Data Scientist - Plateforme conversationnelle visio/chat
Southpigalle

Data Scientist - Plateforme conversationnelle visio/chat

Southpigalle
  • Internship (From 4 to 6 months)
  • Paris (France)
  • Published on August 26 2021

PRÉSENTATION DE LA SOCIÉTÉ :

southpigalle est une société spécialisée sur les technologies de l'AI et les workflows conversationnels, basée à Paris 1er.

Nous proposons aux entreprises la “Superapp”: une application mobile multi fonctions leur permettant d’optimiser leurs processus internes et de développer de nouveaux services personnalisés pour leurs collaborateurs et clients.

Nous comptons de nombreux clients dans le secteur du Luxe (LVMH, Richemont), des Cosmétiques (L’Oréal, Shiseido) du Retail (Monoprix, Kelloggs), des médias et de la Banque/Finance.

Nous sommes alumni des programmes d’accélération de Microsoft (programme "Microsoft for Startups") et du Groupe LVMH à StationF, et partenaire de Microsoft.

 Voir www.southpigalle.io pour plus d'informations.

PRÉSENTATION DU STAGE :

Southpigalle accueille régulièrement des stagiaires au sein de son pôle Data Science / NLP pour étoffer ses briques applicatives existantes (traitement du langage, question/answering, traitement de l’image etc.) ou travailler sur de nouvelles thématiques, parmi lesquelles : 

  • Traitement d’un flux vidéo et audio 

  • “Question Answering” appliqué à un dataset français (camemBERT / PIAF) : réalisation d'une pipeline de recherche de documents et de Q/A, voire jusqu'à la mise en prod via ONNX si le temps le permet ; 

  • Recherche sémantique de documents dans un contexte de production (utiliser la “word mover's distance” pour calculer des scores de similarité entre une question et un ensemble de titres, et ensuite se servir de ces scores pour ranker les documents); 

  • Recommandation : implémenter un système de recommandation de contenu basé sur différents critères (contenu similaire, contenu aimé par d'autres personnes ayant aimé les mêmes contenus que moi, contenu, reinforcement learning ...) ;

  • Meta learning / Few shot learning.

 

Au cours de ce stage, vous travaillerez sur les problématiques suivantes :

  • Méthodes de pre-processing (Lem/Stem, POS Tag, misspell);

  • Text clustering (embedding + distance algébrique);

  • Modules de classification;

  • Modules de NER (classifier + bi-LSTM);

  • Module Question / Answering (BERT et dérivés etc.), distillation;

  • Analyse comportementale (Customer Behavior, Recommender System, Indoor Analytics).


PROFIL RECHERCHÉ & INFOS UTILES :

Nous recherchons un stagiaire avec une solide connaissance de Python, des librairies d’analyse de données (Sklearn, Torch, Gensim, Keras, TensorFlow) et traitement de la langue (Spacy, Nltk). Le stagiaire sera à l’aise avec les différentes techniques de Machine Learning (Classification, Régression, Clustering) et de Deep Learning (RNN, CNN, bi-LSTM, Transformer). Une connaissance des récentes techniques de Reinforcement Learning est un plus.

Au-delà de l’expertise, nous valorisons fortement l’autonomie et la prise d’initiative de la part de nos stagiaires, qui seront amenés à travailler dans un environnement flexible, mais extrêmement dynamique et challenging.

Compte tenu du contexte sanitaire, une partie significative du stage sera effectuée en télétravail.

Stage rémunéré et conventionné.