Stage Startup - Natural Language Processing / Machine Learning
Opscidia
This job is no longer available. Back to the jobs list.

Stage Startup - Natural Language Processing / Machine Learning

Opscidia
  • Internship (From 3 to 6 months)
  • Paris (France)
  • Published on December 18 2019
This job is no longer available. Back to the jobs list.

Entreprise :

Opscidia est une toute jeune startup qui a 2 activités : la publication scientifique "Open Access" et la veille technologique. Ces 2 activités poursuivent le même but : ouvrir les articles scientifiques afin d'en tirer le maximum de valeur économique et sociale possible.

Nous utilisons des techniques de pointe en traitement automatique du langage (NLP) pour tirer les informations pertinentes des articles scientifiques.  Nos algorithmes permettent notamment de collecter les signaux faibles (par exemple “Aurions-nous pu mieux se préparer aux crises d’Ebola ?”), ou d'évaluer la maturité d'une technologie, en se basant sur l'analyse de la littérature scientifique publiée.


Mission :

Vous travaillerez dans le coeur du réacteur de nos outils de veille.

En étroite collaboration avec le CTO (Charles) sur les aspects techniques et le CEO (Sylvain) sur les aspects produits, vous prendrez en charge un pipeline de complet de text-mining sur un ou plusieurs sujets en cours: 

  • approfondir notre première étude sur Ebola

  • comparer la maturité des technologies (notamment photovoltaïque)

  • combattre les fake news en déterminant automatiquement si une affirmation reflète ou non le consensus scientifique.

Vous implémenterez et testerez des approches innovantes. Vous serez libre de vous concentrer sur certaines parties du pipeline (collecte de data, embeddings, clustering, datavisualisation) et d’innover autour de ces sujets.

Nous pourrons également vous faire participer aux autres activités de l’entreprise connexes à votre travail (communiquer/vulgariser votre travail, intervenir lors de conférences scientifiques, prendre en charge une partie de la gestion de projet client).

Et vous serez évidemment l’un des tout premiers acteurs du développement d'une startup tech originale et ambitieuse.


Profil recherché :

Les pré-requis indispensables :

  • Vous êtes étudiants en école d’ingénieurs ou dans un master de mathématiques / informatique / data science.

  • Vous avez une solide maîtrise du développement en Python

  • Vous vous exprimez correctement en Français ou en Anglais et vous lisez l’Anglais.

Les pré-requis souhaitables :

  • Vous avez de bonnes bases concernant les bibliothèques et les méthodes classiques de Machine Learning (clustering, réseau de neurones, Scikit-learn, TensorFlow/Pytorch, etc.)

  • Vous connaissez ou avez envie d’apprendre à utiliser les algorithmes de NLP de type : embeddings et modèle de langue (Word2Vec, BERT, Elmo), Named Entity Recognition (Spacy), Sentiment Analysis, etc.

  • Vous êtes habitués à travailler en itérations courtes et à prendre en compte les retours.

  • Vous êtes pragmatique et autonome.

Les + :

Une connaissance du monde académique et des problématiques d’Open Access serait appréciée.

La diversité des profils et des expériences est importante pour nous, aussi nous sommes ouverts à des candidatures atypiques.


Descriptif pratique

Disponibilité : dès que possible

Localisation : Paris, télétravail partiel possible.

Type de contrat : stage de fin d’études ou de césure ou alternance, avec objectif d’embauche en CDI ensuite.

Processus : vous nous envoyez CV + lettre motivation. La lettre de motivation n’a pas besoin d’être longue mais elle doit bien souligner les liens entre votre parcours et notre proposition de stage. Si vous êtes retenus, nous vous recevrons dans nos locaux (à Paris) pour 2 entretiens physiques (le même jour).

Rémunération : à discuter


Nous avons hâte de vous rencontrer


Sylvain & Charles