STAGE - Ingénieur développement (F-H) Data lake
Dassault Systèmes

STAGE - Ingénieur développement (F-H) Data lake

Dassault Systèmes
  • Internship (From 4 to 6 months (Start date Feb. 2022))
  • Vélizy-Villacoublay (France)
  • Published on September 8 2021

STAGE - Ingénieur développement (F-H) - Datalake Core Technology

Dassault Systèmes, l'entreprise de la 3DEXPERIENCE, est un « accélérateur de progrès humain ». Elle propose aux entreprises et aux particuliers des environnements virtuels collaboratifs qui leur permettent d'imaginer des innovations plus durables. En développant un jumeau virtuel du monde réel, grâce à la plateforme 3DEXPERIENCE et à ses applications, Dassault Systèmes donne à ses clients les moyens de repousser les limites de l'innovation, de l'apprentissage et de la production.

Les 20 000 collaborateurs de Dassault Systèmes travaillent à créer de la valeur pour nos 270 000 clients de toutes tailles, dans toutes les industries, dans plus de 140 pays. Pour plus d'informations, visitez notre site www.3ds.com/fr

Imaginez demain...

Le stage sera effectué au sein de l'équipe en charge du semantic lake ainsi que des technologies sémantiques.

L'objectif du stage est de permettre à une base de données graph de travailler sur de gros volumes de données sans les charger toutes en mémoire.

Votre contribution et vos futurs défis...

C'est un besoin important pour des scénarios de calcul distribués ou de Data Science qui ont besoin de réutiliser des données du Big Data qui ont été archivées.

Pour cela, vous participerez à l'élaboration d'une structure de données dédiée et orientée graph.

Elle sera utilisée par la base de donnée graph de la 3DEXPERIENCE Platform et intégrera les plus récentes recommendations du W3C pour représenter des graphs (RDF 1.1 et RDFStar).

Les objectifs de cette structure de données seront multiples et vous permettront ainsi de découvrir et d'appréhender tout un éco-système d'optimisations dans les bases de données.

Vous développerez ainsi une structure optimisée pour l'ingestion rapide qui trouvera toute sa place dans des scénarios de compute distribués ou de Data Science.

Vous rejoindrez pour ce stage une équipe jeune et passionnée par l'innovation.

Vos atouts pour réussir...

Etudiant(e) préparant un diplôme de niveau bac +5 en Ecole d'Ingénieur ou Master Universitaire avec une spécialité et/ou une option en informatique

Vous maîtrisez le langage C++

Des compétences dans les structures de données (par exemple Apache Arrow, HDT), le calcul distribué (par exemple Apache Spark) ou les bases de données sont un plus.

Votre curiosité, alliée à votre créativité et un fort goût pour l'innovation, sont autant d'atouts qui vous permettront de mener à bien votre mission.