Description du poste
Domaine
Management et projet
Contrat
Stage
Intitulé de l'offre
Exploitation des Large Language Model (LLM) pour optimiser le suivi des exigences dans les marchés p H/F
Sujet de stage
Dans le cadre de l'évolution de nos outils de surveillance du respect des exigences dans ses marchés publics, le département des projets du CEA souhaite développer un outil d'analyses documentaires basé sur l'utilisation de modèles de langage (LLM) et l'ingénierie d'invites (Prompt Engineering). L'objectif est de faciliter et d'accélérer l'analyse des documents techniques et administratifs associés aux marchés contractualisés par le CEA, offrant ainsi aux agents un gain de temps valorisés pour des tâches d'expertise technique et ainsi gagner en efficacité.
Pour cela, nous recherchons un(e) stagiaire pour mener une étude approfondie et prototyper l'outil de traitement des documents.
Durée du contrat (en mois)
6 mois
Description de l'offre
Au sein d'une équipe d'ingénieurs et techniciens supérieurs, le/la stagiaire aura pour missions pendant 4 à 6 mois :
• La rédaction d'un état de l'art des outils d'analyse documentaire utilisant les LLM et l'ingénierie d'invites (Prompt Engineering) :
o Rechercher et analyser les outils existants utilisant des modèles de langage et les méthodes d'ingénierie d'invites pouvant être utilisés pour l'analyse documentaire.
o Identifier les forces et faiblesses de ces outils afin de mieux cibler les besoins et spécifications de notre propre solution.
• Proposition, étude et prototypage d'outil:
o Proposer une solution d'analyse documentaire adaptée aux besoins spécifiques définis par le CEA.
o Développer un prototype permettant de fluidifier l'analyse des documents techniques de marché en tirant parti des capacités des LLM et de l'ingénierie d'invites :
o Implémenter des fonctionnalités adaptées pour l'exploitation et la structuration d'informations pertinentes à partir des documents à analyser.
• Évaluation des performances :
o Évaluer la qualité des résultats générés par l'outil prototype en termes de précision, pertinence et rapidité d'analyse.
o Mettre en place des métriques de performance pour mesurer l'efficacité de l'outil sur des cas d'usage réels.
Les livrables attendus dans le cadre de ce stage sont :
• La livraison d'un état de l'art,
• La livraison d'un prototype d'outil d'analyse documentaire via des LLM,
• La livraison d'une étude de performance de l'outil.
Missions Optionnelles : Le stagiaire pourra, en fonction de ses affinités et de ses résultats, choisir parmi plusieurs axes d'approfondissement :
• LLM sur-mesure : Proposer, étudier et affiner l'entraînement de son propre modèle de langage (LLM) spécifiquement adapté aux exigences du CEA à partir de modèles open-source,
• Architecture matérielle : Définir et proposer une architecture matérielle pour supporter le déploiement à grande échelle de l'outil en production,
• Fonctions supplémentaires : Développer des fonctionnalités complémentaires à l'outil (exemple : recherche croisée dans une base documentaire).
Moyens / Méthodes / Logiciels
LLM interne et son interface applicative (API).Python. CPU GPU.
Profil du candidat
• Formation : Cursus ingénieur avec spécialisation en informatique (Bac+4/5).
• Compétences techniques :
o Maîtrise du développement Python, notamment programmation orientée objet.
o Expérience avec des Framework web (Gradio, Flask, etc.) pour la création d'interfaces utilisateurs interactives en réseau.
o Notions en intelligence artificielle et modèles de langage (LLM) et en Prompt Engineering.
o Connaissances de base en réseaux informatiques.
• Compétences appréciées :
o Notions de scripting VBA et BATCH pour l'automatisation de certaines tâches.
o Autonomie, esprit d'initiative, proactivité, et capacité à proposer des solutions innovantes.
Localisation du poste
Site
DAM Île-de-France
Localisation du poste
France, Ile-de-France, Essonne (91)
Ville
26 Rue de la Piquetterie, 91680 Bruyères-le-Châtel
Critères candidat
Diplôme préparé
Bac+5 - Diplôme École d'ingénieurs
Formation recommandée
Ecole d'ingénieur spécialisation informatique
Possibilité de poursuite en thèse
Non
Demandeur
Disponibilité du poste
01/04/2025
Domaine
Management et projet
Contrat
Stage
Intitulé de l'offre
Exploitation des Large Language Model (LLM) pour optimiser le suivi des exigences dans les marchés p H/F
Sujet de stage
Dans le cadre de l'évolution de nos outils de surveillance du respect des exigences dans ses marchés publics, le département des projets du CEA souhaite développer un outil d'analyses documentaires basé sur l'utilisation de modèles de langage (LLM) et l'ingénierie d'invites (Prompt Engineering). L'objectif est de faciliter et d'accélérer l'analyse des documents techniques et administratifs associés aux marchés contractualisés par le CEA, offrant ainsi aux agents un gain de temps valorisés pour des tâches d'expertise technique et ainsi gagner en efficacité.
Pour cela, nous recherchons un(e) stagiaire pour mener une étude approfondie et prototyper l'outil de traitement des documents.
Durée du contrat (en mois)
6 mois
Description de l'offre
Au sein d'une équipe d'ingénieurs et techniciens supérieurs, le/la stagiaire aura pour missions pendant 4 à 6 mois :
• La rédaction d'un état de l'art des outils d'analyse documentaire utilisant les LLM et l'ingénierie d'invites (Prompt Engineering) :
o Rechercher et analyser les outils existants utilisant des modèles de langage et les méthodes d'ingénierie d'invites pouvant être utilisés pour l'analyse documentaire.
o Identifier les forces et faiblesses de ces outils afin de mieux cibler les besoins et spécifications de notre propre solution.
• Proposition, étude et prototypage d'outil:
o Proposer une solution d'analyse documentaire adaptée aux besoins spécifiques définis par le CEA.
o Développer un prototype permettant de fluidifier l'analyse des documents techniques de marché en tirant parti des capacités des LLM et de l'ingénierie d'invites :
- Vérification de la prise en compte des exigences techniques,
- Comparaison entre documents techniques
o Implémenter des fonctionnalités adaptées pour l'exploitation et la structuration d'informations pertinentes à partir des documents à analyser.
• Évaluation des performances :
o Évaluer la qualité des résultats générés par l'outil prototype en termes de précision, pertinence et rapidité d'analyse.
o Mettre en place des métriques de performance pour mesurer l'efficacité de l'outil sur des cas d'usage réels.
Les livrables attendus dans le cadre de ce stage sont :
• La livraison d'un état de l'art,
• La livraison d'un prototype d'outil d'analyse documentaire via des LLM,
• La livraison d'une étude de performance de l'outil.
Missions Optionnelles : Le stagiaire pourra, en fonction de ses affinités et de ses résultats, choisir parmi plusieurs axes d'approfondissement :
• LLM sur-mesure : Proposer, étudier et affiner l'entraînement de son propre modèle de langage (LLM) spécifiquement adapté aux exigences du CEA à partir de modèles open-source,
• Architecture matérielle : Définir et proposer une architecture matérielle pour supporter le déploiement à grande échelle de l'outil en production,
• Fonctions supplémentaires : Développer des fonctionnalités complémentaires à l'outil (exemple : recherche croisée dans une base documentaire).
Moyens / Méthodes / Logiciels
LLM interne et son interface applicative (API).Python. CPU GPU.
Profil du candidat
• Formation : Cursus ingénieur avec spécialisation en informatique (Bac+4/5).
• Compétences techniques :
o Maîtrise du développement Python, notamment programmation orientée objet.
o Expérience avec des Framework web (Gradio, Flask, etc.) pour la création d'interfaces utilisateurs interactives en réseau.
o Notions en intelligence artificielle et modèles de langage (LLM) et en Prompt Engineering.
o Connaissances de base en réseaux informatiques.
• Compétences appréciées :
o Notions de scripting VBA et BATCH pour l'automatisation de certaines tâches.
o Autonomie, esprit d'initiative, proactivité, et capacité à proposer des solutions innovantes.
Localisation du poste
Site
DAM Île-de-France
Localisation du poste
France, Ile-de-France, Essonne (91)
Ville
26 Rue de la Piquetterie, 91680 Bruyères-le-Châtel
Critères candidat
Diplôme préparé
Bac+5 - Diplôme École d'ingénieurs
Formation recommandée
Ecole d'ingénieur spécialisation informatique
Possibilité de poursuite en thèse
Non
Demandeur
Disponibilité du poste
01/04/2025