Exploitation des Large Language Model (LLM) pour optimiser le suivi des exigences dans les marchés p H/F

Stage 4 à 6 mois

Bruyères-le-Châtel

Publiée le 26 février 2025

  • Contrat

    Stage 4 à 6 mois

  • Lieu

    Bruyères-le-Châtel

  • Date de début

    Dès que possible

  • Salaire

    Information non renseignée

  • Télétravail

    Non spécifié

CEA illustration
Description du poste

Domaine

Management et projet

Contrat

Stage

Intitulé de l'offre

Exploitation des Large Language Model (LLM) pour optimiser le suivi des exigences dans les marchés p H/F

Sujet de stage

Dans le cadre de l'évolution de nos outils de surveillance du respect des exigences dans ses marchés publics, le département des projets du CEA souhaite développer un outil d'analyses documentaires basé sur l'utilisation de modèles de langage (LLM) et l'ingénierie d'invites (Prompt Engineering). L'objectif est de faciliter et d'accélérer l'analyse des documents techniques et administratifs associés aux marchés contractualisés par le CEA, offrant ainsi aux agents un gain de temps valorisés pour des tâches d'expertise technique et ainsi gagner en efficacité.
Pour cela, nous recherchons un(e) stagiaire pour mener une étude approfondie et prototyper l'outil de traitement des documents.

Durée du contrat (en mois)

6 mois

Description de l'offre

Au sein d'une équipe d'ingénieurs et techniciens supérieurs, le/la stagiaire aura pour missions pendant 4 à 6 mois :
La rédaction d'un état de l'art des outils d'analyse documentaire utilisant les LLM et l'ingénierie d'invites (Prompt Engineering) :

o Rechercher et analyser les outils existants utilisant des modèles de langage et les méthodes d'ingénierie d'invites pouvant être utilisés pour l'analyse documentaire.

o Identifier les forces et faiblesses de ces outils afin de mieux cibler les besoins et spécifications de notre propre solution.

• Proposition, étude et prototypage d'outil:

o Proposer une solution d'analyse documentaire adaptée aux besoins spécifiques définis par le CEA.

o Développer un prototype permettant de fluidifier l'analyse des documents techniques de marché en tirant parti des capacités des LLM et de l'ingénierie d'invites :
  • Vérification de la prise en compte des exigences techniques,
  • Comparaison entre documents techniques

o Implémenter des fonctionnalités adaptées pour l'exploitation et la structuration d'informations pertinentes à partir des documents à analyser.

• Évaluation des performances :

o Évaluer la qualité des résultats générés par l'outil prototype en termes de précision, pertinence et rapidité d'analyse.

o Mettre en place des métriques de performance pour mesurer l'efficacité de l'outil sur des cas d'usage réels.

Les livrables attendus dans le cadre de ce stage sont :
• La livraison d'un état de l'art,
• La livraison d'un prototype d'outil d'analyse documentaire via des LLM,
• La livraison d'une étude de performance de l'outil.

Missions Optionnelles : Le stagiaire pourra, en fonction de ses affinités et de ses résultats, choisir parmi plusieurs axes d'approfondissement :
• LLM sur-mesure : Proposer, étudier et affiner l'entraînement de son propre modèle de langage (LLM) spécifiquement adapté aux exigences du CEA à partir de modèles open-source,
• Architecture matérielle : Définir et proposer une architecture matérielle pour supporter le déploiement à grande échelle de l'outil en production,
• Fonctions supplémentaires : Développer des fonctionnalités complémentaires à l'outil (exemple : recherche croisée dans une base documentaire).

Moyens / Méthodes / Logiciels

LLM interne et son interface applicative (API).Python. CPU GPU.

Profil du candidat
Formation : Cursus ingénieur avec spécialisation en informatique (Bac+4/5).
Compétences techniques :

o Maîtrise du développement Python, notamment programmation orientée objet.

o Expérience avec des Framework web (Gradio, Flask, etc.) pour la création d'interfaces utilisateurs interactives en réseau.

o Notions en intelligence artificielle et modèles de langage (LLM) et en Prompt Engineering.

o Connaissances de base en réseaux informatiques.
Compétences appréciées :

o Notions de scripting VBA et BATCH pour l'automatisation de certaines tâches.

o Autonomie, esprit d'initiative, proactivité, et capacité à proposer des solutions innovantes.

Localisation du poste

Site

DAM Île-de-France

Localisation du poste

France, Ile-de-France, Essonne (91)

Ville

26 Rue de la Piquetterie, 91680 Bruyères-le-Châtel

Critères candidat

Diplôme préparé

Bac+5 - Diplôme École d'ingénieurs

Formation recommandée

Ecole d'ingénieur spécialisation informatique

Possibilité de poursuite en thèse

Non

Demandeur

Disponibilité du poste

01/04/2025

Date limite de candidature

Tant que l’offre est en ligne

Niveau d'étude

Niveau Master, MSc ou Programme Grande Ecole

Fonction

Gestion de projet IT & Product

Plus d’infos sur l’entreprise

CEA logo

CEA

Nos énergies pour l'avenir