Skip to content

Sécurité des modèles d'IA générative: détection des attaques par porte dérobée de nouvelle génération

Research / Doctorate 25 to 36 months

91400 Saclay (France)

Published on 26 June 2026

  • Contract

    Research / Doctorate 25 to 36 months

  • Location

    91400 Saclay (France)

  • Start date

    As soon as possible

  • Salary

    Information not provided

  • Remote working

    Not specified

CEA illustration
Description du sujet de thèse

Domaine

Défis technologiques

Sujets de thèse

Sécurité des modèles d'IA générative: détection des attaques par porte dérobée de nouvelle génération

Contrat

Thèse

Description de l'offre

Cette thèse vise à étudier et détecter les attaques par porte dérobée au sein des écosystèmes de modèles d'IA générative (modèles autonomes, systèmes de génération augmentée par récupération (RAG) et agents autonomes basés sur des LLM).

Contexte : De nombreux utilisateurs (particuliers, institutions, ONG et même entreprises) ne sont actuellement pas en mesure de développer leurs propres systèmes d'IA générative. Ils s'orientent donc vers le téléchargement d'agents ou de modèles d'IA générative open source, généralement conçus pour être très accessibles et faciles à utiliser, ne nécessitant que peu d'expertise technique. Cette pratique est largement répandue en raison du grand nombre de modèles open source et d'implémentations d'agents LLM disponibles en ligne (par exemple, Hugging Face héberge plus de deux millions de modèles publics). Malheureusement, l'intégrité comportementale du modèle téléchargé n'est jamais vérifiée, et celui-ci peut avoir été préalablement compromis par une porte dérobée. Il existe donc un besoin urgent de mettre en place des mécanismes de défense capables d'analyser les composants d'un système d'IA générative (modèles et bases de connaissances) et d'identifier ceux qui ont été empoisonnés.

Objectifs : La recherche se concentrera sur le développement de mécanismes innovants de détection et de défense contre les attaques furtives basées sur des triggers, en mettant l'accent sur les scénarios de déploiement réels et sur des benchmarks d'évaluation robustes. En plus de développer des mécanismes de défense et de mettre le code à disposition en open source, la thèse vise également à fournir à la communauté scientifique un framework d'évaluation complet.

Université / école doctorale

Sciences et Technologies de l'Information et de la Communication (STIC)
Paris-Saclay

Localisation du sujet de thèse

Site

Saclay

Critères candidat

Formation recommandée

Master 2 IA, Machine Learning ou statistiques

Demandeur

Disponibilité du poste

01/09/2026

Personne à contacter par le candidat

MAYOUE Aurélien < email deleted for security reasons >
CEA
DRT/DIN/SMCD/LIIDE
CEA Saclay
Bâtiment 565, PC 192
91 191 Gif-sur-Yvette
01 69 08 88 96

Tuteur / Responsable de thèse

MOELLIC Pierre-Alain < email deleted for security reasons >
CEA
DRT/DSYS//LSES
Centre de Microélectronique de Provence
880 route de Mimet
13120 Gardanne
0442616738

En savoir plus

https://list.cea.fr/fr/

Application deadline

As long as the job is online

Study level

Doctorate

Job Category

Technology

More about the company

CEA

Nos énergies pour l'avenir