Aller au contenu

Exploitation avancée des données de santé par de l'apprentissage collaboratif sécurisé

Recherche / Thèse 25 à 36 mois

91400 Saclay (France)

Publiée le 15 juin 2026

  • Contrat

    Recherche / Thèse 25 à 36 mois

  • Lieu

    91400 Saclay (France)

  • Date de début

    Dès que possible

  • Salaire

    Information non renseignée

  • Télétravail

    Non spécifié

CEA illustration
Description du sujet de thèse

Domaine

Défis technologiques

Sujets de thèse

Exploitation avancée des données de santé par de l'apprentissage collaboratif sécurisé

Contrat

Thèse

Description de l'offre

Depuis quelques années, l'apprentissage profond est utilisé avec succès dans de nombreux domaines et est de plus en plus intégré dans la recherche clinique et le domaine de la santé. La capacité à combiner des sources de données diverses, telles que la génomique et l'imagerie, améliore la prise de décision médicale. L'accès à de grands jeux de données hétérogènes est essentiel pour améliorer la qualité et la précision des modèles. L'apprentissage fédéré est actuellement développé pour répondre à cette exigence, en offrant la possibilité d'entraîner des modèles de manière décentralisée garantissant que les données brutes restent stockées localement du côté client (entité qui génère les données sensibles). Plusieurs frameworks open-source intègrent des protocoles de calcul sécurisé pour l'apprentissage fédéré, mais leur applicabilité au domaine de la santé demeure limitée et soulève des enjeux liés à la souveraineté des données.
Dans ce contexte, un framework français, actuellement développé par le CEA-LIST, introduit une architecture d'apprentissage fédéré edge-to-cloud intégrant un chiffrement de bout en bout, avec notamment le chiffrement homomorphe (Fully Homomorphic Encryption), et une résilience face aux attaques malveillantes. Grâce à ce framework, ce projet vise à fournir des composants modulaires et sécurisés pour l'apprentissage fédéré afin de favoriser l'innovation en IA appliquée au domaine de la santé et notamment à la génomique.

Ce projet se focalisera sur trois axes principaux :
1)Déploiement, surveillance et optimisation de modèles d'apprentissage profond au sein de solutions d'apprentissage fédéré et décentralisé.
2)Intégration de grands modèles dans l'apprentissage collaboratif.
3)Développement de méthodes d'agrégation pour des situations non IID (Independant and Identically Distributed).

Université / école doctorale

Structure et Dynamique des Systèmes Vivants (SDSV)
Paris-Saclay

Localisation du sujet de thèse

Site

Saclay

Critères candidat

Formation recommandée

Master AI, Data Science

Demandeur

Disponibilité du poste

01/10/2026

Personne à contacter par le candidat

GAZUT Stéphane < email supprimé pour raison de sécurité >
CEA
DRT/DIN//LIIDE
DRT/ LIST/ DIN/ SMCD/ LIIDE
CEA Saclay, PC 192, bâtiment 565
F-91191 Gif-sur-Yvette cedex

0169088307

Tuteur / Responsable de thèse

MEYER Vincent < email supprimé pour raison de sécurité >
CEA
DRF/JACOB//LBI
CNRGH
Batiment G2
2 rue gaston cremieux
Evry
0160872592

En savoir plus

Date limite de candidature

Tant que l’offre est en ligne

Niveau d'étude

Doctorat

Fonction

Recherche & développement

Plus d’infos sur l’entreprise

CEA

Nos énergies pour l'avenir