Étudiant.e
Directeur.e(s) de recherche
Anne-Sophie Charest
Début du projet
Titre du projet de recherche
Garanties de confidentialité d’une nouvelle méthode de génération de données synthétiques
Description

Il est souvent difficile, voire impossible, de partager des données dénominalisées entre différentes organisations et chercheurs en raison de contraintes éthiques liées à la confidentialité des répondants. Les jeux de données synthétiques pourraient permettre de simplifier ce partage de données. Cependant, plusieurs méthodes actuelles, qui utilisent des concepts d’imputation de données manquantes, affectent le potentiel d’analyse et la qualité des résultats produits.

Ce projet consiste donc à évaluer les garanties de confidentialité d’une nouvelle méthode de génération de données synthétiques prometteuse. Cette dernière intègre un mécanisme de masquage à une technique d’imputation multiple pour adapter le modèle génératif au risque de chaque observation. En particulier, les risques de divulgation d’attributs, c’est-`a-dire la révélation de certaines valeurs d’attributs en fonction d’autres attributs connus, seront testés.

La faisabilité et la qualité des résultats sera également testée sur un jeu de données fourni par l’Institut de la statistique du Québec.

Découvrir

Projet en vedette

Le cancer de la prostate est le deuxième cancer le plus fréquent et la cinquième cause de décès par cancer chez les hommes. Pour améliorer les résultats de santé des patients, le traitement doit être personnalisé en se basant sur un pronostic précis. Il existe déjà des nomogrammes permettant d’identifier les patients à faible risque de récidive sur la base d’informations cliniques préopératoires, mais ces outils n’utilisent pas les images médicales des patients.

Lire plus