Kayla O'Sullivan-Steben, récipiendaire du People's Choice Award at the 2021 AAPM Big Data Workshop!
Lire plusLe comité de programme FONCER en SDRDS est maintenant constitué!
Lire plusLes Midis Santé: Patients Partenaires et données - Accessibilité, confidentialité et usages de nos données
En savoir plusSérie INSPIRER : EntrepreneurIAt numérique + Santé
En savoir plusAPPLIED
Conférence APPLIED - L'IA appliquée à la santé
En savoir plusCHUM
Génomique à la puissance IA : l’aube d’une révolution de la médecine par les données
En savoir plusAriane Boivin
Candidate à la maîtrise
Faculté des sciences et de génie
Université Laval
Il est souvent difficile, voire impossible, de partager des données dénominalisées entre différentes organisations et chercheurs en raison de contraintes éthiques liées à la confidentialité des répondants. Les jeux de données synthétiques pourraient permettre de simplifier ce partage de données. Cependant, plusieurs méthodes actuelles, qui utilisent des concepts d’imputation de données manquantes, affectent le potentiel d’analyse et la qualité des résultats produits.
Ce projet consiste donc à évaluer les garanties de confidentialité d’une nouvelle méthode de génération de données synthétiques prometteuse. Cette dernière intègre un mécanisme de masquage à une technique d’imputation multiple pour adapter le modèle génératif au risque de chaque observation. En particulier, les risques de divulgation d’attributs, c’est-`a-dire la révélation de certaines valeurs d’attributs en fonction d’autres attributs connus, seront testés.
La faisabilité et la qualité des résultats sera également testée sur un jeu de données fourni par l’Institut de la statistique du Québec.
Découvrir
Projet en vedette
Le cancer de la prostate est le deuxième cancer le plus fréquent et la cinquième cause de décès par cancer chez les hommes. Pour améliorer les résultats de santé des patients, le traitement doit être personnalisé en se basant sur un pronostic précis. Il existe déjà des nomogrammes permettant d’identifier les patients à faible risque de récidive sur la base d’informations cliniques préopératoires, mais ces outils n’utilisent pas les images médicales des patients.