Ressources dans DataSHIELD
En savoir plusUn poste de stagiaire postdoctoral en biologie computationnelle du cancer est disponible au Centre de recherche de l’Institut universitaire de cardiologie et de pneumologie de Québec (IUCPQ) dans les laboratoires du Dr Venkata Manem et du Dr Philippe Joubert.
Ce projet porte dans un premier temps sur la conception de modèles de classification de type réseaux convolutionnels (CNNs) en utilisant des données de spectrométrie de masse (1D et 2D) pour le diagnostic clinique.
Une fois finalisé, le 2éme objectif est l’interprétation de ces modèles de classification afin d’identifier les régions spectrales d’intérêt qui peuvent correspondre à de nouveaux biomarqueurs de diagnostic ou de thérapeutique.

Arnaud Droit
Faculté de médecine
Université Laval

Khawla Seddiki
Candidate au doctorat
Faculté de médecine
Université Laval
Ce projet porte dans un premier temps sur la conception de modèles de classification de type réseaux convolutionnels (CNNs) en utilisant des données de spectrométrie de masse (1D et 2D) pour le diagnostic clinique.
Une fois finalisé, le 2éme objectif est l’interprétation de ces modèles de classification afin d’identifier les régions spectrales d’intérêt qui peuvent correspondre à de nouveaux biomarqueurs de diagnostic ou de thérapeutique.
Il est souvent difficile de partager des données dénominalisées entre différentes organisations et chercheurs en raison de contraintes éthiques liées à la confidentialité des répondants. Il peut ainsi s’écouler de longs mois, parfois même des années, entre la rédaction d’un projet de recherche et le début de l’analyse planifiée, ce qui limite la capacité des chercheurs à mener des travaux scientifiques de pointe au moment opportun et contribue à allonger inutilement la formation d’étudiants gradués, entre autres problèmes.

Oumaima Ouffy
Candidate à la maîtrise
Faculté des sciences et de génie
Université Laval
Il est souvent difficile de partager des données dénominalisées entre différentes organisations et chercheurs en raison de contraintes éthiques liées à la confidentialité des répondants. Il peut ainsi s’écouler de longs mois, parfois même des années, entre la rédaction d’un projet de recherche et le début de l’analyse planifiée, ce qui limite la capacité des chercheurs à mener des travaux scientifiques de pointe au moment opportun et contribue à allonger inutilement la formation d’étudiants gradués, entre autres problèmes. Une solution possible est de créer un jeu de données synthétiques à partager aux chercheurs en attente de l’accès au jeu de données original. Ce jeu de données synthétique serait représentatif des données originales, mais créé de façon à ne pas révéler d’information confidentielle sur les répondants. Il permettrait aux chercheurs de se familiariser à l’avance avec les variables mesurées, d’anticiper les difficultés techniques du projet de recherche (stockage, logiciels, gestion des accès), et de planifier de meilleurs protocoles de recherche.
Nous étudions ici les enjeux techniques liés à la création de tels jeux de données synthétiques dans le domaine de la santé. Il faut notamment s’assurer que les modèles statistiques utilisés soient assez flexibles pour bien modéliser les corrélations entre les variables collectées, tout en s’assurant de ne pas sur-ajuster ceux-ci, ce qui pourrait nuire à la protection de la confidentialité. Le travail s’articulera autour de la création d’un jeu synthétique pour un sous-ensemble des données collectées par le Consortium d’identification précoce de la maladie d’Alzheimer - Québec (CIMA-Q), pour qui le partage des données à la communauté de recherche sur la maladie d’Alzheimer canadienne et internationale est un objectif important.
Il est souvent difficile de partager des données dénominalisées entre différentes organisations et chercheurs en raison de contraintes éthiques liées à la confidentialité des répondants. C'est une réalité fréquente dans le domaine de la santé, étant donné la sensibilité inhérente de ce type de données. Une option dans ce cas est de ne pas partager directement les données, mais plutôt de donner accès à celles-ci via un outil qui contrôle le risque de divulgation des requêtes effectuées et permet seulement celles qu'il considère sécuritaires.
Étude de cas en données synthétiques: partage de données complexes en santé
En savoir plusDécouvrir

Projet en vedette
Les traitements de radiothérapie habituels répandus dans le domaine clinique ne font pas souvent l’objet de changements, se résumant généralement à un traitement global de 50 grays, fractionné en cinq traitements de deux grays par semaine durant cinq semaines.