Projets en cours

Directeur.e(s) de recherche
Simon Duchesne
Nicolas Doyon
Début du projet
Titre du projet de recherche
Effet de l'état de la vascularité cérébrale sur le développement de la maladie d’Alzheimer.
Description
Description

De plus en plus d’évidences démontrent l’existence d’un lien entre la présence de pathologies vasculaires cérébrales et l’augmentation du risque de développement de troubles neurocognitifs majeurs, telle que la maladie d’Alzheimer (MA). 
Dans ce contexte, ce travail consistera essentiellement à développer des outils d’analyse de la morphométrie vasculaire, soit la caractérisation des artères et des veines. En effet, la mesure des vaisseaux sanguins (diamètre, densité, etc.) dans toutes les régions cérébrales permettra de mieux comprendre la trajectoire de la santé vasculaire au cours du vieillissement et si cette trajectoire est reliée à deux marqueurs importants, corrélés avec les troubles neurocognitifs, soit l’atrophie du tissue cérébral, et les lésions cérébrovasculaires (principalement la présence d’hyperintensités dans la matière blanche et de micro-saignements). La vasculature de participants cognitivement sains, avec un trouble cognitif léger ou avec un diagnostic de MA sera caractérisé afin de mettre en lumière les liens entre la santé vasculaire et la santé cognitive. 
Pour conclure, le travail proposé est donc une exploration de la relation entre la vascularisation cérébrale et la MA dans le but de mieux comprendre les interactions entre les deux et aider au dépistage de cette maladie.
 

Étudiant.e
Directeur.e(s) de recherche
Anne-Sophie Charest
Philippe Després
Début du projet
Titre du projet de recherche
Analyses complexes avec DataSHIELD pour la protection de données de santé
Description
Description

Il est souvent difficile de partager des données dénominalisées entre différentes organisations et chercheurs en raison de contraintes éthiques liées à la confidentialité des répondants. C'est une réalité fréquente dans le domaine de la santé, étant donné la sensibilité inhérente de ce type de données. Une option dans ce cas est de ne pas partager directement les données, mais plutôt de donner accès à celles-ci via un outil qui contrôle le risque de divulgation des requêtes effectuées et permet seulement celles qu'il considère sécuritaires. DataSHIELD est un tel outil qui a été proposé pour protéger la confidentialité d'un jeu de données, et qui s'utilise via le logiciel statistique R. Il permet en outre de faire des analyses statistiques sur plusieurs jeux de données hébergés à des endroits différents, toujours en assurant la confidentialité des répondants. Dans ce projet, on s'intéresse aux garanties de confidentialité fournies par le logiciel, et aux limites de celui-ci. On étudie en particulier les possibilités d'analyses statistiques plus poussées pouvant être faites avec le logiciel, notamment par l'utilisation de méta-analyses et de réseaux de neurones.

Étudiant.e
Directeur.e(s) de recherche
Philippe Després
Anne-Sophie Charest
Début du projet
Titre du projet de recherche
Possibilités et limites de DataSHIELD pour la protection de données de santé
Description
Description

Il est souvent difficile de partager des données dénominalisées entre différentes organisations et chercheurs en raison de contraintes éthiques liées à la confidentialité des répondants. C'est une réalité fréquente dans le domaine de la santé, étant donné la sensibilité inhérente de ce type de données. Une option dans ce cas est de ne pas partager directement les données, mais plutôt de donner accès à celles-ci via un outil qui contrôle le risque de divulgation des requêtes effectuées et permet seulement celles qu'il considère sécuritaires. DataSHIELD est un tel outil qui a été proposé pour protéger la confidentialité d'un jeu de données, et qui s'utilise via le logiciel statistique R. Il permet en outre de faire des analyses statistiques sur plusieurs jeux de données hébergés à des endroits différents, toujours en assurant la confidentialité des répondants.

Dans ce projet, on s'intéresse aux garanties de confidentialité fournies par le logiciel, et aux limites de celui-ci.

On souhaite notamment établir des principes pour guider le choix des paramètres de contrôle de la divulgation offerts avec l'outil, et comprendre plus précisément l'impact de ces contrôles sur la qualité des statistiques descriptives, modèles linéaires et graphiques produits.

Étudiant.e
Directeur.e(s) de recherche
Louis Archambault
Michèle Desjardins
Début du projet
Titre du projet de recherche
Effet de la pression d’oxygène dans les cellules de tissus cancéreux sur les traitements de radiothérapie
Description
Description

Les traitements de radiothérapie habituels répandus dans le domaine clinique ne font pas souvent l’objet de changements, se résumant généralement à un traitement global de 50 grays, fractionné en cinq traitements de deux grays par semaine durant cinq semaines.
C’est pourquoi il est intéressant de développer un outil basé uniquement sur des modèles mathématiques tirés de la littérature, capable de comparer les différents types de traitements possibles sans avoir à les tester sur de véritables tissus. Plusieurs paramètres viennent modifier la réponse de ces tissus après leur irradiation, notamment la pression partielle d’oxygène dans les régions irradiées, le type de particules envoyées sur le tissu ainsi que la durée des traitements et le temps entre chacun d’eux.

Le code Python créé dans le cadre de ce projet vise ainsi à faciliter l’optimisation des traitements de radiothérapie en générant des graphiques montrant la survie des cellules après un certain nombre de fractions, en tenant compte de plusieurs paramètres. Le code, lorsqu’il sera complété et fera partie d’une interface graphique, sera simple d’utilisation et servira aux projets de recherche qui seront en cours.

Directeur.e(s) de recherche
François Laviolette
Josée Desharnais
Début du projet
Titre du projet de recherche
Des arbres de décision parcimonieux basés sur la logique pour une interprétabilité accrue.
Description
Description

L’interprétabilité de l’intelligence artificielle, c’est-à-dire la capacité d’un-e expert-e de comprendre pourquoi une décision a été rendue, est particulièrement importante dans les contextes d’analyse en santé. D’abord, car il est primordial de savoir pourquoi une décision est prise par un algorithme lorsque celle-ci a un impact sur la santé d’une personne. Ensuite, en recherche, ces types d’algorithmes sont très utiles, car ils dévoilent souvent des pistes d’investigations nouvelles. 

L’objectif de cette étude est de combiner deux algorithmes d’apprentissage automatique supervisé dans le but d’en améliorer autant l’interprétabilité que la performance, notamment grâce aux outils de la logique mathématique. Le but de cette variante algorithmique est d’aider à une meilleure prédiction en augmentant légèrement la complexité du modèle tout en conservant ce haut niveau d’interprétabilité. 

Cet algorithme est développé dans le but d’analyser des données larges (fat data), c’est-à-dire les données qui comportent beaucoup de caractéristiques (attributs), mais dont nous avons peu d’échantillons (observations). Ce type de données est très présent dans les données liées à la santé, notamment dans les cas de données génomiques, métagénomiques et métabolomiques qui sont l’état de l’art des analyses médicales. Plus précisément, nous nous intéressons aux problématiques de la résistance bactérienne aux antibiotiques et de la maladie à coronavirus (COVID-19) longue. 
 

Étudiant.e
Directeur.e(s) de recherche
Anne-Sophie Charest
François Laviolette
Début du projet
Titre du projet de recherche
Création d'un jeu de données synthétique pour des données de santé
Description
Description

Il est souvent difficile de partager des données dénominalisées entre différentes organisations et chercheurs en raison de contraintes éthiques liées à la confidentialité des répondants. Il peut ainsi s’écouler de longs mois, parfois même des années, entre la rédaction d’un projet de recherche et le début de l’analyse planifiée, ce qui limite la capacité des chercheurs à mener des travaux scientifiques de pointe au moment opportun et contribue à allonger inutilement la formation d’étudiants gradués, entre autres problèmes. Une solution possible est de créer un jeu de données synthétiques à partager aux chercheurs en attente de l’accès au jeu de données original. Ce jeu de données synthétique serait représentatif des données originales, mais créé de façon à ne pas révéler d’information confidentielle sur les répondants. Il permettrait aux chercheurs de se familiariser à l’avance avec les variables mesurées, d’anticiper les difficultés techniques du projet de recherche (stockage, logiciels, gestion des accès), et de planifier de meilleurs protocoles de recherche.

Nous étudions ici les enjeux techniques liés à la création de tels jeux de données synthétiques dans le domaine de la santé. Il faut notamment s’assurer que les modèles statistiques utilisés soient assez flexibles pour bien modéliser les corrélations entre les variables collectées, tout en s’assurant de ne pas sur-ajuster ceux-ci, ce qui pourrait nuire à la protection de la confidentialité. Le travail s’articulera autour de la création d’un jeu synthétique pour un sous-ensemble des données collectées par le Consortium d’identification précoce de la maladie d’Alzheimer - Québec (CIMA-Q), pour qui le partage des données à la communauté de recherche sur la maladie d’Alzheimer canadienne et internationale est un objectif important.
 

Étudiant.e
Directeur.e(s) de recherche
Luc Beaulieu
Début du projet
Titre du projet de recherche
Développement d'outils de planification automatique en curiethérapie à haut débit de dose pour le cancer de la prostate
Description
Description

Le traitement du cancer par la radiation est une technique éprouvée et utilisée partout dans le monde. Une des façons de traiter le cancer de la prostate est l’utilisation de la curiethérapie soit seul ou en boost. En ce moment, les techniques utilisées dépendent de l’expérience de l’équipe traitante et des chercheurs tentent de pallier ce problème.
Dans notre cas, la technologie envisagée pour répondre à ce problème est l’apprentissage profond. Le but du projet est donc d’utiliser l'apprentissage profond afin de développer des outils pour la planification en curiethérapie à haut débit de dose du cancer de la prostate.
Quatre phases différentes sont initialement visées. La première consiste en une classification des plans de traitements utilisés. Le second est une approche de ''reinforce learning'' afin d'aider à l'optimisation des plans de traitements, soit en modifiant les objectifs d'optimisation afin de considérer de façon unique chaque patient. Le troisième est la prédiction de carte de dose basée sur l'anatomie des patients. Le quatrième est la génération de plans de traitements; à partir de l'anatomie du patient ou d'une carte de dose pour trouver un plan de traitement adéquat.
Le travail proposé est une nouvelle approche qui permettra, ultimement, d’aider aux traitements de curiethérapie à haut débit de dose pour le cancer de la prostate.
 

Étudiant.e
Directeur.e(s) de recherche
François Laviolette
Jacques Corbeil
Alexandre Drouin
Début du projet
Titre du projet de recherche
Recherche de biomarqueurs en données métabolomique de grande dimensionnalité par des méthodes d'apprentissage machine interprétables
Description
Description

La métabolomique est une des façons d'étudier le métabolisme. La présence de certains métabolites, ou la dégradation de sentiers métaboliques peuvent servir d'indicateurs sur la santé d'un patient. Ils peuvent servir de marqueurs de certaines maladies comme des cancers, ou renseigner sur la qualité de la diète d'un individu. Les méthodes d'acquisition en métabolomique non ciblée produisent des matrices de données de grandes dimensions. Il s'agit de développer des méthodes d'apprentissage machine spécifiquement adaptées aux jeux de données de grande dimensions. Par exemple des modèles basés sur des règles de décisions. 
La finalité de ces modèles étant la recherche de biomarqueurs, ils doivent être parcimonieux pour pouvoir être interprétés par un expert humain. Il s'agit également de développer de nouvelles approches pour interpréter au mieux des modèles déjà existants et performants. L'interprétabilité est un aspect essentiel dans l'application de l'apprentissage machine à la santé. Les modèles ne peuvent pas être des boîtes noires de diagnostic mais plutôt des outils d'analyse à la disposition d'experts pour mieux comprendre le métabolisme humain.
 

Étudiant.e
Directeur.e(s) de recherche
Nadia Lahrichi
Début du projet
Titre du projet de recherche
Décisions thérapeutiques analgésiques intraopératoires basées sur le NOL index : apport d’une approche basée sur les données pour améliorer justesse et pertinence
Description
Description

Ce projet de recherche se base sur l’analyse de données massives portant sur l’index NOL et d’autres paramètres cliniques intraopératoires utilisés par les anesthésistes durant une chirurgie. Ces paramètres les aident à prendre des décisions de traitements analgésiques chez un patient non-communiquant sous anesthésie générale et chez qui il est impossible d’évaluer la douleur et les besoins en analgésiques par les questionnaires habituels réalisés sur patients éveillés.
Dans un premier temps, l’objectif est d’interpréter les valeurs de cet index en lien avec les décisions prises par le clinicien. 
Dans un deuxième temps, il s’agit de développer un algorithme d’intelligence artificielle pouvant guider la prise de décision pour plus de précision et une meilleure sécurité anesthésique pour le patient.
 

Étudiant.e
Directeur.e(s) de recherche
Vicky Drapeau
Yves De Koninck
Philippe Després
Collaboration
PULSAR
Début du projet
Titre du projet de recherche
Conception, opérationnalisation et validation d’un modèle d’évaluation de la santé durable adapté à une plateforme numérique
Description
Description

Le projet porte sur la conception, l’opérationnalisation et la validation d’un modèle d’évaluation de la santé durable. 
Ce modèle sera adapté à une plateforme numérique, reposera sur des bases théoriques et conceptuelles solides et regroupera des indicateurs valides et nourris par des données dépeignant une conception globale et écosystémique de la santé. 
Une fois opérationnalisé, implémenté et validé dans le cadre d’une cohorte, ce modèle représentera une stratégie innovante pour la santé durable grâce à des technologies et des modes d'intervention améliorés.
 

Découvrir

Projet en vedette

Le projet vise à étudier les effets sur le débat public de l'intelligence artificielle (IA) et de la science des données, et de leurs usages par les nouveaux diffuseurs de contenu sur le web. 

Lire plus