Gabriel Couture
Le domaine médical produit une quantité importante de données sur une base quotidienne. Cette masse de données, au coeur de la recherche scientifique, n’est généralement pas gérée de façon optimale et est sous-exploitée. Ces enjeux, communs à d’autres secteurs d’activité, ont mené à l’élaboration d’outils et de guides universels afin de mieux gérer les données. Les principes FAIR (Facilement trouvable, Accessible, Interopérable, Réutilisable), par exemple, guident aujourd’hui plusieurs entreprises scientifiques axées sur les données. Les travaux effectués dans le cadre de cette maîtrise visent à intégrer les bonnes pratiques d’ingénierie de données à des processus ayant cours au Département de radio-oncologie du CHU de Québec - Université Laval. Le développement d’un pipeline de données dosimétriques a été un projet important
effectué dans le cadre de cette maîtrise. Ce pipeline recueille quotidiennement des données de planification de traitement de curiethérapie, sous le format DICOM, afin de calculer des indices dosimétriques. Ces indices sont par la suite versés dans une base de données où chercheurs et cliniciens peuvent les analyser. Ceci permet d’accumuler automatiquement des données dédiées à la recherche ou aux analyses cliniques, et éviter les processus de saisie manuelle, qui sont vulnérables aux erreurs humaines et coûteux en temps. Les principes FAIR ont également inspiré la conception de flots de travail pour des projets de radiomique au cours de cette maîtrise. Ces flots de travail permettent de conserver des informations coûteuses, tel que les segmentations effectuées sur les images, en plus de capturer le contexte de leur génération (ex. nom de la personne ayant fait les segmentations). Étant inspirés des principes FAIR, ils se basent sur des standards, facilitent la réutilisation des données et la reproductibilité des résultats scientifiques.