Il arrive souvent que le partage de données soit limité par des enjeux de confidentialité. C'est une réalité fréquente dans le domaine de la santé, étant donné la sensibilité inhérente de ce type de données.
Lorsque le partage du jeu de données original est impossible, une méthode qu'on peut utiliser est de générer un jeu de données synthétique, qui contient le plus possible une information statistique similaire à celle du jeu de données original, mais qui fournit des données sur de faux individus de façon à protéger la confidentialité des répondants. Ce projet s'intéresse à mesurer rigoureusement la protection de confidentialité offerte par un jeu de données synthétique. On se penchera attentivement sur quelques mesures proposées dans la littérature, pour comprendre leurs garanties et les différences et ressemblances entre celles-ci dans le but d'identifier la ou les mesures qui seraient les plus pertinentes pour le partage de données synthétiques.