Intégration de modèles visuels et de données textuelles dans l'analyse des données génomiques du MOHCCN sur le cancer de la peau (mélanome et carcinome basocellulaire)

DNA test inforgraphic

Les cancers de la peau sont les cancers les plus courants chez les humains au Canada, avec au moins 89 000 cas diagnostiqués chaque année. Ce nombre considérable de cas n'est pas seulement observé au Canada, mais plusieurs pays de l'UE ont également signalé l'existence d'une épidémie de cancer de la peau qui devrait s'accélérer avec le temps, compte tenu de l'augmentation rapide de l'incidence et de l'évolution démographique en faveur des femmes.

Cela motive le développement de systèmes de médecine de précision pour la prédiction du cancer de la peau, adaptés au profil du patient. Au cours de la dernière décennie, les modèles d'apprentissage automatique (AA), en particulier les modèles neuronaux profonds, ont montré des performances prometteuses dans la classification d'images et la compréhension du langage pour l'oncologie de précision. Les modèles AA ont été largement appliqués aux images histopathologiques pour la classification des cancers et aux rapports cliniques textuels pour l'extraction automatique du stade du cancer en vue de la planification du traitement. Cependant, la plupart des efforts actuels se concentrent sur une seule modalité, en utilisant uniquement des images ou des données textuelles.

Dans cette recherche, nous proposons d'intégrer des modèles visuels et des données textuelles (modalités multiples) en tant que modalités auxiliaires dans les données génomiques afin d'identifier le mélanome et le carcinome basocellulaire. Différentes modalités peuvent s'enrichir mutuellement, ce qui permet de traiter les données manquantes/imparfaites, de réduire le besoin de données étiquetées et d'améliorer les performances globales dans un contexte d'oncologie de précision.

Citations

« Spécialisé principalement dans le traitement de textes médicaux, je possède une expertise particulière en informatique médicale. Je suis vraiment enthousiaste quant au potentiel de l'intégration des données textuelles, imagées et génomiques pour prédire le comportement clinique du carcinome basocellulaire. Bien que mon expérience des données génomiques ait été quelque peu limitée, recevoir le prestigieux prix Marathon de l'espoir représente pour moi une occasion remarquable de travailler avec le Dr Philippe Lefrançois afin d'améliorer encore mes compétences analytiques en matière de données génomiques. » — Parsa Bagherzadeh, lauréat du Bourse pour informatique de la santé & science des données

« Le projet de Parsa permettra d'identifier les caractéristiques morphologiques et dermoscopiques des cancers de la peau en corrélation avec les données génomiques de l'oncologie de précision et les résultats cliniques. Cela permettra de déterminer des modèles visuels et des biomarqueurs moléculaires facilement applicables à tous les patients atteints d'un cancer de la peau, ce qui améliorera la prédiction du comportement de la maladie et la stratification des patients dans un contexte où l'accès à des spécialistes du cancer de la peau est limité au Canada. » -- Dr Philippe Lefrançois, mentor