28 mars 2026

Une source de données pour les Canadiens, par des Canadiens : situer la Cohorte de référence du MOHCCN dans le contexte mondial

Professor showing students scientific diagram on classroom projector

L'oncologie de précision a le potentiel de transformer la prise en charge du cancer, en permettant aux patients de bénéficier de traitements spécifiques ciblant précisément les mutations génétiques à l'origine de leur cancer, ce qui améliore leurs résultats thérapeutiques et leur qualité de vie. Cependant, à ce jour, seule une petite partie des patients bénéficie de cette approche.

Pour que la médecine de précision devienne une réalité pour un plus grand nombre de patients atteints de cancer, les cliniciens et les chercheurs doivent mieux comprendre comment le cancer se développe chez chaque individu, pourquoi certains patients réagissent différemment à des traitements similaires et comment cibler au mieux les vulnérabilités propres au cancer de chaque patient. Pour acquérir ces connaissances, ils ont besoin d’accéder à des données – bien plus que ce qu’un seul centre de cancérologie au Canada peut générer à lui seul.

Conscients de cela, l’Institut de recherche Terry Fox, en collaboration avec le gouvernement du Canada et des partenaires de tout le pays, a lancé en 2021 le Réseau des centres d'oncologie du Marathon de l'espoir (MOHCCN), afin de rassembler les communautés canadiennes de recherche et de soins en cancérologie et d’élaborer et de mettre en œuvre une stratégie nationale visant à accélérer la recherche et les soins en oncologie de précision, au bénéfice de tous les patients atteints de cancer au Canada. L'un des principaux piliers de cette stratégie est la création de la Cohorte de référence du MOHCCN, une ressource nationale de données visant à favoriser les découvertes fondées sur les données et à transformer la manière dont le cancer est étudié et traité.

Alors que le Réseau célèbre l'achèvement de la phase 1 de cette base de données, qui rassemble les données de plus de 15 000 patients atteints de cancer traités dans des centres à travers le pays, il est important de répondre à trois questions qui nous sont souvent posées au sujet de la Cohorte de référence : de quoi s’agit-il exactement ? en quoi diffère-t-elle des autres initiatives génomiques à grande échelle menées à travers le monde ? et comment sera-t-elle mise à profit au bénéfice des patients atteints de cancer au Canada et ailleurs ?

Comprendre la Cohorte de référence du MOHCCN

Les accords de financement signés avec le gouvernement du Canada en 2021 stipulaient que l’un des principaux résultats attendus de la première phase du Réseau (2021-2026) était la création d’une base de données nationale regroupant des données de haute qualité provenant de 15 000 patients atteints de divers types de cancer traités à travers le pays. Cette base de données serait conçue de manière à aider à identifier les modifications génétiques et moléculaires spécifiques à l’origine du cancer de chaque patient, à mieux comprendre pourquoi certains patients répondent à des traitements spécifiques tandis que d’autres n’y répondent pas, et à terme, à personnaliser les traitements pour un plus grand nombre de patients, ce qui améliorerait leurs résultats thérapeutiques et leur qualité de vie.

Il est important de noter que cette base de données serait constituée au Canada, par des Canadiens et pour des Canadiens. Elle refléterait la diversité et le caractère unique des populations canadiennes et rassemblerait des experts et des institutions de tout le pays afin de permettre l’élaboration de solutions adaptées au contexte canadien.

Afin de définir la forme que prendrait cette ressource, le Réseau a réuni des leaders d'opinion et des experts venus de tout le pays. Dès le départ, leur position était claire : le Réseau devait s'attacher à produire des données complètes, précises, durables et accessibles.

Concrètement, ces principes impliquent que les données doivent être aussi exhaustives (complètes) et de haute qualité (précises) que le permettent les technologies actuelles ; structurées de manière à faciliter les analyses tant aujourd’hui qu’à l’avenir (pérennes) ; et largement partagées afin de maximiser l’impact de la recherche, plutôt que de rester cloisonnées au sein de chaque institution (accessibles au sens large).

Pour atteindre ces objectifs, les experts ont estimé que la Cohorte de référence du MOHCCN, comme a été nommée cette ressource, devrait inclure les types de données suivants :

Séquençage du génome entier (WGS) de l'ADN tumoral – offre une vue d'ensemble de toutes les altérations génétiques présentes dans le cancer d'un patient, permettant ainsi d'identifier les facteurs de développement de la maladie, qu'ils soient connus ou inédits.

Le séquençage de l'ARN (RNA-seq) des tissus tumoraux, lorsqu'il est techniquement réalisable, permet de mettre en évidence l'activité génique au sein des tumeurs, aidant ainsi les chercheurs à comprendre comment les modifications génétiques s'expriment et influencent le comportement du cancer.

Le séquençage du génome complet de l'ADN normal (non cancéreux) correspondant, généralement prélevé dans le sang, permet de distinguer les variants génétiques héréditaires des mutations spécifiques à la tumeur, et de clarifier ainsi quelles modifications sont à l'origine du cancer.

Les données cliniques standardisées (recueillies à l'aide du modèle de données cliniques du MOHCCN) relient les résultats génomiques aux caractéristiques des patients, aux traitements et aux résultats, permettant ainsi d'obtenir des informations utiles pour des soins plus personnalisés.

Ensemble, ces données offrent la vision la plus complète possible de l’ADN et de l’ARN d’un cancer grâce aux technologies disponibles aujourd’hui, en mettant en évidence à la fois les caractéristiques connues et celles qui restent à découvrir de la biologie tumorale. Cela permet aux chercheurs de mieux comprendre quelles altérations génétiques sont présentes dans les cellules cancéreuses d’un patient et lesquelles pourraient être héréditaires, ainsi que d’étudier comment les caractéristiques moléculaires influencent la progression de la maladie, la réponse au traitement et le risque de récidive chez les personnes atteintes de cancer.

Il en résulte une ressource unique qui ouvre la voie à de nouvelles recherches sur l’origine, l’évolution et la réponse aux traitements des cancers, ainsi que sur la manière dont ces informations peuvent être mises à profit pour offrir des soins personnalisés aux patients atteints de cancer partout au pays.

S'appuyer sur les efforts mondiaux

La décision de créer cette ressource et d'y inclure ces différents types de données n'est pas venue de nulle part. En effet, la Cohorte de référence s'appuie sur des années de travail menées dans le cadre de nombreuses initiatives mondiales de grande envergure qui ont ouvert la voie à la caractérisation des cancers au niveau moléculaire.

Les premières initiatives à grande échelle

Le Cancer Genome Atlas (TCGA), lancé en 2006 par l’Institut national du cancer des États-Unis et l’Institut national de recherche sur le génome humain, a constitué la première initiative à grande échelle en génomique du cancer. En l’espace d’une décennie, le TCGA a généré des données moléculaires issues de plus de 11 000 cas répartis sur 33 types de cancer. Bien qu’elles aient révolutionné le domaine, les analyses du TCGA n’étaient pas uniformes et s’appuyaient principalement sur des technologies telles que le séquençage de l’exome, qui n’interrogent qu’une petite fraction (~2 %) du génome humain.

Le TCGA a également apporté une contribution majeure à l’International Cancer Genome Consortium (ICGC), dont l’ensemble de données initial — généré grâce à de multiples initiatives menées dans différents pays — comprenait des données provenant d’environ 24 000 patients à travers le monde.

Une évolution vers le profilage complet

À mesure que les coûts du séquençage ont baissé au cours des années 2010, le séquençage du génome entier est devenu de plus en plus réalisable à grande échelle. En 2020, le consortium ICGC Pan-Cancer Analysis of Whole Genomes (PCAWG) a publié des analyses de données génomiques complètes provenant de tumeurs et de tissus normaux appariés, issues de 2 658 patients atteints de 28 types de cancer, représentant la quasi-totalité des génomes de tumeurs accessibles au public au moment de l’étude. Des données de séquençage l’ARN étaient également disponibles pour un peu moins de la moitié de ces cas.

Plus récemment, des initiatives nationales ont produit des ensembles de données plus importants basés sur le séquençage du génome entier. En 2024, le programme sur le cancer du projet britannique « 100 000 Genomes » a publié des analyses portant sur 13 880 génomes tumoraux couvrant 33 types de cancer. À l’heure où nous écrivons ces lignes, la Fondation médicale Hartwig aux Pays-Bas a également généré des données de séquençage du génome entier provenant de plus de 8 000 patients atteints d’un cancer métastatique, des données de séquençage de l’ARN étant disponibles pour environ un tiers des cas.

Une nouvelle approche de la génomique clinique

Si le profilage complet du génome présente une valeur inestimable pour la recherche, des approches de séquençage plus ciblées — telles que les tests de « panel », qui permettent d’analyser en profondeur jusqu’à des centaines de gènes cancéreux connus — sont largement utilisées en milieu clinique pour identifier des mutations exploitables. Tirant parti de l’ampleur de ces tests, le projet GENIE, dirigé par l’American Association for Cancer Research, a rassemblé des données génomiques et cliniques provenant de plus de 200 000 patients dans plusieurs pays, dont le Canada.

De même, l’initiative Accelerating Research in Genomic Oncology (ICGC ARGO) de l’ICGC vise à analyser les données génomiques de 100 000 patients à l’échelle mondiale d’ici 2028, en utilisant une combinaison de différentes approches de séquençage. Plusieurs projets canadiens fournissent des données à la fois à l’ICGC ARGO et à la Cohorte de référence.

Le séquençage du génome complet en milieu clinique

Alors que les tests génétiques sont de plus en plus intégrés dans la prise en charge clinique courante du cancer, l’évolution vers un profilage plus complet dans le domaine de la recherche a également mis en évidence les avantages potentiels de ce type d’approche en milieu clinique. Plusieurs pays ont lancé des programmes visant à étudier l’impact de la génomique complète sur les soins cliniques, en particulier dans le domaine du cancer et des maladies rares. On peut citer, à titre d’exemple, l’Initiative française de médecine génomique (PFMG2025), qui a généré des données de séquençage du génome entier et du transcriptome provenant de plus de 3 000 patients atteints de cancer, ainsi que l’initiative Australian Genomics, qui a généré des données de séquençage du génome entier provenant d’environ 2 000 patients atteints de cancer.

Dans ce contexte, la Cohorte de référence occupe une position distincte et complémentaire au sein de l’écosystème mondial de la génomique du cancer.

3 aspects qui font de la Cohorte de référence une initiative unique

Bien que la Cohorte de référence ne soit ni le premier ensemble de données génomiques sur le cancer à grande échelle, ni le plus important en termes de nombre de patients, elle se distingue par la combinaison de son ampleur et de sa portée, ainsi que par la diversité des données qu’elle contient. L’ensemble de ces caractéristiques en fait une ressource unique au monde, conçue pour accélérer la recherche, soutenir l’innovation et, à terme, contribuer à mettre l’oncologie de précision à la portée de tous les patients atteints de cancer au Canada, ce qui améliorerait leurs résultats thérapeutiques et leur qualité de vie.

1. Une ampleur et une portée inégalées en matière de profilage complet

La Cohorte de référence allie l'ampleur — plus de 15 000 patients à ce jour — à la profondeur, grâce à une analyse cohérente du génome entier et du transcriptome sur l'ensemble de la cohorte. Il convient de noter qu'environ 85 % des cas recensés à ce jour disposent de données de séquençage de l'ARN. Le regroupement de données exhaustives à cette échelle au sein d'un cadre unique et coordonné constitue une réalisation sans précédent à ce jour.

Cette combinaison permet des analyses qui sont tout simplement impossibles à réaliser avec des ensembles de données plus petits ou moins complets, notamment l’identification d’événements génétiques rares, les comparaisons entre différents types de cancer et la découverte de nouveaux mécanismes sous-tendant le développement et la progression du cancer.

2. Des données cliniques approfondies et normalisées, associées à des données génomiques

L'un des atouts majeurs de la Cohorte de référence réside dans l'intégration de données génomiques exhaustives et de données cliniques de haute qualité.

Chaque cas comprend des informations cliniques saisies à l’aide du modèle de données cliniques du MOHCCN, qui comprend plus de 100 éléments de données standardisés. Ceux-ci incluent des détails sur le diagnostic, les traitements reçus, la réponse aux traitements et les résultats. Les sites participants sont tenus de mettre à jour les données cliniques chaque année pendant au moins cinq ans, ce qui permet un suivi à long terme.

Ce niveau d'annotation clinique permet de mener des études d'association approfondies (par exemple, en établissant un lien entre les altérations génétiques et la réponse au traitement ou la survie) et offre la possibilité de dégager des enseignements susceptibles, à terme, d'orienter des approches de soins plus personnalisées.

Il est important de noter que le modèle de données cliniques du MOHCCN est étroitement aligné sur le dictionnaire de données ARGO de l'ICGC. Cette interopérabilité permet d'intégrer la Cohorte de référence du MOHCCN à d'autres ensembles de données majeurs, ce qui renforce sa valeur et ouvre la voie à des analyses internationales d'une ampleur encore plus grande.

3. Diversité des patients, des cancers et des stades de la maladie

La Cohorte de référence se distingue également par sa diversité, tant au niveau des populations qu’elle représente que des cancers qu’elle englobe.

La recherche en génomique s’est historiquement fortement appuyée sur des données provenant de personnes d’ascendance européenne, ce qui a limité la généralisation des résultats et contribué à des inégalités en matière de soins. La diversité de la population canadienne offre l’occasion de remédier à ce déséquilibre, et la Cohorte de référence reflète les patients traités à travers le pays, rendant compte d’une grande diversité démographique, culturelle et ancestrale. Cela est essentiel pour permettre une recherche susceptible de bénéficier à la diversité des personnes touchées par le cancer, tant dans ce pays qu’à travers le monde.

Cet ensemble de données reflète également la diversité du cancer lui-même :

Plus de 40 types de cancer y sont représentés.

Les patients couvrent toute la gamme d'âges, des cas pédiatriques aux personnes âgées, dont au moins 1 000 adolescents et jeunes adultes.

La cohorte comprend des cancers à tous les stades de la maladie, dont au moins 2 700 cancers avancés.

Au moins 2 500 cas concernent des cancers rares, tels que des sous-types de sarcomes peu courants et des tumeurs malignes gynécologiques et hématologiques rares.

Il est essentiel de noter que la Cohorte de référence comprend à la fois des tumeurs primaires n’ayant jamais été traitées et des cancers récidivants ou métastatiques ayant déjà fait l’objet d’un traitement.

Des initiatives antérieures telles que le TCGA se concentraient presque exclusivement sur les tumeurs primaires non traitées, ce qui a permis d’établir une classification moléculaire fondamentale des cancers. Cependant, la résistance au traitement —qui contribue à la plupart des décès liés au cancer— ne peut être comprise qu’en étudiant les cancers après traitement. En incluant les maladies résistantes au traitement et métastatiques, la Cohorte de référence est bien placée pour soutenir la recherche sur les mécanismes de l’échec thérapeutique et de la progression de la maladie.

À mesure que l’exploration de l’ensemble de données s’étend et que notre compréhension de celui-ci s’approfondit, sa diversité et son potentiel pour améliorer la manière dont nous détectons, diagnostiquons et traitons le cancer continueront de se révéler.

Une ressource inestimable pour l’avenir de la recherche sur le cancer et des soins personnalisés

L’achèvement de la première phase de la Cohorte de référence constitue une avancée majeure pour les milieux de la recherche et des soins contre le cancer au Canada, et témoigne d’un effort extraordinaire mené par des Canadiens pour des Canadiens. Au-delà du pouvoir de transformation des données elles-mêmes, l’effort conjoint nécessaire à la constitution de cette ressource a jeté les bases d’une nouvelle ère de collaboration entre les institutions canadiennes et leurs communautés de recherche et cliniques. Cette approche concertée a contribué à l’élaboration d’une stratégie nationale visant à accélérer la médecine de précision à l’échelle du pays et a conduit à la mise au point de lignes directrices, de normes et de pratiques exemplaires accessibles au public, susceptibles de soutenir d’autres initiatives génomiques à grande échelle au Canada et à l’échelle internationale.

Alors que le Réseau entre dans sa deuxième phase, la Cohorte de référence continuera de s’étoffer, tout comme son impact sur la pratique clinique. Sur les 15 000 patients ayant fait don de leurs données génomiques et cliniques dans le cadre de la phase 1 de cette initiative, les résultats de l’analyse génomique d’au moins 1 500 d’entre eux ont été transmis à leurs équipes soignantes afin d’orienter leur traitement — c’est là l’oncologie de précision en action. Au cours de la phase 2, le Réseau s’appuiera sur ce succès pour exploiter le profilage génomique complet en temps réel afin d’orienter les soins prodigués à davantage de patients à travers le Canada, accélérant ainsi l’innovation et améliorant la vie des personnes atteintes d’un cancer. L’ensemble de données de la Cohorte de référence facilitera cette transition vers la pratique clinique et continuera de s’enrichir – tant en volume qu’en types de données, y compris différentes technologies de profilage et des données sociodémographiques plus solides – à mesure que davantage de patients seront traités au sein du Réseau.

Au cours de la phase 2, le Réseau accordera également une attention accrue à l'analyse des données et à l'utilisation des données de recherche à grande échelle issues de la ressource Cohorte de référence. Cela permettra de faire émerger des découvertes qui profiteront à tous les patients atteints de cancer au Canada, tout en contribuant à positionner le Canada comme un leader mondial dans le domaine de la recherche et des soins en oncologie de précision.

Il est important de noter qu’en cette période de changements géopolitiques, la Cohorte de référence joue un double rôle : elle contribue à affirmer la souveraineté canadienne en matière de données dans le domaine de la recherche en oncologie de précision, tout en servant d’outil pour renforcer l’intégration mondiale. Il s’agit d’une solution « made in Canada » qui profitera non seulement aux patients canadiens atteints de cancer, mais contribuera également à positionner le Canada comme un leader mondial dans la recherche et les soins en oncologie de précision.

En effet, la Cohorte de référence — et le Réseau plus largement — ne sont pas isolés, mais font partie intégrante d’un écosystème mondial qui bénéficie des efforts collectifs visant à accélérer la recherche en génomique du cancer et en oncologie de précision à l’échelle mondiale, tout en y contribuant.