jen juin 2000, Bill Clinton, alors président américain, se tenait souriant à côté des dirigeants de la Projet du génome humain. “En termes génétiques, tous les êtres humains, quelle que soit leur race, sont identiques à plus de 99,9%”, a-t-il déclaré. C’était le message quand le la première ébauche de la séquence du génome humain a été révélée à la Maison Blanche.
La chaîne unique de As, Ts, Cs et Gs est finalement devenue le premier génome humain de référence. Depuis sa parution en 2003la référence a révolutionné le séquençage du génome et a aidé les scientifiques à trouver des milliers de mutations pathogènes. Pourtant, à sa base se trouve un problème quelque peu ironique : le code censé représenter l’espèce humaine est principalement basé sur un seul homme de Buffalo, New York.
Bien que les humains soient très similaires, “Une personne n’est pas représentative du monde”, explique Pui-Yan Kwok, spécialiste de l’analyse du génome basé à l’Université de Californie à San Francisco et à l’Academia Sinica à Taiwan. En conséquence, la plupart des séquençages du génome sont fondamentalement biaisés.
Ce biais limite le type de variation génétique qui peut être détecté, laissant certains patients sans diagnostic et potentiellement sans traitement approprié. De plus, les personnes qui partagent moins d’ascendance avec l’homme de Buffalo bénéficieront probablement moins de l’ère de la médecine de précision, qui promet d’adapter les soins de santé aux individus.
Pour lutter contre cela, les chercheurs ont commencé à assembler des génomes de référence pour des pays spécifiques, y compris Corée du Sud, Japon, Suède, Danemark et le Emirats Arabes Unis. Ils espèrent que cela servira mieux leurs populations, mais les critiques craignent que cela ne transforme les migrants en citoyens de seconde classe dans leurs systèmes de santé. Aujourd’hui, un nouveau projet gigantesque propose une solution différente dans le but de représenter la diversité mondiale : un pangénome humain.
PLa médecine de la récision, également connue sous le nom de médecine personnalisée, est un mot à la mode au sein de la communauté médicale depuis des années et cela sonne indéniablement bien. “Apporter le bon médicament au bon patient au bon moment est le slogan”, déclare Neil Hanchard, médecin scientifique aux États-Unis. Institut national de recherche sur le génome humain.
Mais le séquençage standard du génome manque de nombreuses variations qui pourraient être liées à la maladie. Dans la plupart des cas, cela fonctionne en coupant l’ADN en petits morceaux appelés « lectures courtes », avant de les séquencer et de les organiser en un génome en utilisant la référence comme guide.
Les variants mononucléotidiques (SNV) – un changement d’un C à un T dans le code d’un gène, par exemple – sont pour la plupart faciles à repérer de cette façon, mais de plus grands morceaux de variation connus sous le nom de variants structurels (SV) sont plus délicats. De nouvelles sections, parfois longues de centaines ou de milliers de paires de bases, peuvent ne pas être détectées, tout comme les sections manquantes, inversées ou déplacées ailleurs. Dans ces cas, les lectures courtes ne peuvent pas facilement être mappées à la référence et “tout un tas”, dit Kwok, est jeté.
Cela signifie que le séquençage standard du génome est biaisé en faveur des SV déjà dans la référence. Si vos SV diffèrent, vous vous retrouvez avec une séquence qui ne capture pas entièrement votre variation personnelle. Comme ce sont ces petites différences entre les personnes qui, nous l’espérons, nous diront, par exemple, pourquoi une personne pourrait bien réagir à un médicament mais pas une autre personne, c’est une mauvaise nouvelle.
Le travail de Kwok fait allusion au nombre de SV non détectés. En 2019son équipe a analysé des échantillons de 154 personnes à travers le monde et a trouvé 60 millions de paires de bases de contenu du génome SV manquant dans la référence, avec beaucoup plus encore là-bas. UN suivre de 338 personnes qui n’ont cherché que de l’ADN supplémentaire inséré ont trouvé près de 130 000 nouvelles séquences.
Mais les SV semblent également montrer des schémas de fréquence différents dans différentes populations. Par extension, dit Kwok, si une personne “est issue d’une population assez différente de la personne dont la référence du génome est dérivée, il y aura plus de désalignement” lorsque leurs lectures courtes sont mappées sur la référence. Par conséquent, dit-il : “Nous pouvons manquer des variantes de risque dans les régions non représentées dans la référence.”
Ce manque de représentation est un problème général en génomique. Même les SNV les plus étudiés présentent de grandes lacunes dans les données. Récemment, par exemple, Hanchard et ses collègues a échantillonné 426 individus de 50 communautés ethnolinguistiques groupes à travers l’Afrique et ont trouvé plus de 3 millions de nouveaux SNV, principalement issus de populations qui n’avaient jamais été échantillonnées auparavant. “Nous n’avons même pas touché [SVs]», dit Hanchard, « mais nos données préliminaires suggèrent que ce sera plus ou moins la même chose. »
Ces disparités de données affectent directement les résultats médicaux. Par exemple, si une personne atteinte d’une variante rare est atteinte d’une maladie rare, il y a de fortes chances que la variante en soit responsable. Mais souvent, nous ne savons pas si les variantes sont véritablement rares ou simplement courantes dans les populations sous-étudiées. Dans ces cas, les médecins ne peuvent pas donner de diagnostic. “Pour les personnes d’ascendance non européenne, cela se produit beaucoup plus”, explique Hanchard.
Alors que nous entrons dans une ère de médecine de précision, cela ne fera que gagner en importance. Kári Stefánsson, dont la société de biotechnologie DeCode basée à Reykjavik La génétique se spécialise dans l’établissement de liens entre les variantes génétiques et la maladie, dit que ce qui l’empêche de dormir, c’est que notre compréhension de la diversité au sein des populations d’origine européenne est maintenant si bonne que nous pouvons commencer à l’utiliser pour la médecine de précision. Mais pour d’autres populations, « nous n’avons pas le même genre de données », dit-il. “[This] va augmenter les disparités en matière de soins de santé au-delà de ce qu’elles sont aujourd’hui.
Os’il n’y a pas de fondements génétiques qui regroupent de manière significative les gens en différentes racescertains pensent qu’il est logique de créer des références pour saisir la variation au sein de populations spécifiques, telles que les groupes ethniques et les États-nations. Un pays qui a maintenant sa propre référence est le Danemark.
“Ce que nous voyons, c’est qu’il y a beaucoup de variations qui [has only been detected in] la population danoise », explique le biologiste informatique Simon Rasmussen de l’Université de Copenhague, qui a dirigé les travaux. C’est un argument fort en faveur d’une référence locale, et l’attrait est évident : une référence basée sur les Danois est particulièrement bien placée pour dynamiser le système de santé danois.
Mais certains reprochent aux génomes nationaux de se concentrer trop sur les différences entre les populations plutôt que sur les individus. L’anthropologue médicale Emma Kowal de l’Université Deakin à Victoria, en Australie, craint que les génomes nationaux ne « maintiennent vivante l’idée de race ». Et encadrer les génomes en termes de nationalité conduit inévitablement à l’exclusion, déclare Jenny Reardon, sociologue des sciences de la vie basée à l’Université de Californie à Santa Cruz. “Nous décidons, en effet, qui est danois et qui ne l’est pas.”
Rasmussen admet que la référence serait moins utile pour le 15% de la population danoise qui sont migrants ou leurs descendants. Des échantillons de personnes d’ascendance mixte ont même été retirés lors de la sélection pour la référence. Mais à cause de problèmes de consentement, la référence n’a jamais été faite à la clinique, alors Rasmussen et son équipe veulent en créer une autre. Pour cela, il déclare : « Nous voulons prendre une autre [selection] approcher.” Comment exactement reste à déterminer.
Il existe cependant une alternative aux génomes nationaux. Au lieu de zoomer sur différentes populations, le Consortium de référence sur le pangénome humain veut faire un zoom arrière ; superposant de nombreux génomes pour créer une référence qui comporte des variations – un pangénome. Le consortium a récemment publié le premier projet de une telle référence dans une prépublication.

Composé de 47 génomes extrêmement détaillés, le projet représente le premier morceau des 350 génomes qu’il prévoit de séquencer pour inclure la variation la plus courante à travers le monde. “Ce n’est pas une norme qui n’a jamais été réalisée auparavant”, déclare Karen Miga de l’Université de Californie à Santa Cruz, qui fait partie du consortium.
Mais le projet ne consiste pas seulement à séquencer des données plus diverses. “Nous devons proposer une meilleure structure de données pour coder ces informations”, déclare le collègue de Miga, Ting Wang, de la faculté de médecine de l’Université de Washington à St Louis, Missouri.
Cette structure de données s’appelle un graphe génomique. Contrairement à la référence actuelle, qui n’est qu’une longue chaîne de lettres, le graphique du génome montre la variation entre les génomes comme des détours sur un chemin autrement partagé. Cela permettra aux chercheurs et aux médecins de mapper des lectures courtes sur la version du chemin qui correspond le mieux à leur échantillon.
La question naturelle est : comment choisit-on qui représente le monde ? Les premiers génomes se sont qualifiés en raison de leur haute qualité technique, mais le consortium devra choisir de nouveaux échantillons à l’avenir. Puisque l’Afrique est le berceau de l’humanité, Miga déclare : « La grande majorité des génomes que nous incluons sont d’ascendance africaine.
Du point de vue de Reardon, cependant, 350 personnes pourraient mieux représenter le monde qu’une seule personne, mais “[the consortium] ont fait des choix concernant les groupes », dit-elle. « Qui ont-ils échantillonné ? Qui n’ont-ils pas échantillonné ? » Tant que la référence ne contient qu’un sous-ensemble, on peut dire que quelqu’un ne fera pas la coupe.
Miga ne le nie pas. “[We are] essayant vraiment de capturer les variations communes au niveau mondial, donc les choses que vous verriez assez fréquemment », dit-elle. Documenter les variations courantes dans ce cas laisse de côté les variations peu courantes. “Si vous cherchez quelque chose d’extrêmement rare”, dit-elle, “ce n’est pas notre responsabilité pour le moment.”
jeDans un monde idéal, les individus auraient leurs génomes séquencés sans l’utilisation d’une référence. Cela a longtemps retenu comme la solution ultime et sans problème, mais presque personne ne croit que c’est sur les cartes. “Ce n’est pas une entreprise triviale et je ne pense pas que ce soit non négligeable dans 10 ans”, déclare Hanchard.
Et plutôt que d’utiliser un large pangénome mondial, les pays pourraient être influencés par une référence plus adaptée à leur population, ainsi que maintenue et contrôlée par eux-mêmes. “Nous ne nous attendons pas vraiment à ce que quelqu’un d’autre que les Danois fabrique un génome de référence danois”, déclare Rasmussen, qui espère que la prochaine itération sera dirigée par le Centre national de génomique du Danemark, contrôlé par l’État, potentiellement dans le cadre du programme de l’UE. Génome de l’Europe projet.
Hanchard voit également l’intérêt des références locales ou régionales. “[The pangenome] toutes les variations ne seront pas représentées », dit-il. Il fait partie de la Consortium H3Africaqui vise à apporter les avantages de la génomique en Afrique et envisage un graphe génomique spécifique à l’Afrique. En même temps, il s’attend à ce que toutes ces références finissent probablement par fusionner.
Interrogé sur ses espoirs pour l’avenir de la génomique, il parle de connaître et de comprendre la variation en ce qui concerne lui-même ou toute autre personne d’ascendance jamaïcaine. “J’aimerais arriver à un point où tout le monde se sent représenté et que c’est pour eux, autant que pour n’importe quel groupe en particulier”, dit-il. “Nous sommes d’une seule humanité, c’est la partie importante.”