Basé sur une technologie d’apprentissage en profondeur, Deepfilter passe automatiquement au crible les faux résultats positifs générés par les techniques de séquençage de gènes de nouvelle génération pour améliorer la précision et l’efficacité du diagnostic et du traitement du cancer. Crédit : Tsinghua Science and Technology, Tsinghua University Press
Les stratégies de lutte contre le cancer de nouvelle génération reposent sur le séquençage de gènes de nouvelle génération (NGS), qui ouvre la voie à de nouvelles techniques et outils pour détecter les mutations et déterminer le traitement des patients. Une équipe de chercheurs chinois a proposé une stratégie plus efficace pour filtrer les faux résultats positifs, ce qui améliore la précision et l’efficacité du diagnostic et du traitement du cancer.
L’équipe de recherche a proposé DeepFilter, un filtre basé sur l’apprentissage en profondeur pour supprimer faux positifs dans les variantes somatiques dans les données NGS.
Leur étude a été publiée le 6 janvier 2023 dans Science et technologie Tsinghua.
Découverte mutations somatiquesou des altérations des tissus normaux, est essentielle pour comprendre les maladies génétiques mortelles du génome humain telles que le cancer. Le séquençage de gènes de nouvelle génération accélère la recherche de mutations somatiques en utilisant des technologies qui séparent l’ADN/ARN en plusieurs morceaux et identifient les séquences en parallèle, produisant des milliers ou des millions de séquences simultanément. Cette technique améliore la précision tout en réduisant le coût et le temps de séquençage.
De puissants « outils d’appel » parcourent les données NGS et localisent les tumeurs ou d’autres mutations en comparant les séquences à un génome de référence provenant de tissus apparentés chez le même individu.
VarDict est un outil d’appel de variantes somatiques couramment utilisé dans recherche clinique. Des études antérieures ont montré que VarDict atteint des taux de précision plus élevés et détecte plus de vraies variantes que des outils d’appel similaires. Cependant, VarDict génère également un nombre plus élevé de faux positifs que les autres appelants, ce qui peut fausser les résultats.
“Une taux d’erreur de 1:10 000 dans un génome avec 3 milliards de positions entraînerait de nombreux faux appels, ce qui pourrait conduire à des diagnostics cliniques inexacts », a déclaré Zekun Yin, auteur de l’étude de l’Université du Shandong. « Cependant, le filtrage des vrais positifs peut également conduire à des diagnostics manqués. .”
En règle générale, les chercheurs filtrent manuellement certains des faux positifs, un processus onéreux et coûteux que l’équipe de recherche chinoise a entrepris d’atténuer.
“Cela permettra d’économiser beaucoup de temps et d’argent si nous fournissons une méthode automatique pour filtrer efficacement la plupart des faux positifs”, a déclaré Hao Zhang, auteur de l’étude de l’Université du Shandong.
Inspirée par les récents succès intégrant des méthodes basées sur l’apprentissage automatique pour appeler des variantes génétiques à partir de données NGS, l’équipe de recherche chinoise a introduit un filtre de variantes basé sur l’apprentissage en profondeur. Baptisé DeepFilter, le filtre est conçu pour filtrer efficacement les variantes de faux positifs générées par VarDict tout en garantissant une sensibilité élevée aux appels.
DeepFilter traite la tâche de distinguer si une variante est vraie ou fausse comme un problème de classification binaire. Les chercheurs ont utilisé trois types d’ensembles de données pour former et tester DeepFilter : des données d’échantillons normaux de tumeurs du monde réel, un mélange de deux données de référence et des données synthétiques.
Les résultats expérimentaux basés sur des données NGS synthétiques et réelles étaient prometteurs :
« DeepFilter a surpassé les autres filtres en termes de tâches de filtrage de variantes faussement positives, ce qui a rendu VarDict plus précieux dans la recherche clinique pratique et a grandement facilité l’analyse en aval dans la recherche biologique et le traitement des patients », a déclaré Zhang.
L’équipe prévoit d’approfondir le problème des faux positifs une variante filtrage, en examinant spécifiquement le problème de déséquilibre des échantillons positifs et négatifs et en incorporant d’autres apprentissages automatiques et l’apprentissage en profondeur méthodes de filtrage.
“Notre objectif ultime est de résoudre le problème de l’efficacité et de la précision des appels de variation et de fournir un outil de détection de variation à la pointe de la technologie”, a déclaré Yin.
Plus d’information:
Hao Zhang et al, DeepFilter : un filtre de variante basé sur l’apprentissage en profondeur pour VarDict, Science et technologie Tsinghua (2023). DOI : 10.26599/TST.2022.9010032
Fourni par Tsinghua University Press
Citation: Le filtre d’apprentissage en profondeur améliore la précision de la détection des mutations cellulaires et la précision des diagnostics de cancer (1er février 2023) récupéré le 1er février 2023 sur https://medicalxpress.com/news/2023-02-deep-learning-filter-precision-cell -mutation.html
Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.