Il faut investir pour faire parler les données génomiques

Anglais

De Génome Canada –  le 24 juin – Volume 29 Numero 10

Par Pierre Meulien, Ph. D.

Le séquençage de l’ADN animal, humain et végétal gagne chaque jour en rapidité et en volume, et avec lui, certaines comparaisons, inimaginables il y a encore quelques années, sont maintenant chose du possible. Par exemple, comme le remarquait récemment Calcul Canada, les appareils de séquençage de l’ADN seront « capables de produire 85 pétaoctets de données cette année », ce qui représente 33 fois l’espace du catalogue de films de Netflix.

Cette avalanche de données recèle un potentiel inouï pour plusieurs secteurs, notamment la santé humaine, l’agriculture, la gestion forestière, la bioénergie et l’aquaculture. Dans de nombreux cas, transformer cet immense potentiel en véritables percées exige une concertation qui transcende les frontières à l’intérieur des pays et même entre eux.

Par exemple, l’International Cancer Genome Project regroupe 85 équipes provenant de 17 pays qui étudient plus de 25 000 génomes tumoraux issus de 50 types de cancers, avec comme objectif de faciliter la création de traitements oncologiques personnalisés applicables à l’échelle de la planète. Le projet Global Microbial Identifier, lui, vise la construction d’un système mondial de bases de données contenant l’ADN des microbes responsables des maladies infectieuses pour améliorer les interventions des autorités lorsque surviennent des éclosions.

Le succès de tels projets repose sur la capacité des chercheurs à trouver une façon de stocker, d’interpréter et de partager au pays et dans le monde des trillions d’octets de données. Pour ce faire, trois éléments essentiels doivent être en place : a) une capacité de calcul de haute performance suffisante pour stocker et analyser les données, b) des outils logiciels sophistiqués pour les transformer en information exploitable par les chercheurs, et c) une infrastructure numérique et institutionnelle qui favorise la collaboration et la communication.

Aujourd’hui, la manne de données sur l’ADN que produisent les chercheurs canadiens est jugulée par un goulot d’étranglement informatique et numérique. Bien que les technologies de séquençage de l’ADN soient à la fine pointe, les méthodes de stockage et d’analyse des données qu’elles produisent tirent de la patte. La quantité astronomique d’information génomique représente un grand défi pour les chercheurs qui peinent à extraire, lire, partager et analyser le tout, mais c’en est un que le Canada peut relever.

Le Canada n’est pas seul dans ce bateau. Aux quatre coins du monde, les organisations engagées dans la recherche fondée sur les mégadonnées s’échinent à la collecte, au stockage, à l’interprétation et à la communication de quantités pharaoniques d’information. En effet, il s’avère parfois très difficile de déterminer la meilleure façon d’emmagasiner les données (dans des dépôts séparés ou dans le nuage) et de les rendre accessibles aux chercheurs des autres pays.

Une mesure du budget 2015 vise expressément la création d’un système national d’infrastructure de recherche numérique. Il est urgent de franchir cette étape si nous voulons que le Canada contribue à la hauteur de son potentiel à la résolution de ces problèmes à l’échelle mondiale. L’atteinte et le maintien d’une capacité de calibre mondiale en matière d’analyse, de partage et d’interprétation des données requièrent un investissement continu. En plus d’une meilleure infrastructure de calcul de haute performance et de stockage de données à grande échelle, les chercheurs ont besoin de logiciels suffisamment puissants pour interpréter les données génomiques et les faire circuler dans leurs réseaux.

La coordination institutionnelle exige aussi sa part d’investissement pour éviter que le calcul de haute performance se fasse en vase clos. De plus, des programmes de formation doivent rassembler des informaticiens, des mathématiciens et des biologistes pour produire des logiciels capables d’analyser des ensembles de données adaptés aux besoins des génomistes.

L’atteinte de ces objectifs, en particulier la production d’algorithmes complexes pour la recherche, impose une approche ascendante à certains égards. À d’autres égards, toutefois, une approche descendante est essentielle pour assurer la collaboration et l’harmonisation des efforts de tous les établissements et autres sources de financement provinciales et nationales.

Du traitement de maladies à l’endiguement de pandémies en passant par la gestion des forêts et l’augmentation des rendements agricoles, les chercheurs canadiens transforment des octets en avancées notables sur le plan de la qualité de vie. Le foisonnement de notre capacité à contribuer à la recherche mondiale de pointe exige un investissement continu dans une infrastructure de calibre international.

Leave A Comment

Top