Mobiliser le pouvoir de l’infonuagique scientifique pour combattre la COVID-19

Anglais

L’Université de Victoria (UVic) et Calcul Canada font appel au puissant système Arbutus, le plus important système infonuagique scientifique au Canada, pour effectuer l’analyse de la structure protéique du virus SARS-CoV-2 dans le cadre d’un effort collaboratif international visant à aider les chercheurs à trouver des thérapies médicamenteuses pour combattre la COVID-19.

Folding@home est un projet de calcul distribué collaboratif international visant à exécuter des simulations de repliement des protéines dans le but de comprendre la maladie et de trouver une façon de la traiter. Folding@home est le tout premier système infonuagique scientifique à atteindre le seuil des exaflops en matière de puissance; elle est maintenant supérieure à la puissance combinée des 500 superordinateurs les plus puissants au monde.

Pour lutter contre la COVID-19, Folding@home analyse les protéines virales du virus SARS-CoV-2, comme la structure distinctive de la protéine en spicule du coronavirus, qui se lie à la protéine ACE2 que l’on retrouve sur la surface des cellules du poumon humain, ce qui permet au virus de s’y infiltrer, et la protéase principale du virus, qui facilite la réplication de celui-ci. La découverte d’un composé qui se lie à une de ces protéines ou qui l’inhibe pourrait mener à l’élaboration d’un traitement médicamenteux contre la COVID-19.

Parmi les 250 000 équipes qui participent au projet Folding@home au moment d’écrire le présent article, l’équipe de Calcul Canada figure parmi les 15 principaux contributeurs au monde en matière du nombre de simulations par jour, ainsi que parmi les 100 principaux contributeurs sur le plan du total cumulatif de contributions grâce à ses milliers d’unités de travail consacrées aux simulations de repliement des protéines par jour. Arbutus est actuellement au quatrième rang des contributeurs individuels à l’échelle mondiale. La grappe Cedar, située à l’Université Simon Fraser, consacre également des ressources par l’entremise du traitement par lots de tâches préemptibles.

Tout a commencé par un essai…

Arbutus est l’un des cinq sites de calcul de recherche national au Canada. Cette grappe est hébergée à l’UVic et exploitée par le Service de calcul de recherche (Research Computing Services ou RCS) de UVic Systems, en partenariat avec Calcul Canada et son partenaire régional WestGrid.

Innovation, Sciences et Développement économique Canada (ISDE), en collaboration avec Calcul Canada, a récemment financé une expansion majeure (« phase 3 ») du matériel du système Arbutus dans le but d’augmenter considérablement ses ressources de calcul, ses capacités de stockage, et les capacités du système en général. Cette expansion en était aux dernières étapes du déploiement en début mars, au moment où la COVID-19 commençait à se propager partout dans le monde.

Le personnel hautement qualifié du RCS de UVic Systems avait besoin d’une période de rodage afin de mener des essais exhaustifs de l’expansion du matériel et la mettre en service; étant donné que ses contributions aux recherches sur la COVID-19 étaient sa priorité principale, il a effectué la mise à l’essai, la configuration et le lancement d’une petite démonstration de faisabilité du déploiement de l’application Folding@home et a réussi à traiter sa première unité de travail de simulation, le tout en moins d’une journée.

Au cours des jours et des semaines qui ont suivi, l’équipe du RCS a travaillé de manière acharnée sur un système massif à évolutivité horizontale à l’aide de TerraFold, un environnement à grappes virtuel conçu pour Folding@home que l’équipe a élaboré pour gérer et approvisionner le grand nombre de systèmes de façon efficace à l’aide d’Ansible et de Terraform.

Les spécialistes de calcul scientifique de RCS, qui ne possédaient aucune connaissance antérieure de l’application Folding@Home, ont éliminé de nombreux obstacles à l’extensibilité, ont automatisé les processus d’approvisionnement et d’extensibilité, et ont déployé plus de 10 000 CPU virtuels et 300 GPU virtuels en l’espace de deux semaines.

« Les systèmes de calcul massifs et les déploiements dynamiques à grande échelle sont deux des éléments qui m’ont attiré vers le domaine du calcul informatique de pointe », a dit Ryan Taylor, spécialiste principal en calcul de recherche de l’équipe de RCS de l’UVic, « mais travailler sur ce projet au cours des dernières semaines a été une expérience particulièrement intéressante, car il me donne l’occasion de faire une différence immédiate dans l’effort collectif face à une crise mondiale; c’est un peu différent du travail que je fais habituellement au quotidien ».

Parallèlement, d’autres chercheurs canadiens mènent rapidement d’autres travaux dans le cadre de la lutte contre la COVID-19, et Calcul Canada offre des priorités spéciales pour l’allocation de ressources associées à ces projets. À mesure que ces nouveaux projets avancent, la flexibilité de l’environnement infonuagique Arbutus permet le ralentissement graduel de l’utilisation de TerraFold pour assurer que l’on puisse consacrer pleinement la plus grande partie du nuage possible au service des charges de travail scientifique en tout temps.

Le système en détail : en quoi consiste le nuage Arbutus?

Arbutus est un environnement infonuagique de recherche spécialement conçu pour les chercheurs canadiens et il est le plus important en son genre au pays. Il comporte plus de 30 000 CPU virtuels, 140 téraoctets de mémoire vive, plus de 18 pétaoctets d’espace de stockage, et 104 GPU V100-PCIE-32Go de Tesla pour l’accélération des charges de travail de traitement de données grandement parallélisées comme celles en intelligence artificielle, en bio-informatique et en dynamique moléculaire.

L’infonuagique est une forme unique de calcul scientifique qui facilite l’approvisionnement hautement agile de ressources pour les charges de travail allouées par concours, maximise l’usage efficace des ressources infonuagiques en utilisant la capacité libre lorsqu’elle est disponible, et réduit l’usage des ressources de façon dynamique lorsque d’autres charges de travail nécessitent des ressources supplémentaires.

L’expansion du système Arbutus en mars a augmenté les ressources de calcul et de stockage existantes en ajoutant plus de 13 000 vCPU, 78 To de mémoire vive, et 15 pébioctets d’espace de stockage sur disque brut. L’expansion a également fourni de nouvelles fonctions grâce à un ensemble de 104 GPU, à un système de sauvegarde sur bande magnétique de 24 Po, et au déploiement de systèmes de fichiers en grappe et de systèmes de stockage objet.

L’accès aux ressources infonuagiques d’Arbutus est offert gratuitement au personnel et aux chercheurs principaux qui mènent des recherches universitaires dans une université, un collège ou un établissement de recherche (y compris les hôpitaux de recherche) au Canada. Pour obtenir plus de renseignements ou pour faire une demande d’accès, veuillez consulter la page suivante : https://docs.computecanada.ca/wiki/Cloud/fr.

Comment les simulations de repliement des protéines aident-elles à combattre la COVID-19?

Les protéines (comme les anticorps et les enzymes, entre autres) sont responsables de la plupart des fonctions biologiques chez tout organisme vivant. Les protéines se composent de chaînes d’acides aminés et la fonction précise de chacun d’entre eux est déterminée par la façon dont ces chaînes se replient pour former une structure particulière, se lient ensemble ou changent potentiellement de forme lorsqu’elles interagissent avec d’autres molécules. Toutefois, avec les techniques expérimentales que nous connaissons actuellement, il nous est impossible d’observer les protéines en mouvement lors du repliement et des transitions structurelles. C’est pourquoi les chercheurs mènent des simulations de dynamique moléculaire pour visualiser et comprendre ces processus, ainsi que pour révéler les possibilités thérapeutiques pour le traitement de maladies, notamment trouver des candidats-médicaments qui pourraient interrompre ou modifier ces processus.

Pour obtenir plus de renseignements au sujet du projet Folding@home et savoir comment vous pouvez y participer à l’aide de votre propre ordinateur, visitez le site Web du projet (en anglais seulement). Pour vous joindre à l’équipe de Calcul Canada pour le projet Folding@home, installez le client dans votre ordinateur personnel et saisissez le numéro de l’équipe, 250396, dans le champ approprié.

Top