Le financement du calcul informatique de pointe en recherche garant du succès en R.-D.

Mark Dietrich, président et chef de la direction de Calcul Canada

Anglais

Qu’est-ce que la liste courte des candidats au titre de Personnalité de l’année du Times, un titre de noblesse et une course mondiale ont à voir avec les infrastructures de calcul informatique de pointe en recherche au Canada?

La chercheuse Fabiola Gianotti s’est vu décerner en juin un doctorat honorifique de l’Université McGill pour ses travaux sur le boson de Higgs. Cette physicienne des particules subatomiques de Milan avait également été finaliste pour le titre de Personnalité de l’année du Times en 2012. Deux scientifiques ayant respectivement prédit l’existence du boson de Higgs et participé à sa découverte ont quant à eux été anoblis en juin.

La particule insaisissable a enfin été détectée en 2012 à l’accélérateur de particules du CERN, en Suisse, dans le cadre de deux expériences colossales, CMS et ATLAS, qui exploitent des centres de données dans le monde entier. Cette découverte stupéfiante, rapportée dans les médias du monde entier et de nombreux documentaires, aurait été impossible sans le calcul informatique de pointe en recherche.

Le Canada a joué un rôle dans cette découverte grâce à la participation de dizaines de collaborateurs tels que Mme Gianotti et à ses infrastructures numériques, notamment le centre de données TRIUMF de Vancouver, l’un des plus illustres laboratoires de physique des particules subatomiques du monde.

Pour l’analyse des données au Canada, l’équipe d’ATLAS a eu recours à quatre centres de données exploités par Calcul Canada. TRIUMF et Calcul Canada ont mobilisé 40 universitaires et 150 chercheurs canadiens dans le cadre de cet effort international. Leur apport à la quête du boson de Higgs a été capital.

Aujourd’hui, ATLAS stocke plus de 120 Po de données aux quatre coins du monde et prévoit atteindre 500 Po en 2020. (Pour illustrer l’ampleur de ce volume de données, un seul pétaoctet de fichiers musicaux représenterait 2 000 ans de musique continue, sans répétition.)

Les percées dans les domaines de l’imagerie médicale et du séquençage génétique stimulent l’essor de la bio-informatique et de la biologie computationnelle. Or, la croissance de ces secteurs s’appuie sur de très grands volumes de données. Les bases de données voient leur volume doubler chaque année dans les domaines de la génomique et de la protéomique, et au rythme de trois à quatre mois pour d’autres types de données.

Le stockage d’une telle quantité d’information entraîne des coûts exponentiels, et il faut parfois compter plusieurs semaines pour transférer les énormes fichiers sur les réseaux les plus rapides. Il est donc impératif de trouver une solution aux problèmes de stockage et de transfert des données si nous voulons mieux comprendre les maladies, créer de nouveaux médicaments et faire de la médecine personnalisée une réalité.

L’infrastructure numérique est désormais un élément essentiel de la science transformatrice, et non plus un simple outil pratique. Elle fournit la clé des mystères du cerveau humain, la puissance nécessaire pour concevoir la nouvelle génération d’aéronefs et la possibilité de prévoir les catastrophes naturelles afin d’épargner des vies et de protéger les biens.

De nos jours, les plus impressionnants projets scientifiques à l’échelle mondiale reposent non seulement sur l’excellence de nos chercheurs, mais aussi sur notre infrastructure numérique. C’est grâce à elles que le Canada participe à l’effort mondial et peut attirer et conserver les plus éminents cerveaux. Ces ressources sont essentielles au maintien du pays parmi les chefs de file du monde scientifique. En outre, l’infrastructure numérique est un moteur d’innovation dans les secteurs des mines et de l’énergie, de l’aérospatiale, de la pharmacologie et des technologies médicales, ainsi que des technologies propres. Aujourd’hui, la R.-D. industrielle dépend entièrement de l’informatique pour la modélisation, la simulation, la visualisation et la conception.

Si l’accès Internet à large bande est un facteur de productivité reconnu dans notre économie, de même, la disponibilité d’infrastructures de calcul informatique de pointe est indispensable pour la recherche scientifique et l’innovation.

Les plus éminents scientifiques sont attirés vers les pays qui mettent à leur disposition des infrastructures informatiques à la fine pointe. Si l’on considère les ressources de calcul informatique de pointe en moyenne par chercheur (selon le classement des 500 principaux centres de superinformatique et les statistiques de l’UNESCO sur les chercheurs), le Canada occupe le septième rang.

      • États-Unis 43,5
      • Allemagne 28,5
      • Japon 24,2
      • R.-U. 17,7
      • France 17,2
      • Italie 16,1
      • Canada 10,5

Selon les gigaflops par chercheur (capacité de traitement par chercheur)

Dans ces pays, on n’observe pas une croissance radicale du nombre de chercheurs; toutefois, leur capacité informatique enregistre une hausse annuelle d’environ 80 % depuis 2010. Ces chiffres indiquent que nous devons doubler la capacité de nos infrastructures numériques chaque année en vue d’attirer et retenir les meilleurs cerveaux, de mettre au point de nouveaux produits et de participer aux initiatives mondiales de science transformatrice.

Calcul Canada exploite et entretient l’ensemble des infrastructures de calcul informatique de pointe en recherche du pays, en partenariat avec ses organismes régionaux, des institutions très actives dans le domaine de la recherche et le réseau CANARIE. Le modèle canadien, unique au monde, garantit l’accessibilité des ressources à presque toutes les universités du pays. Nous pouvons optimiser son utilisation à l’échelle de la plateforme nationale en vue de tirer le maximum des fonds disponibles.

Plus de 80 % de notre capacité est attribuée au moyen de concours et d’évaluations par les pairs. Cette méthode garantit aux meilleurs chercheurs canadiens les ressources nécessaires pour mener à bien leurs travaux, tout en donnant à l’ensemble des scientifiques un accès aux services de Calcul Canada. À l’heure actuelle, 55 % des besoins sont satisfaits en dehors des institutions auxquelles se rattachent les chercheurs et 19 % le sont en dehors de leur région. Nous voulons que les chercheurs ne se soucient pas du système qu’ils utilisent. Idéalement, ils ne devraient même pas le savoir, mais nous n’en sommes pas encore là.

Calcul Canada s’emploie à faciliter le partage de l’expertise. Dans bon nombre de disciplines, la recherche axée sur le numérique est une réalité incontournable qui nécessite les conseils et le soutien des experts de Calcul Canada. Le meilleur moyen d’accélérer les travaux est souvent de créer des outils en ligne sophistiqués qui allient la facilité d’utilisation sur le Web, les services permettant de trouver les données de recherche appropriées et la puissance de nos plus importants systèmes. Les plateformes canadiennes CBRAIN, dans le domaine des neurosciences, et GenAP, en génomique, sont deux exemples d’outils de classe mondiale. Les deux plateformes (financées par le réseau CANARIE) ont la capacité d’amplifier les répercussions dans leurs domaines respectifs, ainsi que dans des domaines connexes, par ordre de grandeur. C’est ici qu’entrent en jeu les plus éminents scientifiques du monde.

Le stockage des données de recherche est notre prochain défi. Le gouvernement a signifié son intérêt à l’égard des données massives et des données ouvertes. L’initiative de cyberinfrastructure de la Fondation canadienne pour l’innovation (FCI) privilégie les propositions axées sur de grands volumes de données, mais nous n’avons pas défini avec précision la quantité de données à stocker ni le coût lié au stockage pour une période de cinq ans, encore moins pour toujours.

Pour mieux cerner le rythme de multiplication des données et l’évolution des besoins de calcul informatique de pointe en recherche, Calcul Canada a lancé l’initiative du Plan durable pour l’informatique de pointe en recherche (PDIPR) en vue d’aider les chercheurs et les institutions à définir leurs besoins en matière d’infrastructures de calcul informatique de pointe en fonction de la trajectoire scientifique qui leur est propre pour les cinq à dix prochaines années. En collaboration avec les différentes disciplines de recherche, les institutions, les organismes subventionnaires et nos partenaires clés tels que CANARIE et Données de recherche Canada, nous établirons les prévisions détaillées des besoins du milieu scientifique canadien en matière d’infrastructures de calcul informatique de pointe.

Cette évaluation des besoins sera cruciale au maintien du Canada parmi les chefs de file de la science et de l’innovation.

Calcul Canada met tout en œuvre pour que les investissements canadiens dans les infrastructures numériques évoluent au rythme des besoins des disciplines scientifiques transformatrices. La course est lancée. Nos scientifiques et chercheurs industriels et universitaires de premier plan doivent être en mesure de soutenir la concurrence mondiale. Pour cela, il nous incombe de leur fournir les outils nécessaires pour atteindre l’excellence.


Mark Dietrich

Mark Dietrich est président et chef de la direction de Calcul Canada. Il dirige l’ensemble du personnel à l’échelle nationale de même qu’une équipe de plus de 150 experts. Calcul Canada et ses six partenaires régionaux assurent la prestation de services informatiques de pointe d’un bout à l’autre du pays.

Top