Le calcul informatisé de haute puissance : Ce n’est plus seulement pour l’astrophysique

Anglais

Les chercheurs en sciences humaines et sociales font aussi appel à l’infrastructure numérique pour l’avancement de leur recherche et un outil canadien appelé Voyant permet à ceux qui travaillent avec des textes de le faire aisément.

Susan Brown se souvient d’avoir vu les visages de ses étudiants s’éclairer lorsqu’elle leur a montré le nouvel outil de recherche numérique et leur a expliqué comment il pourrait les aider dans leur recherche.

« C’était incroyable de voir leurs visages lorsqu’ils découvraient le potentiel de cet outil pour leurs travaux », raconte Brown, titulaire de la Chaire de recherche du Canada sur la recherche numérique collaborative et professeur invité aux universités de Guelph et de l’Alberta.

L’outil s’appelle Voyant et c’est une application de sciences humaines numériques faite spécialement pour étudier des textes. Il est basé sur le Web, donc il n’est pas nécessaire de l’installer et il est simple d’emploi. Lorsqu’on accède à l’URL (voyant-tool.org), on trouve une fenêtre dans laquelle on peut coller un texte. Disons, une pièce de Shakespeare ou les œuvres complètes de Jane Austen. Ensuite, on peut immédiatement demander l’analyse du texte de plusieurs façons. On pourrait, par exemple, comparer les rôles du genre et de la race dans la pièce.

« L’outil est fait pour déceler les caractéristiques d’un texte ou les relations entre des textes, explique John Simpson, spécialistes en sciences humaines et sociales à Calcul Canada. Dans certains cas, il fera presque tout le travail pour vous et dans d’autres cas, il suggère des orientations pour la poursuite de l’étude. »

Voyant est également gratuit, ce qui est un autre avantage évident et, comme si ce n’était pas suffisant, il produit une image graphique qu’on appelle un nuage de mots-clés à partir des mots qui reviennent le plus souvent dans le texte en question. « La combinaison du fait qu’il est gratuit et de la puissance de l’interface est ce qui attire le grand nombre de visiteurs uniques, avance Geoffrey Rockwell, professeur de philosophie et d’informatique des sciences humaines à l’Université de l’Alberta et cocréateur de Voyant. En effet, il reçoit annuellement plus de 200 000 visiteurs uniques. »

John Simpson ajoute que cela en fait l’outil le plus populaire de la plateforme de Calcul Canada.

Stefan Sinclair, cocréateur et professeur agrégé au département de langues, littérature et cultures de l’Université McGill, se déclare ravi de voir leur outil si largement exploité. Dans le monde du codage, l’une de ses passions, il n’y a pas beaucoup de rétroaction au-delà des statistiques d’utilisation.

« Il y a beaucoup de silence, c’est pourquoi il est si exaltant de pouvoir dire qu’on a créé cet outil et que la communauté en profite, souligne-t-il. C’est très satisfaisant de voir l’attraction et le taux d’utilisation. »

Sinclair indique qu’ils reçoivent des journaux Web qui leur fournissent des statistiques sur la façon dont l’outil est utilisé, mais ils savent aussi, par Twitter et par des rencontres lors de conférences, que les professeurs s’en servent en classe.

« Voyant est utilisé dans presque toutes les classes où les sciences humaines numériques sont abordées », affirme son créateur. Selon lui, il est toutefois un peu plus rare que des pairs, chercheurs universitaires eux-mêmes, lui mentionnent l’avoir employé pour une raison ou une autre dans leur recherche, mais il sait bien qu’ils s’en servent.

« Les chercheurs y ont recours pour commencer à explorer et commencer à poser des questions, précise Sinclair. Cela ne veut malheureusement pas dire qu’ils prennent la peine de le nommer comme produit final. Google a beau être très puissant, personne ne va le citer; c’est un peu la même chose qui se produit ici. »

Il entend également parler à l’occasion de personnes qui font usage de leur outil en dehors du contexte universitaire et cela lui procure une tout autre fierté.

« Cela fait près de 10 ans que Voyant est sur le serveur de Calcul Canada, alors c’est presque comme s’il avait normalisé le calcul informatisé de haute puissance d’une manière dont les gens n’ont pas conscience, continue-t-il. Il fait partie d’une infrastructure qui fonctionne sur un nuage informatique de pointe. »

On a tendance à considérer le calcul informatisé de haute puissance comme un outil réservé aux astrophysiciens, aux chimistes et aux généticiens. On ne s’attend pas à ce qu’il soit également utile à ceux qui analysent la littérature produite il y a des siècles, et c’est pourtant le cas partout dans le monde.

Brown y a continuellement recours dans ses recherches. Par exemple, elle a déposé dans l’outil un corpus de huit millions de mots sur l’histoire numérique des écrits par des femmes et cela l’a aidé à déterminer si les auteures ayant plusieurs enfants étaient plus ou moins prolifiques que les autres. « Il y a une corrélation, chez les femmes, entre le fait d’avoir un très grand nombre d’enfants et l’étendue de la production littéraire, a-t-elle appris. Je ne croyais pas à la théorie féministe que la maternité empêchait l’écriture. Il n’y a pas eu beaucoup d’écrivaines ayant de grosses familles, mais ces dernières écrivaient comme des forcenées pour les soutenir. Ceci est un exemple d’étude où nous avons tiré profit des visualisations de Voyant pour explorer les textes. »

Diane Jakacki, coordinatrice des études numériques et membre associée du corps professoral en sciences humaines comparatives à Bucknell University en Pennsylvanie, emploie aussi l’outil dans ses recherches. Elle a travaillé à l’édition, pour Internet Shakespeare Editions, de la pièce Henry VIII de Shakespeare qui raconte les procédures de divorce d’Henri VIII d’avec Catherine d’Aragon afin d’épouser Anne Boleyn. Elle s’est servie de Voyant pour étudier le choix des mots, les thèmes et les personnages de la pièce et, en suivant l’idée de l’état de reine, elle a découvert qu’il y avait une différence entre la façon dont les personnages étaient décrits et la façon dont ils se décrivaient eux-mêmes.

« On ne fait référence à Anne Boleyn que comme une marchandise, un instrument de procréation, et je me demandais comment cela tournerait, avoue le professeur. L’étude m’a demandé un grand exercice sur les pronoms relatifs et les références à “elle” (ou “lui”, en complément indirect). C’est cette sorte de travail approfondi qui nous aide à saisir les nuances de la langue. »

« Catherine se dit Reine tandis qu’Anne prétend qu’elle ne veut pas être reine pour rien au monde, a-t-elle découvert. Je ne peux pas vous dire combien de fois j’ai lu cette pièce, mais c’est Voyant qui m’a révélé cette distinction dans l’identité. » Jakacki a, depuis, écrit et publié sur cette recherche.

Brown et Jakacki sont deux chercheuses qui utilisent le calcul informatisé de haute puissance pour leurs travaux en sciences humaines. Mais il y en a des milliers d’autres. En fin de compte, tous ceux qui cherchent à comprendre le monde emploient des ordinateurs; les sciences humaines et sociales n’y font pas exception.

« Tout est maintenant lié aux technologies informatiques, constate Susan Brown. Nous devons donc exercer notre sens critique quant aux possibilités d’utilisation de l’ordinateur dans notre travail. »

Leave A Comment

Top