Lettres et sciences humaines

Le Dr Rockwell développe des outils qui aident les universitaires à identifier des motifs au sein de textes portant sur l’histoire, la philosophie et la littérature.

Anglais

Researcher Geoffrey Rockwell

Dr. Geoffrey Rockwell
Professeur, philosophie et sciences humaines numériques, Université de l’Alberta Membre (sortant), Conseil de planification et de défense des intérêts de la collectivité, Calcul Canada

Domaine de recherche
Monsieur Rockwell se spécialise dans plusieurs aspects des lettres et sciences humaines, notamment la visualisation et l’analyse de textes, le multimédia, les jeux électroniques ainsi que le calcul informatique appliqué à son domaine. Il a dirigé le projet TAPoR (pour Text Analysis Portal for Research ou portail d’analyse de texte pour la recherche), qui regroupait six universités canadiennes et a mis en place une infrastructure pour les lettres et sciences humaines numériques en recourant aux installations et aux services de soutien de WestGrid et de Calcul Canada. Le portail TAPoR (tapor.ca) et les outils Voyant (voyant-tools.org) procurent des outils en ligne aux chercheurs qui travaillent sur des documents électroniques.

Pertinence de la recherche
Les travaux de monsieur Rockwell et les outils qu’il élabore facilitent la tâche des universitaires qui recourent à l’informatique pour faire ressortir des motifs dans les textes des disciplines dites « classiques », telles l’Histoire, la philosophie et la littérature. Ses recherches répondent à des questions auxquelles il n’était pas jusqu’à présent possible de répondre.

Les jeux de données volumineux et l’informatique de pointe font progresser bien des domaines nos jours, qu’il s’agisse de la génomique ou de la bio-informatique ou d’entreprises comme Amazon ou Netflix. Est-ce une nouveauté pour ceux qui étudient les lettres et sciences humaines numériques?
Pas du tout. Je travaille dans ce domaine depuis la fin des années 1980 et il y avait déjà des projets culturels faisant appel à de vastes jeux de données dans les années 1970. La différence est qu’à présent, l’informatique et les techniques d’exploitation massive des données deviennent la norme en lettres et sciences humaines ainsi qu’en sciences sociales.

Comment avez-vous réussi à combler le fossé entre l’informatique scientifique de pointe et les lettres et sciences humaines avec le concours de Calcul Canada et des consortiums régionaux?
Quand j’enseignais à l’Université McMaster (1994-2008), j’ai contribué à l’organisation d’un atelier avec Sharcnet. L’objectif était de découvrir comment les personnes œuvrant dans le domaine des arts et des sciences humaines se servaient du calcul informatique de pointe (CIP). Par la suite, en 2010, à l’Université de l’Alberta, nous avons tenu un atelier avec WestGrid afin de créer puis de tester des prototypes capables de résoudre des problèmes de nature pratique, par exemple trier plus efficacement des bases de données électroniques ou inculquer aux chercheurs les compétences requises pour utiliser des installations comme celles de WestGrid. Ces ateliers nous ont permis de saisir les besoins en informatique courants des chercheurs spécialisés en lettres et sciences humaines au Canada.

Vous avez aussi travaillé sur le projet TAPoR qui a permis l’installation de serveurs dans les laboratoires et la mise en place d’outils d’analyse de textes qui facilitent la recherche dans les lettres et sciences humaines numériques. De quelle manière ce projet poursuit-il son évolution?
TAPoR demeure un portail sur lequel les universitaires peuvent essayer divers outils en ligne qui leur permettent de manipuler, d’analyser et de visualiser des documents électroniques. Le projet a débouché sur une trousse à outils baptisée TAPoRware, dont on peut se servir sur Internet pour lire et analyser des documents numériques. A suivi la génération des outils Voyant, une technique d’exploration en profondeur des données qui recourt davantage à l’informatique. Quand nous avons lancé les premiers outils TAPoRware, nous recensions environ 8 000 utilisations par mois; à présent, nous en comptons mensuellement de 40 000 à 50 000 dans le monde entier.

Qu’est-ce qui rend les outils Voyant si populaires?
Ils présentent plusieurs avantages. Voyant est une plateforme intégrée combinant de nombreux outils. Elle accepte les jeux de documents beaucoup plus vastes et est très indulgente. Il en existe dorénavant une version que l’on peut télécharger sur son ordinateur, ce qui en accroît la robustesse dans les situations où l’on ne souhaite pas recourir à un serveur éloigné.

Avez-vous d’autres projets pour ce portail?
Je fais partie d’une importante équipe multidisciplinaire qui a obtenu une subvention du Conseil de recherches en sciences humaines pour un projet baptisé « Exploration en profondeur du roman ». L’idée est de créer des algorithmes et de concevoir de nouvelles approches informatiques avec lesquels on étudiera divers problèmes en littérature. Le genre, par exemple. Les algorithmes retenus seront offerts sous forme de code sur TAPoR. Nous avons aussi entrepris la création d’un fonds commun de méthodes, c’est-à-dire une collection de « recettes », disponibles en ligne, permettant d’explorer les textes littéraires en profondeur.

De quelle façon Calcul Canada contribue-t-il à rendre ces outils plus accessibles aux chercheurs des lettres et sciences humaines?
L’organisme a soutenu considérablement l’élaboration de l’infrastructure au fil des ans puisque le portail TAPoR fonctionne sur WestGrid. Maintenant, Calcul Canada engage des spécialistes en lettres et sciences humaines pour initier les universitaires à ces outils et à ces plateformes. Nous comptons aussi des représentants sur divers conseils et comités. Le corps professoral canadien est constitué à 40-50 % d’enseignants en sciences sociales et en lettres et sciences humaines, de la littérature et des arts langagiers au commerce et au droit. Que Calcul Canada trouve des moyens pour les écouter et les amener à s’impliquer est une très bonne chose.

Top