Histoire, langues et textométrie
Du 16 au 18 janvier 2019, le Pireh (Pôle informatique de Recherche et d'Enseignement en Histoire – Université Paris 1 Panthéon-Sorbonne) organise à la Sorbonne un colloque international consacré aux rapports entre Histoire, langue et textométrie.
Les méthodes d’analyse statistiques de textes (lexicométrie, textométrie, linguistique computationnelle, text mining, etc.) connaissent aujourd’hui d’importants développements dans tous les champs scientifiques et dans la société en général. Ces méthodes peuvent en effet répondre aux questions et aux intérêts d’acteurs multiples (entreprises privées, acteurs de la gestion publique, des milieux du renseignement, data-journalism, etc.). Elles prennent également une place croissante dans les sciences humaines et sociales, et notamment chez les chercheurs et chercheuses qui se réclament des humanités numériques. Ceci a donné lieu à de nombreux colloques, à des rencontres scientifiques régulières, telles que les JADT, et à plusieurs synthèses récentes (Léon & Loiseau 2016, Jenset & McGillivray 2017).
La position des historiens peut paraître paradoxale : leur travail repose en grande partie sur des textes utilisés comme sources, et les évolutions de l’historiographie moderne les ont conduits à accorder une attention toujours plus grande aux discours et aux représentations des acteurs du passé. La lexicométrie historique a à ce titre connu de grands succès et bénéficié d’une excellente visibilité dès les années 1970, notamment au Centre de lexicologie politique de l’ENS Fontenay/Saint-Cloud. Pourtant, malgré l’influence du linguistic turn et le développement d’outils informatiques à la fois plus puissants et plus accessibles, les usages de la textométrie en histoire se sont révélés plus dispersés par la suite, malgré d’incontestables succès (Genet 2011). La faible présence des historiens aux JADT est de ce point de vue symptomatique.
On entrevoit aujourd’hui un renouveau de l’approche textométrique en histoire, mais suivant une démarche différente, celle du text mining, pensée comme une aide au dépouillement d’archives textuelles massives issues de programmes de numérisation des sources (Projet Corpus de la BnF par exemple – Moiraghi 2018).
L’objectif de ce colloque est de dresser un panorama des utilisations actuelles des méthodes d’analyse des textes en histoire, quantitatives ou qualitative, quelle que soit la période et l’espace étudiés, à un moment où le contexte intellectuel, social et technique invite ainsi à les repenser.
Trois grands axes seront explorés pour mieux comprendre leur place et leurs apports en histoire :
- Axe 1 : L’historiographie du rapport entre langue et histoire
- Axe 2 : Les renouvellements méthodologiques liés aux corpus
- Sous-axe 2.1 : Vers des sources et objets linguistiques renouvelés pour la textométrie ?
- Sous-axe 2.2 : Les données textuelles à l’ère du big data et leurs relations aux historiens
- Axe 3 : Les développements de l’outillage statistique
- Sous-axe 3.1 : La temporalité Sous-axe
- Sous-axe 3.2 : De nouveaux algorithmes pour la textométrie
- Sous-axe 3.3 : Approches informatiques plus qualitatives