History of Sinology/fr/Chapter 30

From China Studies Wiki
Jump to navigation Jump to search

Chapitre 30 : Les humanités numériques et l'avenir de la recherche sinologique

1. Introduction

L'étude de la Chine a toujours été façonnée par les technologies disponibles pour accéder aux textes chinois et les analyser. L'invention du papier, le développement de l'imprimerie à blocs de bois, la création de grandes encyclopédies — chaque avancée a élargi l'éventail des matériaux textuels accessibles aux savants et transformé les méthodes qu'ils utilisaient pour les étudier. La révolution numérique de la fin du XXe et du début du XXIe siècle représente la dernière — et sans doute la plus radicale — de ces transformations.

Les technologies numériques ont modifié la sinologie de deux manières fondamentales. Premièrement, elles ont rendu un volume sans précédent de matériel textuel chinois librement accessible aux chercheurs du monde entier. Deuxièmement, elles ont fourni de nouveaux outils pour analyser ces matériaux.

2. Les bases de données textuelles numériques

Le Chinese Text Project (Ctext), fondé et maintenu par Donald Sturgeon, est la bibliothèque numérique en libre accès la plus importante de textes chinois pré-modernes. Il fournit un accès au texte intégral de pratiquement tout le corpus de la littérature chinoise traditionnelle.[1]

Avant le Ctext, un savant qui souhaitait retracer une expression particulière à travers la tradition littéraire chinoise aurait dû consulter des dizaines d'éditions imprimées. La même recherche peut désormais être effectuée en quelques secondes.[2]

La Chinese Buddhist Electronic Text Association (CBETA) a numérisé l'intégralité du canon bouddhique chinois — plus de 100 millions de caractères chinois.[3]

Le China Historical Geographic Information System (CHGIS), un projet collaboratif de l'Université Harvard et de l'Université Fudan, fournit une base de données géographique des lieux habités et des unités administratives historiques de 221 av. J.-C. à 1911.[4]

La plateforme MARKUS, développée par Hilde De Weerdt à l'Université de Leyde, est un outil d'annotation et d'analyse de textes.[5] DocuSky, développé par l'Université nationale de Taïwan, fournit une plateforme similaire.[6]

La China Biographical Database (CBDB) fournit des données biographiques structurées sur environ 500 000 individus de l'histoire chinoise.[7]

3. L'IA et le chinois classique

Le développement rapide des grands modèles de langage (LLM) — dont GPT-4, Claude et des modèles spécialisés comme WenyanGPT — a suscité un vif intérêt pour leur application au chinois classique.[8]

WenyanGPT, un modèle de langage spécialisé publié en 2025, a été spécifiquement entraîné sur des textes chinois classiques.[9]

Malgré ces avancées, des défis significatifs demeurent. Les systèmes d'IA actuels peuvent traiter les textes chinois classiques avec une précision croissante, mais ils ne peuvent pas les interpréter avec la profondeur et la sensibilité que requiert l'érudition humaine.

L'approche la plus productive de l'IA dans la recherche sinologique sera probablement collaborative plutôt que substitutive. Les outils d'IA peuvent servir d'assistants de recherche, réalisant des tâches routinières de traitement de texte. Mais le travail interprétatif reste du domaine de l'érudition humaine.

4. La traduction automatique de la littérature chinoise

Des études récentes ont évalué les performances des grands modèles de langage sur la traduction de poésie chinoise classique, examinant la fidélité, la fluidité et l'élégance. Les LLM actuels obtiennent des scores raisonnablement élevés sur les deux premiers critères mais échouent systématiquement sur l'élégance.[10]

Une étude de 2025 dans Scientific Reports a proposé un cadre multi-agents qui décompose le processus de traduction en trois étapes. Cette approche a amélioré la qualité de la traduction mais les traductions nécessitaient encore une post-édition humaine substantielle.[11]

5. Archives numériques, libre accès et analyse computationnelle

Le mouvement vers le libre accès dans les ressources sinologiques numériques a été l'un des développements les plus positifs de ces dernières années.

L'analyse stylométrique a été utilisée pour étudier les questions d'attribution, de datation et d'authenticité textuelle.[12]

L'analyse de réseaux est apparue comme un outil pour étudier les relations sociales et intellectuelles qui ont façonné la culture littéraire et politique chinoise.[13]

6. Formation, durabilité et avenir

Le tournant numérique a des implications profondes pour la formation de la prochaine génération de sinologues. Le China-Princeton Digital Humanities Workshop, tenu en 2025, a réuni sinologues et spécialistes des humanités numériques pour une formation collaborative.[14]

La conclusion la plus importante à tirer est que les méthodes computationnelles complètent mais ne remplacent pas l'érudition humaniste traditionnelle. L'avenir de la recherche sinologique réside non pas dans le choix entre méthodes traditionnelles et computationnelles mais dans leur combinaison.

Notes

Bibliographie

Bol, Peter K. "The China Historical GIS." Journal of Chinese History 4, no. 2 (2020).

De Weerdt, Hilde. Information, Territory, and Networks. Cambridge : Harvard University Asia Center, 2015.

Sturgeon, Donald. "The Chinese Text Project." Digital Scholarship in the Humanities 36, no. 1 (2021) : 189-207.

Références

  1. David B. Honey, Incense at the Altar (New Haven: American Oriental Society, 2001), préface, xxii.
  2. Honey, Incense at the Altar, préface, x.
  3. Zhang Xiping, cours 1, pp. 165-168.
  4. Peter K. Bol, "The China Historical GIS," Journal of Chinese History 4, no. 2 (2020).
  5. Hilde De Weerdt, "MARKUS," in Journal of Chinese History 4, no. 2 (2020).
  6. Tu Hsiu-chih, "DocuSky," Journal of Chinese History 4, no. 2 (2020).
  7. Peter K. Bol and Wen-chin Chang, "The China Biographical Database," in Digital Humanities and East Asian Studies (Leiden: Brill, 2020).
  8. Voir le chapitre 22 de ce volume.
  9. "WenyanGPT," arXiv preprint (2025).
  10. "Benchmarking LLMs," Proceedings of EMNLP (2025).
  11. "A Multi Agent Classical Chinese Translation Method," Scientific Reports 15 (2025).
  12. Voir Mark Edward Lewis et Curie Viragh, "Computational Stylistics and Chinese Literature," Journal of Chinese Literature and Culture 9, no. 1 (2022).
  13. Hilde De Weerdt, Information, Territory, and Networks (Cambridge: Harvard University Asia Center, 2015).
  14. China-Princeton Digital Humanities Workshop 2025 (chinesedh2025.eas.princeton.edu).