Advertisement

Comment l'intelligence artificielle aide à traduire la Bible dans des langues rares

Joel Mathew, à gauche, et Ulf Hermjakob, chercheurs à l'Institut des sciences de l'information de l'Université de Californie du Sud. | Photo de courtoisie Joel Mathew, à gauche, et Ulf Hermjakob, chercheurs à l'Institut des sciences de l'information de l'Université de Californie du Sud. | Photo de courtoisie

Les systèmes d'intelligence artificielle (IA) ont le vent en poupe. Les générateurs d'images d'IA tels que MidJourney se sont révélés capables de créer presque toutes les images imaginables - même une image fausse mais convaincante du pape François dans un manteau chic. Parallèlement, des systèmes avancés de "chatbot" tels que ChatGPT d'OpenAI continuent d'étonner le public en imitant le discours humain avec une précision presque effrayante.

Mais une équipe de chercheurs cherche à mettre l'IA au service d'un objectif différent et plus noble : la traduction de la Bible dans des langues extrêmement rares.

Ulf Hermjakob et Joel Mathew sont chercheurs à l'Institut des sciences de l'information de l'Université de Californie du Sud, à Marina Del Rey, en Californie. Ils ont récemment lancé Greek Room, un programme informatique conçu pour rationaliser le processus de traduction de la Bible en fournissant les services de contrôle de qualité nécessaires, tels que la vérification orthographique des projets de traduction créés par les humains.

"Nous ne pensons pas que l'IA puisse remplacer le traducteur humain. Nous la considérons comme un soutien dans cette tâche très difficile qu'est la traduction de la Bible dans des langues où il n'y a souvent presque aucune trace écrite", a déclaré à l'ANC M. Hermjakob, originaire d'Allemagne et titulaire d'un doctorat en informatique.

Hermjakob, luthérien depuis toujours, a déclaré que bien que la Bible soit le livre le plus traduit au monde, elle n'a été traduite jusqu'à présent que dans environ 700 des 7 000 langues du monde, ce qui exclut de nombreuses langues qui comptent plusieurs milliers de locuteurs - rares, certes, mais loin d'être minuscules.

Advertisement

"Notre objectif principal est une communauté d'environ 100 000 locuteurs. Cela peut être un peu moins, cela peut être un peu plus, mais en général, il ne s'agit pas de langues qui vont s'éteindre dans les dix prochaines années et dont il ne reste qu'une dizaine d'octogénaires - ce n'est généralement pas le groupe cible", a-t-il expliqué.

Mathew, ingénieur qui travaille principalement dans le domaine du traitement du langage naturel, est né de parents chrétiens en Inde et est venu en Californie pour obtenir sa maîtrise. Mathew s'identifie comme un chrétien non confessionnel et reste actif dans sa communauté religieuse. Il a déclaré à l'ANC qu'on ne saurait trop insister sur l'importance d'avoir une Bible pour les locuteurs de langues relativement rares, comme il a pu le constater de visu au sein des communautés chrétiennes de son pays, l'Inde.

"Cela change la vie des communautés - la joie et les larmes que cela apporte aux gens d'avoir un livre imprimé dans la langue de leur cœur", a-t-il dit, faisant référence à la langue que les gens parlent à la maison et à laquelle ils s'identifient le plus.

"Avoir la parole de Dieu dans la langue de son cœur est très significatif. Et contrairement au passé, où la traduction de la Bible était davantage le fait d'une agence plus importante, c'est maintenant l'église locale qui prend l'initiative et dit : "Nous voulons la Bible dans la langue de notre cœur, parce que nous sommes un groupe de croyants ici dans ce petit groupe linguistique, et nous sommes impatients d'avoir la Bible dans notre langue". C'est ainsi que le modèle a changé".

(Pour les catholiques, les traductions de la Bible doivent être approuvées par le Vatican ou la conférence épiscopale concernée avant d'être publiées).

Plus en Afrique

Que fait l'IA ?
Il existe depuis un certain temps des correcteurs orthographiques pour les grandes langues comme l'anglais, mais pour les langues qui ne comptent que quelques milliers de locuteurs, les logiciels commerciaux de correction orthographique n'existent tout simplement pas, a expliqué M. Hermjakob.

Le logiciel de The Greek Room peut scanner les brouillons de la traduction et rechercher les incohérences orthographiques, en les signalant à l'utilisateur. Il peut également scanner le texte et s'assurer que l'alignement des mots semble correct, et signaler les incohérences au traducteur. Pour une traduction longue et technique telle que la Bible, de tels outils peuvent faire gagner beaucoup de temps et d'efforts au traducteur. Tout ce que l'IA signale n'est pas forcément une erreur, mais elle fournit une liste utile d'éléments que les traducteurs humains peuvent examiner et dont ils peuvent discuter, a indiqué M. Mathew.

Exemple de l'outil de classement des mots de Greek Room travaillant sur une traduction de l'anglais vers l'hindi. Crédit : Greek Room

Le logiciel peut également présenter un "menu" de termes tirés d'autres traductions afin d'aider le traducteur à choisir un mot pour les termes difficiles. L'exemple donné par Hermjakob concerne le terme "battering ram", qui n'a pas d'équivalent dans certaines langues. Dans ce cas, les suggestions du logiciel peuvent aider les traducteurs à choisir un mot dans leur langue qui a du sens.

Mathew et Hermjakob ont tous deux précisé que leur programme n'est pas destiné à être une solution tout-en-un pour la traduction de la Bible. Le processus nécessite une petite équipe de locuteurs natifs de la langue rare - idéalement des chrétiens - qui connaissent également une deuxième langue plus courante, telle que l'anglais ou le français. Le programme informatique est conçu pour "apprendre" des locuteurs natifs de la langue rare et sera capable d'assimiler davantage de mots et de règles de grammaire de la langue au fur et à mesure qu'on lui fournira des données.

Advertisement

"En général, on ne fait pas cela [le travail de traduction] de manière isolée, on le fait en équipe et en association avec un corps local de croyants, de chrétiens, de sorte qu'il y a généralement un retour d'information rapide sur ce que vous rédigez. L'élément humain est donc extrêmement important pour nous tous", poursuit Mathew.

"Nous voulons que des personnes soient impliquées parce que je pense qu'il y a un élément chrétien selon lequel Dieu a donné la parole à l'homme, et pendant de nombreuses années, il s'agissait d'une tradition orale, il n'y avait pas d'écrit. Il est donc important d'avoir cette participation humaine".

Quelle est la prochaine étape ?
Outre le financement de leur université, les travaux de Hermjakob et Mathew ont reçu le soutien d'une grande agence chrétienne de traduction de la Bible. Leur objectif est de rendre le logiciel disponible gratuitement, conformément à leurs convictions chrétiennes sur l'importance de diffuser la parole de Dieu "à toutes les tribus et à toutes les nations".

"Pour nous, c'est bien plus qu'un projet académique. C'est aussi un projet de passion, où nous sommes enthousiastes à l'idée de voir des Bibles traduites, quel que soit le moyen par lequel nous pouvons aider. Dieu nous a permis de participer à ce projet pour son royaume", a déclaré Mathew.

Hermjakob est d'accord. "Si nous pouvons soutenir le processus de traduction de la Bible, accélérer le contrôle de la qualité et aider à produire des Bibles de meilleure qualité, c'est une récompense suffisante pour nous", a-t-il déclaré.

Jonah McKeown