Un parchemin antique "illisible" a été déchiffré par une intelligence artificielle
Les papyrus d’Herculanum ont été si endommagés par l’éruption du Vésuve en 79 de notre ère que les spécialistes craignaient les avoir perdus à jamais. Grâce à l'intelligence artificielle (et à un million de dollars), cela vient de changer.
Un rouleau de papyrus carbonisé mis au jour dans une villa de la riche ville d'Herculanum, détruite par l'éruption du Vésuve en l'an 79. Les chercheurs ont annoncé une avancée majeure dans la « lecture » des textes consignés à l'intérieur de ces enveloppes fragiles, qui pourraient inclure des œuvres littéraires et philosophiques antiques jusqu'alors inconnues.
Grâce à l’intelligence artificielle, les chercheurs découvrent désormais des passages de textes datant d’il y a 2 000 ans, jusqu’alors illisibles car les parchemins sur lesquels ils étaient inscrits avaient été carbonisés lors de l’éruption du Vésuve en 79 de notre ère. Cette nouvelle a été annoncée lundi 5 février par les organisateurs du Vesuvius Challenge. Cette compétition mondiale récompensait d'un million de dollars l'obtention de résultats significatifs dans l'application des techniques d'apprentissage automatique à la recherche de textes des célèbres manuscrits d'Herculanum, une bibliothèque ancienne que l'on croyait perdue à jamais.
Environ 1 800 rouleaux de papyrus, censés contenir des œuvres littéraires et philosophiques des 1er et 2e siècles avant notre ère, ont été découverts par des ouvriers qui creusaient dans la ville antique d'Herculanum, près de Pompéi, en 1752. Les parchemins, carbonisés par la chaleur et les gaz de l'éruption, avaient été réduits à l'état de masses fragiles. Ceux que les ouvriers n'ont pas jetés il y a plus de 250 ans ont été laissés depuis lors dans des réserves, considérés comme des curiosités indéchiffrables.
Les progrès technologiques réalisés au cours des deux dernières décennies ont permis aux chercheurs de se rapprocher de la possibilité de « lire » ces parchemins fragiles. Cependant, ce n'est qu'avec l'accélération toute récente de l'intelligence artificielle que l’on peut enfin commencer à percer leurs secrets, sans les ouvrir.
Cette semaine, la compétition, soutenue par des investisseurs de la Silicon Valley, a attribué un dernier versement de 700 000 dollars, soit 650 000 euros, à une équipe de trois participants, dont un étudiant américain, un étudiant égyptien diplômé en Allemagne et un ingénieur en robotique suisse, qui ont travaillé ensemble à révéler quinze colonnes de texte totalisant plus de 2 000 caractères à partir d'un parchemin intact.
DÉLICES ÉPICURIENS
Les papyrologues ont produit une transcription préliminaire du texte récemment révélé, qui représente environ 5 % du contenu du rouleau. Ils travaillent encore à l'analyser, mais ont partagé quelques bribes qui équivalent à un « post de blog sur comment profiter de la vie, vieux de 2 000 ans » selon les organisateurs du concours.
Le mot grec πορφύραc, qui signifie « pourpre », fait partie des caractères et des nombreuses lignes de texte extraits par Luke Farritor et Youssef Nader, participants au concours Vesuvius Challenge.
Selon ce qu’ils ont glané jusqu’ici, les papyrologues présument que le scribe, dont ils n'ont pas le nom, était Philodème de Gadara, un disciple du philosophe grec Épicure, pour qui le plaisir dépassait toutes les autres valeurs. L’un des passages du texte est une réflexion sur la manière dont l'abondance ou la pénurie peut affecter des sources de plaisir telles que la musique et la nourriture. « Nous ne croyons pas d'emblée que les choses rares sont forcément plus agréables que celles qui sont abondantes », écrit l'auteur.
Les historiens supposent que Philodème était en résidence dans la villa d'Herculanum où les rouleaux calcinés ont été retrouvés et qui appartenait probablement au beau-père de Jules César. Le texte déchiffré mentionne par exemple Xénofon, qui pourrait être le musicien que Philodème évoque dans d'autres écrits. L'auteur critique également ses adversaires, probablement les stoïciens, qui n'ont « rien à dire sur le plaisir, ni en général ni en particulier quand il s’agit de le définir. »
« LES PARCHEMINS SONT LISIBLES »
Les nouveaux passages révélés s'appuient sur un seul mot du rouleau, « πορφύραc », que deux des trois concurrents gagnants ont révélé indépendamment en octobre. Ce mot coloré fait référence, en grec ancien, à la teinture pourpre ou aux vêtements de couleur pourpre, une couleur étroitement associée à la royauté et au pouvoir.
« Nous savions que si nous parvenions à lire un seul [parchemin], nous pourrions appliquer la même méthode, voire une méthode améliorée, à tous les autres », a déclaré en octobre Brent Seales, informaticien à l'université du Kentucky, qui tente de décoder les parchemins d'Herculanum depuis vingt ans et dirige le Digital Restoration Initiative (l'initiative de restauration numérique) de l'université. « Nous sommes en train de prouver, non seulement à nous-mêmes, mais à l'ensemble de la communauté internationale, que ces parchemins sont lisibles. »
Au fur et à mesure qu'ils progressent dans le déchiffrage des rouleaux d'Herculanum, les chercheurs pensent qu'ils trouveront de nombreuses autres réflexions épicuriennes. Un chercheur a comparé le propriétaire de la villa, obsédé par l'épicurisme, au « genre de personne qui collectionne tous les albums et toutes les pochettes d'un groupe » sans s’intéresser à quoi que ce soit d'autre.
Vue d'Herculanum, une riche station balnéaire située sur le flanc ouest du Vésuve, détruite avec Pompéi lors de l'éruption de l'an 79.
Au-delà de cela, les chercheurs ne peuvent qu’émettre des hypothèses éclairées et imaginer ce qu’ils aimeraient voir dans ces rouleaux. Peut-être contiendront-ils d'autres extraits de philosophie grecque, comme des œuvres d'Aristote ou des textes stoïciens. Ils pourraient également offrir de nouvelles perspectives sur le christianisme primitif, suggèrent certains chercheurs. Seul le temps, et plus encore le déballage et la transcription virtuels, nous le diront.
LA LECTURE DES PAPYRUS D’HERCULANUM
Depuis le milieu du 18e siècle, plusieurs tentatives de lire certains des parchemins les moins abîmés d'Herculanum ont été faites. Une méthode consistait à couper les rouleaux en deux et à gratter les couches une à une pour voir le texte à l'intérieur, une autre était de dérouler lentement les rouleaux à l'aide d'une machine spécialement conçue à cet effet. Bien que ces efforts aux 18e et 19e siècles aient permis aux conservateurs de recopier certains mots des textes, ils ont souvent endommagé, voire totalement détruit, de nombreux parchemins au cours du processus.
Entre 500 et 600 parchemins carbonisés d'Herculanum, conservés dans des musées, des universités et des collections nationales en Angleterre, en France et en Italie, n'ont toujours pas été ouverts, mais leur nombre exact est difficile à estimer car beaucoup sont fragmentés. Les parchemins restants sont extrêmement fragiles, ce qui signifie que les dérouler physiquement n'est pas une option viable. « Si vous en faites tomber un, il se brisera comme du verre », explique Seales.
Les progrès technologiques réalisés depuis le début des années 2000 ont aidé les chercheurs à surmonter cet obstacle, notamment grâce à la tomodensitométrie qui a permis de produire des images en 3D des parchemins anciens. À partir de là, l'équipe de Seales, chargée de l'initiative de restauration numérique, a mis au point un logiciel capable de « dérouler numériquement » les images 3D pour en faire des segments aplatis. Cette méthode leur a permis de lire un texte auparavant caché dans le rouleau d’Ein Gedi, un rouleau carbonisé et fragmenté du Moyen-Orient datant du 3e ou du 4e siècle de notre ère.
Lorsque les chercheurs ont essayé d'utiliser cette méthode pour déchiffrer les parchemins carbonisés par le Vésuve, ils se sont heurtés à un autre obstacle. L'encre utilisée pour le rouleau d'Ein Gedi contenait du métal, raison pour laquelle les lettres étaient visibles sur le scanner. Les textes des parchemins d'Herculanum, en revanche, ont été écrits avec une encre à base de carbone, ce qui, pour l'œil humain, rend les symboles indiscernables du papyrus carbonisé sur les tomodensitogrammes.
Les chercheurs ne se sont pas découragés et se sont demandé si des scans à plus haute résolution des parchemins, produits par un accélérateur de particules, pourraient fournir un aperçu encore plus détaillé du papyrus carbonisé. Et en effet, à très haute résolution, les scans ont révélé des parties visibles où l'encre avait légèrement modifié la forme et la texture des fibres du papyrus. « L'encre à base de carbone remplit en quelque sorte les trous qui constituent la grille du papyrus, elle les recouvre et les rend un peu plus épais », explique Seales.
Seales et ses collègues de la Digital Restoration Initiative ont ensuite mis au point et entraîné un modèle d'apprentissage automatique afin de détecter ces différences subtiles sur les surfaces carbonisées de papyrus. Pour aller plus loin, ils avaient besoin de l'aide d'êtres humains. C'est là qu’est intervenu le Vesuvius Challenge. Dans l'espoir d'exploiter le pouvoir collectif des scientifiques citoyens du monde entier, Seales s'est associé à des investisseurs de la Silicon Valley et a mis en ligne les données, le code et les méthodes de son équipe pour que tout le monde puisse y avoir accès. L’objectif du défi était de dire qu’après 275 ans, l'énigme des manuscrits d'Herculanum était devenue un simple problème de logiciel, que toute personne ayant accès à un ordinateur, où qu'elle se trouve, pourrait, en théorie, contribuer à résoudre.
UNE ÉNIGME RÉSOLUE PAR LA SCIENCE PARTICIPATIVE
En mars 2023, le Vesuvius Challenge a mis en ligne des milliers d’images en 3D des scans de deux rouleaux provenant d'Herculanum, ainsi qu'un algorithme d'apprentissage automatique capable de détecter les lettres et les symboles invisibles inscrits sur les couches de papyrus carbonisé. Afin d’inciter les participants à développer la technologie de l'IA et, en fin de compte, à accélérer le déchiffrage, un prix d’un million de dollars a été mis en jeu.
Rouleau d'Herculanum avec lignes laser rouges en cours de numérisation 3D par Brent Seales et son équipe, à l'Institut de France. Les manuscrits d'Herculanum sont parmi les plus emblématiques et les plus inaccessibles de la vaste collection mondiale de manuscrits endommagés.
Trois participants ont travaillé ensemble pour extraire les nouvelles colonnes de texte : Luke Farritor, étudiant à l'université de Nebraska-Lincoln, Youssef Nader, doctorant à l’Université libre de Berlin, et Julian Schilliger, qui a récemment obtenu son master en robotique à l'École polytechnique de Zürich. Ils se sont partagé le grand prix de 700 000 dollars pour avoir été les premiers concurrents à être parvenus, avant la fin de l'année 2023, à révéler au moins quatre passages distincts de 140 caractères chacun, sans que plus de 15 % des caractères ne soient manquants ou illisibles.
Les trois lauréats avaient déjà remporté d’autres prix dans le cadre du concours. Farritor et Nader se sont partagé celui des « premières lettres », d'une valeur de 50 000 dollars, pour avoir révélé séparément le mot πορφύραc. Farritor a reçu 40 000 dollars pour avoir été le premier et Nader a obtenu les 10 000 dollars restants. Schilliger, quant à lui, a remporté trois petits prix de progression totalisant 14 500 dollars.
Bien que le grand prix 2023 ait été décerné, le concours est loin d'être terminé. Les organisateurs ont annoncé de nouvelles récompenses pour 2024, dont 100 000 dollars pour la première personne ou équipe qui parviendrait à révéler 90 % du texte de chacun des quatre parchemins fournis par le défi. Selon les organisateurs, cela permettra de jeter les bases d'une éventuelle lecture de l'ensemble des textes anciens.
Les scientifiques citoyens disposent de tout ce dont ils ont besoin en ligne, de l'histoire des parchemins eux-mêmes à des données téléchargeables, en passant par les algorithmes et les tutoriels. Bien que le concours soit ouvert à tous, il s’agit d’un travail technique qui, jusqu'à présent, a surtout attiré des informaticiens qui connaissent déjà bien l'apprentissage automatique. Les concurrents contribuent à faire avancer le projet en déroulant numériquement de nouvelles sections de parchemins à l'aide de logiciels et de méthodes développés par Seales. Ils travaillent également à l'amélioration du modèle d'apprentissage automatique en lui fournissant des exemples d'entraînement supplémentaires à partir des segments numériques de papyrus nouvellement déballés.
ENTRE CURIOSITÉ ET PRESTIGE
Selon Seales, le concours compte entre 1 500 et 2 000 participants au total, et chacun a fait sa part du travail. En moins d'un an, ils ont réalisé d'énormes progrès dans la résolution d'une énigme qui a déconcerté les chercheurs pendant des siècles. « Ces concurrents ont fourni dix ou vingt années-personnes de travail », affirme Seales.
Quelles sont donc les motivations des concurrents qui consacrent des heures et des heures de leur temps à ce projet ? La valeur du prix remporté est un facteur important, mais certains concurrents sont simplement intrigués par les parchemins eux-mêmes. « Lorsque le processus devenait un peu frustrant et que je n’avançais pas, je me sentais incapable d'abandonner parce que j'étais trop curieux, j'avais vraiment besoin de savoir ce qui se cachait là », explique Nader.
L’idée de participer à un projet soutenu par des entrepreneurs et des investisseurs de la Silicon Valley est également attrayante. L'ancien PDG de GitHub, Nat Friedman, a lancé le concours avec l'investisseur en capital-risque Daniel Gross et d'autres fondateurs de startups et investisseurs ont également contribué à l'attribution des prix. « Il y a une sorte de prestige de la Silicon Valley », explique Farritor, qui a passé l'été dernier en stage chez SpaceX.
À partir de là, le modèle d'apprentissage automatique devrait continuer à s'améliorer et à révéler d'autres lettres jusqu'à ce qu’idéalement, les chercheurs soient en mesure de déchiffrer tous les papyrus d'Herculanum. Ces efforts pourraient ouvrir la voie à de futurs travaux d'excavation à Herculanum, où les experts pensent que d'autres parchemins sont encore enfouis et que d'autres textes perdus d'écrivains antiques attendent d'être découverts.
« Certains pourraient se demander pourquoi on se donne autant de mal, mais ce n’est pas comme ça que je vois les choses » affirme Seales. « Il s’agit période extraordinaire de l'histoire de l'humanité. Nous parlons d'autres œuvres de cette période. Bien sûr que je veux en voir davantage. Je veux toutes les voir. »
Cet article a initialement paru sur le site nationalgeographic.com en langue anglaise.