On soupçonne Shakespeare d'avoir écrit la pièce "Henri VIII" avec un ou deux co-auteurs. Grâce à un algorithme dit d’apprentissage automatique, un chercheur tchèque en littérature vient de percer le mystère. Il a fait apprendre à la machine le style de chacun des trois auteurs en leur fournissant des centaines de mots.
Grâce à l’intelligence artificielle, il est possible d’identifier formellement l’auteur d’un texte. Ça pourrait bien bouleverser le petit monde des auteurs.
Prenez la pièce "Henri VIII" de Shakespeare, un extrait qui passionne en particulier les chercheurs depuis 1850. On soupçonne le dramaturge de l’avoir écrit avec un voire deux co-auteurs. Grâce à un algorithme dit d’apprentissage automatique, un chercheur tchèque en littérature vient de percer le mystère. Il a fait apprendre à la machine le style de chacun des trois auteurs en leur fournissant des centaines de mots. Ensuite, en comparant chaque style à des passages entiers de la pièce en question, l’intelligence artificielle, est arrivée à cette conclusion : Shakespeare a bien rédigé des passages à deux mains avec son compère Flechter mais jamais avec l’autre, Massinger. Fin du suspense.
Une autre énigme divisait les chercheurs en littérature : Corneille a-t-il écrit les pièces de Molière ?
Florian Cafiero, ingénieur en mathématiques, a co-signé une étude pour démonter cette tenace rumeur vieille d’un siècle. Non, Corneille n’a pas écrit les pièces de Molière à sa place. Pour parvenir à ce résultat, il s’est appuyée sur l’Intelligence artificielle pour mesurer, parmi deux millions de mots, la quantité de noms propres, adverbes, adjectifs et verbes conjugués employés par plusieurs auteurs de comédie en vers de l’époque. Tâche titanesque impossible à réaliser par l’homme sans la puissance de calcul des robots. Ensuite, pièce par pièce, il a confronté ces résultats au style de chacun en s’appuyant sur six critères très révélateurs notamment les rimes, le lexique, les tics de langage, les enchaînements grammaticaux. Sur chaque critère, Molière arrive en tête loin devant Corneille, selon des statistiques implacables. Corneille n’était donc pas le nègre de Molière.
Tout ça laisse présager d’autres applications ?
Pourquoi pas ! Pour identifier l’auteur de textes médiévaux dont l’origine est douteuse ? Plus près de nous, pour mettre un nom sur le rédacteur de messages anonymes sur les réseaux sociaux. Pour traquer les adeptes du plagiat, ce sport qui anime régulièrement le petit monde de la littérature. En contrepartie, cela soulève des questions éthiques. Quel casse-tête pour défendre les auteurs ? Comment protéger un écrivain qui publie un livre sous un pseudonyme ? Un lanceur d’alerte ou un journaliste qui souhaite dénoncer un scandale dans une tribune anonyme ? Avec la montée en puissance de ces algorithmes, ils risquent d’être vite démasqués. Demain, il n’y aura plus de Romain Gary qui grâce à son pseudo, Emile Ajar, est le seul écrivain à avoir décroché deux prix Goncourt. Jean-Pierre Montanay souhaite aussi bonne chance à la prochaine Elena Ferrante pour maintenir le mystère aussi longtemps.