IA: Google entraîne des logiciels à créer automatiquement des pages Wikipédia
L’entreprise Google est-elle en train de faire un pas en avant dans la création automatique de texte ? Dans un article publié par la Cornell University Library, des chercheurs en intelligence artificielle de Google expliquent comment ils utilisent des logiciels pour générer des articles dans le style de ceux de Wikipédia.
Le processus fonctionne notamment en se basant sur les dix premières pages Web ressortant lors d’une recherche sur un sujet donné, en excluant ceux provenant de Wikipédia, ou en se servant des liens de la catégorie “Références” de Wikipédia, comme l’explique un article de theregister.co.uk. Mohammad Saleh, co-auteur de l’article et ingénieur au sein de l’équipe intelligence artificielle de Google, a expliqué à The Register que la phase d’extraction est un des points sensibles. C’est à cette étape que sont choisies les données qui passeront à la phase d’abstraction. Alors que dans l’idéal, les ingénieurs souhaiteraient que toutes les données provenant des documents de référence puissent passer.
Un texte lisible
La question est de savoir si les résultats sont probants. Dans leur article, les chercheurs publient un exemple. Le texte est tout à fait lisible. Lorsqu’on le compare à celui de Wikipédia, donc créé par des humains, on se rend compte que la version artificielle est finalement plus longue. La mise en forme n’est pas parfaite. Il manque par exemple les majuscules au début des phrases. La question de la vérification de l’information se pose inévitablement. Puisque le système prend automatiquement les premiers résultats sur un sujet donné et qu’il ne semble pas pour l’instant y avoir d’autres critères.