Sambuc éditeur

littérature & sciences humaines

Actualités Dernières parutions Littérature Arts Encyclopédie Quiz Librairies francophones La maison Contact

Technologie | Le 21 octobre 2021, par Sambuc éditeur. Temps de lecture : sept minutes.


« Humanités numériques »

OpenAI dévoile un logiciel de résumé automatique de livres

Intelligence artificielle appliquée au langage

L’entreprise américaine OpenAI a présenté récemment un modèle d’intelligence artificielle capable de produire, de façon automatique, des résumés de très bonne qualité de romans et de livres. La solution développée s’inscrit dans une démarche générale de la recherche en intelligence artificielle, notamment autour du langage, et qui vise à faciliter l’interaction du logiciel avec un juge humain pour progresser, et s’ajuster aux attentes humaines.

© Sambuc éditeur, 2024

La supervision par un être humain est au cœur du développement de l’intelligence artificielle, en particulier pour les tâches qui se rapportent au langage ou aux différentes activités intellectuelles humaines, et qui forment le champ dit de l’intelligence artificielle forte – en anglais artificial general intelligence (AGI). Il s’agit de faire évaluer le modèle de façon interactive par un humain, selon un procédé nommé « apprentissage par renforcement ». Pour de nombreux problèmes, toutefois, cette supervision se révèle très coûteuse et difficile à mettre en place, notamment lorsque les résultats à évaluer par l’homme sont longs ou complexes.

C’est notamment le cas des résumés automatiques de livres, dont l’évaluation suppose la lecture de l’œuvre résumée pour la comparer aux quelques lignes de la synthèse produite. Dans le cas d’un livre d’un millier de pages, cela demande donc plusieurs dizaines d’heures de lecture avant de pouvoir évaluer la qualité du résumé produit par le modèle.

Une approche cartésienne : diviser pour mieux juger

L’entreprise OpenAI, cofondée par Elon Musk et Sam Altman en 2015, vient de publier un compte-rendu de ses recherches sur le sujet, et qui présente une solution originale pour aborder le résumé de textes longs, comme les romans ou les essais. OpenAI est connue pour ses recherches en intelligence artificielle forte, notamment dans le domaine du langage avec des modèles comme GPT-3, capable de rédiger de façon automatique des textes cohérents sur un sujet quelconque. La technologie de ce logiciel utilise les réseaux de neurones en apprentissage dit « profond » (deep learning), et a été entraînée à la rédaction en langue naturelle à partir de milliards de contenus textuels, utilisés comme exemples.

L’enjeu de l’approche du langage par la machine est, entre autres, de parvenir à ce que le modèle conçu dispose d’une grande quantité de connaissance sur le monde, ainsi qu’une capacité d’abstraction. Dans le cas d’un moteur de résumé d’ouvrages, le programme doit reconnaître les éléments essentiels d’un texte tel qu’il est perçu par un être humain, ce qui place la capacité à l’abstraction dans le cadre de l’intention humaine. Pour cette raison, et comme le constate OpenAI, les modèles classiques (qui utilisent des données d’exemples pour entraîner le moteur d’intelligence artificielle) ne sont pas performants pour cette tâche, et la supervision humaine par renforcement est nécessaire.

Comme l’objectif d’OpenAI est de développer des modèles d’intelligence artificielle à grande échelle, le temps demandé à un être humain pour valider le modèle de résumés était un réel obstacle. La solution trouvée a été de décomposer la tâche complexe (résumer un livre entier) en sous-tâches plus simples appliquées aux différents chapitres de l’ouvrage. Cette approche cartésienne (diviser les difficultés en « parcelles ») est ensuite itérée, afin de résumer l’ensemble des textes produits pour chaque chapitre, afin de produire le résumé du livre dans sa totalité. En plus de permettre l’évaluation du modèle par l’homme sur des textes relativement courts, ce procédé récursif rend possible de retracer le processus d’élaboration du résumé, à travers des sélections successives d’aspects essentiels du livre.

Les auteurs dévoilent, dans l’article de blog qui présente cette approche, un exemple des étapes de résumés successifs, par chapitre, puis de l’ensemble du livre, pour le roman Alice au pays des merveilles de Lewis Caroll.

Le problème d’alignement

Au fur et à mesure que nous formons nos modèles à des tâches de plus en plus complexes, il devient de plus en plus difficile pour les humains de faire des évaluations éclairées des résultats des modèles.

Blog OpenAI, « Summarizing Books with Human Feedback ».

Faire en sorte qu’un logiciel d’intelligence artificielle réponde à une tâche en fonction d’attentes humaines est connu sous le nom de problème d’alignement. Or, à mesure les tâches deviennent de plus en plus complexes, l’évaluation par renforcement devient plus délicate à opérer.

La solution proposée par OpenAI s’inscrit donc dans un problème plus général : celle du déploiement à grande échelle de modèles complexes, intégrant par exemple plusieurs tâches ayant trait au langage. L’approche de l’entreprise consiste à chercher à simplifier les évaluations demandées, soit en décomposant des tâches complexes, soit en en faisant traiter une partie par la machine.

Ces travaux sur les résumés de textes constituent, au dire des auteurs, le premier résultat empirique visant à déployer l’apprentissage par renforcement sur des tâches complexes et de grande ampleur. Parmi les applications esquissées dans l’article, est évoqué un logiciel donnant des réponses à des questions, portant par exemple sur des œuvres littéraires.


Sambuc éditeur


Notes et références

Jeff Wu, Long Ouyang et al., « Recursively Summarizing Books with Human Feedback », Cornell university, sept. 2021 (arxiv.org/abs/2109.10862).

Voir aussi

L’intelligence artificielle dans l’encyclopédie Sambuc.

Apprentissage par renforcement.

Le problème d’alignement.


Entités nommées fréquentes : OpenAI.


L’actualité : derniers articles

Actualités culturelles

Norvège : le Nobel de la paix décerné à l’organisation japonaise Nihon Hidankyo contre l’armement nucléaire

Image de l'article `Norvège : le Nobel de la paix décerné à l’organisation japonaise Nihon Hidankyo contre l’armement nucléaire`
Image de l'article `Norvège : le Nobel de la paix décerné à l’organisation japonaise Nihon Hidankyo contre l’armement nucléaire` © Sambuc éditeur, 2024

Le prix Nobel de la paix 2024 a été attribué à Oslo le vendredi 11 octobre à l’organisation japonaise Nihon Hidankyo, pour son engagement en faveur du désarmement nucléaire.

Actualités culturelles | Le 20 octobre 2024, par Sambuc éditeur.

Actualités culturelles

Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques

Image de l'article `Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques`
Image de l'article `Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques` © Sambuc éditeur, 2024

Le prix Nobel de littérature 2024 a été attribué, jeudi 10 octobre, à l’écrivaine coréenne Han Kang (한강), pour sa prose poétique originale et vive autour de la fragilité et des traumatismes historiques.

Actualités culturelles | Le 20 octobre 2024, par Sambuc éditeur.

Actualités culturelles

Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques

Image de l'article `Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques`
Image de l'article `Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques` © Sambuc éditeur, 2024

Le prix Nobel de littérature 2024 a été attribué, jeudi 10 octobre, à l’écrivaine coréenne Han Kang (한강), pour sa prose poétique originale et vive autour de la fragilité et des traumatismes historiques.

Actualités culturelles | Le 20 octobre 2024, par Sambuc éditeur.

Rechercher un article dans l’encyclopédie...



Inscrivez-vous à la newsletter Sambuc !


Ce site utilise des cookies nécessaires à son bon fonctionnement et des cookies de mesure d’audience. Pour plus d’informations, cliquez ici.

En poursuivant votre navigation, vous consentez à l’utilisation de cookies.

Fermer