Sambuc éditeur

littérature & sciences humaines

Actualités Dernières parutions Littérature Arts Encyclopédie Quiz Librairies francophones La maison Contact

Technologie | Le 4 novembre 2021, par Sambuc éditeur. Temps de lecture : cinq minutes.


« Humanités numériques »

Apprentissage par renforcement

Intelligence artificielle

En informatique, l’apprentissage par renforcement désigne un mode d’apprentissage automatique de comportement, dans lequel le modèle est conçu et entraîné par une succession d’essais et d’erreurs qui en corrigent les paramètres. Ce procédé s’inspire du paradigme de l’apprentissage, élaboré en psychologie par l’école béhavioriste. L’apprentissage par renforcement trouve de nombreuses applications en intelligence artificielle, notamment dans des domaines complexes comme la modélisation du langage.

© Sambuc éditeur, 2024

En informatique, on appelle « apprentissage automatique » (anglais machine learning) les procédés qui permettent de concevoir des modèles mathématiques de la réalité à partir de données. Ces données – qui peuvent consister en relevés météorologiques, indices de prix, caractéristiques d’objets, etc. – sont appelées des « données d’entraînement », ou d’apprentissage.

Il existe trois façons principales de concevoir un algorithme d’apprentissage automatique. Dans un premier cas, les données sont dites « étiquetées », c’est-à-dire associées au résultat attendu du modèle pour décrire la réalité (par exemple, si la donnée concerne une surface d’appartement, l’étiquette lui associe un prix de location) : ce procédé est nommé « apprentissage supervisé ». Dans un second cas, en particulier lorsque l’on dispose d’un très grand ensemble de données arbitraires produites par des usages, l’apprentissage non supervisé consiste à établir des liens de corrélations au sein des données d’entraînement, à l’aide de procédés d’inférence statistique : il peut s’agir de traitement du langage, etc. Enfin, on parle d’apprentissage par renforcement lorsque l’élaboration du modèle se fait à travers une série de tentatives, qui sont validées ou non.

L’apprentissage par renforcement fait donc intervenir, au lieu de données d’entraînement, un agent d’évaluation qui détermine si l’essai effectué par le modèle constitue une réussite ou un échec.

Un exemple caractéristique de l’apprentissage par renforcement est le fait d’entraîner un modèle à jouer à un jeu de société comme les échecs. Le modèle « tente » une suite de coups qui constituent une partie contre un adversaire : lorsque la partie se termine, les règles du jeu déterminent le gagnant, ce qui constitue l’épreuve de récompense du modèle. L’apprentissage par renforcement consiste à rectifier le modèle à partir de ce résultat de gain ou perte obtenu à l’issue d’une partie.

Le terme « d’apprentissage par renforcement » est donné à ce procédé par rapprochement avec un ensemble de théories de l’école béhavioriste en psychologie. Le paradigme de l’apprentissage, élaboré dans la suite des travaux d’Ivan Pavlov (1849–1936), étudie le lien qui s’établit entre un individu animal et un milieu, par le biais de renforcements positifs (gratifications) ou négatifs : les stimuli du milieu induisent alors un comportement d’adaptation, à travers une suite d’essais et d’erreurs.


Sambuc éditeur


Voir aussi

L’intelligence artificielle dans l’encyclopédie Sambuc.

Le problème d’alignement.


L’actualité : derniers articles

Actualités culturelles

Norvège : le Nobel de la paix décerné à l’organisation japonaise Nihon Hidankyo contre l’armement nucléaire

Image de l'article `Norvège : le Nobel de la paix décerné à l’organisation japonaise Nihon Hidankyo contre l’armement nucléaire`
Image de l'article `Norvège : le Nobel de la paix décerné à l’organisation japonaise Nihon Hidankyo contre l’armement nucléaire` © Sambuc éditeur, 2024

Le prix Nobel de la paix 2024 a été attribué à Oslo le vendredi 11 octobre à l’organisation japonaise Nihon Hidankyo, pour son engagement en faveur du désarmement nucléaire.

Actualités culturelles | Le 20 octobre 2024, par Sambuc éditeur.

Actualités culturelles

Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques

Image de l'article `Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques`
Image de l'article `Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques` © Sambuc éditeur, 2024

Le prix Nobel de littérature 2024 a été attribué, jeudi 10 octobre, à l’écrivaine coréenne Han Kang (한강), pour sa prose poétique originale et vive autour de la fragilité et des traumatismes historiques.

Actualités culturelles | Le 20 octobre 2024, par Sambuc éditeur.

Actualités culturelles

Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques

Image de l'article `Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques`
Image de l'article `Suède : la Coréenne Han Kang reçoit le Nobel de littérature pour sa prose poétique intense sur les traumatismes historiques` © Sambuc éditeur, 2024

Le prix Nobel de littérature 2024 a été attribué, jeudi 10 octobre, à l’écrivaine coréenne Han Kang (한강), pour sa prose poétique originale et vive autour de la fragilité et des traumatismes historiques.

Actualités culturelles | Le 20 octobre 2024, par Sambuc éditeur.

Rechercher un article dans l’encyclopédie...



Inscrivez-vous à la newsletter Sambuc !


Ce site utilise des cookies nécessaires à son bon fonctionnement et des cookies de mesure d’audience. Pour plus d’informations, cliquez ici.

En poursuivant votre navigation, vous consentez à l’utilisation de cookies.

Fermer