Etude de l'émergence de facultés d'apprentissage fiables et prédictibles d'actions réflexes, à partir de modèles paramétriques soumis à des contraintes internes - Université d'Évry Access content directly
Preprints, Working Papers, ... Year : 2002

Etude de l'émergence de facultés d'apprentissage fiables et prédictibles d'actions réflexes, à partir de modèles paramétriques soumis à des contraintes internes

Frédéric Davesne

Abstract

L'objectif à long terme de notre travail est la mise au points de techniques d'apprentissage fiables et prédictibles d'actionsréflexes, dans le cadre de la robotique mobile. Ce document constitue un départ à ce projet.Dans un premier temps, nous donnons des arguments défendant l'idée que les méthodes d'apprentissage classiques ne peuvent pas, intrinsèquement, répondre à nos exigences de fiabilité et de prédictibilité. Nous illustrons nos propos grâce à un exemple d'apprentissage par renforcement.Nous présentons une démarche formalisée dans laquelle lacommunication est une interaction, au sens physique duterme. Le système y est soumis à deux forces: la réaction du système est due à la fois à l'action de l'environnement et au maintient de contraintes internes. L'apprentissage devientune propriété émergente d'une suite de réactions du système, dans des cas d'interactions favorables. L'ensemble des évolutions possibles du système est déduit par le calcul, en se basant uniquement (sans autre paramètre) sur la connaissance de l'interaction.Nous appliquons notre démarche à deux sous-systèmesinterconnectés, dont l'objectif global est l'apprentissage d'actions réflexes.Nous prouvons que le premier possède comme propriété émergente des facultés d'apprentissage par renforcement et d'apprentissage latent fiables et prédictibles.Le deuxième, qui est ébauché, transforme un signal en uneinformation perceptive. Des contraintes internes à la mémoire déterminent les ensembles valides d'informations perceptives.Nous montrons, dans un cas simple, que ces contraintes mènent à un équivalent du théorème de Shannon sur l'échantillonnage.
Fichier principal
Vignette du fichier
davesne_these.pdf (2.79 Mo) Télécharger le fichier

Dates and versions

hal-00000069 , version 1 (22-11-2002)

Identifiers

  • HAL Id : hal-00000069 , version 1

Cite

Frédéric Davesne. Etude de l'émergence de facultés d'apprentissage fiables et prédictibles d'actions réflexes, à partir de modèles paramétriques soumis à des contraintes internes. 2002. ⟨hal-00000069⟩

Collections

CNRS UNIV-EVRY
43 View
40 Download

Share

Gmail Facebook X LinkedIn More