Le vieil adage selon lequel c’est de ses erreurs que l’on apprend le mieux vient de se vérifier pour les robots quadrupèdes. Le « Mini Cheetah », développé par le MIT, s’est vu implémenter un système d’autoapprentissage qui lui a permis d’apprendre à courir « tout seul ».
Pour le moment, ses mouvements paraissent encore un peu patauds. En fait, la vidéo du MIT démontrant les progrès de « Mini Cheetah », ou « Mini Guépard », est même un peu attendrissante tant elle fait penser à un chiot surexcité qui découvre le monde. Pourtant, ses capacités ont de quoi impressionner.
En premier lieu, parce que « courir », pour un robot, n’est pas une évidence. « Pour obtenir une course rapide, il faut pousser le matériel à ses limites, par exemple en fonctionnant près du couple maximal de sortie des moteurs. Dans de telles conditions, la dynamique du robot est difficile à modéliser analytiquement. Le robot doit réagir rapidement aux changements de l’environnement, comme le moment où il rencontre de la glace en courant sur l’herbe », analysent des scientifiques du MIT’s Improbable AI Lab, Gabriel Margolis et Ge Yang.
Mini Cheetah est pourtant parvenu à enregistrer un record de vitesse de 3,9 mètres par seconde (11 km/h), selon le MIT. Il est également capable de tourner à grande vitesse. Le second point intéressant dans cette performance est que le robot a appris à courir « par lui-même ». En effet, les scientifiques ont utilisé un réseau neuronal en guise de « maître d’apprentissage ».
Cet algorithme d’apprentissage automatique est appelé « réseau neuronal » car il est à l’origine inspiré du fonctionnement des neurones biologiques. L’idée est de « nourrir » l’algorithme avec beaucoup de données afin qu’il puisse étudier des résultats par comparaison et ainsi « apprendre » selon ce qui fonctionne ou non. Mini Cheetah a donc appris dans un simulateur, et en seulement trois heures, elle a acquis de l’expérience sur un grand nombre de situations possibles, qu’elle a pu ensuite réutiliser dans le monde réel.
En somme, le réseau neuronal a fait le travail de ceux qui programment habituellement les robots : « programmer comment un robot doit agir dans toutes les situations possibles est tout simplement très difficile. Le processus est fastidieux, car si un robot devait échouer sur un terrain particulier, un ingénieur humain devrait identifier la cause de l’échec et adapter manuellement le contrôleur du robot, et ce processus peut nécessiter un temps humain considérable. L’apprentissage par essais et erreurs élimine le besoin pour un humain de spécifier précisément comment le robot doit se comporter dans chaque situation », expliquent en effet Gabriel Margolis et Ge yang.
Réduire le temps d’apprentissage des robots
Les scientifiques affirment donc que cette approche pourrait permettre de simplifier grandement le développement de robots : « Le paradigme traditionnel de la robotique est que les humains disent au robot à la fois quelle tâche accomplir et comment l’accomplir. Le problème est qu’un tel cadre n’est pas évolutif, car il faudrait un immense effort d’ingénierie humaine pour programmer manuellement un robot avec les compétences nécessaires pour fonctionner dans de nombreux environnements divers. Une façon plus pratique de concevoir un robot avec de nombreuses compétences diverses est de dire au robot quoi faire et de le laisser comprendre comment ». Pari plutôt réussi, puisqu’on peut voir sur la vidéo que Mini Cheetah s’adapte en effet à des terrains accidentés, des marches, du gravier ou même de la neige.
La vidéo du MIT :