dans

Ils ont mis cet algorithme pour jouer à Pitfall d’Atari et, bien que les précédents n’aient pas pu faire un seul point, il améliore déjà les humains.

Un algorithme peut-il explorer des environnements complexes ou doit-il être mâché à la place? Autrement dit, pouvons-nous former des systèmes d’intelligence artificielle à prendre des décisions en explorant et en comprenant des environnements complexes et pour apprendre à obtenir des récompenses de manière optimale? C’est la question à laquelle Adrien Ecoffet, Joost Huizinga et leurs collègues tentent de répondre depuis des années, et la vérité est que c’est une question complexe.

Par chance, nous avons des jeux vidéo.

Algorithmes vs jeux vidéo

Et, si on y réfléchit un instant, les jeux vidéo sont un cadre fantastique pour former des intelligences artificielles à ces types de décisions (et pour prouver quelle méthodologie fonctionne le mieux): ils ont tout ce dont vous avez besoin pour apprendre dans des environnements de plus en plus complexes, ils vous permettent d’établir des récompenses en fonction de l’atteinte d’un lieu spécifique ou de la réalisation d’un niveau dans un jeu vidéo et, en fait, ils posent un défi même pour les humains eux-mêmes.

Ecoffet et son équipe travaillent avec des algorithmes d’apprentissage par renforcement et ont décidé de tester leurs nouvelles approches avec les jeux vidéo Atari classiques. Plus précisément, «Montezuma’s Revenge» et «Pitfall». Ce n’est pas juste un éclat de nostalgie, c’est ça Les jeux Atari 2600 sont devenus un «  gold standard  » pour ces types de systèmes. Sans aller plus loin, jusqu’à présent, les algorithmes ont obtenu des scores modestes dans le premier et ont lamentablement échoué dans le second: ils n’ont pas marqué un seul point.

A lire :  Une enquête Google révèle que 75% des parents indiens s'inquiètent pour la sécurité en ligne des élèves

La famille d’algorithmes développée par l’équipe Ecoffet (appelée Go-Explore) change la donne, comme cela vient d’être publié dans la revue Nature. L’idée est que GO-Explorers peut explorez les environnements en profondeur et créez une archive pour les aider à se souvenir où ils ont été, en s’assurant qu’ils n’oublient pas la voie vers un terrain d’entente prometteur ou un résultat réussi.

Et avec ces outils, les algorithmes Go-Explore Quadruple les scores précédents dans «  Montezuma’s Revenge  » Oui surpasse la performance humaine moyenne dans ‘Pitfall’ (où, comme je l’ai dit, les algorithmes précédents n’ont pas réussi à obtenir de points).

Suite à ce succès, et toujours selon les données de ‘Nature’, les chercheurs ont appliqué les mêmes algorithmes à des tâches robotiques qui simulent la prise et le placement d’objets avec un bras robotisé (dans des endroits isolés derrière des portes verrouillées). Et c’est une bonne nouvelle car il reste encore beaucoup à faire à une IA pour nous battre dans Fornite, le simple fait qu’ils le fassent dans les jeux de 1982 est un signe qu’ils le feront bientôt (et que cela a des applications pratiques intéressantes).

Image | Atari – Vijoy Rao

45secondes est un nouveau média, n’hésitez pas à partager notre article sur les réseaux sociaux afin de nous donner un solide coup de pouce. 🙂

  • Smartbox Bien-être d'exception à Marseille Coffret cadeau Smartbox
    Ce coffret offre de profiter d’un merveilleux moment de douceur à choisir parmi une sélection de séances de bien-être d’exception à Marseille, pour une ou deux personnes. Volupté et plénitude seront au rendez-vous grâce à des prestations telles que massages aux huiles précieuses, rituels de beauté ou encore
  • Self Electronics Driver de LED à tension constante, à courant constant Self Electronics SLT6-350ILS SLT6-350ILS 7.94 W, 7.31 W 350 mA 7.5, 24.0 - 21.0, 24.0 V/DC, V/DC 1 pc(s)
    Attention : Cet article est réservé aux Professionnels. Seules les commandes effectuées sur cet article en tant que Professionnel pourront être honorées. Cette alimentation stabilisée a été spécialement conçue pour l'alimentation de lampes LED. Grâce à la technologie à courant/tension...
  • Smartbox Rituel bien-être d'1h40 au cœur des vignobles avec gommage, massage et enveloppement du corps Coffret cadeau Smartbox
    Laissez-vous aller au rêve et à la douceur le temps d’1 délicieux rituel de bien-être d’1h40 et découvrez les bienfaits de la vinothérapie ! C’est dans le cadre enchanteur du domaine de Tresbaudon, derrière le château de Tallard, que l’institut De la Vigne à la Beauté vous invite à venir vous ressourcer. Au