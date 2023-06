Faire exécuter à un robot des tâches pour lesquelles il n’a même pas été programmé : on n’est pas si loin d’y parvenir. DeepMind, la société d’IA sous l’égide de Google, veut prouver que cela est possible et RoboCat est leur nouvel « agent d’IA auto-améliorant » pour le prouver. Il s’agit d’un nouveau bras robotique capable d’apprendre de nouvelles tâches par lui-même beaucoup plus rapidement et dans le but de réduire le besoin de supervision par des équipes humaines.

Chat, le modèle sur lequel il est basé. RoboCat (Robot – Cat) est le nom du robot lui-même qui exécute les nouvelles fonctionnalités du modèle, mais le cœur de ce projet est Cat. Il s’agit d’un modèle multimodal capable de traiter le langage, les images et les actions dans différents environnements (simulés ou physiques).

Bien que ce soit la base du fonctionnement du robot, dans le cas de RoboCat, les données de cet ensemble (Cat) ont été combinées avec un autre grand ensemble de données d’entraînement. L’objectif était de tester dans quelle mesure le robot pouvait améliorer ses performances par lui-même en ajoutant des données supplémentaires au modèle.

Le processus d’apprentissage. Pour que le robot apprenne par lui-même, il fallait « juste » lui montrer des démonstrations de tâches qu’il n’avait jamais faites auparavant. Le robot était capable de collecter des données à partir des images et des situations qui lui étaient présentées (saisir différents types d’objets, éviter des obstacles, etc.) afin d’effectuer des ajustements au sein du modèle lui-même.

Une fois ces données collectées, elles font partie du modèle affiné (Cat + les données que le robot a traitées pour exécuter les nouvelles tâches). De cette façon, le modèle parvient à augmenter constamment sa base de données, avec la seule exigence d’avoir de nouveaux exemples de tâches pour continuer à s’améliorer.

De DeepMind, ils soulignent que plus vous apprenez de nouvelles tâches, plus il vous sera facile d’apprendre de nouvelles tâches supplémentaires. Le pourcentage de réussite en eux s’améliore à mesure que le robot s’améliore dans les tâches précédentes. Un cycle d’apprentissage autonome dans lequel plus de données sont collectées, meilleures sont les performances offertes.

Application au monde réel: Jusqu’à présent, si l’on voulait faire fonctionner un bras robotique, il fallait qu’il ait un modèle spécifique programmé pour lui. Basé sur Gato et avec ce système d’auto-apprentissage, le modèle est capable d’apprendre à contrôler différents bras mécaniques (avec différents schémas de mouvement, pinces, etc.) en quelques heures.

Bien que l’application du modèle dans ce cas particulier relève d’un bras robotique, le potentiel d’une IA capable d’apprendre par elle-même est énorme (bien que ce soit quelque chose que nous affinons depuis des années).

L’ambition de DeepMind ces derniers mois n’a pas été moindre. Au début du mois, nous avons appris la création d’un algorithme de tri 70% plus rapide que tous ceux existants.

Pour les programmeurs, il a montré le potentiel d’AlphaCode pour démontrer que son IA peut programmer encore mieux que les humains et, selon le PDG de l’entreprise, nous sommes plus proches que jamais d’atteindre l’intelligence artificielle générale (IA avec la capacité de comprendre et d’effectuer des tâches intellectuelles similaires à celles des êtres humains).

Image | esprit profond

