Tech News

DeepMind AI agents de dépasser celle de ‘l’homme’ de niveau de jeu de Quake III

L’IA des agents de continuer à accumuler des victoires dans le monde du jeu vidéo. La semaine dernière, OpenAI de robots ont été jouer à Dota 2; cette semaine, c’est Quake III, avec une équipe de chercheurs de Google DeepMind filiale avec succès la formation des agents qui peut battre l’homme à un jeu de capture du drapeau.

Comme nous l’avons vu avec les exemples précédents de l’IA jouer à des jeux vidéo, le défi ici est la formation d’un agent qui peut naviguer dans un environnement 3D complexe avec l’information imparfaite. DeepMind du les chercheurs ont utilisé une méthode de IA formation qui est également en train de devenir la norme: l’apprentissage par renforcement, qui est essentiellement la formation par essai et erreur à grande échelle.

Les Agents ne sont pas des instructions sur la façon de jouer le jeu, mais simplement rivaliser contre eux-mêmes, jusqu’à ce qu’ils travaillent sur les stratégies nécessaires pour gagner. Habituellement, cela signifie qu’une version de l’agent AI jouer contre un clone identique. DeepMind a donné une profondeur supplémentaire à cette formule par la formation d’une cohorte de 30 agents pour mettre en place une “diversité” des styles de jeu. Combien de jeux faut-il pour former une IA de cette façon? Près d’un demi-million de dollars, d’une durée de cinq minutes.

Comme toujours, c’est impressionnant de voir comment un tel concept simple technique peut générer des complexes de comportement au nom des bots. DeepMind, des agents non seulement appris les règles de base de la capture du drapeau (prenez vos adversaires drapeau de leur base et de le retourner à votre propre avant de faire de même pour vous), mais à des stratégies comme le gardiennage de votre propre drapeau, camping à la base de l’adversaire, et à la suite de ses coéquipiers autour de sorte que vous pouvez gang sur l’ennemi.

[embedded content]

Pour rendre le défi plus difficile pour les agents, chaque jeu a été joué sur un tout nouveau, sur le plan procédural généré carte. Cela a permis de faire les bots n’étaient pas des stratégies d’apprentissage qui n’a travaillé que sur une seule carte.

Contrairement à OpenAI de Dota 2 robots, DeepMind de agents n’ont pas accès aux matières premières, les données numériques sur le jeu de flux de nombres qui représente des informations comme la distance entre les adversaires et les barres de santé. Au lieu de cela, ils ont appris à jouer juste en regardant l’entrée visuelle de l’écran, de la même comme un homme. Toutefois, cela ne signifie pas nécessairement que DeepMind de robots face à un grand défi; Dota 2 est dans l’ensemble beaucoup plus complexe jeu de la stripped-down version de Quake III qui a été utilisé dans cette recherche.

Pour tester l’IA des agents, les habiletés, les DeepMind tenue d’un tournoi, deux joueurs des équipes de bots seulement, seulement les humains, et un mélange de robots et les humains s’affrontaient à l’encontre l’un de l’autre. Le bot-seules les équipes les plus efficaces, avec 74% probabilité de gagner. Ce, comparativement à 43 pourcentage de probabilité pour la moyenne des joueurs humains, et 52 pour cent de probabilité de forts joueurs humains. Donc: il est clair que l’IA des agents sont les meilleurs joueurs.

Un graphique montrant l’Elo (de compétences) évaluation de divers acteurs. Le “FTW” les agents sont DeepMind, qui a joué contre eux-mêmes au sein d’une équipe de 30. Crédit: DeepMind

Cependant, il est intéressant de noter que plus le nombre de DeepMind robots sur une équipe, le pire qu’ils ont fait. Une équipe de quatre DeepMind robots eu une victoire de la probabilité de 65%, ce qui suggère que, bien que les chercheurs AI agents ont appris certains éléments de jeu en coopération, ce n’est pas nécessairement à l’échelle de plus en plus complexe de la dynamique de l’équipe.

Comme toujours avec les recherches de ce genre, le but n’est pas de battre des êtres humains à des jeux vidéo, mais de trouver de nouvelles façons d’enseigner les agents de naviguer dans des environnements complexes, tout en poursuivant un objectif commun. En d’autres termes, c’est au sujet de l’enseignement de l’intelligence collective — ce qui (en dépit d’une abondante preuve du contraire) fait partie intégrante de l’humanité du succès en tant qu’espèce. Capture du drapeau est juste un proxy pour les plus gros jeux à venir.

About the author

Cyriac

Je suis Zeh Cyriac , fondateur et chef de la direction de la société informatique DROP Corporation Inc. et blogueur indépendant aux États-Unis, avec une passion pour l'Entrepreneuriat en ligne, le marketing de contenu et toutes les choses qui tournent au tour du digital et ’informatique .

Add Comment

Click here to post a comment

Newsletter

Les dernières nouvelles du Web, de la high-tech et de l'innovation numérique tous les matins à l'heure du petit déjeuner.

Vous avez parfaitement souscrit ! Consultez vos mails pour confirmer l'inscription .