Après les échecs et avant notre délicieux cerveau, l'IA vient pour les jeux de stratégie sociale - et il gagne
Depuis que les échecs de l'ordinateur Deep Blue ont battu le champion du monde d'échecs Garry Kasparov en 1997, l'intelligence artificielle a exercé une influence croissante sur les humains dans une poignée de jeux `` adversaires ''-cette interaction humaine joue un rôle limité. Maintenant, cependant, un groupe de chercheurs a révélé une nouvelle IA qui tente d'étendre le pool de jeux sur lequel un ordinateur peut vous battre.
Dans un article (Open dans New Tab) publié cette semaine, les chercheurs ont dévoilé Cicéron, une IA formée pour gagner des jeux de diplomatie, un jeu de société à sept joueurs dans lequel chaque tour, tous les joueurs s'engagent dans [...] de forme libre Dialogue avec les autres pendant une période de négociation avant de prendre une action. Cette phase de discussion est ce qui distingue les efforts de Cicéron des autres IA.
Le document stipule que presque tous les percées de l'IA antérieures ont été dans des jeux à deux joueurs à sume dans lequel gagner un avantage met l'autre joueur dans un désavantage direct. Dans ces jeux de jeux, Starcraft, GO et Poker-L'IA peut apprendre une stratégie optimale en jouant contre elle-même dans un modèle appelé «auto-play». Finalement, il proposera une approche qui ne peut pas être battue dans un jeu équilibré. Dans ces exemples, la complexité du jeu elle-même n'est pas importante; Ce qui compte, c'est que la communication n'est pas un mécanicien de jeu central et que chaque action s'efforce de remettre un autre joueur dans son objectif.
Ce n'est pas vrai pour la diplomatie, un jeu dans lequel la conversation entre les joueurs est importante (sinon entièrement cruciale), et dans laquelle faire un gain ne nuit pas nécessairement à un adversaire. Ici, l'auto-play «a produit un langage non interprétable». C'était un obstacle majeur à surmonter, car l'anonymat était la clé d'une expérience équitable. La communication entre les joueurs a dû être ancrée dans l'état du jeu, ou des événements qui s'étaient déjà produits, et si Cicéron s'est glissé, la probabilité était qu'elle serait découverte en raison de son incapacité à expliquer son erreur.
Plus important encore, cependant, était la capacité de renforcer la confiance avec les autres joueurs. Théoriquement, ce concept serait étranger à Cicéron, mais pour réussir, il faudrait établir une capacité à raisonner sur les croyances, les objectifs et les intentions des autres ainsi que une capacité à persuader et à établir des relations par le dialogue.
Pour établir Cicéron, les chercheurs ont pris un ensemble de données de plus de 40 000 jeux de diplomatie axés sur le dialogue à partir d'une version en ligne du jeu. Un modèle de dialogue de base a ensuite été formé sur les journaux de chat de diplomatie, puis entraînés pour prédire les messages en fonction d'un éventail de données de jeu. Finalement, Cicéron a été formé pour exploiter les informations dans un message lors de la décision de sa prochaine action, tout en raisonnant ce que les autres joueurs pourraient tenter de faire.
Finalement, Cicéron a été entré de manière anonyme dans une ligue en ligne qui s'est déroulée d'août à octobre 2022. Il a joué en 40 matchs, se classant dans le top 10% de ceux qui ont joué plus d'une fois, et en deuxième sur 19 joueurs qui jouaient plus que Cinq matchs. Dans l'ensemble, Cicéron a été le vainqueur du tournoi, avec un score moyen supérieur à celui de certains de ses 82 adversaires.
Ce n'était peut-être pas une annihilation complète, mais c'était un effort gagnant du tournoi pour une IA jetant des bases importantes pour des efforts futurs similaires. Pour l'instant, cela pourrait être limité à la diplomatie, mais il me semble qu'une technologie similaire à Cicéron pourrait un jour se rendre à des jeux comme des colons de Catan, ou même des jeux vidéo de déduction sociale comme la ville de Salem ou parmi nous. Serait maintenant Sus.
Commentaires
Publier un commentaire