5 votes

Comment AlphaGo calcule-t-il ?

Quelqu'un connaît-il l'algorithme d'AlphaGo ? J'ai entendu dire que c'est lié aux réseaux neuronaux. Mais je ne connais pas les détails. Donc il ne trouve pas la solution pour gagner de manière déterministe, n'est-ce pas ? Je pense que oui, car Lee Sedol a gagné une partie. C'est vrai qu'aux échecs, DeepBlue trouve la solution unique pour gagner, donc il n'y a aucune chance qu'un être humain puisse la battre ?

11voto

mcintyre321 Points 5393

Voici l'article de l'équipe AlphaGo qui contient tous les détails (derrière un paywall) : http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html

J'ai donné quelques conférences techniques à ce sujet récemment. Celle-ci porte sur le fonctionnement d'AlphaGo et le match avec Fan Hui 2p : https://www.youtube.com/watch?v=HTDxpxmFRGo

J'ai donné une autre conférence l'année dernière sur les raisons pour lesquelles il est difficile de créer une bonne IA pour le Go. Celle-ci explique également brièvement les règles : http://blog.fogcreek.com/go-and-artificial-intelligence-tech-talk/

3voto

DukeZhou Points 501

AlphaGo s'appuie fortement sur Recherche d'arbres de Monte-Carlo (SCTM), qui est une forme de prise de décision utilisant les choix aléatoires comme analogie à la créativité. Plus précisément, il permet à l'algorithme de "penser" au-delà des limites de ses procédures d'évaluation rationnelles. (Les choix aléatoires sont ensuite analysés et pondérés afin de déterminer ceux qui sont potentiellement utiles). La capacité d'utiliser avec succès cette méthode pour battre les joueurs humains les plus forts est en partie une fonction de la superinformatique, dans la mesure où DeepMind dispose de processeurs très rapides et d'une mémoire pratiquement illimitée.

Ceci est tout à fait différent de la résolution d'un jeu dans le Théorie des jeux combinatoires contexte.

Plus précisément, nous ne pouvons pas savoir si AlphaGo a joué de manière optimale, mais seulement qu'il a joué de manière plus optimale que Lee Sedol dans 4 jeux sur 5.

Les échecs ne sont pas non plus résolus, mais le jeu a été si bien étudié, et DeepBlue si bien développé, qu'il semble désormais impossible pour un humain de l'emporter.

Le statut non résolu de ces jeux non triviaux, qui sont également appelés partisan , séquentiel , déterministe (non-chance), et information parfaite est une fonction de intractabilité .

Dans le cas du Go, cela signifie que même si vous convertissiez chaque atome de l'univers en un dispositif informatique et que vous disposiez de toute la durée de l'univers pour calculer, vous ne pourriez toujours pas exprimer l'arbre de jeu complet du Go. Les échecs sont moins complexes, mais sont toujours considérés comme insolubles.


L'article de DeepMind publié dans Nature : Maîtriser le jeu de Go en profondeur réseaux neuronaux profonds et la recherche arborescente est désormais disponible gratuitement.

AlleGamers.com

AlleGamers est une communauté de gamers qui cherche à élargir la connaissance des jeux vidéo.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X