Comment AlphaGo calcule-t-il ?

Question

Comment AlphaGo calcule-t-il ?

Demandé el 19 de Avril, 2016: Quand la question a-t-elle été
686 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Quelqu'un connaît-il l'algorithme d'AlphaGo ? J'ai entendu dire que c'est lié aux réseaux neuronaux. Mais je ne connais pas les détails. Donc il ne trouve pas la solution pour gagner de manière déterministe, n'est-ce pas ? Je pense que oui, car Lee Sedol a gagné une partie. C'est vrai qu'aux échecs, DeepBlue trouve la solution unique pour gagner, donc il n'y a aucune chance qu'un être humain puisse la battre ?

Demandé el 19 de Avril, 2016 par Tuxmentat

Answer 1

2 Réponses

Answer 2

11voto

mcintyre321 Points 5393

Voici l'article de l'équipe AlphaGo qui contient tous les détails (derrière un paywall) : http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html

J'ai donné quelques conférences techniques à ce sujet récemment. Celle-ci porte sur le fonctionnement d'AlphaGo et le match avec Fan Hui 2p : https://www.youtube.com/watch?v=HTDxpxmFRGo

J'ai donné une autre conférence l'année dernière sur les raisons pour lesquelles il est difficile de créer une bonne IA pour le Go. Celle-ci explique également brièvement les règles : http://blog.fogcreek.com/go-and-artificial-intelligence-tech-talk/

Répondu el 19 de Avril, 2016 par mcintyre321 (5393 Points )

Answer 3

3voto

DukeZhou Points 501

AlphaGo s'appuie fortement sur Recherche d'arbres de Monte-Carlo (SCTM), qui est une forme de prise de décision utilisant les choix aléatoires comme analogie à la créativité. Plus précisément, il permet à l'algorithme de "penser" au-delà des limites de ses procédures d'évaluation rationnelles. (Les choix aléatoires sont ensuite analysés et pondérés afin de déterminer ceux qui sont potentiellement utiles). La capacité d'utiliser avec succès cette méthode pour battre les joueurs humains les plus forts est en partie une fonction de la superinformatique, dans la mesure où DeepMind dispose de processeurs très rapides et d'une mémoire pratiquement illimitée.

Ceci est tout à fait différent de la résolution d'un jeu dans le Théorie des jeux combinatoires contexte.

Plus précisément, nous ne pouvons pas savoir si AlphaGo a joué de manière optimale, mais seulement qu'il a joué de manière plus optimale que Lee Sedol dans 4 jeux sur 5.

Les échecs ne sont pas non plus résolus, mais le jeu a été si bien étudié, et DeepBlue si bien développé, qu'il semble désormais impossible pour un humain de l'emporter.

Le statut non résolu de ces jeux non triviaux, qui sont également appelés partisan , séquentiel , déterministe (non-chance), et information parfaite est une fonction de intractabilité .

Dans le cas du Go, cela signifie que même si vous convertissiez chaque atome de l'univers en un dispositif informatique et que vous disposiez de toute la durée de l'univers pour calculer, vous ne pourriez toujours pas exprimer l'arbre de jeu complet du Go. Les échecs sont moins complexes, mais sont toujours considérés comme insolubles.

L'article de DeepMind publié dans Nature : Maîtriser le jeu de Go en profondeur réseaux neuronaux profonds et la recherche arborescente est désormais disponible gratuitement.

Répondu el 18 de Août, 2017 par DukeZhou (501 Points )

Comment AlphaGo calcule-t-il ?

Réponses

Questions en vedette

Top Tags

AlleGamers.com

Powered by:

Comment AlphaGo calcule-t-il ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

AlleGamers.com

Powered by: