1 votes

Comment fonctionnent les simulations de blackjack ?

La stratégie de base du blackjack a été élaborée à partir de simulations informatiques. Disons que je programme le "joueur" de la simulation pour qu'il joue avec une certaine stratégie, en frappant, en restant ou autre, en fonction de certaines mains du joueur et du croupier. Je lance ensuite la simulation, en faisant jouer au "joueur" des millions de mains, puis j'observe les résultats.

Mais comment interpréter les résultats ? Je pourrais compter le nombre de mains que le joueur a gagnées et perdues. Si le joueur a perdu beaucoup d'argent, il y a certainement quelque chose qui ne va pas dans ma stratégie et je dois l'ajuster. Mais comment saurais-je ce qu'il faut changer ? Il existe un grand nombre de possibilités, et je ne sais pas quelle partie de ma stratégie a influencé mes grosses pertes et dans quelle mesure. Existe-t-il une sorte d'algorithme pour cela ? Je suppose que je pourrais simplement randomiser la stratégie jusqu'à ce que je trouve celle qui rapporte le plus d'argent au joueur, mais cela ne semble pas très efficace.

Par ailleurs, comment les paris fonctionnent-ils dans ces simulations ? S'agit-il généralement d'un pari fixe ou d'une stratégie de pari mise en œuvre ?

Je n'ai pas été en mesure de trouver beaucoup de code ou quoi que ce soit qui puisse expliquer plus en détail le fonctionnement de ces simulations.

1voto

appas Points 185

Toute simulation est basée sur un ensemble d'hypothèses - l'hypothèse la plus simple au blackjack est que toute carte tirée sera de valeur 10 (c'est-à-dire 10, J, Q, K). Vous exécutez votre simulation avec cette hypothèse, qui détermine votre stratégie (par exemple, la plus simple étant de frapper si vous avez 11 ou moins, de rester si vous ne l'avez pas). Exécutez un million de mains et voyez comment vous vous en sortez.

Si vous n'êtes pas dans le trou de beaucoup, tant mieux. Votre stratégie fonctionne raisonnablement bien, et vous pouvez vous arrêter là si vous le souhaitez. Si vous avez perdu beaucoup d'argent, vous devez commencer à modifier votre stratégie jusqu'à ce que vous en trouviez une qui fonctionne (suffisamment) bien. Et, en l'absence de principes directeurs fondés sur les probabilités et autres, vous devez vraiment tester toutes les stratégies possibles et imaginables (dans la limite du raisonnable).

La beauté de la chose, c'est que les ordinateurs sont vraiment capables d'exécuter des millions et des milliards de mains, et donc d'exécuter toutes ces simulations n'est pas aussi difficile que cela peut paraître (je m'attends à ce qu'un programme bien écrit soit capable de simuler 1 million de mains en quelques minutes, de sorte que vous pouvez exécuter des centaines ou des milliers d'itérations différentes en une journée). Si vous pouvez appliquer un peu de mathématiques et de statistiques, vous pouvez probablement réduire le nombre de modifications que vous devez exécuter.

Vous commencez donc par modifier votre mise (double down si vous avez 11, par exemple), ou vos règles de hit/stand (division des As), ou vos hypothèses (hit sur 12 si le croupier montre 10, car même si vous avez des chances de tirer un 10, il est possible que vous ne le fassiez pas). La clé est de ne modifier qu'un seul élément à la fois. À la fin de chaque manche, comparez votre nombre final de jetons. Trouvez le run le plus élevé et vous y êtes. Vous pourriez alors commencer à combiner certaines des modifications qui vous ont permis d'obtenir le meilleur score et voir comment la combinaison s'en sort (doublez le score si vous avez 10 ou 11, par exemple).

Au final, vous obtenez un ensemble de règles sur la façon dont le joueur doit miser et jouer, afin de maximiser ses gains et de minimiser ses pertes.

Il s'agit d'un type de simulation appelé Simulation de Monte Carlo Il utilise une main aléatoire pour simuler le jeu. Exécuté suffisamment de fois, le caractère aléatoire peut conduire à une réponse déterministe. En fait, à chaque fois que vous exécutez votre simulation, vous essayez de calculer l'avantage de la maison - si vous commencez avec 100 $ et terminez avec 98 $, la maison a un avantage de 2 % (ou quelque chose comme ça). Plus vous vous rapprochez de la simulation du jeu parfait, plus vous vous rapprochez du calcul du véritable avantage de la maison.

1voto

Cohensius Points 3357

La stratégie optimale du joueur de BJ est bien étudiée et connue. Une recherche rapide sur Google vous présentera des tonnes de graphiques similaires à celui-ci.

La façon de trouver l'action optimale dans chaque situation est, comme l'a dit mmathis, la simulation Monte Carlo : dans chaque position {main du joueur, carte du croupier} simulez environ un million de fois quel sera le profit du joueur s'il joue chacune des actions. Choisissez ensuite l'action dont le profit moyen est le plus élevé dans chaque situation.

Pour autant que je sache, le dimensionnement des paris ne fonctionne plus puisque les croupiers mélangent les cartes avant d'atteindre le bas de toutes les cartes.

les 60 à 75 dernières cartes environ ne seront pas utilisées. (Ne pas distribuer au cartes, il est plus difficile pour les compteurs de cartes professionnels d'agir efficacement). [ ] Règles BJ

Pseudocode :

list_of_best_actions = []    
for each hand of the player:
    for each hand of the dealer:
        maximal_average_profit = 0
        best_action = None
        for each action from possible_actions:
             profit = 0
             for iteration (1,n):
                  profit += play(action)
             average_profit = profit / n
             if average_profit > maximal_average_profit
                 best_action = action
    list_of_best_actions.append(best_action)

BJ strategy

AlleGamers.com

AlleGamers est une communauté de gamers qui cherche à élargir la connaissance des jeux vidéo.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X