On dit que Alice joue pile avec une proba p, et Bob une proba q
gain de Alice = 5*(p(1-q)+(1-p)q)( ==> si elle gagne) - 9pq-(1-p)(1-q) (==> si elle perd)
= 5p-5pq+5q-5pq-9pq-1+p+q-pq
= -1 + 6p+6q -20pq
On cherche à maximiser ca par rapport à p (elle n'a pas d'influence sur q)
dérivée = 6-20q : indépendant de p!
==> si q>0.3, elle jouera p=0, si q<0.3, p=1, si q=0.3, indifférent
Si q=0.3, on obtient une indifférence par rapport à ce que Alice joue, mettons qu'elle joue p=0
gain de Alice = -1+6*0.3 = 0.8
Pour vérifier, si elle joue p=1:
-1+6+6*0.3-20*0.3 = 0.8
Alice gagne en moyenne! Pour ce faire, on peut calculer sa stratégie:
On minimise son gain par rapport à q
gain de A= -1 + 6p+6q -20pq
dérivée par rapport à q= 6-20p
Cette fois on minimise, donc si p>0.3, q=1, etc...
En clair l'équilibre de Nash, c'est 0.3, 0.3 et Alice gagne 0.8
(j'espère ne pas avoir fait de faute de calcul... )