|
#1 - 28-05-2013 13:49:44
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
Distribution ds sorties du loto
Le loto est un tirage aléatoire de 5 numéros parmi 49, effectué dans une urne. Les tirages étant supposément équiprobable d'après la Française des Jeux, chaque numéro suit donc la même loi uniforme. Par conséquent, on devrait s'attendre à ce que sur un grand nombre de tirage, chaque numéro sorte à peu près le même nombre de fois. Les statistiques de la page officielle du loto donnent sur 740 tirages la distribution suivante:
- 1 numéro est sorti 58 fois - 11 numéros sont sortis de 60 à 69 fois - 23 numéros sont sortis de 70 à 79 fois - 9 numéros sont sortis de 80 à 89 fois - 5 numéros sont sortis entre 90 et 96 fois
Ce résultat vous semble-t-il compatible avec l'hypothèse d'équiprobabilité?
Source statistique: https://www.fdj.fr/jeux/jeux-de-tirage/ … atistiques
(lien "Palmarès des numéros")
#2 - 28-05-2013 16:25:53
- titoufred
- Elite de Prise2Tete
- Enigmes résolues : 20
- Messages : 1749
distriburion des sorties du loto
Oui, ce résultat me semble compatible avec l'hypothèse d'équiprobabilité.
Il n'y a rien d'étonnant à ce que certains numéros soient sortis moins de 60 fois ou plus de 90 fois. Ce sont des fluctuations d'échantillonnage.
On ne s'attend pas à ce que chaque numéro sorte à peu près le même nombre de fois. Qu'est-ce que ça veut dire d'ailleurs "à peu près le même nombre de fois" ? Au contraire, plus on fait de tirages, plus on peut s'attendre à de grands écarts entre le nombre de sorties de deux numéros donnés. Ce qui est assez intuitif d'ailleurs. En fait, ce sont les fréquences de sorties qui vont converger vers la même valeur, et qui vont donc avoir tendance à se rapprocher.
#3 - 28-05-2013 16:45:08
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
Distribution des sortiees du loto
Quelle est la différence entre "le nombre de sortie" et "la fréquence de sortie" de deux numéros donnés ?
#4 - 28-05-2013 16:50:05
- titoufred
- Elite de Prise2Tete
- Enigmes résolues : 20
- Messages : 1749
distribution ses sorties du loto
La fréquence de sortie d'un numéro, c'est le nombre de sorties du numéro divisé par le nombre de tirages.
#5 - 28-05-2013 17:48:26
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
disyribution des sorties du loto
OK, j'ai fini par comprendre ce que tu as dit. Néanmoins, la question demeure: quel est l'écart entre les fréquences de sortie qui soit acceptable pour que l'on puisse estimer que l'hypothèse d'équiprobabilité soit vraie ? Avec mettons un risque de se tromper de 5% ? A noter que la distribution que j'ai décrite ressemble à une courbe de Gauss.
#6 - 28-05-2013 20:04:22
- titoufred
- Elite de Prise2Tete
- Enigmes résolues : 20
- Messages : 1749
Distribution des sories du loto
Je ne sais pas pour ton histoire de 5%, je ne sais pas si c'est très simple à calculer car il n'y a pas indépendance entre les nombres de sorties des différents numéros... A ce propos, je n'ai jamais compris pourquoi on prenait ce 5%, qui me semble bien trop grand, je préfèrerais prendre 1% ou moins.
Si on veut faire un peu de calcul, on peut dire que :
S'il y a équiprobabilité pour chaque tirage, alors, sur 740 tirages, un numéro fixé a environ :
2,3% de chances de sortir 59 fois ou moins. 21% de chances de sortir entre 60 et 69 fois. 46% de chances de sortir entre 70 et 79 fois. 26% de chances de sortir entre 80 et 89 fois. 4,7% de chances de sortir 90 fois ou plus.
#7 - 28-05-2013 20:21:25
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
distributuon des sorties du loto
D'accord. Donc en fait, il s'agit probablement de comparer la courbe de Gauss décrite par les données à la courbe de Gauss théorique et de voir si elles sont significativement similaires ou non, avec un risque à 5 ou 1%, comme on veut. Un Khi-deux devrait faire l'affaire.
Merci pour ton aide.
#8 - 28-05-2013 20:28:38
- Franky1103
- Elite de Prise2Tete
- Enigmes résolues : 49
- Messages : 3220
- Lieu: Luxembourg
distriburion des sorties du loto
@titoufred: quelque chose cloche (de Gauss: ): la somme ne fait pas 100%.
#9 - 28-05-2013 21:05:59
- titoufred
- Elite de Prise2Tete
- Enigmes résolues : 20
- Messages : 1749
distribution drs sorties du loto
Ce sont les arrondis. (Un peu à la barbare, j'avoue, pour le 45,52...) Allez, je le change, sinon je sens que tu vas mal dormir.
#10 - 28-05-2013 21:40:32
- PRINCELEROI
- Elite de Prise2Tete
- Enigmes résolues : 33
- Messages : 1274
Distribution des orties du loto
46% de chances de sortir entre 70 et 79 fois. 26% de chances de sortir entre 70 et 79 fois.
il a de la chance lui!
#11 - 28-05-2013 21:42:48
- titoufred
- Elite de Prise2Tete
- Enigmes résolues : 20
- Messages : 1749
distrivution des sorties du loto
#12 - 28-05-2013 22:25:16
- golgot59
- Elite de Prise2Tete
- Enigmes résolues : 48
- Messages : 1494
- Lieu: Coutiches
distribution des sorties fu loto
D'après le cours sur les intervalles de fluctuation du niveau de 2nde :
Soit p la proportion d'un caractère dans une population donnée. Soit n la taille d'un échantillon de cette population et f la fréquence du caractère dans l'échantillon. Si 0,2 ≤p ≤0,8 et si n≥25 alors, dans au moins 95% des cas, f appartient à l'intervalle : I95%=[p-1/√n;p+1/√n] avec ici p=5/49 et n=740
Dans notre cas, on ne peut pas appliquer ce cours car p=5/49 < 0.2, mais en passant outre cette condition, on trouve : I95%=[6.53%;13.88%]
Les quantités observées pour chaque nombre sont comprises entre 58 et 96 fois, soit des fréquences comprises entre 58/740=7.84% et 96/740=12.97%.
Les fréquences sont toutes comprises dans l'intervalle : Tout va bien ! (il y avait 95% de chances pour chacune des fréquences qu'elles soient dans I95%)
#13 - 29-05-2013 00:00:21
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
Distribution des sorties du ltoo
Merci de cet éclairage. Néanmoins, quand on fait 49 fois un même test statistique avec un risque alpha de 5%, le risque global est largement supérieur. Il faut alors prendre 49 fois un risque très inférieur pour aboutir à 5% au global ou bien, plus empiriquement, comparer le nombre d'erreurs attendues (en dehors de l'intervalle de confiance) au nombre d'erreurs obtenues.
Je vais reprendre ton explication, parce que (i) il me semble qu'il y a une erreur de calcul et (ii) ça manque quand même franchement de détail et de justification pour que quelqu'un puisse comprendre ça du premier coup.
Avec n = 740 tirages et p = 5/49 qu'une boule Xi donnée sorte à chaque tirage:
On peut en effet considérer que le nombre de fois où chaque boule Xi est tirée après n tirages suit la loi binomiale B(n;p), puisqu'on a 740 tirages indépendants avec remise et donc p qui reste inchangé entre chaque tirage.
Puisque qu'on a un nombre de tirage supérieur à 30, on peut alors approximer la loi B(n;p) par une loi normale N(np;[latex]\sigma[/latex]).
Avec [latex]\sigma=\sqrt{np(1-p)}[/latex].
Alors, la formule exacte de l'intervalle de confiance à 95% est:
I95 = [p - 1.96*[latex]\sigma[/latex] ; p + 1.96*[latex]\sigma[/latex]]
D'où I95 = [59.4 ; 91.6], qui est un intervalle de confiance pour un nombre de fois (et non pas une fréquence) où une boule Xi est tiré sur 740 tirages.
L'intervalle de confiance étant à 95%, sur 49 boules, on devrait s'attendre en gros à 2.5 boules en dehors de cet intervalle. Dans les faits, il y a 3 boules tirées 92, 94 et 96 fois, d'après les stats de la FdJ. Donc, je pense qu'il est raisonnable de conclure que le tirage du loto suit bien les règles énoncées par la FdJ, même si des calculs supplémentaires sur l'erreur globale permettraient de répondre plus rigoureusement. Ouf !
Note: le test du khi-deux de tout à l'heure me disait également de ne pas m'en faire. Mais deux vérifications valent mieux qu'une.
#14 - 29-05-2013 08:16:13
- golgot59
- Elite de Prise2Tete
- Enigmes résolues : 48
- Messages : 1494
- Lieu: Coutiches
Distribution eds sorties du loto
Et tu trouves ça plus facile à comprendre ?
Sinon sans rire, où as-tu vu une erreur dans mes calculs ? (si tu parlais du p=1/48 que j'avais mis par erreur (mais le suivant était juste), OK, mais sinon, je ne vois pas d'erreur...) p-1/√n = 5/49-1/√740 = 0.06528 = 6.53% p+1/√n = 5/49+1/√740 = 0.1388 = 13.88% 58/740 = 0.0784 = 7.84% 96/740 = 0.1297 = 12.97%.
-------------------------------
Pour reprendre mon intervalle avec un exemple plus simple : Si je lance un dé 400 fois et que je m'intéresse au nombre de (5 ou 6) que je dois obtenir, je calcul : p = 2 chances sur 6 à chaque lancer donc : p=2/6 = 1/3 = 0.3333 =33.3 % et n = 400 (taille de l'échantillon)
Du coup je dois trouver une fréquence de (5 ou 6) dans l'intervalle I95 = [0.333-1/√400;0.333+1/√400] = [.2833;.3833] = [28.33%;38.33%]
Si on ramène en quantité, il y a 95% de chances que j'obtienne un nombre de (5 ou 6) compris entre 0.2833*400 = 113.33 et 0.2833%*400 = 153.33.
Le nombre de (5 ou 6) a donc 95% de chances de se trouver entre 113 et 154...
J'espère que c'est plus clair
#15 - 29-05-2013 08:43:09
- titoufred
- Elite de Prise2Tete
- Enigmes résolues : 20
- Messages : 1749
distribution fes sorties du loto
golgot, l'intervalle de fluctuation vu en Seconde est bien trop large dans la plupart des cas. D'ailleurs, on ne dit pas "95% de chances", mais "au moins 95% de chances". Ça peut être 96%, 97%, 98%, 99%...
Celui donné par Nombrilist avec l'approximation par la loi normale est meilleur car il tient compte de la proba p pour resserrer la fourchette (car l'écart-type dépend de p).
Mais ça reste une approximation quand même. On peut facilement faire le calcul de l'intervalle exact avec la binomiale si l'on veut. C'est au programme de 1ère S.
#16 - 29-05-2013 08:53:09
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
Distributin des sorties du loto
Merci d'avoir re-répondu. Tu trouves l'intervalle [48;103] (recalculé à partir de tes%) là où je trouve [58;92], ce qui est sensiblement différent. Si ce n'est pas une erreur de calcul, alors c'est une erreur de raisonnement. La formule que tu emploies ne me semble pas adaptée au problème. C'est pour cela que j'ai repris le raisonnement depuis le départ:
1 - on a une loi binomiale 2 - n>30, donc on peut travailler avec une loi normale 3 - on utilise la formule exacte de l'I95 avec le coef 1.96 pour la loi normale
A noter que ce problème n'est pas du niveau seconde, mais plutôt de niveau L3 à Master suivant la discipline.
Enfin, après réflexion, je dirais que ce raisonnement n'est pas suffisant en soi. Tout ce que l'on prouve ici, c'est que l'on n'a pas trouvé d'incompatibilité entre nos résultats et l'hypothèse d'équiprobabilité du tirage des boules au Loto. Mais on n'a toujours pas montré l'équiprobabilité.
#17 - 29-05-2013 14:49:34
- ThomasLRG
- Habitué de Prise2Tete
- Enigmes résolues : 41
- Messages : 31
Distribution des ssorties du loto
Nombrilist a écrit:Mais on n'a toujours pas montré l'équiprobabilité.
Il est impossible de "montrer l'équiprobabilité" à partir de ces statistiques puisque l'équiprobabilité n'est qu'une loi parmi d'autres pouvant aboutir à ces résultats.
La seule chose qu'on peut dire (il faudra s'en contenter), c'est déterminer s'il est probable ou non qu'une loi donnée produise ces résultats.
Par exemple, il est très improbable que la loi de probabilité soit la suivante :une loi dans laquelle on a équiprobabilité sauf pour le nombre 1 qui a une probabilité 100 plus grand que chacun des autres nombres (dans ce cas la probabilité d'obtenir 1 est 0.52 et la probabilité d'obtenir un autre nombre donné est 0.01). Cette loi est écartée par les tests proposés dans les messages précédents.
Ainsi, on peut "éliminer" beaucoup de loi en les considérant comme improbables, mais il en reste fatalement une infinité qu'on ne peut pas éliminer.
Thomas
#18 - 29-05-2013 14:55:26
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
Distribution des sorties du lto
En effet. Tu as tout à fait raison. Les tests statistiques sont majoritairement des tests d'exclusion.
#19 - 29-05-2013 16:11:28
- titoufred
- Elite de Prise2Tete
- Enigmes résolues : 20
- Messages : 1749
Distrbution des sorties du loto
En ce qui concerne les intervalles de fluctuation à 95% :
1) golgot, comme il l'a dit, utilise les intervalles de fluctuation qui sont actuellement au programme de Seconde :
Pour les fréquences : [latex]\left[p-\frac{1}{\sqrt{n}} ; p+\frac{1}{\sqrt{n}}\right][/latex]
Pour les effectifs : [latex]\left[\mu-\sqrt{n} ; \mu+\sqrt{n}\right][/latex]
Ces intervalles contiennent au moins 95% des valeurs mais parfois beaucoup plus (pour des valeurs de p éloignées de 0,5) . Cela donne sur cet exemple l'intervalle [48 ; 103], qui contient bien au moins 95% des effectifs, mais qui en fait contient plus de 99,9% des effectifs. Ici, p est trop petit pour utiliser ces intervalles. La majoration de l'écart-type qui donne [latex]1,96\sqrt{p(1-p)} \leq 1[/latex] est trop grossière lorsque p est proche de 0 ou 1.
2) Toi, tu approximes la Binomiale par une Normale et tu utilises les intervalles de fluctuation pour une loi Normale :
Pour les fréquences : [latex]\left[p-1.96\sqrt{\frac{p(1-p)}{n}} ; p+1.96\sqrt{\frac{p(1-p)}{n}}\right][/latex]
Pour les effectifs : [latex]\left[\mu-1.96\sqrt{np(1-p)} ; \mu+1.96\sqrt{np(1-p)}\right][/latex]
Ce qui donne ici l'intervalle [59 ; 92]. En fait, on peut calculer que cet intervalle contient environ 96% des effectifs.
3) On peut se passer de l'approximation par la loi Normale et faire directement les calculs avec la loi Binomiale. On trouve pratiquement la même chose : l'intervalle [60 ; 91] contient environ 95% des effectifs.
Remarque : L'inconvénient de travailler avec la loi Binomiale, c'est que si l'on n'a pas de programme qui fait la recherche, il faut tâtonner pour trouver l'intervalle, et les calculs ne se font pas de tête. On trouve tout de même assez facilement si l'on a Wolfram Alpha sous la main par exemple (voir le calcul).
#20 - 29-05-2013 16:18:37
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
Distribution des sorties du lot
Merci pour ce complément, Fred. L'utilisation de la loi Binomiale me semble effectivement la méthode la plus pertinente, suivie de l'approximation par la loi normale (les résultats sont extrêmement proches). Je reste sur ma position: la méthode des intervalles de fluctuation est bien trop approximative.
#21 - 29-05-2013 18:50:39
- titoufred
- Elite de Prise2Tete
- Enigmes résolues : 20
- Messages : 1749
Distribution dse sorties du loto
Je n'y connais rien en test du Khi2, mais peut-être serait-ce plus adapté ici ? Quelqu'un s'y connait bien ?
#22 - 29-05-2013 19:01:25
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
distribution des sirties du loto
Je ne suis qu'un utilisateur. Je sais qu'il peut servir à tester avec un risque choisi (par exemple 5%) la dissimilarité de deux lois de distribution, dont l'une peut être théorique. Ce risque indique que dans 5% des cas, on conclura que les distributions sont différentes alors qu'elles sont en réalité identiques. Mais ça ne renseigne pas sur le risque que l'on prend de les considérer à tort comme identiques. Au final ça reste un test d'exclusion de similarité.
Mots clés des moteurs de recherche
|
|