loi bInomiale
La loi binomiale est une loi discrète qui prend ses valeurs sur
{O,1,2,...,n} en fonction d'un paramètre de probabilité
p. n est dénommée taille de la binomiale et
pourrait être considéré comme un paramètre. C'est une des premières
distributions qui a été étudiée ; les coefficients binomiaux se retrouvent
dans le célèbre triangle de Pascal. Elle est généralement définie comme le
nombre de succès de n essais indépendants de même
probabilité p de succès. Son espérance est
np et son écart-type de sqrt(np(1-p)).
exemples
- Le nombre de filles dans une famille de trois enfants.
- Le nombre de personnes portant des lunettes et ayant pris place dans un
wagon de train de banlieue.
remarques
- On peut imaginer que cette loi s'applique dans de très nombreuses
situations. Néanmoins, il ne faut jamais oublier les deux
postulats qui la fondent (i) la constance de la probabilité de succès
d'un essai à l'autre, (ii) l'indépendance de ces
essais.
Il convient de noter que, contrairement à ce qu'on pourrait croire,
ils s'appliquent très bien lors d'un échantillonnage d'une
sous-population dans une grande population. Supposons que l'on
s'intéresse à l'occurrence d'une maladie dans une population de
N individus en sélectionnant (au hasard) un échantillon de
taille n. La variable aléatoire considérée est le nombre de
malade (noté m) dans l'échantillon. On posera volontiers que
m suit une loi binomiale de taille n et de paramètre
p, la probabilité d'être malade pour un individu de la
population.
- Décomposant l'échantillonnage en une série de tirages successifs,
on est en droit de remettre en cause l'égalité des probabilités
(puisque la proportion de malades dans la population restante est
modifiée à chaque tirage) et l'indépendance (puisque si on sait avoir
tiré un malade la première fois, on peut en déduire la diminution de
la probabilité d'en tirer un la seconde fois). En fait, cet argument
ne vaut que pour des cas où le rapport de n sur N
est proche de 1. Des calculs élémentaires montrent qu'il est
complètement négligeable dans la quasi-totalité des situations
réelles.
- Un autre argument, qui semble plus sérieux, est celui qu'a priori
toutes les personnes de la population n'ont pas la même probabilité
d'être malade. Par exemple, on peut savoir que les bébés et les
personnes très âgées sont plus sujettes que les autres à la maladie.
Mais cet argument ne vaudrait que si on notait en même temps que la
maladie, l'âge des personnes échantillonnées et qu'on voulait
conditionner la distribution de n en fonction de cette
covariable ! En cas contraire, on s'intéresse à la probabilité qu'une
personne quelconque de la population soit malade, sans tenir compte
de son âge. Cette probabilité est effectivement une valeur moyenne
des probabilités fonction de l'âge, suivant la répartition des âges
dans la population. C'est d'ailleurs pour cela qu'il faut tirer au
sort (avec égale probabilité) les individus, et ne pas se contenter
d'interroger les pensionnaires des maisons de retraite, même si c'est
plus commode. Dans un contexte baysien, ce raisonnement est dénommé
échangeabilité. La probabilité p est donc
bien constante d'un tirage à l'autre.
- On note souvent la binomiale par Binom(n,p) ou même
B(n,p).
- Dès que n est assez grand, l'approximation Normale de la binomiale est très bonne. Comme le
montre cette série de diagrammes où les abscisses correspondent aux
valeurs de la variable aléatoire et les ordonnées sont les probabilités
pour la distribution binomiale et la densité de probabilité pour la loi
normale.

Cette comparaison de la loi binomiale (les batons noirs) et de la loi
normale (pointillés bleus) pour une probabilité faible de p=0.10
montre que pour des tailles d'échantillon (n) assez faibles,
l'approximation est bonne, pour ne pas dire excellente.