Cours de Première sur l’échantillonnage
Intervalle de fluctuation d’une fréquence
- On étudie un caractère sur une population ; à partir d’études statistiques, on émet l’hypothèse que la proportion de personnes présentant ce caractère dans la population est p.
On cherche à valider ou non cette hypothèse sur un échantillon de n individus, constitué par tirage au sort avec remise ; on calcule la fréquence f d’individus présentant ce caractère.
La variable aléatoire X égale au nombre d’individus présentant ce caractère soit la loi binomiale de paramètres n et p.
X prennent les valeurs entières entre 0 et n, on cherche deux nombres entiers a et b pour partager l’intervalle [0 ; n] en trois intervalles [0 ; a – 1], [a ; b] et [b +1 ; n] de manière à ce que la probabilité que X appartienne à chacun des intervalles [0 ; a – 1] et [b +1 ; n] soit inférieure ou égale à 0.025.
- L’intervalle de fluctuation à 95 % d’une fréquence correspondant à la réalisation, sur un échantillon aléatoire de taille n, d’une variable aléatoire X de loi binomiale, est l’intervalle définit par :
- a est le plus petit entier tel que P(X ≤ a) > 0.025 :
- b est le plus petit entier tel que P(X ≤ b) > 0.975.
Prise de décision à partir d’un échantillon
- On émet l’hypothèse que la proportion d’un caractère est p.
On calcule la fréquence f sur un échantillon de taille n et on détermine l’intervalle de fluctuation à 95 % de cette fréquence. Cet intervalle contient au moins 95 % des fréquences observées sur des échantillons de taille n. Il y a donc un risque de 5 % pour une fréquence observée f de ne pas se trouver dans cet intervalle.
- On applique la règle de décision suivante :
- Si alors on ne peut pas rejeter l’hypothèse au seuil de risque 5 %.
- Si alors on rejette l’hypothèse au seuil de risque 5 %.