Probabilités et statistique inférentielle — Terminale Maths Complémentaires

Estimation et prise de décision

Introduction

L'estimation et la prise de décision sont au cœur de la statistique inférentielle. On utilise les données d'un échantillon pour prendre des décisions concernant une population, en tenant compte de l'incertitude liée à l'échantillonnage.

1. Estimation ponctuelle

1.1 Principe

Définition : Une estimation ponctuelle d'un paramètre est une valeur unique calculée à partir de l'échantillon qui sert d'approximation de .

1.2 Estimateurs usuels

Théorème : Pour estimer les paramètres d'une population à partir d'un échantillon :

Moyenne : on utilise la moyenne de l'échantillon x = 1{n} _{i=1}^n x_i
Proportion : on utilise la fréquence observée f = X{n} où X est le nombre de succès
[[ecart-type|Écart-type]] : on utilise l'écart-type de l'échantillon s = {1{n-1} _{i=1}^n (x_i - x)^2}

Exemple : Dans un échantillon de n = 100 personnes, on observe 60 personnes favorables à une mesure.

L'estimation ponctuelle de la proportion p dans la population est :

[formule]

1.3 Propriétés des estimateurs

Un bon estimateur doit être :

Sans biais : son [[esperance|espérance]] est égale au paramètre à estimer
Convergent : il se rapproche du paramètre quand la taille de l'échantillon augmente
Efficace : il a une variance faible

2. Estimation par intervalle (rappel)

Comme vu dans la leçon précédente, l'estimation par intervalle de confiance est préférable car elle donne une marge d'erreur.

3. Tests d'hypothèses

3.1 Principe

Un test d'hypothèse permet de décider si une hypothèse sur un paramètre de la population est crédible compte tenu des données observées.

3.2 Structure d'un test

Méthode :

Hypothèse nulle H_0 : hypothèse que l'on veut tester (souvent de la forme p = p_0 ou = _0)
Hypothèse alternative H_1 : hypothèse alternative (souvent p p_0, p > p_0 ou p < p_0)
**Niveau de signification ** : probabilité de rejeter H_0 à tort (souvent 5% ou 1%)
Statistique de test : calculée à partir de l'échantillon
Règle de décision : on rejette H_0 si la statistique de test est dans la zone de rejet
Conclusion : on accepte ou rejette H_0 avec un risque d'erreur

4. Test sur une proportion

4.1 Test bilatéral

Théorème : On veut tester H_0 : p = p_0 contre H_1 : p p_0 au niveau .

Si n 30, np_0 5 et n(1-p_0) 5, alors :

On calcule la statistique de test : Z = f - p_0{{p_0(1-p_0){n}}}
On rejette H_0 si |Z| > u_{1-/2} (où u_{1-/2} est le quantile d'ordre 1 - /2 de N(0, 1))

Exemple : On veut tester si une pièce est équilibrée (p = 0,5) au niveau = 5%.

On lance la pièce n = 100 fois et on obtient f = 0,42.

H_0 : p = 0,5 contre H_1 : p 0,5
Statistique de test : Z = 0,42 - 0,5{{0,5 0,5{100}}} = -0,08{0,05} = -1,6
Pour = 5%, on a u_{0,975} 1,96
Comme |Z| = 1,6 < 1,96, on n'accepte pas de rejeter H_0

Conclusion : les données ne permettent pas de conclure que la pièce est déséquilibrée au niveau 5%.

4.2 Test unilatéral

Pour tester H_0 : p = p_0 contre H_1 : p > p_0 :

On rejette H_0 si Z > u_{1-}

Pour tester H_0 : p = p_0 contre H_1 : p < p_0 :

On rejette H_0 si Z < -u_{1-}

5. Risques d'erreur

5.1 Erreur de première espèce

Définition : L'erreur de première espèce (ou risque ) est la probabilité de rejeter H_0 alors qu'elle est vraie.

C'est le niveau de signification du test.

5.2 Erreur de deuxième espèce

Définition : L'erreur de deuxième espèce (ou risque ) est la probabilité d'accepter H_0 alors qu'elle est fausse.

La puissance du test est 1 - : c'est la probabilité de rejeter H_0 quand elle est fausse.

Exemple : Dans un test médical :

Erreur de première espèce : déclarer qu'un traitement est efficace alors qu'il ne l'est pas
Erreur de deuxième espèce : déclarer qu'un traitement n'est pas efficace alors qu'il l'est

Les deux erreurs peuvent avoir des conséquences graves, d'où l'importance de bien choisir le niveau de signification.

6. Prise de décision avec intervalles de confiance

6.1 Principe

On peut aussi prendre une décision en utilisant un intervalle de confiance :

Si l'intervalle de confiance ne contient pas la valeur p_0 de l'hypothèse H_0, on rejette H_0
Si l'intervalle contient p_0, on n'accepte pas de rejeter H_0

Exemple : On veut tester H_0 : p = 0,5 au niveau 5%.

Un échantillon de taille n = 400 donne f = 0,45.

L'intervalle de confiance à 95% est :

[formule]

Comme 0,5 n'est pas dans l'intervalle, on rejette H_0 au niveau 5%.

Conclusion : on peut conclure que p 0,5 avec un risque d'erreur de 5%.

7. Applications pratiques

7.1 Contrôle qualité

Les tests d'hypothèses sont utilisés pour vérifier si un processus de production respecte les spécifications.

Exemple : Une machine doit produire des pièces avec un diamètre moyen de _0 = 50 mm.

On prélève un échantillon de n = 100 pièces et on mesure x = 50,2 mm avec = 0,5 mm connu.

On teste H_0 : = 50 contre H_1 : 50 au niveau 5%.

Statistique de test : Z = 50,2 - 50{0,5/100} = 0,2{0,05} = 4

Comme |Z| = 4 > 1,96, on rejette H_0.

Conclusion : la machine ne produit pas des pièces avec le diamètre moyen attendu.

7.2 Sondages et élections

Les tests permettent de déterminer si un candidat est en tête dans les sondages.

À retenir

Résumé :

L'estimation ponctuelle donne une valeur unique pour un paramètre.
Un test d'hypothèse permet de décider si une hypothèse H_0 est crédible.
Pour un test sur une proportion :
- Statistique de test : Z = f - p_0{{p_0(1-p_0){n}}}
- On rejette H_0 si |Z| > u_{1-/2} (test bilatéral)
L'erreur de première espèce () : rejeter H_0 à tort.
L'erreur de deuxième espèce () : accepter H_0 à tort.
On peut aussi utiliser un intervalle de confiance pour prendre une décision.

Conseil pratique : Pour effectuer un test d'hypothèse :

Formuler H_0 et H_1
Choisir le niveau de signification
Vérifier les conditions d'application
Calculer la statistique de test
Comparer avec la valeur critique
Conclure dans le contexte

Piège courant : Attention à bien interpréter "accepter H_0" : cela signifie seulement qu'on n'a pas assez de preuves pour la rejeter, pas qu'elle est vraie avec certitude. De même, "rejeter H_0" ne signifie pas que H_1 est vraie avec certitude, seulement qu'elle est plus crédible compte tenu des données.