La loi normale en détail

Introduction

La loi normale est la loi de probabilité la plus importante en statistique et en sciences. Elle modélise de nombreux phénomènes naturels (tailles, masses, erreurs de mesure…). Ce cours approfondit l'étude de la loi normale centrée réduite N(0,1) et de la loi normale générale N(, ^2).

1. Loi normale centrée réduite N(0,1)

Loi normale centrée réduite : La variable aléatoire Z suit la loi normale centrée réduite N(0,1) si sa densité est :

[formule]

On a E(Z) = 0 et V(Z) = 1 (d'où le nom « centrée réduite »).

Propriétés de symétrie : La densité f de N(0,1) vérifie :

f(-z) = f(z) pour tout z R (fonction paire)
La courbe est symétrique par rapport à l'axe des ordonnées
Le maximum de f est atteint en z = 0 et vaut f(0) = 1{2} 0{,}399
_{z } f(z) = 0 (la courbe s'aplatit vers 0)

Fonction de répartition : On note la fonction de répartition de la loi N(0,1) :

[formule]

Cette intégrale n'a pas de forme explicite : on utilise des tables numériques ou la calculatrice.

Propriétés de symétrie de : Pour tout z R :

[formule]

Autrement dit : P(Z -z) = 1 - P(Z z) = P(Z > z).

Conséquence : P(-a Z a) = 2(a) - 1 pour tout a > 0.

Exemple : Soit Z N(0,1). En lisant la table : (1{,}96) 0{,}975.

P(Z -1{,}96) = 1 - (1{,}96) = 1 - 0{,}975 = 0{,}025.

P(-1{,}96 Z 1{,}96) = 2 0{,}975 - 1 = 0{,}95.

Ainsi, 95% des valeurs de Z sont comprises entre -1{,}96 et 1{,}96.

2. Loi normale générale N(, ^2)

Loi normale N(, ^2) : La variable aléatoire X suit la loi normale de paramètres (espérance) et ^2 (variance), notée X N(, ^2), si sa densité est :

[formule]

Paramètres :

R : espérance (centre de la courbe)
0 : écart type (contrôle l'étalement)
^2 : variance

Influence des paramètres : La courbe en cloche de N(, ^2) a les caractéristiques suivantes :

Centre : le maximum est atteint en x =
Symétrie : la courbe est symétrique par rapport à la droite x =
Étalement : plus est grand, plus la courbe est aplatie et étalée ; plus est petit, plus la courbe est resserrée et haute
Points d'inflexion : en x = - et x = +

Attention à la notation : N(, ^2) : le second paramètre est la variance ^2.

Ne pas confondre :

X N(100, 25) signifie = 100 et ^2 = 25, donc = 5
X N(100, 5^2) est la même loi, écrite avec = 5

Certains auteurs notent N(, ) avec l'écart type directement. Toujours vérifier la convention utilisée.

3. Calcul de probabilités avec la loi normale

Règle 68-95-99,7 : Si X N(, ^2) :

[formule]

Ces valeurs sont à connaître par cœur.

Calcul d'une probabilité P(a X b) : Pour X N(, ^2) :

Étape 1 : Centrer-réduire les bornes :

[formule]

Étape 2 : Utiliser la fonction de répartition :

[formule]

Étape 3 : Lire dans la table de N(0,1) ou utiliser la calculatrice.

Exemple : Soit X N(170, 6^2) la taille (en cm) d'une population.

Calculer P(164 X 182).

On centre-réduit : [formule]

[formule]

Environ 81,9% de la population mesure entre 164 cm et 182 cm.

4. Centrer-réduire une variable normale

Théorème de centrage-réduction : Si X N(, ^2), alors la variable :

[formule]

suit la loi N(0, 1).

Réciproquement : si Z N(0, 1), alors X = + Z N(, ^2).

Pourquoi centrer-réduire ? : Centrer-réduire permet de ramener n'importe quelle loi normale à la loi N(0,1).

On n'a besoin que d'une seule table (celle de N(0,1)) pour calculer toutes les probabilités liées à une loi normale quelconque.

Méthode : centrer-réduire : Pour calculer une probabilité liée à X N(, ^2) :

Écrire l'événement en fonction de X
Soustraire à chaque membre de l'inégalité
Diviser par chaque membre
On obtient une probabilité portant sur Z N(0,1)
Utiliser la table ou la calculatrice

Schéma : P(X a) = P(Z a - {}) = (a - {})

Exemple : La durée de fabrication X (en minutes) d'une pièce suit N(45, 4^2).

Quelle est la probabilité que la fabrication prenne plus de 50 minutes ?

P(X > 50) = P(Z > 50 - 45{4}) = P(Z > 1{,}25)

= 1 - (1{,}25) = 1 - 0{,}8944 = 0{,}1056

Il y a environ 10,6% de chance que la fabrication dépasse 50 minutes.

5. Lecture de tables et utilisation de la calculatrice

Lecture de la table de N(0,1) : La table donne (z) = P(Z z) pour z 0.

Pour z > 0 : lire directement (z) dans la table.

Pour z < 0 : utiliser (-z) = 1 - (z), c'est-à-dire : [formule]

Exemples de lecture :

(1{,}65) = 0{,}9505
(0{,}50) = 0{,}6915
P(Z -1{,}65) = 1 - 0{,}9505 = 0{,}0495

Calculatrice : Calculer P(a X b) pour X N(, ^2) :

TI-83/84 : normalcdf(a, b, , )
Casio : Menu STAT → DIST → NORM → Ncd → Lower: a, Upper: b, ,

Problème inverse : trouver a tel que P(X a) = p :

TI : invNorm(p, , )
Casio : InvN → Tail: Left, Area: p, ,

Exemple avec calculatrice : X N(100, 15^2) modélise le QI dans une population.

a) P(X 130) = normalcdf(130, 10^{99}, 100, 15) 0{,}0228 (environ 2,3%)

b) Trouver le QI dépassé par 5% de la population :

invNorm(0{,}95, 100, 15) 124{,}7

Environ 5% de la population a un QI supérieur à 124,7.

6. Intervalles de fluctuation et estimation

Intervalle de fluctuation asymptotique : Soit F_n = X_n{n} la fréquence observée dans un échantillon de taille n, avec X_n B(n, p).

Pour n assez grand (règle : n 30, np 5 et n(1-p) 5) :

[formule]

L'intervalle de fluctuation asymptotique au seuil de 95% est :

[formule]

Prise de décision avec l'intervalle de fluctuation : Pour tester si une proportion p_0 est plausible :

Calculer I_n avec p = p_0
Observer la fréquence f dans l'échantillon
Si f I_n : on ne rejette pas l'hypothèse p = p_0
Si f I_n : on rejette l'hypothèse au seuil de 5%

Exemple : Un candidat affirme avoir 60% des voix. Sur un sondage de n = 400 personnes, on observe f = 0{,}55.

I_{400} = [0{,}60 - 1{,}96{0{,60 0{,}40}{400}} ; ; ; 0{,}60 + 1{,}96{0{,60 0{,}40}{400}}]

= [0{,}60 - 1{,}96 0{,}0245 ; ; ; 0{,}60 + 1{,}96 0{,}0245]

= [0{,}552 ; ; ; 0{,}648]

f = 0{,}55 I_{400} ? Non, 0{,}55 < 0{,}552.

Au seuil de 5%, on rejette l'affirmation du candidat.

Intervalle de confiance : À partir d'une fréquence observée f sur un échantillon de taille n, l'intervalle de confiance au niveau de confiance 95% pour la proportion p inconnue est :

[formule]

C'est une estimation « simplifiée » de p. On a P(p IC) 0{,}95.

Exemple : Un sondage sur n = 900 personnes donne f = 0{,}42 favorables à une mesure.

IC = [0{,}42 - 1{900} ; ; ; 0{,}42 + 1{900}] = [0{,}42 - 1{30} ; ; ; 0{,}42 + 1{30}]

= [0{,}387 ; ; ; 0{,}453]

On estime avec 95% de confiance que la proportion réelle est entre 38,7% et 45,3%.

À retenir

Résumé :

Loi N(0,1) : densité f(z) = 1{2} e^{-z^2/2}, fonction paire, (-z) = 1 - (z)
Loi N(, ^2) : courbe en cloche centrée en , étalement contrôlé par
Règle 68-95-99,7 : à 1, 2 et 3 écarts types → 68%, 95%, 99,7% des valeurs
Centrer-réduire : si X N(, ^2), alors Z = X - {} N(0,1)
Calcul : P(a X b) = (b-{}) - (a-{})
Intervalle de fluctuation (seuil 95%) : [p - 1{,}96{p(1-p){n}} ; ; ; p + 1{,}96{p(1-p){n}}]
Intervalle de confiance (niveau 95%) : [f - 1{n} ; ; ; f + 1{n}]