Statistiques descriptives
Introduction
Les statistiques permettent de collecter, organiser et résumer des données. On cherche à décrire une série de données à l'aide d'indicateurs : la moyenne, la médiane, l'étendue, etc.
1. Vocabulaire
Vocabulaire statistique :
- Population : ensemble des individus étudiés
- Caractère : propriété étudiée sur chaque individu
- Caractère quantitatif : mesurable (âge, taille, note...)
- Caractère qualitatif : non mesurable (couleur, métier...)
- Effectif n_i : nombre d'individus ayant une certaine valeur
- Effectif total N : somme de tous les effectifs
- Fréquence f_i = n_i{N} : proportion d'individus
2. Indicateurs de position
Moyenne
Moyenne : La moyenne x d'une série de valeurs x_1, x_2, , x_p d'effectifs n_1, n_2, , n_p est :
[formule]
Exemple : Notes d'un devoir (sur 20) :
| Note | 8 | 10 | 12 | 14 | 16 |
|---|---|---|---|---|---|
| Effectif | 3 | 5 | 8 | 6 | 3 |
N = 25 et x = 3 8 + 5 10 + 8 12 + 6 14 + 3 16{25} = 302{25} = 12{,}08
Médiane
Médiane : La médiane Me est la valeur qui partage la série ordonnée en deux groupes de même effectif :
- 50% des valeurs sont Me
- 50% des valeurs sont Me
Trouver la médiane :
Ordonner les valeurs par ordre croissant
Si N est impair : Me est la valeur de rang N+1{2}
Si N est pair : Me est la demi-somme des valeurs de rang N{2} et N{2} + 1
Exemple : Série : 3, 5, 7, 8, 12, 15, 20 (N = 7, impair)
Rang de la médiane : 7+1{2} = 4. La 4e valeur est 8.
Me = 8
3. Indicateurs de dispersion
Étendue
Étendue : L'étendue est la différence entre la plus grande et la plus petite valeur :
[formule]
Quartiles
Quartiles :
- Q_1 (1er quartile) : au moins 25% des valeurs sont Q_1
- Q_3 (3e quartile) : au moins 75% des valeurs sont Q_3
- Écart interquartile : Q_3 - Q_1 (contient 50% des valeurs centrales)
Écart type
Variance et écart type : La variance mesure la dispersion des valeurs autour de la moyenne :
[formule]
L'écart type est la racine carrée de la variance :
[formule]
Interprétation :
- Un petit écart type → les valeurs sont concentrées autour de la moyenne
- Un grand écart type → les valeurs sont dispersées
4. Diagrammes statistiques
Types de représentations :
Diagramme en bâtons : pour les caractères discrets
Histogramme : pour les données regroupées en classes
Diagramme circulaire : pour les fréquences (angles proportionnels)
Diagramme en boîte : résume x_{}, Q_1, Me, Q_3, x_{}
À retenir
Résumé :
x = n_i x_i{N} (moyenne pondérée)
La médiane partage la série ordonnée en deux moitiés
L'étendue = max - min
L'écart type mesure la dispersion autour de la moyenne
Plus est petit, plus les données sont regroupées