Statistiques descriptives

Statistiques et probabilités — Seconde

Statistiques descriptives

Introduction

Les statistiques permettent de collecter, organiser et résumer des données. On cherche à décrire une série de données à l'aide d'indicateurs : la moyenne, la médiane, l'étendue, etc.


1. Vocabulaire

Vocabulaire statistique :

  • Population : ensemble des individus étudiés
  • Caractère : propriété étudiée sur chaque individu
  • Caractère quantitatif : mesurable (âge, taille, note...)
  • Caractère qualitatif : non mesurable (couleur, métier...)
  • Effectif n_i : nombre d'individus ayant une certaine valeur
  • Effectif total N : somme de tous les effectifs
  • Fréquence f_i = n_i{N} : proportion d'individus

2. Indicateurs de position

Moyenne

Moyenne : La moyenne x d'une série de valeurs x_1, x_2, , x_p d'effectifs n_1, n_2, , n_p est :

[formule]

Exemple : Notes d'un devoir (sur 20) :

Note 8 10 12 14 16
Effectif 3 5 8 6 3

N = 25 et x = 3 8 + 5 10 + 8 12 + 6 14 + 3 16{25} = 302{25} = 12{,}08

Médiane

Médiane : La médiane Me est la valeur qui partage la série ordonnée en deux groupes de même effectif :

  • 50% des valeurs sont Me
  • 50% des valeurs sont Me

Trouver la médiane :

  1. Ordonner les valeurs par ordre croissant

  2. Si N est impair : Me est la valeur de rang N+1{2}

  3. Si N est pair : Me est la demi-somme des valeurs de rang N{2} et N{2} + 1

Exemple : Série : 3, 5, 7, 8, 12, 15, 20 (N = 7, impair)

Rang de la médiane : 7+1{2} = 4. La 4e valeur est 8.

Me = 8


3. Indicateurs de dispersion

Étendue

Étendue : L'étendue est la différence entre la plus grande et la plus petite valeur :

[formule]

Quartiles

Quartiles :

  • Q_1 (1er quartile) : au moins 25% des valeurs sont Q_1
  • Q_3 (3e quartile) : au moins 75% des valeurs sont Q_3
  • Écart interquartile : Q_3 - Q_1 (contient 50% des valeurs centrales)

Écart type

Variance et écart type : La variance mesure la dispersion des valeurs autour de la moyenne :

[formule]

L'écart type est la racine carrée de la variance :

[formule]

Interprétation :

  • Un petit écart type → les valeurs sont concentrées autour de la moyenne
  • Un grand écart type → les valeurs sont dispersées

4. Diagrammes statistiques

Types de représentations :

  • Diagramme en bâtons : pour les caractères discrets

  • Histogramme : pour les données regroupées en classes

  • Diagramme circulaire : pour les fréquences (angles proportionnels)

  • Diagramme en boîte : résume x_{}, Q_1, Me, Q_3, x_{}


À retenir

Résumé :

  1. x = n_i x_i{N} (moyenne pondérée)

  2. La médiane partage la série ordonnée en deux moitiés

  3. L'étendue = max - min

  4. L'écart type mesure la dispersion autour de la moyenne

  5. Plus est petit, plus les données sont regroupées