Arbres pondérés, formule des probabilités totales et formule de Bayes

Introduction

Les arbres pondérés sont un outil fondamental pour résoudre des problèmes de probabilités en plusieurs étapes. Associés à la formule des probabilités totales et à la formule de Bayes, ils permettent de traiter des situations complexes de manière systématique.

1. Arbres pondérés

1.1 Construction d'un arbre pondéré

Construire un arbre pondéré : Pour construire un arbre pondéré :

Identifier les étapes successives de l'expérience aléatoire
À chaque nœud, représenter tous les résultats possibles par des branches
Pondérer chaque branche par la probabilité correspondante (conditionnelle si ce n'est pas la première étape)
Vérifier les deux propriétés fondamentales

Exemple – Construction : Une entreprise fabrique des pièces. 60% sont produites par la machine M_1, 40% par M_2. La machine M_1 produit 3% de pièces défectueuses, M_2 en produit 5%.

Arbre pondéré :

Niveau 1 (choix de la machine) :
- Branche M_1 : P(M_1) = 0{,}6
- Branche M_2 : P(M_2) = 0{,}4
Niveau 2 (qualité de la pièce) :
- Sachant M_1 : P(D|M_1) = 0{,}03 et P(D|M_1) = 0{,}97
- Sachant M_2 : P(D|M_2) = 0{,}05 et P(D|M_2) = 0{,}95

1.2 Lecture d'un arbre pondéré

Lire un arbre pondéré : Pour lire les informations d'un arbre :

Première branche : les probabilités sont des probabilités simples (non conditionnelles)
Branches suivantes : les probabilités sont des probabilités conditionnelles sachant le chemin parcouru
Chaque chemin de la racine à une feuille correspond à une intersection d'événements

1.3 Propriétés fondamentales

Propriétés d'un arbre pondéré : Propriété 1 — Somme en un nœud :

La somme des probabilités des branches issues d'un même nœud vaut 1.

[formule]

Propriété 2 — Produit le long d'un chemin :

La probabilité associée à un chemin est le produit des probabilités inscrites sur chaque branche du chemin.

[formule]

Exemple – Calcul sur l'arbre : Reprenons l'exemple de l'entreprise. Les quatre chemins donnent :

P(M_1 D) = 0{,}6 0{,}03 = 0{,}018
P(M_1 D) = 0{,}6 0{,}97 = 0{,}582
P(M_2 D) = 0{,}4 0{,}05 = 0{,}020
P(M_2 D) = 0{,}4 0{,}95 = 0{,}380

Vérification : 0{,}018 + 0{,}582 + 0{,}020 + 0{,}380 = 1 ✓

Attention : La somme de toutes les probabilités des feuilles (extrémités des chemins) vaut toujours 1. Si ce n'est pas le cas, il y a une erreur dans l'arbre.

2. Formule des probabilités totales

2.1 Partition de l'univers

Partition : Des événements A_1, A_2, , A_n forment une partition de l'univers si :

Ils sont deux à deux incompatibles : A_i A_j = pour i j
Leur réunion couvre tout l'univers : A_1 A_2 A_n =

2.2 Énoncé de la formule

Formule des probabilités totales : Si A_1, A_2, , A_n forment une partition de avec P(A_i) > 0 pour tout i, alors pour tout événement B :

[formule]

Cas particulier {A, A} : Pour la partition {A, A} :

[formule]

C'est le cas le plus fréquent en exercice. Il revient à sommer les probabilités des chemins menant à B dans l'arbre.

Exemple – Probabilités totales : Reprenons l'entreprise. Quelle est la probabilité qu'une pièce prise au hasard soit défectueuse ?

{M_1, M_2} est une partition de l'univers.

[formule] [formule]

La probabilité qu'une pièce soit défectueuse est 0{,}038 soit 3,8%.

Lien avec l'arbre : La formule des probabilités totales revient à additionner les probabilités de tous les chemins qui aboutissent à l'événement B. C'est la troisième règle de l'arbre.

3. Formule de Bayes

3.1 Le problème de l'inversion

Problème de l'inversion : On connaît souvent P(B|A) (probabilité de l'effet sachant la cause), mais on cherche P(A|B) (probabilité de la cause sachant l'effet).

La formule de Bayes permet cette inversion de conditionnement.

3.2 Énoncé de la formule

Formule de Bayes : Si P(B) > 0 et P(A) > 0, alors :

[formule]

En combinant avec la formule des probabilités totales :

[formule]

Méthode – Appliquer la formule de Bayes :

Identifier ce qu'on connaît : P(A), P(B|A), P(B|A)
Calculer P(B) par la formule des probabilités totales
Appliquer la formule de Bayes : P(A|B) = P(A) P(B|A){P(B)}

Exemple – Inversion : Reprenons l'entreprise. Sachant qu'une pièce est défectueuse, quelle est la probabilité qu'elle vienne de M_1 ?

On cherche P(M_1|D).

[formule]

Environ 47,4% des pièces défectueuses proviennent de M_1.

Bien que M_1 produise plus de pièces (60%), elle a un meilleur taux de qualité (3% contre 5%), donc elle contribue à moins de la moitié des défauts.

4. Applications : tests médicaux

4.1 Vocabulaire des tests

Caractéristiques d'un test médical :

Sensibilité : P(T^+|M) — probabilité que le test soit positif sachant que la personne est malade
Spécificité : P(T^-|M) — probabilité que le test soit négatif sachant que la personne est saine
Valeur Prédictive Positive (VPP) : P(M|T^+) — probabilité d'être malade sachant que le test est positif
Valeur Prédictive Négative (VPN) : P(M|T^-) — probabilité d'être sain sachant que le test est négatif
Prévalence : P(M) — proportion de malades dans la population

Attention – Piège classique : La sensibilité P(T^+|M) et la VPP P(M|T^+) sont des probabilités différentes !

Un test peut être très sensible (95%) tout en ayant une faible VPP si la maladie est rare.

4.2 Exemple complet

Test médical – Calcul complet : Une maladie a une prévalence de 0,5% (P(M) = 0{,}005). Un test a une sensibilité de 99% et une spécificité de 98%.

Données :

P(M) = 0{,}005 et P(M) = 0{,}995
P(T^+|M) = 0{,}99 (sensibilité)
P(T^-|M) = 0{,}98, donc P(T^+|M) = 0{,}02 (faux positifs)

Calcul de P(T^+) (probabilités totales) :

[formule] [formule]

Calcul de la VPP (Bayes) :

[formule]

Interprétation : Seulement environ 19,9% des personnes testées positives sont réellement malades. Malgré un test performant (99% de sensibilité, 98% de spécificité), la rareté de la maladie fait que la majorité des positifs sont des faux positifs.

Calcul de la VPN :

P(T^-) = 1 - P(T^+) = 1 - 0{,}02485 = 0{,}97515

[formule]

La VPN est quasiment 1 : un test négatif est très fiable.

Retenir : Plus la prévalence est faible, plus la VPP est faible (beaucoup de faux positifs) et plus la VPN est élevée (un test négatif est fiable).

5. Erreurs classiques à éviter

Erreur n°1 – Confondre P(A|B) et P(B|A) : P(A|B) et P(B|A) sont en général différentes !

Exemple : P(test positif | malade) = 0{,}99 ne signifie pas que P(malade | test positif) = 0{,}99.

C'est l'erreur la plus fréquente, parfois appelée erreur du procureur ou confusion de l'inverse.

Erreur n°2 – Oublier de vérifier les propriétés de l'arbre : Toujours vérifier :

Que la somme des branches en chaque nœud vaut 1
Que la somme de toutes les feuilles vaut 1

Ces vérifications permettent de détecter les erreurs de calcul.

Erreur n°3 – Se tromper dans l'identification des données : Bien distinguer :

La sensibilité P(T^+|M) de la VPP P(M|T^+)
La spécificité P(T^-|M) de la VPN P(M|T^-)

En exercice, commencer toujours par poser les notations et identifier les données.

À retenir

Résumé :

Un arbre pondéré modélise des expériences en plusieurs étapes. La somme en chaque nœud vaut 1, et le produit le long d'un chemin donne la probabilité de l'intersection.
La formule des probabilités totales avec la partition {A, A} est : P(B) = P(A),P(B|A) + P(A),P(B|A).
La formule de Bayes permet d'inverser le conditionnement : P(A|B) = P(A) P(B|A){P(B)}.
Pour un test médical : sensibilité = P(T^+|M), spécificité = P(T^-|M), VPP = P(M|T^+), VPN = P(M|T^-).
Ne jamais confondre P(A|B) et P(B|A) : utiliser la formule de Bayes pour passer de l'un à l'autre.

Arbres pondérés et formules

Arbres pondérés, formule des probabilités totales et formule de Bayes

Introduction

1. Arbres pondérés

1.1 Construction d'un arbre pondéré

1.2 Lecture d'un arbre pondéré

1.3 Propriétés fondamentales

2. Formule des probabilités totales

2.1 Partition de l'univers

2.2 Énoncé de la formule

3. Formule de Bayes

3.1 Le problème de l'inversion

3.2 Énoncé de la formule

4. Applications : tests médicaux

4.1 Vocabulaire des tests

4.2 Exemple complet

5. Erreurs classiques à éviter

À retenir