Arbres pondérés, formule des probabilités totales et formule de Bayes
Introduction
Les arbres pondérés sont un outil fondamental pour résoudre des problèmes de probabilités en plusieurs étapes. Associés à la formule des probabilités totales et à la formule de Bayes, ils permettent de traiter des situations complexes de manière systématique.
1. Arbres pondérés
1.1 Construction d'un arbre pondéré
Construire un arbre pondéré : Pour construire un arbre pondéré :
Identifier les étapes successives de l'expérience aléatoire
À chaque nœud, représenter tous les résultats possibles par des branches
Pondérer chaque branche par la probabilité correspondante (conditionnelle si ce n'est pas la première étape)
Vérifier les deux propriétés fondamentales
Exemple – Construction : Une entreprise fabrique des pièces. 60% sont produites par la machine M_1, 40% par M_2. La machine M_1 produit 3% de pièces défectueuses, M_2 en produit 5%.
Arbre pondéré :
Niveau 1 (choix de la machine) :
- Branche M_1 : P(M_1) = 0{,}6
- Branche M_2 : P(M_2) = 0{,}4
Niveau 2 (qualité de la pièce) :
- Sachant M_1 : P(D|M_1) = 0{,}03 et P(D|M_1) = 0{,}97
- Sachant M_2 : P(D|M_2) = 0{,}05 et P(D|M_2) = 0{,}95
1.2 Lecture d'un arbre pondéré
Lire un arbre pondéré : Pour lire les informations d'un arbre :
Première branche : les probabilités sont des probabilités simples (non conditionnelles)
Branches suivantes : les probabilités sont des probabilités conditionnelles sachant le chemin parcouru
Chaque chemin de la racine à une feuille correspond à une intersection d'événements
1.3 Propriétés fondamentales
Propriétés d'un arbre pondéré : Propriété 1 — Somme en un nœud :
La somme des probabilités des branches issues d'un même nœud vaut 1.
[formule]
Propriété 2 — Produit le long d'un chemin :
La probabilité associée à un chemin est le produit des probabilités inscrites sur chaque branche du chemin.
[formule]
Exemple – Calcul sur l'arbre : Reprenons l'exemple de l'entreprise. Les quatre chemins donnent :
- P(M_1 D) = 0{,}6 0{,}03 = 0{,}018
- P(M_1 D) = 0{,}6 0{,}97 = 0{,}582
- P(M_2 D) = 0{,}4 0{,}05 = 0{,}020
- P(M_2 D) = 0{,}4 0{,}95 = 0{,}380
Vérification : 0{,}018 + 0{,}582 + 0{,}020 + 0{,}380 = 1 ✓
Attention : La somme de toutes les probabilités des feuilles (extrémités des chemins) vaut toujours 1. Si ce n'est pas le cas, il y a une erreur dans l'arbre.
2. Formule des probabilités totales
2.1 Partition de l'univers
Partition : Des événements A_1, A_2, , A_n forment une partition de l'univers si :
- Ils sont deux à deux incompatibles : A_i A_j = pour i j
- Leur réunion couvre tout l'univers : A_1 A_2 A_n =
2.2 Énoncé de la formule
Formule des probabilités totales : Si A_1, A_2, , A_n forment une partition de avec P(A_i) > 0 pour tout i, alors pour tout événement B :
[formule]
Cas particulier {A, A} : Pour la partition {A, A} :
[formule]
C'est le cas le plus fréquent en exercice. Il revient à sommer les probabilités des chemins menant à B dans l'arbre.
Exemple – Probabilités totales : Reprenons l'entreprise. Quelle est la probabilité qu'une pièce prise au hasard soit défectueuse ?
{M_1, M_2} est une partition de l'univers.
[formule] [formule]
La probabilité qu'une pièce soit défectueuse est 0{,}038 soit 3,8%.
Lien avec l'arbre : La formule des probabilités totales revient à additionner les probabilités de tous les chemins qui aboutissent à l'événement B. C'est la troisième règle de l'arbre.
3. Formule de Bayes
3.1 Le problème de l'inversion
Problème de l'inversion : On connaît souvent P(B|A) (probabilité de l'effet sachant la cause), mais on cherche P(A|B) (probabilité de la cause sachant l'effet).
La formule de Bayes permet cette inversion de conditionnement.
3.2 Énoncé de la formule
Formule de Bayes : Si P(B) > 0 et P(A) > 0, alors :
[formule]
En combinant avec la formule des probabilités totales :
[formule]
Méthode – Appliquer la formule de Bayes :
Identifier ce qu'on connaît : P(A), P(B|A), P(B|A)
Calculer P(B) par la formule des probabilités totales
Appliquer la formule de Bayes : P(A|B) = P(A) P(B|A){P(B)}
Exemple – Inversion : Reprenons l'entreprise. Sachant qu'une pièce est défectueuse, quelle est la probabilité qu'elle vienne de M_1 ?
On cherche P(M_1|D).
[formule]
Environ 47,4% des pièces défectueuses proviennent de M_1.
Bien que M_1 produise plus de pièces (60%), elle a un meilleur taux de qualité (3% contre 5%), donc elle contribue à moins de la moitié des défauts.
4. Applications : tests médicaux
4.1 Vocabulaire des tests
Caractéristiques d'un test médical :
- Sensibilité : P(T^+|M) — probabilité que le test soit positif sachant que la personne est malade
- Spécificité : P(T^-|M) — probabilité que le test soit négatif sachant que la personne est saine
- Valeur Prédictive Positive (VPP) : P(M|T^+) — probabilité d'être malade sachant que le test est positif
- Valeur Prédictive Négative (VPN) : P(M|T^-) — probabilité d'être sain sachant que le test est négatif
- Prévalence : P(M) — proportion de malades dans la population
Attention – Piège classique : La sensibilité P(T^+|M) et la VPP P(M|T^+) sont des probabilités différentes !
Un test peut être très sensible (95%) tout en ayant une faible VPP si la maladie est rare.
4.2 Exemple complet
Test médical – Calcul complet : Une maladie a une prévalence de 0,5% (P(M) = 0{,}005). Un test a une sensibilité de 99% et une spécificité de 98%.
Données :
- P(M) = 0{,}005 et P(M) = 0{,}995
- P(T^+|M) = 0{,}99 (sensibilité)
- P(T^-|M) = 0{,}98, donc P(T^+|M) = 0{,}02 (faux positifs)
Calcul de P(T^+) (probabilités totales) :
[formule] [formule]
Calcul de la VPP (Bayes) :
[formule]
Interprétation : Seulement environ 19,9% des personnes testées positives sont réellement malades. Malgré un test performant (99% de sensibilité, 98% de spécificité), la rareté de la maladie fait que la majorité des positifs sont des faux positifs.
Calcul de la VPN :
P(T^-) = 1 - P(T^+) = 1 - 0{,}02485 = 0{,}97515
[formule]
La VPN est quasiment 1 : un test négatif est très fiable.
Retenir : Plus la prévalence est faible, plus la VPP est faible (beaucoup de faux positifs) et plus la VPN est élevée (un test négatif est fiable).
5. Erreurs classiques à éviter
Erreur n°1 – Confondre P(A|B) et P(B|A) : P(A|B) et P(B|A) sont en général différentes !
Exemple : P(test positif | malade) = 0{,}99 ne signifie pas que P(malade | test positif) = 0{,}99.
C'est l'erreur la plus fréquente, parfois appelée erreur du procureur ou confusion de l'inverse.
Erreur n°2 – Oublier de vérifier les propriétés de l'arbre : Toujours vérifier :
- Que la somme des branches en chaque nœud vaut 1
- Que la somme de toutes les feuilles vaut 1
Ces vérifications permettent de détecter les erreurs de calcul.
Erreur n°3 – Se tromper dans l'identification des données : Bien distinguer :
- La sensibilité P(T^+|M) de la VPP P(M|T^+)
- La spécificité P(T^-|M) de la VPN P(M|T^-)
En exercice, commencer toujours par poser les notations et identifier les données.
À retenir
Résumé :
Un arbre pondéré modélise des expériences en plusieurs étapes. La somme en chaque nœud vaut 1, et le produit le long d'un chemin donne la probabilité de l'intersection.
La formule des probabilités totales avec la partition {A, A} est : P(B) = P(A),P(B|A) + P(A),P(B|A).
La formule de Bayes permet d'inverser le conditionnement : P(A|B) = P(A) P(B|A){P(B)}.
Pour un test médical : sensibilité = P(T^+|M), spécificité = P(T^-|M), VPP = P(M|T^+), VPN = P(M|T^-).
Ne jamais confondre P(A|B) et P(B|A) : utiliser la formule de Bayes pour passer de l'un à l'autre.