Info

Définition du théorème de Bayes et exemples

Définition du théorème de Bayes et exemples

Le théorème de Bayes est une équation mathématique utilisée en probabilité et en statistique pour calculer la probabilité conditionnelle. En d'autres termes, il est utilisé pour calculer la probabilité d'un événement en fonction de son association avec un autre événement. Le théorème est également appelé loi de Bayes ou règle de Bayes.

Histoire

Le théorème de Bayes doit son nom au révérend Thomas Bayes, ministre et statisticien anglais, qui a formulé une équation pour son travail "Essai sur la résolution d'un problème dans la doctrine de la chance". Après la mort de Bayes, le manuscrit a été édité et corrigé par Richard Price avant sa publication en 1763. Il serait plus juste de faire référence au théorème en tant que règle de Bayes-Price, la contribution de Price étant significative. La formulation moderne de l'équation a été conçue par le mathématicien français Pierre-Simon Laplace en 1774, qui n'était pas au courant du travail de Bayes. Laplace est reconnu comme le mathématicien responsable du développement de la probabilité bayésienne.

Formule pour le théorème de Bayes

Il existe plusieurs façons d'écrire la formule du théorème de Bayes. La forme la plus courante est:

P (A ∣ B) = P (B ∣ A) P (A) / P (B)

où A et B sont deux événements et P (B) 0

P (A ∣ B) est la probabilité conditionnelle que l'événement A se produise étant donné que B est vrai.

P (B ∣ A) est la probabilité conditionnelle que l'événement B se produise, étant donné que A est vrai.

P (A) et P (B) sont les probabilités que A et B se produisent indépendamment l'une de l'autre (probabilité marginale).

Exemple

Vous voudrez peut-être déterminer la probabilité d'une polyarthrite rhumatoïde si vous avez le rhume des foins. Dans cet exemple, "avoir le rhume des foins" est le test de la polyarthrite rhumatoïde (l'événement).

  • UNE serait l'événement "patient a la polyarthrite rhumatoïde." Les données indiquent que 10% des patients dans une clinique souffrent de ce type d'arthrite. P (A) = 0,10
  • B est le test "patient a le rhume des foins." Les données indiquent que 5% des patients dans une clinique ont le rhume des foins. P (B) = 0,05
  • Les dossiers de la clinique montrent également que 7% des patients atteints de polyarthrite rhumatoïde ont le rhume des foins. En d'autres termes, la probabilité qu'un patient soit atteint du rhume des foins, étant donné qu'elle souffre de polyarthrite rhumatoïde, est de 7%. B ∣ A = 0,07

Brancher ces valeurs dans le théorème:

P (A ∣ B) = (0,07 * 0,10) / (0,05) = 0,14

Donc, si un patient a le rhume des foins, ses chances de souffrir de polyarthrite rhumatoïde sont de 14%. Il est peu probable qu'un patient présentant un rhume des foins soit atteint de polyarthrite rhumatoïde.

Sensibilité et Spécificité

Le théorème de Bayes démontre avec élégance l'effet des faux positifs et des faux négatifs dans les tests médicaux.

  • Sensibilité est le vrai taux positif. C'est une mesure de la proportion de positifs identifiés correctement. Par exemple, dans un test de grossesse, il s'agirait du pourcentage de femmes dont le test de grossesse était positif et qui étaient enceintes. Un test sensible manque rarement un "positif".
  • Spécificité est le vrai taux négatif. Il mesure la proportion de négatifs correctement identifiés. Par exemple, dans un test de grossesse, il s'agirait du pourcentage de femmes dont le test de grossesse était négatif et qui n'étaient pas enceintes. Un test spécifique enregistre rarement un faux positif.

Un test parfait serait sensible et spécifique à 100%. En réalité, les tests ont une erreur minimale appelée taux d'erreur de Bayes.

Par exemple, considérons un test de dépistage de drogue sensible à 99% et spécifique à 99%. Si un demi pour cent (0,5%) des personnes consomment une drogue, quelle est la probabilité qu'une personne aléatoire ayant subi un test positif soit réellement un utilisateur?

P (A ∣ B) = P (B ∣ A) P (A) / P (B)

peut-être réécrit comme:

P (utilisateur ∣ +) = P (+ ∣ utilisateur) P (utilisateur) / P (+)

P (utilisateur ∣ +) = P (+ ∣ utilisateur) P (utilisateur) / P (+ ∣ utilisateur) P (utilisateur) + P (+ ∣ non-utilisateur) P (non-utilisateur)

P (utilisateur ∣ +) = (0,99 * 0,005) / (0,99 * 0,005 + 0,01 * 0,995)

P (utilisateur ∣ +) ≈ 33,2%

Seulement 33% du temps environ une personne au hasard avec un test positif serait effectivement un toxicomane. La conclusion est que même si une personne a un résultat positif à un médicament, il est plus probable qu'elle le fasse ne pas utiliser le médicament que ce qu'ils font. En d'autres termes, le nombre de faux positifs est supérieur au nombre de vrais positifs.

Dans des situations réelles, un compromis est généralement fait entre sensibilité et spécificité, selon qu'il est plus important de ne pas rater un résultat positif ou s'il est préférable de ne pas qualifier un résultat négatif de positif.