4  Probabilidades

4.1 Probabilidades elementales: Las mates

La probabilidad de un suceso es, básicamente, un número entre 0 y 1 (o, si lo preferís, un porcentaje entre 0% y 100%) que mide la expectativa de que se dé este suceso.

En este curso vamos a definir la probabilidad de un suceso como la proporción (la fracción, el porcentaje) de sujetos de una población (o a veces de una muestra, dependerá del contexto) en los que se da el suceso. Esta proporción mide la “probabilidad” de que si escogemos al azar un sujeto de la población, se dé en él el suceso.

Ejemplo:

La probabilidad de que al lanzar una moneda al aire salga cara es la proporción de la población de lanzamientos de esta moneda en los que sale cara.

En casos MUY sencillos, cuando todos los resultados posibles tienen la misma probabilidad, esta proporción coincide con la fracción de veces en que se da este suceso en el conjunto de resultados posibles y por lo tanto se puede calcular con la famosa regla de Laplace: \[ \text{Probabilidad}=\frac{\text{Casos favorables}}{\text{Casos posibles}} \]

Por ejemplo:

  • La probabilidad de que salga cara al lanzar una moneda equilibrada al aire es 1/2 (casos favorables, 1; casos posibles, 2; los dos resultados tienen la misma probabilidad por definición de moneda equilibrada).

  • Pero la probabilidad de que un hijo sea varón no es 1/2, aunque solo haya dos sexos cromosómicos Es la proporción de hijos varones en el total de todos los hijos, que se estima en alrededor del 51.22%.

  • O más exageradamente, la probabilidad de que una mujer de entre 17 y 27 años sea miope no es 1/2, aunque solo haya dos resultados posibles: ser miope y no serlo. Esta probabilidad es la proporción de miopes en la población formada por todas las mujeres de esa franja de edad, que, en España en 2018, se estimaba en un 65.4% según un informe de la Asociación Visión y Vida.

4.1.1 Álgebra de conjuntos

Vamos a repasar muy rápidamente las notaciones y las propiedades de las operaciones de conjuntos, para poder usar este lenguaje en lo que sigue.

Sean \(A\) y \(B\) subconjuntos (en el contexto de la teoría de probabilidades, se los llama sucesos) de un conjunto \(\Omega\) (nuestra población o, en el lenguaje de la teoría de probabilidades, el espacio muestral).

  • \(A\cup B\) es la unión de \(A\) y \(B\): el conjunto formado por los elementos de \(\Omega\) que pertenecen a \(A\) o a \(B\) (o a ambos).

  • \(A \cap B\) es la intersección de \(A\) y \(B\): el conjunto formado por los elementos que pertenecen simultáneamente a \(A\) y a \(B\).

    Corresponde a la conjunción del lenguaje natural.

  • \(A^c\) es el complementario de \(A\): el conjunto formado por los elementos de \(\Omega\) que no pertenecen a \(A\).

    Corresponde a la negación del lenguaje natural.

  • \(A-B=A \cap B^c\) es la diferencia\(A\) menos \(B\)”: el conjunto formado por los elementos de \(A\) que no pertenecen a \(B\).

    Por lo tanto, \(A^c=\Omega-A\).

  • Diremos que \(A\) y \(B\) son disjuntos, o incompatibles, cuando \(A\cap B=\emptyset\), donde \(\emptyset\) es el conjunto vacío, el conjunto que no tiene elementos.

  • Diremos que \(A\) está contenido, o incluido, en \(B\), y lo denotaremos por \(A\subseteq B\), cuando todo elemento de \(A\) pertenece a \(B\). Para recalcar que \(A\) está estrictamente contenido en \(B\) (que está contenido en \(B\) pero no es igual a \(B\)) usaremos \(A\subsetneq B\).

Ejemplo:

Consideremos la población \(\Omega\) formada por los estudiantes de una clase, y sean \(A\) el subconjunto formado por la mujeres de esa clase y \(B\) el subconjunto formado por los estudiantes de esa clase que llevan gafas.

  • \(A\cup B\) es el conjunto formado por las mujeres de la clase o los estudiantes de la clase que llevan gafas (o ambos).

  • \(A \cap B\) es el conjunto formado por las mujeres de la clase que llevan gafas.

  • \(A^c\) es el conjunto formado por los hombres de la clase.

  • \(A-B\) es el conjunto formado por las mujeres de la clase que no llevan gafas.

  • \(A\subseteq B\) significa que todas las mujeres de la clase llevan gafas.

4.1.2 Algunas fórmulas básicas

Hemos definido la probabilidad \(P(A)\) de un subconjunto (suceso) \(A\) de una población (espacio muestral) \(\Omega\) como la fracción de los sujetos de \(\Omega\) que pertenecen a \(A\). A partir de esta definición se deducen, las propiedades siguientes:

  1. Para todo suceso \(A\), \(0\leqslant P(A)\leqslant 1\).

Un subconjunto \(A\) de \(\Omega\) no puede representar ni una fracción negativa ni una fracción mayor que 1 de los sujetos de \(\Omega\).

  1. \(P(\Omega)=1\) y \(P(\emptyset)=0\) (recordad que \(\emptyset\) es el conjunto vacío).

  2. Si \(A\) y \(B\) son dos sucesos disjuntos, entonces \(P(A\cup B)=P(A)+P(B)\).

Si no hay ningún sujeto que pertenezca simultáneamente a \(A\) y a \(B\), entonces el número de sujetos que pertenecen a \(A\) o a \(B\) es la suma de los que pertenecen a \(A\) y de los que pertenecen a \(B\). Entonces, dividiendo por el número total de individuos de la población \(\Omega\) (su cardinal), obtenemos que la fracción de los sujetos que pertenecen a \(A\) o a \(B\) es la suma de las fracciones de los que pertenecen a \(A\) y de los que pertenecen a \(B\).

  1. Más en general, si \(A_1,A_2,\ldots,A_n\) son sucesos disjuntos dos a dos, entonces \[ P(A_1\cup A_2\cup \cdots \cup A_n)=P(A_1)+P(A_2)+\cdots +P(A_n). \]

  2. \(P(A-B)=P(A)-P(A\cap B)\).

  3. \(P(A^c)=1-P(A)\).

Es decir, la fracción de los sujetos que no pertenecen a \(A\) es 1 menos la fracción de los que sí pertenecen a \(A\).

  1. Si \(A\subseteq B\), entonces \(P(A)\leqslant P(B)\).

Si \(A\) está contenido en \(B\), la fracción de los sujetos que pertenecen a \(A\) es menor o igual que la de los que pertenecen a \(B\).

  1. \(P(A\cup B)=P(A)+P(B)-P(A \cap B)\).

Si queréis contar cuántos sujetos hay en \(A\cup B\), tenéis que añadir a los de \(A\) los de \(B-A\). Dividiendo por el total de la población para pasar a proporciones, esto nos dice que \[ P(A\cup B)=P(A)+P(B-A)=P(A)+P(B)-P(A \cap B) \] donde la segunda igualdad se debe a (5).

Por ejemplo, si en una población hay un 50% de mujeres y un 60% de miopes, y un 35% del total son mujeres miopes, las personas que son mujeres o miopes (recordad, o ambas cosas) forman un 75% de la población: al 50% de mujeres hay que sumarle el 25% de miopes que no son mujeres.

El número de sujetos que pertenecen a \(A\) pero no a \(B\) se obtiene restando del total de sujetos de \(A\) los que pertenecen simultáneamente a \(A\) y a \(B\), es decir, a \(A\cap B\). Dividiendo por el número total de individuos de la población, obtenemos la correspondiente igualdad de proporciones.

Ejemplo:

Supongamos que el 0.1% de los donantes de sangre dan positivo en el test de VIH, que el 1% dan positivo en el test de herpes simple (VHS) y que el 0.05% dan positivo en ambos tests.

¿Cuál es la probabilidad de que un donante escogido al azar dé positivo en al menos uno de los dos tests? ¿Y la de que un donante escogido al azar dé positivo en VHS pero no en VIH?

Vamos a poner nombres a los sucesos involucrados en estas preguntas:

  • \(A\): Dar positivo en VIH. Sabemos que \(P(A)=0.001\).

  • \(B\): Dar positivo en VHS. Sabemos que \(P(B)=0.01\).

  • \(A\cap B\): Dar positivo en los dos. Sabemos que \(P(A\cap B)=0.0005\).

  • \(A\cup B\): Dar positivo en al menos uno de los dos. Es lo que queremos calcular en la primera pregunta.

    Por la propiedad (8): \[ P(A \cup B) =P(A)+P(B)-P(A\cap B)=0.001+0.01-0.0005=0.0105 \] La probabilidad de que un donante escogido al azar dé positivo en al menos uno de los dos tests es del 1.05%.

  • \(B-A\): Dar positivo en VHS pero no en VIH. Es lo que queremos calcular en la segunda pregunta.

    Por la propiedad (5), \[ P(B-A)=P(B)-P(A\cap B)=0.01-0.0005=0.0095 \]

La probabilidad de que un donante escogido al azar dé positivo en VHS pero no en VIH es del 0.95%.

Otra manera de calcular estas probabilidades sin necesidad de recordar fórmulas sería:

  • Tomar como referencia una población de un tamaño concreto.

  • Calcular en esta población cuántos individuos pertenecen a \(A\cap B\) (dan positivo en ambos tests), cuántos a \(A-B\) (positivos en VIH pero no en VHS), cuántos a \(B-A\) (positivos en VHS pero no en VIH) y cuántos a \(A^c\cap B^c\) (negativo en ambos tests) y a partir de ahí calcular todo lo que queramos.

A este método se le suele llamar método de frecuencias naturales (“la cuenta de la vieja” no suena lo bastante científico), y así lo llamaremos nosotros. Pongámoslo en práctica en nuestro caso:

  1. Vamos a tomar una población de referencia de 10,000 donantes

    ¿Por qué este número? Veamos, fijaos en que la proporción de sujetos en \(A\cap B\) es del 0.05%, es decir, 0.0005, y para facilitar los cálculos nos gustaría que todos los números que nos salieran fueran enteros, para no liarnos con decimales. Como 0.0005·10000=5, parece que 10,000 nos va a valer.

  2. Los sujetos de \(A\) son el 0.1% de la población: 10

  3. Los sujetos de \(B\) son el 1% de la población: 100

  4. Los sujetos de \(A\cap B\) son el 0.05% de la población: 5

    En resumen: \[ \begin{array}{r|c|c|c} & A\ (\text{VIH}+) & A^c \ (\text{VIH}-) & \text{Total} \\ \hline B\ (\text{VHS}+) & 5 & & 100 \\ \hline B^c\ (\text{VHS}-) & & & 9900 \\ \hline \text{Total} & 10& 9990 & 10000 \\ \end{array} \]

  5. Entonces, los sujetos de \(A-B\) serán los de \(A\) menos los de \(A\cap B\): 5

  6. Y los sujetos de \(B-A\) serán los de \(B\) menos los de \(A\cap B\): 95

  7. Por ahora ya tenemos: 5 sujetos positivos en VIH y en VHS; 5 positivos en VIH y negativos en VHS; y 95 positivos en VHS y negativos en VIH. En total, 105 sujetos. El resto serán negativos tanto en VIH como en VHS.

    Por lo tanto, los sujetos de \(A^c\cap B^c\) serán 10000-105=9895.

Obtenemos la tabla de frecuencias siguiente: \[ \begin{array}{r|c|c|c} & A\ (\text{VIH}+) & A^c \ (\text{VIH}-) & \text{Total} \\ \hline B\ (\text{VHS}+) & 5 & 95 & 100 \\ \hline B^c\ (\text{VHS}-) & 5 & 9895 & 9900 \\ \hline \text{Total} & 10& 9990 & 10000 \\ \end{array} \]

Y ahora, cambiando “probabilidad” por “proporción”, ya podemos calcular lo que queramos.

  • ¿Cuál es la proporción de sujetos que dan positivo en algún test?

    Hay 105 sujetos en la tabla que dan positivo en algún test: los 10 positivos en VIH y los 95 positivos en VHS y negativos en VIH. Por lo tanto, su proporción es de 105/10000=0.0105.

  • ¿Cuál es la proporción de sujetos que dan positivo en VHS pero no en VIH?

    Hay 95 sujetos en la tabla que dan positivo en VHS y negativo en VIH, por lo que su proporción es de 95/10000=0.0095.

4.1.3 Odds

En algunos contextos, las probabilidades se presentan en forma de odds. La traducción más común en castellano es momios, pero se usan otras: posibilidades, oportunidades, ocasiones… Aquí usaremos odds.

Las odds de un suceso \(A\) son \[ \text{Odds}(A)=\frac{P(A)}{P(A^c)}=\frac{P(A)}{1-P(A)} \] y por lo tanto nos dicen cuántas veces es más probable \(A\) que “no \(A\)”.

Si \(\text{Odds}(A)=q\), significa que por cada vez que ocurre “no \(A\)”, ocurre \(q\) veces \(A\). Por ejemplo, si las odds de suspender una asignatura son 2/3, significa que:

Importante

A veces, que unas odds valgan \(a/b\) se expresa diciendo que son \(a\!:\!b\), y se lee “\(a\) a \(b\)”. Por ejemplo, las odds de suspender anteriores son 2:3, es decir, 2 a 3.

Ejemplo:

Algunos ejemplos de odds a partir de probabilidades:

Como son un cociente de dos probabilidades, las odds de un suceso son siempre mayores o iguales que 0 y pueden tomar cualquier valor entre 0 e \(\infty\), ambos incluidos.

Ejercicio Si lanzamos un dado equilibrado de 10 caras numeradas del 0 al 9:

  1. ¿Qué valen las odds de sacar un 3?

  2. ¿Qué valen las odds de sacar un múltiplo de 3?

Si sabemos las odds de \(A\), podemos calcular la probabilidad \(P(A)\): \[ \begin{array}{rl} \text{Odds}(A)=\dfrac{P(A)}{1-P(A)}\!\!\!\! & \Longrightarrow \text{Odds}(A)-\text{Odds}(A)P(A)=P(A)\\ & \Longrightarrow P(A)=\dfrac{\text{Odds}(A)}{1+\text{Odds}(A)} \end{array} \]

Por lo tanto, dos sucesos tienen la misma probabilidad si, y solo si, tienen las mismas odds.

Observad que la función \[ x\mapsto\frac{x}{1+x} \] es creciente en \(x\):

Gráfica de la curva y=x/(1+x).

Como esta es la función que transforma \(\text{Odds}(A)\) en \(P(A)\), deducimos que \[ \text{Odds}(A)>\text{Odds}(B)\Longleftrightarrow P(A)>P(B) \]

\(A\) es más probable que \(B\) si, y solo si, las odds de \(A\) son mayores que las de \(B\).

Como veremos, la manera correcta de presentar los resultados en los estudios de casos y controles es en forma de odds ratios. La odds ratio (razón de momios, de oportunidades…) de dos sucesos \(A\) y \(B\) es el cociente de sus odds: \[ \text{OR}(A,B)=\frac{\text{Odds}(A)}{\text{Odds}(B)} \] Es decir, \(\text{OR}(A,B)\) nos dice cuántas veces son mayores (o menores) las odds de \(A\) que las de \(B\). Su valor es difícil de interpretar en términos de probabilidades excepto por lo que refiere a su relación con 1:

Pero, por ejemplo \[ \text{OR}(A,B)=2 \Longleftrightarrow \text{Odds}(A)= 2\cdot \text{Odds}(B) \hspace{1.2ex} \not\hspace{-1.2ex}\Longleftrightarrow P(A)= 2\cdot P(B) \]

Ejemplo:

En un estudio de casos y controles (Y. Nobel et al, Gastroenterology 159 (2020), pp. 373-375) se afirma que

“la presencia de síntomas gastrointestinales se asoció a un incremento del 70% en el riesgo de dar positivo [en el test de COVID-19]: odds ratio, 1.7.”

¿Qué significa esto? Que la odds ratio valga 1.7 significa que las odds de dar positivo en COVID-19 si se tienen síntomas gastrointestinales son 1.7 veces las de dar positivo si no se tienen síntomas gastrointestinales, es decir un 70% mayores. Pero fijaos que estamos hablando de las odds, no del riesgo entendido en el sentido de probabilidad. No tiene por qué ser cierto que la probabilidad de dar positivo en COVID-19 si se tienen síntomas gastrointestinales sea un 70% mayor que si no se tienen síntomas gastrointestinales.

De hecho, en este estudio concreto se obtuvo la tabla de frecuencias siguiente (SG abrevia “síntomas gastrointestinales”) \[ \begin{array}{r|c|c|c} & \text{COVID-19 } + & \text{COVID-19 } - & \text{Total}\\ \hline \text{SG Sí} & 97& 63 & 160\\\hline \text{SG No} & 181 & 175 & 356\\\hline \text{Total} & 278 & 238 & 316 \end{array} \]

Por lo tanto, la proporción de COVID-19 positivos entre los que tuvieron síntomas gastrointestinales fue 97/160=0.606 y la proporción de COVID-19 positivos entre los que no tuvieron síntomas gastrointestinales fue 181/356=0.508. Como 0.606/0.508=1.19, la primera es un 19% mayor que la segunda, no un 70% mayor.

Veamos las odds. Las de ser COVID-19 positivo entre los que tuvieron síntomas gastrointestinales son \[ \frac{97/160}{63/160}=1.54 \] Las de ser COVID-19 positivo entre los que no tuvieron síntomas gastrointestinales son \[ \frac{181/356}{175/356}=1.03 \] La odds ratio es, entonces 1.54/1.03=1.495.

¿Pero no habíamos dicho que la odds ratio les había salido 1.7?

Bueno, sí, lo que les da 1.7 es la odds ratio ajustada, ORa, una odds ratio que se obtiene al descontar la influencia de confundidores en el desenlace.

4.1.4 Probabilidad condicionada

Dados dos sucesos \(A\) y \(B\), con \(P(A)>0\), la probabilidad de \(B\) condicionada a \(A\) es \[ P(B|A)=\frac{P(A\cap B)}{P(A)} \]

Este valor representa la fracción de los sujetos de \(A\) que pertenecen a \(B\); es decir, es la probabilidad de que si ocurre \(A\), entonces también ocurra \(B\).

Ejemplo:

Supongamos que en una clase de 20 hombres y 30 mujeres, 15 hombres y 18 mujeres llevan gafas. La tabla de frecuencias correspondiente es

\[ \begin{array}{r|c|c|c} & \text{Gafas} & \text{No gafas} & \text{Total}\\ \hline \text{Mujeres} & 18 &12 & 30\\ \hline \text{Hombres} & 15 & 5 & 20 \\ \hline \text{Total} & 33 & 17 & 50 \\ \end{array} \]

  1. ¿Cuál es la probabilidad de que un estudiante sea mujer?

Como hay 30 mujeres de un total de 50 estudiantes, esta probabilidad es 30/50=0.6

  1. ¿Cuál es la probabilidad de que un estudiante lleve gafas?

Como hay 33 estudiantes con gafas de un total de 50 estudiantes, esta probabilidad es 33/50=0.66

  1. ¿Cuál es la probabilidad de que un estudiante sea mujer y lleve gafas?

Como la probabilidad de ser mujer es 0.6 y la probabilidad de llevar gafas es 0.66, la probabilidad de ser mujer y llevar gafas es el producto: 0.6·0.66=0.396.

Precaución

¡No! En general, la probabilidad de la intersección NO es el producto de las probabilidades.

Calculémosla bien. Como hay 18 mujeres que llevan gafas de un total de 50 estudiantes, esta probabilidad es 18/50=0.36

  1. ¿Cuál es la probabilidad de que una mujer lleve gafas?

Como hay 18 mujeres que llevan gafas de un total de 30 mujeres, esta probabilidad es 18/30=0.6. Fijaos que este valor es igual a \[ P(\text{gafas}|\text{mujer})=\frac{P(\text{mujer y gafas})}{P(\text{mujer})}=\frac{18/50}{30/50}=\frac{18}{30} \]

  1. Escogemos un estudiante al azar. ¿Cuál es la probabilidad de que si es mujer, entonces lleve gafas?

Es la misma pregunta que la anterior, por lo que la respuesta es la misma: 18/30=0.6.

  1. ¿Cuál es la probabilidad de que un estudiante que lleve gafas sea mujer?

Como hay 18 mujeres que llevan gafas de un total de 33 estudiantes que lleven gafas, esta probabilidad es 18/33=0.545. Fijaos, de nuevo, que este valor es igual a \[ P(\text{mujer}|\text{gafas})=\frac{P(\text{mujer y gafas})}{P(\text{gafas})}=\frac{18/50}{33/50}=\frac{18}{33} \]

Importante

No confundáis:

  • \(P(B)\): La probabilidad de que un individuo de la población global \(\Omega\) pertenezca a \(B\).

    Por ejemplo, si \(B\) es “llevar gafas”, \(P(B)\) es la probabilidad de que una persona lleve gafas. La población en la que calculamos probabilidades es la de todas las personas.

  • \(P(B|A)\): Probabilidad de que un individuo de \(A\) pertenezca a \(B\).

    Por ejemplo, si además \(A\) es “ser mujer”, \(P(B|A)\) es la probabilidad de que una mujer lleve gafas. La población en la que calculamos probabilidades es la de las mujeres.

  • \(P(A|B)\): Probabilidad de que un individuo de \(B\) pertenezca a \(A\).

    Por ejemplo, con las notaciones anteriores, \(P(A|B)\) es la probabilidad de que una persona que lleva gafas sea mujer. La población en la que calculamos probabilidades es la de las personas que llevan gafas.

  • \(P(B\cap A)\): Probabilidad de que un individuo de la población global pertenezca simultáneamente a \(A\) y a \(B\).

    Por ejemplo, con las notaciones anteriores, \(P(A\cap B)\) es la probabilidad de que una persona sea mujer y lleve gafas. La población en la que calculamos probabilidades vuelve a ser todas las personas.

Ejercicio:

En una universidad, los alumnos se distribuyen de la manera siguiente por tipos de estudios y sexos: \[ \begin{array}{r|c|c|c|c|c} \text{Estudio} & \text{Ciencias} & \text{Derecho} & \text{Educación} & \text{Otros} & \text{Total}\\ \hline \text{Hombres} & 1200 & 1300 & 300 & 2000 & 4800\\ \hline \text{Mujeres} & 1400 & 600 & 1600 & 1600 & 5200\\ \hline \text{Total} & 2600 &1900 & 1900 & 3600 & 10000\\ \end{array} \]

Si escojo un estudiante al azar, ¿cuál es la probabilidad de que:

  1. Sea hombre o mujer?
  2. Sea mujer?
  3. Estudie Ciencias?
  4. No estudie Ciencias?
  5. Sea mujer o estudie Derecho?
  6. Sea mujer y estudie Derecho?
  7. Sea mujer pero no estudie Derecho?
  8. Si estudia Educación, sea mujer?
  9. Si es mujer, estudie Educación?
  10. Si es mujer, no estudie Educación?
  11. Si no es mujer, estudie Educación?
Importante

La probabilidad condicionada a \(A\), \(P(\ldots|A)\), es una probabilidad “de verdad”, simplemente hemos cambiado la población de \(\Omega\) a \(A\). Es decir, en vez de trabajar con proporciones de la población total \(\Omega\), trabajamos con proporciones de la subpoblación definida por los sujetos de \(A\). Por lo tanto, \(P(\ldots |A)\) satisface todas las propiedades de las probabilidades. Por ejemplo, se cumple que:

  • \(P(B^c|A)=1-P(B|A)\)
  • \(P(C-B|A)=P(C|A)-P(B\cap C|A)\)
  • \(P(B\cup C|A)=P(B|A)+P(C|A)-P(B\cap C|A)\)
Ejemplo:

Supongamos que un 15% de los adultos son hipertensos, un 25% de los adultos creen que son hipertensos, y un 9% de los adultos son hipertensos y creen que lo son.

Pongamos nombres a los sucesos involucrados en estas preguntas:

En la primera pregunta nos piden la probabilidad de \(A\) condicionada a \(B\): \[ P(A|B)=\frac{P(A\cap B)}{P(B)}=\dfrac{0.09}{0.25}=0.36 \] Si un adulto cree ser hipertenso, tiene una probabilidad del 36% de serlo.

En la segunda pregunta nos piden la probabilidad de \(B\) condicionada a \(A\): \[ P(B|A) =\frac{P(A\cap B)}{P(A)}=\frac{0.09}{0.15}=0.6 \] Si un adulto es hipertenso, tiene una probabilidad del 60% de creer que lo es.

Y en la tercera pregunta nos piden la probabilidad de \(A\) condicionada a \(B^c\): \[ P(A|B^c) =\frac{P(A\cap B^c)}{P(B^c)}=\frac{P(A)-P(A\cap B)}{1-P(B)}=\frac{0.06}{0.75}=0.08 \] Si un adulto no cree ser hipertenso, tiene una probabilidad del 8% de ser hipertenso.

Ejemplo:

Un test para el VIH da positivo en un 99% de los casos en los que el virus está presente. En una población con el 0.5% de infectados por VIH:

La respuesta a la primera pregunta nos la dan en el enunciado: “el test da positivo en un 99% de los casos en los que el virus está presente”, por lo que “la probabilidad de que si hacemos el test a un infectado, dé positivo” es 0.99.

Pero la segunda pregunta no pide lo mismo que la primera, sino la probabilidad de que pasen dos cosas: que hagamos el test a un infectado Y que dé positivo. Es la probabilidad de una intersección.

Pongamos nombres:

La probabilidad de que, al hacer el test a un individuo al azar, dé positivo y esté infectado es del 0.495%.

Ejemplo:

Un amigo cardiólogo nos contó una vez que la mitad de los enfermos que acudían a su consulta por supuestos problemas de corazón tenían en realidad estrés, y dos tercios, depresión. Nosotros vamos a suponer además que sólo un 15% de estos enfermos no sufrían ninguna de estas dos condiciones.

Esta vez vamos a usar primero el método de frecuencias naturales. Vamos a suponer que tenemos una población de referencia de 300 personas que acuden al cardiólogo.

Ya tenemos la tabla de frecuencias completa: \[ \begin{array}{r|c|c|c} & \text{Depresión} & \text{No depresión} & \text{Total}\\ \hline \text{Estrés} & 95 & 55 & 150 \\ \hline \text{No estrés} & 105 & 45 & 150 \\ \hline \text{Total} & 200 & 100 & 300\\ \end{array} \] Y ahora:

¿Cómo lo hubiéramos resuelto usando las propiedades de probabilidades? Pongamos nombres:

Con estas notaciones, en la primera pregunta nos piden \[ P(E|D)=\dfrac{P(E\cap D)}{P(D)} \] Para calcularla, necesitamos saber \(P(E\cap D)\), que vale: \[ P(E\cap D)=P(E)P(D)=0.5\cdot \frac{2}{3}=0.3333 \]

Precaución

¡Que no! ¡Que la probabilidad de la intersección NO es en general igual al producto de las probabilidades!

Habrá que currárselo algo más:

  1. \(P((E\cup D)^c)=P(E^c\cap D^c)=0.15\), por lo tanto \(P(E\cup D)=1-P((E\cup D)^c)=0.85\)

  2. \(P(E\cap D)=P(E)+P(D)-P(E\cup D)=0.5+2/3-0.85=0.31667\)

Ahora sí, finalmente, \(P(E|D)=P(E\cap D)/P(D)=0.31667/0.66667=0.475\)

En la segunda pregunta nos piden \[ P(E^c|D^c)=\dfrac{P(E^c\cap D^c)}{P(D^c)} \] y esta probabilidad ya la podemos calcular, porque sabemos que \(P(E^c\cap D^c)=0.15\) y \(P(D^c)=1-P(D)=1-2/3=1/3\), por lo que \(P(E^c|D^c)=P(E^c\cap D^c)/P(D^c)=0.15/(1/3)=0.45\).

4.1.5 Sucesos independientes

Dos sucesos \(A\) y \(B\) (ambos de probabilidad no 0) son independientes cuando \(P(B|A)=P(B)\). Es decir:

En esta definición los papeles de \(A\) y \(B\) son intercambiables, como muestra el resultado siguiente que, además, da una caracterización alternativa muy importante.

Dados dos sucesos \(A,B\), ambos de probabilidad ni 0 ni 1, las cinco condiciones siguientes son equivalentes:

  1. \(P(A \cap B)=P(A)\cdot P(B)\)
  2. \(P(B|A)=P(B)\)
  3. \(P(A|B)=P(A)\)
  4. \(P(B|A)=P(B|A^c)\)
  5. \(P(A|B)=P(A|B^c)\)

En efecto, fijaos en que, por la definición de probabilidad condicionada, \[ \begin{array}{l} \mathbf{P(B|A)=P(B)} \Longleftrightarrow \dfrac{P(A\cap B)}{P(A)}=P(B)\\ \qquad \Longleftrightarrow \mathbf{P(A\cap B)=P(A)\cdot P(B)} \\ \qquad \Longleftrightarrow \dfrac{P(A\cap B)}{P(B)}=P(A)\\ \qquad \Longleftrightarrow \mathbf{P(A|B)=P(A)} \end{array} \] Esto demuestra (a) \(\Leftrightarrow\) (b) \(\Leftrightarrow\) (c). Por otro lado \[ \begin{array}{l} \mathbf{P(B|A)=P(B|A^c)}\Longleftrightarrow \dfrac{P(A\cap B)}{P(A)}=\dfrac{P(A^c\cap B)}{P(A^c)}\\ \qquad \Longleftrightarrow P(A\cap B)P(A^c)=P(A^c\cap B)P(A)=P(B-A)P(A)\\ \qquad \Longleftrightarrow P(A\cap B)(1-P(A))=(P(B)-P(A\cap B))P(A)\\ \qquad \Longleftrightarrow P(A\cap B)-P(A\cap B)P(A)=P(B)P(A)-P(A\cap B)P(A)\\ \qquad \Longleftrightarrow \mathbf{P(A\cap B)=P(B)P(A)} \end{array} \] lo que demuestra (a) \(\Leftrightarrow\) (d). La equivalencia (a) \(\Leftrightarrow\) (e) se demuestra intercambiando los papeles de \(A\) y \(B\) en la equivalencia (a) \(\Leftrightarrow\) (d).

Es decir, las afirmaciones siguientes son equivalentes entre si, y definen la independencia de \(A\) y \(B\):

A partir del resultado anterior, se deduce fácilmente que las condiciones siguientes son equivalentes:

  1. \(A\) y \(B\) son independientes.
  2. \(A^c\) y \(B\) son independientes.
  3. \(A\) y \(B^c\) son independientes.
  4. \(A^c\) y \(B^c\) son independientes.

Es razonable. Decir que la probabilidad de que pase \(A\) no depende de si pasa \(B\) o no (\(A\) y \(B\) independientes), es lo mismo que decir que la probabilidad de que pase \(A\) no depende de que no pase \(B\) o sí pase (\(A\) y \(B^c\) independientes). Y si la probabilidad de que pase \(A\) no depende de que pase \(B\) o no, la probabilidad de que no pase \(A\) tampoco depende de que pase \(B\) o no.

Nota

Hemos dado la definición de independencia para sucesos de probabilidad no nula. Para cubrir todos los casos, un suceso de probabilidad 0 se considera siempre independiente de cualquier otro. Es razonable, porque si \(P(A)=0\), entonces, como \(A\cap B\subseteq A\), también \(P(A\cap B)=0\) para cualquier suceso \(B\), y se cumple entonces que \(P(A\cap B)=P(A)P(B)\).

Importante

La fórmula \(P(A\cap B)=P(A)P(B)\) es válida cuando \(A\) y \(B\) son independientes.

Más en general, dada una familia de sucesos \(A_1,\ldots,A_n\), diremos que son independientes cuando, para todo subconjunto de índices \(\{i_1,\ldots,i_k\}\subseteq \{1,2,\ldots,n\}\) se tiene que \[ P(A_{i_1}\cap\cdots \cap A_{i_k})=P(A_{i_1})\cdots P(A_{i_k}) \]

Ejemplo:

En los EEUU, un 33% de la población es hipertensa. Supongamos que escogemos al azar un estadounidense y le hacemos lanzar una moneda equilibrada. ¿Cuál es la probabilidad de que sea hipertenso y saque cara?

Consideremos los sucesos:

La probabilidad que queremos calcular es \(P(A\cap B)\): la probabilidad de que el sujeto sea hipertenso y saque cara.

Naturalmente, ser hipertenso y sacar cara son sucesos independientes: la probabilidad de que salga cara no tiene nada que ver con la tensión arterial de quien la lanza. Por lo tanto \[ P(A\cap B)=P(A)\cdot P(B)=0.33\cdot 0.5=0.165 \] La probabilidad de que el estadounidense escogido al azar sea hipertenso y saque cara es del 16.5%.

Ejemplo:

En los EEUU, el 36.5% de la población adulta es obesa, el 33% es hipertensa, y el 49.5% es obesa o hipertensa (datos del Centro de Control de Enfermedades, CDC, 2014). ¿Son la obesidad y la hipertensión sucesos independientes?

Consideremos los sucesos:

Queremos saber si es verdad que \(P(A\cap B)=P(A)P(B)\). Para ello tenemos que calcular \(P(A\cap B)\) a partir de los datos que tenemos: \[ P(A \cap B) =P(A)+P(B)-P(A\cup B)=0.365+0.33-0.495=0.2 \]

Por otro lado, \(P(A)\cdot P(B)= 0.365\cdot 0.33=0.12\)

Por lo tanto, son sucesos dependientes. De hecho, \(P(B|A)=0.2/0.365=0.55> 0.33=P(B)\): la probabilidad de ser hipertenso entre los obesos es mayor que en el global de la población estadounidense.

Ejemplo:

Un cierto test da positivo en un 10% de los individuos que no tienen una determinada enfermedad. Si a un individuo sano se le realizan dos tests independientes, ¿cuál es la probabilidad de que ambos den positivo? ¿Y la de que alguno dé positivo?

Consideremos los sucesos:

Sabemos que \(P(A_1)=P(A_2)=0.1\) y que, como las dos repeticiones del test son independientes, los sucesos \(A_1\) y \(A_2\) son independientes. Entonces:

Ejercicio:

Tenemos dos tests, A y B, para una determinada enfermedad. Sobre los individuos que tienen dicha enfermedad, el test A da positivo en un 95% de las ocasiones y el test B da positivo en un 90% de las ocasiones. Si a un individuo enfermo se le realizan los dos tests de manera independiente, ¿cuál es la probabilidad de que alguno dé positivo?

4.1.6 Odds condicionadas y odds ratios relativas

En las odds y las odds ratios también podemos condicionar a una subpoblación definida por un suceso.

Ejemplo:

Volvamos a la situación del ejemplo del amigo cardiólogo. Si, entre los pacientes de nuestro amigo cardiólogo, llamamos \(E\) al suceso “Tener estrés” y \(D\) al suceso “Tener depresión”, habíamos calculado que \(P(E|D)=0.475\) y \(P(E^c|D^c)=0.45\). Si habéis hecho el ejercicio que hemos propuesto tras el ejemplo habréis calculado \(P(D|E)=0.6334\) y \(P(D^c|E^c)=0.3\).

Entonces:

Entre los pacientes con depresión, la probabilidad de tener estrés es 0.905 veces la de no tenerlo, es decir, un 9.5% menor.

Importante

Por favor, no digáis que “la probabilidad de tener estrés es 0.905 veces mayor que la de no tenerlo”.

Importante

Las odds de tener estrés entre los que tienen depresión son 0.74 veces las de tener estrés entre los que no tienen depresión y las odds de tener depresión entre los que tienen estrés son 0.74 veces las de tener depresión entre los que no tienen estrés. Pero no es verdad que la probabilidad de tener estrés entre los que tienen depresión sea 0.74 veces las de tener estrés entre los que no tienen depresión ni que la probabilidad de tener depresión entre los que tienen estrés sea 0.74 veces las de tener depresión entre los que no tienen estrés. Estos cocientes son \[ \frac{P(E|D)}{P(E|D^c)}=\frac{0.475}{0.55}=0.864,\quad \frac{P(D|E)}{P(D|E^c)}=\frac{0.6334}{0.7}=0.905 \]

La odds ratio de tener estrés relativa a tener depresión ha dado lo mismo que la odds ratio de tener depresión relativa a tener estrés. ¿Casualidad? No.

Dados dos sucesos \(A\) y \(B\), \(\text{OR}(A|B)=\text{OR}(B|A)\).

Para comprobarlo, basta ir operando astutamente: \[ \begin{array}{l} \text{OR}(B|A)\!\!\!\!\! &= \dfrac{\text{Odds}(B|A)}{\text{Odds}(B|A^c)} = \dfrac{P(B|A)/P(B^c|A)}{P(B|A^c)/P(B^c|A^c)}\\ &=\dfrac{P(B|A)\cdot P(B^c|A^c)}{P(B^c|A)\cdot P(B|A^c)}\\ & =\dfrac{P(B|A)\cdot P(B^c|A^c)\cdot P(A)\cdot P(A^c)}{P(B^c|A)\cdot P(B|A^c)\cdot P(A)\cdot P(A^c)}\\ & =\dfrac{P(B|A)\cdot P(A)\cdot P(B^c|A^c)\cdot P(A^c)}{P(B^c|A)\cdot P(A)\cdot P(B|A^c)\cdot P(A^c)}\\ & =\dfrac{P(B\cap A)\cdot P(B^c\cap A^c)}{P(B^c\cap A)\cdot P(B\cap A^c)}\\ \text{OR}(A|B) & = \dfrac{\text{Odds}(A|B)}{\text{Odds}(A|B^c)} =\dfrac{P(A|B)/P(A^c|B)}{P(A|B^c)/P(A^c|B^c)}\\ & =\dfrac{P(A|B)\cdot P(A^c|B)}{P(A|B^c)\cdot P(A^c|B)}\\ & =\dfrac{P(A|B)\cdot P(A^c|B^c)\cdot P(B)\cdot P(B^c)}{P(A|B^c)\cdot P(A^c|B)\cdot P(B)\cdot P(B^c)}\\ & =\dfrac{P(A|B)\cdot P(B)\cdot P(A^c|B^c)\cdot P(B^c)}{P(A^c|B)\cdot P(B)\cdot P(A|B^c)\cdot P(B^c)}\\ & =\dfrac{P(B\cap A)\cdot P(B^c\cap A^c)}{P(B\cap A^c)\cdot P(B^c\cap A)} \end{array} \] y tenemos que \(\text{OR}(A|B)=\text{OR}(B|A)\).

4.1.7 El teorema de la probabilidad total

Ejemplo:

Tenemos una población clasificada en dos subpoblaciones, A y B; por ejemplo, expuestos y no expuestos a un factor de riesgo. La subpoblación A representa un 20% de la población y la B el 80% restante. Un 50% de la subpoblación A y un 5% de la subpoblación B presentan una cierta característica X; por ejemplo, desarrollan una enfermedad.

¿Qué proporción de la población presenta dicha característica X?

Esta pregunta la podemos resolver fácilmente mediante el método de frecuencias naturales. Supongamos que nuestra población de referencia es de 1000 individuos. Entonces:

Obtenemos la tabla de frecuencias siguiente: \[ \begin{array}{r|c|c|c} & A & B & \text{Total}\\\hline X &100 & 40 &140\\ \hline \text{No }X &100 & 760 &860\\\hline \text{Total} &200 & 800 & 1000 \end{array} \] Entonces la fracción de los sujetos del total de la población con la característica X es 140/1000, un 14%.

¿Cómo podríamos usar las propiedades de las probabilidades para calcular este valor? Pues simplemente teniendo en cuenta que, como los sucesos \(A\) y \(B\), definidos por las correspondientes subpoblaciones, son disjuntos y recubren toda la población, tenemos que \[ X=(X\cap A)\cup (X\cap B),\quad (X\cap A)\cap (X\cap B)=\emptyset \] y por lo tanto \[ P(X)=P(X\cap A)+P(X\cap B)=P(X|A)P(A)+P(X|B)P(B). \]

Como \(P(A)=0.2\), \(P(B)=0.8\), \(P(X|A)=0.5\) y \(P(X|B)=0.05\)

\[ P(X)=0.5\cdot 0.2+0.05\cdot 0.8=0.14. \]

El ejemplo anterior es una aplicación del Teorema de la probabilidad total siguiente:

Si \(A\) y \(X\) son dos sucesos y \(0<P(A)<1\), \[ P(X)= P(X\cap A) +P(X\cap A^c)=P(A)\cdot P(X|A)+ P(A^c)\cdot P(X|A^c) \]

Algunos de vosotros habréis usado en Bachillerato un diagrama de árbol como el siguiente para representar este teorema:

Luego se calcula la probabilidad de cada “hoja” del árbol como el producto de las probabilidades del camino que llega a ella desde \(\Omega\) y se calcula como \(P(X)\) la suma de las probabilidades de las hojas cuyo suceso contiene “\(\cap X\)”.

En el ejemplo anterior, este diagrama es

Más en general, llamaremos una partición (o estratificación, clasificación) de una población \(\Omega\) a una familia (finita) de sucesos no vacíos \(A_1,\ldots,A_n\) tales que

  1. Recubren todo \(\Omega\): \(\Omega=A_1\cup\cdots\cup A_n\).
  2. Dos a dos son disjuntos: Para cada \(i,j\in\{1,\ldots,n\}\), si \(i\neq j\), se tiene que \(A_i\cap A_j=\emptyset\).

Teorema: Si \(A_1\), …, \(A_n\) es una partición de la población, entonces, para todo suceso \(X\), \[ \begin{array}{rl} P(X)\!\!\!\! & = P(X\cap A_1) +\cdots+P(X\cap A_n)\\ & =P(A_1)\cdot P(X|A_1)+\cdots+ P(A_n)\cdot P(X|A_n) \end{array} \] En la suma de la derecha, si algún \(A_i\) tiene probabilidad \(P(A_i)=0\), hay que tomar \(P(A_i)P(X|A_i)=0\).

Ejemplo:

Un test para el VIH da positivo un 99% de los casos en los que el virus está presente y en un 5% de los casos en los que el virus no está presente. En una población con el 0.5% de infectados por VIH, ¿cuál es la probabilidad de que un individuo escogido al azar dé positivo?

En primer lugar vamos a usar el teorema de la probabilidad total para calcular esta probabilidad. Sean los sucesos:

Entonces \[ \begin{array}{rl} P(X) \!\!\!\! & =P(A)\cdot P(X|A)+P(A^c)\cdot P(X|A^c) \\ &=0.005\cdot 0.99+0.995\cdot 0.05=0.0547 \end{array} \]

Usemos ahora la técnica de frecuencias naturales. Tomemos una población de referencia de 100,000 individuos.

La tabla de frecuencias resultante es

\[ \begin{array}{l|c|c|c} & \text{Test }+ & \text{Test }- & \text{Total}\\ \hline \text{VIH} & 495 & 5 & 500\\ \hline \text{No VIH} & 4975& 94525 & 99500\\\hline \text{Total} &5470 & 94530& 100000 \end{array} \]

La proporción de personas en las que el test da positivo es 5470/100000=0.0547.

Ejemplo:

Un test diseñado para diagnosticar una determinada enfermedad da positivo el 94% de las veces en las que existe la enfermedad, y un 4% de las veces en las que no existe la enfermedad. A partir de un estudio masivo se estima que un 15% de la población da positivo en el test. ¿Cuál sería la prevalencia de la enfermedad?

Fijaos en que si llamamos \(E\) al suceso “Tener la enfermedad” y \(+\) al suceso “Dar positivo en el test”, los datos que tenemos son \(P(+)\), \(P(+|E)\) y \(P(+|E^c)\), y queremos saber \(P(E)\). Esta cuestión se resuelve fácilmente con el Teorema de la Probabilidad Total usando \(P(E)\) como incógnita: \[ \begin{array}{l} P(+)=P(+|E)P(E)+(P+|E^c)P(E^c) \\ \qquad\Longrightarrow 0.15 =0.94 P(E)+0.04(1-P(E)) \end{array} \] de donde podemos despejar \(P(E)\): \[ 0.11=0.9P(E)\Rightarrow P(E)=\frac{0.11}{0.9}=0.1222 \]

También podemos usar la técnica de frecuencias naturales. Tomamos una población de referencia de 100,000 individuos. De ellos, un 15%, 15,000, dan positivo en el test, y los 85,000 restantes, negativo.

Llamemos \(x\) al número de enfermos, de manera que \(100000-x\) es el número de sanos. Sabemos que un 94% de los enfermos y un 4% de los sanos dan positivo. Por lo tanto, el número de enfermos positivos será igual a \(0.94x\) y el número de sanos \(0.04(100000-x)\). Completando la tabla para que las sumas de las filas sean correctas, obtenemos:

\[ \begin{array}{l|c|c|c} & \text{Test }+ & \text{Test }- & \text{Total}\\ \hline \text{Enfermo} & 0.94x & 0.06x & x \\ \hline \text{Sano} & 0.04(100000-x) & 0.96(100000-x) & 100000-x \\\hline \text{Total} & 15000 & 85000 & 100000 \end{array} \] Y ahora, por la primera columna, \[ \begin{array}{l} 15000=0.94x+0.04(100000-x)=0.9x+4000\\ \qquad\displaystyle \Longrightarrow x=\frac{11000}{0.9}=12222.22 \end{array} \] Por lo tanto, la prevalencia de la enfermedad es 12222.22/100000=0.1222: un 12.22%.

Ejercicio:

En el estudio de Rotterdam, un 21.7% de la cohorte inicial eran fumadores, un 43% habían sido fumadores pero ya no lo eran, y un 35.3% nunca habían fumado. En el primer grupo, un 26% desarrolló EPOC durante el seguimiento; entre el segundo grupo, un 13.6%, y en el tercero, un 6.4%.

  1. ¿Qué porcentaje de la cohorte desarrolló EPOC durante el seguimiento?

  2. Vamos a llamar “fumador” a un sujeto de la cohorte que o fumaba al principio del estudio, o había fumado anteriormente pero lo había dejado. ¿Qué porcentaje de estos fumadores desarrolló EPOC durante el seguimiento?

El teorema de la probabilidad total se usa de manera implícita en el cálculo de tasas ajustadas:

Por ejemplo, para obtener la tasa de mortalidad de una enfermedad en España ajustada a la composición en franjas de edad de la Unión Europea:

  1. Se obtiene la tasa de mortalidad de la enfermedad por franjas de edad en España.

  2. Se toma como composición en franjas de edad la de la Unión Europea.

  3. Se calcula la tasa de mortalidad de esa enfermedad en una población cuya composición en franjas de edad fuera la europea y en la que la tasa de mortalidad en cada franja de edad fuera la española.

Calculando estas tasas ajustadas para varios países de la UE, se pueden comparar sus tasas de mortalidad evitando el factor de confusión que podría representar la edad.

Ejemplo:

Una cierta enfermedad tiene en China una tasa de mortalidad del 0.1% entre los menores de 15 años, del 0.3% entre las personas de 15 a 64 años y de un 0.7% entre los mayores de 65 años. En la Unión Europea, un 15.5% de la población es menor de 15 años, un 65.4% tiene entre 15 y 64 años, y un 19.1% tiene 65 años o más. En China, estas proporciones son del 17.6%, 71.2% y 11.2%, respectivamente

¿Cuál es la tasa de mortalidad de esta enfermedad en China? ¿Cuál sería la tasa de mortalidad de esta enfermedad ajustada a la distribución de edades de la Unión Europea?

Pongamos nombres a los sucesos de interés:

Tenemos que \(P(M|C_1)=0.001\), \(P(M|C_2)=0.003\) y \(P(M|C_3)=0.007\).

Por el teorema de la probabilidad total, la tasa de mortalidad en China es \[ \begin{array}{rl} P(M)\!\!\!\! &=P(M|C_1)\cdot P(C_1)+P(M|C_2)\cdot P(C_2)+P(M|C_3)\cdot P(C_3)\\ & =0.001\cdot 0.176+0.003\cdot 0.712+0.007\cdot 0.112=0.0031 \end{array} \] O sea, del 0.31%.

La tasa de mortalidad de esta enfermedad ajustada a la distribución de edades de la UE, \(\mathit{TA}\), sería la probabilidad de \(M\) en una población en la que cada franja de edad tuviera probabilidad como en la UE, \(P(E_i)\), y la tasa de mortalidad en cada franja de edad fuera como la de China, \(P(M|C_i)\):

\[ \begin{array}{rl} \mathit{TA}\!\!\!\! & =P(M|C_1)\cdot P(E_1)+P(M|C_2)\cdot P(E_2)+P(M|C_3)\cdot P(E_3)\\ & =0.001\cdot 0.115+0.003\cdot 0.654+0.007\cdot 0.191=0.0034 \end{array} \] Es decir, esta tasa de mortalidad ajustada a la UE es del 0.34%. Es un poco mayor que la “real” en China. Es razonable: vemos que la tasa de mortalidad crece con la edad, y la UE tiene una menor proporción de niños y una mayor proporción de ancianos que China.

Ejercicio:

Supongamos que en los Emiratos Árabes, donde hay 256 hombres por cada 100 mujeres (en serio, datos del CIA Woldfact), un 1% de los hombres y un 2% de las mujeres sufren de una determinada enfermedad.

(b) ¿Cuál es la prevalencia de esta enfermedad en esta población?

(c) ¿Cuál es la prevalencia de esta enfermedad ajustada a una población con un 50% de cada sexo?

4.1.8 La regla de Bayes

A menudo conocemos las probabilidades condicionadas en una dirección pero las que nos interesa saber son precisamente las probabilidades condicionadas en la dirección opuesta. Por ejemplo:

Ejemplo:

Una mujer de 45 años da positivo en una mamografía anual de cribado. Si una mujer tiene cáncer de mama, la probabilidad de dar positivo en dicha prueba es del 99%, y si no lo tiene, esta probabilidad es aún del 9%. Os pide cuáles son sus probabilidades de tener cáncer de mama. ¿Qué contestaríais?

  1. Casi seguro, lo siento mucho.

  2. Del orden de un 50%.

  3. Del orden de un 10%.

  4. Tranquila, del orden de un 1%.

  5. Casi seguro de que no, del orden de un 0.1%.

  6. ¡Señora, yo estudié farmacia, no matemáticas!

Las preguntas de este tipo no pueden responderse sin alguna información extra. Por ejemplo, la probabilidad global de haber estado expuestos al riesgo o la prevalencia de la enfermedad en el ejemplo de los estudios de casos y controles, o la prevalencia de la enfermedad o la proporción global de positivos en el ejemplo del test diagnóstico.

Ejemplo:

Descartada la respuesta (f), buscáis por Internet y encontráis que, según el informe “Las cifras del cáncer en España 2020” de la Sociedad Española de Oncología Médica, la prevalencia del cáncer de mama en España en el período 2013-2018 fue de 130,000 casos de cáncer de mama entre los cerca de 24,000,000 de mujeres españolas. Eso os lleva a concluir que la prevalencia del cáncer de mama entre las mujeres españolas es de alrededor del 0.5%? ¿Qué responderíais a la pregunta de la mujer?

Este tipo de cuestiones se resuelve fácilmente por el método de frecuencias naturales.

Tomamos una población de referencia de 100,000 mujeres y calculamos la tabla de frecuencias en esta población correspondiente a la situación planteada.

La tabla de frecuencias resultante (donde “Test” indica la mamografía) es

\[ \begin{array}{l|c|c|c} & \text{Test }+ & \text{Test }- & \text{Total}\\ \hline \text{Cáncer Sí} & 900 & 100 & 1000\\ \hline \text{Cáncer No} & 9900& 89100 & 99000\\\hline \text{Total} &10800 & 89200& 100000 \end{array} \]

Entonces, la proporción de mujeres con cáncer de mama entre las que dan positivo en la mamografía es de 900/10800= 0.0833: un 8.33%.

La fórmula de Bayes siguiente permite resolver este tipo de problemas sin tener que recurrir a las frecuencias naturales.

Teorema de Bayes: Sean \(A\) y \(B\) dos sucesos. Si \(P(A),P(B)>0\), entonces \[ P(A|B) =\dfrac{P(A)\cdot P(B|A)}{P(A)\cdot P(B|A)+P(A^c)\cdot P(B|A^c)} \]

Esta fórmula se obtiene de \[ P(A|B) =\dfrac{P(A \cap B)}{P(B)} \] donde \[ P(A \cap B)=P(A)\cdot P(B|A) \] y, por el teorema de la probabilidad total, \[ P(B)=P(A)\cdot P(B|A)+P(A^c)\cdot P(B|A^c). \]

Con los números del ejemplo, si llamamos \(C\) al suceso “Tener cáncer de mama” y \(M\) al suceso “Dar positivo en la mamografía”, tenemos que \(P(C)=0.01\), \(P(M|C)=0.9\) y \(P(M|C^c)=0.1\), y por lo tanto \[ \begin{array}{rl} P(C|M)\!\!\!\! & =\dfrac{P(C)\cdot P(M|C)}{P(C)\cdot P(M|C)+P(C^c)\cdot P(M|C^c)}\\ & =\dfrac{0.01\cdot 0.9}{0.01\cdot 0.9+0.99\cdot 0.1}=0.0833 \end{array} \]

Más en general, si \(A_1,A_2,\ldots,A_n\) es una partición de \(\Omega\) y \(X\) un suceso y todos estos sucesos tienen probabilidad no nula, entonces \[ P(A_i|X) =\dfrac{P(A_i)\cdot P(X|A_i)}{P(A_1)\cdot P(X|A_1)+\cdots+P(A_n)\cdot P(X|A_n)} \]

Ejemplo:

Volvemos a la situación del ejemplo. Tenemos un test para el VIH que da positivo en un 99% de las personas en las que el virus está presente y en un 5% de las personas en las que el virus no está presente.

En una población con el 0.5% de infectados por VIH, ¿cuál es la probabilidad de que un individuo que haya dado positivo en el test esté infectado? ¿Y cuál es la probabilidad de que un individuo que haya dado negativo en el test no esté infectado?

Si llamamos \(A\) al suceso “Estar infectado por VIH” y \(B\) al suceso “Dar positivo en el test”, entonces:

Solo un 9% de los positivos están realmente infectados.

Un 99.995% de los negativos no están infectados.

Ejemplo:

Seguimos con el test para el VIH en una población con el 0.5% de infectados por VIH del ejemplo anterior. Supongamos ahora que a un individuo que da positivo le repetimos el test y vuelve a dar positivo. Si los resultados de las dos repeticiones del test son independientes ¿cuál es la probabilidad de que este individuo esté infectado?

Sea \(A\) al suceso “Estar infectado por VIH” y llamemos ahora \(B_2\) al suceso “Dar positivo en dos repeticiones independientes del test”. Si la probabilidad de que un infectado dé positivo en un test es 0.99, la probabilidad de que dé positivo en dos tests independientes será 0.99·0.99=0.9801 (el producto de la probabilidad de dar positivo en el primero por la probabilidad de dar positivo en el segundo). Y si la probabilidad de que un no infectado dé positivo en un test es 0.05, la probabilidad de que dé positivo en dos tests independientes será 0.05·0.05=0.0025.

Es decir, \(P(B_2|A)=0.9801\) y \(P(B_2|A^c)=0.0025\). Apliquemos de nuevo la fórmula de Bayes:

\[ \begin{array}{rl} P(A|B_2)\!\!\!\! & =\dfrac{P(B_2|A)\cdot P(A)}{P(B_2|A)\cdot P(A)+P(B_2|A^c)\cdot P(A^c)}\\ &=\dfrac{0.9801\cdot 0.005}{0.9801\cdot 0.005+0.0025\cdot 0.995}=0.6633 \end{array} \]

Con el segundo positivo, la probabilidad de infección ha subido del 9% al 66.33%.

Precaución

En la vida real, esta segunda probabilidad seguramente sea menor, porque algunos pacientes libres de VIH tienen moléculas en la sangre similares a los anticuerpos del VIH que detecta el test y que dan lugar a falsos positivos; por ejemplo, personas con enfermedades autoinmunes como el lupus. En estos pacientes la repeticiones de los tests no se pueden considerar independientes.

Ejercicio: Un test de detección precoz de una enfermedad da positivo el 97.5% de las veces en que existe la enfermedad, y un 12% de las veces en que no existe la enfermedad. La probabilidad de que un individuo escogido al azar tenga esta enfermedad es de un 2%.

  1. ¿Cuál es la probabilidad de que un individuo escogido al azar dé positivo en el test?

  2. ¿Cuál es la probabilidad de que un individuo escogido al azar tenga la enfermedad y dé positivo en el test?

  3. ¿Cuál es la probabilidad de que un individuo que dé positivo en el test, tenga esta enfermedad?

  4. El dar positivo en el test y el tener la enfermedad, ¿son sucesos independientes?