Actualizando lo que crees
En la leccion anterior, vimos como la informacion nueva cambia la probabilidad. La probabilidad condicional respondio la pregunta: "Dado que algo paso, cuales son las nuevas probabilidades?" El Teorema de Bayes va un paso mas alla al darnos una forma sistematica de actualizar nuestras creencias cuando obtenemos nueva evidencia.
Nombrado en honor al reverendo Thomas Bayes, un ministro y matematico del siglo XVIII, este teorema es una de las ideas mas poderosas de toda la estadistica. Y a pesar de su reputacion, la idea central es sorprendentemente sencilla.
La gran idea en lenguaje cotidiano
Aqui esta el Teorema de Bayes en terminos de todos los dias:
Tu creencia actualizada = Tu creencia original × Que tan bien encaja la evidencia / Que tan comun es la evidencia en general
O mas precisamente:
- Empieza con lo que creias antes (la probabilidad "previa" o "prior").
- Mira la nueva evidencia y preguntate: "Que tan probable seria esta evidencia si mi creencia fuera cierta?"
- Tambien considera: "Que tan probable es esta evidencia en general, sea mi creencia cierta o no?"
- Combina todo para obtener tu creencia actualizada (la probabilidad "posterior").
La formula
Para quienes les gustan las formulas, aqui esta:
P(A | B) = P(B | A) × P(A) / P(B)
Donde:
- P(A | B) = la probabilidad de A despues de ver la evidencia B (lo que quieres encontrar)
- P(B | A) = la probabilidad de ver la evidencia B si A es verdad
- P(A) = la probabilidad de A antes de cualquier evidencia nueva (tu creencia previa)
- P(B) = la probabilidad general de ver la evidencia B
No te preocupes si la formula se siente abstracta ahora. Los ejemplos de abajo la haran concreta.
Ejemplo: pruebas medicas, otra vez
Este es el ejemplo clasico del Teorema de Bayes, y retoma exactamente donde terminamos en la leccion de probabilidad condicional.
Una enfermedad afecta a 1 de cada 200 personas (0.5%). Una prueba de sangre detecta la enfermedad el 95% de las veces cuando alguien la tiene (esto se llama "sensibilidad"). Pero el 3% de las personas sanas tambien reciben un falso positivo.
Tu prueba sale positiva. Cual es la probabilidad de que realmente tengas la enfermedad?
Paso 1: Escribe lo que sabes.
- P(enfermedad) = 0.005 (tu creencia previa: 1 de cada 200)
- P(positivo | enfermedad) = 0.95 (la prueba detecta al 95% de los enfermos)
- P(positivo | sin enfermedad) = 0.03 (3% de falsos positivos)
Paso 2: Encuentra P(positivo), la probabilidad general de dar positivo.
P(positivo) = P(positivo | enfermedad) × P(enfermedad) + P(positivo | sin enfermedad) × P(sin enfermedad)
= (0.95 × 0.005) + (0.03 × 0.995)
= 0.00475 + 0.02985 = 0.03460
Paso 3: Aplica el Teorema de Bayes.
P(enfermedad | positivo) = P(positivo | enfermedad) × P(enfermedad) / P(positivo)
= (0.95 × 0.005) / 0.03460
= 0.00475 / 0.03460 = 0.137, o cerca del 13.7%.
Incluso con una prueba 95% precisa, un resultado positivo significa solo un 14% de probabilidad de tener la enfermedad. La baja tasa base (solo el 0.5% de la gente esta enferma) hace que la mayoria de los positivos sean falsas alarmas.
Por eso los doctores frecuentemente piden una segunda prueba despues de un positivo. Si la segunda tambien sale positiva, la probabilidad sube dramaticamente, porque ahora tu "prior" es 13.7% en vez de 0.5%.
Pensar en terminos de personas (el enfoque de frecuencias naturales)
Muchas personas encuentran el Teorema de Bayes mas facil de entender usando numeros reales de personas en vez de probabilidades. Repitamos el ejemplo con 10,000 personas:
De 10,000 personas:
- 50 tienen la enfermedad (0.5% de 10,000).
- 9,950 NO tienen la enfermedad.
Probamos a las 50 personas enfermas: el 95% da positivo → 48 resultados positivos (redondeando).
Probamos a las 9,950 personas sanas: el 3% da positivo → 299 falsos positivos (redondeando).
Total de resultados positivos: 48 + 299 = 347.
De esos 347 positivos, solo 48 realmente tienen la enfermedad.
48 / 347 = 0.138, o cerca del 13.8%. (La pequena diferencia con 13.7% es solo redondeo.)
Este enfoque, contar personas reales, suele sentirse mas intuitivo que meter numeros en una formula.
Ejemplo: ese correo es spam?
Los filtros de spam son una de las aplicaciones mas comunes del Teorema de Bayes en el mundo real.
Supongamos que el 40% de los correos que recibes son spam. La palabra "GRATIS" aparece en el 80% de los correos de spam pero solo en el 5% de los correos legitimos. Llega un correo con la palabra "GRATIS". Cual es la probabilidad de que sea spam?
Lo que sabemos:
- P(spam) = 0.40
- P("GRATIS" | spam) = 0.80
- P("GRATIS" | no spam) = 0.05
P("GRATIS") en general:
= (0.80 × 0.40) + (0.05 × 0.60) = 0.32 + 0.03 = 0.35
Aplicamos Bayes:
P(spam | "GRATIS") = (0.80 × 0.40) / 0.35 = 0.32 / 0.35 = 0.914, o cerca del 91.4%.
Un correo con "GRATIS" tiene un 91% de probabilidad de ser spam. Los filtros de spam reales usan esta misma logica, pero con miles de palabras y caracteristicas en vez de solo una.
Ejemplo: alarmas de humo y la cocina
Tu alarma de humo se activa. Sabes por experiencia:
- Hay un incendio real en tu casa aproximadamente una vez cada 10 anos, o sea cerca de 0.03% de probabilidad en cualquier dia.
- Cuando SI hay incendio, la alarma suena el 99% de las veces.
- Cuando NO hay incendio, la alarma suena el 2% de las veces (el arroz quemado, el vapor de la ducha, etc.).
La alarma acaba de sonar. Hay un incendio?
P(incendio | alarma) = (0.99 × 0.0003) / [(0.99 × 0.0003) + (0.02 × 0.9997)]
= 0.000297 / (0.000297 + 0.019994) = 0.000297 / 0.020291 = 0.0146, o cerca del 1.5%.
Hay un 1.5% de probabilidad de un incendio real. Es bajo, pero no es cero. Igual deberias ir a revisar! El punto es que la mayoria de las alarmas son falsas alarmas, porque los incendios reales son muy raros comparados con el arroz quemado.
Por que la tasa base importa tanto
En todos estos ejemplos, un tema se repite: la tasa base, que tan comun es algo antes de cualquier evidencia, tiene un impacto enorme en la respuesta final.
Cuando lo que estas evaluando es raro (una enfermedad que afecta al 0.5% de la gente, o un incendio que pasa una vez por decada), incluso pruebas muy precisas producen mayormente falsos positivos. Esto no es una falla de la prueba; son matematicas basicas.
Al reves, cuando algo es comun (el spam es el 40% de los correos), incluso evidencia moderada puede empujar la probabilidad muy alto.
La leccion practica: siempre pregunta "que tan comun es esto para empezar?" antes de interpretar cualquier resultado de prueba, alerta o indicador.
El Teorema de Bayes como forma de pensar
Mas alla de las matematicas, el Teorema de Bayes ofrece una manera valiosa de pensar sobre el mundo:
- Empieza con lo que sabes. Antes de obtener nueva evidencia, cual es tu mejor estimacion? Eso es tu "prior".
- Pesa la nueva evidencia con cuidado. Que tan fuertemente apunta esta evidencia en una direccion u otra?
- Actualiza proporcionalmente. Evidencia fuerte deberia mover mucho tus creencias. Evidencia debil deberia moverlas poco.
- Estate dispuesto a actualizar de nuevo. Cada nueva pieza de evidencia es una oportunidad para refinar tus creencias.
Este enfoque, empezar con una creencia, reunir evidencia y actualizar, es la columna vertebral del pensamiento cientifico, el diagnostico medico, la investigacion criminal y la buena toma de decisiones en general.
Errores comunes
- Ignorar el prior. Una prueba "99% precisa" suena impresionante, pero si la condicion es una en un millon, la mayoria de los positivos seguiran siendo falsos.
- Confundir P(B | A) con P(A | B). La probabilidad de que la prueba sea positiva dado que estas enfermo NO es lo mismo que la probabilidad de estar enfermo dado un resultado positivo.
- No actualizar lo suficiente, o demasiado. Una pieza de evidencia debil no deberia voltear completamente una creencia fuerte. Pero evidencia muy fuerte deberia causar una gran actualizacion, incluso si contradice tu creencia inicial.
El Teorema de Bayes proporciona una forma logica de actualizar tus creencias cuando llega nueva evidencia. La formula P(A | B) = P(B | A) × P(A) / P(B) combina tu creencia previa con la fuerza de la evidencia para producir una probabilidad actualizada. La tasa base, que tan comun es algo para empezar, es crucial y frecuentemente ignorada. Ya sea que estes interpretando resultados medicos, filtrando spam o tomando decisiones cotidianas, pensar como Bayes significa empezar con lo que sabes, pesar la evidencia y actualizar tus creencias paso a paso.