La informacion nueva lo cambia todo
Imagina que estas a punto de salir de casa. Revisas la aplicacion del clima: hay un 30% de probabilidad de lluvia. Luego miras por la ventana y ves nubes oscuras acercandose. Eso cambia lo que piensas sobre la lluvia? Por supuesto que si.
Esa es la idea central de la probabilidad condicional: la probabilidad de que algo ocurra cambia cuando obtienes informacion nueva. La probabilidad de lluvia dado que ves nubes oscuras es diferente a la probabilidad general de lluvia en cualquier dia al azar.
La frase clave: "dado que"
En probabilidad, la frase "dado que" es la senal de que estas ante una probabilidad condicional. Significa que ya sabes que algo paso, y quieres averiguar como eso cambia la probabilidad de otra cosa.
Los matematicos lo escriben asi:
P(A | B) - se lee "la probabilidad de A, dado que B ha ocurrido".
La barra vertical "|" es simplemente una abreviatura de "dado que". No necesitas memorizar notacion complicada. Solo recuerda que la probabilidad condicional responde la pregunta: "Ahora que se esto, como cambian las probabilidades de aquello?"
Un ejemplo sencillo: canicas de colores
Un frasco tiene 4 canicas rojas y 6 azules (10 en total). Sacas una sin mirar. La probabilidad de sacar roja es 4/10 = 0.40.
Ahora supongamos que alguien mira y te dice: "La canica que sacaste NO es azul". Con esta informacion, sabes que la canica tiene que ser roja. La probabilidad de roja, dado "no azul", ahora es 1.00: segura.
Eso es probabilidad condicional en accion. La informacion nueva ("no azul") cambio completamente la probabilidad.
La mayoria de los casos reales no son tan extremos, pero el principio es el mismo. La informacion nueva reduce las posibilidades, lo que cambia las probabilidades.
La formula (en lenguaje sencillo)
La formula de la probabilidad condicional es:
P(A | B) = P(A y B) / P(B)
En palabras: para encontrar la probabilidad de A dado que B ocurrio, toma la probabilidad de que ambos A y B ocurran, y divide entre la probabilidad de que B ocurra.
Por que funciona? Cuando sabes que B ocurrio, ya no estas mirando todos los resultados posibles, solo los que incluyen a B. Dividir entre P(B) "hace zoom" en ese mundo mas pequeno.
En una escuela, el 60% de los estudiantes practica algun deporte. De todos los estudiantes, el 24% practica deporte y esta en el cuadro de honor. Cual es la probabilidad de que un estudiante este en el cuadro de honor, dado que practica deporte?
P(cuadro de honor | deporte) = P(cuadro de honor y deporte) / P(deporte)
= 0.24 / 0.60 = 0.40, o 40%.
Entonces, entre los estudiantes que practican deporte, el 40% tambien esta en el cuadro de honor.
Ejemplo real: pruebas medicas
Las pruebas medicas son una de las aplicaciones mas importantes, y mas malentendidas, de la probabilidad condicional. Aqui hay un escenario que confunde incluso a los doctores:
Una enfermedad afecta al 1% de la poblacion. Una prueba para esta enfermedad tiene un 90% de precision, lo que significa:
- Si TIENES la enfermedad, la prueba dice "positivo" correctamente el 90% de las veces.
- Si NO tienes la enfermedad, la prueba dice "negativo" correctamente el 90% de las veces (pero da un "positivo" falso el 10% de las veces).
Te haces la prueba y sale positiva. Cual es la probabilidad de que realmente tengas la enfermedad?
La mayoria de la gente adivina alrededor del 90%. La respuesta real es mucho menor. Vamos paso a paso con 1,000 personas imaginarias:
- 10 personas realmente tienen la enfermedad (1% de 1,000).
- De esas 10, la prueba identifica correctamente a 9 como positivas (90% de precision).
- 990 personas NO tienen la enfermedad.
- De esas 990, la prueba dice incorrectamente que 99 son positivas (10% de falsos positivos).
Total de resultados positivos: 9 + 99 = 108. Pero solo 9 de esos 108 realmente tienen la enfermedad.
P(enfermedad | prueba positiva) = 9 / 108 = 0.083, o cerca del 8.3%.
Incluso con una prueba "90% precisa", un resultado positivo significa solo un 8% de probabilidad de tener la enfermedad. Esto pasa porque la enfermedad es rara, asi que los falsos positivos del gran grupo sano superan a los verdaderos positivos del pequeno grupo enfermo.
Esto no es un defecto de la prueba: es como funciona la probabilidad condicional cuando la tasa base (que tan comun es la enfermedad) es baja. Entender esto puede ahorrarte un panico innecesario despues de una prueba de deteccion.
Ejemplo real: el clima
En una ciudad, llueve el 20% de los dias en general. En los dias que llueve, hay nubes por la manana el 85% de las veces. En los dias que NO llueve, hay nubes matutinas el 30% de las veces.
Te despiertas y ves nubes. Cual es la probabilidad de que llueva?
Usemos 100 dias como muestra:
- 20 dias tienen lluvia. De estos, 17 tuvieron nubes matutinas (85% de 20).
- 80 dias son secos. De estos, 24 tuvieron nubes matutinas (30% de 80).
Total de dias con nubes matutinas: 17 + 24 = 41.
De esas 41 mananas nubladas, 17 terminaron con lluvia.
P(lluvia | nubes) = 17 / 41 = 0.415, o cerca del 41.5%.
Las nubes subieron la probabilidad de lluvia del 20% al 42% aproximadamente. La informacion ayudo, pero las nubes solas no garantizan lluvia.
Eventos independientes vs. dependientes, revisados
En la leccion anterior, mencionamos que algunos eventos son independientes (uno no afecta al otro) y otros son dependientes (uno cambia la probabilidad del otro). La probabilidad condicional nos da una forma precisa de comprobarlo:
Si P(A | B) = P(A), entonces A y B son independientes.
En otras palabras, si saber que B ocurrio no cambia en nada la probabilidad de A, los eventos no se afectan mutuamente. Si saber B si cambia la probabilidad de A, son dependientes.
Supongamos que el 50% de los clientes de una cafeteria en Buenos Aires piden cafe. Entre los clientes que llegan antes de las 9 AM, el 75% pide cafe. Como P(cafe | antes de las 9) = 0.75 es diferente de P(cafe) = 0.50, la hora de llegada y pedir cafe son eventos dependientes. Los clientes madrugadores tienen mas probabilidad de querer un cafe.
Por que la probabilidad condicional nos confunde
El cerebro humano no esta naturalmente preparado para la probabilidad condicional. Tendemos a cometer dos errores comunes:
- Ignorar la tasa base. En el ejemplo de la prueba medica, la gente se enfoca en el 90% de precision y olvida que la enfermedad es rara. Lo rara que es la enfermedad es informacion crucial.
- Confundir la direccion. P(prueba positiva | enfermedad) NO es lo mismo que P(enfermedad | prueba positiva). La probabilidad de dar positivo si estas enfermo es 90%. Pero la probabilidad de estar enfermo si diste positivo es solo 8%. La direccion importa enormemente.
Este segundo error es tan comun que tiene nombre: la falacia del fiscal. Aparece en tribunales, consultorios medicos y titulares de noticias. Ser consciente de ella te convierte en un pensador mas agudo.
Consejos practicos para pensar en probabilidad condicional
- Usa numeros concretos. En vez de trabajar con porcentajes abstractos, imagina 100 o 1,000 personas. Hace que las cuentas sean mas claras y los resultados mas intuitivos.
- Preguntate "que cambio?". Cada vez que obtengas informacion nueva, preguntate: "Esto cambia las probabilidades?" Si la respuesta es si, estas en territorio de probabilidad condicional.
- Cuida la direccion. Siempre ten claro cual evento es el "dado". P(A | B) y P(B | A) suelen ser numeros muy diferentes.
La probabilidad condicional mide como cambia la probabilidad de un evento cuando obtienes informacion nueva. La formula P(A | B) = P(A y B) / P(B) captura esta idea, pero la leccion practica mas importante es: siempre considera la tasa base (que tan comun es algo para empezar) y nunca confundas P(A | B) con P(B | A). Usar numeros concretos, como imaginar 1,000 personas, hace que la probabilidad condicional sea mucho mas facil de entender y aplicar.