Distribuciones de Probabilidad

Dificultad: Intermedio Tiempo de Lectura: 15 minutos

Patrones dentro de lo aleatorio

Lanza una moneda una vez y el resultado parece completamente aleatorio. Lanzala 1,000 veces y aparece un patron: aproximadamente la mitad seran cara. Tira un dado una vez y cualquier cosa puede pasar. Tiralo 10,000 veces y cada numero aparece mas o menos la misma cantidad de veces.

0 9 18 27 36 45 1 2 3 4 5 6 7 8 9

Una distribucion de probabilidad describe estos patrones. Te dice todos los resultados posibles de un evento aleatorio y que tan probable es cada uno. Piensa en ella como un mapa completo del azar: en vez de preguntar sobre un resultado especifico, puedes ver el panorama completo de una sola vez.

Que es una distribucion de probabilidad?

Una distribucion de probabilidad responde la pregunta: "Si repitiera este evento aleatorio muchas veces, como se verian los resultados?"

Puede mostrarse como una tabla, una formula o, lo mas comun, una grafica. La grafica muestra los resultados posibles en la parte inferior y sus probabilidades hacia arriba.

Ejemplo

Lanza dos dados y suma los numeros. Los totales posibles van de 2 a 12. Pero NO todos son igualmente probables:

  • Un total de 2 solo puede ocurrir de una forma: 1+1. Probabilidad: 1/36.
  • Un total de 7 puede ocurrir de seis formas: 1+6, 2+5, 3+4, 4+3, 5+2, 6+1. Probabilidad: 6/36.
  • Un total de 12 solo puede ocurrir de una forma: 6+6. Probabilidad: 1/36.

Si graficas esto, verias una forma triangular: baja en los extremos (2 y 12), mas alta en el centro (7). Esa grafica ES la distribucion de probabilidad para la suma de dos dados.

Dos tipos de distribuciones

Las distribuciones vienen en dos sabores, dependiendo del tipo de datos:

140 150 160 170 180 190 200

Distribuciones discretas

Tratan con resultados que se pueden contar. Cuantas caras en 10 lanzamientos de moneda? Cuantos clientes visitan una tienda hoy? Cuantos productos defectuosos hay en un envio? Los resultados son numeros especificos (0, 1, 2, 3...) con espacios entre ellos.

Distribuciones continuas

Tratan con resultados medibles que pueden tomar cualquier valor dentro de un rango. La estatura de una persona podria ser 170.0 cm, 170.1 cm, 170.15 cm - cualquier valor es posible. La temperatura, el tiempo y el peso son continuos. En vez de preguntar "cual es la probabilidad de medir exactamente 170.0 cm?" (que es esencialmente cero para datos continuos), preguntamos sobre rangos: "Cual es la probabilidad de medir entre 165 y 175 cm?"

La distribucion normal: la famosa campana de Gauss

De todas las distribuciones de probabilidad, la distribucion normal, tambien llamada campana de Gauss o curva de campana, es con mucho la mas importante. Cuando la graficas, forma una curva suave y simetrica que parece una campana: alta en el centro y disminuyendo por igual a ambos lados.

La campana de Gauss se define con solo dos numeros:

  • La media (promedio): Es el centro de la campana, el punto mas alto. Te dice donde se concentra la mayoria de los valores.
  • La desviacion estandar: Mide que tan dispersos estan los valores. Una desviacion estandar pequena significa una campana alta y estrecha (valores agrupados). Una desviacion estandar grande significa una campana baja y ancha (valores mas dispersos).
Ejemplo

Las mujeres adultas en Mexico tienen una estatura promedio de aproximadamente 156 cm, con una desviacion estandar de unos 7 cm. Esto significa:

  • La mayoria de las mujeres (alrededor del 68%) estan dentro de una desviacion estandar de la media: entre 149 y 163 cm.
  • Casi todas (alrededor del 95%) estan dentro de dos desviaciones estandar: entre 142 y 170 cm.
  • Medir menos de 135 cm o mas de 177 cm es muy raro: menos del 0.3% de la poblacion.

Por eso las tiendas de ropa tienen mas inventario en tallas intermedias y menos en los extremos. La campana de Gauss les dice donde esta la mayoria de sus clientas.

La regla 68-95-99.7

Uno de los datos mas utiles sobre la distribucion normal es la regla 68-95-99.7 (a veces llamada "regla empirica"). Para cualquier campana de Gauss:

17 1 16 2 17 3 16 4 17 5 17 6
  • El 68% de los valores caen dentro de 1 desviacion estandar de la media.
  • El 95% de los valores caen dentro de 2 desviaciones estandar de la media.
  • El 99.7% de los valores caen dentro de 3 desviaciones estandar de la media.

Esta regla te da una forma rapida de juzgar si un valor es tipico o inusual. Si algo cae a mas de 2 desviaciones estandar de la media, esta en el 5% exterior: bastante raro. A mas de 3 desviaciones estandar? Extremadamente raro.

Ejemplo

El examen CENEVAL en Mexico tiene un puntaje promedio de 1000 y una desviacion estandar de 100. Usando la regla 68-95-99.7:

  • Cerca del 68% de los estudiantes obtienen entre 900 y 1100.
  • Cerca del 95% obtienen entre 800 y 1200.
  • Cerca del 99.7% obtienen entre 700 y 1300.

Si alguien obtiene 1250, esta a mas de 2 desviaciones estandar por encima de la media, ubicandose en el 2-3% superior de los examinados. Ese solo numero te dice mucho, gracias a la campana de Gauss.

Por que la campana de Gauss esta en todas partes?

He aqui algo notable: la campana de Gauss aparece en un numero asombroso de situaciones del mundo real. Estaturas, presion arterial, calificaciones de examenes, errores de medicion, temperaturas diarias, el peso de las naranjas de un huerto... todo tiende a seguir una campana de Gauss. Por que?

La respuesta viene de un resultado matematico profundo llamado el Teorema del Limite Central. En terminos simples, dice:

Cuando sumas muchos efectos pequenos, independientes y aleatorios, el total tiende a formar una campana de Gauss, sin importar como se vean los efectos individuales.

La estatura de una persona, por ejemplo, esta influenciada por cientos de factores geneticos y ambientales, cada uno aportando un poco. Sumalos todos y obtienes una campana de Gauss. Las calificaciones de un examen dependen del conocimiento, la preparacion, la concentracion, la dificultad del examen y la suerte: muchos factores pequenos que se combinan en una distribucion con forma de campana.

Ejemplo

Una fabrica produce tornillos que deben medir exactamente 10 cm de largo. En realidad, cada tornillo es ligeramente diferente debido a pequenas variaciones en el metal, la maquina, la temperatura y otros factores. Si la fabrica mide 10,000 tornillos, las longitudes formaran una campana de Gauss centrada alrededor de 10 cm, con la mayoria muy cerca de esa meta y unos pocos atipicos a cada lado.

Los equipos de control de calidad usan esto: si un tornillo esta a mas de 3 desviaciones estandar de la media, probablemente algo salio mal con la maquina.

Otras distribuciones importantes

La campana de Gauss es la mas famosa, pero no es la unica distribucion. Aqui hay otras que podrias encontrar:

La distribucion uniforme

Todos los resultados son igualmente probables. Un dado justo tiene distribucion uniforme: cada cara tiene 1/6 de probabilidad. Si la graficas, obtienes una linea plana: sin picos ni valles.

La distribucion sesgada

No todo es simetrico. La distribucion del ingreso, por ejemplo, esta sesgada a la derecha: la mayoria de la gente gana una cantidad moderada, pero un numero pequeno gana enormemente mas. La "cola" se extiende mucho hacia la derecha. Por eso la mediana del ingreso suele ser una mejor medida que la media: los que ganan muchisimo jalan el promedio hacia arriba.

La distribucion binomial

Describe el numero de exitos en un numero fijo de pruebas de si/no. Cuantas caras en 20 lanzamientos de moneda? Cuantos de 100 clientes compraran algo? La distribucion binomial te da la probabilidad para cada conteo posible. Curiosamente, cuando el numero de pruebas es suficientemente grande, la distribucion binomial empieza a parecerse a una campana de Gauss.

Que nos dicen las distribuciones en la practica

Entender las distribuciones no es solo academico. Tienen valor directo y practico:

  • Detectar eventos inusuales. Si una medicion cae muy lejos de la distribucion esperada, algo notable puede estar pasando. Un tornillo demasiado largo, una calificacion muy alejada de la media, un precio de accion que se movio mucho mas de lo esperado: las distribuciones te ayudan a detectarlos.
  • Hacer predicciones. Si conoces una distribucion, puedes estimar la probabilidad de resultados futuros. Las companias de seguros usan distribuciones para fijar primas. Los servicios meteorologicos las usan para pronosticar temperaturas.
  • Establecer estandares. Los rangos "normales" de presion arterial, colesterol y otras medidas de salud se basan en la distribucion de valores en poblaciones sanas. Si tu medicion cae fuera del rango "normal", significa que estas en las colas de la distribucion.
Ejemplo

Un pediatra les dice a los padres que su hijo esta en el "percentil 75" de estatura. Esto significa que el nino es mas alto que el 75% de los ninos de su edad. El doctor lo sabe porque tiene la distribucion de estaturas para ninos, una campana de Gauss, y puede ver exactamente donde cae cada nino en ella.

Distribuciones y decisiones cotidianas

Interactuas con distribuciones de probabilidad mas seguido de lo que crees:

  • Cuando un paquete de MercadoLibre dice "entrega en 3-5 dias habiles", la empresa esta describiendo el centro de una distribucion. La mayoria de los paquetes llegan en esa ventana, pero algunos llegan antes y otros despues.
  • Cuando una receta dice "hornea por 25-30 minutos", el tiempo real depende de tu horno, el molde, la altitud: muchos factores pequenos. El rango refleja una distribucion de tiempos posibles.
  • Cuando tu viaje al trabajo "normalmente toma 20 minutos", ese es el pico de una distribucion. Algunos dias toma 15, otros 40, y la distribucion muestra que tan probable es cada tiempo de viaje.
Punto Clave

Una distribucion de probabilidad mapea todos los resultados posibles y sus probabilidades. La distribucion normal (campana de Gauss) es la mas comun, definida por su media y desviacion estandar. Gracias a la regla 68-95-99.7, puedes juzgar rapidamente si un valor es tipico o inusual. La campana de Gauss aparece en todas partes porque muchos resultados del mundo real son el resultado de combinar muchos factores pequenos y aleatorios. Entender las distribuciones te da un lente poderoso para interpretar datos, detectar valores atipicos y hacer predicciones informadas en la vida diaria.