Prueba de Hipotesis

Dificultad: Intermedio Tiempo de Lectura: 15 minutos

Tomando decisiones con datos

Todos los dias, la gente hace afirmaciones. Una nueva dieta "te ayuda a bajar de peso mas rapido". Un programa escolar "mejora las calificaciones de lectura". El producto de una empresa es "preferido por la mayoria de los clientes". Pero como sabes si estas afirmaciones son realmente ciertas, o simplemente resultados afortunados?

-3 -2 -1 0 1 2 3

La prueba de hipotesis es el metodo que usan los estadisticos para responder esta pregunta. Es una forma estructurada de usar datos para decidir si una afirmacion tiene evidencia real detras, o si los resultados podrian explicarse facilmente por el azar.

La analogia del tribunal

La forma mas facil de entender la prueba de hipotesis es pensar en como funciona un juicio.

En un juicio, el acusado se presume inocente hasta que se demuestre su culpabilidad. La fiscalia tiene que presentar suficiente evidencia para superar esa presuncion. Si la evidencia es lo bastante fuerte, el jurado dice "culpable". Si no, el acusado se declara "no culpable", lo que no necesariamente significa inocente, solo que no hubo suficiente prueba.

La prueba de hipotesis funciona de la misma manera:

  • Empezamos asumiendo que no pasa nada especial (la suposicion de "inocente").
  • Recopilamos datos (la "evidencia").
  • Si los datos son lo suficientemente convincentes, rechazamos la suposicion inicial.
  • Si no lo son, nos quedamos con ella, no porque la hayamos demostrado como cierta, sino porque no tenemos suficiente evidencia para decir lo contrario.

Hipotesis nula e hipotesis alternativa

Toda prueba de hipotesis empieza con dos afirmaciones en competencia:

Resultado 0.5 2.3 4.1 0

La Hipotesis Nula (H₀): Esta es la afirmacion de "no pasa nada". Dice que no hay efecto, no hay diferencia, no hay relacion. Es la suposicion por defecto, como "inocente hasta que se pruebe lo contrario".

La Hipotesis Alternativa (H₁): Esta es la afirmacion que realmente intentas apoyar. Dice que SI hay un efecto, una diferencia o una relacion.

Ejemplo

Un laboratorio farmaceutico desarrolla un nuevo medicamento para el dolor de cabeza y quiere saber si funciona mejor que una pastilla de azucar (placebo).

Hipotesis Nula (H₀): El nuevo medicamento no es mejor que el placebo. Cualquier diferencia en el alivio del dolor de cabeza se debe al azar.

Hipotesis Alternativa (H₁): El nuevo medicamento proporciona mas alivio del dolor de cabeza que el placebo.

Le dan el medicamento real a 100 pacientes y el placebo a otros 100. Despues de recopilar los resultados, usan una prueba estadistica para ver si el grupo del medicamento tuvo resultados significativamente mejores. Si la evidencia es lo bastante fuerte, rechazan la hipotesis nula y concluyen que el medicamento probablemente funciona.

Los pasos de una prueba de hipotesis

Este es el proceso basico, paso a paso:

  1. Establece tus hipotesis. Escribe la hipotesis nula (no pasa nada) y la hipotesis alternativa (algo esta pasando).
  2. Recopila datos. Ejecuta tu experimento o reune tus observaciones.
  3. Analiza los datos. Usa una prueba estadistica para calcular que tan probables serian tus resultados SI la hipotesis nula fuera cierta.
  4. Toma una decision. Si los resultados serian muy poco probables bajo la hipotesis nula, rechazala. De lo contrario, no la rechaces.

La frase "muy poco probables" generalmente significa menos de un 5% de probabilidad, pero abordaremos ese umbral con mas detalle en la leccion sobre valores p.

Dos tipos de errores

Sin importar que tan cuidadoso seas, siempre hay una posibilidad de llegar a la conclusion equivocada. Hay exactamente dos formas en que las cosas pueden salir mal:

-3 -2 -1 0 1 2 3

Error Tipo I (Falsa alarma)

Esto pasa cuando rechazas la hipotesis nula aunque en realidad sea cierta. Concluyes que algo esta pasando cuando en realidad no es asi.

En la analogia del tribunal, esto es condenar a un inocente.

Ejemplo: Concluyes que el nuevo medicamento funciona, pero en realidad no funciona. Los pacientes simplemente se sintieron mejor por coincidencia.

Error Tipo II (Descubrimiento perdido)

Esto pasa cuando no rechazas la hipotesis nula aunque la alternativa sea cierta. Te pierdes un efecto real.

En la analogia del tribunal, esto es dejar libre a un culpable.

Ejemplo: El medicamento realmente funciona, pero tu estudio no tenia suficientes pacientes para detectar la diferencia, asi que concluyes que no hay efecto.

Ejemplo

Piensa en un detector de humo. Un Error Tipo I es cuando la alarma suena pero no hay incendio: una falsa alarma. Molesto, pero no peligroso. Un Error Tipo II es cuando SI hay incendio pero la alarma no suena: una deteccion fallida. Eso es potencialmente catastrofico.

En estadistica, frecuentemente tienes que equilibrar estos dos riesgos. Hacer mas dificil activar una "deteccion" (exigir evidencia mas fuerte) reduce las falsas alarmas pero aumenta la posibilidad de perderte algo real.

Como reducir los errores?

Hay formas practicas de manejar ambos tipos de errores:

  • Muestras mas grandes hacen mas facil detectar efectos reales, reduciendo los errores Tipo II. Mas datos te dan una imagen mas clara.
  • Umbrales de evidencia mas estrictos (como exigir un 1% de probabilidad en vez de 5%) reducen los errores Tipo I, pero tambien dificultan la deteccion de efectos reales.
  • Mejor diseno de estudio - controlar otras variables, usar asignacion aleatoria - hace que tu evidencia sea mas confiable en general.

Que significa "estadisticamente significativo"

Cuando ves la frase "estadisticamente significativo" en un articulo de noticias o un paper de investigacion, significa que los investigadores realizaron una prueba de hipotesis y decidieron rechazar la hipotesis nula. Sus datos eran lo suficientemente improbables bajo la suposicion de "no pasa nada" como para concluir que algo real esta ocurriendo.

No significa que el resultado sea grande, importante o practicamente util. Un medicamento podria producir una mejora estadisticamente significativa del 0.1%: real, pero probablemente no vale la pena tomarlo. "Significativo" en estadistica solo significa "poco probable que se deba solo al azar".

Ejemplo

Una empresa de comercio electronico en Latinoamerica prueba dos disenos de su pagina de inicio. El Diseno A tiene una tasa de compra del 3.2% y el Diseno B del 3.5%. Despues de evaluar a 50,000 visitantes, la diferencia resulta "estadisticamente significativa".

Pero esa diferencia de 0.3% es practicamente significativa? Depende. Si la tienda tiene millones de visitantes al mes, ese pequeno porcentaje representa miles de ventas adicionales. Si tiene pocos visitantes, la diferencia podria no justificar el costo del rediseno.

Cuando se usa la prueba de hipotesis?

La prueba de hipotesis aparece en todas partes:

  • Medicina: Evaluar si un nuevo tratamiento es mejor que los existentes.
  • Negocios: Pruebas A/B en sitios web para ver si un nuevo diseno genera mas clics o ventas.
  • Educacion: Verificar si un nuevo metodo de ensenanza realmente mejora las calificaciones.
  • Gobierno: Determinar si un cambio de politica publica redujo las tasas de delincuencia.
  • Deportes: Un equipo de futbol quiere saber si un nuevo programa de entrenamiento realmente mejora el rendimiento de sus jugadores, o si los resultados recientes son simplemente buena suerte.
Punto Clave

La prueba de hipotesis es una forma estructurada de usar datos para evaluar afirmaciones. Empiezas asumiendo que no pasa nada (hipotesis nula) y luego verificas si tus datos proporcionan evidencia suficientemente fuerte para rechazar esa suposicion. Dos tipos de errores siempre son posibles: falsas alarmas (Tipo I) y descubrimientos perdidos (Tipo II). Entender este marco te ayuda a evaluar criticamente las afirmaciones que encuentras en noticias, salud y decisiones cotidianas.