Todos cometen estos errores
Los errores estadisticos no se limitan a estudiantes o principiantes. Periodistas, politicos, ejecutivos de negocios e incluso algunos cientificos los cometen regularmente. Estos errores a menudo no son intencionales. Provienen de atajos mentales que parecen logicos pero nos llevan por mal camino.
Aprender a reconocer estos errores te protege de dos maneras: atraparas errores cuando otros los cometan, y evitaras cometerlos tu mismo al evaluar informacion.
Error 1: Confundir correlacion con causalidad
Este es el error estadistico mas comun, y esta en todas partes. Cuando dos cosas tienden a ocurrir juntas, es tentador asumir que una causa a la otra. Pero correlacion (dos cosas moviendose juntas) no es lo mismo que causalidad (una cosa haciendo que la otra ocurra).
Hay una fuerte correlacion estadistica entre las ventas de helado y los ataques de tiburon. Cuando las ventas de helado suben, los ataques de tiburon tambien suben. El helado atrae tiburones? Por supuesto que no. Ambos aumentan durante el verano porque mas personas van a la playa cuando hace calor. El clima calido es el factor oculto que impulsa ambas cosas.
Las consecuencias de este error en el mundo real son serias. Durante anos, los estudios mostraron que las personas que tomaban suplementos vitaminicos tendian a ser mas saludables. Muchos concluyeron que los suplementos causan mejor salud. Pero despues, experimentos disenados con mas cuidado encontraron que los suplementos en si proporcionaban poco beneficio. Las personas que los tomaban simplemente eran mas conscientes de su salud en general: tambien hacian mas ejercicio, comian mejor y visitaban a sus medicos regularmente.
Error 2: Seleccionar datos a conveniencia
Seleccionar datos a conveniencia (cherry-picking) significa elegir solo los datos que apoyan tu argumento e ignorar los que no. Es como un estudiante que les muestra a sus padres solo los examenes en los que le fue bien.
Esto ocurre frecuentemente en los negocios y la politica. Una empresa podria reportar "los ingresos crecieron cada trimestre este ano" mientras omite que las ganancias cayeron. Un politico podria decir "el crimen bajo un 15% desde que asumi el cargo" eligiendo como punto de partida un pico inusual.
El antidoto contra la seleccion a conveniencia es pedir la imagen completa. Como se ve el conjunto completo de datos? Que periodo de tiempo cubre la historia entera? Hay datos que convenientemente se dejaron fuera?
Error 3: Muestras pequenas
Los grupos pequenos producen resultados poco confiables. Si lanzas una moneda diez veces y sale cara siete veces, podrias pensar que la moneda esta trucada. Pero si la lanzas 10,000 veces, casi seguramente obtendras cerca del 50% de caras. Las muestras pequenas son ruidosas. Rebotan de un lado a otro y pueden dar resultados extremos solo por azar.
Un articulo de noticias reporta: "Estudio encuentra que las personas que comen nueces tienen mejor memoria". Revisas el estudio y descubres que involucro a 18 participantes durante dos semanas. Con un grupo tan pequeno, un par de personas naturalmente agudas que terminaron en el grupo de las nueces por azar podria explicar todo el resultado. Compara esto con un estudio de 2,000 personas durante dos anos, y los hallazgos tienen mucho mas peso.
Se especialmente cauteloso con estadisticas sobre grupos pequenos. "La escuela con mejor rendimiento del estado" podria ser una escuela diminuta donde unos cuantos alumnos brillantes elevan el promedio. De ano en ano, las escuelas pequenas a menudo oscilan entre los primeros y los ultimos lugares solo por variacion natural.
Error 4: Ignorar las tasas base
La tasa base es que tan comun es algo en la poblacion general. Ignorarla lleva a conclusiones tremendamente equivocadas, especialmente cuando se trata de eventos raros.
Imagina una prueba medica que tiene un 99% de precision para detectar una enfermedad rara que afecta a 1 de cada 10,000 personas. Si das positivo, cuales son las probabilidades de que realmente tengas la enfermedad? La mayoria de la gente adivina 99%. La respuesta real es alrededor del 1%. Aqui esta el por que: de 10,000 personas evaluadas, la prueba identifica correctamente a la 1 persona que tiene la enfermedad. Pero tambien da falsos positivos a unas 100 personas sanas (1% de 9,999). Asi que de 101 resultados positivos, solo 1 persona realmente tiene la enfermedad.
Esto no es solo un rompecabezas matematico. Tiene implicaciones reales para las pruebas medicas, la justicia penal y los sistemas de seguridad. Cada vez que una prueba o afirmacion involucra algo raro, siempre considera la tasa base.
Error 5: Puntos porcentuales vs. porcentajes
Esta es una distincion sutil pero importante que confunde incluso a profesionales experimentados. Un cambio en "puntos porcentuales" y un cambio en "porcentaje" son cosas muy diferentes.
Supongamos que una tasa de interes sube del 2% al 3%. Podrias describirlo de dos maneras. "La tasa aumento 1 punto porcentual" (de 2% a 3%). O "La tasa aumento un 50%" (porque 1 es el 50% de 2). Ambas afirmaciones son verdaderas, pero dan impresiones completamente diferentes. Un politico que quiere minimizar el cambio dice "solo un punto porcentual". Un oponente que quiere dramatizarlo dice "un aumento del 50%". Mismos datos, diferente presentacion.
Cuando escuches una afirmacion usando porcentajes, haz una pausa y pregunta: porcentaje de que? Son puntos porcentuales (una diferencia absoluta) o un cambio porcentual (una diferencia relativa)?
Error 6: Promedios que esconden la historia
Un promedio puede pintar una imagen enganosa cuando los datos subyacentes estan distribuidos de manera desigual. Si nueve personas en una sala ganan $50,000 pesos al mes y una persona gana $5,000,000, el ingreso promedio es de $545,000. Ese numero no describe con precision a nadie en la sala.
Cuando alguien reporta "el promedio", pregunta que tipo de promedio quieren decir (media, mediana o moda), y si los datos podrian estar distorsionados por valores extremos. Para ingresos, precios de vivienda y muchas otras mediciones del mundo real, la mediana (valor del medio) es usualmente mas informativa que la media (promedio aritmetico).
Detectando estos errores en la vida real
Ahora tienes un kit de herramientas mentales para atrapar los errores estadisticos mas comunes. Aqui tienes una referencia rapida:
- Que dos cosas ocurran juntas no significa que una cause la otra.
- Busca los datos que faltan, no solo los que se muestran.
- Se esceptico ante hallazgos de estudios muy pequenos.
- Cuando algo es raro, los resultados positivos a menudo son erroneos.
- Verifica si "porcentaje" significa puntos porcentuales o un cambio relativo.
- Pregunta que tipo de promedio se esta usando y si los extremos podrian distorsionarlo.
Los errores estadisticos son faciles de cometer y faciles de pasar por alto. Los mas importantes a vigilar son confundir correlacion con causalidad, seleccionar datos a conveniencia para apoyar una conclusion, sacar grandes conclusiones de muestras pequenas, ignorar que tan raro es algo, y confundir puntos porcentuales con porcentajes. No necesitas ser un experto en matematicas para detectarlos. Solo necesitas ir mas despacio y hacerte unas cuantas preguntas criticas antes de aceptar una afirmacion.