Que es el sesgo?
En el lenguaje cotidiano, "sesgo" significa tener una preferencia o inclinacion hacia un lado. En estadistica, sesgo significa algo mas especifico: es un error sistematico que aleja tus resultados de la verdad. No es aleatorio. Empuja los hallazgos consistentemente en una direccion, haciendolos poco confiables.
El sesgo puede colarse en cualquier etapa de una investigacion: desde elegir a quien estudiar, hasta recopilar datos, hasta interpretar resultados. Lo complicado es que los estudios sesgados pueden verse perfectamente profesionales. Conocer los tipos comunes de sesgo te ayuda a detectar problemas que de otra forma podrian enganarte.
Sesgo de seleccion: quien esta en la sala?
El sesgo de seleccion ocurre cuando las personas en un estudio no son representativas del grupo mas grande que te interesa. La muestra esta sesgada desde el principio.
Un restaurante en Lima envia una encuesta de satisfaccion por correo electronico a todos los clientes que se registraron en su programa de lealtad. Los resultados son brillantes: el 92% dice que ama la comida. Pero piensa en quien se inscribio en el programa de lealtad. Son los fans mas fieles del restaurante. Los clientes que tuvieron una experiencia terrible y nunca volvieron no estan en el programa y nunca vieron la encuesta. El restaurante solo esta escuchando a personas que ya les gustaba.
El sesgo de seleccion aparece constantemente en las resenas en linea. Las personas que sienten algo fuerte (ya sea muy contentas o muy molestas) son mucho mas propensas a dejar una resena que las personas que tuvieron una experiencia promedio. Por eso las calificaciones de productos a menudo se acumulan en cinco estrellas y una estrella, con menos calificaciones en el medio.
Sesgo de confirmacion: ver lo que quieres ver
El sesgo de confirmacion es nuestra tendencia natural a prestar atencion a la informacion que apoya lo que ya creemos e ignorar la informacion que lo contradice. Esto afecta a investigadores, periodistas y a todos nosotros en nuestra vida diaria.
Un investigador que cree que un nuevo metodo de ensenanza funciona podria inconscientemente prestar mas atencion a los alumnos que mejoraron y descartar a los que no. Un jefe que cree que el trabajo remoto es improductivo podria notar cada vez que un empleado remoto no cumple un plazo, pero ignorar las veces que superan al equipo de la oficina.
El sesgo de confirmacion es una de las razones por las que el cegamiento en la investigacion (discutido en nuestra leccion sobre diseno de investigacion) es tan importante. Cuando los investigadores no saben que grupo recibio el tratamiento, no pueden favorecer inconscientemente los resultados que esperan.
Sesgo de supervivencia: los fracasos que faltan
El sesgo de supervivencia ocurre cuando solo miramos a las personas o cosas que pasaron por algun proceso de seleccion y nos olvidamos de todas las que no lo lograron.
Las revistas de negocios adoran hacer perfiles de personas que dejaron la universidad y se convirtieron en millonarios: Bill Gates, Mark Zuckerberg, Steve Jobs. Leer estas historias podria hacerte pensar que abandonar la universidad es un camino al exito. Pero por cada desertor que se convirtio en millonario, hay millones que abandonaron y tuvieron dificultades economicas. Nunca lees sus historias porque no se hicieron famosos. Las revistas solo te muestran a los sobrevivientes.
El sesgo de supervivencia aparece en muchos lugares. Estudiamos empresas exitosas para aprender estrategias de negocios pero ignoramos a los miles de empresas que usaron las mismas estrategias y fracasaron. Admiramos edificios antiguos y decimos "ya no construyen como antes", olvidando que los edificios viejos mal construidos se cayeron hace mucho. Solo los buenos sobrevivieron.
Sesgo de medicion: herramientas defectuosas, datos defectuosos
El sesgo de medicion ocurre cuando tu metodo de recopilar datos distorsiona sistematicamente los resultados. La herramienta misma (ya sea una pregunta de encuesta, una prueba medica o un rastreador digital) introduce error en una direccion.
La redaccion de encuestas es una fuente clasica de sesgo de medicion. Preguntale a la gente "Apoyas proteger la fauna silvestre en peligro?" y obtendras alta aprobacion. Pregunta "Apoyas gastar dinero de los impuestos en programas de fauna silvestre?" y la aprobacion baja, aunque estas preguntando sobre la misma politica. La forma en que planteas la pregunta empuja a las personas hacia una respuesta particular.
Otro ejemplo: los datos autorreportados. Cuando los investigadores les preguntan a las personas cuanto ejercicio hacen, cuanto comen o cuanto beben, la gente tiende a sobrereportar comportamientos saludables y subreportar los no saludables. No porque esten mintiendo, sino porque todos tendemos a recordarnos a nosotros mismos de una manera ligeramente mas favorable.
Sesgo de respuesta y sesgo de no respuesta
El sesgo de respuesta ocurre cuando las personas no contestan con la verdad. En una encuesta laboral sobre satisfaccion con el jefe, los empleados podrian dar calificaciones positivas porque temen que sus respuestas no sean realmente anonimas. En temas sensibles como ingresos, uso de sustancias u opiniones controversiales, las personas a menudo matizan sus respuestas hacia lo socialmente aceptable.
El sesgo de no respuesta es un primo cercano. Cuando una gran porcion de las personas elegidas para un estudio no responden, las personas que si responden pueden ser sistematicamente diferentes de las que no. Una encuesta de salud con una tasa de respuesta del 20% podria sobrerrepresentar a personas particularmente conscientes de su salud, ya que estan mas interesadas en el tema.
Como el sesgo afecta decisiones reales
Estos no son solo problemas academicos. El sesgo en la estadistica afecta decisiones que tocan la vida de todos.
- Investigacion medica: Si los ensayos clinicos incluyen mayormente a hombres jovenes y sanos, los resultados podrian no aplicarse a mujeres mayores. Esto historicamente ha llevado a medicamentos que funcionan de manera diferente (o causan efectos secundarios inesperados) en poblaciones que no fueron bien estudiadas.
- Contratacion y educacion: Si evaluas un programa de capacitacion solo mirando a las personas que lo completaron, te pierdes a todos los que lo abandonaron porque el programa no estaba funcionando para ellos.
- Tecnologia: Se ha demostrado que los sistemas de reconocimiento facial entrenados mayormente con rostros de piel clara funcionan mal con rostros de piel oscura. Los datos de entrenamiento tenian sesgo de seleccion incorporado.
Como protegerte
No necesitas ser investigador profesional para estar atento al sesgo. Aqui hay preguntas practicas que puedes hacer:
- A quien se estudio? La muestra representa al grupo que te importa, o es una porcion estrecha?
- Quien falta? Piensa en quien podria no haber sido incluido o quien eligio no participar.
- Como se recopilaron los datos? Las preguntas estaban redactadas de manera justa? Las personas podian responder con honestidad?
- Quien cuenta la historia? Solo estas escuchando de los exitos y no de los fracasos?
- Que esperaban encontrar los investigadores? Habia medidas de proteccion contra sus propias preferencias?
El sesgo no se trata de malas intenciones. Incluso investigadores, periodistas y organizaciones bien intencionados pueden producir resultados sesgados sin darse cuenta. Los cuatro tipos mas comunes a vigilar son el sesgo de seleccion (se estudio a las personas equivocadas), el sesgo de confirmacion (el investigador vio lo que queria ver), el sesgo de supervivencia (los fracasos son invisibles) y el sesgo de medicion (la herramienta de recopilacion de datos era defectuosa). Simplemente saber que estos existen te convierte en un consumidor de informacion mucho mas perspicaz.