No siempre puedes preguntar a todos
Imagina que quieres saber cuantas horas al dia pasan los jovenes mexicanos en su celular. Lo ideal seria preguntarle a cada joven en el pais, pero eso es imposible: son millones de personas. No tienes ni el tiempo, ni el dinero, ni la forma de llegar a cada uno de ellos. Entonces, que haces?
Haces lo que hacen los investigadores, las empresas y los gobiernos todo el tiempo: seleccionas un grupo mas pequeno que represente al grupo grande y estudias a ese grupo. Esa es la idea central detras de las poblaciones y las muestras.
Que es una poblacion?
En estadistica, una poblacion es el grupo completo que te interesa estudiar. No tiene que ser de personas; puede ser cualquier conjunto de elementos sobre los que quieres sacar conclusiones.
Poblaciones en diferentes contextos:
- Todos los estudiantes universitarios de Argentina
- Todas las taquerias de la Ciudad de Mexico
- Todos los partidos jugados en la Copa Libertadores desde 1960
- Todas las llamadas recibidas por un call center en un mes
- Todos los arboles de una reserva ecologica en Costa Rica
La clave es que "poblacion" incluye absolutamente a todos los miembros del grupo que te interesa, sin excepciones.
Que es una muestra?
Una muestra es un subconjunto de la poblacion. Es el grupo mas pequeno que realmente estudias, con la esperanza de que lo que descubras sobre el tambien sea cierto para la poblacion completa.
Si la poblacion es "todos los estudiantes universitarios de Argentina" (aproximadamente 2 millones), tu muestra podria ser 1,500 estudiantes seleccionados de diferentes universidades, ciudades y carreras. Estudias a esos 1,500 y usas los resultados para hacer afirmaciones sobre los 2 millones.
Por que usamos muestras?
La respuesta corta: porque estudiar a toda la poblacion casi siempre es imposible, demasiado caro o innecesario. Aqui van las razones principales:
- Costo: Encuestar a 130 millones de mexicanos cuesta una fortuna. Encuestar a 2,000 es manejable.
- Tiempo: Un censo nacional toma anos. Una encuesta por muestreo puede dar resultados en semanas.
- Accesibilidad: Algunas poblaciones son simplemente inaccesibles. No puedes medir la presion arterial de cada adulto en Colombia.
- Destruccion: A veces medir algo lo destruye. Si una fabrica quiere comprobar la durabilidad de sus focos, no puede probar cada foco hasta que se funda, porque se quedaria sin producto que vender.
La clave: que la muestra sea representativa
Una muestra es util solo si se parece a la poblacion. Si quieres saber que piensan los colombianos sobre el sistema de salud, pero solo encuestas a personas en Bogota con ingresos altos, tu muestra no representa a todo el pais. Las conclusiones que saques seran sesgadas.
Una muestra representativa refleja la diversidad de la poblacion: incluye personas de diferentes edades, regiones, niveles de ingreso y otros factores relevantes, en proporciones similares a las de la poblacion real.
Tipos de muestreo
Hay varias formas de seleccionar una muestra. Aqui estan las mas comunes:
Muestreo aleatorio simple
Cada miembro de la poblacion tiene la misma probabilidad de ser seleccionado. Es como meter todos los nombres en una urna y sacar algunos al azar. Este es el metodo ideal porque minimiza el sesgo.
Muestreo estratificado
Divides la poblacion en subgrupos (estratos) y luego seleccionas al azar dentro de cada subgrupo. Por ejemplo, si quieres encuestar a trabajadores de un hospital, podrias dividirlos en medicos, enfermeros y personal administrativo, y seleccionar personas de cada grupo proporcionalmente.
Muestreo por conveniencia
Seleccionas a las personas que estan mas a la mano. Encuestar a tus amigos o a los primeros 50 clientes que entran a una tienda son ejemplos de muestreo por conveniencia. Es rapido y barato, pero tiene un riesgo alto de sesgo porque no representa a toda la poblacion.
Encuesta electoral en Peru: Una empresa de encuestas quiere predecir los resultados de una eleccion presidencial. Si solo encuesta por telefono fijo, esta dejando fuera a los jovenes (que mayormente usan celular) y a la poblacion rural (que puede no tener telefono). Esa muestra no es representativa. Un mejor enfoque seria combinar encuestas telefonicas, en linea y presenciales para alcanzar a diferentes segmentos de la poblacion.
Parametros y estadisticos
En estadistica, usamos terminos especificos para distinguir entre los numeros que describen a la poblacion y los que describen a la muestra:
- Parametro: Un numero que describe a la poblacion completa. Por ejemplo, la estatura promedio real de todos los adultos en Espana es un parametro. Generalmente no lo conocemos con exactitud.
- Estadistico: Un numero que describe a la muestra. Por ejemplo, la estatura promedio de 500 adultos espanoles encuestados es un estadistico. Lo usamos para estimar el parametro.
La relacion es sencilla: usamos el estadistico (lo que medimos en la muestra) para estimar el parametro (lo que queremos saber sobre la poblacion).
Ingreso promedio en Chile: El gobierno quiere saber el ingreso promedio real de todos los hogares chilenos (el parametro). Como no puede preguntarle a cada hogar, encuesta a 15,000 hogares y calcula su ingreso promedio (el estadistico). Si el estadistico dice $550,000 pesos chilenos, se usa como la mejor estimacion del parametro real.
Errores comunes
Entender la diferencia entre poblacion y muestra te protege de varios errores tipicos:
- Generalizar a partir de una muestra pequena: "Le pregunte a tres amigos y todos prefieren cafe a te, asi que la mayoria de la gente prefiere cafe." Tres personas no son una muestra representativa de nada.
- Confundir muestra con poblacion: Una encuesta de 1,000 personas no es "lo que piensa todo el pais". Es una estimacion, con cierto margen de error.
- Ignorar el sesgo de seleccion: Si solo encuestas por internet, dejas fuera a quienes no tienen acceso. Eso distorsiona los resultados.
La poblacion es el grupo completo que te interesa; la muestra es el subconjunto que realmente estudias. Usamos muestras porque estudiar poblaciones enteras es casi siempre imposible. La clave para obtener resultados confiables es que tu muestra sea representativa: que se parezca a la poblacion en las caracteristicas que importan. Un buen muestreo es la base de toda estadistica confiable.