Tablas de frecuencia y tabulación cruzada

Dificultad: Principiante Tiempo de Lectura: 10 minutos

De datos brutos a conteos organizados

Cuando recopilas datos, a menudo comienzan como una lista desordenada. Imagina que encuestas a 200 clientes sobre su método de pago preferido y recibes una larga columna de respuestas: tarjeta de crédito, efectivo, pago móvil, tarjeta de crédito, tarjeta de crédito, efectivo, y así sucesivamente. Una tabla de frecuencia convierte este caos en un resumen limpio contando cuántas veces aparece cada valor.

Una tabla de frecuencia básica tiene dos columnas: la categoría y el conteo (también llamado frecuencia). Para el ejemplo de pagos, podrías terminar con tarjeta de crédito: 95, efectivo: 52, pago móvil: 38, tarjeta de débito: 15. Ahora puedes ver instantáneamente qué método de pago domina y cuál es raro. Este simple acto de conteo es la base de la estadística descriptiva.

95 Tarjeta de crédito 52 Efectivo 38 Pago móvil 15 Tarjeta de débito

Frecuencia relativa y acumulativa

Los conteos brutos son útiles, pero pueden ser difíciles de comparar entre conjuntos de datos de diferentes tamaños. Si una tienda encuestó a 200 personas y otra a 1,000, comparar conteos brutos es engañoso. La frecuencia relativa resuelve esto expresando cada conteo como una proporción o porcentaje del total. Tarjeta de crédito con 95 de 200 es una frecuencia relativa del 47.5%.

La frecuencia acumulativa va un paso más allá. Muestra un total acumulado a medida que avanzas por las categorías. Para datos ordenados como rangos de calificaciones de exámenes, la frecuencia acumulativa responde preguntas como "¿qué porcentaje de estudiantes obtuvo 70 o menos?" Simplemente sumas las frecuencias de todas las categorías hasta ese punto. Esto es especialmente útil cuando necesitas encontrar medianas o percentiles a partir de datos agrupados.

Juntas, estas tres vistas de los mismos datos (frecuencia bruta, frecuencia relativa y frecuencia acumulativa) te dan una imagen completa. Los conteos brutos muestran los números reales, las frecuencias relativas permiten comparación entre conjuntos de datos, y las frecuencias acumulativas te ayudan a entender la distribución de los valores.

Tablas de frecuencia para datos numéricos

Cuando tus datos son numéricos y continuos, como edades, ingresos o calificaciones de exámenes, no puedes listar cada valor único porque podría haber cientos. En su lugar, agrupas los valores en intervalos llamados clases o bins. Por ejemplo, las edades podrían agruparse como 18-25, 26-35, 36-45, y así sucesivamente.

0 2 4 6 7 20-30 31-40 41-50 51-60 61-70 71-80

Elegir el número correcto de clases importa. Muy pocas clases y pierdes detalle. Demasiadas clases y la tabla se vuelve tan caótica como los datos brutos. Una regla empírica común es usar entre 5 y 15 clases para la mayoría de los conjuntos de datos. El histograma anterior muestra cómo se ven los datos de edad cuando se agrupan en seis clases, haciendo clara la forma de la distribución de un vistazo.

Ejemplo

Una profesora registra las calificaciones de examen de 30 estudiantes: que van de 45 a 98. Crea una tabla de frecuencia con clases de 10 puntos cada una (40-49, 50-59, 60-69, 70-79, 80-89, 90-99). Esto revela que la mayoría de los estudiantes obtuvieron entre 70 y 89, con solo dos estudiantes por debajo de 50. La tabla de frecuencia destaca inmediatamente dónde se concentra la clase y dónde están los valores atípicos, algo difícil de ver en una lista bruta de 30 números.

Tabulación cruzada: dos variables a la vez

Una tabla de frecuencia maneja una variable. Pero, ¿qué pasa si quieres explorar la relación entre dos variables categóricas? Aquí es donde entra la tabulación cruzada (también llamada tabla de contingencia o tabla bidireccional). Crea una cuadrícula donde una variable define las filas y otra las columnas, con conteos en cada celda.

Por ejemplo, supón que encuestas a empleados sobre satisfacción laboral (satisfecho, neutral, insatisfecho) y también registras su departamento (ventas, ingeniería, soporte). Una tabla cruzada muestra cuántos empleados de cada departamento caen en cada categoría de satisfacción. Ahora puedes ver de un vistazo si ingeniería tiene más empleados insatisfechos que ventas, o si soporte está especialmente contento.

35 Ventas - Satisfecho 15 Ventas - Neutral 10 Ventas - Insatisfecho 20 Ing. - Satisfecho 25 Ing. - Neutral 18 Ing. - Insatisfecho 28 Soporte - Satisfecho 12 Soporte - Neutral 7 Soporte - Insatisfecho

Las tablas cruzadas son el punto de partida para muchas pruebas estadísticas, incluyendo la prueba de chi-cuadrado. Te permiten inspeccionar visualmente si dos variables parecen estar relacionadas antes de ejecutar cualquier análisis formal. Al leer investigaciones, a menudo verás tablas de tabulación cruzada presentadas con porcentajes por fila o por columna para facilitar las comparaciones.

Leer tablas como un profesional

Las tablas de frecuencia y las tablas cruzadas aparecen en todas partes: en artículos de noticias, informes médicos, paneles de control empresariales y artículos académicos. Aquí hay consejos prácticos para leerlas bien. Primero, siempre revisa los totales. Si una tabla muestra porcentajes pero no los conteos subyacentes, el tamaño de muestra podría ser demasiado pequeño para que los porcentajes sean significativos (decir "el 50% prefirió la opción A" suena impresionante hasta que descubres que solo 4 personas fueron encuestadas).

Segundo, presta atención a cómo se definen las categorías. Clases de ancho desigual en una tabla de frecuencia pueden distorsionar tu impresión de los datos. Una clase etiquetada "0-10" y otra "11-50" naturalmente tendrá más conteos en la clase más amplia, incluso si la tasa subyacente es la misma.

Tercero, en las tablas cruzadas, decide si los porcentajes por fila o por columna son más apropiados para tu pregunta. Si quieres saber qué fracción de cada departamento está satisfecha, usa porcentajes por fila. Si quieres saber qué fracción de empleados satisfechos proviene de cada departamento, usa porcentajes por columna. Elegir la dirección incorrecta puede llevar a conclusiones erróneas.

Conclusión clave

Las tablas de frecuencia transforman datos brutos en resúmenes organizados contando con qué frecuencia aparece cada valor o categoría. La frecuencia relativa expresa conteos como proporciones para fácil comparación, y la frecuencia acumulativa rastrea totales acumulados. La tabulación cruzada extiende esto a dos variables a la vez, revelando patrones en cómo se relacionan las categorías. Estas herramientas simples son el primer paso en casi todo análisis de datos y una de las habilidades más prácticas para leer estadísticas en la vida cotidiana.