Desviacion Estandar

Dificultad: Principiante Tiempo de Lectura: 12 minutos

De la varianza a la desviacion estandar

En la leccion anterior, aprendimos sobre la varianza, una medida de que tan dispersos estan los valores. La varianza es poderosa, pero tiene un problema practico: se mide en unidades al cuadrado. Si estas viendo calificaciones medidas en puntos, la varianza sale en "puntos al cuadrado". Eso es dificil de interpretar.

55 70 85 100 115 130 145

La desviacion estandar resuelve esto al tomar la raiz cuadrada de la varianza. Esto regresa la medida a las unidades originales: puntos, pesos, grados, kilos, o lo que sea con lo que empezaste.

Desviacion estandar = √varianza

Ejemplo

Del ejemplo de ventas de tacos en la leccion anterior, la varianza era 200 (en "unidades al cuadrado").

Desviacion estandar = √200 ≈ 14.1 unidades

Ahora podemos decir: en promedio, las ventas diarias de cada dia difieren de la media en unas 14 unidades. Ese es un numero que podemos entender y usar.

Que significa realmente la desviacion estandar

Piensa en la desviacion estandar como la distancia promedio respecto al promedio. No es tecnicamente un promedio exacto de las distancias (las matematicas involucran elevar al cuadrado y sacar raiz), pero esa intuicion es muy cercana y extremadamente util.

Una desviacion estandar pequena significa que los datos estan agrupados cerca de la media. Una grande significa que estan esparcidos lejos.

Ejemplo

Dos cafeterias registran cuantos minutos esperan los clientes por su pedido en 5 visitas:

Cafeteria A: 3, 4, 4, 5, 4 → Media = 4 minutos, Desv. Est. ≈ 0.6 minutos

Cafeteria B: 1, 2, 4, 6, 7 → Media = 4 minutos, Desv. Est. ≈ 2.3 minutos

Ambas cafeterias tienen el mismo tiempo promedio de espera, pero la Cafeteria A es mucho mas consistente. Si odias las esperas impredecibles, la Cafeteria A es tu lugar.

Calculando la desviacion estandar paso a paso

Vamos a hacer un calculo completo para que veas exactamente como funciona. No te preocupes por memorizar la formula: entender la idea es lo que importa.

68 70 72 74 76 78 80 73.1
Ejemplo

Las calificaciones de un estudiante en 6 quizzes: 70, 80, 75, 85, 90, 80

Paso 1 - Encuentra la media:
(70 + 80 + 75 + 85 + 90 + 80) / 6 = 480 / 6 = 80

Paso 2 - Encuentra la distancia de cada calificacion a la media:

  • 70 − 80 = −10
  • 80 − 80 = 0
  • 75 − 80 = −5
  • 85 − 80 = +5
  • 90 − 80 = +10
  • 80 − 80 = 0

Paso 3 - Eleva al cuadrado cada distancia: 100, 0, 25, 25, 100, 0

Paso 4 - Encuentra la media de las distancias al cuadrado (varianza):
(100 + 0 + 25 + 25 + 100 + 0) / 6 = 250 / 6 ≈ 41.7

Paso 5 - Saca la raiz cuadrada: √41.7 ≈ 6.5

La desviacion estandar es de unos 6.5 puntos. Esto significa que las calificaciones del estudiante tipicamente caen a unos 6 o 7 puntos de su promedio de 80.

La regla 68-95-99.7

Cuando los datos siguen un patron con forma de campana (lo cual aplica para muchas mediciones del mundo real: estaturas, presion arterial, calificaciones), hay un patron notablemente consistente en como se distribuyen alrededor de la media. Esto se llama la regla 68-95-99.7, a veces llamada la regla empirica.

  • Cerca del 68% de los valores caen dentro de 1 desviacion estandar de la media
  • Cerca del 95% de los valores caen dentro de 2 desviaciones estandar de la media
  • Cerca del 99.7% de los valores caen dentro de 3 desviaciones estandar de la media

Veamos que se ve esto con un ejemplo real.

Ejemplo

Supongamos que las calificaciones de un examen en una clase grande tienen una media de 75 y una desviacion estandar de 10.

El 68% de los estudiantes sacaron entre 65 y 85 (75 ± 10)

El 95% de los estudiantes sacaron entre 55 y 95 (75 ± 20)

El 99.7% de los estudiantes sacaron entre 45 y 105 (75 ± 30)

Si alguien saco 50, esta a mas de 2 desviaciones estandar debajo de la media: solo alrededor del 2.5% de los estudiantes sacaron menos. Es una calificacion muy baja relativa a la clase.

Esta regla es increiblemente poderosa porque te permite juzgar rapidamente si un valor particular es ordinario o inusual, sin calculos complicados.

Interpretando la desviacion estandar en la vida real

Salud: lecturas de presion arterial

Un doctor te dice que la presion arterial sistolica normal tiene una media de unos 120 mmHg con una desviacion estandar de unos 15. Usando la regla 68-95-99.7, sabes que la mayoria de la gente cae entre 105 y 135. Una lectura de 160 esta a casi 3 desviaciones estandar por encima de la media: eso es inusual y vale la pena investigar.

0 9 18 27 36 45 60 65 70 75 80 85 90 95 100

Manufactura: control de calidad

Una fabrica produce tornillos que deberian medir 10.0 cm. El proceso de manufactura tiene una desviacion estandar de 0.02 cm. Esto significa que el 95% de los tornillos miden entre 9.96 y 10.04 cm. Si un tornillo mide 10.1 cm, eso esta a 5 desviaciones estandar del objetivo: algo salio mal con la maquina.

Finanzas: volatilidad del mercado

Cuando los analistas financieros hablan de "volatilidad", frecuentemente se refieren a la desviacion estandar. Una accion con desviacion estandar del 2% en rendimientos diarios es relativamente estable. Una con desviacion estandar del 8% es una montana rusa. Esto ayuda a los inversionistas a elegir inversiones acordes con el riesgo que pueden tolerar.

Ejemplo

Dos fondos de inversion rindieron un promedio del 7% anual durante la ultima decada.

Fondo A: Desviacion estandar del 3% → En la mayoria de los anos, los rendimientos estuvieron entre 4% y 10%.

Fondo B: Desviacion estandar del 12% → En algunos anos los rendimientos fueron del 19%, en otros del −5%.

Un jubilado que necesita ingresos estables probablemente preferiria el Fondo A. Un inversionista joven con decadas por delante podria aceptar los altibajos del Fondo B por la posibilidad de rendimientos altos ocasionales.

Malentendidos comunes

"Una desviacion estandar grande significa que los datos son malos"

No necesariamente. Algunas cosas varian mucho por naturaleza. Las temperaturas diarias en un desierto tienen una desviacion estandar grande porque los desiertos genuinamente oscilan entre calor extremo y frio. Los datos no son "malos": reflejan la realidad con precision.

"La desviacion estandar solo sirve para datos con forma de campana"

La regla 68-95-99.7 aplica especificamente a distribuciones con forma de campana (normales). Pero la desviacion estandar puede calcularse para cualquier conjunto de datos. Siempre es una medida util de dispersion, aunque los porcentajes exactos de la regla empirica no apliquen perfectamente.

"Hay que memorizar la formula"

En la practica, las calculadoras, hojas de calculo y software calculan la desviacion estandar al instante. Lo que importa es entender que significa el numero y como usarlo. Si alguien te dice que la desviacion estandar es 5, deberias saber que la mayoria de los valores estan dentro de unas 5 unidades del promedio: esa es la esencia.

La desviacion estandar de un vistazo

Aqui tienes una forma rapida de pensar sobre diferentes tamanos de desviacion estandar relativa a la media:

  • Pequena (relativa a la media): Datos compactos. Alta consistencia. Piensa en un termometro preciso o un horario de autobus confiable.
  • Moderada: Cantidad normal de variacion. La mayoria de los datos del mundo real caen aqui.
  • Grande (relativa a la media): Datos muy dispersos. Alta variabilidad. Piensa en los ingresos de una startup o en los pasos diarios que oscilan de 500 a 15,000.
Punto Clave

La desviacion estandar te dice, en unidades simples, que tan lejos se ubican tipicamente los valores del promedio. Una desviacion estandar pequena significa consistencia; una grande significa amplia variacion. La regla 68-95-99.7 te da una forma rapida de juzgar si un valor particular es normal o inusual: cerca de dos tercios de los valores caen dentro de una desviacion estandar de la media, y casi todos dentro de tres. Este solo numero es una de las herramientas mas utiles de toda la estadistica.