Que es un valor atipico en estadistica?

Definicion

Un valor atipico es un punto de datos que difiere significativamente de otras observaciones en un conjunto de datos. Se encuentra a una distancia anormal de los otros valores, ya sea mucho mas alto o mucho mas bajo que la mayoria de los datos.

Como identificar valores atipicos

El metodo mas comun usa el rango intercuartilico (RIC). Cualquier valor por debajo de Q1 - 1.5 x RIC o por encima de Q3 + 1.5 x RIC se senala como valor atipico.

Ejemplo

Gastos mensuales de 8 empleados: $200, $250, $230, $210, $240, $220, $260, $1,500

El valor de $1,500 es un valor atipico. Esta muy por encima de los otros valores, que se agrupan entre $200 y $260.

La media con el valor atipico es $389. Sin el, la media es $230. Un solo valor extremo inflo el promedio en casi un 70%.

Por que es importante

Los valores atipicos pueden afectar dramaticamente los calculos estadisticos. Alejan la media del centro, inflan la desviacion estandar y pueden distorsionar las lineas de regresion. No tener en cuenta los valores atipicos puede llevar a conclusiones erroneas.

Sin embargo, los valores atipicos no siempre son malos. Pueden revelar fraude (una transaccion inusualmente grande), errores (un decimal mal colocado) o fenomenos genuinamente importantes (una medicion cientifica revolucionaria). La clave es investigar cada valor atipico en lugar de eliminarlo automaticamente.

Punto clave

Siempre investiga los valores atipicos antes de decidir mantenerlos o eliminarlos. Pueden ser errores que distorsionan tu analisis o puntos de datos reales que contienen informacion valiosa.

← Back to Glossary