Definicion
Un valor atipico es un punto de datos que difiere significativamente de otras observaciones en un conjunto de datos. Se encuentra a una distancia anormal de los otros valores, ya sea mucho mas alto o mucho mas bajo que la mayoria de los datos.
Como identificar valores atipicos
El metodo mas comun usa el rango intercuartilico (RIC). Cualquier valor por debajo de Q1 - 1.5 x RIC o por encima de Q3 + 1.5 x RIC se senala como valor atipico.
Gastos mensuales de 8 empleados: $200, $250, $230, $210, $240, $220, $260, $1,500
El valor de $1,500 es un valor atipico. Esta muy por encima de los otros valores, que se agrupan entre $200 y $260.
La media con el valor atipico es $389. Sin el, la media es $230. Un solo valor extremo inflo el promedio en casi un 70%.
Por que es importante
Los valores atipicos pueden afectar dramaticamente los calculos estadisticos. Alejan la media del centro, inflan la desviacion estandar y pueden distorsionar las lineas de regresion. No tener en cuenta los valores atipicos puede llevar a conclusiones erroneas.
Sin embargo, los valores atipicos no siempre son malos. Pueden revelar fraude (una transaccion inusualmente grande), errores (un decimal mal colocado) o fenomenos genuinamente importantes (una medicion cientifica revolucionaria). La clave es investigar cada valor atipico en lugar de eliminarlo automaticamente.
Siempre investiga los valores atipicos antes de decidir mantenerlos o eliminarlos. Pueden ser errores que distorsionan tu analisis o puntos de datos reales que contienen informacion valiosa.