Come identificare outlier in dati

Valori anomali nei dati sono anomalie che possono indicare la presenza di dati non validi. Questo è visto quando hai bisogno di trovare la media di un insieme di numeri. Un numero è considerato come un outlier perché può comunque alterare la media o il risultato. Identificare un outlier in un dataset è fatta eseguendo calcoli con il quartile inferiore e il quartile superiore di un gruppo di numeri.

Istruzioni

• Scrivere l'insieme di numeri per i vostri dati. Questo può essere l'età dei rispondenti che hanno preso un sondaggio o qualsiasi combinazione di numeri, ad esempio 22, 25, 26, 29, 31, 33, 35 e 50.

• Calcolare la mediana calcolando i due numeri centrali. Nel nostro esempio, questa equazione sembra (29 + 31) / 2, che è uguale a 30.

• Determinare il primo quartile calcolando l'equazione,25 (8 + 1). Il primo quartile è definito come il 25 ° percentile ed è di 2,25. Questo è rappresentato dal numero 25, come questo è il secondo numero del DataSet.

• Eseguire l'equazione di 25 + .25(26-25) che è uguale a 25.25. Il numero 25 viene sottratto il numero successivo più alto nel dataset che è 26.

• Determinare il quartile superiore calcolando l'equazione,75 (8 + 1). Il quartile superiore è definito come il 75 ° percentile ed è 6.75. Questo è rappresentato dal numero 33 come questo è il sesto numero del DataSet.

• Eseguire l'equazione di 33 + .75(35-33) pari a 34,5. Il numero 33 è sottratto dal numero più alto successivo nel dataset che è 35.

• Sottrarre il quartile inferiore di 34,5 da quartile inferiore di 25.25 per un intervallo interquartile di 9.25.

• Moltiplicare l'intervallo interquartile di 9.25 per un risultato di 13.875 per 1,5.

• Calcolare la recinzione interna inferiore sottraendo 25.25 da 13.875 per un risultato di 11375. Calcolare la recinzione interna superiore aggiungendo 22,25 a 13.875 per un risultato di 36.125.

• 3 moltiplicare lo scarto interquartile di 9.25 per un risultato di 27,75

• Calcolare il recinto esterno inferiore sottraendo 33,5 di 27,75 per un risultato di 5.75. Calcolare il recinto esterno superiore aggiungendo 33,5 a 27.75.for un risultato di 61.25

• Trovare il valore erratico che supera la recinzione interna superiore del set di dati. Vi accorgerete che il numero 50 è il valore erratico come questo è esterno all'intervallo statistico dei dati.