Come rimuovere valori anomali con un punteggio di Z

Quando si analizza un insieme di dati, spesso potrebbe essere outlier, i punti che non sembrano corrispondere al modello dei dati stabiliti dal resto dei punti dati. Possono essere visti spesso rappresentando graficamente i risultati, poiché trovare l'equazione "più adatto" per un insieme di punti può fare i ritardatari molto evidente. Essi possono essere causati da errori di misura, fenomeni sconosciuti o semplicemente imprecisioni nel metodo sperimentale. Utilizzare il metodo di z-score per eliminare valori erratici.

Istruzioni

• Calcolare sia la media e la mediana di deviazione assoluta sulla mediana o MAD, di insiemi di dati. Per calcolare la media, aggiungere tutti i risultati e dividere tale somma per il numero di punti dati. Per calcolare la mediana di deviazione assoluta circa la mediana, sottrarre la media da ogni punto di dati, prendere il valore assoluto e trovare il valore mediano - centrale..--di quei risultati.

• Calcolare il Punteggio di z per ogni punto dati sottraendo la media della popolazione dal punto di dati, e dividendo la risposta per la Mad Si tratta di z-score modificato di quel punto dati.

• Decidere come si desidera determinare un outlier. Il test euristico afferma che un punto di dati con un z-score modificato di 3.5 o più dovrebbe determinare un outlier. A seconda della vostra ricerca, è possibile eliminare il valore erratico del tutto, o incorporare i risultati e spiegarlo nella vostra ricerca.