Introduzione alla stima di densità del Kernel

Valutazione di densità del kernel è un metodo statistico per la rappresentazione di un intervallo di dati. Relativo a istogrammi, stima di densità Kernel offre un modo per stimare la distribuzione di una variabile nella popolazione. Il metodo è relativamente sofisticato ma i risultati di un'interpretazione visiva di densità probabile di una variabile, in altre parole, la frequenza con cui viene visualizzata la finestra di una variabile in una popolazione.

Utilizza

Kernel densità stima stima forma di una funzione di densità. Una funzione di densità indica la frequenza con cui appare una variabile in un campione casuale di una popolazione. La stima di densità del Kernel è considerata un metodo non-parametrico. Nelle statistiche, ci sono metodi parametrici e non parametrici. Metodi parametrici formulare ipotesi ulteriori rispetto a quelli non-parametrici. Alcuna ipotesi sulla distribuzione, mezzi o deviazioni standard non sono necessari nella statistica non parametrica. Ad esempio, se si voleva sapere se la decima prova in un'aula avrebbe un punteggio più alto rispetto dei primi nove mesi, nel ragionamento parametrico sarebbe devi sapere la media e la deviazione standard per derivare una risposta. Nel ragionamento non-parametrici, semplicemente conoscendo che il numero di test è sufficiente conoscere l'ultimo test ha una probabilità di 10 per cento di essere sopra i punteggi precedenti.

Kernel

La stima di densità Kernel ha due componenti fondamentali: il kernel e la larghezza di banda. Il Kernel è la funzione di densità. Ci sono sei tipi comuni di funzioni di densità in statistica non parametrica: normale, uniforme, triangolare, Epanechnikov, quartiche, triweight e coseno. Ognuna di queste funzioni viene utilizzato per stimare la frequenza di una variabile casuale in una popolazione.

Larghezza di banda

La seconda componente, la larghezza di banda, appiana i dati risultanti dalla funzione di densità del kernel. La larghezza di banda, pertanto, influisce fortemente la rappresentazione visiva dei dati. Una linea frastagliata può diventare progressivamente levigata fino a quando i dati sono stati parafrasati così che non è più utile. Nella formula di stima di densità del Kernel, la larghezza di banda è rappresentata dalla lettera h. Deve essere positivo e determinare una distribuzione che somma a uno.

Vantaggi

Stima di densità del kernel ha dei vantaggi di altri metodi di stimare non parametrica, soprattutto gli istogrammi. Gli istogrammi rappresentano la distribuzione di una variabile in bidoni lungo un intervallo orizzontale. Impilati bidoni rappresentano una maggiore densità della variabile nel settore dei dati. Perché istogrammi simboleggiano dati attraverso bidoni, la variabile è suddiviso in compartimenti e diverse distribuzioni sono frastagliate e discreti, travisando la distribuzione dei fluidi di una variabile che esiste davvero in una popolazione. Stima di densità del kernel rappresenta meglio questa fluidità con linea regolare, la cui morbidezza è determinata dalla larghezza di banda scelto nella formula densità del kernel.