Qual è la distribuzione gaussiana?

In statistica, la gaussiana o normale, la distribuzione viene utilizzata per caratterizzare sistemi complessi con molti fattori. Come descritto in The History of Statistics di Stephen Stigler, Abraham De Moivre inventato la distribuzione che porta il nome di Karl Fredrick Gauss. Contributo di Gauss risiede nella sua applicazione della distribuzione per l'approccio di minimi quadrati a ridurre al minimo errore nel montaggio dei dati con una retta di regressione. Ce l'ha fatta, così la più importante distribuzione di errore nelle statistiche.

Motivazione

Qual è la distribuzione di un campione di dati? Se non sai distribuzione sottostante dei dati? C'è un modo per testare ipotesi sui dati senza conoscere la distribuzione sottostante? Grazie al teorema del limite centrale, la risposta è sì.

Dichiarazione del teorema

Si afferma che una media del campione da una popolazione infinita è approssimativamente normale, o gaussiana, con la stessa popolazione sottostante e varianza uguale alla varianza della popolazione divisa per la dimensione del campione. L'approssimazione migliora come la dimensione del campione diventa grande.

L'istruzione di approssimazione è a volte misstated come una conclusione sulla convergenza a una distribuzione normale. Poiché le modifiche di distribuzione normale d'approssimazione come l'esempio dimensione aumenta, tale affermazione è fuorviante.

Il teorema è stato sviluppato da Pierre Simon Laplace.

Perché è ovunque

Distribuzioni normali sono onnipresenti. Il motivo deriva dal teorema del limite centrale. Spesso, quando un valore viene misurato, è l'effetto di somma di molte variabili indipendenti. Di conseguenza, il valore misurato si ha una qualità media del campione. Ad esempio, una distribuzione delle performance dell'atleta può avere una forma a campana, a causa delle differenze nella dieta, allenamento, genetica, coaching e psicologia. Anche altezze di maschile ha una distribuzione normale, essendo una funzione di molti fattori biologici.

Copule gaussiane

Quello che viene chiamato una "funzione di copula" con una distribuzione di Gauss è stato nelle notizie nel 2009 a causa del relativo uso nella valutazione del rischio di investire in obbligazioni collateralized. L'uso improprio della funzione era strumentale nella crisi finanziaria del 2008-2009. Anche se c'erano molte cause della crisi, col senno di poi gaussiane distribuzioni probabilmente dovrebbero non sono stati utilizzati. Una funzione con una coda più spessa avrebbe assegnato una maggiore probabilità di eventi avversi.

Derivazione

Teorema del limite centrale può essere dimostrato in molte linee analizzando il momento generando funzione (mgf) di (media del campione - media della popolazione) /? (varianza della popolazione / campione) in funzione della mgf della popolazione sottostante. La parte di ravvicinamento del teorema è introdotta da mgf della popolazione sottostante come serie di potenze in espansione, quindi mostrando la maggior parte dei termini sono insignificante, come la dimensione del campione diventa grande.

Può essere dimostrato in molte meno righe utilizzando un'espansione di Taylor sull'equazione caratteristica della funzione stessa e fare la modella indossa una taglia grande.

Calcolo convenienza

Alcuni modelli statistici presumono gli errori per essere gaussiana. In questo modo le distribuzioni delle funzioni delle normali variabili, come il chi - quadrato- e F-distribuzione, per essere utilizzato nei test di ipotesi. In particolare, nel F-test, la statistica F è composto di un rapporto di distribuzione Chi-quadro, che a loro volta sono funzioni di un parametro di varianza normale. Il rapporto tra i due provoca la varianza annullare, consentendo la verifica senza conoscenza delle varianze a parte la loro normalità e la costanza delle ipotesi.