Come derivare il chi-quadro

Come derivare il chi-quadro

Il test chi quadrato è un metodo statistico utilizzato per testare una distribuzione osservata contro una distribuzione determinata da un'ipotesi nulla. Scienziati che cercano di scoprire se una distribuzione osservata è casuale o non utilizzare chi quadrato estesamente. Ad esempio, un geografo cercando di scoprire se la distribuzione di alberi di mele sopra una collina è correlata al tipo di suolo utilizzerà il test chi quadrato.

Istruzioni

• Creare un'ipotesi nulla. Un'ipotesi nulla esprime esattamente ciò che si desidera analizzare.

Ad esempio, la ricerca mostra che non ci può essere un collegamento tra tipo di suolo e dove i contadini coltivano fragole. L'ipotesi di null sarebbe "la frequenza delle aziende agricole crescono fragole non è correlata al tipo di terreno."

• Stabilire esattamente che cosa avete bisogno registrare e quindi creare un foglio di dati su cui a registrarlo. Ad esempio, per studiare il tipo di terreno e coltivazione della fragola, registrare il tipo di suolo e il numero di aziende agricole le fragole crescente identificate su che tipo di suolo. Assegnare ogni tipo di terreno un "numero di categoria". Ad esempio, un foglio dati completato potrebbe essere come questo:

1: tipo di suolo = sabbia: numero di aziende agricole fragola = 15

2: tipo di suolo = argilla: numero di aziende agricole fragola = 5

3: tipo di suolo = torba: numero di aziende agricole fragola = 12

4: tipo di suolo = terriccio: numero di aziende agricole fragola = 7

5: tipo di suolo = calcare: numero di aziende agricole fragola = 1

• Determinare la frequenza di "prevista". La frequenza prevista è il numero totale di osservazioni divisa per il numero delle zone. Ad esempio, un totale di 40 osservazioni e cinque diverse aree dà una frequenza prevista di otto-- 40 / 5 = 8.

• Sottrarre la frequenza osservata alla frequenza prevista per ogni zona.

Per esempio una frequenza osservata di 15 e un frequenza prevista di otto dà un osservato - previsto frequenza di 7--15-8 = 7.

• Frequenza di Piazza (osservato - atteso) per ogni area. Ad esempio, se zona 1 ha una frequenza di 15 osservata e una frequenza prevista di otto, l'osservato - previsto frequenza è sette e sette al quadrato = 49. Utilizzando i dati di esempio dal passaggio 2, i dati sarebbero apparire come questo:

Tipo di suolo osservati attesi Obs - Exp ^ 2

Sabbia 15 8 49

Argilla 5 8 9

Torba 12 8 16

Terriccio 7 8 1

Calcare 1 8 49

• Aggiungere la (osservato - atteso) ^ 2 valori insieme e poi dividere il totale per la frequenza prevista. Utilizzando i dati dal passaggio 5, la matematica è (49 + 9 + 16 + 1 + 49) / 8 che si risolve in 124 / 8, o 15,5.

• Calcolare il valore di "libertà" sottraendo uno dal numero di categorie nella vostra inchiesta. Nell'esempio ci sono cinque categorie di suolo, pertanto il valore di gradi di libertà è quattro-- 5-1 = 4. Utilizzare una tabella di valori critici per Chi square per identificare il valore per il tuo gradi di libertà con una probabilità 0,05. Se il valore di quadrati chi calcolato è maggiore del valore nella tabella, quindi c'è meno di un 0,05 probabilità del rapporto essere casuale. In altre parole, il rapporto è dovuto al fattore che studiato. Utilizzando i dati di esempio, il valore di probabilità 0,05 con quattro gradi di libertà è 9.4877. Il valore calcolato di 15,5 è maggiore di 9.4877, c'è meno di una probabilità di 0,05 per cento che il rapporto è casuale. C'è un legame tra tipo di suolo e agricoltura della fragola.

Consigli & Avvertenze

  • Non preoccupatevi se previsto l'osservato - frequenza è un numero negativo. Squadratura si trasforma nuovamente in un numero positivo.
  • L'ipotesi di null indica che il rapporto che hanno studiato non esiste. Rifiutare l'ipotesi dimostra che il rapporto esiste.
  • Assicurarsi che nessun altro fattore evidente potrebbero influenzare il risultato. Ad esempio, gli agricoltori ricevono una sovvenzione per la coltivazione di frutti di bosco? Sono gli agricoltori trattando i campi di alterare il pH, drenaggio e caratteristiche nutrizionali?
  • Ci deve essere un minimo di 20 set di dati.
  • Tutte le osservazioni devono essere indipendenti. Una sola osservazione non deve influenzare un altro.