Come calcolare R al quadrato in regressione

Come calcolare R al quadrato in regressione

È possibile utilizzare R al quadrato per valutare quanto forte è la relazione tra due variabili. In genere, queste variabili consistono di un independent "x" valore (dollari spesi sulla pubblicità al mese, per esempio) e un valore dipendente "y" (ad esempio di vendite mensile del prodotto). Il primo passo è mettere i dati in coppie di corrispondenti valori x e y, la loro rappresentazione grafica e trovando l'equazione per la migliore linea retta passante per i punti. Con questa equazione, è possibile determinare R al quadrato utilizzando alcuni semplici calcoli.

Istruzioni

• Trovare la media di tutti i valori di "y" nel set di coppie di dati. Ad esempio, si consideri l'insieme di coppie di dati (1,2), (3,4) e (6,8), che hanno un miglior fit linea retta equazione y = x 1,211 + 0,632. Il valore di y medio per questo set è (2 + 4 + 8) / 3 = 4,67. Avresti precedentemente trovato che la migliore misura linea retta equazione per i vostri dati utilizzando un'applicazione di foglio di calcolo (ad esempio Microsoft Excel) per creare un grafico a dispersione dei numeri e generare l'equazione per quella trama.

• Sottrarre il valore di y medio da ciascun valore y individuali e poi Piazza la differenza. Aggiungere tutti i quadrati di queste differenze. Nell'esempio, si tratterebbe di (2-4,67) ^ 2 + (4-4,67) ^ 2 + (8-4,67) ^ 2 = 18.67. Nelle statistiche, questo valore è denominato SS(Total).

• Calcolare il valore di y che la linea retta equazione predice per ogni valore di x in ogni coppia di dati. Questi sono conosciuti come i valori di "cappello di y". Troverete questi valori sostituendo ogni valore di x nell'equazione linea retta forma migliore per i vostri dati e risolvendo l'equazione per y. Per i dati di esempio, y cappello per il primi punto dati = (1.211)(1) + 0,632 = 1.843. Gli altri valori di cappello due y sono 4.265 e 7.898.

• Calcolare la differenza tra il valore effettivo di y per ogni punto dati e il valore di cappello y corrispondente. Quadrato di ciascuna di queste differenze e quindi aggiungerli. Nell'esempio, questo darebbe (2-1.843) ^ 2 + (4-4.265) ^ 2 + (8-7.898) ^ 2 = 0.105. Questo valore è noto come SSE.

• Eseguire il calcolo seguente per trovare il valore di R al quadrato: [SS(Total) - SSE]/SS(Total). I dati di esempio così avrebbero un valore di R al quadrato (18.67 - 0.105)/18.67 = 0.9944.

Consigli & Avvertenze

  • Il valore massimo possibile per R al quadrato è 1.
  • In genere, il più vicino R al quadrato è 1, migliore è la correlazione tra x e y variabili. Tuttavia, questo non è sempre vero. Se x e y sono correlate, ma in modo non lineare, ad esempio, la migliore linea retta forma darà un povero R al quadrato.