Proprietà del coefficiente di determinazione

Il coefficiente di determinazione è anche noto come R-squared (R ^ 2). È una misura statistica di quanto bene un modello lineare si adatta un set di dati; il modello potrebbe essere una correlazione o una regressione lineare o un'analisi della varianza. Ci sono anche "pseudo R ^ 2" misure per altre forme di regressione come regressione logistica.

Gamma del coefficiente di determinazione

Il coefficiente di determinazione varia da 0 a 1. 0 indica che non esiste una relazione lineare a tutti, 1 indica che il rapporto è perfetto. Ciò che conta come un coefficiente di "alto" o "buono" varia da un campo. In psicologia, 0.3 è abbastanza alto; in fisica 0.8 è spesso considerato basso.

Che cosa misura il coefficiente di

Il coefficiente di determinazione misura la forza di una relazione lineare. Ma il significato esatto di "relazione lineare" è spesso fonte di confusione per gli studenti. Una relazione lineare è lineare nei parametri. Ad esempio, si potrebbe modellare il peso in soggetti adulti in funzione dell'altezza e altezza al quadrato, ottenere un'equazione di regressione come:

W = b0 + b1H + b2H ^ 2

Dove W è il peso e H è l'altezza e b0, b1 e b2 sono coefficienti da stimare. Si tratta di una regressione lineare, perché nessuno del parametro vengono generati ai poteri.

Coefficiente di determinazione in analisi della varianza

Nell'analisi della varianza (ANOVA), modelli sono sviluppati e valutati basata su somme di piazze o varianze. In qualsiasi insieme di dati quantitativi raccolti su diversi gruppi, si può guardare la varianza totale e la varianza all'interno e tra gruppi. Il coefficiente di determinazione è la somma dei quadrati tra gruppi divisi per la somma totale dei quadrati.

Percentuale di variazione

Un altro modo di guardare il coefficiente di determinazione è che è la percentuale di variazione della variabile dipendente (ciò che stiamo cercando di spiegare) che è rappresentato dal modello. Così, se il coefficiente è 0.8, vuol dire che 80 per cento della variazione della variabile dipendente è rappresentato dal modello.