+ All Categories
Home > Documents > Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare...

Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare...

Date post: 14-Jun-2020
Category:
Upload: others
View: 10 times
Download: 0 times
Share this document with a friend
50
Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18 G. Rossi (Dip. Psicologia) Psico 2017-18 1 / 45
Transcript
Page 1: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Psicometria con Laboratorio di SPSS 2Regressione lineare multipla(vers. 1.6, 23 marzo 2018)

Germano Rossi1

[email protected]

1Dipartimento di Psicologia, Università di Milano-Bicocca

2017-18

G. Rossi (Dip. Psicologia) Psico 2017-18 1 / 45

Page 2: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Regressione lineare multipla

Analoga a quellasemplice

Una sola variabiledipendente (Y) o daspiegare

Due o più variabiliindipendenti (X) opredittive, esplicative

Regressione lineare semplice (1 dip, 1 indip)

Yi = b0 + b1X1i + b2X2i + ei

intercetta pendenza indipendente errore

Yi = a + bXi + ei

Regressione lineare multipla (2 indip, 1 dip)

intercetta o costante

pendenza o coeff. di regressione

G. Rossi (Dip. Psicologia) Psico 2017-18 2 / 45

Page 3: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Regressione come modello generale

All’equazione della retta

Yi = 𝛽0 + 𝛽1Xi oppure Yi = a + bXi <- 1 VI

possiamo aggiungere più variabili esplicative quantitative

Yi = 𝛽0 + 𝛽1X1i + 𝛽2X2i <- 2 VIYi = 𝛽0 + 𝛽1X1i + 𝛽2X2i + 𝛽3X3i <- 3 VI

oppure variabili categoriali dicotomiche (0,1) [uso D per evidenziare]

Yi = 𝛽0 + 𝛽1X1i + 𝛽2D2i <- 1 Qt, 1 dicot

e con un’interazione (con I=XD]

Yi = 𝛽0 + 𝛽1X1i + 𝛽2D2i + 𝛽3I3i <- 1 Qt, 1 dicot, 1 inter

G. Rossi (Dip. Psicologia) Psico 2017-18 3 / 45

Page 4: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Regressione multipla: verso il matriciale

Yi = b0 + b1X1i + b2X2i + ei

Y X1 X2 Y = b0 + X1ib1 + X2ib2 + e3 2 1 3 = 1b0 + 2b1 + 1b2 + e12 3 5 2 = 1b0 + 3b1 + 5b2 + e24 5 3 4 = 1b0 + 5b1 + 3b2 + e35 7 6 5 = 1b0 + 7b1 + 6b2 + e48 8 7 8 = 1b0 + 8b1 + 7b2 + e5

Ipotizziamo di lavorare con 1 Y (variabile dipendente) e 2 X (variabili predittive oindipendenti)

Per ogni caso statistico, sostituiamo i valori nell’equazione generale

La costante (b0) viene idealmente moltiplicata per 1

Per ogni caso statistico, sostituiamo i valori nell’equazione generale

G. Rossi (Dip. Psicologia) Psico 2017-18 4 / 45

Page 5: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Regressione multipla: verso il matriciale

Yi = b0 + b1X1i + b2X2i + ei

Y X1 X2 Y = b0 + X1ib1 + X2ib2 + e3 2 1 3 = 1b0 + 2b1 + 1b2 + e12 3 5 2 = 1b0 + 3b1 + 5b2 + e24 5 3 4 = 1b0 + 5b1 + 3b2 + e35 7 6 5 = 1b0 + 7b1 + 6b2 + e48 8 7 8 = 1b0 + 8b1 + 7b2 + e5

Ipotizziamo di lavorare con 1 Y (variabile dipendente) e 2 X (variabili predittive oindipendenti)

Per ogni caso statistico, sostituiamo i valori nell’equazione generale

La costante (b0) viene idealmente moltiplicata per 1

Per ogni caso statistico, sostituiamo i valori nell’equazione generale

G. Rossi (Dip. Psicologia) Psico 2017-18 4 / 45

Page 6: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Regressione multipla matriciale

Passando al matriciale, abbiamo vettori e matrici:⎡⎢⎢⎢⎢⎣32458

⎤⎥⎥⎥⎥⎦ =

⎡⎢⎢⎢⎢⎣1 2 11 3 51 5 31 7 61 8 7

⎤⎥⎥⎥⎥⎦⎡⎣b0

b1b2

⎤⎦ +

⎡⎢⎢⎢⎢⎣e1e2e3e4e5

⎤⎥⎥⎥⎥⎦5× 1 5× 3 3× 1 5× 1

y = X b + e

Ignoriamo gli errori (e)

b è il vettore dei parametri incogniti

In algebra, per trovare b useremmo y/Xma in algebra matriciale la “divisione” diventa un”’inversa” (indicata con −1)

G. Rossi (Dip. Psicologia) Psico 2017-18 5 / 45

Page 7: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Regressione multipla matriciale

b = (X′X)−1X′y

⎛⎜⎜⎜⎜⎝⎡⎣1 1 1 1 1

2 3 5 7 81 5 3 6 7

⎤⎦⎡⎢⎢⎢⎢⎣

1 2 11 3 51 5 31 7 61 8 7

⎤⎥⎥⎥⎥⎦⎞⎟⎟⎟⎟⎠

−1 ⎡⎣1 1 1 1 12 3 5 7 81 5 3 6 7

⎤⎦⎡⎢⎢⎢⎢⎣

32458

⎤⎥⎥⎥⎥⎦⎡⎣ 5 25 22

25 151 13022 130 120

⎤⎦−1 ⎡⎣ 22131111

⎤⎦ =

⎡⎣ 0.501

−0.25

⎤⎦b0b1b2

Yi = .50 + 1X1i + (−.25)X2i

G. Rossi (Dip. Psicologia) Psico 2017-18 6 / 45

Page 8: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Regressione multipla matriciale

X′X =

⎡⎢⎢⎣N

∑X1

∑X2∑

X1∑

X 21

∑X1X2∑

X2∑

X1X2∑

X 22

⎤⎥⎥⎦ X′y =

⎡⎢⎢⎣∑

Y∑X1Y∑X2Y

⎤⎥⎥⎦Più in generale, date n variabili indipendenti, X’X e X’y diventeranno:

X′X =

⎡⎢⎢⎢⎢⎣N

∑X1 · · ·

∑Xn∑

X1∑

X 21 · · ·

∑X1Xn

· · · · · · · · · · · ·∑Xn

∑X1Xn · · ·

∑X 2

n

⎤⎥⎥⎥⎥⎦ X′y =

⎡⎢⎢⎢⎢⎣∑

Y∑X1Y· · ·∑XnY

⎤⎥⎥⎥⎥⎦

G. Rossi (Dip. Psicologia) Psico 2017-18 7 / 45

Page 9: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Percorsi causali/relazionali

ZY

X

a

bc

Influenza diretta = percorso semplice (Z → Y = a, Z → X = b,X → Y = c)Influenza indiretta = percorso composto (Z → X → Y = bc) conanche le covarianzeIl valore di un’influenza indiretta è pari al prodotto delle influenzesemplici

G. Rossi (Dip. Psicologia) Psico 2017-18 8 / 45

Page 10: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Percorsi causali/relazionali

ZY

X

a

bc

Influenza diretta = percorso semplice (Z → Y = a, Z → X = b,X → Y = c)Influenza indiretta = percorso composto (Z → X → Y = bc) conanche le covarianzeIl valore di un’influenza indiretta è pari al prodotto delle influenzesemplici

G. Rossi (Dip. Psicologia) Psico 2017-18 8 / 45

Page 11: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Percorsi causali/relazionali

ZY

X

a

bc

Influenza diretta = percorso semplice (Z → Y = a, Z → X = b,X → Y = c)Influenza indiretta = percorso composto (Z → X → Y = bc) conanche le covarianzeIl valore di un’influenza indiretta è pari al prodotto delle influenzesemplici

G. Rossi (Dip. Psicologia) Psico 2017-18 8 / 45

Page 12: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Percorsi causali/relazionali

ZY

X

a

bc

Influenza diretta = percorso semplice (Z → Y = a, Z → X = b,X → Y = c)Influenza indiretta = percorso composto (Z → X → Y = bc) conanche le covarianzeIl valore di un’influenza indiretta è pari al prodotto delle influenzesemplici

G. Rossi (Dip. Psicologia) Psico 2017-18 8 / 45

Page 13: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Percorsi causali/relazionali

ZY

X

a

bc

Influenza diretta = percorso semplice (Z → Y = a, Z → X = b,X → Y = c)Influenza indiretta = percorso composto (Z → X → Y = bc) conanche le covarianzeIl valore di un’influenza indiretta è pari al prodotto delle influenzesemplici

G. Rossi (Dip. Psicologia) Psico 2017-18 8 / 45

Page 14: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Percorsi causali/relazionali

X1

X2

Y.40

b*1

.50b*

2

.65

.50

.70

Uso 1 anziché X1 e 2 anziché X2

r1y = b*1 + b*

2r12

r2y = b*2 + b*

1r12

b*1 = r1y − r12b*

2 = .65− .50b*2

b*2 = r2y − r12b*

1 = .70− .50b*1

La correlazione fra 2 variabili è la somma delle influenze dirette eindirette delle due variabili

G. Rossi (Dip. Psicologia) Psico 2017-18 9 / 45

Page 15: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Percorsi causali/relazionali

Considerando che la correlazione di una variabile con se stessa è 1

ry1 = b*1 + b*

2r12 = b*1r11 + b*

2r12 = b*1r11 + b*

2r12

ry2 = b*2 + b*

1r12 = b*2r22 + b*

1r12 = b*1r12 + b*

2r22

[ry1ry2

]=

[r11 r12r12 r22

] [b*

1b*

2

]

ryx = Rxxb*yx

b*yx = R−1

xx ryx

G. Rossi (Dip. Psicologia) Psico 2017-18 10 / 45

Page 16: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Regressione matriciale

Ci sono tre formule alternative

Dati grezzi b = (X′X)−1X′y

Varianze/covarianze b = C−1xx cyx

Correlazioni b* = R−1xx ryx

Cxx è la matrice delle varianze/covarianze fra le Xcyx è il vettore delle covarianze fra la Y e le XRxx è la matrice delle correlazioni fra le Xryx è il vettore delle correlazioni fra la Y e le X

G. Rossi (Dip. Psicologia) Psico 2017-18 11 / 45

Page 17: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Calcoliamo

Y X1 X2 Y2 X 21 X 2

2 X1Y X2Y X1X23 2 1 9 4 1 6 3 22 3 5 4 9 25 6 10 154 5 3 16 25 9 20 12 155 7 6 25 49 36 35 30 428 8 7 64 64 49 64 56 56

22 25 22 118 151 120 131 111 130 somme4,4 5 4,4 medie

5,3 6,5 5,8 5,25 3,55 5,0 var/cov.894 .640 .814 cor

var =

∑x2 − (

∑x)2

NN − 1

cov =

∑xy −

∑x∑

yN

N − 1cor =

cov(xy)√var(x)var(y)

G. Rossi (Dip. Psicologia) Psico 2017-18 12 / 45

Page 18: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Esempio con le covarianze

Varianze e covarianze calcolate con N − 1

Cxx =

[6.5 5.05.0 5.8

]cyx =

[5.253.55

]1

12.7

[5.8 −5.0−5.0 6.5

] [5.253.55

]=

[1.00−0.25

]← b1← b2

b0 = Y −∑

(bi Xi) = 4.4− 1(5)− (−.25)4.4 = 0.5

Yi = .50 + 1X1i + (−.25)X2i

G. Rossi (Dip. Psicologia) Psico 2017-18 13 / 45

Page 19: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Esempio con le correlazioni

Rxx =

[1 .814

.814 1

]ryx =

[.894.640

]

10.337

[1 −.814

−.814 1

] [.894.640

]=

[1.107−0.261

]← b*

1← b*

2

b0 = 0

zYi= 1.107zX1i + (−.261)zX2i

G. Rossi (Dip. Psicologia) Psico 2017-18 14 / 45

Page 20: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Standardizzare/destandardizzare

Con i dati dell’esempio precedente

byxi = b*yxi

sy

sxi

1 = 1.107√

5.3√6.5

− 0.25 = −.261√

5.3√5.8

b*yxi

= byxi

sxi

sy1.107 = 1

√6.5√5.3

− 0.261 = −.25√

5.8√5.3

G. Rossi (Dip. Psicologia) Psico 2017-18 15 / 45

Page 21: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Proporzione di varianza spiegata

R2 = (ryy )2 =

(spiegata)totale

=

∑(Y − Y )2∑(Y − Y )2

=

∑(Y − Y )2 −

∑(Y − Y )2∑

(Y − Y )2

= ry1b*1.2 + ry2b*

2.1 =∑

(ryib*i )

con 2 X generico

ryx =

[.894.640

]b* =

[1.107−0.261

]R2 = (.894 * 1.107) + (.640 * −.261)

G. Rossi (Dip. Psicologia) Psico 2017-18 16 / 45

Page 22: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Test di significatività

Sono i test che facciamo per verificare i passaggi dell’analisia) un test globale: che include tutte le variabili

Se il test globale è significativob) un test per ciascuna variabile indipendente (per ogni X)

Anche se il modello globale è significativo, questo non significache tutte le X siano significativamente associate a Y

G. Rossi (Dip. Psicologia) Psico 2017-18 17 / 45

Page 23: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Test globale

Nel test globale si fa un confronto fra il modello studiato e il modellonullo

nullo (ristretto) Y = b0 + e gdl=N-1completo Y = b0 + b1X1 + b2X2 + e gdl=N-3

con N=numero di soggetti; 1 e 3 sono il numero di parametri

L’ipotesi nulla è H0: b1 = b2 = 0

Usiamo la statistica F di Snedecor (rapporto di varianze) tramiteun’analisi della varianza (Anova)

Se è significativa, c’è una relazione consistente fra le X e la Y; laregressione ha senso. N.B.: In genere è significativa

G. Rossi (Dip. Psicologia) Psico 2017-18 18 / 45

Page 24: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Test globale

F =(R2

f − R2r )/(df − dr )

(1− R2f )/df

=

∑(Y − Y )2 −

∑(Y − Y )2/(dr − df )∑

(Y − Y )2/df

=R2

f /k(1− R2

f )/(N − k − 1)

vale anche per i testparziali; f=full (completo);r=ristretto [R2 = 0 per ilmodello nullo]

k=numero di variabiliindipendenti (X)

R2 tende ad aumentare al numero delle X, quindi viene “aggiustato”

R2Adj = R2 − (1− R2)

kN − k − 1

G. Rossi (Dip. Psicologia) Psico 2017-18 19 / 45

Page 25: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Test globale

Riepilogo del modello

Modello R R-quad R-quad corr Err. std. stima

1 ,908(a) 0,824 0,821 14,87675a. Stimatori: (Costante), rwait, oEsSoc, oEsPers, Pacific, oIntrins, Ricercab. Variabile dipendente: Fondam

La variabile Fondam viene spiegata da 6 variabili

R è la correlazione fra tutte le variabili X e la Y (correlazione multipla)

R-quad è la correlazione al quadrato (R2)

R-quad corr è la versione corretta dell’R2

G. Rossi (Dip. Psicologia) Psico 2017-18 20 / 45

Page 26: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Test globale

ANOVA(b)

Modello Somma quad. df Media quad. F Sig.

1 Regress. 290.770,441 6 48.461,740 218,969 ,000(a)Residuo 61.968,960 280 221,318

Totale 352.739,401 286a. Stimatori: (Costante), rwait, oEsSoc, oEsPers, Pacific, oIntrins, Ricercab. Variabile dipendente: Fondam

F =.824/6

(1− .824)/(287− 6− 1)= 218.484 F =

48461.740221.318

= 218.969

R2 = .284

G. Rossi (Dip. Psicologia) Psico 2017-18 21 / 45

Page 27: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Test per ciascuna X

ristretto Y = b0 + b1X1 + e gdl=N-2completo Y = b0 + b1X1 + b2X2 + e gdl=N-3

con N=numero di soggetti; 2 e 3 sono il numero di parametri

L’ipotesi nulla è H0: b2 = 0

Potremmo usare ancora la statistica F di Snedecor (rapporto divarianze)

La maggior parte dei programmi utilizza un semplice t-test. Se il test èsignificativo, la Xn considerata, può stare nel modello, altrimenti sidovrebbe togliere.

t =bi

sy .i=

parametroerr. della stima

G. Rossi (Dip. Psicologia) Psico 2017-18 22 / 45

Page 28: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Test per ciascuna X

Coefficienti(a)

Modello Coef. non stand. Coef. stand. t Sig.B Err. std. Beta

1 (Costante) 66,265 14,455 4,584 0,000Pacific -0,383 0,106 -0,104 -3,619 0,000

oIntrins 2,195 0,177 0,437 12,385 0,000oEsPers 0,351 0,365 0,028 0,962 0,337oEsSoc 0,179 0,366 0,013 0,489 0,625Ricerca -0,456 0,058 -0,306 -7,845 0,000

rwait 0,702 0,102 0,247 6,880 0,000a. Variabile dipendente: Fondam

t =2.1950.177

= 12.385Ci sono 2 variabili che non servono(Sig > .05): oEsPers e oEsSoc

Il Coef. stand. è la relazione della X con la Y depurata del contributo dellealtre

G. Rossi (Dip. Psicologia) Psico 2017-18 23 / 45

Page 29: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Collinearità

La situazione ideale per unaregressione multipla dovrebbeessere: ogni X è altamentecorrelata con Y, ma le X non sonocorrelate fra loro

X1 X2 X3

Y .60 .50 .70X1 .20 .30X2 .20

Idealmente, le correlazioni trale X, dovrebbero essere 0in questo modo b* coincideràcon r e non con r parzializzatoè una situazione che capitararamente

G. Rossi (Dip. Psicologia) Psico 2017-18 24 / 45

Page 30: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Multicollinearità

Spesso, due o più X sono correlatefra loro

X1 X2 X3

Y .60 .50 .70X1 .70 .30X2 .20

Quando due variabili X o più,sono tra loro correlate(moderatamente o più),parliamo di multicollinearitàche può essere più o menograve

G. Rossi (Dip. Psicologia) Psico 2017-18 25 / 45

Page 31: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Multicollinearità

ProblemiFa aumentare l’errore standard della stimalimita la R multipla: se A<–>B, ciascuna spiegherebbe una certaparte di Y, ma se A e B spiegano una stessa parte di varianza....l’effetto dei predittori si confonde: se A viene usato per prima, Bnon spiega più niente (e viceversa)aumenta la varianza e l’instabilità dell’equazione

Riconoscere la collinearitàDopo aver deciso il modello da studiare:Ispezione della matrice di correlazioneStatistiche della collinearità

G. Rossi (Dip. Psicologia) Psico 2017-18 26 / 45

Page 32: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Multicollinearità: statistiche

Variance inflation factor (VIF)

Indice di Tolleranza: (1/VIF)

Interpretazione (non ci sono valore“significativi”)

VIF > 10 (c’è multicollinearità)

VIF > 1 (è possibile che ci sia)

Tolleranza < .1 (grossi problemi)

Tolleranza < .2 (potenzialmenteproblematico)

VIF <=1 OK;

Tolerance >=.2 OK

G. Rossi (Dip. Psicologia) Psico 2017-18 27 / 45

Page 33: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Multicollinearità

Diminuire la multicollinearitàcombinare fra loro i predittori altamente correlati (ad esempiosommandoli)eliminare un predittore molto correlato con un altrofra più predittori altamente correlati, eliminare quello menocorrelato con la Yse ci sono molti predittori altamente correlati, usare un’analisidelle componenti principali per ridurre il numero delle X

G. Rossi (Dip. Psicologia) Psico 2017-18 28 / 45

Page 34: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Multicollinearità: utopia

Matrice di covarianzeY G H V W

Y 4.41G 1.89 1.44H 1.26 0.96 2.25V 1.96 0 0 4.00W 0.63 0 0 0.80 1

Notiamo che G e H noncorrelano con V e WQuindi se calcoloY = b0 + b1H + b2V troveròesattamente gli stessiparametri di Y = b0 + b1H e diY = b0 + b2V

usando il calcolo matriciale[2.25 0

0 4.0

]−1 [1.261.96

]=

[0.560.49

]Ipotizzando due regressioni semplici (separate):

bH =cov(YH)

var(H)=

1.262.25

= 0.56 bV =1.96

4= 0.49

G. Rossi (Dip. Psicologia) Psico 2017-18 29 / 45

Page 35: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Scelta dei predittori

Usare la teoria: Si usano solo variabili teoricamente sensate; lasensatezza può essere ricavata, oltre che dalla logica, da unaricerca bibliograficaQuindi:Standard (Inserisci): Tutte le variabili vengono inserite in un colposoloSeguendo la teoria, si decidono i blocchi da utilizzare (gerarchica)Oppure:Metodi semi-automatici sequenzialiForward (Avanti): Le variabili X vengono inserite una alla voltaBackward (Indietro): Vengono inserite tutte e poi cancellate unaalla voltaStepwise (a passi): Si inizia con un blocco di variabili e poi siinseriscono o si tolgono una alla volta

G. Rossi (Dip. Psicologia) Psico 2017-18 30 / 45

Page 36: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Inserimento dei predittori: Inserisci

metodo standard o Inserisci: Tutte le X vengono inserite assiemee tutti i coefficienti di regressione (B o beta) stimaticontemporaneamente (come negli esempi che abbiamo calcolatocon 2 X)

G. Rossi (Dip. Psicologia) Psico 2017-18 31 / 45

Page 37: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Inserimento dei predittori: Avanti

Forward o In avanti: Le variabili X vengono inserite una alla volta (in genere la Xcon la correlazione XY più alta) e vengono poi calcolate le correlazioni parziali ei test di significatività di tutte le altre.

Una nuova variabile viene inserita se risulta statisticamente associata al modello

Ci si ferma quando non ci sono più variabili significative

G. Rossi (Dip. Psicologia) Psico 2017-18 32 / 45

Page 38: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Inserimento dei predittori: Indietro

Backword o Indietro: Le X vengono inserite tutte assieme e poipian piano tolte se non risultano significative al t-testCi si ferma quando tutte le non significative sono state tolte

G. Rossi (Dip. Psicologia) Psico 2017-18 33 / 45

Page 39: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Inserimento dei predittori: a passi

Stepwise o per passi: Si parte con “alcune” variabili X o con la Xmaggiormente associata alla YLe altre X vengono inserite, tolte o ignorate a seconda della loroimportanza e significatività statistica aggiuntivaIl modello finale identificato “dovrebbe” essere il migliore (ma èmolto legato alle caratteristiche del campione...)

G. Rossi (Dip. Psicologia) Psico 2017-18 34 / 45

Page 40: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Ordine dei predittori

SE le variabili X sono pochissimo correlate fra loro, l’ordine hapoca importanza.SE sono correlate, usare le variabili maggiormente associate ad Yin letteratura;Inserendole nell’ordine decrescente di efficacia indicata inletteratura.Preferibilmente, usare l’approccio gerarchicoSi inseriscono nel primo blocco le variabili maggiormenteassociate in letteratura/teoriasuccessivamente si inseriscono altre variabili (in blocchisuccessivi)

G. Rossi (Dip. Psicologia) Psico 2017-18 35 / 45

Page 41: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

In SPSS

Analizza | Regressione | Lineare...

Trasferite in Dipendente la variabile che volete spiegare (la Y)Trasferite in Indipendenti tutte le variabili che volete usare perspiegare (le diverse X)

G. Rossi (Dip. Psicologia) Psico 2017-18 36 / 45

Page 42: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

In SPSS

Per una regressione standard: verificare che Metodo siaimpostato su Inserisci

Per una forward: impostare Metodo su Avanti

Per una backward: impostare Metodo su Indietro

Per una stepwise: impostare Metodo su Per passi (v.24)

G. Rossi (Dip. Psicologia) Psico 2017-18 37 / 45

Page 43: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

In SPSS

Click-ate su Statistiche...

Selezionate almeno: Diagnostiche di collinearità e Correlazioni diordine zero e parzialiA piacere selezionate Intervalli di confidenza

Poi Continua e OK

G. Rossi (Dip. Psicologia) Psico 2017-18 38 / 45

Page 44: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Correlazioni multiple e parziali

Y

X1

X2

a

bc

I cerchi rappresentano le co-varianze incomune fra le diverse variabiliCon tre variabili, R2 corrisponde a(a + b + c) cioè la varianza che Y ha incomune con X1 e X2

la correlazione multipla è quindi√R2 =

√a + b + c; tutto il resto dell’area

di Y è la varianza non spiegata (1− R2)

Correlazione parziale: sovrapposizione fra Y e X1 (√

a + c) ofra Y e X2 (

√b + c)

Correlazione semiparziale: solo la parte unica di sovrapposizionefra Y e X1 (

√a) o fra Y e X2 (

√b)

G. Rossi (Dip. Psicologia) Psico 2017-18 39 / 45

Page 45: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Correlazione multipla

È la correlazione di una variabile (Y) con 2 o più variabili (X1, X2,...) contemporaneamente (oscilla fra −1 e +1)

R =

√r212 + r2

13 − 2r12r13r23

1− r223

dover12 è la correlazione fra le variabili1 e 2;r13 fra la 1 e la 3... er1.23 è la correlazione multipla (R)

r 1-RSE 2-SWLS

2-SWLS .520 -3-RifAccet .634 .593

R =√.5202 + .6342 − 2 × .520 × .634 × .593

1 − .5932

= .659

In SPSS si ottiene solo come sottoprodotto della regressione linearemultipla

G. Rossi (Dip. Psicologia) Psico 2017-18 40 / 45

Page 46: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Correlazione parziale

È la correlazione di due variabili a cui viene “tolta”(contemporaneamente) l’influenza di una terza variabile.Es. correlazione fra “numero di parole conosciute” e “intelligenza”parzializzata in base all’età (tolto il contributo dell’età). Se l’età ècorrelata con una delle due, la correlazione diminuirà.

pr12.3 = r12.3 =r12 − r13r23√

(1− r213)(1− r2

23)

dover12 è la correlazione fra le variabili 1 e 2;r13 fra la 1 e la 3... er12.3 è la correlazione fra 1 e 2parzializzata sulla 3

Rp =.520− .634× .593√(1− .6342)(1− .5932)

= .231

In SPSS si ottiene in Correlazione o in Regressione lineare multipla

G. Rossi (Dip. Psicologia) Psico 2017-18 41 / 45

Page 47: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Correlazione semi-parziale

È la correlazione fra due variabili, ma solo ad una delle due èstato tolto il contributo di una terza.Es. correlazione fra “numero di parole conosciute” e “intelligenza”.La parzializzazione in base all’età viene attuata solo con il numerodi parole.

sr12.3 = r1(2.3) =r12 − r13r23√

1− r223

dove r12 è la correlazione fra le variabile 1e 2, r13 fra la prima e la terza e così via

Rsp =.520− .634× .593√

1− .5932= .178

In SPSS si ottiene solo in Regressione lineare multipla

G. Rossi (Dip. Psicologia) Psico 2017-18 42 / 45

Page 48: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Correlazioni parziali in SPSS

1 Analizza | Correlazione | Parziale...

2 Analizza | Regressione | Lineare..., bottoneStatistiche, segnare Correlazioni di ordine zero eparziale

1 Calcola la correlazione di più variabili, parzializzate su un’altravariabile (identica per tutte)

2 Mentre effettua una regressione multipla, calcola la correlazione(ordine 0) fra ogni singola indipendente con la Y e quindiparzializza questa correlazione con tutte le altre indipendenti(parziale e semiparziale [parziale indipendenti])

G. Rossi (Dip. Psicologia) Psico 2017-18 43 / 45

Page 49: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Correlazioni parziali

R =

√.5202 + .6342 − 2× .520× .634× .593

1− .5932 = .659

Rp =.520− .634× .593√(1− .6342)(1− .5932)

= .231

Rsp =.520− .634× .593√

1− .5932= .178

G. Rossi (Dip. Psicologia) Psico 2017-18 44 / 45

Page 50: Psicometria con Laboratorio di SPSS 2 · Psicometria con Laboratorio di SPSS 2 Regressione lineare multipla (vers. 1.6, 23 marzo 2018) Germano Rossi1 germano.rossi@unimib.it 1Dipartimento

Residui

I residui (e = Y − Y ) dovrebbero essere dispersi casualmente

attorno a YSe non sono dispersi casualmente, esiste un’altra variabile X chepuò spiegarne una parte, oppure la relazione non è lineare

G. Rossi (Dip. Psicologia) Psico 2017-18 45 / 45


Recommended