+ All Categories
Home > Documents > Regresión Lineal

Regresión Lineal

Date post: 14-Dec-2015
Category:
Upload: alexis-laguna
View: 229 times
Download: 3 times
Share this document with a friend
Description:
.
Popular Tags:
18
INSTITUTO TECNOLÓGICO DE CANCÚN Tema: “Regresión Lineal” Alumno: . Carrera: Ingeniería en sistemas computacionales Materia: Probabilidad y Estadística Maestro: .
Transcript

INSTITUTO TECNOLÓGICO DE CANCÚN

Tema: “Regresión Lineal”

Alumno:.

Carrera:Ingeniería en sistemas computacionales

Materia:Probabilidad y Estadística

Maestro:.

Cancún, Quintana Roo a 15 de junio del 2015

REGRESIÓN LINEAL

Ejemplo 1. Determine el modelo de regresión lineal para un conjunto de 20

mediciones de temperaturas (considere valores negativos).

Los ejercicios debe contener:

1. Grafica de dispersión

2. Ecuación de regresión lineal

3. Covarianza SXY

4. Coeficiente de correlación lineal r

5. Coeficiente de determinación r2

6. Los residuales (grafica)

7. Error estándar del estimador

8. Estimar dos aproximaciones de temperatura y usar el error estándar para definir margen de confiabilidad

Datos:

Temperatura muestreada

Temperatura Celsius(X)

Temperatura Fahrenheit

(Y)1 3 37.42 -7 19.43 36 96.84 22 71.65 -21 -5.86 5 417 36 96.88 21 69.89 12 53.6

10 18 64.411 -52 -61.612 43 109.413 26 78.814 -35 -3115 32 89.616 11 51.817 39 102.218 -5 2319 15 5920 33 91.4

232 1057.6

1. CONSTRUCCIÓN DEL DIAGRAMA DE DISPERSIÓN.

-60 -40 -20 0 20 40 60

-80

-60

-40

-20

0

20

40

60

80

100

120

Diagrama de dispersión

Temperatura celsius X

Tem

per

atu

ra fa

hre

nh

eit

Y

2. ECUACIÓN DE REGRESIÓN LINEAL.

Temperatura muestreada

Temperatura Celsius(X)

Temperatura Fahrenheit

(Y)XY X2 Y2

1 3 37.4 112.2 9 1398.762 -7 19.4 -135.8 49 376.363 36 96.8 3484.8 1296 9370.244 22 71.6 1575.2 484 5126.565 -21 -5.8 121.8 441 33.646 5 41 205 25 16817 36 96.8 3484.8 1296 9370.248 21 69.8 1465.8 441 4872.049 12 53.6 643.2 144 2872.96

10 18 64.4 1159.2 324 4147.3611 -52 -61.6 3203.2 2704 3794.5612 43 109.4 4704.2 1849 11968.3613 26 78.8 2048.8 676 6209.4414 -35 -31 1085 1225 96115 32 89.6 2867.2 1024 8028.1616 11 51.8 569.8 121 2683.2417 39 102.2 3985.8 1521 10444.8418 -5 23 -115 25 529

19 15 59 885 225 348120 33 91.4 3016.2 1089 8353.96

232 1057.6 34366.4 14968 95702.72

Media:

X=∑ X

n=23220

=11.6

Y=∑ Yn

=1057 .620

=52.88

Por lo tanto:

b=∑ XY−n X Y

∑ X 2−n X 2=

(34366 .4 )−(20 ) (11.6 ) (52.88 )14968−(20 ) (11.6 )2

=22098 .2412276 .8

=1.8

a=Y−b X=52 .88−(1 .8 ) (11.6 )=32

La ecuación de regresión es:

Y=a+bX=32+1.8 X

-60 -40 -20 0 20 40 60

-80

-60

-40

-20

0

20

40

60

80

100

120

Diagrama de dispersión

Temperatura celsius X

Tem

per

atu

ra fa

hre

nh

eit

Y

3. COVARIANZA SXY

Temperatura muestreada

Temperatura Celsius(X)

Temperatura Fahrenheit (Y) X-X Y-Y (X-X )(Y-Y )

1 3 37.4 -8.6 -15.48 133.1282 -7 19.4 -18.6 -33.48 622.7283 36 96.8 24.4 43.92 1071.6484 22 71.6 10.4 18.72 194.6885 -21 -5.8 -32.6 -58.68 1912.9686 5 41 -6.6 -11.88 78.4087 36 96.8 24.4 43.92 1071.6488 21 69.8 9.4 16.92 159.0489 12 53.6 0.4 0.72 0.288

10 18 64.4 6.4 11.52 73.72811 -52 -61.6 -63.6 -114.48 7280.92812 43 109.4 31.4 56.52 1774.72813 26 78.8 14.4 25.92 373.24814 -35 -31 -46.6 -83.88 3908.80815 32 89.6 20.4 36.72 749.08816 11 51.8 -0.6 -1.08 0.64817 39 102.2 27.4 49.32 1351.36818 -5 23 -16.6 -29.88 496.00819 15 59 3.4 6.12 20.80820 33 91.4 21.4 38.52 824.328

232 1057.6 0 0 22098.24

SXY=∑i=1

n

[ (X i− X ) (Y i−Y ) ]n

SXY=22098 .2420

=1104.912

4. COEFICIENTE DE CORRELACIÓN R.

Se sacan las desviaciones estándar de cada variable:

Sx2=∑ x

i2

n−X 2

Sx2=1496820

−(11.6 )2

Sx2=748 .4−134 .56=613 .84

Sx=√613.84=24 .77

Sy2=∑ y

i2

n−Y 2

Sy2=95702 .7220

−(52 .88)2

Sy2=4785.136−2796 .2944=1988 .8416

Sy√1988 .8416=44 .59

Aplicando la fórmula de coeficiente de correlación r:

r=SXYSX SY

r=1104.912(24 .77 )( 44 .59 )

=1.0

Comparando el resultado con la tabla de coeficiente de correlación

Correlación Relación lineal entre X y Y Pendiente de la

recta

r = 0 Las variables no están relacionadas. No tiene

pendiente

0 < r < 1 Las variables están directamente

relacionadas.

positiva

-1 < r < 0 Las variables están inversamente

relacionadas.

negativa

r = 1 Las variables tienen una correlación

directa perfecta

positiva

r = -1 Las variables tienen una correlación

inversa perfecta

negativa

Podemos decir que nuestro resultado encaja en r=1 Las variables tienen

una correlación directa perfecta.

5. COEFICIENTE DE DETERMINACIÓN R2.

r2= S2XY

S2X S

2Y

r2=(1104 .912)2

(24 .77 )2(44 .59 )2=1220830 .5281219907 .659

=1 .0

6. CÁLCULO DE RESIDUALES Y GRÁFICA DE RESIDUALES

Temperatura muestreada

Temperatura Celsius(X)

Temperatura Fahrenheit

Valor Residual

(Y) ajustado( )( )

1 3 37.4 37.4 02 -7 19.4 19.4 03 36 96.8 96.8 04 22 71.6 71.6 05 -21 -5.8 -5.8 06 5 41 41 07 36 96.8 96.8 08 21 69.8 69.8 09 12 53.6 53.6 0

10 18 64.4 64.4 011 -52 -61.6 -61.6 012 43 109.4 109.4 013 26 78.8 78.8 014 -35 -31 -31 015 32 89.6 89.6 016 11 51.8 51.8 017 39 102.2 102.2 018 -5 23 23 019 15 59 59 020 33 91.4 91.4 0

232 1057.6 1057.6 0

-60 -40 -20 0 20 40 600

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Diagrama residual

Valor ajustado Ŷ

Res

idu

al e

Ye Y Y

7. ERROR ESTÁNDAR DEL ESTIMADOR.

se=√∑ (Y i−Y i)2

n−2

se=√ (0)2

20=0

8. ESTIMAR DOS APROXIMACIONES Y USAR EL ERROR

ESTÁNDAR PARA DEFINIR MARGEN DE CONFIABILIDAD.

Y=a+bX=32+1.8 X

1) 32+1.8(4)=39.2+0=39.2

32+1.8(4)=39.2-0=39.2

2) 32+1.8(42)=107.6+0=107.6

32+1.8(42)=107.6-0=107.6

Ejemplo 2:

Datos:

Trabajador

muestread

o

1 2 3 4 5 6 7 8 9 10 11 12

Semanas

de

experiencia

(X)

7 9 6 14 8 12 10 4 2 11 1 8

Número

de

rechazos

(Y)

26 20 28 16 23 18 24 26 38 22 32 25

1. CONSTRUCCIÓN DEL DIAGRAMA DE DISPERSIÓN.

0 2 4 6 8 10 12 14 160

5

10

15

20

25

30

35

40

Diagrama de dispersión

Número de rechazos

Sem

anas

de

exp

erie

nci

a

2. ECUACIÓN DE REGRESIÓN LINEAL.

Trabajador

muestreado

Semanas de

experiencia(X)

Número de

rechazos(Y) XY X2 Y2

1 7 26 182 49 676

2 9 20 180 81 400

3 6 28 168 36 784

4 14 16 224 196 256

5 8 23 184 64 529

6 12 18 216 144 324

7 10 24 240 100 576

8 4 26 104 16 676

9 2 38 76 4 1444

10 11 22 242 121 484

11 1 32 32 1 1024

12 8 25 200 64 625

92 298 2048 876 7798

Media:

X=∑ X

n=9212

=7 .66

Y=∑ Yn

=29812

=24 .83

Por lo tanto:

b=∑ XY−n X Y

∑ X 2−n X 2=

(2048 )−(12 ) (7.66 ) (24 .83 )876−(12 ) (7 .66 )2

=−234 .3736171 .8928

=−1.363487011≃−1 .4

a=Y−b X=24 .83−(−1 .4 ) (7 .66 )=35 .554≃35.5

La ecuación de regresión es:

Y=a+bX=35 .5+−1 .4 X

0 2 4 6 8 10 12 14 160

5

10

15

20

25

30

35

40

Diagrama de dispersión

Número de rechazos

Sem

anas

de

exp

erie

nci

a

3. COVARIANZA SXY

Trabajador

muestreado

Semanas

de

experiencia

(X)

Número de

rechazos(Y) X-X Y-Y (X-X )(Y-Y )

1 7 26 -0.66 1.17 -0.7722

2 9 20 1.34 -4.83 -6.4722

3 6 28 -1.66 3.17 -5.2622

4 14 16 6.34 -8.83 -55.9822

5 8 23 0.34 -1.83 -0.6222

6 12 18 4.34 -6.83 -29.6422

7 10 24 2.34 -0.83 -1.9244

8 4 26 -3.66 1.17 -4.2822

9 2 38 -5.66 13.17 -74.5422

10 11 22 3.34 -2.83 -9.4522

11 1 32 -6.66 7.17 -47.7522

12 8 25 0.34 0.17 0.0578

-236.6486

SXY=∑i=1

n

[ (X i− X ) (Y i−Y ) ]n

SXY=−236 .648612

=−19 .72

4. COEFICIENTE DE CORRELACIÓN R.

Se sacan las desviaciones estándar de cada variable:

Sx2=∑ x

i2

n−X 2

Sx2=87612

−(7 .66 )2

Sx2=73−58.6756=14 .3244

Sx=√14 .3244=3 .7847

Sy2=∑ y

i2

n−Y 2

Sy2=779812

−(24 .83 )2

Sy2=649 .83−616 .5289=33.3011

Sy√33 .3011=5 .77

Aplicando la fórmula de coeficiente de correlación r:

r=SXYSX SY

r= −19 .72(3.7847 )(5.77 )

=−0 .90

Comparando el resultado con la tabla de coeficiente de correlación

Correlación Relación lineal entre X y Y Pendiente de la

recta

r = 0 Las variables no están relacionadas. No tiene

pendiente

0 < r < 1 Las variables están directamente

relacionadas.

positiva

-1 < r < 0 Las variables están inversamente

relacionadas.

negativa

r = 1 Las variables tienen una correlación

directa perfecta

positiva

r = -1 Las variables tienen una correlación

inversa perfecta

negativa

Podemos decir que nuestro resultado encaja en -1<r<0 Las variables están

inversamente relacionadas con una pendiente negativa.

5. COEFICIENTE DE DETERMINACIÓN R2.

r2= S2XY

S2X S

2Y

r2=(−19 .72 )2

(3 .7847 )2 (5 .77 )2=388 .8784476 .8859

=0 .81

6. CÁLCULO DE RESIDUALES Y GRÁFICA DE RESIDUALES.

Trabajador

muestreado

Semanas de

experiencia(X)

Número de

rechazos(Y)

Valor

ajustado( )

Residual

( )

1 7 26 25.7 0.3

2 9 20 22.9 -2.9

3 6 28 27.1 0.9

4 14 16 15.9 0.1

5 8 23 24.3 -1.3

6 12 18 18.7 -0.7

7 10 24 21.5 2.5

8 4 26 29.9 -3.9

9 2 38 32.7 5.3

10 11 22 20.1 1.9

11 1 32 34.1 -2.1

12 8 25 24.3 0.7

0.8

Y e Y Y

10 15 20 25 30 35 40

-6

-4

-2

0

2

4

6

Diagrama residual

Valor ajustado Ŷ

Res

idu

al e

7. ERROR ESTÁNDAR DEL ESTIMADOR.

se=√∑ (Y i−Y i )2

n−2

se=√ 0 .6410=0.25

8. ESTIMAR DOS APROXIMACIONES Y USAR EL ERROR

ESTÁNDAR PARA DEFINIR MARGEN DE CONFIABILIDAD.

Y=a+bX=35 .5+−1 .4 X

3) 35.5+(-1.4)(3)=31.3+0.25=31.55

35.5+(-1.4)(3)=31.3-0.25=31.05

4) 35.5+(-1.4)(13)=17.3+0.25=17.55

35.5+(-1.4)(13)=17.3-0.25=17.05


Recommended