Date post: | 14-Dec-2015 |
Category: |
Documents |
Upload: | alexis-laguna |
View: | 229 times |
Download: | 3 times |
INSTITUTO TECNOLÓGICO DE CANCÚN
Tema: “Regresión Lineal”
Alumno:.
Carrera:Ingeniería en sistemas computacionales
Materia:Probabilidad y Estadística
Maestro:.
Cancún, Quintana Roo a 15 de junio del 2015
REGRESIÓN LINEAL
Ejemplo 1. Determine el modelo de regresión lineal para un conjunto de 20
mediciones de temperaturas (considere valores negativos).
Los ejercicios debe contener:
1. Grafica de dispersión
2. Ecuación de regresión lineal
3. Covarianza SXY
4. Coeficiente de correlación lineal r
5. Coeficiente de determinación r2
6. Los residuales (grafica)
7. Error estándar del estimador
8. Estimar dos aproximaciones de temperatura y usar el error estándar para definir margen de confiabilidad
Datos:
Temperatura muestreada
Temperatura Celsius(X)
Temperatura Fahrenheit
(Y)1 3 37.42 -7 19.43 36 96.84 22 71.65 -21 -5.86 5 417 36 96.88 21 69.89 12 53.6
10 18 64.411 -52 -61.612 43 109.413 26 78.814 -35 -3115 32 89.616 11 51.817 39 102.218 -5 2319 15 5920 33 91.4
232 1057.6
1. CONSTRUCCIÓN DEL DIAGRAMA DE DISPERSIÓN.
-60 -40 -20 0 20 40 60
-80
-60
-40
-20
0
20
40
60
80
100
120
Diagrama de dispersión
Temperatura celsius X
Tem
per
atu
ra fa
hre
nh
eit
Y
2. ECUACIÓN DE REGRESIÓN LINEAL.
Temperatura muestreada
Temperatura Celsius(X)
Temperatura Fahrenheit
(Y)XY X2 Y2
1 3 37.4 112.2 9 1398.762 -7 19.4 -135.8 49 376.363 36 96.8 3484.8 1296 9370.244 22 71.6 1575.2 484 5126.565 -21 -5.8 121.8 441 33.646 5 41 205 25 16817 36 96.8 3484.8 1296 9370.248 21 69.8 1465.8 441 4872.049 12 53.6 643.2 144 2872.96
10 18 64.4 1159.2 324 4147.3611 -52 -61.6 3203.2 2704 3794.5612 43 109.4 4704.2 1849 11968.3613 26 78.8 2048.8 676 6209.4414 -35 -31 1085 1225 96115 32 89.6 2867.2 1024 8028.1616 11 51.8 569.8 121 2683.2417 39 102.2 3985.8 1521 10444.8418 -5 23 -115 25 529
19 15 59 885 225 348120 33 91.4 3016.2 1089 8353.96
232 1057.6 34366.4 14968 95702.72
Media:
X=∑ X
n=23220
=11.6
Y=∑ Yn
=1057 .620
=52.88
Por lo tanto:
b=∑ XY−n X Y
∑ X 2−n X 2=
(34366 .4 )−(20 ) (11.6 ) (52.88 )14968−(20 ) (11.6 )2
=22098 .2412276 .8
=1.8
a=Y−b X=52 .88−(1 .8 ) (11.6 )=32
La ecuación de regresión es:
Y=a+bX=32+1.8 X
-60 -40 -20 0 20 40 60
-80
-60
-40
-20
0
20
40
60
80
100
120
Diagrama de dispersión
Temperatura celsius X
Tem
per
atu
ra fa
hre
nh
eit
Y
3. COVARIANZA SXY
Temperatura muestreada
Temperatura Celsius(X)
Temperatura Fahrenheit (Y) X-X Y-Y (X-X )(Y-Y )
1 3 37.4 -8.6 -15.48 133.1282 -7 19.4 -18.6 -33.48 622.7283 36 96.8 24.4 43.92 1071.6484 22 71.6 10.4 18.72 194.6885 -21 -5.8 -32.6 -58.68 1912.9686 5 41 -6.6 -11.88 78.4087 36 96.8 24.4 43.92 1071.6488 21 69.8 9.4 16.92 159.0489 12 53.6 0.4 0.72 0.288
10 18 64.4 6.4 11.52 73.72811 -52 -61.6 -63.6 -114.48 7280.92812 43 109.4 31.4 56.52 1774.72813 26 78.8 14.4 25.92 373.24814 -35 -31 -46.6 -83.88 3908.80815 32 89.6 20.4 36.72 749.08816 11 51.8 -0.6 -1.08 0.64817 39 102.2 27.4 49.32 1351.36818 -5 23 -16.6 -29.88 496.00819 15 59 3.4 6.12 20.80820 33 91.4 21.4 38.52 824.328
232 1057.6 0 0 22098.24
SXY=∑i=1
n
[ (X i− X ) (Y i−Y ) ]n
SXY=22098 .2420
=1104.912
4. COEFICIENTE DE CORRELACIÓN R.
Se sacan las desviaciones estándar de cada variable:
Sx2=∑ x
i2
n−X 2
Sx2=1496820
−(11.6 )2
Sx2=748 .4−134 .56=613 .84
Sx=√613.84=24 .77
Sy2=∑ y
i2
n−Y 2
Sy2=95702 .7220
−(52 .88)2
Sy2=4785.136−2796 .2944=1988 .8416
Sy√1988 .8416=44 .59
Aplicando la fórmula de coeficiente de correlación r:
r=SXYSX SY
r=1104.912(24 .77 )( 44 .59 )
=1.0
Comparando el resultado con la tabla de coeficiente de correlación
Correlación Relación lineal entre X y Y Pendiente de la
recta
r = 0 Las variables no están relacionadas. No tiene
pendiente
0 < r < 1 Las variables están directamente
relacionadas.
positiva
-1 < r < 0 Las variables están inversamente
relacionadas.
negativa
r = 1 Las variables tienen una correlación
directa perfecta
positiva
r = -1 Las variables tienen una correlación
inversa perfecta
negativa
Podemos decir que nuestro resultado encaja en r=1 Las variables tienen
una correlación directa perfecta.
5. COEFICIENTE DE DETERMINACIÓN R2.
r2= S2XY
S2X S
2Y
r2=(1104 .912)2
(24 .77 )2(44 .59 )2=1220830 .5281219907 .659
=1 .0
6. CÁLCULO DE RESIDUALES Y GRÁFICA DE RESIDUALES
Temperatura muestreada
Temperatura Celsius(X)
Temperatura Fahrenheit
Valor Residual
(Y) ajustado( )( )
1 3 37.4 37.4 02 -7 19.4 19.4 03 36 96.8 96.8 04 22 71.6 71.6 05 -21 -5.8 -5.8 06 5 41 41 07 36 96.8 96.8 08 21 69.8 69.8 09 12 53.6 53.6 0
10 18 64.4 64.4 011 -52 -61.6 -61.6 012 43 109.4 109.4 013 26 78.8 78.8 014 -35 -31 -31 015 32 89.6 89.6 016 11 51.8 51.8 017 39 102.2 102.2 018 -5 23 23 019 15 59 59 020 33 91.4 91.4 0
232 1057.6 1057.6 0
-60 -40 -20 0 20 40 600
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Diagrama residual
Valor ajustado Ŷ
Res
idu
al e
Ye Y Y
7. ERROR ESTÁNDAR DEL ESTIMADOR.
se=√∑ (Y i−Y i)2
n−2
se=√ (0)2
20=0
8. ESTIMAR DOS APROXIMACIONES Y USAR EL ERROR
ESTÁNDAR PARA DEFINIR MARGEN DE CONFIABILIDAD.
Y=a+bX=32+1.8 X
1) 32+1.8(4)=39.2+0=39.2
32+1.8(4)=39.2-0=39.2
2) 32+1.8(42)=107.6+0=107.6
32+1.8(42)=107.6-0=107.6
Ejemplo 2:
Datos:
Trabajador
muestread
o
1 2 3 4 5 6 7 8 9 10 11 12
Semanas
de
experiencia
(X)
7 9 6 14 8 12 10 4 2 11 1 8
Número
de
rechazos
(Y)
26 20 28 16 23 18 24 26 38 22 32 25
1. CONSTRUCCIÓN DEL DIAGRAMA DE DISPERSIÓN.
0 2 4 6 8 10 12 14 160
5
10
15
20
25
30
35
40
Diagrama de dispersión
Número de rechazos
Sem
anas
de
exp
erie
nci
a
2. ECUACIÓN DE REGRESIÓN LINEAL.
Trabajador
muestreado
Semanas de
experiencia(X)
Número de
rechazos(Y) XY X2 Y2
1 7 26 182 49 676
2 9 20 180 81 400
3 6 28 168 36 784
4 14 16 224 196 256
5 8 23 184 64 529
6 12 18 216 144 324
7 10 24 240 100 576
8 4 26 104 16 676
9 2 38 76 4 1444
10 11 22 242 121 484
11 1 32 32 1 1024
12 8 25 200 64 625
92 298 2048 876 7798
Media:
X=∑ X
n=9212
=7 .66
Y=∑ Yn
=29812
=24 .83
Por lo tanto:
b=∑ XY−n X Y
∑ X 2−n X 2=
(2048 )−(12 ) (7.66 ) (24 .83 )876−(12 ) (7 .66 )2
=−234 .3736171 .8928
=−1.363487011≃−1 .4
a=Y−b X=24 .83−(−1 .4 ) (7 .66 )=35 .554≃35.5
La ecuación de regresión es:
Y=a+bX=35 .5+−1 .4 X
0 2 4 6 8 10 12 14 160
5
10
15
20
25
30
35
40
Diagrama de dispersión
Número de rechazos
Sem
anas
de
exp
erie
nci
a
3. COVARIANZA SXY
Trabajador
muestreado
Semanas
de
experiencia
(X)
Número de
rechazos(Y) X-X Y-Y (X-X )(Y-Y )
1 7 26 -0.66 1.17 -0.7722
2 9 20 1.34 -4.83 -6.4722
3 6 28 -1.66 3.17 -5.2622
4 14 16 6.34 -8.83 -55.9822
5 8 23 0.34 -1.83 -0.6222
6 12 18 4.34 -6.83 -29.6422
7 10 24 2.34 -0.83 -1.9244
8 4 26 -3.66 1.17 -4.2822
9 2 38 -5.66 13.17 -74.5422
10 11 22 3.34 -2.83 -9.4522
11 1 32 -6.66 7.17 -47.7522
12 8 25 0.34 0.17 0.0578
-236.6486
SXY=∑i=1
n
[ (X i− X ) (Y i−Y ) ]n
SXY=−236 .648612
=−19 .72
4. COEFICIENTE DE CORRELACIÓN R.
Se sacan las desviaciones estándar de cada variable:
Sx2=∑ x
i2
n−X 2
Sx2=87612
−(7 .66 )2
Sx2=73−58.6756=14 .3244
Sx=√14 .3244=3 .7847
Sy2=∑ y
i2
n−Y 2
Sy2=779812
−(24 .83 )2
Sy2=649 .83−616 .5289=33.3011
Sy√33 .3011=5 .77
Aplicando la fórmula de coeficiente de correlación r:
r=SXYSX SY
r= −19 .72(3.7847 )(5.77 )
=−0 .90
Comparando el resultado con la tabla de coeficiente de correlación
Correlación Relación lineal entre X y Y Pendiente de la
recta
r = 0 Las variables no están relacionadas. No tiene
pendiente
0 < r < 1 Las variables están directamente
relacionadas.
positiva
-1 < r < 0 Las variables están inversamente
relacionadas.
negativa
r = 1 Las variables tienen una correlación
directa perfecta
positiva
r = -1 Las variables tienen una correlación
inversa perfecta
negativa
Podemos decir que nuestro resultado encaja en -1<r<0 Las variables están
inversamente relacionadas con una pendiente negativa.
5. COEFICIENTE DE DETERMINACIÓN R2.
r2= S2XY
S2X S
2Y
r2=(−19 .72 )2
(3 .7847 )2 (5 .77 )2=388 .8784476 .8859
=0 .81
6. CÁLCULO DE RESIDUALES Y GRÁFICA DE RESIDUALES.
Trabajador
muestreado
Semanas de
experiencia(X)
Número de
rechazos(Y)
Valor
ajustado( )
Residual
( )
1 7 26 25.7 0.3
2 9 20 22.9 -2.9
3 6 28 27.1 0.9
4 14 16 15.9 0.1
5 8 23 24.3 -1.3
6 12 18 18.7 -0.7
7 10 24 21.5 2.5
8 4 26 29.9 -3.9
9 2 38 32.7 5.3
10 11 22 20.1 1.9
11 1 32 34.1 -2.1
12 8 25 24.3 0.7
0.8
Y e Y Y
10 15 20 25 30 35 40
-6
-4
-2
0
2
4
6
Diagrama residual
Valor ajustado Ŷ
Res
idu
al e
7. ERROR ESTÁNDAR DEL ESTIMADOR.
se=√∑ (Y i−Y i )2
n−2
se=√ 0 .6410=0.25
8. ESTIMAR DOS APROXIMACIONES Y USAR EL ERROR
ESTÁNDAR PARA DEFINIR MARGEN DE CONFIABILIDAD.
Y=a+bX=35 .5+−1 .4 X
3) 35.5+(-1.4)(3)=31.3+0.25=31.55
35.5+(-1.4)(3)=31.3-0.25=31.05
4) 35.5+(-1.4)(13)=17.3+0.25=17.55
35.5+(-1.4)(13)=17.3-0.25=17.05