regresionlinealmultiple-120104134224-phpapp01.ppt

No Slide TitleOBJETIVOS
UNO
Describir la relación entre dos o más variables independientes y una variable dependiente utilizando la ecuación de regresión múltiple.
DOS
Calcular e interpretar el error estándar múltiple de estimación y el coeficiente de determinación.
TRES
CUATRO
© 2001 Alfaomega Grupo Editor
OBJETIVOS
CINCO
Realizar una prueba de hipótesis para determinar si los de coeficientes de regresión son diferentes de cero.
SEIS
Realizar una prueba de hipótesis para cada uno de los coeficientes de regresión.
Análisis de regresión múltiple
Para dos variables independientes, la fórmula general de la ecuación de regresión múltiple es:
X1 y X2 son las variables independientes.
a es la intercepción en Y.
b1 es el cambio neto en Y por cada cambio unitario en X1, manteniendo X2 constante. Se denomina coeficiente de regresión parcial, coeficiente de regresión neta o bien coeficiente
de regresión.
Análisis de regresión múltiple
La ecuación general de regresión múltiple con k varibles independientes es:
El criterio de mínimos cuadrados se usa para el desarrollo de esta ecuación.
Como estimar b1, b2, etc. es muy tedioso, existen muchos programas de cómputo que pueden utilizarse para estimarlos.
13-4
694.unknown
Error estándar múltiple de la estimación
El error estándar múltiple de la estimación es la medida de la eficiencia de la ecuación de regresión.
Está medida en las mismas unidades que la variable dependiente.
Es difícil determinar cuál es un valor grande y cuál es uno pequeño para el error estándar.
13-5
La fórmula es:
donde n es el número de observaciones y k es el número de variables independientes.
13-6
Las variables independientes y dependientes tienen una relación lineal.
La variable dependiente debe ser continua y al menos con escala de intervalo.
La variación en (Y - Y’) o residuo debe ser la misma para todos los valores de Y. Cuando éste es el caso, se dice que la diferencia presenta homosedasticidad.
Los residuos deben tener distribución normal con media igual a 0.
Las observaciones sucesivas de la varible dependiente no deben estar correlacionadas.
13-7
Tabla ANOVA
La tabla ANOVA proporciona la variación de la variable dependiente (tanto de la que está explicada por la ecuación de regresión como de la que no lo está).
13-8
Matriz de correlación
La matriz de correlación se usa para mostrar todos los posibles coeficientes de correlación simple entre todas las variables.
La matriz también se útil para localizar la correlación de las variables independientes.
En la matriz se muestra qué tan fuerte está correlacionada la variable independiente con la variable dependiente.
13-9
Prueba global
La prueba global se usa para investigar si todas las variables independientes tienen coeficientes significativos. Las hipótesis son:
Ha : al menos uno de los coeficientes de regresión no es cero.
13-10
Prueba global continuación
El estadístico de prueba es la distribución F con k (número de variables independientes) y n - (k + 1) grados de libertad, donde n es el tamaño de la muestra.
13-11
Prueba para variables individuales
La prueba se usa para determinar qué variable independiente tiene coeficientes de regresión diferentes de 0.
Las variables que tiene coeficientes de regresión cero, suelen desaparecer del análisis.
El estadístico de prueba es la distribución t con n - (k + 1) grados de libertad.
13-12
EJEMPLO 1
Un estudio de mercado para la cadena de tiendas autoservicio Super Dollar analiza la cantidad anual que gastan en comida las familias de cuatro o más miembros. Se iensa que tres variables independientes se relacionan con los gastos en comida. Esas variables son: ingreso familiar total, tamaño de la familia y si la familia tiene hijos en la universidad.
13-13
EJEMPLO 1 continuación
Use un software, como MINITAB o Excel, para desarrollar la matriz de correlación.
Del análisis proporcionado por MINITAB, escriba la ecuación de regresión:
¿Qué gastos en comida estima para una familia de 4 integrantes, sin hijos en la universidad y con ingresos de $50,000?
13-15
700.unknown
Y’=954 + 10.9(50) + 748(4) + 565 (0) = 4491.
Realice una prueba global de hipótesis para determinar si alguno de los coeficientes de regresión es distinto de cero.
H1 : al menos una
H0 se rechaza si F > 4.07
A partir de la salida de MINITAB, el valor del estadístico de prueba calculado es 10.94
Decisión: como F = 10.94 > 4.07, H0 se rechaza. Entonces, no todos los coeficientes de regresión son cero.
13-16
Realice una prueba individual para determinar qué coeficientes son distintos de cero.
De la salida de MINITAB, la única variable significativa es FSIZE (tamaño de familia) al usar los valores p. Las otras variables pueden omitir del modelo.
Entonces,
Para 5% de nivel de significancia, se rechaza H0 si el valor p < .05
13-17
704.unknown
Como el valor p =.039 <.05, se rechaza H0 y se concluye que . Esto es, el tamaño de la familia y cantidad gastada en comida tienen una relación significativa.
13-18
Variables cualitativas y regresiones escalonadas
Las variables cualitativas son no numéricas y también se llaman variables ficticias .
Para una variable cualitativa, sólo existen dos condiciones posibles.
La regresión escalonada conduce a la ecuación de regresión más eficiente.
Sólo las variables independientes con coeficientes de regresión significativos entran en el análisis. Las variables se introducen en el orden en que hacen que R^2 aumente más rápido.
13-19
Análisis de residuos
Un residuo (o residual) es la diferencia entre el valor real de Y y el valor pronosticado Y’.
Los residuos deben tener una distribución normal aproximada. Los histogramas y los diagramas de tallo y hoja sirven para verificar estos requisitos.
Una gráfica de residuos y los valores de Y’ correspondientes se usan para mostrar que no hay tendencias ni patrones en los residuos.
13-20
8
7
6
5
4
3
2
1
0
Frecuencia
Residuos
13-22
Y
a
b
X
b
X

Date post:	16-Nov-2015
Category:	Documents
Upload:	stephanie-brown
View:	212 times
Download:	0 times

regresionlinealmultiple-120104134224-phpapp01.ppt

Documents