Mestrado Profissional em Administração
Disciplina: Análise Multivariada
Professor: Hedibert Freitas Lopes
1º trimestre de 2015
2
Leitura de Artigo 1) The use of Logit and Probit models in strategic management research: critical issues. Strat. Mgmt. J., v. 28, p. 331-343 (2007). 2) A estatística multivariada na análise econômico-financeira de empresas. Rev. FAE, v. 5, n. 3, p. 51-59 (2002). Entrega do resumo e discussão: 10/03
3
Regressão Logística
Manly, Cap. 8 HAIR et al., Cap. 5
4
Modelos de regressão
Y: variável dependente (quantitativa).
X1, X2, ..., Xp: variáveis independentes.
Objetivo: estabelecer uma relação f u n c i o n a l e n t r e a s v a r i á v e i s independentes e a dependente.
5
Regressão linear simples
Y = β0 + β1 X + ε
! E(ε) = 0 e Var(ε) = σ2
! ε ~ N(0, σ2)
! E(Y) = β0 + β1 X ! Observações independentes
6
Regressão logística
Y: variável resposta dicotômica
⎩⎨⎧
=possui não se 0,
interesse, de ticacaracterís a possui se Y
,1
E(Y) = P(Y = 1) = P(indivíduo possuir a característica)
7
Regressão logística
Exemplos:
" indivíduo ser consumidor de determinado produto;
" ocorrer sinistro numa apólice de seguro;
" cliente pagar empréstimo;
" empresa ir à falência;
" óbito de paciente com determinada doença.
8
Modelo de regressão
Y = variável dependente dicotômica
X1, X2, ... Xp = variáveis independentes
Objetivo encontrar uma relação funcional entre P(Y = 1) e X1, X2, ... Xp (regressão pela média).
9
Exemplo – Comportamento do consumidor
40 60 80 100
0.0
0.2
0.4
0.6
0.8
1.0
rendimento anual (em milhares de reais)
Con
sum
idor
(dum
my)
10
Ajuste de um modelo linear
40 60 80 100
0.0
0.2
0.4
0.6
0.8
1.0
rendimento anual (em milhares de reais)
Con
sum
idor
(dum
my)
11
Problemas
Modelo linear: P(Y= 1) = β0 + β1 X
Linearidade do modelo.
Dependendo do valor de X, podemos prever, com base no modelo, que P(Y=0) < 0 ou P(Y=1) > 1.
12
Regressão logística
x)x
x
e1e1e1)P(Y
1010
10
(1
ββββ
ββ
+−+
+
+=
+==
13
Modelo logístico tende a 1 quando x aumenta
tende a 0 quando x diminui
Forma de S
Caso crescente β1>0
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-6 -4 -2 0 2 4 6
π↑′
14
Modelo logístico tende a 1 quando x diminui
tende a 0 quando x aumenta
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-6 -4 -2 0 2 4 6
α=0 β=−1Caso decrescente
β1<0
Forma de S invertido
15
β1 = 1 e β0 = -1, 0 e 1
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-4 -3 -2 -1 0 1 2 3 4
α=0 β=1α=−1 β=1α=1 β=1
16
β0 = 0 e β1 = 0,5; 1; 2 e 3
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-4 -3 -2 -1 0 1 2 3 4
α=0 β=1α=0 β=0,5α=0 β=2α=0 β=3
17
β0 = 0 e β1 = -1; 1
0
0,2
0,4
0,6
0,8
1
1,2
-4 -3 -2 -1 0 1 2 3 4
α=0 β=1α=0 β=−1
18
Modelo de regressão
Y = variável dependente dicotômica
X1, X2, ... Xp = variáveis independentes
Objetivo: encontrar uma relação funcional entre P(Y = 1) e X1, X2, ... Xp (regressão pela média).
19
Regressão logística
x)x
x
e1e1e1)P(Y
1010
10
(1
ββββ
ββ
+−+
+
+=
+==
Modelar o logaritmo neperiano (ln) da chance de ocorrência do evento de interesse:
( )( ) xYPYP
1001ln ββ +=⎟⎟⎠
⎞⎜⎜⎝
⎛==
20
Estimação do modelo
Uma variável independente: Amostra: (Yi, xi), i= 1, …, n, independentes;
Yi: variável de Bernoulli; xi: variável independente fixa.
21
Estimação do modelo
Método da máxima verossimilhança
ii y-1i
yi )p(1-p ),L( =10 ββFunção de
verossimilhança
x
x
i e1e1)P(Yp
10
10
ββ
ββ
+
+
+===
22
Estimação do modelo Estimadores obtidos a partir da solução do seguinte sistema:
⎪⎪⎩
⎪⎪⎨
⎧
=∂
∂
=∂
∂
0
) ,L(
0
) ,L(
1
10
0
10
βββ
βββ
Não há fórmula fechada
23
Dados sobre consumidores de trator.
⎩⎨⎧
=for não se 0,
consumidorfor i indivíduo o se 1,Yi
xi: rendimento anual (em milhares de reais)
Exemplo – Comportamento do consumidor
n=24 (tamanho amostral)
24
25
Ajuste de um modelo logístico
40 60 80 100
0.0
0.2
0.4
0.6
0.8
1.0
rendimento anual (em milhares de reais)
Con
sum
idor
(dum
my)
26
Interpretação dos parâmetros
x
x
x e1ep
10
10
ββ
ββ
+
+
+=
x
x
x ep1-p
10 ββ += : Chance (odds)
xp1-
p lnx
x10 ββ +=⎟⎟⎠
⎞⎜⎜⎝
⎛: Logito (logit)
27
Interpretação dos parâmetros
xp1-
p lnx
x10 ββ +=⎟⎟⎠
⎞⎜⎜⎝
⎛
0
0
0
0
p1pe
p1p ln
−=⇒⎟⎟⎠
⎞⎜⎜⎝
⎛−
= 00
ββ
exp(β0) = chance de alguém com valor zero na variável explicativa possuir a característica de interesse, comparado a que não a possui.
28
Interpretação dos parâmetros
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
=⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛= +
+
+
+
x
x
1x
1x
x
x
1x
1x
p1-pp1-
p
ln p1-
p ln - p1-
p ln 1β
x
x
1x
1x
p1-pp1-p
e +
+
=1βexp(β1) = razão de chances (odds
ratio) de se possuir a característica de interesse, ao comparar alguém com valor da variável explicativa uma unidade acima de outra pessoa.
29
Interpretação dos parâmetros
1 - exp(β1) = variação na chance de uma pessoa ter a característica de interesse em relação a não ter, quando aumentamos o valor da variável explicativa em uma unidade.
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
=⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛= +
+
+
+
x
x
1x
1x
x
x
1x
1x
p1-pp1-
p
ln p1-
p ln - p1-
p ln 1β
30
Interpretação dos parâmetros
Parâmetro Estimativa exp (estimativa)
β0 -5,79 0,003β1 0,09 1,094
A chance de uma pessoa ser consumidora em relação a não ser aumenta 9,4% a cada aumento de mil reais na renda.
31
Ajuste de um modelo logístico
14 16 18 20 22
0.0
0.2
0.4
0.6
0.8
1.0
tamanho do lote (em hectares)
Con
sum
idor
(dum
my)
32
( )321
321
xxx
xxx
e1econsumidorP
3210
3210
ββββ
ββββ
+++
+++
+=
Y: 1=consumidor, 0=não consumidor x1: rendimento anual (em milhares de reais) x2: tamanho do lote (em hectares) x3: 1=se há criação de gado, 0=caso contrário
MODELO
Exemplo – Comportamento do consumidor
33
Ajuste do modelo completo
34
Ajuste do modelo x1,x2
35
Interpretação dos parâmetros
A chance de uma pessoa ser consumidora em relação a não ser aumenta 11,72% a cada aumento de mil reais na renda anual, mantida a área do lote constante e 162,16% a cada aumento de um hectare no tamanho do lote, mantida a renda constante.
Parâmetro Estimativa exp (estimativa)β0 -25.9382 0.0000β1 0.1109 1.1172β2 0.9638 2.6216
36
Qual a probabilidade de um indivíduo com renda anual igual a 90 mil reais e com lote de 21 hectares ser consumidor do trator?