Mestrado Profissional em...

Post on 15-Aug-2020

2 views 0 download

transcript

Mestrado Profissional em Administração

Disciplina: Análise Multivariada

Professor: Hedibert Freitas Lopes

1º trimestre de 2015

2

Leitura de Artigo 1) The use of Logit and Probit models in strategic management research: critical issues. Strat. Mgmt. J., v. 28, p. 331-343 (2007). 2) A estatística multivariada na análise econômico-financeira de empresas. Rev. FAE, v. 5, n. 3, p. 51-59 (2002). Entrega do resumo e discussão: 10/03

3

Regressão Logística

Manly, Cap. 8 HAIR et al., Cap. 5

4

Modelos de regressão

Y: variável dependente (quantitativa).

X1, X2, ..., Xp: variáveis independentes.

Objetivo: estabelecer uma relação f u n c i o n a l e n t r e a s v a r i á v e i s independentes e a dependente.

5

Regressão linear simples

Y = β0 + β1 X + ε

! E(ε) = 0 e Var(ε) = σ2

! ε ~ N(0, σ2)

! E(Y) = β0 + β1 X ! Observações independentes

6

Regressão logística

Y: variável resposta dicotômica

⎩⎨⎧

=possui não se 0,

interesse, de ticacaracterís a possui se Y

,1

E(Y) = P(Y = 1) = P(indivíduo possuir a característica)

7

Regressão logística

Exemplos:

" indivíduo ser consumidor de determinado produto;

" ocorrer sinistro numa apólice de seguro;

" cliente pagar empréstimo;

" empresa ir à falência;

" óbito de paciente com determinada doença.

8

Modelo de regressão

Y = variável dependente dicotômica

X1, X2, ... Xp = variáveis independentes

Objetivo encontrar uma relação funcional entre P(Y = 1) e X1, X2, ... Xp (regressão pela média).

9

Exemplo – Comportamento do consumidor

40 60 80 100

0.0

0.2

0.4

0.6

0.8

1.0

rendimento anual (em milhares de reais)

Con

sum

idor

(dum

my)

10

Ajuste de um modelo linear

40 60 80 100

0.0

0.2

0.4

0.6

0.8

1.0

rendimento anual (em milhares de reais)

Con

sum

idor

(dum

my)

11

Problemas

Modelo linear: P(Y= 1) = β0 + β1 X

Linearidade do modelo.

Dependendo do valor de X, podemos prever, com base no modelo, que P(Y=0) < 0 ou P(Y=1) > 1.

12

Regressão logística

x)x

x

e1e1e1)P(Y

1010

10

(1

ββββ

ββ

+−+

+

+=

+==

13

Modelo logístico tende a 1 quando x aumenta

tende a 0 quando x diminui

Forma de S

Caso crescente β1>0

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-6 -4 -2 0 2 4 6

π↑′

14

Modelo logístico tende a 1 quando x diminui

tende a 0 quando x aumenta

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-6 -4 -2 0 2 4 6

α=0 β=−1Caso decrescente

β1<0

Forma de S invertido

15

β1 = 1 e β0 = -1, 0 e 1

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-4 -3 -2 -1 0 1 2 3 4

α=0 β=1α=−1 β=1α=1 β=1

16

β0 = 0 e β1 = 0,5; 1; 2 e 3

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-4 -3 -2 -1 0 1 2 3 4

α=0 β=1α=0 β=0,5α=0 β=2α=0 β=3

17

β0 = 0 e β1 = -1; 1

0

0,2

0,4

0,6

0,8

1

1,2

-4 -3 -2 -1 0 1 2 3 4

α=0 β=1α=0 β=−1

18

Modelo de regressão

Y = variável dependente dicotômica

X1, X2, ... Xp = variáveis independentes

Objetivo: encontrar uma relação funcional entre P(Y = 1) e X1, X2, ... Xp (regressão pela média).

19

Regressão logística

x)x

x

e1e1e1)P(Y

1010

10

(1

ββββ

ββ

+−+

+

+=

+==

Modelar o logaritmo neperiano (ln) da chance de ocorrência do evento de interesse:

( )( ) xYPYP

1001ln ββ +=⎟⎟⎠

⎞⎜⎜⎝

⎛==

20

Estimação do modelo

Uma variável independente: Amostra: (Yi, xi), i= 1, …, n, independentes;

Yi: variável de Bernoulli; xi: variável independente fixa.

21

Estimação do modelo

Método da máxima verossimilhança

ii y-1i

yi )p(1-p ),L( =10 ββFunção de

verossimilhança

x

x

i e1e1)P(Yp

10

10

ββ

ββ

+

+

+===

22

Estimação do modelo Estimadores obtidos a partir da solução do seguinte sistema:

⎪⎪⎩

⎪⎪⎨

=∂

=∂

0

) ,L(

0

) ,L(

1

10

0

10

βββ

βββ

Não há fórmula fechada

23

Dados sobre consumidores de trator.

⎩⎨⎧

=for não se 0,

consumidorfor i indivíduo o se 1,Yi

xi: rendimento anual (em milhares de reais)

Exemplo – Comportamento do consumidor

n=24 (tamanho amostral)

24

25

Ajuste de um modelo logístico

40 60 80 100

0.0

0.2

0.4

0.6

0.8

1.0

rendimento anual (em milhares de reais)

Con

sum

idor

(dum

my)

26

Interpretação dos parâmetros

x

x

x e1ep

10

10

ββ

ββ

+

+

+=

x

x

x ep1-p

10 ββ += : Chance (odds)

xp1-

p lnx

x10 ββ +=⎟⎟⎠

⎞⎜⎜⎝

⎛: Logito (logit)

27

Interpretação dos parâmetros

xp1-

p lnx

x10 ββ +=⎟⎟⎠

⎞⎜⎜⎝

0

0

0

0

p1pe

p1p ln

−=⇒⎟⎟⎠

⎞⎜⎜⎝

⎛−

= 00

ββ

exp(β0) = chance de alguém com valor zero na variável explicativa possuir a característica de interesse, comparado a que não a possui.

28

Interpretação dos parâmetros

⎟⎟⎟⎟

⎜⎜⎜⎜

=⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛= +

+

+

+

x

x

1x

1x

x

x

1x

1x

p1-pp1-

p

ln p1-

p ln - p1-

p ln 1β

x

x

1x

1x

p1-pp1-p

e +

+

=1βexp(β1) = razão de chances (odds

ratio) de se possuir a característica de interesse, ao comparar alguém com valor da variável explicativa uma unidade acima de outra pessoa.

29

Interpretação dos parâmetros

1 - exp(β1) = variação na chance de uma pessoa ter a característica de interesse em relação a não ter, quando aumentamos o valor da variável explicativa em uma unidade.

⎟⎟⎟⎟

⎜⎜⎜⎜

=⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛= +

+

+

+

x

x

1x

1x

x

x

1x

1x

p1-pp1-

p

ln p1-

p ln - p1-

p ln 1β

30

Interpretação dos parâmetros

Parâmetro Estimativa exp (estimativa)

β0 -5,79 0,003β1 0,09 1,094

A chance de uma pessoa ser consumidora em relação a não ser aumenta 9,4% a cada aumento de mil reais na renda.

31

Ajuste de um modelo logístico

14 16 18 20 22

0.0

0.2

0.4

0.6

0.8

1.0

tamanho do lote (em hectares)

Con

sum

idor

(dum

my)

32

( )321

321

xxx

xxx

e1econsumidorP

3210

3210

ββββ

ββββ

+++

+++

+=

Y: 1=consumidor, 0=não consumidor x1: rendimento anual (em milhares de reais) x2: tamanho do lote (em hectares) x3: 1=se há criação de gado, 0=caso contrário

MODELO

Exemplo – Comportamento do consumidor

33

Ajuste do modelo completo

34

Ajuste do modelo x1,x2

35

Interpretação dos parâmetros

A chance de uma pessoa ser consumidora em relação a não ser aumenta 11,72% a cada aumento de mil reais na renda anual, mantida a área do lote constante e 162,16% a cada aumento de um hectare no tamanho do lote, mantida a renda constante.

Parâmetro Estimativa exp (estimativa)β0 -25.9382 0.0000β1 0.1109 1.1172β2 0.9638 2.6216

36

Qual a probabilidade de um indivíduo com renda anual igual a 90 mil reais e com lote de 21 hectares ser consumidor do trator?