Strategic Impact Evaluation Fund

Post on 19-Mar-2016

24 views 2 download

Tags:

description

Strategic Impact Evaluation Fund. www.worldbank.org/sief. Marie-H élène Cloutier & Patrick Premand Banco mundial. MEDIR O IMPACTO II. Metodos quase - experimentais. 2. Seleção aleatória. Promoção aleatória. Modelo de discontinuidade. Dupla Diferenca. ou “Diff-in-Diff ”. - PowerPoint PPT Presentation

transcript

www.worldbank.org/hdchiefeconomist

The World Bank

Human Development Network

Spanish Impact Evaluation Fund

Strategic Impact Evaluation Fund

www.worldbank.org/sief

Marie-Hélène Cloutier & Patrick PremandBanco mundial

MEDIR O IMPACTO II

Metodos quase-experimentais

2Métodos de avaliação do

impacto

Seleção aleatória

Modelo de discontinuidade

ou “Diff-in-Diff”

Promoção aleatória

Dupla Diferenca

Emparelhamento pela marca de propensão

Emparelhamento

2Métodos de avaliação do

impacto

Seleção aleatória

Modelo de discontinuidade

ou “Diff-in-Diff”

Promoção aleatória

Dupla Diferenca

Emparelhamento pela marca de propensão

Emparelhamento

Modelo de discontinuidade

Programas de combate à pobreza

Aposentaduria

Bolsas de estudo

Agricultura

Muitos programas sociais selecionam os beneficiários utilisando um índice ou uma límite:

Alvo: familias em baixo do límte de pobreza

Alvo: população acima de uma certa idade

Destinadas aos alunos com bons resultados nos testes

Fertilizante destinado à agricultura familiar explorações (< um certo número de hectares)

Exemplo: Efeito de subsídios para fertilizantes sobre a produção agrícola

Melhorar a produção agrícola (rendimento de arroz) das pequenas explorações.

Objectivo

o Explorações com terreno ≤50 ha são pequenaso Explorações com terreno >50 ha são grandes

Método

Os pequenos agricultores recebem subsídios para comprar fertilizante

Intervenção

Exemplo: Modelo de discontinuidade da regressão – Situação na linha de base

Não elegível

Elegível

Exemplo: Modelo de discontinuidade da regressão – Situação depois da intervenção

IMPACTO

Caso 5: Modelo de discontinuidade Temos um índice de eligibilidade contínuo com um ponto de corte de elegibilidade bem definido.o Familias com índice ≤ ponto de corte são elegíveiso Familias com índice > ponto de corte são inelegíveiso Ou vice-versa

Intuição para o método:o Unidades justo acima do ponto de corte são muito similares

às justo em baixo– boa comparaçãoo Comparar resultado Y para as unidades justo acima e justo

em baixo do ponto de corte

Para o modelo de discontinuidade, e necessário: 1) Índice contínuo de

elegibilidade 2) Um ponto de corte de

elegibilidade bem definido

Caso 5: Modelo de discontinuidade para Progresa

Elegibilidade para Progresa é baseada sobre um índice nacional de pobreza

Familia considerada pobre se o valor do índice ficar ≤ 750

Elegibilidade para Progresa:o Elegível=1 se o valor do índice ≤ 750o Elegível=0 se o valor do índice > 750

Caso 5: Modelo de discontinuidade Valor do índice vs. consumo antes do tratamento

Fitte

d va

lues

puntaje estimado en focalizacion276 1294

153.578

379.224

Índice de pobreza

Cons

umo

Valo

res p

redi

tos

Fitte

d va

lues

puntaje estimado en focalizacion276 1294

183.647

399.51

Caso 5: Modelo de discontinuidade Valor do índice vs. consumo depois do tratamento

Cons

umo

Valo

res p

redi

tos

Índice de pobreza

30.58**Impacto estimado sobre o consumo (Y) | Regressão multivariada

OBS: Efeito estatisticamente significativo à 1% indicado por ** e à 10% por+

Para lembrar (1)

Modelo de discontinuidadeModelo de discontinuidadeRequer um índice contínuo de elegibilidade com um ponto de corte bem definido

Produz uma estimação sem vieis do efeito do tratamento para as observações ao redor do ponto de corte de elegibilidade (que podem ser comparadas).

Não precisa de excluir um grupo de familias ou de indivíduos elegíveis.

Pode, às vezes, ser utilizado para programas já em curso.

!

Para lembrar (2)

Modelo de discontinuidadeModelo de discontinuidadeProduz uma estimação local :o Efeito do programa ao

redor do ponto de corte

o Nem sempre se pode generalizar

Poder : o São necessárias muitas observações ao redor do ponto de corte de elegibilidade.Importante evitar erros no modelo estatístico : As vezes o que sembra uma discontinuidade na figura é outra coisa

!

2Métodos da avaliação de

impacto

Selecção aleatória

Modelo de discontinuidade

Ou Diff-in-Diff

Promoção aleatória

Dupla diferença

Propensity score matching

Emparelhamento

Dupla Diferença (Dif-in-dif)

Y=Taxa de escolarização das raparigasP=Programa de bolsa-escola para elas

Diff-in-Diff: Impacto=(Yt1-Yt0)-(Yc1-Yc0)

Inscritas Não inscritas

Depois 0.74 0.81

Antes 0.60 0.78

Diferença +0.14 +0.03 0.11

- -

- =

Dupla Diferença (Dif-in-dif)

Dif-in-Dif: Impacto=(Yt1-Yc1)-(Yt0-Yc0)

Y=RendaP=Programa de capacitação profissionalizante de jovens

Inscritos Não inscritos

Depois 0.74 0.81

Antes 0.60 0.78

Diferênça

-0.07

-0.18

0.11

-- -

=

Dupla diferençaImpacto=(A-B)-(C-D)=(A-C)-(B-D)

Pres

enca

na

esco

la

B=0.60

C=0.81

D=0.78

T=0 T=1 Tempo

Inscritos

Não inscritos

Impacto=0.11

A=0.74

Pres

enca

na

esco

la

Impacto<0.11

B=0.60

A=0.74

C=0.81

D=0.78

T=0 T=1 Tempo

Inscritos

Não inscritos

Dupla diferençaImpacto=(A-B)-(C-D)=(A-C)-(B-D)

Caso 6: Dupla Diferença Inscritos Não inscritos Diferênça

Referência (T=0) Consumo (Y) 233.47 281.74 -48.27

Seguimento (T=1) Consumo (Y) 268.75 290 -21.25

Diferênça 35.28 8.26 27.02

Impacto estimado sobre o Consumo (Y)

Regressão Lineal 27.06**Regressão LinealMultivariada 25.53**

OBS: Efeito estatisticamente significativo à 1% indicado por ** e à 10% por+

Para lembrar

Dupla DiferençaDupla Diferença: combina inscritos & não inscritos com antes & depois.

Inclinação: Produz um cenário contrafactual para a mudança no resultado

Hipótese Fondamental: As inclinações – são idênticas nos grupos de tratamento e de controle

Para testar isto, pelo menos 3 observações no tempo são necessárias: o 2 observações anteso 1 observação depois.

!

E…Recomendação para Progresa?

Impacto de Progresa sobre o Consumo (Y)

Caso 1: Antes & Depois 34.28**

Caso 2: Inscritos & Não inscritos -4.15

Caso 3: Assignação aleatória 29.75**

Caso 4: Promoção aleatória 30.4**

Caso 5: Modelo de discontinuidade 30.58**

Caso 6: Dupla diferença 25.53**

OBS: Efeito estatisticamente significativo à 1% indicado por ** e à 10% por+

2Métodos de avaliação de

impacto

Seleção Aleatória

Modelo de Discontinuidade

Ou Diff-in-Diff

Promoção Aleatória

Dupla Diferenças

Matching

Emparelhamento

Emparelhamento (Matching)

Para cada unidade tratada, escolher a melhor unidade de comparação (par) de uma outra fonte de dados.

Ideia

Os pares são selecionados sobre a base das similaridades nas características observadas.

Como?

Se há características não observáveis e que estes « não-observáveis » influenciam a participação: tendências de seleção!

Problema?

Emparelhamento pelo score de propensão (PSM)

Grupo de Comparação : não-participantes com as mesmas características observáveis que os participantes.o Na prática, é muito difícil. o Pode haver muitas características importantes!Emparelhar sobre a base do “score de propensão”, Solução proposta por Rosenbaum e Rubin:o Calcular a probabilidade de participação de cada um,

baseada sobre as suas características observáveis.o Escolher pares que têm a mesma probabilidade de

participação com as unidades tratadas.o Ver anexo 2.

Densidade do score de propensão

Densidade

Score de Propensão0 1

ParticipantesNão-Participantes

Suporte Comum

Caso 7: Emparelhamento - Progresa

Característica de referência Coeficiente EstimadoProbit, Prob Inscrit=1

Idade do chefe (ano) -0.022**Idade da esposa (ano) -0.017**Educação do chefe (ano) -0.059**Educação da esposa (ano) -0.03**O chefe é uma mulher=1 -0.067Indígeno=1 0.345**Números de membros da familia 0.216** Chão de terra=1 0.676**Quarto de banho=1 -0.197**Hectares de terra -0.042**Distância ao hospital (km) 0.001*Constante 0.664**

OBS: Efeito estatisticamente significativo à 1% indicado por ** , 5% por * e à 10% par+

Caso 7: Suporte Comum (Progresa)

Pr (Inscritos)

Densidade: Pr (Inscritos)

Dens

idad

e: P

r (In

scrit

os)

Densidade: Pr (Inscritos)

Caso 7: Emparelhamento -Progresa

Impacto Estimado sobre o Consumo (Y)

Regressão linealmultivariada 7.06+

OBS: Efeito estatisticamento significativo à 1% indicado por ** , 5% por * e à 10% par+

E…Recomendação para Progresa?

Impacto de Progresa sobre a Consumo (Y)

Caso 1: Antes & Após 34.28**Caso 2: Inscritos & Não inscritos -4.15Caso 3: Selecção aleatória 29.75**Caso 4: Promoção aleatória 30.4**Caso 5: Modelo de discontinuidade 30.58**Caso 6: Dupla Diferença 25.53**Caso 7: Emparelhamento 7.06+

OBS: Efeito estatisticamente significativo à 1% indicado por ** , 5% por * e à 10% par+

Para lembrarEmparelhamento O emparelhamento requer grandes amostras e dados de boa qualidade.

O emparelhamento na linha de base pode ser útil:o Conhecer as régras de

seleção e emparelhar em função delas

o Combinar com outras técnicas (i.e. dif-in-dif)

O emparelhamento ex-post (após intervenção) não é recomendável:o Se não tiver linha de base,

cuidado! o O emparelhamento sobre

variáveis endógenas ex-post dá maus resultados.

!

Recomendação para Progresa?

OBS: Se o efeito é estatisticamente significativo à um nível de uma importância de 1%, nós marcamos o impacto estimado por 2 asteriscos (**). Se é significativo à um nível de 10% , nós marcamos o impacto de +

Impacto de Progresa sobre o Consumo (Y)

Caso 1: Antes & Após 34.28**Caso 2: Inscritos & Não inscritos -4.15Caso 3: Selecção aleatória 29.75**Caso 4: Promoção aleatória 30.4**Caso 5: Modelo de discontinuidade 30.58**Caso 6: Dupla Diferênças 25.53**Caso 7: Emparelhamento 7.06+

2Métodos da AI

Caixa de ferramentas

Seleção Aleatória

Modelo de Discontinuidade

Ou Diff-in-Diff

Promoção Aleatória

Dupla Diferença

Propensity score matching

Emparelhamento

Combinações de métodos

Da onde vêm os grupos de comparação?

As régras de operação dos programas determinam a estratégia da avaliação.

É quase sempre possível encontrar um grupo de comparação se:

as régras de seleção dos beneficiários forem equitativas, transparentes

a avaliação é concebida de maneira prospectiva.

Regras operacionais e avaliação prospectiva

3 perguntas para determinar qual o método apropriado para um determinado programa:

Financiamento: O programa tem os recursos suficientes para passar a escala e cobrir todos os potenciais elegíveis? Regras de focalização: Quem é elegível para o programa? O programa focaliza em base a um índice ou é disponível para todos? Calendário: Como são os beneficiários incluidos no programa – todos ao mesmo tempo ou por fases?

Aproveitar as oportunidades de produzir boms grupos de comparação e assegurar que dados de linha de base são coletados

Escolher seu método de AIDinheiro Recursos

Limitados (pedido > oferta)Recursosilimitados

Focalização

CalendárioFocalizado Universal Focalizado Universal

Extensão por fases

1 Seleção Aleatória4 Modelo de discontinuidade

1 Seleção Aleatória2 Promoção aleatória3 DD com5 Eparelhamento

1 Seleção Aleatória4 Modelo de discontinuidade

1 Seleção Aleatória por fases2 Promoção aleatória 3 DD com5Emparelhamento

Extensão imediata

1 Seleção Aleatória4 Modelo de discontinuidade

1 Seleção Aleatória2 Promoção aleatória3 DD com5Emparelhamento

4 Modelo de discontinuidade

Se parcial:2 Promoção aleatória3 DD com5 Emparelhamento

“Lembramo-nos (1)

O objectivo da avaliação de impacto é de estimar o efeito causal ou o impacto de um programa sobre indicadores de resultados de interesse.

“Lembramo-nos (2)

Para estimar o impacto, nós devemos estimar o cenário contrafactual. • O que teria acontecido sem o programa?• Utilizar um grupo de comparação (grupo controle

ou testemunha)

“Lembramo-nos (3)

Nós temos uma caixa de ferramentas com 5 métodos para identificar grupos de comparação.

“Lembramo-nos (4)

Escolher o melhor método de avaliação que é praticável no contexto operacional.

Versão em francês e espanhol disponiveis

Versão portuguesa em preparacão

www.worldbank.org/ieinpractice

Referência

Thank YouThank YouObrigada

?Q & A?Q & A

Anexo 1Minimos quadrados em 2 estagios (2SLS)

1 2y T x

0 1 1T x Z

Modelo com tratamento endogeno (T):

Fase 1: Regressar a variável endógena sobre a variável instrumental (Z) e as outras variáveis explicativas:

Calcular o valor predito para cada observação: T «  chapéu»

Anexo 1 Minimos quadrados em 2 estagios (2SLS)

^

1 2( )y T x Corregir os erros standard (eles são baseados sobre os T Chapéu e não T)

Fase 2: Regressar o resultado sobre a variável predita (e outras variáveis explicativas):

Na prática, utilizar STATA – « ivreg ».

Intuição: T foi “limpado” da sua correlação com ε.

Anexo 2Etapas do emparelhamento PSM

1. Inquêrito representativo e altamente comparável entre os não participantes e os participantes.

2. Re-agrupar as duas amostras e estimar um modelo « logit/probit » da participação ao programa.

3. Restringir as amostras para garantir um suporte comum (importante fonte de vieis nos estudos observacionais)

4. Para cada participante, encontrar uma amostra de não participantes com um índice de propensão similar.

5. Comparar os indicadores dos resultados para cada observação e o grupo de pares: a diferênça é a estimação do impacto dado ao programa.

6. Calcular a média destes impactos individuais para obter o impacto médio global.