+ All Categories
Home > Documents > Manual Eviews Intermedio

Manual Eviews Intermedio

Date post: 11-Oct-2015
Category:
Upload: riskmetrico
View: 223 times
Download: 25 times
Share this document with a friend
Popular Tags:

of 75

Transcript
  • EviewsIntermedio

    Aplicado al AnalisisMicroeconometrico

    Juan Carlos Abanto Orihuela

    1 de julio de 2012

  • 2Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • Indice general

    1. Microeconometra y Tecnicas de Estimacion 51.1. Estimacion y Analisis . . . . . . . . . . . . . . . . . . . . . . . 5

    1.1.1. Funcion de Verosimilitud . . . . . . . . . . . . . . . . . . 51.1.2. Score Eficiente y Matriz de Informacion . . . . . . . . . . 61.1.3. Estimador MV del Modelo Lineal General . . . . . . . . 6

    2. Modelos de Eleccion Discreta 112.1. Estimacion y Analisis . . . . . . . . . . . . . . . . . . . . . . . 11

    2.1.1. Interpretacion Estructural . . . . . . . . . . . . . . . . . 112.1.2. Modelo de Probabilidad Lineal . . . . . . . . . . . . . . 132.1.3. Modelo de Probabilidad No Lineal . . . . . . . . . . . . 152.1.4. Analisis de Probabilidades y Cambios Marginales . . . . 19

    3. Modelos de Eleccion Ordinal 233.1. Estimacion y Analisis . . . . . . . . . . . . . . . . . . . . . . . 24

    3.1.1. Modelo de Variable Latente . . . . . . . . . . . . . . . . 243.1.2. Testeo de Hipotesis . . . . . . . . . . . . . . . . . . . . . 263.1.3. Supuesto de Paralelismo . . . . . . . . . . . . . . . . . . 273.1.4. Analisis de Probabilidades y Cambios Marginales . . . . 27

    4. Modelos Truncados y Censurados 334.1. Variables Dependientes con Truncamiento No Incidental . . . . 34

    4.1.1. Variable Aleatoria Truncada . . . . . . . . . . . . . . . . 344.1.2. Truncamiento en el Modelo de Regresion . . . . . . . . . 354.1.3. Estimacion del Modelo de Regresion con Variable Trun-

    cada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364.1.4. Impacto Marginal en el Modelo de Regresion . . . . . . . 364.1.5. Variable Aleatoria Censurada . . . . . . . . . . . . . . . 374.1.6. Censura en el Modelo de Regresion . . . . . . . . . . . . 374.1.7. Estimacion del Modelo de Regresion Censurada . . . . . 384.1.8. Efectos Marginales y Bondad de Ajuste . . . . . . . . . . 40

    4.2. Variable de Truncamiento Incidental, Sesgo de Seleccion . . . . 424.2.1. El modelo de Truncamiento Incidental . . . . . . . . . . 42

    3

  • 4 INDICE GENERAL

    4.2.2. Estimacion del Modelo de Truncamiento Incidental . . . 444.2.3. Efectos Marginales . . . . . . . . . . . . . . . . . . . . . 46

    5. Modelos de Panel Estatico 515.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515.2. Estructura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545.3. Heterogeneidad No Observada . . . . . . . . . . . . . . . . . . . 565.4. Estimacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    5.4.1. Modelo MCO combinado (MCOC) - Pooled . . . . . . . 575.4.2. Modelo de Efectos Fijos . . . . . . . . . . . . . . . . . . 575.4.3. Modelo de Efectos Aleatorios . . . . . . . . . . . . . . . 585.4.4. Test de Hausman . . . . . . . . . . . . . . . . . . . . . . 59

    6. Panel Dinamico 616.1. Especificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616.2. Especificacion del Modelo Econometrico . . . . . . . . . . . . . 626.3. Estimacion del modelo . . . . . . . . . . . . . . . . . . . . . . . 64

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • Sesion 1

    Microeconometra y Tecnicas deEstimacion

    1.1. Estimacion y Analisis

    La microeconometra es la rama de la econometra que se encarga del estu-dio de datos microeconomicos. La microeconometra utiliza tecnicas estadsti-cas y matematicas para la estimacion de diversos parametros en modelos mi-croeconomicos. Se divide en dos grandes grupos, principalmente: modelos dedatos de panel y modelos de eleccion cualitativa, aunque tambien estudia otrassituaciones, como por ejemplo modelos de variables acotadas.

    1.1.1. Funcion de Verosimilitud

    El objetivo de la verosimilitud, es el encontrar parametros que maximicenla probabilidad de obtener la verdadera muestra.

    La tecnica necesita establecer una funcion f(y, ) y maximizar la verosimi-litud establecida por L(y, ) =

    ni=0 f(yi, ) o su transformacion monotonica

    LnL(y, ) =n

    i=0 Lnf(yi, ).

    La funcion anterior (que recibe el nombre de funcion log-verosimil) es preci-samente aquella que se busca maximizar en terminos de . Esta transformacionpuede realizarse debido a que las funciones de probabilidad son monotonicascrecientes y por tanto cualquier transformacion de este tipo no altera los re-sultados de los puntos de maximizacion.

    Este tipo de estimacion, partiendo de una correcta especificacion y el cum-plimiento de ciertas condiciones, garantiza la obtencion de estimadores asintoti-camente insesgados, eficientes y consistentes.

    5

  • 6 1. Microeconometra y Tecnicas de Estimacion

    1.1.2. Score Eficiente y Matriz de Informacion

    Existen dos matrices importantes en el analisis de las funciones de vero-similitud. Estas matrices nos dan informacion valiosa que es muy importanteincorporar en el estudio de los estimadores de maxima verosimiltitud. La pri-mera de ellas se conoce como el score eficiente y se define como:

    LnL()

    = S() = g()

    Este es el vector gradiente de la funcion log-verosmil. Contiene tantos ele-mentos como parametros a estimar contenga un modelo. El valor de la matrizde score eficiente, evaluada en el estimador de maxima verosimilitud (que re-presenta precisamente el maximo de la funcion) es cero.

    La segunda matriz se conoce como la matriz de informacion y viene dadapor la esperanza del negativo de la segunda derivada de la funcion log-verosmilrespecto al parametro:

    E

    [(2lnL()

    )]Bajo ciertas condiciones de regularidad, la varianza del estimador de maxi-

    ma verosimilitud viene dada por la inversa de la matriz de informacion:

    V ar(MV ) = [I()]1

    La expresion anterior se deriva del teorema de la Cota Minima de Cramer-Rao, el cual establece que si la funcion de densidad de x satisface ciertas con-diciones de regularidad, la varianza de un estimador insesgado del parametro sera siempre por lo menos igual a [I()]1.

    1.1.3. Estimador MV del Modelo Lineal General

    El principio de maxima verosimilitud es muy flexible y se puede aplicar to-mando en cuenta varias formas estructurales y distintas funciones de distribu-cion. Consideraremos el estimador maximo verosmil del modelo lineal general,sabiendo que este puede expresarse de la siguiente manera: y = x + . En elcontexto de maxima verosimilitud debemos suponer que la variable aleatoriarelevante sigue una funcion de probabilidad especfica. Por ello vamos a intro-ducir el supuesto de que el vector sigue una distribucion normal manteniendoel supuesto de que su media es igual a cero y su varianza viene dada por lamatriz I. De esta manera la funcion de densidad del vector seria:

    f() =1

    (2pi)n/21

    (2)n/2

    e1

    22

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 1.1. Estimacion y Analisis 7

    La funcion de densidad anterior puede transformarse en la funcion de ve-rosimilitud muestral si se expresa en funcion de x e y.

    L(, 2/x, y) =1

    (2pi)n/21

    (2)n/2

    e1

    22(yx)(yx)

    Luego de realizar la transformacion monotonica LnL(, 2) procedemos aoptimizar en funcion a sus parametros:

    LnL

    = 0

    LnL

    2= 0

    De esta forma, se verifica que, bajo los supuestos de normalidad del terminode error y forma lineal del modelo, el estimador de maxima verosimilitud de coincide con el estimador MCO. El estimador de la varianza del termino deerror, sin embargo, difiere del obtenido a traves de MCO, siendo ahora sesgado.

    Sin embargo, el sesgo del estimador de maxima verosimilitud tiende a ceroal aumentar el tamano muestral y se aproxima al estimador MCO.

    En Eviews podemos realizar una estimacion de verosimilitud como sigue:

    ===========================================================

    Aplicacion 01: Estimador MV y Matriz de Varianza Covarianza

    ===========================================================

    wf u 100

    rndseed 123

    simulacion de datos con distribucion Normal

    series x1=4+0.2*@rnorm

    series x2=5+0.3*@rnorm

    series x3=6+0.5*@rnorm+0.3*@trend

    PGD: proceso generador de datos

    series y=0.5+0.6*x1+0.32*x2+0.7*x3+0.01*@rnorm

    Estimacion MCO

    equation eq1.ls y c x1 x2 x3

    coef(1) inter

    coef(3) beta

    coef(1) sigma2

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 8 1. Microeconometra y Tecnicas de Estimacion

    inter(1)=eq1.@coef(1)

    for !w=2 to 4

    beta(!w)=eq1.@coef(!w+1)

    next

    sigma2(1)=eq1.@se^2

    Estimacion MV

    logl logl1

    logl1.append @logl loglike

    logl1.append @byeqn

    logl1.append error=y-inter(1)-beta(1)*x1-beta(2)*x2-beta(3)*x3

    logl1.append varianza=sigma2(1)

    logl1.append loglike=log(@dnorm(error/@sqrt(varianza)))

    - (1/2)*log(varianza)

    logl1.ml

    Estimacion de la matriz de VarCov

    matrix cmatrix =logl1.@coefcov

    Estimacion por gradientes de la matriz de informacion

    logl1.makegrads(n=gradiente) g_inter gbeta1 gbeta2 gbeta3 g_sigma2

    stom(gradiente, g1)

    matrix info=@transpose(g1)*g1

    Comparacion de las varianzas estimadas

    matrix crao=cmatrix-@inverse(info)

    Ahora podemos comparar los estimadores de la desviacion estandar y delparametro asociado a un modelo AR(1) con drift.

    =============================================================

    Aplicacion 02: Estimacion de la varianza y pendiente mediante

    MCO y MV

    =============================================================

    !n=100

    wf u !n

    series mus

    series rhos

    series sigmas2

    series mus1

    series rhos1

    series sigmas21

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 1.1. Estimacion y Analisis 9

    FOR !k=1 to !n

    series y=0

    series z=nrnd

    smpl @first+1 @last

    series y=0.5+0.8*y(-1)+z genero un ar(1) con intercepto

    smpl @all

    equation mco.ls y c ar(1)

    coef(1) mu=mco.@coef(1) guardo el valor en un coeficiente

    coef(1) rho=mco.@coef(2)

    coef(1) sigma2=mco.@se^2

    mus(!k)=mu(1)

    rhos(!k)=rho(1)

    sigmas2(!k)=sigma2(1)

    logl logl1

    logl1.append @logl loglike

    logl1.append res=y-mu(1)-rho(1)*y(-1)

    logl1.append var=sigma2(1)

    logl1.append loglike=log(@dnorm(res/@sqrt(var)))-log(var)/2

    smpl @first+1 @last

    logl1.ml

    mus1(!k)=mu(1)

    rhos1(!k)=rho(1)

    sigmas21(!k)=sigma2(1)

    NEXT

    group g1 rhos rhos1

    g1.line

    group g2 sigmas2 sigmas21

    g2.line

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 10 1. Microeconometra y Tecnicas de Estimacion

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • Sesion 2Modelos de Eleccion Discreta

    2.1. Estimacion y Analisis

    Las estimaciones lineales clasicas permiten la modelizacion de variables de-pendientes cuantitativas para identificar relaciones estadsticas en las que seasume una serie de supuestos sobre la forma del error de la ecuacion lineal(homocedasticidad, normalidad, etc.). Sin embargo, en muchos contextos, elfenomeno que se quiere modelizar no es continuo sino discreto, por ejemplocuando se quiere modelar la eleccion de compra de un bien o servicio; o ladecision de participar o no en el mercado laboral. Estos son los modelos cono-cidos como modelos de respuesta cualitativa. Llamamos variables cualitativasa aquellas que no aparecen en forma numerica, sino como categoras o atribu-tos como por ejemplo, el sexo o la profesion de una persona. En general, sedice que una variable es discreta cuando esta formada por un numero finito dealternativas que miden cualidades.

    2.1.1. Interpretacion Estructural

    Existen tres enfoques para la interpretacion estructural de los modelos deeleccion discreta. El primero hace referencia a la modelizacion de una variablelatente a traves de una funcion ndice, que trata de modelizar una variableinobservable o latente. El segundo de los enfoques permite interpretar los mo-delos de eleccion discreta bajo la teora de la utilidad aleatoria, de tal maneraque la alternativa seleccionada en cada caso sera aquella que maximice la utili-dad esperada. El tercero pasa por plantear un modelo de probabilidad no lineal.

    Bajo el primero de los enfoques se trata de modelizar una variable ndice,inobservable o latente no limitada en su rango de variacion y*. Cuando lavariable latente supera un determinado nivel, la variable discreta toma el valor1, y si no lo supera toma el valor 0. La variable latente depende de un conjuntode variables explicativas que generan las alternativas que se dan en la realidady que permiten expresar el modelo dicotomico como:

    11

  • 12 2. Modelos de Eleccion Discreta

    Y =

    {1, si Y > 0,

    0, si Y 0.Donde el supuesto sobre la distribucion de error determina el tipo de mo-

    delo a estimar. Si se supone una funcion de distribucion uniforme, se utilizael Modelo Lineal de Probabilidad truncado; si se distribuye como una normalcon media cero y varianza uno, el modelo generado sera un Probit; mientrasque si se supone que se distribuye como una curva logstica, se tratara de unmodelo Logit. La hipotesis de que el umbral a superar por la variable latentesea cero se puede modificar por cualquier otro valor sugiriendose, en determi-nados estudios, que el valor crtico sea el definido por el termino constante.

    Bajo este enfoque, el modelo probabilistico quedara:

    Y = X +

    Pr(Y = 1/X) = Pr(Y > 0/X)Pr(Y = 1/X) = Pr( > (X)/X)Pr(Y = 1/X) = F (X)

    Con el modelo as definido, la variable endogena del modelo dicotomicorepresenta la probabilidad de ocurrencia del fenomeno analizado, siendo laprobabilidad de que ocurra la opcion 1 mas elevada cuando mayor sea el valorde Y .

    El segundo de los enfoques para la interpretacion de los modelos de res-puesta dicotomica es el que hace referencia a la modelizacion a traves de laformulacion de una utilidad aleatoria. Bajo este enfoque un individuo debeadoptar una decision que le permita elegir entre dos alternativas excluyentes,la 1 o la 0, lo que hara maximizando la utilidad esperada que le proporcionacada una de las alternativas posibles sobre las que tiene que decidir. Es decir,el individuo i-esimo elegira una de las dos alternativas dependiendo de que lautilidad que le proporciona dicha decision sea superior a la que le proporcionasu complementaria.

    La formulacion del modelo bajo esta teora parte del supuesto de que lautilidad derivada de una eleccion, Ui0 o Ui1, es funcion de las variables explica-tivas de dicha decision, que son las caractersticas propias de cada una de lasalternativas de eleccion y las caractersticas personales propias del individuo,de manera que suponiendo linealidad en las funciones, se tiene:

    Ui0 = 0 +Xi0 + i0Ui1 = 1 +Xi1 + i1

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 2.1. Estimacion y Analisis 13

    Donde los ij recogen las desviaciones que los agentes tienen respecto alo que sera el comportamiento del agente medio y que se debe a factoresaleatorios. El agente i elegira la opcion 1 si la utilidad de esa decision superala de la opcion 0 y viceversa, de manera:

    Yi =

    {1, si Ui1 > Ui0,

    0, si Ui1 < Ui0.

    Y el modelo dicotomico quedara definido por:

    Pr(Y = 1/X) = Pr(Ui1 > Ui0/X) = Pr(i1 i0 > (X)/X)Pr(Y = 1/X) = F (X)

    Segun que la funcion asociada a la perturbacion aleatoria ij (que sera lafuncion de distribucion, F (X), que se suponga siga dicha probabilidad), seauna funcion de distribucion uniforme, la funcion de distribucion de la normaltipificada o la de la curva logstica, se obtienen el Modelo Lineal de Probabi-lidad Truncado, el Probit o el Logit, respectivamente.

    El tercer enfoque pasa por estructurar un modelo de probabilidad no lineal,como lo sugiere Theil - 1970, de tal manera que:

    Pr(Y = 1/X) = Mi =exp(X)

    1+exp(X)

    (x) = Pr(Y=1/X)Pr(Y=0/X)

    = Pr(Y=1/X)1Pr(Y=1/X)

    Ln((x)) = X +

    Es decir medir que tan a menudo ocurre algo (Y=1), respecto a que tan amenudo no ocurre (Y=0).

    2.1.2. Modelo de Probabilidad Lineal

    La primera alternativa teorica desarrollada para estudiar modelos con va-riables dicotomas se planteo como una extension del modelo lineal general:

    Yt = t +Xktk + t

    Donde :

    Yt =

    {1, si ocurre una alternativa,

    0, en caso contrario.

    Xkt=Variables explicativast=Variable aleatoria que se distribuye N(0,

    2)

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 14 2. Modelos de Eleccion Discreta

    En general, la distribucion de los modelos de eleccion binaria se caracterizapor configurar una nube de puntos de tal manera que las observaciones sedividen en dos subgrupos. Uno de ellos esta formado por las observacionesen las que ocurrio el acontecimiento objeto de estudio (Yi =1), y el otro, porlos puntos muestrales en los que no ocurrio (Yi =0).Para el desarrollo de losmodelos de eleccion discreta se utilizara la base de datos bdbinario.

    load bdbinario

    La base de datos que trabajaremos cuenta con informacion sobre un conjun-to de alumnos, los cuales fueron sometidos a un nuevo metodo de ensenanza,luego de aplicado el metodo de ensenanza se busco ver si el alumno mejoro ono, para ello la variable mejora nos da dicha informacion. Para predecir siel alumno mejoro o no, se uso el siguiente set de variables: cm (promedio decalificaciones pasadas del alumno), np (nota del alumno en examen previo) ypsi (variable que indica si el alumno estudio con el nuevo metodo de ensenanzao no).

    equation eqlineal.ls mejoro c np

    Problemas con esta estimacion

    La interpretacion de los coeficientes en los modelos de probabilidad es simi-lar a la de los modelos de regresion lineal, en donde el valor de los parametrosrecoge el efecto de una variacion unitaria en cada una de las variables explica-tivas sobre la probabilidad de ocurrencia del acontecimiento objeto de estudio,sin embargo, el MPL presenta algunas inconsistencias.

    Se puede apreciar en el modelo inicial que algunos de los valores estimadosse encuentran fuera de rango, lo cual carece de logica considerando que debeninterpretarse como probabilidades.

    eq1.fit mejoro_hat mejoro_se

    series e1=resid

    graph gph1.scat np mejoro_hat mejoro

    gph1.legend position(-1,3.7)

    Solucion: Modelo de probabilidad truncada?

    A traves del grafico de la densidad de Kernel para el modelo que incluyetodas las variables, se observa que los residuos no se distribuyen de maneranormal, por lo tanto no es eficiente, es decir, pueden presentarse problemas deminimizacion de la varianza a medida que la muestra aumenta.

    e1.kdensity(k=n)

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 2.1. Estimacion y Analisis 15

    Invalida esto la estimacion por MCO? Los estimadores siguen siendo ME-LI (BLUE)?

    Problemas de Heterocedasticidad. Aun en el caso de que se cumpliesen lashipotesis de media y correlacion nula en la perturbacion aleatoria E(i) = 0E(i, j) = 0 para todo i 6= j, no se cumple la hipotesis de varianza constante,es decir, la perturbacion aleatoria no es homocedastica.

    V ar(t) = E[(i E(i))(i E(i))] = E(2i )

    V ar(t) = (1X)2fi(1) + (0X)2(1 fi(1))

    V ar(t) = (1 fi(1))2fi(1) + (fi(1))2(1 fi(1))

    V ar(t) = (1 fi(1))fi(1)Veamos ahora si el residuo presenta heterocedasticidad.

    eq1.white(c)

    eq1.archtest(2)

    Para el presente ejemplo la hipotesis nula de varianza constante (homo-cedasticidad) sera rechazada debido a que el p value de la distribucion delestadstico chicuadrado es muy pequeno, aceptandose la hipotesis alterna devarianza no homogenea.

    Solucion: MCG o MCP?

    2.1.3. Modelo de Probabilidad No Lineal

    Los problemas en la interpretacion y estimacion de los parametros del mo-delo de probabilidad lineal han llevado a la busqueda de modelos alternativosque permitan estimaciones mas fiables de las variables dicotomas. Es el casode los modelos de probabilidad no lineal, donde la funcion de especificacionutilizada garantiza un resultado en la estimacion comprendido en el rango 0-1.Estos son los modelos logit y probit. Analizaremos a continuacion los datos atraves de una regresion logstica, la cual se formula a continuacion.

    Pr(Y = 1) =eX

    1 + eX= (X)

    equation eqextremo.binary(d=x) mejoro c cm np psi

    equation eqprobit.binary(d=n) mejoro c cm np psi

    equation eqlogit.binary(d=l) mejoro c cm np psi

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 16 2. Modelos de Eleccion Discreta

    Pos-estimacion

    a. Test de efectos individuales

    Si los supuestos bases del modelo se sostienen, los estimadores son dis-tribuidos de manera asintotica y normal:

    ka N(k, 2k)

    Donde la hipotesis nula de significancia del parametro puede ser testeadaa partir de:

    z =k 2k

    Si la hipotesis nula es verdadera entonces z se distribuira aproximada-mente como una normal con media cero y varianza unitaria para muestrasgrandes.

    b. Test de Wald

    Podemos analizar el modelo una vez estimado, mediante un testeo dehipotesis que validen una correcta especificacion. Para esto el test deWald calculado para hipotesis lineales sobre los parametros de los mode-los estimados nos sera de mucha utilidad. Tambien puede usarse el testbajo una estructura no lineal, la cual no abordaremos en esta seccion.

    equation eqprobit.binary(d=n) mejoro c cm np psi

    eqlogit.wald c(2)=0, c(3)=0

    c. Test LR

    El estadstico de verosimilitud tambien nos sera de gran utilidad paraevaluar mediante hipotesis la significacia de modelos. Este estadsticocompara modelos anidados.

    eqlogit.binary(d=l) mejoro c cm np psi

    scalar lh1=eqlogit.@logl

    eqlogit.binary(d=l) mejoro c cm np

    scalar lh2=eqlogit.@logl

    scalar ratio=-2*(lh2 - lh1)

    scalar pval = 1-@cchisq(ratio, 1)

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 2.1. Estimacion y Analisis 17

    Donde nuestra hipotesis nula es H0 = psi = 0

    Muchas medidas escalares han sido desarrolladas para resumir las bonda-des de ajuste de modelos de regresion continuo o de variables categoricas.Sin embargo no hay evidencia convincente de seleccion de un modelo quemaximice los valores de una medida comparada con la medida de otromodelo. Mientras las medidas de ajuste proveen informacion, esta es soloparcial, que debera ser sostenida con una teora economica razonable, oinvestigaciones anteriores como referencia.

    A continuacion proveeremos de una breve descripcion de cada una de lasmedidas que podemos encontrar en Long(1997).

    Medida basada en Log-Likehood

    Stata comienza su analisis maximizando iteracciones de verosimi-litud y calculando sus logaritmos, para determinado modelo, contodos los parametros excepto el intercepto en un nivel de ceroL(Mintercepto), mientras que cuando los parametros son diferentesde cero, el logaritmo de verosimilitud calculado sera L(Mfull)

    Test Chi-Cuadrado de todos los coeficientes

    Un test LR donde la hipotesis nula de que todos los coeficientesexcepto el intercepto son ceros puede ser calculado comparando ellogaritmo de verosimilitud LR=2[Ln(Mfull)-Ln(Mintercepto)], a vecesa este estadistico se le designa con el valor G2.

    McFaddens R2

    R2 en MRLPara una regresion lineal se reporta el coeficiente de determinacionestandar:

    R2 = 1N

    1 (yi yi)2N1 (yi yi)2

    =V ar(y)

    V ar(y) + V ar(e)= 1

    [L(Mintercepto)

    L(Mfull)

    ] 2N

    Y el R2 ajustado seria:

    R2 =

    (R2 K

    N 1)(

    N 1N K 1

    )R2 en MRNLEn modelos no lineales la medida calculada son los pseudos R2.El R2 de McFadden, tambien conocido como el ndice del ratio deverosimilitud, compara dos modelos:

    R2McF = 1[

    LnL(Mfull)

    LnL(Mintercepto)

    ]Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 18 2. Modelos de Eleccion Discreta

    Y como el R2 de McFadden siempre se incrementa con el numeronuevo de variables explicativas, se ajusta su version con:

    R2McF = 1[LnL(Mfull)KLnL(Mintercepto)

    ]Donde K es el numero de variables independientes, no el numerode parametros.

    El R2Count y el R2Count Ajustado

    De los valores observados y predichos, se calcula el R2Count.

    Definimos as el R2Count como:

    R2Count =1

    N

    j

    njj

    donde njj es el numero de predicciones correctas en la tabla. Pero elR2Count puede darnos una interpretacion fallida del poder de predic-cion del modelo. En un modelo binario sin previo conocimiento delas variables independientes es posible corregir las predicciones enal menos el 50 % de los casos eligiendo una categora con el mayorporcentaje de casos observados. El ajuste se hace de la siguientemanera:

    R2Count =

    j njj maxr(n++)N maxr(n++)

    Donde n++ es el mayor valor marginal de la ultima fila.

    Medidas de InformacionAICEste criterio compara modelos de diferentes tamanos de muestra otambien modelos no anidados. Akaike (1973) definio:

    AIC =2LnL(Mk) + 2p

    N

    Donde p es el numero de parametros en el modelo (K+1 en losmodelos de regresion binaria donde K es el numero de regresores)

    BICEl criterio de informacion Bayesiana fue propuesto por Raftery(1996) como una medida que compara modelos anidados como mo-delos no anidados. Definimos BIC de la siguiente manera:

    BICK = D(MK) glkLn(N)Donde glk son los grados de libertad asociados con la desviacion.La segunda version de BIC es basada al ratio de verosimilitud del

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 2.1. Estimacion y Analisis 19

    Chi2 con glk definiendo dichos grados de libertad, como el numerode regresores (no parametros) en le modelo.

    BIC K = G2(MK) glkLn(N)

    eqprobit.binary(d=n) mejoro c cm np psi

    eqprobit.testfit(h,5,u)

    Otra posible solucion a las inconsistencias que presenta el modelo de pro-babilidad lineal para explicar el comportamiento de una variable dependientebinaria es el uso del modelo probit de la forma:

    y = f(0 + 1x1 + ...+ kxk) +

    Donde f es la funcion de distribucion normal estandar

    f(X) =

    X

    12pies2

    2 ds+ i

    2.1.4. Analisis de Probabilidades y Cambios Marginales

    Los efectos marginales suelen proporcionar una buena aproximacion delcambio que la presencia o no de la variable binaria o continua, originaria sobrela probabilidad predicha de algun modelo.

    ooooooooooooooooooooooo

    Estimacion Modelo Probit

    equation eqprobit.binary(d=n) mejoro c np cm psi

    eqprobit.fit mejoro_hat1 mejoro_se1

    graph gph2.scat np mejoro_hat1 mejoro

    numero de coeficientes del modelo

    !p=4

    vector(!p) coef_probit

    for !k=1 to !p

    coef_probit(!k)=eqprobit.@coef(!k)

    next

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 20 2. Modelos de Eleccion Discreta

    vector(!p) efmarg_probit

    for !k=1 to !p

    efmarg_probit(!k)=@dnorm(-(coef_probit(1)+coef_probit(2)*@mean(np)

    +coef_probit(3)*@mean(cm)+coef_probit(4)*@mean(psi)))*coef_probit(!k)

    next

    Estimacion Modelo Logit

    equation eqlogit.binary(d=l) mejoro c np cm psi

    numero de coeficientes del modelo

    !p=4

    vector(!p) coef_logit

    for !k=1 to !p

    coef_logit(!k)=eqlogit.@coef(!k)

    next

    vector(!p) efmarg_logit

    for !k=1 to !p

    efmarg_logit(!k)=@dlogistic(-(coef_logit(1)+coef_logit(2)*@mean(np)

    +coef_logit(3)*@mean(cm)+coef_logit(4)*@mean(psi)))*coef_logit(!k)

    next

    Estimacion Modelo Valor Extremo

    equation eqval.binary(d=x) mejoro c np cm psi

    numero de coeficientes del modelo

    !p=4

    vector(!p) coef_VAL

    for !k=1 to !p

    coef_val(!k)=eqval.@coef(!k)

    next

    vector(!p) efmarg_val

    scalar z=coef_val(1)+coef_val(2)*@mean(np)+coef_val(3)*@mean(cm)

    +coef_val(4)*@mean(psi)

    for !k=1 to !p

    efmarg_val(!k)=( @exp(-z)*@exp( -@exp(-z) ) )*coef_val(!k)

    next

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 2.1. Estimacion y Analisis 21

    Si existe un cambio marginal en alguna variable discreta entonces necesi-tamos evaluar los cambios totales:

    EMg general en Logit

    oooooooooooooooooooooooooooo

    model m_probit

    m_probit.append assign @all f

    m_probit.append con_Psi = 1 - @CNORM(-(coef_probit(1)+

    coef_probit(2)*CM+ coef_probit(4)*@mean(psi)))

    m_probit.append sin_Psi = 1 - @CNORM(-(coef_probit(1)+

    coef_probit(2)*CM))

    m_probit.solve

    graph gph2.scat cm con_psif sin_psif

    Veamos la estimacion va verosimilitud

    logl ll1

    ll1.append @logl logl1

    ll1.append xb = c(1)+c(2)*CM + c(3)*NP + c(4)*psi

    ll1.append logl1 = mejoro*log(@cnorm(xb))+(1-mejoro)*log(1-@cnorm(xb))

    equation eq1.ls mejoro c cm np psi

    ll1.ml(showopts, m=1000, c=1e-5)

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 22 2. Modelos de Eleccion Discreta

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • Sesion 3

    Modelos de Eleccion Ordinal

    Cuando la variable dependiente es discreta, pero sus valores indican un or-den, no es correcto realizar la estimacion de la misma a traves de los modelospresentados en el apartado anterior, ya que la inclusion de la informacion queaporta el orden de las alternativas en la especificacion del modelo permite ob-tener unos mejores resultados.

    Las variables ordinales son a menudo codificadas como enteros consecutivasde 1 al numero de categoras, no sera correcto el uso de un modelo de regre-sion clasico, ya que codificadas las posibles alternativas como 1, 2, ...(j+1), ...,J, se estara considerando la diferencia entre (j+1) y (j+2) como la existenteentre 1 y 2, lo cual no tiene porque ser as ya que los numeros utilizados enla codificacion solo representan un orden dentro de una clasificacion. As, conmodelos de salida ordinal es mejor usar modelos que eviten el supuesto de quelas distancias entre las categoras sean iguales, ahora nos enfocaremos en unlogit y probit que consideren esta ordenacion, modelos introducidos por Mc-Kelvey y Zavoina (1975) en terminos de una variable latente.

    Cuando las salidas son ordinales o nominales la dificultad de explicar masde dos respuestas se incrementa. Una variable puede ser ordenada de ciertamanera cuando consideramos un tema, y ordenada de otra manera cuandoconsideramos un tema diferente. Millar y Volker (1985) mostraron como dife-rentes supuestos sobre el ordenamiento de ocupaciones, proyectan diferentesresultados. Una variable podra reflejar ordenamiento sobre mas de una dimen-sion tal como escalas de actitudes, que reflejen ambas la intensidad y direccionde opinion. Mas aun es muy comun que encuestas incluyan la categora nosabe, no opina, lo cual probablemente no corresponda a la categora interme-dia en una escala, aun cuando en el analisis uno este tentado a colocarla comotal, sobretodo cuando la propuesta de ordenamiento es ambigua, el modelo desalidas nominales podra ser considerado.

    23

  • 24 3. Modelos de Eleccion Ordinal

    3.1. Estimacion y Analisis

    Los MRO pueden ser desarrollados de diferentes maneras, cada una de ellasnos conduce al mismo resultado. El modelo de regresion binaria (MRB) puedenser vistos como un caso especial de los MRO, en el cual la variable endogenasolo tiene dos categoras.

    3.1.1. Modelo de Variable Latente

    El modelo de regresion ordinal es comunmente presentado como un modelode variable latente. Definida y como una variable latente cuyo rango va desde- a

    yi = xi +

    Donde la variable endogena toma los siguientes valores:

    yi = m, si rm1 yi < rm m = 1...JO tambien de manera extendida:

    yi =

    1, si = r0 yi < r1,2, si r1 yi < r2,3, si r2 yi < r3,...

    J, si rJ1 yi < rJ =.Donde los puntos de corte rj son estimados. Como ejemplo, podramos te-

    ner la siguiente pregunta en una encuesta: Una mujer trabajadora estableceun fuerte y seguro vinculo con su hijo, as como una mujer que no trabaja?

    Las posibles respuestas podran ser: 1=Desacuerdo Total, 2=Desacuerdo,3=Acuerdo, 4=Acuerdo Total

    La variable latente continua puede imaginarse como el grado de aceptaciona favor de que las mujeres trabajadoras son buenas madres.

    yi =

    1 = DT, si = r0 yi < r1,2 = D, si r1 yi < r2,3 = A, si r2 yi < r3,4 = AT, si r3 yi < r4 =.

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 3.1. Estimacion y Analisis 25

    La probabilidad de una variable observada dado el valor de x, correspondea la region en la que la distribucion de y cae entre rm1 y rm

    Pr(y = m/x) = Pr(rm1 y < rm/x)Sustituyendo x + por y y usando algo de algebra obtenemos la formulaestandar que predice la probabilidad en el MRO

    Pr(y = m/x) = F (rm x) F (rm1 x)Donde F es la funcion de probabilidad acumulada para . En el probit or-

    dinal, F es una normal con Var()=1, en el logit ordinal, F es una logistica conVar()=pi

    2

    3. Notar que cuando y=1 el termino F(- x)=0 y cuando y=J el

    primer termino de F( x)=1.

    Comparando estas ecuaciones con las de un MRB se observa que el MROes identico a la regresion binaria, veamos:

    load binario

    equation eqprobit.binary(d=n) mejoro c np

    equation eqlogit.binary(d=l) mejoro c np

    equation eqoprobit.ordered(d=n) mejoro c np

    equation eqologit.ordered(d=l) mejoro c np

    Los coeficientes y sus desviaciones estandar son los mismos pero el inter-cepto para el logit, es reportado, mientras que para el ologit ese intercepto esreemplazado por el punto de corte del mismo nivel pero de signo opuesto.

    En Stata, la identificacion del MRO asume que el intercepto es cero y as losvalores de los puntos de corte son estimados.

    El modelo de regresion ordinal puede tambien ser desarrollado como unmodelo de probabilidad no lineal sin recurrir a la idea de variable latente.Para mostrar esto, primero definimos el odds de que la variable explicada esmenor o igual a m vs que sea mayor que m dado las variables exogenas x:

    Por ejemplo, podriamos calcular el odds de desagrado o fuerte desagrado,versus el agrado o fuerte agrado. Asi el logaritmo del odds es igual a:

    m|>m =Pr(y m/x)Pr(y| > m/x)

    Para una simple variable independiente y tres categoras en la explicada,donde el intercepto fue fijado en 0, tendriamos:

    Ln(Pr(y1/x)Pr(y>1/x)

    ) = r1 1x1Ln(Pr(y2/x)

    Pr(y>2/x)) = r2 1x1

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 26 3. Modelos de Eleccion Ordinal

    Parece confuso que el modelo substraiga xb en lugar de anadirlo, esto esconsecuencia del calculo del logit de y m vs y > m.

    Aqu un ejemplo basado en la encuesta realizada entre 1977 y 1989 deGeneral Social Survey, donde el tema y pregunta tratado fue: Una madretrabajadora puede establecer una calida y segura relacion sentimental con suhijo como una madre que no trabaja?

    load warm

    equation eq1.ordered(d=n) warm c yr89 male white

    equation eq2.ordered(d=l) warm c yr89 male white

    equation eq3.ordered(x) warm c yr89 male white

    Usando los datos, nosotros estimamos el siguiente modelo:

    Pr(warm = m/xi) = F (rm x) F (rm1 x)Donde

    x = yr89yr89 + malemale+ whitewhite+ ageage+ prstprst

    Aqu las salidas sean con ologit, oprobit, pueden ser comparadas:

    equation eq2.ordered(d=l) warm c yr89 male white age ed prst

    coef beta1=eq2.@coefs

    equation eq2.ordered(d=n) warm c yr89 male white age ed prst

    coef beta2=eq2.@coefs

    Como en el analisis de los modelos de regresion binaria, la diferencia estribaen que los coeficientes tienen una razon de 1.7, es decir, solo hay diferencia enescala, sin embargo los z-test, son los mismos y no se ven afectados por la escala.

    3.1.2. Testeo de Hipotesis

    Para el testeo de hipotesis podremos usar el test de wald o maxima verosi-militud para elegir el mejor modelo.

    equation eqlogit.ordered(d=l) warm c yr89 male white

    eqlogit.wald c(1)=0

    eqlogit.wald c(1)=0, c(2)=0 , c(3)=0

    equation eqlogit.ordered(d=l) warm c yr89 male white

    scalar lh1=eqlogit.@logl

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 3.1. Estimacion y Analisis 27

    equation eqlogit.ordered(d=l) warm c yr89 male

    scalar lh2=eqlogit.@logl

    scalar ratio=-2*(lh2 - lh1)

    scalar pval = 1-@cchisq(ratio, 1)

    3.1.3. Supuesto de Paralelismo

    Antes de discutir la interpretacion, es importante entender un supuesto queesta implcito en el MRO, conocido como paralelismo de la regresion, y parael modelo ologit, el supuesto de odds proporcional.

    Pr(y = 1/x) = F (rm x)Pr(y = m/x) = F (rm x) F (rm1 x), cuando : m = 2...J 1Pr(y = J/x) = 1 F (rm1 x)

    Las ecuaciones presentadas pueden ser usadas para calcular la probabilidadacumulada, lo cual tienen la siguiente forma:

    Pr(y m/x) = F (rm x), cuando : m = 1...J 1En esta ecuacion se muestra que el MRO es equivalente para J-1 regresiones

    binarias con el supuesto de que las pendientes o coeficientes son identicos a lolargo de cada regresion.

    Por ejemplo, si tenemos cuatro categoras en nuestra endogena y una va-riable independiente las ecuaciones serian:

    Pr(y 1/x) = F (r1 x1)Pr(y 2/x) = F (r2 x1)Pr(y < 3/x) = F (r3 x1)

    El intercepto no se encuentra en las ecuaciones dado que se ha asumidoque 0 = 0, cada curva de probabilidad diferira unicamente en su inclinacionhacia la derecha o izquierda, es decir, son paralelas como consecuencia de queel parametro es el mismo en cada ecuacion. De esta manera el supuesto deparalelismo implica que, 1 = 2 = ... = J1. El grado de paralelismo seasume con parametros muy cercanos entre s.

    3.1.4. Analisis de Probabilidades y Cambios Marginales

    El MRO es no lineal, entonces, no hay una sola aproximacion que puedadescribir totalmente la relacion entre una variable y las probabilidades, por lotanto, se debera considerar cada uno de estos metodos antes de decidir que

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 28 3. Modelos de Eleccion Ordinal

    aproximacion es mas efectiva en nuestra aplicacion.

    En el MRO, y = x + , el cambio marginal en y con respecto a xk es:Siendo y una variable latente (cuya medida es desconocida), el cambio mar-ginal no puede ser interpretado sin la estandarizacion, mediante la desviacionestandar de y.

    2y = V ar(x) + V ar()

    Donde V ar(x) es la matriz de covarianza para las explicativas, V ar()es 1 para los probit ordenados, o pi2/3 para los logit ordenados. Entonces elestandarizacion y del coeficiente de xk es:

    Syk =

    ky

    Por cada unidad en que se incremente xk, se espera que y se incremente

    en Syk desviaciones estandar, manteniendo las demas variables constantes.

    El coeficiente con una total estandarizacion seria:

    Sk =kky

    = kSyk

    Por cada desviacion estandar en que se incremente xk, se espera que y

    se incremente en Sk desviaciones estandar, manteniendo las demas variablesconstantes.

    equation eq4.ordered(d=l) warm ((yr89-@MEAN(YR89))/@STDEV(YR89))

    ((male-@MEAN(MALE))/@STDEV(MALE)) ((white-@MEAN(WHITE))/@STDEV(WHITE))

    equation eq4.ordered(d=l) ((warm - @MEAN(WARM))/@STDEV(WARM))

    ((yr89-@MEAN(YR89))/@STDEV(YR89)) ((male-@MEAN(MALE))/@STDEV(MALE))

    ((white-@MEAN(WHITE))/@STDEV(WHITE))

    equation eq4.ordered(d=l) ((warm - @MEAN(WARM))/@STDEV(WARM))

    c yr89 male white

    Por cada desviacion estandar en que se incremente la educacion, se incre-menta el apoyo para las madres que trabajan en 0.11 desviaciones estandar,manteniendo las demas variables constantes.

    Prediccion de Probabilidades

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 3.1. Estimacion y Analisis 29

    Predecimos las probabilidades como:

    P r(y = m/x) = F (rm x) F (rm1 x)Con probabilidades acumuladas:

    P r(y m/x) = F (rm x)Luego de estimar el modelo es util calcular las probabilidades, indicando unavariable nueva por cada categora estimada

    equation eq5.ordered(d=n) warm c yr89 male white

    eq1.makelimit gamma

    coef beta=eq5.@coefs

    series pwarm1

    series pwarm2

    series pwarm3

    series pwarm4

    pwarm1=@cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male +

    beta(3)*white ) )

    pwarm2=@cnorm(gamma(2)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )

    - @cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )

    pwarm3=@cnorm(gamma(3)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )

    - @cnorm(gamma(2)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )

    pwarm4=1- @cnorm(gamma(3)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )

    group g1 warm pwarm1 pwarm2 pwarm3 pwarm4

    g1.scat

    Las probabilidades predichas para las categoras extremas tienden a sermenos que 0.25, la mayor cantidad de las predicciones para las categoras in-termedias caen entre 0.25 y 0.5, solo unas cuantas tienden a ser mayores que0.5

    Prediccion de Probabilidades

    La prediccion de probabilidades para individuos con un conjunto de carac-tersticas pueden ser calculadas mediante el siguiente comando, por ejemplo,nosotros podramos desear, examinar las probabilidades predichas para indi-viduos con las siguientes caractersticas:

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 30 3. Modelos de Eleccion Ordinal

    Hombres de la clase trabajadora en 1977 quienes estan cerca de retirarse.

    Mujeres jovenes con elevada educacion y prestigiosos trabajos.

    Individuo promedio en 1977

    Individuo promedio en 1989

    equation eq5.ordered(d=l) warm c yr89 male white age ed prst

    eq1.makelimit gamma

    coef beta=eq5.@coefs

    series pwarm1

    series pwarm2

    series pwarm3

    series pwarm4

    pwarm1=@cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male +

    beta(3)*white ) )

    pwarm2=@cnorm(gamma(2)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )

    - @cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )

    pwarm3=@cnorm(gamma(3)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )

    - @cnorm(gamma(2)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )

    pwarm4=1- @cnorm(gamma(3)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )

    Tarea generar una tabla con las probabilidades promedio en base

    a estas probabilidades calculadas para cada escenario

    Probabilidad Predicha

    Tipo de individuo SD D A SAHombres de la clase trabajadoraen1997 quienes estan cerca del retiro

    0.23 0.42 0.27 0.07

    Mujeres jovenes con alta educacion en1989 con trabajos prestigiosos

    0.02 0.08 0.32 0.59

    Individuo promedio en 1977 0.13 0.36 0.37 0.14Individuo promedio en 1989 0.08 0.28 0.43 0.21

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 3.1. Estimacion y Analisis 31

    Cambios en las Probabilidades Predichas

    El cambio marginal en la probabilidad es calculado como:

    Pr(y = m/x)

    xk=F (rm x)

    xk F (rm1 x)

    xk

    La cual es la pendiente de la curva que relaciona xk a Pr(y = m/x),manteniendo las otras variables constantes. En nuestro ejemplo, nosotros con-sideraremos el efecto marginal de la edad Pr(y=m/x)

    age, para mujeres en 1989,

    manteniendo en su media a las demas variables.

    equation eq1.ordered(d=n) warm c yr89 male white

    eq1.makelimit gamma

    coef beta=eq1.@coefs

    vector(4) marginal

    marginal(1)=-( @dnorm(gamma(1)- ( beta(1)*@mean(yr89) +

    beta(2)*@mean(male) + beta(3)*@mean(white) ) ))*beta(1)

    marginal(2)=-(@dnorm( gamma(2)- (beta(1)*@mean(yr89) +

    beta(2)*@mean(male) + beta(3)*@mean(white) ) ) -

    @dnorm(gamma(1)- (beta(1)*@mean(yr89) + beta(2)*@mean(male)

    + beta(3)*@mean(white) ) ))*beta(1)

    marginal(3)=-(@dnorm( gamma(3)- (beta(1)*@mean(yr89) +

    beta(2)*@mean(male) + beta(3)*@mean(white) ) ) -

    @dnorm(gamma(2)- (beta(1)*@mean(yr89) + beta(2)*@mean(male)

    + beta(3)*@mean(white) ) ))*beta(1)

    marginal(4)=(-@dnorm( gamma(3)- (beta(1)*@mean(yr89) +

    beta(2)*@mean(male) + beta(3)*@mean(white) ) ) )*(-beta(1))

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 32 3. Modelos de Eleccion Ordinal

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • Sesion 4Modelos Truncados y

    Censurados

    Esta seccion1 estudia el conjunto de modelos con solucion de esquina. Parael uso de los modelos, es importante el recordar el por que se usan variableslogit y probit en modelos de eleccion binaria, modelos tobit en modelos de res-puesta de solucion de esquina o modelos tipo poison en modelos de recuento, yes por eso que se necesitan modelos que tomen en cuenta ciertas caracteristicasimportantes de la distribucion de y.

    En e caso de la participacion de la mujer en el mercado laboral, el proble-ma es que una parte importante de las mujeres casadas decide no tener ninguntrabajo asalariado.

    En el caso de notas que se obtinene en una evaluacion, las mismas quesegun el sistema de calificacion pueden fluctuar solo entre 0 y 20. Tambien sepresenta cuando solo podemos observar el gasto efectivo de aquellas personasque adquieren un bien pero no su disponibilidad a pagar, mas aun si es inferioral precio mnimo con el que es posible acceder al bien. Finalmente, tambien esel caso de los ingresos percibidos por el trabajo remunerado, dado que no esposible observar el ingreso potencial de una persona que no esta laborando enel momento en que se recoge la informacion por analizar. En cualquiera de es-tas situaciones, las observaciones correspondientes son excluidas de la muestra(lo que se define como truncamiento, ya sea incidental o no ), o su incorpo-racion en ella es distorcionada por un valor especfico que no es el real (lo cualdefinimos como censura).

    Podemos tener tres tipos de variables dependientes continuas limitadas: lastruncadas, las censuradas y las que poseen sesgo de seleccion (o truncamientoincidental).

    1Basado en Introduccion a la econometra de Jeffrey M Wooldridge y Modelos de panely variables limitadas de Arlette Beltran y Juan Francisco Castro

    33

  • 34 4. Modelos Truncados y Censurados

    4.1. Variables Dependientes con Truncamien-

    to No Incidental

    El truncamiento se produce cuando la variable dependiente (yi) se observa,si y solo si esta toma un valor mayor que a, donde a es una constantecualquiera. Lo mismo ocurre con toda la informacion referida a las posibles ex-plicativas del modelo, el vector xi, asociadas con estas observaciones truncadas.

    Un ejemplo podria ser el analisis de la disponibilidad a pagar por un au-tomovil nuevo, si es que es cierto que en el mercado el mas barato que sepuede encontrar tiene un precio de $7,000. De esta manera, cuando la personaesta dispuesta a pagar dicho monto o mas, es probable que compre el auto yque se registre su gasto efectivo y toda su informacion socioeconomica (xi). Sila persona esta dispuesta a pagar menos de $7,000, no realiza ninguna compray no se cuenta con sus datos asociados; es decir esta observacion desaparecede la muestra.

    4.1.1. Variable Aleatoria Truncada

    Definamos el concepto de variable aleatoria truncada. Es aquella que tieneuna tiene funcion de densidad de la forma:

    f(y|y < a) = f(y)Pr(y > a)

    Dada la condicionalidad detras de esta ecuacion se justifica la necesidad deescalar la funcion de densidad original, f(y), de tal manera que su integral seauno cuando solo se incluyan los valores no truncados, es decir, en este caso, losvalores mayores a a. Este procedimiento se conoce como normalizacion dela densidad, donde el denominador de esta ecuacion es la constante normali-zada que corresponde al integral del numerador en el rango entre y a.

    La distribucion de una variable truncada, tiene caractersticas especialesque pueden resumirse como sigue:

    Si y N(, 2) y a es una constante, entonces:

    E(y|truncamiento) = + (a)

    V ar(y|truncamiento) = 2[1 ()]

    Donde = a

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 4.1. Variables Dependientes con Truncamiento No Incidental 35

    La funcion () es conocida como la inversa del ratio de Mills, que eneste caso, puede ser:

    () =f()

    1 F ()si el truncamiento es hacia abajo (y > a)

    () =f()F ()

    si el truncamiento es hacia arriba (y a)

    La funcion (), por su parte, viene dada por () = ()[()], donde0 < () < 1,

    Notese que si se truncan los valores por debajo de una constante a, lamedia de la variable truncada sera mayor que la original, mientras que si setruncan hacia arriba, la primera sera menor que la ultima. De otro lado, lavarianza de la variable truncada sera siempre menor que la de la variableoriginal (dado que () se encuentra entre 0 y 1).

    4.1.2. Truncamiento en el Modelo de Regresion

    Volviendo al ejemplo de la disponibilidad a pagar por un automovil (yi), de-finamos el siguiente modelo para explicarla a partir de un conjunto de variablesexplicativas (xi):

    yi = xi + i

    donde i N(0, 2), por lo que E(yi|xi = xi).Recuerdese que solo es posible observar la variable dependiente y sus de-

    terminantes cuando esta supera el precio mas bajo del mercado a.Tomandoel valor esperado de la disponibilidad pago, condicionado al truncamiento, setiene:

    E(yi|yi > a;xi) = xi + E(i|yi > a;xi) = xi + E(i|i > a xi;xi)Aplicando las caracteristicas antes descritas, se tiene:

    E(yi|yi > a;xi) = xi + (i)Donde (i) =

    f(i)1F (i) , i =

    axi

    De esta forma el modelo de variable dependiente truncada sera:

    yi|yi > a = xi + (i) + iel mismo que solo es posible estimar para el conjunto de observaciones no

    truncadas.

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 36 4. Modelos Truncados y Censurados

    4.1.3. Estimacion del Modelo de Regresion con VariableTruncada

    Si se estima linealmente yi en funcion solo de xi se estara omitiendo lavariable explicativa (), la cual, debido a la perdida de informacion que im-plica el truncamiento, no es posible estimar de manera alguna. Por ello no esadecuado usar directamente MCO, y la alternativa es estimar el modelo pormaxima verosimilitud utilizando la funcion de verosimilitud truncada:

    L =Ni=1

    f(i)

    1 F (i)

    4.1.4. Impacto Marginal en el Modelo de Regresion

    Que resultado es el que interesa en el modelo de regresion truncada?Elefecto impacto o los coeficientes estimados ? Si es que solo se quiere analizarlos efectos del cambio en una variable explicativa sobre la dependiente paraaquellas observaciones no truncadas incluidas en la regresion, bastara con elefecto impacto correspondiente. El uso de los coeficientes sera de interes sise quiere generalizar los resultados a toda la poblacion, este truncado o no.

    Consistente con nuestro ejemplo, mostremos a continuacion como se derivael efecto impacto correspondiente cuando la variable dependiente esta truncadapara valores menores que a.

    E(yi|yi > a;xi)xij

    = j + (i)

    i

    ixij

    E(yi|yi > a;xi)xij

    = j + (i)

    i

    j

    E(yi|yi > a;xi)xij

    = j

    [1 (i)

    i

    ]Para hallar el diferencial (i)

    ies necesario tomar en cuenta que F (i)

    i=

    f(i) y que la funcion de densidad supuesta es la normal, por lo quef(i)i

    =if(i). Con esto, se tiene el siguiente resultado.

    E(yi|yi > a;xj)xij

    = [1 (i)((i) i)]

    La expresion entre llaves, que se encuentra entre 0 y 1, es el factor de ajustedel coeficiente j (que corresponde el efecto impacto en un modelo lineal paratoda la poblacion), que da cuenta del efecto del truncamiento. Notese que afecta la magnitud de los efectos impacto (a traves de ) mas no la direccion.

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 4.1. Variables Dependientes con Truncamiento No Incidental 37

    4.1.5. Variable Aleatoria Censurada

    Retomando el ejemplo de la disponibilidad a pagar por el automovil y su-pongamos que aun si la persona no compra el auto, si se registran sus datosxi como cliente potencial. En este caso la variable yi, tomara el valor pagadopor la persona si esta compra el auto, y el de 0 si no lo compra. En cualquie-ra de los dos casos, se habra recogido informacion sobre el cliente. De estamanera, podemos decir que la variable yi ha sido censurada en 0 para disponi-bilidades a pagar menores que $7,000 valor que es el precio mnimo de mercado.

    El modelo conceptual utilizado para el caso de variables discretas, dondeasumimos la existencia de una variable latente continua e ilimitada y cuyamedia condicional puede ser modelada como una combinacion lineal de unconjunto de explicativas, tambien puede ser modelada como una combinacionlineal de un conjunto de explicativas, tambien puede ser aplicado en este con-texto. En el ejemplo anterior, la variable latente es la disponibilidad de pagola cual puede adoptar cualquier valor. La variable observada, en este caso, co-rresponde a la latente pero solo cuando esta ultima supera el precio mnimode mercado.

    Otro ejemplo nos ayudara en la formalizacion de este modelo. Supongamosque la variable latente yi es el puntaje en una prueba de aptitud que incluyepuntos en contra, mientras que yi es el puntaje en una prueba de aptitud queincluye puntos en contra, mientras que yi, se define de tal forma que:

    yi =

    {yi , si y

    i > 0,

    0, si yi 0.En cualquiera de los dos casos se conocen los potenciales factores explica-

    tivas del puntaje xi.

    De esta manera la distribucion de la variable yi tiene dos componentesclaramente diferenciados: la parte continua, para las observaciones no censu-radas, y la discreta, para aquellas a las que se asigna el puntaje de corte. Eneste caso, no hay necesidad de escalar la distribucion (como lo fue en el de lasvariables truncadas) ya que la probabilidad acumulada es de 100 % si se consi-dera que a las observaciones censuradas se les asigna la probabilidad de estarlo.

    4.1.6. Censura en el Modelo de Regresion

    Si trabajamos en el ambito del modelo de regresion, tenemos que la variablelatente puede ser representada como:

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 38 4. Modelos Truncados y Censurados

    yi = xi + i

    Para establecer el valor esperado de la variable observada (y), que consi-dera tambien las observaciones censuradas, es necesario diferenciar entre dossituaciones alternativas. Al igual que en el ejemplo anterior, en lo que siguesuponemos que el valor de corte es igual a cero (a=0).

    Para una observacion tomada al azar:

    E(yi|xi) = (0)Pr(yi = 0) + E(yi|yi > 0;xi)Pr(yi > 0)= E(yi|yi > 0;xi)Pr(yi > 0)= (xi + (i))(1 F (i))

    Notese que ahora, como la censura es en 0, se tiene que:

    i =xi

    (i) =f(xi/)

    1 F (xi/) =f(xi/)

    F (xi/)

    Y su varianza sera, en cambio:

    V ar(yi|xi) = 2F (i)[1 (i) + (i (i))2(1 F (i))]Para una observacion no censurada

    Como es la situacion similar a la de las observaciones no truncadas, elmodelo sera el mismo que el de la ecuacion:

    E(yi|yi > 0;x) = xi + (i)Para este modelo aplica todo lo dicho anteriormente, la pregunta seriaahora como estimar los modelos que contienne variables dependientescensuradas y especificamente aquellos planteados antes.

    4.1.7. Estimacion del Modelo de Regresion Censurada

    a. Estimacion por MCO en 2 Etapas

    La estimacion MCO se realiza mediante un procedimiento en dos etapas,que consiste en modelar el proceso de censura previamente a la estimacionde la ecuacion principal.

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 4.1. Variables Dependientes con Truncamiento No Incidental 39

    Primera Etapa

    Se utiliza una variable auxiliar zi de la forma:

    zi =

    {1, si yi > 0: No hay censura

    0, si yi 0: Hay censuraA partir de ella y de un conjunto de explicativas que den cuentade la censura, se estima un modelo probit para obtener el vector/ de estimados y construir y (), segun estan definidos en lasecuaciones previas

    Segunda Etapa

    Se utiliza para estimar por MCO cualquiera de los dos modelosde las ecuaciones para una observacion tomada al azar o para ob-servaciones no censuradas:

    Modelo con todas las observaciones

    yi = (xi + (i))F (i) + i = F (i)x + f(i) + i

    Modelo con todas las observaciones no censuradas

    yi|yi > 0; yi = xi + (i) + iEl uso de uno u otro modelo dependera del objetivo de la investigacion. Elprimero permitira predecir el valor promedio del total de observaciones.En el ejemplo de la disponibilidad a pagar por un automovil, seria elpago promedio realizado por una persona cualquiera de la muestra total,haya comprado el auto o no (el valor promedio de compra, consirandoque auellos que no realizaron la compra pagaron un monto igual a cero).El segundo modelo, en cambio, servira para calcular el valor promediopagado por aquellas observaciones no censuradas y haria posible predecirel valor promedio de las ventas efectivas.

    b. Maxima Verosimilitud: El Modelo Tobit2

    Para estimar un modelo con variable dependiente censurada medianteel metodo de maxima verosimilitud (MV), es necesario considerar quese tiene dos tipos de informacion. Aquella referida a las observacionesno censuradas, para las que se conoce la esperanza condicional de yi, y

    2Tobin (1956) fue el primero en vinvular el problema de censura con el analisis de re-gresion. Relaciono este problema con el modelo probit el el sentido de que hay dos tipos deobservaciones: sobre las que se tiene el valor de la dependiente y las que tienne un valor decero asignado. Por dicha razon se le conoce como el modelo probit de tobin o tobit.

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 40 4. Modelos Truncados y Censurados

    aquella referida a las observaciones censuradas, para las que se conoce laprobabilidad de estar censurada.

    La funcion de verosimilitud se construye considerando ambos componen-tes. As:

    L =yi>0

    Pr(yi > 0)f(yi|yi > 0)yi=0

    Pr(yi = 0)

    Si recordamos que la funcion de densidad truncada viene dada por:

    f(yi|yi > 0) = f(yi)Pr(yi > 0)

    Por lo tanto podemos establecer la funcion de verosimilitud como:

    L =yi>0

    f(yi)yi=0

    Pr(yi = 0)

    Note que el modelo tobit implica que los coeficientes estimados prome-dian dos tipos de efectos de las variables explicativas, aquel sobre laprobabilidad de estar censurado y dado que no lo esta, el efecto sobre elvalor esperado de yi.

    Si no es posible garantizar que las mismas variables explicativas dencuenta de la censura, as como del fenomeno economico que se quiereanalizar condicionado a dicha censura, el tobit puede no ser el modleomas adecuado para realizar la estimacion, ya que el procedimiento queinvolucra implica restringir ambos modelos a un mismo set de variablesexplicativas. Por ejemplo, saber conducir un automovil, puede ser unaexplicativa importante para adquirir o no uno, pero podra no tener ma-yor impacto sobre la cantidad que se paga por el una vez que se hadecidido comprarlo. En este caso es mejor usar el metodo de estimacionen dos etapas visto previamente, en el que se da libertad para incorporarvariables explicativas distintas en cada una de ellas.

    Las estimaciones por MCO sobre toda la muestra que desconocen elproblema de censura, son inconsistentes y suelen ser menores en valorabsoluto a los del modelo Tobit.

    4.1.8. Efectos Marginales y Bondad de Ajuste

    Si se analiza cual es la medida de bonda de ajuste mas apropiada en elcaso de un modelo censurado, podra elegirse el cuadrado del coeficiente de

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 4.1. Variables Dependientes con Truncamiento No Incidental 41

    correlacion entre yi e yi, donde esta ultima se construye a partir del modelodado con todas las observaciones. El estadstico es distinto al R-cuadrado delMCO.

    La definicion basada en el coeficiente de correlacion es preferida a la delR-cuadrado debido a que tiene la ventaja de fluctuar entre 0 y 1, cosa que noocurre con el segundo, el que puede ser negativo en regresiones sin intercepto.De todas formas, es necesario tener en cuenta que el R-cuadrado no es tanimportante en modelos censurados , especialmente en el caso del tobit, q que adiferencias de MCO, no maximiza este estadistico sino la funcion log-verosimil.

    En cuanto a los efectos impacto, puede ser interesante estimarlos tantopara la muestra completa, como para las observaciones no censuradas. Eneste segundo caso, el efecto impacto sera similar al de variables truncadas,aun cuando se observa un cambio de signo (si tomamos en cuenta que seesta trabajando con una censura hacia abajo, con un corte igual a cero ysuponemos una distribucion simetrica). As:

    E(yi|yi > 0;xi)xij

    = j[1 (i)(i + (i))]Este resultado, sin embargo, tiene las mismas consecuencias vistas previa-

    mente respecto del problema de truncamiento.

    En el caso para el modelo de la muestra completa, se tiene el siguienteefecto marginal:

    E(yi|xi)xij

    = jF (j) + xif(i)j xi

    f(i)

    j

    E(yi|xi)xij

    = jF (j)De esta manera, en el caso de trabajar con la muestra completa, para que elcoeficiente j refleje el efecto impacto de la variable explicativa j sobre el valoresperado de y, es necesario multiplicarlo por la probabilidad de la no censura,F (i). Si comparamos este efecto impacto con aquel asociado al de toda lapoblacion (), notaremos que ambos se asemejaran en la medida en que F (i)tiende a 1. Como es de esperarse, los resultados que toman en cuenta unapotencial censura en la muestra y aquellos referidos a la data sin censurar seranequivalentes en la medida en que la mayoria de observaciones se concentren enla parte no censurada. Bajo estas circunstancias, las estimaciones que tomanen cuenta la especificacion para la medida condicional dada en el modelo decensura, seran equivalentes a aquellas que se obtenian si se regresiona yi sobrexi mediante MCO. Es decir, E(yi|xi) = (xi + (i))(1 F (i)) xi, enla medida en que a.

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 42 4. Modelos Truncados y Censurados

    4.2. Variable de Truncamiento Incidental, Ses-

    go de Seleccion

    El problema de sesgo de seleccion se produce cuando la inclusion de unaunidad economica en la muestra depende de una decision previa que no esexogena, por lo que resulta ser una muestra no aleatoria, solo se presenta ses-go de seleccion cuando la muestra no es aleatoria o la seleccion muestral noes exogena. Es decir, si por ejemplo se separan observaciones de una muestrade manera aleatoria, o se utiliza algun criterio exogeno como la edad, el sexo,la raza, no se producira un problema de sesgo de seleccion. En particular, ytal como veremos mas adelante, el sesgo ocurre cuando el componente no ob-servable de la decision de pertenecer a la muestra esta correlacionado con elcomponente no observable del fenomeno bajo analisis.

    Por ejemplo, supongamos que se quiere analizar el rendimiento estudiantilpero solo se cuenta con informacion suficiente sobre dicho rendimiento y susdeterminantes para el caso de escuelas privadas. Como veremos, el hecho detrabajar solo con aquellos ninos jovenes cuya familias decidieron matricularlosen un colegio particular puede tener un efecto sobre el modelo que se buscaestimar y en especial, sobre su media.

    4.2.1. El modelo de Truncamiento Incidental

    Analicemos primero la decision de asistir a determinado tipo de colegio(ecuacion de seleccion). Para esto, y de acuerdo con la formulacion desarrolladapara los modelos de eleccion binaria, supongamos que la utilidad de asistar aun colegio privado (zi ) puede representarse como:

    zi = wi + i

    Dicha ecuacion seria la ecuacion de seleccion, la variable zi no es directa-mente observable. Lo que si se observa es si el estudiante esta matriculado enun colegio privado o no, resultado que depende de que la utilidad de hacerlosupere determinado umbral (a). De esta manera, si zi > a, el alumno se ma-tricula en un colegio privado y, por lo mismo, pertenece a la muestra de trabajo.

    En lo que respecta al rendimiento, supongamos que, en general, este puedeser representado como:

    Y i = xi + i

    Que es la ecuacion de rendimiento, donde Y i es la nota final obtenida en de-terminado ano de estudios escolares. Es necesario notar que en la muestra detrabajo no se tienen observaciones de la distribucion completa de Y i , sino solo

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 4.2. Variable de Truncamiento Incidental, Sesgo de Seleccion 43

    de aquellas observaciones provenientes de estudiantes matriculados en una es-cuela privada. Es decir, la variable dependiente observada Yi viene dada segun:Yi = Y

    i si z

    i > a. Esto implica que si bien E[y

    i |xiwi] = xi, lo mismo no

    ocurre para E[yi|xiwi]. En particular, la esperanza condicional de interes vienedada por: E[yi|xiwi] = E[yi |zi > a;xiwi].

    En este caso sera necesario definir la densidad condicional de yi dado zi

    de la siguiente manera:

    f(yi , zi |zi > a) =

    f(yi , zi |zi > a)

    Pr(zi > a)

    y verificar sus propiedades a partir de lo siguiente.

    Distribucion truncada conjunta

    Si dos variables (y, z) tienen una distribucion normal bivariada, con mediasy y z, varianzas

    2y y

    2z y correlacion yz (distinta de cero), entonces:

    E[y|truncamientosobrez] = y + yzy(z)V ar[y|truncamientosobrez] = 2y[1 2yz(z)]

    Donde z =(az)z

    , y (.), la inversa del ratio de Mills, viene dada segun:

    (z) =f(z)

    1F (z) si el truncamiento es hacia abajo (z > a)

    (z) =f(z)F (z)

    si el truncamiento es hacia arriba (z a)La funcion (.), por su parte, viene dada por (z) = (z)[(z) z],

    donde 0 < (z) < 1.

    Notese que la media de la variable truncada incidentalmente se desplaza enigual direccion que yz cuando el truncamiento es hacia abajo y en direccionopuesta cuando (z a). La varianza se reduce cualquiera sea el caso ya que(.) y 2yz estan entre 0 y 1.

    Si volvemos al ejemplo planteado y tomamos en cuenta los resultados as co-mo las especificaciones para zi e y

    i , repectivamente tenemos que:

    E[yi|zi > a;xiwi] = E[yi |zi > a;xiwi] = xi + u(z)Donde: z =

    awi

    y (z) =z

    1F (z) .

    Vale la pena destacar varios elementos de la expresion anterior. En primerlugar, es claro que E[yi|zi > a;xiwi] 6= xi, excepto cuanto = 0 o cuandoa . Es decir, no bastara con modelar la esperanza de nuestra variable

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 44 4. Modelos Truncados y Censurados

    dependiente como una combinacion lineal de sus determinantes si es que soloes posible observarla efectivamente cuando el agente cumple con una carac-terstica especial (no es cierto que a ) y dicha caracterstica influyesobre el resultado que estoy modelando ( 6= 0).

    Para el ejemplo considerado, preguntarse si 6= 0 equivale a preguntarsesi es que el hecho de estar matriculado en un colegio privado (la caractersticaespecial que hace que una unidad sea parte de la muestra) influye sobre elrendimiento del estudiante (el fenomeno que se esta modelando). Al respecto,nuestra respuesta sera afirmativa en la medida en que creamos que, ademasde las caractersticas socieconomicas tipicamente observables (como la impor-tancia que da el hogar a la acumulacion del capital humano) que afecta tantoa la decision de que tipo de colegio elegir como al rendimiento del nino en elcolegio. Estos no observables seran capturados en i y i y el grado de direc-cion en el que afecten ambos fenomenos (seleccion y rendimiento) vendra dado,precisamente por la correlacion entre los dos terminos de error () y su signo.

    De considerar un sistema educativo como el peruano, donde la calidad deeducacion basica privada es superior a la publica, cabria esperar una correla-cion positiva: mas importancia asignada a la acumulacion de capital humanopor parte del hogar impactara positivamente tanto en la decision de matricu-la en una escuela privada (la posibilidad de observar al agente en la muestraconsiderada) como en el rendimiento en la misma. En este sentido, lo que seplantea es corregir al alza, la esperanza del rendimiento para tomar en cuentaque se esta trabajando con aquellos individuos que pertenecen a hogares espe-cialmente preocupados por la educacion de sus hijos.

    Tan o mas importantes que entender la correccion introducida sobre laesperanza de la variable de interes, es entender el riesgo que corremos de omi-tirla. Es claro que la correccion propuesta no es otra cosa que una variablerelevante mas, cuya inclusion es necesaria para lograr una correcta especifi-cacion de la media condicional de la variable dependiente. No incluirla, portanto, conduciria a los conocidos problemas asociados a la omision de varia-bles. En particular, tendramos estimadores sesgados o para el caso de muestrasgrandes, un estimador no consistente.

    4.2.2. Estimacion del Modelo de Truncamiento Inciden-tal

    La estimacion del modelo de una variable dependiente con sesgo de seleccionpuede hacerse a traves de dos alternativas:

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 4.2. Variable de Truncamiento Incidental, Sesgo de Seleccion 45

    a. MCO: Modelo de Heckit3 En este caso se usa tambien un procedimientode dos etapas, en la primera se estima la ecuacion de seleccion, quecaracteriza la forma en que las observaciones son incluidas en la ecuacionprincipal. La segunda etapa consiste en estimar el modelo principal conla muestra no truncada incidentalmente.

    Primera Etapa Se estima la ecuacion de seleccion utilizando unavariable auxiliar (zi) de la forma:

    zi =

    {1, si zi > 0: Matriculado en colegio privado

    0, si zi 0: Matriculado en colegio publico

    Para ello se estima un probit que permitira obtener los parametros/, con los cuales se construyen z y (z).

    Segunda Etapa

    En la segunda etapa se utiliza (z) para estimar por MCO el si-guiente modelo:

    yi = xi + (z)

    Es decir, regresionar yi sobre xi y (z).

    Es necesario considerar que en la ecuacion de seleccion se debe in-cluir, por lo menos, una variable explicativa adicional que no este enla ecuacion de interes. Si bien la inversa del ratio de Mills es unafuncion no lineal de las explicativas de la ecuacion de seleccion, fre-cuentemente se puede aproximar a traves de una funcion lineal. Porlo mismo, no incluir dicho regresor adicional podra llevar a que lainversa del ratio de Mills este altamente correlacionada con las otrasexplicativas de la ecuacion de interes.

    b. Maxima Verosimilitud

    Para estimar un modelo con sesgo de seleccion a traves del metodo MVes necesario considerar que se tiene dos tipos de informacion. Aquellareferida a las observaciones no truncadas, para las que se conoce la espe-ranza condicional y aquella referida a las observaciones truncadas, paralas que se cuenta con la probabilidad de estarlo.

    Entonces, la funcion de verosimilitud se construye considerando ambostipos de informacion:

    3Heckman (1979)

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 46 4. Modelos Truncados y Censurados

    L =zi >0

    Pr(zi > 0)f(yi|zi > 0)zi =0

    Pr(zi 0)

    Si tenemos en cuenta que:

    f(yi|zi > 0) =f(yi)

    Pr(zi > 0)

    Por lo tanto podemos establecer la funcion de verosimilitud como:

    L =zi >0

    f(yi)zi =0

    Pr(zi 0)

    4.2.3. Efectos Marginales

    Finalmente el efecto impacto de una variable explicativa que se encuentratanto en la ecuacion de seleccion como en la de interes, sobre una dependientecon truncamiento incidental, teniendo:

    E[yi|zi > a;xi, wi] = xi + (z)donde

    (z) =f(z)

    1 F (z)Si suponemos que a=0 tenemos ademas que z =

    wi

    y (z) =f(z)F (z) .

    Entonces el impacto de un cambio en una variable explicativa xi sobre la mediade yi truncada incidentalmente seria:

    E(yi|zi > 0;xi, wi)xij

    = j + (z)

    z

    zij

    = j + [z(z) + (z)2][ j

    ]= j j

    [(z)

    2 z(z)]

    Donde el ultimo corchete es igual a (z).

    Recordando que la variable xj se encuentra en ambas ecuaciones, la deseleccion y la de interes. Si es positivo y la esperanza de yi es mayor pa-ra valores positivos de zi , como (z) se encuentra entre 0 y 1, el segundotermino que aparece restando a j reduce el efecto impacto. El cambio en la

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 4.2. Variable de Truncamiento Incidental, Sesgo de Seleccion 47

    probabilidad de que zi = 1 ante un cambio en xj afecta a la media de yi, yaque en el grupo donde zi = 1 la media es mas alta. As el termino que resta aj compensa este efecto, dejando solo el efecto marginal de un cambio en xjsobre la media de yi, dado que z

    i > 0.

    Al igual que en el caso del truncamiento, j se refiere al efecto impactodel j-esimo regresor sobre la media de la variable dependiente en toda la po-blacion. En otras palabras j se refiere al efecto impacto sobre el rendimientoestudiantil, mientras que el resultado anterior se refiere al efecto impacto sobreel rendimiento en escuelas privadas de una varianle que afecta tanto al rendi-miento como a la probabilidad de estudiar en una escuela de este tipo.

    La correccion por truncamiento incidental no es solo relevante cuando nosinteresa conocer los efectos marginales para la muestra truncada. En muchoscasos el interes se concentra en determinar el valor del vector y su estimacionrequiere considerar la correccion por la inversa del ratio de Mills.

    Por ultimo, es necesario mencionar que en el caso de que las ecuaciones deinteres tengan especificaciones diferentes para ambos grupos. Esto equivale aque el rendimiento de la escuela privada responda a un modelo distinto al dela publica. En algunos casos sera necesario estimar dos regresiones separadaspara cada uno, evaluando en ambas la correccion por el sesgo de seleccioncorrespondiente.

    ===============================================================

    Aplicacion 01: Modelos de variable dependiente limitada

    ===============================================================

    wf u 753

    read(a2, sheet="Hoja1") "C:\mroz.xls" 22

    Modelo Lineal para Horas

    equation mco1.ls hours c nwifeinc educ exper expersq age

    kidslt6 kidsge6

    Modelo Censurado

    equation eq1.censored(h, l=0) hours c nwifeinc educ exper

    expersq age kidslt6 kidsge6

    Modelo Censurado con distribucion normal del error

    equation eq11.censored(d=n, h, l=0) hours c nwifeinc educ

    exper expersq age kidslt6 kidsge6

    Modelo Censurado con distribucion logistica del error

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 48 4. Modelos Truncados y Censurados

    equation eq12.censored(d=l, h, l=0) hours c nwifeinc educ

    exper expersq age kidslt6 kidsge6

    Modelo Censurado con distribucion valor extremo del error

    equation eq13.censored(d=x, h, l=0) hours c nwifeinc educ

    exper expersq age kidslt6 kidsge6

    Modelo Lineal para Salario

    equation mco2.ls wage c educ exper exper^2

    Modelo Truncado en cero

    equation eq2.censored(t, l=0) wage c educ exper exper^2

    Modelo Truncado en cero con distribucion normal del error

    equation eq21.censored(t, d=n, l=0) wage c educ exper exper^2

    Modelo Truncado en cero con distribucion logistica del error

    equation eq22.censored(t, d=l, l=0) wage c educ exper exper^2

    Modelo Truncado en cero con distribucion de valor extremo del error

    equation eq23.censored(t, d=x, l=0) wage c educ exper exper^2

    ===============================================================

    Aplicacion 02: Modelo de Sesgo de Seleccion

    ===============================================================

    Modelo de Truncamiento Incidental: Heckit

    Primera Etapa

    smpl @all

    equation logit1.binary(d=l) inlf c nwifeinc educ exper expersq age

    kidslt6 kidsge6

    series e1=resid

    guardamos los coeficientes para usarlos como parametros de inicio

    coef(8) beta=logit1.@coefs

    calculamos la inversa del ratio de mills

    logit1.fit xbhat

    stom(e1, e)

    matrix sigma2=@transpose(e)*e/(logit1.@regobs-8)

    scalar sigma=@sqrt(sigma2(1,1))

    series imills=@dnorm(-xbhat/sigma)/(1-@cnorm(-xbhat/sigma))

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 4.2. Variable de Truncamiento Incidental, Sesgo de Seleccion 49

    series delta=imills*(imills(-xbhat/sigma))

    Segunda Etapa

    smpl @all

    equation heckman.ls wage educ exper expersq imills

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 50 4. Modelos Truncados y Censurados

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • Sesion 5Modelos de Panel Estatico

    5.1. Introduccion

    Los modelos de datos de panel son versiones mas generales de los modelosde corte tansversal y series de tiempo. En tal sentido, muchas de las conside-raciones utilizadas para estimar estos dos tipos de modelos pueden aplicarseal caso de data panel con algunas modificaciones. En terminos practicos unmodelo de corte transversal puede representarse como:

    yi = + xi + i

    Este es un modelo donde la variabilidad de los datos es transversal oespacial. Es decir, las observaciones son obtenidas para diferentes individuoso grupos de individuos (empresas, ciudades, pases) en un momento dado en eltiempo y existen de estos grupos. Por contraste un modelo de series de tiempose define como:

    yt = + xt + t

    La variabilidad en este caso es temporal. Es decir las observaciones sonpuntos en el tiempo (das, meses, anos) para un grupo particular (un hogar,un pas, una empresa) y existen periodos. En el caso de un modelo de datosde panel se combinan ambas especificaciones en un modelo mas general quetoma la forma:

    yit = + xit + it

    La variabilidad del modelo es transversal y temporal. Es decir, existenobservaciones de individuos o grupos de individuos durante periodos de tiempo.Asimismo, el supuesto sobre los errores (por el momento) es similar a los quese hace para el caso del modelo lineal general, pero esta vez considerando tantola dimension espacial y temporal. Bajo estos supuestos iniciales se identificanuna serie de ventajas de este tipo de modelos:

    51

  • 52 5. Modelos de Panel Estatico

    Incrementa la eficiencia econometrica de los modelos estimados. Un mo-delo de corte transversal cuenta con N observaciones y un modelo deseries de tiempo con T . En el caso de un modelo de panel data se dis-ponen de un total de NxT observaciones. Al incrementarse el numerode datos (y las fuentes de variabilidad de los mismos) se reducen lasposibles fuentes de colinearidad y la eficiencia econometrica de los esti-madores aumenta.

    Por ejemplo, en el caso de un modelo de corte transversal la hetero-geneidad de los datos esta limitada a aquella que vara de individuo aindividuo y no la que es comun a todos los individuos, pero que varaen el tiempo. Esta nueva fuente de variabilidad es una fuente de mayorprecision en los estimados. En lnea con este argumento, un modelo depanel permitira un contexto mas confiable para estudiar efectos dinami-cos. En un contexto de corte transversal estos efectos simplemente nopueden ser estudiados y en un modelo de series de tiempo la precisionde los resultados puede verse afectada por problemas de multicolineari-dad. En un modelo como yt =

    txti + t, donde se intenta estudiar

    un modelo de rezagos distribuidos para un unico individuo o grupos, lasexplicativas xti seran altamente colineares. Sin embargo, si es que sepudiera obtener data de las xti para diferentes grupos, la colinearidadse reducira y sera necesario imponer restricciones ad-hoc a la estructurade rezagos.

    Ampla el ambito de las preguntas economicas que pueden resolverse.En el caso de series tiempo, se puede explicar la variabilidad temporalde los datos o en otras palabras asociar los cambios entre dos variable alo largo del tiempo. En el caso del corte transversal ocurre lo mismo yaque las diferencias por ser explicadas ocurren al nivel de dos individuosdiferentes.

    En un modelo de corte transversal se puede identificar que el ratio depobreza de una region es 20 %, lo cual puede interpretarse como que exis-te un 20 % de probabilidad de que los individuos en la muestra caiganen situacion de pobreza. Luego, en base aun modelo de probabilidades,se pueden identificar los factores que afectan la probabilidad de que unindividuo sea pobre. Sin embargo, el modelo de corte no permite iden-tificar si es que esta probabilidad es constante en el tiempo o no. Porcontraste, un modelo de series tiempo permitira identificar si es que elratio de pobreza de 20 % cambia cada ano. Luego a partir de esas varia-ciones podra estudiar que factores comunes a toda region afectan a laprobabilidad de que cualquier individuo sea pobre.

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 5.1. Introduccion 53

    Las diferencias en las recomendaciones de poltica que se derivan de cadauno de los enfoques son diferentes. Por ejemplo, a traves de un mode-lo de series de tiempo se puede probar la hipotesis que el crecimientoeconomico a traves del manejo macroeconomico ordenado (una polticacomun para toda la sociedad) es el mecanismo por el cual se reduce lapobreza. Sin embargo, no se reconoce la existencia de polticas especficaspara grupos de individuos. Mientras tanto a partir de un modelo de cortetransversal se pueden identificar polticas especficas para un grupo deindividuos (por sector economico o grupos de vulnerabilidad) y disenarpolticas sociales que intenten suplir ciertas carencias. Sin embargo, unapoltica general como el crecimiento economico no puede ser evaluada.

    Solo a la luz de un modelo de panel data, ambas estrategias de superacionde la pobreza pueden ser testeadas una contra la otra (en terminos deimportancia, relevancia y efectividad). No debe caber la duda que esjustamente a partir de estos modelos de datos de panel de donde emergenrecomendaciones como el crecimiento inclusivo, donde las buena polticamacroeconomica es importante para superar la pobreza, pero insuficientey debe ser complementada con polticas sociales o sectoriales (en sentidoamplio) que reduzcan las vulnerabilidades particulares de cierto grupode individuos. Con un modelo de corte o series de tiempo no habra sidoposible llegar a una conclusion como esta.

    Permite solucionar problemas econometricos importantes asociados a lamala especificacion por variables omitidas o efectos no observables. Co-mo se recuerda, tales problemas generan resultados sesgados e incon-sistentes. El ejemplo tpico ocurre en modelos micro-econometricos delmercado laboral. As, imagine que el investigador esta interesado en es-timar una curva de salarios en Lima Metropolitana y para ello disponedel siguiente modelo: wi = + xi + zi + i. Claramente, esta es unaespecificacion de corte transversal donde las i corresponden a los dife-rentes sujetos dentro de la muestra. La variable wi son las observacionesde los salarios percibidos por los limenos en el 2009, corresponde a unvector de caractersticas observables de los individuos que potencialmen-te influyen en sus salarios (educacion y edad, por ejemplo) y las zi sonfactores no observados en la muestra ya sea porque nuestra encuesta noincluye esa informacion (por ejemplo, la calidad de la educacion recibi-da) o informacion simplemente no disponible (habilidad del individuo).Bajo estas condiciones lo que realmente el investigador esta estimandoes wi = + xi + ei donde ei = zi + i En la medida que las zi seencuentren correlacionadas con las xi (como es de suponer). Una esti-macion MCO de sera incosistente impidiendo una correcta estimaciondel efecto de la educacion en los salarios, por ejemplo. Una alternativa es

    Eviews IntermedioAplicado al Analisis Microeconometrico

    www.giddea.com

    [email protected]

  • 54 5. Modelos de Panel Estatico

    utilizar variables instrumentales, sin embargo, la real capacidad del in-vestigador para obtener instrumentos confiables puede ser limitada. Anteesta dificultad, los modelos de datos de panel ofrecen una alternativa sies que los factores no observados zi varan entre individuos (la habili-dad o calidad educativa recibida es diferente entre dos individuos), peroes constante en el tiempo (la habilidad de una persona que trabaja o lacalidad de la educacion se mantiene de un ano a otro). Con ello, si es quese disponen de datos de panel, el modelo puede plantearse de la siguienteforma wit = +xit+zi+it. Al tomar el primer rezago de la ecuacion(si se dispusiera de una base de datos del ano 2008) obtenemos wit1 =+xit1+zi+it1 y al restar el primer rezago de la ecuacion originalse obtiene witwit1 = ()+(xitxit1)+(zizi)+(itit1), esdecir wit = xit+eit, un modelo que puede ser estimado a traves deMCO y ofrecer estimados constantes de una vez que se toma en cuenta.Sin embargo, la estructura de los errores ahora es de media movil, lo quepuede crear problemas en la estimacion aunque posibles de ser corregi-dos. En todo caso, la disponibilidad del panel ha permitido corregir lapresencia de variables no observables.

    Notese que una alternativa de estimacion es tomar las diferencias res-pecto a las medias temporales y estimar la relacion: wit wi = (xit xi) + (it i), con lo que se han eliminado tambien aquellos factores noobservables que son constantes a traves del tiempo, pero que varan deindividuo a individuos. Esta es una estimacion MCO en diferencias demedias que proveera resultados insesgados y consistentes.

    Si por el contrario estos factores fueran constantes entre individuos,


Recommended