+ All Categories
Home > Documents > INTRODUCCIÓN A LA ECONOMETRÍA

INTRODUCCIÓN A LA ECONOMETRÍA

Date post: 22-Nov-2021
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
70
ucm.randomshock.com UN PRIMER CONTACTO INTRODUCCIÓN A LA ECONOMETRÍA JOSÉ ALBERTO MAURICIO
Transcript
Page 1: INTRODUCCIÓN A LA ECONOMETRÍA

ucm.randomshock.com

UN PRIMER CONTACTO

INTRODUCCIÓN A LA

ECONOMETRÍA

JOSÉ ALBERTO MAURICIO

Page 2: INTRODUCCIÓN A LA ECONOMETRÍA
Page 3: INTRODUCCIÓN A LA ECONOMETRÍA

Econometric techniques are usually developed and employed for answering practical questions. As the first five letters of the word "econometrics" indicate, these questions tend to deal with economic issues, although applications to other disciplines are widespread. The economic issues can concern macroeconomics, international economics, and microeconomics, but also finance, marketing, and accounting. The questions usually aim at a better understanding of an actually observed phenomenon and sometimes also at providing forecasts for future situations. Often it is hoped that these insights can be used to modify current policies or to put forward new strategies.

P.H. FRANSES A Concise Introduction to Econometrics

Decision making in business and economics is often supported by the use of quantitative information. Econometrics is concerned with summarizing relevant data information by means of a model. Such econometric models help to understand the relation between economic and business variables and to analyse the possible effects of decisions.

C. HEIJ, P. DE BOER, P.H. FRANSES, T. KLOEK Y H.K. VAN DIJK Econometric Methods with Applications in Business and Economics

Econometrics is used in all applied economics fields to test economic theories, to inform government and private policymakers, and to predict economic time series. Sometimes, an econometric model is derived from a formal economic model, but in other cases, econometric models are based on informal economic reasoning and intuition.

J.M. WOOLDRIDGE Introductory Econometrics - A Modern Approach

Social scientists and policymakers alike seem driven to draw sharp conclusions, even when these can be generated only by imposing much stronger assumptions than can be defended. We need to develop a greater tolerance for ambiguity. We must face up to the fact that we cannot answer all of the questions that we ask.

C.F. MANSKI - Identification Problems in the Social Sciences Citado en B.H. BALTAGI - Econometrics

Page 4: INTRODUCCIÓN A LA ECONOMETRÍA

Intro-Ectr.pdf

COPYRIGHT © 2009 - 2021 J.A.M.

ucm.randomshock.com

Versión 5.0 - Julio 2021

Page 5: INTRODUCCIÓN A LA ECONOMETRÍA

iii

CONTENIDO

PRÓLOGO iv 1 La Naturaleza de la Econometría 1

1.1 Preguntas 2 1.2 Datos 7

1.3 Modelos 12

1.4 Respuestas 20

2 La Metodología de la Econometría Aplicada 25

2.1 Especicación 27 2.2 Estimación 34 2.3 Diagnosis y Revisión 38

3 Los Recursos Instrumentales de la Econometría 43

3.1 Matemáticas y Estadística 44 3.2 Recursos Informáticos 49

Resumen 50 Bibliografía 52 Ejercicios 53 APÉNDICE 58 A.1 Archivos de Datos 58 A.2 Indicaciones sobre Algunos Ejercicios 58

Page 6: INTRODUCCIÓN A LA ECONOMETRÍA

iv

PRÓLOGO

Las maneras de impartir y de recibir las enseñanzas universitarias correspondientes a un primer cuatrimestre de Econometría, han cambiado notablemente desde el curso académico 1986-87 (lo cual es bastante lógico, teniendo en cuenta que han transcurrido treinta y cinco años desde entonces ...), cuando algunos estudiantes de cuarto curso de la licenciatura en Ciencias Económicas y Empresariales de la UCM nacidos en torno a 1965 tuvimos nuestro primer contacto serio con ella. No obstante, el contenido de la materia sigue siendo esencialmente el mismo desde entonces (seguramente, incluso, desde mucho antes): métodos (teoría) y aplicaciones (práctica) del Análisis de Regresión Lineal con datos de sección cruzada y con datos de series temporales, con algunos añadidos importantes más recientes dedicados en particular al análisis de datos de series temporales no estacionarias.

Los cambios en las maneras de impartir y de recibir la docencia han estado motivados, sobre todo, por las enormes posibilidades asociadas con el desarrollo vertiginoso de la informática y las comunicaciones. Por ejemplo, en la actualidad es extraordinariamente sencillo acceder a grandes colecciones de datos y analizarlos cómoda y ecientemente con un ordenador portátil de gran potencia en prácticamente cualquier ubicación física. También es muy sencillo y rápido el intercambio de información de todo tipo entre quienes imparten la docencia y quienes la reciben, más allá del tradicional intercambio presencial que sigue siendo muy valioso y productivo.

Por su parte, el hecho de que el contenido de la materia en un primer cuatrimestre de Econometría siga siendo esencialmente el mismo que hace treinta y cinco años, está razonablemente justicado por la importancia del Análisis de Regresión Lineal no sólo como instrumento de gran utilidad por sí mismo, sino también como herramienta en la que se fundamenta gran parte de los métodos econométricos utilizados en la actualidad.

En cualquier caso, quizás lo realmente importante en un primer curso de Econometría no

Page 7: INTRODUCCIÓN A LA ECONOMETRÍA

PRÓLOGO

v

tenga que ver del todo ni con el contenido de la materia ni con la forma de impartirla o de estudiarla, sino más bien con intentar explicar y entender claramente desde el principio del curso qué es la Econometría. La idea central a este respecto es muy simple: la Econometría es una herramienta de propósito general que puede contribuir a resolver muchos problemas prácticos, mediante la interpretación y el uso adecuado de la información contenida en una colección de datos resumida a través de uno o varios modelos.

Probablemente, la dicultad principal con la que nos hemos encontrado estudiantes y profesores de Econometría durante al menos los últimos treinta y cinco años, ha tenido que ver con no percibir ni transmitir claramente esta idea tan sencilla desde el principio del curso. En muchas ocasiones, nos hemos limitado a explicar y a entender la Econometría como un conjunto variado de fórmulas y técnicas dirigidas cada una por su cuenta, de forma inconexa, al análisis de distintos tipos de datos económicos o nancieros, en vez de como un intento unicador y riguroso de analizar, resumir e interpretar la información no experimental que se puede obtener mediante la mera observación de fenómenos y entornos muy diversos de carácter tanto social como natural.

Con la presente Introducción a la Econometría se pretende ofrecer suciente información (más de la concebida inicialmente, de hecho) para dejar lo más claras posible, desde el comienzo de un primer curso de Econometría, las ideas mencionadas en los dos párrafos anteriores. Con estas ideas bien transmitidas y entendidas, se espera que la parafernalia técnica (matemática, estadística e informática) asociada con un primer contacto con la Econometría teórica y aplicada, resulte fácilmente explicable y entendible dentro de un panorama amplio y progresivamente familiar en el que se pueden ir detallando, poco a poco y con sentido, todas las piezas que suelen conformar ese primer curso.

J.A.M. Julio de 2021

D.AM.H.

Observación: Los archivos de datos (WF1) en el formato del programa EViews que se mencionan a lo largo del texto pueden obtenerse como se indica en el Apéndice A.1.

Page 8: INTRODUCCIÓN A LA ECONOMETRÍA

INTRODUCCIÓN A LA

ECONOMETRÍA UN PRIMER CONTACTO

Page 9: INTRODUCCIÓN A LA ECONOMETRÍA

Introducción a la Econometría: Un Primer Contacto 1

Wanderers in the land of Osten Ard are cautioned not to put blind trust in old rules and forms, and to observe all rituals with a careful eye, for they often mask being with seeming.

T. WILLIAMS Memory, Sorrow and Thorn - The Dragonbone Chair

A pesar de sus “viejas reglas” y “rituales” y de lo que el término sugiere, la econometría no trata únicamente de cómo medir o evaluar teorías y relaciones económicas. Ante todo, la econometría moderna es una herramienta de propósito bastante general que puede contribuir a resolver una amplia gama de problemas prácticos mediante análisis de datos.

Las páginas siguientes están dedicadas en parte a presentar un muestrario breve de dichos problemas. También se describen con cierto detalle la metodología que se emplea en la práctica para contribuir a resolverlos y el tipo de soluciones que la econometría puede ofrecer en ámbitos variados. En conjunto, en estas páginas se presenta, desde un punto de vista introductorio, una panorámica global de la econometría a partir de la que podría desarrollarse el contenido de un primer curso sobre esta disciplina. Disponer de una visión global desde el principio puede resultar útil para entender, desde una perspectiva general, cuál es el interés especíco de cada uno de los temas que suelen congurar un primer curso típico de econometría.

1 La Naturaleza de la Econometría

La toma de decisiones en economía y en nanzas, así como en muchos otros contextos de carácter tanto social como natural, se basa a menudo en la información cuantitativa contenida en unos datos. Los datos suelen reejar, con mayor o menor precisión, ciertos aspectos del funcionamiento real de un sistema económico, nanciero o de algún otro tipo,

Page 10: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

2 Introducción a la Econometría: Un Primer Contacto

cuyo entendimiento es esencial para tomar razonadamente una decisión entre varias alternativas posibles. En ocasiones, entender cuál es el funcionamiento de un sistema que aparece reejado en unos datos es un asunto meramente cientíco, en el sentido de que, a veces, tan sólo se pretende inferir a partir de los datos y divulgar las pautas esenciales del funcionamiento del sistema considerado.

La econometría aplicada trata de cómo analizar datos para responder a preguntas diversas referidas a sistemas cuyo funcionamiento es, en buena medida, estocástico o aleatorio, es decir, imposible de caracterizar con total exactitud o de prever con absoluta certeza. Por este motivo, muchos de los métodos que se utilizan en la econometría aplicada para analizar datos están tomados directamente o adaptados de la estadística. Otros son métodos desarrollados especícamente para analizar ciertos tipos de datos que son especiales por algún motivo. En conjunto, todos estos métodos conforman lo que se denomina econometría teórica, teoría econométrica o métodos econométricos.

En esta Sección 1 se ofrece una panorámica general acerca de las preguntas que puede contribuir a responder la econometría aplicada, los tipos de datos que suelen emplearse para intentar responderlas, los métodos que se utilizan para analizar dichos datos y, en última instancia, las respuestas que pueden darse a las preguntas planteadas.

1.1 Preguntas

El punto de partida de cualquier análisis econométrico aplicado consiste en plantear con precisión una pregunta concreta sobre algún aspecto de un sistema estocástico, cuya respuesta se pretende obtener usando la evidencia empírica contenida en una colección de datos. Aunque hay otras posibilidades, muchas preguntas que se plantean en la econometría aplicada tratan sobre la evaluación de efectos causales entre determinadas variables y sobre la previsión de cantidades desconocidas.

1.1.1 Ejemplo - Algunas Preguntas Analizables con Datos En este ejemplo se enuncian varios problemas prácticos potencialmente resolubles mediante análisis de datos. Cada problema va acompañado por una sugerencia sobre los datos que podrían emplearse para intentar resolverlo. .EJERCICIO 1.

Page 11: INTRODUCCIÓN A LA ECONOMETRÍA

1.1 Preguntas

Introducción a la Econometría: Un Primer Contacto 3

P01: Evaluar la ecacia de un fertilizante. Datos: Rendimiento de varias zonas de cultivo y cantidad empleada de fertilizante en cada una de ellas.

P02: Evaluar el efecto de la asistencia a clase sobre las notas nales. Datos: Notas nales y horas de asistencia a clase de varios alumnos.

P03: Evaluar el efecto del consumo de tabaco durante el embarazo sobre el peso de un recién nacido. Datos: Peso de varios recién nacidos y consumo diario de cigarrillos por parte de sus madres durante el embarazo.

P04: Evaluar la posible discriminación salarial por motivos de género. Datos: Salario, años de educación, años de experiencia y género de varias personas trabajadoras.

P05: Estimar el precio de venta de una vivienda de segunda mano en función de sus características. Datos: Precio de venta, supercie, número de habitaciones, estado de conservación y localización de varias viviendas puestas recientemente a la venta.

P06: Evaluar el efecto del gasto anual en publicidad sobre las ventas de una empresa. Datos: Volumen de ventas y gasto en publicidad referidos a varios años consecutivos.

P07: Describir la inercia observada en la evolución del crecimiento anual del PIB real y preverlo a corto plazo. Datos: Variación anual del PIB real en varios años consecutivos.

P08: Analizar y prever la rentabilidad de algunos valores de la deuda pública a corto plazo. Datos: Tipos de interés de las operaciones a seis meses y a tres meses en el mercado secundario de la deuda pública, referidos a varios trimestres consecutivos.

P09: Evaluar la relación entre el gasto en alimentación de una familia y su renta disponible. Datos: Gasto en alimentación y renta disponible de varias familias.

P10: Evaluar el efecto de la educación sobre los salarios. Datos: Salarios, años de educación y otras características laborales y personales de varios trabajadores.

Quizás las preguntas más difíciles de responder en la econometría aplicada son las que tratan sobre cómo evaluar algún efecto causal (como P01, P02, P03, P06 y P10 en el Ejemplo 1.1.1), es decir, cómo aislar y cuanticar la inuencia directa o parcial de una variable sobre otra. La dicultad principal tiene que ver con que, en muchas ocasiones, los datos disponibles para intentar evaluar efectos causales son de tipo observacional o no experimental, es decir, son datos que no se han obtenido mediante la ejecución activa de

Page 12: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

4 Introducción a la Econometría: Un Primer Contacto

un experimento controlado diseñado especícamente para provocar, aislar y medir una reacción o una inuencia, sino mediante la mera observación pasiva de un sistema dado. En estas condiciones, el problema reside en que las variables sobre las que se pretende evaluar algún efecto causal (el rendimiento de una zona de cultivo, la nota nal de un alumno, el peso de un recién nacido, las ventas de una empresa, o el salario de un trabajador) suelen estar sometidas a un número elevado de inuencias relacionadas entre sí, muchas de ellas no controlables por el analista (investigador), y algunas difíciles o imposibles de observar. Evaluar ablemente el efecto aislado de una inuencia dada (la cantidad empleada de un fertilizante, las horas de asistencia a clase, el consumo de tabaco durante el embarazo, el gasto en publicidad, o los años de educación) puede resultar especialmente difícil si la inuencia que se pretende aislar está relacionada con otras que no se consideran, por imposibilidad o por error, explícitamente en el análisis.

1.1.2 Definición - Efectos Causales A continuación se dene con precisión un efecto causal y se describen las dicultades asociadas con la evaluación de efectos causales usando datos no experimentales. La posibilidad de ejecutar un experimento controlado elimina, en general, dichas dicultades.

En preguntas como P01 o P02 en el Ejemplo 1.1.1, se trata de cómo evaluar el efecto causal de una variable X (la cantidad empleada de un fertilizante, o el número de horas de asistencia a clase) sobre otra variable Y (el rendimiento de una zona de cultivo, o la nota nal de un alumno en cierta asignatura). Todas las inuencias posibles que recibe Y se pueden resumir mediante una expresión matemática (una función) del tipo

( , , )Y F X W V= , [1]

donde W representa las inuencias observables que no están recogidas en X, mientras que V recoge todas las inuencias sobre Y difíciles o imposibles de observar. .EJERCICIO 2.

En relación con [1], el efecto causal (directo, parcial o “ceteris paribus”) de X sobre Y puede denirse como la variación o la respuesta de Y relativa a una variación en X ( 0XD =/ ) cuando W y V permanecen constantes ( 0W VD = D = ). Cualquier variación que tiene lugar en Y se puede descomponer, de acuerdo con [1], como

[ ] [ ] [ ]X W VY F X F W F VD @ ´D + ´D + ´D , [2]

donde XF , WF y VF son las derivadas parciales de la función ( , , )F X W V con respecto a

Page 13: INTRODUCCIÓN A LA ECONOMETRÍA

1.1 Preguntas

Introducción a la Econometría: Un Primer Contacto 5

cada uno de sus tres argumentos. La derivada XF en [2] representa el efecto causal de X sobre Y en el sentido de que / XY X FD D @ cuando 0XD =/ y 0W VD = D = . La utilidad de una representación matemática como [1]-[2] reside justamente en que permite considerar de forma aislada un efecto de este tipo, a pesar de que en la práctica puede ser difícil o imposible observar qué ocurre cuando X varía ( 0XD =/ ) a la vez que W y V permanecen constantes ( 0W VD = D = ).

En la práctica, cuando las inuencias W y V en [1] presentan algún tipo de relación sistemática con X [por ejemplo, si la irrigación ( )W y la calidad del suelo ( )V de una zona de cultivo están relacionadas con la cantidad empleada de un fertilizante ( )X , o si el número de horas de estudio fuera de clase ( )W y el grado de interés por una asignatura ( )V están relacionados con el número de horas de asistencia a clase ( )X ], cualquier variación en X tiene asociadas ciertas variaciones en W y en V, que pueden representarse, respectivamente, como XWD y XVD . En este caso, la respuesta total de Y frente a una variación de cuantía XD en X puede escribirse, de acuerdo con [2], como

Respuesta Total

Respuesta Directa Respuesta Indirecta

X X W X V XY F X F W F VD @ ´D + ´D + ´D

,

o bien, de manera más explícita, como

Efecto Total

Efecto Directo Efecto Indirecto I Efecto Indirecto II

X XW VX X W VX X

Y F F F XD DD D

é ùê úê úD @ + ´ + ´ Dê úê úê úë û

. [3]

En la Figura 1 de la página siguiente están representados el efecto directo (con trazo grueso) y los efectos indirectos (con trazos delgados) considerados en [3].

Tanto la expresión [3] como la Figura 1 ponen de maniesto lo siguiente: la variación total relativa de Y asociada con X, /XY XD D , representa el efecto causal o directo XF de X sobre Y sólo cuando (i) 0W VF F= = , de manera que ni W ni V inuyen directamente sobre Y (una posibilidad, en general, más bien remota y, por lo tanto, descartable), o bien cuando (ii) 0X XW VD = D = , de manera que ni W ni V varían sistemáticamente con X. Desde el punto de vista de un análisis econométrico aplicado, esto signica que el grado de asociación (relativa) entre yY X observado en una colección de datos sobre dichas

Page 14: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

6 Introducción a la Econometría: Un Primer Contacto

ΔX

I II

XΔW XΔV

XΔY

XF

WF VF

variables, representará un efecto causal sólo si las inuencias sobre Y que no se consideran de forma explícita en el análisis no están relacionadas con X. Por el contrario, si existen relaciones sistemáticas entre W y X, o entre V y X, entonces el grado de asociación observado entre yY X puede deberse tan sólo a la existencia de dichas relaciones (es decir, a los efectos indirectos en [3], representados con trazos delgados en la Figura 1) y no a la existencia de un efecto causal de X sobre Y (el efecto directo en [3], representado con un trazo grueso en la Figura 1). En tal caso, suele decirse que la relación observada entre

yY X es una relación espuria, en el sentido de que dicha relación es tan sólo aparente, carente de legitimidad o de autenticidad.

1.1.3 Ejemplo - Cómo Obtener Datos Experimentales En la práctica, para garantizar la independencia de W (por ejemplo, irrigación o número de horas de estudio fuera de clase) y de V (por ejemplo, calidad del suelo o grado de interés por una asignatura) con respecto a X (cantidad empleada de un fertilizante o número de horas de asistencia a clase), se podría intentar obtener datos sobre yY X ejecutando alguno de los dos experimentos siguientes: .EJERCICIO 3.

Experimento I. Paso 1: Escoger una colección de datos sobre X tal que los valores correspondientes de W y de V sean idénticos en todos los casos. Paso 2: Observar los valores correspondientes de Y. Esta estrategia garantiza que W y V no varían en absoluto en los casos considerados ( 0W VD = D = ), por lo que cualquier asociación observada entre yY X representa ciertamente el efecto parcial o “ceteris paribus” de X sobre Y. El problema asociado con esta estrategia reside en que es muy difícil asegurar que W y V tengan exactamente los mismos valores en todos los casos, especialmente en relación con

FIGURA 1 Efectos Directo e Indirectos de X sobre Y en la Ecuación [3]

Page 15: INTRODUCCIÓN A LA ECONOMETRÍA

1.2 Datos

Introducción a la Econometría: Un Primer Contacto 7

las inuencias difíciles o imposibles de observar contenidas en V.

Experimento II. Paso 1: Asignar a X una colección de valores predeterminados sin tener en cuenta (ignorando o independientemente de) los valores correspondientes de W y de V (por ejemplo, asignando valores a X de acuerdo con una secuencia de números aleatorios generados por un ordenador). Paso 2: Observar los valores correspondientes de Y. Esta estrategia garantiza que W y V varían independientemente de X ( 0X XW VD = D = ), por lo que (igual que en el Experimento I anterior) cualquier asociación observada entre

yY X representa el efecto directo o causal de X sobre Y. El problema asociado con esta estrategia reside en que asignar a X unos valores controlados o decididos de antemano puede resultar impracticable por diversos motivos (por ejemplo, porque dicha asignación sea prohibitivamente costosa, moralmente inaceptable o simplemente imposible).

Cuando no es posible obtener datos a través de alguna de estas estrategias, la evaluación able en la práctica de efectos causales puede resultar difícil, especialmente si no se tiene conanza en que las inuencias sobre Y que no se consideran de forma explícita son sucientemente independientes de los datos observados sobre X. Por este motivo, dos elementos centrales en el diseño y la elaboración de cualquier análisis econométrico aplicado son los que tienen que ver con qué variables se incluyen explícitamente en el análisis y cuál es su posible relación con otras variables que se omiten.

Actualmente, la econometría puede emplearse para contribuir a resolver problemas muy variados, que no se limitan obligatoriamente a cuestiones causales de tipo económico o nanciero. No obstante, esta amplitud de posibilidades sí obliga a plantear el problema que se pretende resolver en cada caso de la manera más concreta y especíca posible. Esto es imprescindible para decidir adecuadamente qué datos utilizar (de qué tipo, sobre qué colectivo, o sobre qué período temporal) y qué métodos emplear para analizarlos. Sin un planteamiento inicial preciso sobre el objetivo y el interés de un análisis, es prácticamente imposible saber siquiera por dónde empezar.

1.2 Datos Cada dato que se emplea en un análisis econométrico aplicado es un valor numérico de cierta característica de una entidad observable (un individuo, una organización, un objeto

Page 16: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

8 Introducción a la Econometría: Un Primer Contacto

o un lugar, en el sentido más amplio de cualquiera de estos términos) que forma parte del sistema social o natural al que se reere la pregunta planteada al comienzo del análisis. En función de cómo se haya llevado a cabo la observación de dicho sistema, los datos resultantes pueden ser, al menos, de tres tipos (con algunas variaciones dentro de cada uno de ellos): datos de sección cruzada o transversales, datos de series temporales y datos de panel o longitudinales. Cada uno de estos tipos de datos resulta adecuado para resolver unas cuestiones determinadas, por lo que la pregunta que se plantea al comienzo de un análisis suele indicar el tipo de datos que es relevante en cada caso.

1.2.1 Definición - Datos de Sección Cruzada o Transversales Una sección cruzada es una colección de datos sobre una o varias características comunes de distintas entidades observables en un momento dado.

1.2.2 Ejemplo - Una Sección Cruzada de Viviendas Unifamiliares La Tabla 1 contiene parte de una colección de datos de sección cruzada que se podría utilizar para intentar resolver un problema como P05 en el Ejemplo 1.1.1. La sección cruzada completa se encuentra en el archivo SC01-VIVIENDAS.WF1.

La Tabla 1 está organizada de manera que cada la se reere a una entidad observada (una vivienda) y cada columna a una característica (precio de venta, supercie y número de dormitorios). Aunque conviene asignar a cada entidad observada un número de orden (como en la primera columna de la Tabla 1), el orden en el que están dispuestas las

TABLA 1 Datos sobre Algunas Características de 80 Viviendas Unifamiliares

Vendidas en el Área Metropolitana de Boston en 1990

Número de Observación

Precio de Venta (miles de dólares)

Superficie (metros cuadrados)

Número de Dormitorios

1 335.0 226.5 4 2 405.0 192.9 3 3 226.0 127.6 3

78 365.5 203.1 3 79 281.0 179.1 4 80 260.0 120.2 3

Page 17: INTRODUCCIÓN A LA ECONOMETRÍA

1.2 Datos

Introducción a la Econometría: Un Primer Contacto 9

observaciones es, en general, irrelevante para el análisis.

En muchas ocasiones, una sección cruzada se reere a un grupo de entidades observables que es tan sólo un subconjunto de un colectivo más amplio. Por este motivo, una sección cruzada suele interpretarse como una muestra aleatoria procedente de una población bien denida. Si en una sección cruzada están sucientemente bien representadas todas las entidades observables de una población, entonces puede esperarse que las conclusiones obtenidas del análisis de dicha sección cruzada (muestra) sean aplicables a todo el colectivo (población). .EJERCICIO 4.

Los datos de sección cruzada suelen emplearse para investigar posibles relaciones entre ciertas características o variables de una población examinando las diferencias observadas entre distintas entidades de una muestra en un momento dado.

1.2.3 Definición - Datos de Series Temporales Una serie temporal es una secuencia de datos ordenados cronológicamente sobre una o varias características de una única entidad observable en diferentes momentos.

1.2.4 Ejemplo - Series Temporales de Ventas y Publicidad La Tabla 2 contiene parte de una colección de datos de series temporales que podría utilizarse para intentar resolver un problema como P06 en el Ejemplo 1.1.1. Las series completas se encuentran en el archivo ST01-PINKHAM.WF1.

TABLA 2 Datos sobre Ventas y Gasto en Publicidad Anuales de la Empresa

Lydia E. Pinkham's Medicine Co. desde 1907 hasta 1960

Número de Observación

Fecha (año)

Volumen de Ventas (miles de dólares)

Gasto en Publicidad (miles de dólares)

1 1907 1016 608 2 1908 921 451 3 1909 934 529

53 1959 1387 644 54 1960 1289 564

Page 18: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

10 Introducción a la Econometría: Un Primer Contacto

La Tabla 2 está organizada de manera que cada la se reere a una fecha (un año) y cada columna a una característica (volumen de ventas y gasto en publicidad) de la entidad observada (una empresa). A diferencia de lo que suele ocurrir con una sección cruzada, el orden en el que guran los datos en una serie temporal es crucial para detectar posibles inercias o dinámicas en la evolución de las características a las que se reeren los datos.

Una serie temporal está asociada con un período muestral que es sólo una parte de la historia de la entidad considerada. En este sentido, una serie temporal suele interpretarse como una muestra ordenada (no aleatoria) extraída de un proceso estocástico (desarrollo histórico) bien denido. Si las circunstancias sociales o naturales del período muestral al que se reere la serie temporal considerada se mantienen relativamente estables después de dicho período, entonces puede esperarse que las conclusiones obtenidas del análisis de dicha serie sean aplicables también a momentos posteriores, al menos a corto plazo.

El análisis de series temporales permite investigar posibles relaciones dinámicas entre variables examinando las variaciones recogidas en los datos entre momentos consecutivos de la historia de una entidad observable. Adicionalmente, el análisis de series temporales se emplea con mucha frecuencia para prever la evolución futura de variables económicas, nancieras, y de muchos otros tipos. .EJERCICIO 5.

En ocasiones, puede resultar útil analizar información que combine datos de sección cruzada con datos de series temporales. En particular, el análisis de una combinación de distintas secciones cruzadas referidas a la misma población en diferentes momentos de su historia, puede resultar útil para evaluar cómo han variado con el paso del tiempo ciertas características de la población considerada (debido, por ejemplo, a la implantación de nuevas políticas o a la ocurrencia de sucesos especiales). Cuando las entidades observadas son exactamente las mismas en cada momento considerado, la colección de datos correspondiente se denomina una colección de datos de panel.

1.2.5 Definición - Datos de Panel Una colección de datos de panel (o un panel de datos) es una secuencia de datos ordenados cronológicamente sobre varias características de las mismas entidades observables en diferentes momentos.

Page 19: INTRODUCCIÓN A LA ECONOMETRÍA

1.2 Datos

Introducción a la Econometría: Un Primer Contacto 11

1.2.6 Ejemplo - Un Panel de Datos de Trabajadores La Tabla 3 contiene algunas observaciones de una combinación de dos secciones cruzadas extraídas de la misma población en dos momentos de su historia. Estos datos podrían utilizarse para investigar cómo ha cambiado de un momento a otro la cuestión a la que se reere el problema P04 del Ejemplo 1.1.1. Las dos secciones cruzadas completas se encuentran en el archivo PA01-SALARIOS1.WF1.

TABLA 3 Una Combinación de Dos Secciones Cruzadas de

550 Trabajadores en 1978 y 534 Trabajadores en 1985

Número de Observación

Fecha (año)

Salario Medio Anual (dólares por hora)

Educación (años)

Experiencia (años) Género

1 1978 3.37 12 8 Hombre2 1978 5.00 12 30 Mujer3 1978 8.50 6 38 Hombre

550 1978 12.50 15 12 Hombre

551 1985 9.00 10 27 Hombre552 1985 5.50 12 20 Hombre553 1985 3.80 12 4 Mujer

1084 1985 19.47 12 9 Hombre

TABLA 4 Un Panel de Datos de 545 Trabajadores en 1980 y 1981

Número de Observación Trabajador Fecha

(año) Salario Medio Anual (dólares por hora)

Educación (años)

Experiencia (años)

1 1 1980 3.31 14 1 2 1 1981 6.38 14 2 3 2 1980 5.34 13 4 4 2 1981 4.56 13 5

1087 544 1980 6.30 11 2 1088 544 1981 8.80 11 3 1089 545 1980 3.10 9 5 1090 545 1981 3.71 9 6

Page 20: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

12 Introducción a la Econometría: Un Primer Contacto

Como en el caso de una única sección cruzada, el orden en el que están dispuestas las observaciones individuales en la Tabla 3 no es importante. Sin embargo, identicar claramente a qué momento se reere cada observación (como se hace en la segunda columna) es crucial para evaluar posibles cambios poblacionales de un momento a otro.

Por otro lado, la Tabla 4 de la página anterior contiene parte de un panel de datos que podría utilizarse para intentar resolver un problema como P10 en el Ejemplo 1.1.1. El panel completo se encuentra en el archivo PA02-SALARIOS2.WF1.

La Tabla 4 está organizada de manera que cada dos las se reeren a los dos años observados para cada trabajador. La Tabla 4 se podría haber organizado igual que la Tabla 3 (con 545 las primero para todos los trabajadores en el año 1980 y 545 las debajo para los mismos trabajadores en 1981), lo que sugiere que una colección de datos de panel (como la de la Tabla 4) puede analizarse como si fuese una mera combinación de secciones cruzadas (como la de la Tabla 3). No obstante, el hecho de que en un panel de datos las entidades observadas en cada momento sean exactamente las mismas, permite la utilización de métodos especiales para su análisis con la nalidad de responder a ciertas preguntas que no son tratables con una mera combinación de secciones cruzadas.

En general, la dimensión temporal que los datos de panel añaden a los datos de sección cruzada permite responder a preguntas que son difíciles o imposibles de responder utilizando solamente una sección cruzada. Concretamente, el hecho de disponer de múltiples observaciones temporales sobre las mismas entidades observables facilita la evaluación de efectos causales en situaciones en las que sería imposible evaluar dichos efectos de manera able con una única sección cruzada.

1.3 Modelos Una vez escogidos los datos que se van a utilizar para resolver el problema planteado al comienzo de un análisis, el paso siguiente consiste en elaborar con ellos un modelo econométrico (o, simplemente, un modelo). Conceptualmente, un modelo es tan sólo un resumen de la información esencial contenida en los datos. Para hacer operativa esta idea en la práctica, un modelo suele plantearse a través de un conjunto de hipótesis o supuestos plausibles sobre algún aspecto del funcionamiento real del sistema que ha generado los

Page 21: INTRODUCCIÓN A LA ECONOMETRÍA

1.3 Modelos

Introducción a la Econometría: Un Primer Contacto 13

datos. Un modelo debe ser, ante todo, una herramienta útil y able para responder a las preguntas planteadas al comienzo de un análisis. En consecuencia, el tipo de modelo adecuado en cada caso puede depender crucialmente tanto de dichas preguntas como de las propiedades de los datos que se van a emplear para intentar responderlas.

1.3.1 Ejemplo - El Modelo de Regresión Lineal Simple En este ejemplo se introduce el modelo de regresión lineal simple (RLS) como una herramienta sencilla para intentar evaluar efectos causales entre dos variables y para calcular previsiones de una variable en función de (condicionada por) otra.

En las Figuras 2 y 3 de la página siguiente están representadas cuatro colecciones de datos referidas a los problemas P03, P05, P06 y P07, respectivamente, del Ejemplo 1.1.1. Cada gráco contiene una nube de puntos formada por N pares de observaciones 1 1( , )y x ,

2 2( , ),y x ..., ( , )N Ny x sobre dos variables, Y (en el eje vertical) y X (en el eje horizontal). Los datos ( , ), 1, 2, ..., ,i iy x i N= constituyen en cada caso una muestra de N observaciones, referida a un grupo o a una secuencia de N puntos muestrales (entidades observables o momentos) que forman parte de un colectivo (población) o de un desarrollo histórico (proceso estocástico) más amplio. .EJERCICIO 6.

En un modelo RLS, la información contenida en los datos ( , ), 1, 2, ..., ,i iy x i N= se emplea con el propósito de cuanticar una hipotética relación causal unidireccional estocástica entre la característica Y a la que se reeren los datos 1 2, , ..., Ny y y , que se denomina la variable dependiente del modelo, y la característica X a la que se reeren los datos 1 2, , ..., Nx x x , que se denomina la variable explicativa.

Con esta nalidad, en el modelo RLS todas las inuencias posibles que recibe Y se resumen (comparar con [1]) mediante una expresión matemática del tipo

1 2Y X Ub b= + + , [4]

donde 1b (el término constante) y 2b (la pendiente) son dos parámetros (números) cuyos valores desconocidos se pretende inferir a partir de los datos disponibles; por su parte, U (un término de error, o una perturbación) representa todas las inuencias observables y no observables sobre Y que no están recogidas en 1 2Xb b+ .

En línea con la Denición 1.1.2, la expresión [4] implica que la respuesta total de Y frente a una variación de cuantía XD en X es

Page 22: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

14 Introducción a la Econometría: Un Primer Contacto

1000

2000

3000

4000

5000

Y:P

ESO

ALNA

CER

0 10 20 30 40 50

X : CIGARRILLOS

100

200

300

400

500

600

700

800

Y:P

RECI

ODE

VEN

TA

120 160 200 240 280 320 360

X : SUPERFICIE

1000

1500

2000

2500

3000

3500

Y: V

ENTA

S

500 1000 1500 2000

X : GASTO EN PUBLICIDAD

0

2

4

6

8

Y: V

ARIA

CIÓN

ANUA

LDEL

PIB

0 2 4 6 8

X : VARIACIÓN DEL AÑO ANTERIOR

FIGURA 2 Datos de Sección Cruzada Referidos a las Preguntas P03 y P05 del Ejemplo 1.1.1

Peso (gramos) de 1387 recién nacidos en 1988 y consumo de cigarrillos durante el embarazo

(número medio al día) por parte de sus madres. SC02-RECIENNACIDOS.WF1

Precio (miles de dólares) y superficie (metros cuadrados) de 88 viviendas unifamiliares vendidas

en el área metropolitana de Boston en 1990. SC01-VIVIENDAS.WF1

FIGURA 3 Datos de Series Temporales Referidos a las Preguntas P06 y P07 del Ejemplo 1.1.1

Ventas y gasto en publicidad anuales (miles de dólares) de la empresa Lydia E. Pinkham's Medicine

Co. desde 1907 hasta 1960. ST01-PINKHAM.WF1

Variación anual del PIB real en España (porcentaje) desde 1966 hasta 1997, junto con la misma serie

retardada un año. ST02-PIB.WF1

Page 23: INTRODUCCIÓN A LA ECONOMETRÍA

1.3 Modelos

Introducción a la Econometría: Un Primer Contacto 15

Respuesta Total

2

Respuesta Directa Respuesta Indirecta

Efecto Total

2

Efecto IndirectoEfecto Directo

X

X X

UX

Y X Ub

b DD

D = ´D + D =

éê

= +

ë

X

ùú

ê ú Dê úê úû

[5]

(comparar con [3]), donde 2 /Y Xb = ¶ ¶ es el efecto causal o “ceteris paribus” de X sobre Y, y XUD representa posibles variaciones en U asociadas con X.

De [5] se deduce que el grado de asociación relativa entre yY X observado en los datos ( , ), 1, 2, ..., ,i iy x i N= (ver Figuras 2 y 3) representará el efecto causal de X sobre Y cuando las inuencias sobre Y recogidas en U no están relacionadas con X (es decir, cuando XUD = 0). Por el contrario, si existe algún tipo de relación sistemática entre U y X, entonces el grado de asociación observado entre yY X puede deberse, al menos en parte, a la existencia de dicha relación (es decir, al efecto indirecto en [5]), y no sólo a la existencia de un efecto causal o directo legítimo de X sobre Y.

Por otro lado, [4] implica que cualquier valor observado (dato) de la variable dependiente del modelo puede descomponerse como la suma de dos términos:

1 2

Valor Parte Sistemática Error oObservado o Previsible Parte Imprevisible

,Y X Ub b= + +

[6]

donde tanto 1 2Xb b+ (la parte sistemática o previsible de Y, que se supone depende de X ) como U (el error o la parte imprevisible de Y, que se supone independiente de X ) son cantidades que no se conocen. La Figura 4 de la página siguiente contiene una representación gráca del modelo RLS descrito en [6], junto con su signicado referido a dos pares de datos concretos sobre yY X [ 1 1 2 2( , ), ( , )y x y x ; los N = 11 pares de datos observados sobre yY X está representados en la Figura 4 con un color más oscuro]. Al igual que [4] ó [6], la Figura 4 representa tan sólo (salvo por la nube de puntos) una situación hipotética o supuesta, en el sentido de que en cualquier aplicación práctica del modelo RLS no se sabe cuánto valen ni los parámetros 1b y 2b , ni, por lo tanto, los errores 1 2, , ..., Nu u u asociados con cada par de datos observados sobre yY X .

Page 24: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

16 Introducción a la Econometría: Un Primer Contacto

1 2 2β β x+1 2 1β β x+

1x2x

2y1β

0

2u 0<

1u 0>

X : VARIABLE EXPLICATIVA

Y : V

ARIA

BLE

DEPE

NDIE

NTE

1y

1 2β β X+

2La pendiente deesta recta es β

Una vez planteado un modelo RLS como instrumento para intentar resumir el contenido informativo de una colección de datos ( , ), 1, 2, ..., ,i iy x i N= se puede recurrir al empleo de algún método de estimación para asignar a 1b y 2b unos valores numéricos 1b y 2b concretos, que, a su vez, pueden utilizarse para calcular estimaciones de los dos términos del lado derecho de [6]: 1 2

ˆ ˆY Xb b= + (valor ajustado), 1 2ˆ ˆˆ ˆU Y Y Y Xb b= - = - -

(residuo), de manera que ˆ ˆY Y U= + . La Figura 5 contiene una representación gráca del modelo estimado, en el que

1 2

Valor Observado Valor Ajustado Residuo

ˆ ˆ ˆ.Y X Ub b= + +

[7]

A diferencia de lo que ocurre en la Figura 4, todos los elementos de la Figura 5 (excepto la línea punteada, que es la recta 1 2Xb b+ de la Figura 4) pueden conocerse (calcularse) en cualquier aplicación práctica utilizando los datos disponibles ( , ), 1, 2, ..., .i iy x i N= El modelo RLS estimado [7] (representado en la Figura 5) puede utilizarse en la práctica con alguno de los nes que se describen en el Apartado 1.4.

El modelo RLS del Ejemplo anterior constituye una de las herramientas más sencillas que se emplean en la econometría aplicada para intentar resolver problemas como los del

FIGURA 4 Elementos Básicos del Modelo de Regresión Lineal Simple

Page 25: INTRODUCCIÓN A LA ECONOMETRÍA

1.3 Modelos

Introducción a la Econometría: Un Primer Contacto 17

1 2ˆ ˆY β β X= +

1 2 2ˆ ˆβ β x+

1 2 1ˆ ˆβ β x+

2u 0<

1u 0>

1 2β β X+

2

La pendiente deˆesta recta es β

1 1 2 1ˆ ˆy β β x= +

2 1 2 2ˆ ˆy β β x= +

1x2x

2y

0

X : VARIABLE EXPLICATIVA

Y : V

ARIA

BLE

DEPE

NDIE

NTE

1y

Ejemplo 1.1.1. Actualmente, hay una gran variedad de modelos disponibles para hacer econometría aplicada en la práctica. No obstante, la variedad de opciones disponibles no debe ocultar el hecho de que, en última instancia, la utilidad práctica de un modelo sencillo o de uno muy sosticado reside simplemente en su capacidad para proporcionar respuestas ables y entendibles a las preguntas planteadas al comienzo de un análisis.

Una posibilidad para calibrar el grado de abilidad de las respuestas proporcionadas por un modelo (especialmente en entornos no experimentales), consiste en plantear ciertas hipótesis sobre los elementos que intervienen en él, y derivar las conclusiones a las que lleva el cumplimiento (o el incumplimiento) de dichas hipótesis. La validez de esas conclusiones depende de si las hipótesis utilizadas son razonables en cada caso concreto, en especial al compararlas con las características muestrales de los datos empleados.

En la econometría aplicada, la hipótesis central de un modelo consiste en suponer que cada dato disponible para el análisis es (salvo en casos excepcionales) una realización particular de una variable aleatoria.

1.3.2 Definición - Variable Aleatoria Una variable aleatoria es una característica concreta de una entidad observable tal que:

FIGURA 5 El Modelo de Regresión Lineal Simple Estimado

Page 26: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

18 Introducción a la Econometría: Un Primer Contacto

1. Es susceptible de tomar distintos valores numéricos. 2. Todos los valores que puede tomar son perfectamente conocidos. 3. El valor que realmente toma no se puede prever o anticipar con absoluta certeza.

Cada uno de los valores que puede tomar una variable aleatoria se denomina un valor posible o una realización posible. Un valor que realmente toma (o que se supone que toma) una variable aleatoria es un valor observado o una realización particular.

Desde el punto de vista de un análisis aplicado, puede decirse que una variable es aleatoria cuando el analista no puede decidir o conocer de antemano su valor observado. En relación con el Ejemplo 1.1.1, el rendimiento de una zona de cultivo, la nota nal y las horas de asistencia a clase de un alumno, las ventas y el gasto en publicidad de una empresa, la tasa de variación del PIB real, o el salario y los años de educación de un trabajador, son todas ellas variables aleatorias. En algunos casos excepcionales, un analista puede decidir de antemano cuáles son los valores de ciertas características observables relevantes para su análisis, porque dichas características se encuentran bajo su control, o bien porque ha elegido su colección de datos seleccionando una muestra con valores predeterminados para dichas características. No obstante, esta posibilidad es muy remota en entornos no experimentales. Aunque a veces es posible concebir ciertos experimentos (como los del Ejemplo 1.1.3) en los que se jan de antemano los valores de algunas características relevantes para un análisis, en muchos casos es imposible, prohibitivamente costoso, o moralmente inaceptable ejecutar dichos experimentos. En este sentido, la econometría no debe explicarse ni entenderse como un conjunto variado de fórmulas y técnicas dirigidas cada una por su cuenta al análisis de distintos tipos de datos económicos o nancieros, sino como un intento unicador y riguroso de analizar la información no experimental que se puede obtener mediante la mera observación de sistemas (entornos, o fenómenos) muy diversos tanto sociales como naturales.

1.3.3 Ejemplo - Algunas Hipótesis en el Modelo RLS Para calibrar el grado de abilidad de las respuestas que puede proporcionar un modelo RLS estimado (como el de la ecuación [7], representado en la Figura 5), es fundamental conocer las propiedades estadísticas del método empleado para calcular las estimaciones 1b y 2b . Bajo ciertas hipótesis sobre algunos de los elementos del modelo RLS, es posible demostrar que el método de estimación denominado Mínimos Cuadrados Ordinarios

Page 27: INTRODUCCIÓN A LA ECONOMETRÍA

1.3 Modelos

Introducción a la Econometría: Un Primer Contacto 19

(MCO) posee buenas propiedades, en el sentido de que cuando dichas hipótesis son razonables, entonces la probabilidad de que el método MCO proporcione estimaciones 1b y

2b próximas a lo que realmente valen 1b y 2b es relativamente elevada.

La hipótesis central en todo esto consiste en suponer que cada par de datos ( , )i iy x , i = 1, 2, ..., N, disponible para el análisis es una realización particular de un par de variables aleatorias ( , )i iY X tales que (ver 3.1.4, en especial [38])

1 2 , con E[ | ] E[ ] para todo 1, 2, ...,i i i i i iY X U U X U i Nb b= + + = = , [8]

de manera que el valor esperado o medio de iU es independiente de iX en cada punto muestral ( iU y iX están incorrelacionadas). Esta hipótesis constituye un enunciado formal de la idea de independencia entre inuencias omitidas e inuencias incluidas en un análisis aplicado, mencionada repetidamente en el Apartado 1.1 y en el Ejemplo 1.3.1.

Adicionalmente, suele suponerse que el valor esperado de cada iU es el mismo para todo 1, 2, ...,i N= (de manera que las perturbaciones son, en cierto sentido, homogéneas a lo

largo de toda la muestra), y que dicho valor esperado es cero (lo que puede garantizarse por la presencia del término constante 1b en el modelo). .EJERCICIO 7.

En consecuencia, [8] puede escribirse nalmente como

1 2

1 2

, con E[ | ] 0, o bien

E[ | ] , para todo 1, 2, ..., .i i i i i

i i i

Y X U U X

Y X X i N

b bb b

= + + == + = [9]

Esta expresión contiene las hipótesis estadísticas básicas del modelo RLS, que garantizan en cierto sentido unas buenas propiedades para el método de estimación MCO.

Observación: Cuando se plantea un modelo RLS para una colección de datos de series temporales, el índice i y la letra N que se han utilizado hasta ahora para identicar cada punto muestral y el número total de ellos, suelen cambiarse por t y T, respectivamente. Por ejemplo, una colección de datos de series temporales sobre dos variables yY X suele representarse como ( , ), 1, 2, ...,t ty x t T= , mientras que [9] queda

1 2 , con E[ ] 0 para todo 1, 2, ...,t t t t tY X U U X t Tb b= + + = = .

Con el empleo de t y T en lugar de i y N, se pretende hacer explícito que las variables y los datos considerados siguen un orden temporal o cronológico (ver Ejemplo 1.2.4) que es fundamental para su análisis. Con esta notación también se pretende poner de maniesto que en el análisis de datos de series temporales deben tenerse muy en cuenta ciertas posibilidades (efectos dinámicos, autocorrelación, no estacionariedad, tendencias, ...) que no suelen ser relevantes en el análisis de datos de sección cruzada (para los que, en general, el orden de las observaciones no importa; ver Ejemplo 1.2.2).

Page 28: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

20 Introducción a la Econometría: Un Primer Contacto

1.4 Respuestas Las respuestas que proporciona un modelo estimado a partir de unos datos, pueden ir desde una mera descripción cuantitativa hasta una serie de previsiones muy valoradas a la hora de tomar decisiones importantes.

El tipo de respuesta que es adecuado en cada caso depende, lógicamente, de cuál haya sido la pregunta planteada al comienzo del análisis. En consecuencia, el planteamiento inicial preciso sobre el objetivo y el interés de un análisis es fundamental no sólo para decidir adecuadamente qué datos utilizar y qué modelo emplear para resumir su contenido informativo, sino también para decidir, en última instancia, qué hacer con dicho modelo.

En el Ejemplo 1.4.1 se describen algunos usos posibles del modelo RLS estimado de la ecuación [7] (representado grácamente en la Figura 5). Dichos usos se ilustran en el Ejemplo 1.4.2 a través de cuatro modelos RLS estimados con las colecciones de datos representadas en las Figuras 2 y 3 del Ejemplo 1.3.1 del Apartado 1.3 anterior.

1.4.1 Ejemplo - Algunos Usos de la Regresión Lineal Simple I En las Figuras 6 y 7 de la página siguiente están representados grácamente cuatro modelos RLS estimados con los datos de las Figuras 2 y 3 del Ejemplo 1.3.1. Como en la Figura 5, la representación de cada modelo estimado tiene la forma de una línea recta del tipo 1 2

ˆ ˆY Xb b= + , cuya pendiente es igual a 2b (una estimación numérica del parámetro 2b ). En todos los casos, 1b y 2b se han calculado utilizando el método MCO mencionado en el Ejemplo 1.3.3, lo que implica, en particular, que

1

12 2

1

( )( ) Covarianza Muestral entre ,ˆ .Varianza Muestral de ( )

Ni iiN

NiiN

y y x x Y XXx x

b =1

=

å - -= =

å - [10]

Por lo tanto, 2b mide simplemente el grado de asociación lineal relativa entre yY X observado en los datos disponibles sobre dichas variables. En este sentido, puede resultar útil comparar [10] con la ecuación [5] del Ejemplo 1.3.1 (y la discusión posterior), así como recordar toda la discusión del Ejemplo 1.3.3. .EJERCICIO 8.

Un modelo RLS estimado como el de la ecuación [7] (representado en la Figura 5), puede utilizarse en la práctica (quizás entre otros nes) para lo siguiente:

Page 29: INTRODUCCIÓN A LA ECONOMETRÍA

1.4 Respuestas

Introducción a la Econometría: Un Primer Contacto 21

1000

2000

3000

4000

5000

Y:P

ESO

ALNA

CER

0 10 20 30 40 50

X : CIGARRILLOS

100

200

300

400

500

600

700

800

Y:P

RECI

ODE

VEN

TA

120 160 200 240 280 320 360

X : SUPERFICIE

1000

1500

2000

2500

3000

3500

Y: V

ENTA

S

500 1000 1500 2000

X : GASTO EN PUBLICIDAD

0

2

4

6

8

Y: V

ARIA

CIÓN

ANUA

LDEL

PIB

0 2 4 6 8

X : VARIACIÓN DEL AÑO ANTERIOR

FIGURA 6 Modelos RLS Estimados por MCO con los Datos de la Figura 2

PESO 3392 14.4 CIGMN 1387 recién nacidos

= − ×=

PRECIO 51.551 1.494 SUPM2

N 80 viviendas= + ×

=

FIGURA 7 Modelos RLS Estimados por MCO con los Datos de la Figura 3

VENTAS 477.500 1.429 GPUBN 54 años (1907-1960)

= − ×=

T VPIB 1.01 0.67 TVPIB( 1)

N 32 años (1966-1997)= + × −

=

Page 30: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

22 Introducción a la Econometría: Un Primer Contacto

I. Evaluar el efecto causal o "ceteris paribus" de X sobre Y

Del modelo RLS [4] se deduce que 2b = /Y X¶ ¶ , por lo que

2 cuando 0Y X UbD = ´D D = .

En consecuencia, 2b representa la variación absoluta en Y provocada por una variación absoluta unitaria en X ( 1XD = ), cuando todos los factores contenidos en U se mantienen constantes ( 0UD = ). Aunque esta interpretación del parámetro 2b en [4] es correcta sin ambigüedades, también es cierto que la abilidad de 2b en [10] como estimación de 2b depende crucialmente de que E[ ] 0i iU X = para todo i = 1, 2, …, N (como se supone en la ecuación [9] del Ejemplo 1.3.3). Dado que 2b mide el grado de asociación lineal relativa entre yY X observado en los datos, 2b será una estimación able del efecto causal de X sobre Y cuando las inuencias sobre Y recogidas en U no estén relacionadas con X; en caso contrario, el grado de asociación entre yY X captado por 2b puede deberse, al menos en parte, a la existencia de una respuesta indirecta de Y frente a X a través de U (como indica la ecuación [5]), y no sólo a la existencia de un efecto causal o directo legítimo de X sobre Y. Cuando la estimación por MCO de un modelo RLS no es able porque E[ ] 0i iU X =/ (una posibilidad que siempre debería considerarse en la práctica), es muy importante (i) investigar las causas posibles de esa situación para intentar corregirlas, o bien (si no es posible corregir las causas) (ii) emplear otro método alternativo a MCO para estimar el modelo de manera más able. .EJERCICIO 9.

II. Prever Y en función de X

Una hipótesis implícita en muchos análisis econométricos aplicados es que los datos empleados son sucientemente representativos de la población o del proceso estocástico del que han sido extraídos. Bajo esta hipótesis, se espera que las conclusiones del análisis sean aplicables más allá de la muestra empleada. En particular, si p hace referencia a una entidad observable o a un momento fuera de dicha muestra, un modelo estimado como [7] puede resultar útil para estimar una esperanza del tipo E[ | ]p pY X siempre que la ecuación [9] sea aplicable en i p= , es decir, siempre que 1 2E[ | ]p p pY X Xb b= + . Si px es un valor dado (conocido o supuesto) para pX , entonces E[ | ]p p pY X x= =

1 2 pxb b+ se puede estimar, de acuerdo con [7], como 1 2ˆ ˆˆp py xb b= + , que se denomina

una previsión puntual. La abilidad de una previsión de este tipo depende crucialmente de que 2b sea una estimación able del efecto causal de X sobre Y, y de que dicho efecto sea

Page 31: INTRODUCCIÓN A LA ECONOMETRÍA

1.4 Respuestas

Introducción a la Econometría: Un Primer Contacto 23

aplicable a la entidad observable o al momento p considerado.

III. Controlar Y a través de X

En ciertas ocasiones, la variable explicativa de un modelo RLS (como el gasto en publicidad de una empresa en un año determinado) puede manipularse o controlarse en algún sentido práctico para conseguir o para simular un objetivo (como un volumen de ventas esperado al nal del año). En estos casos, [7] puede resultar útil para estimar el valor de X asociado con un valor esperado para Y jado de antemano. En particular, si c hace referencia a una entidad observable o a un momento tal que [9] es aplicable en i c= , entonces 1 2E[ ]c c cY X Xb b= + . Por lo tanto, si se desea que E[ ]c cY X sea igual a un valor cy * dado, se debe asignar a cX un valor cx * tal que 1 2 c cx yb b * *+ = , lo que implica que cx * debe ser igual a 1 2( ) /cy b b* - . Esta cantidad puede estimarse como

1 2ˆ ˆˆ ( ) /c cx y b b* *= - , lo que garantiza, de acuerdo con [7]-[9], que ˆ ˆE[ | ]c c c cY X x y* *= = .

Como en el caso del punto II anterior, la abilidad de cx * depende crucialmente de que 2b sea una estimación able del efecto causal de X sobre Y, y de que dicho efecto sea aplicable a la entidad observable o al momento c considerado.

1.4.2 Ejemplo - Algunos Usos de la Regresión Lineal Simple II A continuación se emplean las posibilidades descritas en el Ejemplo 1.4.1 para responder a las preguntas P03, P05, P06 y P07 planteadas en el Ejemplo 1.1.1. .EJERCICIO 10.

Respuesta a la pregunta P03 del Ejemplo 1.1.1:

Del modelo estimado en el panel izquierdo de la Figura 6 se deduce que:

1 3392b = gramos es una estimación del peso esperado cuando CIGM = 0.

2ˆˆ 14.4 14.4PESOb = - D = - gramos cuando 1CIGMD = cigarrillo, 0UD = .

Respuesta a la pregunta P05 del Ejemplo 1.1.1:

Del modelo estimado en el panel derecho de la Figura 6 se deduce que:

1 51551b = dólares es la parte estimada del precio esperado que no depende de SUPM2. En este caso, interpretar 1 51551b = como el precio previsto de una vivienda con SUPM2 = 0 no tiene sentido práctico porque no existen “viviendas sin supercie”.

Page 32: INTRODUCCIÓN A LA ECONOMETRÍA

1 La Naturaleza de la Econometría

24 Introducción a la Econometría: Un Primer Contacto

2ˆˆ 1.494 1494PRECIOb = D = dólares cuando 21 mSUPM2D = , 0UD = .

El precio previsto para una vivienda con, por ejemplo, 200 metros cuadrados de supercie, es E[ 2 200] 51551 1494 200 350351PRECIO SUPM = = + ´ = dólares.

Respuesta a la pregunta P06 del Ejemplo 1.1.1:

Del modelo estimado en el panel izquierdo de la Figura 7 se deduce que:

1 477500b = dólares es el volumen de ventas previsto cuando GPUB = 0.

2ˆˆ 1.429 1429VENTASb = D = dólares cuando PUBD = mil dólares, 0UD = .

El volumen de ventas previsto para un gasto en publicidad de un millón de dólares en 1961, es 6 6E[ 10 ] 477500 1.429 10 1906500VENTAS GPUB = = + ´ = dólares.

Si se pretende un volumen de ventas de, por ejemplo, dos millones de dólares para el año 1961, entonces ˆ ˆ2000000 477500 1.429 1065000GPUB GPUB* *= + ´ @ dólares.

Respuesta a la pregunta P07 del Ejemplo 1.1.1:

Del modelo estimado en el panel derecho de la Figura 7 se deduce que:

1 1.01%b = es la variación anual prevista si la última variación anual (es decir, la del año anterior) fue igual a cero.

Si la última variación anual (el dato disponible sobre 1997) fue 3.38%, entonces:

Previsión para 1998: E[ ( 1) 3.38] 1.01 0.67 3.38 3.27%.TVPIB TVPIB - = = + ´ =

Previsión para 1999: E[ ( 1) 3.27] 1.01 0.67 3.27 3.20%.TVPIB TVPIB - = = + ´ =

La serie de previsiones converge a largo plazo a una variación anual del 3.06%.

Observación: De acuerdo con el modelo RLS [4] (ver el punto I del Ejemplo 1.4.1), el efecto sobre Y de una variación absoluta unitaria en X no depende de los valores de partida de X ni de Y. Por ejemplo, un gasto adicional de mil dólares en publicidad tendría un efecto absoluto sobre las ventas que sería independiente del gasto en publicidad ya efectuado y del volumen de ventas de partida. Esta implicación del modelo RLS no es adecuada en muchas situaciones prácticas. No obstante, el modelo RLS puede adaptarse a dichas situaciones deniendo su variable dependiente y su variable explicativa como alguna transformación de cada variable original en el análisis. Por ejemplo, si ln( )Y F= y ln( )X P= en [4], entonces 2b es la elasticidad de F con respecto a P, es decir, la respuesta porcentual (aproximada) de F provocada por una variación de un 1% en P cuando 0UD = . Un modelo como 1 2ln( ) ln( )F P Ub b= + + es no lineal con respecto a F y P [porque

Page 33: INTRODUCCIÓN A LA ECONOMETRÍA

1.4 Respuestas

Introducción a la Econometría: Un Primer Contacto 25

ln(·) es una función no lineal], aunque es un modelo que sí es lineal con respecto a los parámetros 1b y 2b . El modelo RLS es lineal justamente por este motivo, es decir, porque 1b y 2b aparecen en [4] de forma lineal. Al mismo tiempo, yY X pueden representar en [4] cualesquiera transformaciones de las variables originales de interés en el análisis, lo que proporciona al modelo RLS bastante más exibilidad que la que sugieren a simple vista la ecuación [4] o la Figura 4. Ver 3.1.1-3.1.3, en especial [23]-[30].

La abilidad de las respuestas proporcionadas por un modelo elaborado a partir de unos datos depende en la práctica de varios factores. Entre ellos, el factor crítico quizás sea (sobre todo en entornos no experimentales) el grado de compatibilidad entre las hipótesis que conforman el modelo y las pautas muestrales que están realmente presentes en los datos. Sin una evaluación adecuada de ese grado de compatibilidad, es imposible juzgar la abilidad de las conclusiones obtenidas al nal de un análisis. La cita siguiente resume con bastante precisión este aspecto crucial de cualquier análisis de datos:

Most kinds of statistical calculation rest on assumptions about the behavior of the data. Those assumptions may be false, and then the calculations may be misleading. We ought always to try to check whether the assumptions are reasonably correct; and if they are wrong, we ought to be able to perceive in what ways they are wrong. […] Good statistical analysis is not a purely routine matter, and generally calls for more than one pass through the computer. The analysis should be sensitive both to peculiar features in the given numbers and also to whatever background information is available about the variables. The latter is particularly helpful in suggesting alternative ways of setting up the analysis. ANSCOMBE (1973) PÁGINA 17.

En la Sección 2 siguiente se describe una estrategia posible para abordar en la práctica el problema central de la econometría aplicada: cómo elaborar modelos que resuman de manera adecuada el contenido informativo de una colección de datos. Las operaciones más importantes en dicha estrategia son, precisamente, las que tienen que ver con la cita anterior: la diagnosis y la revisión de un modelo. De la ejecución adecuada de estas operaciones depende, en gran medida, la abilidad de las respuestas que proporciona un análisis econométrico aplicado.

2 La Metodología de la Econometría Aplicada

En general, las operaciones fundamentales en la elaboración de un modelo a partir de unos datos no tienen mucho que ver con plantear una especicación inicial lo más completa y rigurosa posible. Por el contrario, dichas operaciones tienen que ver más bien con la

Page 34: INTRODUCCIÓN A LA ECONOMETRÍA

2 La Metodología de la Econometría Aplicada

26 Introducción a la Econometría: Un Primer Contacto

PREGUNTA

Marco Teórico Métodos Econométricos IEspecificación - Estimación Software

MODELO

Métodos Econométricos IIDiagnosisRevisión

RESPUESTA

Métodos Econométricos IIIDescripción - Previsión - Control

DATOS

revisión crítica y sistemática de una especicación inicial razonable, hasta obtener la que mejor describa la información contenida en los datos.

El diagrama de la Figura 8 resume los pasos que suelen seguirse actualmente en la econometría aplicada para obtener una respuesta a una pregunta concreta, sobre la base de la información contenida en unos datos y resumida en un modelo. Las líneas y los recuadros de trazo más claro representan procedimientos y recursos especialmente críticos en la práctica, que, no obstante, reciben a veces poca atención (o ninguna en absoluto) tanto en muchos manuales de econometría como en muchas publicaciones y estudios académicos y profesionales.

La forma de un modelo y los métodos econométricos adecuados para su elaboración y su uso en la práctica, pueden diferir según la naturaleza de los datos empleados (ver Ejemplos 1.2.2, 1.2.4 y 1.2.6) y el tipo de pregunta que se pretende responder (es decir, el uso que se pretende dar al modelo; ver Ejemplo 1.4.1). No obstante, cualquier análisis econométrico

FIGURA 8 La Metodología de la Econometría Aplicada

Page 35: INTRODUCCIÓN A LA ECONOMETRÍA

2.1 Especificación

Introducción a la Econometría: Un Primer Contacto 27

aplicado sigue (o, más bien, debería seguir) un desarrollo semejante al que está descrito en la Figura 8.

En esta Sección 2 se ofrece una descripción breve de algunos de los elementos de la Figura 8 que no han sido considerados en la Sección 1 anterior. En particular, en esta Sección 2 se discuten algunas cuestiones relacionadas con la especicación, la estimación y la diagnosis de modelos econométricos.

2.1 Especificación La especicación de un modelo se reere al planteamiento de un conjunto de hipótesis plausibles (aunque no incuestionables ni denitivas) sobre las características esenciales de los datos recogidos para el análisis. Para contribuir a la formulación inicial de dichas hipótesis, a veces es útil recurrir a un marco teórico. En el contexto de la Figura 8, un marco (o un modelo) teórico es tan sólo una construcción matemática, de origen más o menos formal (como una teoría económica, nanciera, sociológica, biológica o física, o bien simplemente la intuición, el criterio subjetivo y la experiencia del analista), en la que intervienen las características o variables a las que reeren los datos.

La posible utilidad de un marco teórico, sobre todo en relación con la especicación inicial de un modelo econométrico, siempre debe tenerse en cuenta. No obstante, la visión tradicional de la econometría como una herramienta para evaluar empíricamente teorías económicas es probablemente una visión anticuada e innecesariamente limitada. Nada obliga a que un modelo teórico constituya el elemento central de un análisis econométrico aplicado. En cualquier caso, un examen detallado de los datos al comienzo de un análisis suele resultar tan revelador o más que cualquier modelo teórico por muy sosticado que sea. La cita siguiente resume este punto de vista sobre la econometría aplicada:

In this book we describe econometric modelling from an applied point of view where we start from the data. We consider models as constructs that we can change in the light of data information. By incorporating more of the relevant data characteristics in the model, we may improve our understanding of the underlying economic processes. […] This view of econometric modelling differs from a more traditional one that has more confidence in the theory and the postulated model and less in the observed data. In this view econometrics is concerned with the measurement of theoretical relations as suggested by economic theory. In our approach, on the other hand, we are not primarily interested in testing a particular theory but in using data to

Page 36: INTRODUCCIÓN A LA ECONOMETRÍA

2 La Metodología de la Econometría Aplicada

28 Introducción a la Econometría: Un Primer Contacto

get a better understanding of an observed phenomenon of interest. HEIJ, DE BOER, FRANSES, KLOEK

Y VAN DIJK (2004) PÁGINAS 274-275.

En la práctica, este punto de vista es aplicable no sólo a cuestiones o problemas de tipo económico o nanciero, sino, en general, a cualquier cuestión de interés tanto social como natural que se pretenda analizar utilizando la información cuantitativa contenida en una colección de datos.

En los dos ejemplos siguientes se introduce el modelo de regresión lineal múltiple (RLM) como una herramienta sencilla para mitigar las dicultades asociadas con el modelo RLS a la hora de evaluar efectos causales. También se ilustra la posibilidad de que una mera inspección visual de los datos proporcione básicamente la misma información que un marco teórico formal a la hora de especicar inicialmente un modelo RLM.

2.1.1 Ejemplo - El Modelo de Regresión Lineal Múltiple Como se vio en la Denición 1.1.2 a partir de las expresiones [1]-[3], una dicultad asociada con la evaluación del efecto causal de X sobre Y utilizando solamente datos sobre yY X , tiene que ver con que Y puede depender de otros factores observables relacionados con X que no se consideran explícitamente en el análisis. Si esos factores pudieran incluirse de forma explícita en la investigación de una posible relación causal entre yY X , entonces la dicultad mencionada no estaría presente. Para verlo, consideramos, en línea con la Denición 1.1.2, la respuesta total de Y ante una variación de cuantía XD en X,

X X W X V XY F X F W F VD @ ´D + ´D + ´D ,

junto con la respuesta total de Y ante una variación de cuantía WD en W,

W W X W V WY F W F X F VD @ ´D + ´D + ´D .

En la Denición 1.1.2 se vieron las implicaciones de considerar individualmente tan sólo la primera de las dos expresiones anteriores. Sin embargo, las dos expresiones se pueden escribir conjuntamente como

[ ] [ ] [ ] [ ]

X X X XV

WW W W

Y X W F VF

FY X W V

D D D Dé ù é ù é ùé ùê ú ê ú ê úê ú@ +ê ú ê ú ê úê úD D D Dê úê ú ê ú ê úë ûë û ë û ë û

XWXW XWFY XW VD D D

, [11]

o bien, de manera más compacta y explícita, como

Page 37: INTRODUCCIÓN A LA ECONOMETRÍA

2.1 Especificación

Introducción a la Econometría: Un Primer Contacto 29

[ ] [ ] [ ] [ ]

[ ] [ ] [ ] [ ]Efectos Totales

1

Efectos Directos Efectos Indirectos

.

V

V

F

F -

@ + =

é ùê ú= +ê úê úê úë û

XW XW XW

XW XW

Y XW F V

XW F XW V

D D D

D D D

[12]

Esta expresión (que no es más que una extensión de [3] en la Denición 1.1.2) pone de maniesto que [ ] [ ] [ ]1- @XW XWXW Y FD D siempre que (i) VF = 0, de manera que V no inuye directamente sobre Y (una posibilidad, en general, más bien remota), o bien que (ii) [ ] =XWV 0D , de manera que V no varía sistemáticamente ni con X ni con W. Por lo tanto, si las inuencias no observadas recogidas en V no están relacionadas ni con X ni con W, entonces el efecto causal de X sobre Y (al igual que el de W sobre Y, que también podría tener cierto interés) se puede evaluar de manera able a partir de [11]-[12] utilizando datos sobre Y, X y W, a pesar de que X y W estén relacionadas entre sí. Por el contrario, como se vio en la Denición 1.1.2, el efecto causal de X sobre Y no podría evaluarse ablemente a partir tan sólo de la primera ecuación de [11] (incluso suponiendo que 0XVD = ), a menos que o bien 0WF = , o bien 0XWD = . La ventaja de incluir a W en un análisis de causalidad de X sobre Y, reside justamente en que la inclusión de W elimina la necesidad de asumir ciertas hipótesis (como 0WF = , o 0XWD = ) que pueden resultar difíciles de justicar en la práctica.

Esta conclusión sugiere que en un análisis de causalidad sobre Y es recomendable considerar explícitamente tantas inuencias observables como sea posible y razonable, a pesar de que en última instancia quizás interese evaluar el efecto directo o causal de tan sólo una de dichas inuencias. En este sentido, un modelo RLS como el de los Ejemplos 1.3.1 y 1.3.3 puede ampliarse para recoger explícitamente otras inuencias directas sobre Y adicionales a la inuencia de X. Esta ampliación da lugar a un modelo de regresión lineal múltiple (RLM), en el que todas las inuencias posibles que recibe Y se resumen mediante una expresión matemática del tipo

1 2 2 3 3 ... K KY X X X Ub b b b= + + + + + , [13]

donde 2X , 3X , ..., KX son 1K - variables explicativas observables, posiblemente relacionadas entre sí; por su parte, U representa todas las inuencias (observables y no observables) sobre Y que no están recogidas en 1 2 2 3 3 ... K KX X Xb b b b+ + + + .

Page 38: INTRODUCCIÓN A LA ECONOMETRÍA

2 La Metodología de la Econometría Aplicada

30 Introducción a la Econometría: Un Primer Contacto

A partir de [13], las respuestas totales de Y ante variaciones de cuantía jXD en jX ( 2, 3, ..., )j K= pueden escribirse conjuntamente (al estilo de [11]) como

[ ] [ ]

2 2

3 3

2

2 3.2 .2 2

2.3 3 .3 3

2. 3.K K

KX X

X XK

X XK K K K

X X XY U

Y UX X X

Y UX X X

b

b

b

é D D D ù é ùD Dé ù é ùê ú ê úê ú ê úê ú ê úê ú ê úD DD D Dê ú ê úê ú ê ú= +ê ú ê úê ú ê úê ú ê úê ú ê úê ú ê úê ú ê úê ú ê úê ú ê úD DD D Dê ú êê ú ê úë û ë ûë û ë ûXY XXD D b

[ ]

úXUD

, [14]

o bien, de manera más compacta y explícita (al estilo de [12]), como

[ ] [ ] [ ]

[ ] [ ] [ ]

2

Efectos Totales

12

Efectos Directos Efectos Indirectos

.-

= ´ + =

é ùê ú= +ê úê úê úë û

X X

X

Y XX U

XX XX U

D D b D

D b D D

[15]

Esta expresión (que es simplemente una extensión de [5] en el Ejemplo 1.3.1) indica que [ ] [ ]1

2- =XXX YD D b siempre que [ ] =XU 0D , es decir, siempre que U en [13] no

varíe sistemáticamente con ninguna variable explicativa. Por lo tanto, si las inuencias recogidas en U son independientes de todas las variables explicativas, entonces tanto 2b como 3 , ..., Kb b pueden evaluarse de manera able a partir de [15] utilizando datos sobre Y, 2X , 3X , ..., KX . Por el contrario, como se vio en la Denición 1.1.2, 2b no podría evaluarse ablemente a partir tan sólo de la primera ecuación de [14] (incluso suponiendo que

20XUD = ), a menos que .2 0j jXb ´D = para todo 3, ...,j K= . La ventaja de

incluir a 3X , ..., KX junto con 2X en [13] en relación con un análisis de causalidad de 2X sobre Y, reside justamente en que la inclusión de 3X , ..., KX elimina la necesidad de asumir ciertas hipótesis (como que o bien 0jb = , o bien .2 0jXD = para todo

3, ...,j K= ) que pueden resultar difíciles de justicar en la práctica.

Según esto y como extensión del Ejemplo 1.3.3, en un modelo RLM se supone que cada observación o vector de datos 2 3( , , , ..., )i i i iKy x x x , i = 1, 2, …, N, sobre todas las variables incluidas en el análisis, es una realización particular de un vector de variables aleatorias 2 3( , , , ..., )i i i iKY X X X tal que

1 2 2 3 3 ...i i i K iK iY X X X Ub b b b= + + + + + [16]

Page 39: INTRODUCCIÓN A LA ECONOMETRÍA

2.1 Especificación

Introducción a la Econometría: Un Primer Contacto 31

con 2 3E[ | , , ..., ] E[ ] 0i i i iK iU X X X U= = [17]

para todo 1, 2, ...,i N= , de manera que el valor esperado o medio de iU es independiente de 2 3, , ...,i i iKX X X en cada punto muestral ( iU y ijX están incorrelacionadas para todo 2, ...,j K= ). El análisis teórico y el uso en la práctica de modelos RLM constituyen uno de los elementos centrales de toda la econometría.

Las expresiones [16]-[17] contienen las hipótesis estadísticas básicas del modelo RLM, que, como en el caso del modelo RLS del Ejemplo 1.3.3, garantizan en cierto sentido unas buenas propiedades para el método de estimación MCO.

2.1.2 Ejemplo - Especificación Inicial de un Modelo RLM Con el n de ilustrar cómo especicar inicialmente un modelo RLM en la práctica, en la Figura 9 de la página siguiente se ha representado parte de una sección cruzada que podría utilizarse en relación con el problema P10 del Ejemplo 1.1.1. El modelo más sencillo que puede considerarse para evaluar el efecto causal de la educación sobre el salario es un modelo RLS del tipo

1 2SLRPH EDUC Ub b= + + , [18]

aunque el panel izquierdo de la Figura 9 sugiere que un modelo RLS quizás más adecuado que [18] podría ser en este caso .EJERCICIO 11.

1 2ln SLRPH EDUC Ub b= + + . [19]

El problema fundamental de [19] reside en que si U contiene alguna inuencia sobre el salario de un trabajador que esté relacionada con su educación (como, por ejemplo, su experiencia, o su habilidad o su capacidad para desempeñar adecuadamente su trabajo), entonces la posible independencia entre U y EDUC no es justicable en [19]. En este sentido, un modelo RLM que incluye la experiencia como variable explicativa es

1 2 3ln SLRPH EDUC EXLP Ub b b= + + + , [20]

aunque el panel derecho de la Figura 9 sugiere que un modelo RLM quizás más adecuado que [20] podría ser en este caso .EJERCICIO 11.

21 2 3 4ln SLRPH EDUC EXLP EXLP Ub b b b= + + + + . [21]

Page 40: INTRODUCCIÓN A LA ECONOMETRÍA

2 La Metodología de la Econometría Aplicada

32 Introducción a la Econometría: Un Primer Contacto

0

5

10

15

20

25

30

0 10 20 30 40 50

EXLP : EXPERIENCIASL

RPH

:SAL

ARIO

0

5

10

15

20

25

30

0 4 8 12 16 20

EDUC : EDUCACIÓN

SLRP

H:S

ALAR

IO

La ventaja fundamental de [21] frente a [19] reside en que en [21] es seguro que U no contiene ni a EXLP ni a 2EXLP , por lo que la posible relación entre U y EDUC es seguramente notablemente menor en [21] que en [19]. En todo caso, para poder evaluar ablemente tanto 2b como 3b y 4b en el modelo RLM [21], U debe ser independiente no sólo de la educación, sino también de la experiencia. Aunque la presencia en U de factores no observables (como la habilidad para desempeñar un trabajo) siempre es problemática en este sentido, también es cierto que a [21] se le pueden añadir otras inuencias observables relacionadas con la educación, con la experiencia o con ambas. En esta línea, una extensión razonable de [21] podría ser la siguiente: .EJERCICIO 11.

2 3

4 5

1 2 3

24 5

ln

.

Y X X

X X

SLRPH EDUC EXLP

EXLP EDUC EXLP U

b b b

b b

= + + +

+ + ´ +

[22]

Si 5b en [22] es distinto de cero, entonces U en [21] no puede ser independiente ni de la educación ni de la experiencia. Quizás U en [22] tampoco lo es, aunque seguro que el

FIGURA 9 Datos de Sección Cruzada referidos a la Pregunta P10 del Ejemplo 1.1.1

Salario medio anual (dólares por hora), educación (años) y experiencia laboral (años) de 526 personas trabajadoras entrevistadas en 1976 (Current Population Survey - U.S. Census Bureau).

SC03-SALARIOS3.WF1

Page 41: INTRODUCCIÓN A LA ECONOMETRÍA

2.1 Especificación

Introducción a la Econometría: Un Primer Contacto 33

motivo no sería en ese caso la ausencia de un término asociado con el producto de la educación por la experiencia.

Un modelo como [22] puede justicarse a partir de un modelo teórico como el llamado Modelo del Capital Humano (en inglés, Human Capital Model; ver, por ejemplo, Berndt 1991, Capítulo 5). No obstante, toda la discusión que precede a [22] sugiere que un modelo RLM como [22] puede surgir de manera bastante natural sin más que combinar algo de intuición y buen juicio con lo que puede observarse acerca de las posibles relaciones (parciales) entre los datos sobre SLRPH y EDUC, por un lado, y sobre SLRPH y EXLP, por otro, representados en la Figura 9.

Observación: Cuando se dice que un modelo como [22] (o como cualquiera de los de las ecuaciones [19]-[21]) es lineal, se está haciendo referencia a cómo guran los parámetros 1b (término constante), 2b , 3b , 4b y 5b (pendientes) en el lado derecho de [22], no a cómo guran las variables SLRPH, EDUC y EXLP en [22]. (Ver la Observación que sigue al Ejemplo 1.4.2 en relación con el modelo RLS.) En general, las variables Y, 2X ,

3X , ..., KX pueden representar en [13] cualesquiera transformaciones de las variables originales de interés en un análisis. Esto proporciona una gran exibilidad a la hora de representar diferentes tipos de efectos causales mediante modelos RLM. En la práctica, la nalidad esencial de transformar las variables originales de interés en un análisis, consiste en especicar un modelo cuyas perturbaciones tengan unas propiedades que garanticen la validez de los métodos econométricos que vayan a ser utilizados; al mismo tiempo, es muy importante que las transformaciones empleadas proporcionen un modelo que represente efectos causales razonablemente interpretables, como en [22].

Del ejemplo anterior puede concluirse (igual que se indica al nal del Ejemplo 1.1.3) que la evaluación able en la práctica de efectos causales descansa, en cierta medida, en la conanza que se tenga en que las inuencias que no se consideran explícitamente en un análisis sean razonablemente independientes de las inuencias que sí se consideran de manera explícita. La cita siguiente resume con precisión este aspecto fundamental de la econometría aplicada:

The key question in most empirical studies is: Have enough other factors been held fixed to make a case for causality? Rarely is an econometric study evaluated without raising this issue. In most serious applications, the number of factors that can affect the variable of interest —such as […] wages— is immense, and the isolation of any particular variable may seem like a hopeless effort. However, we will eventually see that, when carefully applied, econometric methods can simulate a ceteris paribus experiment. […] As we will see throughout this text, accounting for other observed factors, such as experience, when estimating the ceteris paribus

Page 42: INTRODUCCIÓN A LA ECONOMETRÍA

2 La Metodología de la Econometría Aplicada

34 Introducción a la Econometría: Un Primer Contacto

effect of another variable, such as education, is relatively straightforward. We will also find that accounting for inherently unobservable factors, such as ability, is much more problematic. It is fair to say that many of the advances in econometric methods have tried to deal with unobserved factors in econometric models. WOOLDRIDGE (2020) PÁGINAS 10-12.

Los Ejemplos 2.1.1-2.1.2 sugieren que la especicación inicial de un modelo de regresión requiere considerar tres cuestiones: (i) la elección de las variables explicativas, (ii) la elección de la forma funcional de la relación entre la variable dependiente y las variables explicativas, y (iii) el planteamiento de las hipótesis que garantizan unas buenas propiedades para los métodos econométricos que serán utilizados posteriormente. Las cuestiones (i)-(ii) suelen resolverse mediante algún tipo de razonamiento lógico basado (quizás) en algún modelo teórico y (fundamentalmente) en un análisis inicial detallado de las características muestrales de los datos disponibles sobre todas las variables. También son importantes en (i)-(ii) la intuición, la experiencia y el buen juicio del analista. La cuestión (iii) suele resolverse planteando de forma tentativa sobre el resultado de (i)-(ii) las hipótesis que justican el empleo de métodos econométricos óptimos.

2.2 Estimación Una vez especicado inicialmente un modelo econométrico, el paso siguiente en un análisis aplicado consiste en estimar los parámetros que guran en el modelo. La estimación de un modelo econométrico se reere a la asignación de valores numéricos concretos a sus parámetros (es decir, al cálculo de estimaciones de dichos parámetros) empleando la información contenida en los datos. Buena parte de la econometría teórica está dedicada al diseño y al análisis de las propiedades de diferentes métodos de estimación para diferentes modelos, así como a la comparación entre las propiedades de métodos alternativos para cada tipo de modelo. Actualmente, en la econometría aplicada puede utilizarse una gran variedad tanto de modelos como de métodos para estimarlos. No obstante, la utilidad práctica de las estimaciones proporcionadas por cualquier método de estimación siempre puede evaluarse respondiendo a la misma pregunta en todos los casos: ¿Qué grado de conanza tenemos en que las estimaciones obtenidas estén próximas a lo que realmente valen los parámetros de nuestro modelo?

En la práctica, ese grado de conanza puede evaluarse en función de las propiedades estadísticas (como la insesgadez, la eciencia o la consistencia) que posea el método de

Page 43: INTRODUCCIÓN A LA ECONOMETRÍA

2.2 Estimación

Introducción a la Econometría: Un Primer Contacto 35

estimación empleado, que dependen crucialmente, a su vez, de cuáles sean las hipótesis que conforman el modelo que se pretende estimar y de cuál sea el grado de adecuación de éstas a las pautas muestrales que están presentes en los datos.

2.2.1 Ejemplo - Propiedades de un Estimador En este ejemplo se introducen los conceptos de un estimador y una estimación de un vector de parámetros en relación con un modelo RLM. También se presentan algunas de las propiedades de un estimador asociadas con su posible utilidad en la práctica.

El modelo RLM resumido en [16]-[17] puede interpretarse como una proposición concreta sobre ciertos aspectos de la distribución de probabilidad de una colección M de variables aleatorias,

1 12 13 1

2 22 23 2

2 3

K

K

N N N NK

Y X X X

Y X X X

Y X X X

é ùê úê úê ú= ê úê úê úë û

M

,

de la que los datos

1 12 13 1

2 22 23 2

2 3

K

K

N N N NK

y x x x

y x x x

y x x x

é ùê úê úê ú= ê úê úê úë û

m

constituyen una realización particular. Para obtener información sobre los parámetros que guran en [16], a veces es posible diseñar una función 1 2(·) [ (·), (·), ..., (·)]Kb b b ¢=b tal que la distribución de probabilidad de un estimador del tipo ( )=Mb b M sea conocida (exacta o aproximadamente), e implique una probabilidad relativamente elevada de que una estimación puntual ( )=b b m calculada con cualquier realización particular m de M esté próxima al verdadero valor de 1 2[ , , ..., ]Kb b b ¢=b , independientemente de cuál sea ese valor. Como la distribución de M depende de b (porque cada iY en M depende de b a través de [16]) y Mb es una función de M, la distribución de probabilidad del estimador

Mb también dependerá de b . Esto implica, en particular, que la esperanza y la varianza de Mb pueden ser distintas para distintos valores de b . Por lo tanto, Mb será un

Page 44: INTRODUCCIÓN A LA ECONOMETRÍA

2 La Metodología de la Econometría Aplicada

36 Introducción a la Econometría: Un Primer Contacto

1k 2k

bf M df M

β δ

estimador útil de b en la práctica cuando su distribución de probabilidad varíe con b de tal manera que la probabilidad de que Mb proporcione estimaciones próximas a b , sea relativamente elevada con independencia de cuál sea el verdadero valor de b . La utilidad del estimador Mb en este sentido puede establecerse cuando Mb tiene ciertas propiedades estadísticas derivadas de su distribución de probabilidad, tales como la insesgadez, la eciencia o la consistencia.

En la Figura 10 están representadas dos funciones de densidad Normales, bf M y df M , asociadas con las distribuciones de probabilidad de dos estimadores alternativos, bM y dM , de un parámetro b . En este caso, los dos estimadores tienen las mismas propiedades estadísticas excepto por sus valores esperados: E[ ]b b=M , mientras que E[ ]d d=M . Esta diferencia implica que la 1 2Pr[ ]k b k£ £M es mayor que la 1 2Pr[ ]k d k£ £M , lo que signica que la probabilidad de obtener una estimación próxima a b es mayor si se emplea el estimador bM que si emplea el estimador dM . Un estimador como bM , cuyo valor esperado coincide con el verdadero valor de lo que se pretende estimar, se denomina un estimador insesgado. Como se ilustra en la Figura 10, a igualdad de otras propiedades, un estimador insesgado es preferible a otro que no lo sea.

En la Figura 11, los dos estimadores considerados tienen las mismas propiedades (en particular, ambos son insesgados) excepto porque Var[ ] Var[ ]b d<M M . Como en el caso

FIGURA 10 Insesgadez de un Estimador

Page 45: INTRODUCCIÓN A LA ECONOMETRÍA

2.2 Estimación

Introducción a la Econometría: Un Primer Contacto 37

1k 2kβ

bf M

df M

anterior, esta diferencia implica que 1 2 1 2Pr[ ] Pr[ ]k b k k d k£ £ > £ £M M . En este caso, se dice que bM es relativamente más eciente que dM . Como se ilustra en la Figura 11, entre varios estimadores insesgados es preferible el que tenga menor varianza. Cuando un estimador insesgado tiene varianza mínima con respecto a todos los estimadores insesgados que pueden considerarse, se dice que dicho estimador es un estimador (absolutamente) eciente.

Por último, la Figura 12 de la página siguiente representa el caso de un estimador bM que, aunque no es insesgado, es consistente: aunque E[ ]b b=/M para cualquier tamaño muestral N (nito), la distribución de probabilidad de bM varía con N de tal manera que la 1 2Pr[ ] 1k b k£ £ M a medida que N aumenta. La consistencia es lo mínimo que debería satisfacer cualquier estimador para poder resultar de utilidad en la práctica.

En resumen, la insesgadez, la eciencia (relativa o absoluta) y la consistencia son propiedades deseables porque el empleo en la práctica de un estimador con dichas propiedades otorga cierto grado de abilidad a las estimaciones que proporciona.

En la práctica, la abilidad de un modelo estimado siempre debe juzgarse contrastando el grado de validez de las hipótesis que garantizan, en cada caso, unas buenas propiedades

FIGURA 11 Eficiencia Relativa de un Estimador

Page 46: INTRODUCCIÓN A LA ECONOMETRÍA

2 La Metodología de la Econometría Aplicada

38 Introducción a la Econometría: Un Primer Contacto

b 2f (N N )=M

=b 3f (N N )M

b 1f (N N )=M

31 2N NN< <

1k 2kβ

estadísticas para el método de estimación empleado. No obstante, el hecho de que un estimador tenga buenas propiedades estadísticas no debe tomarse como una garantía absoluta de obtener estimaciones que estén próximas a lo que se pretende estimar (por ejemplo, el estimador bM de las Figuras 10-12 podría proporcionar, en teoría, cualquier estimación de b que estuviera comprendida entre -¥ y +¥). Lo único que realmente permite el empleo de un estimador con buenas propiedades es tener más conanza en las estimaciones obtenidas que si se hubiera empleado un estimador carente de esas propiedades. En el contexto de un análisis econométrico aplicado, en el que la incertidumbre juega un papel fundamental en muchos sentidos, éste es el único tipo de razonamiento que puede justicar el tomar o no tomar determinadas decisiones con el n de hacer algún progreso en el análisis de los datos.

2.3 Diagnosis y Revisión

La diagnosis de un modelo estimado a partir de unos datos se reere a la vericación o a la refutación, según el caso, de que las hipótesis que conforman el modelo describen adecuadamente las características de los datos empleados para estimarlo. Dado que la nalidad principal de un modelo consiste en resumir adecuadamente la información

FIGURA 12 Consistencia de un Estimador

Page 47: INTRODUCCIÓN A LA ECONOMETRÍA

2.3 Diagnosis y Revisión

Introducción a la Econometría: Un Primer Contacto 39

contenida en los datos, un modelo puede considerarse una herramienta útil solamente cuando cumple con dicha nalidad. En caso contrario, la utilidad práctica de un modelo es probablemente nula. En particular, si un método de estimación determinado sólo tiene buenas propiedades bajo ciertas condiciones, entonces las estimaciones derivadas de su uso sólo serán ables si los datos satisfacen razonablemente dichas condiciones.

Al igual que ocurre con la inspección visual de los datos en relación con la especicación inicial de un modelo econométrico (como se ilustra en el Ejemplo 2.1.2), el análisis gráco de los resultados de la estimación de un modelo suele ser bastante revelador en relación con el grado de validez de algunas de las hipótesis que conforman el modelo. La cita siguiente hace referencia a esta cuestión:

It's almost always a good idea to begin forecasting projects with graphical data analysis. When compared to the modern array of statistical modelling methods, graphical analysis might seem trivially simple, perhaps even so simple as to be incapable of delivering serious insights into the series to be forecast. Such is not the case: In many respects the human eye is a far more sophisticated tool for data analysis and modelling than even the most sophisticated modern modelling techniques. That’s certainly not to say that graphical analysis alone will get the job done —certainly, graphical analysis has its limitations— but it’s usually the best place to start. […] Graphics help us summarize and reveal patterns in data […] Graphics help us identify anomalies in data […] Graphics facilitate and encourage comparison of different pieces of data […] Graphics enable us to present a huge amount of data in a small space, and to make huge data sets coherent. DIEBOLD (2007) PÁGINAS 51 Y 53-54.

En general, este punto de vista es aplicable no sólo a cuestiones relacionadas con la previsión, sino a cualquier cuestión que se pretenda analizar utilizando la información contenida en una colección de datos. El ejemplo siguiente trata sobre el empleo de instrumentos grácos muy sencillos para de diagnosticar modelos estimados.

2.3.1 Ejemplo - Gráficos como Instrumentos de Diagnosis En este ejemplo se ilustra la posibilidad de que un modelo RLS estimado no resuma adecuadamente el contenido informativo de una colección de datos. Esta posibilidad no es fácil de detectar si sólo se mira a la información numérica asociada con un modelo estimado, aunque es muy fácilmente detectable mediante un simple examen de alguna representación gráca de dicha información. La Tabla 5 de la página siguiente contiene datos simulados (articiales) sobre seis variables, tomados (al igual que la cita del nal de

Page 48: INTRODUCCIÓN A LA ECONOMETRÍA

2 La Metodología de la Econometría Aplicada

40 Introducción a la Econometría: Un Primer Contacto

la Sección 1) de Anscombe (1973) (archivo NUM02-ANSCOMBE.WF1). Con los datos sobre cada uno de los pares de variables 1 1( , ),Y X 2 1( , ),Y X 3 1( , ),Y X 4 2( , ),Y X se han estimado por MCO cuatro modelos RLS, lo que ha proporcionado en todos los casos las mismas estimaciones MCO de 1b (término constante) y 2b (pendiente): 1 3.0b = y

2ˆ 0.5b = . Adicionalmente, en los cuatro casos se han obtenido los mismos errores estándar (desviaciones típicas estimadas) para los estimadores MCO de 1b y 2b (1.12 y 0.12, respectivamente, que miden el grado de precisión o de abilidad del estimador correspondiente; ver la Figura 11 del Ejemplo 2.2.1), y el mismo valor para el coeciente de determinación (un 67%, que representa el porcentaje de la variación total observada en los datos sobre la variable dependiente que el modelo estimado consigue explicar). Estos resultados sugieren que la relación entre cada par de variables podría ser la misma en los cuatro casos considerados.

La Figura 13 de la página siguiente contiene las representaciones grácas (nubes de puntos) de los datos correspondientes a los cuatro pares de variables considerados, junto con la RLS estimada por MCO en cada caso (que es exactamente la misma en todos los casos). Un simple vistazo a los cuatro grácos de la Figura 13 indica claramente, a pesar de lo que los resultados numéricos sugieren, que la relación entre cada par de variables no es la misma en los cuatro casos considerados. .EJERCICIO 12.

TABLA 5 Datos de Anscombe (1973)

i Y1 Y2 Y3 X1 Y4 X2

1 8.04 9.14 7.46 10.00 6.58 8.00 2 6.95 8.14 6.77 8.00 5.76 8.00 3 7.58 8.74 12.74 13.00 7.71 8.00 4 8.81 8.77 7.11 9.00 8.84 8.00 5 8.33 9.26 7.81 11.00 8.47 8.00 6 9.96 8.10 8.84 14.00 7.04 8.00 7 7.24 6.13 6.08 6.00 5.25 8.00 8 4.26 3.10 5.39 4.00 12.50 19.00 9 10.84 9.13 8.15 12.00 5.56 8.00 10 4.82 7.26 6.42 7.00 7.91 8.00 11 5.68 4.74 5.73 5.00 6.89 8.00

Page 49: INTRODUCCIÓN A LA ECONOMETRÍA

2.3 Diagnosis y Revisión

Introducción a la Econometría: Un Primer Contacto 41

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14 16 18 20

X2

Y4

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14 16 18 20

X1

Y3

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14 16 18 20

X1Y2

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14 16 18 20

X1

Y1

En el caso de las variables 1 1( , )Y X , el modelo estimado parece razonable: los datos sugieren una relación positiva entre 1Y y 1X que está bastante bien recogida por la línea recta ˆ 3.0 0.5Y X= + . En particular, el nivel medio de los residuos parece independiente de los valores que toma 1X .

En el caso de las variables 2 1( , )Y X , la situación es muy diferente: los datos sugieren una relación muy clara entre 2Y y 1X , aunque dicha relación no es lineal. En este caso, el nivel medio de los residuos depende claramente de los valores que toma 1X .

FIGURA 13 Modelos RLS Estimados por MCO con los Datos de la Tabla 5.

En Todos los Casos 1β 3.0= (Término Constante) y 2β 0.5= (Pendiente).

Page 50: INTRODUCCIÓN A LA ECONOMETRÍA

2 La Metodología de la Econometría Aplicada

42 Introducción a la Econometría: Un Primer Contacto

En el caso de las variables 3 1( , )Y X , los datos sugieren una relación lineal positiva entre

3Y y 1X . Sin embargo, hay un par de datos (el tercero) que no parece formar parte de dicha relación y que ejerce una inuencia notable sobre el modelo estimado. También en este caso, el nivel medio de los residuos depende de los valores que toma 1X .

Por último, en el caso de las variables 4 2( , )Y X , todos los pares de datos están dispuestos en vertical con la excepción de uno de ellos (el octavo), que ejerce una inuencia muy notable sobre el modelo estimado. Con independencia de otras consideraciones, el gráco correspondiente de la Figura 13 revela inmediatamente el carácter anómalo de este caso.

En general, la diagnosis de un modelo de regresión tiene que ver con los dos elementos centrales del modelo estimado: las estimaciones de sus parámetros y sus residuos. Por ejemplo, un signo o una magnitud chocante (que contrasta con lo esperado inicialmente) en un parámetro estimado, debe examinarse cuidadosamente para intentar detectar sus posibles causas y, en su caso, revisarlas y corregirlas. Por su lado, los residuos contienen la parte de la información total disponible sobre la variable dependiente del modelo que queda fuera del modelo estimado. En consecuencia, los residuos de un modelo adecuado no deben contener ningún tipo de información susceptible de poder ser utilizada para revisar y mejorar el modelo (como suele decirse, los residuos deben ser “puramente aleatorios” o “ruido blanco”). De manera equivalente, las propiedades muestrales de los residuos deben ser análogas a las propiedades teóricas supuestas sobre las perturbaciones del modelo. La cita siguiente tiene que ver con la importancia del análisis de residuos:

Complicated phenomena, in which several causes concurring, opposing, or quite independent of each other, operate at once, so as to produce a compound effect, may be simplified by subducting the effect of all the known causes, as well as the nature of the case permits, either by deductive reasoning or by appeal to experience, and thus leaving, as it were, a residual phenomenon to be explained. It is by this process, in fact, that science, in its present advanced state, is chiefly promoted. JOHN F.W. HERSCHEL (1830) "A PRELIMINARY DISCOURSE ON THE STUDY OF

NATURAL PHILOSOPHY" CITADO EN COOK Y WEISBERG (1982) PÁGINA 1.

En última instancia, la diagnosis de un modelo estimado es útil no sólo para descubrir posibles deciencias en el modelo, sino también para intentar descubrir pistas que puedan indicar cómo revisarlo y mejorarlo. Actualmente, existe una gran variedad de métodos grácos, numéricos y estadísticos para diagnosticar y revisar modelos econométricos en la

Page 51: INTRODUCCIÓN A LA ECONOMETRÍA

2.3 Diagnosis y Revisión

Introducción a la Econometría: Un Primer Contacto 43

práctica. Sólo una vez concluidas satisfactoriamente estas operaciones, podrá servir un modelo para lo que en última instancia debe servir: proporcionar respuestas ables y entendibles a las preguntas planteadas al comienzo de un análisis.

2.3.2 Una Última Cita ... El hombre trata de penetrar los secretos del universo como si lo observara desde el exterior, como si dominara la perspectiva. Piensa que hace el recuento de los mecanismos de la vida cuando él es un agente, una manifestación de esta vida. El hombre es limitado. No tiene todos los datos del problema en la mano. ¡No se puede explicar un fenómeno cuando se es una expresión de este fenómeno! Es absurdo. En todo caso, su visión está condenada a permanecer fragmentaria, incompleta.

R. SARDOU El Peregrino del Tiempo (L'Eclat de Dieu)

3 Los Recursos Instrumentales de la Econometría

La incertidumbre juega un papel fundamental en cualquier análisis de datos con el que se pretenda describir el funcionamiento de un sistema que no puede ser caracterizado con total exactitud o previsto con absoluta certeza. Por este motivo, muchos de los métodos que conforman la econometría teórica están tomados directamente o adaptados de la estadística. Otros son métodos desarrollados especícamente para analizar ciertos tipos de datos que son especiales en algún sentido. Todos estos métodos se fundamentan, en mayor o menor medida, en la Teoría de la Probabilidad y en la Inferencia Estadística, que constituyen dos de los recursos instrumentales básicos de la Teoría Econométrica. En consecuencia, un buen conocimiento de estos dos recursos estadísticos es imprescindible para entender tanto el desarrollo y el funcionamiento de los métodos econométricos disponibles actualmente, como la manera de aplicarlos en la práctica.

Al mismo tiempo, el desarrollo ordenado y formal de la Teoría de la Probabilidad, de la Inferencia Estadística y, en consecuencia, de la Teoría Econométrica, hace uso de multitud de recursos matemáticos sobre lógica, geometría, conjuntos, números reales, vectores, matrices y funciones (por mencionar unos pocos), cuyo conocimiento es absolutamente esencial para entender bien dicho desarrollo.

Page 52: INTRODUCCIÓN A LA ECONOMETRÍA

3 Los Recursos Instrumentales de la Econometría

44 Introducción a la Econometría: Un Primer Contacto

Por último, la aplicación práctica de la Teoría Econométrica para analizar datos reales requiere inevitablemente (salvo en casos muy simples) el uso de recursos informáticos adecuados, que sean capaces de procesar ecientemente grandes colecciones de datos. Dichos recursos están disponibles actualmente en una gran variedad de formatos, aunque, esencialmente, un ordenador personal modesto y un programa de cálculo econométrico sencillo suelen ser recursos sucientes para poder llevar a cabo una gran variedad de análisis econométricos aplicados.

En esta Sección 3 se hacen algunas consideraciones muy breves sobre los recursos citados en los tres párrafos anteriores (estadística, matemáticas e informática). También se mencionan varias referencias bibliográcas donde pueden encontrarse exposiciones completas y detalladas sobre el contenido de dichos recursos.

3.1 Matemáticas y Estadística Las matemáticas y la estadística utilizadas regularmente en la econometría teórica y aplicada pueden consultarse en multitud de manuales de econometría. Dos de ellos, que también se citan en la Sección 1, son Heij, de Boer, Franses, Kloek y van Dijk (2004, Capítulos 1-2 y Apéndice A), y Wooldridge (2020, Apéndices A-D). Otras referencias más completas y avanzadas son Dhrymes (2013), Johnston (1984, Capítulos 4-5 y Apéndice A) [todo un “clásico” ...], Mittelhammer (2013), y Greene (2018, Apéndices A-E).

A continuación se mencionan brevemente tres cuestiones matemáticas elementales (que son, no obstante, esenciales para dotar de signicado práctico a los parámetros de muchos modelos econométricos), y algunas cuestiones sobre esperanzas condicionales (que son muy útiles a la hora de interpretar hipótesis como [8], [9] o [17] en modelos de regresión) y sobre vectores y matrices de variables aleatorias (indispensables en la Teoría Econométrica).

3.1.1 Variaciones

VP.1 Variación absoluta: 1 0 .Y Y YD = -

VP.2 Variación relativa o proporcional: 1 0

0 0.Y YY

Y Y-D =

VP.3 Variación logarítmica: 1

0 0 01 0 .ln ln ln ln ln 1

Y Y YY Y Y

Y Y Y D Dé ùD = - = = + @ê úë û

Observación: La última relación de la línea anterior proporciona una “buena” aproximación solamente cuando

Page 53: INTRODUCCIÓN A LA ECONOMETRÍA

3.1 Matemáticas y Estadística

Introducción a la Econometría: Un Primer Contacto 45

0/Y YD es una cantidad “pequeña”, en el sentido de que una aproximación de Taylor de primer orden (lineal) al valor de la función ln(1 )x+ para valores de x próximos a 0x proporciona lo siguiente:

00 0 0 0

0 0

1ln(1 ) ln(1 ) [(1 ) (1 )] ln(1 ) cuando 0.

1 1x x

x x x x x x xx x

-+ @ + + ´ + - + = + + = =+ +

VP.4 Variación porcentual: 0

% 100 100 ln .YY

Y YDD = @ D

3.1.2 Elasticidad - Rendimientos

ER.1 Si ( )Y g X= , la elasticidad de Y con respecto a X es % lnln%

Y YYX XXl D D

DD= @ , de

manera que YXl representa la variación porcentual que tiene lugar en Y cuando X varía

un 1% (% %YXY l XD = ´ D ).

ER.2 Si 1 2 1 2( , ) b cY g X X aX X= = (una función de tipo Cobb-Douglas), entonces ocurre

que 1 2ln ln ln lnY a b X c X= + + , por lo que 1YXl b= y 2YXl c= . Al mismo tiempo,

1 2 1 2 1 2( , ) ( ) ( ) ( ),b c b c b cg X X a X X aX Xm m m m m += = por lo que en este caso 1 2( , )g X X es

una función homogénea de grado b + c, es decir, 1 2( , )g X X presenta rendimientos

constantes si b + c = 1, crecientes si b + c > 1, y decrecientes si b + c < 1.

3.1.3 Interpretación de Parámetros

IP.1 En la función 1 2F Pb b= + , [23]

2 2 ,dF FdP P

b b DD= = o bien

2F PbD = D . [24]

Por lo tanto, 2b en [23] es (exactamente) igual a la respuesta (variación) absoluta de F ante una variación absoluta unitaria en P.

IP.2 En la función 1 2ln lnF Pb b= + , [25]

21 2 1 2ln ln ln2 2 2

dF F F P F PF P PdP P P F F PP

F e e ebb b b b b b bD D D+ +

D= = = = @ @ ; en

este caso, multiplicando por 100,

2% %F PbD @ D . [26]

Por lo tanto, 2b en [25] es la elasticidad (aproximada) de F con respecto a P, es decir, la respuesta (aproximada) en % de F ante una variación de un 1% en P.

Page 54: INTRODUCCIÓN A LA ECONOMETRÍA

3 Los Recursos Instrumentales de la Econometría

46 Introducción a la Econometría: Un Primer Contacto

IP.3 En la función 1 2lnF Pb b= + , [27]

1 2 1 2 1ln2 2 2 2

dF F FF P PdP F FP

F e e e F Pb b b bb b b bD D+ +D= = = = @ @ D ; por lo

tanto, multiplicando por 100,

2% 100F PbD @ D . [28]

En relación con [27], 2100b es la semielasticidad (aproximada) de F con respecto a P, es decir, la respuesta (aproximada) en % de F ante una variación absoluta unitaria en P.

IP.4 En la función 1 2lnF Pb b= + , [29]

12 2 2

dF F PdP P PP

P Fb b bD DD= @ D @ ; por lo tanto, multiplicando y dividiendo el

lado derecho por 100,

2100 %F PbD @ D . [30]

En relación con [29], 2100b

es la respuesta absoluta (aproximada) de F provocada por una variación de un 1% en P.

IP.5 En la función 21 2 3F P Pb b b= + + , [31]

2 22 3

2 3 3 22 , 2 , 0dF d F dF

dP dPdPP P

bbb b b *= + = = = - ; por lo tanto, P * es un máximo

(mínimo) de F con respecto a P si 3 0b < ( 3 0b > ). Adicionalmente, el valor P * que

minimiza (maximiza) F es el mismo que minimiza (maximiza) lnF [porque ln(·) es una

función monótona estrictamente creciente].

3.1.4 Esperanzas Condicionales

EC.1 Si U y X son dos variables aleatorias continuas con función de densidad (pdf, del inglés probability density function) conjunta ( , )UXf u x , y (·)g es una función real continua, entonces:

Esperanza de g(·): E[ ( , )] ( , ) ( , ) .UXg U X g u x f u x dudx+¥ +¥-¥ -¥= ò ò [32]

Pdfs Marginales: ( ) ( , ) ,

( ) ( , ) .

U UX

X UX

f u f u x dx

f x f u x du

+¥-¥+¥-¥

= ò

= ò [33]

Page 55: INTRODUCCIÓN A LA ECONOMETRÍA

3.1 Matemáticas y Estadística

Introducción a la Econometría: Un Primer Contacto 47

Esperanzas Marginales: E[ ] ( ) ,

E[ ] ( ) .

U

X

U uf u du

X xf x dx

+¥-¥+¥-¥

= ò

= ò [34]

Pdfs Condicionales:

1( , ) ( , ),( )

1( , ) ( , ).( )

U X UXX

X U UXU

f u x f u xf x

f u x f u xf u

= ´

= ´ [35]

Esperanzas Condicionales: E[ ] ( , ) ,

E[ ] ( , ) .

U X

X U

U X uf u X du

X U xf U x dx

+¥-¥+¥-¥

= ò

= ò [36]

EC.2 Si (·)g es una función real continua, y U y X son dos variables aleatorias continuas con pdfs y esperanzas como en [33]-[36], entonces

Law of Iterated Expectations: E[ ( , )] E[E[ ( , ) ]].g U X g U X X= [37]

Demostración:

E[ ( , ) ] ( , ) ( , ) ( ), por lo que

E[E[ ( , ) ]] E[ ( )] ( ) ( )

( , ) ( , ) ( )

( , ) ( , ) E[ ( , )].

U X

X

U X X

UX

g U X X g u X f u X du h X

g U X X h X h x f x dx

g u x f u x du f x dx

g u x f u x dudx g U X

+¥-¥

+¥-¥

+¥ +¥-¥ -¥+¥ +¥-¥ -¥

= =ò

= = òé ù= ò òê úë û

= =ò ò

EC.3 Si U y X son dos variables aleatorias continuas con pdfs y esperanzas como en [33]-[36], entonces

E[ ] E[ ] Cov[ , ] 0 Corr[ , ] 0.U X U U X U X= = = [38]

Demostración:

E[ ]

Cov[ , ] E[( E[ ])( E[ ])] E[ ] E[ ] E[ ]

E[E[ ]] E[ ] E[ ]

E[E[ ] ] E[ ] E[ ] E[E[ ] ] E[ ] E[ ]

E[ ] E[ ] E[ ] E[ ] 0.

U

U X U U X X UX U X

UX X U X

U X X U X U X U X

U X U X

= - - = - ´

= - ´

= ´ - ´ = ´ - ´

= ´ - ´ =

Page 56: INTRODUCCIÓN A LA ECONOMETRÍA

3 Los Recursos Instrumentales de la Econometría

48 Introducción a la Econometría: Un Primer Contacto

El resultado [38] permite, por ejemplo, interpretar la hipótesis en la segunda parte de [8] en términos de ausencia de correlación entre la perturbación y la variable explicativa de un modelo RLS en cada observación o punto muestral. Análogamente, la hipótesis [17] implica la ausencia de correlación entre la perturbación y todas las variables explicativas de un modelo RLM en cada observación o punto muestral.

3.1.5 Vectores de Esperanzas y Matrices de Varianzas-Covarianzas

Si W y X son matrices N M´ y N K´ , respectivamente, de variables aleatorias, entonces los símbolos E[W] y E[ ]W X representan matrices de orden N M´ cuyos elementos en las posiciones ij ( 1, 2, ..., ; 1, 2, ...,i N j M= = ) son E[ ]ijW y E[ ]ijW X , respectivamente. En particular, si 1 2[ , , ..., ]NV V V ¢=V es un vector 1N ´ (columna) de variables aleatorias (el símbolo ¢ representa la operación de trasposición), entonces

1 1

2 2

E[ ] E[ ]

E[ ] E[ ]E[ ] , E[ ]

E[ ] E[ ]N N

V V

V V

V V

é ù é ùê ú ê úê ú ê úê ú ê ú= =ê ú ê úê ú ê úê ú ê úë û ë û

XX

V V X

X

[39]

son los vectores de esperanzas (medias) incondicionales y condicionales, respectivamente, de V. Por otro lado,

( )

1 1

2 21 1 2 2

2 1 1 2 2 1 11 122 2 1 1 2 22 2

E[ ]

E[ ]( E[ ])( E[ ]) E[ ], E[ ], ..., E[ ]

E[ ]

( E[ ])( E[ ]) ( E[ ])( E[ ])( E[ ])

( E[ ])( E[ ]) ( E[ ])( E( E[ ])

N N

N N

N N

N

V V

V VV V V V V V

V V

V V V V V V V VV V

V V V V V V VV V

æ ö- ÷ç ÷ç ÷ç - ÷ç ÷¢ ç ÷- - = - - - =÷ç ÷ç ÷ç ÷ç ÷÷çè - ø

- - - --- - - --

=

V V V V

21 1 2 2

[ ]).

( E[ ])( E[ ]) ( E[ ])( E[ ]) ( E[ ])

N

N N N N N N

V

V V V V V V V V V V

é ùê úê úê úê úê úê úê ú- - - - -ë û

Por lo tanto, teniendo en cuenta que 2E[( E[ ]) ] Var[ ]i i iV V V- = ( 1, 2, ...,i N= ), y que E[( E[ ])( E[ ])] Cov[ , ]i i j j i jV V V V V V- - = ( , 1, 2, ..., ;i j N i j= =/ ), aplicando el operador

Page 57: INTRODUCCIÓN A LA ECONOMETRÍA

3.2 Recursos Informáticos

Introducción a la Econometría: Un Primer Contacto 49

E[·] a la matriz ( E[ ])( E[ ])¢- -V V V V anterior resulta que

1 1 2 1

2 1 2 2

1 2

Var[ ] Cov[ , ] Cov[ , ]

Cov[ , ] Var[ ] Cov[ , ]E[( E[ ])( E[ ]) ]

Cov[ , ] Cov[ , ] Var[ ]

N

N

N N N

V V V V V

V V V V V

V V V V V

é ùê úê úê ú¢- - = ê úê úê úë û

V V V V

,

que se denomina la matriz de varianzas-covarianzas (o la matriz de varianzas, o la matriz de covarianzas) incondicionales de V:

Var[ ] E[( E[ ])( E[ ]) ].¢= - -V V V V V [40]

La matriz Var[ ]V es una matriz cuadrada (N N´ ) y simétrica. Los elementos en su diagonal principal son las varianzas de los componentes individuales de V, y los elementos fuera de su diagonal principal son las covarianzas entre cada par de componentes de V:

Var[ ] Var[ ] para 1, 2, ..., ,ii iV i N= =V

Var[ ] Cov[ , ] para , 1, 2, ..., con .ij i jV V i j N i j= = =/V

Análogamente, la matriz de varianzas-covarianzas condicionales de V es

Var[ ] E[( E[ ])( E[ ]) ].¢= - -V X V V X V V X X [41]

Como añadido importante a [39]-[40], un vector 1 2[ , , ..., ]NV V V ¢=V de variables aleatorias sigue una distribución Normal multivariante con vector de medias E[ ] =V m y matriz de varianzas-covarianzas Var[ ] =V S sí y sólo sí su función de densidad es

1/2 11/22( ) (2 ) exp ( ) ( )Nf p - -- é ù¢= - - -ë ûv v vS m S m , [42]

lo que suele representarse como Normal( , )V m S .

3.2 Recursos Informáticos

Aunque actualmente existen tanto ordenadores como programas de análisis de datos muy potentes y sosticados, lo cierto es que (salvo en casos especiales) un ordenador personal

Page 58: INTRODUCCIÓN A LA ECONOMETRÍA

Resumen

50 Introducción a la Econometría: Un Primer Contacto

modesto y un software sencillo son recursos sucientes para poder llevar a cabo una gran variedad de análisis econométricos en la práctica, cómoda y ecientemente.

En la guía Introducción al Uso de EViews 4.1 disponible en ucm.randomshock.com se explica cómo utilizar el programa EViews (versión 4.1 para Windows) en relación con varios de los temas que suelen impartirse en los estudios de grado de muchas universidades en dos cuatrimestres de econometría. Existen, desde luego, muchas alternativas (como versiones más recientes de EViews, programas libres y de pago, y documentación gratuita en Internet), por lo que cualquier usuario de la econometría aplicada (estudiante, analista, investigador) puede elegir su software a la medida de sus gustos y sus necesidades.

Resumen

La toma de decisiones en muchos contextos tanto sociales como naturales se basa con frecuencia en el análisis de datos. Los datos reejan el funcionamiento real de algún sistema cuyo entendimiento es importante para tomar decisiones razonadamente.

La econometría aplicada moderna trata de cómo analizar datos para responder a preguntas diversas referidas a sistemas cuyo funcionamiento es imposible de caracterizar con total exactitud o de prever con absoluta certeza.

Los métodos estadísticos y matemáticos que se utilizan en la econometría aplicada para analizar datos conforman, en conjunto, lo que suele denominarse econometría teórica o métodos econométricos.

El punto de partida de un análisis econométrico aplicado consiste en el planteamiento preciso de una pregunta concreta sobre algún aspecto de un sistema dado, cuya respuesta se pretende obtener usando la evidencia empírica contenida en una colección de datos.

Muchas preguntas que se plantean en la econometría aplicada tratan sobre la evaluación de efectos causales entre variables, o sobre la previsión de cantidades desconocidas.

Evaluar de manera able el efecto causal o directo de una variable sobre otra utilizando datos no experimentales es una tarea difícil, especialmente cuando la inuencia que se pretende aislar está relacionada con otras que no se consideran de forma explícita en el análisis. La presencia de efectos indirectos asociados con esta posibilidad puede llevar a la

Page 59: INTRODUCCIÓN A LA ECONOMETRÍA

Resumen

Introducción a la Econometría: Un Primer Contacto 51

estimación de relaciones espurias, carentes de legitimidad o de autenticidad. Por este motivo, dos elementos centrales en la elaboración de un análisis econométrico aplicado son los que tienen que ver con qué variables se incluyen explícitamente en el análisis y cuál es su posible relación con otras variables que se omiten.

Cada dato que se emplea en un análisis econométrico aplicado es un valor numérico de cierta característica de una entidad observable que forma parte del sistema social o natural al que se reere la pregunta planteada al comienzo del análisis. En función de cómo se haya llevado a cabo la observación de dicho sistema, los datos resultantes pueden ser de sección cruzada (transversales), de series temporales, o de panel (longitudinales).

Una vez escogidos los datos que se van a utilizar para resolver el problema planteado al comienzo de un análisis, el paso siguiente consiste en resumir la información cuantitativa contenida en los datos mediante un modelo econométrico, como un modelo de regresión lineal simple (RLS), o un modelo de regresión lineal múltiple (RLM).

Un modelo se plantea como un conjunto de hipótesis plausibles que pretenden resumir algún aspecto del funcionamiento real de un sistema reejado en unos datos. Para que un modelo pueda dar respuestas ables a las preguntas formuladas al comienzo de un análisis, las hipótesis que dan forma al modelo deben adecuarse tanto a dichas preguntas como a las propiedades de los datos que se emplearán para intentar responderlas.

Las respuestas que proporciona un modelo elaborado a partir de unos datos, pueden ir desde una mera descripción cuantitativa de algún aspecto de un sistema, hasta una serie de previsiones muy valoradas a la hora de tomar decisiones importantes.

La elaboración de un modelo requiere inicialmente la especicación de las hipótesis que le dan forma y la estimación de los parámetros que guran en dicha especicación. Tanto la especicación inicial de un modelo como la estimación de sus parámetros son pasos importantes en un análisis aplicado, pero no proporcionan por sí solos ninguna garantía para la obtención de respuestas ables.

La abilidad de las respuestas proporcionadas por un modelo elaborado a partir de unos datos depende fundamentalmente (sobre todo en entornos no experimentales) del grado de compatibilidad entre las hipótesis que conforman el modelo y las pautas muestrales que están realmente presentes en los datos. Sin una evaluación adecuada de ese grado de compatibilidad, es imposible juzgar la abilidad de las conclusiones obtenidas al nal de un

Page 60: INTRODUCCIÓN A LA ECONOMETRÍA

Bibliografía

52 Introducción a la Econometría: Un Primer Contacto

análisis. Por este motivo, la diagnosis y, en su caso, la revisión de un modelo constituyen probablemente la etapa esencial de cualquier análisis econométrico aplicado.

Aunque existen muchos métodos útiles y más o menos sosticados tanto para especicar como para diagnosticar y, en su caso, revisar un modelo, el análisis gráco de los datos y de otras cantidades asociadas con la elaboración de un modelo suele ser el mejor punto de partida para su especicación y su diagnosis.

Bibliografía

Las citas en las páginas 1 y 43 están tomadas de dos obras literarias bien conocidas, que han sido publicadas por diversas editoriales en fechas y ediciones variadas. Por su parte, las referencias siguientes han sido utilizadas como fuentes de citas, ejemplos y datos, o han sido mencionadas por algún otro motivo, a lo largo del texto:

Anscombe, F.J. (1973), Graphs in Statistical Analysis, The American Statistician 27 (1) pp. 17-21.

Baltagi, B.H. (2008), Econometrics (Fourth Edition), Springer.

Berndt, E.R. (1991), The Practice of Econometrics, Addison-Wesley.

Cook, D., Weisberg, S. (1982), Residuals and Influence in Regression, Chapman & Hall.

Dhrymes, P.J. (2013), Mathematics for Econometrics (Fourth Edition), Springer.

Diebold, F.X. (2007), Elements of Forecasting (Fourth Edition), Thomson South-Western.

Franses, P.H. (2002), A Concise Introduction to Econometrics, Cambridge University Press.

Greene, W.H. (2018), Econometric Analysis (Eighth Edition), Pearson.

Heij, C., de Boer, P., Franses, P.H., Kloek, T., van Dijk, H.K. (2004), Econometric Methods with Applications in Business and Economics, Oxford University Press.

Johnston, J. (1984), Econometric Methods (Third Edition), McGraw-Hill.

Mittelhammer, R.C. (2013), Mathematical Statistics for Economics and Business (Second Edition), Springer.

Wooldridge, J.M. (2020), Introductory Econometrics - A Modern Approach (Seventh Edition), Cengage.

Page 61: INTRODUCCIÓN A LA ECONOMETRÍA

Ejercicios

Introducción a la Econometría: Un Primer Contacto 53

El Capítulo 1 de Baltagi (2008), el Capítulo 1 de Berndt (1991), el libro de Franses (2002) y el Capítulo 1 de Wooldridge (2020) son lecturas introductorias muy recomendables. También lo son el libro de Franses (2018), el Capítulo 1 de Hill, Gri ths y Lim (2018), los Capítulos 1 y 22 de Kennedy (2008), y los Capítulos 1-3 de Stock y Watson (2019), cuyas referencias completas son las siguientes:

Franses, P.H. (2018), Enjoyable Econometrics, Cambridge University Press.

Hill, R.C., Griffiths, W.E., Lim, G.C. (2018), Principles of Econometrics (Fifth Edition), Wiley.

Kennedy, P. (2008), A Guide to Econometrics (Sixth Edition), Blackwell.

Stock, J.H., Watson, M.W. (2019), Introduction to Econometrics (Fourth Edition), Pearson.

Ejercicios

.EJERCICIO 1.

Explicar a quién y para qué podría interesar resolver cada uno de los problemas planteados en el Ejemplo 1.1.1. Para ello, replantear cada problema de la forma más precisa posible, reriéndolo a una situación o a un entorno concreto.

.EJERCICIO 2.

En relación con la ecuación [1] de la Denición 1.1.2, explicar qué podrían representar Y, X, W y V en cada uno de los problemas planteados en el Ejemplo 1.1.1. Discutir la posible independencia de W y de V con respecto a X en cada caso.

.EJERCICIO 3.

Diseñar varios experimentos del tipo de alguno de los dos descritos en el Ejemplo 1.1.3 que permitan obtener datos referidos a los problemas P01, P02, P03, P06 y P10 del Ejemplo 1.1.1. Explicar en cada caso las dicultades prácticas asociadas con la ejecución de dichos experimentos.

.EJERCICIO 4.

Indicar para cuáles de los problemas planteados en el Ejemplo 1.1.1 sería razonable utilizar

Page 62: INTRODUCCIÓN A LA ECONOMETRÍA

Ejercicios

54 Introducción a la Econometría: Un Primer Contacto

datos de sección cruzada.

.EJERCICIO 5.

Indicar para cuáles de los problemas planteados en el Ejemplo 1.1.1 sería razonable utilizar datos de series temporales.

.EJERCICIO 6. .APÉNDICE A.2.

Elaborar los grácos de las Figuras 2-3. [Requiere EViews o similar.]

.EJERCICIO 7. .APÉNDICE A.2.

Explicar por qué la presencia del término constante en un modelo RLS garantiza que la hipótesis de que E[ ] 0iU = sea perfectamente asumible.

.EJERCICIO 8. .APÉNDICE A.2.

[A] Elaborar los grácos de las Figuras 6-7 y estimar por MCO las cuatro regresiones correspondientes. [Requiere EViews o similar.] [B] Comprobar que la estimación MCO [10] de 2b es la misma que proporciona el método de momentos aplicado al modelo RLS [9].

.EJERCICIO 9.

Discutir la posible independencia entre U y X (y, por lo tanto, la abilidad de las estimaciones MCO) en los cuatro modelos RLS estimados en el Ejemplo 1.4.1.

.EJERCICIO 10.

Indicar cuáles de las respuestas obtenidas en el Ejemplo 1.4.2 encajan en alguno de los tres tipos de respuestas considerados en el Ejemplo 1.4.1.

.EJERCICIO 11.

Justicar e interpretar cada uno de los modelos [19], [21] y [22] del Ejemplo 2.1.2.

.EJERCICIO 12. .APÉNDICE A.2.

Comprobar todos los resultados numéricos y grácos del Ejemplo 2.3.1. [Requiere EViews o similar.]

Page 63: INTRODUCCIÓN A LA ECONOMETRÍA

Ejercicios

Introducción a la Econometría: Un Primer Contacto 55

.EJERCICIO DE REPASO.

Al comienzo del primer trimestre del año 2021 (día 1 de enero de 2021), pretendemos decidir cómo invertir a tres meses (hasta el día 31 de marzo) cierta cantidad de dinero en el mercado secundario de la deuda pública. Consideramos dos inversiones alternativas:

(1) Comprar un valor a 3 meses el día 1 de enero y esperar a su vencimiento el día 31 de marzo para hacerlo efectivo.

(2) Comprar un valor a 6 meses el día 1 de enero y, en vez de esperar a su vencimiento el 30 de junio, venderlo tres meses después de comprarlo (el día 31 de marzo) por el precio que tenga entonces en el mercado un valor a tres meses.

Los dos valores considerados se compran al descuento, lo que signica que:

(A) El día 1 de enero se conoce exactamente la rentabilidad asociada con la operación (1), ya que tanto el precio como el valor de reembolso del valor a 3 meses se contratan en el momento de su compra (el día 1 de enero).

(B) Para la operación (2), el día 1 de enero se puede contratar el precio de compra (así como el valor de reembolso para 6 meses después) del valor a 6 meses, pero no se sabe a qué precio se podrá vender dicho valor tres meses después (el día 31 de marzo), por lo que la rentabilidad asociada con la operación (2) no se conoce en el momento de invertir (el día 1 de enero).

Conocida la rentabilidad de la operación (1) en el momento de invertir, el problema consiste en cómo prever la rentabilidad de la operación (2) en dicho momento, para decidir en cuál de las dos operaciones invertir nuestro dinero.

DATOS

Para resolver este problema, disponemos de datos trimestrales sobre las rentabilidades observadas de las operaciones (1) y (2) desde el primer trimestre del año 2011 hasta el último trimestre del año 2020, ambos inclusive (40 trimestres consecutivos). Al comienzo del primer trimestre de 2021 (el día 1 de enero de 2021), también sabemos cuál será la rentabilidad de la operación (1) para dicho trimestre, pero no sabemos cuál será la rentabilidad de la operación (2). Si representamos las rentabilidades de ambas operaciones como X e Y, respectivamente, entonces el día 1 de enero de 2021 contamos con la siguiente

Page 64: INTRODUCCIÓN A LA ECONOMETRÍA

Ejercicios

56 Introducción a la Econometría: Un Primer Contacto

información:

Número de observación

Fecha (trimestre)

Rentabilidad operación (1): X

Rentabilidad operación (2): Y

1 2011:1 1x 1y 2 2011:2 2x 2y

39 2020:3 39x 39y 40 2020:4 40x 40y

2021:1 Conocida ( x∗ ) Desconocida

MODELO

1 2 1 2ˆ ˆˆ ˆ ˆEstimaciónY X U Y Y U X Ub b b b= + + = + = + + .

Pregunta 1: Indique de qué tipo son los datos que guran en la tabla anterior.

Pregunta 2: En el modelo 1 2Y X Ub b= + + , indique cuáles son y qué representan las variables, cuáles son y qué representan los parámetros, y qué representa el término U.

Pregunta 3: Explique qué diferencias hay entre lo que representa el símbolo 2b (sin sombrero) y lo que representa el símbolo 2b (con sombrero). Haga lo mismo con lo que representan los símbolos U (sin sombrero) y U (con sombrero).

Pregunta 4: Explique cómo calcularía, a partir del modelo estimado, una previsión de la rentabilidad de la operación (2) para el primer trimestre de 2021. Si representamos dicha previsión como y* , indique cuál es la expresión analítica de y* en términos de x* . Explique cómo utilizaría las cantidades x* (un dato) e y* (una previsión) para decidir en cuál de las dos operaciones invertir.

Pregunta 5: Si el símbolo Y* (en mayúscula y sin sombrero) representa la rentabilidad de la operación (2) en el primer trimestre de 2021 (desconocida), indique cuándo se conocerá el valor real (observado) de Y* . Por último, explique cómo utilizaría el valor estimado de una probabilidad del tipo Pr[ ]Y x* *³ para decidir en cuál de las dos operaciones invertir.

Las respuestas a estas cinco preguntas se encuentran en la página siguiente ...

Page 65: INTRODUCCIÓN A LA ECONOMETRÍA

Ejercicios

Introducción a la Econometría: Un Primer Contacto 57

Respuesta 1: Son datos de series temporales.

Respuesta 2: Las variables son la variable dependiente Y [rentabilidad de la operación (2)], y la variable explicativa X [rentabilidad de la operación (1)]. Los parámetros son el término constante 1 E[ 0]Y Xb = = (siempre que U y X sean independientes en el sentido de que E[ ] 0U X = ), y la pendiente 2 /Y Xb = ¶ ¶ . El término U (error o perturbación) es la parte de Y que diere de (no considerada en) 1 2Xb b+ .

Respuesta 3: El símbolo 2b representa lo que realmente vale el efecto causal de X sobre Y. Es una cantidad desconocida. El símbolo 2b representa una estimación numérica (calculable fácilmente) de dicha cantidad. El símbolo U representa todas las inuencias que realmente recibe Y no consideradas explícitamente en el modelo a través del término

1 2Xb b+ . Muchas de esas inuencias suelen ser difíciles o imposibles de observar. El símbolo U representa la diferencia entre cualquier valor observado (dato) de la variable dependiente y el valor ajustado o previsto correspondiente 1 2

ˆ ˆY Xb b= + de acuerdo con el modelo estimado. En ocasiones, U (residuo) se interpreta como una estimación numérica del contenido real (desconocido) de U (error o perturbación).

Respuesta 4: La previsión se calcularía como 1 2ˆ ˆ ˆˆ E[ ]y x Y X xb b* * *= + = = . Si y*

fuera signicativamente mayor [menor] que x* , sería recomendable invertir en la operación (2) [(1)].

Respuesta 5: El valor de Y* se conocerá al nalizar el primer trimestre de 2021 (el día 31 de marzo de 2021). Si el valor estimado de Pr[ ]Y x* *³ fuera grande [pequeño], sería razonable invertir en la operación (2) [(1)].

Page 66: INTRODUCCIÓN A LA ECONOMETRÍA

58 Introducción a la Econometría: Un Primer Contacto

APÉNDICE

A.1 Archivos de Datos

En la lista siguiente guran los nombres de los archivos de datos (WF1) para EViews utilizados a lo largo del texto. También se indican los apartados donde se menciona cada uno de ellos. Los archivos se encuentran en ucm.randomshock.com/data/Intro-Ectr.zip.

SC01-VIVIENDAS.WF1 Apartados 1.2, 1.3. ST01-PINKHAM.WF1 Apartados 1.2, 1.3. PA01-SALARIOS1.WF1 Apartado 1.2. PA02-SALARIOS2.WF1 Apartado 1.2. SC02-RECIENNACIDOS.WF1 Apartado 1.3. ST02-PIB.WF1 Apartado 1.3. SC03-SALARIOS3.WF1 Apartado 2.1. NUM02-ANSCOMBE.WF1 Apartado 2.3.

A.2 Indicaciones sobre Algunos Ejercicios

La resolución de los Ejercicios 6, 8[A] y 12, requiere utilizar un programa como EViews o similar. En las Secciones 1-10 de la guía Introducción al Uso de EViews 4.1 disponible en ucm.randomshock.com se explica con todo detalle cómo llevar a cabo las operaciones correspondientes.

A.2.1 Solución del Ejercicio 7 Un modelo RLS como

1 2 , con E[ ] 0,i i i iY X U Ub b q¢ ¢ ¢= + + = =/

Page 67: INTRODUCCIÓN A LA ECONOMETRÍA

APÉNDICE

Introducción a la Econometría: Un Primer Contacto 59

es equivalente a

1 2 1 2( ) ( ) ,i i i i iY X U X Ub q b q b b¢ ¢= + + + - = + + con

1 1( ), ( ), E[ ] E[ ] E[ ] 0,i i i iU U U Ub b q q q q q¢ ¢ ¢= + = - = - = - =

lo que implica que el término constante de un modelo de regresión lineal siempre se puede “redenir” de tal manera que la esperanza de las perturbaciones sea igual a cero.

A.2.2 Solución del Ejercicio 8[B] La hipótesis de que E[ ] 0i iU X = en [9] implica, de acuerdo con [37]-[38], que

E[ ] E[E[ ]] E[0] 0i i iU U X= = = , [A1]

Cov[ , ] 0.i iU X = [A2]

A su vez, [A2] implica, teniendo en cuenta [A1], que

E[( E[ ])( E[ ]) E[ ] E[ ] E[ ] E[ ] 0.i i i i i i i i i iU U X X U X U X U X- - = - ´ = =

Por lo tanto, 1 2i i iY X Ub b= + + con E[ ] 0i iU X = en [9] implican en conjunto que

1 2E[ ] 0,i iY Xb b- - = [A3]

1 2E[( ) ] 0,i i iY X Xb b- - = [A4]

para todo i = 1, 2, ..., N. Las condiciones muestrales análogas a [A3]-[A4] para estimar los parámetros 1b y 2b por el método de momentos son las siguientes:

11 21

ˆ ˆ( ) 0,Ni iiN

y xb b=å - - = [A5]

11 21

ˆ ˆ( ) 0,Ni i iiN

y x xb b=å - - = [A6]

que constituyen un sistema de dos ecuaciones con dos incógnitas ( 1 2ˆ ˆ,b b ), cuya única

solución, bajo la premisa de que 21 ( ) 0N

ii x x=å - > , es

1 2ˆ ˆ ,y xb b= - [A7]

12 2

1

( )( ) ˆ ˆcov[ , ] dvt[ ]ˆ ˆcorr[ , ].ˆ ˆvar[ ] dvt[ ]( )

Ni ii

Nii

y y x x

x xb =

=

å - -= = = ´

å -y x y

y xx x

[A8]

La obtención paso a paso de 1b y 2b en [A7]-[A8] a partir de [A5]-[A6] constituye un buen

Page 68: INTRODUCCIÓN A LA ECONOMETRÍA

APÉNDICE

60 Introducción a la Econometría: Un Primer Contacto

ejercicio de repaso sobre operaciones con sumatorios y estadísticos muestrales. El signicado de algunos de los símbolos que guran en [A7]-[A8] es el siguiente:

Vectores de datos: 1 2 1 2[ , , ..., ] , [ , , ..., ] .N Ny y y x x x¢ ¢= =y x

Medias muestrales: 1 11 1, .N N

i ii iN Ny y x x= == å = å

Varianza muestral: 1 21ˆvar[ ] ( ) .N

iiNx x== å -x

Desviación típica muestral: ˆ ˆdvt[ ] var[ ].=x x

Covarianza muestral: 11ˆcov[ , ] ( )( ).N

i iiNy y x x== å - -y x

Correlación simple muestral: ˆcov[ , ] .ˆcorr[ , ]

ˆ ˆdvt[ ] dvt[ ]=

´y x

y xy x

Para más detalles, ver, por ejemplo, Wooldridge (2020), pp. 25-26.

Page 69: INTRODUCCIÓN A LA ECONOMETRÍA

06072021

Page 70: INTRODUCCIÓN A LA ECONOMETRÍA

En un primer curso de Econometría, quizás lo realmente importante no tiene que ver del todo ni con el contenido especí�co de la materia ni con la forma de impartirla o de estudiarla, sino más bien con intentar explicar y entender claramente desde el principio del curso qué es la Econome-tría. La idea central a este respecto es muy sencilla: la Econometría es simplemente una herra-mienta de propósito general que puede contribuir a resolver muchos problemas prácticos, mediante la interpretación y el uso adecuado de la información contenida en una colección de datos resumida a través de uno o varios modelos.

En esta guía ilustrada se introducen, detenida y ordenadamente, los conceptos y los procedi-mientos fundamentales del Análisis de Regresión Lineal dirigidos a enfocar la Econometría como lo que realmente es en sus aspectos tanto teóricos como aplicados, incluyendo los siguientes:

» Preguntas, datos, modelos y respuestas.

» Evaluación de efectos causales y cálculo de previsiones.

» Especi�cación, estimación, diagnosis y revisión de modelos.

» Recursos matemáticos, estadísticos e informáticos.

A lo largo del texto se utilizan numerosos ejemplos y se proponen varios ejercicios con la intención de ilustrar tanto las posibilidades como las di�cultades asociadas con la elaboración de cualquier análisis econométrico aplicado en la práctica.

Esta guía pretende contribuir, en particular, a que toda la parafernalia técnica asociada típicamen-te con un primer curso de Econometría (teórica y aplicada) resulte fácilmente explicable y entendi-ble, dentro de un panorama amplio y progresivamente familiar en el que se pueden ir detallando, poco a poco y con sentido, todas las piezas que suelen conformar ese primer curso.

JOSÉ ALBERTO MAURICIO

Profesor TitularDepartamento de Análisis Económico y Economía Cuantitativa

Universidad Complutense de Madrid

INTRODUCCIÓN A LA

ECONOMETRÍAUN PRIMER CONTACTO


Recommended