28/10/2015
1
Introduzione all’Econometria
Seminario A.A. 2015‐16
Silvia Balia
Dipartimento di Scienze Economiche e Aziendali
28/10/2015
2
Dati cross‐section sui salari e altre caratteristiche individuali
Dati di serie storiche per Puerto Rico
• avgmin: salario medio minimo• avgcov: percentuale di lavoratori coperti dalla legge sul salario minimo• unemp: tasso di disoccupazione• gnp: prodotto domestico nazionale
28/10/2015
3
Dati longitudinali, per il crimine urbano ‐panel di 2 anni
Outline del seminario
• Richiami di probabilità e statistica– Variabili causali e distribuzioni di probabilità– Valore atteso, media e varianza– Distribuzioni congiunte, marginali e condizionate– Covarianza e correlazione– Stima della media della popolazione– Verifica delle ipotesi circa la media della popolazione
• Analisi di regressione– Modello di regressione lineare– Definizione di stima e stimatore– Lo stimatore dei minimi quadrati ordinari– Misure di bontà dell’adattamento– Assunzioni dei minimi quadrati– Distribuzione campionaria OLS– Verifica di ipotesi e intervalli di confidenza con un solo regressore– Omeoschedasticità e eteroschedasticità
• LAB– Applicazioni con excel e Stata
28/10/2015
4
California Test Score Data Set
Sintesi delle distribuzioni delle variabili STR e Test score
Scatterplot
28/10/2015
5
Differenza tra medie di due gruppi
• C’è una differenza statisticamente significativa tra i punteggi delle classi piccole (STR<20) e i punteggi delle classi grandi (STR≥20)?
Asimmetria e Curtosi
28/10/2015
6
Il coefficiente di correlazione misura l’associazione lineare
Distribuzione campionaria di
quando Y è una Bernoulli (p= 0.78)
28/10/2015
7
Distribuzione campionaria di
Calcolo del p‐value quando la varianza è nota
28/10/2015
8
Valori critici basati sulla distribuzione t di Student
• Se n è moderato (diverse dozzine) o grande (centinaia), la differenza tra I valori critici della t‐distribution e della N(0,1) è trascurabile. Qui alcuni valori critici al 5% per test bilaterali“2‐sided”:
28/10/2015
9
Modello di regressione‐ terminologia
Modello di regressione della popolazione ‐Osservazioni su Y e X con n=7
28/10/2015
10
E(y|x) come funzione lineare di x
28/10/2015
11
Valori predetti e residui
Applicazione ai dati
28/10/2015
12
Stata output
Assunzione 2) E(u|X = x) = 0
28/10/2015
13
Assunzione 4) Outliers
Maggiore è la varianza di x, minore è la varianza dello stimatore
Il numero di punti neri e blu è lo stesso. Quali usereste per avere una stima più accurata dei parametri, cioè per avere una retta di regressione più accurata?
28/10/2015
14
p‐value
Output Stata (es. 1)
28/10/2015
15
Output Stata (es. 2)
http://fmwww.bc.edu/ec‐p/data/wooldridge/datasets.list.html
Output Stata (es. 3) ‐ variabile dummy
28/10/2015
16
Medie nei gruppi
Trasformazione log‐log
28/10/2015
17
Trasformazione semilog
28/10/2015
18
Omoschedasticità
Eteroschedasticità
28/10/2015
19
Esercitazione
https://www.dropbox.com/sh/gvrteyegzhyqfeu/AADzBGE2ls880c9Ez_OJxDsca?dl=0