Wirtschaftsstatistik 2 Herbert Nagel
Literatur
Bucher
Brannath, Futschik, Krall (2010): Statistik im Studium der Wirtschaftswissenschaften.
facultas
Hatzinger, Nagel (2013): Statistik mit SPSS (2. Auflage). Pearson
Hatzinger, Hornik, Nagel, Maier (2014): R Einfuhrung durch angewandte Statistik
(2. Auflage). Pearson
Sonstiges
Nagel: Kategoriale Daten. Download
Nagel: Foliensatz Wirtschaftsstatistik 2. Download
Wirtschaftsstatistik 2 Herbert Nagel
Alkohol- und Tabakkonsum: Streudiagramm
tobacco
5,04,54,03,53,02,5
alco
ho
l
6,5
6,0
5,5
5,0
4,5
4,0
3,5
NorthernIreland
Scotland
Wales
Southwest
Southeast
EastAnglia
WestMidlands
EastMidlands
NortheastYorkshire
North
Wirtschaftsstatistik 2 Herbert Nagel
Korrelationskoeffizient (Pearson)
• Geeignet bei linearem Zusammenhang.Check via Streudiagramm!
• Unabhangig vom Maßstab.
• −1 ≤ r ≤ 1Das Vorzeichen von r gibt die Richtung des Zusammenhangs an.|r| gibt die Starke des Zusammenhangs an.
• Symmetrisch: rxy = ryx.
Wirtschaftsstatistik 2 Herbert Nagel
Starke Korrelation
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
● ●●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
● ●
●
0 1 2 3 4 5
0.0
0.5
1.0
1.5
r = 0.932
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
● ●
●
●
●
●●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
0 1 2 3 4 5
−1.
5−
1.0
−0.
50.
0
r = −0.83
Wirtschaftsstatistik 2 Herbert Nagel
Schwache Korrelation
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
0 1 2 3 4 5
−1
01
2
r = 0.403
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
0 1 2 3 4 5
−1.
5−
1.0
−0.
50.
00.
5
r = −0.603
Wirtschaftsstatistik 2 Herbert Nagel
Korrelation: falsch eingesetzt
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
● ●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
● ●
0 1 2 3 4 5
01
23
45
6
r = −0.0257
●
●● ●
●●
●
●●
● ●
●
●●
●
●
●●
●●
●
● ●
−1 0 1 2 3 4 5
01
23
45
r = 0.908
Wirtschaftsstatistik 2 Herbert Nagel
Test des Korrelationskoeffizienten
• H0 : ρ = 0 und H1 : ρ 6= 0
• Teststatistik T folgt einer t-Verteilung mit n− 2 Freiheitsgraden.
T = r
√n− 2√1− r2
• Kritischer Wert (zweiseitig) fur |T | ist Q(t)n−2(1− α/2).
• Einseitige Tests H1 : ρ > 0 bzw. H1 : ρ < 0 mit ±Q(t)n−2(1− α).
Wirtschaftsstatistik 2 Herbert Nagel
Alkohol- und Tabakkonsum: Test des Korrelationskoeffizienten
• H0 : ρ = 0 gegen H1 : ρ 6= 0 bei α = 0.05
• n = 10 und r = 0.784
T = 0.784
√10− 2√
1− 0.7842= 3.572
• Q(t)10−2(1− 0.05/2) = Q
(t)8 (0.975) = 2.306
• H0 wird verworfen, ρ ist signifikant positiv.
Wirtschaftsstatistik 2 Herbert Nagel
Alkohol- und Tabakkonsum: Berechnung und Test in SPSS (ohne Nordirland)
tobaccoalcohol
Korrelation nach Pearson
Signifikanz (2-seitig)
N
Korrelation nach Pearson
Signifikanz (2-seitig)
N
alcohol
tobacco
1010
,007
1,784**
1010
,007
,784**
1
Korrelationen
**. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant.
In der Standardeinstellung werden mit sog. Signifikanzsternen signifikante Ergebnisse mar-kiert.
Wirtschaftsstatistik 2 Herbert Nagel
Alkohol- und Tabakkonsum: Achtung auf Ausreißer (mit Nordirland)
tobaccoalcohol
Korrelation nach Pearson
Signifikanz (2-seitig)
N
Korrelation nach Pearson
Signifikanz (2-seitig)
N
alcohol
tobacco
1111
,509
1,224
1111
,509
,2241
Korrelationen
Der Korrelationskoeffizient ist nicht robust gegenuber Ausreißern.Sie konnen Ergebnisse in jede Richtung beeinflussen.
Wirtschaftsstatistik 2 Herbert Nagel
Bankfilialen und Minderheitenanteil
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
10 20 30 40
1.5
2.0
2.5
3.0
3.5
Banken in Counties von New Jersey
Minderheitenanteil
Ein
woh
nerje
Ban
kfili
ale
Wirtschaftsstatistik 2 Herbert Nagel
Bankfilialen und Minderheitenanteil: Korrelationsberechnung in R
Pearson's product-moment correlation
data: Minderheitenanteil and EinwohnerjeBankfiliale
t = 4.6686, df = 19, p-value = 0.0001674
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.4372051 0.8837648
sample estimates:
cor
0.7309378
Wirtschaftsstatistik 2 Herbert Nagel
Selbstmorde mit Schusswaffen
●
●
●
●
●
●
●
●
●
800 1000 1200 1400 1600 1800 2000
2.0
2.5
3.0
3.5
4.0
4.5
Selbstmorde mit Schusswaffen 1990−2000
Waffenlizenzen
SM
_sch
ussw
affe
n
B
K
N
O
S
St
T
V
W
Wirtschaftsstatistik 2 Herbert Nagel
Selbstmorde mit Schusswaffen: Rangkorrelation nach Spearman
Spearman's rank correlation rho
data: Waffenlizenzen and SM_schusswaffen
S = 4, p-value = 8.267e-05
alternative hypothesis: true rho is greater than 0
sample estimates:
rho
0.9666667
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: Streudiagramm
Meilen
5000040000300002000010000
Pre
is
6000
5800
5600
5400
5200
5000
4800
Wirtschaftsstatistik 2 Herbert Nagel
Kleinstquadrat-Prinzip: Ausgangsdaten
●
●
●
●
●
0 2 4 6 8 10 12
68
1012
1416
18
Ausgangsdaten
Wirtschaftsstatistik 2 Herbert Nagel
Kleinstquadrat-Prinzip: Einfachversuch
●
●
●
●
●
0 2 4 6 8 10 12
68
1012
1416
18
RSS = 22.80
y=11.8
Wirtschaftsstatistik 2 Herbert Nagel
Kleinstquadrat-Prinzip: Besserer Versuch
●
●
●
●
●
0 2 4 6 8 10 12
68
1012
1416
18
RSS = 8.30
Wirtschaftsstatistik 2 Herbert Nagel
Kleinstquadrat-Prinzip: Beste Gerade
●
●
●
●
●
0 2 4 6 8 10 12
68
1012
1416
18
RSS = 4.90
y=6.307+0.886x
Wirtschaftsstatistik 2 Herbert Nagel
Regression: Matrixschreibweise
Gegeben sind: x′ = (x1, x2, . . . , xn) y′ = (y1, y2, . . . , yn)
y = β0 + β1 · x+ ε =
1 x11 x2...1 xn
·(β0β1
)+ ε = X · β + ε
β =(X ′X
)−1X ′y
Der Rechenaufwand ist unvertretbar hoch.Wir entnehmen Ergebnisse SPSS- oder R-Output!
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: SPSS - Regressionsoutput (Teil 1)
Standardfehler des Schätzer
sKorrigiertes R-
QuadratR-QuadratR
1 151,569,647,650,806a
ModellModell
Modellzusammenfassung
a. Einflußvariablen : (Konstante), Meilen
Sig.FMittel der Quadratedf
Quadratsumme
Regression
Nicht standardisierte Residuen
Gesamt
1
996434890,190
22973,086982251362,469
,000a
182,1064183527,72114183527,721
ModellModell
ANOVAb
a. Einflußvariablen : (Konstante), Meilenb. Abhängige Variable: Preis
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: SPSS - Regressionsoutput (Teil 2)
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
Meilen
1
,000-13,495-,806,002-,031
,00077,30784,5126533,383
ModellModell
Koeffizientena
a. Abhängige Variable: Preis
Wichtigster Ausgabeblock in der einfachen linearen Regression.
Enthalt die Regressionskoeffizienten und die Angaben fur den t-Test von β1 (incl. p-Wert).
Preis = 6533.383− 0.031 ·Meilen
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: Streudiagramm mit Regressionsgeraden
Meilen
5000040000300002000010000
Pre
is
6000
5800
5600
5400
5200
5000
4800
R2 Linear = 0,650
Wirtschaftsstatistik 2 Herbert Nagel
Inferenz uber β1
• Test fur β1 (BFK (7.10)): H1 : β1 6= 0
T =b1sb1
wobei s2b1
=s2e∑
(xi − x)2und s2
e =1
n− 2
∑e2i
Entscheidung fur H1, wenn |T | > Q(t)n−2(1− α/2).
• Konfidenzintervall fur β1 (BFK (7.13)):
b1 ±Q(t)n−2(1− α/2) · sb1
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: Inferenz uber β1
• n = 100 β1 = b1 = −0.031 sb1 = 0.002
• Test:
T =−0.031
0.002= −15.5
Q(t)100−2(0.975) = Q
(t)98(0.975) = 1.984
Also Entscheidung fur H1. β1 ist signifikant von 0 verschieden.
• KI: −0.031± 1.984 · 0.002 = (−0.035,−0.027)
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagen: Prognose
• Punktprognosen: Einsetzen in die Regressionsgleichung fur bestimmte Werte der
erklarenden Variablen bzw. Punkt auf der Geraden ablesen.
z.B: Preiserwartung fur einen Wagen mit 30000 Meilen:
Preis = 6533.383− 0.031 · 30000 = 5603.38
• Prognoseintervalle: Zur Punktprognose sollen Schwankungsbreiten bestimmt wer-
den.
Sowohl fur individuelle Prognosen (BFK (7.15))
als auch fur Mittelwert-Prognosen (BFK (7.16)) sind rechenaufwandig.
Wirtschaftsstatistik 2 Herbert Nagel
Buromieten: Streudiagramm
Leer
2520151050
Mie
te
16,00
14,00
12,00
10,00
8,00
6,00
Wirtschaftsstatistik 2 Herbert Nagel
Buromieten: Regressionskoeffizienten
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
Leer
1
,000-4,196-,621,053-,223
,00018,468,69912,916
ModellModell
Koeffizientena
a. Abhängige Variable: Miete
Damit kommt man zu einer Mietprognose fur eine Stadt mit 10% Leerstand:
Miete = 12.916− 0.223 · 10 = 10.686
Wirtschaftsstatistik 2 Herbert Nagel
Rohol- und Benzinpreise: Streudiagramm
●
●
●●
●
●
●
●
●
●●
●
●●
●
●
●●
●
●
●
●
10 15 20 25 30 35
6080
100
120
Benzinpreise 1975 − 1996
Rohöl (Dollar pro Gallone)
Ben
zin
(Cen
ts p
ro B
arre
l)
Wirtschaftsstatistik 2 Herbert Nagel
Rohol- und Benzinpreise: R - Output
Call: lm(formula = Benzin ~ Rohoel)
Residuals:
Min 1Q Median 3Q Max
-14.278 -4.770 -3.224 3.633 17.850
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 30.1038 5.4629 5.511 2.15e-05
Rohoel 3.0201 0.2659 11.358 3.57e-10
---
Residual standard error: 8.966 on 20 degrees of freedom
Multiple R-squared: 0.8658, Adjusted R-squared: 0.8591
F-statistic: 129 on 1 and 20 DF, p-value: 3.571e-10
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 8
Vorbereitung
1210864
Pu
nkt
e
100
90
80
70
60
50
40
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 8
Standardfehler des Schätzer
sKorrigiertes R-
QuadratR-QuadratR
1 16,650,347,510,714a
ModellModell
Modellzusammenfassung
a. Einflußvariablen : (Konstante), Vorbereitung
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
Vorbereitung
1
,1751,769,7142,7304,828
,1821,72922,04338,108
ModellModell
Koeffizientena
a. Abhängige Variable: Punkte
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 9
Standardfehler des Schätzer
sKorrigiertes R-
QuadratR-QuadratR
1 6,838,623,650,806a
ModellModell
Modellzusammenfassung
a. Einflußvariablen : (Konstante), d
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
d
1
,0004,916,806,099,486
,0014,3533,75116,329
ModellModell
Koeffizientena
a. Abhängige Variable: ertrag
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 10
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
gr2
1
,0016,692,939,136,909
,0007,77311,73891,243
ModellModell
Koeffizientena
a. Abhängige Variable: gralt
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 12
Groesse
195190185180175170165
Gew
ich
t
95
90
85
80
75
70
65
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 12
Standardfehler des
SchätzersKorrigiertes R-
QuadratR-QuadratR
1 6,075,309,408,639a
ModellModell
Modellzusammenfassung
a. Einflußvariablen : (Konstante), Groesse
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
Groesse
1
,0882,032,639,227,462
,943-,07540,615-3,050
ModellModell
Koeffizientena
a. Abhängige Variable: Gewicht
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 14
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
qualkon
1
,00016,263,993,1893,067
,376,9951,1391,133
ModellModell
Koeffizientena
a. Abhängige Variable: umsatz
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 16
flaeche
12010080604020
pre
is
4400
3400
2400
1400
400
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 16
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
flaeche
1
,0233,578,87310,59337,898
,344-1,071810,748-868,297
ModellModell
Koeffizientena
a. Abhängige Variable: preis
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: Streudiagramm Preis – Service
Service
543210
Pre
is
6000
5800
5600
5400
5200
5000
4800
Wirtschaftsstatistik 2 Herbert Nagel
Einfachregression: Prinzip des F - Tests
●
●
●
●
●
0 2 4 6 8 10 12
68
1012
1416
18
RSS = 22.80
y=11.8
RSS0 = 22.80
●
●
●
●
●
0 2 4 6 8 10 12
68
1012
1416
18
RSS = 4.90
y=6.307+0.886x
RSS1 = 4.90
Wirtschaftsstatistik 2 Herbert Nagel
Prinzip des F - Tests
Ein einfaches Modell M0 wird wird mit einem komplexeren Modell M1 verglichen.
Zu beiden Modellen werden Residuenquadratsummen (RSS0 bzw. RSS1) berechnet.
Diese geben an, wie gut das jeweilige Modell zu den Daten passt.
So gut wie immer gilt: RSS0 > RSS1 (nur in Sonderfallen gilt =).
Ist der Unterschied in den Quadratsummen nur gering, ist das Modell M1 nur etwas besser
als M0, man wird das einfachere Modell M0 zur Beschreibung der Daten wahlen. Ist der
Unterschied groß, ist M1 wesentlich besser als M0.
Zur Beurteilung, ob die Unterschiede groß (signifikant) sind, werden F-Tests eingesetzt.
Wirtschaftsstatistik 2 Herbert Nagel
Regression: Matrixschreibweise
Gegeben sind Vektoren der Lange n: y und x1, x2, . . . , xky1y2...yn
= y = β0 + β1 · x1 + . . .+ βk · xk + ε
=
1 x11
x21. . . xk1
1 x12x22
. . . xk2... ... ... ... ...1 x1n x2n . . . xkn
·β0β1...βk
+ ε
= X · β + ε
Wirtschaftsstatistik 2 Herbert Nagel
Regression: Parameterschatzung in Matrixschreibweise
β =(X ′X
)−1X ′y
Der Rechenaufwand ist unvertretbar hoch, speziell das Invertieren von X ′X.
Wir entnehmen Ergebnisse SPSS- oder R-Output!
Wirtschaftsstatistik 2 Herbert Nagel
Bestimmtheitsmaß und F-Test
• Modelle:
M0 : y = β0 + ε mit RSS0 = SQT
M1 : y = β0 + β1 · x1 + . . .+ βk · xk + ε mit RSS1 = SQR
• Bestimmtheitsmaß: (BFK (8.5))
R2 = 1−SQR
SQT
0 ≤ R2 ≤ 1
Wirtschaftsstatistik 2 Herbert Nagel
Bestimmtheitsmaß und F-Test
• Hypothesen:
H0 : β1 = β2 = . . . = βk = 0 (M0 gilt)
H1 : wenigstens ein βi 6= 0 (M1 gilt)
• F-Test: (BFK (8.6))
f =(n− k − 1) ·R2
k · (1−R2)
Entscheidung fur H1, falls f > Q(F )k,n−k−1(1− α)
Einfachere Berechnung von f uber Quadratsummen moglich.
Wirtschaftsstatistik 2 Herbert Nagel
Einfachregression: ANOVA – Tableau
n = 5 k = 1
SQ df MS F
SQE 17.90 1 17.90 10.98
SQR 4.90 3 1.63
SQT 22.80 4
R2 = 17.90/22.80 = 0.785
Q(F )1,3 (0.95) = 10.13
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: SPSS - Regressionsoutput (Teil 1)
Standardfehler des Schätzer
sKorrigiertes R-
QuadratR-QuadratR
1 41,479,974,974,987a
ModellModell
Modellzusammenfassung
a. Einflußvariablen : (Konstante), Service, Meilen
Sig.FMittel der QuadratedfQuadratsumme
Regression
Nicht standardisierte Residuen
Gesamt
1
996434890,190
1720,53197166891,524
,000a
1821,5303133999,33326267998,666
ModellModell
ANOVAb
a. Einflußvariablen : (Konstante), Service, Meilenb. Abhängige Variable: Preis
Wirtschaftsstatistik 2 Herbert Nagel
Inferenz uber einzelne βi
Im Prinzip wie bei der Einfachregression, nur ein leicht modifiziertes t-Quantil kommt zumEinsatz
• t-Test fur βi (BFK (8.8)): H1 : βi 6= 0
T =bisbi
Entscheidung fur H1, wenn |T | > Q(t)n−k−1(1− α/2).
• Konfidenzintervall fur βi (BFK (8.9)):
bi ±Q(t)n−k−1(1− α/2) · sbi
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: SPSS - Regressionsoutput (Teil 2)
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
Meilen
Service
1
,00034,807,5693,903135,837
,000-49,788-,814,001-,031
,000248,58124,9666206,128
ModellModell
Koeffizientena
a. Abhängige Variable: Preis
Enthalt die Regressionskoeffizienten und Angaben zu den t-Tests fur die βiPreis = 6206.128− 0.031 ·Meilen+ 135.837 · Service
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: Inferenz uber βService
• t-Test fur Service
T =135.837
3.907= 34.8
Vergleich (zweiseitig) mit Q(t)97(0.975) = 1.984.
Bequemer mit p-Wert (nur zweiseitig angegeben!)
• KI fur Service
135.837± 1.984 · 3.903 = 135.837± 7.744 = (128.093; 143.581)
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: Modellcheck: Normalverteilung der Residuen
Beobachteter Wert
100500-50-100
Erw
arte
ter
Wer
t vo
n N
orm
al
100
50
0
-50
-100
Q-Q-Diagramm von Normal von Unstandardized Residual
Die Residuen sollen normal-
verteilt sein.
Uberprufung via Q-Q-Plot,
die beobachteten Quantile
werden mit den (unter der
NV) erwarteten Quantilen
verglichen.
Das Idealbild sind Punkte auf
einer 45-Grad-Geraden.
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: Modellcheck: Prognosewerte – Residuen
Unstandardized Predicted Value
6000580056005400520050004800
Un
stan
dar
diz
ed R
esid
ual
100
75
50
25
0
-25
-50
-75
-100
Es soll kein Zusammenhang zwischen
den prognostizierten Werten und den
Residuen erkennbar sein.
Das Wunschbild ist ein vollig wirres
Streudiagramm ohne erkennbare Mu-
ster.
Achtung: bei kleinen Datensatzen
werden leicht Muster erkannt, wo ei-
gentlich keine sind.
Wirtschaftsstatistik 2 Herbert Nagel
Diagnoseplots: Ausreißer
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
−4 −2 0 2 4
−6
−4
−2
02
46
x
y
●
●
●
●
●
●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●
●
●
●
●
−6 −4 −2 0 2 4
−2
−1
01
2
Residuen
erw
arte
te Q
uant
ile
●
●
●
●
●
●
●
●
● ●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●●
●●
●
●
●
−4 −2 0 2 4
−6
−4
−2
02
4
Prognose
Res
idue
n
Wirtschaftsstatistik 2 Herbert Nagel
Diagnoseplots: Nichtlinearer Zusammenhang
●●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
−4 −2 0 2 4
−50
050
x
y
●
●
●
●
●
●●●●
●●●●●
●●
●●●●●●
●●●●●●●●●●●
●●●●●●●●●●●● ●●
●●●●●●
●●●●
●●●●●
●●●●●●●●●●●●
●●●●●
●●●●
●●
●●●●●●
●●●●
●
●
●
●
●
−30 −20 −10 0 10 20 30
−20
−10
010
20
Residuen
erw
arte
te Q
uant
ile
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
−40 −20 0 20 40
−30
−20
−10
010
2030
Prognose
Res
idue
n
Wirtschaftsstatistik 2 Herbert Nagel
Diagnoseplots: Heterogene Varianzen
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
2 4 6 8 10
05
1015
x
y
●
●
●
●
●
●●
●●●●●●
●●●
●●●
●●●
●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●
●●●●●
●●●●
●
●
●
●
●
−10 −5 0 5
−5
05
Residuen
erw
arte
te Q
uant
ile●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
2 4 6 8 10
−10
−5
05
Prognose
Res
idue
n
Wirtschaftsstatistik 2 Herbert Nagel
Fastfoodlokal: Streudiagramme
Angestellte
403020100
Um
satz
200
150
100
50
0
CityNicht in City
Lage
Schüler
13108530
Um
satz
200
150
100
50
0
CityNicht in City
Lage
Wirtschaftsstatistik 2 Herbert Nagel
Fastfoodlokal: Koeffizienten (3 erklarende Var.)
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
Angestellte
Schüler
Lage
1
,0142,496,1936,32915,800
,491,691,0531,102,762
,0009,014,675,5294,765
,374,8946,9716,232
ModellModell
Koeffizientena
a. Abhängige Variable: Umsatz
Wirtschaftsstatistik 2 Herbert Nagel
Fastfoodlokal: Koeffizienten (2 erklarende Var.)
Sig.FMittel der Quadratedf
Quadratsumme
Regression
Nicht standardisierte Residuen
Gesamt
1
89134479,389
745,2498764836,635
,000a
46,72534821,377269642,754
ModellModell
ANOVAb
a. Einflußvariablen : (Konstante), Lage, Angestellteb. Abhängige Variable: Umsatz
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
Angestellte
Lage
1
,0072,758,2066,11816,873
,0009,063,676,5274,775
,1871,3286,2648,321
ModellModell
Koeffizientena
a. Abhängige Variable: Umsatz
Wirtschaftsstatistik 2 Herbert Nagel
Fastfoodlokal: Modell-Check
Beobachteter Wert
6040200-20-40-60
Erw
arte
ter
Wer
t vo
n N
orm
al
60
40
20
0
-20
-40
-60
Q-Q-Diagramm von Normal von Unstandardized Residual
Unstandardized Predicted Value
200150100500
Un
stan
dar
diz
ed R
esid
ual
80
60
40
20
0
-20
-40
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: R - Output
Teil 1: Aufruf und Zusammenfassung der Residuen
Call:
lm(formula = Preis ~ Meilen + Service + Garage)
Residuals:
Min 1Q Median 3Q Max
-97.343 -30.205 -1.084 26.777 97.323
Wirtschaftsstatistik 2 Herbert Nagel
Gebrauchtwagenpreise: R - Output
Teil 2: Koeffizienten und F-Test
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.187e+03 2.585e+01 239.379 <2e-16
Meilen -3.114e-02 6.359e-04 -48.966 <2e-16
Service 1.345e+02 3.867e+00 34.793 <2e-16
GarageIn Garage 1.901e+01 8.461e+00 2.247 0.027
Residual standard error: 40.64 on 96 degrees of freedom
Multiple R-squared: 0.9754, Adjusted R-squared: 0.9746
F-statistic: 1267 on 3 and 96 DF, p-value: < 2.2e-16
Wirtschaftsstatistik 2 Herbert Nagel
Sozialstaatsvolksbegehren
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●●
●
5000 10000 15000 20000 25000 30000 35000
2000
4000
6000
8000
1000
012
000
Sozialstaatsvolksbegehren 2002
SP − Stimmen Gemeinderat 2001
Unt
ersc
hrift
en V
olks
bege
hren
Wirtschaftsstatistik 2 Herbert Nagel
Sozialstaatsvolksbegehren Anteile
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●
●
30 35 40 45 50 55 60
1213
1415
1617
Sozialstaatsvolksbegehren 2002
SP − Anteil Gemeinderat 2001
Ant
eil U
nter
schr
iften
Vol
ksbe
gehr
en
Wirtschaftsstatistik 2 Herbert Nagel
Zeitreihen: TrendLinearer Trend
Zeit
zrlin
2002 2004 2006 2008 2010 2012
1.0
1.5
2.0
Exponentieller Trend
Zeit
zrex
p
2002 2004 2006 2008 2010 2012
010
2030
40
Wirtschaftsstatistik 2 Herbert Nagel
Zeitreihen: Linearer TrendLinearer Trend
Zeit
zrlin
2002 2004 2006 2008 2010 2012
1.0
1.5
2.0
Wirtschaftsstatistik 2 Herbert Nagel
Zeitreihen: Exponentieller Trend
Logarithmierte Reihe − Linearer Trend
Zeit
lzre
2002 2004 2006 2008 2010 2012
01
23
Ursprungsreihe − Exponentieller Trend
Zeit
zrex
p
2002 2004 2006 2008 2010 2012
010
2030
40
Wirtschaftsstatistik 2 Herbert Nagel
Die Presse
Bericht am 7. Oktober 2000
Thema: Merger & Akquisition
Geschehen
X-Achse: Marktkapitalisierung
Y-Achse: M&A - Aktivitat
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 8 - 17
Standardfehler des Schätzer
sKorrigiertes R-
QuadratR-QuadratR
1 ,266,915,940,969a
ModellModell
Modellzusammenfassung
a. Einflußvariablen : (Konstante), note, semester
Sig.FMittel der Quadratedf
Quadratsumme
Regression
Nicht standardisierte Residuen
Gesamt
1
75,875
,0715,355
,001a
38,9142,76025,520
ModellModell
ANOVAb
a. Einflußvariablen : (Konstante), note, semesterb. Abhängige Variable: bewertung
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
semester
note
1
,0025,961,670,099,593
,0045,101,573,079,401
,0035,347,3351,791
ModellModell
Koeffizientena
a. Abhängige Variable: bewertung
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 8 - 23
Haltbarkeit
45403530252015
Zu
frie
den
20
15
10
5
0
Material
111000Z
ufr
ied
en
20
15
10
5
0
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 8 - 23
Standardfehler des Schätzer
sKorrigiertes R-
QuadratR-QuadratR
1 3,116,569,665,816
ModellModell
Modellzusammenfassung
Sig.FMittel der QuadratedfQuadratsumme
Regression
Nicht standardisierte Residuen
Gesamt
1
9202,900
9,708767,957
,0226,95067,4722134,943
ModellModell
ANOVA
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
Material
Haltbarkeit
1
,086-2,000-,472,142-,284
,0083,666,8642,1247,788
,0034,4033,41615,038
ModellModell
Koeffizienten
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 8 - 25
Standardfehler des Schätzer
sKorrigiertes R-
QuadratR-QuadratR
1 ,2751,0001,0001,000
ModellModell
Modellzusammenfassung
Sig.FMittel der QuadratedfQuadratsumme
Regression
Nicht standardisierte Residuen
Gesamt
1
5724163,333
,0763,227
,0004786242,643362081,5532724163,106
ModellModell
ANOVA
StandardfehlerRegressionskoeff
izientB Beta Sig.T
Standardisierte KoeffizientenNicht standardisierte Koeffizienten
(Konstante)
x
xx
1
,0001741,1282,815,000,500
,000-1194,695-1,932,025-30,013
,0001515,328,429649,983
ModellModell
Koeffizienten
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 8 - 26
Sig.FMittel der QuadratedfQuadratsumme
Regression
Nicht standardisierte Residuen
Gesamt
1
52022,833
31,352394,057
,01030,760964,38821928,776
ModellModell
ANOVA
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
x
xx
1
,010-5,768-2,561,916-5,286
,0274,0461,7964,77419,314
,0057,6855,07539,000
ModellModell
Koeffizienten
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 8 - 30 i
yd
100806040200
res
40
30
20
10
0
-10
-20
-30
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 9 Revision
d
6040200
ertr
ag
50
40
30
20
10
0
Unstandardized Predicted Value
50,0000040,0000030,0000020,0000010,00000U
nst
and
ard
ized
Res
idu
al
10,00000
5,00000
,00000
-5,00000
-10,00000
-15,00000
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 9 Revision
Standardfehler des Schätzer
sKorrigiertes R-
QuadratR-QuadratR
1 1,696,977,980,990a
ModellModell
Modellzusammenfassung
a. Einflußvariablen : (Konstante), dd, d
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
d
dd
1
,000-14,119-2,509,001-,021
,00018,2823,248,1071,959
,089-1,8511,659-3,071
ModellModell
Koeffizientena
a. Abhängige Variable: ertrag
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 7 - 9 Revision
Unstandardized Predicted Value
50,0000040,0000030,0000020,0000010,00000,00000
Un
stan
dar
diz
ed R
esid
ual
2,00000
1,00000
,00000
-1,00000
-2,00000
-3,00000
Wirtschaftsstatistik 2 Herbert Nagel
Produkteinfuhrung: Parallele Boxplots
Marketing
PreisQualitätBequemlichkeit
Um
satz
900
800
700
600
500
400
40
36
Wirtschaftsstatistik 2 Herbert Nagel
Produkteinfuhrung: ANOVA – Voraussetzungen
• Normalverteilung
Histogramme, Boxplots, Tests
• Varianzhomogenitat
Boxplots, Maßzahlen, Tests
Signifikanzdf2df1Levene-Statistik
,803572,220
Test der Homogenität der Varianzen
Umsatz
Wirtschaftsstatistik 2 Herbert Nagel
ANOVA – Prinzip: Keine Unterschiede
Gruppe 1 Gruppe 2 Alle
12
34
56
7
●
●
●
●
●
●
●
●
●
●
●
●
x∑
(xi − x)2
Gruppe 1 2 2Gruppe 2 2 2Zusammen 2 4
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
gr 1 0 0 0 1
Residuals 4 4 1
Wirtschaftsstatistik 2 Herbert Nagel
ANOVA – Prinzip: Unterschiede
Gruppe 1 Gruppe 2 Alle
12
34
56
7
●
●
● ●
●
●
●
●
●●
●
● x∑
(xi − x)2
Gruppe 1 2 2Gruppe 2 4 2Zusammen 3 10
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
gr 1 6 6 6 0.07
Residuals 4 4 1
Wirtschaftsstatistik 2 Herbert Nagel
ANOVA – Prinzip: Starke Unterschiede
Gruppe 1 Gruppe 2 Alle
12
34
56
7
●
●
●
●
●
●
●
●
●
●
●
●
x∑
(xi − x)2
Gruppe 1 2 2Gruppe 2 6 2Zusammen 4 28
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
gr 1 24 24 24 0.008
Residuals 4 4 1
Wirtschaftsstatistik 2 Herbert Nagel
Produkteinfuhrung: ANOVA
SignifikanzFMittel der Quadratedf
Quadratsumme
Zwischen den Gruppen
Innerhalb der Gruppen
Gesamt 59614756,983
9051,19957515918,350
,0075,46049419,317298838,633
ONEWAY ANOVA
Umsatz
Wirtschaftsstatistik 2 Herbert Nagel
Produkteinfuhrung: Post – Hoc
SignifikanzStandardfehle
rMittlere
Differenz (I-J)
Qualität
Preis
Bequemlichkeit
Preis
Bequemlichkeit
Qualität
Bequemlichkeit
Qualität
Preis
Qualität
Preis
Bequemlichkeit
Preis
Bequemlichkeit
Qualität
Bequemlichkeit
Qualität
Preis
LSD
Bonferroni
,25330,085-52,850
,38330,08546,500
,25330,08552,850
,00530,08599,350*
,38330,085-46,500
,00530,085-99,350*
,08430,085-52,850
,12830,08546,500
,08430,08552,850
,00230,08599,350*
,12830,085-46,500
,00230,085-99,350*
(I) Marketing (J) Marketing(I) Marketing (J) Marketing
Mehrfachvergleiche
Abhängige Variable:Umsatz
*. Die Differenz der Mittelwerte ist auf dem Niveau 0.05 signifikant.
Wirtschaftsstatistik 2 Herbert Nagel
Produkteinfuhrung: ANOVA als Regression
Sig.FMittel der Quadratedf
Quadratsumme
Regression
Nicht standardisierte Residuen
Gesamt
1
59614756,983
9051,19957515918,350
,007a
5,46049419,317298838,633
ModellModell
ANOVAb
a. Einflußvariablen : (Konstante), dummy_qualitaet, dummy_preisb. Abhängige Variable: Umsatz
Standardfehler
RegressionskoeffizientB Beta Sig.T
Standardisierte Koeffiziente
nNicht standardisierte
Koeffizienten
(Konstante)
dummy_preis
dummy_qualitaet
1
,0023,302,46330,08599,350
,1281,546,21730,08546,500
,00026,59221,273565,700
ModellModell
Koeffizientena
a. Abhängige Variable: Umsatz
Wirtschaftsstatistik 2 Herbert Nagel
Alkohol – Gehalt: Boxplot
alkohol
oftab und zunie
geh
alt
80
70
60
50
40
30
20
Wirtschaftsstatistik 2 Herbert Nagel
Alkohol – Gehalt: ANOVA
SignifikanzFMittel der Quadratedf
Quadratsumme
Zwischen den Gruppen
Innerhalb der Gruppen
Gesamt 696078,571
86,148675771,893
,1771,780153,3392306,678
ONEWAY ANOVA
gehalt
Wirtschaftsstatistik 2 Herbert Nagel
Kaufman Assessment Battery for Children
3. 5. 7.
Mittelwerte 11.7500 12.7963 13.077
Standardabw 2.3837 2.4981 2.832
Df Sum Sq Mean Sq F value Pr(>F)
schulstufe 2 49 24.57 3.78 0.025
Residuals 146 948 6.49
Wirtschaftsstatistik 2 Herbert Nagel
Kaufman Assessment Battery for Children
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 11.750 0.341 34.51 <2e-16
schulstufe5. 1.046 0.486 2.15 0.033
schulstufe7. 1.327 0.531 2.50 0.014
Residual standard error: 2.55 on 146 degrees of freedom
Multiple R-squared: 0.0493, Adjusted R-squared: 0.0363
F-statistic: 3.78 on 2 and 146 DF, p-value: 0.025
Wirtschaftsstatistik 2 Herbert Nagel
Rechentechnik
Rechnen mit Einzeldaten ist muhsam, mit Kennzahlen der einzelnen Gruppen ist der Auf-wand vertretbar (Formeln in BFK: (9.4), (9.5), (9.6)).
Gruppe n x sI 17 37 8II 9 35 9III 26 42 8
N = 17 + 9 + 26 = 52x = (37 · 17 + 35 · 9 + 42 · 26)/52 = 39.154
SQA = 17 · (37− 39.154)2 + 9 · (35− 39.154)2 + 26 · (42− 39.154)2
= 444.95
SQR = (17− 1) · 82 + (9− 1) · 92 + (26− 1) · 82 = 3272
Wirtschaftsstatistik 2 Herbert Nagel
Rechentechnik
Somit kann das ANOVA – Tableau erstellt werden.
QS df MQS FSQA 444.95 2 222.48 3.33SQR 3272.00 49 66.77SQT 3716.95 51
Vergleichswert: Q(F )2,49(0.95) = 3.18
Das Ergebnis ist also signifikant. Die Mittelwerte in den drei Gruppen unterscheiden sich.
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 9 - 10
Signifikanzdf2df1Levene-Statistik
,440122,880
Test der Homogenität der Varianzen
Arbeitszeit
SignifikanzFMittel der Quadratedf
Quadratsumme
Zwischen den Gruppen
Innerhalb der Gruppen
Gesamt 1448,376
2,8481234,180
,1242,4927,098214,196
ONEWAY ANOVA
Arbeitszeit
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 9 - 13
Signifikanzdf2df1Levene-Statistik
,665122,423
Test der Homogenität der Varianzen
Tonerverbrauch
SignifikanzFMittel der Quadratedf
Quadratsumme
Zwischen den Gruppen
Innerhalb der Gruppen
Gesamt 1414,877
,432125,180
,00211,2324,84929,697
ONEWAY ANOVA
Tonerverbrauch
Wirtschaftsstatistik 2 Herbert Nagel
Produkteinfuhrung: Gruppierte Boxplots
Marketing
PreisQualitätBequemlichkeit
Um
satz
900
800
700
600
500
400
ZeitungTV
Medium
Wirtschaftsstatistik 2 Herbert Nagel
Produkteinfuhrung: Mittelwertplot
Marketing
PreisQualitätBequemlichkeit
Gru
pp
enm
itte
lwer
te690
660
630
600
570
Geschätztes Randmittel von Umsatz
ZeitungTV
Medium
Wirtschaftsstatistik 2 Herbert Nagel
Modelle: Nullmodell
Mittelwerte
A1 A2
B1 20.0 20.0
B2 20.1 20.1
1819
2021
2223
24
Modell Y~1
A
Gru
ppen
mitt
elw
erte
A1 A2
B
B2B1
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
A 1 0.00 0.00 0.00 1.00
B 1 0.04 0.04 0.02 0.88
A:B 1 0.00 0.00 0.00 1.00
Residuals 12 20.00 1.67
Wirtschaftsstatistik 2 Herbert Nagel
Modelle: Haupteffekt A
Mittelwerte
A1 A2
B1 20.0 30.0
B2 20.2 30.2
2022
2426
2830
Modell Y~A
A
Gru
ppen
mitt
elw
erte
A1 A2
B
B2B1
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
A 1 400 400 240.0 2.7e-09
B 1 0 0 0.1 0.76
A:B 1 0 0 0.0 1.00
Residuals 12 20 2
Wirtschaftsstatistik 2 Herbert Nagel
Modelle: Haupteffekt B
Mittelwerte
A1 A2
B1 20.0 20.0
B2 35.0 35.0
2025
3035
Modell Y~B
A
Gru
ppen
mitt
elw
erte
A1 A2
B
B2B1
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
A 1 0 0 0 1
B 1 900 900 540 2.4e-11
A:B 1 0 0 0 1
Residuals 12 20 2
Wirtschaftsstatistik 2 Herbert Nagel
Modelle: Additives Modell A + B
Mittelwerte
A1 A2
B1 20.0 30.0
B2 35.0 45.0
2025
3035
4045
Modell Y~A+B
A
Gru
ppen
mitt
elw
erte
A1 A2
B
B2B1
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
A 1 400 400 240 2.7e-09
B 1 900 900 540 2.4e-11
A:B 1 0 0 0 1
Residuals 12 20 2
Wirtschaftsstatistik 2 Herbert Nagel
Modelle: Wechselwirkungsmodell A * B
Mittelwerte
A1 A2
B1 20.0 30.0
B2 35.0 28.0
2025
3035
Modell Y~A*B
A
Gru
ppen
mitt
elw
erte
A1 A2
B
B1B2
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
A 1 9 9.0 5.4 0.039
B 1 169 169.0 101.4 3.3e-07
A:B 1 289 289.0 173.4 1.7e-08
Residuals 12 20 1.7
Wirtschaftsstatistik 2 Herbert Nagel
Produkteinfuhrung: ANOVA
Sig.FMittel der Quadratedf
Quadratsumme vom Typ III
Korrigiertes Modell
Konstanter Term
Marketing
Medium
Marketing * Medium
Fehler
Gesamt
Korrigierte Gesamtvariation
59614756,983
6023257855,000
9280,30954501136,700
,917,087804,81721609,633
,2391,41913172,017113172,017
,0085,32549419,317298838,633
,0002439,90822643098,017122643098,017
,0452,44922724,0575113620,283a
QuelleQuelle
Tests der Zwischensubjekteffekte
Abhängige Variable:Umsatz
a. R-Quadrat = ,185 (korrigiertes R-Quadrat = ,109)
Wirtschaftsstatistik 2 Herbert Nagel
Lehrveranstaltungsbeurteilung: Boxplots
Stud
FrauMann
Pu
nkt
e
10
8
6
4
2
0
Prof
FrauMann
Pu
nkt
e
10
8
6
4
2
0
Wirtschaftsstatistik 2 Herbert Nagel
Lehrveranstaltungsbeurteilung: ANOVA
Sig.FMittel der Quadratedf
Quadratsumme vom Typ III
Korrigiertes Modell
Konstanter Term
Prof
Stud
Prof * Stud
Fehler
Gesamt
Korrigierte Gesamtvariation
99198,040
1003632,000
1,76496169,360
,00015,32727,040127,040
,453,5671,00011,000
,548,363,6401,640
,0001946,5053433,96013433,960
,0025,4199,560328,680a
QuelleQuelle
Tests der Zwischensubjekteffekte
Abhängige Variable:Punkte
a. R-Quadrat = ,145 (korrigiertes R-Quadrat = ,118)
Wirtschaftsstatistik 2 Herbert Nagel
Lehrveranstaltungsbeurteilung: Profilplot
Stud
FrauMann
Ges
chät
zte
Ran
dm
itte
l6,25
6,00
5,75
5,50
5,25
5,00
Geschätztes Randmittel von Punkte
FrauMann
Prof
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 9 - 16 Wechselwirkungsmodell
Sig.FMittel der Quadratedf
Quadratsumme vom Typ III
Korrigiertes Modell
Konstanter Term
Flaeche
Mittel
Flaeche * Mittel
Fehler
Gesamt
Korrigierte Gesamtvariation
111612,000
12226840,000
.0,000
..40,5836243,500
..365,2502730,500
..212,6673638,000
..225228,0001225228,000
..146,545111612,000a
QuelleQuelle
Tests der Zwischensubjekteffekte
Abhängige Variable:Ertrag
a. R-Quadrat = 1,000 (korrigiertes R-Quadrat = .)
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 9 - 16 Additives Modell
Sig.FMittel der Quadratedf
Quadratsumme vom Typ III
Korrigiertes Modell
Konstanter Term
Flaeche
Mittel
Fehler
Gesamt
Korrigierte Gesamtvariation
111612,000
12226840,000
40,5836243,500
,0169,000365,2502730,500
,0415,240212,6673638,000
,0005549,766225228,0001225228,000
,0196,744273,70051368,500a
QuelleQuelle
Tests der Zwischensubjekteffekte
Abhängige Variable:Ertrag
a. R-Quadrat = ,849 (korrigiertes R-Quadrat = ,723)
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 9 - 17
Mittel
A3A2A1
Beh
and
lun
gse
rfo
lg
20
15
10
5
0
B2B1
Krankheit
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 9 - 17
Sig.FMittel der Quadratedf
Quadratsumme vom Typ III
Korrigiertes Modell
Konstanter Term
Krankheit
Mittel
Krankheit * Mittel
Fehler
Gesamt
Korrigierte Gesamtvariation
17395,778
181580,000
6,8331282,000
,1881,92713,167226,333
,0713,32522,722245,444
,00035,415242,0001242,000
,000173,3011184,22211184,222
,0019,18462,7565313,778a
QuelleQuelle
Tests der Zwischensubjekteffekte
Abhängige Variable:Behandlungserfolg
a. R-Quadrat = ,793 (korrigiertes R-Quadrat = ,706)
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 9 - 17
Mittel
A3A2A1
Ges
chät
zte
Ran
dm
itte
l15,0
12,5
10,0
7,5
5,0
Geschätztes Randmittel von Behandlungserfolg
B2B1
Krankheit
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 9 - 18
Sig.FMittel der Quadratedf
Quadratsumme vom Typ III
Korrigiertes Modell
Konstanter Term
marke
wo
marke * wo
Fehler
Gesamt
Korrigierte Gesamtvariation
1116,662
12760,850
,23461,405
,731,331,0772,155
,00134,8798,16818,168
,00514,8083,46726,935
,0003178,025744,1871744,187
,00413,0313,051515,257a
QuelleQuelle
Tests der Zwischensubjekteffekte
Abhängige Variable:spritv
a. R-Quadrat = ,916 (korrigiertes R-Quadrat = ,845)
Wirtschaftsstatistik 2 Herbert Nagel
Beispiel 9 - 18
marke
CBA
Ges
chät
zte
Ran
dm
itte
l
9,0
8,0
7,0
6,0
Geschätztes Randmittel von spritv
UeberlandStadt
wo
Wirtschaftsstatistik 2 Herbert Nagel
Tourismus
In einem Tourismusort wird unter anderem erhoben, woher die Gaste kommen. Fur Gaste
aus dem Inland soll eine Untergliederung in die einzelnen Bundeslander, fur Gaste aus
dem Ausland eine spezielle Aufteilung in die beiden wichtigsten Hauptherkunftslander und
restliche Lander erfolgen. Es liegen Daten von 60465 Gasten vor.
Betrieb Ankunft Abfahrt Nachte Land.. .. .. .. ..Hotel Adler 050707 050714 7 DPension Berger 050707 050721 14 A-W.. .. .. .. ..
Wirtschaftsstatistik 2 Herbert Nagel
Tourismus: Numerische Beschreibung
Angabe
Land absolut relativ Prozent
A-Rest 16987 0.281 28.1
A-Wien 7413 0.123 12.3
Deutschland 21910 0.362 36.2
Italien 3812 0.063 6.3
Rest EU 6265 0.104 10.4
Sonstige 4078 0.067 6.7
Wirtschaftsstatistik 2 Herbert Nagel
Messbesuch: Kumulative Haufigkeiten
Eine Befragung unter 120 Katholiken uber den Besuch der Sonntagsmesse ergab folgende
Tabelle:
Messbesuch absolut Prozent kumuliertjede Woche 18 15.00 15.00gelegentlich 37 30.83 45.83nur bei besonderem Anlass 46 38.33 84.17nie 19 15.83 100.00
120 100.00
Wirtschaftsstatistik 2 Herbert Nagel
Tourismus: Grafische Beschreibung
A−
Res
t
A−
Wie
n
Deu
tsch
l.
Italie
n
Res
t EU
Son
stig
e
Herkunftsland des Gastes
050
0010
000
1500
020
000
A−RestA−Wien
Deutschland
Italien
Rest EU
Sonstige
Herkunftsland des Gastes (n=60465)
Wirtschaftsstatistik 2 Herbert Nagel
Arbeitsaufteilung
A B C D E F
Dienstverteilung
abso
lute
Häu
figke
iten
02
46
810
1214
Wirtschaftsstatistik 2 Herbert Nagel
χ2 – Anpassungstest
1. H0 : Die Haufigkeiten der J Kategorien entsprechen einer vorgegebenen Verteilung.H1 : Zumindest eine Kategorie unterscheidet sich in ihrer Haufigkeit von der Vorgabe.
2. Kritischer Wert: Q(χ2)J−1(1− α)
3. Berechnen der beobachteten und erwarteten Haufigkeiten
4. T =∑Jj=1
(oj−ej)2
ej
5. Ist T großer als der kritische Wert, wird H0 verworfen, sonst beibehalten.
Wirtschaftsstatistik 2 Herbert Nagel
Arbeitsaufteilung: Anpassungstest mit SPSS (Modellansicht)
EntscheidungSig.TestNullhypothese
1 Nullhypothese behalten.,613Chi-Quadrat-Test
einer Stichprobe
Die Kategorien von Arzt treten mit gleichen Wahrscheinlichkeiten auf.
Übersicht über Hypothesentest
Asymptotische Signifikanzen werden angezeigt. Das Signifikanzniveau ist ,05.
Wirtschaftsstatistik 2 Herbert Nagel
Arbeitsaufteilung
Anpassungstest
mit SPSS
(Zusatzansicht)
Chi-Quadrat-Test einer Stichprobe
ArztFEDCBA
Häu
fig
keit
14
13
12
11
10
9
8
7
HypotheseBeobachtet
Häufigkeit
Gesamtanzahl
Teststatistik
Freiheitsgrade
Asymptotische Sig. (zweiseitiger Test) ,613
5
3,571
63
1. Es sind 0 Zellen (0%) mit erwarteten Werten kleiner als 5 vorhanden. Der kleinste erwartete Wert ist 10,500.
Wirtschaftsstatistik 2 Herbert Nagel
Reprasentativitat einer Meinungsumfrage
Kategorie absolut Prozent Osterreich erwartetEhepaar mit Kindern 103 51.5 44.5 89.0Ehepaar ohne Kinder 47 23.5 29.4 58.8Nicht eheliche Lebensgemeinschaft mit K. 26 13.0 4.5 9.0Nicht eheliche Lebensgemeinschaft ohne K. 5 2.5 5.6 11.2Alleinerzieher 19 9.5 16.0 32.0
Chi-squared test for given probabilities
data: famt
X-squared = 45.4, df = 4, p-value = 3.291e-09
Wirtschaftsstatistik 2 Herbert Nagel
Uberfalle auf Trafiken
λ = (0 · 6 + 1 · 10 + 2 · 13 + 3 · 14 + 4 · 4 + 5 · 5 + 6 · 1) /53 = 2.358
Anzahl (j) 0 1 2 3 4 5+Haufigkeit (oj) 6 10 13 14 4 6pj 0.0946 0.2230 0.2630 0.2068 0.1219 0.0907erwartet (ej) 5.0118 11.8204 13.9391 10.9584 6.4613 4.8090
T =(6− 5.0118)2
5.0118+
(10− 11.8204)2
11.8204+ · · · = 2.615
df = 6− 1− 1 = 4 Q(χ2)4 (0.95) = 9.49
Wirtschaftsstatistik 2 Herbert Nagel
Sonntagsfrage
Partei absolut ProzentAP 185 37.0BP 162 32.4CP 106 21.2DP 47 9.4
500 100.0
H0 : pA = 0.35
H1 : pA 6= 0.35
Kategorie absolut(oj) Prozent unter H0 erwartete H (ej)AP 185 35.0 500 · 0.35 = 175
Rest 315 65.0 500 · 0.65 = 325
Wirtschaftsstatistik 2 Herbert Nagel
Sonntagsfrage
Anteilstest mit SPSS
(Zusatzansicht)
H0 : pA = 0.35
H1 : pA 6= 0.35
Chi-Quadrat-Test einer Stichprobe
ParteiRestAP
Häu
fig
keit
350
300
250
200
150
HypotheseBeobachtet
Häufigkeit
Gesamtanzahl
Teststatistik
Freiheitsgrade
Asymptotische Sig. (zweiseitiger Test) ,348
1
,879
500
1. Es sind 0 Zellen (0%) mit erwarteten Werten kleiner als 5 vorhanden. Der kleinste erwartete Wert ist 175.
Wirtschaftsstatistik 2 Herbert Nagel
Sonntagsfrage: Exakter Anteilstest mit SPSS
H0 : pD = 0.05
H1 : pD > 0.05
Test auf Binomialverteilung
Kategorie N Testanteil
Partei Gruppe 1
Gruppe 2
Gesamt
DP 47 ,094 ,05 ,000
Rest 453 ,906
500 1,000
Wirtschaftsstatistik 2 Herbert Nagel
Sonntagsfrage: Exakter Binomial-Test in R
Exact binomial test
data: 47 and 500
number of successes = 47, number of trials = 500, p-value = 3.308e-05
alternative hypothesis: true probability of success is greater than 0.05
95 percent confidence interval:
0.0734 1.0000
sample estimates:
probability of success
0.094
Wirtschaftsstatistik 2 Herbert Nagel
Sonntagsfrage: Konfidenzintervalle fur Anteile aller Parteien
Partei Anteil c Untergrenze ObergrenzeAP 0.370 0.0423 0.3277 0.4123BP 0.324 0.0410 0.2830 0.3650CP 0.212 0.0358 0.1862 0.2478DP 0.094 0.0256 0.0684 0.1196
Wirtschaftsstatistik 2 Herbert Nagel
Sonntagsfrage: Kreuztabelle
Auswertung der Sonntagsfrage nach Parteipraferenz und Geschlecht der Befragten ergibt
eine zweidimensionale Tabelle (Matrix).
Eigentliche Kreuztabelle
Partei Frau MannAP 104 81BP 77 85CP 56 50DP 18 29
Kreuztabelle mit Randhaufigkeiten
Partei Frau Mann SummeAP 104 81 185BP 77 85 162CP 56 50 106DP 18 29 47
Summe 255 245 500
Wirtschaftsstatistik 2 Herbert Nagel
Sonntagsfrage: Relative Haufigkeiten
Gesamtprozent
Geschlecht
Partei Frau Mann
AP 20.8 16.2
BP 15.4 17.0
CP 11.2 10.0
DP 3.6 5.8
Zeilenprozent
Geschlecht
Partei Frau Mann
AP 56.2 43.8
BP 47.5 52.5
CP 52.8 47.2
DP 38.3 61.7
Spaltenprozent
Geschlecht
Partei Frau Mann
AP 40.8 33.1
BP 30.2 34.7
CP 22.0 20.4
DP 7.1 11.8
Achtung: Interpretation
Wirtschaftsstatistik 2 Herbert Nagel
Sonntagsfrage: Balkendiagramme mit absoluten Haufigkeiten
Frau Mann
APBPCPDP
Gruppiertes Balkendiagramm
abso
lute
Häu
figke
iten
020
4060
8010
0
Frau Mann
DPCPBPAP
Gestapeltes Balkendiagramm
abso
lute
Häu
figke
iten
050
100
150
200
250
Wirtschaftsstatistik 2 Herbert Nagel
Sonntagsfrage: Balkendiagramme mit relativen Haufigkeiten
AP BP CP DP
MannFrau
Gestapeltes Balkendiagramm
Zei
lenp
roze
nt0
2040
6080
100
Frau Mann
DPCPBPAP
Gestapeltes Balkendiagramm
Spa
ltenp
roze
nt0
2040
6080
100
Wirtschaftsstatistik 2 Herbert Nagel
Verwaltungsgerichtshof: Entscheidungen 2000 – 2004
Nur Entscheidungen in Abgabensachen, hier nur Berufungen nach Betriebsprufungen.
Vertretung
Entscheidung RA WP Sum
Abweisung 203 43 246
Aufhebung 89 39 128
teilweise Aufhebung 12 4 16
Sum 304 86 390
Unterscheiden sich die Haufigkeiten fur die Entscheidungen zwischen RA und WP?
Wirtschaftsstatistik 2 Herbert Nagel
Verwaltungsgerichtshof
RA WP
teilweise AufhebungAufhebungAbweisung
VwGH−Entscheidungen
abso
lute
Häu
figke
iten
050
100
150
200
250
300
RA WP
teilweise AufhebungAufhebungAbweisung
VwGH−Entscheidungen
Spa
ltenp
roze
nt0.
00.
20.
40.
60.
81.
0
Wirtschaftsstatistik 2 Herbert Nagel
Erwartete Haufigkeiten
Unter der Annahme gleicher (relativer) Haufigkeitsverteilungen konnen Erwartungswerte
fur die einzelnen Zellen berechnet werden.
Randverteilungen bleiben erhalten!
b1 b2a1 . . 150a2 . . 60a3 . . 90
200 100 300
b1 b2a1 . . o1+a2 . . o2+a3 . . o3+
o+1 o+2 n
eij =oi+ · o+j
n
Wirtschaftsstatistik 2 Herbert Nagel
χ2 – Homogenitatstest
1. H0 : Die Haufigkeitsverteilung einer Variablen ist in allen Gruppen gleich.H1 : Es gibt Unterschiede zwischen den Verteilungen.
2. Kritischer Wert: Q(χ2)df (1− α) df = (I − 1) · (J − 1)
3. Berechnen der beobachteten (oij) und erwarteten (eij) Haufigkeiten.
4. T =∑Ii=1
∑Jj=1
(oij−eij)2
eij
5. Ist T großer als der kritische Wert, wird H0 verworfen, sonst beibehalten.
Wirtschaftsstatistik 2 Herbert Nagel
Verwaltungsgerichtshof: Homogenitatstest
Vertretung
Entscheidung RA WP Sum
Abweisung 203 43 246
Aufhebung 89 39 128
teilweise Aufhebung 12 4 16
Sum 304 86 390
Vertretung
RA WP
191.8 54.2
99.8 28.2
12.5 3.5
T =(203− 191.8)2
191.8+ . . .+
(4− 3.5)2
3.5= 8.35
df = (3− 1) · (2− 1) = 2 ⇒ Q(χ2)2 (0.95) = 5.991
Entscheidung fur H1, die Entscheidungen unterscheiden sich nach der Vertretung der Be-
rufung.
Wirtschaftsstatistik 2 Herbert Nagel
Verwaltungsgerichtshof: Homogenitatstest in R
Pearson's Chi-squared test
data: vwgh
X-squared = 8.35, df = 2, p-value = 0.01539
Wo sind die Unterschiede?
Balkendiagramme, Prozentangaben
Vergleich von beobachteten und erwarteten Haufigkeiten, Residuen
Wirtschaftsstatistik 2 Herbert Nagel
Einstellung zu Technologien
In einer Umfrage wurde die Einstellung zu mehreren Technologien erhoben, darunter die
Nutzung der Atomkraft zur Energiegewinnung und die Nutzung der Gentechnik in der
Medizin.
Atomtechnik
Gentechnik negativ neutral positiv Sum
negativ 65 15 29 109
neutral 14 7 13 34
positiv 6 8 11 25
Sum 85 30 53 168
Forschungsfrage: Gibt es einen Zusammenhang zwischen diesen zwei Variablen?
Wirtschaftsstatistik 2 Herbert Nagel
Einstellung zu Technologien: Mosaikplot
Technologien
Gentechnik
Ato
mte
chni
k
negativ neutral positiv
nega
tivne
utra
lpo
sitiv
Wirtschaftsstatistik 2 Herbert Nagel
Einstellung zu Technologien: Unabhangigkeitstest
In einer Umfrage wurde die Einstellung zu mehreren Technologien erhoben, darunter dieNutzung der Atomkraft zur Energiegewinnung und die Nutzung der Gentechnik in derMedizin.
Pearson's Chi-squared test
data: tech
X-squared = 12.4, df = 4, p-value = 0.01479
Interpretation: der p-Wert ist sehr klein, die Nullhypothese der Unabhangigkeit der Ein-stellungen zu den beiden Technologien muss verworfen werden.
Art der Abhangigkeit?
Wirtschaftsstatistik 2 Herbert Nagel
Verkaufsfordernde Maßnahmen
In einer Studie zu verkaufsfordernden Maßnahmen wurde untersucht, ob praktische Arzte
eher bereit sind, ein neues Medikament zu verwenden, wenn dieses von einem Pharmaver-
treter oder im Rahmen eines speziellen Abendessens (Dinner Party) vorgestellt wird.
Forschungsfrage: Wird das Medikament signifikant ofter angewendet, wenn es bei einem
speziellen Abendessen angewendet wird?
Promotion
Anwendung Dinner Party Vertreter
Ja 58 47
Nein 23 38
Wirtschaftsstatistik 2 Herbert Nagel
Verkaufsfordernde Maßnahmen: Balkendiagramm
Dinner Party Vertreter
NeinJa
Neues Medikament
0.0
0.2
0.4
0.6
0.8
1.0
Wirtschaftsstatistik 2 Herbert Nagel
Verkaufsfordernde Maßnahmen: Vergleich der Anteile
Pearson's Chi-squared test
data: medikament
X-squared = 4.75, df = 1, p-value = 0.02934
Wirtschaftsstatistik 2 Herbert Nagel
Seltene Krankheit
An zwei Kliniken wurden unterschiedliche Behandlungsmodelle zur Therapie einer seltenen
Krankheit entwickelt. Die bisherigen Daten zum Behandlungserfolg zeigen folgendes Bild:
Klinik A Klinik BBehandlungserfolg gut 2 5Behandlungserfolg schlecht 5 4
Forschungsfrage: Kann man auf Grund dieser Daten schon schließen, dass mit der Be-
handlungsmethode von Klinik B der Behandlungserfolg hoher ist?
Problem: Fur den Homogenitatstest sind die erwarteten Haufigkeiten zu klein!
Wirtschaftsstatistik 2 Herbert Nagel
Image von Fernsehsendern
In einer Umfrage im Mai 2008, knapp vor der Fußball-EM in Osterreich und der Schweiz,
wurden 229 Personen (mit Kabel-TV- oder Satelliten-TV-Empfang) im Raum Wien zu
ihrem TV-Sehverhalten befragt.
Ein Teil dieser Umfrage zielte darauf ab, Eigenschaften (aktuell, kritisch, informativ, sen-
sationslustern etc.) von Fernsehsendern herauszufiltern.
Wir beschranken uns hier auf eine Eigenschaft, namlich Aktualitat, bei den zwei privaten
Sendern Pro7 und RTL.
Forschungsfrage: Beurteilen Personen die Sender unterschiedlich?
Problem: Verbundene (abhangige) Stichproben
Wirtschaftsstatistik 2 Herbert Nagel
Image von Fernsehsendern: McNemar-Test
RTL
Pro7 nicht aktuell aktuell
nicht aktuell 93 42
aktuell 36 58
Konzentration auf die Gegendiagonale!
McNemar's Chi-squared test
data: aktuell
McNemar's chi-squared = 0.462, df = 1, p-value = 0.4969
Wirtschaftsstatistik 2 Herbert Nagel
Pete Sampras (1991 – 1998): Odds und Odds – Ratio
Rasen Sandgewonnen 63 62verloren 10 24
Odds:
OddsR =63
10= 6.3 OddsS =
62
24= 2.583
Odds – Ratio:
OR =63/10
62/24=
63 · 24
62 · 10= 2.44
Wirtschaftsstatistik 2 Herbert Nagel
Odds – Ratio: Konfidenzintervalle
• Schwankungsbreite fur das log Odds Ratio:
s = Q(N)(1− α/2) ·√
1
a+
1
b+
1
c+
1
d
• Konfidenzintervall auf der logarithmierten Skala:
(ln(OR)− s ; ln(OR) + s)
• Konfidenzintervall auf der eigentlichen Skala:(OR
es; OR · es
)
Wirtschaftsstatistik 2 Herbert Nagel
PrufungschancenPruferA B
positiv 45 21negativ 16 15
• OR = 2.009 und ln(2.009) = 0.6976.
• s = 1.96 ·√
1/45 + 1/21 + 1/16 + 1/15 = 0.8744
• Konfidenzintervall auf der logarithmierten Skala:
(0.6976− 0.8744 ; 0.6976 + 0.8744) = (−0.1768 ; 1.5720)
• Konfidenzintervall auf der eigentlichen Skala:
(2.009/ exp(0.8744) ; 2.009 · exp(0.8744)) = (0.838 ; 4.816)
Wirtschaftsstatistik 2 Herbert Nagel
Problemlosen und Intelligenz
● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
95 100 105 110 115 120 125
0.0
0.2
0.4
0.6
0.8
1.0
IQ−Problemloesung
IQ
Pro
blem
gel
oest
(0=
nein
, 1=
ja)
Wirtschaftsstatistik 2 Herbert Nagel
Linearer Pradiktor – Linkfunktion – LogOdds
ln
(p
1− p
)= β0 + β1 · x1 + . . .+ βk · xk
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
−4 −2 0 2 4
0.0
0.2
0.4
0.6
0.8
1.0
Logistische Funktion
Linearer Praediktor
P
Wirtschaftsstatistik 2 Herbert Nagel
Problemlosen und Intelligenz: Modellschatzung
Call: glm(formula = y ~ iq, family = binomial)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -24.567 10.417 -2.36 0.018
iq 0.231 0.097 2.38 0.017
Null deviance: 33.651 on 24 degrees of freedom
Residual deviance: 24.167 on 23 degrees of freedom
AIC: 28.17
Number of Fisher Scoring iterations: 5
Wirtschaftsstatistik 2 Herbert Nagel
Problemlosen und Intelligenz: Prognosewerte
● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
95 100 105 110 115 120 125
0.0
0.2
0.4
0.6
0.8
1.0
IQ−Problemloesung
IQ
fitte
d va
lues
Wirtschaftsstatistik 2 Herbert Nagel
Verkaufsfordernde Maßnahmen
Promotion
Anwendung DinnerP Vertreter
Ja 58 47
Nein 23 38Dinner Party Vertreter
NeinJa
Neues Medikament
0.0
0.2
0.4
0.6
0.8
1.0
OddsDP = 58/23 = 2.522 ln(OddsDP ) = ln(2.522) = 0.925
OddsV e = 47/38 = 1.237 ln(OddsV e) = ln(1.237) = 0.213
Wirtschaftsstatistik 2 Herbert Nagel
Verkaufsfordernde Maßnahmen: Logistische Regression in R
Call: glm(formula = try ~ promotion, family = binomial)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.925 0.246 3.75 0.00017
promotionVertreter -0.712 0.329 -2.16 0.03042
Null deviance: 218.32 on 165 degrees of freedom
Residual deviance: 213.54 on 164 degrees of freedom
AIC: 217.5
Number of Fisher Scoring iterations: 4
Wirtschaftsstatistik 2 Herbert Nagel
Sonderausstattung bei Autosalter
Bedeutung 18-23 24-40 > 40
unwichtig 66 26 13
wichtig 44 63 88
18−23 24−40 > 40
wichtigunwichtig
Klimaanlage im Auto
rela
tive
Häu
figke
iten
0.0
0.2
0.4
0.6
0.8
1.0
Wirtschaftsstatistik 2 Herbert Nagel
Sonderausstattung bei Autos: R-Output
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.405 0.195 -2.08 0.037
alter24-40 1.291 0.304 4.25 2.1e-05
alter > 40 2.318 0.355 6.53 6.8e-11
Null deviance: 388.47 on 299 degrees of freedom
Residual deviance: 333.14 on 297 degrees of freedom
Wirtschaftsstatistik 2 Herbert Nagel
Verkehrsmittelwahl: R-Output 1
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.9969 1.2874 -2.33 0.0199
Alter 0.0572 0.0247 2.31 0.0207
SexFrau -0.7170 0.5523 -1.30 0.1942
Dist 0.1249 0.0431 2.90 0.0037
Null deviance: 100.893 on 79 degrees of freedom
Residual deviance: 85.735 on 76 degrees of freedom
Wirtschaftsstatistik 2 Herbert Nagel
Verkehrsmittelwahl: R-Output 2
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.2917 1.2678 -2.60 0.0094
Alter 0.0611 0.0242 2.52 0.0117
Dist 0.1156 0.0418 2.76 0.0057
Null deviance: 100.89 on 79 degrees of freedom
Residual deviance: 87.45 on 77 degrees of freedom
Wirtschaftsstatistik 2 Herbert Nagel
Aggression im Straßenverkehr
Blockierer Blockierter Hupen
Geschlecht Autoklasse Ja Nein
Mann Mittel/Oberkl. 15 17Kleinwagen 14 16
Frau Mittel/Oberkl. 8 12Kleinwagen 19 5
Wirtschaftsstatistik 2 Herbert Nagel
Aggression im Straßenverkehr: Mosaikplot
Aggression im Autoverkehr
Auto
Sex
Mittel/Oberklasse Kleinwagen
Man
nF
rau
Nein Ja Nein Ja
Wirtschaftsstatistik 2 Herbert Nagel
Aggression im Straßenverkehr: Wechselwirkungsmodell
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.12516 0.35425 -0.35 0.724
SexFrau -0.28030 0.57777 -0.49 0.628
AutoKleinwagen -0.00837 0.50933 -0.02 0.987
SexFrau:AutoKleinwagen 1.74883 0.84875 2.06 0.039
Null deviance: 146.61 on 105 degrees of freedom
Residual deviance: 137.18 on 102 degrees of freedom