Date post: | 02-Jan-2016 |
Category: |
Documents |
Upload: | louis-cruz |
View: | 32 times |
Download: | 2 times |
1
Prof.dr.sc. Elza JurunEkonomski fakultet Split
POSLOVNA STATISTIKA - stručni studij
2
ISPITIVANJE ODNOSA MEĐU POJAVAMA
3
Dijagram rasipanja
Poslovna i makroekonomska analiza često, uz promatranje kretanja jedne ekonomske pojave, imaju potrebu istražiti ovisnosti dviju ili više pojava, odnosno numeričkih nizova, zajedno.
Prvi korak: Dijagram rasipanja u pravokutnom koordinatnom sustavu točkama
prikazuje parove vrijednosti dviju promatranih numeričkih varijabli. ),( ii yx
yi
xi
(a) pozitivna funckionalnaveza
yi
xi
(b) pozitivna statističkaveza
4
(a) negativna funckionalnaveza
yi
xi
yi
xi
(b) negativna statističkaveza
5
(a) pozitivna funckionalnakrivolinijska veza
yi
xi
yi
xi
(b) pozitivna statističkakrivolinijska veza
Veza između promatranih varijabli ne mora uvijek odgovarati jednadžbi pravca.
(a) nema veze među pojavama
yi
xi
6
Primjer Dijagram rasipanja vrijednosti proizvodnje u tekućim cijenama (u 000 kn) i broj zaposlenih (u tis.) na nekom
području za nekoliko vremenskih razdoblja
100
120
140
160
180
200
220
240
260
280
300
320
100 110 120 130 140 150 160
Broj zaposlenih (u 000) xi
Vri
jed
no
st
pro
izv
od
nje
(u
00
0 k
n)
yi
Izvor: Podaci su simulirani Raspored točaka dijagrama rasipanja upućuje na pozitivnu statističku vezu između vrijednosti
proizvodnje i broja zaposlenih. Između točaka može se zamisliti linija pravca, ali sve točke ne leže na toj liniji već postoje pozitivna i/ili negativna odstupanja. Dakle, u ovom slučaju, porast broja zaposlenih na promatranom području prati porast vrijednosti proizvodnje.
7
Koeficijent linearne korelacije
Pod pojmom korelacija podrazumijeva se međuzavisnost ili povezanost slučajnih varijabli.
Po smjeru korelacija može biti:
pozitivna i
negativna.
Pozitivna korelacija je prisutna kada rast vrijednosti jedne varijable prati rast vrijednosti druge promatrane varijable, odnosno kada pad jedne prati pad vrijednosti druge varijable.
Negativna korelacija prisutna je kada rast jedne varijable prati pad druge
varijable i obratno.
8
Pearsonov koeficijent linearne korelacije (r) -najpoznatija mjera linearne korelacije između slučajnih varijabli:
ili ,
,
)()(
)()(
1 1
22
1
n
i
n
iii
n
iii
YYXX
YYXXr
yx
n
iii
n
YXnYXr
1
gdje su i jednostavne standardne devijacije promatranih varijabli: yx
21
2
Xn
xn
ii
x
21
2
Yn
yn
ii
y
i
9
Kreće se u intervalu:
;
11 r
Ako je:
1r 1r; funkcionalna negativna/pozitivna korelacija,
; jaka negativna/pozitivna korelacija, 8,01 r 18,0 r
5,08,0 r 8,05,0 r srednje jaka negativna/pozitivna korelacija,
; slaba negativna/pozitivna korelacija, 05,0 r 5,00 r
nema korelacije. 0r
10
Primjer
Iz osnovnog skupa od 1744 industrijskih poduzeća u Splitsko-dalmatinskoj županiji nakon odbacivanja podataka o poduzećima s 0 zaposlenih i negativnim poslovanjem, te "outliersa" po različitim financijskim pokazateljima, u analizi je ostao uzorak veličine 316 poduzeća.
Zadatak je izračunati linearnu korelaciju između odabranih varijabli za poduzeća u uzorku:
broja zaposlenih, ukupnog prihoda, neto dobiti i vlastitog kapitala.
11
Correlations
Broj zaposlenih
Ukupni prihodi
Neto dobit Vlastiti kapital
Broj zaposlenih
Pear. Corr. 1 .954** .868** .302**
Sig. . .000 .000 .000
N 316 316 316 316
Ukupni prihodi
Pear. Corr. .954** 1 .959** .311**
Sig. .000 . .000 .000
N 316 316 316 316
Neto dobit Pear. Corr. .868** .959** 1 .146**
Sig. .000 .000 . .009
N 316 316 316 316
Vlastiti kapital
Pear. Corr. .302** .311** .146** 1
Sig. .000 .000 .009 .
N 316 316 316 316
** Correlation is significant at the 0.01 level (1%).
12
Korelacija ranga
Ako se želi istražiti međuovisnost pojava koje su izražene modalitetima redosljednog obilježja, odnosno ako su im modaliteti pridruženi na temelju ordinalne skale računa se korelacija ranga.
Spearmanov koeficijent korelacjie ranga (rS):
NN
dr
N
ii
S
31
261
gdje je:
N - odgovarajuća vrijednost iz tablica normalne distribucije,
)()( iii yrxrd - razlika rangova vrijednosti varijabli X i Y.
13
Korelacija ranga
Spearmanov koeficijent korelacije ranga može poprimiti vrijednosti u intervalu:
11 Sr
Kada ovaj koeficijent poprimi vrijednosti -1 i 1, riječ je o potpunoj korelaciji ranga među varijablama.
Vrijednost ovog koeficijenta 0 znači da nema nikakve korelacije ranga među pojavama.
11 sr Najćešće se vrijednost Spearmanovog koeficijenta kreće u rasponu
14
Primjer
Zadani su podaci za 12 studenata fakulteta "E" o bodovima na testu iz predmeta: Matematika i Ekonometrija.
Zadatak je izračunati Spearmanov koeficijent korelacije ranga uspjeha na testovima.
15
Tablica: Bodovi na testu iz Matematike i Ekonometrije odabranih studenata fakulteta "E"
2id
StudentiBodovi na testu iz Matematike
(xi)
Bodovi na testu iz Ekonometrije
(yi)
Rangr(xi)
Rangr(yi)
Razlika rangova
di
A 50* 45* 6,5 5 1,5 2,25
B 64 70 9 11 -2 4C 43 45* 5 5 0 0D 80 75 12 12 0 0E 21 38 2 2 0 0F 57 60 8 8 0 0G 50* 45* 6,5 5 1,5 2,25
H 37 50 4 7 -3 9I 10 25 1 1 0 0J 75 68 11 10 1 1K 65 63 10 9 1 1L 35 40 3 3 0 0
Ukupno: - - - 0 19,5
Izvor: Podaci su simulirani
16
931818,01212
5,1961
61
331
2
NN
dr
N
ii
S
Spearmanov koeficijent korelacije ranga je pozitivan i iznosi 0.93. Može se zaključiti da u ovom primjeru između uspjeha na testu iz Matematike i Ekonometrije postoji visoka korelacija ranga. Odnosno, ako je student postigao dobar rezultat na testu iz Matematike, može se očekivati da će postići dobar rezultat i na testu iz Ekonometrije i obratno.
17
Kendallov koeficijent korelacije ranga (W)
mjeri stupanj korelacije skupine od varijabli ranga.
pretpostavlja se da su vrijednosti svih varijabli ranga izražene s prvih N prirodnih brojeva.
ako su varijable originalno dane u numeričkom obliku, potrebno ih je transformirati u varijable ranga.
3k
18
)1(12
1
)(
2
1
2
NN
RRW
N
ii
gdje je:
- aritmetička sredina rangova (rki) po svim varijablama k, za svako
opažanje i. K
rR
K
kki
i
1
NK
rR
N
i
K
kki
1 1 - aritmetička sredina svih rangova (rki) za sve varijable k i sva
opažanja i.
19
Ovaj koeficijent se kreće u intervalu:
W=1, znači potpuno neslaganje rangova promatranih K varijabli.
W=0, znači potpunu podudarnost rangova promatranih K varijabli.
10 W
20
Primjer
Zadani su rangovi za 19 različitih regija prema 3 regionalna ekonomska pokazatelja:
r1 - društveni proizvod po stanovniku,
r2 - broj ind. poduzeća s pozitivnim poslovanjem,
r3 - broj stanovnika s VSS na 1000 stanovnika.
Zadatak je izračunati Kendallov koeficijent korelacije ranga između ovih varijabli.
21
Tablica: Rangovi za 19 različitih regija prema 3 regionalna ekonomska pokazatelja
Izvor: Podaci su simulirani
Regija
A 2 3 2 7 2,3333 58,7778B 4 4 3 11 3,6667 40,1111C 1 2 1 4 1,3333 75,1111D 7 7 6 20 6,6667 11,1111E 3 1 4 8 2,6667 53,7778F 5 6 7 18 6,0000 16,0000G 6 5 5 16 5,3333 21,7778H 9 10 9 28 9,3333 0,4444I 11 11 10 32 10,6667 0,4444J 8 9 8 25 8,3333 2,7778K 14 14 13 41 13,6667 13,444L 10 8 11 29 9,6667 0,1111M 12 13 14 39 13,000 9,0000N 13 12 12 37 12,3333 5,4444O 16 17 16 49 16,3333 40,1111P 18 18 17 53 17,6667 58,7778R 15 16 15 46 15,3333 28,4444S 19 19 19 57 19,0000 81,0000T 17 15 18 50 16,6667 44,4444
190 190 190 - - 561,1111
ir1 ir2 ir3
K
kkir
1 iR 2)( RRi
22
9844,0)119(19
12
11111,561
)1(12
1
)(
22
1
2
NN
RRW
N
ii
Kendallov koeficijent korelacije ranga (W=0,9844) pokazuje da postoji visoki stupanj podudarnosti rangova u 19 odabranih regija prema ova 3 ekonomska pokazatelja.
Regije s visokim društvenim proizvodom po stanovniku imaju veći broj industrijskih poduzeća s pozitivnim poslovanjem, kao i veći udio visoko obrazovanih stanovnika (s VSS).
10193
570
193
1901901901 1
NK
rR
N
i
K
kki