Sample Distributions
關於〝變異數〞的抽樣分配
抽樣分配
統計對象 型態 分配類型
母體分配樣本分配
離散型機率分配
均勻分配 二項分配多項分配 負二項分配超幾何分配 幾何分配伯努利分配 波松分配
連續型機率分配
連續均勻分配 常態分配標準常態分配 指數分配Gamma分配 卡方分配
抽樣分配 機率分配
樣本比例差( Ƹ𝑝 − 𝑝 )平均數~
Z分配 t分配變異數~
單母體變異數 卡方分配兩母體變異數比 F分配
我們除了對於母體「平均數」或「比例」感到興趣外,在某些議題上,更關注的是母體「變異數」或「標準差」的資訊,因為變異數是衡量分配的集中程度。所以像是機器生產,可藉由變異數來估計機器的穩定度;在教育上,可估計學生成績的差異情形。(卡方分配)
實務上,也可能需要比較來自兩個母體變異數的差異,例如兩個不同品牌機器穩定度的比較;或是兩個國家學生對於數學成績的差異狀況;或是比較兩地區經濟水準,年所得變異越大,代表貧富越懸殊,社會問題會更嚴重。(F分配)
𝝌𝟐 distribution
卡方分配
(chi-square distribution)
卡方分配抽樣形成示意圖
樣本1
x
𝝌𝟐
樣本2 樣本3 樣本n
μ
σ母體分配~N(μ, σ2)
𝜒12 𝜒2
2𝜒32
𝜒n2
(𝜇1, 𝜎1) (𝜇2, 𝜎2) (𝜇3, 𝜎3)(𝜇n, 𝜎n)
函數定義(分配形式)~原型
有 n 個獨立之常態隨機變數 x1, x2, x3, ……, xn ,其平均數
分別為 μ1, μ2, μ3, ….., μn ,標準差為 σ1, σ2, σ3, ….., σn :
𝑧 =𝑥 − 𝜇
𝜎
𝜒n2 =
i=1
n𝑥𝑖 − 𝜇𝑖𝜎𝑖
2
𝜒2 = (x − 𝜇
𝜎)2
𝜒n2 =
i=1
n𝑥𝑖 − 𝜇
𝜎
2來在同一個常態母體
χ2 變數也是隨機變數,與樣本大小有關,上述式子,
稱為具有「自由度 n 」的卡方分配。
函數定義(分配形式)~實務
實務上,母體平均數 μ 通常未知,故以 ҧ𝑥 來取代母體平均
數,此時「自由度」會少1,所以卡方分配可改寫為:
𝜒n−12 =
i=1
n𝑥𝑖 − തx
𝜎
2
上述式子稱為具有「自由度 n-1 」的卡方分配。
又可得樣本變異數 𝑆2 =σ(𝑥𝑖 − ҧ𝑥)2
𝑛 − 1,帶入上式可得
𝜒𝑛−12 =
(𝑛 − 1)𝑠2
𝜎2
卡方分配圖的性質
圖片來源: http://2012books.lardbucket.org/books/beginning-statistics/s15-chi-square-tests-and-f-tests.html
隨著自由度的增加,變異數會逐漸增大,且會逐漸趨近於常態分配
期望值等於「自由度」: E(χ2)= n-1
變異數等於2倍「自由度」: V(χ2)= 2( n-1)
卡方分配為右偏分配
卡方分配的用途
進行單一常態分配母體的變異數統計推論。
可用來做適合度檢定(goodness-of-fit test)。
可用來做獨立性檢定(test of independence)。
可用來做變異數齊一性檢定(test of homogeneity)。
卡方分配的查表
1
2
𝜒α, n−12
α機率值 自由度
①先找自由度②再找符合區域的
機率值α
𝜒0.1, 52 = 9.2364
案例
「現代統計學」p129,吳柏林 著,五南圖書
機械公司新出產機車專用引擎,品管部門以引擎
轅軸長的變異數來判定生產過程是否有一致性。
假定每個引擎轅軸長的變異數為 0.8 ,整批產品
變異數超過 1.3 表示此批產品不佳?需要重新調
整生產過程。現在從產品中隨機挑選 10 個引擎,
試求重新調整生產過程之機率?
案例解說
用變異數判定一致性 → 考慮卡方分配;
每個引擎轅軸長變異數 0.8 → σ2=0.8 ;
超過 1.3 表示產品不佳 → 臨界值
抽取 10 個引擎 → n=10
P( s2>1.3 ) = pn−1 s2
𝜎2>
10−1 1.3
0.8
= P( χ2>14.6) [卡方分配查表]
= 0.1
重新調整生產過程之機率為 0.1 。
𝜒𝑛−12 =
(𝑛 − 1)𝑠2
𝜎2
F distribution
F分配
F分配抽樣形成示意圖
x1μ1
σ1
母體分配~N(μ, σ2)
𝜒12
𝐹
x2μ2
σ2
𝜒22
𝐹 =൘𝜒12
𝑛1 − 1
൘𝜒22
𝑛2 − 1
自由度 (n1-1) 自由度 (n2-1)
函數定義(分配形式)~原型
F分配亦稱為Fisher分配,是由兩個卡方統計量的比值所形
成的抽樣分配,可用來估計兩個母體變異數比的問題。
假設有 2 個不同的常態母體x1, x2 ,隨機抽取樣本,樣本
數個別為 n1, n2 ,則F分配為:
上述式子,稱為具有「分子自由度 n1-1、分母自由度n2-1 」
的 F 分配。
𝐹( n1−1 , n2−1 ) =൘𝜒12
𝑛1 − 1
൘𝜒22
𝑛2 − 1x1自由度 x2自由度
函數定義(分配形式)~實務
從卡方分配可知,實務上會以樣本變異數 s2 來應用:
從式中可知,F分配可以推論兩個母體變異數的估計。
𝜒1,(𝑛1−1)2 =
(𝑛1 − 1)𝑠12
𝜎12 𝜒2,(n2−1)
2 =(𝑛2 − 1)𝑠2
2
𝜎22
⟹ 𝐹α( n1−1 , n2−1 ) =
൘s12
𝜎12
൘s22
𝜎22df1 df2
γ1 γ2
F分配圖的性質
F分配的性質
期望值: E(x)=𝜈1
𝜈2−1
變異數: V(x)=2𝜈2
2(𝜈1+𝜈2−2)
𝜈1(𝜈2−2)2 𝜈2−4
, 𝜈2 > 4
假設隨機變數 X 為具有自由度 γ1 (=n1-1) 與 γ2 (=n2-1) 的
F分配,則:
重要查表性質: 𝐹𝛼 𝜈1, 𝜈2 =1
𝐹1−𝛼 𝜈2, 𝜈1
F分配為右偏分配
F分配的用途
變異數分析。
迴歸分析中的整體檢定。
檢定兩個常態母體變異數是否相等。
代替二項分配做母體比例的推論。
F分配的查表Fα(n1-1 , n2-1)
機率值自由度 自由度
①先找2個自由度②再找符合區域的機率值α
F0.05(8 , 6)=4.15
1
3 2
案例
「現代統計學」p130,吳柏林 著,五南圖書
投資風險的大小, 一般由短期投資的可能結果而定。最
常用的衡量短期投資方法就是計算可能結果的變異數值。
現在假設有A、B兩種投資組合,兩種投資組合的投資報
酬率均為20%。但是A投資組合十年來的獲利變異數為
8.4;B投資組合八年來的獲利變異數為3.1。如果兩種投
資組合的母體平均報酬率變異數均等,即 σ1/σ2 = 1,
試問𝑠12
𝑆22 大於2.7的機率是多少?
案例解說
2個用變異數判定一致性 → 考慮 F 分配;
σ1/σ2 = 1 → 計算上不變
A:十年來… → n1=10 ; B:八年來… → n2=8
P( s12
s22 >2.7 ) = p
൘s12
𝜎12
൘s22
𝜎22
>2.7
= P( Fα( (10-1), (8-1) ) >2.7 ) [F分配查表]
= 0.1 ( = α )
機率為 0.1 。
The End