+ All Categories
Home > Documents > Ph_¬ng ph¸p håi qui vµ t_¬ng quan

Ph_¬ng ph¸p håi qui vµ t_¬ng quan

Date post: 06-Jul-2018
Category:
Upload: hinhxamnoigockhuattimanh
View: 219 times
Download: 0 times
Share this document with a friend

of 18

Transcript
  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    1/18

    CHƯƠNG 6:

    PHƯƠNG PHÁP HỒI QUI VÀ TƯƠNG QUAN

    (Linear Correlation and Regression) 

    I. HỆ SỐ TƯƠNG QUAN1. Hệ số tương quan mẫu2. Đặc tính của hệ số tương quan

    II. TƯƠNG QUAN HẠNGIII. MÔ HÌNH HỒI QUI TUYẾN TÍNH

    1. Hồi qui tuyến tính một chiềua.  Phương trình hồi qui tuyến tính một chiều

     b.  Khoảng tin cậy và kiểm định giả thuyết trong hồi qui một chiều

    c.  Kiểm định tham số hồi qui tổng thể ((): (T est of the population regression slope)d.   Phân tích phương sai (ANOVA ) hồi qui e.  Dự báo trong phương pháp hồi qui tuyến tính đơn

    2. Hồi qui nhiều chiềua.  Phương trình hồi qui nhiều chiều

     b.  Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi qui nhiều chiềuc.  Kiểm định giả thuyết cho các tham số hồi qui d.  Kiểm định trên tất cả các tham số của một mô hình hồi qui e.  Dự báo trong phư ơng pháp hồi qui tương quan nhiều chiều

    BÀI TẬP

     

    Mục đích của phương pháp hồi qui tương quan là ước lượng mức độ liên hệ (tương quan) giữa các biến độclập (các biến giải thích) đến biến phụ thuộc (biến được giải thích), hoặc ảnh hưởng của các biến độc lập với nhau(các yếu tố nguyên nhân). Phương pháp này được ứng dụng trong kinh doanh và kinh tế để phân tích mối liên hệgiữa hai hay nhiều biến ngẫu nhiên.

    I. HỆ SỐ TƯƠNG QUAN (Correlation coef ficient)   T

      Hệ số tương quan đo lường mức độ quan hệ tuyến tính giữa hai biến; chính xác hơn là quan hệ tuyến tínhgiữa hai biến, không phân biệt biến này phụ thuộc vào biến kia.

      1. Hệ số tương quan mẫu (r): (Sample correlation coefficient)   T

      Gọi (x1, y1), (x2, y2), ..., (xn, yn) là n cặp quan sát của một mẫu ngẫu nhiên của hai biến ngẫu nhiên X & YHệ số tương quan mẫu tính từ mẫu n cặp giá trị quan sát của hai biến X và Y với trung bình (x và (y và phương sai(x2 và (y2 được thể hiện trong công thức sau:

    http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/chuong5.htmhttp://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/decuong.htmhttp://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/chuong7.htmhttp://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/index.htmhttp://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/index.htmhttp://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/chuong7.htmhttp://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/decuong.htmhttp://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/chuong5.htm

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    2/18

     

    2. Ðặc tính của hệ số tương quan:   T

    Hệ số tương quan (r) không có đơn vị, có thể tính từ giá trị mã hóa bằng phép biến đổi tuyến tính của X và Y. (r)luôn luôn biến động trong khoảng ( 1 (-1 ( r ( 1), nếu hệ số tương quan (r) dương cho biết X và Y biến động cùnchiều và âm thì ngược lại. Ðể biểu hiện mức độ chặt chẽ của mối liên hệ giữa các biến ta có các nhận xét sau đây:

    ( r = ( 1 : Mối liên hệ giữa các biến hoàn toàn chặt chẽ.

      ( r = 0 : Giữa các biến không có mối liên hệ.

    Ðể thấy được đặc tính của r, sáu trường hợp sau đây trình bày sự liên hệ tuyến tính giữa X và Y và giá trị của rTrong tất cả 6 trường hợp chỉ có (x y là thay đổi, còn các giá trị còn lại như dưới đây:

     

    Ví dụ: Một quảng cáo giới thiệu du lịch được đăng trong 17 tờ báo hoặc tạp chí. Liên quan đến chiến dịch quảng cáonày có hai biến liên hệ (bảng 6.1) 

    X: chi phí quảng cáo (100.000 đồng)

      Y: tỉ suất lợi nhuận (chỉ tính trên 100.000đ chi phí quảng cáo)

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    3/18

     

    Từ số liệu bảng trên ta tính trung bình mẫu như sau:

     

    r = -0.441 chỉ ra mối quan hệ giữa chi phí và thu nhập là mối tương quan nghịch, có nghĩa rằng chi phí cao ththu nhập thấp và giữa chúng mối liên hệ không chặt chẽ lắm.

    Hệ số tương quan của mẫu thì hữu ích khi dùng để mô tả tính chặt chẽ của mối quan hệ tuyến tính trong mộtmẫu. Vì vậy, nó có thể dùng làm cơ sở cho kiểm định giả thuyết của tổ hợp không  tuyến tính (không tương quan)trong tổng thể (nghĩa la ìhệ số tương quan tổng thể ( = 0).

    Ðặt r là hệ số tương quan mẫu được tính từ một mẫu ngẫu nhiên gồm n cặp quan sát từ một phân phối chuẩnTa có các trường hợp tổng quát để kiểm định ( = 0) nghĩa là không có mối liên hệ giữa các biến như sau:

     

    Trở lại ví dụ về chi phí và thu nhập trong chiến dịch quảng cáo chúng ta sẽ kiểm định giả thuyết H0 rằngkhông có mối quan hệ tương quan trong tổng thể. Trường hợp kiểm định dạng 2 đuôi ta có:

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    4/18

     

    Tra bảng phân phối Student t trong trường hợp n = 17, ta có (n - 2) =15 và kiểm định trong hai trường hợp ( = 10%và ( = 5%.

      t15,5% = 1,753 và t15,2,5% = 2,131.

     Như vậy: t = -1, 903 nằm trong khoảng giữa của t15,5% và t15,10%, nghĩa là:

     

    Vậy theo điều kiện quyết định bác bỏ giả thuyết H0 trong trường hợp kiểm định dạng 2 đuôi thì quan sát trên cho phép bác bỏ giả thuyết H0 ở mức ý nghĩa 10% (có tương quan giữa chi phí quảng cáo và thu nhập) và chấp nhận githuyết H0 ở mức ý nghĩa 5% (không tương quan giữa chi phí quảng cáo và thu nhập), nghĩa là nếu chọn một xácsuất sai lầm (bác bỏ giả thuyết H0 khi giả thuyết này đúng) nhỏ thì số liệu quan sát trên không đủ điều kịên để bác

     bỏ H0.

    II. TƯƠNG QUAN HẠNG: (RANK CORRELATION)   T

      Tương quan hạng dùng để sử dụng cho kiểm định mối liên hệ giữa các biến khi phân phối của tổng thể đượgiả sử không phải là phân phối chuẩn hoặc trong trường hợp hiện diện các giá trị bất thường của biến quan sát (lớnquá hoặc nhỏ quá).

    Ðặt xi và yi là những cặp quan sát được xếp hạng riêng biệt theo thứ tự được bắt đầu từ 1. Ta có hai trườnghợp:

    · Nếu các hạng được xếp có trùng nhau (đồng hạng) thì sử dụng công thức (11.1) để tính hệ số tương quan r.

    · Nếu các hạng được xếp không trùng nhau thì sử dụng công thức của Spearman như dưới đây để tính hệ sốtương quan hạng. 

    Trong đó: di là chênh lệch của 2 hạng được xếp của biến xi và yi

    Tương tự các bước kiểm định cho trường hợp tổng quát - không có mối liên hệ giữa các biến (( = 0) ta có:

     

    Trở lại ví dụ của chi phí quảng cáo và thu nhập ta có: 

     Bảng 6.2. Chi phí quảng cáo (xi) và tỉ suất lợi nhuận (yi) trên 17 tờ báo và tạp chí:

    xi   hạng yi   hạng xi   hạng yi   hạng

    4,07

    2,15

    14

    8

    17,41

    22,25

    2

    4

    1,50

    1,68

    3

    6

    78,74

    66,42

    13

    12

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    5/18

    1,25

    14,67

    16,02

    3,81

    9,87

    1,27

    1,80

     

    1

    16

    17

    13

    15

    2

    7

    106,84

    14,41

    24,18

    29,73

    35,95

    61,81

    48,36

    16

    1

    5

    6

    8

    11

    9

    2,72

    1,61

    1,52

    3,10

    3,32

    3,07

    9

    5

    4

    11

    12

    10

    121,95

    21,93

    31,29

    88,31

    92,70

    59,06

    17

    3

    7

    14

    15

    10

     Ta thấy rằng hạng được xếp cho các cặp của hai biến X và Y không trùng nhau. Vì vậy ứng dụng công thức củSpearman ta có hệ số tương quan mẫu:

    Tra bảng phân phối Spearman ở mức ý nghĩa ( = 5% và ( = 10% ta có:

      rs,5% = 0,412 và rs,2,5% = 0,490

        r s,2,5% < r S < r s,5%

    Bởi vì giá trị tính được r = - 0,431, và rs,2,5% < r < rs,5% ta có thể kết luận rằng giả thuyết H0 (không có sự liên hệgiữa chi phí quảng cáo và thu nhập) có thể bị bác bỏ trên cơ sở kiểm định dạng hai đuôi ở mức ý nghĩa 10% nhưngkhông bị bác bỏ ở ( = 5%.

    III. MÔ HÌNH HỒI QUI TUYẾN TÍNH: (LINEAR REGRESSION)   T

      Mục tiêu phân tích của mô hình này là xét mối liên hệ tuyến tính giữa một hay nhiều biến độc lập Xi (Xi: cònđược gọi là biến giải thích) đến một biến phụ thuộc (Y: biến được giải thích).

      1. Hồi qui tuyến tính một chiều (tuyến tính đơn): (Simple linear regression)   T

    Mục tiêu phân tích của mô hình này là xét mối liên hệ tuyến tính giữa một hay nhiều biến độc lập Xi (Xi: còn đượcgọi là biến giải thích) đến một biến phụ thuộc (Y: biến được giải thích).

    a) Phương trình hồi qui tuyến tính một chiều:   T

    Ðặt (x1,y1), (x2,y2)... (xn,yn) là mẫu gồm n cặp quan sát trên đường hồi qui tổng thể:.

    Theo phương pháp bình phương bé nhất thì ước lượng các hệ số ( và ( là các giá trị a và b sao cho tổng bình phương sai số của phương trình sau đây là bé nhất:

     

    Các hệ số a và b được tính như sau:

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    6/18

    Và đường hồi qui tuyến tính mẫu của y trên x là: y = a + bxVí dụ: Chúng ta có thể quan sát số tiền chi tiêu (yi) và thu nhập (xi) của 22 hộ gia đình trong một tháng có mối quanhệ với nhau như thế nào (1.000đ). Số liệu thu thập được trình bày ở bảng 11.3.

    Từ bảng bên ta có:

      n = 22

     

    Ðường hồi qui quan sát như sau: y = 1923 + 0,3815x

    Phương trình này hàm ý rằng nếu thu nhập của hộ gia đình tăng lên 1.000đ thì trung bình chi tiêu tăng thêm l381,5 đ. Còn 1923đ là phần chi tiêu do các nguồn khác.

    b) Khoảng tin cậy và kiểm định giả thuyết trong hồi qui một chiều:   T

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    7/18

      Giả sử đường hồi qui tuyến tính có dạng: yi = ( +(xi + (i

    và đặtĠ là phương sai của sai số và được ước lượng từ công thức sau:

     

    Vấn đề ở đây là ta xem xét phân phối mẫu và xác định tham số b của đường hồi qui. Ðặt b là ước lượng mẫu của (thì phương sai của b sẽ là:

     

    Và vì vậy, ước lượng không chệch củš được xác định bởi:

     

    Giả sử rằng, sai số hồi qui ((i) có phân phối chuẩn thì biến ngẫu nhiên (t) dùng để kiểm định giả thuyết về ( và ướclượng khoảng tin cậy của ( được tính như sau:

      (6.4)

    và một khoảng tin cậy 100(1-()% cho ( là:

     

    Trong đó:Ġ là một số sao choĠ

    Ví dụ: Trong sự liên hệ giữa chi tiêu và thu nhập mỗi hộ. Chúng ta có những thông tin như sau:

    n = 22; b = 0,3815; S b= 0,0253

    Khoảng tin cậy 99% cho ( được tính như sau:

    Tra bảng phân phối t ta có: Ġ

    Suy ra: 0,3815 - (2,845)(0,0253) <  < 0,3815 + (2,845)(0,0253)

      0,3095 <  < 0,4535

    Vì vậy, với khoảng tin cậy 99%, cứ 1000 đồng tăng lên trong thu nhập/hộ thì chi tiêu tăng thêm nằm trong khoảng309,5 đồng đến 453,5 đồng.

    c) Kiểm định tham số hồi qui tổng thể ((): (Test of the population  regression slope) To

      Ở mức ý nghĩa (, giả thuyết H0 có thể kiểm định dưới các trường hợp sau:

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    8/18

     

    Ðặt giả thuyết: ĉĉĉ

    Giá trị kiểm định: ĉ

    Quyết định bác bỏ H0 khi: t > tn-2,( t 2,845). Ðiều này có nghĩa rằng H1 đúng hay chi tiêu thì phụ thuộc vào thunhập.

    d) Phân tích phương sai (ANOVA) hồi qui:   T

      Trong ước lượng các tham số của mô hình hồi qui tuyến tính đơn theo phương pháp bình phương nhỏ nhất, cóthể chứng minh được rằng:

     

    Trong đó:

      ĉ là tổng biến động của y

      ĉ là tổng bình phương hồi qui, là đại lượng biến động của y được giải thích bởi đường hồi qui.

      ĉ là phần biến động còn lại hay còn gọi là dư số, là đại lượng biến động tổng gộp của các nguồn biến độngdo các nhân tố khác gây ra mà không hiện diện trong mô hình hồi qui và phần biến động ngẫu nhiên.

      SSR càng lớn thì mô hình hồi qui càng có độ tin cậy cao trong việc giải thích biến động của y.

      Hệ số xác định: r2 =Ġ là phần trăm biến động của y được giải thích bởi mối quan hệ tuyến tính của y đối với x.

      Số thống kê F =Ġ có phân phối F và thường được dùng để kiểm định mức ý nghĩa của mô hình hồi qui. F cànglớn mô hình càng có ý nghĩa (vì Sig.F sẽ nhỏ hơn so với mức ý nghĩa tự chọn của kiểm định).

    Các nguồn biến động của hồi qui tuyến tính đơn được tóm tắt trong bảng phân tích phương sai hồi qui như sau:

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    9/18

     

    Ví dụ sau đây là bảng kết quả phân tích hồi qui một chiều được xử lý từ Excel hoặc SPSS giữa hai biến - nhu cầuvốn vay (y) và số nhân khẩu/hộ (x). Kết quả thể hiện

    ·  Giải thích hệ số tương quan r: tương quan giữa hai biến là rất chặt chẽ (r = 0,98), nghĩa là số nhân khẩu càng caothì nhu cầu vốn vay càng lớn.

    ·  Giải thích hệ số xác định r2: Chỉ riêng số nhân khẩu/hộ làm thay đổi 97,2% nhu cầu vốn vay (r2 = 0,972).

    ·  Kiểm định ở mức ý nghĩa 5% thì mô hình hồi qui rất có ý nghĩa vì Sig.F= 0,0001% rất nhỏ so với 5%.

     

    e) Dự báo trong phương pháp hồi qui tuyến tính đơn   T

    Giả sử ta có mô hình hồi qui của tổng thể y = ( + (xi + (i (i =1,..., n) và (i có phân phối chuẩn. Ðặt a và b là hai thamsố được ước lượng theo phương pháp bình phương bé nhất của ( và (, dựa vào n cặp quan sát (x1,y1); (x2,y2);...(xn,yn). Ta ước lượng được:

      Khoảng tin cậy 100(1-()% của giá trị thật (yn +1) tại (xn+1):

      yn +1 = ( + (xn+1 + (n+1 nằm trong khoảng:

     

      Và khoảng tin cậy 100(1 - ()% của giá trị mong đợi (yn +1) tại (xn+1) trong điều kiện E (yn+1/xn+1) là:

     

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    10/18

    Với Ġ vàĠ Ĩ là một giá trị của x mà tại đó chúng ta muốn dự báo về giá trị của y)

     Ví dụ: Giả sử rằng chúng ta quan tâm đến dự đoán doanh thu bán lẻ trên hộ trong một năm mà trong đó thu nhậptrên hộ/năm là 12 triệu đồng.

    Ta có: xn+1 = 12.000, a = 1.923 và b = 0,3815

    Suy ra:

     

    Vì vậy, khi thu nhập/năm là 12 triệu đồng thì doanh thu bán lẻ thu được trên hộ khoảng 6,5 triệu đồng. Dựa trên cácđại lượng:

     

    Thế các đại lượng trên vào công thức (6.6) và (6.7) ta có kết luận sau:

    ·  Dự báo giá trị thật cho doanh thu bán lẻ là 6,501 ( 321. Có nghĩa là với khoảng tin cậy 95% của doanh thu trongmột năm tại mức thu nhập là 12 triệu nằm trong khoảng 6,18 triệu đến 6,82 triệu.

    ·  Và dự báo cho giá trị mong đợi của doanh thu bán lẽ là 6,501 ( 91. Như vậy, rõ ràng rằng trong cùng khoảng tincậy nhưng sự không chắc chắn trong việc dự báo cho giá trị thật thì lớn hơn giá trị mong đợi vì dự báo giá trthật có khoảng ước lượng rộng hơn.

    Chú ý: Nếu tất cả các yếu tố khác không đổi thì:

      - Cỡ mẫu n càng lớn, càng hẹp khoảng tin cậy khi ước lượng, dự báo càng chính xác.

      -Ġ càng lớn, khoảng tin cậy ước lượng càng lớn, dự báo càng kém chính xác.

      - Phương saiĠ càng lớn, thì khoảng tin cậy ước lượng càng hẹp, dự báo càng chính xác.

      -Ġcàng lớn, khoảng tin cậy ước lượng càng rộng, và dự báo càng kém chính xác.

    2. Hồi qui nhiều chiều: (Multiple Regression)

    a) Phương trình hồi qui nhiều chiều: To

      Mục tiêu của mô hình này giải thích biến phụ thuộc (y) bị ảnh hưởng bởi nhiều biến độc lập (xi). Ví dụtrong kinh doanh ngành ngân hàng, lợi tức thu được từ việc chênh lệch giữa lãi suất tiền gởi và cho vay phụ thuộc ínhất vào hai yếu tố: Phần trăm tăng lên trong lượng tiền gởi (x1) và số đơn vị đến gởi (x2). Ðể xét mối quan hệ nàyta sử dụng tài liệu thu thập của ngân hàng qua 25 năm như sau:

    Bảng 6.4: Lợi tức, % tăng của tiền gởi và số đơn vị gởi tiền qua 25 năm

    Năm x1(%) x2   y (%) Năm x1(%) x2   y (%)

    1 3,92 7.298 0,75 14 3,78 6.672 0,842 3,61 6.855 0,71 15 3,82 9.890 0,793 3,32 6.636 0,66 16 3,97 7.115 0,704 3,07 6.506 0,61 17 4,07 7.327 0,685 3,06 6.450 0,70 18 4,25 7.546 0,726 3,11 6.402 0,72 19 4,41 7.931 0,557 3,21 6.368 0,77 20 4,49 8.097 0,63

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    11/18

    8 3,26 6.340 0,74 21 4,70 8.468 0,569 3,42 6.349 0,90 22 4,58 8.717 0,41

    10 3,42 6.352 0,82 23 4,69 8.991 0,5111 3,45 6.361 0,75 24 4,71 9.179 0,4712 3,58 6.369 0,77 25 4,78 9.318 0,3213 3,66 6.546 0,78

    Phương trình hồi qui nhiều chiều cho ví dụ này có dạng:

      y = a + b1x1 + b2x2

    Một cách tổng quát, phương trình hồi qui tuyến tính nhiều chiều có dạng:

      y = a + b1x1 + b2x2 + .... + bk xk   (6.8)

    Các tham số a, b1, b2,....,bn có thể được ước lượng dễ dàng nhờ các phần mềm có sẳn trên máy tính. Phươngtrình này sẽ được suy rộng cho tổng thể có biến phụ thuộc Y và các biến độc lập X1,X2,...,Xk . Trở lại ví dụ trên cáctham số có kết quả giải bằng phương pháp ma trận hoặc từ phần mềm Excel như sau:

      a = 1,565 ; b1 = 0,237 ; b2 = - 0,000249

    Vì vậy: y = 1,565 + 0,237x1 - 0,000249x2

    Giải thích:

    ·  Khi cố định số lượng đơn vị tiền gởi (x2), lươûng tiền gởi tăng 1% dẫn đến 0,237% tăng lên trong lợi tức.

      Khi cố định % tăng lên trong lượng tiền gởi (x1), cứ tăng lên 1000 đơn vị tiền gởi dẫn đến giảm trong lợi tức0,249%.

    ·   Ngoài hai nhân tố trên, các nhân tố khác làm tăng lợi tức 1,565% (các nguồn thu từ Nhà nước chẳng hạn).

     

      Hệ số xác định R2 : (Multiple coefficient of determination)

      R2 được định nghĩa như là tỉ lệ (hay phần trăm) biến động của biến phụ thuộc (y) được giải thích bởi cá 

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    12/18

     biến đôûc lập xi. Chẳng hạn, R2=0,52 có nghĩa là 52% sự thay đổi trong lợi tức là do ảnh hưởng bởi % tăng tronglượng tiền gởi và số đơn vị tiền gởi. Hệ số xác định được tính như sau:

     

      Hệ số tương quan bội R : (Multiple Correlation Corfficient)

    R nói lên tính chặt chẽ của mối liên hệ giữa biến phụ thuộc (y) và các biến độc lập (xi).

     

    Từ ví dụ trên, ta cóĠ, nghĩa là sự liên hệ giữa lợi tức (y) và phần trăm tăng lên trong lượng tiền gởi, số lượng đơn vịtiền gởi là khá chặt chẽ.

      Hệ số xác định đã điều chỉnhĠ: (Adjusted Corfficient of Determination)

    ĉ (k: số biến độc lập) (6.11)

    hoặc tính từ R2: Ġ (6.12)

    Ý nghĩa củaĠ giống như R2, thường thường giá trị củaĠ có sự khác biệt rất ít so với R2. Tuy nhiên trong

    trường hợp đặc biệt,Ġ hiệu chỉnh khác biệt lớn so với R2 khi số lượng biến độc lập chiếm tỉ lệ lớn trong một mẫunhỏ.Ġlà chỉ số quan trọng để chúng ta nên thêm một biến độc lập mới vào phương trình hồi qui hay không. Chúng tacó thể quyết định thêm một biến độc lập nếŵtăng lên khi thêm biến đó vào (điều này thực hiện khá dễ dàng trên

     phần mềm Excel bằng cách khi chọn vùng số liệu ta chọn thêm một cột số liệu của chỉ tiêu nào đó mà ta muốn thêmvào).

      Tỷ số F = MSR/MSE trong bảng kết quả: dùng để so sánh với F trong bảng phân phối F ở mức ý nghĩa (. Tuynhiên, cũng trong bảng kết quả ta có giá trị Significance F, giá trị này cho ta kết luận ngay mô hình hồi qui có ýnghĩa khi nó nhỏ hơn mức ý nghĩa ( nào đó (thay vì phải tra bảng phân phối F phía sau sách), và giá trị Sig. Fcũng là cơ sở để quyết định bác bỏ hay chấp nhận giả thuyết H0 trong kiểm định bao quát các tham số của môhình hồi qui. Nói chung F càng lớn, khả năng bác bỏ giả thuyết H0 càng cao - giả thuyết H0 cho rằng tất cả các

    tham số hồi qui đều bằng 0, nghĩa là các biến độc lập (xi) không liên quan tuyến tính tới biến phụ thuộc y.Trở lại bảng kết quả trên ta thấy giá trị Sig. F = 0,000282 = 0,023% là rất thấp so với mức ý nghĩa trong kiểm định5% nên mô hình hồi qui rất có ý nghĩa, nghĩa là các biến độc lập x1 (% tăng lên trong lượng tiền gởi) và x2 (lượngđơn vị tiền gởi) có ảnh hưởng đến biến phụ thuộc y (lợi tức ngân hàng).

     

    b) Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi qui nhiều chiều:   To

    Mô hình hồi qui nhiều chiều cho tổng thể có dạng:

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    13/18

     

    Ðặt a, b1, b2, ...,bk là những tham số được ước lượng cho tổng thể; là những độ lệch chuẩn đã ướlượng, và  coi phân phối chuẩn thì biến ngẫu nhiên t được tính như sau:

     

    Vì vậy, khoảng tin cậy 100(1-()% cho các hệ số hồi qui (i được tính như sau:

     

    ĉ là một số sao choĠ

    Ví dụ: Phương trình hồi qui tương quan liên hệ giữa % tiền gởi tiết kiệm, số đơn vị gởi tiền và lợi tứ ngân hàngtrong bảng kết quả trang 209 như sau:

     

      Khoảng tin cậy 99% cho (1 là:

      -0,108 - (2,819)(0,063) < 1 < -0,108 + (2,819)(0,063)

    hay -0,285 < 1 < 0,069.

    Vậy, khi cố định số đơn vị tiền gởi, cứ một 1% tăng lên trong lượng tiền gởi thì dẫn đến lợi tức giảm từ 0,3% đếntăng 0,069% xét trong khoảng tin cậy 99%.

     

      Khoảng tin cậy 99% cho (2 là:

      -0,00003 - (2,819)(0,00003) < 2 < - 0,00003 + (2,819)(0,00003)

    hay - 0,00011 < 2  < 0,00005.

    Vậy, khi cố định % tăng lên trong lượng tiền gởi, cứ tăng 1000 đơn vị tiền gởi thì làm giảm lợi tức từ 0,011% đếntăng 0,005%.

     

    c) Kiểm định giả thuyết cho các tham số hồi qui: To

    Phần kiểm định này giống như trong hồi qui một chiều nhưng thay độ tự do tn-2 bằng tn-k-1:

    Ðặt giả thuyết ĉĉĉ

    Giá trị kiểm định ĉ

     

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    14/18

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    15/18

    Ví dụ: Giả sử ta có một phương trình h i qui nhi u chi u có 4 bi n độc lập (k = 4), n = 31 và R2 = 0,72.

    Ðặt giả thuyết H0: (1 = (2 = (3 = (4 = 0.

    Kiểm định Ġ

    Tra bảng Fk,n-k-1,( = F4,26,1% = 4,14

    Vì vậy, giả thuyết H0 bị bác bỏ ở mức ý nghĩa 1%, điều này có nghĩa là nói chung các biến độc lập có ảnh hưởng tớ

    sự thay đổi của biến phụ thuộc. 

    e) Dự báo trong phương pháp hồi qui tương quan nhiều chiều: To

    Giả sử ta có một mô hình hồi qui tổng thể có dạng tổng quát như sau:

     

    Ðặt a, b1, ..., bk là những thông số được ước lượng của (, (1, ..., (k theo phương pháp số bình phương bé nhất. Dựvào thông tin mẫu ta có:

     

    Tương ứng với giá trị của các biến x1..n+1, x2. n+1, ..., xk.n+1 được cho trước thì mô hình tuyến tính dự đoántốt nhất cho yn+1 là:

     Trở lại ví dụ trong ngành ngân hàng lợi tức (y) bị ảnh hưởng bởi % tăng lên trong lượng tiền gởi (x1) và số

    đơn vị tiền gởi (x2). Giả sử rằng chúng ta muốn dự báo lợi tức trong một năm mà trong đó x1= 4,5% và x2=9.000đơn vị tiền gởi, phương trình hồi qui ước lượng tìm được ở phần trước là:

      y = 1,565 + 0,237x1 - 0,000249 x2

    Vì vậy, lợi tức tối ưu sẽ là 0,39 %.

     Sự dự đoán này có thể sử dụng để ước tính lợi nhuận mong muốn trong những điều kiện cụ thể.

     

    BÀI TẬP To

    1. Một mẫu ngẫu nhiên gồm 8 dự án có gía/sản phẩm và doanh thu lần lượt như sau:

    Doanh thu (triệu đồng): 12,2 18,6 29,2 15,7 25,4 35,2 14,7 11,1

    Giá (ngàn đồng): 29,2 30,5 29,7 31,3 30,8 29,9 27,8 27,0

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    16/18

      a. Tìm sự tương quan giữa doanh thu và giá?

      b. Kiểm định ở mức ý nghĩa 5% dựa vào kiểm định dạng 2 đuôi với giả thuyết H0 rằng hệ số tương quancủa tổng thể thì bằng 0?

    2. Những công ty đa quốc gia thường chuyển từ một sang nhiều liînh vực buôn bán hàng hóa và dich vụ khác nhautrên trường quốc tế. Họ có một sự linh hoạt rất lớn trong giá chuyển giao của các mặt hàng. Một nghiên cứu của hacông ty lớn đang hoạt động ở Việt Nam là P & G và Unilever nhằm xác định tầm quan trọng của 20 biến có liên hệnhững biến này có thể được xem xét trong việc thành lập chính sách chuyển giao giá quốc tế. Các biến này đã đượ

    xếp hạng trong bảng như sau:

    a. Hãy tính hệ số tương quan hạng của Spearman (Tied Rank)?

      b. Kiểm định giả thuyết H0 rằng không có sự tương quan giữa các biến ở mức ý nghĩa 5%?

    3. Một công ty đặt những giá khác nhau cho hệ thống âm ly đặc biệt cho 8 khu vực khác nhau trong nước. Bảngsau đây trình bày doanh thu và giá cả như sau: (triệu đồng)

    Giá 5,5 6,0 6,5 6,0 5,0 6,5 4,5 5,0

      Doanh thu 420 380 350 400 440 380 450 420

    Hãy ước lượng phương trình hồi qui của doanh thu trên giá và giải thích?

    4. Một mẫu gồm 25 công nhân ở một phân xưởng sản xuất được chọn ra. Mỗi công nhân được yêu cầu để đánhgiá sự thỏa mãn trong nghề nghiệp (x) trong phạm vi từ 1 đến 10. Hơn nữa, số lượng ngày vắng mặt (y) trongcông việc trong năm rồi đã được liệt kê cho số công nhân này theo đường hồi qui mẫu:

    y = 13,6 - 1,2x và Sb = 80,6

    a. Giải thích phương trình hồi qui?

     

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    17/18

      b. Ki m định ở mức ý mghĩa 1% dạng một đuôi giả thuy t H0 r ng không có quan hệ tuy n tính giữa sự thỏmãn nghề nghiệp và sự vắng mặt (nghỉ việc trong năm)?

    5. Một nhà phân tích tin rằng nhân tố quyết định quan trọng của lợi tức ngân hàng (y:%) là chênh lệch giữa lãi suấtcho vay và lãi suất tiền gởi (x:%). Một mẫu ngẫu nhiên gồm 20 nhà băng được chọn và đường hồi qui mẫu như sau:y = 0,97 + 0,47x và hệ số xác định R 2 = 0.72.

      a. Giải thích phương trình hồi qui?

     b. Kiểm định hai đuôi ở mức ý nghĩa 5% giả thuyết H0 rằng không có tổ hợp tuyến tính giữa x và y?

    6. Trong nghiên cứu nhận dạng vấn đề của một công ty muốn thâm nhập thị trường mới, công ty tiến hành đánh giásự ảnh hưởng của các nhân tố khác nhau trong việc có nên đặt một chi nhánh hay đặt một cơ sở sản xuất tại một nơnào đó hay không. Một mẫu ngẫu nhiên gồm 70 khu vực được khảo sát với các nhân tố như trong mô hình hồi quisau đây được ước lượng:

    y = -59,31 + 4,983x1 + 2,198x2 +3,816x3 - 0,31x4 - 0,886x5 + 3,215x6 + 0,085x7 

    (1,156) (0,21) (2,063) (0,33) (3,055) (1,568) (0,354)

    R 2 = 0.766

    Chú ý: số trong ngọăc dưới phương trình hồi qui là sai số chuẩn của mỗi  biến (Sbi).

    Trong đó:

      y: Thâm nhập thị trường mới

      x1: Dân số (triệu người)

      x2: Phạm vi hay mức độ rộng lớn của ngành

      x3: Số đo chất lượng đời sống kinh tế

      x4: Số đo chất lượng đời sống chính trị

      x5: Số đo chất lượng đời sống môi trường

      x6: Số đo chất lượng đời sống sức khỏe và y tế

      x7: Số đo chất lượng đời sống xã hội

    Yêu cầu:

      1. Giải thích phương trình hồi qui?

      2. Giải thích hệ số xác định?

      3. Tìm khoảng tin cậy 95% cho sự tăng lên trong y từ một đơn vị tăng lên trong x3, với tất cả nhân tố khákhông thay đổi?

      4. Kiểm định ở mức ý nghĩa 5% giả thuyết H0 rằng x5 không ảnh hưởng đến y, các nhân tố khác không thayđổi?

      5. Yêu cầu giống như câu 4 cho trường hợp x6?

      6. Kiểm định giả thuyết H0 rằng tất cả 7 biến độc lập trên không ảnh hưởng đến sự bắt đầu cuộc kinh doanhmới y ở mức ý nghĩa 5%?

  • 8/18/2019 Ph_¬ng ph¸p håi qui vµ t_¬ng quan

    18/18

    http://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/index.htmhttp://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/chuong7.htmhttp://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/decuong.htmhttp://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/chuong5.htmhttp://websrv1.ctu.edu.vn/coursewares/kinhte/phantichdulieu/chuong6.htm

Recommended