+ All Categories
Home > Data & Analytics > Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Date post: 21-Jul-2015
Category:
Upload: si-thinh-hoang
View: 904 times
Download: 10 times
Share this document with a friend
39
Phần 3 – Những phân tích căn bản trong SPSS 10 – Lựa chọn kỹ thuật thống kê phù hợp Hoàng Sĩ Thính Học viện Nông nghiệp Việt Nam Mobile: 0942293689 Email: [email protected] Facebook: [email protected]
Transcript
Page 1: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Phần 3 – Những phân tích căn bản trong SPSS

10 – Lựa chọn kỹ thuật thống kê phù hợp

Hoàng Sĩ ThínhHọc viện Nông nghiệp Việt NamMobile: 0942293689Email: [email protected]: [email protected]

Page 2: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

1. Sự cần thiết phải chọn đúng kỹ thuật thống kê

• Một trong những việc khó nhất đối với người nghiên cứu là chọn đúng kỹ

thuật thống kê để phân tích số liệu

• Việc lựa chọn kỹ thuật thống kê tùy thuộc vào câu hỏi nghiên cứu mà bạn

đang phải trả lời, và đặc điểm số liệu bạn có

• Vì vậy, là một người nghiên cứu, bạn cần có những hiểu biết căn bản về

các kỹ thuật thống kê, các dạng câu hỏi phù hợp với các kiểu kỹ thuật

thống kê, các giả định và yêu cầu của từng kỹ thuật thống kê.

• Làm cách nào để hiểu được các điều trên??? Hãy đọc sách, bài báo…

• Việc quyết định lựa chọn một kỹ thuật thống kê cũng giống như quyết

định làm một món ăn. Bạn cần quan tâm đến hai điều: bạn đang có gì

(what you have) và bạn muốn mốn gì với những gì mình có (what you

want).

Page 3: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

2. Khái quát chung về các kỹ thuật thống kêsử dụng trong nghiên cứu

Tổng quát, các kỹ thuật thống kê được chia làm hai loại: các kỹ thuật

phân tích mối quan hệ giữa các biến (vd: giữa tuổi và độ lạc quan); và

các kỹ thuật so sánh khác biệt giữa các nhóm (vd: khác biệt về mức

độ lạc quan giữa nam và nữ)

Page 4: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

3. Kỹ thuật phân tích quan hệ giữa các biến liên tục(Exploring relationship)

1. Kỹ thuật phân tích tương quan (Correlation): Pearson correlation hoặc

Spearman correlation được sử dụng để phân tích mối quan hệ (cả độ

mạnh – strength, và xu hướng – direction) giữa hai biến liên tục. Chủ

đề này được cover trong Chapter 11

2. Kỹ thuật phân tích tương quan từng phần (Partial correlation): là một

dạng mở rộng của Pearson Correlation. Kỹ thuật này cho phép loại bỏ

ảnh hưởng của một biến ngoại sinh (vd: biến lạm phát có thể làm cho

phân tích tăng trưởng kinh tế trở nên mơ hồ). Nội dung này được

phân tích kỹ trong chương 12

Page 5: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

3. Phân tích hồi quy bội (hồi quy đa biến – Multiple Regression):

– Là dạng mở rộng phức tạp của phân tích tương quan.

– Kỹ thuật này cho phép phân tích ảnh hưởng (khả năng dự báo) của

một nhóm các biếnđộc lập tới một biến phụ thuộc liên tục.

– Kỹ thuật này được chi tiết ở Chapter 13

3. Kỹ thuật phân tích quan hệ giữa các biến liên tục(Exploring relationship)

Page 6: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

4. Phân tích nhân tố (factor analysis):

– kỹ thuật này cho phép chuyển một số lượng biến lớn (hoặc một số

lượng lớn các thành phần của một biến) thành một số lượng biến nhỏ

hơn (hoặc một số lượng nhỏ hơn các thành phần của biên – chỉ tiêu

nghiên cứu). Tại sao??? Để tạo ra một tập hợp các biến (hoặc nhóm

thành phần của biến) có ý nghĩa hơn

– Việc gộp biến (nhóm các thành phần biến) được thực hiện như thế

nào? Bằng cách phân tích đặc điểm tương quan, từ đó tìm ra các

nhóm biết (nhóm thành phần biến) có tương quan rất mạnh. Các

nhóm này sau đó sẽ được gộp thành một biến (hoặc một thành phần

của biến)

– Kỹ thuật này thường được sử dụng để phát triển một chỉ tiêu nghiên

cứu (chỉ tiêu mới)

3. Kỹ thuật phân tích quan hệ giữa các biến liên tục(Exploring relationship)

Page 7: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

1. Có thể sử dụng phân tích “Chi Square Test for Relatedness or

Independence”.

Ví dụ: bạn muốn xem liệu giới tính (biến gender – biến catigorical) có ảnh

hưởng đến tỷ lệ người từ bỏ một phương thức trị bệnh (Drop out/ Continue).

2. Phân tích sự khác biệt (Discriminant function analysis):

– Phân tích khả năng dự đoán dựa trên một tập biến độc lập đối với một

biến categorical phụ thuộc

– Điều đó cũng như bạn muốn tìm ra những biến có ảnh hưởng quyết

định đến tình trạng phân loại nhóm của biến phụ thuộc (group

membership)

– Biến phụ thuộc thường là các tiêu chí rõ ràng (vd: passed/ failed;

dropped out/ continued with a treatment)

4. Kỹ thuật phân tích quan hệ giữa các biến trong đóbiến phụ thuộc là categorical (Exploring relationship)

Page 8: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

• Phân tích tương quan cổ điển (hoặc phân tích Canonical Correlation):

– Dùng để phân tích mối quan hệ của hai nhóm biến

– Vd: phân tích mối quan hệ giữa nhóm biến nhân chủng học (demographic

variables) và nhóm biến gồm phúc lợi (wellbeing) và biến đánh giá

(adjustment)

• Mô hình phương trình cấu trúc (Structured Equation Modeling)

– Cho phép kiểm định các mô hình trong đó có mô tả mối quan hệ giữa các biến

– Cụ thể 1: có thể kiểm định độ mạnh trong tác động của từng biến đến mô

hình, hoặc độ chặt (thích hợp) của mô hình với những số liệu bạn có.

– Cụ thể 2: Kỹ thuật này còn cho phép so sánh giữa các dạng mô hình có thể

thay thế lẫn nhau.

4. Kỹ thuật phân tích quan hệ giữa các biến trong đóbiến phụ thuộc là categorical (Exploring relationship)

Page 9: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm

T-Test

• Chỉ sử dụng cho Parametric Test – biến liên tục

• T-Test được sử dụng khi nào??

Khi bạn muốn so sánh giá trị trung bình của hai nhóm khác cases (vd: males và

females), hoặc của hai dãy số liệu cùng cases (before và after).

• Có 2 loại T-test:

– Kiểm định T-test lặp (Paired sample t-tests, hay repeated measures): được dùng

cho kiểm định khác biệt của chỉ tiêu ở hai thời điểm điều tra khác nhau trên cùng

đối tượng (các cases ở hai lần là như nhau). Thông thường được ứng dụng cho các

động thái can thiệp (chính sách)

– Kiểm định T-test mẫu độc lập (Independent sample t-test): được dùng để so sánh

giá trị trung bình biến (chỉ tiêu) của hai nhóm cases khác nhau cùng một thời điểm

(males và females)

• T-test được trình bày cụ thể ở Chapter 17

• Chú ý: Để kiểm định nhóm non-parametric người ta thường sử dụng Mann-Whitney

U Test và Wilcoxon Signed Rank Test – Chi tiết trong Chapter 16

Page 10: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

5. Kỹ thuật thống kê phân tích khác biệt giữa các nhómPhân tích phương sai một chiều

One-way analysis of variance - ANOVA

• Chỉ dùng cho parametric test

• Cũng giống như T-test, nhưng với số nhóm từ 2 trở lên (T-test chỉ làm cho 2 nhóm)

• Tại sao lại gọi là one-way? Vì nó chỉ sử dụng trong nghiên cứu ảnh hưởng của 1 biến độc lập lên biến phụ thuộc

• Kiểm định ANOVA chỉ giúp bạn cho biết có sự khác biệt hay không giữa các nhóm, nhưng không cho biết mức độ khác biệt là bao nhiêu (significant difference) – Post hoc analysis để tìm ra significant diffrence

• Cũng có 2 dạng ANOVA:

– Kiểm định ANOVA với biến lặp (cùng cases nhưng với hơn 2 thời điểm khácnhau)

– Kiểm định ANOVA mẫu độc lập: kiểm định trung bình biến với 2 hoặc nhiềuhơn số nhóm cases khác nhau (trẻ, trung niên, già)

• One-way ANOVA được chi tiết trong Chapter 16, trong khi các kiểm định non-parametric như là Kruskal-Wallis Test and Friedman Test sẽ được trình bày trongChapter 16

Page 11: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

• Cho phép phân tích ảnh hưởng của hai biến độc lập lên một biến phụ thuộc

• Lợi thế của kỹ thuật này là cho phép kiểm định ảnh hưởng cộng hưởng (interaction effect) – tức là

ảnh hưởng của một biến chịu tác động bởi một biến khác. Vd: mức độ lạc quan (optimism) tăng khi

tuổi (age) tăng, nhưng chỉ với nhóm nam (males)

• Kỹ thuật này còn cho phép kiểm định ảnh hưởng của riêng biệt từng biến độc lập (sex, age,…) đến

biến phụ thuộc

• Có hai kỹ thuật two-way ANOVA: ANOVA cho các nhóm khác nhau (between group ANOVA – các

cases ở các nhóm khác nhau, vd: males và females), và ANOVA lặp (repeated measures ANOVA -

cùng cases nhưng được theo dõi trong nhiều lần khác nhau)

• Between group ANOVA và repeated measures ANOVA có thể được kết hợp cùng nhau trong cùng

một nghiên cứu. Kỹ thuật kết hợp này được gọi là “Mixed Between-Within Designs” hoặc “Split-

Plot” (chi tiết ở Chapter 20)

• Kỹ thuật two-way ANOVA được chi tiết trong chapter 19

5. Kỹ thuật thống kê phân tích khác biệt giữa các nhómPhân tích phương sai hai chiều

Two-way analysis of variance - ANOVA

Page 12: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

• Được sử dụng để so sánh các nhóm cho (hoặc dựa trên) các biến

phụ thuộc khác nhau, nhưng có liên quan đến nhau

Vd: So sánh các biện pháp trị bệnh khác nhau (các nhóm khác

nhau) trên cơ sở tập hợp các tác dụng (các biến phụ thuộc) về sợ hãi

(anxiety), thất vọng (depression), và các triệu chứng vật lý (physical

symptoms)

• MANOVA có thể được sử dụng theo kiểu one-way, two-way hoặc

các phân tích so sánh có nhiều hơn các biến độc lập

• MANOVA được chi tiết trong Chapter 21

5. Kỹ thuật thống kê phân tích khác biệt giữa các nhómPhân tích phương sai đa chiều

Multivariate analysis of variance - MANOVA

Page 13: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

5. Kỹ thuật thống kê phân tích khác biệt giữa các nhómPhân tích hiệp phương sai

Analysis of covariance (ANCOVA)

• Kỹ thuật này cho phép bạn kiểm soát ảnh hưởng của biến ngoại

sinh(confounding variable, hoặc covariate) đến mô hình

• Vd: ảnh hưởng của các biến độc lập lên biến phụ thuộc (ảnh hưởng

1) có thể chịu ảnh hưởng (ảnh hưởng 2) bởi một biến (một số biến)

nào khác. Kỹ thuật này cho phép bạn kiểm soát (loại trừ) ảnh hưởng

2

• ANCOVA có thể sử được sử dụng như là một phần của one-way,

two-way, hoặc các thiết kế multivariate designs

• ANCOVA được chi tiết trong Chapter 22

Page 14: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

6. Chú ý khi ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn)

• Như vậy có khá nhiều kỹ thuật thống kê, bạn phải lựa chọn cái nào

phù hợp với những gì mình có và những gì mình muốn

• Khi đi đến quyết định lựa chọn bạn cần phải quan tâm đến:

– Câu hỏi nghiên cứu của bạn là gì?

– Loại chỉ tiêu (biến) và thành phần biến mà bạn có trong phiếu

điều tra

– Đặc điểm số liệu của chỉ tiêu (biến) mà bạn có

– Các giả định thống kê bạn cần phải đảm bảo ứng với mỗi kỹ

thuật thống kê có thể sử dụng

Page 15: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bước 1: Câu hỏi nghiên cứu là gì?

• Liệt kê tất cả những câu hỏi nghiên cứu bạn muốn trả lời

• Chú ý: mỗi câu hỏi nghiên cứu có thể được hỏi theo những cáchkhác nhau (sử dụng những kỹ thuật khác nhau để trả lời)

– Vd: khi bạn muốn nghiên cứu ảnh hưởng của tuổi (age) đếnmức độ lạc quan (optimism), bạn có thể đặt thành các câu hỏi:

• Có bất kỳ mối liên hệ nào giữa tuổi và mức độ lạc quankhông?

• Liệu người cao tuổi có lạc quan hơn người trẻ không?

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn)

Page 16: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bước 2: Xác định các chỉ tiêu (biến - scale) và các thành phần biến (items) dùng để

trả lời từng câu hỏi nghiên cứu

• Đặc điểm của chỉ tiêu và items trong chỉ tiêu có ý nghĩa quyết định đến kỹ thuật

thống kê bạn sẽ sử dụng để trả lời câu hỏi nghiên cứu.

• Cũng chính vì thế mà trước khi phát triển chỉ tiêu nghiên cứu (và phiếu điều tra)

bạn cần chú ý đến dự định về các phân tích của mình về sau này

• Chẳng hạn, cũng là thông tin về tuổi (age), các cách hỏi khác nhau sẽ tạo ra định

dạng số liệu khác nhau, và do đó kỹ thuật thống kê sử dụng cũng sẽ khác:

– Nếu bạn hỏi họ tick vào một trong hai lựa chọn dưới hoặc trên 35, thì bạn chỉ

có hai giá trị biến tuổi, và như thế kỹ thuật thống kê sử dụng sẽ rất hạn chế.

– Trái lại, nếu bạn yêu cầu người trả lời cho biết tuổi của họ (in years), tình hình

sẽ khác hẳn. Bạn có một dãy số liệu (từ 18 đến 80+). Bạn có thể gộp nhóm

tuổi (collapse) để thực hiện một số phân tích (như ANOVA), trong khi dãy số

liệu ban đầu vẫn hoàn toàn khả thi cho phân tích khác (correlation chẳng hạn)

Tóm lại: hãy kiểm tra lại các biến (cả độc lập và phụ thuộc) xem nó được đo lường

thế nào (dạng số liệu là gì). Cái đó kết hợp với câu hỏi nghiên cứu, bạn sẽ có ý tưởng

cho việc nên lựa chọn kỹ thuật thống kê nào!

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn)

Page 17: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bước 3: Xem xét kỹ hơn về đặc điểm của biến

• Về tổng quát: biến nào là biến độc lập, biến nào là biến phụ thuộc? Câu trả lời đến từ

đặc điểm số liệu bạn có, cộng với hiểu biết của bạn về nội dung nghiên cứu, về các

nguyên lý, và về các nghiên cứu trước đó

• Hãy chắc chắn về mặt tư duy: biến nào gây nên ảnh hưởng (đó là independent

variable), biến nào chịu ảnh hưởng (đó là dependent variable)

• Có một số kỹ thuật thống kê (vd: correlation) không cần phân biệt đầu là biến độc lập,

đâu là biến phụ thuộc. Tuy nhiên, với một số kỹ thuật khác thì lại khác (vd: ANOVA)

• Chú ý về định dạng giá trị của biến

– Dạng biến phân loại (categorical – dạng biến định danh): Males/ females

– Dạng biến ordinal (ranking: 1st, 2nd, 3rd), và

– Dạng biến liên tục (continuous): dạng interval và ratio , vd: ages in years, scores on

the Optimism scale

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn)

Page 18: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bước 3: Xem xét kỹ hơn về các biến

Một số chú ý thêm về biến liên tục và biến phân loại:

• Đối với biến liên tục, bạn cần tìm hiểu thêm thông tin về phân bố

của chúng: chuẩn hay không chuẩn? Độ bao phủ (range) của nó ra

sao? (Chapter 6)

• Đối với biến categorical (vd: males/females) hãy tìm ra số lượng các

cases trong mỗi nhóm. Số lượng các cases trong các nhóm có cân

bằng nhau hay không? Có nhóm nào bị trống không? (Chapter 6)

Tất cả những thông tin trong bước 3 bạn có được từ biến sẽ có tác

dụng rất tích cực trong việc đi đến quyết định lựa chọn kỹ thuật thống

kê cho đề tài của mình

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn)

Page 19: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bước 4: Tưởng tượng biểu đồ (đồ thị, biểu, bảng) cho mỗi câu hỏi nghiên cứu

• Về khái quát: bạn cần rõ tôi muốn phân tích quan hệ giữa các biến, hay muốn

phân tích sự khác biệt giữa các nhóm

• Từ đó hãy tóm lược đặc điểm của các thông tin bạn có, rồi nghĩ (brainstorming)

ra những biều đồ bạn sẽ dùng để trả lời cho mỗi câu hỏi nghiên cứu.

Một số Slide sau sẽ minh hoạc một số ví dụ chỉ cho bạn biết bạn cần tư duy như

thế nào cho bước 4 (rất quan trọng – vd cho đề cương chi tiết của một nghiên

cứu)

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn)

Page 20: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Vd 1: Nếu bạn muốn trả lời câu hỏi: “liệu có mối quan hệ giữa tuổi (age) và mức độ

lạc quan (optimism) không?”, thì bạn cần phải tư duy về những nội dung sau:

• Tư duy về biến (variables):

– Biến tuổi (age): là biến continuous, đo lường bằng số năm, từ 18 đến 80+

– Biến lạc quan (optimism): là biến continuous, đo lường bằng mức độ lạc quan,

từ 6 đến 30. Tại sao lại từ 6 đến 30???

• Tư duy về dạng biểu đồ (diagram)

– Hãy sử dụng literature để phán đoán về mối quan hệ

– Hình dung (vẽ) mối quan hệ ra giấy

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)

Page 21: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Ví dụ 2: Với câu hỏi “liệu nam giới có lạc quan hơn nữ giới không?”, bạn cầnphải tư duy như sau:

• Variables:

– Sex: independent, categorical (two groups): males/ females

– Optimism: dependent, continuous, đo lường bằng mức độ lạc quan(từ 6 đến 30)

• Hình dung dạng biểu đồ:

– Chỉ có một biến độc lập dạng phân loại (2 nhóm) và 1 biến phụ thuộcliên tục

– Do đó, dạng biểu đồ sẽ như sau:

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)

Page 22: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Ví dụ 3: Với câu hỏi “liệu ảnh hưởng của tuổi đến mức độ lạc quan có khác nhau

giữa 2 nhóm nam và nữ không?”, bạn cần phải tư duy:

• Kiểu ảnh hưởng: ảnh hưởng tổng hợp của cả biến tuổi (age) và biến giới tính

(gender). Do đó bạn có thể chia tuổi thành các nhóm khác nhau (vd: dưới 30, từ

31 đến 49 và từ 50 trở lên)

• Tư duy về biến (variables):

– Sex: independent, categorical: males/ females;

– Age: independent, categorical, chia làm 3 nhóm cân bằng nhau

– Optimism: dependent, continuous: đo lường bằng mức độ lạc quan, từ 6 đến 30

• Biểu đồ có thể sẽ như sau:

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)

Page 23: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Ví dụ 4: Với câu hỏi “sự biến động trong mức độ hài lòng về cuộc sống có thểđược giải thích như thế nào bởi các yếu tố thuộc về đặc điểm cá nhân (tựtrọng – self-esteem, optimism – lạc quan, perceived control – điều khiểnnhận thức)?”, bạn cần tư duy về:

• Variables:

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)

Page 24: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bước 5: Quyết định xem kỹ thuật thống kê nào sẽ phù hợp: thống kê tham số

(parametric) hay thống kê phi tham số (non-parametric)

• Nhớ rằng các kỹ thuật thống kê có thể đi (được chia) theo hai nhóm: thống kê

tham số (parametric statistics) và thống kê phi tham số (non-parametric

statistics). Thông thường thống kê tham số được xem là mạnh hơn, tuy nhiên

nó đò hỏi những ràng buộc nhất định

• Ví dụ về giả định của thống kê tham số: giá trị biến phải đảm bảo phân bố

chuẩn

• Ngoài ra, các thống kê tham số đòi hỏi các giả định khác (chi tiết ở từng

Chapter đối với từng kỹ thuật).

• Do đó, bạn cần kiểm tra tình trạng vi phạm các giả định của kỹ thuật thống kê

trước khi bạn dùng mỗi kỹ thuật cụ thể.

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn)

Page 25: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bạn có thể làm gì nếu số liệu vi phạm các giả định thống kê??? Có một số cách:

• Cách 1 (Option 1): bạn vẫn có thể dùng parametric statistics với hy vọng rằng các vi

phạm không ảnh hưởng quá nghiêm trọng đến kết quả nghiên cứu.

– Một số học giả cho rằng các tiếp cận (trong đó có kỹ thuật thống kê) thường khá mạnh (robust) và

chúng có thể hạn chế tốt những ảnh hưởng của các vi phạm, đặc biệt nếu dung lượng mẫu lớn

– Nếu bạn vẫn lựa chọn tiếp tục con đường của mình, bạn cần thu thập nhiều bằng chứng để hỗ trợ

cho quyết định của mình. Hãy sử dụng các nghiên cứu có sẵn, đặc biệt là các nghiên cứu có sử dụng

cùng chỉ tiêu nghiên cứu như của bạn. Hãy xem họ đã làm gì với vấn đề phi phạm giả thiết ấy???

• Cách 2 (Option 2): Bạn có thể manipulate số liệu của mình nhằm thỏa mãn các giả thiết

thống kê của mình (vd: bạn có một số cách để chuyển từ biến không chuẩn thành biến

chuẩn – Chapter 8). Một khi thực hiện chuyển biến, bạn cũng cần tìm đủ bằng chứng để

support cho việc làm của mình

• Cách 3 (Option 3 – cách cuối cùng): nếu số liệu không đảm bảo giả định thống kê

parametric, hãy sử dụng thống kê non-parametric. Mặc dù các kỹ thuật này cũng yêu

cầu một số giả định, nhưng sẽ không khắt khe như trường hợp parametric statistic. Tuy

nhiên, các kỹ thuật này sẽ “yếu” hơn các kỹ thuật parametric statistics (Non-parametric

statistics sẽ kỹ hơn ở Chapter 16)

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn)- Bước 5 (tiếp)

Page 26: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bước 6: Ra quyết định cuối cùng

Đến đây bạn sẽ biết nên dùng kỹ thuật thốngkê nào cho phù hợp với những gì bạn có vànhững gì bạn muốn!

7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp(Quyết định lựa chọn phương thức làm món ăn)

Page 27: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản8.1 Phân tích quan hệ giữa các biếnKỹ thuật 1: Chi square for independence

Vd câu hỏi nghiên cứu: “quan hệ giữa giới tính và số người từ bỏ điều bệnhnhư thế nào?”

• Bạn cần phải có gì?

– Một biến độc lập, dạng phân loại (sex: males/ females)

– Một biến phụ thuộc, dạng phân loại (dropout: Yes/ No)

• Bạn muốn gì? Số người (từ bỏ/ không từ bỏ điều trị) ở mỗi nhóm (males/females)

• Dạng biểu độ sẽ là:

Page 28: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

• Câu hỏi nghiên cứu: “liệu có quan hệgiữa tuổi và mức độ lạc quan không?Liệu lạc quan có tăng khi tuổi tăngkhông?”

• Những thứ bạn phải có: 2 biếncontinuous (age và optimism)

• Biểu đồ sẽ có dạng dưới đây

• Kỹ thuật thống kê có thể thay thế:

Spearman's Rank Order Correlation

8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản8.1 Phân tích quan hệ giữa các biếnKỹ thuật 2: Phân tích tương quan (Correlation)

Page 29: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Câu hỏi nghiên cứu: Sau khi đã kiểm soát được

biến socially desirable responding, có mối quan

hệ rõ rệt nào giữa biến optimism và life

satisfaction không?

• Bạn cần có gì? 3 biến liên tục (life satisfaction,

optimism, và socially desirable responding)

8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản8.1 Phân tích quan hệ giữa các biếnKỹ thuật 3: Phân tích tương quan từng phần (Partial Correlation)

Page 30: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

• Câu hỏi nghiên cứu: Sự biến động của biến life satisfaction được giải thích

như thế nào bởi một tập hợp các biến self-esteem, optimism, và perceived

control? Biến nào giải thích tốt hơn về sự biến động của life satisfaction?

• Bạn cần có gì?

– Một biến phụ thuộc, dạng continuous (life satisfaction), và

– Hai hoặc nhiều hơn hai biến độc lập, dạng continuous (self-esteem,

optimism, perceived control)

• Dạng biểu đồ:

8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản8.2 Phân tích sự khác biệt giữa các nhómKỹ thuật 6: Phân tích tương hồi quy đa biến (Multiple regression)

Page 31: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Câu hỏi nghiên cứu: “nam giới có lạc quan hơn nữ giới không?”

• Bạn cần có gì?

– Một biến độc lập, dạng phân loại chia thành hai nhóm (biến sex: males/ females)

– Một biến độc lập, dạng continuous (optimism scores)

• Dạng biểu đồ:

• Kỹ thuật thống kê phi tham số thay thế: Mann-Whitney Test

8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản8.2 Phân tích khác biệt giữa các nhómKỹ thuật 7: Kiểm định T-test mẫu độc lập (Independent samples T-test)

Page 32: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Câu hỏi nghiên cứu: “liệu khóa đào tạo 10 tuần về tâm lý có làm giảm mức độ sợhãi của người tham gia hay không? Có sự thay đổi nào trong mức độ sợ hãi từthời gian 1 (trước đào tạo - pre-intervention) đến thời gian 2 (sau đào tạo – post-intervention) hay không?”

• Bạn cần có gì?

– Một biến độc lập, dạng phân loại (Time 1 – before intervention, Time 2 –after intervention)

– Một biến phụ thuộc, dạng continuous (anxiety scores)

• Chú ý: trường hợp này là cùng cases, được theo dõi vào các thời điểm khácnhau

• Dạng biểu đồ:

• Thống kê phi tham số có thể thay thế: Wilcoxon Signed-Rank Test

8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản8.2 Phân tích khác biệt giữa các nhómKỹ thuật 8: Kiểm định T-test mẫu lặp (Paired Samples T-test – repeated measures)

Page 33: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

• Câu hỏi nghiên cứu: “mức độ lạc quan (optimism score) có khác nhau giữa cácnhóm người dưới 30 tuổi, từ 31 đến 49 tuổi, và từ 50 tuổi trở lên không?”

• Bạn cần có:

– Một biến độc lập, dạng phân loại cho 2 hoặc nhiều hơn 2 nhóm (age:under 30, 31-49, over 50) và

– Một biến phụ thuộc, dạng continuous (optimism score)

• Thống kê phi tham số có thể thay thế: Không có

• Chú ý thêm:

Phân tích phương sai có thể được mở rộng cho các trường hợp có từ 3 biếnđộc lập trở lên (thường được gọi là phân tích nhân tố của phương sai – FactoralAnalysis of Variance)

8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản8.2 Phân tích khác biệt giữa các nhómKỹ thuật 9: Phân tích ANOVA một chiều mẫu độc lập (One-way between groups analysis of Variance)

Page 34: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

• Câu hỏi nghiên cứu: “Biện pháp can thiệp nào (kỹ năng toán – math skills/ và tạo niềmtin – confidence building) có hiệu quả hơn trong giảm thiểu thống kê về nỗi sợ hãi đượcđo lường trong 3 giai đoạn (trước khi can thiệp – pre-intervention, sau khi can thiệp –post-intervention, ba tháng sau khi can thiệp – three month follow up)

• Bạn cần có:

– Một biến độc lập chia thành các nhóm khác nhau (one between groupsindependent variable – type of intervention)

– Một biết độc lập chia thành các nhóm như nhau (one within groups independentvariable – time1, time2, time3)

• Dạng biểu đồ như sau:

• Thống kê phi tham số có thể thay thế: không có

8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản8.2 Phân tích khác biệt giữa các nhómKỹ thuật 10: Phân tích ANOVA kết hợp cả mẫu độc lập và mẫu lặp (Mixed between and within groups analysis of Variance)

Page 35: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

• Câu hỏi nghiên cứu: “liệu nam giới có khả năng kiểm soát tốt hơn nữ giới trongnhững vấn đề liên quan đến sức khỏe thể chất và tâm lý (sợ hãi, thất vọng, vàáp lực cuộc sống)?”

• Bạn cần có:

– Một biến độc lập, dạng định danh (sex: males/ females); và

– Hai hoặc nhiều hơn hai biến phụ thuộc, dạng continuous (anxiety,depression, and perceived stress)

• Dạng biểu đồ có thể là:

• Kỹ thuật thống kê phi tham số có thể thay thế: Không có

• Chú ý thêm: MANOVA có thể được sử dụng với phân tích một chiều (01 biếnđộc lập), hoặc hai chiều (02 biến độc lập), và nhiều chiều hơn nữa.

8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản8.2 Phân tích khác biệt giữa các nhómKỹ thuật 11: Phân tích phương sai đa chiều (Multivariate Analysis of Variance -MANOVA)

Page 36: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

• Câu hỏi nghiên cứu: “Có hay không sự khác biệt về mức độ sợ hãi giữa haibiện pháp điều trị (hai nhóm khác nhau) gồm maths skills và confidence building, giả định rằng những ảnh hưởng của mức độ sợ hãi trước khi cócác biệt pháp can thiệp (điều trị) đã được kiểm soát (hoặc loại bỏ)

• Bạn cần có gì?– Một biến độc lập, dạng phân loại (type of intervention – maths skills và confidence

building)

– Một biến phụ thuộc, dạng continuous (Fear scores at Time 2); và

– Một biến kiểm soát (tức là biến ta muốn tách ảnh hưởng của nó ra), dạng continuous (Fear scores at Time 1 – Pre-intervention)

• Thống kê phi tham số có thể thay thế: Không có

• Chú ý thêm:

• ANCOVA có thể sử dụng với phân tích một chiều (một biến độc lập), haichiều (hai biến độc lập), và phân tích đa chiều (hai hoặc nhiều hơn haibiến phụ thuộc)

8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản8.2 Phân tích khác biệt giữa các nhómKỹ thuật 12: Phân tích hiệp phương sai (Analysis of Covariance - ANCOVA)

Page 37: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bảng tóm tắt các kỹ thuật thống kê phổ biến

Page 38: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bảng tóm tắt các kỹ thuật thống kê phổ biến

Page 39: Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Tham khảo

http://www.allenandunwin.com/spss/default.html


Recommended