+ All Categories
Home > Documents > Nhap mon SAS

Nhap mon SAS

Date post: 21-Jan-2023
Category:
Upload: independent
View: 0 times
Download: 0 times
Share this document with a friend
25
NHẬP MÔN SAS Statistical Analysis System
Transcript

NHẬP MÔN SASStatistical Analysis

System

1. DATA STEP - data statement :This statement begin a data step and provides a name for the SAS dataset

- input statement : The input statement describes the arrangement of values in an input record and assigns input values to corresponding SAS variables.

2. Procedure STEP- PROC SORT :

SORT proceduce sorts observations in a SAS data set by one or more variables, storing the resulting sorted observation in a new SAS dataset or replacing the original .

- PROC FORMAT :Use the FORMAT procedure to define your own informats and formats for character of numeric variable. Option for the FORMATE produce print the contents of a format library , create a template data set for writing other informats and formats , or read a template date sat to create informats or format.

Specifications :PROC FORMAT option ;

VALUE name [(format option )] range = ‘formatted value’ … ;

- PROC MEANS: Specification:

PROC MEAN option;VAR variables;BY variables;

Dùng để tính giá trị trung bình của các quan sát

Phân tích phương saiPROC ANOVA : Specifications :PROC ANOVA options1 ;CLASS variables;MODEL dep. Variables = indep.variables;MEANS indep. Variables / options2;

Phân tích biến trong trường hợp phân phối tự do

PROC GLM : Specificasions :PROC GLM options ;CLASS variables;MODEL dep. Variables = indep. Variables;LSMEANS indep. Variables / options;

Sử dụng để phân tích tương quanPROC CORR: Specificasions :

PROC CORR options ;VAR variables ;WITH variables ;

PROC REG: Specifications :

PROC REG options ;MODEL dep. variable =

indep. variable ;

PROC PRINT;

Std Dev: Standard deviation – Độ lệch chuẩn

Std Error: Standard Error – Sai số chuẩn

MinimumMaximumMeanVarProb > |T| chỉ khả năng xảy ra so với giả thuyết Ho gọi là null hypothesis (so với hệ số bằng 0)

Thực tập SAS1. Nguyên tắc:- Các dòng lệnh, khi kết thúc phải có dấu ;

- Không được quá 8 ký tự cho mỗi option

- Số liệu mang tính liên tục sử dụng dấu @ hoặc @@

- Expired day là tháng 5/2005- Cửa sổ của SAS là: File Edit View Locals Globals Options Window Help

- Khi bắt đầu sử dụng vào cửa sổ: Globals> Program Editor

- Sử dụng các dòng lệnh theo yêu cầu

- Sau cùng của tất cả các dòng lệnh gõ: run;

- Kết thúc bấm vào submit- Đọc các thông tin, nếu cần copy thì có 2 cách

+ Bôi đen bằng cách rê chuột, copy và paste vào Word

+ Vào File>Save as: Chọn *.doc, sau khi đọc xong, Word sẽ hỏi lại có Save dạng SAS không thì trả lời là No, nếu trả lời Yes thì những gì được sửa chữa sẽ trở lại như cũ

Ví dụ: Hãy tính điểm kỳ thi chung và từng kỳ thi; sau đó xếp hạng. SUBJECT GENDER HOMEWORKNUMBER ( M or F ) EXAM 1 EXAM 2

GRADE 10 M 80

84 A 7 M 85

89 A 4 F 90

86 B 20 M 82

85 B 25 F 94

94 A 14 F 88

84 C

DATA TEST ; INPUT SUBJECT GENDER $ EXAM1 EXAM2 HWGRADE $;

DATALINES;10 M 80 84 A 7 M 85 89 A 4 F 90 86 B20 M 82 85 B25 F 94 94 A14 F 88 84 C ;PROC MEANS DATA =TEST ;RUN ;

So sánh hai nhóm, hai trung bìnhCông việc đầu tiên có liên quan đến việc kiểm tra giả thuyết chính là so sánh hai nhóm. Khi các điều kiện đúng được đáp ứng cho sự so sánh này, việc sử dụng t-test kiểm tra đám đông được dùng để so sánh trung bình của hai đám đông. Ngược lại nếu không đáp ứng được các điều kiện có một vài thủ tục của SAS để giải quyết việc so sánh này.

Khái niệm proc t-test - t-test laì mäüt bæåïc hoàûc lyï thuyãút thäúng kã maì noï âæåüc sæí duûng âãø so saïnh sæû khaïc nhau cuía hai trung bçnh cuía hai âaïm âäng (population mean) hay trung bçnh cuía caïc kãút quaí xæí lyï (treatment mean)- Âiãöu kiãûn thæûc hiãûn+ Hai nhoïm phaíi âäüc láûp+ Phán phäúi theo lyï thuyãút cuía trung bçnh máùu phaíi laì phán phäúi chuáøn+ Sæû biãún thiãn cuía hai nhoïm phaíi tæång âæång vaì bçnh âàóng- Giaí thuyãútHo (null hypothesis) trung bçnh cuía nhoïm xæí lyï vaì nhoïm âäúi chæïng khäng khaïc nhau ho: Mc=MtHa (alternative hypothesis) Giaí thuyãút læûa choün, ngæåüc laûi våïi Ho

Ví dụ: So saïnh aính hæåíng cuía viãûc baío quaín quaí åí nhiãût âäü 12oC so våïi âäúi chæïng våïi chè tiãu laì thåìi gian chên.

Âäúi chæïng Xæí lyï

80 100 93

10383 10489 9998 102

DATA XULY; INPUT GROUP $ TIME @@;DATALINES;C 80 T 100 C 93 T 103 C 83 T 104 C 89 T 99 C 98 T 102 ;PROC TTEST ; TITLE ‘T-test Example ‘; CLASS GROUP; VAR TIME;RUN;

DATA XULY; INPUT C T; DIFF = T - C; DATALINES;80 100 93 103 83 104 89 99 98 102 ;PROC TTEST ;

VAR DIFF;RUN;

Giả thiết là: ho: diff = 0; ha: diff ≠ 0

Hai biến độc lập có sự phân phối tự do:Trong trường hợp hai nhóm không đáp ứng được điều kiện của đánh giá t-test, nhất là không đảm bảo được sự phân phối bình thường thì bài toán phải chuyển sang xử lý dạng khác có sự can thiệp của các tham số toán học.Ví dụ: Đánh giá kết quả của việc xử lý ung bướu qua việc có dùng thuốc và không có dùng thuốc, kết quả như sau (tỷ lệ mắc bệnh):Nhóm A (đối chứng) 3.1 2.2 1.7 2.7 2.5Nhóm B (xử lý) 0.0 0.0 1.0 2.3

DATA TUMOR ; INPUT GROUP $ MASS @@ ;DATALINES;A 3.1 A 2.2 A 1.7 A 2.7 A 2.5B 0.0 B 0.0 B 1.0 B 2.3 ;PROC NPAR1WAY DATA=TUMOR WILCOXON ; TITLE ‘ Nonparametric Test to Compare Tumor Masses ‘ ; CLASS GROUP ; VAR MASS ; EXACT WILCOXON ;RUN ;

Ví dụ: Hãy so sánh lượng sinh khối được sinh ra từ 3 phương pháp lên men

X, Y, Z X

Y Z 700

480 500 850

460 550 820

500 480 640

570 600 920

580 610

DATA ferment ; INPUT GROUP $ RESULTS @@ ;DATALINES ;X 700 X 850 X 820 X 640 X 920Y 480 Y 460 Y 500 Y 570 Y 580Z 500 Z 550 Z 480 Z 600 Z 610 ;PROC ANOVA DATA=FERMENT ;

CLASS GROUP ; MODEL RESULTS=GROUP ; MEANS GROUP ; (có thể thêm options)RUN ;

1. CRD with samplingProc ANOVA;Class treat rep;Model res = treat rep(treat);Test h=treat e=rep(treat);

2. RCBD/RCB Proc ANOVA;Class trt block;Model res = block trtMeans trt / lsd;

3. RCB with sampling Proc ANOVA;Class trt blk;Model res = blk trt blk*trt;Test h=trt e=trt*blk

4. Factorial with RCBProc ANOVA;Class blk A C;Model res = blk A | C;Test h=A|C e=A|C;


Recommended