Post on 09-Feb-2022
transcript
Statistical Inference Using SASSAS Code Workshop Series
Qiang Wu
Department of Biostatistics, East Carolina University
February 10, 2012
1 / 87
Analyzing Categorical Data
2 / 87
Survey Data
3 / 87
Variable Description
Col. Description Var. Name Type1-3 Subject ID ID4-5 Age in years AGE Quantitative
6 Gender GENDER Categorical7 Race RACE Categorical8 Marital status MARITAL Categorical9 Education level EDUCATION Categorical
10 President doing good job PRESIDENT Likert Scale11 Arms budget increased ARMS Likert Scale12 Federal aid to cities CITIES Likert Scale
4 / 87
Data Format
PROC FORMAT;
VALUE $SEXFMT '1' = 'Male'
'2' = 'Female'
OTHER = 'Miscoded';
VALUE $RACE '1' = 'White'
'2' = 'African Am.'
'3' = 'Hispanic'
'4' = 'Other';
VALUE $OSCAR '1' = 'Single'
'2' = 'Married'
'3' = 'Widowed'
'4' = 'Divorced';
VALUE $EDUC '1' = 'High Sch or Less'
'2' = 'Two Yr. College'
'3' = 'Four Yr. College'
'4' = 'Graduate Degree';
VALUE LIKERT 1 = 'Str Disagree'
2 = 'Disagree'
3 = 'No Opinion'
4 = 'Agree'
5 = 'Str Agree';
RUN;
DATA QUEST;
INPUT ID $ 1-3
AGE 4-5
GENDER $ 6
RACE $ 7
MARITAL $ 8
EDUCATION $ 9
PRESIDENT 10
ARMS 11
CITIES 12;
LABEL MARITAL = "Marital Status"
EDUCATION = "Education Level"
PRESIDENT = "President Doing a Good Job"
ARMS = "Arms budget Increase"
CITIES = "Federal Aid to Cities";
FORMAT GENDER $SEXFMT.
RACE $RACE.
MARITAL $OSCAR.
EDUCATION $EDUC.
PRESIDENT ARMS CITIES LIKERT.;
DATALINES;
001091111232
002452222422
003351324442
004271111121
005682132333
006651243425
;
RUN;
5 / 87
Data Input
PROC FORMAT;
VALUE $SEXFMT '1' = 'Male'
'2' = 'Female'
OTHER = 'Miscoded';
VALUE $RACE '1' = 'White'
'2' = 'African Am.'
'3' = 'Hispanic'
'4' = 'Other';
VALUE $OSCAR '1' = 'Single'
'2' = 'Married'
'3' = 'Widowed'
'4' = 'Divorced';
VALUE $EDUC '1' = 'High Sch or Less'
'2' = 'Two Yr. College'
'3' = 'Four Yr. College'
'4' = 'Graduate Degree';
VALUE LIKERT 1 = 'Str Disagree'
2 = 'Disagree'
3 = 'No Opinion'
4 = 'Agree'
5 = 'Str Agree';
RUN;
DATA QUEST;
INPUT ID $ 1-3
AGE 4-5
GENDER $ 6
RACE $ 7
MARITAL $ 8
EDUCATION $ 9
PRESIDENT 10
ARMS 11
CITIES 12;
LABEL MARITAL = "Marital Status"
EDUCATION = "Education Level"
PRESIDENT = "President Doing a Good Job"
ARMS = "Arms budget Increase"
CITIES = "Federal Aid to Cities";
FORMAT GENDER $SEXFMT.
RACE $RACE.
MARITAL $OSCAR.
EDUCATION $EDUC.
PRESIDENT ARMS CITIES LIKERT.;
DATALINES;
001091111232
002452222422
003351324442
004271111121
005682132333
006651243425
;
RUN;
6 / 87
Charts and Frequency Tables
PROC GCHART DATA=QUEST;
VBAR GENDER RACE EDUCATION;
PIE GENDER RACE EDUCATION;
RUN;
PROC FREQ DATA=QUEST;
TITLE "Frequency Counts for Categorical Variables";
TABLES GENDER RACE MARITAL EDUCATION
PRESIDENT ARMS CITIES;
RUN;
PROC FREQ DATA=QUEST;
TITLE "One-sample test for binomial proportions";
TABLES GENDER / BINOMIAL;
RUN;
DATA ELECT;
INPUT GENDER $ CANDID $ COUNT;
DATALINES;
M DEWEY 40
F DEWEY 70
M TRUMAN 40
F TRUMAN 30
;
RUN;
PROC GCHART DATA=ELECT;
VBAR GENDER CANDID / SUMVAR=COUNT;
PIE GENDER CANDID / SUMVAR=COUNT;
RUN;
PATTERN1 COLOR=RED;
PATTERN2 COLOR=BLUE;
PATTERN3 COLOR=GREEN;
PROC GCHART DATA=ELECT;
VBAR CANDID / SUMVAR=COUNT GROUP=GENDER PATTERNID=MIDPOINT;
run;
PROC FREQ DATA=ELECT;
TITLE "Two-way Tables and the Chi-square Test";
TABLES GENDER CANDID;
TABLES CANDID*GENDER / CHISQ;
WEIGHT COUNT;
RUN;
7 / 87
Bar Charts and Pie Charts
8 / 87
Bar Charts from Sgplot
9 / 87
Frequency Tables
����������������������������������������� ������������������������ ����������������������������
������������������������������������������������������������������������������������������������
����������������������������������������� ���!"#�$��������
��������������������������������������������������������%�����&������%�����&�
������������������'"()"!�������������������$�������������������������$������
������������������*************************************************************
�������������������������������������+�������,,-,.�������������+��������,,-,.
��������������������%��������������������������-���������������,����������-��
����������������������������������������������������������%�����&������%�����&�
�����������������!/"������������������������$�������������������������$������
�����������������****************************************************************
�����������������0 ������������������������������-��������������������������-��
�����������������/�������/%-���������������������-������������������������1�-��
�����������������2� 3���������������������������,-,.�������������,����������-��
�������������������������������������������������4����
��������������������������������������������������������%�����&������%�����&�
�������������������/!5�/6������������������$�������������������������$������
������������������*************************************************************
������������������4����������������������������-��������������������������-��
�����������������������������������������������-���������������+��������,,-,.
������������������0���7�����������������������,-,.����������������������1�-��
������������������)�&�������������������������,-,.�������������,����������-��
�����������������������������������������"���������6�&��
������������������������������������������������������������%�����&������%�����&�
��������������")8/�59(������������������������$�������������������������$������
��������������*********************************************************************
��������������2�� �4� ����6� ���������������������-��������������������������-��
���������������7��:�-�����������������������������-���������������+��������,,-,.
�������������������:�-���������������������������,-,.����������������������1�-��
��������������'��������)��������������������������,-,.�������������,����������-��
������������������������������������$�� ������)�������'����;��
����������������������������������������������������������%�����&������%�����&�
�������������������$!"45)"(������������������$�������������������������$������
����������������*****************************************************************
����������������4���)� �������������������������,-,.�����������������������,-,.
����������������)� �����������������������������,-,.������������������������-��
����������������(��93���������������������������,-,.������������������������-��
����������������/��������������������������������-���������������,����������-��
����������������������������������������� ������������������������ ����������������������������
������������������������������������������������������������������������������������������������
����������������������������������������� ���!"#�$��������
���������������������������������������/�% ��������5����� �
����������������������������������������������������������%�����&������%�����&�
������������������������/!�4�����������������$�������������������������$������
����������������*****************************************************************
����������������)� ������������������������������-��������������������������-��
����������������(��93����������������������������-������������������������1�-��
����������������/�������������������������������,-,.�������������,����������-��
����������������������������������������������/����������
����������������������������������������������������������%�����&������%�����&�
����������������������5�5"4�����������������$�������������������������$������
����������������*****************************************************************
����������������4���)� �������������������������,-,.�����������������������,-,.
����������������)� ������������������������������-���������������+��������,,-,.
����������������(��93���������������������������,-,.����������������������1�-��
����������������4���/���������������������������,-,.�������������,����������-��
10 / 87
Z-tests for Proportions
�����������������������������9��< �%3����� ����������%����3��3������ �����������������������������
������������������������������������������������������������������������������������������������
����������������������������������������� ���!"#�$��������
��������������������������������������������������������%�����&������%�����&�
������������������'"()"!�������������������$�������������������������$������
������������������*************************************************************
�������������������������������������+�������,,-,.�������������+��������,,-,.
��������������������%��������������������������-���������������,����������-��
���������������������������������������=���%����$��3������
��������������������������������������������'"()"!�>�����
���������������������������������********************************
���������������������������������$��3�����������������������-,,,.
���������������������������������/4"������������������������-����
�����������������������������������?�6�7�������6�%���������-�1��
�����������������������������������?�833�������6�%���������-����
���������������������������������"@��������6�%��
�����������������������������������?�6�7�������6�%���������-���1
�����������������������������������?�833�������6�%���������-��,.
������������������������������������� �����2���$��3�������>��-�
���������������������������������/4"�������2����������������-��+�
���������������������������������A��������������������������-1�,�
���������������������������������9��< �����$��B��A����������-��.�
����������������������������������7�< �����$��B�CAC���������-+�+�
�����������������������������������������4�%3���4�D��>�,
11 / 87
Two-Way Tables
PROC GCHART DATA=QUEST;
VBAR GENDER RACE EDUCATION;
PIE GENDER RACE EDUCATION;
RUN;
PROC FREQ DATA=QUEST;
TITLE "Frequency Counts for Categorical Variables";
TABLES GENDER RACE MARITAL EDUCATION
PRESIDENT ARMS CITIES;
RUN;
PROC FREQ DATA=QUEST;
TITLE "One-sample test for binomial proportions";
TABLES GENDER / BINOMIAL;
RUN;
DATA ELECT;
INPUT GENDER $ CANDID $ COUNT;
DATALINES;
M DEWEY 40
F DEWEY 70
M TRUMAN 40
F TRUMAN 30
;
RUN;
PROC GCHART DATA=ELECT;
VBAR GENDER CANDID / SUMVAR=COUNT;
PIE GENDER CANDID / SUMVAR=COUNT;
RUN;
PATTERN1 COLOR=RED;
PATTERN2 COLOR=BLUE;
PATTERN3 COLOR=GREEN;
PROC GCHART DATA=ELECT;
VBAR CANDID / SUMVAR=COUNT GROUP=GENDER PATTERNID=MIDPOINT;
run;
PROC FREQ DATA=ELECT;
TITLE "Two-way Tables and the Chi-square Test";
TABLES GENDER CANDID;
TABLES CANDID*GENDER / CHISQ;
WEIGHT COUNT;
RUN;
12 / 87
Side-by-Side Bar Charts
13 / 87
Bar Charts from Sgplot
14 / 87
Two-Way Tables and Chi-square Tests
�������������������������������7�<7������� ������ �� �< �������� ������������������������������+������������������������������������������������������������������������������������������������
����������������������������������������� ���!"#�$��������
�������������������������������������������������������%�����&������%�����&��������������������'"()"!�����������������$�������������������������$�������������������������***********************************************************����������������������������������������������-�,������������������������-�,�����������������������������������1��������++-++������������1�����������-��
�������������������������������������������������������%�����&������%�����&��������������������/()5)�����������������$�������������������������$�������������������������***********************************************************�������������������)"0":��������������������,�-������������������������,�-����������������������!8�/(����������.���������1-1�������������1�����������-��
���������������������������������������������/()5)���'"()"!
�������������������������������/()5)�����'"()"!
���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E��������E��������E��������������������������������������*********F********F********F�������������������������������)"0":����E�����.��E�����+��E�����������������������������������������������E���1-1��E����-���E��,�-������������������������������������������E��,�-,+�E���,-�,�E����������������������������������������E��.�-���E����-���E�������������������������������*********F********F********F��������������������������������!8�/(���E��������E�����+��E�����.�����������������������������������������E���,-,.�E����-���E���1-1�����������������������������������������E��+�-1,�E���.-�+�E����������������������������������������E����-���E����-���E�������������������������������*********F********F********F�������������������������������������������������������1��������1����������������������������������������������-�,����++-++������-��
�������������������������������7�<7������� ������ �� �< �������� �������������������������������������������������������������������������������������������������������������������������������
����������������������������������������� ���!"#�$��������
�����������������������������4���� ��� ��������������/()5)���'"()"!
����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4���������������������������������.-+1�������-��,�����������������������6�G��� ����!����� �<4����������������.-+��������-��,��������������������������������/�H-� �<4�����������������,-,,�,�����-���1����������������������������<2��� D��� �<4�����������������.-+��������-��,+����������������������$ ������������������������������������-��������������������������������������������������������������-���1������������������������%��I �������������������������������-����
����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K��������.���������������������������������6���< �����$��L>�������������-��1���������������������������������!�� �< �����$��B>������������-��+�
��������������������������������������$����������J$K��������-�������������������������������������7�< �����$��L>�$������������-��1.
����������������������������������������4�%3���4�D��>��1�
15 / 87
Paired Comparisons
PROC FORMAT;
VALUE $OPINION 'P' = 'Positive'
'N' = 'Negative';
RUN;
DATA MCNEMAR;
LENGTH BEFORE AFTER $ 1;
INPUT BEFORE $ AFTER $ COUNT;
FORMAT BEFORE AFTER $OPINION.;
DATALINES;
P P 23
P N 30
N P 15
N N 32
;
RUN;
PROC FREQ DATA=MCNEMAR;
TITLE "McNemar's Test for Paired Samples";
TABLES BEFORE*AFTER / AGREE;
WEIGHT COUNT;
RUN;
DATA ODDS;
INPUT OUTCOME $ EXPOSURE $ COUNT;
DATALINES;
CASE 1-YES 50
CASE 2-NO 100
CONTROL 1-YES 20
CONTROL 2-NO 130
;
RUN;
PROC FREQ DATA=ODDS;
TITLE "Program to Compute an Odds Ratio";
TABLES EXPOSURE*OUTCOME / CHISQ CMH;
WEIGHT COUNT;
RUN;
DATA ABILITY;
INPUT GENDER $ RESULTS $ SLEEP $ COUNT;
DATALINES;
BOYS FAIL 1-LOW 20
BOYS FAIL 2-HIGH 15
BOYS PASS 1-LOW 100
BOYS PASS 2-HIGH 150
GIRLS FAIL 1-LOW 30
GIRLS FAIL 2-HIGH 25
GIRLS PASS 1-LOW 100
GIRLS PASS 2-HIGH 200
;
RUN;
PROC FREQ DATA=ABILITY;
TITLE "Mantel-Haenszel Chi-square Test";
TABLES GENDER*SLEEP*RESULTS / ALL;
WEIGHT COUNT;
RUN;
16 / 87
McNemar’s Tests
����������������������������������(�%��I ��� ������$������4�%3�� ��������������������������������,������������������������������������������������������������������������������������������������
����������������������������������������� ���!"#�$��������
����������������������������������������������="�9!"���/��"!
�������������������������������="�9!"�����/��"!
���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E(�����&�E$� ���&�E��������������������������������������*********F********F********F�������������������������������(�����&��E��������E��������E�����+.����������������������������������������E����-���E����-���E��+.-������������������������������������������E��,1-���E����-���E����������������������������������������E����-,��E����-+.�E�������������������������������*********F********F********F�������������������������������$� ���&��E��������E��������E�����������������������������������������������E����-���E����-���E����-������������������������������������������E���,-,��E��+�-+��E����������������������������������������E��+1-���E��,�-���E�������������������������������*********F********F********F����������������������������������������������,���������1����������������������������������������������������,�-�������1-��������-��
�����������������������������4���� ��� ��������������="�9!"���/��"!
�������������������������������������������(�%��I ��� ��������������������������������������***********************�������������������������������������4���� ����J4K�����-�����������������������������������������)�����������������������������������������������������������$��B�4������������-����
�������������������������������������4�%3���M�33���������������������������������������������********************************���������������������������������M�33�����������������������-���1���������������������������������/4"������������������������-��+,�����������������������������������?�6�7�������6�%�������<�-�.�.�����������������������������������?�833�������6�%���������-��1�
����������������������������������������4�%3���4�D��>����
17 / 87
Odds Ratio
PROC FORMAT;
VALUE $OPINION 'P' = 'Positive'
'N' = 'Negative';
RUN;
DATA MCNEMAR;
LENGTH BEFORE AFTER $ 1;
INPUT BEFORE $ AFTER $ COUNT;
FORMAT BEFORE AFTER $OPINION.;
DATALINES;
P P 23
P N 30
N P 15
N N 32
;
RUN;
PROC FREQ DATA=MCNEMAR;
TITLE "McNemar's Test for Paired Samples";
TABLES BEFORE*AFTER / AGREE;
WEIGHT COUNT;
RUN;
DATA ODDS;
INPUT OUTCOME $ EXPOSURE $ COUNT;
DATALINES;
CASE 1-YES 50
CASE 2-NO 100
CONTROL 1-YES 20
CONTROL 2-NO 130
;
RUN;
PROC FREQ DATA=ODDS;
TITLE "Program to Compute an Odds Ratio";
TABLES EXPOSURE*OUTCOME / CHISQ CMH;
WEIGHT COUNT;
RUN;
DATA ABILITY;
INPUT GENDER $ RESULTS $ SLEEP $ COUNT;
DATALINES;
BOYS FAIL 1-LOW 20
BOYS FAIL 2-HIGH 15
BOYS PASS 1-LOW 100
BOYS PASS 2-HIGH 150
GIRLS FAIL 1-LOW 30
GIRLS FAIL 2-HIGH 25
GIRLS PASS 1-LOW 100
GIRLS PASS 2-HIGH 200
;
RUN;
PROC FREQ DATA=ABILITY;
TITLE "Mantel-Haenszel Chi-square Test";
TABLES GENDER*SLEEP*RESULTS / ALL;
WEIGHT COUNT;
RUN;
18 / 87
Odds Ratio
���������������������������������$�����%�����%3�������9�� �!����������������������������������.
����������������������������������������� ���!"#�$��������
��������������������������������������������"N$948!"���98�9�"
�������������������������������"N$948!"�����98�9�"
���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E/4"����E9(�!96�E��������������������������������������*********F********F********F��������������������������������<:"4����E��������E��������E�����.�����������������������������������������E���,-,.�E���,-,.�E����-������������������������������������������E��.�-+��E���1-�.�E����������������������������������������E����-���E����-���E�������������������������������*********F********F********F��������������������������������<(9�����E��������E��������E�����������������������������������������������E����-���E��+�-���E��.,-,.����������������������������������������E��+�-+1�E���,-���E����������������������������������������E��,,-,.�E��1,-,.�E�������������������������������*********F********F********F���������������������������������������������������������������������������������������������������������������-��������-��������-��
���������������������������4���� ��� ��������������"N$948!"���98�9�"
����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4���������������������������������,-..������L-��������������������������6�G��� ����!����� �<4����������������.-��.�����L-�����������������������������������/�H-� �<4������������������-,.�1����L-��������������������������������<2��� D��� �<4�����������������,-.�+�����L-��������������������������$ ������������������������������������-��,+����������������������������������������������������������-����������������������������%��I �������������������������������-��,+
����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K������������������������������������������6���< �����$��L>�������������-������������������������������������!�� �< �����$��B>���������-���"<��
��������������������������������������$����������J$K�����-���"<�����������������������������������7�< �����$��L>�$��������,-�+�"<��
����������������������������������������4�%3���4�D��>����
���������������������������������$�����%�����%3�������9�� �!����������������������������������1
����������������������������������������� ���!"#�$��������
����������������������������4�%%���4���� ��� �����"N$948!"���98�9�"
��������������������� ���<������<2��� D���4���� ��� �J=� ������������4���� K
�����������������4���� �������/��������&��23�� � � ����)�������������������$��������������������***************************************************************������������������������������(��D�����������������������������,-.�+�����L-����������������������������������!�7������4���� �)�����������������,-.�+�����L-����������������������������������'�������/ �����������������������,-.�+�����L-����
������������������������" ��%��� ����� ���%%���!�����&��!� G�J!�7�O!�7�K
�������������3�����4����������� ��������������������������������?�����������6�%�� ������������*************************************************************************������������� �<������������������<2��� D�����������-������������-1�1���������-1�.���������������J9�� �!����K����6�����������������������-������������-1�1���������-1�.�
������������� ���������������������<2��� D�����������-,+����������-������������-��+,��������������J����!� GK�����6�����������������������-,+����������-������������-��+,
������������� ���������������������<2��� D�����������-������������-�+����������-.++,��������������J����!� GK�����6�����������������������-������������-�+����������-.++,
�������������������������������������������4�%3���4�D��>����
19 / 87
Stratified Tables
PROC FORMAT;
VALUE $OPINION 'P' = 'Positive'
'N' = 'Negative';
RUN;
DATA MCNEMAR;
LENGTH BEFORE AFTER $ 1;
INPUT BEFORE $ AFTER $ COUNT;
FORMAT BEFORE AFTER $OPINION.;
DATALINES;
P P 23
P N 30
N P 15
N N 32
;
RUN;
PROC FREQ DATA=MCNEMAR;
TITLE "McNemar's Test for Paired Samples";
TABLES BEFORE*AFTER / AGREE;
WEIGHT COUNT;
RUN;
DATA ODDS;
INPUT OUTCOME $ EXPOSURE $ COUNT;
DATALINES;
CASE 1-YES 50
CASE 2-NO 100
CONTROL 1-YES 20
CONTROL 2-NO 130
;
RUN;
PROC FREQ DATA=ODDS;
TITLE "Program to Compute an Odds Ratio";
TABLES EXPOSURE*OUTCOME / CHISQ CMH;
WEIGHT COUNT;
RUN;
DATA ABILITY;
INPUT GENDER $ RESULTS $ SLEEP $ COUNT;
DATALINES;
BOYS FAIL 1-LOW 20
BOYS FAIL 2-HIGH 15
BOYS PASS 1-LOW 100
BOYS PASS 2-HIGH 150
GIRLS FAIL 1-LOW 30
GIRLS FAIL 2-HIGH 25
GIRLS PASS 1-LOW 100
GIRLS PASS 2-HIGH 200
;
RUN;
PROC FREQ DATA=ABILITY;
TITLE "Mantel-Haenszel Chi-square Test";
TABLES GENDER*SLEEP*RESULTS / ALL;
WEIGHT COUNT;
RUN;
20 / 87
Mantel-Haenszel Chi-square Tests
���������������������������������������<2��� D��� �< �������� ���������������������������������
����������������������������������������� ���!"#�$��������
����������������������������������������������46""$���!"486�4��������������������������������������������������'"()"!>=9:4
�������������������������������46""$�����!"486�4
���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E�/56����E$/44����E��������������������������������������*********F********F********F��������������������������������<690����E��������E��������E�����������������������������������������������E���.-���E����-���E��+�-������������������������������������������E���,-,.�E��1�-���E����������������������������������������E���.-�+�E��+�-���E�������������������������������*********F********F********F��������������������������������<25'2���E��������E��������E�����,�����������������������������������������E����-�,�E����-,��E���.-1�����������������������������������������E����-���E����-���E����������������������������������������E��+�-1,�E��,�-���E�������������������������������*********F********F********F����������������������������������������������������������������1����������������������������������������������-�1����1.-.�������-��
����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>=9:4
����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4����������������������������������-.��������-��++����������������������6�G��� ����!����� �<4�����������������-,+�+�����-��,��������������������������������/�H-� �<4������������������-���������-�1�.����������������������������<2��� D��� �<4������������������-,11������-��+1����������������������$ ������������������������������������-��+�����������������������������������������������������������-����������������������������%��I �������������������������������-��+�
����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K������������������������������������������6���< �����$��L>�������������-�1����������������������������������!�� �< �����$��B>������������-�+��
��������������������������������������$����������J$K��������-�������������������������������������7�< �����$��L>�$������������-�,.+
���������������������������������������<2��� D��� �< �������� ���������������������������������
����������������������������������������� ���!"#�$��������
����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>=9:4
����������������������4���� ���������������������������������������������/4"����������������������******************************************************����������������������'�%%�����������������������������������-���������-�,������������������������M������I ����<�������������������������-��+������-���1����������������������4�����I ����<��������������������������-�.�������-���.
����������������������4�%�� I�)�C!��������������������������-�.�1�����-�+�.����������������������4�%�� I�)�!C��������������������������-�.�+�����-�1��
����������������������$��� ���������������������������������-��+������-���1����������������������43���%��������������������������������-��+������-���1
����������������������6�%����/ %%������C!������������������-���������-��������������������������6�%����/ %%������!C������������������-�+�.�����-�+1�����������������������6�%����4%%����������������������������-���������-��.+
����������������������8���������������������C!������������-��.������-��.�����������������������8���������������������!C������������-���+�����-��������������������������8���������������������4%%�����������-���������-���.
���������������������������" ��%��� ����� ��!�����&��!� G�J!�7�O!�7�K
�����������������3�����4������������������������������������?�����������6�%�� ����������������*****************************************************************����������������� �<�������J9�� �!����K�������-�������������-�...��������+-��������������������� ����J����!� GK��������������-1������������-�.�����������-+�������������������� ����J����!� GK��������������-��,.���������-1�+����������-��,+
����������������������������������������4�%3���4�D��>��1�
21 / 87
Mantel-Haenszel Chi-square Tests
���������������������������������������<2��� D��� �< �������� ���������������������������������
����������������������������������������� ���!"#�$��������
����������������������������������������������46""$���!"486�4��������������������������������������������������'"()"!>'5!64
�������������������������������46""$�����!"486�4
���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E�/56����E$/44����E��������������������������������������*********F********F********F��������������������������������<690����E��������E��������E�����������������������������������������������E���1-+��E���1-�.�E���,-,�����������������������������������������E����-�1�E��.,-���E����������������������������������������E���+-���E����-���E�������������������������������*********F********F********F��������������������������������<25'2���E��������E��������E�����������������������������������������������E���.-�+�E���,-�+�E��,�-�1����������������������������������������E����-���E��11-1��E����������������������������������������E��+�-+��E��,,-,.�E�������������������������������*********F********F********F���������������������������������������������������������������������������������������������������������������-+�����1+-��������-��
����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>'5!64
����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4����������������������������������-���,�����-���.����������������������6�G��� ����!����� �<4����������������1-.��������-�����������������������������������/�H-� �<4�����������������1-���������-��++����������������������������<2��� D��� �<4�����������������1-�1�������-���.����������������������$ ������������������������������������-��������������������������������������������������������������-��.�������������������������%��I �������������������������������-����
����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K������������������������������������������6���< �����$��L>�������������-������������������������������������!�� �< �����$��B>������������-����
��������������������������������������$����������J$K��������-�������������������������������������7�< �����$��L>�$������������-���.
���������������������������������������<2��� D��� �< �������� ���������������������������������
����������������������������������������� ���!"#�$��������
����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>'5!64
����������������������4���� ���������������������������������������������/4"����������������������******************************************************����������������������'�%%�����������������������������������-+��1�����-���+����������������������M������I ����<�������������������������-���������-��+�����������������������4�����I ����<��������������������������-���������-���,
����������������������4�%�� I�)�C!��������������������������-���.�����-�+������������������������4�%�� I�)�!C��������������������������-���������-�.�+
����������������������$��� ���������������������������������-���������-��+�����������������������43���%��������������������������������-���������-��+�
����������������������6�%����/ %%������C!������������������-���������-��������������������������6�%����/ %%������!C������������������-��1������-��������������������������6�%����4%%����������������������������-��.������-����
����������������������8���������������������C!������������-��1+�����-��������������������������8���������������������!C������������-��1.�����-���1����������������������8���������������������4%%�����������-���������-����
���������������������������" ��%��� ����� ��!�����&��!� G�J!�7�O!�7�K
�����������������3�����4������������������������������������?�����������6�%�� ����������������*****************************************************************����������������� �<�������J9�� �!����K�������-+������������-�+�+��������+-��.������������������ ����J����!� GK��������������-�.,����������-�.1����������-�.�1����������������� ����J����!� GK��������������-1,�+���������-..�����������-�,��
����������������������������������������4�%3���4�D��>����
22 / 87
Mantel-Haenszel Chi-square Tests
���������������������������������������<2��� D��� �< �������� ���������������������������������
����������������������������������������� ���!"#�$��������
�����������������������������4�%%���4���� ��� �����46""$���!"486�4�����������������������������������������������������'"()"!
��������������������� ���<������<2��� D���4���� ��� �J=� ������������4���� K
�����������������4���� �������/��������&��23�� � � ����)�������������������$��������������������***************************************************************������������������������������(��D������������������������������-+..������-���+������������������������������!�7������4���� �)������������������-+..������-���+������������������������������'�������/ ������������������������-+..������-���+
������������������������" ��%��� ����� ���%%���!�����&��!� G�J!�7�O!�7�K
�������������3�����4����������� ��������������������������������?�����������6�%�� ������������*************************************************************************������������� �<������������������<2��� D�����������-��1���������-+�1���������-���+��������������J9�� �!����K����6�����������������������-���1��������-+�����������-��,+
������������� ���������������������<2��� D�����������-�..���������-�+.+��������-������������������J����!� GK�����6�����������������������-�1����������-���1��������-��1.
������������� ���������������������<2��� D�����������-11����������-1�1���������-��++��������������J����!� GK�����6�����������������������-1��,��������-1��+��������-��1�
���������������������������������������=�� ��7<)���� ���������������������������������������2�%������������ ��9�� �!���� ����������������������������������******************************���������������������������������� �<4��������������������-��������������������������������������)���������������������������������������������������������������$��B� �4����������������-,�1�
�������������������������������������������4�%3���4�D��>�,+�
23 / 87
T-tests and NonparametricComparisons
24 / 87
Comparing Two Groups
DATA RESPONSE;
INPUT GROUP $ TIME;
DATALINES;
C 80
C 93
C 83
C 89
C 98
T 100
T 103
T 104
T 99
T 102
;
RUN;
PROC SORT DATA=RESPONSE;
BY GROUP;
RUN;
PROC BOXPLOT DATA=RESPONSE;
PLOT TIME*GROUP;
RUN;
PROC MEANS DATA=RESPONSE;
CLASS GROUP;
VAR TIME;
RUN;
PROC TTEST DATA=RESPONSE h0=100;
TITLE "One-sample T-test Example";
VAR TIME;
RUN;
PROC TTEST DATA=RESPONSE;
TITLE "Two-sample T-test Example";
CLASS GROUP;
VAR TIME;
RUN;
DATA TUMOR;
INPUT GROUP $ MASS @@;
DATALINES;
A 3.1 A 2.2 A 1.7 A 2.7 A 2.5
B 0.0 B 0.0 B 1.0 B 2.3
;
RUN;
PROC NPAR1WAY DATA=TUMOR WILCOXON;
TITLE "Nonparametric Test to Compare Tumor Masses";
CLASS GROUP;
VAR MASS;
EXACT WILCOXON;
RUN;
25 / 87
Side-by-Side Boxplots
26 / 87
Boxplots from Sgplot
27 / 87
T-tests
DATA RESPONSE;
INPUT GROUP $ TIME;
DATALINES;
C 80
C 93
C 83
C 89
C 98
T 100
T 103
T 104
T 99
T 102
;
RUN;
PROC SORT DATA=RESPONSE;
BY GROUP;
RUN;
PROC BOXPLOT DATA=RESPONSE;
PLOT TIME*GROUP;
RUN;
PROC MEANS DATA=RESPONSE;
CLASS GROUP;
VAR TIME;
RUN;
PROC TTEST DATA=RESPONSE h0=100;
TITLE "One-sample T-test Example";
VAR TIME;
RUN;
PROC TTEST DATA=RESPONSE;
TITLE "Two-sample T-test Example";
CLASS GROUP;
VAR TIME;
RUN;
DATA TUMOR;
INPUT GROUP $ MASS @@;
DATALINES;
A 3.1 A 2.2 A 1.7 A 2.7 A 2.5
B 0.0 B 0.0 B 1.0 B 2.3
;
RUN;
PROC NPAR1WAY DATA=TUMOR WILCOXON;
TITLE "Nonparametric Test to Compare Tumor Masses";
CLASS GROUP;
VAR MASS;
EXACT WILCOXON;
RUN;
28 / 87
T-tests
������������������������������������9��< �%3����<�� ��"@�%3�������������������������������������
���������������������������������������� ����"4��$��������
�����������������������������������������������������5�"
�������������������(�����������������4���)�&�����4���"�����������%�%�������@�%�%
���������������������������-����������1-��.��������-,��+�����1�-�������������+-�
�����������������������������������?�6�������������4���)�&��������?�6�4���)�&
���������������������-���������1�-��.��������-�������1-��.��������-1�1�����-�+��
��������������������������������������)����������������$��B�C�C
����������������������������������������������<�-1��������-����
�������������������������������������7�< �%3����<�� ��"@�%3������������������������������������,
���������������������������������������� ����"4��$��������
�����������������������������������������������������5�"
�����������'!98$����������(�����������������4���)�&�����4���"�����������%�%�������@�%�%
�������������������������������11-,���������.-���.�������-�,�������1�-����������1-����
�������������������������������������-,�������-�.�,�������-��.+�������-�������������+-�
�����������)����J�<�K����������<��-�����������-�,,,�������-��+�
��'!98$������������ ������������������������������?�6�������������4���)�&��������?�6�4���)�&
���������������������������������11-,��������.�-�������.-,,��������.-���.������+-�.+�����-�.1�
���������������������������������������-,�������-����������+-��������-�.�,�������-�+�+����-��1.
��)����J�<�K����$����������������<��-��������<��-1�,1��<�-�.���������-�,,,�������-,�+�����-�1��
��)����J�<�K����4������ 7��������<��-��������<��-���.��<+-�,1�
���������������������� ��������������������� ��������)����������������$��B�C�C
�������������������$����������������"�����������������1������<�-1��������-����
�������������������4������ 7��������8������������+-,+��������<�-1��������-��+�
��������������������������������������"������������������
��������������������������� ��������(�%�)�����)���)����������������$��B��
�����������������������������������������+���������+��������-+������-���1
29 / 87
Wilcoxon Rank Sum Tests
DATA RESPONSE;
INPUT GROUP $ TIME;
DATALINES;
C 80
C 93
C 83
C 89
C 98
T 100
T 103
T 104
T 99
T 102
;
RUN;
PROC SORT DATA=RESPONSE;
BY GROUP;
RUN;
PROC BOXPLOT DATA=RESPONSE;
PLOT TIME*GROUP;
RUN;
PROC MEANS DATA=RESPONSE;
CLASS GROUP;
VAR TIME;
RUN;
PROC TTEST DATA=RESPONSE h0=100;
TITLE "One-sample T-test Example";
VAR TIME;
RUN;
PROC TTEST DATA=RESPONSE;
TITLE "Two-sample T-test Example";
CLASS GROUP;
VAR TIME;
RUN;
DATA TUMOR;
INPUT GROUP $ MASS @@;
DATALINES;
A 3.1 A 2.2 A 1.7 A 2.7 A 2.5
B 0.0 B 0.0 B 1.0 B 2.3
;
RUN;
PROC NPAR1WAY DATA=TUMOR WILCOXON;
TITLE "Nonparametric Test to Compare Tumor Masses";
CLASS GROUP;
VAR MASS;
EXACT WILCOXON;
RUN;
30 / 87
Wilcoxon Rank Sum Tests
����������������������������(��3���%�������� ������%3������%����� � ���������������������������.
������������������������������������������������������������������������������������������������
��������������������������������������� ��($/!�0/:�$��������
��������������������������0����@���4���� �J!��G�4�% K���������������/44
������������������������������������ �����������������'!98$
�����������������������������������4�%���������"@3������������4���)�&��������������
��������������'!98$�������(��������4���� ������8�����2�������8�����2����������4����
��������������*********************************************************************
��������������/������������������������-�������������-�������+-�,�+�.����������,-,�
��������������=�����������+������������-�������������-�������+-�,�+�.�����������-��
�������������������������������/&������ ���� �7����� ���������� -
������������������������������������0����@����7�<4�%3����� �
�������������������������������4���� ����J4K�����������������-����
�������������������������������(��%���/33��@�%�����
�������������������������������A���������������������������<�-1++1
�������������������������������9��<4�����$��L��A�������������-����
��������������������������������7�<4�����$��B�CAC������������-�,��
���������������������������������/33��@�%�����
�������������������������������9��<4�����$��L��A�������������-����
��������������������������������7�<4�����$��B�CAC������������-����
�������������������������������"@������ �
�������������������������������9��<4�����$��L>��4������������-���.
��������������������������������7�<4�����$��B>�C4�<�����C����-�,��
����������������������������A�������� ����������������������������-�-
���������������������������������������M�� G��<0���� ��� �
������������������������������������ �<4���������������-1.��
������������������������������������)������������������������
������������������������������������$��B� �<4����������-�+��
31 / 87
Paired T-tests
DATA PAIRED;
INPUT CTIME TTIME;
DATALINES;
90 95
87 92
100 104
80 89
95 101
90 105
;
RUN;
PROC TTEST DATA=PAIRED;
TITLE "Demonstrating a Paired T-test";
PAIRED CTIME*TTIME;
RUN;
DATA READING;
INPUT GROUP $ WORDS @@;
DATALINES;
X 700 X 850 X 820 X 640 X 920
Y 480 Y 460 Y 500 Y 570 Y 580
Z 500 Z 550 Z 480 Z 600 Z 610
;
RUN;
PROC SORT DATA=READING;
BY GROUP;
RUN;
PROC BOXPLOT DATA=READING;
PLOT WORDS*GROUP;
RUN;
PROC MEANS DATA=READING;
CLASS GROUP;
VAR WORDS;
RUN;
PROC ANOVA DATA=READING;
TITLE "Analysis of Reading Data";
CLASS GROUP;
MODEL WORDS = GROUP;
MEANS GROUP / TUKEY;
RUN;
PROC NPAR1WAY DATA=READING WILCOXON;
TITLE "The Kruskal-Wallis Test";
CLASS GROUP;
VAR WORDS;
EXACT WILCOXON;
RUN;
32 / 87
Paired T-tests
����������������������������������)�%�� ����������$�������<�� ���������������������������������1
���������������������������������������� ����"4��$��������
������������������������������������)�������������5�"�<���5�"
�������������������(�����������������4���)�&�����4���"�����������%�%�������@�%�%
�������������������,�����<.-����������+-�����������-,1,�����<��-���������<+-����
�����������������������������������?�6�������������4���)�&��������?�6�4���)�&
�������������������<.-��������<��-,,1.��<�-��.�������+-�����������-�.1.����-����
��������������������������������������)����������������$��B�C�C
����������������������������������������������<+-���������-��.+
33 / 87
Analysis of Variance
34 / 87
Comparing More Groups
DATA PAIRED;
INPUT CTIME TTIME;
DATALINES;
90 95
87 92
100 104
80 89
95 101
90 105
;
RUN;
PROC TTEST DATA=PAIRED;
TITLE "Demonstrating a Paired T-test";
PAIRED CTIME*TTIME;
RUN;
DATA READING;
INPUT GROUP $ WORDS @@;
DATALINES;
X 700 X 850 X 820 X 640 X 920
Y 480 Y 460 Y 500 Y 570 Y 580
Z 500 Z 550 Z 480 Z 600 Z 610
;
RUN;
PROC SORT DATA=READING;
BY GROUP;
RUN;
PROC BOXPLOT DATA=READING;
PLOT WORDS*GROUP;
RUN;
PROC MEANS DATA=READING;
CLASS GROUP;
VAR WORDS;
RUN;
PROC ANOVA DATA=READING;
TITLE "Analysis of Reading Data";
CLASS GROUP;
MODEL WORDS = GROUP;
MEANS GROUP / TUKEY;
RUN;
PROC NPAR1WAY DATA=READING WILCOXON;
TITLE "The Kruskal-Wallis Test";
CLASS GROUP;
VAR WORDS;
EXACT WILCOXON;
RUN;
35 / 87
Side-by-Side Boxplots
36 / 87
Boxplots from Sgplot
37 / 87
One-way ANOVA
DATA PAIRED;
INPUT CTIME TTIME;
DATALINES;
90 95
87 92
100 104
80 89
95 101
90 105
;
RUN;
PROC TTEST DATA=PAIRED;
TITLE "Demonstrating a Paired T-test";
PAIRED CTIME*TTIME;
RUN;
DATA READING;
INPUT GROUP $ WORDS @@;
DATALINES;
X 700 X 850 X 820 X 640 X 920
Y 480 Y 460 Y 500 Y 570 Y 580
Z 500 Z 550 Z 480 Z 600 Z 610
;
RUN;
PROC SORT DATA=READING;
BY GROUP;
RUN;
PROC BOXPLOT DATA=READING;
PLOT WORDS*GROUP;
RUN;
PROC MEANS DATA=READING;
CLASS GROUP;
VAR WORDS;
RUN;
PROC ANOVA DATA=READING;
TITLE "Analysis of Reading Data";
CLASS GROUP;
MODEL WORDS = GROUP;
MEANS GROUP / TUKEY;
RUN;
PROC NPAR1WAY DATA=READING WILCOXON;
TITLE "The Kruskal-Wallis Test";
CLASS GROUP;
VAR WORDS;
EXACT WILCOXON;
RUN;
38 / 87
One-Way ANOVA
�������������������������������������/��� � ����!�������)��������������������������������������
���������������������������������������� ��/(9�/�$��������
��������������������������������������� �6�&���5����%�����
������������������������������������ ���������6�&�� ���������
����������������������������������'!98$�������������������N�:�A
�����������������������������(�%�������9� ��&����� �!���������������
�����������������������������(�%�������9� ��&����� �8 ��������������
�������������������������������������/��� � ����!�������)��������������������������������������
���������������������������������������� ��/(9�/�$��������
)�3�����������������09!)4
�����������������������������������������������4�%���
�������4���������������������������)����������4����� ����������4��������������������$��B��
���������������������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����
�������"�����������������������������������..�1�-�����������,+��-����
�����������������������������������+��������,��-����
������������������������!<4������������������������!�����4"����09!)4�����
�������������������������-.�,,����������-�1��,������1�-�+�.�������,�.-����
�������4���������������������������)���������/��&��44����������4��������������������$��B��
�������'!98$���������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����
39 / 87
Multiple Comparisons
�������������������������������������/��� � ����!�������)��������������������������������������
���������������������������������������� ��/(9�/�$��������
����������������������������G�I �4�������D���!�����J24)K��� ������09!)4
(9�"��� � ��� ��������� �� ���3��5��@3���%���7� ������������������������������ � ��� �� ����3�
������������������������������������55������������� ���!"'0#-
���������������������������/�3 �������������������������������������-��
���������������������������"�����)����� ����������%��������������������
���������������������������"����������4������������������������,+��-���
��������������������������������������������4�������D���!�������-..���
�������������������������������%�%�4�����������)��������������������-��
����������������������� �7�� �� �� �%����������������� ���������������������-
����������������������G��'���3�����������������������(����'!98$
���������������������������������/��������.1,-�������������N
���������������������������������=���������+1-�������������A
���������������������������������=
���������������������������������=����������1-�������������:
40 / 87
Kruskal-Wallis Tests
�������������������������������������� ��M�� G��<0���� ��� �������������������������������������
��������������������������������������� ��($/!�0/:�$��������
�������������������������0����@���4���� �J!��G�4�% K��������������09!)4
������������������������������������ �����������������'!98$
�����������������������������������4�%���������"@3������������4���)�&��������������
��������������'!98$�������(��������4���� ������8�����2�������8�����2����������4����
��������������*********************************************************************
��������������N����������������������,�-�����������+�-�������1-����.������������-��
��������������:������������������������-�����������+�-�������1-����.�����������+-,�
��������������A������������������������-�����������+�-�������1-����.�����������,-+�
�������������������������������/&������ ���� �7����� ���������� -
���������������������������������������M�� G��<0���� ��� �
������������������������������ �<4���������������������������-1���
������������������������������)������������������������������������
������������������������������/ %3������$��B�� �<4����������-��.+
������������������������������"@���������$��B>� �<4����������-����
41 / 87
GLM and Contrasts
PROC GLM DATA=READING;
TITLE "Analysis of Reading Data - Planned Comparisons";
CLASS GROUP;
MODEL WORDS = GROUP;
LSMEANS GROUP / PDIFF ADJUST=TUKEY;
CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;
CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;
RUN;
PROC GLM DATA=READING;
TITLE "Analysis of Reading Data - Comparisons Vs. a Control";
CLASS GROUP;
MODEL WORDS = GROUP;
LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;
RUN;
DATA TWOWAY;
INPUT GROUP $ GENDER $ WORDS @@;
DATALINES;
X M 700 X M 850 X M 820 X M 640 X M 920
Y M 480 Y M 460 Y M 500 Y M 570 Y M 580
Z M 920 Z M 550 Z M 480 Z M 600 Z M 610
X F 900 X F 880 X F 899 X F 780 X F 899
Y F 590 Y F 540 Y F 560 Y F 570 Y F 555
Z F 520 Z F 660 Z F 525 Z F 610 Z F 645
;
RUN;
PROC GLM DATA=TWOWAY;
TITLE "Analysis of Reading Data";
CLASS GROUP GENDER;
MODEL WORDS = GROUP GENDER GROUP*GENDER;
LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;
LSMEANS GROUP*GENDER / SLICE=GENDER;
RUN;
PROC MEANS DATA=TWOWAY NWAY NOPRINT;
CLASS GROUP GENDER;
VAR WORDS;
OUTPUT OUT=MEANS MEAN=M_WORDS;
RUN;
SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;
SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;
PROC GPLOT DATA=MEANS;
TITLE "Interaction Plot";
PLOT M_WORDS*GROUP=GENDER;
RUN;
PROC GLM DATA=TWOWAY;
TITLE "Demonstrating the CONSTRAST Statement of GLM";
CLASS GROUP GENDER;
MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;
CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;
CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;
RUN;
42 / 87
GLM
��������������������������/��� � ����!�������)����<�$��������%3��� �� �������������������������+
������������������������������������������������������������������������������������������������
����������������������������������������� ��'6��$��������
��������������������������������������� �6�&���5����%�����
������������������������������������ ���������6�&�� ���������
����������������������������������'!98$�������������������N�:�A
�����������������������������(�%�������9� ��&����� �!���������������
�����������������������������(�%�������9� ��&����� �8 ��������������
��������������������������/��� � ����!�������)����<�$��������%3��� �� ��������������������������
������������������������������������������������������������������������������������������������
����������������������������������������� ��'6��$��������
)�3�����������������09!)4
�����������������������������������������������4�%���
�������4���������������������������)����������4����� ����������4��������������������$��B��
���������������������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����
�������"�����������������������������������..�1�-�����������,+��-����
�����������������������������������+��������,��-����
������������������������!<4������������������������!�����4"����09!)4�����
�������������������������-.�,,����������-�1��,������1�-�+�.�������,�.-����
�������4���������������������������)���������3��5�44����������4��������������������$��B��
�������'!98$���������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����
�������4���������������������������)�������3��555�44����������4��������������������$��B��
�������'!98$���������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����
43 / 87
Contrasts
��������������������������/��� � ����!�������)����<�$��������%3��� �� �������������������������,
������������������������������������������������������������������������������������������������
����������������������������������������� ��'6��$��������
���������������������������������������6�� ��4����� �����
����������������������������/�H� �%�������������3����%3��� �� ����G�
�����������������������������������������������������������64�"/(
��������������������������������'!98$����09!)4�64�"/(������(�%���
��������������������������������N����������.1,-������������������
��������������������������������:������������1-������������������
��������������������������������A�����������+1-������������������
�������������������������������6�� ��4����� ����� ������������'!98$
�������������������������������$��B�C�C�����2���64����J�K>64����JHK
������������������������������������)�3�����������������09!)4
���������������������������OH�������������������������������������������
�����������������������������������������������������-�������������-���+
���������������������������������������-���������������������������-1�.�
���������������������������������������-���+���������-1�.�
��������������������������/��� � ����!�������)����<�$��������%3��� �� �������������������������.
������������������������������������������������������������������������������������������������
����������������������������������������� ��'6��$��������
)�3�����������������09!)4
������������ ���������������������)����������� ��44����������4��������������������$��B��
�������N��4-�:�/()�A��������������������������,�-�������������,�-������������-������L-����
��������"�29)�:��4-�A���������������������������-���������������-������������-�������-�,+�
44 / 87
Contrasts vs. a Control
�����������������������/��� � ����!�������)����<��%3��� �� �� -��������������������������������
������������������������������������������������������������������������������������������������
����������������������������������������� ��'6��$��������
���������������������������������������6�� ��4����� �����
���������������������������/�H� �%�������������3����%3��� �� ��)������
��������������������������������������������������������2��64����>
����������������������������������������������������������������
�������������������������������'!98$����09!)4�64�"/(������$��B�C�C
�������������������������������N����������.1,-������
�������������������������������:������������1-���������������-���+
�������������������������������A�����������+1-���������������-����
45 / 87
Two-way ANOVA
PROC GLM DATA=READING;
TITLE "Analysis of Reading Data - Planned Comparisons";
CLASS GROUP;
MODEL WORDS = GROUP;
LSMEANS GROUP / PDIFF ADJUST=TUKEY;
CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;
CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;
RUN;
PROC GLM DATA=READING;
TITLE "Analysis of Reading Data - Comparisons Vs. a Control";
CLASS GROUP;
MODEL WORDS = GROUP;
LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;
RUN;
DATA TWOWAY;
INPUT GROUP $ GENDER $ WORDS @@;
DATALINES;
X M 700 X M 850 X M 820 X M 640 X M 920
Y M 480 Y M 460 Y M 500 Y M 570 Y M 580
Z M 920 Z M 550 Z M 480 Z M 600 Z M 610
X F 900 X F 880 X F 899 X F 780 X F 899
Y F 590 Y F 540 Y F 560 Y F 570 Y F 555
Z F 520 Z F 660 Z F 525 Z F 610 Z F 645
;
RUN;
PROC GLM DATA=TWOWAY;
TITLE "Analysis of Reading Data";
CLASS GROUP GENDER;
MODEL WORDS = GROUP GENDER GROUP*GENDER;
LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;
LSMEANS GROUP*GENDER / SLICE=GENDER;
RUN;
PROC MEANS DATA=TWOWAY NWAY NOPRINT;
CLASS GROUP GENDER;
VAR WORDS;
OUTPUT OUT=MEANS MEAN=M_WORDS;
RUN;
SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;
SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;
PROC GPLOT DATA=MEANS;
TITLE "Interaction Plot";
PLOT M_WORDS*GROUP=GENDER;
RUN;
PROC GLM DATA=TWOWAY;
TITLE "Demonstrating the CONSTRAST Statement of GLM";
CLASS GROUP GENDER;
MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;
CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;
CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;
RUN;
46 / 87
GLM
�������������������������������������/��� � ����!�������)��������������������������������������
����������������������������������������� ��'6��$��������
��������������������������������������� �6�&���5����%�����
������������������������������������ ���������6�&�� ���������
����������������������������������'!98$�������������������N�:�A
����������������������������������'"()"!���������������������
�����������������������������(�%�������9� ��&����� �!���������������
�����������������������������(�%�������9� ��&����� �8 ��������������
�������������������������������������/��� � ����!�������)��������������������������������������
����������������������������������������� ��'6��$��������
)�3�����������������09!)4
�����������������������������������������������4�%���
�������4���������������������������)����������4����� ����������4��������������������$��B��
������������������������������������������+.1���-�,,.��������,��-+�����������-�,����L-����
�������"����������������������������+�������.+��-�����������1,++-����
�����������������������������������������,1�,��-�,,.
������������������������!<4������������������������!�����4"����09!)4�����
�������������������������-,�.+���������+-�...���������-�.�1�������,,�-+���
�������4���������������������������)���������3��5�44����������4��������������������$��B��
�������'!98$������������������������������+��..�-�,,.���������1�-,����������,-�.����L-����
�������'"()"!�������������������������������,1+�-�����������,1+�-������������-.������-�1��
�������'!98$P'"()"!���������������������������+�-,������������.�-������������-�������-����
�������4���������������������������)�������3��555�44����������4��������������������$��B��
�������'!98$������������������������������+��..�-�,,.���������1�-,����������,-�.����L-����
�������'"()"!�������������������������������,1+�-�����������,1+�-������������-.������-�1��
�������'!98$P'"()"!���������������������������+�-,������������.�-������������-�������-����
47 / 87
LSmeans
�������������������������������������/��� � ����!�������)��������������������������������������
����������������������������������������� ��'6��$��������
���������������������������������������6�� ��4����� �����
����������������������������/�H� �%�������������3����%3��� �� ����G�
�����������������������������������������������������������64�"/(
��������������������������������'!98$����09!)4�64�"/(������(�%���
��������������������������������N����������1�1-1�����������������
��������������������������������:�����������+�-������������������
��������������������������������A����������,��-������������������
�������������������������������6�� ��4����� ����� ������������'!98$
�������������������������������$��B�C�C�����2���64����J�K>64����JHK
������������������������������������)�3�����������������09!)4
���������������������������OH�������������������������������������������
����������������������������������������������������L-������������L-����
��������������������������������������L-���������������������������-��1,
��������������������������������������L-�������������-��1,
�������������������������������������/��� � ����!�������)�������������������������������������+
����������������������������������������� ��'6��$��������
���������������������������������������6�� ��4����� �����
����������������������������/�H� �%�������������3����%3��� �� ����G�
��������������������������������������������������������2��64�����>
����������������������������������������������������������64�����
������������������������������'"()"!����09!)4�64�"/(�������$��B�C�C
������������������������������������������,.�-����������������-�1��
������������������������������������������,+�-������
48 / 87
The “Slice” Option
�������������������������������������/��� � ����!�������)��������������������������������������
����������������������������������������� ��'6��$��������
���������������������������������������6�� ��4����� �����
���������������������������������'!98$����'"()"!����09!)4�64�"/(
���������������������������������N��������������������1.�-,�����
���������������������������������N��������������������.1,-������
���������������������������������:���������������������,�-������
���������������������������������:����������������������1-������
���������������������������������A�����������������������-������
���������������������������������A��������������������,��-������
�������������������������������������/��� � ����!�������)�������������������������������������,
����������������������������������������� ��'6��$��������
���������������������������������������6�� ��4����� �����
�������������������������'!98$P'"()"!�"������4��������'"()"!�����09!)4
����������������������������������������4�%���
��������������'"()"!��������)����������4����� ����������4��������������������$��B��
�������������������������������������������+�������������+�����������,-1�����L-����
�����������������������������������������1�1���������������++.��������-+,�����-����
49 / 87
Interaction Plot
PROC GLM DATA=READING;
TITLE "Analysis of Reading Data - Planned Comparisons";
CLASS GROUP;
MODEL WORDS = GROUP;
LSMEANS GROUP / PDIFF ADJUST=TUKEY;
CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;
CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;
RUN;
PROC GLM DATA=READING;
TITLE "Analysis of Reading Data - Comparisons Vs. a Control";
CLASS GROUP;
MODEL WORDS = GROUP;
LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;
RUN;
DATA TWOWAY;
INPUT GROUP $ GENDER $ WORDS @@;
DATALINES;
X M 700 X M 850 X M 820 X M 640 X M 920
Y M 480 Y M 460 Y M 500 Y M 570 Y M 580
Z M 920 Z M 550 Z M 480 Z M 600 Z M 610
X F 900 X F 880 X F 899 X F 780 X F 899
Y F 590 Y F 540 Y F 560 Y F 570 Y F 555
Z F 520 Z F 660 Z F 525 Z F 610 Z F 645
;
RUN;
PROC GLM DATA=TWOWAY;
TITLE "Analysis of Reading Data";
CLASS GROUP GENDER;
MODEL WORDS = GROUP GENDER GROUP*GENDER;
LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;
LSMEANS GROUP*GENDER / SLICE=GENDER;
RUN;
PROC MEANS DATA=TWOWAY NWAY NOPRINT;
CLASS GROUP GENDER;
VAR WORDS;
OUTPUT OUT=MEANS MEAN=M_WORDS;
RUN;
SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;
SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;
PROC GPLOT DATA=MEANS;
TITLE "Interaction Plot";
PLOT M_WORDS*GROUP=GENDER;
RUN;
PROC GLM DATA=TWOWAY;
TITLE "Demonstrating the CONSTRAST Statement of GLM";
CLASS GROUP GENDER;
MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;
CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;
CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;
RUN;
50 / 87
Interaction Plot
51 / 87
Interaction Plot from Sgplot
52 / 87
Contrasts
PROC GLM DATA=READING;
TITLE "Analysis of Reading Data - Planned Comparisons";
CLASS GROUP;
MODEL WORDS = GROUP;
LSMEANS GROUP / PDIFF ADJUST=TUKEY;
CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;
CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;
RUN;
PROC GLM DATA=READING;
TITLE "Analysis of Reading Data - Comparisons Vs. a Control";
CLASS GROUP;
MODEL WORDS = GROUP;
LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;
RUN;
DATA TWOWAY;
INPUT GROUP $ GENDER $ WORDS @@;
DATALINES;
X M 700 X M 850 X M 820 X M 640 X M 920
Y M 480 Y M 460 Y M 500 Y M 570 Y M 580
Z M 920 Z M 550 Z M 480 Z M 600 Z M 610
X F 900 X F 880 X F 899 X F 780 X F 899
Y F 590 Y F 540 Y F 560 Y F 570 Y F 555
Z F 520 Z F 660 Z F 525 Z F 610 Z F 645
;
RUN;
PROC GLM DATA=TWOWAY;
TITLE "Analysis of Reading Data";
CLASS GROUP GENDER;
MODEL WORDS = GROUP GENDER GROUP*GENDER;
LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;
LSMEANS GROUP*GENDER / SLICE=GENDER;
RUN;
PROC MEANS DATA=TWOWAY NWAY NOPRINT;
CLASS GROUP GENDER;
VAR WORDS;
OUTPUT OUT=MEANS MEAN=M_WORDS;
RUN;
SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;
SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;
PROC GPLOT DATA=MEANS;
TITLE "Interaction Plot";
PLOT M_WORDS*GROUP=GENDER;
RUN;
PROC GLM DATA=TWOWAY;
TITLE "Demonstrating the CONSTRAST Statement of GLM";
CLASS GROUP GENDER;
MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;
CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;
CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;
RUN;
53 / 87
Contrasts
���������������������������)�%�� ��������� ��9(4�!/4��4����%�������'6���������������������������.
������������������������������������������������������������������������������������������������
����������������������������������������� ��'6��$��������
��������������������������������������� �6�&���5����%�����
������������������������������������ ���������6�&�� ���������
����������������������������������'!98$�������������������N�:�A
����������������������������������'"()"!���������������������
�����������������������������(�%�������9� ��&����� �!���������������
�����������������������������(�%�������9� ��&����� �8 ��������������
���������������������������)�%�� ��������� ��9(4�!/4��4����%�������'6���������������������������1
������������������������������������������������������������������������������������������������
����������������������������������������� ��'6��$��������
)�3�����������������09!)4
�����������������������������������������������4�%���
�������4���������������������������)����������4����� ����������4��������������������$��B��
������������������������������������������+.1���-�,,.��������,��-+�����������-�,����L-����
�������"����������������������������+�������.+��-�����������1,++-����
�����������������������������������������,1�,��-�,,.
������������������������!<4������������������������!�����4"����09!)4�����
�������������������������-,�.+���������+-�...���������-�.�1�������,,�-+���
�������4���������������������������)�������3��555�44����������4��������������������$��B��
�������'!98$������������������������������+��..�-�,,.���������1�-,����������,-�.����L-����
�������'"()"!�������������������������������,1+�-�����������,1+�-������������-.������-�1��
�������'!98$P'"()"!���������������������������+�-,������������.�-������������-�������-����
������������ ���������������������)����������� ��44����������4��������������������$��B��
�������N��4-�:��"�/6"�9(6:������������������1�1+-�����������1�1+-�����������.-�+����L-����
�������N��4-�:��/6"�9(6:�������������������.��,�-����������.��,�-������������-..�����-����
54 / 87
ANCOVA Data
DATA COVAR;
LENGTH GROUP $ 1;
INPUT GROUP MATH IQ @@;
DATALINES;
A 260 105 A 325 115 A 300 122 A 400 125 A 390 138
B 325 126 B 440 135 B 425 142 B 500 140 B 600 160
;
RUN;
PROC CORR DATA=COVAR NOSIMPLE;
TITLE "Covariate Example";
VAR MATH IQ;
RUN;
PROC TTEST DATA=COVAR;
CLASS GROUP;
VAR IQ MATH;
RUN;
55 / 87
ANCOVA Data
�����������������������������������������&�������"@�%3�����������������������������������������
����������������������������������������� ��9!!�$��������
�������������������������������������������� ������/�2�����5#
�����������������������������$��� ������������������������ ��(�>���
������������������������������������$����B�C�C�������2���! �>�
������������������������������������������������/�2������������5#
����������������������������������/�2��������-�������������-��+�,
������������������������������������������������������������-����
���������������������������������5#����������-��+�,��������-�����
����������������������������������������������-����
�����������������������������������������&�������"@�%3���������������������������������������+�
���������������������������������������� ����"4��$��������
�����������������������������������������������������5#
�����������'!98$����������(�����������������4���)�&�����4���"�����������%�%�������@�%�%
�����������/�������������������������-��������-��.��������-+,1�����������-����������1-�
�����������=�����������������������+�-,�������-+1���������-�1�����������,-���������,�-�
�����������)����J�<�K����������<��-,����������-����������.-1�+�
��'!98$������������ ������������������������������?�6�������������4���)�&��������?�6�4���)�&
��/������������������������������������-�����������-1������,-��������-��.�������.-���,����-����
��=����������������������������������+�-,����������-�������,-��������-+1��������.-+.1+����-1,..
��)����J�<�K����$����������������<��-,�������<�.-,�����<�-�1�.�������-����������1-�+�+����-,,�.
��)����J�<�K����4������ 7��������<��-,�������<�.-,��.��<�-�.��
���������������������� ��������������������� ��������)����������������$��B�C�C
�������������������$����������������"�����������������1������<�-���������-��,�
�������������������4������ 7��������8������������.-��,,������<�-���������-��,�
��������������������������������������"������������������
��������������������������� ��������(�%�)�����)���)����������������$��B��
�����������������������������������������+���������+��������-�+�����-�,��
�����������������������������������������������������/�2
�����������'!98$����������(�����������������4���)�&�����4���"�����������%�%�������@�%�%
�����������/�������������������������-��������-�1��������,-,+�1��������,�-��������+��-�
�����������=����������������������+�1-�����������-������+�-��������������-��������,��-�
�����������)����J�<�K������������<���-������1�-�111�������-����
��'!98$������������ ������������������������������?�6�������������4���)�&��������?�6�4���)�&
��/������������������������������������-���������,�-�����+��-��������-�1���������-,�.������.�-�
��=���������������������������������+�1-�����������-������1�-1����������-������,�-,.�1�������-�
��)����J�<�K����$������������������<���-�������<�++-���<�-1��������1�-�111������,-�����������-�
��)����J�<�K����4������ 7����������<���-�������<�+�-�����-�+��
���������������������� ��������������������� ��������)����������������$��B�C�C
�������������������$����������������"�����������������1������<�-�+�������-�+.+
�������������������4������ 7��������8������������,-+.�,������<�-�+�������-��+.
56 / 87
ANCOVA
PROC GPLOT DATA=COVAR;
PLOT MATH*IQ=GROUP;
RUN;
PROC GLM DATA=COVAR;
CLASS GROUP;
MODEL MATH = IQ GROUP IQ*GROUP / SS3;
RUN;
PROC GLM DATA=COVAR;
CLASS GROUP;
MODEL MATH = IQ GROUP / SS3;
LSMEANS GROUP / PDIFF;
RUN;
57 / 87
Scatter Plots
58 / 87
Scatter Plots from Sgplot
59 / 87
ANCOVA
�����������������������������������������&�������"@�%3���������������������������������������+�
����������������������������������������� ��'6��$��������
��������������������������������������� �6�&���5����%�����
������������������������������������ ���������6�&�� ���������
����������������������������������'!98$�������������������/�=
�����������������������������(�%�������9� ��&����� �!���������������
�����������������������������(�%�������9� ��&����� �8 ��������������
�����������������������������������������&�������"@�%3���������������������������������������+�
����������������������������������������� ��'6��$��������
)�3������������������/�2
�����������������������������������������������4�%���
�������4���������������������������)����������4����� ����������4��������������������$��B��
������������������������������������������1�+��-�+���������.1�1-�1����������.-�������-����
�������"����������������������������,���������.-����.����������-��1�+
����������������������������������������������-�����
������������������������!<4������������������������!�����4"������/�2�����
�������������������������-1�,1,���������-�1,11��������-��++1��������,-����
�������4���������������������������)�������3��555�44����������4��������������������$��B��
�������5#���������������������������������+��.1-��+�������+��.1-��+����������-1������-����
�������'!98$��������������������������������,�+-+��+��������,�+-+��+���������-�.�����-�1�+
�������5#P'!98$�����������������������������1�,-�,�.��������1�,-�,�.���������-�������-�.�+
60 / 87
ANCOVA
�����������������������������������������&�������"@�%3���������������������������������������++
����������������������������������������� ��'6��$��������
��������������������������������������� �6�&���5����%�����
������������������������������������ ���������6�&�� ���������
����������������������������������'!98$�������������������/�=
�����������������������������(�%�������9� ��&����� �!���������������
�����������������������������(�%�������9� ��&����� �8 ��������������
�����������������������������������������&�������"@�%3���������������������������������������+�
����������������������������������������� ��'6��$��������
)�3������������������/�2
�����������������������������������������������4�%���
�������4���������������������������)����������4����� ����������4��������������������$��B��
������������������������������������������.�,�1-�1,���������1��-�������������-.1�����-����
�������"����������������������������.�������+�+-���.����������,-����+
����������������������������������������������-�����
������������������������!<4������������������������!�����4"������/�2�����
�������������������������-1��1+���������-�+��1������+�-..�����������,-����
�������4���������������������������)�������3��555�44����������4��������������������$��B��
�������5#���������������������������������+�1��-,1,�������+�1��-,1,����������-1������-����
�������'!98$����������������������������������,-��.�����������,-��.����������-�������-1�11
61 / 87
Correlation and SimpleRegression
62 / 87
Correlations
DATA COVAR;
LENGTH GROUP $ 1;
INPUT GROUP MATH IQ @@;
DATALINES;
A 260 105 A 325 115 A 300 122 A 400 125 A 390 138
B 325 126 B 440 135 B 425 142 B 500 140 B 600 160
;
RUN;
PROC CORR DATA=COVAR NOSIMPLE;
TITLE "Covariate Example";
VAR MATH IQ;
RUN;
PROC TTEST DATA=COVAR;
CLASS GROUP;
VAR IQ MATH;
RUN;
PROC GLM DATA=COVAR;
CLASS GROUP;
MODEL MATH = IQ GROUP IQ*GROUP / SS3;
RUN;
PROC GLM DATA=COVAR;
CLASS GROUP;
MODEL MATH = IQ GROUP / SS3;
LSMEANS GROUP / PDIFF;
RUN;
DATA CORR_EG;
INPUT GENDER $ HEIGHT WEIGHT AGE;
DATALINES;
M 68 155 23
F 61 99 20
F 63 115 21
M 70 205 45
M 69 170 .
F 65 125 30
M 72 220 48
;
RUN;
GOPTIONS RESET=ALL;
PROC GPLOT DATA=CORR_EG;
PLOT (HEIGHT WEIGHT)*AGE;
RUN;
PROC CORR DATA=CORR_EG PEARSON SPEARMAN;
TITLE "Example of a Correlation Matrix";
VAR HEIGHT WEIGHT AGE;
RUN;
PROC CORR DATA=CORR_EG PEARSON SPEARMAN;
VAR AGE;
WITH HEIGHT WEIGHT;
RUN;
PROC CORR DATA=CORR_EG NOSIMPLE;
TITLE "Example of Partial Correlation";
VAR HEIGHT WEIGHT;
PARTIAL AGE;
RUN;
63 / 87
Scatter Plots
64 / 87
Scatter Plots from Sgplot
65 / 87
Correlation Matrices
���������������������������������"@�%3������������������������@������������������������������+.
����������������������������������������� ��9!!�$��������
��������������������������������������� �����2"5'2����0"5'2����/'"
����������������������������������������4�%3���4���� ���
�����������������������(���������������������4���)�&�������������������������%�%���������@�%�%
����2"5'2��������������.������,,-1�.�+��������-�.,��������,1-�����������,�-�����������.�-�����
����0"5'2��������������.��������-�.�+�������+�-.�,����������-�������������-�������������-�����
����/'"����������������,��������-�,,,.��������-+�,���������,-�������������-�����������+1-�����
��������������������������������$��� ������������������������
�����������������������������������$����B�C�C�������2���! �>�
��������������������������������������(�%�������9� ��&�����
���������������������������������������2"5'2���������0"5'2������������/'"
�������������������������2"5'2���������-�������������-�.�,���������-1,,�+
������������������������������������������������������-�������������-���.
��������������������������������������������.�������������.�������������,
�������������������������0"5'2���������-�.�,���������-�������������-��+�,
����������������������������������������-���������������������������-��1�
��������������������������������������������.�������������.�������������,
�������������������������/'"�����������-1,,�+��������-��+�,��������-�����
����������������������������������������-���.���������-��1�
��������������������������������������������,�������������,�������������,
��������������������������������43���%������������������������
�����������������������������������$����B�C�C�������2���! �>�
��������������������������������������(�%�������9� ��&�����
���������������������������������������2"5'2���������0"5'2������������/'"
�������������������������2"5'2���������-�������������-�������������-�+�1,
�����������������������������������������������������L-�������������-��+1
��������������������������������������������.�������������.�������������,
�������������������������0"5'2���������-�������������-�������������-�+�1,
���������������������������������������L-���������������������������-��+1
��������������������������������������������.�������������.�������������,
�������������������������/'"�����������-�+�1,��������-�+�1,��������-�����
����������������������������������������-��+1���������-��+1
��������������������������������������������,�������������,�������������,
66 / 87
Partial Correlations
DATA COVAR;
LENGTH GROUP $ 1;
INPUT GROUP MATH IQ @@;
DATALINES;
A 260 105 A 325 115 A 300 122 A 400 125 A 390 138
B 325 126 B 440 135 B 425 142 B 500 140 B 600 160
;
RUN;
PROC CORR DATA=COVAR NOSIMPLE;
TITLE "Covariate Example";
VAR MATH IQ;
RUN;
PROC TTEST DATA=COVAR;
CLASS GROUP;
VAR IQ MATH;
RUN;
PROC GLM DATA=COVAR;
CLASS GROUP;
MODEL MATH = IQ GROUP IQ*GROUP / SS3;
RUN;
PROC GLM DATA=COVAR;
CLASS GROUP;
MODEL MATH = IQ GROUP / SS3;
LSMEANS GROUP / PDIFF;
RUN;
DATA CORR_EG;
INPUT GENDER $ HEIGHT WEIGHT AGE;
DATALINES;
M 68 155 23
F 61 99 20
F 63 115 21
M 70 205 45
M 69 170 .
F 65 125 30
M 72 220 48
;
RUN;
GOPTIONS RESET=ALL;
PROC GPLOT DATA=CORR_EG;
PLOT (HEIGHT WEIGHT)*AGE;
RUN;
PROC CORR DATA=CORR_EG PEARSON SPEARMAN;
TITLE "Example of a Correlation Matrix";
VAR HEIGHT WEIGHT AGE;
RUN;
PROC CORR DATA=CORR_EG PEARSON SPEARMAN;
VAR AGE;
WITH HEIGHT WEIGHT;
RUN;
PROC CORR DATA=CORR_EG NOSIMPLE;
TITLE "Example of Partial Correlation";
VAR HEIGHT WEIGHT;
PARTIAL AGE;
RUN;
67 / 87
Partial Correlations
���������������������������������"@�%3������������������������@������������������������������+1
����������������������������������������� ��9!!�$��������
���������������������������������0�� ��������� �����2"5'2����0"5'2�
���������������������������������������������� �����/'"
����������������������������������������4�%3���4���� ���
�����������������������(���������������������4���)�&�������������������������%�%���������@�%�%
����2"5'2��������������.������,,-1�.�+��������-�.,��������,1-�����������,�-�����������.�-�����
����0"5'2��������������.��������-�.�+�������+�-.�,����������-�������������-�������������-�����
����/'"����������������,��������-�,,,.��������-+�,���������,-�������������-�����������+1-�����
���������������������������������$��� ������������������������
������������������������������������$����B�C�C�������2���! �>�
��������������������������������������(�%�������9� ��&�����
��������������������������������������������������������/'"
���������������������������������������2"5'2���������-1,,�+
������������������������������������������������������-���.
����������������������������������������������������������,
���������������������������������������0"5'2���������-��+�,
������������������������������������������������������-��1�
����������������������������������������������������������,
��������������������������������43���%������������������������
�����������������������������������$����B�C�C�������2���! �>�
��������������������������������������(�%�������9� ��&�����
��������������������������������������������������������/'"
���������������������������������������2"5'2���������-�+�1,
������������������������������������������������������-��+1
����������������������������������������������������������,
���������������������������������������0"5'2���������-�+�1,
������������������������������������������������������-��+1
����������������������������������������������������������,
����������������������������������"@�%3������$�����������������������������������������������+�
����������������������������������������� ��9!!�$��������
�������������������������������$��������������� �����/'"
����������������������������������������������� �����2"5'2����0"5'2�
�������������������������$��� ���$���������������������������� ��(�>�,
��������������������������������$����B�C�C�������2���$�������! �>�
����������������������������������������������2"5'2���������0"5'2�
��������������������������������2"5'2���������-�������������-����+
�������������������������������������������������������������-��.�
��������������������������������0"5'2���������-����+��������-�����
�����������������������������������������������-��.�
68 / 87
Regressions
SYMBOL1 V=DOT I=R;
PROC GPLOT DATA=CORR_EG;
PLOT WEIGHT*HEIGHT;
RUN;
PROC REG DATA=CORR_EG;
TITLE "Regression Line for Height-Weight Data";
MODEL WEIGHT = HEIGHT;
PLOT RESIDUAL.*HEIGHT;
RUN;
GOPTIONS CSYMBOL=BLUE;
SYMBOL1 VALUE=DOT;
SYMBOL2 VALUE=NONE I=RLCLM95;
SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;
PROC GPLOT DATA=CORR_EG;
TITLE "Regression Lines and 95% CI's";
PLOT WEIGHT*HEIGHT=1
WEIGHT*HEIGHT=2
WEIGHT*HEIGHT=3 / OVERLAY;
RUN;
DATA CORR_EG;
SET CORR_EG;
HEIGHT2 = HEIGHT**2;
RUN;
PROC REG DATA=CORR_EG;
TITLE "Regression Line for Height-Weight Data";
MODEL WEIGHT = HEIGHT HEIGHT2;
PLOT RESIDUAL.*HEIGHT;
RUN;
DATA HEART;
INPUT DOSE HR @@;
DATALINES;
2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73
;
RUN;
SYMBOL VALUE=DOT I=SM;
PROC GPLOT DATA=HEART;
PLOT HR*DOSE;
RUN;
DATA HEART;
SET HEART;
LDOSE = LOG(DOSE);
LABEL LDOSE = "Log of Dose";
RUN;
PROC GPLOT DATA=HEART;
PLOT HR*LDOSE;
RUN;
PROC REG DATA=HEART;
TITLE "Investigating the Dose/HR Relationship";
MODEL HR = LDOSE;
PLOT R.*LDOSE;
RUN;
69 / 87
Scatter Plot and Regression Line
70 / 87
Regression Plots from Sgplot
71 / 87
Linear Regression
������������������������������!���� ����6��������2��� �<0��� ��)���������������������������������
������������������������������������������������������������������������������������������������
����������������������������������������� ��!"'�$��������
��������������������������������������������������9)"6�
�����������������������������������)�3�����������������0"5'2�
�����������������������������(�%�������9� ��&����� �!��������������.
�����������������������������(�%�������9� ��&����� �8 �������������.
���������������������������������������/��� � ������������
����������������������������������������������4�%������������������
����������4������������������������)���������4����� ���������4��������������������$��B��
�������������������������������������������������11�������������11�������1+-+������-����
����������"��������������������������������.��-�1.���������+�-,..+�
�����������������������������������,�������������1+
�����������������������!�����4"���������������-1,�.�����!<4�����������-�++�
�����������������������)�3��������������������-�.�+�����/�H�!<4�������-����
��������������������������������������������.-,����
���������������������������������������$���%�����" ��%���
������������������������������������$���%�����������4�������
����������������������������)��������" ��%�������������"�������������������$��B�C�C
���������������5������3������������<���-,++�1�������1�-�+��.������<.-�.�������-���1
���������������2"5'2�������������������-����.���������-��.1���������-���������-����
72 / 87
Residual Plot
73 / 87
Confidence Region
74 / 87
Confidence Bands from Sgplot
75 / 87
Adding a Quadratic Term
SYMBOL1 V=DOT I=R;
PROC GPLOT DATA=CORR_EG;
PLOT WEIGHT*HEIGHT;
RUN;
PROC REG DATA=CORR_EG;
TITLE "Regression Line for Height-Weight Data";
MODEL WEIGHT = HEIGHT;
PLOT RESIDUAL.*HEIGHT;
RUN;
GOPTIONS CSYMBOL=BLUE;
SYMBOL1 VALUE=DOT;
SYMBOL2 VALUE=NONE I=RLCLM95;
SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;
PROC GPLOT DATA=CORR_EG;
TITLE "Regression Lines and 95% CI's";
PLOT WEIGHT*HEIGHT=1
WEIGHT*HEIGHT=2
WEIGHT*HEIGHT=3 / OVERLAY;
RUN;
DATA CORR_EG;
SET CORR_EG;
HEIGHT2 = HEIGHT**2;
RUN;
PROC REG DATA=CORR_EG;
TITLE "Regression Line for Height-Weight Data";
MODEL WEIGHT = HEIGHT HEIGHT2;
PLOT RESIDUAL.*HEIGHT;
RUN;
DATA HEART;
INPUT DOSE HR @@;
DATALINES;
2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73
;
RUN;
SYMBOL VALUE=DOT I=SM;
PROC GPLOT DATA=HEART;
PLOT HR*DOSE;
RUN;
DATA HEART;
SET HEART;
LDOSE = LOG(DOSE);
LABEL LDOSE = "Log of Dose";
RUN;
PROC GPLOT DATA=HEART;
PLOT HR*LDOSE;
RUN;
PROC REG DATA=HEART;
TITLE "Investigating the Dose/HR Relationship";
MODEL HR = LDOSE;
PLOT R.*LDOSE;
RUN;
76 / 87
Quadratic Regression
������������������������������!���� ����6��������2��� �<0��� ��)���������������������������������
������������������������������������������������������������������������������������������������
����������������������������������������� ��!"'�$��������
��������������������������������������������������9)"6�
�����������������������������������)�3�����������������0"5'2�
�����������������������������(�%�������9� ��&����� �!��������������.
�����������������������������(�%�������9� ��&����� �8 �������������.
���������������������������������������/��� � ������������
����������������������������������������������4�%������������������
����������4������������������������)���������4����� ���������4��������������������$��B��
��������������������������������������������������,������,���-+�,��������.�-�.�����-���.
����������"�������������������������+���������-1��+,�������1�-.����
�����������������������������������,�������������1+
�����������������������!�����4"��������������1-�1�������!<4�����������-�.+�
�����������������������)�3��������������������-�.�+�����/�H�!<4�������-�,��
���������������������������������������������-..++�
���������������������������������������$���%�����" ��%���
������������������������������������$���%�����������4�������
����������������������������)��������" ��%�������������"�������������������$��B�C�C
���������������5������3����������������-������������+�-�������������-.��������-����
���������������2"5'2����������������<.,-1++,1�������+�-�+��+������<�-���������-����
���������������2"5'2�������������������-,,������������-�������������-�.�������-���,
77 / 87
Residual Plot
78 / 87
Data Transformation
SYMBOL1 V=DOT I=R;
PROC GPLOT DATA=CORR_EG;
PLOT WEIGHT*HEIGHT;
RUN;
PROC REG DATA=CORR_EG;
TITLE "Regression Line for Height-Weight Data";
MODEL WEIGHT = HEIGHT;
PLOT RESIDUAL.*HEIGHT;
RUN;
GOPTIONS CSYMBOL=BLUE;
SYMBOL1 VALUE=DOT;
SYMBOL2 VALUE=NONE I=RLCLM95;
SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;
PROC GPLOT DATA=CORR_EG;
TITLE "Regression Lines and 95% CI's";
PLOT WEIGHT*HEIGHT=1
WEIGHT*HEIGHT=2
WEIGHT*HEIGHT=3 / OVERLAY;
RUN;
DATA CORR_EG;
SET CORR_EG;
HEIGHT2 = HEIGHT**2;
RUN;
PROC REG DATA=CORR_EG;
TITLE "Regression Line for Height-Weight Data";
MODEL WEIGHT = HEIGHT HEIGHT2;
PLOT RESIDUAL.*HEIGHT;
RUN;
DATA HEART;
INPUT DOSE HR @@;
DATALINES;
2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73
;
RUN;
SYMBOL VALUE=DOT I=SM;
PROC GPLOT DATA=HEART;
PLOT HR*DOSE;
RUN;
DATA HEART;
SET HEART;
LDOSE = LOG(DOSE);
LABEL LDOSE = "Log of Dose";
RUN;
PROC GPLOT DATA=HEART;
PLOT HR*LDOSE;
RUN;
PROC REG DATA=HEART;
TITLE "Investigating the Dose/HR Relationship";
MODEL HR = LDOSE;
PLOT R.*LDOSE;
RUN;
79 / 87
Scatter Plot
80 / 87
Smooth fitting from Sgplot
81 / 87
Regression on Transformed Data
SYMBOL1 V=DOT I=R;
PROC GPLOT DATA=CORR_EG;
PLOT WEIGHT*HEIGHT;
RUN;
PROC REG DATA=CORR_EG;
TITLE "Regression Line for Height-Weight Data";
MODEL WEIGHT = HEIGHT;
PLOT RESIDUAL.*HEIGHT;
RUN;
GOPTIONS CSYMBOL=BLUE;
SYMBOL1 VALUE=DOT;
SYMBOL2 VALUE=NONE I=RLCLM95;
SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;
PROC GPLOT DATA=CORR_EG;
TITLE "Regression Lines and 95% CI's";
PLOT WEIGHT*HEIGHT=1
WEIGHT*HEIGHT=2
WEIGHT*HEIGHT=3 / OVERLAY;
RUN;
DATA CORR_EG;
SET CORR_EG;
HEIGHT2 = HEIGHT**2;
RUN;
PROC REG DATA=CORR_EG;
TITLE "Regression Line for Height-Weight Data";
MODEL WEIGHT = HEIGHT HEIGHT2;
PLOT RESIDUAL.*HEIGHT;
RUN;
DATA HEART;
INPUT DOSE HR @@;
DATALINES;
2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73
;
RUN;
SYMBOL VALUE=DOT I=SM;
PROC GPLOT DATA=HEART;
PLOT HR*DOSE;
RUN;
DATA HEART;
SET HEART;
LDOSE = LOG(DOSE);
LABEL LDOSE = "Log of Dose";
RUN;
PROC GPLOT DATA=HEART;
PLOT HR*LDOSE;
RUN;
PROC REG DATA=HEART;
TITLE "Investigating the Dose/HR Relationship";
MODEL HR = LDOSE;
PLOT R.*LDOSE;
RUN;
82 / 87
Plot of Transformed Data
83 / 87
Regression fitting from Sgplot
84 / 87
Regression on Transformed Data
������������������������������5�&� ���������� ��)� �O2!�!������� �3������������������������������
������������������������������������������������������������������������������������������������
����������������������������������������� ��!"'�$��������
��������������������������������������������������9)"6�
�������������������������������������)�3�����������������2!
�����������������������������(�%�������9� ��&����� �!���������������
�����������������������������(�%�������9� ��&����� �8 ��������������
���������������������������������������/��� � ������������
����������������������������������������������4�%������������������
����������4������������������������)���������4����� ���������4��������������������$��B��
��������������������������������������������,,-+�����������,,-+���������+��-������L-����
����������"�������������������������1���������-��������������-,+�.�
�������������������������������������������.�-,����
�����������������������!�����4"���������������-1���+����!<4�����������-�1��
�����������������������)�3������������������,,-���������/�H�!<4�������-�.1.
���������������������������������������������-�����
���������������������������������������$���%�����" ��%���
�������������������������������������������$���%�����������4�������
��������������������6��������������)��������" ��%�������������"�������������������$��B�C�C
�������5������3�����5������3������������������-��������������-�������������-1�������L-����
�������6)94"��������6������)� ����������������-�,�1+���������-��11���������-�+������L-����
85 / 87
Residual Plot
86 / 87
Reference Text
87 / 87