+ All Categories
Home > Documents > 1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의...

1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의...

Date post: 09-Jul-2020
Category:
Upload: others
View: 2 times
Download: 0 times
Share this document with a friend
9
Introductory Statistics Spring 2015 통계학 1. 통계학 1) 정의 [Webster’s Dictionary] 통계학(Statistics)은 숫자 데이터(numbered data)를 수집(collect), 정리 (summarize), 분석 (analysis), 표현(presentation)에 관련된 일련의 과정에 관한 학문으로 수학의 한 분야이다. [Kendall and Stuart] 통계학은 모집단(population: 관심의 대상이 되는 집단)의 성질(이를 통계학에 서는 변수라 한다)을 세거나 측정하여 얻어진 데이터를 다루는 과학의 한 분야이다. [Ott] Statistics is about data. 통계학은 데이터에 관한 학문이다. [Anonymous] 통계학은 미지에 대한 가이드이다. Statistics is a guide to the unknown. 한남대학교 권세혁교수 http://wolfpack.ac.kr / 19 표본 (1) 데이터 수집 (data collection) 관심 집단의 특성을 측정한다. 측정된 특성을 변수라 하고 변수 형태는 비율 (ratio), 구간 (interval), 순서 (ordinal), 명목 (nominal)으로 나눈다. (2) 데이터 정리 (data summarization) 수집된 데이터를 표나 그래프로 (히스토그램, 산점도) 정 리하여 그래프 요약을 (graphical summary) 얻거나 평균, 표준편차, 비율과 숫자 요약을 얻는다. (3) 데이터 분석 (data analysis) 알고자 하는 모집단의 특성 (모수), 함수관계에 대한 추론 단계 추론 (inference)이란 모수 (parameter) 값을 추정하거나 통계적 가 설에 대한 진위여부를 판단하는 단계 (4) 데이터 표현 (data presentation) 데이터를 정리, 분석하여 얻은 정보를 적절히 표현하는 단계. 통계 전공자가 아니더라도 쉽게 이해할 수 있도록 작성한다. 모집단
Transcript
Page 1: 1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의 민수기(numbers)에 이스라엘 백성 인구 조사, 광야 생활 전과 후에 각 한 번씩

Introductory Statistics Spring 2015 통계학

1. 통계학

1) 정의

[Webster’s Dictionary] 통계학(Statistics)은 숫자 데이터(numbered data)를 수집(collect), 정리(summarize), 분석 (analysis), 표현(presentation)에 관련된 일련의 과정에 관한 학문으로 수학의 한 분야이다.

[Kendall and Stuart] 통계학은 모집단(population: 관심의 대상이 되는 집단)의 성질(이를 통계학에서는 변수라 한다)을 세거나 측정하여 얻어진 데이터를 다루는 과학의 한 분야이다.

[Ott] Statistics is about data. 통계학은 데이터에 관한 학문이다.

[Anonymous] 통계학은 미지에 대한 가이드이다. Statistics is a guide to the unknown.

한남대학교 권세혁교수 http://wolfpack.ac.kr / 1 9

표본

(1) 데이터 수집 (data collection)

관심 집단의 특성을 측정한다. 측정된 특성을 변수라 하고 변수 형태는 비율 (ratio), 구간 (interval), 순서 (ordinal), 명목 (nominal)으로 나눈다.

(2) 데이터 정리 (data summarization)

수집된 데이터를 표나 그래프로 (히스토그램, 산점도) 정리하여 그래프 요약을 (graphical summary) 얻거나 평균, 표준편차, 비율과 숫자 요약을 얻는다.

(3) 데이터 분석 (data analysis)

알고자 하는 모집단의 특성 (모수), 함수관계에 대한 추론 단계 추론 (inference)이란 모수 (parameter) 값을 추정하거나 통계적 가설에 대한 진위여부를 판단하는 단계

(4) 데이터 표현 (data presentation)

데이터를 정리, 분석하여 얻은 정보를 적절히 표현하는 단계. 통계 전공자가 아니더라도 쉽게 이해할 수 있도록 작성한다.

모집단

Page 2: 1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의 민수기(numbers)에 이스라엘 백성 인구 조사, 광야 생활 전과 후에 각 한 번씩

Introductory Statistics Spring 2015 통계학

2) 종류

ASA (American Statistical Association)는 통계학은 데이터 수집, 분석, 표현에 대한 수리적 원리의 과학적 응용이라고 정의하고, 통계학자는 조사 및 실험설계, 데이터 수집, 처리, 분석, 그리고 결과에 대한 해석에 그들의 수리적, 통계학적 지식의 활용하여 과학적 의문에 도움을 주는 전문가이다.

통계학은 기술통계학과 추론통계학으로 나뉜다. 기술통계학은 (descriptive Statistics) 모집단 전체 혹은 표본 (모집단 일부)으로부터 얻은 데이터에 대한 숫자 요약(기초통계량; 평균, 분산)이나 그래프 요약을 (히스토그램) 통하여 관심대상에 대한 유용한 정보를 생산하는 분야이다. 표본으로부터 얻은 정보, 요약된 통계량이나 그래프를 이용하여 모집단의 특성(모수: parameter)을 추론(추정, 검정)하거나 설정된 특성들의 (변수) 함수관계의 진위여부를 판단하는 분야를 추론 통계학이라 (inferential Statistics) 한다.

(a) 기술 통계학(descriptive statistics)

모집단 전체(센서스) 혹은 표본(sample: 모집단 일부)으로부터 얻은 데이터에 대한 숫자 요약(numerical summary, 평균, 분산)이나 그래프 요약(graphical summary)을 통하여 데이터가 가진 정보를 정리한다.

(b) 추론 통계학(inferential statistics)

표본으로부터 얻은 정보를 이용하여 모집단의 특성(모수: parameter)을 추론(추정, 검정)하거나 변수들간의 적절한 함수 관계(modeling)를 설정한다.

2. 통계 역사

1) 기술 통계학 - 국가통계

•성경: 구약의 민수기(numbers)에 이스라엘 백성 인구 조사, 광야 생활 전과 후에 각 한 번씩 조사

•로마 황제 Tullis: 세금 징수를 위하여 5년마다 인구 조사, Caesar 가 로마 제국 전역으로 확대

•AD74 로마 패망 후 영국 스페인(미국/페루지역) 센서스

•센서스(census, 전수 조사): 어원 censura(라틴어 세금tax), statistics(통계학, 라틴어 status국가)

•17C 영국 출생률과 사망률 조사: 나이팅게일도 통계학자 - polar diagram (원인별 비율)

한남대학교 권세혁교수 http://wolfpack.ac.kr / 2 9

Page 3: 1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의 민수기(numbers)에 이스라엘 백성 인구 조사, 광야 생활 전과 후에 각 한 번씩

Introductory Statistics Spring 2015 통계학

사회조사는 19세기 후반부터 사회 과학자들에 의해 사용되기 시작하였다. Karl Marx는 1880년에 2만 5천명의 프랑스 노동자를 대상으로 그들의 정치적 태도와 성향에 대한 우편 조사를 시행하였고, Max Weber는 직접 관찰과 조사 연구를 통하여 노동자들의 심리, 태도, 직업관 등을 연구하였다. 20세기에 들어오면서 미국 사회학자들에 의해 사회 조사 방법론 연구가 활발하게 진행되었으며, 미국 통계국(Bureau of Census)은 표본 추출 방법과 자료 수집 방법에 대한 연구에 집중하였고, Gallup과 Roper와 같은 사회여론 조사기관은 방법론을 발전시켰다.

2) 추론 통계학 - 확률개념 활용

•게임 이론(game theory, probability, chance): 중세에 종교적, 도덕적 장벽으로 인하여 발전이 더딤

•Fermat, Pascal(1754): 드멜라라는 친구의 요청으로2인 게임에서 경기 조합 방법을 계산하기 위하여 파스칼의 삼각형을 제안하였다.

(활용1)

동전을 던져 3번 먼저 이기면 게임이 끝나고 승자는 만원을 가져간다. 동전을 3번 던진 결과 A가 2번 B가 한 번을 이기고 동전을 잃어버려 더 이상 게임을 진행 할 수 없다. 만원을 어떻게 나누어 가져야 하는가?

(활용2) 전개하시오.

•Gauss, (1,800대초) 정규분포 분포, 행성간 거리 오차에 대한 히스토그램으로부터 식을 유도 - 측정오차의 대부분은 이 분포를 따르고 있어 normal 정규분포라 함. Gaussian 분포

•W.S. Gosset (1908): 독일 양조장 공장장, t-분포, 소표본 평균의 분포가 정규분포에 따르지 않음으로 인하여 발견

•F. Galton(1885): 회귀분석(유전학자, 완두콩과 부모자녀 키의 관계), Karl Pearson 수리적 접근 => 인과관계

•Fisher: 농업 통계 분야 분산분석 방법론 적용

•사회과학 조사, 여론조사 (1900년 이후)

•수학적 이론을 바탕으로 통계 방법론이 연구되고 자연 과학은 물론 사회 과학, 인문 과학의 계량적 연구에 이용되고 있음

(a + b)5 =

한남대학교 권세혁교수 http://wolfpack.ac.kr / 3 9

Page 4: 1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의 민수기(numbers)에 이스라엘 백성 인구 조사, 광야 생활 전과 후에 각 한 번씩

Introductory Statistics Spring 2015 통계학

3. TEXTBOOK (통계학 이해, 이용구_김삼용저, 율곡출판사)

1.1 통계

•통계란 특정집단(모집단)을 대상으로 한 조사나 실험에 의하여 구한 결과에 대한 요약된 형태(숫자요약, 그래프 요약)의 표현

•자료 수집 : 관심 현상에 대한 정보를 얻기 위해 조사를 실시하는 경우 우선 자료를 수집

•자료들을 정리 · 요약 : 자료가 가지고 있는 의미 파악 용이

•(예) 2012년 19대 국회의원 당선자 분석

통계를 구하는 과정에서는 단순화에 따라 필연적으로 정보의 손실이 발생

•정보의 손실을 최소화 <=> Parsimony Rule (알고자 하는 정보만 가장 적은 노력, 데이터 수의 최소화 표현)

•통계를 구하는 과정에서 발생되는 정보의 손실과 그 통계의 중요성을 비교하여 정보의 손실이 받아들일 수 있는 수준인가를 판단.

•예) 야구 선수와 타율 : 타율 3할과 강속구에 강함

한남대학교 권세혁교수 http://wolfpack.ac.kr / 4 9

Page 5: 1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의 민수기(numbers)에 이스라엘 백성 인구 조사, 광야 생활 전과 후에 각 한 번씩

Introductory Statistics Spring 2015 통계학

1.2 통계학과 통계분석

통계학이란 불확실한 현상을 대상으로 자료를 수집하고 정리하며 (기술통계학), 이 자료가 수집된 대상에 대하여 적절한 모형을 설정하고 추정(estimation), 검정(testing) 및 예측(forecasting)을 하는 학문

통계학은 크게 수리통계학과 응용통계학으로 분류

•수리통계학 : 통계학의 기본이 되는 수리적 이론을 다루는 분야. (확률론, 추론 등 통계학에서 논의되는 기본적인 이론을 다루는 학문 분야. )

•응용통계학 : 수리통계학에서 정립된 이론을 바탕으로 실제자료 분야에 응용하는 방법을 연구하는 학문분야로써 자료의 수집 과정에서 표본추출방법을 다루는 표본론과 자료분석방법에 따른 회귀분석, 분산분석, 범주형 자료분석, 시계열분석, 다변량 분석

(다른 기준의 분류) 통계학은 확률론과 통계적 추론으로 분류 가능

•확률론 : 확률변수와 분포에 관한 것을 다룸.

•통계적추론 : 관찰된 자료와 주어진 (가정한) 확률 분포를 이용하여 관심있는 모수를 추정하고(estimation) 가설을 검정하는 것(testing)

통계분석

•어떤 현상에 대하여 자료를 수집하고 정리한 후에 통계적 모형을 이용하여 그 현상에 대한 정보를 구하는 과정

•수리통계학과 응용통계학의 이론을 이용하여 실제자료로 부터 유용한 정보를 구하는 과정(Data Mining)) => 통계분석은 수집된 자료를 이용하므로 자료는 대상집단의 특성을 잘 대표하도록 수집되어야 함.

유의 사항

•통계 분석은 분석 과정에서 항상 대상집단의 자료형태에 대해 기본 가정을 설정하고 분석을 실시

•기본 가정은 각각의 분석방법에 따라 다름

•따라서 분석 과정에 주어진 기본 가정이 무엇인가를 확인하고 자료가 그 가정을 잘 따르는가를 살펴 보아야 한다. 예) 분산 분석 : 정규성, 등분산성

한남대학교 권세혁교수 http://wolfpack.ac.kr / 5 9

Page 6: 1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의 민수기(numbers)에 이스라엘 백성 인구 조사, 광야 생활 전과 후에 각 한 번씩

Introductory Statistics Spring 2015 통계학

통계분석

한남대학교 권세혁교수 http://wolfpack.ac.kr / 6 9

Page 7: 1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의 민수기(numbers)에 이스라엘 백성 인구 조사, 광야 생활 전과 후에 각 한 번씩

Introductory Statistics Spring 2015 통계학

1.3 생활 속의 통계

사회조사 통계

(정의)

특정 지역 또는 국가에 있어서 경제, 사회적 현상을 파악하는 통계. 특정 시점 또는 기간에 사회에서 발생되는 통계

•한 지역이나 국가의 경제, 또는 사회적 현상 등을 측정

•통계청에서 조사해 월별, 분기별, 연도별로 발표하는 각종 경제, 사회지표

•보건복지부에서 조사해 발표하는 인구 및 후생복지 관련 지표

•농수산부에서 발표하는 농업, 임업, 어업 관련 통계

(종류)

•총조사(census) : 국가전체의 국민 모두를 대상으로 하는 조사

•표본조사 : 대상자 중에서 일부를 표본으로 추출하여 조사

여론조사

(정의)

정치·경제·사회적으로 발생한 특정 사건이나 현상에 대하여 국민들이 어떠한 생각을 갖고 있는가를 조사하는 방법

•어떤 특정한 사회·정치적 현상에 대해 지역주민 또는 국민들의 의견을 조사

•선거에 앞서서 실시되는 선거 관련 여론 조사

(여론이란?)

특정 집단에 속한 사람들의 `대중의 의견'이라고 할 수 있다. 이와 같은 여론은 실체를 구체적으로 볼 수 없으며 시간의 흐름에 따라 변화하기 때문에 어느 누구도 정확하게 파악할 수 없다. 이와 같이 존재는 하나 실체를 볼 수 없으며 시간의 흐름에 따라 변하는 여론을 흔히 `바람'에 비유하기도 한다.

한남대학교 권세혁교수 http://wolfpack.ac.kr / 7 9

Page 8: 1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의 민수기(numbers)에 이스라엘 백성 인구 조사, 광야 생활 전과 후에 각 한 번씩

Introductory Statistics Spring 2015 통계학

한남대학교 권세혁교수 http://wolfpack.ac.kr / 8 9

Page 9: 1. 통계학wolfpack.hnu.ac.kr/2015_Spring/IS/IS_개요.pdf•성경: 구약의 민수기(numbers)에 이스라엘 백성 인구 조사, 광야 생활 전과 후에 각 한 번씩

Introductory Statistics Spring 2015 통계학

1.4 사회조사 실례분석

표본오차 <=> 허용오차 , ,

Δ = zα /2p(1− p)n

zα /2 = 1.96 p = 0.5

한남대학교 권세혁교수 http://wolfpack.ac.kr / 9 9


Recommended