LLG Data Journalism Module3 Review

Post on 01-Jul-2015

150 views 8 download

description

LLG Data Journalism Module3 Review

transcript

MODULE 3 REVIEW

FINDING STORY IDEA

WITH DATA ANALYSIS

뉴스젤리김재옥

목차

1. 개념소개

2. 분석툴

3. 데이터분석사례

1. 개념소개

스토리를위한..

•패턴 (PATTERN)

•아웃라이어 (OUTLIER)

1. 개념소개

•증감률

•비율

•평균 VS 중앙값

•최빈값

1. 개념소개

= (New – Old) / Old

= 인구 x명당(per)

= Average vs. Median

= 가장빈번히나타난값

•최고값/최저값

•사분위수

•표준편차

1. 개념소개

= 내림차순/오름차순

= 25% / 50% / 75% / 100%

= to find outliers

•상관관계

•회귀분석

1. 개념소개

= 인과관계분석을위한

= A와 B가상관관계에있으면A와 B가인과관계에있다?

2. 분석툴

• 엑셀

2. 분석툴

• 오픈리파인http://openrefine.org/

• R 통계프로그램http://www.r-project.org/

• 하둡

• 엑셀

• Freeze(틀고정)

• Sort & Filter (정렬&필터)

• 계산식• 함수• 피벗테이블

2. 분석툴

• 오픈리파인 (Openrefine)

• 데이터정제툴• Facet 기능

2. 분석툴

• R

• 오픈소스통계패키지• 성능• 그래픽가능• R언어

2. 분석툴

• 하둡

• 오픈소스• 빅데이터처리• 분산시스템

2. 분석툴

3. 데이터분석사례

3. 데이터분석사례

• 비만도

• Freeze / 정렬기능• 최고/최저값• 증감률• 비율활용(per 값)

• 평균, 중앙값• 상관관계

• 월드컵 H조득실점

• 최빈값• 피벗테이블

• Discussion Points (Module 3)

• 주제선정후, 스토리설정이먼저?

데이터분석이먼저?

• 수집한데이터를어떻게분석할지생각해봅시다.

• 데이터분석의깊이는어느정도까지되어야할까요?

(보도수준 / 보고서수준 / 논문수준)

• Discussion Points

• 함형건앵커님주제