+ All Categories
Home > Documents > Data Mining - Chapter 3

Data Mining - Chapter 3

Date post: 01-Mar-2018
Category:
Upload: truong-van-truong
View: 220 times
Download: 0 times
Share this document with a friend
26
 1 Chương 3: Hi qui dliu Chương 3: Hi qui dliu Khai phá dliu (Data mining) Hc k1 – 2009-2010 Khoa Khoa Hc & KThut Máy Tnh Khoa Khoa Hc & KThut Máy Tnh T!ư"ng #$i Hc %ách Khoa T' HCh Minh T!ư"ng #$i Hc %ách Khoa T' HCh Minh
Transcript

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 1/26

  1

Chương 3: Hồi qui dữ liệuChương 3: Hồi qui dữ liệu

Khai phá dữ liệu

(Data mining)

Học kỳ 1 – 2009-2010

Khoa Khoa Học & Kỹ Thuật Máy TnhKhoa Khoa Học & Kỹ Thuật Máy Tnh

T!ư"ng #$i Học %ách Khoa T' Hồ Ch MinhT!ư"ng #$i Học %ách Khoa T' Hồ Ch Minh

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 2/26

 2

Ni dung

!"1" #$ng %uan &' hi %ui

!"2" H i %ui tu*n t+nh

!"!" H i %ui phi tu*n !"," ng d.ng

!"/" ác &n ' &3i hi %ui !"4" #5m t6t

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 3/26

 3

#7i liệu tham kh8

()* +ia,-i Han. Mich-lin- Ka/0-!. 12ata Mining:Conc-t and T-chniqu-4. 5-cond 6dition. Mo!ganKau7/ann 8u0lih-!. 9;'

(9* 2a<id Hand. H-i==i Mannila. 8adh!aic 5/yth.18!incil- o7 2ata Mining4. M>T 8!-. 9)'

:!; Da&id <" =l>n? Du@>un DAlAn? BCd&ancAd Data ining#Achni%uA>E? Fp@ingA@-GA@lag? 200"

:,; I@aham J" illiam>? FimAn J" FimLL? BData iningM#hA@? Athdlg? #Achni%uA>? and Cpplicatin>E? Fp@ingA@-GA@lag? 2004"

(?* @haoHui Tang. +a/i- MacA-nnan. 12ata Mining,ith 5BA 5-!<-! 9?4. il-y 8u0lihing. 9?'

(;* D!acl-. 12ata Mining Conc-t4. %9E)9FG). 9E'

:; =@aclA? BData ining Cpplicatin DA&AlpA@O> IuidAE?

P21!1-01? 200"

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 4/26

 4

!"0" #Qnh huRng 1Ng7 maigiá c$ phi*uF#P >S l7Ta nhiUuVVV

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 5/26

 5

!"0" #Qnh huRng 2

x

y

y = x + 1

X1

Y1

Y1’

W hQnh phXn TR dữ liệu cYa y  thA x VVV

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 6/26

 6

!"0" #Qnh huRng !

P7i tán phXn t+ch giZ h7ng th[t@\]ng (ma@kAt Ta>kAt anal>i>)

 >^ k*t h_p giữa các m`t h7ngV

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 7/26

 7

!"0" #Qnh huRng ,

Kh8 >át các *u tR tác ng *n u h\3ng>b d.ng %u8ng cá t@^c tu*n ti Giệt Nam F^ gi8i t@+ c8m nhn (e0"209)

ht l\_ng thWng tin (e0"241) ht l\_ng thWng tin c8m nhn (e0"199) F^ kh5 ch[u c8m nhn (-0"1/) Sự tin cậy cảm nhận

Thái độ về tính riêng tư 

F^ t\fng tác (e0"!!) hun chY %uan (e0"2/,)

Nhn thc kim >át h7nh &i (e0"!)

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 8/26

 8

!"0" #Qnh huRng j

Hi %ui (@Ag@A>>in)

Khai phá dữ liệu c5 t+nh d^ Tá (@Adicti&A datamining)

#Qnh huRng VVV

Khai phá dữ liệu c5 t+nh mW t8 (DA>c@ipti&A datamining)

#Qnh huRng VVV

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 9/26

 9

!"1" #$ng %uan &' hi %ui

[nh ngha - Hi %ui (@Ag@A>>in) J" Han At al (2001? 2004)M Hi %ui l7 k thut

thRng kU ch phop d^ án các t@[ (>R) liUn t.c"

iki (2009)M Hi %ui (hXn t+ch hi %ui –@Ag@A>>in anal>i>) l7 k thut thRng kU chphop \3c l\_ng các mRi liUn k*t giữa các Ti*n

" D" FnAA (19)M Hi %ui (hXn t+ch hi %ui) l7k thut thRng kU t@ng lnh &^c phXn t+ch dữ liệu&7 X d^ng các mW hQnh tq th^c nghiệm? chphop mW hQnh hi %ui &qa \_c khám phá \_cdrng ch m.c +ch d^ Tá (p@Adictin)? i'ukhin (cnt@l)? ha học (lAa@n) cf ch* s t @a

dữ liệu"

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 10/26

 10

!"1" #$ng %uan &' hi %ui

Mô hình hồi qui (regression model): mô hình mô tả mili!n "#t (rel$tionshi%) gi&$ m't t% * i#n d, *o(%reditor -$ri$les.inde%endent -$ri$les) -/ m't h$y

nhi0u *% 2ng (res%onses.de%endent -$ri$les)3 4h5n lo6i

7ồi qui tuy#n t8nh (line$r) -/ %hi tuy#n (nonline$r)

7ồi qui 9n i#n (single) -/ $ i#n (multi%le) 7ồi qui thông s (%$r$metri); %hi thông s

(non%$r$metri); -/ thông s "#t h<% (semi%$r$metri)

7ồi qui i x2ng (symmetri) -/ t i x2ng ($symmetri)

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 11/26

 11

!"1" #$ng %uan &' hi %ui

h\fng t@Qnh hi %uiM   L(I? J) IM các Ti*n d^ Tá (p@Adict@indApAndAnt

&a@iaTlA>)

M các áp ng (@A>pn>A>dApAndAnt &a@iaTlA>) JM các hệ >R hi %ui (@Ag@A>>in cALLiciAnt>)

v drng gi8i th+ch >^ Ti*n $i cYa các áp ng w"

w drng ' mW t8 các hiện t\_ng (phAnmAnn)\_c %uan tXmgi8i th+ch"

xuan hệ giữa w &7 v \_c diyn t8 Tzi >^ ph. thuch7m cYa w Ri &3i v"

{ mW t8 >^ 8nh h\zng cYa v Ri &3i w"

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 12/26

 12

!"1" #$ng %uan &' hi %ui

4h5n lo6i 7ồi qui tuy#n t8nh (line$r) -/ %hi tuy#n (nonline$r)

>ine$r in %$r$meters: "#t h<% tuy#n t8nh * thông s t6o n!n Y  ?online$r in %$r$meters: "#t h<% %hi tuy#n * thông s t6o n!n Y

7ồi qui 9n i#n (single) -/ $ i#n (multi%le) @ingle: X = (X1) Multi%le: X = (X1; XA; B; X")

7ồi qui thông s (%$r$metri); %hi thông s (non%$r$metri); -/ thông s"#t h<% (semi%$r$metri) 4$r$metri: mô hình hồi qui -Ci h&u h6n thông s  ?on%$r$metri: mô hình hồi qui -Ci -ô h6n thông s @emi%$r$metri: mô hình hồi qui -Ci h&u h6n thông s D< qu$n t5m

7ồi qui i x2ng (symmetri) -/ t i x2ng ($symmetri) @ymmetri: mô hình hồi qui t8nh mô tả (desri%ti-e) (eg3 logEline$r models) Fsymmetri: mô hình hồi qui t8nh d, *o (%rediti-e) (eg3 gener$liGed line$r

models)

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 13/26

 13

!"2" Hi %ui tu*n t+nh

Hi %ui tu*n t+nh fn Ti*n

Hi %ui tu*n t+nh a Ti*n

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 14/26

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 15/26

 15

!"2"1" Hi %ui tu*n t+nh fn Ti*n

•w {0 e J)€v1 w 0"4!4 e 2"01€v→

•Du cYa {1 ch Ti*t >^ 8nh h\zng cYa v Ri &3i w"

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 16/26

 16

!"2"1" Hi %ui tu*n t+nh fn Ti*n

3c l\_ng T thWng >R { ( ) t \_c mWhQnh hi %ui tu*n t+nh fn Ti*n

#h`ng d\ (@A>idual)

#$ng th`ng d\ TQnhph\fng (>um L

>%ua@Ad @A>idual>) tRi thiu h5a

#@[ \3c l\_ng cYa {

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 17/26

 17

!"2"2" Hi %ui tu*n t+nh a Ti*n

Hi %ui tu*n t+nh a Ti*nM phXn t+ch mRi%uan hệ giữa Ti*n ph. thuc(@A>pn>AdApAndAnt &a@iaTlA) &7 hai ha

nhi'u Ti*n c lp (indApAndAnt &a@iaTlA>)i  T0 e T1i1 e T2i2 e j e Tkik 

i 1""n &3i n l7 >R Ri t\_ng s %uan >átk >R Ti*n c lp (>R thuc t+nhtiUu ch+*u tRj)w Ti*n ph. thucv Ti*n c lpT0  t@[ cYa w khi v 0

T1""k  t@[ cYa các hệ >R hi %ui

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 18/26

 18

!"2"2" Hi %ui tu*n t+nh a Ti*n

H 1 1 A AI

k k  y b b x b x b x= + + + +K 

( )   YXXXb  T T  1−=

1;1 1;A 1;1 H

A;1 A;A A;A 1

;1 ;A ;

1

1; ;

1

n n n k  n k 

 x x xY b

 x x xY b

 x x xY b

= = =

Y X b

M M M MM M

#@[ \3c l\_ng cYa w

#@[ \3c l\_ng cYaT thWng >R T

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 19/26

 19

!"2"2" Hi %ui tu*n t+nh a Ti*n

‚amplAM a >alA> managA@ L #ackA #>?nAAd> t p@Adict >alA> L #ackA p@duct> in>AlActAd ma@kAt a@Aa" HA TAliA&A> that

ad&A@ti>ing ApAnditu@A> and thA ppulatinin Aach ma@kAt a@Aa can TA u>Ad t p@Adict>alA>" HA gathA@Ad >amplA L t >alA>?ad&A@ti>ing ApAnditu@A> and thA ppulatin

a> TAlƒ" „ind thA linAa@ multiplA @Ag@A>>inA%uatin ƒhich thA TA>t Lit t thA data" 

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 20/26

 20

!"2"2" Hi %ui tu*n t+nh a Ti*n

M$r"et Fre$ Fd-ertising Jx%enditures(Khous$nds oL oll$rs)  x1

4o%ul$tion(Khous$nds)  xA

Koy s$les(Khous$nds oL oll$rs)  y

F 13H AHH 1HH

N O3H PHH QHH

R S3H SHH THH

U3H THH AHH

J Q3H 1HH 1HH

V 1H3H UHH THH

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 21/26

 21

!"2"2" Hi %ui tu*n t+nh a Ti*n

1 AI U3QWPA AH3TWA1 H3ASHO y x x= + +

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 22/26

 22

!"!" Hi %ui phi tu*n

  L(I? J) w l7 h7m phi tu*n ch &iệc k*t h_p các thWng >R

{"

G+ d.M h7m m…? h7m lga@it? h7m Iau>>? j

vác [nh T thWng >R { tRi \uM các gi8i thut tRi \uh5a #Ri \u h5a c.c T

#Ri \u h5a t7n c.c ch t$ng th`ng d\ TQnh ph\fng (>um L

>%ua@Ad @A>idual>)

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 23/26

 23

!"," ng d.ng

xuá t@Qnh khai phá dữ liệu

Iiai n ti'n b l† dữ liệu

Iiai n khai phá dữ liệu Khai phá dữ liệu c5 t+nh mW t8

Khai phá dữ liệu c5 t+nh d^ Tá

ác lnh &^c ng d.ngM >inh học (Tilg)?nWng nghiệp (ag@icultu@A)? s hi (>ciali>>uA>)? kinh t* (Acnm)? kinh danh

(Tu>inA>>)? j

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 24/26

 24

!"/" ác &n ' &3i hi %ui

ác gi8 [nh (a>>umptin>) i k‡m &3i T7itán hi %ui"

<\_ng dữ liệu \_c b l†" ánh giá mW hQnh hi %ui"

ác k thut tiUn ti*n ch hi %uiM

C@tiLicial NAu@al NAtƒ@k (CNN)

Fupp@t GAct@ achinA (FG)

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 25/26

 25

!"4" #5m t6t

7ồi qui

thut thng "!; D< *% dZng ho * thu' t8nh li!n tZ(ontinuous $ttriutes.Le$tures)

R l[h s\ %h*t tri]n l5u ^i

_9n giản nhDng rt h&u dZng; D< 2ng dZng r'ng r`i

Rho thy s, ng g% *ng "] a$ lbnh -, thng "! trong

lbnh -, "h$i %h* d& licu

R* d6ng mô hình hồi qui: tuy#n t8nh.%hi tuy#n; 9n i#n.$ i#n; thông s.%hi thông s.thông s "#t h<%;

i x2ng.t i x2ng

7/26/2019 Data Mining - Chapter 3

http://slidepdf.com/reader/full/data-mining-chapter-3 26/26

 26

HZi ˆ áp jHZi ˆ áp j


Recommended