Date post: | 01-Mar-2018 |
Category: |
Documents |
Upload: | truong-van-truong |
View: | 220 times |
Download: | 0 times |
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 1/26
1
Chương 3: Hồi qui dữ liệuChương 3: Hồi qui dữ liệu
Khai phá dữ liệu
(Data mining)
Học kỳ 1 – 2009-2010
Khoa Khoa Học & Kỹ Thuật Máy TnhKhoa Khoa Học & Kỹ Thuật Máy Tnh
T!ư"ng #$i Học %ách Khoa T' Hồ Ch MinhT!ư"ng #$i Học %ách Khoa T' Hồ Ch Minh
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 2/26
2
Ni dung
!"1" #$ng %uan &' hi %ui
!"2" H i %ui tu*n t+nh
!"!" H i %ui phi tu*n !"," ng d.ng
!"/" ác &n ' &3i hi %ui !"4" #5m t6t
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 3/26
3
#7i liệu tham kh8
()* +ia,-i Han. Mich-lin- Ka/0-!. 12ata Mining:Conc-t and T-chniqu-4. 5-cond 6dition. Mo!ganKau7/ann 8u0lih-!. 9;'
(9* 2a<id Hand. H-i==i Mannila. 8adh!aic 5/yth.18!incil- o7 2ata Mining4. M>T 8!-. 9)'
:!; Da&id <" =l>n? Du@>un DAlAn? BCd&ancAd Data ining#Achni%uA>E? Fp@ingA@-GA@lag? 200"
:,; I@aham J" illiam>? FimAn J" FimLL? BData iningM#hA@? Athdlg? #Achni%uA>? and Cpplicatin>E? Fp@ingA@-GA@lag? 2004"
(?* @haoHui Tang. +a/i- MacA-nnan. 12ata Mining,ith 5BA 5-!<-! 9?4. il-y 8u0lihing. 9?'
(;* D!acl-. 12ata Mining Conc-t4. %9E)9FG). 9E'
:; =@aclA? BData ining Cpplicatin DA&AlpA@O> IuidAE?
P21!1-01? 200"
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 4/26
4
!"0" #Qnh huRng 1Ng7 maigiá c$ phi*uF#P >S l7Ta nhiUuVVV
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 5/26
5
!"0" #Qnh huRng 2
x
y
y = x + 1
X1
Y1
Y1’
W hQnh phXn TR dữ liệu cYa y thA x VVV
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 6/26
6
!"0" #Qnh huRng !
P7i tán phXn t+ch giZ h7ng th[t@\]ng (ma@kAt Ta>kAt anal>i>)
>^ k*t h_p giữa các m`t h7ngV
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 7/26
7
!"0" #Qnh huRng ,
Kh8 >át các *u tR tác ng *n u h\3ng>b d.ng %u8ng cá t@^c tu*n ti Giệt Nam F^ gi8i t@+ c8m nhn (e0"209)
ht l\_ng thWng tin (e0"241) ht l\_ng thWng tin c8m nhn (e0"199) F^ kh5 ch[u c8m nhn (-0"1/) Sự tin cậy cảm nhận
Thái độ về tính riêng tư
F^ t\fng tác (e0"!!) hun chY %uan (e0"2/,)
Nhn thc kim >át h7nh &i (e0"!)
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 8/26
8
!"0" #Qnh huRng j
Hi %ui (@Ag@A>>in)
Khai phá dữ liệu c5 t+nh d^ Tá (@Adicti&A datamining)
#Qnh huRng VVV
Khai phá dữ liệu c5 t+nh mW t8 (DA>c@ipti&A datamining)
#Qnh huRng VVV
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 9/26
9
!"1" #$ng %uan &' hi %ui
[nh ngha - Hi %ui (@Ag@A>>in) J" Han At al (2001? 2004)M Hi %ui l7 k thut
thRng kU ch phop d^ án các t@[ (>R) liUn t.c"
iki (2009)M Hi %ui (hXn t+ch hi %ui –@Ag@A>>in anal>i>) l7 k thut thRng kU chphop \3c l\_ng các mRi liUn k*t giữa các Ti*n
" D" FnAA (19)M Hi %ui (hXn t+ch hi %ui) l7k thut thRng kU t@ng lnh &^c phXn t+ch dữ liệu&7 X d^ng các mW hQnh tq th^c nghiệm? chphop mW hQnh hi %ui &qa \_c khám phá \_cdrng ch m.c +ch d^ Tá (p@Adictin)? i'ukhin (cnt@l)? ha học (lAa@n) cf ch* s t @a
dữ liệu"
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 10/26
10
!"1" #$ng %uan &' hi %ui
Mô hình hồi qui (regression model): mô hình mô tả mili!n "#t (rel$tionshi%) gi&$ m't t% * i#n d, *o(%reditor -$ri$les.inde%endent -$ri$les) -/ m't h$y
nhi0u *% 2ng (res%onses.de%endent -$ri$les)3 4h5n lo6i
7ồi qui tuy#n t8nh (line$r) -/ %hi tuy#n (nonline$r)
7ồi qui 9n i#n (single) -/ $ i#n (multi%le) 7ồi qui thông s (%$r$metri); %hi thông s
(non%$r$metri); -/ thông s "#t h<% (semi%$r$metri)
7ồi qui i x2ng (symmetri) -/ t i x2ng ($symmetri)
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 11/26
11
!"1" #$ng %uan &' hi %ui
h\fng t@Qnh hi %uiM L(I? J) IM các Ti*n d^ Tá (p@Adict@indApAndAnt
&a@iaTlA>)
M các áp ng (@A>pn>A>dApAndAnt &a@iaTlA>) JM các hệ >R hi %ui (@Ag@A>>in cALLiciAnt>)
v drng gi8i th+ch >^ Ti*n $i cYa các áp ng w"
w drng ' mW t8 các hiện t\_ng (phAnmAnn)\_c %uan tXmgi8i th+ch"
xuan hệ giữa w &7 v \_c diyn t8 Tzi >^ ph. thuch7m cYa w Ri &3i v"
{ mW t8 >^ 8nh h\zng cYa v Ri &3i w"
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 12/26
12
!"1" #$ng %uan &' hi %ui
4h5n lo6i 7ồi qui tuy#n t8nh (line$r) -/ %hi tuy#n (nonline$r)
>ine$r in %$r$meters: "#t h<% tuy#n t8nh * thông s t6o n!n Y ?online$r in %$r$meters: "#t h<% %hi tuy#n * thông s t6o n!n Y
7ồi qui 9n i#n (single) -/ $ i#n (multi%le) @ingle: X = (X1) Multi%le: X = (X1; XA; B; X")
7ồi qui thông s (%$r$metri); %hi thông s (non%$r$metri); -/ thông s"#t h<% (semi%$r$metri) 4$r$metri: mô hình hồi qui -Ci h&u h6n thông s ?on%$r$metri: mô hình hồi qui -Ci -ô h6n thông s @emi%$r$metri: mô hình hồi qui -Ci h&u h6n thông s D< qu$n t5m
7ồi qui i x2ng (symmetri) -/ t i x2ng ($symmetri) @ymmetri: mô hình hồi qui t8nh mô tả (desri%ti-e) (eg3 logEline$r models) Fsymmetri: mô hình hồi qui t8nh d, *o (%rediti-e) (eg3 gener$liGed line$r
models)
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 13/26
13
!"2" Hi %ui tu*n t+nh
Hi %ui tu*n t+nh fn Ti*n
Hi %ui tu*n t+nh a Ti*n
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 15/26
15
!"2"1" Hi %ui tu*n t+nh fn Ti*n
•w {0 e J)€v1 w 0"4!4 e 2"01€v→
•Du cYa {1 ch Ti*t >^ 8nh h\zng cYa v Ri &3i w"
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 16/26
16
!"2"1" Hi %ui tu*n t+nh fn Ti*n
3c l\_ng T thWng >R { ( ) t \_c mWhQnh hi %ui tu*n t+nh fn Ti*n
#h`ng d\ (@A>idual)
#$ng th`ng d\ TQnhph\fng (>um L
>%ua@Ad @A>idual>) tRi thiu h5a
#@[ \3c l\_ng cYa {
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 17/26
17
!"2"2" Hi %ui tu*n t+nh a Ti*n
Hi %ui tu*n t+nh a Ti*nM phXn t+ch mRi%uan hệ giữa Ti*n ph. thuc(@A>pn>AdApAndAnt &a@iaTlA) &7 hai ha
nhi'u Ti*n c lp (indApAndAnt &a@iaTlA>)i T0 e T1i1 e T2i2 e j e Tkik
i 1""n &3i n l7 >R Ri t\_ng s %uan >átk >R Ti*n c lp (>R thuc t+nhtiUu ch+*u tRj)w Ti*n ph. thucv Ti*n c lpT0 t@[ cYa w khi v 0
T1""k t@[ cYa các hệ >R hi %ui
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 18/26
18
!"2"2" Hi %ui tu*n t+nh a Ti*n
H 1 1 A AI
k k y b b x b x b x= + + + +K
( ) YXXXb T T 1−=
1;1 1;A 1;1 H
A;1 A;A A;A 1
;1 ;A ;
1
1; ;
1
k
k
n n n k n k
x x xY b
x x xY b
x x xY b
= = =
Y X b
K
K
M M M MM M
K
#@[ \3c l\_ng cYa w
#@[ \3c l\_ng cYaT thWng >R T
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 19/26
19
!"2"2" Hi %ui tu*n t+nh a Ti*n
‚amplAM a >alA> managA@ L #ackA #>?nAAd> t p@Adict >alA> L #ackA p@duct> in>AlActAd ma@kAt a@Aa" HA TAliA&A> that
ad&A@ti>ing ApAnditu@A> and thA ppulatinin Aach ma@kAt a@Aa can TA u>Ad t p@Adict>alA>" HA gathA@Ad >amplA L t >alA>?ad&A@ti>ing ApAnditu@A> and thA ppulatin
a> TAlƒ" „ind thA linAa@ multiplA @Ag@A>>inA%uatin ƒhich thA TA>t Lit t thA data"
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 20/26
20
!"2"2" Hi %ui tu*n t+nh a Ti*n
M$r"et Fre$ Fd-ertising Jx%enditures(Khous$nds oL oll$rs) x1
4o%ul$tion(Khous$nds) xA
Koy s$les(Khous$nds oL oll$rs) y
F 13H AHH 1HH
N O3H PHH QHH
R S3H SHH THH
U3H THH AHH
J Q3H 1HH 1HH
V 1H3H UHH THH
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 21/26
21
!"2"2" Hi %ui tu*n t+nh a Ti*n
1 AI U3QWPA AH3TWA1 H3ASHO y x x= + +
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 22/26
22
!"!" Hi %ui phi tu*n
L(I? J) w l7 h7m phi tu*n ch &iệc k*t h_p các thWng >R
{"
G+ d.M h7m m…? h7m lga@it? h7m Iau>>? j
vác [nh T thWng >R { tRi \uM các gi8i thut tRi \uh5a #Ri \u h5a c.c T
#Ri \u h5a t7n c.c ch t$ng th`ng d\ TQnh ph\fng (>um L
>%ua@Ad @A>idual>)
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 23/26
23
!"," ng d.ng
xuá t@Qnh khai phá dữ liệu
Iiai n ti'n b l† dữ liệu
Iiai n khai phá dữ liệu Khai phá dữ liệu c5 t+nh mW t8
Khai phá dữ liệu c5 t+nh d^ Tá
ác lnh &^c ng d.ngM >inh học (Tilg)?nWng nghiệp (ag@icultu@A)? s hi (>ciali>>uA>)? kinh t* (Acnm)? kinh danh
(Tu>inA>>)? j
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 24/26
24
!"/" ác &n ' &3i hi %ui
ác gi8 [nh (a>>umptin>) i k‡m &3i T7itán hi %ui"
<\_ng dữ liệu \_c b l†" ánh giá mW hQnh hi %ui"
ác k thut tiUn ti*n ch hi %uiM
C@tiLicial NAu@al NAtƒ@k (CNN)
Fupp@t GAct@ achinA (FG)
7/26/2019 Data Mining - Chapter 3
http://slidepdf.com/reader/full/data-mining-chapter-3 25/26
25
!"4" #5m t6t
7ồi qui
thut thng "!; D< *% dZng ho * thu' t8nh li!n tZ(ontinuous $ttriutes.Le$tures)
R l[h s\ %h*t tri]n l5u ^i
_9n giản nhDng rt h&u dZng; D< 2ng dZng r'ng r`i
Rho thy s, ng g% *ng "] a$ lbnh -, thng "! trong
lbnh -, "h$i %h* d& licu
R* d6ng mô hình hồi qui: tuy#n t8nh.%hi tuy#n; 9n i#n.$ i#n; thông s.%hi thông s.thông s "#t h<%;
i x2ng.t i x2ng