+ All Categories
Home > Documents > 3 Model Linear untuk Regresi - UI Open...

3 Model Linear untuk Regresi - UI Open...

Date post: 08-Mar-2019
Category:
Upload: vuanh
View: 221 times
Download: 1 times
Share this document with a friend
12
Model Linear untuk Regresi Departemen Matematika, Universitas Indonesia – Depok 16424 Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Intelligent Data Analysis (IDA) Group Telp. +62-21-7862719/7863439, Fax. +62-21-7863439, Email. [email protected] MMA10991 Topik Khusus - Machine Learning 2 Machine Learning y(x,w) t x 1 x 2 : x D Input Model/Metode Output Diberikan data pelatihan (training data), yaitu x i dan/atau t i , i = 1 sd N Preprocessing: pemilihan/ekstraksi fitur dari data, misal x i = (x 1 , x 2 , .., x D ) T Learning: penentuan parameter metode, misal w, berdasarkan data pelatihan Testing: pengujian metode dengan data baru. Data penguji (testing data) tersebut harus dilakukan preprocessing yang sama dengan data pembelajaran sebelum dieksekusi oleh metode Tahapan Umum Proses
Transcript
Page 1: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

Model Linear untuk Regresi

Departemen Matematika, Universitas Indonesia – Depok 16424

Dr. rer. nat. Hendri Murfi

Intelligent Data Analysis (IDA) GroupIntelligent Data Analysis (IDA) Group

Telp. +62-21-7862719/7863439, Fax. +62-21-7863439, Email. [email protected]

MMA10991 Topik Khusus - Machine Learning

2

Machine Learning

y(x,w) t

x1

x2

:x

D

Input Model/Metode Output

Diberikan data pelatihan (training data), yaitu xi dan/atau t

i, i = 1 sd N

• Preprocessing: pemilihan/ekstraksi fitur dari data, misal xi = (x

1, x

2, .., x

D)T

• Learning: penentuan parameter metode, misal w, berdasarkan data

pelatihan

• Testing: pengujian metode dengan data baru. Data penguji (testing data)

tersebut harus dilakukan preprocessing yang sama dengan data

pembelajaran sebelum dieksekusi oleh metode

Tahapan Umum Proses

Page 2: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

3

Diberikan data pelatihan xi , i = 1 sd N, dan/atau t

i , i = 1 as N

• Supervised Learning. Data pelatihan disertai target, yaitu {xi, t

i}, i = 1 sd

N. Tujuan pembelajaran adalah membangun model yang dapat

menghasilkan output yang benar untuk suatu data input, misal untuk

regresi, klasifikasian, regresi ordinal, ranking, dll

• Unsupervised Learning. Data pelatihan tidak disertai target, yaitu xi, i = 1

sd N. Tujuan pembelajaran adalah membagun model yang dapat

menemukan komponen/variabel/fitur tersembunyi pada data pelatihan,

yang dapat digunakan untuk: pengelompokan (clustering), reduksi

dimensi (dimension reduction), rekomendasi, dll

Learning

4

Supervised Learning

• Regresi

– Nilai output ti bernilai kontinu (riil)

– Bertujuan memprediksi output

dengan akurat untuk data baru

• Klasifikasi

– Nilai output ti bernilai diskrit (kelas)

– Bertujuan mengklasifikasi data baru

dengan akurat

Page 3: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

5

• Model linear adalah kombinasi linear dari fungsi nonlinear dari variabel input

(fungsi basis):

dimana x = (x1, x

2, ..., x

D)T adalah variabel input, dan w = (w

0, w

1, ..., w

M-1)T

adalah parameter, φφφφ(x) = (φ0(x)

, φ

1(x)

, ..., φ

Μ−1(x))T adalah vektor fungsi basis

φj(x), M adalah jumlah total parameter dari model

• Biasanya, φ0(x) = 1, sehingga w

0 berfungsi sebagai bias

• Ada banyak pilihan yang mungkin untuk fungsi basis φ(x), misal fungsi linear,

fungsi polinomial, fungsi gaussian, fungsi sigmoidal, dll

Model Linear

Regresi

6

• Regresi linear sederhana (simple linear regression) adalah

masalah regresi dengan variabel input x berdimensi satu. Misal

kita menggunakan polinomial φj(x) = xj sebagai fungsi basis, dan M

= M-1, maka bentuk umum dari regresi linear sederhana

tersebut adalah:

Regresi Linear SederhanaFungsi Basis Polinomial

Page 4: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

7

Regresi Linear SederhanaPolynomial Curve Fitting

Diberikan data pelatihan {xi, t

i}

, i = 1 sd N

• Masalah: bagaimana mendapatkan

kurva polinomial yang cocok untuk

data pelatihan tersebut

• Solusi: mencari kurva polinomial yang

memiliki kesalahan (error) terkecil

pada data pelatihan tersebut

• Persoalan ini sering juga disebut

sebagai polynomial curve fitting

8

Fungsi Error

• Salah satu fungsi error yang

sering digunakan adalah

fungsi sum-of-squares error

sbb:

• Salah satu metode yang

digunakan untuk mencari nilai

w yang meminimumkan

fungsi error adalah metode

kuadrat terkecil (least

squares)

Regresi Linear Sederhana

Page 5: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

9

Metode Kuadrat Terkecil

• Setelah penurunan E(w) terhadap w, maka persoalan penentuan

nilai parameter w menjadi persoalan penentuan solusi sistem

persamaan linear:

Aw = t

dimana

Regresi Linear Sederhana

10

Contoh Kasus

Seorang ahli biologi telah melakukan eksperimen sebanyak 7 kali untuk melihat

pertumbuhan bakteri berdasarkan kadar Nitrogen, dan diperoleh kondisi sbb:

Tentukan regresi linear polinomial berorde 1 berdasarkan data tsb. Selanjutnya, prediksi

pertumbuhan bakteri jika diberikan Nitrogen sebanyak 5 gram.

Solusi:

Dari persoalan diatas diketahui x = kadar nitrogen, t = pertumbuhan bakteri, N=6 dan

M=1, sehingga:

dan model linear yang dihasilkan adalah y(x) = -2.35 + 1.19x. Sementara prediksi

pertumbuhan bakteri untuk 5 gram Nitrogen adalah y(5) = -2.35 + 1.19*5 = 3.6

Kadar Nitrogen (gram) 3 4 6 7 8 9

Pertumbuhan Bakteri 1 3 4 6 8 8

A=[ 6

37

37

255 ] , t=[ 30

217 ] , dan w=[w0

w1]adalah solusi SPL Aw=t , yaitu w=[−2.35

1.19 ]

Regresi Linear Sederhana

Page 6: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

11

Contoh Kasus: Menggunakan Weka

@RELATION bakteri

@ATTRIBUTE kadar NUMERIC

@ATTRIBUTE pertumbuhan NUMERIC

@DATA

3,1

4,3

6,4

7,6

8,8

9,8

Format data*:

*Disimpan dalam file

dengan ekstensi arff

(misal: bakteri.arff)

Regresi Linear Sederhana

12

Contoh Kasus: Menggunakan Weka

Model hasil:

y(x) = -2.35 + 1.19x

Regresi Linear Sederhana

Page 7: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

13

• Karakteristik model regresi linear polinomial ditentukan

oleh nilai M (orde polinomial atau jumlah parameter).

Pemilihan nilai M yang optimal dikenal juga dengan istilah

pemilihan model (model selection)

Pemilihan Model

14

Pemilihan ModelUnder-fitting dan Over-fitting

Page 8: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

15

Root-Mean-Square (RMS) Error:

Pemilihan ModelUnder-fitting dan Over-fitting

16

• Jumlah data pembelajaran

seharusnya tidak lebih sedikit dari

jumlah parameter

Parameter vs Data

Page 9: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

17

• Pada aplikasi praktis, kita sering menemukan kondisi

dimana untuk persoalan yang kompleks ketersediaan data

pembelajaran terbatas.

• Salah satu teknik yang digunakan untuk mengkontrol

fenomena over-fitting adalah regularisasi (regularization),

yaitu dengan cara menambah finalti ke fungsi error.

Regularisasi

18

Penghalusan Kurva

Regularisasi

Page 10: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

19

Pengecilan Nilai Bobot

Regularisasi

20

Mengatasi over-fitting

Regularisasi

Page 11: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

21

• Fungsi sum square error adalah

nilai bobot w yang meminimum fungsi error adalah

dimana

Regresi Linear Umum

22

• Fungsi regularized sum square error adalah

nilai bobot w yang meminimum fungsi erroe adalah

dimana

Regresi Linear UmumRegularisasi

Page 12: 3 Model Linear untuk Regresi - UI Open Coursewareocw.ui.ac.id/pluginfile.php/251/mod_resource/content/0/3 Model... · Model Linear untuk Regresi Departemen Matematika, Universitas

Referensi

• Bishop, C. H., Pattern Recognition and Machine Learning,

Springer, 2006 (Bab 1.1, Bab 1.3, Bab 1.4, Bab 3.1)


Recommended