ii
ESTIMASI MODEL REGRESI SEMIPARAMETRIK
BIRESPON MULTIPREDIKTOR
BERDASARKAN ESTIMATOR PENALIZED SPLINE
SKRIPSI
DODIK ANDRIANTO
PROGRAM STUDI S-1 STATISTIKA
DEPARTEMEN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS AIRLANGGA
2017
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
iii
ESTIMASI MODEL REGRESI SEMIPARAMETRIK
BIRESPON MULTIPREDIKTOR
BERDASARKAN ESTIMATOR PENALIZED SPLINE
SKRIPSI
DODIK ANDRIANTO
PROGRAM STUDI S-1 STATISTIKA
DEPARTEMEN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS AIRLANGGA
2017
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
iv
PEDOMAN PENGGUNAAN SKRIPSI
Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam
lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi
kepustakaan, tetapi pengutipan harus seizin penyusun dan harus menyebutkan
sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan hak milik
Universitas Airlangga.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
vi
KATA PENGANTAR
Alhamdulillahirabbil ’alamin puji syukur penulis panjatkan kepada Allah
SWT yang telah melimpahkan rahmat dan karunia-Nya sehingga penulis dapat
menyelesaikan skripsi dengan judul ”Estimasi Model Regresi Semiparametrik
Birespon Multiprediktor Berdasarkan Estimator Penalized Spline”.
Penulis menyadari bahwa skripsi ini tidak terlepas dari bantuan berbagai
pihak, oleh karena itu sepantasnya penulis mengucapkan terima kasih kepada:
1. Kedua orang tua tersayang: Ibu Sumarni dan Bapak Subekan, serta
keluarga besar penulis yang mendoakan dan telah memberikan semangat,
kepercayaan, dan dukungan baik secara materiil maupun moril.
2. Dr. Nur Chamidah, M.Si. dan Dr. Ardi Kurniawan, M.Si. selaku dosen
pembimbing yang telah memberikan penjelasan, pengarahan, bimbingan,
masukan, saran, dan motivasi kepada penulis untuk terus belajar.
3. Drs. Suliyanto, M.Si. selaku dosen wali selama menjadi mahasiswa yang
telah selalu memberikan nasehat, arahan, dukungan, saran, dan motivasi
kepada penulis untuk menyelesaikan studi dengan baik serta seluruh dosen
statistika yang telah memberikan ilmu pengetahuan selama perkuliahan.
4. Serta pihak yang telah berjasa dalam membantu penulis menyelesaikan
skripsi ini, namun tidak dapat disebutkan satu per satu oleh penulis.
Penulis menyadari skripsi ini jauh dari sempurna, baik dari segi
penyusunan, bahasa atau penulisan. Oleh karena itu penulis mengharapkan kritik
dan saran yang bersifat membangun guna menyempurnakan skripsi ini. Penulis
berharap semoga skripsi ini dapat bermanfaat bagi perkembangan ilmu
pengetahuan di masa yang akan datang.
Surabaya, 25 Januari 2017
Penulis,
Dodik Andrianto
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
vii
Dodik Andrianto, 2017. Estimasi Model Regresi Semiparametrik Birespon
Multiprediktor Berdasarkan Estimator Penalized Spline. Skripsi dibawah
bimbingan Dr. Nur Chamidah, M.Si. dan Dr. Ardi Kurniawan, M.Si., Program
Studi S-1 Statistika, Departemen Matematika, Fakultas Sains dan Teknologi,
Universitas Airlangga, Surabaya.
ABSTRAK
Metode dalam ilmu statistika yang menganalisis pola hubungan secara
fungsional antara variabel respon dan variabel prediktor dengan komponen
parametrik dan nonparametrik didalamnya yaitu analisis regresi semiparametrik.
Estimator dalam regresi noparametrik yang belum banyak dikembangkan salah
satunya adalah estimator penalized spline, estimator tersebut dapat digunakan
terhadap data yang mengalami peningkatan tajam dengan membebankan penalty
pada komponen potongan polinomial (piece wise polinomial) yang memiliki sifat
tersegmen yang kontinu. Persoalan dalam kehidupan sehari-hari sering kali
memerlukan pemodelan yang melibatkan dua variabel respon dan diantara
keduanya terdapat korelasi yang kuat dengan melibatkan lebih dari satu variabel
prediktor. Sehingga secara teori menarik untuk megembangkan pengestimasian
berdasarkan estimator penalized spline pada model regresi semiparametrik
birespon multiprediktor. Tujuan dari penelitian ini adalah mendapatkan bentuk
model regresi semiparametrik birespon multiprediktor dengan menggunakan
estimator penalized spline dalam mengestimasi kurva regresi nonparametriknya
serta mengembangkan pula algoritma dan pemrogramannya untuk implementasi
pada data. Data yang digunakan pada pengimplementasian adalah data pasien di
RSU Haji Surabaya dengan tekanan darah sistolik dan diastolik sebagai variabel
respon, LDL sebagai variabel prediktor komponen parametrik, serta variabel
prediktor komponen nonparametriknya adalah berat badan, usia, dan HDL. Hasil
estimasi data tekanan darah menggunakan software OSS-R diperoleh nilai MSE
dan R-square untuk pemodelan yaitu masing-masing sebesar 136,5604 dan
91,23%.
Kata Kunci : Regresi, Semiparametrik, Birespon, Multiprediktor, Penalized
Spline, Tekanan Darah
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
viii
Dodik Andrianto, 2017. Estimation of Bi-response Multipredictor
Semiparametric Regression Model Based on Penalized Spline Estimator. This
skripsi is under supervised by Dr. Nur Chamidah, M.Si. and Dr. Ardi Kurniawan,
M.Si., S-1 Statistics Courses, Mathematics Department, Faculty of Science and
Technology, Universitas Airlangga, Surabaya.
ABSTRACT
The methods in statistical science that analyzes the pattern of a functional
relationship between the response and the predictor variables with parametric and
nonparametric components therein are semiparametric regression analysis.
Estimator in nonparametric regression who have developed one of which is the
Penalized spline estimator, the estimator can use the data it has increased sharply
by imposing a penalty on the component pieces of polynomial (piece wise
polynomial) which has the property of segmented continuous. Problems in
everyday life often require modeling involving two response variables and
between them there is a strong correlation with the involvement of more than one
predictor variable. So in theory needs to be developed Penalized spline estimator
estimating base on semiparametric regression model bi-response multipredictor.
The purpose of this research is to form semiparametric regression model bi-
response multipredictor using Penalized spline estimator to estimate the
nonparametric regression curve and also develop algorithms and programming to
the implementation of the data. Data used in the implementation is data in RSU
Haji Surabaya patients with systolic and diastolic blood pressure as the response
variable, LDL as a predictor variable component of parametric and nonparametric
predictor variable component is the weight, age, and HDL. The estimation results
of the blood pressure data using OSS software-R obtained by MSE and R-square
for modeling are 136.5604 respectively and 91.23%.
Keywords : Regression, Bi-response, Multipredictor, Semiparametric, Penalized
Spline, Blood Pressure
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
ix
DAFTAR ISI
Halaman
LEMBAR JUDUL .............................................................................................. i
LEMBAR PERNYATAAN ................................................................................ ii
LEMBAR PENGESAHAN ................................................................................ iii
LEMBAR PEDOMAN PENGGUNAAN SKRIPSI .......................................... iv
SURAT PERNYATAAN TENTANG ORISIALITAS ...................................... v
KATA PENGANTAR ....................................................................................... vi
ABSTRAK .......................................................................................................... vii
ABSTRACT ........................................................................................................ viii
DAFTAR ISI ....................................................................................................... ix
DAFTAR TABEL ............................................................................................... xii
DAFTAR GAMBAR .......................................................................................... xiii
DAFTAR LAMPIRAN ....................................................................................... xiv
BAB I PENDAHULUAN ................................................................................... 1
1.1 Latar Belakang .................................................................................. 1
1.2 Rumusan Masalah ............................................................................. 5
1.3 Tujuan ............................................................................................... 5
1.4 Manfaat ............................................................................................. 5
1.5 Batasan Masalah ................................................................................ 6
BAB II TINJAUAN PUSTAKA ........................................................................ 7
2.1 Aljabar Matrik ................................................................................... 7
2.2 Pendekatan Regresi ........................................................................... 12
2.2.1 Regresi Parametrik ................................................................... 12
2.2.2 Regresi Nonparametrik ............................................................ 12
2.2.3 Regresi Semiparametrik ........................................................... 13
2.3 Regresi Birespon ............................................................................... 13
2.4 Regresi Multiprediktor ...................................................................... 14
2.5 Estimator Penalized Spline pada Regresi Nonparametrik................. 14
2.6 Kuantil ............................................................................................... 18
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
x
2.7 Pemilihan Titik Knot Optimal ........................................................... 19
2.8 Pemilihan Jumlah Titik Knot Optimal .............................................. 19
2.9 Model Semiparametrik Berdasarkan Estimator Penalized Spline
dengan Satu Variabel Respon ........................................................ 20
2.10 Model Semiparametrik Birespon Berdasarkan Estimator
Penalized Spline dengan Satu Variabel Prediktor.......................... 21
2.11 Kasus Homoskedastisitas dan Heteroskedastisitas ......................... 22
2.12 Estimasi Parameter Weighted Least Square (WLS) ........................ 23
2.13 Uji Glesjer ....................................................................................... 23
2.14 Uji Korelasi Pearson ....................................................................... 24
2.15 Open Source Software R (OSS-R) .................................................. 25
2.16 Tekanan Darah ................................................................................ 28
BAB III METODE PENELITIAN ..................................................................... 29
3.1 Mengestimasi Model Regresi Semiparametrik Birespon
Multiprediktor Berdasarkan Estimator Penalized Spline ............. 29
3.2 Membuat Algoritma dan Program Untuk Mengestimasi Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan Estimator
Penalized Spline yang Diterapkan Pada Data Riil atau Data
Bangkitan ......................................................................................... 31
3.2.1 Algoritma dan Program untuk Mengestimasi Model Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan
Estimator Penalized Spline ................................................... 31
3.2.2 Penerapan Model Regresi Semiparametrik Birespon
Multiprediktor Berdasarkan Estimator Penalized Spline
pada Data Riil ....................................................................... 36
BAB IV HASIL DAN PEMBAHASAN ............................................................ 37
4.1 Estimasi Model Regresi Semiparametrik Birespon Multiprediktor
Berdasarkan Estimator Penalized Spline ...................................... 37
4.2 Algoritma dan Program Untuk Mengestimasi Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan Estimator
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
xi
Penalized Spline yang Diterapkan Pada Data Riil atau Data
Bangkitan ......................................................................................... 47
4.2.1 Algoritma dan Program untuk Mengestimasi Model Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan
Estimator Penalized Spline ................................................... 47
4.2.2 Penerapan Model Regresi Semiparametrik Birespon
Multiprediktor Berdasarkan Estimator Penalized Spline
pada Data Riil ....................................................................... 54
BAB V KESIMPULAN DAN SARAN ............................................................. 71
5.1 Kesimpulan ....................................................................................... 71
5.2 Saran .................................................................................................. 72
DAFTAR PUSTAKA ......................................................................................... 73
LAMPIRAN
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
xii
DAFTAR TABEL
Nomor Judul Tabel Halaman
3.1 Variabel-variabel Penelitian ........................................................ 36
4.1 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik
Knot, dan Nilai Lambda Optimal, serta GCV Minimum
Prediktor Ke-1 ............................................................................. 57
4.2 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik
Knot, dan Nilai Lambda Optimal, serta GCV Minimum
Prediktor Ke-2 ............................................................................. 59
4.3 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik
Knot, dan Nilai Lambda Optimal, serta GCV Minimum
Prediktor Ke-3 ............................................................................. 60
4.4 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik
Knot, serta Nilai Lambda Optimal Setiap ................................... 61
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
xiii
DAFTAR GAMBAR
Nomor Judul Gambar Halaman
3.1 Diagram Alir Algoritma dan Program ........................................ 35
4.1 Scatterplot antara Tekanan Darah Sistolik dan Diastolik
dengan Berat Badan .................................................................... 55
4.2 Scatterplot antara Tekanan Darah Sistolik dan Diastolik
dengan Usia ................................................................................. 56
4.3 Scatterplot antara Tekanan Darah Sistolik dan Diastolik
dengan HDL ................................................................................ 56
4.4 Plot Observasi dan Estimasi pada Tekanan Darah
Sistolik Data Insample ................................................................ 68
4.5 Plot Observasi dan Estimasi pada Tekanan Darah
Diastolik Data Insample .............................................................. 68
4.6 Plot Observasi dan Estimasi pada Tekanan Darah
Sistolik Data Outsample ............................................................. 69
4.7 Plot Observasi dan Estimasi pada Tekanan Darah
Diastolik Data Outsample ........................................................... 70
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
xiv
DAFTAR LAMPIRAN
Nomor Judul
1 Data Insample Tekanan Darah Pasien dan Variabel Prediktor RSU
Haji Surabaya
2 Data Outsample Tekanan Darah Pasien dan Variabel Prediktor
RSU Haji Surabaya
3 Program Uji Korelasi Pearson
4 Program Identifikasi Kombiasi Orde Respon, Jumlah Knot, Titik
Knot, dan Lambda Optimal Setiap Prediktor
5 Program Estimasi Model Regresi Semiparametrik Birespon
Berdasarkan Estimator Penalized Spline (Tanpa Pembobot)
6 Program Uji Glesjer dan Penentuan Matrik Pembobot
7 Program Estimasi Model Regresi Semiparametrik Birespon
Berdasarkan Estimator Penalized Spline (dengan Pembobot)
8 Program Estimasi Outsample Model Regresi Semiparametrik
Birespon Berdasarkan Estimator Penalized Spline
9 Output Uji Korelasi Pearson
10 Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik
Knot, dan Lambda Optimal Prediktor Ke-1
11 Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik
Knot, dan Lambda Optimal Prediktor Ke-2
12 Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik
Knot, dan Lambda Optimal Prediktor Ke-3
13 Output Estimasi Model Regresi Semiparametrik Birespon
Berdasarkan Estimator Penalized Spline (Tanpa Pembobot)
14 Output Uji Glesjer dan Penentuan Matrik Pembobot
15 Output Estimasi Model Regresi Semiparametrik Birespon
Berdasarkan Estimator Penalized Spline (dengan Pembobot)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
xv
16 Output Estimasi Outsample Model Regresi Semiparametrik
Birespon Berdasarkan Estimator Penalized Spline
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BAB I
PENDAHULUAN
1.1 Latar Belakang
Analisis regresi merupakan suatu metode dalam ilmu statistika yang
menganalisis pola hubungan secara fungsional antara variabel respon dan variabel
prediktor melalui estimasi kurva. Terdapat tiga macam pendekatan dalam
mengestimasi fungsi regresi, yaitu pendekatan parametrik, nonparametrik, dan
semiparametrik. Pendekatan parametrik digunakan apabila sudah mengasumsikan
bentuk tertentu dari pola hubungan antara variabel respon dan variabel prediktor
serta terdapat informasi, pengetahuan maupun teori masa lalu tentang karakteristik
data yang diteliti, sedangkan pendekatan nonparametrik digunakan karena tidak
adanya informasi sebelumnya tentang hubungan antara variabel respon dan
variabel prediktor (Ricky, 2014) dan data diharapkan mencari sendiri bentuk
estimasinya sehingga dapat dikatakan regresi nonparametrik memiliki fleksibilitas
yang lebih besar terhadap data yang diteliti. Dalam beberapa kasus di kehidupan
nyata sering diketahui pola kurva antara variabel respon dengan beberapa variabel
prediktor karena terdapat informasi sebelumnya tentang hubungan antara
keduanya, namun tidak dengan variabel prediktor yang lainnya yang belum
diketahui pola hubungannya. Solusi untuk mengetahui model fungsi tersebut
adalah dengan mengestimasi fungsi regresi menggunakan pendekatan regresi
semiparametrik. Pendekatan regresi semiparametrik digunakan jika pola
hubungan antara sekumpulan variabel prediktor terhadap variabel respon ada pola
yang diketahui dan ada pula yang pola hubungannya tidak diketahui (Budiantara,
2012).
Masalah estimasi pada regresi semiparametrik muncul karena adanya
komponen nonparametrik berupa fungsi yang tidak diketahui bentuknya. Oleh
karena itu, hampiran terhadap bentuk fungsi tersebut dapat dilakukan dengan
lebih dari satu bentuk fungsi. Beberapa diantaranya adalah spline, kernel, fourier,
wavelet, dan polinomial lokal. Secara aplikasi, hampiran-hampiran ini memiliki
1 SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
2
kelebihan yang berbeda (Wibowo, dkk., 2013). Pendekatan regresi nonparametrik
yang cukup populer adalah adalah spline (Andriani, et al., 2015), karena
memberikan fleksibilitas yang lebih baik terhadap karakteristik suatu fungsi atau
data dengan mulus (smooth) (Ricky, 2014). Keuntugan lain yang dimiliki oleh
spline adalah mampu menjelaskan perubahan pola perilaku fungsi dalam sub-
interval tertentu dan dapat digunakan untuk mengatasi atau mengurangi pola data
yang mengalami peningkatan tajam dengan bantuan titik knot. Griggs (2013)
meyatakan bahwa penalized spline lebih cocok digunakan terhadap data yang
mengalami peningkatan tajam karena penalized spline membebankan penalty
pada komponen potongan polinomial (piece wise polinomial) yang memiliki sifat
tersegmen yang kontinu sehingga lebih cocok digunakan untuk lebih
mengoptimalkan. Penalized spline adalah salah satu bentuk estimator spline yang
diperoleh dengan meminimumkan Penalized Least Square (PLS). Untuk itu ada
beberapa hal yang perlu dipertimbangkan, yaitu titik dan jumlah knot, fungsi
dasar spline, serta derajat bebas dan matrik penalty (Montoya, et al., 2014).
Beberapa penelitian terkait regresi berdasarkan estimator penalized spline
antara lain adalah Andriani, et al. (2015) dan Pütz (2016), kedua penelitian
tersebut menggunakan pendekatan nonparametrik dalam mengestimasi model,
namun pada kehidupan nyata sering kali ditemukan kasus dengan adanya pola
hubungan yang diketahui antara sekumpulan variabel prediktor terhadap variabel
respon dan ada pula pola yang tidak dapat diketahui sehingga diperlukan
pengembangan penelitian yaitu dengan pendekatan regresi semiparametrik.
Penelitian terkait model regresi semiparametrik berdasarkan estimator penalized
spline salah satunya adalah Salam (2013), yang mengestimasi model regresi
semiparametrik berdasarkan estimator penalized spline dengan menggunakan
metode likelihood maximum penalized, namun hanya menggunakan satu variabel
respon.
Persoalan dalam kehidupan sehari-hari sering dijumpai pemodelan regresi
dengan multirespon salah satu contohnya pengukuran tekanan darah yaitu sistolik
dan diastolik. Salah satu analisis regresi yang dapat digunakan untuk memodelkan
kasus tersebut adalah model regresi birespon. Penelitian mengenai model regresi
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
3
multirespon berdasarkan estimator spline truncated telah banyak dilakukan, antara
lain adalah Oktaviana (2011), Setyawan (2011), Juliandari (2014) dan Wulandari
(2014), namun penelitian yang menyangkut estimator penalized spline dengan
respon lebih dari satu belum banyak dikembangkan. Tujuan pemodelan regresi
multirespon adalah untuk mendapatkan model yang lebih baik dari pemodelan
respon tunggal, dengan model regresi yang tidak hanya mempertimbangkan
pengaruh prediktor terhadap respon, akan tetapi juga hubungan antar respon
(Fernandes, 2014). Penelitian dengan menggunakan regresi birespon berdasarkan
estimator penalized spline antara lain adalah Yolandika (2011) yaitu dengan
menggunakan pendekatan noparametrik, namun seperti halnya permasalahan pada
regresi dengan respon tunggal maka diperlukan pengembangan penelitian yaitu
dengan pendekatan regresi semiparametrik. Selain itu, terdapat penelitian dari
Chamidah dan Eridani (2015) mengenai regresi semiparametrik birespon
berdasarkan estimator penalized spline, penelitian tersebut menggunakan satu
variabel prediktor pada komponen parametrik dan satu variabel prediktor pula
pada komponen nonparametrik sedangkan pada sebagian besar kasus dalam
kehidupan nyata variabel respon tidak hanya dipengaruhi oleh satu variabel
prediktor saja, jika hanya menggunakan satu variabel saja maka kemungkinan
variabel prediktor tersebut belum dapat mewakili faktor yang mempengaruhi
variabel respon yang diteliti.
Skripsi ini membahas mengenai pengembangan pengestimasian
berdasarkan estimator penalized spline dalam model regresi semiparametrik
birespon multiprediktor karena dari berbagai penelitian yang sudah dilakukan saat
ini, belum dapat menjawab persoalan atas kasus data yang memerlukan variabel
respon lebih dari satu dan beberapa variabel prediktor pada komponen parametrik
dan nonparametrik dalam mengestimasi model regresi. Selain itu utuk
implementasi pada data maka dikembangkan pula algoritma dan
pemrogramannya. Penerapan dari algoritma penelitian akan lebih mudah apabila
menggunakan bantuan software statistika dibanding secara manual karena
penerapan secara manual akan membutuhkan waktu yang lama. Software
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
4
statistika yang digunakan dalam penelitian adalah Open Source Software R (OSS-
R).
Teori yang dibahas mengenai estimasi model regresi semiparametrik
birespon multiprediktor berdasarkan estimator penalized spline diterapkan pada
data tekanan darah dengan variabel respon pertama yaitu tekanan darah sistolik
dan variabel respon kedua yaitu tekanan darah diastolik. Tekanan darah sangatlah
penting karena merupakan kekuatan pendorong bagi darah agar dapat beredar ke
seluruh tubuh untuk memberikan darah segar yang mengandung oksigen dan
nutrisi ke organ-organ tubuh. Tekanan darah bervariasi untuk berbagai alasan,
seperti usia, berat badan, kandungan lemak darah, dan lain sebagainya. Faktor
resiko tekanan darah yang tinggi diantaranya adalah hipertensi, stroke, dan
jantung koroner. Penyakit-penyakit tersebut termasuk dalam penyakit tidak
menular yang saat ini sangat mengkhawatirkan dan telah menjadi masalah utama
dalam kesehatan masyarakat yang ada di Indonesia maupun di beberapa negara
yang ada di dunia. Sehingga perlu adanya pengawasan yang lebih dalam dunia
kesehatan terhadap tingkat tekanan darah. Penelitian yang membahas mengenai
tekanan darah sistolik dan diastolik salah satunya adalah Mersi dan Andrianto
(2016) menganalisis pengaruh LDL terhadap tekanan darah dengan pendekatan
regresi nonparametrik berdasarkan estimator penalized spline, namun penelitian
yang dilakukan masih menggunakan analisis unirespon yaitu dengan memodelkan
masing-masing tekanan darah sistolik dan diastolik terhadap LDL dan hanya
melibatkan satu variabel prediktor kompoen nonparametrik. Persoalan tersebut
melibatkan dua variabel respon dan diantara keduanya terdapat korelasi yang kuat
sehingga untuk selanjutya membutuhkan pemodelan dengan analisis regresi
semiparameterik birespon multiprediktor.
Berdasarkan uraian yang telah dijelaskan, penulis tertarik untuk membahas
secara lebih lanjut mengenai model regresi semiparametrik birespon
multiprediktor berdasarkan estimator penalized spline dengan membuat algoritma
dan program dalam OSS-R serta menerapkan hasilnya pada data riil yaitu data
tekanan darah sistolik dan tekanan darah diastolik.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
5
1.2 Rumusan Masalah
Berdasarkan latar belakang, maka pemasalahan yang dibahas dalam
skripsi ini adalah :
1. Bagaimana mengestimasi model regresi semiparametrik birespon
multiprediktor berdasarkan estimator penalized spline?
2. Bagaimana membuat algoritma dan program untuk mengestimasi regresi
semiparametrik birespon multiprediktor berdasarkan estimator penalized
spline menggunakan software OSS-R yang diterapkan pada data riil atau
data bangkitan?
1.3 Tujuan Penelitian
Berdasarkan rumusan masalah, maka tujuan penelitian dalam skripsi ini
adalah :
1. Mengestimasi model regresi semiparametrik birespon multiprediktor
berdasarkan estimator penalized spline.
2. Membuat algoritma dan program untuk mengestimasi regresi
semiparametrik birespon multiprediktor berdasarkan estimator penalized
spline menggunakan software OSS-R yang diterapkan pada data riil atau
data bangkitan.
1.4 Manfaat Penelitian
Berdasarkan latar belakang, maka manfaat penelitian dalam skripsi ini
adalah :
1. Menambah wawasan dan pengetahuan tentang estimasi model regresi
semiparametrik birespon multiprediktor berdasarkan estimator penalized
spline.
2. Mengetahui algoritma dan program untuk mengestimasi regresi
semiparametrik birespon multiprediktor berdasarkan estimator penalized
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
6
spline menggunakan software OSS-R dan penerapan pada data riil atau
data bangkitan.
1.5 Batasan Masalah
Estimasi model regresi semiparametrik birespon multiprediktor
berdasarkan estimator penalized spline dalam penulisan skripsi ini dibatasi pada
pemilihan parameter penghalus dengan menggunakan metode Generalized Cross
Validation (GCV).
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BAB II
TINJAUAN PUSTAKA
Pada bab ini akan dibahas mengenai beberapa tinjauan pustaka yang akan
digunakan untuk pembahasan pada bab-bab berikutnya. Pada BAB I sebelumnya
telah diuraikan tentang tujuan dari penulisan skripsi ini. Berdasarkan tujuan
tersebut maka akan dibahas mengenai matrik, regresi semiparametrik, regresi
birespon, regresi multiprediktor, estimator penalized spline, kuantil, pemilihan
titik knot optimal, pemilihan jumlah titik knot optimal, model semiparametrik
berdasarkan estimator penalized spline dengan satu variabel respon, model
semiparametrik birespon berdasarkan estimator penalized spline dengan satu
variabel prediktor, kasus heteroskedastisitas dan homoskedastisitas, estimasi
parameter Weighted Least Square (WLS), uji glesjer, uji korelasi pearson, OSS-
R.
2.1 Aljabar Matrik
Matrik adalah susunan bilangan atau variabel dalam bentuk persegi
panjang atau persegi. Bilangan-bilangan dalam susunan tersebut dinamakan entri
matrik. Ukuran matrik dijelaskan dengan menyatakan banyaknya baris dan
banyaknya kolom yang terdapat dalam matrik tersebut, sehingga suatu matrik
dengan m baris dan n kolom dikatakan sebagai matrik dengan ukuran (ordo) m x
n. Bentuk umum matrik yang berukuran m x n adalah sebagai berikut:
11 12 1
21 22 2
1 1
n
nmn
m m mn
a a aa a a
a a a
=
A
Tiap-tiap bilangan ija yang berada didalam matrik A disebut elemen.
Indeks i dan j masing-masing menyatakan baris dan kolom tempat beradanya
7 SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
8
sebuah elemen dari matrik A. Beberapa operasi pada matrik adalah sebagai
berikut:
a. Matrik Partisi
Partisi matrik A menjadi empat submatrik (persegi atau persegi panjang)
sebagai berikut:
11 12
21 22
=
A AA
A A
Apabila dua matrik A dan B adalah conformal untuk perkalian, dan jika A dan B
dipartisi sehingga submatrik conformal, maka perkalian AB dapat dinyatakan
sebagai berikut:
11 12 11 12
21 22 21 22
=
A A B BAB
A A B B
11 11 12 21 11 12 12 22
21 11 22 21 21 12 22 22
+ + = + +
A B A B A B A BA B A B A B A B
Apabila B diganti oleh vektor b yang dipartisi menjadi dua himpunan dari
elemen-elemen, jika A dipartisi menjadi dua himpunan dari kolom-kolom, maka
menjadi
( ) 11 2 1 1 2 2
2
= = +
bAb A A A b A b
b
b. Perkalian
Jika A adalah matrik berordo m x n dan B adalah matrik berordo n x p. Hasil
perkalian AB adalah matrik C berukuran m x p dengan 1
n
ij ik kjk
c=
=∑A B . Perkalian
dua buah matrik dapat terjadi jika dan hanya jika banyaknya kolom dari matrik A
sama dengan banyaknya baris dari matrik B. Perkalian yang melibatkan vektor
mengikuti aturan yang sama untuk matrik. Misalkan A adalah matrik berordo
mxn,vektor b berdimensi px1, vektor c berdimensi px1. Kemudian Ab adalah
vektor kolom berdimensi nx1, Tb c adalah jumlah perkalian berukuran (1 x 1),
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
9
Tbc adalah matrik berukuran pxp. karena Tb c adalah jumlah perkalian berukuran
(1 x 1), maka sama dengan Tc b , yaitu:
1 1 2 2 ...Tp pb c b c b c= + + +b c
1 1 2 2 ...Tp pc b c b c b= + + +c b
T T=b c c b
Jika j adalah vektor berdimensi nx1 yang semua elemennya 1, maka
( )1
21 2, ,...,
j j
j jTi i i i i ip
j nj
aa
a a a
a
∑ ∑ = ∑ ∑ ∑ ∑
j A
c. Transpose
Jika matrik ( )ija=A , maka transpose dari A didefinisikan sebagai
( ) ( )TTij jia a= =A . Notasi ini menunjukkan bahwa elemen pada baris ke-i dan
kolom ke-j dari matrik A merupakan baris j dan kolom i dari matrik TA . Jika
matrik A berordo mxn. Jika A adalah sembarang matrik, maka ( )TT =A A . Salah
satu sifat transpose yang digunakan adalah ( )T T T=AB B A dengan syarat matrik
A dan B masing-masing merupakan matrik yang memenuhi sifat perkalian. Jika A
adalah matrik partisi 11 12
21 22
=
A AA
A A, maka transpose matrik partisi
11 12
21 22
T TT
T T
=
A AA
A A, jika B adalah vektor partisi ( )1 2=b b b , maka transpose
vektor partisi 1
2
TT
T
=
bb
b.
d. Invers
Misalkan A adalah matrik berukuran nxn (A adalah matrik persegi). Sebuah
matrik B berukuran nxn sedemikian hingga BA = I disebut invers kiri dari A dan
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
10
sebuah matrik B berukuran nxn sedemikian hingga AB = I disebut invers kanan
dari A dengan I merupakan matrik identitas. Jika AB = BA = I maka matrik B
disebut invers kanan dan invers kiri dari matrik A dan matrik A dikatakan
invertibel. Jika matrik A dan B masing-masing merupakan matrik yang invertibel
dan AB terdefinisi maka ( ) 1 1 1− − −=AB B A . Jika A adalah matrik simetri dan
nonsingular dan dipartisi menjadi 11 12
21 22
=
A AA
A A dan jika 1
22 21 11 12−= −B A A A A ,
sedemikian hingga, maka 111−A dan 1−B ada, sehingga invers dari A adalah :
1 1 1 1 1 11 11 11 12 21 11 11 12
1 1 121 11
− − − − − −−
− − −
+ −=
−
A A A B A A A A BA
B A A B
e. Trace
Trace ( )ija=A berukuran nxn adalah fungsi skalar yang didefinisikan sebagai
jumlah dari elemen-elemen diagonal dari A, yaitu tr(A)1
n
iii
a=
=∑
f. Turunan Fungsi Vektor dan Matrik
Misalkan ( )u f x= fungsi dari variabel-variabel 1 2, ,..., px x x dengan
( )1 2, ,...,T
px x x=x , dan misalkan
1
2
p
uxu
u x
ux
∂ ∂ ∂
∂ ∂= ∂ ∂
∂
x
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
11
Misalkan T Tu = =a x x a , dengan ( )1 2, ,...,Tpa a a a= adalah vektor konstanta,
maka ( ) ( )T Tu ∂ ∂∂
= = =∂ ∂ ∂
a x x aa
x x x. Jika Tu = x Ax , dengan A adalah matrik simetri
dari suatu konstanta, 1
2
3
xxx
=
x dan 11 12 13
21 22 23
31 32 33
a a aa a aa a a
=
A maka
( )
( )
( )
( )
1
1
22
3
3
2 2
T
TT T
T
T
T
x
ux
x
∂
∂
∂ ∂∂ = = = = ∂ ∂ ∂ ∂ ∂
a Ax
a xa Ax a Axa x Ax
x xa x
a Ax
g. Matrik Kovariansi
Variansi 2 2 21 2, ,..., pσ σ σ dari 1 2, ,..., py y y dan kovariansi ijσ untuk semua i j≠
merupakan elemen-elemen dari matrik kovariansi yang dinotasikan dengan Σ
yaitu
( )
11 12 1
21 22 2
1 2
...
...cov
...
p
p
p p pp
σ σ σσ σ σ
σ σ σ
∑ = =
y
Baris ke-i dari Σ mengandung variansi iy dan kovariansi iy dengan tiap variabel y
yang lain. Supaya konsisten dengan notasi ijσ digunakan 2 ,ii iσ σ= 1, 2,...,i p=
untuk varians. Varians terdapat pada diagonal Σ, dan kovariansi berada diselain
diagonal tersebut.
(Rencher and Schaalje, 2008)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
12
2.2 Pendekatan Regresi
2.2.1 Regresi Parametrik
Regresi parametrik digunakan untuk mengetahui pola hubungan antara
variabel respon dengan variabel prediktor yang diasumsikan telah diketahui
bentuk fungsinya. Salah satu bentuk regresi parametrik dapat dinyatakan sebagai
model regresi linier berganda yang secara umum dapat dituliskan dalam notasi
matrik sebagai berikut :
i i iy X β ε= +
dengan y merupakan vektor dari variabel respon yang berukuran nx1, X
merupakan matriks dari variabel prediktor yang diasumsikan tetap berukuran nxp,
βmerupakan vektor parameter yang berukuran px1, dan ε adalah residual acak,
dengan 2~ (0, )IIDNε σ .
(Ruppert, et al., 2003)
2.2.2 Regresi Nonparametrik
Regresi nonparametrik merupakan salah satu pendekatan dalam analisis
regresi yang digunakan apabila kurva regresinya tidak diasumsikan memiliki
bentuk tertentu. Dalam regresi nonparametrik, kurva regresi hanya diasumsikan
halus (smooth), sehingga pendekatan regresi nonparametrik memiliki fleksibilitas
yang tinggi karena data diharapkan mencari sendiri bentuk estimasi kurva regresi
tanpa dipengaruhi oleh faktor subyektivitas peneliti.
Jika diberikan pasangan data ( ),i it y dengan 1,2,...,i n= dan pola hubungan
antara variabel response dengan variabel prediktor tidak diketahui bentuknya,
maka dapat digunakan pendekatan regresi nonparametrik. Secara umum, model
regresi nonparametrik adalah
( )i i iy f t= + ε , 1, 2,...,i n=
dengan iy merupakan variabel response, ( )if t adalah persamaan kurva regresi
yang tidak diasumsikan mengikuti bentuk tertentu dengan it sebagai variabel
prediktor, sedangkan iε adalah error berdistribusi normal independen dengan
(2.1)
(2.2)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
13
mean 0 dan variansi 2σ (Eubank, 1999). Terdapat beberapa teknik untuk
mengestimasi kurva regresi dalam regresi nonparametrik, diantaranya yaitu
regresi spline, kernel, deret fourir dan lain-lain.
2.2.3 Pendekatan Regresi Semiparametrik
Pendekatan regresi tidak hanya parametrik dan nonparametrik, terdapat
pula golongan statistikawan, yang memandang kurva regresi dapat
diklasifikasikan kedalam dua komponen, yaitu komponen parametrik (bentuk
fungsinya diketahui) dan komponen nonparametrik (bentuk fungsinya tidak
diketahui). Pandangan ini memberikan pendekatan regresi semiparametrik,
(Budiantara, 2012).
Analisis regresi semiparametrik merupakan gabungan dari regresi
parametrik dan regresi nonparametrik, sehingga estimasi model semiparametrik
ekuivalen dengan estimasi parameter-parameter pada komponen parametrik dan
estimasi kurva pada komponen nonparametrik. Misalkan terdapat data
berpasangan ( ), , i i iy x t , dan hubungan antara iy , ix , dan it diasumsikan
mengikuti model regresi semiparametrik sebagai berikut :
( )i i i iX fY tβ ε+ += dengan 1,2,...,i n=
dengan iY adalah variabel respon pada pengamatan ke i− , iX adalah komponen
parametrik, ( )if t adalah fungsi regresi nonparametrik dan ε adalah residual
acak, dengan 2~ (0, )IIDNε σ .
(Ruppert, et al., 2003)
2.3 Regresi Birepson
Regresi birespon merupakan suatu analisis model regresi yang melibatkan
dua variabel respon dalam estimasi data. Secara umum model regresi birespon
dapat dinyatakan dalam persamaan (2.4) sebagai berikut:
( ) ,i i it ε= +Y f
dengan 1,2,...,i n=
(2.3)
(2.4)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
14
dengan (1) (2)(Y ,Y )Tij i i=Y adalah dua respon yang saling berkorelasi dan
(1) (1)( ) ( ( ), ( ))Ti i it t f tf=f
adalah fungsi regresi dalam model, dan (1) (2)( , )Ti i iε ε ε=
adalah residual pengukuran dengan mean 0
dan variansi i∑ , dengan matrik
variansi-covariansi sebagai berikut : (1)
1 (2)( ) ii
i
Var Varε
εε
= =
∑
(1) (1) (2)
(1) (2) (2)
( ) Cov( , )Cov( , ) ( )
i i i
i i i
VarVar
ε ε εε ε ε
=
21 1 2
21 2 2
i i i i
i i i i
σ σ σ ρσ σ ρ σ
=
dengan 21σ dan 2
2σ adalah 2 komponen variansi dan ρ merupakan koefisien
korelasi.
(Welsh and Yee, 2006)
2.4 Regresi Multiprediktor
Model aditif mempunyai variabel respon y yang bergantung pada
penjumlahan beberapa fungsi dari variabel prediktor x, sehingga model regresi
multiprediktor dapat dituliskan sebagai berikut :
1( )
d
i j ji ij
y f x ε=
= +∑
dengan iε adalah residual acak yang diasumsikan berdistribusi identik dan
independen dengan mean nol dan variansi 2σ .
(Wood and Agustin, 2002)
2.5 Estimator Penalized Spline Pada Regresi Nonparametrik
Estimator penalized spline merupakan salah satu estimator f yang smooth
dan dapat digunakan untuk menghasilkan fungsi regresi yang sesuai dengan data.
(2.5)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
15
Estimator penalized spline dengan multiprediktor menggunakan model aditif
dengan variabel respon y yang bergantung pada penjumlahan beberapa variabel
prediktor x, dengan mengikuti bentuk model sebagai berikut :
( )1
; 1, 2, ,q
i j ji ij
y f x i nε=
= + = …∑
dengan jf adalah fungsi regresi prada prediktor ke-j yang belum diketahui
bentuknya, yi adalah variabel respon pengamatan ke i− , jix adalah variabel
prediktor ke-j pada pengamatan ke i− , dan iε adalah error random dengan mean
0 dan variansi 2Iσ .
Menurut Ruppert (2003), estimator penalized spline adalah suatu fungsi f
yang dinyatakan sebagai berikut :
0( ) ( ),
j jp k
j ji jh h jih
f x xβ φ+
=
= ∑
1, 2,..., ;i n= 1,2,...,j q=
dengan ( )0 1 ( ), ,...,j j
T
j j j j p kβ β β β += menunjukkan vektor parameter dan ( )h jixφ
merupakan suatu fungsi yang didefinisikan sebagai berikut :
( )( )
, untuk 0( )
, untuk 1 1j
j
hji j
ph ji
ji j h p j j
x h px
x p h pφ
ξ −+
≤ ≤=
− + ≤ ≤ +
jp adalah orde polinomial, jk adalah banyaknya knot untuk prediktor ke-j, dan h
adalah indeks fungsi basis berupa bilangan bulat positif, dan
( ) ( )( ) ( )( )
( )
,
0,
j j j
j
j
p ji j h p j h pji j h p
j h p
x xx
x
ξ ξξ
ξ− −
−+
−
− >− = ≤
Penalized spline merupakan potongan-potongan polinomial dengan
segmen-segmen yang berbeda digabungkan bersama menjadi titik knot
1 2, , , kξ ξ ξ… . Pada penalized spline, titik knot ditentukan berdasarkan sampel
kuantil dari nilai unique (tunggal) suatu variabel indepeden 1
ni i
x=
. Fungsi regresi
nonparametrik degan orde p dan titik-titik knots 1 2, , , kξ ξ ξ… dinyatakan dalam
persamaan (2.6) sebagai berikut :
(2.6)
(2.7)
(2.8)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
16
0 1 ( )1
( ) ... ( )j
j j
j j jj
Kp p
j ji j j ji jp ji j p k ji jkk
f x x x xβ β β β ξ+ +=
= + + + + −∑
dari fungsi pada persamaan (2.9) dapat dirubah menjadi bentuk matrik seperti
persamaan (2.10) sehingga didapatkan model linier campuran
( )j j j jf x β= X
dengan 2
1 1 1 1 1 1
22 2 2 2 1 2
21
1 ( ) ( )
1 ( ) ( )
1 ( ) ( )
j j j
j
j j j
j
j j j
j
p p pj j j j j j j k
p p pj j j j j j j k
p p pjn jn jn jn j jn jk
x x x x x
x x x x x
x x x x x
ξ ξ
ξ ξ
ξ ξ
+ +
+ +
+ +
− − − −
… …
… … =
− − … …
X
;
0
1
( )j j
j
jj
j p k
ββ
β
β +
=
dan estimator penalized spline dapat dituliskan sebagai
ˆy β= X
Estimator penalized spline diperoleh dengan meminimumkan fungsi Penalized
Least Square (PLS) yang merupakan ukuran standart dari kesesuaian terhadap
data yang terdiri dari least square ( )1
1 2( )n
j ii
i jn y f x=
− −∑ dan ukuran kemulusan
alami 2( )
1j
j
j
j
K
j pk
kβ +=∑ , yang dituliskan dalam persamaan (2.12) sebagai berikut :
( )1 2)
1
2
1(( ) , 0
j
j
j
j
Kn
i j ji j j p ki k
n y f x λ β λ= =
−+− + ≥∑ ∑
dengan jλ adalah suatu parameter penghalus dari variabel prediktor ke-j, k adalah
jumlah knot, dan p adalah orde polinomial. Langkah-langkah selanjutnya untuk
meminimumkan fungsi PLS adalah sebagai berikut :
1. Mengubah 1 2
1( ( ))
n
i j jii
n y f x−
=
−∑ kedalam bentuk matrik
( ) ( )2
1
1 1( ) 2n
T
i
T T T Ti j ji j j j j j jn y f x n y y yβ β β− −
=
− = − +∑ X X X
(2.9)
(2.10)
(2.11)
(2.12)
(2.13)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
17
2. Mengubah 2( )
1
j
j jj
K
j p kk
β +=∑ kedalam bentuk matrik
2 2 2 2( ) ( 1) ( 2) ( )
1
j
j j j j j jj
K
j m k j p j p j p Kk
β β β β+ + + +=
= + +…+∑
Jika diasumsikan terdapat matrik jD yang merupakan suatu matrik diagonal,
didefinisikan sebagai berikut :
11
22
( 1)( 1)
( 1)( 1)
0 ... 0 00 ...
0 0
0 ... 0 ...
j j
j j j j
jp p
p K p K
aa
a
a
+ +
+ + + +
=
D
dengan ( )( )11 22 1 10,
j j j jp p p p
a a a a+ +
= =…= = =
( )( ) ( )( ) ( )( )2 2 3 3 1 11
j j j j j j j jp p p p p K p Ka a a
+ + + + + + + += =…= =
sehingga fungsi penalized 2( )
1
j
j jj
K
j p kk
β +=∑ dituliskan dalam bentuk matrik, sebagai
berikut :
11 0
22 12( ) 0 1 ( )
1
( 1)( 1) ( )
0 00 0
0 0
j
j j j jj
j j j j j j
jK
jj p k j j j p K
k
p K p K j p K
aa
a
ββ
β β β β
β
+ +=
+ + + + +
=
…
∑
Tj jβ β= D
Matrik fungsi PLS yang diperoleh dari menggabungkan fungsi persamaan dapat
ditulis sebagai berikut :
( )1 2T T T T T T Tj j j j j j j j j j jL n y y yβ β β λ β β−= − + +X X X D
(2.14)
(2.15)
(2.16)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
18
Nilai 𝜷𝜷 dapat diperoleh dengan meminimumkan persamaan L. Syarat perlu agar
persamaan L minimum adalah turunan pertama sama dengan nol, 0Lβ∂
=∂
,
sehingga diperoleh persamaan (2.17) sebagai berikut : 1ˆ ( )T T
j j j j j jn yβ −= +X X λ D X
Subtitusi persamaan pada ˆy β= C
menghasilkan bentuk estimator penalized
spline ( )j jf x dari variabel prediktor ke-j menjadi persamaan (2.18) sebagai
berikut : 1ˆ ( )T T
j j j j j jy n y−= +X X X λ D X
( )ˆ jy yλ= H
(Ruppert, et al., 2003)
2.6 Kuantil
Ukuran lokasi yang menjelaskan atau menunjukkan lokasi sebagian data
relatif terhadap keseluruhan data disebut fraktil atau kuantil. Menurut Walpole
(1997), kuantil adalah nilai-nilai yang dibawahnya terdapat sejumlah pecahan atau
persentase tertentu dari seluruh pengamatan. Beberapa kuantil yang sering dibahas
diantaranya adalah persentil, desil, dan kuartil.
Nilai-nilai yang membagi segugus pengamatan menjadi 100 bagian yang sama
disebut persentil dan umumnya dinotasikan dengan 1 2 99, , ,P P P . Notasi 1P
berarti bahwa 1% dari seluruh data terletak di bawah 1P , 2% terletak di bawah 2P
dan seterusnya sampai 99P yang menyatakan bahwa 99% terletak di bawah 99P .
Nilai-nilai yang membagi jajaran data menjadi 10 bagian yang sama dinamakan
desil. Nilai-nilai tersebut dinotasikan dengan 1 2 9, , ,D D D yang berarti bahwa
10% data terletak di bawah 1D , 20% terletak di bawah 2D , dan seterusnya sampai
9D yang berarti bahwa 90% data terletak di bawah 9D . Nilai-nilai yang membagi
data menjadi 4 bagian yang sama disebut kuartil dan dinotasikan dengan
(2.17)
(2.18)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
19
𝑄𝑄1, 𝑄𝑄2, 𝑄𝑄3. Notasi 𝑄𝑄1 berarti bahwa 25% data terletak di bawah 𝑄𝑄1, 50% data
terletak di bawah 𝑄𝑄2, dan 75% data terletak di bawah 𝑄𝑄3. Persentil ke-50, desil
kelima, dan kuartil kedua dari suatu data dapat pula disebut median karena
median merupakan nilai-nilai yang membagi data menjadi 2 bagian yang sama.
(Walpole, et al., 2012).
2.7 Pemilihan Titik Knot Optimal
Parameter λ merupakan pengontrol keseimbangan antara kemulusan
fungsi terhadap data. Jika λ besar maka estimasi fungsi yang diperoleh akan
semakin halus, dan sebaiknya jika λ kecil maka estimasi fungsi yang diperoleh
akan semakin kasar. Salah satu metode yang digunakan sebagai kriteria untuk
menentukan parameter penghalus λ optimum adalah dengan menentukan nilai
Generalized Cross Validation (GCV) yang minimum. Metode GCV dapat
didefinisikan sebagai berikut :
1 2
( )( )(1 ( ))fit
RSSGCVn df
λλλ−=
−
dengan ( )1 1ˆ ˆ ˆ2 ( )( ) () T T T TS n f f nS fR λ λ λ ω ωλ −− − + = − −= y y y Y A Y A
( ) tr(H( ));fitdf λ λ= 1(H( ) )T TX X X n D Xλλ −= +
(Ruppert, et al., 2003)
2.8 Pemilihan Jumlah Titik Knot Optimal
Pemilihan jumlah dan titik knot optimal perlu dilakukan untuk
mengestimasi fungsi spline. Jumlah knot ( K ) merupakan banyaknya titik knot
atau banyaknya titik perubahan perilaku fungsi pada interval yang berlainan.
Ruppert (2002) menyatakan bahwa titik knot terletak pada sampel kuantil dari
nilai-nilai unique (tunggal) variabel prediktor 1
ni i
t=
. Salah satu metode yang
dapat digunakan untuk menentukan jumlah dan lokasi titik knot optimal adalah
metode full-search. Algoritma dari metode full-search yang didasarkan pada
kriteria Generalized Cross Validation (GCV) adalah:
(2.19)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
20
a. Membandingkan nilai ( )GCV λ pada 1K = dan 2K = .
i. Apabila nilai ( )GCV λ pada 1K = lebih kecil dari nilai ( )GCV λ pada
2K = , maka algoritma berhenti dengan memilih jumlah knot optimal
yaitu 1K = .
ii. Apabila nilai ( )GCV λ pada 1K = lebih besar dari nilai ( )GCV λ pada
2K = , maka algoritma ini akan dilanjutkan dengan membandingkan
nilai ( )GCV λ untuk 2K = dan 3K = .
b. Membandingkan nilai ( )GCV λ pada 2K = dan 3K = .
i. Apabila nilai ( )GCV λ pada 2K = lebih kecil dari nilai ( )GCV λ pada
3K = , maka algoritma berhenti dengan memilih jumlah knot optimal
yaitu 2K = .
ii. Apabila nilai ( )GCV λ pada 2K = lebih besar dari nilai ( )GCV λ pada
3K = , maka algoritma ini akan dilanjutkan dengan membandingkan
nilai ( )GCV λ untuk 3K = dan 4K = .
Membandingkan nilai ( )GCV λ pada 3K = dan 4K = yang dilakukan
dengan cara yang sama seperti di atas, demikian seterusnya hingga diperoleh
nilai ( )GCV λ yang minimum.
(Ruppert, et al., 2003)
2.9 Model Semiparametrik Berdasarkan Estimator Penalized Spline
dengan Satu Variabel Respon
Model regresi semiparametrik berdasarkan estimator penalized spline,
diberikan dalam bentuk model sebagai berikut :
( )T= + +β f Zy X ε
dengan y adalah vektor dari variabel respon yang berukuran n×1, TX adalah
matrik transpose variabel prediktor untuk komponen parametrik dengan ukuran
n×p dengan p=(k+1) dan Z variabel prediktor untuk komponen nonparametrik,
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
21
( )0 1 2, , ,..., Tkβ β β β=β merupakan vektor (k+1)×1 untuk parameter yang tidak
diketahui, f adalah vektor dari fungsi regresi yang bentuk kurvanya tidak
diketahui atau merupakan fungsi yang mulus atau dengan kata lain f atau ( )if z
licin (smooth) yaitu 0 11
(z ) ... ( ) , 1, 2 .,. .,nK
p pi p pk k
kf z z z x pβ β β β +
=
= + + + + − =∑ dan
ε adalah vektor dari error random independen dengan mean nol dan varians 2σ . (Salam, 2013)
2.10 Model Semiparametrik Birespon Berdasarkan Estimator Penalized
Spline dengan Satu Variabel Prediktor
Model regresi semiparametrik birespon berdasarkan estimator penalized
spline, diberikan n data observasi 1 2( , , , )i i i iy y x t dengan ijy menunjukkan
observasi ke i− pada respon ke j− memeuhi model regresi semiparametrik
multirespon sebagai berikut :
( ) , 1, 2,...,Ti i i iY a g t i nε= + + =X
dengan 1 2( , )Ti i iY y y=
dan iε
berturut-turut adalah respon dan error untuk
observasi ke i− . ( )ig t
merupakan fungsi dari rata-rata populasi yang diasumsikan
smooth. 1(1 ... )T Ti i iqx x=X
adalah komponen parametrik dari fungsi yang
diasumsikan diketahui untuk observasi ke i− dan ( )0 1, ,...,T
qa a a a=
yang
merupakan koefisien dari variabel prediktor parametrik. Persamaan (2.20)
mengandung Ti aX
sebagai komponen parametrik dan ( )ig t
merupakan
komponen nonparametik. Berdasarkan persamaan (2.20), fungsi ( )ig t
diestimasi
menggunakan estimator penalized spline. Fungsi penalized spline dengan p orde
dan beberapa knot 1 2( , ,..., )kτ τ τ dapat ditulis sebagai berikut :
11 1
( ) ( )p K
r pr p l
r lg t t tβ β τ+ +
= =
= + −∑ ∑
(2.20)
(2.21)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
22
Estimasi α dan β dengan meminimumkan kriteria Penalized Least Square
(PLS) sebagai berikut : 2
2 21
1 1 1( )
n KT T
ij ij ij pj i i
y x tα β λ β += = =
− + +∑∑ ∑
dengan λ adalah parameter penghalus, dan K adalah titik knot dan p merupakan
orde polinomial.
(Chamidah and Eridani, 2015)
2.11 Kasus Homoskedastisitas dan Heteroskedastisitas
Salah satu asumsi dalam analisis regresi adalah homoskedastisitas yang
berarti bahwa variansi dari setiap iε tidak tergantung pada variabel pedictor.
Variansi dari setiap iε bernilai sama untuk semua variabel pedictor, sehingga
nilai dari variansi residual bersifat konstan atau 2 2( ) E( )i ivar = =ε ε σ ,
1, 2,3,...,i n= . Pelanggaran terhadap asumsi ini disebut heteroskedastisitas yang
berarti bahwa variansi dari setiap error bersifat tidak konstan. Dalam analisis
regresi, heteroskedastisitas dinyatakan sebagai berikut: 2
i i ivar ε = σ x , 1, 2, ,i n=
Persamaan (2.18) juga dapat dinotasikan dalam model di bawah ini.
21 1
222 2 2
2
0 0 0 00 0 0 0
'
0 0 0 0 0 0
X
n n
E
ω σ ω σ εε = σ Ω = σ = ω σ
sehingga 2 2i iσ = σ ω . Dalam kasus homoskedastisitas, nilai 1iω = untuk
1,2, ,i n= .
(Greene, 2003)
(2.23)
(2.22)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
23
2.12 Estimasi Parameter Weighted Least Square (WLS)
Untuk mengilustrasikan metode Weighted Least Square (WLS), digunakan
model dua variabel. Metode kuadrat terkecil tanpa pembobot yaitu Ordinary Least
Square (OLS) mengasumsikan bahwa terdapat variansi konstan dalam error yang
pada umumnya disebut keadaan homoskedastisitas. Untuk mengestimasi
parameter fungsi yang diminimumkan yakni :
( ) ( )TT y yε ε = − β − βX X
sedangkan metode WLS meminimumkan jumlah kuadrat error terboboti dapat
digunakan ketika asumsi variansi konstan dalam error dilanggar atau dalam kata
lain disebut heteroskedastisitas (Greene, 2003) yang dirumuskan sebagai berikut :
( ) ( )TT y yε ε = − β − βW X W X
dengan β
merupakan estimator WLS dan pembobot W merupakan invers dari
matrik variansi-kovariansi dari ε
atau y
dengan syarat X , yang dinotasikan
( ) ( )var var ,yε = = ∑X X
dengan 2 2 21 2( , ,..., ).ndiag∑ = σ σ σ
Persamaan (2.18) selanjutnya diturunkan terhadap β
sedemikian sehingga
diperoleh estimator WLS sebagai berikut: 1( )T T y−β = X WX X W
Pada metode OLS, pembobot W merupakan matrik identitas.
(Maziyya dkk.,2015)
2.13 Uji Glesjer
Untuk mendeteksi terjadinya heteroskedastisitas bisa dilakukan dengan
beberapa uji diantaranya Uji korelasi Rank-Spearmen, Uji Park, Uji Glesjer, Uji
Goldfeld-Quandt (Gujarati, 2004). Uji glesjer merupakan pengujian yang sangat
popular untuk melihat terjadinya gejala heteroskedastisitas. Uji glesjer dilakukan
dengan cara meregresikan harga mutlak residual dengan variabel prediktornya.
(2.24)
(2.25)
(2.26)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
24
( )i i ig xε ε= +
Hipotesis untuk uji glesjer adalah sebagai berikut :
2 2 2 20 1 2: ... nH σ σ σ σ= = = =
1 :H minimal ada satu 2 2iσ σ≠ , dengan 1,2,...,i n=
Statistik uji :
( ) ( )
( ) ( )
2
1
2
1
ˆ / 1
ˆ /
n
ii
hitung n
i ii
jF
n j
ε ε
ε ε
=
=
− − = − −
∑
∑
dengan 1,2,...,j n= dan i j≠ , n merupakan bayaknya variabel prediktor . daerah
penolakan hipotesis adalah tolak 0H jika ( , 1, )hitung tabel p n pF F Fα − −< = , sehingga
akan terjadi kasus heteroskedastisitas jika 0H ditolak yakni terdapat minimal satu
2 2iσ σ≠ .
2.14 Uji Korelasi Pearson
Koefisien korelasi merupakan suatu nilai yang mengukur keeratan
hubungan antara dua variabel. Koefisien korelasi yang dihitung untuk data
populasi dinotasikan dengan ρ sedangkan koefisien korelasi yang dihitung untuk
data sampel dinotasikan dengan r. Nilai koefisien korelasi dapat dihitung dengan
menggunakan Pearson Product Moment pada persamaan (2.28) sebagai berikut:
(2.27)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
25
1
2 2
1 1
1
2 2 2 2
1 1
( )(Y )
( ) (Y )
n
i ii
n n
i ii i
n
i ii
n n
i ii i
X X Yr
X X Y
X Y nXYr
X nX Y nY
=
= =
=
= =
− −=
− −
−=
− −
∑
∑ ∑
∑
∑ ∑
nilai r selalu berada diantara -1 sampai 1 ( 1 1r− ≤ ≤ ). Apabila nilai 1r = maka
disebut dengan korelasi linier positif sempurna. Apabila nilai 1r = − maka
dinamakan korelasi linier negatif sempurna, sedangkan apabila nilai 0r =
menunjukkan bahwa tidak terdapat korelasi diantara kedua variabel tersebut.
Pengujian koefisien korelasi dilakukan dengan menggunakan hipotesis nol
yaitu kedua variabel tidak memiliki hubungan linier ( 0ρ = ) dan hipotesis
alternatif (H1) adalah 0ρ > , 0ρ < atau 0ρ ≠ . Konversi nilai koefisien korelasi
menjadi distribusi t adalah
2
2
1
r ntr−
=−
dengan derajat bebas 2n − , n merupakan banyaknya pasangan data dari variabel-
variabel yang diduga berkorelasi dan r merupakan nilai koefisien korelasi yang
diperoleh berdasarkan persamaan (2.28). Nilai statistik uji t yang telah diperoleh
berdasarkan persamaan (2.29) selanjutnya dibandingkan dengan nilai t tabel.
Apabila nilai t hitung kurang dari t tabel maka H0 diterima dan dapat disimpulkan
bahwa tidak terdapat korelasi linier diantara kedua variabel, demikian sebaliknya.
(Rasmussen, 2006)
2.15 Open Source Software R (OSS-R)
R merupakan salah satu software yang sering digunakan dalam statistika
dan termasuk dalam kategori Open Source Software (OSS) untuk memanipulasi
data, simulasi, kalkulasi, dan peragaan graphic. Bahasa R berbasis bahasa S yang
(2.28)
(2.29)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
26
dibangun di Bell Laboratories di tahun 80-an sehingga syntax R memiliki
perbedaan yang tidak terlalu banyak atau hampir identik jika dibandingkan
dengan syntax pada software S-plus (Sawitzki, 2009). R mempunyai beberapa
kelebihan dan fitur-fitur yang canggih dan berguna, diantaranya :
a. Efektif dalam pengolahan data dan fasilitas penyimpanan. Ukuran file
yang disimpan jauh lebih kecil dibanding software lainnya.
b. Lengkap dalam perhitungan array.
c. Lengkap dan terdiri dari koleksi tools statistik yang terintegrasi untuk
analisis data, diantaranya, mulai statistik deskriptif, fungsi probabilitas,
berbagai macam uji statistik, hingga time series.
d. Tampilan grafik yang menarik dan fleksibel ataupun costumized.
e. Dapat dikembangkan sesuai keperluan dan kebutuhan dan sifatnya yang
terbuka, setiap orang dapat menambahkan fitur-fitur tambahan dalam
bentuk paket ke dalam software R.
Software R sangat cocok digunakan untuk riset, baik statistik, ekonomi,
komputasi numerik, dan pemrograman komputer (Didi, 2014). Beberapa perintah
internal yang digunakan dalam OSS-R adalah sebagai berikut:
1. function( ), merupakan perintah untuk menunjukkan kumpulan dari
beberapa fungsi yang digunakan dalam program. Fungsi dipanggil dengan
format nama fungsi( daftar argumen ).
2. length( ), merupakan perintah yang digunakan untuk menghitung
banyaknya data. Misalkan terdapat perintah length(vector), maka akan
diperoleh hasil yaitu panjang dari vector tersebut.
3. plot( ), digunakan untuk membuat plot data. Beberapa penggunaan
perintah ini diantaranya:
a. plot(X,Y) berarti bahwa akan dibuat plot data berupa titik dengan
sumbu datar X dan sumbu tegak Y.
b. plot(X,Y,type=”l”) memberikan hasil plot bertipe garis.
c. plot(X,Y,type=”b”) memberikan hasil plot bertipe garis dan titik.
4. rep(a,b), merupakan perintah yang digunakan untuk membentuk suatu
vektor dengan anggota a sebanyak b.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
27
5. matrix(a,b,c), merupakan perintah yang digunakan untuk membentuk
suatu matrik berukuran b c× dengan elemen a.
6. print( ), digunakan untuk menampilkan hasil atau output dari program.
7. cat(“…”), merupakan perintah untuk menuliskan kemudian menampilkan
argumen dalam bentuk karakter.
8. for( ), merupakan perintah yang digunakan untuk mengulang satu blok
pernyataan berulang kali hingga memenuhi kondisi yang telah ditentukan.
Format penulisan perintah ini adalah for( kondisi ) pernyataan .
9. repeat( ), hampir mirip dengan for( ), apabila kondisi sudah terpenuhi
maka proses pengulangan akan dihentikan. Struktur penulisan statement
repeat dalam R yaitu repeat command if( kondisi ) break
10. if-else, merupakan perintah yang digunakan untuk seleksi kondisi. Apabila
suatu kondisi bernilai benar, maka pernyataan pertama akan dijalankan,
sedangkan apabila kondisi bernilai salah maka pernyataan kedua yang
akan dijalankan. Struktur penulisan perintah ini adalah sebagai berikut:
if( kondisi ) pernyataan pertama else pernyataan kedua
11. solve( A ), digunakan untuk menghitung invers dari suatu matrik A.
12. sum( ), digunakan untuk menghitung jumlah dari keseluruhan data.
13. rbind( ), digunakan untuk menggabungkan suatu matrik atau vektor
berdasarkan baris.
14. cbind( ), digunakan untuk menggabungkan suatu matrik atau vektor
berdasarkan kolom.
15. diag( a ), merupakan perintah yang digunakan untuk membentuk suatu
vektor a menjadi suatu matrik diagonal dengan elemen diagonal utamanya
adalah elemen dari a dan elemen yang lain bernilai nol.
16. sort( ), merupakan perintah yang digunakna untuk mengurutkan
sekumpulan data.
17. unique( ), digunakan untuk menentukan nilai tunggal dari suatu data.
18. quantile(…, …), merupakan perintah untuk menentukan sampel kuantil.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
28
19. order( ), merupakan perintah untuk menunjukkan vektor posisi data
apabila data tersebut diurutkan.
20. var( ), merupakan perintah untuk menghitung nilai varians dari suatu
vektor atau matrik variansi-kovariansi dari suatu matrik.
2.16 Tekanan Darah
Tekanan darah adalah tekanan yang ditimbulkan pada dinding arteri atau
dengan kata lain kekuatan yang diperlukan agar darah dapat mengalir di dalam
pembuluh darah dan beredar mencapai semua jaringan tubuh manusia. Tekanan
yang diukur pada nadi, yang dinyatakan dalam millimeter (mm) air raksa (Hg)
dan terdiri dari 2 nilai : yang atas adalah tekanan sistolik, dan yang bawah adalah
tekanan diastolik. Tekanan darah sistolik dicapai bila titik bilik jantung
menguncup, pada saat itu tekanan yang dicapai adalah tekanan yang tertinggi
yaitu terjadi saat ventrikel berkontraksi. Tekanan darah diastolik dicapai bila bilik
jantung merenggang pada saat itu tekanan yang dicapai adalah tekanan yang
terendah yaitu terjadi saat ventrikel beristirahat dan mengisi ruangannya. Pada
pengukuran tekanan darah kita akan mengukur dua tekanan : tekanan tertinggi dan
tekanan terendah atau juga disebut tekanan sistolik dan diastolik. Menurut kriteria
the seventh report of high blood pressure (JNC VII), tekanan darah normal yaitu
120/80 mmHg, angka 120 menunjukkan tigkat tekanan darah sistolik dan angka
80 menunjukkan tingkat tekanan darah diastolik. Beberapa faktor yang
mempengaruhi tekaan darah diantaranya adalah faktor psikologis seperti usia dan
jenis kelamin, faktor fisiologis seperti volume darah, kekuatan gerak jantung,
viscositas darah, dan kapasitas pembuluh darah, serta faktor eksternal seperti
stress, pola makan, ataupun kebiasaan merokok.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BAB III
METODOLOGI PENELITIAN
Pada bab ini akan dibahas mengenai langkah-langkah untuk menjawab
rumusan masalah yang telah dirumuskan pada BAB I sebelumnya dengan
landasan beberapa tinjauan pustaka pada BAB II.
3.1 Mengestimasi Model Regresi Semiparametrik Birespon
Multiprediktor Berdasarkan Estimator Penalized Spline
Langkah-langkah mengestimasi model regresi semiparametrik birespon
multiprediktor berdasarkan pendekatan penalized spline adalah sebagai berikut :
1. Mengasumsikan data berpasangan ( )( ), ,ri vi wiy x t dengan 1,2,..., ni =
menyatakan indeks untuk subyek yang diamati, 1, 2,...,v p= menyatakan
indeks variabel prediktor untuk komponen parametrik, 1, 2,...,w q=
menyatakan indeks variabel prediktor untuk komponen nonparametrik,
dan 1, 2r = menyatakan indeks variabel respon yang memenuhi
persamaan model regresi semiparametrik birespon multiprediktor sebagai
berikut :
( )
1
( )0
1( ) ,
p qr
i vi rw wiv w
rr rv iy x f tθ θ ε
= =
= + ++∑ ∑
dengan ( )riε merupakan error random dengan mean 0 dan variansi iΣ ,
1, 2,...,i n= .
2. Menggunakan pendekatan berdasarkan estimator spline pada ( )rw wif t yang
merupakan kurva regresi untuk respon ke- r berderajat j dengan titik knot
ξ , dan k merupakan banyaknya titik knot sebagai berikut :
(3.1)
29 SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
30
(( )
1 1 1 1
)0 ( )
rw ww
d kp qdr j
i vi rwj wi rwhr
r r wi whv w j h
v iy x t tα βθ ξθ ε+= = = =
= + + − +
+∑ ∑ ∑ ∑
3. Menguraikan persamaan regresi semiparametrik birespon multiprediktor,
kemudian menyatakan dalam suatu matrik sehingga menjadi persamaan
(3.3) sebagai berikut :
y = θ+ Φ + εX Z
dengan ( ) ( )( )1 2 ;T
y y y=
( ) ( )( ) ( ) ( )1 2
Tr r r rny y y y=
dan
( ) ( )( )1 2 Tε = ε ε
. ( )( ) ( ) ( ) ( )0 1 2
( ) ...Tr r r rr
v pθ θ θ θθ =
merupakan parameter
pada komponen parametrik dan
( )( ) ( ) ( ) ( ) ( ) ( ) ( )1 1 2
(0 2) ... ;r
w
Tr r r r r r rq qα β α β αθ βΦ =
( )( ) ( ) ( ) ( )1 2 ...
Tr r r rw w w wdα α α α=
dan ( )( ) ( ) ( ) ( )1 2 ...
Tr r r rw w w wkβ β β β=
yang
merupakan parameter pada komponen nonparametrik.
4. Menyatakan X dalam suatu matrik (1)
(2)
=
X 0X
0 X
( )( )1 2 3
Trnx x x x=X
dan 1 21i i i pix x x x =
.
5. Menyatakan Z dalam suatu matrik (1)
(2)
=
00
ZZ
Z dengan
( ) ( )(r) ( ) ( ) ( )1 2 3 ;
Tr r r rn= Z Z Z ZZ
(r) ( ) ( ) ( )
1 2 ;r r ri qz z z = Z 1
( ) 21 2( ) ( ) ( )w w w wd d d dr
w wi wi wi wi w wi w wi wkz t t t t t t = − ξ − ξ − ξ
6. Menyatakan persamaan (3.3) sehingga menjadi persamaan (3.4) sebagai
berikut :
y − θ = ΦX Z
dengan mengasumsikan parameter θ
diketahui nilainya dan memisalkan ΦZ
sebagai *y
adalah sebagai berikut : *y = ΦZ
7. Menyatakan estimator penalized spline yang meminimukan fungsi
Penalized Least Square (PLS) untuk variabel respon *y
.
(3.2)
(3.3)
(3.4)
(3.5)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
31
8. Mengestimasi model dengan meminimumkan kriteria Penalized Weighted
Least Square (PWLS) sebagai berikut :
( ) ( )1 * * TTn y y λ− − Φ − Φ Φ Φ= +L Z DWZ
dengan W adalah matrik pembobot yang merupakan invers dari matrik variansi kovariansi error untuk respon 1 dan respon 2. Pengestimasian Φ
dengan mendefferensiasi L terhadapΦ
ˆ 0L∂Φ = =
∂Φ
9. Mengestimasi nilai dugaan θ
melalui pendefferensiasikan fungsi K
dengan menggunakan metode WLS yang meminimumkan fungsi berikut :
( )( ) ( )( )Ty y y yθ θ θ θ= − − − − − −K X A X X A X
mengestimasi θ
dengan mendefferensiasi K terhadapθ
ˆ 0θθ
∂= =∂K
10. Mendapatkan matrik hat untuk komponen parametrik ( )parametrikA dan
untuk komponen nonparametrik ( )nonparametrikA .
11. Menyatakan matrik hat semipar parametrik nonparametrik= +A A A untuk dapat
menghitung nilai Generalized Cross Validation (GCV).
3.2 Membuat Algoritma dan Program Untuk Mengestimasi Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan Estimator
Penalized Spline yang Diterapkan Pada Data Riil atau Data Bangkitan
3.2.1 Algoritma dan Program untuk Mengestimasi Model Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized
Spline
Penerapan model regresi semiparametrik birespon multiprediktor
berdasarkan pendekatan penalized spline tidak dapat dilakukan secara manual
sehingga diperlukan bantuan software statistika untuk memperoleh
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
32
penyelesaiannya. Langkah-langkah membuat algoritma untuk mengestimasi
model adalah sebagai berikut :
1. Menginputkan data berpasangan ( )( ), , ;ri vi wiy x t
1, 2,..., n;i = 1, 2;r =
1,2,...,v p= 1, 2,...,w q= .
2. Menguji korelasi antara variabel respon 1 dan respon 2 dengan
menggunakan uji korelasi pearson berdasarkan persamaan (2.22).
3. Mengestimasi tanpa matrik pembobot variansi kovariansi ( )W dengan
langkah-langkah sebagai berikut :
a. Mendefinisikan sampel kuantil dari nilai wit yang diurutkan dari nilai
terkecil ke nilai yang terbesar untuk pemilihan titik knot.
b. Menentukan kombinasi orde nonparametrik respon 1 dan respon 2,
menggerakkan kombinasi vektor knot dan banyak knot dengan
menggunakan metode full search serta menggerakkan nilai lambda
untuk mendapatkan nilai lambda optimal kemudian dihitung GCV
minimum berdasarkan subbab (2.8)
c. Membuat matrik X untuk regresi parametrik dan matrik Z untuk
regresi nonparametrik.
d. Membuat matrik D (matrik diagonal) yang elemen-elemen
diagonalnya adalah ( )rD . Matrik ( )rD merupakan matrik diagonal pada
respon ke-r dengan elemen diagonalnya adalah 1 2, ,..., qD D D dan wD
merupakan matrik diagonal pada prediktor pada komponen
nonparametrik ke-w yang elemen-elemen diagonalnya elemen-elemen
diagonalnya elemen-elemen diagonalnya 11 22 1, 1 11 22, ,..., , , ,..., ;
w w w wd d k ka a a b b b+ + dengan 11 22 1, 1, ,..., 0w wd da a a + + = dan
11 22, ,..., 1w wk kb b b = .
e. Menentukan matrik penghalus A dengan menggunakan parameter
smoothing optimum yang telah diperoleh pada langkah a.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
33
f. Melakukan estimasi model tanpa pembobot W dengan menggunakan
parameter smoothing optimum yang telah diperoleh pada langkah b
sesuai dengan subbab 2.9.
g. Memperoleh nilai ε
untuk respon 1 dan respon 2 dari hasil estimasi.
4. Melakukan uji heteroskedastisitas terhadap matrik variansi kovariansi
residual yang telah diperoleh dengan menggunakan uji glesjer pada
subbab 2.13.
5. Mendefinisikan matrik pembobot W berdasarkan hasil pengujian
heteroskedastisitas sesuai hasil pada langkah 4.
6. Mengestimasi dengan menggunakan matrik pembobot variansi kovariansi
( )W dengan langkah-langkah sebagai berikut :
a. Menentukan kombinasi orde nonparametrik respon 1 dan respon 2,
menggerakkan kombinasi vektor knot dan banyak knot dengan
menggunakan metode full search serta menggerakkan nilai lambda
untuk mendapatkan nilai lambda optimal kemudian dihitung GCV
minimum berdasarkan subbab (2.8)
b. Membuat matrik X untuk regresi parametrik dan matrik Z untuk
regresi nonparametrik.
c. Membuat matrik D (matrik diagonal) yang elemen-elemen
diagonalnya adalah ( )rD . Matrik ( )rD merupakan matrik diagonal pada
respon ke-r dengan elemen diagonalnya adalah 1 2, ,..., qD D D dan wD
merupakan matrik diagonal pada prediktor pada komponen
nonparametrik ke-w yang elemen-elemen diagonalnya elemen-elemen
diagonalnya elemen-elemen diagonalnya 11 22 1, 1 11 22, ,..., , , ,..., ;
w w w wd d k ka a a b b b+ + dengan 11 22 1, 1, ,..., 0w wd da a a + + = dan
11 22, ,..., 1w wk kb b b = .
d. Menentukan matrik penghalus A dengan menggunakan parameter
smoothing optimum yang telah diperoleh pada langkah a.
e. Melakukan estimasi model yang telah didefinisikan pada langkah a.
f. Menghitung estimasi y
.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
34
g. Membuat plot data observasi dan hasil estimasi variabel respon
terhadap variabel prediktor.
h. Menghitung nilai Mean Square Error (MSE) dengan menggunakan
persamaan (3.6) sebagai berikut:
( ) ( ) ( )12T
MSE n y y y y− = − −
i. Menghitung nilai R-square dengan menggunakan persamaan (3.7)
sebagai berikut:
2 1 JKGRJKT
= −
dengan Jumlah Kuadrat Galat (JKG) ( ) ( )ˆ ˆT
y y y y= − −
Jumlah Kuadrat Total (JKT) ( ) ( )Ty y y y= − −
.
(3.7)
(3.6)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
35
Langkah-langkah dalam merancang agoritma program untuk mengestimasi model
regresi semiparametrik birespon multiprediktor berdasarkan pendekatan penalized
spline dapat digambarkan dalam diagram alir sebagai berikut:
Gambar 3.1 Diagram Alir Algoritma dan Program
Memperoleh parameter smoothing optimum dengan menggunakan metode full-search berdasarkan kriteria GCV minimum
Input data ( )( ), ,ri vi wiy x t yang memenuhi persamaan (3.1)
Melakukan estimasi tanpa melibatkan pembobot W dengan menggunakan parameter smoothing optimal yang telah diperoleh
Memperoleh nilai ( )ˆ rε
Melakukan uji heteroskedastisitas pada nilai ε
Mendefinisikan pembobot W berdasarkan uji heteroskedastisitas pada nilai ε
Uji korelasi antara ( )1y
dan ( )2y
Menentukan parameter smoothing dengan melibatkan pembobot W berdasarkan kriteria GCV minimum
Menghitung nilai parameter dan estimasi y
Membuat plot data observasi dan hasil estimasi y
Menghitung MSE dan 2R
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
36
3.2.2 Penerapan Model Regresi Semiparametrik Birespon Multiprediktor
Berdasarkan Estimator Penalized Spline pada Data Riil
a. Data dan Sumber Data
Data yang digunakan dalam skripsi ini adalah data sekunder yang
berasal dari rekam medis pasien yang menjalani rawat inap di Rumah
Sakit Umum (RSU) Haji Surabaya pada Tahun 2014-2015 sebanyak 65
data. Data tersebut dibagi menjadi 2, 50 data digunakan untuk pemoelan
insampel (Lampiran 1) dan 15 data digunakan untuk pemodelan outsample
(Lampiran 2).
b. Variabel Penelitian
Variabel-variabel penelitian yang digunakan pada penelitian ini
disajikan pada Tabel 3.1 sebagai berikut :
Tabel 3.1 Variabel-variabel Penelitian
No. Variabel Keterangan Variabel Satuan
1 (1)iy Tekanan darah sistolik mmHg
2 (2)iy Tekanan darah diastolik mmHg
3 1ix LDL mg/dL
4 1it Berat Badan Kg
5 2it Usia Tahun
6 3it HDL mg/dL
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
(4.1)
BAB IV
HASIL DAN PEMBAHASAN
4.1 Estimasi Model Regresi Semiparametrik Birespon Multiprediktor
Berdasarkan Penalized Spline
Estimasi penalized spline dalam regresi semiparametrik birespon
multiprediktor disajikan dengan menggunakan optimasi Weighted Least Square
(WLS). Data berpasangan yang meliputi dua variabel respon ( )(1) (2),i iy y yang
diasumsikan memiliki korelasi antar respon dengan p variabel prediktor
1 2, ,...,i i pix x x yang diketahui pola hubungannya serta q variabel prediktor
1 2, ,...,i i qit t t yang tidak diketahui bentuk pola hubungannya. Hubungan antara
variabel ( )riy , pix , dan wit mengikuti model regresi semiparametrik birespon
multiprediktor sebagai berikut :
( ) ( ) (
1 1
)0
( ) ( ) ,( )p
rq
r ri vi w
ri
wv iw
v
ry x f tθ θ ε= =
= + ++∑ ∑
dengan 1,2,..., ni = menyatakan indeks untuk subyek yang diamati, 1, 2,...,v p=
menyatakan indeks variabel prediktor untuk komponen parametrik, 1, 2,...,w q=
menyatakan indeks variabel prediktor untuk komponen nonparametrik, dan 1, 2r = menyatakan indeks variabel respon.
( )riy adalah variabel respon ke- r
observasi ke- i , vix merupakan variabel prediktor untuk komponen parametrik ke-
v observasi ke- i , wit merupakan variabel prediktor untuk komponen
nonparametrik ke- w observasi ke- i , dan ( )rε sebagai error random. ( )rε di
asumsikan saling independen yang memiliki mean nol dan variansinya 2rσ ,
sedangkan (1)ε dan (2)ε saling berkorelasi 12( )ρ . Pada umumnya ( ) ( )rw wif t adalah
fungsi regresi yang tidak diketahui bentuknya dan diasumsikan smooth dalam arti
termuat di dalam ruang fungsi tertentu.
37 SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
38
(4.5)
(4.2)
(4.4)
(4.3)
Model regresi semiparametrik birespon multiprediktor pada persaman
(4.1) dapat dijelaskan sebagai berikut :
( ) ( ) ( ) ( )0 1 2
( ) ( ) ( ) ( )1 2
( )1 2
1 2
...
( ) ( ) ... ( )
r r r rp
r r r rq i
ri i i pi
i i qi
y x x x
f t f t f t
θ θ θ θ
ε
= + + +
+ + + + +
+
Apabila fungsi nonparametrik ( ( )rw wif t ) didekati dengan fungsi spline dengan
orde rwd dan wk titik knot maka fungsi tersebut dapat ditulis sebagai berikut :
( ) ( ) ( )
( ) ( ) ( )
0
( )0 1 2
( ) ( ) ( )2
2
21
1
1
1
( ) ( )
...
( ) ( ) ... ( )
rw wrw
rw
rw rw rw
w
w
w
d kdj
wi wi wi whj h
d
r r rw wj w
wi wi wi
d d dw
h
r r r rw w w wd
r r rw w wki w wi w wi wk
f t t t
t t t
t t t
α β ξ
α α α α
β ξ β ξ β ξ
+= =
+ + +
= + −
= + + + +
+ − + − + + −
∑ ∑
dengan rwjα adalah koefisien polinomial bernilai riil, rwhβ adalah koefisien
truncated bernilai riil, dan 1 2, ,...,ww w wkξ ξ ξ adalah titik-titik knot yang
memperlihatkan perubahan perilaku dari fungsi pada sub-sub interval yang
berbeda tergantung pada data. Model regresi semiparametrik birespon
multiprediktor setelah dilakukan pendekatan fungsi spline dengan orde rwd dan wk
titik knot maka persamaan (4.1) dapat ditulis menjadi persamaan sebagai berikut :
( ) ( ) ( ) ( ) ( )( )
1 1 0 10 ( )
rw wrw
d kp qdr j
i vi wi wi whv w j h
r r r r rv wj wh iy x t tα β ξθ θ ε+
= = = =
= + + − +
+∑ ∑ ∑ ∑
1
1
1
1 1 1
1
( ) 1 21 1 1 1
1 11
( ) ( ) ( ) ( ) ( ) ( ) ( )0 1 10 11 12 1
( ) ( ) ( )11 12 1
( ) ( ) ( ) ( )
1 12 1 1
10 1 2
2
... ...
( ) ( ) ... ( ) ...
...
r
r
q
r r
rq
dri i pi i i i
d d di i i k
dq
r r r r r r rp d
r r rk
r r r rq q q qd
q
i qi qi
y x x t t t
t t t
t t t
θ θ θ α α α α
β ξ β ξ β ξ
α α α α
β
+ + +
= + + + + + + + +
+ − + − + + − +
+ + + + +
+ ( ) ( ) ( ) ( )1 21 2( ) ( ) ... ( )r
q
q rq rq
q
d d dqi
r r r rq qq qi q qi qkk it t tξ β ξ β ξ ε+ + +− + − + + − +
Model regresi semiparametrik birespon pada persamaan (4.5) adalah
bentuk ringkas untuk dua respon dengan n unit observasi, persamaan (4.5) untuk
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
39
(4.6)
(4.7)
(4.8)
(4.9)
(4.10)
(4.11)
respon 1 dapat dijelaskan dengan persamaan berikut :
11
11 11 1
1
1
1
1
1
(1) 1 21 11 1 11 11 11
11 11 11
(1) (1) (1) (1) (1) (1) (1)0 1 10 11 12 1
(1) (1) (1)11 12 1
(1) (1) (1) (1
12 11 1
1 21 1 1
)0 1 2
... ...
( ) ( ) ... ( ) ...
...q
q
dp
d d dk
dq
p d
k
q q q qd
q
q q
y x x t t t
t t t
t t t
α α α α
β ξ β ξ β ξ
α α α
θ θ
α
θ
β
+ + +
= + + + + + + + +
+ − + − + + − +
+ + + + +
+ 1 1 1
11
11 1
1
1
1
(1) (1) (1) (1)1 2 1
(1
1 1 1 2 1
(1) 1 22 12 2 12 12 12
12 11
) (1) (1) (1) (1) (1) (1)0 1 10 11 12 1
(1) (1) (11 12 121 12 1
( ) ( ) ... ( )
... ...
( ) ( ) ...
q q
q
q
q
d d dq q q q q qk
dp
q qk
d
kd d
p
t t t
y x x t t t
t t
ξ β ξ β ξ
α α α α
β ξ β
ε
θ θ θ
ξ β
+ + +
+ +
− + − + + − +
= + + + + + + + +
+ − + − + + 11
1
1
1 1 1
12 1
1 22 2 2
2 1 2 2
)
(1) (1) (1) (1)0 1 2
(1) (1) (1) (1)1 2 2
(1) (1) (1) (1) (1) (1)0
2
(1)1 10 1
11 1 11 12
( ) ...
...
( ) ( ) ... ( )
...
q
q q
q
q
q
q
q q q qd
q
dk
dq q q
d d dq q q q q qk
n n
k
p pn
q
n
q
t
t t t
t t t
y x x t t
ξ
α α α α
β ξ β ξ β ξ
α α
ε
θ αθ θ
+
+ + +
− +
+ + + + +
+ − + − + + − +
= + + + + + +
11
11 11 11
1
1
1 1
1
1
(1)1
(1) (1) (1)11 12 1
(1) (1) (1) (1)0 1
21
1 11 1 12 1 1
1 22
(1) (1) (1)1 21 2
...
( ) ( ) ... ( ) ...
...
( ) ( ) ... ( )
q
q
q
q
q
q
dn nd
k
q q q qd
q q q
d d dn n n k
dqn qn qn
d d dqn qkq qn q qk
t
t t t
t t t
t t t
α
β ξ β ξ β ξ
α α α α
β ξ β ξ β ξ
+ + +
+ + +
+ +
+ − + − + + − +
+ + + + +
+ − + − + + − 1 (1)qnε+
untuk respon 2 dapat dijelaskan dengan persamaan berikut : 21
21 21 2
1
2
1
1
1
(2) 1 21 11 1 11 11 11
11 11 11
(2) (2) (2) (2) (2) (2) (2)0 1 10 11 12 1
(2) (2) (2)11 12 1
(2) (2) (2) (2
12 11 1
1 21 1 1
)0 1 2
... ...
( ) ( ) ... ( ) ...
...q
q
dp
d d dk
dq
p d
k
q q q qd
q
q q
y x x t t t
t t t
t t t
α α α α
β ξ β ξ β ξ
α α α
θ θ
α
θ
β
+ + +
= + + + + + + + +
+ − + − + + − +
+ + + + +
+ 2 2 2
21
21 2
1
1
1
(2) (2) (2) (2)1 2 1
(2
1 1 1 2 1
(2) 1 22 12 2 12 12 12
12 11
) (2) (2) (2) (2) (2) (2)0 1 10 11 12 1
(2) (2) (21 12 121 12 1
( ) ( ) ... ( )
... ...
( ) ( ) ...
q q
q
q
q
d d dq q q q q qk
dp
q qk
d
kd d
p
t t t
y x x t t t
t t
ξ β ξ β ξ
α α α α
β ξ β
ε
θ θ θ
ξ β
+ + +
+ +
− + − + + − +
= + + + + + + + +
+ − + − + + 21
1
2
2 2 2
12 1
1 22 2 2
2 1 2 2
)
(2) (2) (2) (2)0 1 2
(2) (2) (2) (2)1 2 2
(2) (2) (2) (2) (2) (2)0
2
(2)1 10 1
11 1 11 12
( ) ...
...
( ) ( ) ... ( )
...
q
q q q
q
dk
dq q q
d d dq q q q q qk
n n pn n
q q q qd
q q qk
p n
t
t t t
t t t
y x x t t
ξ
α α α α
β ξ β ξ β ξ
α α
ε
θ θ θ α
+
+ + +
− +
+ + + + +
+ − + − + + − +
= + + + + + +
21
21 21 21
1
2
2
1
2 2
1
(2)1
(2) (2) (2)11 12 1
(2) (
21
1
2) (2) (2)0 1 2
(2) (2
11 1 12 1 1
1 2
1) (2
1 2 2)
...
( ) ( ) ... ( ) ...
...
( ) ( ) ... ( )
q
q
q
q
q
q
ddn
d d dn n n k
dqn qn q
k
n
d d dqn q qn q q q
q q q q
q q qk k
d
t
t t t
t t t
t t t
α
β ξ β ξ β ξ
α α α α
β ξ β ξ β ξ
+ + +
+ + +
+ +
+ − + − + + − +
+ + + + +
+ − + − + + − (2)qnε+
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
40
(4.12)
(4.13)
Persamaan diatas dapat pula ditulis dalam bentuk matriks sebagai berikut :
(1) (1) ( )(1) (1)
(2) ( )(2) (
(1)
2) (2(2) )
r
r
y
yθ εθ ε
Φ = + + Φ
X 0 00
ZZX 0
Masing-masing elemen pada persamaan (4.12) dapat dijelaskan sebagai berikut :
1 2
( ) ( ) ( ) ( )( , ,..., )n
r r r r Ty y y y=
merupakan variabel respon ke r− (1, 2)r = ;
( )( ) ( ) ( ) ( )0 1 2
( ) ...Tr r r rr
v pθ θ θ θθ =
merupakan vektor parameter komponen
parametrik respon ke r− ;
( )( ) ( ) ( ) ( ) ( ) ( ) ( )1 1 2
(0 2) ... ;r
w
Tr r r r r r rq qα β α β αθ βΦ =
( ) ( ) ( ) ( )
0 10 20 0...r r r rw qθ α α α= + + +
adalah penjumlahan dari sekumpulan intersep komponen nonparametrik respon ke
r− ;
( )( ) ( ) ( ) ( )1 2 ...
Tr r r rw w w wdα α α α=
dan ( )( ) ( ) ( ) ( )1 2 ...
Tr r r rw w w wkβ β β β=
merupakan
vektor parameter komponen nonparametrik respon ke r− ; ( ) ( ) ( ) ( )
1 2( , ,..., )r r r r Tnε ε ε ε=
merupakan vektor error respon ke r− ;
( )( )1 2 3 ;Tr
nx x x x=X
1 21i i i pix x x x =
;
( ) ( )(r) ( ) ( ) ( )1 2 3 ;
Tr r r rn= Z Z Z ZZ
(r) ( ) ( ) ( )
1 2 ;r r ri q = τ τ τ Z 1
( ) 21 2( ) ( ) ( )w w w wd d d dr
w wi wi wi wi w wi w wi wkt t t t t t τ = − ξ − ξ − ξ
Sehingga matriks pada persamaan (4.12) dapat ditulis secara sederhana sebagai :
y = θ+ Φ + εX Z
dengan y
merupakan vektor variabel respon berukuran 2 1n× , matrik
(1) (2)( , )diag=X X X adalah matrik diagonal berukuran 2 2( 1)n p× + , θ
merupakan parameter pada komponen parametrik dengan ukuran 2( 1) 1p + × ,
matrik (1) (2)( , )diag=Z Z Z adalah matrik diagonal berukuran
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
41
(4.15)
(4.14)
(4.16)
2
1 12 1
q
rw wr w
n d k= =
× + +
∑ ∑ yang tergantung pada orde dan titik knot optimal, dan
Φ
merupakan parameter pada komponen nonparametrik berukuran
2
1 11 1
q
rw wr w
d k= =
+ + ×
∑ ∑ , serta ε
merupakan vektor error berukuran 2 1n× .
Penduga Parameter Komponen Nonparametrik
Pendugaan parameter pada model regresi semiparametrik birespon tidak
dapat dilakukan keseluruhan secara simultas sehingga dengan mengasumsikan θ
diketahui pada persamaan (4.13), maka model regresi semiparametrik birespon
dapat dinyatakan sebagai :
y − θ = ΦX Z
Misalkan * ( )y g t= = ΦZ
, maka *y y= − θX
dengan ( )* *(1) *(2) ;T
y y y=
( )*( ) *( ) *( ) *( )1 2 ... ;
Tr r r rny y y y=
( )( ) ( ) ( ) ( )*( ) ( )10 1 2 2 ...r r r rr r
i i v ppi i iy y x x xθ θ θ+ + + +θ= −
Hasil estimasi fungsi regresi ( )g t dapat dinyatakan sebagai :
* ˆˆ ˆ ( )y g t= = ΦZ
Nilai Φ
didapatkan dengan meminimumkan fungsi Penalized Weighted Least
Square (PWLS) sebagai berikut :
( ) ( ) ( )1 * *2 TTn y y λ− − Φ Φ Φ+Φ= −WL Z Z D
Matrik W adalah matrik pembobot yang merupakan invers dari matrik
variansi kovariansi error untuk respon 1 dan respon 2 yang didefiisikan sebagai
berikut :
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
42
(4.17)
[ ]1
1 11 12
21 22
;−
− Σ Σ = Σ = Σ Σ
W
dengan ( )11 11diag σΣ = , ( )12 21 1 2diag σ σ ρΣ = Σ = , dan ( )22 22diag σΣ = , serta
diketahui matriks D adalah suatu matrik diagonal yang didefinisikan sebagai
berikut :
( )
( );
r
r
=
D 0D
0 D
( )1
( ) ( )2
( )
0 0 0 ... 00 ...0 ...
0 ...
T T T
r
r r
rq
=
D 0 0D 0 D 0
0 0 D
dengan
11
22
( )
11
22
0 ... 0 ... 00 ... 0
0 ...
0 ... 00 ...
0 0 ... 0 0 ...
w w
w w
d drw
k k
aa
a
bb
b
=
D
;
11 22 ,... 0w wd da a a= = = = , 11 22 ... 1
w wk kb b b= = = = , [ ]0 0 0 ... 0 T=
, dan 0
merupakan matrik nol.
Pengestimasian Φ
dilakukan dengan mendefferensiasi L terhadap Φ
untuk mendapatkan Φ
( ) ( )( ) ( )( )( )
1 * *
1 * *
1 * * * *
1 * * *
2
2
2 2
2 T
T T
T T T
T
T
T T
T T T T
T T TT T
n y y
n y y
n y y y y
n y y y
λ
λ
λ
λ
−
−
−
−
− Φ − Φ Φ Φ
= −Φ − Φ Φ Φ
= − Φ −Φ +Φ Φ + Φ Φ
= − Φ +Φ Φ +
=
+
Φ
+
Φ
L Z ZW
W
W W W W
D
Z Z D
Z Z
W
Z Z D
Z Z WZ DW
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
43
(4.18)
Nilai minimum L pada persamaan (4.17) dicapai saat 0∂=
∂ΦL
, sehingga
diperoleh :
( )1 *2 0 2 2 2 0T Tn y λ−∂= − + Φ + Φ =
∂ΦL W WZ Z Z D
*2 2 2 0T Ty nλ− + Φ + Φ =W WZ Z Z D
( )*2 0T Ty nλ− + Φ + Φ =W WZ Z Z D
* 0T Ty nλ− + Φ + Φ =Z Z ZW DW
*T Tn yλΦ + Φ =Z Z D ZW W
( ) *T Tn yλ+ Φ =Z Z D ZW W
( ) 1 *ˆ T Tn yλ
−Φ = +Z Z D ZW W
Untuk menjamin bahwa penduga parameter Φ
telah minimum maka dilakukan
pendeferensiasian kedua pada L terhadap Φ
sebagai berikut :
2
2 0 2 2T λ∂= + +
∂ΦZ ZW DL
( )2 T λ= +WZ Z D
Berdasarkan persamaan (4.12) dapat diketahui elemen dari matrik Z dan TZ WZ
merupakan bentuk kuadratik, serta λ merupakan suatu nilai yang positif maka
diperoleh :
( )2
2 02 T λ∂= +
Φ>
∂Z ZW DL
dan terbukti bahwa penduga parameter Φ
minimum, sehingga bentuk estimasi
dari ( )g t
adalah
ˆˆ ( )g t = ΦZ
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
44
(4.19)
(4.20)
(4.21)
dengan ( ) 1 *ˆ T Tn yλ−
Φ = +Z Z D ZW W
atau bentuk estimasi dari ( )g t
dapat dinyatakan sebagai berikut :
( ) 1 *ˆ ( ) T Tg t n y−
= + λZ Z WZ Z WD
Berdasarkan persamaan (4.15) diperoleh ˆ ( )g t
pada persamaan (4.19) yang
merupakan fungsi regresi nonparametrik birespon. Estimator penalized spline
untuk fungsi regresi birespon ˆ( )g t
diberikan sebagai :
*ˆ ( )g t y= A
atau * *y y= A
Sehingga matrik hat A nonparametrik yang didapatkan dari persamaan (4.19)
untuk estimasi fungsi regresi adalah
( ) 1T Tn−
= λ+Z Z Z DA ZW W
Penduga Parameter Komponen Parametrik
Berdasarkan persamaan (4.13), nilai dugaan θ
adalah θ
yang diperoleh
melalui pendefferensiasian fungsi K terhadap θ
( ) ( )( ) ( )
( )( ) ( )( )( ) ( )( ) ( )( ) ( ) ( )( )
( ) ( )( ) ( ) ( )( )( ) ( ) ( ) ( )
* *
ˆ ˆ( ) ( ) ( ) ( )T
T
T
T
T
T TT T T
T TT T
T
g t g t g t g t
y y y y
y y y y
y y y y
y y
y y
y y y
θ θ
θ θ θ θ
θ θ θ θ
θ θ
θ θ
θ
θ
= − −
= − − − −
= − − − − − −
= − − + − − +
= − − − − − −
= − − − − − −
= − − − − −
−
K
X A X A
X A X X A X
A X AX A X AX
I A I A X I A I A X
I A X I A I A I A X
I A I A I A I A X
( ) ( ) ( ) ( )T TT T Ty θ θ− − + − −X I A I A X I A I A X
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
45
(4.22)
Nilai minimum K pada persamaan (4.21) dicapai saat 0θ
∂=
∂K
, sehingga
diperoleh :
( ) ( ) ( ) ( ) ( ) ( )0 2 0T T TT T Ty y θθ
∂= − − − − − − + − − =
∂K I A I A X X I A I A X I A I A X
( ) ( ) ( ) ( ) ( ) ( )2 0T T TT T Ty y θ− − − − − − + − − =X I A I A X I A I A X I A I A X
( ) ( ) ( ) ( )2 2 0T TT Ty θ− − − + − − =X I A I A X I A I A X
( ) ( ) ( ) ( )( )2 0T TT Ty θ− − − + − − =X I A I A X I A I A X
( ) ( ) ( ) ( ) 0T TT Ty θ− − − + − − =X I A I A X I A I A X
( ) ( ) ( ) ( )T TT T yθ− − = − −X I A I A X X I A I A
Kemudian didapatkan
( ) ( )( ) ( ) ( )
1ˆ T TT T yθ−
= − − − −X I A I A X X I A I A
Untuk menjamin bahwa penduga parameter θ
telah minimum maka dilakukan
pendeferensiasian kedua pada K terhadap θ
sebagai berikut :
( ) ( )2
2 0 2 TT
θ∂
= + − −∂
K X I A I A X
( ) ( )2 TT= − −X I A I A X
Berdasarkan persamaan (4.12) dapat diketahui elemen dari matrik X dan matrik
hat A yang telah didefinisikan sebelumnya, serta ( ) ( )2 TT − −X I A I A X
merupakan bentuk kuadratik maka diperoleh :
( ) ( )2
2 02 TT
θ∂
=∂
>− −K X I A I A X
dan terbukti bahwa penduga parameter θ
minimum.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
46
…(4.23)
(4.24)
(4.25)
(4.27)
(4.26)
Penduga parameter θ
dan Φ
yang teah didapatkan pada persamaan (4.18)
dan persamaan (4.22) disubtitusikan dalam persamaan (4.13), sehingga diperoleh :
( ) ( )( ) ( ) ( ) ( )( ) ( )( ) ( ) ( ) ( ) ( )( ) ( )( ) ( ) ( )
( ) ( ) ( )( ) ( ) ( )
1*
1
1
1 1
1
1
ˆ ˆˆ
T T
T T
T TT T
T TT T
T TT T
T TTT TT
y
y n y
y n y
y
n y y
−
−
−
−
−
−−
= θ+ Φ
= − − − − + +
= − − − − + + − θ
= − − − −
+ + − − − − −
λ
λ
λ
X
X X I A I A X X I A I A W W
X X I A I A X X I A I A W W X
X X I A
Z
Z
I A X X I A I A
W W X X I A I A X X I A
Z D Z
Z Z D Z
Z Z Z D Z I A
dengan memisalkan ( ) ( )( ) ( ) ( )1T TT T−
= − − − −C X X I A I A X X I A I A , maka
persamaan (4.23) dapat dinyatakan sebagai berikut :
( ) ( )( ) ( )
1
1
ˆ T T
T T
y y n y y
y n y
−
−
= + + −
= −
λ
λ+ +
C WZ Z W C
C W W I C
Z D Z
Z Z Z D Z
Persamaan (4.24) dapat ditulis sebagai berikut :
( )
ˆ
par nonpar
par nonpar
semipar
y y y
y
y
= +
= +
=
A A
A A
A
dengan par =A C , ( )nonpar = −A A I C , dan semiparA merupakan matriks penghalus
yang sesuai untuk variabel respon disetiap pengamatan. Nilai Generalized Cross
Validation (GCV) diperoleh berdasakan subbab 2.7 untuk estimasi model regresi
semiparametrik birespon berdasarkan estimator penalized spine sebagai berikut :
( ) 1 2
( )( )(1 2 ( ))fit
RSSGCVn df
λλλ−=
−
dengan ( ) ( )1 ˆ( ) ˆT
y yRSS n y yλ − −= −
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
47
(4.28)
( ) ( ) ( )( ) ( )( ) ( )( )( ) ( ) ( )( )
1
1
1
2
2
2
T
semipar semipar
T
semipar semipar
TTsemipar semipar
n y y y y
n y y
n y y
−
−
−
= − −
= − −
= − −
A A
I A I A
I A I A
4.2 Algoritma dan Program untuk Mengestimasi Model Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan Estimator
Penalized Spline yang Diterapkan pada Data Riil atau Data Bangkitan
4.2.1 Algoritma dan Program untuk Mengestimasi Model Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized
Spline
Algoritma untuk mengestimasi model regresi semiparametrik birespon
multiprediktor melalui pendekatan estimator penalized spline dalam software R
adalah sebagai berikut :
1. Menginputkan data berpasangan ( )( ), , ;ri vi wiy x t
1, 2,..., n;i = 1, 2;r =
1,2,...,v p= 1, 2,...,w q= .
2. Menguji korelasi antara variabel respon 1 dan respon 2 dengan
menggunakan uji korelasi pearson berdasarkan persamaan (2.22).
3. Mengestimasi tanpa matriks pembobot variansi kovariansi ( )W dengan
langkah-langkah sebagai berikut :
a. Mendefinisikan sampel kuantil dari nilai wit yang diurutkan dari nilai
terkecil ke nilai yang terbesar untuk pemilihan titik knot pada setiap
prediktor.
b. Menentukan kombinasi orde nonparametrik respon 1 dan respon 2,
banyak knot dengan menggunakan metode full search serta
menggerakkan nilai lambda untuk mendapatkan nilai lambda optimal
kemudian dihitung GCV minimum berdasarkan subbab (2.8)
c. Membuat matrik X untuk regresi parametrik dan matrik Z untuk
regresi nonparametrik.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
48
d. Membuat matrik D (matrik diagonal) yang elemen-elemen
diagonalnya adalah ( )rD . Matrik ( )rD merupakan matrik diagonal pada
respon ke-r dengan elemen diagonalnya adalah 1 20, , ,..., qD D D dan wD
merupakan matrik diagonal pada prediktor pada komponen
nonparametrik ke-w yang elemen-elemen diagonalnya elemen-elemen
diagonalnya elemen-elemen diagonalnya 11 22 11 22, ,..., , , ,..., ;
w w w wd d k ka a a b b b dengan 11 22, ,..., 0w wd da a a = dan
11 22, ,..., 1w wk kb b b = .
e. Menentukan matrik penghalus A dengan menggunakan parameter
smoothing optimum yang telah diperoleh pada langkah a.
f. Melakukan estimasi model tanpa pembobot W dengan menggunakan
parameter smoothing optimum yang telah diperoleh pada langkah b
sesuai dengan subbab 2.9.
g. Memperoleh nilai ε
untuk respon 1 dan respon 2 dari hasil estimasi.
4. Melakukan uji heteroskedastisitas terhadap matrik variansi kovariansi
residual yang telah diperoleh dengan menggunakan uji glesjer pada
subbab 2.13. Apabila hitung tabelF F< maka terjadi kasus heteroskedastisitas
yakni terdapat minimal satu 2 2iσ σ≠ sedangkan jika sebaliknya
hitung tabelF F> maka tidak terjadi kasus heteroskedastisitas atau dapat
dikatakan terjadi homoskedastisitas.
5. Mendefinisikan matrik pembobot W berdasarkan hasil pengujian
heteroskedastisitas sesuai hasil pada langkah 4.
Jika terjadi kasus homoskedastisitas maka langkah-langkah untuk
mendapatkan pembobot W adalah sebagai berikut :
a. Menghitung matriks variansi kovariansi dari error pada respon 1 dan
error pada respon 2, sehingga didapatkan 11σ , 22σ , 12σ , dan 21σ
dengan 12 21σ σ= .
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
49
b. Membentuk matriks diagonal dari masing-masing 11σ , 22σ , 12σ , dan
21σ .
c. Menggabungkan matriks diagonal dari matriks variansi kovariansi
sehingga didapatkan matrik pembobot W .
Jika terjadi kasus heteroskedastisitas maka langkah-langkah untuk
mendapatkan pembobot W adalah sebagai berikut :
a. Menghitung matriks variansi kovariansi dari error pada masing-masing
subjek ke-i; 1,2,...i n= respon 1 dan error pada respon 2, sehingga
didapatkan 11( )iσ , 12( )iσ , 21( )iσ , dan 22( )iσ dengan 12( ) 21( )i iσ σ= .
b. Membentuk matriks diagonal dari masing-masing 11( )iσ , 12( )iσ , 21( )iσ ,
dan 22( )iσ .
c. Menggabungkan matriks diagonal dari matriks variansi kovariansi
sehingga didapatkan matrik pembobot W .
6. Mengestimasi dengan menggunakan matriks pembobot variansi kovariansi
( )W dengan langkah-langkah sebagai berikut :
a. Menentukan kombinasi orde nonparametrik respon 1 dan respon 2,
banyak knot dengan menggunakan metode full search serta
menggerakkan nilai lambda untuk mendapatkan nilai lambda optimal
kemudian dihitung GCV minimum berdasarkan subbab (2.8)
a. Membuat matrik X untuk regresi parametrik dan matrik Z untuk
regresi nonparametrik.
b. Membuat matrik D (matrik diagonal) yang elemen-elemen
diagonalnya adalah ( )rD . Matrik ( )rD merupakan matrik diagonal pada
respon ke-r dengan elemen diagonalnya adalah 1 20, , ,..., qD D D dan wD
merupakan matrik diagonal pada prediktor pada komponen
nonparametrik ke-w yang elemen-elemen diagonalnya elemen-elemen
diagonalnya elemen-elemen diagonalnya
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
50
11 22 11 22, ,..., , , ,..., ;w w w wd d k ka a a b b b dengan 11 22, ,..., 0
w wd da a a = dan
11 22, ,..., 1w wk kb b b = .
c. Menentukan matrik penghalus A dengan menggunakan parameter
smoothing optimum yang telah diperoleh pada langkah a.
d. Melakukan estimasi model yang telah didefinisikan pada langkah a.
e. Menghitung estimasi y
.
f. Membuat plot data observasi dan hasil estimasi variabel respon
terhadap variabel prediktor.
g. Menghitung nilai Mean Square Error (MSE) dengan menggunakan
persamaan (3.6) sebagai berikut:
( ) ( ) ( )1 ˆ ˆ2T
MSE n y y y y− = − −
h. Menghitung nilai R-square dengan menggunakan persamaan (3.7)
sebagai berikut:
2 1 JKGRJKT
= −
dengan Jumlah Kuadrat Galat (JKG) ( ) ( )ˆ ˆT
y y y y= − −
Jumlah Kuadrat Total (JKT) ( ) ( )Ty y y y= − −
.
(4.29)
(4.30)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
51
Algoritma program pengestimasian model regresi semiparametrik birespon
multiprediktor dapat digambarkan dalam flowchart sebagai berikut:
Mulai
Input banyak prediktor Input batas bawah lambda
Input batas atas lambda Input increament (h)
Input data ( ) ( )( )1 2, ,ij ij ijt y y
Uji korelasi antara ( )1y
dan ( )2y
Selesai
Input data ( ) ( )( )1 2, , ,ij ij ij ijy y x t
Input alfa
p value alfa− ≤ Ya
Tidak
• Matriks p
• ( ) ( )( )1 2 Ty y y=
Data tidak dapat digunakan
tbaru
1,2,...,q w=
A
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
52
Vektor MSE; vektor GCV
Lambda Optimal [p], MSE [p], dan GCV minimum [p] pada orde [ ]c,p
A
1k =
1c =
lambda= batas bawah
Lambda optimal saat GCV minimum
1c c= +
lambda= batas bawah + h Estimasi Model
c = total semua kombinasi
B
Tidak
Ya
[ ]MSE a dan [ ]GCV a
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
53
Membandingkan GCV untuk kombinasi orde
Melakukan estimasi dengan menggunakan parameter smoothing optimal yang telah diperoleh
Uji heteroskedastisitas pada nilai ε
Menghitung variansi-kovariansi dari ( )1ε
dan ( )2ε
Menghitung variansi-kovariansi dari ( )1
iε
dan ( )2iε
Mendefinisikan vektor variansi covariansi sebagai matriks diagonal
[ ] [ ]1GCV k GCV k+ > Tidak
Ya p value alfa− ≤
Ya
B 1k k= +
Tidak
Kasus
Homoskedastisitas
Kasus
Heteroskedastisitas
C
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
54
4.2.2 Penerapan Model Regresi Semiparametrik Birespon Multiprediktor
Berdasarkan Estimator Penalized Spline pada Data Riil
Data yang diguakan untuk penerapan model regresi semiparametrik
birespon multiprediktor berdasarkan estimator penalized spline adalah data
tekanan darah pada pasien di Rumah Sakit Umum (RSU) Haji Surabaya. Pasien
yang menjadi objek penelitian sebanyak 65 pasien. Data yang digunakan dalam
pemodelan insampel sebayak 50 data dan 15 data untuk pemodelan outsampel.
Variabel yang digunakan dalam pengestimasian diantaranya variabel respon
pertama (1)( )iy yaitu tekanan darah sistolik dan variabel respon kedua (2)( )iy yaitu
Menghitung nilai penduga parameter
Menghitung MSE dan 2R
Membuat plot data observasi dan hasil estimasi y
Menggabungkan keempat matriks diagonal, dan menghitung inversnya
Melakukan estimasi dengan menggunakan parameter smoothing optimal yang telah diperoleh beserta W
Selesai
C
Menghitung nilai estimasi y
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
55
tekanan darah diastolik. Penentuan variabel prediktor komponen parametrik
menggunakan uji korelasi pearson, karena pada teori yang dikembangkan variabel
prediktor komponen parametrik diasumsikan linier sehingga uji korelasi pearson
tepat digunakan untuk mengidentifikasi variabel prediktor yang termasuk dalam
komponen parametrik. Berdasarkan hasil output uji Korelasi Pearson pada
Lampiran 9, diperoleh nilai yang berkorelasi dengan kedua variabel respon adalah
Low Density Lipoprotein (LDL) sehingga disimpulkan bahwa variabel LDL
sebagai hubungan parametrik.
Scatterplot dibuat untuk menunjukkan hubungan antara tekanan darah
sistolik dan diastolik dengan masing-masing variabel prediktor yang digunakan.
Scatterplot ini digunakan untuk menunjukkan bahwa pola hubungan yang
terbentuk untuk setiap variabel prediktor tidak diketahui yang merupakan pola
nonparametrik. Scatterplot antara tekanan darah sistolik dan diastolik dengan
berat badan, usia, dan High Density Lipoprotein (HDL) ditampilkan secara
berturut-turut pada Gambar 4.1, Gambar 4.2, dan Gambar 4.3 sebagai berikut :
Gambar 4.1 Scatterplot antara Tekanan Darah Sistolik dan Diastolik
dengan Berat Badan
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
56
Gambar 4.2 Scatterplot antara Tekanan Darah Sistolik dan Diastolik
dengan Usia
Gambar 4.3 Scatterplot antara Tekanan Darah Sistolik dan Diastolik
dengan HDL
Berdasarkan Gambar 4.1, Gambar 4.2, dan Gambar 4.3 dapat diketahui
pola hubungan kedua variabel respon yaitu tekanan darah sistolik dan diastolik
dengan variabel prediktor berat badan, usia, ataupun HDL titik-titik pada
scatterplot terlihat menyebar tidak mengikuti pola apapun sehingga disimpulkan
sebagai hubungan nonparametrik. Berdasarkan hasil identifikasi variabel prediktor
yang dilakukan dapat diketahui prediktor pada komponen parametrik adalah LDL
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
57
1( )ix , serta variabel prediktor komponen nonparametrik diantaranya adalah berat
badan 1( )it , usia 2( )it , dan HDL 3( )it .
Langkah awal sebelum melakukan analisis data adalah melakukan uji
untuk mengetahui korelasi antara variabel respon pertama (tekanan darah sistolik)
dan variabel respon kedua (tekanan darah diastolik) dengan program pada
Lampiran 3 menggunakan hipotesis yang dirumuskan sebagai berikut :
H0 : Tidak terdapat korelasi antara tekanan darah sistolik dan diastolik
H1 : Terdapat korelasi antara tekanan darah sistolik dan diastolik
Berdasarkan hasil output uji Korelasi Pearson pada Lampiran 9, diperoleh
nilai korelasi (r) sebesar 0,631 serta nilai p-value 0,000 < α (=0,05), maka dapat
diambil keputusan untuk menolak H0 sehingga dapat disimpulkan bahwa ada
korelasi antara variabel respon pertama (tekanan darah sistolik) dan variabel
respon kedua (tekanan darah diastolik).
Langkah selanjutya untuk analisis data adalah menentukan kombinasi orde
polinomial optimal pada respon pertama dan respon kedua serta jumlah titik knot
optimal dengan mendapatkan nilai lambda optimal pada masing-masing variabel
prediktor komponen nonparametrik menggunakan program yang telah dibuat pada
lampiran 3 berdasarkan kriteria Generalized Cross Validation (GCV) minimum.
Kombinasi orde polinomial pada respon pertama dan respon kedua, jumlah knot
dan titik knot, serta nilai lambda optimal berdasarkan kriteria GCV minimum
pada prediktor komponen nonparametrik pertama yaitu berat badan (Lampiran 10)
ditampilkan pada Tabel 4.1 sebagai berikut :
Tabel 4.1 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, dan Nilai
Lambda Optimal, serta GCV Minimum Prediktor Ke-1
Jumlah
Knot Titik Knot
Kombinasi Orde GCV
Minimum Lambda
Respon 1 Respon 2
1 60 1 1 693.4911 100
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
58
Jumlah
Knot Titik Knot
Kombinasi Orde GCV
Minimum Lambda
Respon 1 Respon 2
1 60
1 2 738.7294 1000
2 1 721.8352 1000
2 2 769.9759 1000
2 55,33; 65
1 1 689.9469 76
1 2 745.6781 1000
2 1 707.6577 73
2 2 772.0771 84
3 50,5; 60; 70
1 1 687.0901 95
1 2 749.1611 1000
2 1 701.1939 179
2 2 769.1391 284
4 50; 57,6;
63,8; 73,4
1 1 688.3006 158
1 2 752.1939 1000
2 1 695.1142 343
2 2 763.7129 608
Berdasarkan Tabel 4.1 nilai GCV minimum yang paling kecil dari
beberapa kombinasi orde respon pertama dan respon kedua pada jumlah titik knot
4 bertambah besar daripada di jumlah titik knot 3 maka penambahan jumlah knot
dihentikan. Sehingga nilai GCV minimum yang lebih kecil yaitu 687.0901
terletak pada jumlah titik knot sebanyak 3 di titik knot 50,5; 60; 70 dengan nilai
lambda optimal 95 yang terdapat pada kombinasi orde respon pertama yaitu orde
1 dan orde respon kedua yaitu orde 1.
Kombinasi orde polinomial pada respon pertama dan respon kedua, jumlah
knot dan titik knot, serta nilai lambda optimal berdasarkan kriteria GCV minimum
pada prediktor komponen nonparametrik kedua yaitu usia (Lampiran 11)
ditampilkan pada Tabel 4.2 sebagai berikut :
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
59
Tabel 4.2 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, dan Nilai
Lambda Optimal, serta GCV Minimum Prediktor Ke-2
Jumlah
Knot Titik Knot
Kombinasi Orde GCV
Minimum Lambda
Respon 1 Respon 2
1 60,5
1 1 566.9609 2
1 2 590.4973 1
2 1 569.2413 8
2 2 582.3961 1000
2 55,33; 69
1 1 569.1749 5
1 2 607.8141 3
2 1 566.9604 25
2 2 586.7442 1000
3 53; 60,5;
70,75
1 1 557.4237 8
1 2 621.3194 6
2 1 574.6779 125
2 2 592.9409 1000
4 49; 57,6;
65,2; 72,2
1 1 552.4698 9
1 2 635.4309 10
2 1 577.1338 490
2 2 597.1745 1000
5 48.167; 55.33;
60.5; 69; 73
1 1 552.1594 11
1 2 633.7329 13
2 1 577.0646 547
2 2 599.2182 1000
6 47; 53; 59;
64; 70; 74
1 1 552.1427 14
1 2 638.7481 18
2 1 577.3606 757
2 2 601.9875 1000
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
60
Jumlah
Knot Titik Knot
Kombinasi Orde GCV
Minimum Lambda
Respon 1 Respon 2
7
46,125; 53;
57; 60,5;
68,25; 70,75;
74
1 1 555.7744 17
1 2 641.0961 20
2 1 576.7996 827
2 2 603.0142 1000
Berdasarkan Tabel 4.2 nilai GCV minimum yang paling kecil dari
beberapa kombinasi orde respon pertama dan respon kedua pada jumlah titik knot
7 bertambah besar daripada di jumlah titik knot 6 maka penambahan jumlah knot
dihentikan. Sehingga nilai GCV minimum yang lebih kecil yaitu 552.1427
terletak pada jumlah titik knot sebanyak 6 di titik knot 47; 53; 59; 64; 70; 74
dengan nilai lambda optimal 14 yang terdapat pada kombinasi orde respon
pertama yaitu orde 1 dan orde respon kedua yaitu orde 1.
Kombinasi orde polinomial pada respon pertama dan respon kedua, jumlah
knot dan titik knot, serta nilai lambda optimal berdasarkan kriteria GCV minimum
pada prediktor komponen nonparametrik ketiga yaitu LDL (Lampiran 12)
ditampilkan pada Tabel 4.3 sebagai berikut :
Tabel 4.3 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, dan Nilai
Lambda Optimal, serta GCV Minimum Prediktor Ke-3
Jumlah
Knot Titik Knot
Kombinasi Orde GCV
Minimum Lambda
Respon 1 Respon 2
1 41
1 1 676.2053 21
1 2 721.1062 7
2 1 687.5927 1000
2 2 734.7972 1000
2 35,33; 45,67
1 1 682.3386 1000
1 2 735.0219 1000
2 1 695.548 1000
2 2 751.5255 1000
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
61
Berdasarkan Tabel 4.3 nilai GCV minimum yang paling kecil dari
beberapa kombinasi orde respon pertama dan respon kedua pada jumlah titik knot
2 bertambah besar daripada di jumlah titik knot 1 maka penambahan jumlah knot
dihentikan. Sehingga nilai GCV minimum yang lebih kecil yaitu 676.2053
terletak pada jumlah titik knot sebanyak 1 di titik knot 41 dengan nilai lambda
optimal 21 yang terdapat pada kombinasi orde respon pertama yaitu orde 1 dan
orde respon kedua yaitu orde 1.
Kombinasi orde polinomial pada respon pertama dan respon kedua, jumlah
knot dan titik knot, serta nilai lambda optimal berdasarkan kriteria GCV minimum
pada masing-masing prediktor ditampilkan secara keseluruhan pada Tabel 4.4
sebagai berikut :
Tabel 4.4 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, serta Nilai
Lambda Optimal Setiap Prediktor
Variabel
Prediktor
Kombinasi Orde Jumlah
Knot Titik Knot Lambda
Respon 1 Respon 2
Berat Badan 1( )t 1 1 3 50,5; 60;
70 95
Usia 2( )t 1 1 6 47; 53; 59;
64; 70; 74 14
HDL 3( )t 1 1 1 41 21
Berdasarkan Tabel 4.4 untuk prediktor pada komponen nonparametrik
pertama yaitu berat badan 1( )t bahwa GCV minimum terletak pada jumlah titik
knot sebanyak 3 di titik knot 50,5; 60; 70 dengan nilai lambda optimal 95 yang
terdapat pada kombinasi orde respon pertama yaitu orde 1 dan orde respon kedua
yaitu orde 1. Pada prediktor komponen nonparametrik kedua yaitu usia 2( )t
bahwa GCV minimum terletak pada jumlah titik knot sebanyak 6 di titik knot 47;
53; 59; 64; 70; 74 dengan nilai lambda optimal 14 yang terdapat pada kombinasi
orde respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1. Sedangkan
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
62
prediktor komponen nonparametrik ketiga yaitu LDL 3( )t bahwa GCV minimum
terletak pada jumlah titik knot sebanyak 1 di titik knot 41 dengan nilai lambda
optimal 21 yang terdapat pada kombinasi orde respon pertama yaitu orde 1 dan
orde respon kedua yaitu orde 1. Setelah didapatkan kombinasi orde polinomial
respon 1 dan respon 2 serta jumlah titik knot, dan titik knot optimal pada masing-
masing variabel prediktor maka dilakukan pemodelan berdasarkan kombinasi orde
polinomial respon 1 dan respon 2 serta jumlah titik knot, dan titik knot optimal
dengan nilai lambda optimal 59,13 sehingga didapatkan nilai residual dari respon
pertama dan respon kedua seperti pada Lampiran 13 yang selanjutnya akan
dilakukan uji heteroskedastisitas/homoskedastisitas diantara kedua residual
tersebut.
Analsis uji yang digunakan untuk menguji adanyan heteroskedastisitas
pada matriks variansi kovariansi dilakuakan uji glesjer (Lampiran 6) dengan
hipotesis sebagai berikut :
2 2 2 20 1 2: ... nH σ σ σ σ= = = =
1 :H minimal ada satu 2 2iσ σ≠ , dengan 1,2,...,50i =
Berdasarkan hasil uji glesjer pada Lampiran 14 untuk matriks variansi
kovariansi diperoleh nilai hitungF sebesar 0,453 serta nilai p-value sebesar 0,997
maka dapat diambil keputusan untuk menerima H0 sehingga dapat disimpulkan
bahwa terjadi kasus homoskedastisitas ( 2 2 2 21 2 ... nσ σ σ σ= = = = ).
Langkah berikutnya setelah dilakukan uji homoskedastisitas adalah
mengestimasi model regresi semiparametrik birespon multiprediktor berdasarkan
estimator penalized spline menggunakan pembobot W berdasarkan subbab 4.2.1
dengan program yang telah dibuat pada Lampiran 7. Estimasi model regresi
semiparametrik birespon multiprediktor berdasarkan estimator penalized spline
menggunakan pembobot W dilakuakan dengan menggnuakan kombinasi orde
polinomial respon 1 dan respon 2 serta jumlah titik knot, dan titik knot optimal
yang telah didapatkan sebelumnya yaitu untuk prediktor berat badan 1( )it dengan
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
63
(4.32)
jumlah titik knot sebanyak 3 pada titik knot 50,5; 60; 70 serta kombinasi orde
respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1, pada prediktor
usia 2( )it bahwa dengan jumlah titik knot sebanyak 6 pada titik knot 47; 53; 59;
64; 70; 74 serta kombinasi orde respon pertama yaitu orde 1 dan orde respon
kedua yaitu orde 1, dan prediktor LDL 3( )it dengan jumlah titik knot sebanyak 1
pada titik knot 41 serta kombinasi orde respon pertama yaitu orde 1 dan orde
respon kedua yaitu orde 1.
Estimasi model tekanan darah sistolik yang didapatkan dengan model
regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized
spline dengan nilai lambda optimal 0.01 adalah sebagai berikut :
1 1 1
1 1 2 2
2 2 2 2
3
(1)
2
15) 98,4014 0,1859 0,3489 0,3149( 50,5)0,0646( 60) 0,4170( 70) 1,5876 0,7330( 47)0,6876( 53) 0,4915( 59) 0,5155( 64) 0,1333( 70)0,3975( 74) 0,2
ˆ (4,82
3
6
5
6
7
e x t tt t t tt t t
y
tt t
+
+ + +
+ + + +
+
− + + − + −+ − − − + − −− − − − − − − −+ − −
=
− 30,1952( 41)t +−
Berdasarkan persamaan (4.31) didapatakan masing-masing fungsi nonparametrik
berdasarkan estimator spline pada setiap prediktor serta dapat diinterpretasikan
secara lebih mudah dalam bentuk fungsi potongan. Fungsi potongan untuk
prediktor pertama yaitu berat badan dinyatakan pada persamaan (4.32) dan
persamaan (4.33) sebagai berikut :
(1)1 1 1 1 1( ) 0,3489 0,3149( 50,5) 0,0646( 60) 0,4170( 70)f t t t t t+ + += − + − + − − −
1 1
1 1(1)1
1 1
1 1
0,3489 ; 0 50,515,9025 0,0340 ; 50,5 60
( )19,7785 0,0306 ; 60 70
9,4115 0.3864 ; 70
t tt t
f tt t
t t
− ≤ <− − ≤ <= − + ≤ < − ≥
Fungsi potongan untuk prediktor kedua yaitu usia dinyatakan pada persamaan
(4.34) dan persamaan (4.35) sebagai berikut : (1)
2 2 2 2 2
2 2 2
( ) 1,5876 0,7330( 47) 0,6876( 53) 0,4915( 59)0,5155( 64) 0,1333( 70) 0,3975( 74)
f t t t t tt t t
+ + +
+ + +
= − − − − − −− − − − + −
(4.31)
(4.34)
(4.33)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
64
2 2
2 2
2 2(1)
2 2 2
2 2
2 2
2 2
4770,8938 0,1670 5399,8923 0,3
1,5876 ; 4734,4510 0,8546 ; 53
; 59( ) 64
132,8843 0,8400142,2153
245 ; 59;64 70;70 74; 7
0,9733112,8003 0,5 4758
t tt tt t
f t t tt tt tt t
< + ≤ < ≤ <
= ≤ < −
+−
< − < − ≥
≤≤
Fungsi potongan untuk prediktor ketiga yaitu HDL dinyatakan pada persamaan
(4.36) dan persamaan (4.37) sebagai berikut : (1)
3 3 3( ) 0, 2753 0,1952( 41)f t t t += − − −
3 3(1)3
3 38,0030,275
23 ; 41
( )0,470 ; 415
t tf t
t t−− <
= ≥
Berdasarkan persamaan (4.31) dengan menggunakan potongan polinomial
persamaan (4.33), persamaan (4.35), dan persamaan (4.37), diketahui bahwa
setiap kenaikan kadar LDL sebesar 1 satuan mg/dL akan meningkatkan tekanan
darah sistolik sebesar 0,1859 mmHg. Tekanan darah sistolik pada pasien dengan
berat badan 60 kg sampai kurang dari 70 kg setiap kenaikan berat badan 1 kg
mengakibatkan kenaikan sebesar 0,0306 mmHg. Pada pasien berusia kurang dari
47 tahun setiap pertambahan usia 1 tahun mengakibatkan kenaikan sebesar 1,5876
mmHg, pada pasien berusia 47 tahun sampai kurang dari 53 tahun setiap
pertambahan usia 1 tahun mengakibatkan kenaikan sebesar 0,8546 mmHg, pada
pasien berusia 53 tahun sampai kurang dari 59 tahun setiap pertambahan usia 1
tahun mengakibatkan kenaikan sebesar 0,1670 mmHg. Sedangkan pada pasien
dengan kadar HDL kurang dari 41 mg/dL setiap kenaikan kadar HDL 1 satuan
mg/dL megalami penurunan sebesar 0,2753 mmHg, pada pasien dengan kadar
HDL lebih dari sama dengan 41 mg/dL setiap kenaikan kadar HDL 1 satuan
mg/dL mengakibatkan megalami penurunan sebesar 0,4705 mmHg.
Untuk menduga tekanan darah sistolik gambarannya yaitu jika ingin
mengetahui tekanan darah sistolik pasien berusia 58 tahun dengan berat badan 55
(4.37)
(4.36)
(4.35)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
65
kg, serta LDL 113 mg/dL dan HDL 35 mg/dL maka perhitungannya dilakukan
dengan cara melihat interval 150,5 60t≤ < pada (1)1( )f t , interval 253 59t≤ <
pada (1)2( )f t , dan interval 3 41t < pada (1)
3( )f t sehingga nilai estimasi tekanan
darah sistolik pasien tersebut ( )15) 98,40ˆ (4,82 14 0,1856 136 9 1y e − + +=
( ) ( ) ( ) 70,893815,9025 0, 0,0340 55 1670 58 0,2753 35+ + −++ − − adalah
172,5799≈173 mmHg. Sedangkan estimasi model tekanan darah diastolik yang
didapatkan dengan model regresi semiparametrik birespon multiprediktor
berdasarkan estimator penalized spline dengan nilai lambda optimal 0.01 adalah
sebagai berikut :
1 1 1
1 1 2
(2)
2
2 2 2 2
2 3
(1,0826 14) 70,1469 0,1129 0,5043 0,3804( 50,5)0,6259( 60) 0,6036( 70) 0,6729 0,5412( 47)0,0042( 53) 0,0717( 59) 0,6859( 64) 0,2915( 70)0,0483( 74) 0,0
ˆ
875
e x t tt t t tt t t tt
y
t
+
+ + +
+ + + +
+
− − + + − + −+ − − − + − −− − − − − −
=
+ −− − + 30, 2237( 41)t +− −
Berdasarkan persamaan (4.38) didapatakan masing-masing fungsi
nonparametrik berdasarkan estimator spline pada setiap prediktor serta dapat
diinterpretasikan secara lebih mudah dalam bentuk fungsi potongan. Fungsi
potongan untuk prediktor pertama yaitu berat badan dinyatakan pada persamaan
(4.39) dan persamaan (4.40) sebagai berikut :
(2)1 1 1 1 1( ) 0,5043 0,3804( 50,5) 0,6259( 60) 0,6036( 70)f t t t t t+ + += − + − + − − −
1 1
1 1(2)1
1 1
1 1
0,5043 ; 0 50,519,2102 0,1239 ; 50,5 60
( )56,7642 0,5020 ; 60 7014,5122 0.1016 ; 70
t tt t
f tt tt t
− ≤ <− − ≤ <= − + ≤ <− − ≥
Fungsi potongan untuk prediktor kedua yaitu usia dinyatakan pada persamaan
(4.41) dan persamaan (4.42) sebagai berikut : (2)
2 2 2 2 2
2 2 2
( ) 0,6729 0,5412( 47) 0,0042( 53) 0,0717( 59)0,6859( 64) 0,2915( 70) 0,0483( 74)
f t t t t tt t t
+ + +
+ + +
= − − − − − −− − + − − −
(4.38)
(4.39)
(4.40)
(4.41)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
66
2 2
2 2
2 2(2)
2 2 2
2 2
2 2
2 2
25,4364 0,1317 4725,6590 0,1257 5329,8892 0,0558 ;5973,7869 0,6301 ;64 7053,3819 0,3386 ;70 7456,9561 0
0,6729 ; 47; 53;
,38
59
69 ;
( ) 64
74
t tt tt t
f t t tt tt tt t
< ≤+
++
< ≤ <
= ≤ <−
< < ≥
≤− ≤−
Fungsi potongan untuk prediktor ketiga yaitu HDL dinyatakan pada persamaan
(4.43) dan persamaan (4.44) sebagai berikut : (2)
3 3 3( ) 0,0875 0,2237( 41)f t t t += − −
3 3(2)3
3 39,1717 0,0,0875 ; 41
( ); 411326
t tf t
t t<
= ≥−
Berdasarkan persamaan (4.38) dengan menggunakan potongan polinomial
persamaan (4.40), persamaan (4.42), dan persamaan (4.44), setiap kenaikan kadar
LDL sebesar 1 satuan mg/dL akan meningkatkan tekanan darah diastolik sebesar
0,1129 mmHg. Tekanan darah diastolik pada pasien dengan berat badan 60 kg
sampai kurang dari 70 kg setiap kenaikan berat badan 1 kg mengakibatkan
kenaikan sebesar 0,5020 mmHg. Pada pasien berusia kurang dari 47 tahun setiap
pertambahan usia 1 tahun mengakibatkan kenaikan sebesar 0,6729 mmHg, pada
pasien berusia 47 tahun sampai kurang dari 53 tahun setiap pertambahan usia 1
tahun mengakibatkan kenaikan sebesar 0,1317 mmHg, pada pasien berusia 53
tahun sampai kurang dari 59 tahun setiap pertambahan usia 1 tahun
mengakibatkan kenaikan sebesar 0,1257 mmHg, pada pasien berusia 59 tahun
sampai kurang dari 64 tahun setiap pertambahan usia 1 tahun mengakibatkan
kenaikan sebesar 0,0558 mmHg. Sebaliknya pada pasien dengan kadar HDL lebih
dari sama dengan 41 mg/dL setiap kenaikan kadar HDL 1 satuan mg/dL
mengakibatkan megalami penurunan sebesar 0,1326 mmHg.
Penelitian oleh Dasha Braverman dkk, (2014) menjelaskan bahwa semakin
tinggi kadar kolesterol LDL dalam tubuh, semakin besar risiko mengidap penyakit
(4.42)
(4.43)
(4.44)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
67
Hipertensi dan Jantung koroner, berbagai penyakit tersebut merupakan faktor
resiko tekanan darah yang tinggi, dan sebaliknya semakin tinggi kadar kolesterol
HDL dalam tubuh, semakin kecil resiko tekanan darah yang tinggi. Penelitian lain
terkait faktor tekanan darah antara lain Anggara (2013) yang menyimpulkan
bahwa berat badan berpengaruh terhadap tekanan darah seseorang, hal ini karena
kegemukan (obesitas) merupakan ciri khas dari populasi hipertensi, dan
dibuktikan bahwa faktor ini memiliki kaitan erat dengan terjadinya hipertensi di
kemudian hari, serta tekanan darah dewasa cenderung meningkat seiring dengan
pertambahan usia, hal ini mendukung hasil yang didapatkan.
Untuk menduga tekanan darah diastolik gambarannya yaitu jika ingin
mengetahui tekanan darah sistolik pasien berusia 58 tahun dengan berat badan 55
kg, serta LDL 113 mg/dL dan HDL 35 mg/dL maka perhitungannya dilakukan
dengan cara melihat interval 150,5 60t≤ < pada (2)1( )f t , interval 253 59t≤ <
pada (2)2( )f t , dan interval 3 41t < pada (2)
3( )f t sehingga nilai estimasi tekanan
darah diasitolik pasien tersebut ( )(1,0826 14) 70,1469 0,1 113ˆ 129y e= − − + +
( ) ( ) ( ) 25,659019,21 0,102 0,123 257 59 55 0,0875 58 3+ + ++ − − adalah
86,7670≈87 mmHg. Setelah didapatkan model terbaik pada persamaan (4.31) dan
(4.38), diperoleh nilai MSE sebesar 136,5604 dan diperoleh nilai R-square
sebesar 0,9123 dan dapat diartikan bahwa pengaruh variabel prediktor yang
diamati terhadap variabel respon adalah sebesar 91,23% sehingga dari hasil
tersebut menunjukkan model yang diperoleh sudah baik untuk menghitung
tekanan darah pada data insample.
Model estimasi yang diperoleh tidak dapat digambarkan secara
keseluruhan karena membutuhkan ruang dimensi lebih dari tiga. Namun dari
model estimasi yang diperoleh, selanjutnya dapat diplotkan hasil pengamatan
(observasi) serta nilai estimasi tekanan darah sistolik untuk mengetahui seberapa
jauh jarak antara hasil data observasi serta nilai estimasi dapat dilihat pada
Gambar 4.4 sebagai berikut :
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
68
Gambar 4.4 Plot Observasi dan Estimasi pada Tekanan Darah Sistolik
Data Insample
Plot hasil pengamatan (observasi) serta nilai estimasi tekanan darah diastolik
dapat dilihat pada Gambar 4.5 sebagai berikut :
Gambar 4.5 Plot Observasi dan Estimasi pada Tekanan Darah Diastolik
Data Insample
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
69
Estimasi pada data outsample dilakukan dengan menggunakan model yang
telah diperoleh berdasarkan estimasi pada data insample. Langkah awal untuk
estimasi pada data outsample adalah merumuskan data variabel prediktor
komponen parametrik pada matrik X dan data setiap variabel prediktor
komponen nonparametrik pada matrik Z yang kemudian mendapatkan nilai
ˆ ˆy = θ+ ΦX Z
, θ
dan Φ
merupakan nilai dugaan parameter yang telah didapatkan
dari estimasi data insample. Estimasi dilakukan dengan menggunakan program
yang telah dibuat pada Lampiran 8. Berdasarkan hasil analisis 15 data outsample
pada Lampiran 16, didapat nilai dugaan masing-masing iy yang kemudian
diperoleh nilai MSE sebesar 254,2364 dan diperoleh nilai R-square sebesar
76,71% sehingga dari hasil tersebut menunjukkan model yang diperoleh sudah
baik untuk menghitung tekanan darah pada data outsample.
Plot hasil pengamatan (observasi) serta nilai estimasi tekanan darah
sistolik pada data outsample dapat dilihat pada Gambar 4.6 sebagai berikut :
Gambar 4.6 Plot Observasi dan Estimasi pada Tekanan Darah Sistolik
Data Outsample
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
70
Sedangkan plot hasil pengamatan (observasi) serta nilai estimasi tekanan darah
diastolik pada data outsample dapat dilihat pada Gambar 4.7 sebagai berikut :
Gambar 4.7 Plot Observasi dan Estimasi pada Tekanan Darah Sistolik
Data Outsample
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil dan pembahasan yang telah diuraikan pada BAB 4 dapat
diperoleh kesimpulan sebagai berikut :
1. Model regrsi semiparametrik birespon multiprediktor berdasarkan
estimator penalized spline yaitu y = θ+ Φ + εX Z
dengan
( ) 1 2
(1) (2) ( ) ( ) ( ) ( ); ( , ,... , )n
T r r r r Ty y y y y y y= =
,
(1)
(2);
=
X 0X
0 X( )( )
1 2 3 ;Trnx x x x=X
1 2 , 1i i i pix x x x =
( ) ( )( ) ( ) ( ) ( )0
(1) (2) ( )1 2 ... ,;
Tr r r rv p
T r θ θθ θ θθ θθ= =
( ) ( )(r) ( ) ( ) (
(1)
1 2( 3
)
2) ; ;
Tr r r rn
= =
Z 0Z Z Z ZZ Z
0 Z
(r) ( ) ( ) ( )1 2 ;r r r
i q = τ τ τ Z 1
( ) 2
1 2( ) ( ) ( ,) w w w wd d d drw wi wi wi wi w wi w wi wkt t t t t t τ = − ξ − ξ − ξ
( ) ( )(1) (2) ( ) ( ) ( ) ( ) ( ) ( ) ( )1 1 2 2
( )0; .. . ;
TT r r rr r r r rq qw α β α α βθ βΦ = Φ Φ Φ =
( )( ) (( ) ( ) ( ) ( )0 10 2
) ( ) )1 20 0
(... ; ... ;Tr r r r
w w w wdr r r r
w qα α α α α α αθ = + =+ +
( )( ) ( ) ( ) ( )
1 2 ...Tr r r r
w w w wkβ β β β=
, dan
( )(1) (2) ( ) ( ) ( ) ( )1 2; ( , ,..., )
T r r r r Tnε ε ε ε ε ε ε= =
1, 2,..., ni = , 1, 2,...,v p= , 1, 2,...,w q= , serta 1, 2r = . Proses
pengestimasian dilakukan dengan menggunakan matrik pembobot
variansi kovariansi untuk meminimumkan jumlah kuadrat residual
71 SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
72
sedemikian sehingga diperoleh estimasi model regresi semiparametrik
birepson multiprediktor berdasaarkan estimator penalized spline adalah
( ) ( )1
ˆ T Ty y n y−
= + + λ −Z Z Z D ZC W W I C
dengan
( ) ( )( ) ( ) ( )1
;T TT T−
= − − − −C X X I A I A X X I A I A
( ) 1. T Tn
−λ= +Z Z Z D ZA W W
2. Penerapan algoritma dan program pengestimasian model regresi
semiparametrik birespon multiprediktor berdasarkan estimator penalized
spline pada data tekanan darah pasien di RSU Haji Surabaya memberikan
hasil bahwa titik dimana terjadi pola perubahan perilaku tekanan darah
pasien berada pada berat badan 50,5 kg; 60 kg; 70 kg, usia 47 tahun; 53
tahun; 59 tahun; 64 tahun; 70 tahun; 74 tahun, dan HDL 41 mg/dL dengan
diperoleh MSE sebesar 136,5604 dan diperoleh nilai R-square sebesar
91,23% untuk data.
5.2 Saran
Berdasarkan hasil yang diperoleh dalam skripsi ini, saran yang diberikan
untuk penelitian selanjutnya sebagai berikut :
1. Secara teori perlu dikembangkan estimasi model regresi seiparametrik
birespon multiprediktor berdasarkan estimator penalized spline pada
data longitudinal.
2. Secara terapan disarankan menambahkan variabel prediktor lain yang
yaitu faktor fisiologis diantaranya adalah volume darah, kekuatan
gerak jantung, viscositas darah, ataupun kapasitas pembuluh darah
serta faktor eksternal seperti stress, pola makan, ataupun kebiasaan
merokok.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
73
DAFTAR PUSTAKA
Andriani, H., Wibowo, W., and Rahayu, S. P., 2015, Penalized Spline Estimator In Nonparametrik Regression, Proceedings of the IConSSE FSM SWCU (2015), pp. MA.1–4 , ISBN: 978-602-1047-21-7.
Budiantara, I. N., 2012, Penelitian Bidang Regresi Spline Menuju Terwujudnya
Penelitian Statistika Yang Mandiri Dan Berkarakter, Denpasar: Seminar Nasional FMIPA Undiksha Denpasar.
Chamidah, N., and Eridani, 2015, Designing of Growth Reference Chart by Using
Birespon Semiparametrik Regression Approach Based on P-Spline Estimator, International Journal of Applied Mathematics and Statistics, Int. J. Appl. Math. Stat.; 53 (3); 2015, ISSN 0973-1377.
Didi. 2014. http//:didi.staff.gunadarma.ac.id/Downloads/files/13706/BabII
.pdf. (Diakses pada 10 Oktober 2016). Fernandes, A., 2014, Spline Estimator for Bi-responses Nonparametrik
Regression Model for Longitudinal Data, Surabaya : Applied Mathematical Sciences; 8 (114); 2014. ISBN : 5653-5665.
Greene, W., 2003, Econometric Analysis Fifth Edition, NewYork : Prentice Hall. Griggs, W., 2013, Penalized Spline Regression and its Applications,
Wangshington D. C. : Whitman College. Hintze, J. L., 2007, User’s Guide IV:Multivariate Analysis, Clustering, Meta
Analysis, Forecasting / Time Series, Operations Research, Mass Appraisal, Utah : NCSS Statistical System.
Juliandari, N. dan Budiantara, I. N. , 2014, Pemodelan Angka Harapan Hidup dan
Angka Kematian Bayi di Jawa Timur dengan Pendekatan Regresi Nonparametrik Spline Birespon, http://digilib.its.ac.id/public/ITS-paper-34916-1309100048-Paper.pdf. (Diakses pada 23 September 2016).
Maziyya, P. A., Sukarsa, I. K. G., dan Asih, N. M., 2015, Mengatasi
Heteroskedastisitas Pada Regresi Dengan Menggunakan Weighted Least Square, Jurnal Matematika; 4 (1); 2015, ISSN:2303-1751.
Mersi, C., dan Andrianto, D., 2016, Analisis Pengaruh LDL terhadap Tekanan
Darah pada Penderita Hipertensi dengan Pendekatan Regresi Nonparametrik Berdasarkan Estimator Penalized Spline, dalam PKM-AI yang didanai DIKTI tahun 2016.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
74
Montoya, E. L., N. Ulloa, and V. Miller, 2014, A Simulation Study Comparing Knot Selection Methods With Equally Spaced Knots in a Penalized Regression Spline, International Journal of Statistics and Probability; 3 (3); 2014, ISSN 1927-7032, E-ISSN 1927-7040.
Oktaviana, D., dan Budiantara, I N., 2011, Regresi Spline Birespon Untuk
Memodelkan Kadar Gula Darah Penderita Diabetes Melitus, http://digilib.its.ac.id/public/ITS-paper-19523-1307100068-Paper.pdf. (Diakses pada 23 September 2016).
Palmer. A., 2007, Tekanan Darah Tinggi, Jakarta: Erlangga. Pütz, P., and T. Kneib, 2016, A Penalized Spline Estimator for Fixed Effects
Panel Data Models, Germany : German Socio-Economic Panel (SOEP). Rasmussen, S., 2006, An Introduction to Statistics with Data Analysis. Belmont :
Brooks/Cole. Ricky, N. A., 2014, Estimasi Model Regresi Nonparametrik Menggunakan Radial
Smoothing Berdasarkan Estimator Penalized Spline, Surabaya : Skripsi Fakultas Sains dan Teknologi Universitas Airlangga.
Ruhana, U. T., 2016, Estimasi Model Regresi Semiparametrik Birespon Pada
Data Longitudinal Berdasarkan Estimator Spline Truncated, Surabaya : Skripsi Fakultas Sains dan Teknologi Universitas Airlangga.
Ruppert, D., Wand, M. P., and Carrol, R. J., 2003. Cambridge Series in Statistical
and Probabilistic Mathematics: Semiparametrik Regression. New York: Cambridge University Press.
Salam, N., 2013, Estimasi Likelihood Maximum Penalized dari Model Regresi
Semiparametrik, Prosiding Seminar Nasional Statistika Universitas Diponegoro 2013, ISBN : 978-602-14387-0-1.
Sari, R. P., 2016, Estimasi Model Regresi Nonparametrik Bi-Response Pada Data
Longitudinal Berdasarkan Estimator Weighted Spline Truncated, Surabaya : Skripsi Fakultas Sains dan Teknologi Universitas Airlangga.
Sawitzki, G., 2009, Computational Statistics: An Introduction to R, Journal of
Statistical Software; 32 (2); 2009. ISBN : 978-1-4200-8678-2. Setyawan, N. dan I N. Budiantara., 2011, Nonparametrik Biresponse Spline
Regression Approach on Modeling Determinants of Education Outcome in Papua Island. http://digilib.its.ac.id/public/ITS-Master-18993-Paper-3221676.pdf. (Diakses pada 23 September 2016).
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
75
Walpole, R. E, Raymond H. M., Sharon, L. M., and Keying Y., 2012, Probability and Statistics for Engineers and Scientists Ninth Edition, United States of America : Pearson Education Publisher.
Welsh, A. H. and Yee, T. W., 2006, Local Regression for Vector Responses,
Journal of Statistical Planning and Inference 136; 2006, 3007 – 3031. WHO, 1995, Clinical’s Manual Hypertension and the Elderly, London: Science
Press. Wibowo, W., S. Haryatmi, dan I. N. Budiantara, 2013, Kajian Metode Estimasi
Parameter dalam Regresi Semiparametrik Spline, Jurnal Berkala MIPA, 23(1), Januari 2013.
Wood, S. N., and Augustin, N. H., 2002, GAMs with Integrated Model Selection
Using Penalized Regression Spline and Applications to Environmental Modelling, Jurnal of Ecological Modelling 157; 2002, 157-177.
Wulandari I. dan I N. Budiantara., 2014, Analisis Faktor-Faktor yang
Mempengaruhi Persentase Penduduk Miskin dan Pengeluaran Perkapita Makanan di Jawa Timur menggunakan Regresi Nonparametrik Birespon Spline, Surabaya : Jurnal Sains dan Seni POMITS; 3 (1); 2014. ISBN : 2337-3520.
Yolandika, B., 2011, Estimasi Model Regresi Nonparametrik Birespon
Berdasarkan Estimator Penalized Spline, Surabaya : Skripsi Fakultas Sains dan Teknologi Universitas Airlangga.
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 1. Data Insample Tekanan Darah Pasien dan Variabel Prediktor RSU Haji Surabaya
No. Y1 Y2 x1 t1 t2 t3 1 170 110 150 70 54 42 2 200 90 123 60 60 38 3 160 110 147 58 57 62 4 168 81 101 58 70 43 5 160 90 109 50 70 51 6 200 110 187 65 62 44 7 180 90 114 66 71 39 8 160 90 211 57 71 41 9 160 100 179 70 57 33 10 140 90 137 165 64 35 11 110 80 157 149 73 98 12 170 90 117 65 74 24 13 140 80 130 45 84 49 14 140 90 154 90 40 54 15 140 80 132 63 73 52 16 150 90 137 65 69 63 17 160 90 112 50 50 36 18 160 80 150 57 55 35 19 150 80 58 60 62 30 20 180 110 141 65 48 40 21 190 100 120 72 53 35 22 160 90 111 76 39 37 23 150 90 130 60 69 46 24 184 87 95 70 53 32 25 170 110 146 90 69 33 26 150 80 128 85 72 34 27 190 100 166 75 49 36 28 170 100 122 73 59 31 29 180 110 138 80 60 33 30 150 90 95 75 78 32 31 180 100 165 45 56 32 32 200 130 145 47 64 44 33 160 90 162 55 58 42 34 160 90 94 50 53 59 35 140 90 76 54 74 45
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
No. Y1 Y2 x1 t1 t2 t3 36 190 100 121 45 80 41 37 90 60 57 50 15 59 38 145 80 121 52 42 46 39 180 80 131 49 82 50 40 150 100 182 56 75 55 41 140 80 45 48 37 25 42 180 100 138 60 46 48 43 160 90 120 45 61 46 44 170 100 157 60 47 40 45 170 90 126 62 67 45 46 150 90 103 90 39 22 47 150 100 122 50 82 34 48 200 100 217 58 69 74 49 200 90 173 50 59 34 50 160 90 148 55 49 64
Sumber : Rekam Medis Pasien Rawat Inap RSU Haji Surabaya 2015
Keteragan :
Y1, merupakan tekanan darah sistolik (mmHg)
Y1, merupakan tekanan darah diastolik (mmHg)
x1, merupakan kadar lemak jahat atau Low Density Lipoprotein (LDL) (mg/dL)
t1, merupakan berat badan (Kg)
t2, merupakan usia (Tahun)
t3, merupakan kadar lemak baik atau High Density Lipoprotein (HDL) (mg/dL)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 2. Data Outsample Tekanan Darah Pasien dan Variabel Prediktor RSU Haji Surabaya
No. Y1 Y2 x1 t1 t2 t3 1 180 110 141 65 48 40 2 133 83 80 63 65 27 3 110 80 157 149 73 98 4 150 80 58 60 62 30 5 140 90 137 165 64 35 6 140 90 171 60 73 55 7 140 90 165 68 69 56 8 184 87 95 70 53 32 9 130 70 131 45 75 60
10 170 100 157 60 47 40 11 140 80 45 48 37 25 12 160 90 94 50 53 59 13 140 90 139 70 69 35 14 150 90 176 50 68 33 15 140 90 110 63 64 32
Sumber : Rekam Medis Pasien Rawat Inap RSU Haji Surabaya 2015
Keteragan :
Y1, merupakan tekanan darah sistolik (mmHg)
Y1, merupakan tekanan darah diastolik (mmHg)
x1, merupakan kadar lemak jahat atau Low Density Lipoprotein (LDL) (mg/dL)
t1, merupakan berat badan (Kg)
t2, merupakan usia (Tahun)
t3, merupakan kadar lemak baik atau High Density Lipoprotein (HDL) (mg/dL)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 3. Program Uji Korelasi Pearson
korelasi<-function(data) cat("\nUJI KORELASI PEARSON\n") cat("==============================================") alfa<-as.numeric(readline("\n\nInput nilai alfa : ")) y1<-data[,1] y2<-data[,2] M<-length(y1) n<-M sy1y2<-sum(y1*y2)-(M*mean(y1)*mean(y2)) sy1<-sqrt(sum(y1^2)-(M*(mean(y1))^2)) sy2<-sqrt(sum(y2^2)-(M*(mean(y2))^2)) korelasi<-sy1y2/(sy1*sy2) cat("\nkoefisien korelasi:",korelasi,"\n") t<-(korelasi*sqrt(M-2))/sqrt(1-(korelasi^2)) v<-M-2 ttabel<-qt(1-(alfa/2),v) cat("hipotesis:\n") cat("H0 : rho = 0\n") cat("H1 : rho != 0\n") p_value=round(2*pt(abs(t),v,lower.tail=FALSE),4) cat("\n========================================","\n") cat("nilai P-value = ",p_value,"\n") cat("==========================================","\n") cat("\nkesimpulan:\n") if(p_value<alfa) cat("Tolak Ho\nada korelasi\n\n") else cat("Terima Ho\ntidak ada korelasi\n\n")
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 4. Program Identifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Setiap Prediktor
mp<-function(x,eps=1e-006) x<-as.matrix(x) xsvd<-svd(x) diago<-xsvd$d[xsvd$d>eps] if(length(diago)==1) xplus<-
as.matrix(xsvd$v[,1])%*%t(as.matrix(xsvd$u[,1])/diago) else xplus<-
xsvd$v[,1:length(diago)]%*%diag(1/diago)%*%t(xsvd$u[,1:length(diago)])
return(xplus) trun<-function(prediktor,knot,orde) prediktor[prediktor<knot]<-knot b<-(prediktor-knot)^orde return(b) datai<-data[,1:2] data11<-data[,6] data12<-data[,7] data13<-data[,8] data1<-cbind(datai,data11) data2<-cbind(datai,data12) data3<-cbind(datai,data13) spline<-function(data) y1<-data[,1] y2<-data[,2] y<-c(y1,y2) M<-length(y1) n<-M cat("\n") P<-as.numeric(readline("Input Orde Maksimum : ")) bb<-as.numeric(readline("Input Batas Bawah Lamda : ")) ba<-as.numeric(readline("Input Batas Atas Lamda : ")) h<-as.numeric(readline("Input Increment : ")) k=0 kecilGCV<-rep(0,k+2) kecilGCV[1]<-10^10000 boptmaxx<-rep(0,k+1) pmaxx<-rep(0,k+1) repeat
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
k=k+1 prediktor=data[,3] vl<-seq(bb,ba,h) nvl<-length(vl) GCV<-rep(0,nvl) MSE<-rep(0,nvl) n<-nrow(data) dataurut<-data[order(prediktor),1:3] x<-dataurut[,3] y<-c(dataurut[,1],dataurut[,2]) z<-k+1 r<-quantile(x,seq(0,1,by=1/z)) lr<-length(r) R<-r[-lr] RR<-R[-1] cat("Jumlah Knot = ",k,"\n") for(i in 1:k) cat("titik knots[",i,"] = ",RR[i],"\n") p<-matrix(0,(P*P),2) p[,2]<-rep((1:P),P) for(i in 1:P) c<-rep(i,P) p[((P*(i-1)+1):(P*i)),1]=c pmax<-rep(0,2) gm<-rep(0,(n+1)) GCVmin<-rep(0,(P*P)) bopt<-rep(0,(P*P)) for(m in 1:(P*P)) cat("\nORDE respon 1 :",p[m,1],"; ORDE respon 2
:",p[m,2],"\n") for (r in 1:nvl) Z1<-matrix(0,M,(p[m,1]+k)) v11<-matrix(0,M,(p[m,1])) v21<-matrix(0,M,k) for(s in 1:(p[m,1])) v11[,s]<-x^(s) v11[,(p[m,1])]<-x^(p[m,1]) for(j in 1:k) v21[,j]<-trun(x,RR[j],p[m,1]) Z1[,1:(p[m,1]+k)]<-cbind(v11,v21) Z2<-matrix(0,M,(p[m,2]+k)) v12<-matrix(0,M,(p[m,2])) v22<-matrix(0,M,k) for(s in 1:(p[m,2])) v12[,s]<-x^(s)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
v12[,(p[m,2])]<-x^(p[m,2]) for(j in 1:k) v22[,j]<-trun(x,RR[j],p[m,2]) Z2[,1:(p[m,2]+k)]<-cbind(v12,v22) ZZ<-rep(1,M) ZA<-cbind(ZZ,Z1) ZB<-cbind(ZZ,Z2) ZC<-matrix(0,M,((p[m,2]+k)+1)) ZD<-matrix(0,M,((p[m,1]+k)+1)) A<-cbind(ZA,ZC) B<-cbind(ZD,ZB) Z<-rbind(A,B) d1<-rep(0,(p[m,1]+1)) d2<-rep(0,(p[m,2]+1)) d3<-rep(1,k) D1<-c(d1,d3) D2<-c(d2,d3) d0<-c(D1,D2) D<-diag(d0) betatopi<-mp(t(Z)%*%Z+(M*vl[r]*D))%*%t(Z)%*%y ytopi<-Z%*%betatopi H<-Z%*%mp(t(Z)%*%Z+(n*vl[r]*D))%*%t(Z) MSE[r]<-(t(y-ytopi)%*%(y-ytopi))/M GCV[r]<-MSE[r]/(1-((1/M)*sum(diag(H))))^2 #tutup lambda mlamda<-cbind(vl,GCV,MSE) GCVmin[m]<-min(GCV) win.graph() plot(vl,GCV,type="l",xlim=c(min(vl),max(vl)),ylim=c(min(GCV),max(G
CV)),xlab="Lambda",ylab="GCV") title("Plot Lambda Terhadap GCV",sub=paste("\n*untuk orde respon :
",p[m,1]," dan ",p[m,2]," ; jumlah knot = ",k),cex.sub = 0.75, font.sub = 3, col.sub = "red")
bopt[m]<-mlamda[mlamda[,2]==GCVmin[m],1] MSEE<-mlamda[mlamda[,2]==GCVmin[m],3] cat(" Nilai MSE = ",MSEE,"\n") cat(" Nilai GCV minimum = ",GCVmin[m],"\n") cat("Nilai Lambda Optimal saat GCV Minimum = ",bopt[m],"\n") betatopii<-mp(t(Z)%*%Z+(M*bopt[m]*D))%*%t(Z)%*%y ytopii<-Z%*%betatopii error<-y-ytopii ee<-cbind(ytopii,error) MSE<-(t(y-ytopii)%*%(y-ytopii))/length(y) JKT<-t(y-(mean(y)))%*%(y-(mean(y))) JKG<-t(y-ytopii)%*%(y-ytopii) RK<-1-(JKG/JKT) ER<-matrix(0,M,2) ER[,1]<-error[1:M] ER[,2]<-error[(M+1):(2*M)] #tutup orde for(a in 1:(P*P)) if(GCVmin[a]==min(GCVmin))
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
kecilGCV[k+1]<-GCVmin[a] boptmaxx[k]<-bopt[a] pmaxx[k]<-a if(kecilGCV[k+1]>kecilGCV[k]) kmax<-k-1 boptmax<-boptmaxx[k-1] pmax<-pmaxx[k] cat("\n\nOptimal") cat("\nNilai GCV minimum adalah",kecilGCV[k]) cat("\npada nilai lambda optimal = ",boptmax) cat("\nsaat orde respon 1 :",p[pmax,1],"\n") cat("dan orde respon 2 :",p[pmax,2],"\n") lr<-kmax+2 z<-kmax+1 r<-quantile(x,seq(0,1,by=1/z)) lr<-length(r) R<-r[-lr] RR<-R[-1] k<-kmax cat("Jumlah Knot = ",kmax,"\ndengan ") for(i in 1:k) cat("titik knots[",i,"] = ",RR[i],"\n") Z1<-matrix(0,M,(p[m,1]+k)) v11<-matrix(0,M,(p[m,1])) v21<-matrix(0,M,k) for(s in 1:(p[m,1])) v11[,s]<-x^(s) v11[,(p[m,1])]<-x^(p[m,1]) for(j in 1:k) v21[,j]<-trun(x,RR[j],p[m,1]) Z1[,1:(p[m,1]+k)]<-cbind(v11,v21) Z2<-matrix(0,M,(p[m,2]+k)) v12<-matrix(0,M,(p[m,2])) v22<-matrix(0,M,k) for(s in 1:(p[m,2])) v12[,s]<-x^(s) v12[,(p[m,2])]<-x^(p[m,2]) for(j in 1:k) v22[,j]<-trun(x,RR[j],p[m,2]) Z2[,1:(p[m,2]+k)]<-cbind(v12,v22) ZZ<-rep(1,M) ZA<-cbind(ZZ,Z1)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
ZB<-cbind(ZZ,Z2) ZC<-matrix(0,M,((p[m,2]+k)+1)) ZD<-matrix(0,M,((p[m,1]+k)+1)) A<-cbind(ZA,ZC) B<-cbind(ZD,ZB) Z<-rbind(A,B) d1<-rep(0,(p[m,1]+1)) d2<-rep(0,(p[m,2]+1)) d3<-rep(1,k) D1<-c(d1,d3) D2<-c(d2,d3) d0<-c(D1,D2) D<-diag(d0) betatopiii<-mp(t(Z)%*%Z+(M*boptmax*D))%*%t(Z)%*%y ytopiii<-Z%*%betatopiii errorfix<-y-ytopiii ee<-cbind(ytopiii,errorfix) cat("\nPenduga Parameter : ") cat("\n") for(m in 1:((p[pmax,1]+kmax)+1)) cat("\nNilai Phi-topi [",m,"] Model 1=
",format(betatopiii[m])) for(m in ((p[pmax,1]+kmax)+2):(((p[pmax,1]+kmax)+1)+
((p[pmax,2]+kmax)+1))) cat("\nNilai Phi-topi [",m-((p[pmax,1]+kmax)+1),"]
Model 2= ",format(betatopiii[m])) cat("\n\n\tHasil Estimasi:\n\tytopi\t\terror\n") print(ee) cat("\n") MSE<-(t(y-ytopiii)%*%(y-ytopiii))/length(y) cat("MSE=",MSE,"\n") JKT<-t(y-(mean(y)))%*%(y-(mean(y))) JKG<-t(y-ytopiii)%*%(y-ytopiii) RK<-1-(JKG/JKT) cat("R-square=",RK,"\n") ERfix<-matrix(0,M,2) ERfix[,1]<-errorfix[1:M] ERfix[,2]<-errorfix[(M+1):(2*M)] break else cat("lanjut tambah jumlah knot\n\n") #tutup repeat k spline(data)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 5. Program Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (Tanpa Pembobot)
mp<-function(x,eps=1e-006) x<-as.matrix(x) xsvd<-svd(x) diago<-xsvd$d[xsvd$d>eps] if(length(diago)==1) xplus<-as.matrix(xsvd$v[,1])%*%t(as.matrix(xsvd$u[,1])/diago) else xplus<-xsvd$v[,1:length(diago)]%*%diag(1/diago)%*%t(xsvd$u[,1:length(diago)]) return(xplus) trun<-function(prediktor,knot,orde) prediktor[prediktor<knot]<-knot b<-(prediktor-knot)^orde return(b) data<-read.table("E:/Data Skripsi Insample.txt", header=TRUE) spline<-function(data)#tanpa pembobot para<-as.numeric(readline("Input Banyak Prediktor Parametrik : ")) bb<-as.numeric(readline("Input Batas Bawah Lamda : ")) ba<-as.numeric(readline("Input Batas Atas Lamda : ")) h<-as.numeric(readline("Input Increment : ")) kolom=length(data[1,]) q=ncol(data)-para-2 k<-rep(0,q) orde1<-rep(0,q) orde2<-rep(0,q) z<-rep(0,q) lr<-rep(0,q) for(i in 1:q) cat("\nInput Orde Respon 1 Prediktor ke-",i," = ") orde1[i]<-as.numeric(readline(" ")) cat("Input Orde Respon 2 Prediktor ke-",i," = ") orde2[i]<-as.numeric(readline(" ")) cat("Input Banyak Knot Prediktor ke-",i," = ") k[i]<-as.numeric(readline(" ")) lr[i]<-k[i]+2 z[i]<-k[i]+1
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
dataurut<-matrix(0,M,q) t<-matrix(0,M,q) RR<-matrix(0,max(k),q) prediktor=data[,(para+3):kolom] dataA=as.matrix(prediktor) p<-cbind(orde1,orde2) r<-matrix(0,max(lr),q) R<-matrix(0,(max(lr)-1),q) for(i in 1:q) dataurut[,i]<-sort(dataA[,i]) t[,i]<-dataurut[,i] if(lr[i]<max(lr)) r[1:lr[i],i]<-quantile(t[,i],seq(0,1,by=1/z[i])) r[(lr[i]+1):max(lr),i]<-0 else r[,i]<-quantile(t[,i],seq(0,1,by=1/z[i])) R[,i]<-r[-lr[i],i] RR[,i]<-R[-1,i] for (i in 1:q) cat("\nPrediktor ke-",i) cat("\nORDE respon 1 :",p[i,1],"; ORDE respon 2 :",p[i,2],"\n") for(j in 1:k[i]) cat("titik knot [",j,"] = ",RR[j,i],"\n") y<-c(data[,1],data[,2]) vl<-seq(bb,ba,h) nvl<-length(vl) GCV<-rep(0,nvl) MSE<-rep(0,nvl) for (r in 1:nvl) Z1<-matrix(0,M,(sum(p[,1])+sum(k))) for(u in 1:q) v11<-matrix(0,M,(p[u,1])) v21<-matrix(0,M,(k[u])) for(s in 1:p[u,1]) v11[,s]<-dataA[,u]^(s) v11[,(p[u,1])]<-dataA[,u]^(p[u,1]) for(j in 1:k[u]) v21[,j]<-trun(dataA[,u],RR[j,u],p[u,1])
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
if(u==1) Z1[,1:(p[u,1]+k[u])]<-cbind(v11,v21) else Z1[,((sum(p[1:(u-1),1])+sum(k[1:(u-1)])+1):(sum(p[1:(u),1])+sum(k[1:(u)])))]<-cbind(v11,v21) Z2<-matrix(0,M,(sum(p[,2])+sum(k))) for(u in 1:q) v12<-matrix(0,M,(p[u,2])) v22<-matrix(0,M,(k[u])) for(s in 1:p[u,2]) v12[,s]<-dataA[,u]^(s) v12[,(p[u,2])]<-dataA[,u]^(p[u,2]) for(j in 1:k[u]) v22[,j]<-trun(dataA[,u],RR[j,u],p[u,2]) if(u==1) Z2[,1:(p[u,2]+k[u])]<-cbind(v12,v22) else Z2[,((sum(p[1:(u-1),2])+sum(k[1:(u-1)])+1):(sum(p[1:(u),2])+sum(k[1:(u)])))]<-cbind(v12,v22) ZZ<-rep(1,M) ZA<-cbind(ZZ,Z1) ZB<-cbind(ZZ,Z2) ZC<-matrix(0,M,((sum(p[,2])+sum(k))+1)) ZD<-matrix(0,M,((sum(p[,1])+sum(k))+1)) A<-cbind(ZA,ZC) B<-cbind(ZD,ZB) Z<-rbind(A,B) D1<-rep(0,(sum(p[,1])+sum(k))) D2<-rep(0,(sum(p[,2])+sum(k))) for(i in 1:q) d1<-rep(0,(p[i,1])) for(j in 1:(p[i,1])) d1[j]<-0 d2<-rep(0,(p[i,2])) for(j in 1:(p[i,2])) d2[j]<-0
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
d3<-rep(0,(k[i])) for(j in 1:k[i]) d3[j]<-1 if(i==1) D1[1:((p[i,1])+(k[i]))]<-c(d1,d3) D2[1:((p[i,2])+(k[i]))]<-c(d2,d3) else D1[(sum(p[1:(i-1),1])+sum(k[1:i-1])+1):(sum(p[1:i,1])+sum(k[1:i]))]<-c(d1,d3) D2[(sum(p[1:(i-1),2])+sum(k[1:i-1])+1):(sum(p[1:i,2])+sum(k[1:i]))]<-c(d2,d3) DD1<-c(0,D1) DD2<-c(0,D2) d0<-c(DD1,DD2) D<-diag(d0) c1<-matrix(0,M,1+para) for(i in 1:(para+1)) c1[,i]<-1 c1[,1+para]<-data[,2+para] c2<-matrix(0,M,1+para) for(i in 1:(para+1)) c2[,i]<-1 c2[,1+para]<-data[,2+para] c3<-matrix(0,M,1+para) c4<-matrix(0,M,1+para) X1<-cbind(c1,c3) X2<-cbind(c4,c2) X<-rbind(X1,X2) I<-diag(1,M+M) A<-matrix(0,M+M,M+M) A<-Z%*%mp(t(Z)%*%Z+(n*vl[r]*D))%*%t(Z) Apar<-X%*%mp(t(X)%*%t(I-A)%*%(I-A)%*%X)%*%t(X)%*%t(I-A)%*%(I-A) Anon<-A%*%(I-Apar) Asemi<-Apar+Anon ytopi<-Asemi%*%y MSE[r]<-(t(y-ytopi)%*%(y-ytopi))/n GCV[r]<-MSE[r]/(1-((1/n)*sum(diag(1-A))))^2 mlamda<-cbind(vl,GCV,MSE) GCVmin<-min(GCV) win.graph() plot(vl,GCV,type="l",xlim=c(min(vl),max(vl)),ylim=c(min(GCV),max(GCV)),xlab="Lambda",ylab="GCV")
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
title("Plot Lambda Terhadap GCV") bopt<-mlamda[mlamda[,2]==GCVmin,1] MSEE<-mlamda[mlamda[,2]==GCVmin,3] cat("\nNilai MSE = ",MSEE,"\n") cat("Nilai GCV minimum = ",GCVmin,"\n") cat("Nilai Lambda Optimal saat GCV Minimum = ",bopt,"\n") I<-diag(1,M+M) AA<-matrix(0,M+M,M+M) AA<-Z%*%mp(t(Z)%*%Z+(n*bopt*D))%*%t(Z) AApar<-X%*%mp(t(X)%*%t(I-AA)%*%(I-AA)%*%X)%*%t(X)%*%t(I-AA)%*%(I-AA) AAnon<-AA%*%(I-AApar) AAsemi<-AApar+AAnon teta<-mp(X)%*%AApar%*%y ystar<-y-(X%*%teta) phi<-mp(t(Z)%*%Z+(n*bopt*D))%*%t(Z)%*%ystar cat("\nPenduga Parameter : ") for(m in 1:(para+1)) cat("\nNilai Teta-topi[",m-1,"] Model Respon 1= ",format(teta[m])) for(m in (para+2):(2*(para+1))) cat("\nNilai Teta-topi[",m-1-(para+1),"] Model Respon 2= ",format(teta[m])) cat("\n") for(m in 1:((sum(p[,1])+sum(k))+1)) cat("\nNilai Phi-topi [",m-1,"] Model Respon 1= ",format(phi[m])) for(m in ((sum(p[,1])+sum(k))+2):(sum(p)+(2*sum(k))+2)) cat("\nNilai Phi-topi [",m-1-((sum(p[,1])+sum(k))+1),"] Model Respon 2= ",format(phi[m])) cat("\n\n\tHasil Estimasi:\n\tytopi\t\terror\n") ytopii<-AAsemi%*%y error<-y-ytopii ee<-cbind(ytopii,error) print(ee) cat("\n") MSE<-(t(y-ytopii)%*%(y-ytopii))/length(y) cat("MSE=",MSE,"\n") JKT<-t(y-(mean(y)))%*%(y-(mean(y))) JKG<-t(y-ytopii)%*%(y-ytopii) RK<-1-(JKG/JKT) cat("R-square=",RK,"\n") ER<-matrix(0,M,2) ER[,1]<-error[1:M] ER[,2]<-error[(M+1):(2*M)] cat("\nNilai error untuk respon 1 dan 2 adalah \n\n") print(ER)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 6. Program Uji Glesjer dan Penentuan Matrik Pembobot
glesjer<-function(ERfix) cat("\n\nUJI GLESJER\n") cat("==============================================") alfa<-as.numeric(readline("\n\nInput nilai alfa : ")) Asemi=as.matrix(Asemi) error=abs(error) error=as.matrix(error) errorbar=mean(error) n=nrow(error) yhat=Asemi%*%error j=nrow(data)-2 error1=error-yhat SSE=sum((error-yhat)^2) SSR=sum((yhat-errorbar)^2) SST=SSR+SSE MSE=SSE/(n-j) MSR=SSR/(j-1) cat("hipotesis:\n") cat("H0 : var(1)=var(2)=...=var(n)= var\nKasus
Homoskedastisitas\n") cat("H1 : minimal ada satu var(i)!= var\nKasus
Heteroskedastisitas\n") Fhit=MSR/MSE pvalue=pf(Fhit,(j-1),(n-j),lower.tail=FALSE) cat("\nAnalysis of Variance","\n") cat("=============================================================
=","\n") cat("Sumber df SS MS Fhit
pvalue","\n") cat("Regresi ",j-1," ",SSR," ",MSR,"",Fhit,"",pvalue,"\n") cat("Error ",n-j," ",SSE,"",MSE,"\n") cat("Total ",n-1," ",SST,"\n") cat("=============================================================
=","\n") cat("\nkesimpulan:") if (pvalue<=alfa) cat("\nTolak Ho\nKasus Heteroskedastisitas","\n") cat("","\n") c<-rep(0,(M+1)) vr1<-rep(0,M) vr2<-rep(0,M) cv<-rep(0,M) vr<-var(ER) vr1<-rep(vr[1,1],M) vr2<-rep(vr[2,2],M) cv<-rep(vr[1,2],M) A<-diag(vr1,M) B<-diag(cv,M) C<-B D<-diag(vr2,M) AA<-cbind(A,B)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BB<-cbind(C,D) U<-rbind(AA,BB) W<-solve(U) else cat("\nTerima Ho\nKasus Homoskedastisitas","\n") cat("","\n") vr1<-rep(0,M) vr2<-rep(0,M) cv<-rep(0,M) vr<-var(ER) vr1<-rep(vr[1,1],M) vr2<-rep(vr[2,2],M) cv<-rep(vr[1,2],M) A<-diag(vr1,M) B<-diag(cv,M) C<-B D<-diag(vr2,M) AA<-cbind(A,B) BB<-cbind(C,D) U<-rbind(AA,BB) W<-solve(U) print(W)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 7. Program Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (dengan Pembobot)
mp<-function(x,eps=1e-006) x<-as.matrix(x) xsvd<-svd(x) diago<-xsvd$d[xsvd$d>eps] if(length(diago)==1) xplus<-as.matrix(xsvd$v[,1])%*%t(as.matrix(xsvd$u[,1])/diago) else xplus<-xsvd$v[,1:length(diago)]%*%diag(1/diago)%*%t(xsvd$u[,1:length(diago)]) return(xplus) trun<-function(prediktor,knot,orde) prediktor[prediktor<knot]<-knot b<-(prediktor-knot)^orde return(b) data<-read.table("E:/Data Skripsi Insample.txt", header=TRUE) spline<-function(data)#dengan pembobot para<-as.numeric(readline("Input Banyak Prediktor Parametrik : ")) bb<-as.numeric(readline("Input Batas Bawah Lamda : ")) ba<-as.numeric(readline("Input Batas Atas Lamda : ")) h<-as.numeric(readline("Input Increment : ")) kolom=length(data[1,]) q=ncol(data)-para-2 k<-rep(0,q) orde1<-rep(0,q) orde2<-rep(0,q) z<-rep(0,q) lr<-rep(0,q) for(i in 1:q) cat("\nInput Orde Respon 1 Prediktor ke-",i," = ") orde1[i]<-as.numeric(readline(" ")) cat("Input Orde Respon 2 Prediktor ke-",i," = ") orde2[i]<-as.numeric(readline(" ")) cat("Input Banyak Knot Prediktor ke-",i," = ") k[i]<-as.numeric(readline(" ")) lr[i]<-k[i]+2 z[i]<-k[i]+1
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
dataurut<-matrix(0,M,q) t<-matrix(0,M,q) RR<-matrix(0,max(k),q) prediktor=data[,(para+3):kolom] dataA=as.matrix(prediktor) p<-cbind(orde1,orde2) r<-matrix(0,max(lr),q) R<-matrix(0,(max(lr)-1),q) for(i in 1:q) dataurut[,i]<-sort(dataA[,i]) t[,i]<-dataurut[,i] if(lr[i]<max(lr)) r[1:lr[i],i]<-quantile(t[,i],seq(0,1,by=1/z[i])) r[(lr[i]+1):max(lr),i]<-0 else r[,i]<-quantile(t[,i],seq(0,1,by=1/z[i])) R[,i]<-r[-lr[i],i] RR[,i]<-R[-1,i] for (i in 1:q) cat("\nPrediktor ke-",i) cat("\nORDE respon 1 :",p[i,1],"; ORDE respon 2 :",p[i,2],"\n") for(j in 1:k[i]) cat("titik knot [",j,"] = ",RR[j,i],"\n") y<-c(data[,1],data[,2]) vl<-seq(bb,ba,h) nvl<-length(vl) GCV<-rep(0,nvl) MSE<-rep(0,nvl) for (r in 1:nvl) Z1<-matrix(0,M,(sum(p[,1])+sum(k))) for(u in 1:q) v11<-matrix(0,M,(p[u,1])) v21<-matrix(0,M,(k[u])) for(s in 1:p[u,1]) v11[,s]<-dataA[,u]^(s) v11[,(p[u,1])]<-dataA[,u]^(p[u,1]) for(j in 1:k[u]) v21[,j]<-trun(dataA[,u],RR[j,u],p[u,1])
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
if(u==1) Z1[,1:(p[u,1]+k[u])]<-cbind(v11,v21) else Z1[,((sum(p[1:(u-1),1])+sum(k[1:(u-1)])+1):(sum(p[1:(u),1])+sum(k[1:(u)])))]<-cbind(v11,v21) Z2<-matrix(0,M,(sum(p[,2])+sum(k))) for(u in 1:q) v12<-matrix(0,M,(p[u,2])) v22<-matrix(0,M,(k[u])) for(s in 1:p[u,2]) v12[,s]<-dataA[,u]^(s) v12[,(p[u,2])]<-dataA[,u]^(p[u,2]) for(j in 1:k[u]) v22[,j]<-trun(dataA[,u],RR[j,u],p[u,2]) if(u==1) Z2[,1:(p[u,2]+k[u])]<-cbind(v12,v22) else Z2[,((sum(p[1:(u-1),2])+sum(k[1:(u-1)])+1):(sum(p[1:(u),2])+sum(k[1:(u)])))]<-cbind(v12,v22) ZZ<-rep(1,M) ZA<-cbind(ZZ,Z1) ZB<-cbind(ZZ,Z2) ZC<-matrix(0,M,((sum(p[,2])+sum(k))+1)) ZD<-matrix(0,M,((sum(p[,1])+sum(k))+1)) A<-cbind(ZA,ZC) B<-cbind(ZD,ZB) Z<-rbind(A,B) D1<-rep(0,(sum(p[,1])+sum(k))) D2<-rep(0,(sum(p[,2])+sum(k))) for(i in 1:q) d1<-rep(0,(p[i,1])) for(j in 1:(p[i,1])) d1[j]<-0 d2<-rep(0,(p[i,2])) for(j in 1:(p[i,2])) d2[j]<-0
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
d3<-rep(0,(k[i])) for(j in 1:k[i]) d3[j]<-1 if(i==1) D1[1:((p[i,1])+(k[i]))]<-c(d1,d3) D2[1:((p[i,2])+(k[i]))]<-c(d2,d3) else D1[(sum(p[1:(i-1),1])+sum(k[1:i-1])+1):(sum(p[1:i,1])+sum(k[1:i]))]<-c(d1,d3) D2[(sum(p[1:(i-1),2])+sum(k[1:i-1])+1):(sum(p[1:i,2])+sum(k[1:i]))]<-c(d2,d3) DD1<-c(0,D1) DD2<-c(0,D2) d0<-c(DD1,DD2) D<-diag(d0) c1<-matrix(0,M,1+para) for(i in 1:(para+1)) c1[,i]<-1 c1[,1+para]<-data[,2+para] c2<-matrix(0,M,1+para) for(i in 1:(para+1)) c2[,i]<-1 c2[,1+para]<-data[,2+para] c3<-matrix(0,M,1+para) c4<-matrix(0,M,1+para) X1<-cbind(c1,c3) X2<-cbind(c4,c2) X<-rbind(X1,X2) I<-diag(1,M+M) A<-matrix(0,M+M,M+M) A<-Z%*%mp(t(Z)%*%W%*%Z+(n*vl[r]*D))%*%t(Z)%*%W Apar<-X%*%mp(t(X)%*%t(I-A)%*%(I-A)%*%X)%*%t(X)%*%t(I-A)%*%(I-A) Anon<-A%*%(I-Apar) Asemi<-Apar+Anon ytopi<-Asemi%*%y MSE[r]<-(t(y-ytopi)%*%(y-ytopi))/n GCV[r]<-MSE[r]/(1-((1/n)*sum(diag(1-A))))^2 mlamda<-cbind(vl,GCV,MSE) GCVmin<-min(GCV) win.graph() plot(vl,GCV,type="l",xlim=c(min(vl),max(vl)),ylim=c(min(GCV),max(GCV)),xlab="Lambda",ylab="GCV")
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
title("Plot Lambda Terhadap GCV") bopt<-mlamda[mlamda[,2]==GCVmin,1] MSEE<-mlamda[mlamda[,2]==GCVmin,3] cat("\nNilai MSE = ",MSEE,"\n") cat("Nilai GCV minimum = ",GCVmin,"\n") cat("Nilai Lambda Optimal saat GCV Minimum = ",bopt,"\n") I<-diag(1,M+M) AA<-matrix(0,M+M,M+M) AA<-Z%*%mp(t(Z)%*%W%*%Z+(n*bopt*D))%*%t(Z)%*%W AApar<-X%*%mp(t(X)%*%t(I-AA)%*%(I-AA)%*%X)%*%t(X)%*%t(I-AA)%*%(I-AA) AAnon<-AA%*%(I-AApar) AAsemi<-AApar+AAnon teta<-mp(X)%*%AApar%*%y ystar<-y-(X%*%teta) phi<-mp(t(Z)%*%W%*%Z+(n*bopt*D))%*%t(Z)%*%W%*%ystar cat("\nPenduga Parameter : ") for(m in 1:(para+1)) cat("\nNilai Teta-topi[",m-1,"] Model Respon 1= ",format(teta[m])) for(m in (para+2):(2*(para+1))) cat("\nNilai Teta-topi[",m-1-(para+1),"] Model Respon 2= ",format(teta[m])) cat("\n") for(m in 1:((sum(p[,1])+sum(k))+1)) cat("\nNilai Phi-topi [",m-1,"] Model Respon 1= ",format(phi[m])) for(m in ((sum(p[,1])+sum(k))+2):(sum(p)+(2*sum(k))+2)) cat("\nNilai Phi-topi [",m-1-((sum(p[,1])+sum(k))+1),"] Model Respon 2= ",format(phi[m])) cat("\n\n\tHasil Estimasi:\n\tytopi\t\terror\n") ytopii<-AAsemi%*%y error<-y-ytopii ee<-cbind(ytopii,error) print(ee) cat("\n") MSE<-(t(y-ytopii)%*%(y-ytopii))/length(y) cat("MSE=",MSE,"\n") JKT<-t(y-(mean(y)))%*%(y-(mean(y))) JKG<-t(y-ytopii)%*%(y-ytopii) RK<-1-(JKG/JKT) cat("R-square=",RK,"\n") Yt<-matrix(0,M,2) Yt[,1]<-ytopii[1:M] Yt[,2]<-ytopii[(M+1):(2*M)] ER<-matrix(0,M,2) ER[,1]<-error[1:M] ER[,2]<-error[(M+1):(2*M)]
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
urut<-c(1:M) datagab<-cbind(Yt,data) for(r in 1:2) win.graph() plot(urut,data[,r],xlim=c(min(urut),max(urut)),ylim=c(min(c(data[,r],Yt[,r])),max(c(data[,r],Yt[,r]))),xlab="Unit Observasi",ylab="Respon") par(new=T) plot(urut,Yt[,r],type="l",xlim=c(min(urut),max(urut)),ylim=c(min(c(data[,r],Yt[,r])),max(c(data[,r],Yt[,r]))),xlab="Unit Observasi",ylab="Respon") title("Plot Estimasi",sub=paste("\n*Plot Estimasi untuk Respon ke-",r),cex.sub = 0.75, font.sub = 4, col.sub = "red")
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 8. Program Estimasi Outsample Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline
prediksi<-function() prediktorr<-dataset[,(3+para):length(dataset[1,])] dataA=as.matrix(prediktorr) M<-length(dataset[,1]) Z1<-matrix(0,M,(sum(p[,1])+sum(k))) for(u in 1:q) v11<-matrix(0,M,(p[u,1])) v21<-matrix(0,M,(k[u])) for(s in 1:p[u,1]) v11[,s]<-dataA[,u]^(s) v11[,(p[u,1])]<-dataA[,u]^(p[u,1]) for(j in 1:k[u]) v21[,j]<-trun(dataA[,u],RR[j,u],p[u,1]) if(u==1) Z1[,1:(p[u,1]+k[u])]<-cbind(v11,v21) else Z1[,((sum(p[1:(u-1),1])+sum(k[1:(u-1)])+1):(sum(p[1:(u),1])+sum(k[1:(u)])))]<-cbind(v11,v21) Z2<-matrix(0,M,(sum(p[,2])+sum(k))) for(u in 1:q) v12<-matrix(0,M,(p[u,2])) v22<-matrix(0,M,(k[u])) for(s in 1:p[u,2]) v12[,s]<-dataA[,u]^(s) v12[,(p[u,2])]<-dataA[,u]^(p[u,2]) for(j in 1:k[u]) v22[,j]<-trun(dataA[,u],RR[j,u],p[u,2]) if(u==1) Z2[,1:(p[u,2]+k[u])]<-cbind(v12,v22) else Z2[,((sum(p[1:(u-1),2])+sum(k[1:(u-1)])+1):(sum(p[1:(u),2])+sum(k[1:(u)])))]<-cbind(v12,v22)
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
ZZ<-rep(1,M) ZA<-cbind(ZZ,Z1) ZB<-cbind(ZZ,Z2) ZC<-matrix(0,M,((sum(p[,2])+sum(k))+1)) ZD<-matrix(0,M,((sum(p[,1])+sum(k))+1)) A<-cbind(ZA,ZC) B<-cbind(ZD,ZB) Z<-rbind(A,B) c1<-matrix(0,M,1+para) for(i in 1:(para+1)) c1[,i]<-1 c1[,1+para]<-dataset[,2+para] c2<-matrix(0,M,1+para) for(i in 1:(para+1)) c2[,i]<-1 c2[,1+para]<-dataset[,2+para] c3<-matrix(0,M,1+para) c4<-matrix(0,M,1+para) X1<-cbind(c1,c3) X2<-cbind(c4,c2) X<-rbind(X1,X2) ypred<-(X%*%teta)+(Z%*%phi) cat("\n") y<-c(dataset[,1],dataset[,2]) cat("\tHasil Estimasi:\n\tytopi\t\terror\n") error<-y-ypred ee<-cbind(ypred,error) print(ee) cat("\n") MSE<-(t(y-ypred)%*%(y-ypred))/length(y) cat("\nMSE=",MSE,"\n") JKT<-t(y-(mean(y)))%*%(y-(mean(y))) JKG<-t(y-ypred)%*%(y-ypred) RK<-1-(JKG/JKT) cat("R-square=",RK,"\n") y1<-ypred[1:M] y2<-ypred[(M+1):(2*M)] Yt<-cbind(y1,y2) urut<-c(1:M) datagab<-cbind(Yt,dataset) for(r in 1:2) win.graph() plot(urut,dataset[,r],xlim=c(min(urut),max(urut)),ylim=c(min(c(dataset[,r],Yt[,r])),max(c(dataset[,r],Yt[,r]))),xlab="Unit Observasi",ylab="Respon") par(new=T) plot(urut,Yt[,r],type="l",xlim=c(min(urut),max(urut)),ylim=c(min(c(dataset[,r],Yt[,r])),max(c(dataset[,r],Yt[,r]))),xlab="Unit Observasi",ylab="Respon")
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
title("Plot Estimasi",sub=paste("\n*Plot Estimasi untuk Respon ke-",r),cex.sub = 0.75, font.sub = 4, col.sub = "red") tanya<-as.numeric(readline("\nData Outsample (1=Ya/2=Tidak)? ")) if(tanya==1) prediksi() else if(tanya==2) cat("Thank You") else cat("Inputan Salah")
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 9. Output Uji Korelasi Pearson
>korelasi(data) UJI KORELASI PEARSON Y1 dan Y2 ============================================== Input nilai alfa : 0.05 koefisien korelasi: 0.6308517 hipotesis: H0 : rho = 0 H1 : rho != 0 =================================================== nilai P-value = 0 =================================================== kesimpulan: Tolak Ho ada korelasi >korelasi(data) UJI KORELASI PEARSON Y1 dan LDL ============================================== Input nilai alfa : 0.05 koefisien korelasi: 0.3925691 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.0048 ========================================== kesimpulan: Tolak Ho ada korelasi >korelasi(data) UJI KORELASI PEARSON Y2 dan LDL ============================================== Input nilai alfa : 0.05 koefisien korelasi: 0.4633581 hipotesis: H0 : rho = 0 H1 : rho != 0
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
======================================== nilai P-value = 7e-04 ========================================== kesimpulan: Tolak Ho ada korelasi >korelasi(data) UJI KORELASI PEARSON Y1 dan Berat Badan ============================================== Input nilai alfa : 0.05 koefisien korelasi: -0.2725271 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.0555 ========================================== kesimpulan: Terima Ho tidak ada korelasi >korelasi(data) UJI KORELASI PEARSON Y2 dan Berat Badan ============================================== Input nilai alfa : 0.05 koefisien korelasi: -0.01898711 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.8959 ========================================== kesimpulan: Terima Ho tidak ada korelasi >korelasi(data) UJI KORELASI PEARSON Y1 dan Umur ==============================================
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Input nilai alfa : 0.05 koefisien korelasi: 0.1634208 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.2568 ========================================== kesimpulan: Terima Ho tidak ada korelasi >korelasi(data) UJI KORELASI PEARSON Y2 dan Umur ============================================== Input nilai alfa : 0.05 koefisien korelasi: 0.1157343 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.4235 ========================================== kesimpulan: Terima Ho tidak ada korelasi >korelasi(data) UJI KORELASI PEARSON Y1 dan HDL ============================================== Input nilai alfa : 0.05 koefisien korelasi: -0.3013103 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.0335 ========================================== kesimpulan: Tolak Ho
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
ada korelasi >korelasi(data) UJI KORELASI PEARSON Y2 dan HDL ============================================== Input nilai alfa : 0.05 koefisien korelasi: -0.1274857 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.3776 ========================================== kesimpulan: Terima Ho tidak ada korelasi
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 10. Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Prediktor Ke-1
>spline(data1) Input Orde Maksimum : 2 Input Batas Bawah Lamda : 1 Input Batas Atas Lamda : 1000 Input Increment : 1 Jumlah Knot = 1 titik knots[ 1 ] = 60 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 578.7937 Nilai GCV minimum = 693.4911 Nilai Lambda Optimal saat GCV Minimum = 100 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 580.5636 Nilai GCV minimum = 738.7294 Nilai Lambda Optimal saat GCV Minimum = 1000 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 567.2865 Nilai GCV minimum = 721.8352 Nilai Lambda Optimal saat GCV Minimum = 1000 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 561.2481 Nilai GCV minimum = 769.9759 Nilai Lambda Optimal saat GCV Minimum = 1000 lanjut tambah jumlah knot Jumlah Knot = 2 titik knots[ 1 ] = 55.33333 titik knots[ 2 ] = 65 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 566.2247 Nilai GCV minimum = 689.9469 Nilai Lambda Optimal saat GCV Minimum = 76 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 578.8064 Nilai GCV minimum = 745.6781 Nilai Lambda Optimal saat GCV Minimum = 1000 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 526.2484 Nilai GCV minimum = 707.6577 Nilai Lambda Optimal saat GCV Minimum = 73 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 519.9925 Nilai GCV minimum = 772.0771
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Nilai Lambda Optimal saat GCV Minimum = 84 lanjut tambah jumlah knot Jumlah Knot = 3 titik knots[ 1 ] = 50.5 titik knots[ 2 ] = 60 titik knots[ 3 ] = 70 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 560.6594 Nilai GCV minimum = 687.0901 Nilai Lambda Optimal saat GCV Minimum = 95 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 576.2664 Nilai GCV minimum = 749.1611 Nilai Lambda Optimal saat GCV Minimum = 1000 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 522.3729 Nilai GCV minimum = 701.1939 Nilai Lambda Optimal saat GCV Minimum = 179 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 520.5138 Nilai GCV minimum = 769.1391 Nilai Lambda Optimal saat GCV Minimum = 284 lanjut tambah jumlah knot Jumlah Knot = 4 titik knots[ 1 ] = 50 titik knots[ 2 ] = 57.6 titik knots[ 3 ] = 63.8 titik knots[ 4 ] = 73.4 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 563.5096 Nilai GCV minimum = 688.3006 Nilai Lambda Optimal saat GCV Minimum = 158 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 573.1 Nilai GCV minimum = 752.1939 Nilai Lambda Optimal saat GCV Minimum = 1000 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 517.9076 Nilai GCV minimum = 695.1142 Nilai Lambda Optimal saat GCV Minimum = 343 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 516.8079 Nilai GCV minimum = 763.7129 Nilai Lambda Optimal saat GCV Minimum = 608
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Optimal Nilai GCV minimum adalah 687.0901 pada nilai lambda optimal = 95 saat orde respon 1 : 1 dan orde respon 2 : 1 Jumlah Knot = 3 dengan titik knots[ 1 ] = 50.5 titik knots[ 2 ] = 60 titik knots[ 3 ] = 70
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 11. Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Prediktor Ke-2
> spline(data2) Input Orde Maksimum : 2 Input Batas Bawah Lamda : 1 Input Batas Atas Lamda : 1000 Input Increment : 1 Jumlah Knot = 1 titik knots[ 1 ] = 60.5 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 443.5291 Nilai GCV minimum = 566.9609 Nilai Lambda Optimal saat GCV Minimum = 2 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 437.9426 Nilai GCV minimum = 590.4973 Nilai Lambda Optimal saat GCV Minimum = 1 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 427.6487 Nilai GCV minimum = 569.2413 Nilai Lambda Optimal saat GCV Minimum = 8 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 420.9496 Nilai GCV minimum = 582.3961 Nilai Lambda Optimal saat GCV Minimum = 1000 lanjut tambah jumlah knot Jumlah Knot = 2 titik knots[ 1 ] = 55.33333 titik knots[ 2 ] = 69 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 432.179 Nilai GCV minimum = 569.1749 Nilai Lambda Optimal saat GCV Minimum = 5 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 420.8886 Nilai GCV minimum = 607.8141 Nilai Lambda Optimal saat GCV Minimum = 3 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 409.8595 Nilai GCV minimum = 566.9604 Nilai Lambda Optimal saat GCV Minimum = 25 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 413.6152 Nilai GCV minimum = 586.7442 Nilai Lambda Optimal saat GCV Minimum = 1000
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
lanjut tambah jumlah knot Jumlah Knot = 3 titik knots[ 1 ] = 53 titik knots[ 2 ] = 60.5 titik knots[ 3 ] = 70.75 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 422.3764 Nilai GCV minimum = 557.4237 Nilai Lambda Optimal saat GCV Minimum = 8 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 413.9058 Nilai GCV minimum = 621.3194 Nilai Lambda Optimal saat GCV Minimum = 6 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 422.0043 Nilai GCV minimum = 574.6779 Nilai Lambda Optimal saat GCV Minimum = 125 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 412.4846 Nilai GCV minimum = 592.9409 Nilai Lambda Optimal saat GCV Minimum = 1000 lanjut tambah jumlah knot Jumlah Knot = 4 titik knots[ 1 ] = 49 titik knots[ 2 ] = 57.6 titik knots[ 3 ] = 65.2 titik knots[ 4 ] = 72.2 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 413.686 Nilai GCV minimum = 552.4698 Nilai Lambda Optimal saat GCV Minimum = 9 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 413.5971 Nilai GCV minimum = 635.4309 Nilai Lambda Optimal saat GCV Minimum = 10 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 432.596 Nilai GCV minimum = 577.1338 Nilai Lambda Optimal saat GCV Minimum = 490 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 408.0583 Nilai GCV minimum = 597.1745 Nilai Lambda Optimal saat GCV Minimum = 1000 lanjut tambah jumlah knot Jumlah Knot = 5
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
titik knots[ 1 ] = 48.16667 titik knots[ 2 ] = 55.33333 titik knots[ 3 ] = 60.5 titik knots[ 4 ] = 69 titik knots[ 5 ] = 73 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 411.8717 Nilai GCV minimum = 552.1594 Nilai Lambda Optimal saat GCV Minimum = 11 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 410.5413 Nilai GCV minimum = 633.7329 Nilai Lambda Optimal saat GCV Minimum = 13 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 431.7147 Nilai GCV minimum = 577.0646 Nilai Lambda Optimal saat GCV Minimum = 547 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 406.8293 Nilai GCV minimum = 599.2182 Nilai Lambda Optimal saat GCV Minimum = 1000 lanjut tambah jumlah knot Jumlah Knot = 6 titik knots[ 1 ] = 47 titik knots[ 2 ] = 53 titik knots[ 3 ] = 59 titik knots[ 4 ] = 64 titik knots[ 5 ] = 70 titik knots[ 6 ] = 74 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 413.0288 Nilai GCV minimum = 552.1427 Nilai Lambda Optimal saat GCV Minimum = 14 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 413.2826 Nilai GCV minimum = 638.7481 Nilai Lambda Optimal saat GCV Minimum = 18 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 433.0366 Nilai GCV minimum = 577.3606 Nilai Lambda Optimal saat GCV Minimum = 757 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 405.0305 Nilai GCV minimum = 601.9875 Nilai Lambda Optimal saat GCV Minimum = 1000 lanjut tambah jumlah knot
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Jumlah Knot = 7 titik knots[ 1 ] = 46.125 titik knots[ 2 ] = 53 titik knots[ 3 ] = 57 titik knots[ 4 ] = 60.5 titik knots[ 5 ] = 68.25 titik knots[ 6 ] = 70.75 titik knots[ 7 ] = 74 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 416.7134 Nilai GCV minimum = 555.7744 Nilai Lambda Optimal saat GCV Minimum = 17 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 413.8341 Nilai GCV minimum = 641.0961 Nilai Lambda Optimal saat GCV Minimum = 20 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 432.0171 Nilai GCV minimum = 576.7996 Nilai Lambda Optimal saat GCV Minimum = 827 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 403.4229 Nilai GCV minimum = 603.0142 Nilai Lambda Optimal saat GCV Minimum = 1000 Optimal Nilai GCV minimum adalah 552.1427 pada nilai lambda optimal = 14 saat orde respon 1 : 1 dan orde respon 2 : 1 Jumlah Knot = 6 dengan titik knots[ 1 ] = 47 titik knots[ 2 ] = 53 titik knots[ 3 ] = 59 titik knots[ 4 ] = 64 titik knots[ 5 ] = 70 titik knots[ 6 ] = 74
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 12. Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Prediktor Ke-3
> spline(data3) Input Orde Maksimum : 2 Input Batas Bawah Lamda : 1 Input Batas Atas Lamda : 1000 Input Increment : 1 Jumlah Knot = 1 titik knots[ 1 ] = 41 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 553.9097 Nilai GCV minimum = 676.2053 Nilai Lambda Optimal saat GCV Minimum = 21 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 542.3584 Nilai GCV minimum = 721.1062 Nilai Lambda Optimal saat GCV Minimum = 7 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 540.5427 Nilai GCV minimum = 687.5927 Nilai Lambda Optimal saat GCV Minimum = 1000 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 535.6266 Nilai GCV minimum = 734.7972 Nilai Lambda Optimal saat GCV Minimum = 1000 lanjut tambah jumlah knot Jumlah Knot = 2 titik knots[ 1 ] = 35.33333 titik knots[ 2 ] = 45.66667 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 576.3939 Nilai GCV minimum = 682.3386 Nilai Lambda Optimal saat GCV Minimum = 1000 ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 571.0874 Nilai GCV minimum = 735.0219 Nilai Lambda Optimal saat GCV Minimum = 1000 ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 540.4175 Nilai GCV minimum = 695.548 Nilai Lambda Optimal saat GCV Minimum = 1000 ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 535.1111 Nilai GCV minimum = 751.5255 Nilai Lambda Optimal saat GCV Minimum = 1000
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Optimal Nilai GCV minimum adalah 676.2053 pada nilai lambda optimal = 21 saat orde respon 1 : 1 dan orde respon 2 : 1 Jumlah Knot = 1 dengan titik knots[ 1 ] = 41
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 13. Output Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (Tanpa Pembobot)
>spline(data) Input Banyak Prediktor Parametrik : 1 Input Batas Bawah Lamda : 58 Input Batas Atas Lamda : 60 Input Increment : 0.01 Input Orde Respon 1 Prediktor ke- 1 = 1 Input Orde Respon 2 Prediktor ke- 1 = 1 Input Banyak Knot Prediktor ke- 1 = 3 Input Orde Respon 1 Prediktor ke- 2 = 1 Input Orde Respon 2 Prediktor ke- 2 = 1 Input Banyak Knot Prediktor ke- 2 = 6 Input Orde Respon 1 Prediktor ke- 3 = 1 Input Orde Respon 2 Prediktor ke- 3 = 1 Input Banyak Knot Prediktor ke- 3 = 1 Prediktor ke- 1 ORDE respon 1 : 1 ; ORDE respon 2 : 1 titik knot [ 1 ] = 50.5 titik knot [ 2 ] = 60 titik knot [ 3 ] = 70 Prediktor ke- 2 ORDE respon 1 : 1 ; ORDE respon 2 : 1 titik knot [ 1 ] = 47 titik knot [ 2 ] = 53 titik knot [ 3 ] = 59 titik knot [ 4 ] = 64 titik knot [ 5 ] = 70 titik knot [ 6 ] = 74 Prediktor ke- 3 ORDE respon 1 : 1 ; ORDE respon 2 : 1 titik knot [ 1 ] = 41 Nilai MSE = 314.327 Nilai GCV minimum = 507.0568 Nilai Lambda Optimal saat GCV Minimum = 59.13
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Penduga Parameter : Nilai Teta-topi[ 0 ] Model Respon 1= 4.077194e-14 Nilai Teta-topi[ 1 ] Model Respon 1= 0.2335038 Nilai Teta-topi[ 0 ] Model Respon 2= 1.722404e-14 Nilai Teta-topi[ 1 ] Model Respon 2= 0.1382942 Nilai Phi-topi [ 0 ] Model Respon 1= 123.6454 Nilai Phi-topi [ 1 ] Model Respon 1= -0.1333675 Nilai Phi-topi [ 2 ] Model Respon 1= 0.02374892 Nilai Phi-topi [ 3 ] Model Respon 1= -0.06426027 Nilai Phi-topi [ 4 ] Model Respon 1= -0.1659545 Nilai Phi-topi [ 5 ] Model Respon 1= 0.8451164 Nilai Phi-topi [ 6 ] Model Respon 1= -0.2896941 Nilai Phi-topi [ 7 ] Model Respon 1= -0.3155978 Nilai Phi-topi [ 8 ] Model Respon 1= -0.2792371 Nilai Phi-topi [ 9 ] Model Respon 1= -0.2383332 Nilai Phi-topi [ 10 ] Model Respon 1= -0.1062202 Nilai Phi-topi [ 11 ] Model Respon 1= -0.02320073 Nilai Phi-topi [ 12 ] Model Respon 1= -0.4998152 Nilai Phi-topi [ 13 ] Model Respon 1= -0.06122403 Nilai Phi-topi [ 0 ] Model Respon 2= 66.95633 Nilai Phi-topi [ 1 ] Model Respon 2= -0.00604936 Nilai Phi-topi [ 2 ] Model Respon 2= 0.02940036
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Nilai Phi-topi [ 3 ] Model Respon 2= 0.01383378 Nilai Phi-topi [ 4 ] Model Respon 2= -0.08325971 Nilai Phi-topi [ 5 ] Model Respon 2= 0.3050303 Nilai Phi-topi [ 6 ] Model Respon 2= -0.1245372 Nilai Phi-topi [ 7 ] Model Respon 2= -0.1256992 Nilai Phi-topi [ 8 ] Model Respon 2= -0.1118268 Nilai Phi-topi [ 9 ] Model Respon 2= -0.1055777 Nilai Phi-topi [ 10 ] Model Respon 2= -0.02953651 Nilai Phi-topi [ 11 ] Model Respon 2= -0.009095719 Nilai Phi-topi [ 12 ] Model Respon 2= -0.1401241 Nilai Phi-topi [ 13 ] Model Respon 2= -0.04409283 Hasil Estimasi: ytopi error [,1] [,2] [1,] 171.39510 -1.3950973 [2,] 170.04948 29.9505209 [3,] 162.15130 -2.1513015 [4,] 160.68598 7.3140150 [5,] 158.95452 1.0454754 [6,] 180.86294 19.1370625 [7,] 164.19677 15.8032336 [8,] 187.21913 -27.2191296 [9,] 183.44574 -23.4457405 [10,] 140.63738 -0.6373761 [11,] 112.94829 -2.9482871 [12,] 171.41649 -1.4164858 [13,] 160.03949 -20.0394880 [14,] 149.31180 -9.3118029 [15,] 160.98248 -20.9824773 [16,] 157.06045 -7.0604512 [17,] 166.52283 -6.5228262 [18,] 177.26250 -17.2624960 [19,] 158.79143 -8.7914308 [20,] 168.20688 11.7931242 [21,] 167.03042 22.9695765 [22,] 152.47646 7.5235392 [23,] 165.83299 -15.8329851 [24,] 163.37194 20.6280585 [25,] 167.83731 2.1626917 [26,] 163.78791 -13.7879141 [27,] 174.03059 15.9694079 [28,] 170.59581 -0.5958057 [29,] 170.91399 9.0860100 [30,] 158.08365 -8.0836543 [31,] 183.95036 -3.9503643 [32,] 173.35451 26.6454888 [33,] 177.44332 -17.4433219 [34,] 151.38824 8.6117555
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
[35,] 152.62892 -12.6289228 [36,] 164.05493 25.9450655 [37,] 112.37235 -22.3723461 [38,] 157.19713 -12.1971277 [39,] 159.99282 20.0071839 [40,] 171.14353 -21.1435258 [41,] 146.52534 -6.5253448 [42,] 162.54813 17.4518695 [43,] 166.77981 -6.7798114 [44,] 172.25691 -2.2569078 [45,] 165.66774 4.3322569 [46,] 153.34799 -3.3479920 [47,] 166.30597 -16.3059735 [48,] 170.65795 29.3420477 [49,] 184.87140 15.1285997 [50,] 158.41060 1.5894050 [51,] 97.53352 12.4664792 [52,] 94.24926 -4.2492552 [53,] 93.18013 16.8198685 [54,] 89.16748 -8.1674791 [55,] 88.62799 1.3720105 [56,] 102.19892 7.8010805 [57,] 91.69165 -1.6916494 [58,] 104.53278 -14.5327776 [59,] 103.01364 -3.0136443 [60,] 92.37234 -2.3723445 [61,] 82.98221 -2.9822130 [62,] 93.59477 -3.5947674 [63,] 89.14983 -9.1498315 [64,] 91.68163 -1.6816313 [65,] 91.37846 -11.3784622 [66,] 90.85697 -0.8569686 [67,] 91.97625 -1.9762473 [68,] 98.17138 -18.1713754 [69,] 86.26706 -6.2670587 [70,] 95.47003 14.5299695 [71,] 94.26271 5.7372877 [72,] 89.03032 0.9696845 [73,] 92.83467 -2.8346730 [74,] 91.31788 -4.3178793 [75,] 96.53981 13.4601930 [76,] 93.59386 -13.5938569 [77,] 99.62392 0.3760755 [78,] 95.38249 4.6175143 [79,] 96.93539 13.0646126 [80,] 88.58188 1.4181201 [81,] 100.60244 -0.6024446 [82,] 95.88991 34.1100888 [83,] 98.92362 -8.9236241
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
[84,] 86.01191 3.9880942 [85,] 84.47970 5.5203025 [86,] 90.18389 9.8161095 [87,] 70.05109 -10.0510922 [88,] 89.56456 -9.5645611 [89,] 89.48220 -9.4821971 [90,] 97.14217 2.8578266 [91,] 80.67222 -0.6722170 [92,] 92.95406 7.0459420 [93,] 92.24732 -2.2473197 [94,] 97.31632 2.6836792 [95,] 92.86530 -2.8653039 [96,] 89.38077 0.6192256 [97,] 90.87032 9.1296791 [98,] 99.66149 0.3385070 [99,] 101.56269 -11.5626851 [100,] 91.93879 -1.9387907 MSE= 157.1635 R-square= 0.8990955 Nilai error untuk respon 1 dan 2 adalah [,1] [,2] [1,] -1.3950973 12.4664792 [2,] 29.9505209 -4.2492552 [3,] -2.1513015 16.8198685 [4,] 7.3140150 -8.1674791 [5,] 1.0454754 1.3720105 [6,] 19.1370625 7.8010805 [7,] 15.8032336 -1.6916494 [8,] -27.2191296 -14.5327776 [9,] -23.4457405 -3.0136443 [10,] -0.6373761 -2.3723445 [11,] -2.9482871 -2.9822130 [12,] -1.4164858 -3.5947674 [13,] -20.0394880 -9.1498315 [14,] -9.3118029 -1.6816313 [15,] -20.9824773 -11.3784622 [16,] -7.0604512 -0.8569686 [17,] -6.5228262 -1.9762473 [18,] -17.2624960 -18.1713754 [19,] -8.7914308 -6.2670587 [20,] 11.7931242 14.5299695 [21,] 22.9695765 5.7372877 [22,] 7.5235392 0.9696845 [23,] -15.8329851 -2.8346730 [24,] 20.6280585 -4.3178793 [25,] 2.1626917 13.4601930
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
[26,] -13.7879141 -13.5938569 [27,] 15.9694079 0.3760755 [28,] -0.5958057 4.6175143 [29,] 9.0860100 13.0646126 [30,] -8.0836543 1.4181201 [31,] -3.9503643 -0.6024446 [32,] 26.6454888 34.1100888 [33,] -17.4433219 -8.9236241 [34,] 8.6117555 3.9880942 [35,] -12.6289228 5.5203025 [36,] 25.9450655 9.8161095 [37,] -22.3723461 -10.0510922 [38,] -12.1971277 -9.5645611 [39,] 20.0071839 -9.4821971 [40,] -21.1435258 2.8578266 [41,] -6.5253448 -0.6722170 [42,] 17.4518695 7.0459420 [43,] -6.7798114 -2.2473197 [44,] -2.2569078 2.6836792 [45,] 4.3322569 -2.8653039 [46,] -3.3479920 0.6192256 [47,] -16.3059735 9.1296791 [48,] 29.3420477 0.3385070 [49,] 15.1285997 -11.5626851 [50,] 1.5894050 -1.9387907
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 14. Output Uji Glesjer dan Penentuan Matrik Pembobot
>glesjer(ERfix) UJI GLESJER ============================================== Input nilai alfa : 0.05 hipotesis: H0 : var(1)=var(2)=...=var(n)= var Kasus Homoskedastisitas H1 : minimal ada satu var(i)!= var Kasus Heteroskedastisitas Analysis of Variance ============================================================== Sumber df SS MS Fhit pvalue Regresi 47 1824.077 38.81015 0.4530344 0.9966446 Error 52 4454.691 85.66713 Total 99 6278.768 ============================================================== kesimpulan: Terima Ho Kasus Homoskedastisitas
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 15. Output Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (dengan Pembobot)
>spline(data) Input Banyak Prediktor Parametrik : 1 Input Batas Bawah Lamda : 0.01 Input Batas Atas Lamda : 1 Input Increment : 0.01 Input Orde Respon 1 Prediktor ke- 1 = 1 Input Orde Respon 2 Prediktor ke- 1 = 1 Input Banyak Knot Prediktor ke- 1 = 3 Input Orde Respon 1 Prediktor ke- 2 = 1 Input Orde Respon 2 Prediktor ke- 2 = 1 Input Banyak Knot Prediktor ke- 2 = 6 Input Orde Respon 1 Prediktor ke- 3 = 1 Input Orde Respon 2 Prediktor ke- 3 = 1 Input Banyak Knot Prediktor ke- 3 = 1 Prediktor ke- 1 ORDE respon 1 : 1 ; ORDE respon 2 : 1 titik knot [ 1 ] = 50.5 titik knot [ 2 ] = 60 titik knot [ 3 ] = 70 Prediktor ke- 2 ORDE respon 1 : 1 ; ORDE respon 2 : 1 titik knot [ 1 ] = 47 titik knot [ 2 ] = 53 titik knot [ 3 ] = 59 titik knot [ 4 ] = 64 titik knot [ 5 ] = 70 titik knot [ 6 ] = 74 Prediktor ke- 3 ORDE respon 1 : 1 ; ORDE respon 2 : 1 titik knot [ 1 ] = 41 Nilai MSE = 136.5604 Nilai GCV minimum = 4395.396 Nilai Lambda Optimal saat GCV Minimum = 0.01
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Penduga Parameter : Nilai Teta-topi[ 0 ] Model Respon 1= 4.826632e-15 Nilai Teta-topi[ 1 ] Model Respon 1= 0.1859222 Nilai Teta-topi[ 0 ] Model Respon 2= -1.082576e-14 Nilai Teta-topi[ 1 ] Model Respon 2= 0.1128686 Nilai Phi-topi [ 0 ] Model Respon 1= 98.40135 Nilai Phi-topi [ 1 ] Model Respon 1= -0.3488794 Nilai Phi-topi [ 2 ] Model Respon 1= 0.3148969 Nilai Phi-topi [ 3 ] Model Respon 1= 0.06459672 Nilai Phi-topi [ 4 ] Model Respon 1= -0.4170322 Nilai Phi-topi [ 5 ] Model Respon 1= 1.587642 Nilai Phi-topi [ 6 ] Model Respon 1= -0.7329713 Nilai Phi-topi [ 7 ] Model Respon 1= -0.6876009 Nilai Phi-topi [ 8 ] Model Respon 1= -0.4914828 Nilai Phi-topi [ 9 ] Model Respon 1= -0.5154928 Nilai Phi-topi [ 10 ] Model Respon 1= -0.1333981 Nilai Phi-topi [ 11 ] Model Respon 1= 0.3975025 Nilai Phi-topi [ 12 ] Model Respon 1= -0.2753206 Nilai Phi-topi [ 13 ] Model Respon 1= -0.1951951 Nilai Phi-topi [ 0 ] Model Respon 2= 70.14687 Nilai Phi-topi [ 1 ] Model Respon 2= -0.5042986 Nilai Phi-topi [ 2 ] Model Respon 2= 0.3804148 Nilai Phi-topi [ 3 ] Model Respon 2= 0.6258566 Nilai Phi-topi [ 4 ] Model Respon 2= -0.6035625 Nilai Phi-topi [ 5 ] Model Respon 2= 0.6728882 Nilai Phi-topi [ 6 ] Model Respon 2= -0.5412132
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Nilai Phi-topi [ 7 ] Model Respon 2= -0.004191537 Nilai Phi-topi [ 8 ] Model Respon 2= -0.07171556 Nilai Phi-topi [ 9 ] Model Respon 2= -0.6858784 Nilai Phi-topi [ 10 ] Model Respon 2= 0.2914969 Nilai Phi-topi [ 11 ] Model Respon 2= -0.04826601 Nilai Phi-topi [ 12 ] Model Respon 2= 0.08744745 Nilai Phi-topi [ 13 ] Model Respon 2= -0.2236642 Hasil Estimasi: ytopi error [,1] [,2] [1,] 176.81019 -6.81019071 [2,] 173.29156 26.70843946 [3,] 167.10514 -7.10514262 [4,] 161.16516 6.83484462 [5,] 159.31772 0.68228359 [6,] 182.45732 17.54267931 [7,] 164.21623 15.78376644 [8,] 181.61831 -21.61831236 [9,] 185.37623 -25.37622528 [10,] 139.01922 0.98078050 [11,] 112.48969 -2.48968852 [12,] 165.95328 4.04671714 [13,] 156.25628 -16.25628109 [14,] 147.77075 -7.77074614 [15,] 159.79807 -19.79807002 [16,] 159.37306 -9.37305532 [17,] 169.05231 -9.05231321 [18,] 178.89550 -18.89550461 [19,] 162.76035 -12.76035299 [20,] 171.28923 8.71076722 [21,] 172.41506 17.58494316 [22,] 150.81628 9.18371544 [23,] 165.91729 -15.91729452 [24,] 169.36580 14.63420172 [25,] 166.02498 3.97502308 [26,] 161.54863 -11.54863179 [27,] 176.11422 13.88577664 [28,] 174.50418 -4.50418397 [29,] 173.89896 6.10103989 [30,] 155.57820 -5.57820432 [31,] 184.81709 -4.81709250 [32,] 175.39060 24.60939960 [33,] 179.57331 -19.57330654 [34,] 158.42384 1.57616006 [35,] 151.81878 -11.81878197 [36,] 160.65031 29.34968794 [37,] 95.61215 -5.61215121 [38,] 156.26880 -11.26879735 [39,] 155.72777 24.27222688 [40,] 166.17762 -16.17761716 [41,] 141.88138 -1.88137662 [42,] 164.56715 15.43284784 [43,] 171.47251 -11.47251090 [44,] 173.25625 -3.25624694 [45,] 167.38516 2.61483856
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
[46,] 148.04886 1.95113590 [47,] 159.86748 -9.86747844 [48,] 168.98606 31.01394334 [49,] 184.51064 15.48935849 [50,] 162.36502 -2.36501972 [51,] 101.44532 8.55467661 [52,] 93.94520 -3.94520223 [53,] 93.99287 16.00712702 [54,] 88.14218 -7.14217695 [55,] 89.13667 0.86333031 [56,] 103.64388 6.35611506 [57,] 92.13246 -2.13246281 [58,] 100.61543 -10.61542762 [59,] 104.53760 -4.53760034 [60,] 90.85479 -0.85479278 [61,] 82.70143 -2.70142768 [62,] 89.64154 0.35845693 [63,] 89.07759 -9.07758502 [64,] 92.60265 -2.60265212 [65,] 90.65746 -10.65746299 [66,] 92.37332 -2.37331928 [67,] 92.74211 -2.74210509 [68,] 96.53626 -16.53626242 [69,] 86.02070 -6.02069860 [70,] 97.18255 12.81744661 [71,] 97.34013 2.65986576 [72,] 89.91970 0.08030206 [73,] 91.38906 -1.38905949 [74,] 94.45926 -7.45925615 [75,] 96.16439 13.83560604 [76,] 93.42082 -13.42081720 [77,] 101.78807 -1.78806886 [78,] 97.87939 2.12060786 [79,] 99.20482 10.79517566 [80,] 88.31241 1.68759050 [81,] 101.67332 -1.67331937 [82,] 99.44702 30.55298397 [83,] 98.90937 -8.90937139 [84,] 89.09083 0.90916900 [85,] 84.18911 5.81089141 [86,] 90.69902 9.30097985 [87,] 62.59222 -2.59222201 [88,] 89.31664 -9.31663573 [89,] 87.81080 -7.81080201 [90,] 94.15637 5.84363326 [91,] 78.10268 1.89732284 [92,] 92.66345 7.33654900 [93,] 97.19416 -7.19416104 [94,] 96.34691 3.65308762 [95,] 93.33797 -3.33796851 [96,] 86.28278 3.71721922 [97,] 86.90450 13.09549566 [98,] 97.64233 2.35767219 [99,] 100.61212 -10.61212038 [100,] 93.16833 -3.16832637
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
MSE= 136.5604 R-square= 0.9123234
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 16. Output Estimasi Outsample Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline
Data Outsample (1=Ya/2=Tidak)? 1 Hasil Estimasi: ytopi error [,1] [,2] [1,] 171.28923 8.7107672 [2,] 166.27971 -33.2797148 [3,] 112.48969 -2.4896885 [4,] 162.76035 -12.7603530 [5,] 139.01922 0.9807805 [6,] 165.54565 -25.5456480 [7,] 167.96433 -27.9643305 [8,] 169.36580 14.6342017 [9,] 156.44874 -26.4487446 [10,] 173.25625 -3.2562469 [11,] 141.88138 -1.8813766 [12,] 158.42384 1.5761601 [13,] 171.90124 -31.9012388 [14,] 180.36204 -30.3620399 [15,] 171.32069 -31.3206852 [16,] 97.18255 12.8174466 [17,] 89.22881 -6.2288090 [18,] 82.70143 -2.7014277 [19,] 86.02070 -6.0206986 [20,] 90.85479 -0.8547928 [21,] 93.14477 -3.1447703 [22,] 97.99308 -7.9930758 [23,] 94.45926 -7.4592561 [24,] 91.17399 -21.1739870 [25,] 96.34691 3.6530876 [26,] 78.10268 1.8973228 [27,] 89.09083 0.9091690 [28,] 97.58100 -7.5810037 [29,] 98.62168 -8.6216754 [30,] 93.68222 -3.6822152 MSE= 254.2364 R-square= 0.7670787
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI ESTIMASI MODEL REGRESI... DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA