OPEN JOURNAL SYSTEMS
Journal Help
USER
Username
Password
Remember me
Log In
NOTIFICATIONS
View
Subscribe / Unsubscribe
JOURNAL CONTENT
Search
All
E - J u r n a l
M a t e m a t i k a
E-Jurnal Matematika file:///F:/NILA FILE/e-JURNAL MATEMATIKA/E-JURNAT MATEMA...
1 of 2 7/19/2014 2:15 PM
Search
Browse
By Issue
By Author
By Title
Other Journals
FONT SIZE
INFORMATION
For Readers
For Authors
For Librarians
HOME ABOUT LOG IN REGISTER SEARCH CURRENT ARCHIVES
Home > E-Jurnal Matematika
E-Jurnal Matematika
E-Jurnal Matematika merupakan salah satu jurnal elektronik yang ada di Universitas Udayana, sebagai media komunikasi antar
peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan
matematika dibidang ilmu lainnya. Jurnal ini lahir sebagai salah satu bentuk nyata peran serta jurusan Matematika FMIPA UNUD
guna mendukung percepatan tercapainya target mutu UNUD, selain itu jurnal ini terbit didorong oleh surat edaran Dirjen DIKTI
tentang syarat publikasi karya ilmiah bagi program Sarjana di Jurnal Ilmiah. E-jurnal Matematika juga menerima hasil-hasil
penelitian yang tidak secara langsung berkaitan dengan tugas akhir mahasiswa meliputi penelitian atau artikel yang merupakan
kajian keilmuan.
Editorial Team
Ketua : Desak Putu Eka Nilakusumawati, S.Si., M.Si
Sekretaris : I Made Eka Dwipayana S.Si. M.Si.
Penyunting :
Tjokorda Bagus Oka Ph.D.1.
Komang Dharmawan Ph.D.2.
Drs. GK Gandhiadi MT.3.
Ir. I Komang Gde Sukarsa M.Si.4.
Ir. I Putu Eka Nila Kencana MT5.
ISSN: 2303-1751
E-Jurnal Matematika file:///F:/NILA FILE/e-JURNAL MATEMATIKA/E-JURNAT MATEMA...
2 of 2 7/19/2014 2:15 PM
OPEN JOURNAL SYSTEMS
Journal Help
USER
Username
Password
Remember me
Log In
NOTIFICATIONS
View
Subscribe / Unsubscribe
JOURNAL CONTENT
Search
All
Search
Browse
By Issue
By Author
By Title
Other Journals
FONT SIZE
E - J u r n a l M a t e m a t i k a
Vol 2, No 4 (2013) http://ojs.unud.ac.id/index.php/mtk/issue/view/1048
1 of 3 7/19/2014 2:26 PM
INFORMATION
For Readers
For Authors
For Librarians
HOME ABOUT LOG IN REGISTER SEARCH CURRENT ARCHIVES
Home > Archives > Vol 2, No 4 (2013)
Vol 2, No 4 (2013)
Table of Contents
ArticlesPERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI
MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA
NI WAYAN YULIANI, I KOMANG GDE SUKARSA, I GUSTI AYU MADE SRINADI 1-5
PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM COVARIANCE DETERMINANT
(LMS-MCD) DALAM REGRESI KOMPONEN UTAMA
I PUTU EKA IRAWAN, I KOMANG GDE SUKARSA, NI MADE ASIH 6-10
PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL (ZINB) UNTUK PENDUGAAN
KEMATIAN ANAK BALITA
NI MADE SEKARMINI, I KOMANG GDE SUKARSA, I GUSTI AYU MADE SRINADI 11-16
KOMPARASI ANALISIS GEROMBOL (CLUSTER) DAN BIPLOT DALAM PENGELOMPOKAN PDF
I MADE ANOM ARIAWAN, I PUTU EKA NILA KENCANA, NI LUH PUTU SUCIPTAWATI 17-22
KARAKTERISTIK SEKTOR PERTANIAN DI PROVINSI BALI MENURUT SUBSEKTOR PENYUSUN PDF
PUTU OKA SURYA ARSANA, MADE SUSILAWATI, KETUT JAYANEGARA 23-28
HUBUNGAN PENGARUH PENOLONG KELAHIRAN TERHADAP STATUS KELAHIRAN BAYI
DENGAN KONTROL VARIABEL CONFOUNDING DI KABUPATEN BULELENG (STUDI KASUS:
PUSKESMAS SUKASADA II)
Vol 2, No 4 (2013) http://ojs.unud.ac.id/index.php/mtk/issue/view/1048
2 of 3 7/19/2014 2:26 PM
KADEK NOVIA DWIJAYANTHI, I GUSTI AYU MADE SRINADI, NI LUH PUTU SUCIPTAWATI 29-32
VARIABEL LATEN SEBAGAI MODERATOR DAN MEDIATOR DALAM HUBUNGAN KAUSAL PDF
I KOMANG GEDE ANTARA, I PUTU EKA NILA KENCANA, KETUT JAYANEGARA 33-39
PERUMUSAN PREMI BULANAN ASURANSI KESEHATAN INDIVIDU PERAWATAN RUMAH SAKIT
(ANUITAS HIDUP PEMBAYARAN BULANAN)
AGUSTINA PAULA THERESIA PUTRI LAHALLO, I NYOMAN WIDANA, DESAK PUTU EKA
NILAKUSMAWATI
40-45
PENGKLASIFIKASIAN DEBITUR DENGAN MENGGUNAKAN ALGORITMA GRAHAM SCAN
DALAM PENGAPLIKASIAN CONVEX HULL
AGUS EKA ARIESTA, G.K. GANDHIADI, NI KETUT TARI TASTRAWATI, I PUTU EKA NILA
KENCANA
46-52
ISSN: 2303-1751
Vol 2, No 4 (2013) http://ojs.unud.ac.id/index.php/mtk/issue/view/1048
3 of 3 7/19/2014 2:26 PM
E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 1- 5 ISSN: 2303-1751
1 Mahasiswa Jurusan Matematika FMIPA Universitas Udayana
2,3 Staf Pengajar Jurusan Matematika FMIPA Universitas Udayana 1
PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA
DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN
PADA REGRESI LINEAR BERGANDA
NI WAYAN YULIANI
1, I KOMANG GDE SUKARSA
2,
I GUSTI AYU MADE SRINADI3
1,2,3Jurusan Matematika FMIPA Universitas Udayana, Bukit Jimbaran-Bali
e-mail: [email protected],
Abstract
Multiple linear regression analysis with a lot of independent variable always
makes many problems because there is a relationship between two or more
independent variables. The independent variables which correlated each other
are called multicollinearity. Principal component analysis which based on
variance covariance matrix is very sensitive toward the existence of outlier in the
observing data. Therefore in order to overcome the problem of outlier it is needed
a method of robust estimator toward outlier. ROBPCA is a robust method for
PCA toward the existence of outlier in the data. In order to obtain the robust
principal component is needed a combination of Projection Pursuit (PP) with
Minimum Covariant Determinant (MCD). The results showed that the ROBPCA
method has a bias parameter and Mean Square Error (MSE) parameter lower
than Principal Component Regression method. This case shows that the ROBPCA
method better cope with the multicollinearity observational data influenced by
outlier.
Keywords: Multiple Linear Regression, Principal Component Regression,
ROBPCA (Robust Principal Component Analysis), multicollinearity,
Outlier
1. Pendahuluan
Analisis regresi linear berganda adalah salah satu metode statistika yang
digunakan untuk mengetahui pengaruh sebuah variabel tidak bebas (dependent
variable) dengan dua atau lebih variabel bebas (independent variable)[2]. Adapun
tujuan dari analisis regresi linier berganda adalah mengetahui seberapa besar
pengaruh beberapa variabel bebas terhadap variabel tidak bebas dan juga dapat
meramalkan nilai variabel tidak bebas apabila seluruh variabel bebas sudah
diketahui nilainya.
Pada analisis regresi linier berganda dengan banyak variabel bebas, sering
timbul masalah karena adanya hubungan antara dua atau lebih variabel bebas.
Variabel bebas yang saling berkorelasi disebut multikolineari. Permasalahan yang
terjadi pada analisis regresi berganda dapat mengakibatkan hasil analisis yang
mailto:[email protected]:[email protected]:[email protected]
Ni Wayan Yuliani, Komang Gde Sukarsa, I G.A.M. Srinadi Perbandingan Regresi Komponen Utama
& ROBPCA dalam Mengatasi
Multikolinearitas & Pencilan
2
kurang akurat. Multikolinearitas merupakan salah satu masalah yang terjadi pada
analisis regresi linear berganda. Masalah lain yang dapat memengaruhi hasil
analisis data adalah pencilan (outlier). Pada penelitian ini akan dibahas dua
permasalahan statistik tersebut.
Pada kasus multikolinearitas, korelasi antar variabel akan menyebabkan
jumlah kuadrat galat yang semakin besar sehingga menghasilkan keputusan yang
tidak significant. Kasus multikolinearitas juga sangat berpengaruh pada bentuk
matriks. Pada pendugaan parameter 𝛽 = 𝑋′𝑋 −1𝑋′𝑌, apabila terjadi
multikolinearitas maka matriks 𝑋′𝑋 singular, sehingga persamaan untuk
pendugaan estimasi parameter tidak lagi mempunyai penyelesaian yang tunggal.
Hal ini akan berdampak pada dugaan koefisien variabel tidak tunggal, melainkan
tidak terhingga banyaknya sehingga tidak mungkin untuk menduganya [3].
Metode regresi komponen utama (Principal Component Regression)
merupakan salah satu teknik dalam mengatasi multikolinearitas dengan cara
mereduksi variabel–variabel yang ada menjadi beberapa variabel baru yang saling
bebas dan merupakan kombinasi linier dari variabel asal (Montgomery [1]).
Dalam menentukan komponen utama pada metode Regresi Komponen Utama
yakni melalui tahapan Principal Component Analysis (PCA). Analisis komponen
utama yang berdasarkan matriks varian kovarian sangat sensitif terhadap adanya
pencilan pada data pengamatan, sehingga untuk mengatasi masalah pencilan
diperlukan suatu metode penduga yang tegar terhadap pencilan. ROBPCA
(Robust Principal Component Analysis) adalah suatu metode yang kuat (robust)
untuk PCA terhadap keberadaan pencilan pada data, untuk mendapatkan
komponen utama yang robust diperlukan penggabungkan konsep Projection
Pursuit (PP) dengan penduga robust Minimum Covariance Determinant
(MCD)[4].
Penduga robust MCD merupakan nilai matriks rata-rata dan matriks
kovarian dari sebagian pengamatan yang meminimumkan determinan matriks
kovarian. Penduga ini didapat dengan cara mencari h pengamatan yang
memberikan nilai minimum dari matrik kovarian (Sunaryo, [4]).
Nilai matriks rata-rata 𝑡𝑙 dan matriks kovarians 𝐶𝑙 dirumuskan sebagai:
𝑡𝑙 =1
ℎ 𝐻𝑏
𝑇 .𝑉∗
𝐶𝑙 =1
ℎ 𝐻𝑏 − 𝑉
∗ 𝑡𝑙 𝑇 𝑇 𝐻𝑏 − 𝑉
∗ 𝑡𝑙 𝑇
2. Metode Penelitian
Data yang digunakan pada penelitian ini adalah data simulasi yang diperoleh
dengan membangkitkan data yang berdistribusi normal, pemeriksaan
multikolinearitas, pemeriksaan pencilan, serta penyelesaian Regresi Komponen
Utama dan Robust Principle Component Analisys. Software yang digunakan
adalah MINITAB 15 dan R i386 2.15.2.
(1.1)
(1.2)
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 1-5
3
Langkah – langkah yang dilakukan dalam penelitian ini yakni:
1. Membangkitkan data yang mengandung multikolinearitas dengan empat
variabel bebas dan satu variabel tidak bebas, amatan yang dibangkitkan
sebanyak 100 amatan (n=100). Nilai sisaan 𝜀 yang dibangkitkan
berdistribusi normal dengan rataan nol dan ragam satu. Nilai sisaan yang
dibangkitkan berukuran 100 amatan.
2. Melakukan analisis regresi linear berganda setelah membentuk vaiabel tidak
bebas dari beberapa variabel bebas. Pada langkah ini model regresi yang
didapat tidak sesuai dengan yang diharapkan sehingga diperlukan suatu
analisis untuk mendapatkan nilai penduga yang mendekati nilai yang
diharapkan.
3. Menganalisis data bangkitan dengan metode regresi Komponen utama. Hasil
analisis ini akan menjadi nilai penduga yang fit untuk mencari bias parameter.
4. Membangkitkan pencilan yang berdistribusi normal (N(40;0,05)) dengan
persentase pencilan 10%, 15%, dan 20%. Selanjutnya menambahkan pencilan
pada masing-masing peubah bebas dan melakukan analisis komponen utama.
5. Melakukan analisis dengan Robust Principle Component Analisys (ROBPCA)
pada data pengamatan yang dipengaruhi oleh pencilan.
6. Langkah terakhir yakni membandingkan dan menganalisis kedua metode
tersebut. Yang digunakan sebagai pembanding adalah nilai bias parameter dan
nilai Mean Square Error.
3. Hasil dan Pembahasan
3.1 Perbandingan Regresi Komponen Utama (RKU) dan Robust Principle
Component Analysis (ROBPCA)
Bias parameter merupakan nilai harapan dari selisih antara nilai estimasi dan
nilai yang sebenarnya. Nilai yang digunakan sebagai acuan adalah nilai penduga
dari metode Regresi Komponen Utama yang tidak dipengaruhi oleh pencilan,
sedangkan nilai yang digunakan sebagai nilai estimasi adalah nilai penduga dari
metode Regresi Komponen Utama dan Robust Principle Component Analysis
yang dipengaruhi oleh pencilan dengan persentase 10%, 15%, dan 20%. Bias
parameter untuk 100 kali ulangan diperoleh dengan rumus berikut ini:
𝐵𝐼𝐴𝑆 𝛽𝑖 = 𝛽 𝑗
𝑓𝑖𝑡100𝑗=1
100 −
𝛽 𝑗𝑝100
𝑗=1
100 , 𝑖 = 1,… ,4
Mean Square Error (MSE) suatu estimator merupakan nilai harapan dari
bias kuadrat. Mean Square Error parameter untuk 100 kali ulangan diperoleh
dengan menggunakan rumus berikut ini:
𝑀𝑆𝐸 𝛽𝑖 = 𝛽 𝑗
𝑓𝑖𝑡−𝛽 𝑗
𝑝
2100𝑗=1
100, 𝑖 = 1,… ,4
Hasil perhitungan bias parameter dan Mean Square Error untuk 100 kali
ulangan disajikan berturut-turut pada Tabel 1 dan Tabel 2.
(3.1)
(3.2)
Ni Wayan Yuliani, Komang Gde Sukarsa, I G.A.M. Srinadi Perbandingan Regresi Komponen Utama
& ROBPCA dalam Mengatasi
Multikolinearitas & Pencilan
4
Tabel 1. Perbandingan Regresi Komponen Utama Dan ROBPCA Berdasarkan
Nilai Bias Parameter
Pencilan Komponen Nilai Bias Parameter
Regresi Komponen Utama ROBPCA
10%
Intercept 19,6368 1,3057
PC1 1,4974 0,3775
PC2 0,4915 0,1309
PC3 0,0803 0,0023
PC4 0,6893 0,1160
15%
Intercept 29,8135 6,3881
PC1 1,5809 0,3581
PC2 0,5197 0,0714
PC3 0,2581 0,0610
PC4 0,9431 0,3668
20%
Intercept 39,8165 13,0083
PC1 1,1576 0,1045
PC2 0,4013 0,1743
PC3 1,4120 0,0457
PC4 1,1039 0,4341
Sumber : Data diolah (2013)
Estimasi yang baik adalah estimasi yang menghasilkan nilai bias yang
rendah atau kecil. Semakin besar nilai bias, maka semakin jauh penyimpangan
dari nilai yang sebenarnya. Pada Tabel 1 munjukkan bahwa nilai penduga dari
metode ROBPCA selalu lebih kecil dibandingkan dengan Regresi Komponen
Utama. Oleh Karena itu nilai penduga dari metode ROBPCA lebih baik
dibandingkan dengan metode Regresi Komponen Utama. Hal ini karena metode
ROBPCA dapat mengatasi data pengamatan yang dipengaruhi oleh pencilan.
Tabel 2. Perbandingan Regresi Komponen Utama Dan ROBPCA Berdasarkan
Nilai Mean Square Error Parameter
Pencilan Komponen Nilai Bias Parameter
Regresi Komponen Utama ROBPCA
10%
Intercept 392,0726 6,6843
PC1 3,9182 1,5095
PC2 2,8191 2,4226
PC3 0,1875 0,0206
PC4 2,7543 1,5256
15%
Intercept 891,3347 48,4942
PC1 4,0961 1,4267
PC2 3,1972 3,0118
PC3 0,4456 0,0494
PC4 3,0174 1,6895
20%
Intercept 1587,84599 173,4866
PC1 3,012465527 1,8322
PC2 2,682504765 2,2665
PC3 2,164030949 0,0714
PC4 3,060462252 1,8983
Sumber : Data diolah (2013)
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 1-5
5
Semakin kecil nilai Mean Square Error suatu estimator, maka hasil
estimasinya akan semakin baik. Pada Tabel 2 munjukkan bahwa nilai penduga
dari metode ROBPCA selalu lebih kecil dibandingkan dengan Regresi Komponen
Utama. Sehingga nilai penduga dari metode ROBPCA lebih baik dibandingkan
dengan metode Regresi Komponen Utama. Hal ini karena metode ROBPCA dapat
mengatasi data pengamatan yang dipengaruhi oleh pencilan.
4. Kesimpulan
Pada penelitian ini nilai penduga dari metode ROBPCA memiliki nilai bias
parameter dan nilai Mean Square Error (MSE) yang lebih kecil dibandingkan
dengan nilai penduga dari metode Regresi Komponen Utama, sehingga metode
ROBPCA memiliki nilai estimasi yang lebih baik dibandingkan dengan metode
Regresi Komponen Utama.
Daftar Pustaka
[1] Montgomery, D.C. dan Peck, E.A. (1991) Introduction to Linear Regression
Analysis, 2nd
edition, A Wiley-Interscience,New York.
[2] Neter, J. (1997) Model Linear Terapan, Bandung: Diterjemahkan oleh
Bambang Sumantri, IPB.
[3] Notiragayu.2008.Pembandingan Beberapa Metode Analisis Regresi
Komponen Utama Robust.Prosiding Seminar Hasil Penelitian dan
Pengabdian kepada Masyarakat, Universitas Lampung.
[4] Sunaryo, S. (2011) Mengatasi Masalah Multikolinearitas dan Outlier
dengan Pendekatan ROBPCA (Studi Kasus: Angka Kematian Bayi di Jawa
Timur), Jurnal Matematika, Saint dan Teknologi, Jurusan Statistika, ITS,
vol. 12, Nomor 1, Maret, pp. 1-10.
E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 6- 10 ISSN: 2303-1751
1 Mahasiswa Jurusan Matematika FMIPA Universitas Udayana
2,3 Staf Pengajar Jurusan Matematika FMIPA Universitas Udayana 6
PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM
COVARIANCE DETERMINANT (LMS-MCD)
DALAM REGRESI KOMPONEN UTAMA
I PUTU EKA IRAWAN1, I KOMANG GDE SUKARSA
2,
NI MADE ASIH3
1,2,3Jurusan Matematika FMIPA Universitas Udayana, Bukit Jimbaran-Bali
e-mail: [email protected],
Abstract
Principal Component Regression is a method to overcome
multicollinearity techniques by combining principal component analysis with
regression analysis. The calculation of classical principal component analysis is
based on the regular covariance matrix. The covariance matrix is optimal if the
data originated from a multivariate normal distribution, but is very sensitive to
the presence of outliers. Alternatives are used to overcome this problem the
method of Least Median Square-Minimum Covariance Determinant (LMS-MCD).
The purpose of this research is to conduct a comparison between Principal
Component Regression (RKU) and Method of Least Median Square - Minimum
Covariance Determinant (LMS-MCD) in dealing with outliers. In this study,
Method of Least Median Square - Minimum Covariance Determinant (LMS-
MCD) has a bias and mean square error (MSE) is smaller than the parameter
RKU. Based on the difference of parameter estimators, still have a test that has a
difference of parameter estimators method LMS-MCD greater than RKU method.
Keywords: Multicollinearity, Outlier, Principal Component Regression, LMS,
MCD
1. Pendahuluan
Multikolinearitas (multicollinearity) merupakan suatu kondisi pada regresi
linear berganda dengan variable-variabel bebas saling berkorelasi. Regresi
Komponen Utama merupakan metode yang mengatasi multikolinearitas dengan
cara mengombinasikan teknik analisis komponen utama dengan analisis regresi.
Pada analisis komponen utama klasik, perhitungannya didasarkan pada matriks
kovarian biasa. Matriks kovarian ini akan optimal apabila data berasal dari suatu
distribusi normal multivariat, tetapi sangat sensitif terhadap adanya pencilan
(oulier) [2]. Alternatif yang digunakan untuk mengatasi masalah ini adalah
Metode Least Median Square-Minimum Covariance Determinant (LMS-MCD).
Adapun tujuan dalam penelitian ini adalah melihat nilai bias dan MSE parameter
dari metode RKU setelah matriks kovarian biasa diganti dengan matriks kovarian
mailto:[email protected]
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 6-10
7
robust (LMS-MCD). Pada penelitian ini, setelah matriks kovarian biasa yang
digunakan pada RKU diganti dengan matriks kovarian robust (LMS-MCD)
memiliki nilai bias dan mean square error (MSE) parameter lebih kecil
dibandingkan dengan RKU. Berdasarkan selisih penduga parameter dari 100
ulangan, masih ada ulangan yang memiliki selisih penduga parameter dari metode
LMS-MCD yang lebih besar dari metode RKU.
Metode Least Median Square (LMS)
Salah satu metode regresi robust yang juga sering digunakan dalam analisis
regresi adalah metode LMS (Least Median Square). Metode ini mempunyai
keuntungan untuk mengurangi pengaruh dari sisaan (residual) terhadap
keakuratan koefisien regresi. Penduga LMS diperoleh dengan mencari model
regresi yang meminimumkan median kuadrat sisaan (𝑒𝑖2) dari himpunan-
himpunan bagian pada data yang masing-masing sebanyak ℎ, dengan 𝑒𝑖2 =
𝑦𝑖 − 𝑥𝑖𝑇𝑏 2 [3]. Nilai ℎ ditentukan dengan menggunakan rumus ℎ =
𝑛
2 +
(𝑝+1)
2 , dengan 𝑛= ukuran sampel (banyaknya data), 𝑝= banyaknya parameter.
Metode Minimum Covariance Determinant (MCD)
Pada Metode ini dicari matriks varians-kovarians dari setiap himpunan
bagian data yang banyak elemennya ℎ′ , dengan ℎ′ =𝑛+𝑝+1
2. Selanjutnya diantara
matriks varian-kovarians tersebut dipilih yang memiliki determinan terkecil,
dengan 𝑝 menyatakan banyak variabel dan 𝑛 menyatakan banyak pengamatan [1].
2. Metode Penelitian
Data yang digunakan adalah data simulasi yang diperoleh dengan
membangkitkan data yang berdistribusi normal dengan menggunakan bantuan
program R i386 2.15.2. Penyelesaian Analisis Komponen Utama dan Least
Median Square – Minimum Covariance Determinant (LMS-MCD) pada data
yang dibangkitkan menggunakan software MINITAB 15 dan software R i386
2.15.2. Pada simulasi data ini, banyaknya sampel yang digunakan adalah 100
amatan (dinotasikan 𝑛 = 100) . Sedangkan presentase pencilan yang digunakan
adalah 10%, 15%, 𝑑𝑎𝑛 20%.
Adapun tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut:
1. Membangkitkan nilai sisaan 𝑒 , 𝑋1~ 50,5 , 𝑋2~ 100,10 , 𝑋3~(30,5), 𝑋4 =
𝑋1 + 𝑋3 + 𝑒, Menentukan nilai 𝑌 dengan cara 𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 +
𝛽3𝑋3 + 𝛽4𝑋4 + 𝑒. Dimana 𝛽0 = 2 dan 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 1
2. Melakukan regresi komponen utama pada 𝑋1, 𝑋2, 𝑋3, 𝑋4 terhadap Y, sehingga
diperoleh nilai penduga yang fit (𝛽 𝑓𝑖𝑡 ) dengan menggunakan R i386 2.15.2.
3. Membangkitkan pencilan yang berdistribusi 𝑁(40,0.05) sebanyak 10% dari
banyak amatan 𝑛 = 100 dengan menggunakan program R i386 2.15.2. dan
I Putu Eka Irawan, Komang Gde Sukarsa, Ni Made Asih Penerapan Metode LMS – MCD dalam Regresi Komponen Utama
8
memasukan pencilan pada data simulasi dengan cara menjumlahkan pencilan
pada masing-masing variabel bebas yaitu 𝑋1, 𝑋2, 𝑋3
4. Menghitung nilai 𝑌𝑝 dari peubah bebas yang sudah terkontaminasi pencilan.
Dengan 𝑌𝑝 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3 + 𝛽4𝑋4 + 𝑒, 𝛽0 = 2 dan 𝛽1 = 𝛽2 =
𝛽3 = 𝛽4 = 1.
5. Melakukan analisis Regresi Komponen Utama pada data yang sudah
terkontaminasi pencilan dengan menggunakan software R i386 2.15.2
sehingga diperoleh 𝛽 (𝑅𝐾𝑈)𝑝
6. Melakukan analisis data menggunakan R i386 2.15.2 dengan menggunakan
metode Least Median Square – Minimum Covariance Determinant (LMS-
MCD) sehingga diperoleh 𝛽 (𝐿𝑀𝑆−𝑀𝐶𝐷)𝑝 .
7. Ulangi langkah 3 sampai 6 untuk presentase 15%, 20%.
8. Menganalisa dan membandingkan hasil perhitungan Regresi Komponen
Utama dengan Least Median Square-Minimum Covariance Determinant
(LMS-MCD) berdasarkan bias parameter dan Mean Square Error (MSE).
3. Hasil dan Pembahasan
Teknik perhitungan analisis komponen utama menggunakan matriks
kovarian biasa. Matriks kovarian ini akan optimal apabila data berasal dari suatu
distribusi normal multivariat. Akan tetapi, matriks kovarian ini sensitif terhadap
adanya pencilan. Apabila pada data terdapat pencilan, maka matriks kovarian
akan kehilangan efisiensinya, sehingga diperlukan suatu matriks kovarian yang
robust terhadap pencilan. Penaksir robust yang digunakan untuk kovarian adalah
Minimum Covariance Determinant (MCD). Setelah matriks kovarian biasa pada
metode RKU diganti dengan matriks kovarian robust, maka diperoleh komponen-
komponen utama yang robust. Selanjutnya komponen-komponen utama yang
robust ini diregresikan terhadap peubah tidak bebas dengan menggunakan metode
Least Median Square.
Berikut hasil perhitungan bias parameter dari metode RKU sebelum
matriks kovarian biasa diganti dengan matriks kovarian robust dan sesudah
matriks kovarian biasa diganti dengan matriks kovarian robust (LMS-MCD) yang
disajikan dalam tabel 1.
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 6-10
9
Tabel 1. Hasil Perhitungan Bias Parameter untuk 100 kali Ulangan
Presentase Pencilan Metode Intercept PC1 PC2 PC3 PC4
10% RKU 20,0055 1,2313 0,5453 0,0308 0,4356
LMS-MCD 1,7792 0,0119 0,1443 0,0199 0,3892
15% RKU 30,0025 1,5189 0,6074 0,3046 0,5959
LMS-MCD 6,7617 0,0883 0,0272 0,0308 0,4804
20% RKU 40,0035 1,0302 0,2414 1,4092 1,1498
LMS-MCD 13,1999 0,0324 0,0826 0,0673 0,685
Hasil perhitungan MSE parameter dapat dilihat pada tabel 2.
Tabel 2. Hasil Perhitungan Mean Square Error Parameter untuk 100 kali Ulangan
Presentase Pencilan Metode Intercept PC1 PC2 PC3 PC4
10% RKU 400,222 3,7153 3,2863 0,1961 2,4759
LMS-MCD 6,3224 1,1183 2,7129 0,0523 1,7137
15% RKU 900,152 3,6949 3,15 0,4917 3,1602
LMS-MCD 48,8361 1,761 2,8019 0,0324 2,0185
20% RKU 1600,28 2,9369 2,916 2,0797 2,7384
LMS-MCD 176,411 1,8399 2,5413 0,0437 2,1958
Berdasarkan Tabel 1 dan 2, terlihat bahwa pada presentase pencilan 10%, 15%,
dan 20% nilai bias parameter dan mean square error (MSE) parameter dari
metode RKU sebelum matriks kovarian biasa diganti dengan matriks kovarian
robust selalu lebih besar dibandingkan dengan nilai bias parameter dan mean
square error (MSE) parameter dari metode RKU sesudah matriks kovarian biasa
diganti dengan matriks kovarian robust (LMS-MCD).
Selain itu, perbandingan untuk kedua metode juga dilakukan dengan
menghitung selisih dari penduga parameter yang dihasilkan oleh kedua metode
dengan penduga parameter dari metode RKU pada data tanpa pencilan. Setelah
dilakukan pengulangan 100 kali dan dihitung selisih penduga parameter dari
masing-masing ulangan pada kedua metode, diperoleh bahwa secara umum
metode LMS-MCD lebih bagus daripada metode RKU.
4. Kesimpulan
Berdasarkan hasil yang diperoleh dapat disimpulkan, untuk presentase
pencilan 10%, 15%, dan 20% pada data simulasi yang dibuat peubah-peubah
bebasnya bermultikolinearitas menunjukkan bahwa metode RKU sesudah matriks
kovarian biasa diganti dengan matriks kovarian robust (LMS-MCD) menunjukkan
hasil yang lebih baik dibandingkan dengan metode RKU sebelum matriks
kovarian biasa diganti dengan matriks kovarian robust. Untuk penelitian
I Putu Eka Irawan, Komang Gde Sukarsa, Ni Made Asih Penerapan Metode LMS – MCD dalam Regresi Komponen Utama
10
selanjutnya disarankan menambah jumlah ulangan dalam simulasi dan
membandingkan peubah bebas yang dibangkitkan dari sebaran normal yang
mengalami multikolinearitas dengan peubah bebas yang dibangkitkan dari sebaran
data normal multivariat.
Daftar Pustaka
[1] Aderlina, D. 2011. Metode Minimum Covariance Determinant pada Analisis
Regresi Linear Berganda dengan Kasus Pencilan. Skripsi. Jurusan
Matematika F MIPA Universitas Padjadjaran.
[2] Notiragayu. 2008. Pembandingan Beberapa Metode Analisis Regresi
Komponen Utama Robust. Prosiding Seminar Hasil Penelitian dan
Pengabdian kepada Masyarakat, Universitas Lampung.
[3] Rousseeuw, P.J. 1984. Least Median of Square Regresson. Journal of the
American Statistical Association.
E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 11- 16 ISSN: 2303-1751
1 Mahasiswa Jurusan Matematika FMIPA Universitas Udayana
2,3 Staf Pengajar Jurusan Matematika FMIPA Universitas Udayana 11
PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL
(ZINB) UNTUK PENDUGAAN KEMATIAN ANAK BALITA
NI MADE SEKARMINI1, I KOMANG GDE SUKARSA
2,
I GUSTI AYU MADE SRINADI3
1,2,3Jurusan Matematika FMIPA Universitas Udayana, Bukit Jimbaran-Bali
e-mail: [email protected],
Abstract
One method of regression analysis used to analyze the count data is
Poisson regression. Poisson regression requires that the mean value equal to the
value of variance (equidispersion). However, sometimes the data is going
overdispersion the state variance values greater than the mean value. One of the
causes overdispersion is the excessive number of zero values on the response
variable (excess zeros). One method of analysis that can be used on data that had
overdispersion due to excess zeros is regression Zero-Inflated Negative Binomial
(ZINB). The data that can be analyzed using the ZINB regression is the early
childhood mortality in the province of Bali because much of the data is zero. The
analysis showed that the data had overdispersion on Poisson regression, so the
ZINB regression analysis was used. From the results of the ZINB regression can
overcome overdispersion so it was better than the Poisson Regression Model.
Keywords: Overdispersion, ZINB Regression, Poisson Regression, Early
Childhood Mortality
1. Pendahuluan
Analisis regresi linear adalah salah satu metode statistika yang dapat
menjelaskan hubungan sebab akibat antara satu variabel respon 𝑌 dengan satu
atau lebih variabel prediktor 𝑋𝑖 . Pada umumnya analisis regresi linear
digunakan untuk menganalisa variabel respon yang berupa data kontinu dan
berdistribusi normal. Namun dalam beberapa aplikasinya, variabel respon yang
akan dianalisis dapat berupa data diskrit [2].
Salah satu model yang dapat digunakan untuk menganalisis variabel respon
diskrit Y yang berdistribusi Poisson dengan variabel bebas berupa data kategorik,
diskrit , kontinu ataupun campuran disebut dengan model regresi Poisson. Pada
regresi Poisson harus memenuhi asumsi variannya yaitu 𝑉𝑎𝑟 𝑌𝑖 = 𝐸 𝑌𝑖 , untuk
setiap observasi i (i = 0,1,…,N), dilain pihak untuk data yang bertipe diskrit
terkadang terjadi overdispersi yaitu nilai varian lebih besar dari nilai mean pada
data respon. Salah satu penyebab terjadinya overdispersi yaitu banyaknya nilai nol
Ni Made.Sekarmini, Komang Gde Sukarsa, I G.A.M. Srinadi Penerapan Regresi Zero-Inflated Negative
Binomial untuk Pendugaan Kematian Balita
12
yang berlebih pada variabel respon (excess zeros). Penanganan model yang dapat
digunakan untuk mengatasi masalah tersebut antara lain adalah model regresi
Zero-Inflated Negative Binomial (ZINB). Regresi Zero Inflated Negative Binomial
(ZINB) adalah model yang dibentuk dari distribusi campuran poisson gamma.
Pada analisis mortalitas (kematian) sering dijumpai banyak data yang bernilai nol.
Salah satu data mortalitas (kematian) yang cocok dianalisis dengan menggunakan
model Regresi Zero Inflated Negative Binomial (ZINB) adalah data kematian anak
balita. Fakta menunjukkan bahwa jarang terjadi peristiwa kematian anak balita di
suatu daerah. Dalam penelitian ini, permasalahan yang dibahas adalah
penggunaan model Regresi Zero Inflated Negative Binomial (ZINB) untuk
pendugaan kematian anak balita di Provinsi Bali dan faktor-faktor yang
memengaruhi kematian anak balita.
Model regresi Poisson adalah model regresi nonlinear yang berasal dari
distribusi Poisson yang merupakan penerapan dari Generalized Linear Model
(GLM). Model ini menggambarkan hubungan antara variabel respon dan variabel
prediktor, dengan variabel respon dalam bentuk diskrit [1].
Model regresi Poisson diberikan sebagai berikut.
𝑌𝑖~𝑃𝑜𝑖𝑠𝑠𝑜𝑛 𝜇𝑖 𝜇𝑖 = exp(𝑋𝑖
𝑇𝛽)
Regresi Zero-Inflated Negative Binomial (ZINB) merupakan model yang
dibentuk dari distribusi poisson dan distribusi gamma. Model regresi ini memiliki
dua keadaan yaitu Keadaan pertama disebut zero state terjadi dengan probabilitas
pi dan menghasilkan hanya observasi bernilai nol, sementara keadaan kedua
disebut Negative Binomial state terjadi dengan probabilitas (1 - pi) dan
berdistribusi Binomial Negatif dengan mean μ , dengan 0 ≤ pi ≤ 1 [1].
1. Model data diskrit untuk 𝜇𝑖
ln 𝜇𝑖 = 𝑥𝑖𝑇𝛽 , 𝜇𝑖 ≥ 0, 𝑖 = 1, … , 𝑛
2. Model Zero-Inflation untuk 𝑝𝑖
𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = ln 𝑝𝑖
1 − 𝑝𝑖 = 𝑧𝑖
𝑇𝛾 , 0 ≤ 𝑝𝑖 ≤ 1, 𝑖 = 1, . . , 𝑛
Jika nilai awal tidak bagus, maka fungsi log-likelihood dari fungsi
probabilitas ZINB tidak linier, sehingga fungsi likelihood ini tidak dapat
diselesaikan dengan metode numerik biasa. Oleh karena itu, digunakan algoritma
EM (Expectation Maximization) [3].
2. Metode Penelitian
Data yang digunakan dalam penelitian ini adalah data sekunder yang
diperoleh dari Dinas Kesehatan Provinsi Bali yaitu data kematian anak balita
tahun 2011 dari seluruh kabupaten/kota di Provinsi Bali. Variabel respon dalam
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 11-16
13
penelitian ini yaitu jumlah kematian anak balita (Y) dan variabel prediktor dalam
penelitian ini adalah persentase Pneumonia 𝑋1 , persentase anak balita mendapat
pelayanan kesehatan 𝑋2 , persentase anak balita mendapat vitamin A sebanyak
2x 𝑋3 , balita gizi buruk 𝑋4 , jumlah posyandu aktif 𝑋5 . Teknik analisis
datanya yaitu pertama melakukan pengumpulan data lalu melakukan analisis
regresi poisson. Dari model yang telah diperoleh dilakukan pemeriksaan
terjadinya overdispersi. Jika terjadi overdispersi dilanjutkan dengan melakukan
analisis regresi ZINB. Untuk menentukan model terbaik ZINB dilihat dari nilai
AIC terkecil kemudian melakukan uji kesesuaian model. Selanjutnya melakukan
pengujian signifikansi parameter secara individu. Dari model yang telah diperoleh
dilakukan intepretasi model. Kemudian kembali dilakukan pengujian overdispersi.
Setelah itu dilakukan perbandingan antara regresi Poisson dan regresi ZINB.
3. Hasil dan Pembahasan
3.1 Deskripsi Data Penelitian
Di Provinsi Bali dengan jumlah kecamatan sebanyak 57 kecamatan terjadi
jumlah total kematian anak balita sebanyak 41 orang dengan jumlah terbanyak di
Kabupaten Gianyar. Jumlah data yang bernilai nol (tidak ada anak balita yang
meninggal) sebanyak 36 data , bernilai 1 sebanyak 12 data, bernilai 2 sebanyak 3
data, bernilai 3 sebanyak 4 data, bernilai 4 sebanyak 1 data dan bernilai 7
sebanyak 1 data.
3.2 Analisis Regresi Poisson
Dari data kematian anak balita di Provinsi Bali diperoleh nilai-nilai
Koefisien 𝛽 dan nilai uji Wald seperti tampak pada Tabel 3.1.
Tabel 3. 1 Koefisien Regresi Model Regresi Poisson
Variabel Prediktor Koefisien 𝛽 Uji Wald P-Value
Intercept 1,3232 0,78 0,377
𝑋1 0,0027 0,06 0,8062
𝑋2 0,0146 2,21 0,1372
𝑋3 -0,0394 5,85 0,0155*
𝑋4 0,3174 0,76 0,3830
𝑋5 0,0085 4,47 0,0344* Sumber :Data diolah tahun 2013; *. Signifikan pada 𝛼 = 0.05
Berdasarkan Tabel 3.1 diperoleh model Regresi Poisson yaitu:
𝜇 = exp 1,9769 − 0,0294𝑋3 + 0,0074𝑋5
Sebagai langkah selanjutnya dilakukan uji kesesuaian Regresi Poisson.
Ni Made.Sekarmini, Komang Gde Sukarsa, I G.A.M. Srinadi Penerapan Regresi Zero-Inflated Negative
Binomial untuk Pendugaan Kematian Balita
14
Uji kesesuaian regresi poisson dilakukan dengan menggunakan prosedur
pengujian nilai Deviansi dengan hipotesis sebagai berikut:
𝐻0: Model Regresi Poisson cocok pada data
𝐻1: Model Regresi Poisson tidak cocok pada data
Setelah dilakukan pengolahan data, diperoleh nilai devians dan pearson chi-
square seperti tampak pada Tabel 3.2.
Tabel 3.2 Uji Devians dan Taksiran Dispersi pada Regresi Poisson
Kriteria DB Nilai Nilai/DB
Devians 54 94,0535 1,7417
Pearson Chi-square 54 135,3078 2,5057
Sumber : Data diolah tahun 2013
Tabel 3.2 memperlihatkan bahwa nilai devians lebih besar dari nilai tabel
𝜒0.05;542 = 72,1358 . Oleh karena itu, 𝐻0 ditolak yang berarti bahwa model regresi
Poisson tidak dapat menjelaskan hubungan antara variabel respon 𝑌 dengan
variabel-variabel bebas 𝑋3,𝑋5 . Lebih lanjut lagi, dilakukan pemeriksaan
terjadinya overdispersi.
Dari Tabel 3.2 terlihat bahwa nilai Devians/ DB dan nilai Pearson Chi-
square/ DB lebih besar dari 1 sehingga dapat disimpulkan bahwa terjadi
overdispersi pada data respon 𝑌 . Oleh karena itu, harus dilakukan analisis
Regresi ZINB.
3.3 Analisis Regresi Zero-Inflated Negative Binomial (ZINB)
Input data persentase anak balita mendapat vitamin A sebanyak 2x
menghasilkan model awal ZINB untuk variabel prediktor 𝑋3 yaitu:
1. Model data diskrit untuk 𝜇𝑖 yaitu: ln 𝜇𝑖 = 0,7425 − 0,0069𝑋3
2. Model zero-inflated untuk 𝑝𝑖 yaitu: 𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = −8,8337 + 0,0854𝑋3
dengan nilai AIC sebesar 139,5338.
Sedangkan input data jumlah posyandu aktif menghasilkan model awal
ZINB untuk variabel prediktor 𝑋5 yaitu:
1. Model data diskrit untuk 𝜇𝑖 yaitu:
ln 𝜇𝑖 = 0,5827 − 0,0054𝑋5
2. Model zero-inflated untuk 𝑝𝑖 yaitu:
𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = 2,3973 − 0,0523𝑋5
dengan nilai AIC sebesar 134,3934.
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 11-16
15
Lebih lanjut lagi, data-data persentase anak balita mendapat vitamin A
sebanyak 2x dan jumlah posyandu aktif menghasilkan model awal ZINB untuk
variabel prediktor 𝑋3 dan 𝑋5 yaitu:
1. Model data diskrit untuk 𝜇𝑖 yaitu:
ln 𝜇𝑖 = 0,2724 + 0,0061𝑋3 − 0,0089𝑋5
2. Model zero-inflated untuk 𝑝𝑖 yaitu:
𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = −49,1936 + 0,6367𝑋3 − 0,2412𝑋5
dengan nilai AIC sebesar 123,1146.
Sebagai langkah selanjutnya, dilakukan pemilihan model Regresi ZINB
terbaik. Model dengan AIC terkecil adalah model regresi ZINB dengan dua
variabel yaitu 𝑋3 dan 𝑋5. Hal ini berarti bahwa peluang respon Y bernilai nol
dipengaruhi oleh persentase anak balita mendapat vitamin A 2x 𝑋3 dan jumlah
posyandu aktif 𝑋5 . Lebih lanjut lagi, dilakukan pengujian kesesuaian model
Regresi ZINB. Adapun Hipotesisnya adalah:
𝐻0: β0 = β3 = β5 = γ0 = γ3 = γ5 = 0
𝐻1: paling sedikit ada satu βj ≠ 0 atau γj ≠ 0
dengan j = 1, 2, … , 5
Dari data diperoleh nilai uji G:
𝐺 = −2 −65,804 − −54,557 = 22,494
Kriteria uji dengan menggunakan = 0,05 , dari tabel chi-square diperoleh
𝜒0.05;42 = 9,488. Tampak bahwa Ghitung> Gtabel sehingga keputusannya H0 ditolak,
yang artinya model regresi ZINB dengan dua variabel layak digunakan.
Lebih lanjut lagi dilakukan pengujian signifikansi parameter Regresi ZINB
secara individu. Dari hasil perhitungan diperoleh koefisien Regresi ZINB dan nilai
uji Wald seperti tampak pada Tabel 3.3.
Tabel 3.3 Koefisien Regresi ZINB dengan dua variabel prediktor 𝑋3 𝑑𝑎𝑛 𝑋5
Parameter Koefisien Uji Wald P-Value
𝛽0 0,2724 0,02 0,8846
𝛽3 0,0061 0,07 0,7919
𝛽5 -0,0089 1,34 0,2473
𝛾0 -49,1936 1,84 0,1753
𝛾3 0,6367 1,89 0,1695
𝛾5 -0,2412 1,76 0,1852
Sumber: Data diolah tahun 2013
Berdasarkan kriteria uji parameter Regresi ZINB memiliki 𝑃 − 𝑣𝑎𝑙𝑢𝑒 > 𝛼 =
0.05, dan 𝑊𝑗 < 𝜒𝛼 ;12 = 3.841, yang artinya ketika pengujian secara individu
menggunakan uji Wald tidak ada variabel prediktor yang berpengaruh secara
signifikan terhadap variabel respon.
Berikutnya dilakukan kembali pengujian overdispersi. Berdasarka hasil
perhitungan pada regresi ZINB diperoleh nilai Devians/ DB sebesar 2,1395 dan
Ni Made.Sekarmini, Komang Gde Sukarsa, I G.A.M. Srinadi Penerapan Regresi Zero-Inflated Negative
Binomial untuk Pendugaan Kematian Balita
16
nilai Pearson Chi-square/ DB sebesar 0,9655. Hal ini mengindikasikan tidak
terjadi overdispersi.
3.4 Perbandingan Model Regresi Poisson dengan Model Regresi ZINB
Tabel 3.4 Nilai devians, Pearson Chi-Square dan AIC.
Kriteria Regresi Poisson Regresi ZINB
Devians 94,0535 109,1146
Pearson Chi-Square 135,3078 49,2389
AIC 150,94 123,1146
Sumber: Data diolah tahun 2013
Dari nilai Pearson Chi-Square dan nilai AIC, regresi ZINB lebih tepat
digunakan untuk memodelkan kematian anak balita dibandingkan dengan model
regresi Poisson.
4. Kesimpulan
Untuk kematian anak balita di Provinsi Bali tahun 2011 berdasarkan nilai
AIC terkecil diperoleh model regresi ZINB dengan dua variabel prediktor yaitu
Model data diskrit untuk 𝜇𝑖 yaitu:
ln 𝜇𝑖 = 0,2724 + 0,0061𝑋3 − 0,0089𝑋5
Model zero-inflated untuk 𝑝𝑖 yaitu:
𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = −49,1936 + 0,6367𝑋3 − 0,2412𝑋5
Dari semua variabel prediktor yang digunakan pada model regresi ZINB
tidak ada yang berpengaruh secara signifikan terhadap penyebab kematian anak
balita. Dalam penelitian ini regresi ZINB dapat mengatasi masalah overdispersi
yang disebabkan oleh excess zeros.
Daftar Pustaka
[1] Ariawan, B., Suparti & Sudarno. 2012. “Pemodelan Regresi Zero Inflated
Negative Binomial ( ZINB ) Untuk Data Respon Diskrit dengan Excess
Zeros”. Gaussian. Vol. 1, No. 1 , 55-64.
[2] Sundari, I. 2012. “Regresi Poisson dan Penerapannya untuk Memodelkan
Hubungan Usia dan Perilaku Merokok Terhadap Jumlah Kematian Penderita
Penyakit Kanker Paru-Paru”. Jurnal Matematika Unad. Vol. 1, no. 1,
Oktober, 75-80.
[3] Garay, A.M. and Hashimoto, E.M. 2011. “On Estimation And Influence
Diagnostics for Zero Inflated Negative Binomial Regression Models”.
Computational Statistics and Data Analysis. Vol. 55 , 1304-1318.
E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 17- 22 ISSN: 2303-1751
1 Mahasiswa Jurusan Matematika FMIPA Universitas Udayana
2,3 Staf Pengajar Jurusan Matematika FMIPA Universitas Udayana 17
KOMPARASI ANALISIS GEROMBOL (CLUSTER) DAN BIPLOT
DALAM PENGELOMPOKAN
I MADE ANOM ARIAWAN1, I PUTU EKA NILA KENCANA
2,
NI LUH PUTU SUCIPTAWATI3
1,2,3Jurusan Matematika FMIPA Universitas Udayana, Bukit Jimbaran-Bali
e-mail: [email protected],
Abstract
One of functions of multivariate analysis is to group data. Multivariate
analysis often used in grouping data are cluster analysis and biplot analysis. In
this paper, a comparative analysis will be made between clusters analysis and
biplot analysis for grouping the data. Technique used in the cluster analysis is k-
mean method and biplot analysis used two-dimensional display. The results ware
that biplot analysis produces are better in grouping accuracy than clusters
analysis. But in general, biplot analysis can not be said to be better than clusters
analysis in grouping the data and vice versa.
Keywords: comparative, multivariate analysis , clusters analysis, biplot analysis
1. Pendahuluan
Analisis multivariat merupakan analisis statistika yang berkaitan dengan
pendiskripsian ataupun interpretasi data yang melibatkan banyak peubah dan
objek secara bersama-sama [1]. Salah satu interpretasi yang dimaksud adalah
pengelompokan data [4]. Pengelompokan data merupakan pengorganisasian
sekumpulan data yang besar dengan cara membagi data tersebut kedalam
beberapa gerombol (kelompok). Gerombol-gerombol yang terbentuk akan mampu
menjelaskan adanya persamaan maupun perbedaan dari keseluruhan data yang
diteliti [2]. Tujuan dari pengelompokan data adalah untuk mempermudah proses
analisis dan interpretasi dari data besar dengan membagi data tersebut menjadi
beberapa gerombol.
Terdapat beberapa teknik dalam pengelompokan suatu data. Namun dalam
tulisan ini, pengelompokan data yang dimaksudkan adalah pengelompokan data
yang didasarkan pada objek dari data tersebut. Salah satu analisis yang sering
digunakan untuk pengelompokan ini adalah analisis gerombol (cluster). Analisis
gerombol merupakan analisis multivariat yang bertujuan untuk mengelompokkan
objek-objek dari data yang diteliti berdasarkan kesamaan karakteristik yang
dimilikinya [7]. Kesamaan karakteristik ini biasanya diukur menggunakan ukuran
kedekatan antarobjek yang dapat berupa ukuran kemiripan atau ketakmiripannya.
mailto:[email protected]:[email protected]:[email protected]
I M. Anom Ariawan, I P.E. Nila Kencana, N.L.P. Suciptawati Komparasi Analsis Gerombol (Cluster)
dan Biplot dalam Pengelompokan
18
Lebih jauh mengenai pengelompokan data berdasarkan objek, analisis multivariat
lain yang juga sering digunakan adalah analisis biplot. Tujuan analisis ini adalah
untuk menggambarkan baris (objek) dan kolom (peubah) yang ada pada matriks
data secara bersama-sama dalam sebuah grafik berdimensi rendah (biasanya dua
atau tiga) [3]. Penggambaran ini meliputi keragaman dan korelasi antar peubah,
serta kedekatan antarobjek yang nantinya akan mampu mengidentifikasikan
pengelompokan objek.
Kedua analisis multivariat tersebut memiliki keunggulan masing-masing,
analisis gerombol mampu digunakan dalam mengelompokkan data dalam jumlah
objek yang besar serta dengan skala pengukuran peubah yang berbeda mulai dari
nominal sampai interval [2]. Analisis biplot mampu menampilkan secara
langsung peubah penciri atau peubah yang paling dominan dari suatu kelompok
objek yang terbentuk pada hasil tampilan analisis biplot [7]. Pada tulisan ini akan
dilakukan komparasi pada kedua analisis tersebut untuk melihat analisis terbaik
dalam pengelompokan objek dari suatu data. Komparasi ini dilakukan dengan
melihat ketepatan setiap objek dalam kelompok-kelompok yang dihasilkan dari
kedua analisis itu terhadap posisi objek tersebut dalam kelompok pada data
kontrol. Suatu objek dikatakan memiliki ketepatan jika berada dalam kelompok
yang sama baik itu pada kelompok hasil analisis maupun kelompok pada data
kontrol. Sebagai contoh, objek i dikatakan memiliki ketepatan apabila objek
tersebut berada dalam kelompok 1 pada data kontrol dan kelompok 1 pada hasil
pengelompokan analisis gerombol.
2. Metode Penelitian
Data yang digunakan dalam tulisan ini adalah data sekunder yang diambil
dari tulisan tentang kredit usaha rakyat (KUR) suatu bank swasta di Kota
Denpasar [6]. Dalam data ini terdapat seratus objek yang telah terbagi menjadi
tiga kelompok dan dengan sembilan peubah yang memiliki skala pengukuran
yang beragam mulai dari nominal sampai interval. Tiga kelompok tersebut
digunakan sebagai kontrol dalam proses perbandingan yang akan dilakukan.
Teknik pengelompokan data yang digunakan dalam analisis gerombol adalah
teknik tak berhirarki yaitu menggunakan k-mean methods, sementara itu dalam
tampilan analisis biplot hanya akan menggunakan dua dimensi saja, sehingga
lebih mudah dalam penafsiran kelompok yang terbentuk.
Langkah-langkah analisis data dalam tulisan ini sebagai berikut.
1. Mempersiapkan data yang akan dianalisis dengan tahapan sebagai beikut.
a. Menghilangkan peubah dengan skala nominal dan mengubah peubah
dengan skala ordinal menjadi kontinu dengan Method of Successive
Interval (MSI) agar semua peubah yang akan digunakan nantinya akan
berskala kontinu, sehingga mampu dianalisis dengan analisis gerombol
dan biplot bersama-sama.
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 17-22
19
b. Melakukan standarisasi data pada hasil langkah a sebelumnya, agar satuan
pada setiap peubah dalam data yang digunakan sama.
2. Melakukan analisis gerombol dengan tahapan sebagai berikut.
a. Pengelompokan data dengan teknik tak berhirarki (k-means method),
memperhatikan jumlah kelompok yang nantinya akan dibentuk sudah
ditentukan.
b. Melakukan uji hipotesis beda rataan untuk dua populasi saling bebas, yaitu
pada kelompok-kelompok hasil analisis gerombol terhadap kelompok-
kelompok pada data kontrol.
c. Membandingkan hasil pengelompokan analisis gerombol dengan
pengelompokan pada data kontrol untuk mendapatkan persentase
ketepatan untuk semua objek pada data yang dianalisis.
3. Melakukan analisis biplot dengan tahapan sebagai berikut.
a. Pemilihan parameter 𝛽 = 1 pada dekomposisi matriks 𝑆 = 𝑈𝐿𝛽𝐿𝛽−1𝐴′
agar memberikan tampilan biplot yang menekankan pada gambaran jarak
antara pasangan baris sehingga baik digunakan untuk melihat kedekatan
objek-objeknya[5]
.
b. Pembentukan kelompok pada hasil analisis biplot yaitu dengan melakukan
proyeksi ortogonal setiap objek terhadap semua vektor (peubah) yang ada
dalam tampilan analisis biplot. Semua objek yang berada dalam satu
kelompok yang sama akan memiliki jarak yang relatif dekat terhadap suatu
peubah yang sama.
c. Melakukan analisis deskriptif pada kelompok dalam data kontrol untuk
melihat variansi setiap peubah dalam kelompok tersebut.
d. Membandingkan hasil pengelompokan analisis biplot dengan
pengelompokan pada data kontrol untuk mendapatkan persentase
ketepatan untuk semua objek pada data yang dianalisis.
4. Mengkomparasikan dua hasil analisis yang telah dilakukan.
3. Hasil dan Pembahasan
Pada langkah awal, dari sembilan peubah yang ada pada data KUR hanya
digunakan enam peubah dengan skala pengukuran kontinu dan satu peubah
dengan skala pengukuran ordinal. Peubah dengan skala ordinal ini selanjutnya
diubah menjadi skala pengukuran kontinu dengan Method of Successive Interval
(MSI). Sehingga pada analisis berikutnya digunakan data dengan tujuh peubah
kontinu. Berikutnya data tersebut distandarisasi untuk menyamakan satuannya,
data hasil standarisasi selanjutnya dikelompokkan menjadi tiga kelompok yaitu
sesuai dengan jumlah kelompok pada data kontrol. Pengelompokan dilakukan
dengan analisis gerombol yaitu dengan k-mean methods. Selanjutnya dilakukan
uji hipotesis beda rataan dua populasi saling bebas pada kelompok hasil analisis
gerombol dengan kelompok pada data kontrol. Hasil uji tersebut menyimpulkan
bahwa kelompok 1, 2 dan 3 pada pengelompokan hasil analisis gerombol masing-
I M. Anom Ariawan, I P.E. Nila Kencana, N.L.P. Suciptawati Komparasi Analsis Gerombol (Cluster)
dan Biplot dalam Pengelompokan
20
masing sama dengan kelompok 1, 2 dan 3 pada data kontrol, sehingga proses
perbandingan dapat dilakukan. Berdasarkan hasil perbadingan antara kelompok
hasil analisis gerombol dengan kelompok pada data kontrol, didapat 44 objek
berada dalam kelompok yang sama baik itu pada kelompok hasil analisis
gerombol maupun kelompok pada data kontrol, dengan kata lain didapatkan
persentase ketepatan sebasar 44%.
Setelah mendapatkan persentase ketepatan pada hasil pengelompokan
analisis gerombol, selanjutnya dilakukan analisis biplot. Hasil analisis biplot
ditampilkan pada Gambar 1. Hasil tersebut menunjukkan bahwa informasi yang
ditampilkan dari dimensi satu dan dua pada tampilan analisis biplot adalah sebesar
47% dari keseluruhan informasi dari data yang digunakan. Tampilan biplot pada
Gambar 1 juga memperlihatkan adanya korelsi antarpeubah yang ditunjukan oleh
sudut yang terbentuk antarpeubah tersebut, yaitu semakin kecil sudut yang
terbentuk antarpeubah maka korelasi antarpeubah tersebut makin besar. Peubah-
peubah yang saling berkorelasi yaitu X1 dengan X4, X5 dengan X6 dan X7 dengan
X9.
Selanjutnya dilakukan proyeksi ortogonal pada setiap titik koordinat objek
terhadap semua vektor peubah untuk mencari jarak setiap objek terhadap vektor
peubah dalam tampilan biplot yang dihasilkan. Berdasarkan hasil proyeksi
ortogonal dan korelasi antarpeubah pada Gambar 1, diperoleh hasil
pengelompokan objek pada analisis biplot dan ditampilkan pada Gambar 2.
Gambar 1. Tampilan Hasil Analisis Biplot
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 17-22
21
Gambar 2. Tampilan Biplot Dengan Pengelompokan Objek
Gambar 2 menunjukkan bahwa, pada setiap kelompok yang terbentuk
terdapat peubah penciri atau peubah yang paling dominan dalam kelompok
tersebut. Peubah penciri dapat dilihat dari panjang vektor dari peubah tersebut
yang lebih panjang dibandingkan vektor yang dibentuk oleh peubah lain dalam
satu kelompok yang sama. Pada kelompok 1, 2 dan 3 mempunyai peubah penciri
yaitu berturut-turut adalah X5, X3 dan X9.
Berikutnya dilakukan analisis deskriptif pada data kontrol untuk melihat
peubah dengan variansi terbesar pada masing-masing kelompok yang ada pada
data kontrol. Hasil analisis deskriptif diperoleh bahwa peubah dengan variansi
terbesar untuk kelompok 1, 2 dan 3 pada data kontrol masing-masing adalah X5,
X3 dan X9. Berdasarkan hasil analisis deskriptif dan pengelompokan objek pada
Gambar 2 dapat disimpulkan bahwa, kelompok 1 pada hasil pengelompokan
analisis biplot dan kelompok 1 pada data kontrol memiliki peubah dominan yang
sama yaitu X5. Selanjutnya, kelompok 2 pada hasil pengelompokan analisis biplot
juga memiliki peubah dominan yang sama dengan kelompok 2 pada data kontrol
yaitu X3. Pada kelompok 3 dari hasil pengelompokan analisis biplot dan kelompok
3 pada data kontrol juga memilki peubah dominan yang sama yaitu X9.
Selanjutnya dilakukan proses perbandingan antara kelompok pada data kontrol
dengan kelompok hasil analisis biplot. Hasilnya diperoleh persentase ketepatan
sebesar 52%.
Berdasarkan hasil perbandingan antara kelompok data kontrol dengan
kelompok hasil analisis gerombol dan analisis biplot, didapatkan bahwa
persentase ketepatan yang diperoleh dari hasil analisis gerombol dan analisis
biplot secara berturut-turut adalah 44% dan 51%. Hal ini berarti, pada
perbandingan yang dilakukan terlihat bahwa pengelompokan analisis biplot
I M. Anom Ariawan, I P.E. Nila Kencana, N.L.P. Suciptawati Komparasi Analsis Gerombol (Cluster)
dan Biplot dalam Pengelompokan
22
menghasilkan persentase ketepatan yang lebih baik dari pada pengelompokan
analisis gerombol.
4. Kesimpulan
Hasil penelitian diperoleh bahwa pengelompokan analisis biplot
menghasilkan persentase ketepatan yang lebih baik dari pada pengelompokan
analisis gerombol. Namun secara umum belum dapat dikatakan bahwa analisis
biplot lebih baik dari analisis gerombol dalam pengelompokan data dan begitu
juga sebaliknya.
Daftar Pustaka
[1] Bilodeau, Martin and Brenner. D. 1999. Theory of Multivariate Statistics.
New York: Spinger.
[2] Everitt, B. S., Landau. S., Leese. M., dan Stahl, D. 2011. Cluster Analysis.
Fifth Edition. London: John Wiley & Sons, Ltd.
[3] Gabriel, K.R. 1971. The Biplot Graphic Display of Matrices with Application
to Principal Componen Analysis. Biometrika 58(3): 453-467
[4] Johnson, R. A. and D. W. Wichern. 2007. Applied Multivariat Statistical
Analysis. Sixth Edition. New Jersey: Printice Hall.
[5] Kohler, Ulrich dan Magdalena Luniak. 2005. Data Inspection Using Biplot.
Berlin: Stata Corp LP.
[6] Kusumawardani, N. M. D., 2011. Pengklasifikasian Debitur Kredit Usaha
Rakyat (KUR) Dengan Analisis Deskriminan Dan Regresi Logistik Ordinal.
Skripsi. Jurusan Matematika, Fakultas Mipa dan Ilmu Pengetahuan Alam,
Universitas Udayana.
[7] Mattjik, A. A., dan I. M. Sumertajaya. 2011. Sidik Peubah Ganda. Bogor:
Institut Pertanian Bogor Press.
E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 23-28 ISSN: 2303-1751
1 Mahasiswa Jurusan Matematika FMIPA Universitas Udayana
2,3 Staf Pengajar Jurusan Matematika FMIPA Universitas Udayana 23
KARAKTERISTIK SEKTOR PERTANIAN DI PROVINSI BALI
MENURUT SUBSEKTOR PENYUSUN
PUTU OKA SURYA ARSANA1, MADE SUSILAWATI
2, KETUT JAYANEGARA
3
1,2,3Jurusan Matematika FMIPA Universitas Udayana, Bukit Jimbaran-Bali
e-mail: 1 [email protected],
Abstract
Bali instead of famous for tourism also popular at agriculture. One of them is
subak. It is a culture heritage in the world. To cope with this problem the
development in agriculture should be increased. The goal for this research are to
know the identifiier factors of agriculture devolopment in Bali, the most dominat
factors, and the variable which represent the development of agriculture in Bali.
The method of analysis used for this research is factors analysis. Factor analysis
is used to reduce the data or summary, for variable which is being changed to a
new variable called factor and still load many information contained in a real
variable. The method used in the factor analysis is principal component analysis
method. Many factors are determined by eigen values. The factor rotation which
used is varimax rotation. Based on the research results, got seven factors with the
diversities which can be explained are 76.417%. Factors dryland farming as the
most dominant factor identifier with the total value of the largest eigenvalues is
4.564 or 25.356% with variables representing these factors are widely planted
potatoes and pulses.
Keywords: factor Analysis, principal component analysis, eigen value, factor
rotation.
1. Pendahuluan
Pulau Bali selain terkenal dari sektor parawisata juga terkenal pada sektor
pertaniannya, contohnya sistem subak yang telah menjadi warisan budaya dunia.
Selain pertanian tanah sawah, Bali juga mempunyai indikator pertanian tanah
bukan sawah seperti perkebunan, tanaman ubi-ubian, dan palawija serta perikanan
yang kurang mendapatkan perhatian dari pemerintah. Untuk menyikapi hal
tersebut, maka pembangunan pada sektor pertanian harus lebih ditingkatkan
dengan cara mengetahui faktor-faktor penciri pembangunan sektor pertanian di
Provinsi Bali. Salah satu analisis peubah ganda yang dapat mengetahui faktor-
faktor penciri sektor pertanian di Provinsi Bali adalah analisis faktor. Dalam
penelitian ini akan dilakukan analisis faktor untuk mendapatkan faktor-faktor
mailto:[email protected]
P.Oka Surya Arsana, Made Susilawati, Ketut Jayanegara Karakteristik Sektor Pertanian di Provinsi
Bali Menurut Subsektor Penyusun
24
penciri dan mendapatkan peubah yang mewakili masing-masing faktor penciri
tersebut.
Analisis peubah ganda merupakan suatu bagian analisis statistika yang
menganalisis secara simultan peubah yang jumlahnya lebih dari dua dimana
analisisnya dilakukan secara serempak. Analisis peubah ganda merupakan
perluasan dari analisis univariat dan bivariat (Supranto, [5]).
Beberapa kegunaan penting dari analisis peubah ganda adalah (Siswadi, dan
Suharjo, [4]): a) Penyederhanaan struktur. Upaya ini dilakukan untuk memperoleh
cara-cara yang lebih mudah dalam mempresentasikan kompleksitas permasalahan
yang dihadapi, b) Pengelompokan peubah, akan dilihat apakah peubah-peubah
berada dalam satu kelompok atau tidak, c) Analisis kesalingtergantungan. Sasaran
dari analisis ini adalah untuk memeriksa kesalingtergantungan peubah-peubah, d)
Analisis ketergantungan. Dalam hal ini satu atau lebih peubah digunakan untuk
memeriksa ketergantungannya terhadap peubah lain, e) Pembentukan dan
pengujian hipotesis.
Analisis faktor merupakan salah satu teknik statistika multivariat berupa
metode interdependensi yang digunakan untuk meringkas informasi yang ada
dalam peubah awal menjadi satu set dimensi baru atau peubah ( factor). Hal ini
dilakukan dengan cara menentukan struktur melalui data summarization atau data
reduction (Hair et al , [2]).
Misalkan terdapat 𝑝 indikator dan 𝑝 faktor, maka dapat dibuat model
sebagai berikut (Sharma, [3]) :
𝑋 1 = 𝜆11𝐹1 + 𝜆12𝐹2 + . . . + 𝜆1𝑝𝐹𝑝 + ɛ1;
𝑋 2 = 𝜆21𝐹1 + 𝜆22𝐹2 + . . . + 𝜆2𝑝𝐹𝑝 + ɛ2;
⋮
𝑋 𝑝 = 𝜆𝑝1𝐹1 + 𝜆𝑝2𝐹2 + . . . + 𝜆𝑝𝑝𝐹𝑝 + ɛ𝑃
dengan 𝑋1,𝑋2, . . . , 𝑋𝑃 adalah indikator dari 𝑝 faktor, 𝜆11 ,𝜆12 , . . . , 𝜆 𝑝𝑝 adalah
muatan (pembobot) peubah ke-1 sampai ke-𝑝 pada faktor ke-1 sampai 𝑝,
𝐹1, 𝐹2, . . . , 𝐹𝑃 menyatakan faktor ke-1 sampai ke-𝑝 dan ɛ1, ɛ2, . . . , ɛ𝑃 faktor unik
untuk peubah ke-1 sampai ke- 𝑝.
Salah satu solusi dalam analisis faktor adalah dengan menggunakan
pendekatan Analisis Komponen Utama (AKU). Misal dari pengamatan 𝑝 peubah
dan 𝑛 objek, dapat ditulis dalam bentuk matriks berikut:
𝑋𝑛×𝑝 =
𝑥11 𝑥12𝑥21 𝑥22
⋯ 𝑥1𝑝⋯ 𝑥2𝑝
⋮ ⋮𝑥𝑛1 𝑥𝑛2
⋮ ⋮⋯ 𝑥𝑛𝑝
, Σ𝑝×𝑝 =
Σ11 Σ12Σ21 Σ22
⋯ Σ1𝑝⋯ Σ2𝑝
⋮ ⋮Σ𝑝1 Σ𝑝2
⋮ ⋮⋯ Σ𝑝𝑝
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 23-28
25
dengan E(X) = µ, matriks ragam Σ, dan komponen utamanya
𝐹𝑖 , 𝑖 = 1,2, . . . , 𝑝. 𝐹 1 = 𝑐11𝑋1 + 𝑐12𝑋2 + . . . + 𝑐1𝑝𝑋𝑝 = 𝑐1
′ 𝑋;
𝐹 2 = 𝑐21𝑋1 + 𝑐22𝑋2 + . . . + 𝑐2𝑝𝑋𝑝 = 𝑐2′ 𝑋;
⋮ 𝐹 𝑝 = 𝑐𝑝1𝑋1 + 𝑐𝑝2𝑋2 + . . . + 𝑐𝑝𝑝𝑋𝑝 = 𝑐𝑝
′ 𝑋.
Bentuk persamaan dapat dituliskan
𝐹𝑝×𝑙 = 𝐶𝑝×𝑝′ 𝑋𝑝×𝑙 ,
𝐹1𝐹2⋮𝐹1
=
𝑐11 𝑐12𝑐21 𝑎22
⋯ 𝑐1𝑝⋯ 𝑐2𝑝
⋮ ⋮𝑐𝑝1 𝑎𝑝2
⋮ ⋮⋯ 𝑐𝑝𝑝
𝑥1𝑥2⋮𝑥𝑝
Komponen utama 𝐹1 = 𝑐1′ 𝑋 diharapkan memiliki keragaman yang
maksimum, sehingga dimungkinkan untuk memilih muatan (weight) atau
koefisien nilai komponen sehingga faktor yang pertama menjelaskan sebagian
besar porsi seluruh varians atau menyerap sebagian besar varians seluruh peubah.
Kemudian muatan yang kedua dapat dipilih, sehingga faktor yang kedua
menyerap sebagian besar sisa varians, setelah diambil faktor pertama, dengan
syarat bahwa faktor yang kedua tidak berkorelasi dengan faktor pertama. Prinsip
yang sama dapat dipergunakan untuk memilih faktor selanjutnya. Jadi faktor bisa
diperkirakan sehingga nilai faktor yang satu tidak berkorelasi dengan nilai faktor
lainnya.
2. Metode Penelitian
Sumber data pada penelitian ini adalah data sekunder yang diperoleh dari
Badan Pusat Statistik (BPS) mengenai indikator pertanian di Bali tahun 2011.
Data yang digunakan dalam penelitian mencakup 57 kecamatan yang ada di
Provinsi Bali yang berkaitan dengan sektor pertanian di Bali. berupa data
kuantitatif dengan skala rasio yaitu Jumlah Penduduk (X1), Luas Panen Padi
Sawah (X2), Luas Panen Ubi-ubian dan Palawija (X3), Luas Panen Tanam Sayur-
sayuran (X4), Jumlah Produksi Buah-Buahan (X5), Jumlah Populasi Ternak Besar
(X6), Jumlah Populasi Ternak Unggas (X7), Luas Pertanian Tanah Sawah (X8),
Luas Pertanian Tanah Bukan Sawah (X9), Jumlah Produksi Perikanan Laut (X10),
Jumlah Produksi Perikanan Darat (X11), Jumlah Produksi Padi Sawah (X12),
Jumlah Produksi Hasil Perkebunan (X13), Luas Wilayah Kecamatan (X14), Luas
Tanaman Perkebunan (X15), Luas Tanam Ubi – Ubian dan Palawija (X16), Jumlah
Produksi Ubi – Ubian dan Palawija (X17), Luas Tanam Padi Sawah (X18).
(BPS, [1]).
Langkah-langkah dalam penelitian ini adalah: (1) mempersiapkan data pada
Microsoft Excel 2007 yang akan diolah dengan menggunakan software SPSS.20;
P.Oka Surya Arsana, Made Susilawati, Ketut Jayanegara Karakteristik Sektor Pertanian di Provinsi
Bali Menurut Subsektor Penyusun
26
(2) menganalisis data dengan menggunakan analisis faktor dengan metode analisis
komponen utama; (3) memeriksa banyaknya faktor yang terbentuk dengan melihat
nilai eigen yang lebih besar dari satu; (4) memeriksa peubah-peubah masuk ke
faktor mana;(5) melakukan rotasi faktor dengan menggunakan rotasi varimax; (6)
mendapatkan faktor penciri beserta peubahnya dan melakukan interpretasi faktor.
3. Hasil dan Pembahasan
Sebelum melakukan analisis faktor dilakukan terlebih dahulu uji kelayakan
data dengan mengunakan uji KMO dan uji bartlett. Hasil uji KMO dan uji bartlett
dapat dilihat pada Tabel 3.2.
Nilai KMO and Bartlett’s Test untuk korelasi antarpeubah yang diinginkan adalah
> 0,5. Signifikansi penelitian ini adalah 0,05. Dari Tabel 3.2 diperoleh nilai KMO
sebesar 0,602 berarti data lebih dari cukup untuk analisis faktor.
Berdasarkan analisis dengan menggunakan analisis faktor, faktor yang
terbentuk dengan melihat nilai eigen yang lebih besar dari satu didapatkan 7
faktor dengan total keragaman yang dapat dijelaskan sebesar 76,417%. Faktor 1
merupakan faktor penciri yang paling dominan dengan total nilai eigen terbesar
yaitu 4,564 atau 25,356%.
Selanjutnya dilakukan rotasi faktor untuk mengetahui peubah-peubah masuk
faktor mana dan melakukan interpretasi faktor, didapatkan hasil sebagai berikut :
a) Faktor 1 dinamakan faktor pertanian lahan kering terdiri dari lima peubah yaitu
luas tanam ubi-ubian dan palawija, jumlah produksi ubi-ubian dan palawija,
jumlah populasi ternak besar, luas wilayah kecamatan, dan luas pertanian tanah
bukan sawah. Faktor ini menerangkan varian terbesar dari faktor lain yaitu sebesar
25,356 %. Peubah yang memiliki muatan faktor terbesar adalah luas tanam ubi-
ubian dan palawija yaitu sebesar 0,920, b) Faktor 2 dinamakan faktor pertanian
lahan basah terdiri dari tiga peubah yaitu luas tanam padi sawah, jumlah produksi
padi sawah, dan luas pertanian tanah sawah. Faktor ini mampu menjelaskan varian
sebesar 15,007%. Peubah yang memiliki muatan faktor terbesar adalah luas tanam
padi sawah yaitu sebesar 0,937, c) Faktor 3 dinamakan faktor perkebunan terdiri
dari dua peubah yaitu jumlah produksi hasil perkebunan, dan luas tanaman
perkebunan. Faktor ini mampu menjelaskan varian sebesar 9,645%. Peubah yang
memiliki muatan faktor terbesar adalah jumlah produksi hasil perkebunan yaitu
sebesar 0,764, d) Faktor 4 dinamakan faktor holtikultura terdiri dari dua peubah
Tabel 3.2 Hasil KMO and Bartlett's test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. ,602
Bartlett's Test of Sphericity
Approx. Chi-Square 604,752
Df 153
Sig. ,000
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 23-28
27
yaitu jumlah produksi buah-buahan, dan luas tanam sayur-sayuran. Faktor ini
mampu menjelaskan varian sebesar 8,075%. Peubah yang memiliki muatan faktor
terbesar adalah jumlah produksi buah-buahan yaitu sebesar 0,759, e) Faktor 5
dinamakan faktor luas panen padi sawah terdiri dari dua peubah yaitu luas panen
padi sawah, dan jumlah penduduk. Faktor ini mampu menjelasan varian sebesar
6,517%. Peubah yang memiliki muatan faktor terbesar adalah luas panen padi
sawah yaitu sebesar 0,782, f) Faktor 6 dinamakan faktor luas panen ubi-ubian dan
palawija terdiri dari dua peubah yaitu luas panen ubi-ubian dan palawija, dan
jumlah populasi ternak unggas. Faktor ini mampu menjelaskan varian sebesar
6,078%. Peubah yang memiliki muatan faktor terbesar adalah luas panen ubi-
ubian dan palawija yaitu sebesar 0,761, dan g) Faktor 7 dinamakan faktor
perikanan terdiri dari dua peubah yaitu jumlah produksi perikanan laut, dan
jumlah produksi perikanan darat. Faktor ini mampu menjelaskan varian sebesar
5,739 %. Peubah yang memiliki muatan faktor terbesar adalah jumlah produksi
perikanan laut yaitu sebesar 0,792.
4. Kesimpulan
Berdasarkan hasil analisis diperoleh kesimpulan bahwa:
1. Didapatkan tujuh faktor penciri pembangunan sektor pertanian di Bali yaitu
faktor pertanian lahan kering, faktor pertanian lahan basah, faktor perkebunan,
faktor holtikultura, faktor luas panen padi sawah, faktor luas panen ubi-ubian
dan palawija dan faktor perikanan.
2. Faktor penciri yang paling dominan dalam pembangunan sektor pertanian di
Provinsi Bali adalah faktor pertanian lahan kering dengan total initial nilai
eigen terbesar yaitu 4,564 atau 25,356%.
3. Peubah yang mewakili masing-masing faktor yaitu luas tanam ubi-ubian dan
palawija dengan muatan faktor sebesar 0,920 mewakili faktor pertanian lahan
kering, luas tanam padi sawah dengan muatan faktor sebesar 0,937 mewakili
faktor pertanian lahan basah, jumlah produksi hasil perkebunan dengan
muatan faktor sebesar 0,764 mewakili faktor perkebunan, jumlah produksi
buah-buahan dengan muatan faktor sebesar 0,759 mewakili faktor
holtikultura, luas panen padi sawah dengan muatan faktor sebesar 0,782
mewakili faktor luas panen padi sawah, luas panen ubi-ubian dan palawija
dengan muatan faktor sebesar 0,761 mewakili faktor luas panen ubi-ubian dan
palawija, jumlah produksi perikanan laut dengan muatan faktor sebesar 0792
mewakili faktor perikanan.
P.Oka Surya Arsana, Made Susilawati, Ketut Jayanegara Karakteristik Sektor Pertanian di Provinsi
Bali Menurut Subsektor Penyusun
28
Daftar Pustaka
[1] BPS.2012. Bali dalam Angka 2012. Bali.
[2] Hair, Joseph F., Rilph F. Anderson, Ronald L. Tahtam dan William C. Black.
2006. Multivariate Data Analysis. Sixth Edition. New Jersey : Prentice-Hall
Inc.w
[3] Sharma, S.1996. Applied Multivariate Techniques.John Wiley and Sons, Inc.
New York.
[4] Siswadi dan Budi Suharjo. 1998. Analisis Eksplorasi Data Peubah Ganda.
IPB Press kampus IPB Taman Kencana Bogor. Bogor.
[5] Supranto, J. 2004. Analisis Multivariat (Arti dan Interpretasi). Rineka Cipta.
Jakarta.
E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 29-32 ISSN: 2303-1751
1 Mahasiswa Jurusan Matematika FMIPA Universitas Udayana
2,3 Staf Pengajar Jurusan Matematika FMIPA Universitas Udayana 29
HUBUNGAN PENGARUH PENOLONG KELAHIRAN
TERHADAP STATUS KELAHIRAN BAYI DENGAN
KONTROL VARIABEL CONFOUNDING
DI KABUPATEN BULELENG
(STUDI KASUS: PUSKESMAS SUKASADA II)
KADEK NOVIA DWIJAYANTHI
1, I GUSTI AYU MADE SRINADI
2,
NI LUH PUTU SUCIPTAWATI3
1,2,3Jurusan Matematika FMIPA Universitas Udayana, Bukit Jimbaran-Bali
e-mail: [email protected],
Abstract
One indicator of the Human Development Index (HDI) is the Infant
Mortality Rate (IMR). IMR is lower HDI showed a better area when compared
with other regions for different values of the same indicators. This study aims to
determine the relationship between the birth attendants birth status and
confounding variables that affect the status of births in Buleleng regency, with
Sukasada II health center located in District Sukasada - Buleleng regency as the
location of the observed cases of infant mortality. Results of analysis using
logistic regression showed that (1) birth attendants, (2) maternal age, and (3)
income household heads have a real influence on the status of the baby's birth.
Birth status with medical birth attendants have the opportunity to live 2,427 times
compared with non-medical birth attendants with controlled variables maternal
age and income of the family head.
Keywords: IPM, Infant Mortality, Sukasada district, Buleleng regency, Logistic
Regression.
1. Pendahuluan
Kesehatan merupakan salah satu unsur penting dalam menentukan indeks
pembangunan Manusia (IPM). Dengan kondisi kesehatan yang optimal
masyarakat suatu daerah mempunyai kemampuan yang lebih besar untuk
memenuhi kebutuhannya [2].
Angka kematian bayi merupakan salah satu indikator yang sangat penting
dalam menentukan tingkat kesehatan masyarakat, karena dapat menggambarkan
kesehatan penduduk secara umum. Tingginya angka kematian bayi tentu saja
dipengaruhi oleh banyak faktor salah satunya adalah masih kurangnya
kemampuan dan keterampilan penolong persalinan. Pemilihan penolong
persalinan tidak hanya memengaruhi status kelahiran bayi namun memengaruhi
angka harapan hidup ibu yang melakukan persalinan [2].
mailto:[email protected]:[email protected]:[email protected]
K. N.Dwijayanthi, I G.A.M. Srinadi, N.L.P.Suciptawati Hubungan Pengaruh Penolong Kelah i ran Terhadap Status Kelah i ran Bayi dengan
Kont rol Variabel Confounding
30
Selain penolong kelahiran, angka kematian bayi juga dikontrol oleh
beberapa faktor yaitu umur ibu, pendidikan ibu, jenis kelamin bayi, jarak
kelahiran, urutan kelahiran dan penghasilan keluarga.
Penelitian terdahulu yang dilakukan oleh Ardika [1] untuk mengetahui
faktor apa saja yang memengaruhi angka kematian bayi diperoleh hasil bahwa
umur ibu dan pengaruh bersama antara pendidikan ibu dan jenis kelamin bayi
yang memengaruhi status kelahiran bayi. Penolong kelahiran tidak berpengaruh
terhadap status kelahiran bayi. Sehingga terjadi ketidakseimbangan dalam
menganalisis suatu kasus akibat adanya pengaruh variabel perancu atau
confounding.
Tujuan dari penelitian ini adalah untuk mengetahui ada tidaknya pengaruh
penolong kelahiran dan status kelahiran bayi di desa-desa yang berada di bawah
tanggung jawab Puskesmas Sukasada II dan untuk mengetahui variabel perancu
yang berpengaruh signifikan terhadap status kelahiran bayi di desa-desa yang
berada di bawah tanggung jawab Puskesmas Sukasada II
Confounding adalah suatu variabel dalam penelitian yang tidak tercakup
dalam hipotesis penelitian akan tetapi muncul dalam penelitian dan berpengaruh
terhadap variabel tidak bebas. Pengaruhnya mencampuri atau berbaur dengan
variabel bebas (Yasril dan Kasjono, [4]). Confounding adalah distorsi oleh
variabel luar yang dapat mengacaukan atau mempengaruhi perhitungan
pendugaan pengaruh variabel bebas terhadap suatu kasus (Murti, [3]).
Variabel confounding merupakan variabel luar yang pengaruhnya
mencampuri pengaruh variabel penelitian terhadap suatu kasus (Yasril dan
Kasjono, [4]). Ada tiga kriteria variabel confounding yaitu: (1) Merupakan faktor
risiko bagi kasus yang diteliti; (2) Mempunyai hubungan dengan variabel bebas;
dan (3) Bukan merupakan bentuk antara dalam hubungan kausal variabel bebas
dan variabel tidak bebas.
Langkah-langkah Uji Confounding: (1) Melakukan seleksi variabel kandidat
untuk masuk dalam model dengan cara analisis regresi logistik dengan p- Value
< 0,25; (2) Melakukan pemodelan regresi logistik ganda terhadap semua variabel
kandidat; (3) Melakukan uji interaksi antara variabel tidak bebas dengan variabel
bebas dan variabel confounding; (4) Melakukan uji confounder dengan
menghitung selisih OR jika > 10% maka variabel tersebut merupakan variabel
confounding; (5) Pemodelan akhir dan interpretasi model (Yasril dan
Kasjono,[4]).
2. Metode Penelitian
Data yang digunakan adalah data ibu rumah tangga yang pernah melahirkan
di desa-desa yang berada di bawah tanggung jawab Puskesmas Sukasada II
kecamatan Sukasada Kabupaten Buleleng, dengan sampel penelitian sebanyak 82
orang.
e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 29-32
31
Status kelahiran bayi (Y) merupakan variabel respon yang dikategorikan
menjadi dua, yaitu status kelahiran bayi hidup dan status kelahiran bayi
meninggal. Variabel bebas terdiri dari penolong kelahiran 𝑋1 , Umur Ibu 𝑋2 ,
Jenis Kelamin Bayi 𝑋3 , dan Jarak Kelahiran Bayi 𝑋4 . Variabel confounder
terdiri dari Pendidikan Ibu 𝑍1 , Penghasilan Keluarga 𝑍2 , dan Urutan
Kelahiran 𝑍3 . Selanjutnya melakukan proses langkah-langkah uji confounding
untuk melakukan analisis penelitian
3. Hasil dan Pembahasan
Analisis regresi berganda dalam penelitian bertujuan untuk menganalisis
hubungan antara variabel bebas dan beberapa variabel confounding terhadap
variabel status kelahiran bayi. Analisis regresi yang digunakan adalah analisis
regresi logistik ganda dengan variabel kandidat yang masuk dalam model adalah
variabel bebas dan variabel confounding dengan nilai p-Value < 0,25. Berdasarkan
analisis ini diperoleh variabel kandidat yang masuk dalam model adalah variabel
penolong kelahiran (p-Value = 0,000 < 0,25), umur ibu (p-Value = 0,187 < 0,25),
pendidikan ibu (p-Value = 0,001 < 0,25) dan penghasilan keluarga (p-Value =
0,003 < 0,25).
Dari hasil analisis tersebut kemudian dilakukan analisis regresi logistik
ganda. Variabel yang masuk dalam model regresi logistik adalah variabel yang
mempunyai p-Value kurang dari 0,05. Hasil regresi logistik ganda diperoleh
variabel penolong kelahiran (p-Value = 0,000 < 0,05), umur ibu (p-Value = 0,013
< 0,05) dan penghasilan keluarga (p-Value = 0,03 < 0,05) yang masuk ke dalam
model.
Kemudian dilakukan pemeriksaan kemungkinan adanya interaksi antar
variabel bebas dan confounding yaitu antara penolong kelahiran dengan
penghasilan keluarga dan antara umur ibu dengan penghasilan keluarga. Dari
analisis tersebut tidak terjadi interaksi antara variabel bebas dan variabel
confounding.
Selanjutnya dilakukan pemeriksaan confounding yaitu dengan mengevaluasi
variabel penghasilan keluarga yang diduga sebagai variabel confounding dengan
membandingkan nilai OR variabel penolong kelahiran dan umur ibu dengan atau
tanpa variabel penghasilan keluarga. Setelah dilakukan analisis diperoleh nilai OR
penolong kelahiran sebesar 19,0% > 10 % dan nilai OR umur ibu sebesar 10% >
10 % maka variabel penghasilan kepala keluarga merupakan variabel
confounding, sehingga diperoleh model regresi logistik adalah:
Log p (Status Kelahiran ) = –3,169 – 3,877 (Penolong kelahiran) + 0,142 (Umur
Ibu) + 0,375 (Penghasilan Keluarga)
Menyatakan bahwa ibu yang melahirkan dengan penolong kelahiran medis
menurunkan risiko untuk status kelahiran meninggal sebesar 0,021 kali
K. N.Dwijayanthi, I G.A.M. Srinadi, N.L.P.Suciptawati Hubungan Pengaruh Penolong Kelah i ran Terhadap Status Kelah i ran Bayi dengan
Kont rol Variabel Confounding
32
dibandingkan penolong kelahiran nonmedis setelah dikontrol variabel penghasilan
keluarga.
4. Kesimpulan
Kesimpulan yang dapat diambil berdasarkan hasil analisis dan pembahasan
yang dilakukan pada bab sebelumnya adalah status kelahiran bayi dipengaruhi
oleh penolong kelahiran, Umur ibu dan penghasilan kepala keluarga.
Model Regresi Logistik Ganda yang diperoleh dari pembahasan tersebut yaitu:
Log p ( Status Kelahiran ) = –3,169 – 3,877 ( Penolong kelahiran ) + 0,142 (
Umur Ibu ) + 0,375 ( Penghasilan Keluarga )
Dari model yang diperoleh, dapat dijelaskan bahwa ibu yang melahirkan dengan
penolong kelahiran medis menurunkan risiko untuk status kelahiran meninggal
sebesar 0,021 kali dibandingkan dengan penolong kelahiran nonmedis setelah
dikontrol variabel penghasilan kepala keluarga.
Daftar Pustaka
[1] Ardika, I Gusti Ngurah. 2011 . Faktor-Faktor yang Mempengaruhi
Kematian Bayi di Kabupaten Buleleng . Universitas Udayana
[2] Dinas Kesehatan [Dikes] Kabupaten Buleleng. 2009 . Profil Kesehatan
Kabupaten Buleleng Tahun 2008. Dikes Kabupaten Buleleng. Singaraja.
[3] Murti, Bhisma. 2003. Prinsip dan Metode Riset Epidemiologi. Gadjah Mada
University Press, Yogyakarta
[4] Yasril dan Kasjono.2008. Analisis Multivariat. Mitra Cendikia Press,
Yogyakarta
E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 33- 39 ISSN: 2303-1751
1 Mahasiswa Jurusan Matematika FMIPA Universitas Udayana
2,3 Staf Pengajar Jurusan Matematika FMIPA Universitas Udayana 33
VARIABEL LATEN SEBAGAI MODERATOR DAN MEDIATOR
DALAM HUBUNGAN KAUSAL
I KOMANG GEDE ANTARA1, I PUTU EKA NILA KENCANA
2,
KETUT JAYANEGARA3
1,2,3Jurusan Matematika FMIPA Universitas Udayana, Bukit Jimbaran-Bali
e-mail: [email protected],
Abstract
Latent variables are variables that can not be measured directly. In analysis
of causal relationship involving three latent variables, one latent variable can be
a moderator or mediator variables. Goodness of Fit moderation and mediation
model of latent variables is affected by the value of the canonical correlation
between moderator/mediator latent variables with the independent latent
variables and dependent latent variables. If the value of both canonical
correlation is well , so the Goodness of Fit models of mediation is getting better,
while the opposite Goodness of Fit models will be better moderation.
Keywords: Latent Variables, Moderator, Mediator, Canonical Correlation
1. Pendahuluan
Pada perkembangan analisis hubungan variabel, terutama analisis hubungan
kausal, tidak hanya melibatkan dua variabel yaitu variabel bebas (independent
variable) dan variabel terikat (dependent variable) akan tetapi juga melibatkan
variabel ketiga yang bisa berupa variabel moderator (moderation variable) atau
variabel mediator (mediation variable) [1]. Variabel moderator berfungsi untuk
memperkuat atau melemahkan pengaruh variabel bebas, sedangkan variabel
mediator berperan untuk menghantarkan pengaruh variabel bebas terhadap
variabel terikat [7].
Lebih jauh mengenai perkembangan analisis hubungan variabel, saat ini
juga berkembang analisis yang melibatkan suatu variabel yang tidak terukur atau
dikenal dengan analisis variabel laten[4]
, terutama analisis dalam dunia kesehatan,
psikologi dan sosial. Pada analisis dengan meggunakan variabel laten dikenal dua
analisis model yaitu model terukur (measurable model) dan model struktural
(structural model)[8]. Model terukur merupakan model yang berkaitan dengan
hubungan antara variabel laten dengan indikatornya, sedangkan model struktural
merupakan model yang berkaitan dengan hubungan antara variabel laten dengan
variabel laten yang lain [3].
mailto:[email protected]:[email protected]:[email protected]
I K. Gede Antara, I P.E. Nila Kencana, Ketut Jayanegara Variabel Laten Sebagai Moderator dan
Mediator dalam Hubungan Kausal
34
Pada model struktural, apabila hubungan yang dibangun merupakan
hubungan kausal maka satu variabel laten akan berperan sebagai variabel bebas
(laten eksogen) dan variabel laten lainnya sebagai variabel terikat (laten endogen).
Selanjutnya apabila hubungan kausal yang terjadi melibatkan tiga variabel laten
maka variabel laten yang ketiga dapat berupa moderator atau mediator pada