E-Jurnal Matematika · 2017. 6. 6. · Outlier 1. Pendahuluan Analisis regresi linear berganda...

OPEN JOURNAL SYSTEMS

Journal Help

USER

Username

Password

Remember me

Log In

NOTIFICATIONS

View

Subscribe / Unsubscribe

JOURNAL CONTENT

Search

All

E - J u r n a l

M a t e m a t i k a

E-Jurnal Matematika file:///F:/NILA FILE/e-JURNAL MATEMATIKA/E-JURNAT MATEMA...

1 of 2 7/19/2014 2:15 PM

Search

Browse

By Issue

By Author

By Title

Other Journals

FONT SIZE

INFORMATION

For Readers

For Authors

For Librarians

HOME ABOUT LOG IN REGISTER SEARCH CURRENT ARCHIVES

Home > E-Jurnal Matematika

E-Jurnal Matematika

E-Jurnal Matematika merupakan salah satu jurnal elektronik yang ada di Universitas Udayana, sebagai media komunikasi antar

peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

matematika dibidang ilmu lainnya. Jurnal ini lahir sebagai salah satu bentuk nyata peran serta jurusan Matematika FMIPA UNUD

guna mendukung percepatan tercapainya target mutu UNUD, selain itu jurnal ini terbit didorong oleh surat edaran Dirjen DIKTI

tentang syarat publikasi karya ilmiah bagi program Sarjana di Jurnal Ilmiah. E-jurnal Matematika juga menerima hasil-hasil

penelitian yang tidak secara langsung berkaitan dengan tugas akhir mahasiswa meliputi penelitian atau artikel yang merupakan

kajian keilmuan.

Editorial Team

Ketua : Desak Putu Eka Nilakusumawati, S.Si., M.Si

Sekretaris : I Made Eka Dwipayana S.Si. M.Si.

Penyunting :

Tjokorda Bagus Oka Ph.D.1.

Komang Dharmawan Ph.D.2.

Drs. GK Gandhiadi MT.3.

Ir. I Komang Gde Sukarsa M.Si.4.

Ir. I Putu Eka Nila Kencana MT5.

ISSN: 2303-1751

E-Jurnal Matematika file:///F:/NILA FILE/e-JURNAL MATEMATIKA/E-JURNAT MATEMA...

2 of 2 7/19/2014 2:15 PM

OPEN JOURNAL SYSTEMS

Journal Help

USER

Username

Password

Remember me

Log In

NOTIFICATIONS

View

Subscribe / Unsubscribe

JOURNAL CONTENT

Search

All

Search

Browse

By Issue

By Author

By Title

Other Journals

FONT SIZE

E - J u r n a l M a t e m a t i k a

Vol 2, No 4 (2013) http://ojs.unud.ac.id/index.php/mtk/issue/view/1048

1 of 3 7/19/2014 2:26 PM

INFORMATION

For Readers

For Authors

For Librarians

HOME ABOUT LOG IN REGISTER SEARCH CURRENT ARCHIVES

Home > Archives > Vol 2, No 4 (2013)

Vol 2, No 4 (2013)

Table of Contents

ArticlesPERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI

MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA

PDF

NI WAYAN YULIANI, I KOMANG GDE SUKARSA, I GUSTI AYU MADE SRINADI 1-5

PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM COVARIANCE DETERMINANT

(LMS-MCD) DALAM REGRESI KOMPONEN UTAMA

PDF

I PUTU EKA IRAWAN, I KOMANG GDE SUKARSA, NI MADE ASIH 6-10

PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL (ZINB) UNTUK PENDUGAAN

KEMATIAN ANAK BALITA

PDF

NI MADE SEKARMINI, I KOMANG GDE SUKARSA, I GUSTI AYU MADE SRINADI 11-16

KOMPARASI ANALISIS GEROMBOL (CLUSTER) DAN BIPLOT DALAM PENGELOMPOKAN PDF

I MADE ANOM ARIAWAN, I PUTU EKA NILA KENCANA, NI LUH PUTU SUCIPTAWATI 17-22

KARAKTERISTIK SEKTOR PERTANIAN DI PROVINSI BALI MENURUT SUBSEKTOR PENYUSUN PDF

PUTU OKA SURYA ARSANA, MADE SUSILAWATI, KETUT JAYANEGARA 23-28

HUBUNGAN PENGARUH PENOLONG KELAHIRAN TERHADAP STATUS KELAHIRAN BAYI

DENGAN KONTROL VARIABEL CONFOUNDING DI KABUPATEN BULELENG (STUDI KASUS:

PUSKESMAS SUKASADA II)

PDF


2 of 3 7/19/2014 2:26 PM

KADEK NOVIA DWIJAYANTHI, I GUSTI AYU MADE SRINADI, NI LUH PUTU SUCIPTAWATI 29-32

VARIABEL LATEN SEBAGAI MODERATOR DAN MEDIATOR DALAM HUBUNGAN KAUSAL PDF

I KOMANG GEDE ANTARA, I PUTU EKA NILA KENCANA, KETUT JAYANEGARA 33-39

PERUMUSAN PREMI BULANAN ASURANSI KESEHATAN INDIVIDU PERAWATAN RUMAH SAKIT

(ANUITAS HIDUP PEMBAYARAN BULANAN)

PDF

AGUSTINA PAULA THERESIA PUTRI LAHALLO, I NYOMAN WIDANA, DESAK PUTU EKA

NILAKUSMAWATI

40-45

PENGKLASIFIKASIAN DEBITUR DENGAN MENGGUNAKAN ALGORITMA GRAHAM SCAN

DALAM PENGAPLIKASIAN CONVEX HULL

PDF

AGUS EKA ARIESTA, G.K. GANDHIADI, NI KETUT TARI TASTRAWATI, I PUTU EKA NILA

KENCANA

46-52

ISSN: 2303-1751


3 of 3 7/19/2014 2:26 PM

E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 1- 5 ISSN: 2303-1751

1 Mahasiswa Jurusan Matematika FMIPA Universitas Udayana

2,3 Staf Pengajar Jurusan Matematika FMIPA Universitas Udayana 1

PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA

DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN

PADA REGRESI LINEAR BERGANDA

NI WAYAN YULIANI

1, I KOMANG GDE SUKARSA

2,

I GUSTI AYU MADE SRINADI3

1,2,3Jurusan Matematika FMIPA Universitas Udayana, Bukit Jimbaran-Bali

e-mail: [email protected],

[email protected],

[email protected]

Abstract

Multiple linear regression analysis with a lot of independent variable always

makes many problems because there is a relationship between two or more

independent variables. The independent variables which correlated each other

are called multicollinearity. Principal component analysis which based on

variance covariance matrix is very sensitive toward the existence of outlier in the

observing data. Therefore in order to overcome the problem of outlier it is needed

a method of robust estimator toward outlier. ROBPCA is a robust method for

PCA toward the existence of outlier in the data. In order to obtain the robust

principal component is needed a combination of Projection Pursuit (PP) with

Minimum Covariant Determinant (MCD). The results showed that the ROBPCA

method has a bias parameter and Mean Square Error (MSE) parameter lower

than Principal Component Regression method. This case shows that the ROBPCA

method better cope with the multicollinearity observational data influenced by

outlier.

Keywords: Multiple Linear Regression, Principal Component Regression,

ROBPCA (Robust Principal Component Analysis), multicollinearity,

Outlier

1. Pendahuluan

Analisis regresi linear berganda adalah salah satu metode statistika yang

digunakan untuk mengetahui pengaruh sebuah variabel tidak bebas (dependent

variable) dengan dua atau lebih variabel bebas (independent variable)[2]. Adapun

tujuan dari analisis regresi linier berganda adalah mengetahui seberapa besar

pengaruh beberapa variabel bebas terhadap variabel tidak bebas dan juga dapat

meramalkan nilai variabel tidak bebas apabila seluruh variabel bebas sudah

diketahui nilainya.

Pada analisis regresi linier berganda dengan banyak variabel bebas, sering

timbul masalah karena adanya hubungan antara dua atau lebih variabel bebas.

Variabel bebas yang saling berkorelasi disebut multikolineari. Permasalahan yang

terjadi pada analisis regresi berganda dapat mengakibatkan hasil analisis yang

mailto:[email protected]:[email protected]:[email protected]

Ni Wayan Yuliani, Komang Gde Sukarsa, I G.A.M. Srinadi Perbandingan Regresi Komponen Utama

& ROBPCA dalam Mengatasi

Multikolinearitas & Pencilan

2

kurang akurat. Multikolinearitas merupakan salah satu masalah yang terjadi pada

analisis regresi linear berganda. Masalah lain yang dapat memengaruhi hasil

analisis data adalah pencilan (outlier). Pada penelitian ini akan dibahas dua

permasalahan statistik tersebut.

Pada kasus multikolinearitas, korelasi antar variabel akan menyebabkan

jumlah kuadrat galat yang semakin besar sehingga menghasilkan keputusan yang

tidak significant. Kasus multikolinearitas juga sangat berpengaruh pada bentuk

matriks. Pada pendugaan parameter 𝛽 = 𝑋′𝑋 −1𝑋′𝑌, apabila terjadi

multikolinearitas maka matriks 𝑋′𝑋 singular, sehingga persamaan untuk

pendugaan estimasi parameter tidak lagi mempunyai penyelesaian yang tunggal.

Hal ini akan berdampak pada dugaan koefisien variabel tidak tunggal, melainkan

tidak terhingga banyaknya sehingga tidak mungkin untuk menduganya [3].

Metode regresi komponen utama (Principal Component Regression)

merupakan salah satu teknik dalam mengatasi multikolinearitas dengan cara

mereduksi variabel–variabel yang ada menjadi beberapa variabel baru yang saling

bebas dan merupakan kombinasi linier dari variabel asal (Montgomery [1]).

Dalam menentukan komponen utama pada metode Regresi Komponen Utama

yakni melalui tahapan Principal Component Analysis (PCA). Analisis komponen

utama yang berdasarkan matriks varian kovarian sangat sensitif terhadap adanya

pencilan pada data pengamatan, sehingga untuk mengatasi masalah pencilan

diperlukan suatu metode penduga yang tegar terhadap pencilan. ROBPCA

(Robust Principal Component Analysis) adalah suatu metode yang kuat (robust)

untuk PCA terhadap keberadaan pencilan pada data, untuk mendapatkan

komponen utama yang robust diperlukan penggabungkan konsep Projection

Pursuit (PP) dengan penduga robust Minimum Covariance Determinant

(MCD)[4].

Penduga robust MCD merupakan nilai matriks rata-rata dan matriks

kovarian dari sebagian pengamatan yang meminimumkan determinan matriks

kovarian. Penduga ini didapat dengan cara mencari h pengamatan yang

memberikan nilai minimum dari matrik kovarian (Sunaryo, [4]).

Nilai matriks rata-rata 𝑡𝑙 dan matriks kovarians 𝐶𝑙 dirumuskan sebagai:

𝑡𝑙 =1

ℎ 𝐻𝑏

𝑇 .𝑉∗

𝐶𝑙 =1

ℎ 𝐻𝑏 − 𝑉

∗ 𝑡𝑙 𝑇 𝑇 𝐻𝑏 − 𝑉

∗ 𝑡𝑙 𝑇

2. Metode Penelitian

Data yang digunakan pada penelitian ini adalah data simulasi yang diperoleh

dengan membangkitkan data yang berdistribusi normal, pemeriksaan

multikolinearitas, pemeriksaan pencilan, serta penyelesaian Regresi Komponen

Utama dan Robust Principle Component Analisys. Software yang digunakan

adalah MINITAB 15 dan R i386 2.15.2.

(1.1)

(1.2)

e-Jurnal Matematika Vol. 2, No. 4, Nopember 2013, 1-5

3

Langkah – langkah yang dilakukan dalam penelitian ini yakni:

1. Membangkitkan data yang mengandung multikolinearitas dengan empat

variabel bebas dan satu variabel tidak bebas, amatan yang dibangkitkan

sebanyak 100 amatan (n=100). Nilai sisaan 𝜀 yang dibangkitkan

berdistribusi normal dengan rataan nol dan ragam satu. Nilai sisaan yang

dibangkitkan berukuran 100 amatan.

2. Melakukan analisis regresi linear berganda setelah membentuk vaiabel tidak

bebas dari beberapa variabel bebas. Pada langkah ini model regresi yang

didapat tidak sesuai dengan yang diharapkan sehingga diperlukan suatu

analisis untuk mendapatkan nilai penduga yang mendekati nilai yang

diharapkan.

3. Menganalisis data bangkitan dengan metode regresi Komponen utama. Hasil

analisis ini akan menjadi nilai penduga yang fit untuk mencari bias parameter.

4. Membangkitkan pencilan yang berdistribusi normal (N(40;0,05)) dengan

persentase pencilan 10%, 15%, dan 20%. Selanjutnya menambahkan pencilan

pada masing-masing peubah bebas dan melakukan analisis komponen utama.

5. Melakukan analisis dengan Robust Principle Component Analisys (ROBPCA)

pada data pengamatan yang dipengaruhi oleh pencilan.

6. Langkah terakhir yakni membandingkan dan menganalisis kedua metode

tersebut. Yang digunakan sebagai pembanding adalah nilai bias parameter dan

nilai Mean Square Error.

3. Hasil dan Pembahasan

3.1 Perbandingan Regresi Komponen Utama (RKU) dan Robust Principle

Component Analysis (ROBPCA)

Bias parameter merupakan nilai harapan dari selisih antara nilai estimasi dan

nilai yang sebenarnya. Nilai yang digunakan sebagai acuan adalah nilai penduga

dari metode Regresi Komponen Utama yang tidak dipengaruhi oleh pencilan,

sedangkan nilai yang digunakan sebagai nilai estimasi adalah nilai penduga dari

metode Regresi Komponen Utama dan Robust Principle Component Analysis

yang dipengaruhi oleh pencilan dengan persentase 10%, 15%, dan 20%. Bias

parameter untuk 100 kali ulangan diperoleh dengan rumus berikut ini:

𝐵𝐼𝐴𝑆 𝛽𝑖 = 𝛽 𝑗

𝑓𝑖𝑡100𝑗=1

100 −

𝛽 𝑗𝑝100

𝑗=1

100 , 𝑖 = 1,… ,4

Mean Square Error (MSE) suatu estimator merupakan nilai harapan dari

bias kuadrat. Mean Square Error parameter untuk 100 kali ulangan diperoleh

dengan menggunakan rumus berikut ini:

𝑀𝑆𝐸 𝛽𝑖 = 𝛽 𝑗

𝑓𝑖𝑡−𝛽 𝑗

𝑝

2100𝑗=1

100, 𝑖 = 1,… ,4

Hasil perhitungan bias parameter dan Mean Square Error untuk 100 kali

ulangan disajikan berturut-turut pada Tabel 1 dan Tabel 2.

(3.1)

(3.2)

Ni Wayan Yuliani, Komang Gde Sukarsa, I G.A.M. Srinadi Perbandingan Regresi Komponen Utama

& ROBPCA dalam Mengatasi

Multikolinearitas & Pencilan

4

Tabel 1. Perbandingan Regresi Komponen Utama Dan ROBPCA Berdasarkan

Nilai Bias Parameter

Pencilan Komponen Nilai Bias Parameter

Regresi Komponen Utama ROBPCA

10%

Intercept 19,6368 1,3057

PC1 1,4974 0,3775

PC2 0,4915 0,1309

PC3 0,0803 0,0023

PC4 0,6893 0,1160

15%

Intercept 29,8135 6,3881

PC1 1,5809 0,3581

PC2 0,5197 0,0714

PC3 0,2581 0,0610

PC4 0,9431 0,3668

20%

Intercept 39,8165 13,0083

PC1 1,1576 0,1045

PC2 0,4013 0,1743

PC3 1,4120 0,0457

PC4 1,1039 0,4341

Sumber : Data diolah (2013)

Estimasi yang baik adalah estimasi yang menghasilkan nilai bias yang

rendah atau kecil. Semakin besar nilai bias, maka semakin jauh penyimpangan

dari nilai yang sebenarnya. Pada Tabel 1 munjukkan bahwa nilai penduga dari

metode ROBPCA selalu lebih kecil dibandingkan dengan Regresi Komponen

Utama. Oleh Karena itu nilai penduga dari metode ROBPCA lebih baik

dibandingkan dengan metode Regresi Komponen Utama. Hal ini karena metode

ROBPCA dapat mengatasi data pengamatan yang dipengaruhi oleh pencilan.

Tabel 2. Perbandingan Regresi Komponen Utama Dan ROBPCA Berdasarkan

Nilai Mean Square Error Parameter

Pencilan Komponen Nilai Bias Parameter

Regresi Komponen Utama ROBPCA

10%

Intercept 392,0726 6,6843

PC1 3,9182 1,5095

PC2 2,8191 2,4226

PC3 0,1875 0,0206

PC4 2,7543 1,5256

15%

Intercept 891,3347 48,4942

PC1 4,0961 1,4267

PC2 3,1972 3,0118

PC3 0,4456 0,0494

PC4 3,0174 1,6895

20%

Intercept 1587,84599 173,4866

PC1 3,012465527 1,8322

PC2 2,682504765 2,2665

PC3 2,164030949 0,0714

PC4 3,060462252 1,8983

Sumber : Data diolah (2013)


5

Semakin kecil nilai Mean Square Error suatu estimator, maka hasil

estimasinya akan semakin baik. Pada Tabel 2 munjukkan bahwa nilai penduga

dari metode ROBPCA selalu lebih kecil dibandingkan dengan Regresi Komponen

Utama. Sehingga nilai penduga dari metode ROBPCA lebih baik dibandingkan

dengan metode Regresi Komponen Utama. Hal ini karena metode ROBPCA dapat

mengatasi data pengamatan yang dipengaruhi oleh pencilan.

4. Kesimpulan

Pada penelitian ini nilai penduga dari metode ROBPCA memiliki nilai bias

parameter dan nilai Mean Square Error (MSE) yang lebih kecil dibandingkan

dengan nilai penduga dari metode Regresi Komponen Utama, sehingga metode

ROBPCA memiliki nilai estimasi yang lebih baik dibandingkan dengan metode

Regresi Komponen Utama.

Daftar Pustaka

[1] Montgomery, D.C. dan Peck, E.A. (1991) Introduction to Linear Regression

Analysis, 2nd

edition, A Wiley-Interscience,New York.

[2] Neter, J. (1997) Model Linear Terapan, Bandung: Diterjemahkan oleh

Bambang Sumantri, IPB.

[3] Notiragayu.2008.Pembandingan Beberapa Metode Analisis Regresi

Komponen Utama Robust.Prosiding Seminar Hasil Penelitian dan

Pengabdian kepada Masyarakat, Universitas Lampung.

[4] Sunaryo, S. (2011) Mengatasi Masalah Multikolinearitas dan Outlier

dengan Pendekatan ROBPCA (Studi Kasus: Angka Kematian Bayi di Jawa

Timur), Jurnal Matematika, Saint dan Teknologi, Jurusan Statistika, ITS,

vol. 12, Nomor 1, Maret, pp. 1-10.




PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM

COVARIANCE DETERMINANT (LMS-MCD)

DALAM REGRESI KOMPONEN UTAMA

I PUTU EKA IRAWAN1, I KOMANG GDE SUKARSA

2,

NI MADE ASIH3



[email protected],

[email protected]

Abstract

Principal Component Regression is a method to overcome

multicollinearity techniques by combining principal component analysis with

regression analysis. The calculation of classical principal component analysis is

based on the regular covariance matrix. The covariance matrix is optimal if the

data originated from a multivariate normal distribution, but is very sensitive to

the presence of outliers. Alternatives are used to overcome this problem the

method of Least Median Square-Minimum Covariance Determinant (LMS-MCD).

The purpose of this research is to conduct a comparison between Principal

Component Regression (RKU) and Method of Least Median Square - Minimum

Covariance Determinant (LMS-MCD) in dealing with outliers. In this study,

Method of Least Median Square - Minimum Covariance Determinant (LMS-

MCD) has a bias and mean square error (MSE) is smaller than the parameter

RKU. Based on the difference of parameter estimators, still have a test that has a

difference of parameter estimators method LMS-MCD greater than RKU method.

Keywords: Multicollinearity, Outlier, Principal Component Regression, LMS,

MCD

1. Pendahuluan

Multikolinearitas (multicollinearity) merupakan suatu kondisi pada regresi

linear berganda dengan variable-variabel bebas saling berkorelasi. Regresi

Komponen Utama merupakan metode yang mengatasi multikolinearitas dengan

cara mengombinasikan teknik analisis komponen utama dengan analisis regresi.

Pada analisis komponen utama klasik, perhitungannya didasarkan pada matriks

kovarian biasa. Matriks kovarian ini akan optimal apabila data berasal dari suatu

distribusi normal multivariat, tetapi sangat sensitif terhadap adanya pencilan

(oulier) [2]. Alternatif yang digunakan untuk mengatasi masalah ini adalah

Metode Least Median Square-Minimum Covariance Determinant (LMS-MCD).

Adapun tujuan dalam penelitian ini adalah melihat nilai bias dan MSE parameter

dari metode RKU setelah matriks kovarian biasa diganti dengan matriks kovarian

mailto:[email protected]


7

robust (LMS-MCD). Pada penelitian ini, setelah matriks kovarian biasa yang

digunakan pada RKU diganti dengan matriks kovarian robust (LMS-MCD)

memiliki nilai bias dan mean square error (MSE) parameter lebih kecil

dibandingkan dengan RKU. Berdasarkan selisih penduga parameter dari 100

ulangan, masih ada ulangan yang memiliki selisih penduga parameter dari metode

LMS-MCD yang lebih besar dari metode RKU.

Metode Least Median Square (LMS)

Salah satu metode regresi robust yang juga sering digunakan dalam analisis

regresi adalah metode LMS (Least Median Square). Metode ini mempunyai

keuntungan untuk mengurangi pengaruh dari sisaan (residual) terhadap

keakuratan koefisien regresi. Penduga LMS diperoleh dengan mencari model

regresi yang meminimumkan median kuadrat sisaan (𝑒𝑖2) dari himpunan-

himpunan bagian pada data yang masing-masing sebanyak ℎ, dengan 𝑒𝑖2 =

𝑦𝑖 − 𝑥𝑖𝑇𝑏 2 [3]. Nilai ℎ ditentukan dengan menggunakan rumus ℎ =

𝑛

2 +

(𝑝+1)

2 , dengan 𝑛= ukuran sampel (banyaknya data), 𝑝= banyaknya parameter.

Metode Minimum Covariance Determinant (MCD)

Pada Metode ini dicari matriks varians-kovarians dari setiap himpunan

bagian data yang banyak elemennya ℎ′ , dengan ℎ′ =𝑛+𝑝+1

2. Selanjutnya diantara

matriks varian-kovarians tersebut dipilih yang memiliki determinan terkecil,

dengan 𝑝 menyatakan banyak variabel dan 𝑛 menyatakan banyak pengamatan [1].


Data yang digunakan adalah data simulasi yang diperoleh dengan

membangkitkan data yang berdistribusi normal dengan menggunakan bantuan

program R i386 2.15.2. Penyelesaian Analisis Komponen Utama dan Least

Median Square – Minimum Covariance Determinant (LMS-MCD) pada data

yang dibangkitkan menggunakan software MINITAB 15 dan software R i386

2.15.2. Pada simulasi data ini, banyaknya sampel yang digunakan adalah 100

amatan (dinotasikan 𝑛 = 100) . Sedangkan presentase pencilan yang digunakan

adalah 10%, 15%, 𝑑𝑎𝑛 20%.

Adapun tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut:

1. Membangkitkan nilai sisaan 𝑒 , 𝑋1~ 50,5 , 𝑋2~ 100,10 , 𝑋3~(30,5), 𝑋4 =

𝑋1 + 𝑋3 + 𝑒, Menentukan nilai 𝑌 dengan cara 𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 +

𝛽3𝑋3 + 𝛽4𝑋4 + 𝑒. Dimana 𝛽0 = 2 dan 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 1

2. Melakukan regresi komponen utama pada 𝑋1, 𝑋2, 𝑋3, 𝑋4 terhadap Y, sehingga

diperoleh nilai penduga yang fit (𝛽 𝑓𝑖𝑡 ) dengan menggunakan R i386 2.15.2.

3. Membangkitkan pencilan yang berdistribusi 𝑁(40,0.05) sebanyak 10% dari

banyak amatan 𝑛 = 100 dengan menggunakan program R i386 2.15.2. dan

I Putu Eka Irawan, Komang Gde Sukarsa, Ni Made Asih Penerapan Metode LMS – MCD dalam Regresi Komponen Utama

8

memasukan pencilan pada data simulasi dengan cara menjumlahkan pencilan

pada masing-masing variabel bebas yaitu 𝑋1, 𝑋2, 𝑋3

4. Menghitung nilai 𝑌𝑝 dari peubah bebas yang sudah terkontaminasi pencilan.

Dengan 𝑌𝑝 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3 + 𝛽4𝑋4 + 𝑒, 𝛽0 = 2 dan 𝛽1 = 𝛽2 =

𝛽3 = 𝛽4 = 1.

5. Melakukan analisis Regresi Komponen Utama pada data yang sudah

terkontaminasi pencilan dengan menggunakan software R i386 2.15.2

sehingga diperoleh 𝛽 (𝑅𝐾𝑈)𝑝

6. Melakukan analisis data menggunakan R i386 2.15.2 dengan menggunakan

metode Least Median Square – Minimum Covariance Determinant (LMS-

MCD) sehingga diperoleh 𝛽 (𝐿𝑀𝑆−𝑀𝐶𝐷)𝑝 .

7. Ulangi langkah 3 sampai 6 untuk presentase 15%, 20%.

8. Menganalisa dan membandingkan hasil perhitungan Regresi Komponen

Utama dengan Least Median Square-Minimum Covariance Determinant

(LMS-MCD) berdasarkan bias parameter dan Mean Square Error (MSE).


Teknik perhitungan analisis komponen utama menggunakan matriks

kovarian biasa. Matriks kovarian ini akan optimal apabila data berasal dari suatu

distribusi normal multivariat. Akan tetapi, matriks kovarian ini sensitif terhadap

adanya pencilan. Apabila pada data terdapat pencilan, maka matriks kovarian

akan kehilangan efisiensinya, sehingga diperlukan suatu matriks kovarian yang

robust terhadap pencilan. Penaksir robust yang digunakan untuk kovarian adalah

Minimum Covariance Determinant (MCD). Setelah matriks kovarian biasa pada

metode RKU diganti dengan matriks kovarian robust, maka diperoleh komponen-

komponen utama yang robust. Selanjutnya komponen-komponen utama yang

robust ini diregresikan terhadap peubah tidak bebas dengan menggunakan metode

Least Median Square.

Berikut hasil perhitungan bias parameter dari metode RKU sebelum

matriks kovarian biasa diganti dengan matriks kovarian robust dan sesudah

matriks kovarian biasa diganti dengan matriks kovarian robust (LMS-MCD) yang

disajikan dalam tabel 1.


9

Tabel 1. Hasil Perhitungan Bias Parameter untuk 100 kali Ulangan

Presentase Pencilan Metode Intercept PC1 PC2 PC3 PC4

10% RKU 20,0055 1,2313 0,5453 0,0308 0,4356

LMS-MCD 1,7792 0,0119 0,1443 0,0199 0,3892

15% RKU 30,0025 1,5189 0,6074 0,3046 0,5959

LMS-MCD 6,7617 0,0883 0,0272 0,0308 0,4804

20% RKU 40,0035 1,0302 0,2414 1,4092 1,1498

LMS-MCD 13,1999 0,0324 0,0826 0,0673 0,685

Hasil perhitungan MSE parameter dapat dilihat pada tabel 2.

Tabel 2. Hasil Perhitungan Mean Square Error Parameter untuk 100 kali Ulangan

Presentase Pencilan Metode Intercept PC1 PC2 PC3 PC4

10% RKU 400,222 3,7153 3,2863 0,1961 2,4759

LMS-MCD 6,3224 1,1183 2,7129 0,0523 1,7137

15% RKU 900,152 3,6949 3,15 0,4917 3,1602

LMS-MCD 48,8361 1,761 2,8019 0,0324 2,0185

20% RKU 1600,28 2,9369 2,916 2,0797 2,7384

LMS-MCD 176,411 1,8399 2,5413 0,0437 2,1958

Berdasarkan Tabel 1 dan 2, terlihat bahwa pada presentase pencilan 10%, 15%,

dan 20% nilai bias parameter dan mean square error (MSE) parameter dari

metode RKU sebelum matriks kovarian biasa diganti dengan matriks kovarian

robust selalu lebih besar dibandingkan dengan nilai bias parameter dan mean

square error (MSE) parameter dari metode RKU sesudah matriks kovarian biasa

diganti dengan matriks kovarian robust (LMS-MCD).

Selain itu, perbandingan untuk kedua metode juga dilakukan dengan

menghitung selisih dari penduga parameter yang dihasilkan oleh kedua metode

dengan penduga parameter dari metode RKU pada data tanpa pencilan. Setelah

dilakukan pengulangan 100 kali dan dihitung selisih penduga parameter dari

masing-masing ulangan pada kedua metode, diperoleh bahwa secara umum

metode LMS-MCD lebih bagus daripada metode RKU.

4. Kesimpulan

Berdasarkan hasil yang diperoleh dapat disimpulkan, untuk presentase

pencilan 10%, 15%, dan 20% pada data simulasi yang dibuat peubah-peubah

bebasnya bermultikolinearitas menunjukkan bahwa metode RKU sesudah matriks

kovarian biasa diganti dengan matriks kovarian robust (LMS-MCD) menunjukkan

hasil yang lebih baik dibandingkan dengan metode RKU sebelum matriks

kovarian biasa diganti dengan matriks kovarian robust. Untuk penelitian

I Putu Eka Irawan, Komang Gde Sukarsa, Ni Made Asih Penerapan Metode LMS – MCD dalam Regresi Komponen Utama

10

selanjutnya disarankan menambah jumlah ulangan dalam simulasi dan

membandingkan peubah bebas yang dibangkitkan dari sebaran normal yang

mengalami multikolinearitas dengan peubah bebas yang dibangkitkan dari sebaran

data normal multivariat.

Daftar Pustaka

[1] Aderlina, D. 2011. Metode Minimum Covariance Determinant pada Analisis

Regresi Linear Berganda dengan Kasus Pencilan. Skripsi. Jurusan

Matematika F MIPA Universitas Padjadjaran.

[2] Notiragayu. 2008. Pembandingan Beberapa Metode Analisis Regresi

Komponen Utama Robust. Prosiding Seminar Hasil Penelitian dan

Pengabdian kepada Masyarakat, Universitas Lampung.

[3] Rousseeuw, P.J. 1984. Least Median of Square Regresson. Journal of the

American Statistical Association.




PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL

(ZINB) UNTUK PENDUGAAN KEMATIAN ANAK BALITA

NI MADE SEKARMINI1, I KOMANG GDE SUKARSA

2,

I GUSTI AYU MADE SRINADI3



[email protected],

[email protected]

Abstract

One method of regression analysis used to analyze the count data is

Poisson regression. Poisson regression requires that the mean value equal to the

value of variance (equidispersion). However, sometimes the data is going

overdispersion the state variance values greater than the mean value. One of the

causes overdispersion is the excessive number of zero values on the response

variable (excess zeros). One method of analysis that can be used on data that had

overdispersion due to excess zeros is regression Zero-Inflated Negative Binomial

(ZINB). The data that can be analyzed using the ZINB regression is the early

childhood mortality in the province of Bali because much of the data is zero. The

analysis showed that the data had overdispersion on Poisson regression, so the

ZINB regression analysis was used. From the results of the ZINB regression can

overcome overdispersion so it was better than the Poisson Regression Model.

Keywords: Overdispersion, ZINB Regression, Poisson Regression, Early

Childhood Mortality

1. Pendahuluan

Analisis regresi linear adalah salah satu metode statistika yang dapat

menjelaskan hubungan sebab akibat antara satu variabel respon 𝑌 dengan satu

atau lebih variabel prediktor 𝑋𝑖 . Pada umumnya analisis regresi linear

digunakan untuk menganalisa variabel respon yang berupa data kontinu dan

berdistribusi normal. Namun dalam beberapa aplikasinya, variabel respon yang

akan dianalisis dapat berupa data diskrit [2].

Salah satu model yang dapat digunakan untuk menganalisis variabel respon

diskrit Y yang berdistribusi Poisson dengan variabel bebas berupa data kategorik,

diskrit , kontinu ataupun campuran disebut dengan model regresi Poisson. Pada

regresi Poisson harus memenuhi asumsi variannya yaitu 𝑉𝑎𝑟 𝑌𝑖 = 𝐸 𝑌𝑖 , untuk

setiap observasi i (i = 0,1,…,N), dilain pihak untuk data yang bertipe diskrit

terkadang terjadi overdispersi yaitu nilai varian lebih besar dari nilai mean pada

data respon. Salah satu penyebab terjadinya overdispersi yaitu banyaknya nilai nol

mailto:[email protected]:[email protected]

Ni Made.Sekarmini, Komang Gde Sukarsa, I G.A.M. Srinadi Penerapan Regresi Zero-Inflated Negative

Binomial untuk Pendugaan Kematian Balita

12

yang berlebih pada variabel respon (excess zeros). Penanganan model yang dapat

digunakan untuk mengatasi masalah tersebut antara lain adalah model regresi

Zero-Inflated Negative Binomial (ZINB). Regresi Zero Inflated Negative Binomial

(ZINB) adalah model yang dibentuk dari distribusi campuran poisson gamma.

Pada analisis mortalitas (kematian) sering dijumpai banyak data yang bernilai nol.

Salah satu data mortalitas (kematian) yang cocok dianalisis dengan menggunakan

model Regresi Zero Inflated Negative Binomial (ZINB) adalah data kematian anak

balita. Fakta menunjukkan bahwa jarang terjadi peristiwa kematian anak balita di

suatu daerah. Dalam penelitian ini, permasalahan yang dibahas adalah

penggunaan model Regresi Zero Inflated Negative Binomial (ZINB) untuk

pendugaan kematian anak balita di Provinsi Bali dan faktor-faktor yang

memengaruhi kematian anak balita.

Model regresi Poisson adalah model regresi nonlinear yang berasal dari

distribusi Poisson yang merupakan penerapan dari Generalized Linear Model

(GLM). Model ini menggambarkan hubungan antara variabel respon dan variabel

prediktor, dengan variabel respon dalam bentuk diskrit [1].

Model regresi Poisson diberikan sebagai berikut.

𝑌𝑖~𝑃𝑜𝑖𝑠𝑠𝑜𝑛 𝜇𝑖 𝜇𝑖 = exp(𝑋𝑖

𝑇𝛽)

Regresi Zero-Inflated Negative Binomial (ZINB) merupakan model yang

dibentuk dari distribusi poisson dan distribusi gamma. Model regresi ini memiliki

dua keadaan yaitu Keadaan pertama disebut zero state terjadi dengan probabilitas

pi dan menghasilkan hanya observasi bernilai nol, sementara keadaan kedua

disebut Negative Binomial state terjadi dengan probabilitas (1 - pi) dan

berdistribusi Binomial Negatif dengan mean μ , dengan 0 ≤ pi ≤ 1 [1].

1. Model data diskrit untuk 𝜇𝑖

ln 𝜇𝑖 = 𝑥𝑖𝑇𝛽 , 𝜇𝑖 ≥ 0, 𝑖 = 1, … , 𝑛

2. Model Zero-Inflation untuk 𝑝𝑖

𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = ln 𝑝𝑖

1 − 𝑝𝑖 = 𝑧𝑖

𝑇𝛾 , 0 ≤ 𝑝𝑖 ≤ 1, 𝑖 = 1, . . , 𝑛

Jika nilai awal tidak bagus, maka fungsi log-likelihood dari fungsi

probabilitas ZINB tidak linier, sehingga fungsi likelihood ini tidak dapat

diselesaikan dengan metode numerik biasa. Oleh karena itu, digunakan algoritma

EM (Expectation Maximization) [3].


Data yang digunakan dalam penelitian ini adalah data sekunder yang

diperoleh dari Dinas Kesehatan Provinsi Bali yaitu data kematian anak balita

tahun 2011 dari seluruh kabupaten/kota di Provinsi Bali. Variabel respon dalam


13

penelitian ini yaitu jumlah kematian anak balita (Y) dan variabel prediktor dalam

penelitian ini adalah persentase Pneumonia 𝑋1 , persentase anak balita mendapat

pelayanan kesehatan 𝑋2 , persentase anak balita mendapat vitamin A sebanyak

2x 𝑋3 , balita gizi buruk 𝑋4 , jumlah posyandu aktif 𝑋5 . Teknik analisis

datanya yaitu pertama melakukan pengumpulan data lalu melakukan analisis

regresi poisson. Dari model yang telah diperoleh dilakukan pemeriksaan

terjadinya overdispersi. Jika terjadi overdispersi dilanjutkan dengan melakukan

analisis regresi ZINB. Untuk menentukan model terbaik ZINB dilihat dari nilai

AIC terkecil kemudian melakukan uji kesesuaian model. Selanjutnya melakukan

pengujian signifikansi parameter secara individu. Dari model yang telah diperoleh

dilakukan intepretasi model. Kemudian kembali dilakukan pengujian overdispersi.

Setelah itu dilakukan perbandingan antara regresi Poisson dan regresi ZINB.


3.1 Deskripsi Data Penelitian

Di Provinsi Bali dengan jumlah kecamatan sebanyak 57 kecamatan terjadi

jumlah total kematian anak balita sebanyak 41 orang dengan jumlah terbanyak di

Kabupaten Gianyar. Jumlah data yang bernilai nol (tidak ada anak balita yang

meninggal) sebanyak 36 data , bernilai 1 sebanyak 12 data, bernilai 2 sebanyak 3

data, bernilai 3 sebanyak 4 data, bernilai 4 sebanyak 1 data dan bernilai 7

sebanyak 1 data.

3.2 Analisis Regresi Poisson

Dari data kematian anak balita di Provinsi Bali diperoleh nilai-nilai

Koefisien 𝛽 dan nilai uji Wald seperti tampak pada Tabel 3.1.

Tabel 3. 1 Koefisien Regresi Model Regresi Poisson

Variabel Prediktor Koefisien 𝛽 Uji Wald P-Value

Intercept 1,3232 0,78 0,377

𝑋1 0,0027 0,06 0,8062

𝑋2 0,0146 2,21 0,1372

𝑋3 -0,0394 5,85 0,0155*

𝑋4 0,3174 0,76 0,3830

𝑋5 0,0085 4,47 0,0344* Sumber :Data diolah tahun 2013; *. Signifikan pada 𝛼 = 0.05

Berdasarkan Tabel 3.1 diperoleh model Regresi Poisson yaitu:

𝜇 = exp 1,9769 − 0,0294𝑋3 + 0,0074𝑋5

Sebagai langkah selanjutnya dilakukan uji kesesuaian Regresi Poisson.



14

Uji kesesuaian regresi poisson dilakukan dengan menggunakan prosedur

pengujian nilai Deviansi dengan hipotesis sebagai berikut:

𝐻0: Model Regresi Poisson cocok pada data

𝐻1: Model Regresi Poisson tidak cocok pada data

Setelah dilakukan pengolahan data, diperoleh nilai devians dan pearson chi-

square seperti tampak pada Tabel 3.2.

Tabel 3.2 Uji Devians dan Taksiran Dispersi pada Regresi Poisson

Kriteria DB Nilai Nilai/DB

Devians 54 94,0535 1,7417

Pearson Chi-square 54 135,3078 2,5057

Sumber : Data diolah tahun 2013

Tabel 3.2 memperlihatkan bahwa nilai devians lebih besar dari nilai tabel

𝜒0.05;542 = 72,1358 . Oleh karena itu, 𝐻0 ditolak yang berarti bahwa model regresi

Poisson tidak dapat menjelaskan hubungan antara variabel respon 𝑌 dengan

variabel-variabel bebas 𝑋3,𝑋5 . Lebih lanjut lagi, dilakukan pemeriksaan

terjadinya overdispersi.

Dari Tabel 3.2 terlihat bahwa nilai Devians/ DB dan nilai Pearson Chi-

square/ DB lebih besar dari 1 sehingga dapat disimpulkan bahwa terjadi

overdispersi pada data respon 𝑌 . Oleh karena itu, harus dilakukan analisis

Regresi ZINB.

3.3 Analisis Regresi Zero-Inflated Negative Binomial (ZINB)

Input data persentase anak balita mendapat vitamin A sebanyak 2x

menghasilkan model awal ZINB untuk variabel prediktor 𝑋3 yaitu:

1. Model data diskrit untuk 𝜇𝑖 yaitu: ln 𝜇𝑖 = 0,7425 − 0,0069𝑋3

2. Model zero-inflated untuk 𝑝𝑖 yaitu: 𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = −8,8337 + 0,0854𝑋3

dengan nilai AIC sebesar 139,5338.

Sedangkan input data jumlah posyandu aktif menghasilkan model awal

ZINB untuk variabel prediktor 𝑋5 yaitu:

1. Model data diskrit untuk 𝜇𝑖 yaitu:

ln 𝜇𝑖 = 0,5827 − 0,0054𝑋5

2. Model zero-inflated untuk 𝑝𝑖 yaitu:

𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = 2,3973 − 0,0523𝑋5



15

Lebih lanjut lagi, data-data persentase anak balita mendapat vitamin A

sebanyak 2x dan jumlah posyandu aktif menghasilkan model awal ZINB untuk

variabel prediktor 𝑋3 dan 𝑋5 yaitu:

1. Model data diskrit untuk 𝜇𝑖 yaitu:

ln 𝜇𝑖 = 0,2724 + 0,0061𝑋3 − 0,0089𝑋5

2. Model zero-inflated untuk 𝑝𝑖 yaitu:

𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = −49,1936 + 0,6367𝑋3 − 0,2412𝑋5


Sebagai langkah selanjutnya, dilakukan pemilihan model Regresi ZINB

terbaik. Model dengan AIC terkecil adalah model regresi ZINB dengan dua

variabel yaitu 𝑋3 dan 𝑋5. Hal ini berarti bahwa peluang respon Y bernilai nol

dipengaruhi oleh persentase anak balita mendapat vitamin A 2x 𝑋3 dan jumlah

posyandu aktif 𝑋5 . Lebih lanjut lagi, dilakukan pengujian kesesuaian model

Regresi ZINB. Adapun Hipotesisnya adalah:

𝐻0: β0 = β3 = β5 = γ0 = γ3 = γ5 = 0

𝐻1: paling sedikit ada satu βj ≠ 0 atau γj ≠ 0

dengan j = 1, 2, … , 5

Dari data diperoleh nilai uji G:

𝐺 = −2 −65,804 − −54,557 = 22,494

Kriteria uji dengan menggunakan = 0,05 , dari tabel chi-square diperoleh

𝜒0.05;42 = 9,488. Tampak bahwa Ghitung> Gtabel sehingga keputusannya H0 ditolak,

yang artinya model regresi ZINB dengan dua variabel layak digunakan.

Lebih lanjut lagi dilakukan pengujian signifikansi parameter Regresi ZINB

secara individu. Dari hasil perhitungan diperoleh koefisien Regresi ZINB dan nilai

uji Wald seperti tampak pada Tabel 3.3.

Tabel 3.3 Koefisien Regresi ZINB dengan dua variabel prediktor 𝑋3 𝑑𝑎𝑛 𝑋5

Parameter Koefisien Uji Wald P-Value

𝛽0 0,2724 0,02 0,8846

𝛽3 0,0061 0,07 0,7919

𝛽5 -0,0089 1,34 0,2473

𝛾0 -49,1936 1,84 0,1753

𝛾3 0,6367 1,89 0,1695

𝛾5 -0,2412 1,76 0,1852

Sumber: Data diolah tahun 2013

Berdasarkan kriteria uji parameter Regresi ZINB memiliki 𝑃 − 𝑣𝑎𝑙𝑢𝑒 > 𝛼 =

0.05, dan 𝑊𝑗 < 𝜒𝛼 ;12 = 3.841, yang artinya ketika pengujian secara individu

menggunakan uji Wald tidak ada variabel prediktor yang berpengaruh secara

signifikan terhadap variabel respon.

Berikutnya dilakukan kembali pengujian overdispersi. Berdasarka hasil

perhitungan pada regresi ZINB diperoleh nilai Devians/ DB sebesar 2,1395 dan



16

nilai Pearson Chi-square/ DB sebesar 0,9655. Hal ini mengindikasikan tidak

terjadi overdispersi.

3.4 Perbandingan Model Regresi Poisson dengan Model Regresi ZINB

Tabel 3.4 Nilai devians, Pearson Chi-Square dan AIC.

Kriteria Regresi Poisson Regresi ZINB

Devians 94,0535 109,1146

Pearson Chi-Square 135,3078 49,2389

AIC 150,94 123,1146

Sumber: Data diolah tahun 2013

Dari nilai Pearson Chi-Square dan nilai AIC, regresi ZINB lebih tepat

digunakan untuk memodelkan kematian anak balita dibandingkan dengan model

regresi Poisson.

4. Kesimpulan

Untuk kematian anak balita di Provinsi Bali tahun 2011 berdasarkan nilai

AIC terkecil diperoleh model regresi ZINB dengan dua variabel prediktor yaitu

Model data diskrit untuk 𝜇𝑖 yaitu:

ln 𝜇𝑖 = 0,2724 + 0,0061𝑋3 − 0,0089𝑋5

Model zero-inflated untuk 𝑝𝑖 yaitu:

𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = −49,1936 + 0,6367𝑋3 − 0,2412𝑋5

Dari semua variabel prediktor yang digunakan pada model regresi ZINB

tidak ada yang berpengaruh secara signifikan terhadap penyebab kematian anak

balita. Dalam penelitian ini regresi ZINB dapat mengatasi masalah overdispersi

yang disebabkan oleh excess zeros.

Daftar Pustaka

[1] Ariawan, B., Suparti & Sudarno. 2012. “Pemodelan Regresi Zero Inflated

Negative Binomial ( ZINB ) Untuk Data Respon Diskrit dengan Excess

Zeros”. Gaussian. Vol. 1, No. 1 , 55-64.

[2] Sundari, I. 2012. “Regresi Poisson dan Penerapannya untuk Memodelkan

Hubungan Usia dan Perilaku Merokok Terhadap Jumlah Kematian Penderita

Penyakit Kanker Paru-Paru”. Jurnal Matematika Unad. Vol. 1, no. 1,

Oktober, 75-80.

[3] Garay, A.M. and Hashimoto, E.M. 2011. “On Estimation And Influence

Diagnostics for Zero Inflated Negative Binomial Regression Models”.

Computational Statistics and Data Analysis. Vol. 55 , 1304-1318.




KOMPARASI ANALISIS GEROMBOL (CLUSTER) DAN BIPLOT

DALAM PENGELOMPOKAN

I MADE ANOM ARIAWAN1, I PUTU EKA NILA KENCANA

2,

NI LUH PUTU SUCIPTAWATI3



2 [email protected],

[email protected]

Abstract

One of functions of multivariate analysis is to group data. Multivariate

analysis often used in grouping data are cluster analysis and biplot analysis. In

this paper, a comparative analysis will be made between clusters analysis and

biplot analysis for grouping the data. Technique used in the cluster analysis is k-

mean method and biplot analysis used two-dimensional display. The results ware

that biplot analysis produces are better in grouping accuracy than clusters

analysis. But in general, biplot analysis can not be said to be better than clusters

analysis in grouping the data and vice versa.

Keywords: comparative, multivariate analysis , clusters analysis, biplot analysis

1. Pendahuluan

Analisis multivariat merupakan analisis statistika yang berkaitan dengan

pendiskripsian ataupun interpretasi data yang melibatkan banyak peubah dan

objek secara bersama-sama [1]. Salah satu interpretasi yang dimaksud adalah

pengelompokan data [4]. Pengelompokan data merupakan pengorganisasian

sekumpulan data yang besar dengan cara membagi data tersebut kedalam

beberapa gerombol (kelompok). Gerombol-gerombol yang terbentuk akan mampu

menjelaskan adanya persamaan maupun perbedaan dari keseluruhan data yang

diteliti [2]. Tujuan dari pengelompokan data adalah untuk mempermudah proses

analisis dan interpretasi dari data besar dengan membagi data tersebut menjadi

beberapa gerombol.

Terdapat beberapa teknik dalam pengelompokan suatu data. Namun dalam

tulisan ini, pengelompokan data yang dimaksudkan adalah pengelompokan data

yang didasarkan pada objek dari data tersebut. Salah satu analisis yang sering

digunakan untuk pengelompokan ini adalah analisis gerombol (cluster). Analisis

gerombol merupakan analisis multivariat yang bertujuan untuk mengelompokkan

objek-objek dari data yang diteliti berdasarkan kesamaan karakteristik yang

dimilikinya [7]. Kesamaan karakteristik ini biasanya diukur menggunakan ukuran

kedekatan antarobjek yang dapat berupa ukuran kemiripan atau ketakmiripannya.


I M. Anom Ariawan, I P.E. Nila Kencana, N.L.P. Suciptawati Komparasi Analsis Gerombol (Cluster)

dan Biplot dalam Pengelompokan

18

Lebih jauh mengenai pengelompokan data berdasarkan objek, analisis multivariat

lain yang juga sering digunakan adalah analisis biplot. Tujuan analisis ini adalah

untuk menggambarkan baris (objek) dan kolom (peubah) yang ada pada matriks

data secara bersama-sama dalam sebuah grafik berdimensi rendah (biasanya dua

atau tiga) [3]. Penggambaran ini meliputi keragaman dan korelasi antar peubah,

serta kedekatan antarobjek yang nantinya akan mampu mengidentifikasikan

pengelompokan objek.

Kedua analisis multivariat tersebut memiliki keunggulan masing-masing,

analisis gerombol mampu digunakan dalam mengelompokkan data dalam jumlah

objek yang besar serta dengan skala pengukuran peubah yang berbeda mulai dari

nominal sampai interval [2]. Analisis biplot mampu menampilkan secara

langsung peubah penciri atau peubah yang paling dominan dari suatu kelompok

objek yang terbentuk pada hasil tampilan analisis biplot [7]. Pada tulisan ini akan

dilakukan komparasi pada kedua analisis tersebut untuk melihat analisis terbaik

dalam pengelompokan objek dari suatu data. Komparasi ini dilakukan dengan

melihat ketepatan setiap objek dalam kelompok-kelompok yang dihasilkan dari

kedua analisis itu terhadap posisi objek tersebut dalam kelompok pada data

kontrol. Suatu objek dikatakan memiliki ketepatan jika berada dalam kelompok

yang sama baik itu pada kelompok hasil analisis maupun kelompok pada data

kontrol. Sebagai contoh, objek i dikatakan memiliki ketepatan apabila objek

tersebut berada dalam kelompok 1 pada data kontrol dan kelompok 1 pada hasil

pengelompokan analisis gerombol.


Data yang digunakan dalam tulisan ini adalah data sekunder yang diambil

dari tulisan tentang kredit usaha rakyat (KUR) suatu bank swasta di Kota

Denpasar [6]. Dalam data ini terdapat seratus objek yang telah terbagi menjadi

tiga kelompok dan dengan sembilan peubah yang memiliki skala pengukuran

yang beragam mulai dari nominal sampai interval. Tiga kelompok tersebut

digunakan sebagai kontrol dalam proses perbandingan yang akan dilakukan.

Teknik pengelompokan data yang digunakan dalam analisis gerombol adalah

teknik tak berhirarki yaitu menggunakan k-mean methods, sementara itu dalam

tampilan analisis biplot hanya akan menggunakan dua dimensi saja, sehingga

lebih mudah dalam penafsiran kelompok yang terbentuk.

Langkah-langkah analisis data dalam tulisan ini sebagai berikut.

1. Mempersiapkan data yang akan dianalisis dengan tahapan sebagai beikut.

a. Menghilangkan peubah dengan skala nominal dan mengubah peubah

dengan skala ordinal menjadi kontinu dengan Method of Successive

Interval (MSI) agar semua peubah yang akan digunakan nantinya akan

berskala kontinu, sehingga mampu dianalisis dengan analisis gerombol

dan biplot bersama-sama.


19

b. Melakukan standarisasi data pada hasil langkah a sebelumnya, agar satuan

pada setiap peubah dalam data yang digunakan sama.

2. Melakukan analisis gerombol dengan tahapan sebagai berikut.

a. Pengelompokan data dengan teknik tak berhirarki (k-means method),

memperhatikan jumlah kelompok yang nantinya akan dibentuk sudah

ditentukan.

b. Melakukan uji hipotesis beda rataan untuk dua populasi saling bebas, yaitu

pada kelompok-kelompok hasil analisis gerombol terhadap kelompok-

kelompok pada data kontrol.

c. Membandingkan hasil pengelompokan analisis gerombol dengan

pengelompokan pada data kontrol untuk mendapatkan persentase

ketepatan untuk semua objek pada data yang dianalisis.

3. Melakukan analisis biplot dengan tahapan sebagai berikut.

a. Pemilihan parameter 𝛽 = 1 pada dekomposisi matriks 𝑆 = 𝑈𝐿𝛽𝐿𝛽−1𝐴′

agar memberikan tampilan biplot yang menekankan pada gambaran jarak

antara pasangan baris sehingga baik digunakan untuk melihat kedekatan

objek-objeknya[5]

.

b. Pembentukan kelompok pada hasil analisis biplot yaitu dengan melakukan

proyeksi ortogonal setiap objek terhadap semua vektor (peubah) yang ada

dalam tampilan analisis biplot. Semua objek yang berada dalam satu

kelompok yang sama akan memiliki jarak yang relatif dekat terhadap suatu

peubah yang sama.

c. Melakukan analisis deskriptif pada kelompok dalam data kontrol untuk

melihat variansi setiap peubah dalam kelompok tersebut.

d. Membandingkan hasil pengelompokan analisis biplot dengan

pengelompokan pada data kontrol untuk mendapatkan persentase

ketepatan untuk semua objek pada data yang dianalisis.

4. Mengkomparasikan dua hasil analisis yang telah dilakukan.


Pada langkah awal, dari sembilan peubah yang ada pada data KUR hanya

digunakan enam peubah dengan skala pengukuran kontinu dan satu peubah

dengan skala pengukuran ordinal. Peubah dengan skala ordinal ini selanjutnya

diubah menjadi skala pengukuran kontinu dengan Method of Successive Interval

(MSI). Sehingga pada analisis berikutnya digunakan data dengan tujuh peubah

kontinu. Berikutnya data tersebut distandarisasi untuk menyamakan satuannya,

data hasil standarisasi selanjutnya dikelompokkan menjadi tiga kelompok yaitu

sesuai dengan jumlah kelompok pada data kontrol. Pengelompokan dilakukan

dengan analisis gerombol yaitu dengan k-mean methods. Selanjutnya dilakukan

uji hipotesis beda rataan dua populasi saling bebas pada kelompok hasil analisis

gerombol dengan kelompok pada data kontrol. Hasil uji tersebut menyimpulkan

bahwa kelompok 1, 2 dan 3 pada pengelompokan hasil analisis gerombol masing-



20

masing sama dengan kelompok 1, 2 dan 3 pada data kontrol, sehingga proses

perbandingan dapat dilakukan. Berdasarkan hasil perbadingan antara kelompok

hasil analisis gerombol dengan kelompok pada data kontrol, didapat 44 objek

berada dalam kelompok yang sama baik itu pada kelompok hasil analisis

gerombol maupun kelompok pada data kontrol, dengan kata lain didapatkan

persentase ketepatan sebasar 44%.

Setelah mendapatkan persentase ketepatan pada hasil pengelompokan

analisis gerombol, selanjutnya dilakukan analisis biplot. Hasil analisis biplot

ditampilkan pada Gambar 1. Hasil tersebut menunjukkan bahwa informasi yang

ditampilkan dari dimensi satu dan dua pada tampilan analisis biplot adalah sebesar

47% dari keseluruhan informasi dari data yang digunakan. Tampilan biplot pada

Gambar 1 juga memperlihatkan adanya korelsi antarpeubah yang ditunjukan oleh

sudut yang terbentuk antarpeubah tersebut, yaitu semakin kecil sudut yang

terbentuk antarpeubah maka korelasi antarpeubah tersebut makin besar. Peubah-

peubah yang saling berkorelasi yaitu X1 dengan X4, X5 dengan X6 dan X7 dengan

X9.

Selanjutnya dilakukan proyeksi ortogonal pada setiap titik koordinat objek

terhadap semua vektor peubah untuk mencari jarak setiap objek terhadap vektor

peubah dalam tampilan biplot yang dihasilkan. Berdasarkan hasil proyeksi

ortogonal dan korelasi antarpeubah pada Gambar 1, diperoleh hasil

pengelompokan objek pada analisis biplot dan ditampilkan pada Gambar 2.

Gambar 1. Tampilan Hasil Analisis Biplot


21

Gambar 2. Tampilan Biplot Dengan Pengelompokan Objek

Gambar 2 menunjukkan bahwa, pada setiap kelompok yang terbentuk

terdapat peubah penciri atau peubah yang paling dominan dalam kelompok

tersebut. Peubah penciri dapat dilihat dari panjang vektor dari peubah tersebut

yang lebih panjang dibandingkan vektor yang dibentuk oleh peubah lain dalam

satu kelompok yang sama. Pada kelompok 1, 2 dan 3 mempunyai peubah penciri

yaitu berturut-turut adalah X5, X3 dan X9.

Berikutnya dilakukan analisis deskriptif pada data kontrol untuk melihat

peubah dengan variansi terbesar pada masing-masing kelompok yang ada pada

data kontrol. Hasil analisis deskriptif diperoleh bahwa peubah dengan variansi

terbesar untuk kelompok 1, 2 dan 3 pada data kontrol masing-masing adalah X5,

X3 dan X9. Berdasarkan hasil analisis deskriptif dan pengelompokan objek pada

Gambar 2 dapat disimpulkan bahwa, kelompok 1 pada hasil pengelompokan

analisis biplot dan kelompok 1 pada data kontrol memiliki peubah dominan yang

sama yaitu X5. Selanjutnya, kelompok 2 pada hasil pengelompokan analisis biplot

juga memiliki peubah dominan yang sama dengan kelompok 2 pada data kontrol

yaitu X3. Pada kelompok 3 dari hasil pengelompokan analisis biplot dan kelompok

3 pada data kontrol juga memilki peubah dominan yang sama yaitu X9.

Selanjutnya dilakukan proses perbandingan antara kelompok pada data kontrol

dengan kelompok hasil analisis biplot. Hasilnya diperoleh persentase ketepatan

sebesar 52%.

Berdasarkan hasil perbandingan antara kelompok data kontrol dengan

kelompok hasil analisis gerombol dan analisis biplot, didapatkan bahwa

persentase ketepatan yang diperoleh dari hasil analisis gerombol dan analisis

biplot secara berturut-turut adalah 44% dan 51%. Hal ini berarti, pada

perbandingan yang dilakukan terlihat bahwa pengelompokan analisis biplot



22

menghasilkan persentase ketepatan yang lebih baik dari pada pengelompokan

analisis gerombol.

4. Kesimpulan

Hasil penelitian diperoleh bahwa pengelompokan analisis biplot

menghasilkan persentase ketepatan yang lebih baik dari pada pengelompokan

analisis gerombol. Namun secara umum belum dapat dikatakan bahwa analisis

biplot lebih baik dari analisis gerombol dalam pengelompokan data dan begitu

juga sebaliknya.

Daftar Pustaka

[1] Bilodeau, Martin and Brenner. D. 1999. Theory of Multivariate Statistics.

New York: Spinger.

[2] Everitt, B. S., Landau. S., Leese. M., dan Stahl, D. 2011. Cluster Analysis.

Fifth Edition. London: John Wiley & Sons, Ltd.

[3] Gabriel, K.R. 1971. The Biplot Graphic Display of Matrices with Application

to Principal Componen Analysis. Biometrika 58(3): 453-467

[4] Johnson, R. A. and D. W. Wichern. 2007. Applied Multivariat Statistical

Analysis. Sixth Edition. New Jersey: Printice Hall.

[5] Kohler, Ulrich dan Magdalena Luniak. 2005. Data Inspection Using Biplot.

Berlin: Stata Corp LP.

[6] Kusumawardani, N. M. D., 2011. Pengklasifikasian Debitur Kredit Usaha

Rakyat (KUR) Dengan Analisis Deskriminan Dan Regresi Logistik Ordinal.

Skripsi. Jurusan Matematika, Fakultas Mipa dan Ilmu Pengetahuan Alam,

Universitas Udayana.

[7] Mattjik, A. A., dan I. M. Sumertajaya. 2011. Sidik Peubah Ganda. Bogor:

Institut Pertanian Bogor Press.

E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 23-28 ISSN: 2303-1751



KARAKTERISTIK SEKTOR PERTANIAN DI PROVINSI BALI

MENURUT SUBSEKTOR PENYUSUN

PUTU OKA SURYA ARSANA1, MADE SUSILAWATI

2, KETUT JAYANEGARA

3


e-mail: 1 [email protected],

2 [email protected],

[email protected]

Abstract

Bali instead of famous for tourism also popular at agriculture. One of them is

subak. It is a culture heritage in the world. To cope with this problem the

development in agriculture should be increased. The goal for this research are to

know the identifiier factors of agriculture devolopment in Bali, the most dominat

factors, and the variable which represent the development of agriculture in Bali.

The method of analysis used for this research is factors analysis. Factor analysis

is used to reduce the data or summary, for variable which is being changed to a

new variable called factor and still load many information contained in a real

variable. The method used in the factor analysis is principal component analysis

method. Many factors are determined by eigen values. The factor rotation which

used is varimax rotation. Based on the research results, got seven factors with the

diversities which can be explained are 76.417%. Factors dryland farming as the

most dominant factor identifier with the total value of the largest eigenvalues is

4.564 or 25.356% with variables representing these factors are widely planted

potatoes and pulses.

Keywords: factor Analysis, principal component analysis, eigen value, factor

rotation.

1. Pendahuluan

Pulau Bali selain terkenal dari sektor parawisata juga terkenal pada sektor

pertaniannya, contohnya sistem subak yang telah menjadi warisan budaya dunia.

Selain pertanian tanah sawah, Bali juga mempunyai indikator pertanian tanah

bukan sawah seperti perkebunan, tanaman ubi-ubian, dan palawija serta perikanan

yang kurang mendapatkan perhatian dari pemerintah. Untuk menyikapi hal

tersebut, maka pembangunan pada sektor pertanian harus lebih ditingkatkan

dengan cara mengetahui faktor-faktor penciri pembangunan sektor pertanian di

Provinsi Bali. Salah satu analisis peubah ganda yang dapat mengetahui faktor-

faktor penciri sektor pertanian di Provinsi Bali adalah analisis faktor. Dalam

penelitian ini akan dilakukan analisis faktor untuk mendapatkan faktor-faktor

mailto:[email protected]

P.Oka Surya Arsana, Made Susilawati, Ketut Jayanegara Karakteristik Sektor Pertanian di Provinsi

Bali Menurut Subsektor Penyusun

24

penciri dan mendapatkan peubah yang mewakili masing-masing faktor penciri

tersebut.

Analisis peubah ganda merupakan suatu bagian analisis statistika yang

menganalisis secara simultan peubah yang jumlahnya lebih dari dua dimana

analisisnya dilakukan secara serempak. Analisis peubah ganda merupakan

perluasan dari analisis univariat dan bivariat (Supranto, [5]).

Beberapa kegunaan penting dari analisis peubah ganda adalah (Siswadi, dan

Suharjo, [4]): a) Penyederhanaan struktur. Upaya ini dilakukan untuk memperoleh

cara-cara yang lebih mudah dalam mempresentasikan kompleksitas permasalahan

yang dihadapi, b) Pengelompokan peubah, akan dilihat apakah peubah-peubah

berada dalam satu kelompok atau tidak, c) Analisis kesalingtergantungan. Sasaran

dari analisis ini adalah untuk memeriksa kesalingtergantungan peubah-peubah, d)

Analisis ketergantungan. Dalam hal ini satu atau lebih peubah digunakan untuk

memeriksa ketergantungannya terhadap peubah lain, e) Pembentukan dan

pengujian hipotesis.

Analisis faktor merupakan salah satu teknik statistika multivariat berupa

metode interdependensi yang digunakan untuk meringkas informasi yang ada

dalam peubah awal menjadi satu set dimensi baru atau peubah ( factor). Hal ini

dilakukan dengan cara menentukan struktur melalui data summarization atau data

reduction (Hair et al , [2]).

Misalkan terdapat 𝑝 indikator dan 𝑝 faktor, maka dapat dibuat model

sebagai berikut (Sharma, [3]) :

𝑋 1 = 𝜆11𝐹1 + 𝜆12𝐹2 + . . . + 𝜆1𝑝𝐹𝑝 + ɛ1;

𝑋 2 = 𝜆21𝐹1 + 𝜆22𝐹2 + . . . + 𝜆2𝑝𝐹𝑝 + ɛ2;

⋮

𝑋 𝑝 = 𝜆𝑝1𝐹1 + 𝜆𝑝2𝐹2 + . . . + 𝜆𝑝𝑝𝐹𝑝 + ɛ𝑃

dengan 𝑋1,𝑋2, . . . , 𝑋𝑃 adalah indikator dari 𝑝 faktor, 𝜆11 ,𝜆12 , . . . , 𝜆 𝑝𝑝 adalah

muatan (pembobot) peubah ke-1 sampai ke-𝑝 pada faktor ke-1 sampai 𝑝,

𝐹1, 𝐹2, . . . , 𝐹𝑃 menyatakan faktor ke-1 sampai ke-𝑝 dan ɛ1, ɛ2, . . . , ɛ𝑃 faktor unik

untuk peubah ke-1 sampai ke- 𝑝.

Salah satu solusi dalam analisis faktor adalah dengan menggunakan

pendekatan Analisis Komponen Utama (AKU). Misal dari pengamatan 𝑝 peubah

dan 𝑛 objek, dapat ditulis dalam bentuk matriks berikut:

𝑋𝑛×𝑝 =

𝑥11 𝑥12𝑥21 𝑥22

⋯ 𝑥1𝑝⋯ 𝑥2𝑝

⋮ ⋮𝑥𝑛1 𝑥𝑛2

⋮ ⋮⋯ 𝑥𝑛𝑝

, Σ𝑝×𝑝 =

Σ11 Σ12Σ21 Σ22

⋯ Σ1𝑝⋯ Σ2𝑝

⋮ ⋮Σ𝑝1 Σ𝑝2

⋮ ⋮⋯ Σ𝑝𝑝


25

dengan E(X) = µ, matriks ragam Σ, dan komponen utamanya

𝐹𝑖 , 𝑖 = 1,2, . . . , 𝑝. 𝐹 1 = 𝑐11𝑋1 + 𝑐12𝑋2 + . . . + 𝑐1𝑝𝑋𝑝 = 𝑐1

′ 𝑋;

𝐹 2 = 𝑐21𝑋1 + 𝑐22𝑋2 + . . . + 𝑐2𝑝𝑋𝑝 = 𝑐2′ 𝑋;

⋮ 𝐹 𝑝 = 𝑐𝑝1𝑋1 + 𝑐𝑝2𝑋2 + . . . + 𝑐𝑝𝑝𝑋𝑝 = 𝑐𝑝

′ 𝑋.

Bentuk persamaan dapat dituliskan

𝐹𝑝×𝑙 = 𝐶𝑝×𝑝′ 𝑋𝑝×𝑙 ,

𝐹1𝐹2⋮𝐹1

=

𝑐11 𝑐12𝑐21 𝑎22

⋯ 𝑐1𝑝⋯ 𝑐2𝑝

⋮ ⋮𝑐𝑝1 𝑎𝑝2

⋮ ⋮⋯ 𝑐𝑝𝑝

𝑥1𝑥2⋮𝑥𝑝

Komponen utama 𝐹1 = 𝑐1′ 𝑋 diharapkan memiliki keragaman yang

maksimum, sehingga dimungkinkan untuk memilih muatan (weight) atau

koefisien nilai komponen sehingga faktor yang pertama menjelaskan sebagian

besar porsi seluruh varians atau menyerap sebagian besar varians seluruh peubah.

Kemudian muatan yang kedua dapat dipilih, sehingga faktor yang kedua

menyerap sebagian besar sisa varians, setelah diambil faktor pertama, dengan

syarat bahwa faktor yang kedua tidak berkorelasi dengan faktor pertama. Prinsip

yang sama dapat dipergunakan untuk memilih faktor selanjutnya. Jadi faktor bisa

diperkirakan sehingga nilai faktor yang satu tidak berkorelasi dengan nilai faktor

lainnya.


Sumber data pada penelitian ini adalah data sekunder yang diperoleh dari

Badan Pusat Statistik (BPS) mengenai indikator pertanian di Bali tahun 2011.

Data yang digunakan dalam penelitian mencakup 57 kecamatan yang ada di

Provinsi Bali yang berkaitan dengan sektor pertanian di Bali. berupa data

kuantitatif dengan skala rasio yaitu Jumlah Penduduk (X1), Luas Panen Padi

Sawah (X2), Luas Panen Ubi-ubian dan Palawija (X3), Luas Panen Tanam Sayur-

sayuran (X4), Jumlah Produksi Buah-Buahan (X5), Jumlah Populasi Ternak Besar

(X6), Jumlah Populasi Ternak Unggas (X7), Luas Pertanian Tanah Sawah (X8),

Luas Pertanian Tanah Bukan Sawah (X9), Jumlah Produksi Perikanan Laut (X10),

Jumlah Produksi Perikanan Darat (X11), Jumlah Produksi Padi Sawah (X12),

Jumlah Produksi Hasil Perkebunan (X13), Luas Wilayah Kecamatan (X14), Luas

Tanaman Perkebunan (X15), Luas Tanam Ubi – Ubian dan Palawija (X16), Jumlah

Produksi Ubi – Ubian dan Palawija (X17), Luas Tanam Padi Sawah (X18).

(BPS, [1]).

Langkah-langkah dalam penelitian ini adalah: (1) mempersiapkan data pada

Microsoft Excel 2007 yang akan diolah dengan menggunakan software SPSS.20;



26

(2) menganalisis data dengan menggunakan analisis faktor dengan metode analisis

komponen utama; (3) memeriksa banyaknya faktor yang terbentuk dengan melihat

nilai eigen yang lebih besar dari satu; (4) memeriksa peubah-peubah masuk ke

faktor mana;(5) melakukan rotasi faktor dengan menggunakan rotasi varimax; (6)

mendapatkan faktor penciri beserta peubahnya dan melakukan interpretasi faktor.


Sebelum melakukan analisis faktor dilakukan terlebih dahulu uji kelayakan

data dengan mengunakan uji KMO dan uji bartlett. Hasil uji KMO dan uji bartlett

dapat dilihat pada Tabel 3.2.

Nilai KMO and Bartlett’s Test untuk korelasi antarpeubah yang diinginkan adalah

> 0,5. Signifikansi penelitian ini adalah 0,05. Dari Tabel 3.2 diperoleh nilai KMO

sebesar 0,602 berarti data lebih dari cukup untuk analisis faktor.

Berdasarkan analisis dengan menggunakan analisis faktor, faktor yang

terbentuk dengan melihat nilai eigen yang lebih besar dari satu didapatkan 7

faktor dengan total keragaman yang dapat dijelaskan sebesar 76,417%. Faktor 1

merupakan faktor penciri yang paling dominan dengan total nilai eigen terbesar

yaitu 4,564 atau 25,356%.

Selanjutnya dilakukan rotasi faktor untuk mengetahui peubah-peubah masuk

faktor mana dan melakukan interpretasi faktor, didapatkan hasil sebagai berikut :

a) Faktor 1 dinamakan faktor pertanian lahan kering terdiri dari lima peubah yaitu

luas tanam ubi-ubian dan palawija, jumlah produksi ubi-ubian dan palawija,

jumlah populasi ternak besar, luas wilayah kecamatan, dan luas pertanian tanah

bukan sawah. Faktor ini menerangkan varian terbesar dari faktor lain yaitu sebesar

25,356 %. Peubah yang memiliki muatan faktor terbesar adalah luas tanam ubi-

ubian dan palawija yaitu sebesar 0,920, b) Faktor 2 dinamakan faktor pertanian

lahan basah terdiri dari tiga peubah yaitu luas tanam padi sawah, jumlah produksi

padi sawah, dan luas pertanian tanah sawah. Faktor ini mampu menjelaskan varian

sebesar 15,007%. Peubah yang memiliki muatan faktor terbesar adalah luas tanam

padi sawah yaitu sebesar 0,937, c) Faktor 3 dinamakan faktor perkebunan terdiri

dari dua peubah yaitu jumlah produksi hasil perkebunan, dan luas tanaman

perkebunan. Faktor ini mampu menjelaskan varian sebesar 9,645%. Peubah yang

memiliki muatan faktor terbesar adalah jumlah produksi hasil perkebunan yaitu

sebesar 0,764, d) Faktor 4 dinamakan faktor holtikultura terdiri dari dua peubah

Tabel 3.2 Hasil KMO and Bartlett's test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. ,602

Bartlett's Test of Sphericity

Approx. Chi-Square 604,752

Df 153

Sig. ,000


27

yaitu jumlah produksi buah-buahan, dan luas tanam sayur-sayuran. Faktor ini

mampu menjelaskan varian sebesar 8,075%. Peubah yang memiliki muatan faktor

terbesar adalah jumlah produksi buah-buahan yaitu sebesar 0,759, e) Faktor 5

dinamakan faktor luas panen padi sawah terdiri dari dua peubah yaitu luas panen

padi sawah, dan jumlah penduduk. Faktor ini mampu menjelasan varian sebesar

6,517%. Peubah yang memiliki muatan faktor terbesar adalah luas panen padi

sawah yaitu sebesar 0,782, f) Faktor 6 dinamakan faktor luas panen ubi-ubian dan

palawija terdiri dari dua peubah yaitu luas panen ubi-ubian dan palawija, dan

jumlah populasi ternak unggas. Faktor ini mampu menjelaskan varian sebesar

6,078%. Peubah yang memiliki muatan faktor terbesar adalah luas panen ubi-

ubian dan palawija yaitu sebesar 0,761, dan g) Faktor 7 dinamakan faktor

perikanan terdiri dari dua peubah yaitu jumlah produksi perikanan laut, dan

jumlah produksi perikanan darat. Faktor ini mampu menjelaskan varian sebesar

5,739 %. Peubah yang memiliki muatan faktor terbesar adalah jumlah produksi

perikanan laut yaitu sebesar 0,792.

4. Kesimpulan

Berdasarkan hasil analisis diperoleh kesimpulan bahwa:

1. Didapatkan tujuh faktor penciri pembangunan sektor pertanian di Bali yaitu

faktor pertanian lahan kering, faktor pertanian lahan basah, faktor perkebunan,

faktor holtikultura, faktor luas panen padi sawah, faktor luas panen ubi-ubian

dan palawija dan faktor perikanan.

2. Faktor penciri yang paling dominan dalam pembangunan sektor pertanian di

Provinsi Bali adalah faktor pertanian lahan kering dengan total initial nilai

eigen terbesar yaitu 4,564 atau 25,356%.

3. Peubah yang mewakili masing-masing faktor yaitu luas tanam ubi-ubian dan

palawija dengan muatan faktor sebesar 0,920 mewakili faktor pertanian lahan

kering, luas tanam padi sawah dengan muatan faktor sebesar 0,937 mewakili

faktor pertanian lahan basah, jumlah produksi hasil perkebunan dengan

muatan faktor sebesar 0,764 mewakili faktor perkebunan, jumlah produksi

buah-buahan dengan muatan faktor sebesar 0,759 mewakili faktor

holtikultura, luas panen padi sawah dengan muatan faktor sebesar 0,782

mewakili faktor luas panen padi sawah, luas panen ubi-ubian dan palawija

dengan muatan faktor sebesar 0,761 mewakili faktor luas panen ubi-ubian dan

palawija, jumlah produksi perikanan laut dengan muatan faktor sebesar 0792

mewakili faktor perikanan.



28

Daftar Pustaka

[1] BPS.2012. Bali dalam Angka 2012. Bali.

[2] Hair, Joseph F., Rilph F. Anderson, Ronald L. Tahtam dan William C. Black.

2006. Multivariate Data Analysis. Sixth Edition. New Jersey : Prentice-Hall

Inc.w

[3] Sharma, S.1996. Applied Multivariate Techniques.John Wiley and Sons, Inc.

New York.

[4] Siswadi dan Budi Suharjo. 1998. Analisis Eksplorasi Data Peubah Ganda.

IPB Press kampus IPB Taman Kencana Bogor. Bogor.

[5] Supranto, J. 2004. Analisis Multivariat (Arti dan Interpretasi). Rineka Cipta.

Jakarta.

E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 29-32 ISSN: 2303-1751



HUBUNGAN PENGARUH PENOLONG KELAHIRAN

TERHADAP STATUS KELAHIRAN BAYI DENGAN

KONTROL VARIABEL CONFOUNDING

DI KABUPATEN BULELENG

(STUDI KASUS: PUSKESMAS SUKASADA II)

KADEK NOVIA DWIJAYANTHI

1, I GUSTI AYU MADE SRINADI

2,

NI LUH PUTU SUCIPTAWATI3



[email protected],

[email protected]

Abstract

One indicator of the Human Development Index (HDI) is the Infant

Mortality Rate (IMR). IMR is lower HDI showed a better area when compared

with other regions for different values of the same indicators. This study aims to

determine the relationship between the birth attendants birth status and

confounding variables that affect the status of births in Buleleng regency, with

Sukasada II health center located in District Sukasada - Buleleng regency as the

location of the observed cases of infant mortality. Results of analysis using

logistic regression showed that (1) birth attendants, (2) maternal age, and (3)

income household heads have a real influence on the status of the baby's birth.

Birth status with medical birth attendants have the opportunity to live 2,427 times

compared with non-medical birth attendants with controlled variables maternal

age and income of the family head.

Keywords: IPM, Infant Mortality, Sukasada district, Buleleng regency, Logistic

Regression.

1. Pendahuluan

Kesehatan merupakan salah satu unsur penting dalam menentukan indeks

pembangunan Manusia (IPM). Dengan kondisi kesehatan yang optimal

masyarakat suatu daerah mempunyai kemampuan yang lebih besar untuk

memenuhi kebutuhannya [2].

Angka kematian bayi merupakan salah satu indikator yang sangat penting

dalam menentukan tingkat kesehatan masyarakat, karena dapat menggambarkan

kesehatan penduduk secara umum. Tingginya angka kematian bayi tentu saja

dipengaruhi oleh banyak faktor salah satunya adalah masih kurangnya

kemampuan dan keterampilan penolong persalinan. Pemilihan penolong

persalinan tidak hanya memengaruhi status kelahiran bayi namun memengaruhi

angka harapan hidup ibu yang melakukan persalinan [2].


K. N.Dwijayanthi, I G.A.M. Srinadi, N.L.P.Suciptawati Hubungan Pengaruh Penolong Kelah i ran Terhadap Status Kelah i ran Bayi dengan

Kont rol Variabel Confounding

30

Selain penolong kelahiran, angka kematian bayi juga dikontrol oleh

beberapa faktor yaitu umur ibu, pendidikan ibu, jenis kelamin bayi, jarak

kelahiran, urutan kelahiran dan penghasilan keluarga.

Penelitian terdahulu yang dilakukan oleh Ardika [1] untuk mengetahui

faktor apa saja yang memengaruhi angka kematian bayi diperoleh hasil bahwa

umur ibu dan pengaruh bersama antara pendidikan ibu dan jenis kelamin bayi

yang memengaruhi status kelahiran bayi. Penolong kelahiran tidak berpengaruh

terhadap status kelahiran bayi. Sehingga terjadi ketidakseimbangan dalam

menganalisis suatu kasus akibat adanya pengaruh variabel perancu atau

confounding.

Tujuan dari penelitian ini adalah untuk mengetahui ada tidaknya pengaruh

penolong kelahiran dan status kelahiran bayi di desa-desa yang berada di bawah

tanggung jawab Puskesmas Sukasada II dan untuk mengetahui variabel perancu

yang berpengaruh signifikan terhadap status kelahiran bayi di desa-desa yang

berada di bawah tanggung jawab Puskesmas Sukasada II

Confounding adalah suatu variabel dalam penelitian yang tidak tercakup

dalam hipotesis penelitian akan tetapi muncul dalam penelitian dan berpengaruh

terhadap variabel tidak bebas. Pengaruhnya mencampuri atau berbaur dengan

variabel bebas (Yasril dan Kasjono, [4]). Confounding adalah distorsi oleh

variabel luar yang dapat mengacaukan atau mempengaruhi perhitungan

pendugaan pengaruh variabel bebas terhadap suatu kasus (Murti, [3]).

Variabel confounding merupakan variabel luar yang pengaruhnya

mencampuri pengaruh variabel penelitian terhadap suatu kasus (Yasril dan

Kasjono, [4]). Ada tiga kriteria variabel confounding yaitu: (1) Merupakan faktor

risiko bagi kasus yang diteliti; (2) Mempunyai hubungan dengan variabel bebas;

dan (3) Bukan merupakan bentuk antara dalam hubungan kausal variabel bebas

dan variabel tidak bebas.

Langkah-langkah Uji Confounding: (1) Melakukan seleksi variabel kandidat

untuk masuk dalam model dengan cara analisis regresi logistik dengan p- Value

< 0,25; (2) Melakukan pemodelan regresi logistik ganda terhadap semua variabel

kandidat; (3) Melakukan uji interaksi antara variabel tidak bebas dengan variabel

bebas dan variabel confounding; (4) Melakukan uji confounder dengan

menghitung selisih OR jika > 10% maka variabel tersebut merupakan variabel

confounding; (5) Pemodelan akhir dan interpretasi model (Yasril dan

Kasjono,[4]).


Data yang digunakan adalah data ibu rumah tangga yang pernah melahirkan

di desa-desa yang berada di bawah tanggung jawab Puskesmas Sukasada II

kecamatan Sukasada Kabupaten Buleleng, dengan sampel penelitian sebanyak 82

orang.


31

Status kelahiran bayi (Y) merupakan variabel respon yang dikategorikan

menjadi dua, yaitu status kelahiran bayi hidup dan status kelahiran bayi

meninggal. Variabel bebas terdiri dari penolong kelahiran 𝑋1 , Umur Ibu 𝑋2 ,

Jenis Kelamin Bayi 𝑋3 , dan Jarak Kelahiran Bayi 𝑋4 . Variabel confounder

terdiri dari Pendidikan Ibu 𝑍1 , Penghasilan Keluarga 𝑍2 , dan Urutan

Kelahiran 𝑍3 . Selanjutnya melakukan proses langkah-langkah uji confounding

untuk melakukan analisis penelitian


Analisis regresi berganda dalam penelitian bertujuan untuk menganalisis

hubungan antara variabel bebas dan beberapa variabel confounding terhadap

variabel status kelahiran bayi. Analisis regresi yang digunakan adalah analisis

regresi logistik ganda dengan variabel kandidat yang masuk dalam model adalah

variabel bebas dan variabel confounding dengan nilai p-Value < 0,25. Berdasarkan

analisis ini diperoleh variabel kandidat yang masuk dalam model adalah variabel

penolong kelahiran (p-Value = 0,000 < 0,25), umur ibu (p-Value = 0,187 < 0,25),

pendidikan ibu (p-Value = 0,001 < 0,25) dan penghasilan keluarga (p-Value =

0,003 < 0,25).

Dari hasil analisis tersebut kemudian dilakukan analisis regresi logistik

ganda. Variabel yang masuk dalam model regresi logistik adalah variabel yang

mempunyai p-Value kurang dari 0,05. Hasil regresi logistik ganda diperoleh

variabel penolong kelahiran (p-Value = 0,000 < 0,05), umur ibu (p-Value = 0,013

< 0,05) dan penghasilan keluarga (p-Value = 0,03 < 0,05) yang masuk ke dalam

model.

Kemudian dilakukan pemeriksaan kemungkinan adanya interaksi antar

variabel bebas dan confounding yaitu antara penolong kelahiran dengan

penghasilan keluarga dan antara umur ibu dengan penghasilan keluarga. Dari

analisis tersebut tidak terjadi interaksi antara variabel bebas dan variabel

confounding.

Selanjutnya dilakukan pemeriksaan confounding yaitu dengan mengevaluasi

variabel penghasilan keluarga yang diduga sebagai variabel confounding dengan

membandingkan nilai OR variabel penolong kelahiran dan umur ibu dengan atau

tanpa variabel penghasilan keluarga. Setelah dilakukan analisis diperoleh nilai OR

penolong kelahiran sebesar 19,0% > 10 % dan nilai OR umur ibu sebesar 10% >

10 % maka variabel penghasilan kepala keluarga merupakan variabel

confounding, sehingga diperoleh model regresi logistik adalah:

Log p (Status Kelahiran ) = –3,169 – 3,877 (Penolong kelahiran) + 0,142 (Umur

Ibu) + 0,375 (Penghasilan Keluarga)

Menyatakan bahwa ibu yang melahirkan dengan penolong kelahiran medis

menurunkan risiko untuk status kelahiran meninggal sebesar 0,021 kali

K. N.Dwijayanthi, I G.A.M. Srinadi, N.L.P.Suciptawati Hubungan Pengaruh Penolong Kelah i ran Terhadap Status Kelah i ran Bayi dengan

Kont rol Variabel Confounding

32

dibandingkan penolong kelahiran nonmedis setelah dikontrol variabel penghasilan

keluarga.

4. Kesimpulan

Kesimpulan yang dapat diambil berdasarkan hasil analisis dan pembahasan

yang dilakukan pada bab sebelumnya adalah status kelahiran bayi dipengaruhi

oleh penolong kelahiran, Umur ibu dan penghasilan kepala keluarga.

Model Regresi Logistik Ganda yang diperoleh dari pembahasan tersebut yaitu:

Log p ( Status Kelahiran ) = –3,169 – 3,877 ( Penolong kelahiran ) + 0,142 (

Umur Ibu ) + 0,375 ( Penghasilan Keluarga )

Dari model yang diperoleh, dapat dijelaskan bahwa ibu yang melahirkan dengan

penolong kelahiran medis menurunkan risiko untuk status kelahiran meninggal

sebesar 0,021 kali dibandingkan dengan penolong kelahiran nonmedis setelah

dikontrol variabel penghasilan kepala keluarga.

Daftar Pustaka

[1] Ardika, I Gusti Ngurah. 2011 . Faktor-Faktor yang Mempengaruhi

Kematian Bayi di Kabupaten Buleleng . Universitas Udayana

[2] Dinas Kesehatan [Dikes] Kabupaten Buleleng. 2009 . Profil Kesehatan

Kabupaten Buleleng Tahun 2008. Dikes Kabupaten Buleleng. Singaraja.

[3] Murti, Bhisma. 2003. Prinsip dan Metode Riset Epidemiologi. Gadjah Mada

University Press, Yogyakarta

[4] Yasril dan Kasjono.2008. Analisis Multivariat. Mitra Cendikia Press,

Yogyakarta




VARIABEL LATEN SEBAGAI MODERATOR DAN MEDIATOR

DALAM HUBUNGAN KAUSAL

I KOMANG GEDE ANTARA1, I PUTU EKA NILA KENCANA

2,

KETUT JAYANEGARA3



[email protected],

[email protected]

Abstract

Latent variables are variables that can not be measured directly. In analysis

of causal relationship involving three latent variables, one latent variable can be

a moderator or mediator variables. Goodness of Fit moderation and mediation

model of latent variables is affected by the value of the canonical correlation

between moderator/mediator latent variables with the independent latent

variables and dependent latent variables. If the value of both canonical

correlation is well , so the Goodness of Fit models of mediation is getting better,

while the opposite Goodness of Fit models will be better moderation.

Keywords: Latent Variables, Moderator, Mediator, Canonical Correlation

1. Pendahuluan

Pada perkembangan analisis hubungan variabel, terutama analisis hubungan

kausal, tidak hanya melibatkan dua variabel yaitu variabel bebas (independent

variable) dan variabel terikat (dependent variable) akan tetapi juga melibatkan

variabel ketiga yang bisa berupa variabel moderator (moderation variable) atau

variabel mediator (mediation variable) [1]. Variabel moderator berfungsi untuk

memperkuat atau melemahkan pengaruh variabel bebas, sedangkan variabel

mediator berperan untuk menghantarkan pengaruh variabel bebas terhadap

variabel terikat [7].

Lebih jauh mengenai perkembangan analisis hubungan variabel, saat ini

juga berkembang analisis yang melibatkan suatu variabel yang tidak terukur atau

dikenal dengan analisis variabel laten[4]

, terutama analisis dalam dunia kesehatan,

psikologi dan sosial. Pada analisis dengan meggunakan variabel laten dikenal dua

analisis model yaitu model terukur (measurable model) dan model struktural

(structural model)[8]. Model terukur merupakan model yang berkaitan dengan

hubungan antara variabel laten dengan indikatornya, sedangkan model struktural

merupakan model yang berkaitan dengan hubungan antara variabel laten dengan

variabel laten yang lain [3].


I K. Gede Antara, I P.E. Nila Kencana, Ketut Jayanegara Variabel Laten Sebagai Moderator dan

Mediator dalam Hubungan Kausal

34

Pada model struktural, apabila hubungan yang dibangun merupakan

hubungan kausal maka satu variabel laten akan berperan sebagai variabel bebas

(laten eksogen) dan variabel laten lainnya sebagai variabel terikat (laten endogen).

Selanjutnya apabila hubungan kausal yang terjadi melibatkan tiga variabel laten

maka variabel laten yang ketiga dapat berupa moderator atau mediator pada

Date post:	29-Jan-2021
Category:	Documents
Upload:	others
View:	3 times
Download:	0 times

E-Jurnal Matematika · 2017. 6. 6. · Outlier 1. Pendahuluan Analisis regresi linear berganda...

Documents