i
BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER
MODEL KETAHANAN HIDUP PASIEN PENDERITA
JANTUNG KORONER
THE USE OF BAYESIAN SURVIVAL ANALYSIS TO ESTIMATE
PARAMETERS OF SURVIVAL MODEL FOR CORONARY HEART
DISEASE’S PATIENTS
Oleh:
A. DEWI LUKITASARI
662011009
TUGAS AKHIR
Diajukan kepada Program Studi Matematika, Fakultas Sains dan Matematika,
guna memenuhi sebagian dari persyaratan untuk memperoleh Gelar Sarjana Sains
(Matematika)
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS KRISTEN SATYA WACANA
SALATIGA
2015
ii
iii
iv
v
MOTTO
“Do your best and lets God do the rest”
(Anonim)
“FULL TILT!”
(James Gwee)
“It doesn’t matter how hard the obstacles are, you must finish what you started”
(Vivi Adeliana)
PERSEMBAHAN
Tuhan Yesus Kristus
Keluarga
vi
KATA PENGANTAR
Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa karena atas
berkatnya yang melimpah penulis dapat menyelesaikan skripsi ini tepat waktu.
Penulis menyadari, penulisan skripsi ini tidak lepas dari bantuan dan dukungan dari
berbagai pihak. Oleh karena itu penulis ingin menyampaikan ucapan terima kasih
kepada :
1. Dr. Adi Setiawan, M.Sc selaku pembimbing I atas bimbingan, motivasi dan
kesabarannya dalam membimbing agar segera menyelesaikan skripsi ini.
2. Leopoldus Ricky Sasongko, M.Si sebagai pembimbing II untuk bimbingan
dan koreksi yang diberikan dalam penyusunan skripsi ini.
3. Dosen pengajar, Dr. Bambang Susanto,MS, Dr. Hanna Arini Parhusip, Dra.
Lilik Linawati, M.Kom, Dr. Didit Budi Nugroho, dan Tundjung Mahatma,
M.Kom untuk ilmu dan bimbingan yang diberikan kepada penulis selama
belajar di Program Studi Matematika.
4. Staf TU dan Pak Edy untuk bantuannya saat kesulitan instal software.
5. Bapak, Ibuk, Kakak dan Adik atas segala dukungan, semangat dan doa yang
diberikan.
6. Mas Restu yang selalu memberikan semangat untuk tidak pernah putus asa
selama proses penyelesaian skripsi.
7. Freda, Dek Tina dan Mbak Nina yang selalu memberikan semangat dalam
penyelesaian skripsi ini.
8. Rekan seperjuangan Matematika 2011 Daivi, Titis, Priska, Purwoto, Dwi,
Malik dan Kevin.
Penulis menyadari bahwa skripsi ini masih banyak kekurangan. Oleh sebab itu,
penulis mengharapkan kritik dan saran yang membangun dari pembaca. Semoga
skripsi ini dapat bermanfaat bagi semua pihak.
Salatiga, 21 Januari 2015
Penulis
vii
DAFTAR ISI
Halaman
HALAMAN JUDUL………………………………………………………………… i
PERNYATAAN KEASLIAN KARYA TULIS TUGAS AKHIR………………….. ii
PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS AKHIR
UNTUK KEPENTINGAN AKADEMIS……………………………………………. iii
HALAMAN PENGESAHAN…………………………………………………….…. iv
MOTTO DAN PERSEMBAHAN……………………………………………..……. v
KATA PENGANTAR………………………………………………………….…… vi
DAFTAR ISI…………………………………………………………………..…….. vii
ABSTRAK……………………………………………………….………………….. viii
ABSTRACT…………………………………………………………………………. ix
PENDAHULUAN…………………………………………………………………… x
MAKALAH 1 : Bayesian Survival Analysis untuk mengestimasi parameter
model Cox-Regression pada kasus ketahanan hidup pasien
penderita jantung koroner.
MAKALAH 2 : Bayesian Survival Analysis ntuk mengestimasi parameter
model Weibull-Regression pada kasus ketahanan hidup pasien
penderita jantung koroner.
PENUTUP………………………………………...…………………….………. ..... xiii
DAFTAR PUSTAKA……………………………………………………………….. xiv
LAMPIRAN 1 : Data survival pasien penderita jantung koroner………………..… xvi
LAMPIRAN 2 : Program WINBUGS 1.4 untuk Bayesian Survival Analysis
menggunakan Cox-Regression …………………………………... xvii
LAMPIRAN 3 : Program WINBUGS 1.4 untuk Bayesian Survival Analysis
menggunakan Weibull-Regression……………………………...…… xx
LAMPIRAN 4 : Manual penggunaan WINBUGS 1.4……………………………... xxi
LAMPIRAN 5 : Makalah 1 Publikasi……………………………............................. xxi
LAMPIRAN 6 : Sertifikat Publikasi……………………………................................. xxi
viii
BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER
MODEL KETAHANAN HIDUP PASIEN PENDERITA
JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan
2, Leopoldus Ricky Sasongko
3
1,2,3 Program Sudi Matematika, Fakultas Sains dan Matematika,
Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
ABSTRAK
Skripsi ini membahas mengenai analisis survival menggunakan Cox-
Regression dan Weibull-Regression untuk mengestimasi parameter model ketahanan
hidup pasien penderita jantung koroner dengan pendekatan Bayesian. Data yang
digunakan adalah data survival pasien penderita jantung koroner dan data tersensor
hasil simulasi meliputi waktu hidup pasien, status pasien (hidup/mati) dan treatment
yang dikenakan pada pasien yaitu ring dan bypass, dengan jumlah pasien sebanyak
40 orang. Pendekatan Bayesian (Bayesian approach) digunakan untuk mengestimasi
parameter yang belum diketahui dari model regresi yang digunakan. Metode Markov
Chain Monte Carlo (MCMC) menggunakan algoritma Gibbs Sampling digunakan
untuk membangkitkan Rantai Markov untuk mengestimasi distribusi posterior dari
parameter, meliputi koefisien regresi ( ) dari masing-masing model dan parameter r
dari model survival Weibull. Parameter dan r yang diperoleh digunakan untuk
menghitung fungsi survival tiap pasien sesuai dengan treatment yang dikenakan.
Fungsi survival menunjukkan probabilitas bertahan hidup pasien penderita jantung
koroner. Berdasarkan analisis kedua model regresi, pada kasus penderita jantung
koroner, Weibull-Regression kurang mampu memodelkan data survival pasien
penderita jantung koroner karena diperoleh nilai probabilitas yang kurang wajar yakni
bernilai 0 untuk treatment bypass.
ix
Kata Kunci : Survival Analysis, model Weibull-Regression, Bayesian, Markov
Chain Monte Carlo (MCMC)
THE USE OF BAYESIAN SURVIVAL ANALYSIS TO ESTIMATE
PARAMETERS OF SURVIVAL MODEL FOR CORONARY HEART
DISEASE’S PATIENTS
A. Dewi Lukitasari1, Adi Setiawan
2, Leopoldus Ricky Sasongko
3
1,2,3 Mathematics Department, Faculty of Science and Mathematics,
Satya Wacana Christian University, Jl.Diponegoro No.52-60, Salatiga.
ABSTRACT
This study examined survival analysis using Cox and Weibull-Regression to
estimate survival model for coronary heart disease’s patients. Survival and censored
data simulation of coronary heart disease’s patients were used for data collection,
including survival time, survival status (life or die) and custom treatment (ring and
bypass). The total number of patients was 40 patients. Bayesian approach was
applied to estimate unknown parameter from regression models. Markov Chain
Monte Carlo (MCMC) method using Gibbs Sampling algorithm generated Markov
Chain to estimate posterior distribution of parameter that included regression
coefficient ( ) from each models and r parameter from Weibull’s model. Parameter
that had been found was to count survival function from each patient in each
treatment. This showed life probability of coronary heart disease’s patients.
Regarding the analysis from the two models, in context of coronary heart’s diseases
Weibull-Regression not really good in modeling of survival data of coronary heart’s
diseases patients because the result of the probability were bad.
Keywords : Survival analysis, Cox-Regression model, Weibull-Regression,
Bayesian, Markov Chain Monte Carlo (MCMC)
x
PENDAHULUAN
Latar Belakang
Kemajuan ilmu pengetahuan dan teknologi yang memunculkan inovasi di
berbagai aspek kehidupan, membawa dampak pada perubahan pola hidup masyarakat
yang cenderung serba instan. Pola hidup tersebut membawa dampak negatif.
Diantaranya muncul berbagai jenis penyakit yang berbahaya dan mematikan, salah
satunya adalah penyakit jantung koroner. Karena penyakit ini sangat berbahaya maka
seseorang yang terkena penyakit ini mungkin melakukan investasi/ asuransi sebagai
bentuk antisipasi apabila sewaktu-waktu penyakit ini kambuh dan harus menjalani
perawatan ,operasi atau meninggal dunia. Perusahaan asuransi perlu untuk
menentukan peluang waktu hidup pemegang polis yang menderita jantung koroner.
Peluang hidupnya biasa direpresentasikan dengan tabel mortalitas.
Inovasi yang berkembang meliputi bidang aktuaria, engineering dan
biostatistik yaitu munculnya survival analysis yang digunakan untuk memodelkan
data survival Survival analysis bertujuan menduga probabilitas kelangsungan hidup,
kematian, dan peristiwa-peristiwa lainnya sampai pada periode waktu tertentu serta
menjelaskan pengaruh variabel independent terhadap waktu hidup. Teknik analisis
yang biasa digunakan antara lain parametric, semi-parametric dan non-parametric.
Salah satu teknik analisis parametric yang digunakan adalah Weibull-Regression
sedangkan teknik analisis non-parametric sederhana yang digunakan untuk
memodelkan data survival adalah model Cox-regression.
Kenyataannya, selama proses observasi dimungkinkan terdapat data yang
tidak terobservasi secara penuh (not completely observed) yang disebut data
tersensor. Oleh karena itu untuk mengolah data tersensor digunakan teknik analisis
parametric menggunakan model Weibull. Distribusi Weibull digunakan secara
efektif untuk menganalisis data waktu hidup khususnya untuk data tersensor.
Saat ini dikenal ada dua pendekatan model yaitu pendekatan klasik (classical
approach) dan pendekatan Bayesian (Bayesian approach). Keunggulan pendekatan
Bayesian diantaranya mampu menyelesaikan masalah yang tidak dapat diselesaikan
xi
secara analitis dan mampu menawarkan kemungkinan yang kaya dengan interferensia
serta mengeksplor perbedaan-perbedaan interpretasi data terhadap kriteria kinerja
prior. Pada proses pemodelannya menggunakan estimasi Bayesian dengan bantuan
Markov-Chain Monte-Carlo (MCMC) berdasarkan algoritma Gibbs Sampling.
Berdasarkan uraian di atas, pada skripsi ini dibahas analisis survival untuk
model dengan Cox-Regression dan Weibull-Regression menggunakan pendekatan
klasik kemudian dilanjutkan dengan menggunakan pendekatan Bayesian untuk
mengestimasi parameter dari model yang digunakan. Pada model Cox-Regression
digunakan data pasien penderita jantung koroner yang dikenakan pengobatan dengan
treatment Ring dan Bypass, sedangkan untuk model Weibull-Regression digunakan
data survival simulasi pasien penderita jantung koroner. Total pasien adalah sebanyak
40 pasien. Treatment Ring adalah teknik pengobatan jantung koroner dengan cara
memasangkan cincin pada jantung untuk melebarkan pembuluh darah yang
menyempit atau tersumbat di bagian jantung, sedangkan treatment Bypass adalah
teknik pengobatan dengan mengambil pembuluh darah vena yang diambil dari vena
lengan atau kaki.
Rumusan Masalah
Berdasarkan uraian latar belakang tersebut, permasalahan yang dibahas dalam
penelitian ini adalah :
1. Bagaimana mengestimasi parameter pada model Cox-Regression dengan
Bayesian survival analisis pada kasus ketahanan hidup pasien penderita
jantung koroner?
2. Bagaimana mengestimasi parameter pada model Weibull-Regression dengan
Bayesian survival analisis pada kasus ketahanan hidup pasien penderita
jantung koroner?
xii
Tujuan
Tujuan dari penelitian ini adalah :
1. Memperoleh nilai parameter pada model Cox-Regression dengan
menggunakan Bayesian survival analisis pada kasus ketahanan hidup pasien
penderita jantung koroner.
2. Memperoleh nilai parameter pada model Weibull-Regression dengan
menggunakan Bayesian survival analisis pada kasus ketahanan hidup pasien
penderita jantung koroner.
Batasan Masalah
Beberapa hal yang membatasi penelitian ini adalah :
Diasumsikan bahwa tidak ada kegagalan yang dapat terjadi secara bersamaan.
Diasumsikan data termasuk ke dalam tipe data Random Censoring.
Manfaat penelitian
Penelitian ini dapat bermanfaat untuk perusahaan asuransi jiwa kategori manfaat
penyakit kritis seperti asuransi operasi dalam membuat kalkulasi asuransi (insurance
calculations) seperti alat pengukur pembentuk rate premi yang akan digunakan untuk
membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk
cakupan asuransi.
Untuk menyelesaikan rumusan masalah tersebut, maka dibuat dua makalah yaitu :
1. Bayesian Survival Analysis menggunakan Cox-Regression untuk
mengestimasi model ketahanan hidup pasien penderita jantung koroner yang
telah diseminarkan di Universitas Muhammadiyah Purworejo pada tanggal 29
November 2014.
2. Bayesian Survival Analysis untuk mengetimasi parameter model Weibull-
Regression pada kasus ketahanan hidup pasien penderita jantung koroner.
xiii
PENUTUP
Kesimpulan
Berdasarkan analisis yang dilakukan, diperoleh nilai dari setiap parameter
yang diestimasi meliputi, koefisien regresi dan 0 pada model Cox-Regression.
Parameter r dan koefisien regresi untuk model Weibull-Regression. Didapatkan
probabilitas pasien bertahan hidup untuk masing-masing treatment yakni treatment
Ring dan Bypass. Diperoleh adanya kelemahan untuk model Weibull-Regression
dalam memodelkan ketahanan hidup pasien penderita jatung koroner karena
menghasilkan nilai probabilitas yang kurang wajar dikarenakan pada analisis dengan
menggunakan Weibull-Regression diperoleh nilai probabilitas untuk treatment
Bypass sebesar nol.
Saran
Penelitian ini dapat diaplikasikan untuk perusahaan asuransi jiwa kategori
penyakit kritis seperti asuransi operasi dalam membuat kalkulasi asuransi (insurance
calculations) seperti alat pengukur pembentuk rate premi yakni menghitung nilai
probabiltas kematian pemegang polis yang akan digunakan untuk membuat
perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk cakupan
asuransi.
xiv
DAFTAR PUSTAKA
[1] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan
Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita
Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika.
UKSW : Salatiga.
[2] Departemen Kesehatan Republik Indonesia.2007.Profil Kesehatan Indonesia
2005. Jakarta.
[3] World Health Organization. 2014. The top 10 causes of death. Swiss: WHO.
diakses pada Senin,15 September 2014 pukul 9.41.
http://www.who.int/mediacentre/factsheets/fs310/en/.
[4] London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX
Publication : USA.
[5] Reskianti,Kiki, Nuriti Sunusi dan Nasrah Sirajang.2014.Estimasi Bayesian pada
Analisis Data Ketahanan Hidup Berdistribusi Eksponensial melalui Pendekatan
SELF. Studi Kasus: Analisis Ketahanan Hidup Flourophores.Jurusan
Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam.Universitas
Harsanudin : Makassar.
[6] Subanar.2013.Statistika Matematika.Graha Ilmu: Yogyakarta.
[7] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data.
Universitas Cagliari: Italia.
[8] Hidayah, Eny. 1994. Analisis Ketahanan Hidup dengan Metode Gehan Mantel-
Haenszel dan Tarone-Ware untuk 2 Sampel Sampai K Sampel. Universitas
Diponegoro : Semarang.
[9] Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan
Metode Bayes Menggunakan Prior Konjugat. Universitas Diponegoro:
Semarang.
http://eprints.undip.ac.id/29153/1/ade_candra.pdf
[10] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for
Censored and Truncated Data. New York. Springer-Verlag New York Inc.
[11] Andrew E Long. 1999. Leuk: survival analysis using Cox regression. Diakses
pada Selasa 16 September 2014 pukul 20.12.
http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node29.html
xv
[12] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi Cox
Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus.
Program Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.
[13] Hidayah,Entin.2013.Model Disagregasi Data Hujan Temporal dengan
Pendekatan Bayesian sebagai Input Permodelan Banjir.ITS:Surabaya.
[14] Mustafa, Ayman dan Anis Ben Ghorbal.2011. Using WinBUGS to Cox Model
with Changing from the Baseline Hazard Function. Fakultas Matematika.
Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.
1
BAYESIAN SURVIVAL ANALYSIS UNTUK MENGETIMASI PARAMETER
MODEL COX-REGRESSION PADA KASUS KETAHANAN HIDUP
PASIEN PENDERITA JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan
2, Leopoldus Ricky Sasongko
3
1,2,3 Program Sudi Matematika, Fakultas Sains dan Matematika,
Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
ABSTRAK
Penerapan model Cox-Regression dalam konteks survival analysis dengan
pendekatan Bayesian untuk memodelkan ketahanan hidup pasien penderita jantung
koroner dibahas dalam paper ini. Data yang digunakan adalah waktu hidup pasien,
status pasien (hidup/mati) dan treatment yang dikenakan. Diambil dua treatment yang
digunakan oleh pasien penderita jantung koroner yaitu ring dan bypass. Pendekatan
yang digunakan adalah pendekatan Bayesian (Bayesian approach) untuk mencari
distribusi posterior parameter. Updating data menggunakan metode Markov Chain
Monte Carlo (MCMC) dengan algoritma Gibbs Sampling. Software winBUGS 1.4
membantu dalam mengestimasi nilai setiap parameter yaitu koefisien regresi .
Parameter yang diestimasi dari model Cox-Regression digunakan untuk menghitung
probabilitas bertahan hidup pasien penderita jantung koroner.
Kata Kunci : Survival Analysis, model Cox-Regression, Bayesian, Markov Chain
Monte Carlo (MCMC)
2
PENDAHULUAN
Kemajuan ilmu pengetahuan dan teknologi yang kian pesat menuntut berbagai
aspek untuk menemukan inovasi guna mempermudah kehidupan manusia. Inovasi
teknologi yang serba canggih membawa dampak pada perubahan pola hidup
masyarakat yang cenderung serba instan. Tidak dapat dipungkiri pola hidup tersebut
membawa dampak negatif. Diantaranya muncul berbagai jenis penyakit yang
berbahaya dan mematikan, salah satunya adalah penyakit jantung koroner [1].
Menurut World Health Organization (WHO) atau Badan Kesehatan Dunia, penyakit
jantung koroner merupakan penyakit dengan urutan pertama penyebab kematian dan
tersebar di seluruh dunia. Pada tahun 2012 tercatat 7,2 juta orang di seluruh dunia
meninggal setiap tahunnya akibat penyakit ini. Banyaknya orang yang meninggal
akibat ini diperkirakan akan terus meningkat hingga 23,3 juta di tahun 2030 [2].
Karena penyakit ini sangat berbahaya maka seseorang yang terkena penyakit ini akan
melakukan investasi sebagai bentuk antisipasi apabila sewaktu-waktu penyakit ini
kambuh dan harus menjalani perawatan atau operasi. Perusahaan asuransi perlu untuk
menentukan peluang waktu hidup seseorang yang akan melakukan asuransi. Peluang
hidupnya biasa direpresentasikan dengan membuat tabel mortalitas.
Angka kematian yang tinggi akibat penyakit jantung koroner menimbulkan
perkembangan inovasi di bidang aktuaria, engineering dan biostatistik yaitu
munculnya survival analysis yang digunakan untuk memodelkan data survival [3].
Survival analysis bertujuan menduga probabilitas kelangsungan hidup, kekambuhan,
kematian, dan peristiwa-peristiwa lainnya sampai pada periode waktu tertentu serta
mejelaskan pengaruh variabel independent terhadap waktu survive [4]. Teknik
analisis yang biasa digunakan antara lain parametric, semi-parametric dan non-
parametric [5]. Salah satu teknik analisis non-parametric sederhana yang digunakan
untuk memodelkan data survival adalah model Cox-regression. Sedangkan untuk
permodelan data dikenal ada dua pendekatan yaitu pendekatan klasik (classical
approach) dan pendekatan Bayesian (Bayesian approach) [6]. Pendekatan klasik
3
memandang parameter bernilai tetap, sedangkan pada pendekatan bayesian parameter
dipandang sebagai variabel random yang memiliki distribusi (distribusi Prior).
Keunggulan pendekatan Bayesian diantaranya mampu menyelesaikan masalah yang
tidak dapat diselesaikan secara analitis dan mampu menawarkan kemungkinan yang
kaya dengan interferensia serta mengeksplor perbedaan-perbedaan interpretasi data
terhadap kriteria kinerja prior [7]. Estimasi parameter model menggunakan estimasi
Bayesian dengan metode Markov-Chain Monte-Carlo (MCMC) berdasarkan
algoritma Gibbs Sampling. Salah satu kontribusi yang dapat bermanfaat bagi
perusahaan asuransi kejiwaan untuk penyakit kritis seperti asuransi operasi dalam
membuat kalkulasi asuransi (insurance calculations) yang akan digunakan untuk
membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk
cakupan asuransi.
Berdasarkan uraian di atas, pada paper ini dibahas terlebih dahulu cara
mengestimasi parameter menggunakan pendekatan klasik dengan menggunakan
model regresi Cox-Proporsional Hazard pada kasus ketahanan hidup pasien
penderita jantung koroner, kemudian dilanjutkan dengan menggunakan pendekatan
Bayesian survival analysis menggunakan Cox-regression. Tujuan dari penelitian ini
untuk memperoleh model ketahanan hidup pasien penderita jantung koroner dengan
Bayesian survival analysis menggunakan Cox-regression. Dalam proses estimasi
diasumsikan bahwa tidak ada kegagalan yang dapat terjadi secara bersamaan. Hal
tersebut berarti terdapat asumsi bahwa satu pasien hanya dapat mengalami satu kali
kegagalan dan satu pasien hanya dikenakan satu treatment saja. Alat bantu
perhitungan menggunakan paket program winBUGS 1.4 yang telah memuat
algoritma BUGS (Bayesian Interface Using Gibbs Sampling).
4
DASAR TEORI
Fungsi Survival
Fungsi survival )(tS merupakan probabilitas dari seseorang untuk bertahan
hidup setelah waktu yang ditetapkan sebut t . Fungsi survival merupakan merupakan
komplemen dari variabel random fungsi distribusi kumulatif )(tF maka ditulis
)(1)()( tFtTPtS [8]. Fungsi distribusi kumulatif dari variabel random T
dengan fungsi kepadatan probabilitas (probability density function) )(tf , diperoleh
dengan cara mengintegralkan fungsi kepadatan probabilitas sehingga diperoleh
t
dttftTPtF0
)()()( dengan T adalah variabel random yang mencerminkan
failure time atau waktu bertahan hidup sampai munculnya kejadian tertetu. Kejadian
yang dimaksud adalah kematian [9].
Fungsi Hazard
Fungsi Hazard )(0 t menunjukkan laju kegagalan individu untuk mampu
bertahan hidup setelah melewati waktu yang ditetapkan, t . Didefinisikan sebagai
berikut :
)(
)('
)(
)(lim
)|(lim)(
000
tS
tF
tTP
dttTtP
dt
tTdttTtPt
dtdt (1)
dengan T asumsikan kontinu sehingga memiliki fungsi kepadatan probabilitas dan
kejadian berlangsung untuk rentang waktu ),[ dttt [10]. Untuk fungsi Hazard
kumulatif yaitu
t
duut0
00 )()( (2)
Proses Intensitas dan model regresi Cox
Data survival yang ada perlu dilakukan proses menghitung jumlah kegagalan
yang terjadi sampai waktu t . Proses tersebut dinamakan proses intensitas. Proses
5
intensitas )(tI i , merepresentasikan hubungan probabilitas subjek i , ni ...,,2,1
pada interval ),[ dttt . Dirumuskan :
)|1)(()( ti FtdNEdttI
(3)
)(tN i menunjukkan kenaikan dari iN untuk interval ),[ dttt , tF menunjukkan
data yang ada sebelum waktu t . Jika nilai i masuk di interval waktu maka diambil
nilai 1)(tdN i dan sebaliknya jika tidak maka diambil nilai 0)(tdNi .
Jika nilai 0dt untuk )}(),(),({ tztYtND iii , probabilitas pada proses
intensitas berubah menjadi instantaneous hazard untuk waktu t dan subjek i
ditunjukkan pada persamaan di bawah ini
)'exp()()()( 0 iii zttYtI (4)
dengan D mencerminkan data, )(tYi adalah indikator risiko yang ditunjukkan dari
status hidup pasien terdiri dari 0 atau 1 dan )(tzi adalah vektor covariate. Model
Cox-Regression ditunjukkan dari izt 'exp()(0 ) yang menunjukan skor risiko untuk
individu ke- i . Parameter menunjukkan koefisien regresi.
Fungsi eksponensial menjamin )(tI i bernilai positif. Probabilitas fungsi
survival dirumuskan sebagai berikut :
t
zduuztS0
)exp(
0 )))(exp((),( (5)
Parameter dan nilai t
duut0
00 )()( yang akan diestimasi dengan estimasi non-
parametric yang akan digunakan untuk mengestimasi model survival [11].
Distribusi Prior
Distribusi prior mencerminkan kepercayaan subyektif parameter sebelum sampel
diambil. Penentuan distribusi prior dapat ditentukan berdasarkan ruang parameternya.
6
Penentuan prior dengan mengambil konjugat tNi ( ) sehingga
)),((~)(*
00 ctcdGammatd . )(*
0 td menunjukann perkiraan prior dari fungsi
hazard yang belum diketahui dan c menujukkan derajat konfidensi [11].
Fungsi Likelihood
Fungsi likelihood yang biasa digunakan adalah :
))(,|()))(,|( 00 tDLtDL i (6)
dttItItDLt
i
n
i t
tdN
ii
01 0
)(
0 )(exp)()(,|( (7)
Mengganti nilai )(tI i dengan persamaan (4) diperoleh persamaan likelihood sebagai
berikut:
dttdztYtdztYtDLt
ii
n
i t
tdN
iii
00
1 0
)(
00 )()'exp()((exp))()'exp()(())(,|(
(8)
dengan )(0 td mencerminkan kenaikan dari fungsi hazard,
dttIPoissontdN ii ))((~)( merupakan kenaikan yang sangat kecil dari )(tN i dan
)(0 t menunjukkan baseline hazard function terintegrasi selama interval ),[ dttt
[5].
Distribusi Posterior
Dalam estimasi Bayes, setelah informasi tentang sampel dan prior dapat
ditentukan maka distribusi posteriornya dicari dengan mengalikan priornya dengan
informasi sampel yang diperoleh dari likelihoodnya [7]. Dituliskan sebagai berikut:
))(()()(,|()|)(,( 000 tPPtDLDtP . (9)
Akan difokuskan dalam mengestimasi parameter dan )(0 t . Karena model cukup
kompleks distribusi posterior susah untuk dicari secara langsung maka perlu adanya
suatu pendekatan menggunakan metode simulasi dengan MCMC (Markov Chain
Monte Carlo). Pada proses MCMC dipilih menggunakan algoritma Gibbs Sampling.
7
Kemudahan yang diperoleh dari penggunaan metode MCMC pada analisis
Bayesian antara lain metode MCMC dapat menyederhanakan bentuk integral yang
kompleks dengan dimensi besar menjadi bentuk integral yang sederhana dengan satu
dimensi. MCMC dapat mengestimasi densitas data dengan cara membangkitkan suatu
rantai Markov yang berurutan sebanyak N yang cukup besar sampai diperoleh
konvergen [12]. Salah satu keunggulan MCMC terletak pada performa yang tidak
terlalu sensitif pada penggunaan nilai awal.
Proses penyusunan algoritma Gibbs Sampling perlu ditentukan nilai awal dari
parameter yang akan diestimasi yaitu ),0(~ 2
0 Normal dan )(0 t . Manual
penyusunan algoritma Gibbs Sampling mengikuti prosedur penentuan
)),|)(()),(,|(( 00 DtPtDP dengan langkah pada persamaan (10) dan (11) yaitu
))(,|()())(,|( 00 tDPPtDP (10)
dan
))((),|)(( 00 tPDtP . (11)
Langkah pada persamaan (10) dan (11) diulang sebanyak B yang cukup besar, dengan
B merupakan banyaknya update pada penyusunan rantai Markov hingga diperoleh
deret rantai Markov yang konvergen.
Gibbs Sampling termasuk ke dalam dua kategori algoritma utama
dalam MCMC selain algoritma Metropolis. Gibbs Sampling adalah teknik
membangkitkan variabel acak dari distribusi marginal secara tidak langsung tanpa
harus menghitung densitasnya.
8
METODE PENELITIAN
Profil data
Data yang digunakan adalah data waktu bertahan hidup, status hidup pasien dan
treatment yang digunakan pasien penderita jantung koroner [4]. Data ditunjukkan
pada Tabel 1. Pasien sebanyak 40 pasien dan pasien yang mengalami kegagalan
(meninggal) saat menjalani treatment sebanyak 8 pasien.
Langkah-langkah penelitian
Pengolahan data dengan menggunakan software winBUGS 1.4. Software
winBUGS 1.4 adalah paket program yang dirancang khusus untuk memfasilitasi
permodelan data Bayesian menggunakan implementasi MCMC yang bekerja dalam
sistem operasi windows. Pengolahan data survival dilakukan dengan tahapan dan
spesifikasi model meliputi pengecekan terhadap syntax model, loading data,
compiling model, inisialisasi, menentukan iterasi MCMC sebanyak 10.000 kali guna
membangkitkan Rantai-Markov. Penyusunan parameter dan node Ring serta node
Bypass. Updating data parameter sebanyak 10.000. Dalam ploting masing-masing
node dan parameter beta nilai Markov dilakukan burn in sebanyak 5000 data, dan
diambil bangkitan rantai dari data ke 5001 sampai dengan 10.000.
Tabel 1. Data waktu bertahan hidup pasien penderita jantung koroner
No Waktu
(bulan) Status Treatment No
Waktu
(bulan) Status Treatment
1 26 0 Ring 21 32 0 Bypass
2 26 0 Ring 22 33 0 Bypass
3 38 0 Ring 23 42 0 Bypass
4 51 0 Ring 24 42 0 Bypass
5 52 0 Ring 25 56 0 Bypass
6 56 0 Ring 26 56 0 Bypass
7 57 0 Ring 27 60 1 Bypass
8 61 1 Ring 28 65 0 Bypass
9 62 0 Ring 29 78 0 Bypass
10 62 0 Ring 30 87 0 Bypass
11 66 0 Ring 31 87 0 Bypass
12 71 1 Ring 32 93 0 Bypass
9
13 71 0 Ring 33 102 0 Bypass
14 75 0 Ring 34 116 0 Bypass
15 83 0 Ring 35 116 1 Bypass
16 106 0 Ring 36 146 1 Bypass
17 123 0 Ring 37 161 0 Bypass
18 128 0 Ring 38 173 1 Bypass
19 156 0 Ring 39 178 1 Bypass
20 183 0 Ring 40 182 1 Bypass
ANALISIS HASIL
Proses analisis dilakukan pada data survival yang terdiri dari 40n dan
8T , dengan n menyatakan total pasien dan T menunjukkan pasien yang mengalami
kegagalan dalam proses treatment. Digunakan dan diselidiki terlebih dahulu dengan
pendektan klasik yaitu Regresi Cox-Proporsional Hazard dengan load packages
survival yang ada pada software R i386 3.0.1. Waktu hidup dan status sebagai
variabel yang dependent terhadap treatment. Hal tersebut berarti treatment sebagai
variabel independent dan probabilitas survival tergantung pada jenis treatment yang
digunakan. Diperoleh gambaran hasil yang dinyatakan pada Tabel 2.
Tabel 2. Hasil estimasi node Ring dengan metode klasik non-parametrik
Node
Waktu Survival Standard
Error
Batas
minimum
Batas
Maksimum
Ring [1] 61 0.923 0.0739 0.798 1
Ring [2] 71 0.821 0.1169 0.621 1
Tabel 3. Hasil estimasi node Bypass dengan metode klasik non- parametric
Node Waktu Survival
Standard
Error
Batas
minimum
Batas
Maksimum
Bypass[1] 60 0.929 0.0688 0.8030 1
Bypass[2] 116 0.796 0.1362 0.5691 1
Bypass[3] 146 0.637 0.1793 0.3667 1
Bypass[4] 173 0.424 0.2105 0.1606 1
10
Bypass[5] 178 0.212 0.1833 0.0391 1
Bypass[6] 182 0.000 - - -
Tabel 4. Hasil estimasi parameter Beta dengan metode klasik
Node Survival Estimasi
Titik
Batas
minimum
Batas
Maksimum
Beta 0.408 -0.6851 0.0778 0.9053
Tabel 4. menunjukkan nilai estimasi titik yang sekaligus menunjukkan nilai
koefisien regresi yakni sebesar -0.6851. Tingkat signifikansi alfa sebesar 0.5%.
Estimasi interval diambil dengan mengambil exponensial dari minus lower.95 dan
minus upper.95. Batas bawah dan batas atas diperoleh (0.0778, 0.9053) dengan
probabilitas 0.408 yang sudah signifikan karena nilai probabilitasnya lebih besar dari
0.05. Dengan estimasi non parametrik gambaran nilai probabilitas pasien bertahan
hidup untuk masing-masing treatment yang dikenakan terdapat pada Tabel 2 dan
Tabel 3. Ditunjukkan bahwa nilai probabilitas tertinggi ada dalam kelompok bypass
dengan nilai probabilitas sebesar 0.929 hanya selisih cukup kecil yaitu 0.005
signifikan dengan pasien dengan ring yang memiliki probabilitas tertinggi 0.923.
Gambaran grafik estimasi mean dari fungsi survival ditunjukan pada
Gambar 1. Pada Gambar 1. Sumbu horizontal menunjukkan waktu bertahan hidup
pasien penderita jantung koroner dalam satuan bulan , sedangkan sumbu vertical
menunjukkan presentase subjek yang masih bertahan hidup. Garis putus-putus pada
Gambar 1. menunjukkan garis survival untuk treatment Ring dan Bypass. Grafik
memiliki kecenderungan mengalami penurunan secara bertahap, tidak dapat
dipungkiri probabilitas pasien untuk bertahan hidup juga semakin kecil. Pada Gambar
1. Terlihat bahwa probabilitas bertahan hidup penderita dengan treatment ring jauh
lebih besar karena penurunan probabilitas tidak sesignifikan jika dengan
menggunakan bypass
.
11
0 50 100 150
0.0
0.2
0.4
0.6
0.8
1.0
survival Time in Months
Sur
viva
l Pro
babi
lity
Bypass
Ring
Gambar 1. Estimasi mean fungsi survival untuk treatment Ring dan Bypass
Hasil nilai estimasi dan karakteristik untuk masing-masing parameter
ditunjukkan pada Tabel 5, Tabel 6, dan Tabel 7.
Tabel 5. Hasil estimasi Bayesian node Ring
Node Mean Standard
Deviasi
MC error
(410 )
Batas
minimum
2,5%
Median
Batas
maksimum
97,5%
Ring[1] 0.9771 0.02706 3.18 0.9025 0.9865 0.9996
Ring[2] 0.9536 0.04169 5.01 0.841 0.9659 0.9972
Ring[3] 0.9262 0.05832 7.47 0.7752 0.941 0.9931
Ring[4] 0.8781 0.09146 12.58 0.6403 0.9009 0.988
Ring[5] 0.8119 0.1333 19.61 0.4802 0.8425 0.9797
Ring[6] 0.7185 0.182 26.98 0.2892 0.7567 0.967
Ring[7] 0.613 0.2202 33.35 0.1471 0.6429 0.9479
Ring[8] 0.4868 0.2417 37.97 0.0564 0.4902 0.9169
12
Tabel 6. Hasil estimasi Bayesian node Bypass
Node Mean Standard
Deviasi
MC error
(410 )
Batas
minimum
2,5%
Median
Batas
maksimum
97,5%
Bypass[1] 0.9532 0.04703 4.48 0.826 0.9679 0.9988
Bypass[2] 0.9067 0.06644 6.53 0.7398 0.9224 0.9887
Bypass[3] 0.855 0.08318 8.23 0.6548 0.8702 0.9701
Bypass[4] 0.7701 0.1131 10.3 0.5051 0.7862 0.9398
Bypass[5] 0.6615 0.1402 12.73 0.357 0.6743 0.8932
Bypass[6] 0.5194 0.1651 14.42 0.189 0.5257 0.8192
Bypass[7] 0.3739 0.1697 14.65 0.07959 0.366 0.7175
Bypass[8] 0.2289 0.1565 12.8 0.01491 0.2018 0.5872
Tabel 7. Hasil estimasi Bayesian parameter Beta
Node Mean Standard
Deviasi
MC
error
(410 )
Batas
Minimum
2,5%
Median
Batas
Maksimum
97,5%
Beta -0.8789 0.9409 0.01502 -2.919 -0.8126 0.7644
Mean dan Median dalam Tabel 5 dan Tabel 6 menunjukkan nilai estimasi
titik. Rata-rata dari parameter dalam Tabel 5 dan Tabel 6 merepresentasikan estimasi
nilai rata-rata posterior untuk pasien yang menggunakan treatment ring dan bypass
yang sekaligus mencerminkan peluang pasien untuk bertahan hidup jika
menggunakan treatment tersebut. Nilai mean yang tertinggi untuk pasien dengan
treatment ring adalah 0.9771 sedangkan dengan bypass 0.953 menunjukkan peluang
bertahan hidup seseorang bertahan dengan menggunakan treatment ring akan
menghasilkan nilai peluang bertahan hidup lebih besar dibandingkan dengan
menggunakan bypass yakni sebesar 0.9771. Nilai error dalam penyusunan MCMC
dengan algoritma Gibbs Sampling ditunjukkan dari MC error, diperoleh nilai error
yang kecil karena mendekati 0. Estimator interval untuk parameter ditunjukkan dari
interval konfidensi yakni batas minimum dan maksimum dengan pengambilan nilai
tingkat sifnifikansi 5%. Estimasi parameter menunjukkan bahwa semua
13
parameter terletak dalam batas interval konfidensi pada posisi antara 2,50% dan
97,50% dan nilainya signifikan yang tidak melewati nilai nol. Adanya interval
konfidensi tersebut menjamin pencakupan dari parameter yang diselidiki. Nilai rata-
rata posterior yaitu standar error sekaligus menunjukkan koefisien regresi,
diperoleh ditunjukkan pada Tabel 7 sebesar -0.8789.
Gambar 2. Plot time series untuk MCMC Bayesian dan densitas kernel Ring[1], Bypass[1],
dan beta
Plot time series untuk MCMC Bayesian dan densitas kernel ditujukkan dalam
Gambar 2. Rantai Markov yang terbentuk ditunjukkan dari garis hitam untuk
MCMC-Ring[1], MCMC-Bypass[1] dan MCMC-Beta. Plot dari time series
menunjukkan gambaran rantai Markov yang dibangkitkan. Updating rantai Markov
sebanyak 10.000 iterasi. Plot Gambar 2. menunjukkan nilai MCMC selalu positif,
hasil plot nampak rapat dan dapat merespon keseluruhan variabel berarti didapati
0 1000 2000 3000 4000 5000
0.70
0.85
1.00
MCMC-Ring[1]
Index
Ring
1
0.70 0.80 0.90 1.00
020
40
Densitas Kernel-Ring[1]
N = 5000 Bandw idth = 0.00302
Ring
1
0 1000 2000 3000 4000 5000
0.60.8
1.0
MCMC-Bypass[1]
Index
Bypa
ss1
0.6 0.7 0.8 0.9 1.0
05
10
Densitas Kernel-Bypass[1]
N = 5000 Bandw idth = 0.006248
Bypa
ss1
0 1000 2000 3000 4000 5000
-40
2
MCMC-Beta
Index
Beta
-6 -4 -2 0 2
0.00.2
0.4
Densitas Kernel-Beta[1]
N = 5000 Bandw idth = 0.1484
Beta
14
model telah konvergen. Nilai estimasi densitas posterior dapat dilihat dari plot
dnsitas kernel. Estimasi densitas kernel memberikan plot yang bagus karena
dihasilkan densitas yang cenderung halus. Plot dari parameter beta menunjukkan
bahwa distribusi gambar yang dihasilkan berdistribusi normal. Gambaran MCMC
mengindikasikan bahwa nilai yang ditunjukkan berasal dari sebaran posterior yang
dibentuk oleh rantai Markov.
Gambar 3. Gambaran running quantiles dan autokorelasi
Ring[1]
iteration
401 2500 5000 7500
0.9
0.95
1.0
Bypass[1]
iteration
401 2500 5000 7500
0.8
0.85
0.9
0.95
1.0
Bypass[1]
iteration
401 2500 5000 7500
0.8
0.85
0.9
0.95
1.0
Gambar 3. menunjukkan plot dari running quantiles yang merepresentasikan
gambaran mengenai nilai dari gambaran kinerja dari sampel yang bagus karena
ditunjukkan dari posisi plot garis berada di tengah dari batas atas dan bawah. Pada
gambaran running quantiles sumbu horizontal menunjukkan bangkitan rantai
Markov, sedangkan sumbu vertikal menunjukkan nilai estimasi titik nya. Nilai
autokorelasi untuk tiap node dan parameter ditunjukkan pula pada Gambar 3. Nilai
autokorelasi menunjukkan bahwa data yang dibangkitkan memenuhi sifar rantai
0 10 20 30
0.00.2
0.40.6
0.81.0
Lag
ACF
Series Ring1[5001:10000]
0 10 20 30
0.00.2
0.40.6
0.81.0
Lag
ACF
Series Bypass1[5001:10000]
0 10 20 30
0.00.2
0.40.6
0.81.0
Lag
ACF
Series Beta[5001:10000]
15
Markov. Untuk menggambar nilai autokorelasi digunakan fungsi acf pada R i386
3.0.1.
Berdasarkan analisis yang dilakukan diperoleh estimasi parameter beta dari
model Cox-Regresion untuk pasien penderita jantung koroner dengan estimasi
Bayesian menggunakan dua treatment yakni ring dan bypass sebesar -0.8789
sehingga model Cox-Regression dari fungsi survival )8789.0exp()(0 izt ) dan
)-0.8789exp()71.82476473exp();( zztS .
Kesimpulan
Dalam paper ini diperoleh parameter dari model Cox-Regression untuk data
ketahanan hidup pasien penderita jantung koroner dengan Bayesian survival analysis.
Penelitian ini dapat dikembangkan untuk analisis survival model Weibul dengan
metode Bayesian.
DAFTAR PUSTAKA
[1] Departemen Kesehatan Republik Indonesia.2007.Profil Kesehatan Indonesia
2005. Jakarta
[2] World Health Organization. 2014. The top 10 causes of death. Swiss: WHO.
diakses pada Senin 15 September 2014 pukul 9.41.
http://www.who.int/mediacentre/factsheets/fs310/en/
[3] Reskianti,Kiki, Nuriti Sunusi dan Nasrah Sirajang.2014.Estimasi Bayesian pada
Analisis Data Ketahanan Hidup Berdistribusi Eksponensial melalui Pendekatan
SELF. Studi Kasus: Analisis Ketahanan Hidup Flourophores.Jurusan
Matematika, Fakultas Matematika dan Ilmu Pengetahuan
Alam.UNHAS:Makassar.
[4] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan
Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita
Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika.
UKSW : Salatiga.
16
[5] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data.
Universitas Cagliari: Italia.
[6] Subanar,Prof.,Ph.D.2013.Statistika Matematika.Graha Ilmu: Yogyakarta
[7] Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan
Metode Bayes Menggunakan Prior Konjugat. Universitas Diponegoro:
Semarang.
http://eprints.undip.ac.id/29153/1/ade_candra.pdf
[8] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi Cox
Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus. Program
Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.
[9] Hidayah, Eny. 1994. Analisis Ketahanan Hidup dengan Metode Gehan Mantel-
Haenszel dan Tarone-Ware untuk 2 Sampel Sampai K Sampel. Universitas
Diponegoro : Semarang.
[10] Mustafa, Ayman dan Anis Ben Ghorbal.2011. Using WinBUGS to Cox Model
with Changing from the Ba seline Hazard Function. Fakultas Matematika.
Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.
[11] Andrew E Long. 1999. Leuk: survival analysis using Cox regression. Diakses
pada Selasa 16 September 2014 pukul 20.12 .
http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node29.html
[12] Hidayah,Entin. Model Disagregasi Data Hujan Temporal dengan Pendekatan
Bayesian sebagai Input Permodelan Banjir.ITS:Surabaya.
[13] London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX
Publication : USA.
.[14] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for
Censored and Truncated Data. New York. Springer-Verlag New York Inc.
1
BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER
MODEL WEIBULL-REGRESSION PADA KASUS KETAHANAN HIDUP
PASIEN PENDERITA JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan
2, Leopoldus Ricky Sasongko
3
1,2,3 Program Sudi Matematika, Fakultas Sains dan Matematika,
Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
ABSTRAK
Paper ini membahas mengenai estimasi parameter model Weibull-Regression
untuk data tersensor pada kasus ketahanan hidup pasien penderita jantung koroner
dengan pendekatan Bayesian survival analysis. Data yang digunakan adalah data
simulasi waktu hidup pasien, status pasien (hidup/mati) dan treatment yang
dikenakan yaitu ring dan bypass. Pendekatan Bayesian (Bayesian approach)
digunakan untuk mencari distribusi posterior parameter. Metode Markov Chain
Monte Carlo (MCMC) digunakan untuk membangkitkan Rantai Markov guna
mengestimasi parameter meliputi koefisien regresi ( ) dan parameter r dari model
survival Weibull. Parameter dan r yang diperoleh digunakan untuk menghitung
fungsi survival tiap pasien untuk tiap treatment yang sekaligus menunjukkan
probabilitas bertahan hidup pasien penderita jantung koroner.
Kata Kunci : Survival Analysis, model Weibull-Regression, Bayesian, Markov
Chain Monte Carlo (MCMC)
2
PENDAHULUAN
Pada makalah [1] telah dibahas cara mengestimasi parameter model Cox-
Regression pada kasus ketahanan hidup pasien penderita jantung koroner [1].
Permodelan data survival dengan menggunakan Bayesian survival analysis
menggunakan Cox-Regression tidak memperhatikan adanya data tersensor.
Kenyataannya, selama proses pengamatan berlangsung terdapat data tersensor
(censored data) yaitu data yang tidak terobservasi secara penuh (not completely
observable) dalam waktu pengamatan [2]. Hal ini berarti selama proses pengamatan
dalam rentang waktu yang ditentukan, terdapat pasien yang belum selesai menjalani
treatment dan waktu hidupnya tetap dicatat dalam pengamatan. Oleh karena itu
untuk mengolah data tersensor digunakan analisis model survival parametrik. Model
yang sering digunakan adalah model Weibull [2]. Distribusi Weibull digunakan
secara efektif untuk menganalisis data waktu hidup khususnya untuk data tersensor
[3]. Fungsi survival distribusi Weibull diestimasi dan digunakan sebagai distribusi
probabilitas untuk data waktu bertahan hidup pasien penderita jantung koroner.
Diasumsikan data yang digunakan termasuk ke dalam Random Censoring.
DASAR TEORI
Data Tersensor
Data tersensor adalah data yang tidak teramati secara penuh (not completely
observable). Biasanya data tersensor ini dijumpai untuk studi observasi dan penelitian
dengan adanya batasan waktu. Terdapat 3 tipe data tersensor yaitu Tersensor tipe I,
Tersensor tipe II dan Random Censoring. Data tersensor tipe I terjadi apabila subjek
berhenti sebelum pemberian waktu sensor. Data tersensor tipe II terjadi apabila
subjek melampaui batas waktu pengamatan dan waktu survivenya catat jika subjek
telah mengalami kegagalan. Random Censoring adalah tipe data tersensor yang sering
terjadi [2].
3
Distribusi Weibull
Distribusi Weibull merupakan distribusi yang sering digunakan dalam analisis
parametrik untuk fungsi survival. Distibusi Weibull banyak digunakan pada aplikasi
di bidang industri maupun biomedis. Realitas yang ditemui untuk bidang engineering
digunakan untuk menggambarkan waktu kegagalan (time to failure) pada barang
elektronik dan sistem mekanik serta untuk memodelkan ketahanan barang elektronik
[3]. Secara umum fungsi kepadatan probabilitas (probability density function) dari
distribusi Weibull adalah:
r
r
r
tt
rtf
exp)( 1 dengan 0, r dan 0t . (1)
Dengan mensubtitusikan
r
1ke dalam persamaan (1) maka diperoleh :
)exp()( 1 rr ttrtf . (2)
Shape parameter dan scale parameter berurutan ditunjukkan oleh nilai r dan . Scale
parameter (parameter skala) adalah jenis khusus dari parameter numerik yang
menunjukkan besarnya distribusi data. Semakin kecil nilai dari scale arameter maka
distribusi data akan menyebar. Scale parameter (parameter bentuk) adalah jenis
khusus dari parameter numerik yang menunjukkan bentuk dari kurva. Fungsi
survival untuk distribusi Weibull dapat diperoleh dengan mengintegralkan fungsi
kepadatan probabilitas pada persamaan (1) sehingga
).exp()()( r
t
tduuftS
(3)
Laju kegagalan pasien ditunjukkan oleh fungsi hazard (hazard function) dari
distribusi Weibull yaitu:
.)(ln)(
)()( 1
0
rtrtSdt
d
tS
tft (4)
Fungsi hazard kumulatifnya (cumulative hazard function) ditunjukkan seperti di
bawah ini:
4
.)()(0
00
r
t
tduut (5) [4].
Weibull-Regression
Model regresi Weibull untuk distribusi dari fungsi survival dapat dirumuskan
sebagai berikut:
)exp(),('1' r
i
zr
i
z
ii tetreztf ii
(6)
dengan mengganti iz
i e' maka persamaan (6) berubah menjadi:
)exp(),(1 r
ii
r
iiii ttrtf
(7)
dengan it menunjukkan waktu bertahan hidup untuk data pasien yang tersensor
dengan vektor covariate iz [5]. Dalam hal ini r sebagai parameter yang akan
diestimasi nilainya. Distribusi Weibull digunakan karena fleksibel meliputi bentuk
dan model sederhana yang memungkinkan perubahan kenaikan 1r , penurunan
1r dan laju kegagalan yang konstan untuk 1r [6]. Koefisien regresi dari model
Weibull adalah yang diperoleh dengan mengasumsikannya sebagai prior yang
berdistribusi normal )0001.0,0(~ N . Parameterisasinya ),(~ iii rWeibullT .
Distribusi Prior Model Weibull
Penentuan distribusi prior model Weibull ditentukan dengan mengambil
distribusi yang sering digunakan sebagai standar yaitu Normal ),0( 2N dengan nilai
2 diambil nilai 0.0001 sebagai vague precision untuk model regresi Weibull.
Penentuan distribusi Prior untuk penentuan shape parameter r menggunakan
distribusi Gamma(1,0.0001) untuk fungsi distribusi survival yang turun perlahan pada
saat nilai 0t (positive real line) [5].
5
Fungsi Likelihood Model Weibull
Fungsi likelihood yang biasa digunakan untuk menganalisis data tersensor adalah
)1(
1
)()(),|( ii
ii
n
i
tStfrDL
. (9)
Dengan mensubtitusikan )( itf diberikan pada persamaan (2) dan )( itS pada
persamaan (3) maka diperoleh fungsi likelihood untuk Model Weibull yaitu:
)1(
1
'1')exp()exp(),|(
i
i
ii rn
i
r
i
zr
i
zttetrerDL
(10)
dengan 0i jika observasi ke-i tersensor dan 1i jika observasi ke-i tidak
tersensor [2].
Aproksimasi Distribusi Posterior
Dalam estimasi Bayes, setelah informasi tentang sampel dan prior dapat
ditentukan maka distribusi posteriornya dicari dengan cara mengalikan priornya
dengan informasi sampel yang diperoleh dari likelihoodnya [7]. Dituliskan sebagai
berikut:
)()(),|()|,( PrPrDLDrP . (11)
Akan difokuskan dalam mengestimasi parameter r dan . Karena model rumit
karena mengandung banyak parameter maka distribusi posterior susah untuk
diestimasi secara langsung, maka perlu adanya suatu pendekatan menggunakan
metode simulasi dengan MCMC (Markov Chain Monte Carlo). Pada proses MCMC
dipilih menggunakan algoritma Gibbs Sampling.
Algoritma Gibbs Sampling dalam winBUGS membutuhkan nilai awal dari
parameter yang akan di estimasi. Nilai awal ditentukan yaitu )0.0001,0(~ Normal
dan )1,0.0001(~Gammar . Langkah manual penyusunan algoritma Gibbs Sampling
dibuat dengan prosedur penentuan )),|(),,|(( DrPDrP dengan langkah pada
persamaan (12) dan (13) yaitu:
),|()(),|( rDLPrDP (12)
dan
6
),|()(),|( rDLrPDrP . (13)
Langkah pada persamaan (12) dan (13) diulang sebanyak bilangan B yang cukup
besar, dengan B merupakan banyaknya update pada software WinBUGS 1.4 yaitu
proses iterasi guna menyusun rantai Markov hingga diperoleh deret rantai Markov
yang konvergen.
METODE PENELITIAN
Profil data
Data yang digunakan adalah data waktu bertahan hidup, status hidup pasien dan
treatment yang digunakan pasien penderita jantung koroner [4]. Kemudian dilakukan
simulasi dengan menambah data yang tersensor. Data survival ditunjukkan pada
Tabel 1 dengan banyaknya pasien sejumlah 40 pasien dan dua treatment yang
dikenakan yaitu treatment Ring dan Bypass. Dalam hal ini tanda * menunjukkan data
yang tersensor. Banyaknya data yang tersensor untuk treatment Ring sebanyak 1
pasien dan untuk treatment Bypass sebanyak 7 pasien. Status hidup pasien bernilai 0
menunjukkan pasien tetap bertahan hidup saat menjalani treatment dan bernilai 1
menunjukkan pasien meninggal saat proses treatment berlangsung
Langkah-langkah penelitian
Pengolahan data dengan menggunakan winBUGS 1.4. Sspesifikasi model
meliputi pengecekan terhadap syntax model, loading data, compiling model,
inisialisasi model, menentukan iterasi MCMC sebanyak 200.000 kali guna
membangkitkan Rantai-Markov hingga mencapai konvergen. Parameter yang
akan diestimasi meliputi treatment ring, bypass serta parameter distribusi Weibull r.
Updating data parameter ditentukan sebanyak 200.000 titik sampel. Dalam ploting
masing-masing node dan parameter beta nilai rantai Markov dilakukan burn in
sebanyak 100.000 data, dan diambil bangkitan rantai dari data ke 100.001 sampai
dengan 200.000 titik sampel.
7
Tabel 1. Data survival pasien penderita jantung koroner
No Waktu
(bulan) Status Treatment No
Waktu
(bulan) Status Treatment
1 26 0 Ring 21 32 0 Bypass
2 26 0 Ring 22 33 0 Bypass
3 38 0 Ring 23 42 0 Bypass
4 51 0 Ring 24 42 0 Bypass
5 52 0 Ring 25 56 0 Bypass
6 56 0 Ring 26 56* 0 Bypass
7 57 0 Ring 27 60* 1 Bypass
8 61 1 Ring 28 65 0 Bypass
9 62 0 Ring 29 78 0 Bypass
10 62 0 Ring 30 87 0 Bypass
11 66 0 Ring 31 87* 0 Bypass
12 71 1 Ring 32 93 0 Bypass
13 71 0 Ring 33 102* 0 Bypass
14 75 0 Ring 34 116* 0 Bypass
15 83 0 Ring 35 116* 1 Bypass
16 106 0 Ring 36 146* 1 Bypass
17 123 0 Ring 37 161 0 Bypass
18 128* 0 Ring 38 173 1 Bypass
19 156 0 Ring 39 178 1 Bypass
20 183 0 Ring 40 182 1 Bypass
HASIL DAN PEMBAHASAN
Dalam proses analisis data yang terdiri dari 40N dan 2M , dengan N
menyatakan total pasien penderita penyakit jantung koroner dan M menunjukkan
banyaknya treatment yang digunakan oleh pasien meliputi metode pengobatan Ring
dan Bypass.
Weibull-Regresion menggunakan pendekatan Bayesian dilakukan dengan
update untuk menyusun MCMC dengan iterasi sebanyak 200.000 titik sampel. Hasil
nilai estimasi dan karakteristik untuk masing-masing parameter ditunjukkan pada
Tabel 2 dan Tabel 3.
8
Tabel 2. Hasil estimasi Bayesian untuk parameter node Ring dan Bypass
Node Mean Standard
Deviasi
MC
error
Batas
minimum 2,5% Median
Batas
maksimum
97,5%
Ring -8.936 1.248 0.02904 -11.51 -8.889 -6.627
Bypass -0.7868 0.3685 0.00155 -1.524 -0.7821 -0.07581
Tabel 3. Hasil estimasi Bayesian untuk parameter r
Node Mean Standard
Deviasi
MC
error
Batas
Minimum
2,5%
Median
Batas
Maksimum
97,5%
r 1.98 0.2609 0.00612 1.493 1.972 2.515
Tabel 4. Probabilitas tiap pasien untuk masing-masing treatment
No Waktu
(bulan) S(t) Treatment No
Waktu
(bulan)
S(t) 125101
Treatment
1 26 0.9200 Ring 21 32 0.5810 Bypass
2 26 0.9200 Ring 22 33 0.5810 Bypass
3 38 0.8381 Ring 23 42 0 Bypass
4 51 0.7288 Ring 24 42 0 Bypass
5 52 0.7198 Ring 25 56 0 Bypass
6 56 0.6834 Ring 26 56* 0 Bypass
7 57 0.6742 Ring 27 60* 0 Bypass
8 61 0.6370 Ring 28 65 0 Bypass
9 62 0.6277 Ring 29 78 0 Bypass
10 62 0.6277 Ring 30 87 0 Bypass
11 66 0.5904 Ring 31 87* 0 Bypass
12 71 0.5439 Ring 32 93 0 Bypass
13 71 0.5439 Ring 33 102* 0 Bypass
14 75 0.5072 Ring 34 116* 0 Bypass
15 83 0.4362 Ring 35 116* 0 Bypass
16 106 0.2601 Ring 36 146* 0 Bypass
17 123 0.1640 Ring 37 161 0 Bypass
18 128* 0.1414 Ring 38 173 0 Bypass
19 156 0.0553 Ring 39 178 0 Bypass
20 183 0.0189 Ring 40 182 0 Bypass
9
Pada [1] telah diperoleh satu nilai estimasi parameter model Cox-
Regression untuk kedua teknik pengobatan Ring dan Bypass yaitu sebesar -0.8789
[1]. Pada model Weibull-Regression didapatkan dua nilai parameter untuk
treatment Ring dan Bypass berurutan sebesar -8.936 dan -0.7868. Probabilitas tiap
pasien untuk masing-masing treatment ditunjukkan pada Tabel 4. Nilai probabiitas
tertinggi untuk pasien menggunakan treatment Ring adalah 0.9200 dan yang terendah
adalah 0.0189. Sedangkan untuk treatment bypass diperoleh nilai probabilitas yang
sangat kecil. Pebandingan nilai probabilitas ketahanan hidup pasien penderita jantung
koroner untuk model Cox-Regression dan Weibull-Regression ditunjukkan pada
Tabel 5. Dari Tabel 5. Terlihat nilai probabilitas bertahan hidup pasien dengan
menggunakan Weibull-Regression jauh lebih kecil jika dibandingkan dengan model
Cox-Regression. Nilai probabilitas fungsi survival yang bernilai 0 diduga karena
model Weibull-Regression kurang sesuai untuk mengestimasi parameter ktahanan
hidup pasien penderita jantung koroner.
Tabel 5. Probabilitas survival untuk model Cox-Regression dan Weibull-Regression
Pasien ke - Waktu
(bulan)
S(t)
Cox-Regression
S(t)
Weibull-Regression
Status
Pasien
8 61 0.9771 0.6370 1
12 71 0.9536 0.5439 1
27 60 0.9262 0 1
35 116 0.8781 0 1
36 146 0.8119 0 1
38 173 0.7185 0 1
39 178 0.6130 0 1
40 182 0.4868 0 1
Mean dan Median dalam Tabel 2 menunjukkan nilai estimasi titik untuk nilai
parameter . Rata-rata dari parameter dalam Tabel 2 merepresentasikan estimasi
nilai rata-rata posterior untuk pasien yang menggunakan ring dan bypass
menggunakan kedua treatment tersebut. Nilai mean untuk pasien dengan ring adalah
-8.936 sedangkan dengan bypass -0.7868. Nilai error dalam penyusunan MCMC
dengan algoritma Gibbs Sampling ditunjukkan dari MC error, diperoleh nilai error
10
yang cukup kecil karena mendekati nol. Estimator interval untuk parameter
ditunjukkan dari interval konfidensi yakni batas minimum dan maksimum dengan
pengambilan nilai 5,0 . Estimasi parameter menunjukkan bahwa semua parameter
terletak dalam batas interval konfidensi pada posisi antara 2,50% dan 97,50% dan
nilainya signifikan karena tidak melewati nilai nol. Adanya interval konfidensi
tersebut menjamin pencakupan dari parameter yang diselidiki. Nilai dari koefisien
regresi ditunjukkan dari nilai mean dari ring dan bypass.
Plot time series untuk MCMC Bayesian dan densitas kernel ditujukkan dalam
Gambar 1. Plot dari time series menunjukkan gambaran rantai Markov yang
dibangkitkan dari data dengan updating sebanyak 200.000 iterasi.
Gambar 1. Plotime series untuk MCMC Bayesian dan densitas kernel node Ring, node
Bypass, dan r
0e+00 4e+04 8e+04
-14
-10
-6
MCMC-Ring
Index
Rin
g
-14 -12 -10 -8 -6 -4
0.00
0.15
0.30
Densitas Kernel beta-Ring
N = 100000 Bandw idth = 0.1109
Rin
g1
0e+00 4e+04 8e+04
-2.5
-1.0
0.5
MCMC-Bypass
Index
Byp
ass
-3 -2 -1 0
0.0
0.4
0.8
Densitas Kernel beta-Bypass
N = 100000 Bandw idth = 0.03327
Byp
ass
0e+00 4e+04 8e+04
1.0
2.0
3.0
MCMC-r
Index
r
1.0 1.5 2.0 2.5 3.0
0.0
1.0
Densitas Kernel-r
N = 100000 Bandw idth = 0.02319
r
11
Plot Gambar 1. menunjukkan nilai MCMC tidak selalu positif, hasil plot
nampak rapat dan dapat merespon keseluruhan sampel berarti didapati model telah
konvergen. Nilai estimasi densitas posterior dapat dilihat dari plot densitas kernel.
Estimasi densitas kernel memberikan plot yang bagus karena dihasilkan densitas yang
cenderung halus. Plot dari densitas kernel untuk setiap node Ring dan Bypass
mengikuti densitas prior yakni berdistribusi normal sedangkan untuk parameter r juga
cenderung normal. Gambaran MCMC mengindikasikan bahwa nilai yang
ditunjukkan berasal dari sebaran posterior yang dibentuk oleh rantai Markov.
Gambar 3. Gambaran running quantiles dan autokorelasi
ring
iteration
8001 50000 100000 150000
-12.0
-10.0
-8.0
-6.0
bypass
iteration
8001 50000 100000 150000
-1.5
-1.0
-0.5
0.0
r
iteration
8001 50000 100000 150000
1.5
2.0
2.5
3.0
Gambar 3. menunjukkan plot dari running quantiles yang merepresentasikan
gambaran mengenai nilai dari kinerja sampel yang cukup bagus. Hal tersebut
ditunjukkan dari posisi plot garis yang masih terletak di dalam rentang interval yaitu
diantara batas atas dan bawah. Gambaran nilai autokorelasi untuk tiap node dan
0 10 30 50
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
Series ring[100001:2e+05]
0 10 30 50
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
Series bypass[100001:2e+05]
0 10 30 50
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
Series r[100001:2e+05]
12
parameter ditunjukkan pula pada Gambar 3. Nilai autokorelasi menunjukkan bahwa
data yang dibangkitkan memenuhi sifar rantai Markov [8]. Plot nilai autokorelasi
dengan menggunakan fungsi acf pada R i386 3.0.1. ACF merupakan singkatan dari
Auto Corelation Function. Nilai autokorelasi untuk ring dan r kuat ditunjukkan dari
plot autokorelasi yang turun secra perlahanan, Sedangkan untuk node bypass tidak
sekuat nilai autokorelasi untuk ring dan r. Hal tersebut terlihat dari plot autokorelasi
yang turun tajam.
Berdasarkan analisis yang dilakukan diperoleh nilai estimasi parameter
dan r dari model Weibull-Regresion untuk pasien penderita jantung koroner.
Kesimpulan
Dalam paper ini diperoleh nilai parameter dan r serta nilai probabilitas
bertahan hidup pada model Weibull-Regression untuk mengolah data tersensor
ketahanan hidup pasien penderita jantung koroner dengan Bayesian survival analysis.
DAFTAR PUSTAKA
[1] Lukitasari, A.Dewi, Adi Setiawan dan Leopoldus Ricky Sasongko.2014.
Bayesian Survival Analysis menggunakan Cox-Regression untuk Mengestimasi
Model Ketahanan Hidup Pasien Penderita Jantung Koroner. Prosiding Seminar
Nasional Sains dan Pendidikan Sains. Universitas Muhammadiyah : Purworejo. [2] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data.
Fakultas Matematika dan Informatika. Universitas Cagliari: Italia.
[3] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for
Censored and Truncated Data. New York. Springer-Verlag New York Inc.
[4] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan
Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita
Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika.
UKSW : Salatiga.
[5] Andrew E Long. 1999. Weibull Regression in Censored Survival Analysis.
Diakses pada Selasa, 16 Desember 2014 pukul 14:02.
http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node27.html
13
[6] Thamrin, Sri Astuti.2013.Bayesian Survival Analysis Using Gene
Expression.Fakultas Sains dan Teknik.Universitas Teknologi Queensland :
Australia.
[7] Subanar.2013.Statistika Matematika.Graha Ilmu: Yogyakarta.
[8] Hidayah,Entin.2013.Model Disagregasi Data Hujan Temporal dengan
Pendekatan Bayesian sebagai Input Permodelan Banjir.ITS:Surabaya.
[9] Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan Metode
Bayes Menggunakan Prior Konjugat. Universitas Diponegoro: Semarang.
http://eprints.undip.ac.id/29153/1/ade_candra.pdf
[10] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi
Cox Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus.
Program Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.
[11] London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX
Publication : USA.
[12] Mustafa, Ayman dan Anis Ben Ghorbal.2011.Using WinBUGS to Cox Model
with Changing from the Ba seline Hazard Function. Fakultas Matematika.
Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.
xvi
Lampiran 1
Data survival pasien penderita jantung koroner
No Waktu
(bulan) Status Treatment No
Waktu
(bulan) Status Treatment
1 26 0 Ring 21 32 0 Bypass
2 26 0 Ring 22 33 0 Bypass
3 38 0 Ring 23 42 0 Bypass
4 51 0 Ring 24 42 0 Bypass
5 52 0 Ring 25 56 0 Bypass
6 56 0 Ring 26 56* 0 Bypass
7 57 0 Ring 27 60* 1 Bypass
8 61 1 Ring 28 65 0 Bypass
9 62 0 Ring 29 78 0 Bypass
10 62 0 Ring 30 87 0 Bypass
11 66 0 Ring 31 87* 0 Bypass
12 71 1 Ring 32 93 0 Bypass
13 71 0 Ring 33 102* 0 Bypass
14 75 0 Ring 34 116* 0 Bypass
15 83 0 Ring 35 116* 1 Bypass
16 106 0 Ring 36 146* 1 Bypass
17 123 0 Ring 37 161 0 Bypass
18 128* 0 Ring 38 173 1 Bypass
19 156 0 Ring 39 178 1 Bypass
20 183 0 Ring 40 182 1 Bypass
xvii
Lampiran 2
Program WINBUGS 1.4 untuk Bayesian Survival Analysis menggunakan Cox-
Regression
#Program WINBUGS 1.4 untuk model Cox-Regression data survival pasien
penderita jantung koroner
model jantung;
const
N =40, # number of patients
T = 8, # number of unique failure times
eps = 0.000001; # used to guard against numerical
# imprecision in step function
var
obs.t[N], # observed failure or censoring time for
each patient
t[T+1], # unique failure times + maximum censoring
time
dN[N,T], # counting process increment
Y[N,T], # 1=subject observed; 0=not observed
Idt[N,T], # intensity process
Z[N], # covariate
beta, # regression coefficient
dL0[T], # increment in unknown hazard function
beta0[T], # log(increment in unknown hazard
function)
dL0.star[T], # prior guess at hazard function
c, # degree of confidence in prior guess for
dL0
mu[T], # location parameter for Gamma (= c *
dL0.star)
r, # prior guess at failure rate
fail[N], # failure = 1; censored = 0
Ring[T], # survivor function for ring group
Bypass[T]; # survivor function for bypass group
{
# Set up data
for(i in 1:N) {
for(j in 1:T) {
# risk set = 1 if obs.t >= t
xviii
Y[i,j] <- step(obs.t[i] - t[j] + eps);
# counting process jump = 1 if obs.t in [ t[j],
t[j+1] )
# i.e. if t[j] <= obs.t < t[j+1]
dN[i,j] <- Y[i,j]*step(t[j+1] - obs.t[i] -
eps)*fail[i];
}
}
# Model
for(j in 1:T) {
# beta0[j] ~ dnorm(0,0.001); # include this when using
Poisson trick
for(i in 1:N) {
dN[i,j] ~ dpois(Idt[i,j]); # Likelihood
Idt[i,j] <- Y[i,j]*exp(beta*Z[i])*dL0[j]; # Intensity
# Try Poisson trick - independent log-normal hazard
increments
# - enables dL0, c, r, mu to be
dropped from model
# Idt[i,j] <- Y[i,j]*exp(beta0[j]+beta*Z[i]); #
Intensity
}
dL0[j] ~ dgamma(mu[j], c);
mu[j] <- dL0.star[j] * c; # prior mean hazard
# Survivor function = exp(-
Integral{l0(u)du})^exp(beta*z)
Ring[j] <- pow(exp(-sum(dL0[1:j])), exp(beta * -0.5));
Bypass[j] <- pow(exp(-sum(dL0[1:j])), exp(beta * 0.5));
}
c <- 0.001; r <-0.1;
for (j in 1:T) {
dL0.star[j] <- r * (t[j+1]-t[j])
xix
}
beta ~ dnorm(0.0,0.000001);
}
#List data pasien penderita jantung koroner list(N=60, T=8, eps = 1.0E-10,
obs.t=c(6,7,7,8,11,17,20,21,21,25,26,26,38,51,52,56,
57,61,62,62,66,71,71,75,83,106,123,128,156,183,6,6,7,12,1
2,16,17,17,21,26,32,33,42,42,56,56,60,65,78,87,87,93,102,
116,116,146,161,173,178,182),
fail=c(0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0
,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,
0,0,0,1,1,0,1,1,1),
Z=c(0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,
0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0
.5,0.5,0.5,0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-
0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-
0.5,-0.5,-0.5,-0.5,-0.5,-0.5, -0.5,-0.5,-0.5,-0.5,-
0.5),t=c(60,61,71,116,146,173,178,182,183))
#inisialisasi untuk treatment ring dan bypass list( beta = 0.0,
dL0 = c(1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0))
xx
Lampiran 3
Program WINBUGS 1.4 untuk Bayesian Survival Analysis menggunakan
Weibull-Regression
#Program WINBUGS 1.4 untuk model Weibull-Regression data survival pasien
penderita jantung koroner
model
{
for(i in 1 : M) {
for(j in 1 : N) {
t[i, j] ~ dweib(r, mu[i])I(t.cen[i,
j],)
}
mu[i] <- exp(beta[i])
beta[i] ~ dnorm(0.0, 0.001)
median[i] <- pow(log(2) * exp(-beta[i]),
1/r)
}
r ~ dexp(0.001)
ring <-beta[1]
bypass <- beta[2] - beta[1]
}
#List untuk data simulasi pasien penderita jantung koroner
list(t =
structure(.Data=c(26,26,38,51,52,56,57,61,62,62,
66,71,71,75,83,106,123,NA,156,183,32,33,42,42,56,NA,NA,65
,78,87,NA,93,NA,NA,NA,NA,161,173,178,182),.Dim =
c(2,20)),
t.cen=structure(.Data=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,128,0,0,0,0,0,0,0,56,60,0,0,0,87,0,102,116,116,146,
0,0,0,0),.Dim = c(2,20)),M = 2, N = 40)
#Inisialisasi
list(beta = c(0,0), r = 2)
#Keterangan
N =40, # number of patients
M = 2 #number of treatment; NA = waktu data tersensor
xxi
Lampiran 4
Manual penggunaan WINBUGS 1.4
1. Buka software WINBUGS 1.4 sehingga muncul tampilan sebagai berikut
2. Open file yang akan dirunning dengan klik file open, dilanjutkan dengan
memilih file yang telah berisi model, data dan inisialisi.
xxii
3. Mengecek model dengan klik model specification sehinga muncul kotak
dialog sebagai berikut
4. Lakukan cek model dengan mengeblok kata model kemudian pilih check
model
xxiii
5. Loading data dilakukan dengan cara blok list data kemudian pilih load data
6. Compiling model dilakukan dengan klik compile
xxiv
7. Lakukan inisialisasi dengan cara blok list inisialisasi data kemudian pilih load
inits dan klik gene inits
8. Lanjutkan dengan setting sample yaitu pilih menu interface sample akan
muncul kotak dialog sample monitor tool
xxv
9. Lakukan paramerisasi dengan cara set parameter . meliputi ring, bypass dan r
10. Lakukan updating MCMC dengan pilih menu model update, isi kolom
updates sebanyak 200.000 titik sesuai banyaknya titik sampel rantai Markov
yang ingin dibangkitkan. Tunggu hingga update MCMC selesai.
xxvi
11. Pada kolom node di sample monitor tool, isi dengan * (untuk memunculkan
semua node yang telah di set). Untuk mencari statistik dari parameter pilih
stats maka akan muncul statistik dari keseluruhan parameter yang telah di set.
12. Untuk menampilkan gambaran rantai Markov klik history
xxvii
13. Untuk menggambar kuantil klik quantiles
xxviii
Lampiran 6
Sertifikat Publikasi