Date post: | 17-Jan-2016 |
Category: |
Documents |
Upload: | yeahrightskripsi |
View: | 297 times |
Download: | 0 times |
1
PERANCANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA C4.5
UNTUK DIAGNOSA PENYAKIT PADA ANAK (Studi Kasus: BPS Amanah)
Abstract – Susceptible to interference, espcially
children. Parents who lack an understanding of health,
entrust the matter to experts or specialists who
understand more about health. However, sometimes
the eperts or specialisthave weaknesses in working
hours (of practice) and a limited number of patients
that have to wait for the queue. For that the patientmay
experience disappointetment, consequently comfort felt
by the patient or the doctor himself distracted.
Therefore parents need an expert who can facilitate in
diagnosing diseases. Because of them that we need a
tool that can diagnose diseases such as data mining.
With the help of data mining is expected to assist
physicians in the treatment of patiens or with data
mining also a physician assistant can also help treat
patients.
The problems that occur are dealt with a casethat is
capable of searching for data reinforce the results of
the decision and the expected decision technique C4.5
algorithm generated wll be accurate.
The results of this study will produce an output that is
featuring a selection of the patiens symptoms, types of
illness and it s management.
Keywords – data mining, choice of symptoms, type of
disease, C4.5 algorithm, BPS
1. Pendahuluan
Perkembangan dunia kesehatan saat ini sangatlah
penting, itu karena kesadaran masyarakat akan manfaat
kesehatan sudah tinggi sehingga peningkatan jumlah
kesehatan setiap tahun mengalami kenaikan. Dengan
demikian bukan tidak mungkin dapat menimbulkan
masalah bagi setiap anggota medis dalam mendiagnosa
dengan baik.
BPS Amanah merupakan salah satu contoh Lembaga
Bidan Praktek Swasta yang bisa membantu
permasalahan kesehatan yang ada di masyarakat.
Namun, terkadang terdapat pula kelemahannya seperti
jam kerja (praktek) terbatas dan banyaknya pasien
sehingga harus menunggu antrian. Selain itu, pihak BPS
masih mendiagnosa penyakit pasien secara manual. Oleh
karena itu, dibutuhkan sebuah sistem yang dapat
membantu mendiagnosa penyakit pasien agar
mempermudah para tenaga medis.
Dengan itu aplikasi ini akan memnbantu pihak
lembaga terkait agar dapat mendiagnosa penyakit yang
diderita oleh pasien. Dimana, aplikasi ini akan
mengimplementasikan Data Mining menggunakan
algoritma C4.5.
2. Pembahasan
Data mining adalah serangkaian proses untuk
menggali nilai tambah dari suatu kumpulan data, berupa
pengetahuan didalam database yang selama ini tidak
diketahui secara manual. Data mining adalah proses
yang menggunakan teknik statistik, matematika,
kecerdasan buatan dan machine learning untuk
mengekstrasi informasi yang bermanfaat dan
pengetahuan yang terkait dari berbagai database besar
[1].
Algoritma C4.5 merupakan algoritma yang
digunakan untuk membentuk pohon keputusan. Dengan
metode pohon keputusan kita dapat mengubah fakta
yang sangat besar menjadi pohon keputusan yang
merepresentasikan aturan [1].
Sebuah pohon keputusan adalah sebuah struktur yang
dapat digunakan untuk membagi kumpulan data yang
besar menjadi himpunan - himpunan record yang lebih
kecil dengan menerapkan serangkain aturan keputusan.
Dengan masing - masing rangkaian pembagian, anggota
himpunan hasil menjadi mirip satu dengan yang lain [1].
Pediatri berasal dari bahasa Yunani yaitu pedos yang
berarti anak dan iatrica yang berarti pengobatan. Arti
bahasa Indonesia yang sebenarnya ialah ilmu pengobatan
anak [2].
2.1 Analisis Penyakit
Untuk mengetahui suatu penyakit perlu diketahui
dahulu gejala-gejala yang dirasakan. Meskipun hanya
dari gejala klinis (langsung) dari situ dokter dapat
mengambil suatu kesimpulan berupa penyakit yang
diderita. Adapun gejala yang digunakan pada aplikasi ini
yaitu, demam, pneunonia, muntah, batuk pilek dan sesak
nafas.
2.1.1 Ispa
Infeksi saluran pernafasan atas (Ispa) adalah infeksi
yang terutama mengenai struktur saluran pernafasan
diatas laring, tetapi kebanyakan penyakit ini mngenai
bagian saluran atas dan bawah secara berurutan [3].
2
2.1.2 Kulit
Kulit adalah organ tubuh penting paling luar
dari manusia yang membatasi lingkungan dalam
dan luar tubuh manusia. Fungsinya disamping
dipengaruhi oleh kerusakan struktur juga oleh
penyakit [4].
2.2 Analisa Data
Data yang berada di sistem adalah berupa
atribut yang dimiliki oleh pasien, nilai atribut dan
kemungkinannya. Data yang dimaksud adalah
data yang minimal mempunyai dua kolom, yaitu
satu kolom sebagai kolom atribut dan satu kolom
untuk kolom atribut target. Secara umum
algoritma C4.5 untuk membangun pohon
keputusan adalah sebagai berikut :
1. Pilih atribut sebagai akar
2. Buat cabang untuk tiap nilai
3. Bagi kasus dalam cabang
4. Ulangi proses untuk setiap cabang sampai
semua kasus pada cabang memiliki kelas
yang sama.
Untuk memilih atribut sebagai akar,
didasarkan pada nilai gain tertinggi dari atribut
yang ada, aka digunakan rumus :
Keterangan :
S : himpunan kasus
A : atribut
n : jumlah partisi pada atribut A
|Si| : jumlah kasus pada partisi ke -i
|S| : jumlah kasus pada S
Sedangkan untuk perhitungan entropi
sebagai berikut :
Keterangan :
S : himpunan kasus
A : fitur
n : jumlah partisi S
pi : proporsi dari Si terhadap S
Selanjutnya, akan diuraikan penjelasan
lebih terperinci mengenai tiap-tiap langkah dalam
pembentukan pohon keputusan dengan
menggunakan algoritma C4.5 deperti dibawah ini.
Tabel 1 Perhitungan node 1
Dari tabel perhitungan diata, maka
diperoleh pohon keputusan seperti pada gambar
beikut.
Usia
1.1Sesak nafas
Kulit Ispa
1-5 tahun0-1 tahun 6-12 tahun
Ispa
pneumonia
Ya Tidak
Kulit
Ya
Tidak
Ispa
Gambar 1 Hasil akhir pohon keputusan
3
2.3 Perancangan Basis Data
2.3.1 Entity Relationship Diagram
Entity Relationship Diagram adalah gambar
atau diagram yang menunjukkan informasi yang dibuat,
disimpan dan digunakan dalam sistem bisnis [5].
pasien pohon keputusan
c45
mining _c45
rule_c45
testing
lakukan
id_rule_c45
usia
jenis_kelamin
demam
pneumonia
id
no_rm
muntah
batuk_pilek
sesak_nafas
keputusan_c45
id
id
atribut
nilai_atribut
jenis_penyakit
id
atribut
nilai_atribut
id_parent
jenis_penyakit
jml_kasus_ispa
jml_kasus_kulit
jenis_penyakit
rule_penentu_keputusan
mengetahui
id_parent
id
proses
rule
jenis_penyakit
jml_kasus_ispa
jml_kasus_kulit
entropy
inf_gain
inf_gain_gain
id
id_rule_c45
atribut nilai_atribut
pohon
cocok
n n
1 n
no_rm
1n
n n
Gambar 2 Entity Relationship Diagram
2.3.2 Relasi Tabel
data_pasien
PK id
no_rm usia jenis_kelamin
jenis_penyakit demam
pneumoniamuntahbatuk_pileksesak_nafas
mining_c45
PK id
atribut nilai_atribut
jml_kasus_ispajml_kasus_kulitprosesentropyinf_gaininf_gain_temp
pohon_keputusan
PK id
atribut nilai_atributid_parentjenis_penyakit
jml_kasus_ispajml_kasus_kulitprosesid_rule_c45
testing
PK id
no_rmid_rule_c45keputusan_c45
rule_c45
PK id
id_parentrule prosesjenis_penyakit
rule_penentu_keputusan
PK id
id_rule_c45 atributnilai_atribut
cocokpohon
Gambar 3 Relasi Tabel
2.3.3 Data Flow Diagram
Data Flow Diagram merupakan alat ayng
digunakan pada metodologi pengembangan sistem yang
terstruktur. DFD sering digunakan untuk
menggambarkan suatu sistem yang telah ada atau sistem
baru yang akan dikembangkan secara logika tanpa
mempertimbangkan lingkungan fisik dimana data
tersebut mengalir atau disimpan [5].
Gambar 4 DataFlow Diagram
2.3.4 Flowchart
2.3.4.1 Flowchart Data Pasien
Pada proses algoritma form proses mining akan
terjadi penginputan data keputusan yang berasal dari
identitas pasien. Pada tahap ini semua proses
penginputan data akan dikumpulkan menjadi satu
kemudian akan ditentukan hasil keputusannya dengan
menggunakan teknik mining algoritma C4.5. Berikut ini
adalah gambar Flowchart dari proses data pasien.
Gambar 5 Flowchart data pasien
4
2.3.4.2 Flowchart Proses Keputusan
Form keputusan merupakan proses
hasil akhir yang dilakukan oleh pengguna untuk
memudahkan melihat hasil keputusan berdasarkan
masing-masing variabel yang akan diuji satu
persatu.
Dimulai dari pohon pertama yang
ditentukan oleh program dan selanjutnya program
akan membuka kemungkinan variabel berikutnya
sesuai hasil perhitungan. Setelah terjadi proses
tersebut maka hasil akhir akan diperoleh keputusan
yang ditentukan program berdasarkan hasil dari
perhitungan akhir. Dibawah ini adalah Flowchart
dari Form proses keputusan.
Gambar 6 Flowchart proses keputusan
2.4 Implementasi Sistem
Implementasi sistem merupakan tahap meletakkan
sistem yang dikembangkan setelah melakukan analisis
dan rancangan sistem. Tahap implementasi dilakukan
ketika sistem telah melalui tahap pengujian, pengujian
sistem dilakukan untuk mengetahui apakah program
telah bebas dari kesalahan-kesalahan sebelum
diterapkan. Dibawah ini adalah tampilan form data
pasien, fungsinya untuk menginputkan data kasus pasien,
secara manual atau dalam bentuk file *.csv.
Gambar 7 Halaman data input pasien
Setelah data kasus dimasukkan dalam program,
proses selanjutnya adalah dengan melakukan
perhitungan menggunakan teknik algortima C4.5 dan
akan membentuk pohon keputusan. Pohon keputusan
yang dihasilkan dari program adalah sebagai berikut :
Gambar 8 Halaman pohon keputusan
Setelah pohon keputusan terbentuk, maka
program akan menghasilkan tahapan akhir yaitu jenis
penyakit yang diderita oleh pasien. Hasil dari program
tersebut adalah sebagai berikut :
Gambar 9 Halaman konsultasi
5
2.5 Pengujian Program
Pada pengujian sistem ini akan dilakukan
menggunakan Black Box Testing. Pada Black Box
Testing ini cara pengujiannya dengan menjalankan atau
mengeksekusi unit atau modul, kemudian diamati,
apakah hasil dari unit sesuai dengan proses bisnis yang
diinginkan.
Tabel 2 Pengujian Black Box
Menu Pengujian Hasil
Pengujian input data
Pengisian data pasien Baik
Pengujian ambil file .csv
Menyimpan hasil input ke database
Baik
Pengujian lihat data input
Menampilkan data masukkan
Baik
Pengujian lakukan mining C45
Menampilkan hasil dari proses mining C45
Baik
Pengujian pohon keputusan
Menampilkan pohon keputusan dan rule
Baik
Pengujian daftar penyakit
Menampilkan daftar penyakit yang termasuk kelompok Ispa dan Kulit
Baik
Pengujian konsultasi
Menampilkan hasil diagnosa pasien
Baik
Pengujian menu lain-lain
Menampilkan menu bantuan dan pembuat program
Baik
Tabel 3 Pengujian Form Konsultasi
Kasus dan Hasil Pengujian
Data masukkan
Yang diharapkan
Pengamatan Kesimpulan
No RM Usia Jenis kelamin Demam Pneumonia Muntah Batuk pilek Sesak nafas
Dapat menampilkan data sesuai dengan no rm, usia, jenis kelamin, gejala dan jenis penyakit yang diderita oleh pasien
Data yang ditampilkan sesuai dengan yang diderita oleh pasien
[ ] Diterima [ ] Ditolak
2.6 Pengecekan Nilai Akurasi
Pengecekan nilai akurasi pada program bertujuan
untuk mengetahui seberapa siapkah pogram untuk
diimplementasikan di lapangan. Pengecekan nilai akurasi
dapat dilihat seperti dibawah ini.
2.6.1 Screenshot Halaman Konsultasi
Gambar 10 Halaman konsultasi
2.6.2 Screenshot Data Masukan Pasien
Gambar 11 Data masukan pada Ms. Excel
Berdasarkan hasil perbandingan diatas, nilai
yang dihasilkan oleh program memiliki akurasi 90 %,
dilihat dari data pada Ms. Excel dengan data yang
dimasukkan pada program aplikasi, beserta sreenshot
sebagai bukti akurasi. Oleh karena itu, dapat
disimpulkan bahwa program ini dapat di
implementasikan di lapangan.
3. Kesimpulan
Berdasarkan hasil penelitian dan
pembahasan yang telah dilakukan, maka dapat diambil
kesimpulan, yaitu :
1. Data Mining dapat digunakan untuk membantu
pihak BPS Amanah dalam mendiagnosa
penyakit pada anak. Dimana proses diagnosa
yang dilakukan berdasarkan pada rule pohon
keputusan yang terbentuk sebelumnya.
6
2. Sistem mampu mengimplementasikan pohon
keputusan menggunakan algoritma C4.5 dengan
cara menginputkan data kasus pasien yang akan
di diagnosa.
3. Hasil penelitian ini merupakan gambaran dalam
melihat implementasi dari teknik data mining di
lapangan.
4. Data yang dapat diambil hanya file yang
berekstensi *.csv (Comma Delimited).
Saran
Mengingat keterbatasan yang dimiliki oleh
penulis, baik pengetahuan, waktu maupun pemikiran,
maka penulis dapat memberikan beberapa gambaran
sebagai saran yang dapat dipakai sebagai acuan
yang akan datang, antara lain :
1. Selama melakukan penelitian ada variabel yang
dibutuhkan, namun dari pihak BPS memiliki
sedikit data mengenai gejala-gejala yang
diderita oleh pasien.
2. Menyempurnakan segala kekurangan program
yang belum diketahui oleh penulis, seperti
menambahkan variabel data yang dibutuhkan
untuk proses diagnosa.
3. Untuk pengembangan sistem sebaiknya data
yang ditambahkan ke dalam sistem di update
secara berkala untuk menghasilkan data yang
lebih akurat dan dibuat tampilan yang lebih baik
lagi karena dinilai masih sangat sederhana.
Daftar Pustaka
[1] Kusrini dan Emha Taufiq Luthfi. 2009.
Algoritma Data Mining. Yogyakarta: Andi
[2] Gilbert, P. 1986. Penyakit yang Lazim pada
Anak-Anak. Jakarta: Arcan
[3] Behrman, E Richard dan Victor C. Vaughan.
1988. Ilmu Kesehatan Anak. Jakarta : Buku
Kedokteran EGC
[4] Akhsin, Zulkoni. 2011. Parasitologi Untuk
Keperawatan, Kesehatan Masyarakat
dan Teknik Lingkungan. Yogyakarta : Nuha
Medika.
[5] Al Fatta, Hanif. 2007. Analisis Dan
Perancangan Sistem Informasi
Yogyakarta: Andi.