+ All Categories

jon

Date post: 17-Jan-2016
Category:
Upload: yeahrightskripsi
View: 297 times
Download: 0 times
Share this document with a friend
Description:
jon
Popular Tags:
6
1 PERANCANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA C4.5 UNTUK DIAGNOSA PENYAKIT PADA ANAK (Studi Kasus: BPS Amanah) Abstract Susceptible to interference, espcially children. Parents who lack an understanding of health, entrust the matter to experts or specialists who understand more about health. However, sometimes the eperts or specialisthave weaknesses in working hours (of practice) and a limited number of patients that have to wait for the queue. For that the patientmay experience disappointetment, consequently comfort felt by the patient or the doctor himself distracted. Therefore parents need an expert who can facilitate in diagnosing diseases. Because of them that we need a tool that can diagnose diseases such as data mining. With the help of data mining is expected to assist physicians in the treatment of patiens or with data mining also a physician assistant can also help treat patients. The problems that occur are dealt with a casethat is capable of searching for data reinforce the results of the decision and the expected decision technique C4.5 algorithm generated wll be accurate. The results of this study will produce an output that is featuring a selection of the patiens symptoms, types of illness and it s management. Keywords data mining, choice of symptoms, type of disease, C4.5 algorithm, BPS 1. Pendahuluan Perkembangan dunia kesehatan saat ini sangatlah penting, itu karena kesadaran masyarakat akan manfaat kesehatan sudah tinggi sehingga peningkatan jumlah kesehatan setiap tahun mengalami kenaikan. Dengan demikian bukan tidak mungkin dapat menimbulkan masalah bagi setiap anggota medis dalam mendiagnosa dengan baik. BPS Amanah merupakan salah satu contoh Lembaga Bidan Praktek Swasta yang bisa membantu permasalahan kesehatan yang ada di masyarakat. Namun, terkadang terdapat pula kelemahannya seperti jam kerja (praktek) terbatas dan banyaknya pasien sehingga harus menunggu antrian. Selain itu, pihak BPS masih mendiagnosa penyakit pasien secara manual. Oleh karena itu, dibutuhkan sebuah sistem yang dapat membantu mendiagnosa penyakit pasien agar mempermudah para tenaga medis. Dengan itu aplikasi ini akan memnbantu pihak lembaga terkait agar dapat mendiagnosa penyakit yang diderita oleh pasien. Dimana, aplikasi ini akan mengimplementasikan Data Mining menggunakan algoritma C4.5. 2. Pembahasan Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data, berupa pengetahuan didalam database yang selama ini tidak diketahui secara manual. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstrasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar [1]. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Dengan metode pohon keputusan kita dapat mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan [1]. Sebuah pohon keputusan adalah sebuah struktur yang dapat digunakan untuk membagi kumpulan data yang besar menjadi himpunan - himpunan record yang lebih kecil dengan menerapkan serangkain aturan keputusan. Dengan masing - masing rangkaian pembagian, anggota himpunan hasil menjadi mirip satu dengan yang lain [1]. Pediatri berasal dari bahasa Yunani yaitu pedos yang berarti anak dan iatrica yang berarti pengobatan. Arti bahasa Indonesia yang sebenarnya ialah ilmu pengobatan anak [2]. 2.1 Analisis Penyakit Untuk mengetahui suatu penyakit perlu diketahui dahulu gejala-gejala yang dirasakan. Meskipun hanya dari gejala klinis (langsung) dari situ dokter dapat mengambil suatu kesimpulan berupa penyakit yang diderita. Adapun gejala yang digunakan pada aplikasi ini yaitu, demam, pneunonia, muntah, batuk pilek dan sesak nafas. 2.1.1 Ispa Infeksi saluran pernafasan atas (Ispa) adalah infeksi yang terutama mengenai struktur saluran pernafasan diatas laring, tetapi kebanyakan penyakit ini mngenai bagian saluran atas dan bawah secara berurutan [3].
Transcript
Page 1: jon

1

PERANCANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA C4.5

UNTUK DIAGNOSA PENYAKIT PADA ANAK (Studi Kasus: BPS Amanah)

Abstract – Susceptible to interference, espcially

children. Parents who lack an understanding of health,

entrust the matter to experts or specialists who

understand more about health. However, sometimes

the eperts or specialisthave weaknesses in working

hours (of practice) and a limited number of patients

that have to wait for the queue. For that the patientmay

experience disappointetment, consequently comfort felt

by the patient or the doctor himself distracted.

Therefore parents need an expert who can facilitate in

diagnosing diseases. Because of them that we need a

tool that can diagnose diseases such as data mining.

With the help of data mining is expected to assist

physicians in the treatment of patiens or with data

mining also a physician assistant can also help treat

patients.

The problems that occur are dealt with a casethat is

capable of searching for data reinforce the results of

the decision and the expected decision technique C4.5

algorithm generated wll be accurate.

The results of this study will produce an output that is

featuring a selection of the patiens symptoms, types of

illness and it s management.

Keywords – data mining, choice of symptoms, type of

disease, C4.5 algorithm, BPS

1. Pendahuluan

Perkembangan dunia kesehatan saat ini sangatlah

penting, itu karena kesadaran masyarakat akan manfaat

kesehatan sudah tinggi sehingga peningkatan jumlah

kesehatan setiap tahun mengalami kenaikan. Dengan

demikian bukan tidak mungkin dapat menimbulkan

masalah bagi setiap anggota medis dalam mendiagnosa

dengan baik.

BPS Amanah merupakan salah satu contoh Lembaga

Bidan Praktek Swasta yang bisa membantu

permasalahan kesehatan yang ada di masyarakat.

Namun, terkadang terdapat pula kelemahannya seperti

jam kerja (praktek) terbatas dan banyaknya pasien

sehingga harus menunggu antrian. Selain itu, pihak BPS

masih mendiagnosa penyakit pasien secara manual. Oleh

karena itu, dibutuhkan sebuah sistem yang dapat

membantu mendiagnosa penyakit pasien agar

mempermudah para tenaga medis.

Dengan itu aplikasi ini akan memnbantu pihak

lembaga terkait agar dapat mendiagnosa penyakit yang

diderita oleh pasien. Dimana, aplikasi ini akan

mengimplementasikan Data Mining menggunakan

algoritma C4.5.

2. Pembahasan

Data mining adalah serangkaian proses untuk

menggali nilai tambah dari suatu kumpulan data, berupa

pengetahuan didalam database yang selama ini tidak

diketahui secara manual. Data mining adalah proses

yang menggunakan teknik statistik, matematika,

kecerdasan buatan dan machine learning untuk

mengekstrasi informasi yang bermanfaat dan

pengetahuan yang terkait dari berbagai database besar

[1].

Algoritma C4.5 merupakan algoritma yang

digunakan untuk membentuk pohon keputusan. Dengan

metode pohon keputusan kita dapat mengubah fakta

yang sangat besar menjadi pohon keputusan yang

merepresentasikan aturan [1].

Sebuah pohon keputusan adalah sebuah struktur yang

dapat digunakan untuk membagi kumpulan data yang

besar menjadi himpunan - himpunan record yang lebih

kecil dengan menerapkan serangkain aturan keputusan.

Dengan masing - masing rangkaian pembagian, anggota

himpunan hasil menjadi mirip satu dengan yang lain [1].

Pediatri berasal dari bahasa Yunani yaitu pedos yang

berarti anak dan iatrica yang berarti pengobatan. Arti

bahasa Indonesia yang sebenarnya ialah ilmu pengobatan

anak [2].

2.1 Analisis Penyakit

Untuk mengetahui suatu penyakit perlu diketahui

dahulu gejala-gejala yang dirasakan. Meskipun hanya

dari gejala klinis (langsung) dari situ dokter dapat

mengambil suatu kesimpulan berupa penyakit yang

diderita. Adapun gejala yang digunakan pada aplikasi ini

yaitu, demam, pneunonia, muntah, batuk pilek dan sesak

nafas.

2.1.1 Ispa

Infeksi saluran pernafasan atas (Ispa) adalah infeksi

yang terutama mengenai struktur saluran pernafasan

diatas laring, tetapi kebanyakan penyakit ini mngenai

bagian saluran atas dan bawah secara berurutan [3].

Page 2: jon

2

2.1.2 Kulit

Kulit adalah organ tubuh penting paling luar

dari manusia yang membatasi lingkungan dalam

dan luar tubuh manusia. Fungsinya disamping

dipengaruhi oleh kerusakan struktur juga oleh

penyakit [4].

2.2 Analisa Data

Data yang berada di sistem adalah berupa

atribut yang dimiliki oleh pasien, nilai atribut dan

kemungkinannya. Data yang dimaksud adalah

data yang minimal mempunyai dua kolom, yaitu

satu kolom sebagai kolom atribut dan satu kolom

untuk kolom atribut target. Secara umum

algoritma C4.5 untuk membangun pohon

keputusan adalah sebagai berikut :

1. Pilih atribut sebagai akar

2. Buat cabang untuk tiap nilai

3. Bagi kasus dalam cabang

4. Ulangi proses untuk setiap cabang sampai

semua kasus pada cabang memiliki kelas

yang sama.

Untuk memilih atribut sebagai akar,

didasarkan pada nilai gain tertinggi dari atribut

yang ada, aka digunakan rumus :

Keterangan :

S : himpunan kasus

A : atribut

n : jumlah partisi pada atribut A

|Si| : jumlah kasus pada partisi ke -i

|S| : jumlah kasus pada S

Sedangkan untuk perhitungan entropi

sebagai berikut :

Keterangan :

S : himpunan kasus

A : fitur

n : jumlah partisi S

pi : proporsi dari Si terhadap S

Selanjutnya, akan diuraikan penjelasan

lebih terperinci mengenai tiap-tiap langkah dalam

pembentukan pohon keputusan dengan

menggunakan algoritma C4.5 deperti dibawah ini.

Tabel 1 Perhitungan node 1

Dari tabel perhitungan diata, maka

diperoleh pohon keputusan seperti pada gambar

beikut.

Usia

1.1Sesak nafas

Kulit Ispa

1-5 tahun0-1 tahun 6-12 tahun

Ispa

pneumonia

Ya Tidak

Kulit

Ya

Tidak

Ispa

Gambar 1 Hasil akhir pohon keputusan

Page 3: jon

3

2.3 Perancangan Basis Data

2.3.1 Entity Relationship Diagram

Entity Relationship Diagram adalah gambar

atau diagram yang menunjukkan informasi yang dibuat,

disimpan dan digunakan dalam sistem bisnis [5].

pasien pohon keputusan

c45

mining _c45

rule_c45

testing

lakukan

id_rule_c45

usia

jenis_kelamin

demam

pneumonia

id

no_rm

muntah

batuk_pilek

sesak_nafas

keputusan_c45

id

id

atribut

nilai_atribut

jenis_penyakit

id

atribut

nilai_atribut

id_parent

jenis_penyakit

jml_kasus_ispa

jml_kasus_kulit

jenis_penyakit

rule_penentu_keputusan

mengetahui

id_parent

id

proses

rule

jenis_penyakit

jml_kasus_ispa

jml_kasus_kulit

entropy

inf_gain

inf_gain_gain

id

id_rule_c45

atribut nilai_atribut

pohon

cocok

n n

1 n

no_rm

1n

n n

Gambar 2 Entity Relationship Diagram

2.3.2 Relasi Tabel

data_pasien

PK id

no_rm usia jenis_kelamin

jenis_penyakit demam

pneumoniamuntahbatuk_pileksesak_nafas

mining_c45

PK id

atribut nilai_atribut

jml_kasus_ispajml_kasus_kulitprosesentropyinf_gaininf_gain_temp

pohon_keputusan

PK id

atribut nilai_atributid_parentjenis_penyakit

jml_kasus_ispajml_kasus_kulitprosesid_rule_c45

testing

PK id

no_rmid_rule_c45keputusan_c45

rule_c45

PK id

id_parentrule prosesjenis_penyakit

rule_penentu_keputusan

PK id

id_rule_c45 atributnilai_atribut

cocokpohon

Gambar 3 Relasi Tabel

2.3.3 Data Flow Diagram

Data Flow Diagram merupakan alat ayng

digunakan pada metodologi pengembangan sistem yang

terstruktur. DFD sering digunakan untuk

menggambarkan suatu sistem yang telah ada atau sistem

baru yang akan dikembangkan secara logika tanpa

mempertimbangkan lingkungan fisik dimana data

tersebut mengalir atau disimpan [5].

Gambar 4 DataFlow Diagram

2.3.4 Flowchart

2.3.4.1 Flowchart Data Pasien

Pada proses algoritma form proses mining akan

terjadi penginputan data keputusan yang berasal dari

identitas pasien. Pada tahap ini semua proses

penginputan data akan dikumpulkan menjadi satu

kemudian akan ditentukan hasil keputusannya dengan

menggunakan teknik mining algoritma C4.5. Berikut ini

adalah gambar Flowchart dari proses data pasien.

Gambar 5 Flowchart data pasien

Page 4: jon

4

2.3.4.2 Flowchart Proses Keputusan

Form keputusan merupakan proses

hasil akhir yang dilakukan oleh pengguna untuk

memudahkan melihat hasil keputusan berdasarkan

masing-masing variabel yang akan diuji satu

persatu.

Dimulai dari pohon pertama yang

ditentukan oleh program dan selanjutnya program

akan membuka kemungkinan variabel berikutnya

sesuai hasil perhitungan. Setelah terjadi proses

tersebut maka hasil akhir akan diperoleh keputusan

yang ditentukan program berdasarkan hasil dari

perhitungan akhir. Dibawah ini adalah Flowchart

dari Form proses keputusan.

Gambar 6 Flowchart proses keputusan

2.4 Implementasi Sistem

Implementasi sistem merupakan tahap meletakkan

sistem yang dikembangkan setelah melakukan analisis

dan rancangan sistem. Tahap implementasi dilakukan

ketika sistem telah melalui tahap pengujian, pengujian

sistem dilakukan untuk mengetahui apakah program

telah bebas dari kesalahan-kesalahan sebelum

diterapkan. Dibawah ini adalah tampilan form data

pasien, fungsinya untuk menginputkan data kasus pasien,

secara manual atau dalam bentuk file *.csv.

Gambar 7 Halaman data input pasien

Setelah data kasus dimasukkan dalam program,

proses selanjutnya adalah dengan melakukan

perhitungan menggunakan teknik algortima C4.5 dan

akan membentuk pohon keputusan. Pohon keputusan

yang dihasilkan dari program adalah sebagai berikut :

Gambar 8 Halaman pohon keputusan

Setelah pohon keputusan terbentuk, maka

program akan menghasilkan tahapan akhir yaitu jenis

penyakit yang diderita oleh pasien. Hasil dari program

tersebut adalah sebagai berikut :

Gambar 9 Halaman konsultasi

Page 5: jon

5

2.5 Pengujian Program

Pada pengujian sistem ini akan dilakukan

menggunakan Black Box Testing. Pada Black Box

Testing ini cara pengujiannya dengan menjalankan atau

mengeksekusi unit atau modul, kemudian diamati,

apakah hasil dari unit sesuai dengan proses bisnis yang

diinginkan.

Tabel 2 Pengujian Black Box

Menu Pengujian Hasil

Pengujian input data

Pengisian data pasien Baik

Pengujian ambil file .csv

Menyimpan hasil input ke database

Baik

Pengujian lihat data input

Menampilkan data masukkan

Baik

Pengujian lakukan mining C45

Menampilkan hasil dari proses mining C45

Baik

Pengujian pohon keputusan

Menampilkan pohon keputusan dan rule

Baik

Pengujian daftar penyakit

Menampilkan daftar penyakit yang termasuk kelompok Ispa dan Kulit

Baik

Pengujian konsultasi

Menampilkan hasil diagnosa pasien

Baik

Pengujian menu lain-lain

Menampilkan menu bantuan dan pembuat program

Baik

Tabel 3 Pengujian Form Konsultasi

Kasus dan Hasil Pengujian

Data masukkan

Yang diharapkan

Pengamatan Kesimpulan

No RM Usia Jenis kelamin Demam Pneumonia Muntah Batuk pilek Sesak nafas

Dapat menampilkan data sesuai dengan no rm, usia, jenis kelamin, gejala dan jenis penyakit yang diderita oleh pasien

Data yang ditampilkan sesuai dengan yang diderita oleh pasien

[ ] Diterima [ ] Ditolak

2.6 Pengecekan Nilai Akurasi

Pengecekan nilai akurasi pada program bertujuan

untuk mengetahui seberapa siapkah pogram untuk

diimplementasikan di lapangan. Pengecekan nilai akurasi

dapat dilihat seperti dibawah ini.

2.6.1 Screenshot Halaman Konsultasi

Gambar 10 Halaman konsultasi

2.6.2 Screenshot Data Masukan Pasien

Gambar 11 Data masukan pada Ms. Excel

Berdasarkan hasil perbandingan diatas, nilai

yang dihasilkan oleh program memiliki akurasi 90 %,

dilihat dari data pada Ms. Excel dengan data yang

dimasukkan pada program aplikasi, beserta sreenshot

sebagai bukti akurasi. Oleh karena itu, dapat

disimpulkan bahwa program ini dapat di

implementasikan di lapangan.

3. Kesimpulan

Berdasarkan hasil penelitian dan

pembahasan yang telah dilakukan, maka dapat diambil

kesimpulan, yaitu :

1. Data Mining dapat digunakan untuk membantu

pihak BPS Amanah dalam mendiagnosa

penyakit pada anak. Dimana proses diagnosa

yang dilakukan berdasarkan pada rule pohon

keputusan yang terbentuk sebelumnya.

Page 6: jon

6

2. Sistem mampu mengimplementasikan pohon

keputusan menggunakan algoritma C4.5 dengan

cara menginputkan data kasus pasien yang akan

di diagnosa.

3. Hasil penelitian ini merupakan gambaran dalam

melihat implementasi dari teknik data mining di

lapangan.

4. Data yang dapat diambil hanya file yang

berekstensi *.csv (Comma Delimited).

Saran

Mengingat keterbatasan yang dimiliki oleh

penulis, baik pengetahuan, waktu maupun pemikiran,

maka penulis dapat memberikan beberapa gambaran

sebagai saran yang dapat dipakai sebagai acuan

yang akan datang, antara lain :

1. Selama melakukan penelitian ada variabel yang

dibutuhkan, namun dari pihak BPS memiliki

sedikit data mengenai gejala-gejala yang

diderita oleh pasien.

2. Menyempurnakan segala kekurangan program

yang belum diketahui oleh penulis, seperti

menambahkan variabel data yang dibutuhkan

untuk proses diagnosa.

3. Untuk pengembangan sistem sebaiknya data

yang ditambahkan ke dalam sistem di update

secara berkala untuk menghasilkan data yang

lebih akurat dan dibuat tampilan yang lebih baik

lagi karena dinilai masih sangat sederhana.

Daftar Pustaka

[1] Kusrini dan Emha Taufiq Luthfi. 2009.

Algoritma Data Mining. Yogyakarta: Andi

[2] Gilbert, P. 1986. Penyakit yang Lazim pada

Anak-Anak. Jakarta: Arcan

[3] Behrman, E Richard dan Victor C. Vaughan.

1988. Ilmu Kesehatan Anak. Jakarta : Buku

Kedokteran EGC

[4] Akhsin, Zulkoni. 2011. Parasitologi Untuk

Keperawatan, Kesehatan Masyarakat

dan Teknik Lingkungan. Yogyakarta : Nuha

Medika.

[5] Al Fatta, Hanif. 2007. Analisis Dan

Perancangan Sistem Informasi

Yogyakarta: Andi.


Recommended