Seminar Nasional Teknologi Informasl dan Multimedia 2017STMIK AMIKOM Yogyokorto. 4 Februari 2017ISSN : 2302-3805
PENERAPAN ALGORITMA APRIORI ASSOCIATION RULEUNTUK ANALISA NILAI MAHASISWA
DI UNIVERSITAS GUNADARMA
Margi Cahyanti l ), Maulana Mujahidin2), Ericks Rachmat Swedia3)
Sistem Informasi Universitas Gunadarma2) Tekmk Komputer Universitas Gunadarma
J) Teknik Informatika Universitas GunadarmaJI Margonda Raya no
Email : [email protected] [email protected] 100. Depok
2), ericks rs@staff gunadarma.ac.id J)
Abstrak
pada penelitian ini diterapkan metode aprioriassociation rule untuk melihat aturan asosiasi nilai danmatakuliah pada mahasiswa universitas gunadarmajenjang diploma tigajurusan teknik komputer dari tahun2000 sampai tahun 2005 untuk nilai D dan nilai E. atauberarti mencari aturan asosiasi untuk nilai yangmengulang pada 75 matakuliah yang telah diambil.Min_support yang diinput adalah 100 (±5 0/0 dari rata-rata yumlah data yang sebanyak 1800), danmin confidence yang diinput adalah 60%.
Dari hasil analisa terlihat bahwa aturan yang memilikinilai support vs confidence terbesar terjadi pada aturanIF Praktikum Algoritma dan Pemrograman THENPengantar Sistem Komputer. Hal ini berarti bahwakecenderungan mahasiswa jika mengulang matakuliahpraktikum algoritma dan pemrograman juga mengulang
matakuliah pengantar sistem komputer. dengan
confidence rata-rata sebesar 83.84%. Confidence
terbesar terdapat pada tahun 2004 yaitu sebesar
Kata kunci: Association Rule, Data Mining, Apriori,
Market-Basket Analysis.
1. Pendahuluan
Association Rule biasanya dimanfaatkan secara luas
dalam proses bisnis diantaranya dalam proses penjualan.
f. Data mining algoritma asoslasi dapat membantu dalam
proscs penjualan dengan memberikan hubungan antar
data penjualan yang dilakukan pelanggan sehingga akan
didapat pola pembelian pelanggan atau sering disebut
dcngan Market-Basket Analysis.161
Analisis asosiasi dikenal juga sebagai salah satu teknik
data mining yang menjadi dasar dari berbagai teknik data
mining lainnya. Tahap dari analisis asosiasi yang disebut
analisis pola frequensi tinggi (frequent pattern mining)
menarik perhatian banyak peneliti untuk menghasilkan
algoritma yang etisien[71.
Association rule mining adalah suatu prosedur untuk
mencari hubungan antar itejn dalam suatu data set yang
ditentukan Ill. Association rule meliputi dua tahap [21
I. Mencari kombinasi yang paling sering terjadi darisuatu itemset dan 2. Mendefinisikan Condition danResult (untuk conditional association rule).
Dalam menentukan suatu association rule, terdapatsuatu ukuran kepercayaan yang didapatkan dari hasilpengolahan data dengan perhitungan tertentu. Umumnyaada dua ukuran, yaitu 13] . 1. Support suatu ukuranyang menunjukkan seberapa besar tingkat dominasisuatu item/itemset dari keseluruhan transaksi. Ukuran inimenentukan apakah suatu item/itemset layak untukdicari confidence-nya (misal, dari keseluruhan transaksiyang ada, seberapa besar tingkat dominasi yangmenunjukkan bahwa item A dan B dibeli bersamaan)dan 2. Confidence . suatu ukuran yang menunjukkanhubungan antar 2 item secara kondisional (misal,seberapa sering item B dibeli jika orang membeli item
Kedua ukuran ini nantinya berguna dalam menentukaninteresting association rules, yaitu untuk dibandingkandengan batasan (treshold) yang ditentukan oleh user.
Batasan tersebut umumnya terdiri dari min_support dan
min_confidence [31.
Penerapan aturan assosiatif dari analisa pembelian di
suatu pasar swalayan adalah dapat diketahuinya berapa
besar kemungkinan seorang pelanggan membeli roti
bersamaan dengan susu. Dengan pengetahuan tersebut
pemilik pasar swalayan dapat mengatur penempatan
barangnya atau merancang kampanye pemasaran dengan
memakai kupon diskon untuk kombinasi barang tertentu.
Aturan assosiatifbiasanya dinyatakan dalam bentuk :
{roti, mentega} {susu)
(support = 40%, confidence = 50%)
Yang artinya "50% dari transaksi di database yang
memuat item roti dan mentega juga memuat item susu,
sedangkan 40% dari seluruh transaksi yang ada di
database memuat ketiga item itu." Dapat juga diartikan .
"Seorang konsumen yang membeli roti dan mentega
punya kemungkinan 50% untuk juga membeli susu.
Aturan ini cukup signifikan karena mewakili 40% dari
catatan transaksi selama
2+19
ISSN : 2302-3805
Seminar Naslonal Teknologl Informasl dan Mubimedia 2017STMIK AMIKOM Yogyokorto. 4 Februari
Analisis asosiasi didefinisikan suatu proses untukmenemukan scmua aturan assosiatif yang memenuhisyarat minimum untuk supporl (minimum dansyarat minimum untuk confidence (minimumconfidence).
Dengan menggunakan output dari aplikasi ini, yangberupa aturan asosiasi, ingin diketahui tingkat asosiasinilai dan matakuliah yang berguna untuk membantupihak pengambil kcputusan dalam menentukankebijakan.
"Apriori is an influental algorithm for mining frequentitemsets for Boolean association rules." I J. Aprioriadalah suatu algoritma yang sudah sangat dikcnal dalammelakukan pcncarian frequent Itemsct denganassociation rule.
Algoritma ini menggunakan knowledge mengenaifrequcnt itemset yang telah diketahui sebelumnya, untukmemproses informasi selanjutnya. Algoritma apriorimemakai pendekatan iterative (level-wise search),dimana k-itemsct dipakai untuk menyelidikiitemset. Langkah-langkah dari algoritma ini adalahsebagai berikut [41 .
I. Set (menunjuk pada itemset ke-l ).
2. Hitung semua k-itemset (itemset yang mempunyai kitem).
3. Hitung support dari semua calon itemset — filteritemset tersebut berdasarkan perhitungan minimumsupport.
4. Gabungkan semua k-sized itemset untukmenghasilkan calon itemset k+l.
5. Set k=k+l.6. Ulangi langkah 3-5 sampai tidak ada itemset yang
lebih besar yang dapat dibentuk.7. Buat final set dari itemset dengan menciptakan
suatu union dari semua k-itemset.
8. Menghitung support / analisa pola frekuensi tinggi.Support aturan asosiasiA B adalah .
Jumlah Transaksi mengandung A dan BSuppon PCA n B) = (1)
Total Transaksi
9. Menghitung confidence.
Confidence aturan asosiasi A B adalah
Confidence BIA) =
PCA)
= Jumlah Transaksł mengandung A dan B
(2)Jumlah Transaksł mengandung A
IO. Menghitung support vs confidence dengan rumus :Support vs Confidence = Support x Conîidence
Nilai dengan support vs confidence terbesar yangmerupakan aturan terbaik.
2. Pembahasan
Aplikasi dibuat dengan bahasa pemrograman cg.
Aplikasi ini terkoneksi dengan server akademik
univcrsitas gunadarma. Data yang dibutuhkan harus
memiliki struktur seperti tabel dibawah15J :
Tabel I Struk:ur data ni/ai mahasiswa
NP.M
50401001
50401001
50401002
50401002
KD MK
KK013210
KK013215
KK013210
KK013215
AMA_ IK ILA
Pengantar Sistem
Komputer
Algoritma dan
Pemrograman I
Pengantar Sistem c
Komputer
Algoritma dan
Pemrograman I
Langkah pertama aplikasi ini adalah mengambil data ke
database nilai dan mentransformasi pivot dari struktur
data diatas menjadi struktur seperti gambar I. dibawah
(data NPM sebagai baris, data matakuliah dijadikan
kolom dan data nilai sebagai isi), seperti contoh tabel 2
dibawah[8J.
Tabel 2.Strukîur Pivot data nilai mahasiswa
NPM
50401001
50401002
Berikut adalah hasildatatabIe(7).
Datatable dtProses"KD_MK". ”NILAI");
KK013210 KK01J21
c
setelah transformasi pivot dari
Pivot(ref dtNiIai, "NPM"
Gambar I. Tampilan hasil pivot data nilai mahasiswa.
2.1-20
Seminar Nasional Teknologi Informasi dan Multimedia 2017 ISSN : 2302-3805STMIK AMIKOM Yogyakarta, 4 Februari 2017
Dari data pada gambar I diatas setiap nilai yang ingindilihat association rule-nya ditransform menjadi I, selainitu O, misal jika ingin melihat relasi matakuliah yangnilainya D dan E, maka setiap nilai D dan E diubahmenjadi l, sedangkan nilai A, B, dan C diubah menjadi
contoh terlihat pada tabel 3 dibawah, kemudianmemasukkan minimum support yang diinginkan danmenghitung jumlah setiap kolom. Hasil dapat dilihat digambar 2.
Tabel 3.Transformasi data nilai mahasiswa
NPM KK013210 KK013215
50401001 1 o
50401002 14,
Total : 1 1
Berikut adalah output aplikasi untuk merubah nilai A, B,
C menjadi O dan D, E menjadi I dari data table dan
menghitung total keseluruhan nilai I dari setiap kolom
matakuliah.
(92
•
Č-
Gambar 2. Tampilan data pivot nilai mahasiswa
Kemudian membentuk k-itemset dan mencari minimum
supporĺ. Tahap ini mencari kombinasi item yang
memenuhi syarat minimum dari nilai support dalam
database. Minimum supporl yang dimasukkan adalah
100 (±5% dari rata-rata jumlah data yang sebanyak
1800). Proses dimulai dengan mencari kombinasi
himpunan data matakuliah dengan item-set berjumlah 2 :
{KD013111, KD013121}, {KD013111, KD013201},
{KD013111, KD013202}, {KD013111, KD013205}
dst sampai semua kombinasi terpenuhi, kemudian
menghitung total dari data yang bernilai I dari setiap
himpunan. Jika terdapat total data lebih besar atau sama
dengan min_supporł, maka proses berlanjut mencari
kombinasi himpunan data matakuliah dengan item-set
berjumlah 3 : {KD013111, KD013121, KD013201},
{KD013111, KD013121, KD013202}, {KD013111,
0013121, KD013205} . dst, kemudian menghitung
total dari data yang bernilai I pada masing-masing
kolom dari setiap himpunan. Kemudian kembali
mengecek total setiap himpunan dengan min support.
Jika terdapat total data lebih besar atau sama dengan
min support, maka proses berlanjut mencari kombinasi
himpunan data matakuliah dengan item-set berjumlah
4,5,6, dst, sampai tidak ada total data yang lebih besar
atau sama dengan min_support. Hasil terlihat pada
gambar 3,
Berikut adalah output dari hasil perhitungan kombinasi
data dimulai dari item-set berjumlah 2, menghitung total
setiap himpunan dan mengecek total dengan dengan
min_support yang diinput (data himpunan akan
tersimpan di datatable dtHimpunan).
Gambar 3. Tampilan himpunan danjumlah masing-
masing himpunan
Setelah semua pola frekuensi tinggi (minimum support)
telah ditemukan, langkah selanjutnya adalah menghitung
confidence dan menghitung support vs confidence,
kemudian memasukkan confidence yang diinginkan.
Pada gambar 4 adalah output aplikasi untuk menghitung
support dan confidence dan menghitung support vsconfidence (data ditampilkan pada komponen Listview
IvwSupport).
Gambar 4. Tampłlan Support, Confidence dan Support
vs Confidence
Setelah nilai confidence didapat, barulah dicari aturan
assosiatif yang memenuhi syarat minimum untuk
2.1-21
Seminar Nasional Teknologi Informasl dan Muhimedia 2017STMJK AMIKOM Yogyokarta. 4 Februari 2017
ISSN : 2302-380S
confidence, dan mencari nilai terbesar support vsconfidence dari masing-masing aturan. Nilai terbesardari support vs confidence ini yang dijadikan aturanasosiasi. I-lasil aturan asosiasi dapat dilihat pada gambar
Berikut adalah output aplikasi untuk mengambil nilaiconfidence yang diinginkan (data ditampilkan padakomponen Listview IvwFiIterConfidence).
Gambar 5. Tampilan Aturan asosiasi yang dihasilkan.
Analisis dilakukan pada mahasiswa jenjang diploma tigaJurusan manajemen informatika universitas gunadarmadari tahun 2000 sampai tahun 2005 untuk nilai D dannilai E, atau berarti mencari aturan asosiasi untuk nilaiyang mengulang pada 75 matakuliah yang telah diambil.Min_support yang diinput adalah 100 (±5% dari rata-ratajumlah data yang sebanyak 1 800), dan min_confidenceyang diinput adalah 60%.
Tabel 4.Hasil aturan asosiasi dari tahun 2000 — 2005.
1214
ASOSIASI
AJgorun
THEN
CONFIDEANGKA BCEHIMptfTAN DAT
2000 86,69
2001 2433 Maks
1012
2002 2148Maks
69 92
182
2003
7S 74
SUPPOR
CONODEN
0.062
0.056
o.092
0.079
ATURANASOSI&S'
Algontnu
THENSgtem Konouler
A]goratnv
Penrogranun
THEN PengMtarSgtem Konvuler
Algontma dMPerryogranun
THEN PengantarSstem Ron-outer
JF PcnganlarSBIem KonvulerTHEN Algontnu
Penvogranun
IF PraiAlgonlnuPerryogranun
THEN Pengantar
Sßlem Konvuter
Dari hasil diatas terlihat bahwa dari tahun 2000 sampai
2005 aturan yang memiliki nilai support vs confidenceterbesar terjadi pada aturan "IF Prak. Algoritma dan
Pemrograman THEN Pengantar Sistem Komputer". Hal
ini berarti bah"a kecenderungan mahasiswa jika
mengulang matakuliah "Praktikum Algoritma dan
Pemrograman" juga mengulang matakuliah "Pengantar
Sistem Komputer".
Sedikit perbedaan terjadi pada tahun 2003 yang nilai
support vs confidence terbesar 0.079 adalah pada aturan"IF Pengantar Sistem Komputer THEN Algoritma danPcmrograman J" dengan confidence 69,92 0/0, namunpada aturan "IF Prak. Algoritma dan PemrogramanTHEN Pengantar Sistem Komputer" walaupun memilikinilai support vs confidence yang sedikit lebih kecil yaitusebesar 0,075 (selisih tapi memiliki tingkatconfidence yang paling tinggi yaitu sebesar 78, 74%.Jika minimum confidence diubah menjadi 75% makaaturan "IF Pengantar Sistem Komputer THEN Algoritma
dan Pemrograman I" tidak akan didapat, karena hanyamemiliki confidence sebesar 69,92 0/0, karena itu pada
tahun 2003 ini aturan yang diambil adalah "IF Prak.Algoritma dan Pemrograman THEN Pengantar SistemKomputer".
Rata-rata confidence yang terjadi dari tahun 2000-2005adalah (86.69 + 83,59 + 87,21 + 78,74 + 88,67 +
78,14)/6 sebesar 83.84%, dengan nilai confidence palingtinggi sebesar 88,67% terjadi pada tahun 2004, dan nilaiconfidence terkecil sebesar 78, terjadi pada tahun2005.
3. Kesimpulan
Algoritma apriori association rule dapat juga diterapkanuntuk melihat asosiasi nilai dan matakuliah padamahasiswa. Metode ini diterapkan untuk mencari aturanasosiasi pada nilai yang mengulang (nilai D dan nilai E)di 75 matakuliah yang telah diambil pada jurusanmanajemen informatika jenjang diploma tiga universitasgunadarma tahun 2000 sampai 2005.
Dari penerapan metode ini, dihasilkan aturan asosiasi.Aturan asosiasi yang terbentuk adalah
IF Prak Algorinna dan Pemrograman THEN PengantarSistem Komputer
2. I -22
Seminar Nasional Teknologl Informasl dan Muhimedia 2017STM/K AMIKOM Yogyakarta, 4 Februari 2017
dengan confidence sebesar 83,84% dan minimumsuppon 100, sehingga dapat disimpulkan bahwa dengantingkat kepercayaan ±80% mahasiswa yang mengulangmatakuliah ”Praktikum Algoritma dan Pemrograman”juga akan mengulang matakuliah "Pengantar SistemKomputer”. Hasil ini dapat digunakan sebagai referensiuntuk mahasiswa angkatan mendatang.
Daftar Pustaka
Jławei, H. Kamber. Młchelłne Data MmmgConcepts andTechniques Morgan Kaufmann. 2001
[2) Ulmer, Davłd, " Mimng an Online Auctions Data Worehouse TheMid-Atlantic Student Workshop on Programmmg Languages andSystems” 19 Apnl 2002 Pace Umversłty<httpJ/csjs pace edWcsjs/masplas/p8 pdi> [Dłakses 25 November20161
Budhl G S, lam. R dan Prayłtno, "Penggłmaan Metode C-Covering untuk Analisa Market Baskct pada Supermarket JurnalInformatika VOI 6. No I Mel 2005
[4) Inrose, D T. Discovenng Knowledge in Data An Introduction toData Mmmg, John Wiley & Sons, Met 2005
15) Tang, Z dan MacLennan, J, , Data Mmmg with SQLSełver 2005.Wiley Publłshłng, Indianapolis. 2005Dilly, Ruth, Dara ,țfmžng An Introduction, Queens UmversltyBelfast, 2004
R Agrawal, R Srłkant Algoruhms for Mimng AssociationRules ' Procecdłngs of the 20Lh VLDB Conference Santiago,Chile, 1994R Agrawal. T Irnłelłnskt, and A Swamł December " Databasemining A performance perspective IEEE Transacuons onKnowledge and Data Engłneenng, 1993
Biodata Penulis
Margi Cahyanti, memperoleh gelar Sarjana Komputer
(S.Kom), Jułusan Sistem Informasi Universitas
Gunadarma, lulus tahun 1992. Memperoleh gelarMagister Manajemen Sistem Informasi (MMSi) Program
Pasca Sarjana Magester Manajemen Sistem Informasi
Universitas Gunadarma, Iulus tahun 2000. Saat ini
menjadi Dosen di Universitas Gunadarma
Maulana Mujahidin, memperoleh gelar Sarjana
Komputer (S.Kom), Jurusan Teknik KomputerUniversitas Gunadarma, lulus tahun 2003. Memperoleh
gelar Magister Teknik (MMSi) Program Pasca Sarjana
Magester Teknik Universitas Gunadarma, lulus tahun
2009. Saat ini menjadi Dosen di Universitas Gunadarma
Ericks Rachmat Swedia, memperoleh gelar Sarjana
Teknik (ST), Jurusan Teknik Informatika Universitas
Gunadarma, Iulus tahun 1999. Memperoleh gelar
Magister Manajemen Sistem Infôrmasi (MMSi) Program
Pasca Sarjana Magester Manajemen Sistem Informasi
Universitas Gunadarma, Iulus tahun 2008. Saat ini
meniadi Dosen di Universitas Gunadarma.
2.1-23
ISSN 2302-3805