1
ANALISA POLA KEYWORD PENCARIAN PADA GOOGLE
MENGGUNAKAN MARKET BASKET ANALYSIS.
(STUDI KASUS : STIKOM Wireless Connection)
Bayu Hendra Krisdhianto 1)
1) S1 / Jurusan Sistem Informasi, STIKOM Surabaya, email : [email protected] Abstract: Market Basket Analysis with the Association Rules is one way to search for patterns of associations based on spending patterns by consumers, which will then be known to those items purchased any item simultaneously. And later can be used as an ingredient in the decision analysis, to increase profits or to determine marketing strategies.
In this research, apriori methods used to obtain the association rules that describe the relationship between the keywords searched by users in the Google search engine on the network STIKOM Wireless Connection.
From the results of empirical testing can be concluded that the computing time for generating association rules is influenced by the number of transactions, and the number of association rules is influenced by the value of minimum support and minimum confident.
Keyword: Google, Apriori, Market Basket Analysis, Client – Server, Networking.
Kata “informasi” telah menjadi suatu topik
yang cukup menarik untuk dibicarakan dan
seolah tak ada habisnya untuk dikaji karena
pertumbuhannya dan kebutuhannya yang sangat
cepat dan mendesak. Teknologi Informasi
memacu dalam suatu lingkungan di mana
informasi menjadi sangat penting dalam segala
sisi kehidupan kita baik di dunia nyata ataupun di
dunia maya atau biasa disebut internet. Internet
telah secara dramatis mengubah cara orang dalam
mencari suatu informasi. Berbagai web mesin
pencari (search engine) banyak bermunculan dan
saling bersaing untuk menjadi yang teratas dalam
menyediakan informasi. Salah satu metode yang
dapat digunakan search engine untuk
mengumpulkan semua data yang ada di internet
dan menyajikannya kembali sebagai sebuah
informasi bagi user adalah web mining. “Web
mining adalah sebuah penemuan dan analisis
informasi yang berguna dari World Wide Web.
Ini menggambarkan pencarian otomatis sumber
informasi on-line yang tersedia, yaitu, konten
Web mining, dan penemuan pola-pola akses
pengguna dari layanan web, yaitu penggunaan
Web mining”. (Cooley, Mobasher, & Srivastava
(1997).
Sekolah Tinggi Manajemen Informatika
dan Teknik Komputer (STIKOM) Surabaya
memberikan banyak fasilitas tambahan untuk
mendukung proses kegiatan pembelajaran di area
kampus STIKOM Surabaya. Salah satunya
adalah STIKOM Wireless Connection (SWC).
Dengan tersambung pada SWC, civitas akademik
STIKOM Surabaya dapat mengakses internet
secara gratis untuk mendapatkan informasi
penunjang pembelajaran kuliah ataupun
informasi lainnya.
Usaha yang dilakukan oleh search engine
untuk mengumpulkan informasi juga berbanding
lurus bila dilihat dari sudut pandang pihak
manajemen STIKOM Surabaya. Pihak
manajemen menginginkan semua fasilitas yang
ada di kampus dapat dimaksimalkan fungsinya
bagi kepentingan civitas akademik STIKOM
2
Surabaya. Banyaknya audience yang menghadiri
pelatihan atau seminar yang diadakan pihak
kampus, padatnya kerumunan mahasiswa di
perpustakaan karena selalu tersedia koleksi baru
yang sekarang ini sedang trend, dan masih
banyak lagi tujuan yang lain
Internet seakan-akan telah menjadi tempat
rujukan kedua bila ada sesuatu hal yang tidak
bisa didapatkan langsung di dunia nyata karena
adanya beberapa keterbatasan seperti letak
geografis ataupun waktu. Google adalah salah
satu websearch terkenal yang sering dipakai oleh
civitas STIKOM Surabaya untuk mencari
informasi yang tidak bisa didapatkan langsung di
kampus STIKOM Surabaya. Tidak diadakannya
seminar atau pelatihan pada topik tertentu,
minimnya jumlah koleksi pustaka yang dimiliki
perpustakaan di topik tertentu, mendorong
mereka harus mencari informasi dimana dan
bagaimana hal tersebut bisa mereka dapatkan.
Diantaranya dengan mencari informasi di
Google. Hal ini menjadi peluang bagi pihak
manajemen agar event yang diadakan di kampus
ataupun fasilitas yang disediakan selalu dipadati
oleh civitas akademik STIKOM Surabaya.
Diantaranya adalah dengan mengetahui trend apa
yang sekarang ini sedang diminati di kalangan
civitas akademik STIKOM Surabaya.
Untuk mengetahui trend apa yang sekarang
ini sedang diminati oleh civitas STIKOM
Surabaya, pihak manajemen STIKOM Surabaya
merasa perlu memantau hasil pencarian yang
dilakukan oleh user internet di STIKOM
Surabaya pada websearch Google. Dari
kumpulan keyword yang dicari oleh user internet
di STIKOM Surabaya, baik yang terkoneksi
lewat wired local area network ataupun
STIKOM wireless Connection, dapat dijadikan
sumber data untuk kemudian dianalisa sehingga
dapat diketahui kata-kata yang berkaitan dengan
topik tertentu dengan kadar relasi interest yang
tinggi sedang menjadi trend di kampus STIKOM
sekarang ini. Dari hasil pencarian user internet di
Google, dirasa ada beberapa hubungan yang unik
antara kata ataupun topik yang dimasukkan
sebagai keyword pencarian di Google.
Penelitian ini membahas tentang analisa
keyword pencarian di Google berdasarkan
aktivitas Google search dari jaringan STIKOM
Wireless Connection (SWC) dengan metode
Market Basket Analysis (MBA). Dari hasil analisa
akan didapatkan suatu pola assosiasi dari
keyword tertentu beserta nilai confidence yang
dimiliki. Hasil analisa tersebut yang kemudian
dapat menjadi masukan bagi pihak manajemen
STIKOM Surabaya selaku pembuat keputusan
untuk memaksimalkan fungsi fasilitas yang ada
berkaitan dengan hasil analisa sistem ini.
Misalnya bagi pihak PSDM dapat mengadakan
pelatihan atau seminar yang berkaitan dengan
topik yang sedang menjadi trend dikalangan
civitas akademik STIKOM, bagi pihak
Perpustakaan dapat menyediakan koleksi pustaka
yang baru berkaitan dengan topik yang sama.
Dan masih banyak lagi manfaat tidak langsung
dari diketahuinya topik yang sekarang ini sedang
menjadi trend interest di kampus STIKOM
sebagaimana didapat dari hasil analisa sistem
yang akan dibuat ini.
TUJUAN
1. Menghasilkan perangkat lunak (Client Side)
yang dapat mengumpulkan data history
keyword pencarian pada Google.
3
2. Mengetahui bahwa Market Basket Analysis
dapat digunakan untuk menganalisa pola
keyword pencarian pada Google.
3. Menghasilkan perangkat lunak (Server Side)
yang dapat menganalisa data history keyword
pencarian pada Google yang dikirimkan oleh
sistem (Client Side) menggunakan metode
Apriori.
4. Menghasilkan perangkat lunak yang dapat
menyusun daftar hubungan assosiasi antar
keyword beserta tingkat confidence yang
dimiliki berdasarkan parameter minimum
frequent, minimum support dan minimum
confidence.
LANDASAN TEORI DATA MINING
Secara sederhana data mining adalah suatu
proses untuk menemukan interesting knowledge
dari sejumlah data yang disimpan dalam basis
data atau media penyimpanan data lainnya.
Dengan melakukan data mining terhadap
sekumpulan data, akan didapatkan suatu
interesting pattern yang dapat disimpan sebagai
knowledge baru. Pattern yang didapat akan
digunakan untuk melakukan evaluasi terhadap
data-data tersebut untuk selanjutnya akan
didapatkan informasi.
Tehnik dalam data mining datang dari
Basis Data, Machine Learning, dan Statistik.
Elemen-elemen kunci untuk data mining ini telah
dibuat dalam beberapa tahun terakhir. Secara
umum tugas dari data mining dapat dibagi ke
dalam dua tipe, yaitu Predictive Data Mining dan
Knowledge Discovery / Description Data Mining.
Predictive Data Mining adalah tipe data
mining untuk memprediksi nilai suatu variabel di
masa yang akan datang atau nilai variabel lain
berdasarkan beberapa variabel yang saat ini telah
diketahui nilainya. Yang termasuk dalam tipe ini
antara lain: klasifikasi, re gresi, dan deteksi
deviasi.
Knowledge Discovery / Description Data
Mining yang juga sering disebut sebagai
pencarian pola (pattern discovery) adalah tipe
data mining yang digunakan untuk mendapatkan
pola yang tersembunyi dalam data dan bisa
dipahami oleh manusia, biasanya ditampilkan
dalam bentuk kalimat yang mudah dimengerti,
misalnya “Jika seseorang membeli produk A
maka juga membeli produk B”. Meskipun pola
ini bisa ditemukan oleh manusia tanpa bantuan
komputer – khususnya jika jumlah variabel dan
datanya kecil – namun jika jumlah variabel
puluhan bahkan ratusan dan jumlah data ribuan
bahkan jutaan maka diperlukan waktu bertahun-
tahun untuk mendapatkan pola-pola tersebut.
Disinilah peran teknologi informasi dengan
dukungan sistem data mining membantu dalam
penyelesaian permasalahan ini. Yang termasuk
tipe ini adalah: klusterisasi, aturan asosiasi, dan
penemuan pola sekuensial.
Dengan data mining pemilik toko bisa
mendapatkan informasi penting dan profitable
tentang konsumen yang pada akhirnya bisa
meningkatkan keuntungan toko dan angka
penjualan. Kegunaan informasi pada data mining
seperti diatas sering disebut sebagai Market
Basket Analysis. Dalam jangka panjang, data
mining dapat membuat sebuah toko menjadi lebih
kompetitif.
MARKET BASKET ANALYSIS (MBA)
Market Basket Analysis merupakan sebuah
analisis terhadap kebiasaan customer berbelanja
4
pada supermarket dengan cara menemukan
asosiasi dan korelasi di antara berbagai macam
item yang dimasukkan customer di dalam
shopping basket mereka. Secara lebih spesifik
Market Basket Analysis bertujuan untuk
mengetahui item apa saja yang sering dibeli
bersamaan oleh customer. Item di sini diartikan
sebagai berbagai macam produk atau barang pada
supermarket (Han, Yongjian Fu, 1999).
Pada umumnya Market Basket Analysis
dapat diaplikasikan pada :
1. Transaksi kartu kredit : barang-barang yang
dibeli menggunakan kartu kredit dapat
menjadi analisa atas produk sejenis lainnya
yang juga dibeli secara bersamaan.
2. Transaksi Supermarket : kombinasi dari
barang-barang yang telah dibeli oleh
pelanggan dapat digunakan untuk
menentukan peletakan posisi barang di rak.
3. Transaksi produk telekomunikasi : fasilitas
yang saling berhubungan (Seperti nada sela,
tampilan nama pemanggil, fungsi
multimedia, kamera, koneksi dan lain-lain)
membantu menentukan paket dan fungsi dari
suatu produk.
4. Transaksi perbankan : pola dari pelayanan
yang digunakan oleh nasabah digunakan oleh
pihak bank untuk menawarkan pelayanan
yang juga banyak digunakan oleh nasabah
lainnya.
5. Transaksi asuransi : kombinasi yang tidak
lazim dari sebuah klaim asuransi
menunjukkan terjadinya kecurangan sebuah
klaim (klaim fiktif/ rekayasa).
6. Prosedur absensi mesin : kombinasi yang
tidak lazim dari jam kedatangan seseorang
menunjukkan terjadinya kecurangan dalam
proses absensi.
7. Catatan medis pasien : kombinasi tertentu
dari suatu kondisi dapat menggambarkan
bertambahnya resiko dari sebuah komplikasi dari
suatu penyakit
Untuk beberapa kasus, pola dari item-
item yang dibeli secara bersamaan oleh
konsumen mudah untuk ditebak, misalnya susu
dibeli bersamaan dengan roti. Namun, mungkin
saja terdapat suatu pola pembelian item yang
tidak pernah terpikirkan sebelumnya. Misalnya,
pembelian minyak goreng dengan deterjen.
Mungkin saja pola seperti ini tidak pernah
terpikirkan sebelumnya karena minyak goreng
dan deterjen tidak mempunyai hubungan sama
sekali, baik sebagai barang pelengkap maupun
barang pengganti. Hal ini mungkin tidak pernah
terpikirkan sebelumnya sehingga tidak dapat
diantisipasi jika terjadi sesuatu, seperti
kekurangan stok deterjen misalnya. Inilah salah
satu manfaat yang dapat diperoleh dari
melakukan market basket analysis. Dengan
melakukan proses ini secara otomatis, seorang
manajer tidak perlu mengalami kesulitan untuk
menemukan pola item apa saja yang mungkin
dibeli secara bersamaan.
ASSOCIATION RULES
Association rules digunakan untuk
menemukan hubungan di antara data atau
bagaimana suatu kelompok data mempengaruhi
suatu keberadaan data yang lain (M. Kantardzic,
2003). Metode ini dapat membantu mengenali
pola-pola tertentu di dalam kumpulan data yang
besar. Association rule meliputi dua tahap
(Ulmer, David, 2002) :
5
1. Pencarian frequent itemset, dengan cara
mencari kombinasi yang paling sering terjadi
dari suatu itemset.
2. Penyusunan rules, dengan cara
mendefinisikan Condition dan Result
(conditional association rule).
Dalam menentukan suatu association rule,
terdapat suatu interestingness measure (ukuran
kepercayaan) yang didapatkan dari hasil
pengolahan data dengan perhitungan tertentu.
Umumnya ada tiga ukuran, yaitu:
- Support : suatu ukuran yang menunjukkan
seberapa besar tingkat dominasi suatu
item/itemset dari keseluruhan transaksi. Ukuran
ini akan menentukan apakah suatu item/itemset
layak untuk dicari confidence-nya (misal, dari
seluruh transaksi yang ada, seberapa besar tingkat
dominasi yang menunjukkan bahwa item A dan B
dibeli bersamaan) dapat juga digunakan untuk
mencari tingkat dominasi item tunggal.
- Confidence : suatu ukuran yang menunjukkan
hubungan antar 2 item secara conditional (misal,
seberapa sering item B dibeli jika orang membeli
item A).
- Improvement : suatu ukuran yang
menunjukkan besarnya kemungkinan 2 item
dapat dibeli secara bersamaan.
Ketiga ukuran ini nantinya akan berguna
dalam menentukan interesting association rules,
yaitu untuk dibandingkan dengan threshold
(batasan) yang ditentukan.
Batasan tersebut umumnya terdiri dari
minimum support, minimum cofidence, dan
minimum improvement. Sebuah association rule
dengan confidence sama atau lebih besar dari
minimum confidence � dapat dikatakan sebagai
valid association rule (Agrawal R, Srikant,
R.,1994).
ALGORITMA APRIORI
Algoritma ini dicetuskan oleh Agrawal
(1994). Ide dasarnya adalah menghitung pola
kemunculan item yang muncul dalam data
transaksi dengan beberapa iterasi. Iterasi ke i
berarti mendapatkan semua frequent i-itemset
(suatu itemset yang jumlah item anggotanya
sejumlah i). Langkah umum tiap iterasi adalah
menghasilkan candidate itemset kemudian
dihitung nilai support dari tiap candidate. Untuk
menghasilkan candidate, pada dasarnya dapat
dilakukan dengan menyusun kombinasi item-item
yang sudah ditemukan sebelumnya. Algoritma ini
didasari oleh hukum apriori, jika sebuah itemset
ternyata infrequent, maka seharusnya superset-
nya juga infrequent sehingga tidak perlu
diperiksa lagi.
Pada iterasi pertama, setiap jenis item yang
ditemukan dalam data dijadikan candidate untuk
frequent 1-itemsets. Sedangkan candidate di
iterasi berikutnya didapatkan dari frequent
itemset yang ditemukan di iterasi sebelumnya.
Proses akan berhenti jika tidak ada lagi
kombinasi candidate yang bisa dibuat.
Selain algoritma Apriori yang
diimplementasikan sendiri, dalam data mining
workbench yang dibangun juga diintegrasikan
implementasi algoritma Apriori oleh Christian
6
Borgelt (2003) yang sering diacu dan digunakan
oleh peneliti di bidang algoritma data mining.
Google adalah plesetan dari kata 'googol',
yang dipakai oleh Milton Sirotta, keponakan dari
ahli matematika Amerika Edward Kasner, untuk
menyebutkan angka 1 dan mempunyai 100 angka
nol dibelakangnya. Google memakai kata ini
dalam menjelaskan misi perusahaan untuk
mengorganisasi sedemikian banyaknya informasi
yang tersedia di Internet dan didunia ini.
Google adalah sebuah raksasa pencarian
yang banyak diminati sebagai search engine
favorit. Google seolah telah menembus ruang
waktu di berbagai belahan dunia. Google
merupakan mesin pencari yang mempunyai nama
yang cukup populer di mata para pengguna
internet sedunia. Tampilan Google sangat
sederhana, tetapi mengandung kekuatan dan
multifungsi. Selain itu, web Google sangat
lengkap dan hampir menampung semua
perbendaharaan kata dalam berbagai bahasa di
seluruh dunia.
Mesin pencari (search engine) merupakan
cara yang efektif untuk mencari informasi secara
online berdasarkan kata kunci (keyword) yang
dimasukkan. Dalam sistem database, hal itu
disebut sebagai query, merupakan sistematika
bahasa operasi untuk melakukan pencarian data
berdasarkan kedekatan dengan keyword yang
dimasukkan.
ANALISA SISTEM
Setelah dilakukan analisa terhadap
sistem, langkah berikutnya perancangan sistem.
Dimana dalam perancangan sistem ini dapat
memberikan gambaran tentang sistem yang
dibuat.
Gambar 1. Blok Diagram Aplikasi Go ‘N Run.
Go ’n Run nantinya akan terbagi menjadi 2
(dua) bagian, yaitu aplikasi yang berada di sisi
server sebagai penganalisis data, dan aplikasi
yang berada di setiap client baik yang terhubung
secara wired ataupun wireless local area network
sebagai pengumpul data. Server dan Client akan
berada dalam satu jaringan yang sama meskipun
tersambung dari hub wired network dan wireless
access point yang berbeda.
Aplikasi client hanya akan memonitor
aktivitas dari browser Internet Explorer. Setiap
url yang diketikkan pada addressbar Internet
Explorer akan dicatat dan kemudian dikirimkan
ke aplikasi server. Sebagaimana umumnya
aplikasi yang berjalan secara client-server, maka
terlebih dahulu harus ditentukan IP address dari
server dan juga port yang digunakan sebagai
jalur komunikasi antara client dan server.
7
Gambar 2. System Flow Aplikasi Client.
Agar Go ’N Run client dapat digunakan
dengan sempurna, terlebih dahulu harus
ditentukan alamat IP server yang terpasang
aplikasi Go ’N Run Server beserta port yang
sedang aktif digunakan menerima kiriman paket
keyword Google. Begitu konfigurasi jaringan
sudah dilakukan dan client sudah dapat
terkoneksi dengan server, pada startup aplikasi
Go ’N Run client berikutnya setiap aktifitas
keluar masuknya client ke sistem server akan
selalu dicatat di log server. Pencatatan ini
berguna untuk membantu identifikasi client,
sehingga dapat diketahui client mana saja (siapa
saja) yang sedang online dan terhubung dengan
aplikasi Go ’N Run server.
Fitur password dapat diaktifkan untuk
mencegah pengubahan konfigurasi jaringan
komunikasi dengan aplikasi server oleh pihak
lain.
Aplikasi client akan mencatat semua url
yang diketikkan di addressbar Internet Explorer.
Url akan disaring sehingga hanya akan
didapatkan url yang berasal dari domain Google.
Data url Google akan disaring ulang, hingga
akhirnya akan didapatkan kumpulan kata kunci
yang dicari oleh user.
Secara periodik kata kunci akan
dikirimkan ke aplikasi server untuk kemudian
disimpan. Sehingga data dapat dianalisa di
kemudian hari sesuai dengan kebutuhan analisis
.Gambar 3. System Flow Aplikasi Server..
Agar Go ’N Run server dapat digunakan
dengan sempurna, terlebih dahulu harus
ditentukan port manakah yang digunakan untuk
melayani kiriman paket keyword dari client.
Kumpulan pola keyword pencarian yang
telah terkumpul di server kemudian dilakukan
analisa dengan memberikan batasan nilai
Minimal Support dan Minimal Confident. Daftar
yang dihasilkan adalah data yang memenuhi
8
persyaratan nilai Minimal Support dan Minimal
Confident.
User diberikan pilihan apakah daftar
tersebut akan dicetak menjadi sebuah dokumen.
Modul PDF Generator akan memproses daftar
tersebut hingga dihasilkan sebuah file PDF yang
memuat deskripsi singkat dari hasil analisis
Market Basket Analysis, grafik frekuensi data,
dan daftar kesimpulan analisis data.
Di akhir proses user kembali diberikan
pilihan, apakah file PDF tersebut akan
didistribusikan atau tidak. Media email dipilih
sebagai media distribusi berkas kepada pihak-
pihak terkait. Untuk mempermudah identifikasi
user penerima email, terlebih dahulu bisa diisikan
data user pada buku alamat email Go ’N Run
Server.
Algoritma Market Basket Analysis
Proses terpenting pada aplikasi ini adalah
penerapan metode Market Basket Analysis.
Proses dimulai dengan pencatatan url dari
browser Internet Explorer. Dari url yang berhasil
dicatat, hanya akan diambil url yang berasal dari
domain Google. Dari daftar baru yang hanya
berisi url dari Google, akan dipecah-pecah
sehingga didapatkan pola keyword yang dicari
oleh user.
Pola-pola keyword kemudian akan dipecah
menjadi daftar keyword tunggal. Kemudian
dibuat tabel tabulasinkeyword untuk mengetahui
jumlah keyword yang ditemukan per pola
keyword yang ada. Dari tabel tabulasi dapat
diketahui nilai support dan nilai confident dari
tiap pola. Dengan membandingkan dengan
batasan nilai Minimal Support dan Minimal
Confident didapatkan daftar akhir pola keyword
yang ber-asosiasi dan memenuhi batasan nilai
Minimal Support dan Minimal Confident. Aliran
proses Market Basket Analysis yang diterapkan
akan tampak seperti pada gambar 4.
Gambar 4. Flow Chart MBA.
Desain DFD dalam sistem ini seperti
dalam Gambar 5. Context diagram merupakan
diagram pertama dalam rangkaian suatu DFD
yang menggambarkan entitas-entitas yang
berhubungan dengan suatu sistem informasi.
AttachedReport
Raw URL
Hostname
Serverport
Usedport
Original PDF Report
Min_Confident
Min_Support
Password
mailAddress
0
Analisis Pola Keyword Pencarian pada Google
Menggunakan Market Basket Analysis
+
Client User
Internet Explorer
DepartemenPPTI
Gambar 5 Context Diagram Sistem Go ’n Run
9
HASIL DAN PEMBAHASAN
Bahasa pemrograman yang digunakan
untuk melakukan implementasi adalah Microsoft
Visual Basic.NET. Tampilan awal aplikasi client
dapat dilihat pada gambar 6.
Gambar 6 Aplikasi Client
Dan tampilan awal aplikasi server dapat dilihat
pada gambar 7.
Gambar 7 Aplikasi Server
UJI COBA DATA
Perangkat keras yang dipergunakan pada
uji coba ini adalah komputer dengan prosesor
Intel Pentium IV Core2Duo 2.0GHz dengan
memori sebesar 2048 MB. Sedangkan sistem
operasi yang dipergunakan adalah Windows XP
Profesional Edition Service Pack 2. Pada uji coba
yang akan dilakukan, digunakan 3 sumber data
transaksional yang berbeda. Spesifikasi ketiga
sumber data transaksional yang akan digunakan
adalah seperti yang terlihat pada tabel 1.
Tabel 1 Spesifikasi Data Uji Coba
Data 1 Data 2 Data 3
∑ Item 15 15 15
∑ Transaksi 26 58 108
Pada uji coba ini, yang akan dilakukan
adalah menjalankan perangkat lunak dengan
parameter yang sama pada tabel yang berbeda.
Sumber data yang akan digunakan ada 3 (tiga),
yaitu: Data 1, Data 2, dan Data 3. Sedangkan
parameter yang digunakan adalah minsup dan
minconf. Nilai minsup yang akan dimasukkan
adalah 0%, 25%, 50%. Sedangkan nilai minconf
yang dimasukkan adalah 20%. Hasil uji coba
untuk masing-masing tabel dapat dilihat pada
tabel 2, tabel 3 dan tabel 4.
Tabel 2 Hasil Uji Coba 1 menggunakan Data1
Min. Support
(%)
0 25 50
Waktu
Proses
00:00:24 00:00:08 00:00:09
∑ Kaidah
Asosiasi
30 10 10
10
Tabel 3 Hasil Uji Coba 1 menggunakan Data2
Min. Support
(%)
0 25 50
Waktu
Proses
00:01:51 00:01:42 00:01:55
∑ Kaidah
Asosiasi
208 44 44
Tabel 4 Hasil Uji Coba 1 menggunakan Data3
Min. Support
(%)
0 25 50
Waktu
Proses
00:07:34 00:07:05 00:07:13
∑ Kaidah
Asosiasi
260 80 80
Berdasarkan hasil pengujian yang telah
dilakukan pada tabel uji coba maka dapat ditarik
kesimpulan sementara hasil pengujian sebagai
berikut :
1. Semakin banyak jumlah transaksi maka akan
semakin banyak waktu yang diperlukan untuk
proses analisa Market Basket Analysis.
2. Semakin tinggi nilai Minimum Support maka
akan semakin memperpendek waktu yang
diperlukan untuk proses analisa Market
Basket Analysis.
3. Semakin tinggi nilai Minimum Support maka
akan semakin sedikit jumlah kaidah asosiasi
yang dihasilkan.
Gambar 8 Grafik Support – Waktu Komputasi
Gambar 9 Grafik Support – Jumlah Pola Asosiasi
UJI DATA LAPANGAN
Perangkat keras yang dipergunakan pada
uji lapangan ini adalah komputer dengan prosesor
Intel Pentium IV Core2Duo 2.0 GHz dengan
memori sebesar 2048 MB. Sedangkan sistem
operasi yang dipergunakan adalah Windows XP
Profesional Edition Service Pack 2. Uji lapangan
ini dilakukan selama 2 minggu yaitu mulai
tanggal 1 Agustus 2011 sampai dengan tanggal
16 Agustus 2011.
Dari hasil uji lapangan diketahui bahwa
selama periode uji lapangan telah terjadi 897 kali
pola pencarian di websearch Google. Untuk
mengetahui semua aturan asosiasi yang
dihasilkan, proses analisa Market Basket Analysis
dilakukan dengan memberikan batasan minimum
support sebesar 0% dan minimum confidence
sebesar 0%.
Dari proses analisa dihasilkan 796 aturan
asosiasi User pencari kata (buku) juga
mencari kata (blog) dengan nilai confidence
tertinggi sebesar 97% dan nilai confidence
terendah sebesar 1%. Untuk melakukan proses
analisa ini diperlukan waktu selama hampir 3,5
jam (03:24:44).
11
KESIMPULAN
1. Metode Market Basket Analysis dapat
digunakan untuk menganalisa pola keyword
pencarian pada Google.
2. Arsitektur aplikasi Keyword Patern
Searching Analyzer pada dasarnya terbagi
menjadi 2 (dua) bagian utama, yaitu client
side (aplikasi yang di-install di client) dan
server side (aplikasi yang di-install di
server).
3. Client side dapat mencatat url yang
diketikkan user pada Internet Explorer pada
masing-masing client PC. Pada saat user
melakukan pencarian di Google, dapat
diketahu pola keyword yang pernah dicari
oleh user. Keyword dikirimkan ke server
untuk kemudian dilakukan analisa lebih
lanjut oleh aplikasi pada server side.
4. Server side dapat menangkap semua
kiriman pola keyword dari client yang
terkoneksi di jaringan. Berdasarkan pola
keyword yang telah terkumpul, aplikasi
server side dapat menemukan association
rule dari keyword yang dicari oleh user
client di Google sesuai kebutuhan dengan
parameter pembatas berupa minimum
support dan minimum confident.
5. Output dari aplikasi Keyword Patern
Searching Analyzer yang berupa informasi
mengenai keyword apa saja yang dicari
secara bersamaan oleh pengguna search
engine Google, masih berupa laporan
umum. Daftar ini dapat didistribusikan ke
pihak-pihak terkait sebagai bahan masukan
pembuatan keputusan.
6. Contoh menerapkan informasi yang
dihasilkan oleh aplikasi Keyword Patern
Searching Analyzer ini adalah dapat
disimpulkan bahwa semakin tinggi nilai
confident dari suatu pattern, semakin
banyak pula peminat pattern tersebut. Dan
bila pattern tersebut diterapkan sebagai
topik diskusi dalam sebuah
seminar/workshop, maka diharapkan
semakin tinggi pula jumlah peserta yang
mengikutinya. Baik peserta dari kalangan
umum maupun dari kalangan civitas
akademik STIKOM Surabaya. Dengan
demikian semakin baik pula image kampus
STIKOM Surabaya di pandangan
masyarakat sekitar.
7. Pada analisa terhadap sejumlah data
ditemukan bahwa semakin banyak data
yang dianalisa, waktu proses akan lebih
lama karena semakin banyak pula frequent
items dan rules yang dihasilkan.
8. Pada analisa terhadap sejumlah data
ditemukan bahwa semakin tinggi nilai
minimum support dan minimum confident
yang ditentukan, semakin sedikit jumlah
kaidah asosiasi yang dihasilkan yang
dihasilkan.
DAFTAR RUJUKAN
Agrawal R, Srikant, R.(1994). Fast Algorithms for Mining Association Rules, Proceedings of the 20th International Conference on Very
12
Large Data Bases (VLDB), Santiago, Chile, pp. 487-499.
Amanda Spink, Dietmar Wolfram, Bernard J.
Jansen, and Tefko Saracevic. Searching the Web: the public and their queries. Journal of the American Society for Information Science and Technology, 52(3), 226-234, 2001.
Borgelt C. (2003). Efficient Implementations
of Apriori and Eclat. Proceeding of the 1st IEEE ICDM Workshop on Frequent Item Set Mining Implementations (FIMI 2003, Melbourne, FL). CEUR Workshop Proceedings 90, Aachen, Germany.
Cooley, R., Mobasher, B., & Srivastava, J. “Web mining: Information and pattern discovery on the world wide web”, 1997
Google.com. “Official Supported Domains”, http://www.google.com/supported_domains (diakses pada tanggal 9 Februari 2010)
Han, Jiawei, Micheline Kamber, “Data Mining: Concepts and Techniques”, Morgan Kaufmann, 2001
Han, Jiawei, Yongjian Fu, “Discovery Of Multiple-Level Association Rules From Large Databases”, IEEE Transactions On Knowledge And Data Engineering, Vol. 11, No. 5, September/October 1999
Jansen, B. J., & Spink, A., “An Analysis of Document Viewing Patterns of Web Search Engine Users”, 2003
Kantardzic, M. (2003). Data Mining
Concepts Models, Methods, and Algorithms. New Jersey: IEEE.
Ulmer, David; “Mining an Online Auctions Data Warehouse.” The Mid-Atlantic Student Workshop on Programming
Languages and Systems. 19 April 2002. Pace University. http://csis.pace.edu/csis/masplas/p8.pdf (diakses pada tanggal 9 Februari 2010)
Wicaksono, Soetam Risky, 2005, Kuliah Interaksi Manusia dan Komputer, STIKOMP, Surabaya