+ All Categories
Home > Documents > IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB...

IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB...

Date post: 15-Jul-2019
Category:
Upload: vokien
View: 219 times
Download: 0 times
Share this document with a friend
67
i IDENTIFIKASI PENULIS PADA DOKUMEN TULISAN TANGAN AKSARA LAMPUNG BERDASARKAN KARAKTER TERPILIH (Skripsi) Oleh SYIFA TRIANINGSIH FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS LAMPUNG BANDAR LAMPUNG 2019
Transcript
Page 1: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

i

IDENTIFIKASI PENULIS PADA DOKUMEN TULISAN TANGAN AKSARA

LAMPUNG BERDASARKAN KARAKTER TERPILIH

(Skripsi)

Oleh

SYIFA TRIANINGSIH

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS LAMPUNG

BANDAR LAMPUNG

2019

Page 2: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

iii

ABSTRACT

WRITER IDENTIFICATION OF LAMPUNG HANDWRITTEN

DOCUMENTS BASED ON CHOSEN CHARACTERS

BY

SYIFA TRIANINGSIH

Handwriting recognition is becoming more popular for the forensic and knowledge

development purposes, because from handwriting every human can save and

transmission an information to other people. Traditional characters from Lampung,

one of region in Indonesia was chosen as media in this experiment, called Had

Lampung. They have 20 main characters and 11 diacritics that used in every word

or sentence. Based on those selected characters, the authors would be identified

using Principal Component Analysis (PCA). PCA is one of the linear feature

extraction method for recognize a pattern with high dimensional data. PCA extract

the features by reducing the dimension of images. Dataset used in this experiment

called Lampung Dataset and available on Technische Universität’s website for free.

This dataset consists of 82 documents written by hands in Lampung characters. In

the experiment, almost 12500 Lampung characters was chosen from 82 different

writers are used to train and test the performances of the proposed method.

Page 3: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

iv

Lampung characters that used in this experiment have gone through a pre-

processing before. The highest accuracy that PCA got in identification the authors

is 82,92% whilst the lowest accuracy in this experiment is 28,9%.

Keywords: feature extraction; lampung characters; principal component analysis;

pca; writer identification.

Page 4: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

i

ABSTRAK

IDENTIFIKASI PENULIS PADA DOKUMEN TULISAN TANGAN AKSARA

LAMPUNG BERDASARKAN KARAKTER TERPILIH

Oleh

SYIFA TRIANINGSIH

Pengenalan tulisan tangan menjadi topik yang popular untuk bidang forensik dan

pengembangan ilmu pengetahuan. Karena dari tulisan tangan, setiap manusia dapat

menyimpan dan mentrasmisikan sebuah informasi kepada orang lain. Karakter

tradisional daerah Lampung, salah satu daerah di Indonesia terpilih sebagai media

dalam penelitian ini, karakter tradisional daerah Lampung biasa disebut dengan

Had Lampung. Had Lampung memiliki 20 karakter utama dan 11 anak huruf yang

digunakan pada kata atau padanan kalimat. Berdasarkan karakter terpilih, penulis

akan diidentifikasi menggunakan Principal Component Analysis (PCA). PCA

merupakan salah satu metode fitur ekstraksi linear untuk mengenali pola dengan

dimensi yang tinggi. PCA mengekstraksi fitur dengan mengurangi dimensi gambar.

Dataset yang digunakan pada penelitian ini disebut dengan Lampung Dataset yang

tersedia secara gratis di situs Technische Universität. Dataset tersebut memiliki 82

dokumen tulisan tangan Aksara Lampung. Pada penelitian ini, hampir 12.500

Page 5: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

ii

Aksara Lampung dari 82 dokumen terpilih untuk digunakan sebagai data train dan

data test untuk menunjang performa metode yang diusulkan. Sebelumnya, Aksara

Lampung pada dataset yang telah tersedia telah mengalami preprocessing. Hasil

akhirnya, akurasi tertinggi hasil identifikasi yang didapatkan pada identifikasi

penulis adalah 82,92% sedangkan akurasi terendah yang didapatkan adalah sebesar

28,29%.

Kata kunci: aksara Lampung, fitur ekstraksi, identifikasi penulis, principal

component analysis.

Page 6: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

v

IDENTIFIKASI PENULIS PADA DOKUMEN TULISAN TANGAN AKSARA

LAMPUNG BERDASARKAN KARAKTER TERPILIH

Oleh:

SYIFA TRIANINGSIH

Skripsi

Sebagai Salah Satu Syarat untuk Mencapai Gelar

SARJANA KOMPUTER

Pada

Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS LAMPUNG

BANDAR LAMPUNG

2019

Page 7: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah
Page 8: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah
Page 9: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah
Page 10: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

ix

RIWAYAT HIDUP

Penulis dilahirkan pada tanggal 20 Sepetember 1996 di Kota Bekasi,

sebagai anak kedua dari dua bersaudara, dari bapak Suparyanto dan

Ibu Raras Wigati. Pendidikan formal yang ditempuh penulis adalah

Sekolah Taman Kanak-kanak (TK) Shandy Putra Telkom Bandar

Lampung diselesaikan tahun 2002, Sekolah Dasar (SD) diselesaikan

di SD Kartika II-5 Bandar Lampung pada tahun 2008. Sekolah Menengah Pertama

(SMP) diselesaikan di SMP Negeri 5 Bandar Lampung pada tahun 2011, dan Sekolah

Menengah Atas (SMA) YP Unila Bandar Lampung pada tahun 2014.

Pada tahun 2014, penulis terdaftar sebagai mahasiswa Jurusan Ilmu Komputer Fakultas

Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Lampung melalui jalur

SBMPTN. Semasa kuliah, penulis terdaftar dalam organisasi Organisasi Himpunan

Mahasiswa Jurusan Ilmu Komputer (HIMAKOM) FMIPA Unila sebagai anggota

Keilmuan periode 2015/2016.

Selama menjadi mahasiswa beberapa kegiatan yang pernah dilakukan penulis antara

lain:

Page 11: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

x

1. Pada bulan Januari 2015 penulis melaksanakan Karya Wisata Ilmiah (KWI) di

Desa Sidokaton, Gisting, Kabupaten Tanggamus.

2. Pada pernah Semester Ganjil Tahun Akademik 2016/2017 penulis menjadi

asisten praktikum mata kuliah Grafika Komputer

3. Pada Bulan Januari 2017, penulis melakukan kerja Praktik di Kantor Badan

Pengawasan Keuangan dan Pembangunan (BPKP) Perwakilan Provinsi

Lampung.

4. Pada Bulan Juli 2017 penulis melakukan kegiatan Kuliah Kerja Nyata (KKN) di

Desa Banjarmasin Kecamatan Penengahan, Kabupaten Lampng Selatan.

Page 12: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xi

PERSEMBAHAN

Kuucapkan syukurku kepada Allah Subhanahuwata’ala, kujadikan setiap proses

pembuatan karya kecilku ini sebagai salah satu bentuk ibadahku kepada Allah

Kudedikasikan buku ini menjadi beberapa bagian:

Untuk Ibuku Sayang,

Untuk Pahlawan Super-ku

Untuk Si K-Drama Lovers

Dan, untuk “The wiser yet the most patience person”

Page 13: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xii

MOTTO

“Sesungguhnya bersama kesulitan, ada kemudahan. Dan hanya kepada Tuhanmulah engkau berharap”

(Q. S. Al – Insyirah (94): 6&8)

“Nothing’s gone forever, only out of place” (Mary Poppins)

Page 14: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xiii

SANWACANA

Puji syukur kehadirat Allah Subhannahu wata ‘ala, atas limpahan rahmat dan hidayah-

Nya sehingga penulis dapat menyelesaikan skripsi yang berjudul “Identifikasi Penulis

Pada Dokumen Tulisan Tangan Aksara Lampung Berdasarkan Karakter

Terpilih”. Skripsi ini merupakan salah satu syarat untuk memperoleh gelar Sarjana

Komputer di Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan

Alam Universitas Lampung.

Pada saat pelaksanaan dan penyusunan skripsi penulis sangat berterima kasih kepada

seluruh pihak yang membantu penulis menyelesaikan skripsi ini. Oleh karena itu,

penulis mengucapkan terima kasih kepada:

1. Kedua orangtua tercinta, Bapak Suparyanto dan Ibu Raras Wigati yang selalu

memberikan doa, nasihat dan semangat dukungan berupa moril, dan materil.

2. Kakak perempuan penulis satu-satunya, Aryanti Dwiastuti yang selalu

memberikan semangat, kritik, saran, motivasi, pengalaman, dan masukannya.

3. Dr. rer. nat. Akmal Junaidi, M. Sc. selaku dosen pembimbing utama yang telah

memberikan kesediaan waktunya, kesabaran, motivasi semangat, kritik, dan

saran sehingga penulisan skripsi ini dapat diselesaikan.

Page 15: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xiv

4. Bapak Muhammad Iqbal, S. Kom., M. Kom. selaku pembimbing kedua yang

telah membimbing penulis serta memberikan saran dan motivasi dalam

pembuatan skripsi.

5. Bapak Dr. Eng. Admi Syarif selaku dosen pembahas. Terima kasih atas masukan,

kritik, semangat, serta bimbingan dalam penyelesaian skripsi ini.

6. Bapak Prof. Warsito, S. Si., D.E.A., Ph.D. selaku Dekan FMIPA Universitas

Lampung.

7. Bapak Dr. Ir. Kurnia Muludi, M. S. Sc. selaku Ketua Jurusan Ilmu Komputer

Universitas Lampung.

8. Bapak Didik Kurniawan, S. Si., M. T. selaku Sekretaris Jurusan Ilmu Komputer

Universitas Lampung.

9. Bapak Rico Andrian, S. Si., M. Kom. selaku Pembimbing Akademik selama

penulis terdaftar sebagai mahasiswa Ilmu Komputer Universitas Lampung.

10. Bapak dan Ibu Dosen Jurusan Ilmu Komputer yang telah memberikan ilmu dan

pengalaman yang bermanfaat bagi penulis.

11. Seluruh staff yang ada di Jurusan Ilmu Komputer.

12. Partner sharing terbaik Nuha Hanifah, Devi Ranita, Tri Lestari, Noni Kurniasih,

dan Maria Regina Caeli terima kasih untuk bantuan, masukan, saran, kritik,

energi positif yang disampaikan, dalam pembuatan skripsi.

13. Kolega selama Kuliah Kerja Nyata (KKN) Tri, Siska, Aldi, dan Darius terima

kasih atas kebersamaan, kerja sama, semoga tali silaturahmi tetap terjaga.

Page 16: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xv

14. Teman-teman Ilmu Komputer angkatan 2014, khususnya kelas ganjil yang

menjadi teman satu angkatan selama menjalankan masa studi di Jurusan Ilmu

Komputer.

15. Almamater tercinta, Universitas Lampung.

Penulis menyadari bahwa penyusunan skripsi ini masih banyak kekurangan dan masih

jauh dari kesempurnaan. Semoga Allah melimpahkan rahmat dan berkenan membalas

semua budi baik yang diberikan kepada penulis, serta semoga skripsi ini dapat

bermanfaat bagi kita semua, Aamiin.

Bandar Lampung, Januari 2019

Penulis,

Syifa Trianingsih

Page 17: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xvi

DAFTAR ISI

Halaman

SANWACANA ......................................................................................................... xiii

DAFTAR ISI ............................................................................................................. xvi

DAFTAR TABEL .................................................................................................... xix

DAFTAR GAMBAR ................................................................................................. xx

I. PENDAHULUAN .............................................................................................. 1

1.1. Latar Belakang ......................................................................................... 1

1.2. Rumusan Masalah .................................................................................... 3

1.3. Batasan Masalah ...................................................................................... 4

1.4. Tujuan ...................................................................................................... 4

1.5. Manfaat .................................................................................................... 5

II. LANDASAN TEORI ......................................................................................... 6

2.1. Aksara Lampung ...................................................................................... 6

2.1.1. Induk Huruf (Kelabai Surat) ........................................................ 8

2.1.2. Anak Huruf (Benah Surat) ......................................................... 10

2.1.3. Tanda Baca ................................................................................. 16

2.2. Pengenalan Pola ..................................................................................... 16

Page 18: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xvii

2.2.1. Tujuan dan Implementasi Pengenalan Pola ............................... 17

2.3. Identifikasi Penulis ................................................................................ 18

2.4. Preprocessing ........................................................................................ 20

2.4.1. Reduksi Noise ............................................................................ 21

2.4.2. Binerisasi Gambar ...................................................................... 22

2.4.3. Normalisasi Gambar .................................................................. 23

2.5. Ekstraksi Fitur ........................................................................................ 24

2.5.1. Principal Component Analysis (PCA) ....................................... 25

2.6. Euclidean Distance ................................................................................ 30

III. METODOLOGI PENELITIAN ..................................................................... 32

3.1. Pra Penelitian ......................................................................................... 32

3.1.1. Studi Literatur ............................................................................ 32

3.1.2. Dataset ....................................................................................... 33

3.2. Preprocessing ........................................................................................ 33

3.3. Identifikasi Penulis ................................................................................ 34

3.3.1. Pembagian Karakter ................................................................... 35

3.3.2. Ekstraksi Fitur Menggunakan PCA ........................................... 35

3.3.3. Training Identifikasi Penulis ...................................................... 36

3.3.4. Identifikasi Penulis ..................................................................... 37

3.3.5. Pengukuran Hasil Identifikasi .................................................... 38

3.4. Analisis Singkat Kesalahan Identifikasi Penulis ................................... 38

IV. HASIL DAN PEMBAHASAN ........................................................................ 39

4.1. Dataset ................................................................................................... 39

4.2. Ekstraksi Fitur Menggunakan PCA ....................................................... 40

4.3. Training Identifikasi Penulis ................................................................. 52

4.4. Identifikasi Penulis ................................................................................ 53

4.5. Pengukuran Hasil Identifikasi ................................................................ 61

4.6. Analisis Singkat Hasil Identifikasi ........................................................ 63

Page 19: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xviii

V. SIMPULAN DAN SARAN.............................................................................. 66

5.1. Simpulan ................................................................................................ 66

5.2. Saran ...................................................................................................... 66

DAFTAR PUSTAKA ................................................................................................ 68

LAMPIRAN ............................................................................................................... 71

Page 20: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xix

DAFTAR TABEL

Tabel Halaman

4.1. Pembagian Sampel Trainingset dan Testingset.................................................... 40

4.2. Tabel Ukuran Matriks Train. ............................................................................... 42

4.3. Tabel Susunan Ordo Hasil Rata-Rata Matriks Train (m). ................................... 44

4.4. Tabel Ukuran Matriks Substraksi (A). ................................................................. 46

4.5. Tabel Ukuran Matriks Kovarians untuk Setiap Sampel (L). ............................... 48

4.6. Ukuran Matriks Hasil Eigenvalue dan Eigenvektor. ............................................ 49

4.7. Hasil Eliminasi Elemen Matriks Eigenvalue. ...................................................... 50

4.8. Hasil Proses Perkalian Mendapatkan PCA dari Setiap Sampel Penelitian. ......... 52

4.9. Ukuran Matriks Proyeksi Gambar Train dari Setiap Sampel Penelitian. ............ 53

4.10. Ukuran Matriks Hasil dari Baca Gambar Uji untuk Setiap Sampel. ................. 55

4.11. Ukuran Matriks Proyeksi Gambar Uji dari Setiap Sampel Penelitian. .............. 57

4.12. Jumlah Prediksi Benar yang Didapatkan pada Pengujian Identifikasi Penulis. . 61

Page 21: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xx

DAFTAR GAMBAR

Gambar Halaman

2.1. Induk huruf yang belum disempurnakan (Pudjiastuti, 2014). ................................ 8

2.2. Induk huruf yang sudah disempurnakan (Junaidi, et al., 2011). ............................ 9

2.3. Contoh induk huruf yang condong mengarah ke kanan-atas. ................................ 9

2.4. Contoh bentuk huruf yang terdiri dari dua komponen huruf utama..................... 10

2.5. Bentuk-bentuk benah surat pada Aksara Lampung. ............................................ 11

2.6. Bentuk-bentuk benah surat yang terletak di bagian atas huruf. .......................... 12

2.7. Bentuk-bentuk anak huruf yang terletak di bagian bawah huruf. ........................ 13

2.8. Bentuk anak huruf yang dapat diletakkan di samping kanan huruf. .................... 14

2.9. Kumpulan tanda baca yang ada di Aksara Lampung. .......................................... 16

2.10. Gambar sebelum noise dihilangkan (kiri) dan gambar sesudah noise dihilangkan

(kanan) (Garnett, et al., 2005). ........................................................................... 22

2.11. Contoh perangko Jerman yang dikonversi ke dalam format biner, (Junaidi, 2016).

........................................................................................................................... 22

2.12. Contoh proses normalisasi kemiringan pada bentuk tulisan (proses slant)

(Virajitha, et al., 2012). ...................................................................................... 23

2.13. Contoh proses normalisasi kemiringan pada arah tulisan (proses skew) (Virajitha,

et al., 2012). ....................................................................................................... 23

Page 22: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xxi

2.14. Ilustrasi perubahan matrik (𝑀 × 𝑁) menjadi vektor kolom (𝑀 × 𝑁) × 1 (Paul &

Al Sumam, 2012). .............................................................................................. 26

3.15. Metode penelitian identifikasi penulis pada dokumen tulisan tangan Aksara

Lampung. ........................................................................................................... 34

3.16. Tahapan fitur ekstraksi PCA (Paul & Al Sumam, 2012). .................................. 36

3.17. Tahapan training identifikasi penulis (Paul & Al Sumam, 2012). .................... 37

3.18. Tahapan identifikasi penulis (Paul & Al Sumam, 2012). .................................. 37

4.19. Salah satu dataset gambar tulisan tangan aksara Lampung yang sudah mengalami

preprocessing, (Junaidi, et al., 2011). ................................................................ 40

4.20. Code program untuk memroses gambar aksara Lampung menjadi matriks dan

mengubahnya ke dalam vektor kolom. .............................................................. 41

4.21. Ilustrasi proses code program dalam mengubah dua gambar aksara Lampung

menjadi matriks vektor kolom. .......................................................................... 42

4.22. Tahapan proses ekstraksi fitur menggunakan PCA. .......................................... 43

4.23. Potongan code program untuk menghitung nilai rata-rata matriks train. .......... 44

4.24. Ilustrasi gambar untuk proses mendapatkan nilai rata-rata matriks train dari dua

gambar aksara Lampung. ................................................................................... 44

4.25. Potongan code program untuk menghitung substraksi matriks train. ............... 45

4.26. Ilustrasi proses untuk mendapatkan nilai substraksi dari dua buah gambar train.

........................................................................................................................... 45

4.27. Potongan code program matriks kovarians. ....................................................... 46

4.28. Ilustrasi gambar untuk proses mendapatkan matriks kovarians dari dua gambar

aksara Lampung. ................................................................................................ 47

Page 23: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xxii

4.29. Potongan code program untuk mendapatkan matriks eigenvalue dan eigenvektor.

........................................................................................................................... 48

4.30. Ilustrasi proses matriks kovarians dari dua gambar train aksara Lampung

mendapatkan matriks eigenvalue dan eigenvektor. ........................................... 49

4.31. Potongan code program untuk mengeliminasi elemen matriks eigenvalue. ...... 50

4.32. Ilustrasi proses eliminasi elemen matriks eigenvalue. ....................................... 50

4.33. Potonga code program untuk menghitung nilai PCA. ....................................... 51

4.34. potongan code program untuk menghitung proyeksi gambar train. .................. 52

4.35. Potongan code program untuk membaca satu gambar dalam bentuk matriks serta

mengubahnya ke dalam bentuk vektor kolom. .................................................. 54

4.36. Proses code program dalam membaca sebuah gambar uji dan mengubahnya ke

dalam bentuk vektor kolom. .............................................................................. 54

4.37. Potongan code program untuk membaca satu folder yang berisi beberapa gambar

uji. ...................................................................................................................... 55

4.38. Potongan code program untuk mencari nilai proyeksi gambar uji. ................... 56

4.39. Ilustrasi proses operasi hitung untuk mendapatkan nilai proyeksi gambar uji dari

satu buah gambar pengujian. ............................................................................. 56

4.40. Potongan code program untuk menghitung jarak Euclidean distance pada satu

buah gambar uji. ................................................................................................ 58

4.41. Potongan code program untuk menghitung jarak Euclidean distance pada

beberapa gambar uji. .......................................................................................... 58

4.42. Matriks hasil dari perhitungan jarak Euclidean untuk beberapa gambar uji. ..... 59

Page 24: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

xxiii

4.43. Potongan code program untuk menampilkan hasil jarak Euclidean distance yang

paling kecil......................................................................................................... 60

4.44. Hasil output prediksi identifikasi penulis. .......................................................... 60

4.45. Bentuk aksara Lampung yang memiliki kemiripan. .......................................... 64

4.46. Contoh gaya tulisan yang serupa dari penulis yang berbeda. ............................ 64

Page 25: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

1

I. PENDAHULUAN

1.1. Latar Belakang

Biometrik telah menjadi topik penelitian dalam waktu yang lama, karena

penelitian biometrik memiliki tujuan yang berkaitan tentang pengenalan identitas

berdasarkan karakteristik individu. Tulisan tangan merupakan salah satu ciri

biometrik, karena tulisan tangan dapat mewakili karakteristik pribadi dari

masing-masing individu. Identifikasi tulisan tangan termasuk ke dalam

pendekatan perilaku biometrik, karena tulisan tangan seseorang memiliki gaya

yang berbeda, sehingga identitas dapat diukur berdasarkan tulisan tangan yang

bisa merepresentasikan pribadi setiap manusia (Zuo, et al., 2002).

Identifikasi tulisan tangan juga termasuk topik riset pada bidang pengenalan pola

yang telah berkembang beberapa tahun terakhir. Salah satu faktor yang menarik

perhatian sebagian besar peneliti pada bidang pengenalan pola tulisan tangan

karena adanya penemuan tulisan tangan yang dapat memfasilitasi manusia agar

dapat menyimpan dan mentransmisikan informasi (Junaidi, 2016). Pola teks

tulisan tangan menjadi alat penting yang dapat digunakan oleh para ahli forensik

dalam mengidentifikasi pemilik tulisan tangan (Bulacu & Lambert, 2005). Media

yang dijadikan bahan untuk identifikasi adalah dokumen-dokumen tulisan tangan

Page 26: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

2

dari skrip aksara modern dan/atau dari skrip aksara tradisional. Penelitian ini

bukan ditujukan untuk kepentingan forensik, melainkan untuk pengembangan

ilmu pengetahuan. Sebagai media identifikasi, penulis menggunakan dokumen

tulisan tangan aksara tradisional dari daerah Lampung.

Lampung merupakan sebuah provinsi yang letaknya berada di ujung selatan

Pulau Sumatera, Indonesia. Lampung mempunyai ciri aksara khas daerah yang

bernama Aksara Lampung. Daerah lain yang memiliki aksara khas adalah Rejang

Bengkulu, Rencong, Sunda, Jawa, dan Bali. Aksara Lampung memiliki dua

puluh huruf induk yang ditulis dari kiri ke kanan dan sebelas tanda baca.

Keunikan Aksara Lampung tersebut yang menjadi salah satu latar belakang dari

penelitian ini.

Secara teknis Aksara Lampung akan diidentifikasi siapa penulisnya dengan

menggunakan beberapa langkah penelitian. Pada tahapan penelitian ini, salah

satu proses yang harus dilakukan adalah ekstraksi fitur. Penelitian ini akan

melakukan analisis apakah fitur tersebut mampu mengenali penulis pada

dokumen Aksara Lampung atau tidak. Pembahasan secara komprehensif

bagaimana proses identifikasi penulis pada dokumen Aksara Lampung yang

dibahas lebih lengkap lagi dibagian berikutnya.

Pada penelitian ini penulis menggunakan fitur Principal Component Analysis

(PCA) dalam mengidentifikasi penulis pada tulisan dokumen Aksara Lampung.

PCA dipilih karena adanya kecocokan metode dengan penelitian sebelumnya,

Page 27: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

3

yaitu Identifikasi Tulisan Tangan Berdasarkan PCA milik Zuo dan rekan pada

tahun 2002 yang menggunakan PCA untuk mengidentifikasi penulis melalui

potongan kata dalam Bahasa Tiongkok (Zuo, et al., 2002). Selain itu, PCA dipilih

karena adanya gagasan ide yang relevan berasal dari pengenalan wajah milik

Kaur dan rekan (Kaur, et al., 2015). Perbedaannya, penelitian ini menggunakan

PCA sebagai metode utamanya dan diaplikasikan untuk potongan huruf Akasara

Lampung. PCA mengidentifikasi potongan kata dalam Bahasa Tiongkok dengan

melakukan reduksi dimensi sebagai teknik ekstraksi fitur pada beberapa kata

terpilih untuk mengidentifikasi penulis. Hal ini juga akan diberlakukan pada

tulisan Aksara Lampung. Dalam penelitian tersebut, PCA yang digunakan untuk

mengidentifikasi penulis pada Aksara Tiongkok berhasil mengenali penulis

dengan presentase hingga 97. 5% (Zuo, et al., 2002). Dengan latar belakang

tersebut, penulis ingin menjadikan skrip Aksara Lampung sebagai objek

penelitian identifikasi penulis Aksara Lampung menggunakan PCA. Dataset

yang digunakan sebanyak 82 dokumen skrip Aksara Lampung yang dapat

diakses secara gratis pada link http://patrec.cs.tu-

dortmund.de/cms/en/home/Resources/index.html.

1.2. Rumusan Masalah

Berdasarkan latar belakang yang telah dijelaskan pada subbab sebelumnya, maka

dapat dirumuskan beberapa masalah antara lain:

1. Bagaimana mengimplementasikan PCA pada identifikasi penulis dokumen

tulisan tangan Aksara Lampung?

Page 28: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

4

2. Berapa besar hasil akurasi identifikasi penulis pada dokumen tulisan tangan

Aksara Lampung dengan menggunakan ekstraksi fitur tersebut?

1.3. Batasan Masalah

Batasan masalah dalam penelitian identifikasi pengenalan tulisan tangan

dokumen Aksara Lampung adalah sebagai berikut:

1. Dataset yang digunakan adalah gambar yang telah melalui tahapan

preprocessing dan dapat diunduh secara bebas pada link

http://patrec.cs.tu-dortmund.de/cms/en/home/Resources/index.html.

2. Dataset terdiri dari 82 dokumen tulisan tangan Aksara Lampung.

3. Ekstraksi fitur dan identifikasi penulis menggunakan PCA berdasarkan

karakter yang telah diproses sebelumnya.

4. Hasil identifikasi yang akan didapatkan adalah berupa tabulasi data hasil

akurasi kebenaran dalam identifikasi penulis dokumen tulisan tangan

Aksara Lampung.

1.4. Tujuan

Penelitian ini bertujuan untuk mengimplementasikan PCA dalam identifikasi

penulis pada dokumen tulisan tangan Aksara Lampung. Hasil implementasi ini

digunakan untuk mengukur akurasi PCA dalam mengenali penulis pada

dokumen tulisan tangan Aksara Lampung.

Page 29: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

5

1.5. Manfaat

Penelitian ini bermanfaat untuk menambah pengetahuan dasar PCA dan

implementasinya dalam mengidentifikasi penulis pada dokumen tulisan tangan

Aksara Lampung. Selain itu, manfaat penelitian ini adalah untuk mengukur

tingkat akurasi PCA dalam mengidentifikasi penulis pada dokumen tulisan

tangan Aksara Lampung.

Page 30: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

6

II. LANDASAN TEORI

2.1. Aksara Lampung

Definisi aksara menurut Kamus Besar Bahasa Indonesia adalah sistem tanda

grafis yang digunakan manusia untuk berkomunikasi dan sedikit banyaknya

mewakili ujaran atau perkataan. Lampung merupakan salah satu daerah di

Indonesia yang diketahui memiliki aksara khas atau yang bisa disebut dengan

aksara Lampung. Aksara ini dikenal juga dengan sebutan aksara “Ka-Ga-Nga”

yang diambil dari tiga huruf pertamanya. Orang-orang suku Lampung biasa

menyebut Aksara Lampung dengan sebutan Had Lampung (Pudjiastuti, 2014).

Menurut Miller tahun 2011, Aksara Lampung termasuk ke dalam varietas

Aksara di daerah Sumatera Selatan yang dikenal dengan nama Surat Ulu atau

tulisan dari hulu. Surat Ulu terdiri dari Aksara Rejang, Aksara Kerinci, dan

Aksara Lampung. Aksara-aksara tersebut telah dikenal pada awal masa

kolonial (Miller, 2010). Orang-orang Ulu menulis aksara di atas kulit kayu,

kulit binatang, kepingan logam, tanduk kerbau, dan batu, yang dibuktikan

dengan adanya Naskah Ulu yang dituliskan pada tanduk kerbau. Naskah

Page 31: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

7

tersebut merupakan warisan keturunan Ompu Pernong yang berasal dari Skala

Beghak (Andhifani, 2013).

Aksara Lampung memiliki kekerabatan dengan aksara yang digunakan di

India Selatan. Selain itu, struktur tulisan Bahasa Arab juga turut

mempengaruhi sistem penulisan pada Aksara Lampung. Tanda bahwa adanya

pengaruh tulisan Arab pada sistem Aksara Lampung adalah penggunaan anak

huruf. Perbedaan anak huruf Aksara Lampung dengan anak Huruf Arab

terdapat pada peletakkan dan bunyi anak hurufnya. Bila anak Huruf Arab

hanya terletak di bagian atas yang bernama fathah dan dhommah, serta di

bagian bawah yang bernama kasrah, maka anak huruf Aksara Lampung

terletak di bagian atas, bawah, dan samping kanan huruf utama dengan

berbagai macam nama dan bunyi. Anak huruf atau bisa disebut dengan benah

surat ini memiliki fungsi dan peran masing-masing yang akan dijelaskan di

subbab berikutnya.

Aksara Lampung juga memiliki kekerabatan dengan Aksara Rejang, Rencong,

Sunda, sehingga Aksara Lampung terlihat mirip dengan aksara khas daerah

tersebut. Sebelum mengalami penyempurnaan, Aksara Lampung memiliki

sembilan belas karakter utama atau disebut dengan induk huruf atau kelabai

surat, anak huruf atau benah surat, dan tanda baca. Namun aksara yang

digunakan sebagai bahan ajar di sekolah dan yang digunakan saat ini telah

mengalami penyempurnaan, sehingga Aksara Lampung memiliki dua puluh

karakter kelabai surat, enam karakter benah surat di bagian atas, tiga karakter

Page 32: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

8

benah surat di bagian bawah, tiga karakter benah surat di bagian kanan, dan

tanda baca.

2.1.1. Induk Huruf (Kelabai Surat)

Induk huruf adalah huruf-huruf utama yang digunakan pada Aksara Lampung,

sama halnya dengan huruf alfabet. Seperti yang dijelaskan pada bagian

sebelumnya, Aksara Lampung sebelum disempurnakan, induk huruf hanya

terdiri dari sembilan belas karakter yang terbagi menjadi tiga elemen, yaitu

elemen karakter utama atau disebut kelabai surat, kemudian anak huruf atau

disebut benah surat, dan tanda baca (Pudjiastuti, 2014). Saat ini aksara yang

digunakan masyarakat suku Lampung menggunakan aksara yang lebih

sederhana yang sudah mengalami penyempurnaan. Perbedaannya ada pada

karakter tambahan baru bernama “Gha” (H). Bentuk induk huruf yang belum

disempurnakan dijelaskan pada ilustrasikan Gambar 2.1.

Gambar 2.1. Induk huruf yang belum disempurnakan (Pudjiastuti, 2014).

Page 33: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

9

Sedangkan bentuk induk huruf yang telah disempurnakan dan saat ini

digunakan oleh masyarakat suku Lampung dijelaskan pada Gambar 2.2 di

bawah ini.

Gambar 2.2. Induk huruf yang sudah disempurnakan (Junaidi, et al., 2011).

Struktur Aksara Lampung memiliki bentuk yang mirip dengan kurva terutama

bentuk kuadrat dan kurva tersebut mendominasi setiap huruf. Hururf-huruf

pada Aksara Lampung condong mengarah ke kanan-atas. Satu suku kata dapat

terbentuk dari satu aksara tanpa perlu menambahkan anak huruf, karena

komponen setiap induk huruf terdiri dari satu huruf konsonan dan satu huruf

vokal. Selain bentuk hurufnya yang unik, Aksara Lampung memiliki pelafalan

huruf yang mengganti bunyi hururf “r” dengan bunyi “gha” atau “kha”.

Bentuk induk huruf diperlihatkan pada Gambar 2.3. di bawah ini.

Gambar 2.3. Contoh induk huruf yang condong mengarah ke kanan-atas.

K g G

Page 34: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

10

Sedangkan contoh huruf Aksara Lampung yang memiliki dua komponen

huruf induk dijelaskan pada Gambar 2.4. di bawah ini.

Gambar 2.4. Contoh bentuk huruf yang terdiri dari dua komponen huruf utama.

2.1.2. Anak Huruf (Benah Surat)

Anak huruf atau yang disebut dengan benah surat merupakan elemen dari

Aksara Lampung yang dapat mengubah bunyi pelafalan huruf induk. Seperti

penjelasan sebelumnya bahwa salah satu elemen Aksara Lampung adalah

anak huruf atau benah surat. Benah surat diletakkan disekitar induk huruf.

Benah surat dibedakan berdasarkan peletakkannya dan bunyinya. Setiap satu

induk huruf, Aksara Lampung memiliki pasangan berupa sebuah huruf

konsonan dengan sebuah huruf vokal a dalam satu kesatuan, sehingga semua

huruf akan diakhiri oleh huruf vokal a.

Benah surat pada Aksara Lampung diperlukan untuk mengubah bunyi huruf

vokal a yang memiliki satu kesatuan dengan huruf dasar menjadi bunyi huruf

vokal lain. Sehingga, pada Aksara Lampung, benah surat berperan penting

sebagai pengganti bunyi vokal dasar menjadi bunyi vokal yang lain. Oleh

karena itu, benah surat mempunyai peran tersendiri untuk membangun sebuah

r H

Page 35: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

11

padanan kata. Benah surat memiliki sebelas bentuk yang dapat dilihat pada

ilustrasi Gambar 2.5. di bawah ini.

Gambar 2.5. Bentuk-bentuk benah surat pada Aksara Lampung.

Aksara Lampung yang berdiri sendiri tanpa benah surat disekitarnya,

menghasilkan bunyi huruf yang tidak mengalami perubahan. Benah surat

dapat dibedakan berdasarkan peletakan huruf, ada benah surat yang terletak

di bagian atas huruf, benah surat yang terletak di bagian bawah huruf, dan

benah surat yang terletak di samping kanan huruf. Ragam benah surat

tersebut dijelaskan pada subbab berikut.

2.1.2.1. Benah Surat Bagian Atas

Anak huruf atau benah surat merupakan sebagian benah surat yang terletak

di bagian atas huruf. Setiap benah surat memiliki nama-namanya tersendiri

dan bunyi tersendiri. Terdapat tiga dari enam benah surat yang memiliki

pelafalan yang sama dengan huruf vokal yang digunakan dalam alfabet yaitu

i, e (lafal huruf e lemah), dan é (lafal huruf e lebar). Bentuk-bentuk benah

surat beserta penjelasannya dapat dilihat pada ilustrasi Gambar 2.6 di halaman

selanjutnya.

Page 36: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

12

Gambar 2.6. Bentuk-bentuk benah surat yang terletak di bagian atas huruf.

a. Ulan é (---e)

Ulan é memiliki bunyi e lebar seperti pada kata “enak” (aenk/) dan “elok”

(aeloK/).

b. Bicek e (---E)

Anak huruf bicek e memiliki keterkaitan dengan anak huruf ulan é namun

memiliki pelafalan yang berbeda. Bicek e memiliki bunyi e yang lemah

seperti pada kata “berat” (BErT/) dan “pesan” (FEsA).

c. Ulan i (---i)

Pelafalan anak huruf ulan i apabila bertemu dengan induk huruf akan

berubah menjadi huruf vokal i. Contoh pada huruf “ka” (q) apabila diberi

anak huruf ulan i akan berubah menjadi “ki” (ki).

d. Tekelubang (--X-), Redatas (--A-), dan Rejunjung (--R-)

Anak huruf tekelubang, redatas, dan rejunjung merupakan anak huruf yang

digunakan pada padanan kata yang berakhiran huruf konsonan seperti -ang,

Page 37: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

13

-an, dan -ar, seperti pada kata “ruang” (ruaX), “bukan” (BukA), dan

“belajar” (BElJR).

2.1.2.2. Benah Surat Bagian Bawah

Benah surat bagian bawah adalah sebagian anak huruf Aksara Lampung yang

bisa diletakkan di bagian bawah huruf induk atau kelabai surat. Bentuk-

bentuk dasar anak huruf bagian bawah dijelaskan pada Gambar 2.7. berikut

ini.

Gambar 2.7. Bentuk-bentuk anak huruf yang terletak di bagian bawah huruf.

a. Bitan u (---U) dan Bitan o (---O)

Anak huruf bitan u dan bitan o memiliki beberapa persamaan, seperti nama

yang sama yaitu “bitan”, bentuk anak huruf yang sama-sama berupa garis

pendek, dan sama-sama terletak di bagian bawah huruf. Perbedaannya

hanya terletak pada bunyi pelafalannya saja. Apabila bitan u mengubah

bunyi huruf vokal a menjadi bunyi huruf vokal u, maka bitan o mengubah

bunyi huruf vokal a menjadi huruf vokal o. Contohnya untuk anak huruf

bitan u terdapat pada kata “lugu” (lugu) dan untuk anak huruf bitan o

terdapat pada kata “polos” (Folos/) dalam Bahasa Indonesia.

Page 38: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

14

b. Tekelungau au (--W-)

Anak huruf tekelungau berbeda dengan kedua anak huruf lainnya, ketika

bitan u dan bitan o mengubah bunyi huruf vokal a menjadi bunyi huruf

vokal lain yaitu u dan o, maka tekelungau mengganti bunyi huruf vokal a

menjadi huruf vokal lain yang terdiri dari dua komponen huruf yaitu au

atau bisa disebut sebagai huruf diftong. Tekelungau digunakan pada sebuah

kata yang memiliki akhiran -au seperti pada contoh kata “ranjau” (rAZW).

2.1.2.3. Benah Surat Bagian Kanan

Anak huruf bagian kanan merupakan sebagian benah surat yang terletak di

bagian sebelah kanan huruf. Benah surat bagian kanan juga memiliki nama-

namanya tersendiri dan bunyi tersendiri. Benah surat yang dapat diletakkan

di samping kanan huruf memiliki tiga bentuk yang dapat dilihat pada ilustrasi

Gambar 2.8. di bawah ini.

Gambar 2.8. Bentuk anak huruf yang dapat diletakkan di samping kanan huruf.

a. Tekelingai ai (---I)

Tekelingai merupakan anak huruf yang mengganti bunyi huruf vokal a

menjadi huruf diftong yang terdiri dari dua komponen huruf vokal yaitu a

dan i. Anak huruf tersebut mengganti huruf vokal a menjadi -ai untuk kata

Page 39: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

15

yang berakhiran huruf -ai. Contoh pada padanan kata “keledai” (qElEDI)

dan “ramai” (rMI).

b. Keleniah ah (---x)

Anak huruf keleniah merupakan salah satu anak huruf yang menggantikan

huruf vokal a menjadi dua komponen huruf yaitu a dan h yang bukan huruf

diftong. Keleniah menggnatikan huruf vokal a menjadi -ah pada padanan

kata yang terdapat huruf -ah. Keleniah memiliki keunikan bentuk yang

mirip dengan induk huruf “ha” (h). Contoh penggunaan keleniah terdapat

pada kata “lemah” (lEmx) dan “susah” (susx).

c. Nengen (/)

Tanda nengen merupakan tanda istimewa yang menyebabkan adanya

perbedaan pendapat. Pendapat pertama dinyatakan oleh Pudjiastuti dalam

Junaidi tahun 2016 bahwa nengen tergolong ke dalam anak huruf,

sedangkan pendapat kedua dinyatakan oleh Sabaruddin Sa dalam Junaidi

tahun 2016 bahwa nengen termasuk ke dalam tanda baca (Junaidi, 2016).

Nengen berfungsi untuk mematikan karakter a (vowel silencer) pada induk

huruf seperti pada kata “redatas” (rEDTS/) dan “padat” (gDT/).

Nengen dapat digunakan pada huruf-huruf tertentu saja seperti pada huruf

“sa” (s), “la” (l), “ka” (k), dan “ta” (t). Nengen tidak dapat digunakan

pada induk huruf “nga” (G), “na” (n), “ra” (r), “ya” (y), “wa” (w), dan

Page 40: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

16

“ha” (h), karena karakter a (vowel silencer) pada huruf-huruf tersebut

dapat dimatikan dengan menggunakan tanda baca yang sudah ada dalam

sistem penulisan Aksara Lampung. Ragam tanda baca akan dijelaskan pada

subbab berikut.

2.1.3. Tanda Baca

Aksara Lampung memiliki tanda baca sama seperti sistem penulisan pada

umumnya. Aksara Lampung memiliki sepuluh tanda baca termasuk tanda

baca khas Lampung bernama “tanda mula” yang digunakan untuk memulai

tulisan pada saat menulis Aksara Lampung. Tanda baca tersebut memiliki

peran yang sama dengan tanda baca pada sistem penulisan pada umumnya.

Ilustrasi pada Gambar 2.9. merupakan bentuk tanda baca yang terdapat pada

sistem Aksara Lampung.

Gambar 2.9. Kumpulan tanda baca yang ada di Aksara Lampung.

2.2. Pengenalan Pola

Pengenalan pola merupakan salah satu cabang dari bidang kecerdasan buatan

(artificial intelegence). Menurut Duda dan Hart, pengenalan pola adalah

penentuan suatu objek fisik atau kejadian ke dalam salah satu atau beberapa

Page 41: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

17

sampel (Duda, et al., 2000). Pengenalan pola mengelompokkan data

berdasarkan pola kelompoknya, yang tujuannya adalah proses belajar deteksi

pola-pola eksplisit dan mengklasifikasikan objek ke dalam sejumlah kategori.

Rancangan sistem pengenalan pola pada dasarnya melibatkan tiga aspek yaitu

akuisisi data dan preprocessing, representasi data, dan pengambilan

keputusan. Pengenalan pola akan belajar dari satu set contoh atau disebut

dengan training dengan menggunakan empat pendekatan yaitu pencocokan

template, klasifikasi statistik, dan jaringan saraf. Namun, model-model

pendekatan tersebut tidak selalu independent karena terdapat metode

pengenalan pola yang sama tetapi menggunakan interpretasi yang berbeda

(Anil K, et al., 2000).

Banyak peneliti yang menjadikan pengenalan pola sebagai topik utama

penelitian mereka, karena pengenalan pola dapat digunakan untuk

menyelesaikan beberapa persoalan yang dihadapi oleh manusia. Contoh yang

sering ditemukan dalam kehidupan sehari-hari misalnya pengenalan pola sidik

jari yang sekarang digunakan sebagai absensi automatis di kantor-kantor,

kemudian pengenalan pola nomor polisi sebagai alat yang membantu polisi

dalam pengwasan lalu lintas.

2.2.1. Tujuan dan Implementasi Pengenalan Pola

Pengenalan pola bertujuan untuk menentukan kelompok atau sampel pola

berdasarkan ciri-ciri yang dimiliki oleh pola tersebut. Dengan kata lain,

pengenalan pola membedakan suatu objek dengan objek lain. Selain itu,

Page 42: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

18

pengenalan pola bertujuan untuk mengklarifikasikan beberapa mekanisme

yang sulit saat pembuatan keputusan dan mengautomasikan fungsi-fungsi

tersebut menggunakan komputer.

Oleh sebab itu, pengenalan pola dapat diimplementasikan menjadi beberapa

konsentrasi untuk menyelesaikan masalah yang lebih kompleks lagi

(Fukunaga, 1990). Beberapa konsentrasi tersebut adalah OCR (Optical

Character Recognition), pengenalan pola pada sistem biometrik, diagnosa

penyakit di bidang medis, pengenalan suara, identifikasi sidik jari, dan

aplikasi pada bidang militer.

2.3. Identifikasi Penulis

Identifikasi penulis merupakan pengenalan penulis berbasis tulisan tangan

dengan memproses mencocokan tulisan tangan yang tidak diketahui terhadap

data sampel yang penulisnya telah diketahui sebelumnya (Louloudis, et al.,

2011). Menurut Al-Maadeed, dua konsep dasar yang dianggap penting pada

identifikasi penulis adalah tidak ada dua orang yang menulis dengan sama

persis dan tidak ada seorangpun yang menulis dengan gaya tulisan yang sama

sebanyak dua kali (Al-Madeed, 2012). Tujuan dari identifikasi Penulis adalah

untuk menentukan penulis teks tulisan tangan di antara sejumlah penulis yang

dikenal dengan syarat database fitur khusus setiap penulis harus dibangun

sebelumnya. Teksnisnya ketika dilakukan proses identifikasi akan dihitung

dan dibandingkan dengan database yang telah disimpan. Hasil identifikasi

penulis yang cocok akan memiliki tingkat kesamaan yang tinggi. Terdapat dua

Page 43: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

19

pendekatan yang dapat dilakukan untuk mengidentifikasi penulis, yaitu

dengan analisis berdasarkan karakter dan pendekatan kedua dengan analisis

tekstur dari dokumen (Fiel & Sablatnig, 2012). Pada penelitian ini pendekatan

yang dilakukan adalah dengan menggunakan karakter yang akan dibahas

secara lengkap pada bab selanjutnya.

Pengenalan penulis dengan menggunakan sampel teks yang belum diketahui

penulisnya berkaitan dengan identifikasi penulis dan verifikasi penulis.

Identifikasi penulis secara umum dibedakan menjadi dua bagian, yaitu

identifikasi penulis dan verifikasi penulis. Identifikasi penulis berkaitan

dengan pencarian secara “one-to-many” (Siddiqi & Vincent, 2009). Pencarian

“one-to-many” adalah pencarian pada sebuah dokumen yang tidak diketahui

penulisnya, dengan tujuan untuk menentukan penulisnya berdasarkan

referensi dokumen-dokumen yang telah diketahui penulisnya. Sedangkan

verifikasi penulis adalah membandingkan dokumen secara “one-to-one”

dengan dua sampel tulisan tangan yang akan diketahui bahwa penulis tersebut

ditulis oleh orang yang sama atau bukan.

Menurut Schlapbach (2007) yang dikutip oleh Awaida et. al tahun 2012,

identifikasi penulis merupakan proses menentukan beberapa kandidat penulis

pada set dokumen melalui beberapa contoh karakteristik tulisan tangan.

Sedangkan menurut pernyataan Bradford (1992) dalam Awaida et. al tahun

2012 menjelaskan bahwa verifikasi penulis adalah proses membandingkan

tulisan tangan yang tidak diketahui penulisnya dengan beberapa sampel

Page 44: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

20

tulisan tangan yang diperoleh dari sumber yang diketahui. Verifikasi penulis

mencakup diterima atau tidaknya keputusan tersebut terhadap kriteria,

sedangkan identifikasi penulis adalah mencakup hal menklasifikasi “one-to-

many” yaitu mencari penulisnya siapa berdasarkan tulisan tangan tersebut

(Awaida & Mahmoud, 2012).

2.4. Preprocessing

Preprocessing adalah serangkaian proses yang dilakukan setelah akuisisi data

untuk mencapai tingkat kualitas gambar tertentu. Citra mentah dari dokumen

tulisan tangan dalam langkah ini diubah menjadi citra perantara, bisa berupa

citra grayscale maupun citra biner. Dari citra perantara tersebut akan

didapatkan fitur-fitur yang akan diekstraksi di langkah selanjutnya. Citra

perantara tersebut dapat meminimalkan variasi fitur yang tidak penting,

sehingga fitur-fitur yang berpengaruh dapat dipertahankan sehingga dapat

meningkatkan akurasi pengenalan (Junaidi, 2016).

Seperti yang sudah dijelaskan di paragraf sebelumnya, salah satu tujuan dari

melakukan preprocessing adalah untuk mereduksi kuantitas fitur yang tidak

penting sehingga proses ekstraksi fitur dapat berjalan secara efisien. Namun

tujuan lain melakukan tahap preprocessing adalah sebagai berikut:

1. Untuk mengurangi noise atau titik-titik yang bukan bagian citra utama.

2. Untuk menurunkan kompleksitas representasi citra menjadi channel

tunggal dengan melakukan binerisasi.

Page 45: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

21

3. Untuk menormalisasi citra aktual sesuai dengan keperluan proses

selanjutnya.

2.4.1. Reduksi Noise

Menurut Umbaugh (1999) dalam Jamil et. al tahun 2008 menjelaskan

mengenai pengertian noise dalam bidang olah citra adalah informasi gangguan

yang tidak diinginkan dan dapat mencemari gambar. Pada proses akuisisi citra

digital, adanya perubahan gambar optik menjadi sinyal listrik merupakan

sumber utama noise. Faktor yang mempengaruhi adanya noise yaitu

menyimpangnya data digital yang diterima oleh kamera, ukuran megapixel

dan resolusi yang rendah (Jamil, et al., 2008) Kualitas dari citra yang

diakuisisi akan berdampak pada baik atau tidaknya hasil dari akurasi pada saat

melakukan pengenalan objek. Variabel noise yang merupakan salah satu

variabel yang tidak diinginkan, sehingga perlu dikurangi atau dihilangkan

agar tidak menghambat proses ekstraksi fitur dan mengurangi kualitas citra.

Keadaan dokumen seperti tinta yang sudah pudar dan umur dokumen yang

sudah tua juga merupakan faktor pendukung adanya noise pada citra. Contoh

gambar sebelum noise dibersihkan dan gambar setelah noise dibersihkan

diilustrasikan pada Gambar 2.10. di halaman selanjutnya.

Page 46: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

22

Gambar 2.10. Gambar sebelum noise dihilangkan (kiri) dan gambar sesudah

noise dihilangkan (kanan) (Garnett, et al., 2005).

2.4.2. Binerisasi Gambar

Binerisasi gambar dilakukan untuk mengkonversi gambar mentah menjadi

gambar hitam dan putih. Binerisasi gambar juga dilakukan pada bagian

background. Tujuan dari binerisasi adalah untuk menajamkan objek sebagai

latar depan dari background-nya. Binerisasi gambar dapat dibedakan menjadi

dua, yaitu global dan local binarization. Binersiasi dengan global binarization

menggunakan single threshold yang bisa dihitung secara heuristik dan secara

statistik terhadap keseluruhan gambar. Sedangkan local binarization

menggunakan pixel terdekat untuk menghitung threshold dan diaplikasikan

hanya ke pixel yang dihitung. Contoh dari binerisasi gambar terdapat pada

ilustrasi Gambar 2.11.

Gambar 2.11. Contoh perangko Jerman yang dikonversi ke dalam format

biner, (Junaidi, 2016).

Page 47: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

23

2.4.3. Normalisasi Gambar

Normalisasi data pada tulisan tangan perlu dilakukan karena adanya

keberagaman pada bentuk tulisan, sehingga perlu dilakukan standarisasi

tulisan dengan melakukan transformasi agar tulisan tangan tersebut menjadi

seragam. Terdapat tipe-tipe normalisasi, seperti normalisasi terhadap

kemiringan tulisan, kemiringan arah penulisan, dan normalisasi ukuran tulisan.

Normalisasi kemiringan atau kemencongan tulisan dilakukan apabila tulisan

tangan tersebut terlalu miring. Contoh normalisasi kemiringan pada bentuk

tulisan tangan, terdapat pada ilustrasi Gambar 2.12 di bawah ini.

Gambar 2.12. Contoh proses normalisasi kemiringan pada bentuk tulisan

(proses slant) (Virajitha, et al., 2012).

Sedangkan contoh proses normalisasi pada arah tulisan terdapat pada ilustrasi

Gambar 2.13 di bawah ini.

Gambar 2.13. Contoh proses normalisasi kemiringan pada arah tulisan (proses

skew) (Virajitha, et al., 2012).

Page 48: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

24

2.5. Ekstraksi Fitur

Ekstraksi fitur merupakan proses pengambilan nilai ciri data yang paling

penting dari satu entitas data. Tahapan ekstraksi fitur yaitu dengan

megekplorasi bagian penting yang menentukan bentuk objek secara tepat dan

unik. Ekstraksi fitur bertujuan untuk mengekstraksi informasi yang relevan

menjadi ciri setiap kelas. Pada tahapan ekstraksi fitur, setiap objek diwakili

oleh fitur yang relevan untuk dijadikan sebagai identitasnya (Kumar & Kumar

Bhatia, 2014).

Ekstraksi fitur juga merupakan salah satu tahapan pada metodologi

identifikasi penulis dengan mengambil nilai ciri dari sebuah objek. Pada

umumnya, ekstraksi fitur memiliki masalah yang kompleks tergantung pada

domain masalah utamanya. Bagian ekstraksi fitur membutuhkan banyak

pengetahuan tentang domain masalah tersebut dikarenakan ekstraksi fitur

dapat dilakukan berulang kali untuk mendapatkan nilai ciri tersebut. Sebagai

contoh, sebuah ekstraksi fitur yang sangat bagus untuk identifikasi jenis ikan,

pasti tidak akan cocok untuk mengidentifikasi sidik jari (Duda, et al., 2000).

Tujuan melakukan tahapan ekstraksi fitur adalah untuk mendapatkan nilai-

nilai ciri karakteristik dari objek untuk dapat dikenali pada saat proses

pengenalan pola. Selain itu untuk mengukur atribut pola yang bersangkutan

pada objek. Ada banyak jenis ekstraksi fitur untuk mendapatkan nila-nilai ciri

sebuah objek, seperti ekstraksi fitur berdasarkan feature direction,

transformasi Hough, transformasi Fourier, representasi Line-Based,

Page 49: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

25

transformasi linear, aproksimasi bentuk, dan sebagainya (Cheriet, et al., 2007).

Pada penelitian ini digunakan salah satu metode ekstraksi fitur berdasarkan

transformasi linear, yaitu PCA (Pincipal Component Analysis).

2.5.1. Principal Component Analysis (PCA)

Principal Component Analysis (PCA) adalah teknik yang termasuk dalam

sampel metode analisis faktor yang dapat ditemukan dalam berbagai kajian

seperti neural networks, pemrosesan gambar dan sinyal, serta machine

learning (Jain & Ko, 2008). PCA juga dikenal dengan nama Karhunen-Loeve

Transformation (KLT) dan Eigenscape Projection yang merupakan ekstraksi

fitur klasik dan teknik representasi data yang banyak digunakan dalam bidang

pengenalan pola dan computer vision. PCA digunakan untuk mengurangi

vektor dimensi dalam mengenali gambar. PCA merupakan teknik umum

untuk mengenali pola dengan data dimensi yang tinggi (Karamizadeh, et al.,

2013).

Transformasi linear pada PCA biasanya digunakan untuk mengurangi dimensi

fitur, dan juga dapat meningkatkan akurasi pada klasifikasi. Dimensi fitur

yang dikurangi merupakan penyederhanaan “seperangkat fitur” yang akan

dilakukan identifikasi menjadi “subset fitur” yang ukurannya lebih kecil dari

fitur aslinya. “Seperangkat fitur” yang telah ditransformasikan menjadi

“subset fitur” pada dasarnya memiliki informasi yang sama seperti

“seperangkat fitur” aslinya (Cheriet, et al., 2007). Penyederhanaan

Page 50: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

26

“seperangkat fitur” dimensi dalam metode PCA disebut sebagai metode

reduksi dimensi.

Reduksi dimensi digunakan untuk mengompres kumpulan informasi yang

“sama” dan merekognisi objek melalui informasi utamanya. Hasil reduksi

dimensi tersebut merupakan “subset fitur” yang didapatkan dari perolehan

vektoreigen, berdasarkan perhitungan matriks kovarian (Kaur, et al., 2015).

Secara teori sebuah objek train memiliki matriks (matriks A) dengan dimensi

𝑀 𝑏𝑎𝑟𝑖𝑠 × 𝑁 𝑘𝑜𝑙𝑜𝑚 yang direpresentasikan ke dalam bentuk matriks vektor

kolom (𝑀 × 𝑁) × 1. Objek pada trainingset berjumlah P gambar, sehingga

objek-objek pada trainingset harus direpresentasikan dalam bentuk matriks

vektor kolom berukuran (𝑀 × 𝑁) × 𝑃 . Hal tersebut juga dilakukan pada

testingset. Matriks X yang berisi matriks-matriks vektor kolom tersebut

memiliki peran untuk menghitung besaran vektoreigen. Proses mengubah

sebuah matriks dari gambar train akan dijelaskan pada ilustrasi Gambar 2.14

di bawah ini.

Gambar 2.14. Ilustrasi perubahan matrik (𝑀 × 𝑁) menjadi vektor kolom

(𝑀 × 𝑁) × 1 (Paul & Al Sumam, 2012).

Page 51: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

27

2.5.1.1. Algoritma Principal Component Analysis (PCA)

Menurut Paul dan Suman pada (2012), algoritma yang digunakan pada metode

ekstraksi fitur menggunakan PCA memiliki tujuan untuk mencari nilai eigen.

Tahapan mencari nilai eigen dijelaskan pada uraian algoritma berikut ini (Paul

& Al Sumam, 2012):

a. Langkah 1: Menyiapkan objek gambar yang akan digunakan

Objek gambar yang akan digunakan adalah gambar I1, I2, I3, I4, …………, IM.

objek gambar yang digunakan harus memiliki ukuran yang sama.

b. Langkah 2: Menyiapkan dataset

Setiap objek-objek gambar Ii, di transformasikan ke dalam bentuk vektor dan

dijadikan sebagai data training set S.

𝑆 = {Γ1, Γ2, Γ3, Γ4, ……… , Γ𝑀}

Misalnya, sebuah gambar (M) memiliki ukuran (N2) sebesar 1024 piksel,

maka setiap gambar ditransformasikan bentuknya menjadi vektor berukuran

𝑁2 × 1 dan disesuaikan ke dalam data training set. Untuk alasan

kesederhanaan, objek-objek gambar diasumsikan berukuran 𝑁 × 𝑁 dan akan

menghasilkan titik pada ruang dimensi N2. Gabungan objek gambar tersebut

setelah disatukan kemudian akan dipetakan pada kumpulan titik-titik N2 di

ruang yang besar.

c. Langkah 3: Menghitung rata-rata vektor dataset

Rata-rata vektor dataset (Ψ) dapat dihitung dengan menggunakan formula (2.1)

di halaman selanjutnya:

Page 52: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

28

Ψ = 1

𝑀∑Γ𝑛

𝑀

𝑛=1

(2.1)

Catatan:

Ψ ∶ rata-rata vektor dataset 𝑀 ∶ jumlah dataset

𝑛 ∶ indeks data N dari 1 s.d. n Γ𝑛 ∶ gambar train ke n

d. Langkah 4: Mensubstraksi dengan rata-rata vektor dataset

Rata-rata vektor dataset disubstraksi dari gambar aslinya ( Γ𝑖 ) dan akan

disimpan di dalam variabel Φ𝑖, dengan menggunakan formula (2.2) di bawah

ini:

Φ𝑖 = Γ𝑖 − Ψ (2.2)

Catatan:

Φ𝑖 ∶ substraksi mean vektor dataset ke-i

Γ𝑖 ∶ vektor gambar ke-I

Ψ ∶ mean vektor dataset

e. Langkah 5: Menghitung matriks kovarians

Cara untuk mendapatkan matriks kovarians C dengan menggunakan formula

di bawah ini:

𝐶 =1

𝑀∑Φ𝑛

𝑀

𝑛=1

Φ𝑛𝑇 (2.3)

Catatan:

𝐶 ∶ substraksi rata-rata vektor dataset

𝑀 ∶ jumlah dataset

Φ𝑛 ∶ substraksi rata-rata vektor dataset ke-n

Φ𝑛𝑇 ∶ substraksi rata-rata vektor dataset ke-n ditranspose

Page 53: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

29

Formula (2.2) dapat disederhanakan menjadi 𝐶 = 𝐴 × 𝐴𝑇 dimana 𝐴 =

[Φ1, Φ2, Φ3, Φ4, ……… ,Φ𝑀].

Untuk memudahkan proses komputasi dalam mencari nilai eigen agar lebih

efisien rumus 𝐶 = 𝐴 × 𝐴𝑇dapat diubah menjadi 𝐶 = 𝐴𝑇 × 𝐴. Karena apabila

gambar berukuran 256 × 256 menggunakan rumus matriks kovarians 𝐶 =

𝐴 × 𝐴𝑇 , maka akan membutuhkan perhitungan yang besar. Serta, saat

menghitung nilai eigen akan ada 65,356 eigen yang dihasilkan. Sehingga

untuk meminimalisir nilai eigen yang dihasilkan dari bantuan matriks

kovarians, digunakan rumus 𝐶 = 𝐴𝑇 × 𝐴 dimana 𝐴 =

[Φ1, Φ2, Φ3, Φ4, ……… ,Φ𝑀].

f. Langkah 6: Menghitung vektoreigen dan eigenvalues menggunakan matriks

kovarians.

Vektoreigen dan eigenvalue dihitung dengan bantuan nilai kovarians C, yaitu

dengan menggunakan formula (2.4) di bawah ini:

𝑢𝑖 = 𝐴 × 𝐶 (2.4)

Catatan:

u𝑖 ∶ vektoreigen

𝐴 ∶ [Φ1, Φ2, Φ3, Φ4, ……… ,Φ𝑀] 𝐶 ∶ matriks kovarians

g. Langkah 7: Eliminasi elemen matriks vektoreigen

Hasil vektoreigen yang telah dihitung dari rumus

𝑢𝑖 = 𝐴 × 𝐶 dieliminasi elemen matriksnya, agar fitur yang digunakan hanya

fitur-fitur tertentu yang dapat merepresentasikan objek.

Page 54: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

30

h. Langkah 8: Menghitung proyeksi dataset menjadi eigenspace

Gambar-gambar train yang telah melewati proses hitung rata-rata hingga

proses hitung nilai vektoreigen, tahapan selanjutnya adalah menghitung

proyeksi dataset menjadi eigenspace dengan menggunakan formula di bawah

ini.

𝜔𝑖 = 𝑢𝑖𝑇 × (Γ𝑖 − Ψ) (2.5)

Catatan:

𝜔𝑖 ∶ proyeksi gambar

𝑢𝑖𝑇 ∶ vektoreigen ditranspose

Γ𝑖 ∶ vektor gambar ke-i

Ψ ∶ rata-rata vektor dataset

2.6. Euclidean Distance

Teknik pengenalan pola bertujuan untuk mengklasifikasikan berdasarkan

pengukuran kuantitatif fitur atau ciri khusus dari suatu objek. Metode yang

digunakan pada pengenalan pola terdiri dari metode supervised, metode

unsupervised, metode jarak, dan lain-lain. Metode jarak digunakan untuk

menentukan derajat kesamaan atau ketidaksamaan pada dua fitur vektor

(Wurdianarto, et al., 2014). Terdapat berbagai macam jenis metode jarak yaitu

City Block Distance, Manhattan Distance, Euclidean Distance, Minkowski

Distance, dan lain-lain. Metode jarak yang penelitian ini gunakan adalah

Euclidean distance. Euclidean distance digunakan karena metode jarak

tersebut yang paling sederhana sehingga dapat meminimalisir proses

komputasi.

Page 55: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

31

Euclidean distance adalah pengukuran yang digunakan untuk menghitung

kemiripan dua vektor, yang mempresentasikan dua objek dengan menghitung

jarak antara keduanya. Euclidean distance dapat dihitung dengan

menggunakan persamaan (2.6) di bawah ini.

𝑒𝑢𝑐 = √∑(Γ𝑖𝑛 − Γ𝑗𝑛)2

𝑀

𝑛=1

(2.6)

Catatan:

𝑒𝑢𝑐 ∶ jarak Euclidean

𝑀 ∶ jumlah data dalam bentuk vektor

Γ𝑖𝑛 ∶ vektor gambar trainingset

Γ𝑗𝑛 ∶ vektor gambar testingset

Seperti penjelasan sebelumnya, Euclidean distance termasuk ke dalam bagian

klasifikasi, karena Euclidean distance dapat menentukan kemiripan objek dan

mengelompokkannya berdasarkan jarak antar objek tetangganya. Semakin

kecil jarak yang dihasilkan oleh perhitungan Euclidean distance, maka akan

semakin mirip kedua objek tersebut. Pada penelitian ini, Euclidean deistance

menetukan derajat kemiripan penulis berdasarkan jarak antara data trainingset

dengan data testingset. Penerapan Euclidean distance pada penelitian ini

adalah dengan menggunakan proyeksi gambar trainingset dan proyeksi

gambar testingset.

Page 56: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

32

III. METODOLOGI PENELITIAN

Tahapan penelitian akan dilakukan di Jurusan Ilmu Komputer Universitas Lampung

pada Semester Ganjil Tahun Ajaran 2018/2019. Urutan tahapan tersebut dimulai dari

preprocessing hingga post processing. Selain tahapan umum tersebut, pada bab ini juga

diuraikan tentang tahapan awal sebelum memasuki tahapan baku, yaitu pra-penelitian

dan persiapan dataset. Penjelasan secara lengkap disajikan pada subbab-subbab berikut

ini.

3.1. Pra Penelitian

Pra-penelitian merupakan tahapan awal sebelum penelitian dilakukan, dengan

mempersiapkan beberapa hal yang dibutuhkan sebagai alat pendukung proses

penelitian. Persiapan tersebut terdiri dari studi literatur dan persiapan dataset

yang dijelaskan pada subbab selanjutnya.

3.1.1. Studi Literatur

Studi literatur bertujuan untuk meningkatkan pemahaman mengenai teori-

teori yang relevan, agar dapat memberikan gagasan yang kuat untuk

menyusun kerangka konsep metodologi penelitian yang didasari oleh kajian

literatur. Pada penelitian ini studi literatur membantu mengembangkan konsep

metodologi tersebut yang sesuai dengan latar belakang masalah.

Page 57: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

33

3.1.2. Dataset

Penelitian ini menggunakan dataset yang sudah melalui proses pengolahan

awal. Dataset tersebut merupakan Lampung Dataset (Junaidi, et al., 2011)

yang tersedia secara bebas pada situs Technische Universität Dortmund untuk

penelitian pada bidang pengenalan pola. Sumber dataset telah tersedia dalam

bentuk file image dan annotasi yang dapat di unduh pada situs

http://patrec.cs.tu-dortmund.de/cms/en/home/Resources/index.html. Dataset

tersebut berisi sebanyak 82 dokumen gambar tulisan tangan Aksara Lampung

yang sudah mengalami preprocessing (Junaidi, et al., 2011).

3.2. Preprocessing

Preprocessing merupakan salah satu bagian dari tahapan baku yang mengolah

citra gambar untuk mencapai tingkat kualitas tertentu. Hasil citra gambar yang

sudah diolah akan dijadikan sebagai citra perantara sebelum dilakukan proses

ekstraksi ciri sebagai parameter identifikasi. Sub-sub tahapan pada

preprocessing ini meliputi noise reduction, binerisasi gambar, dan normalisasi

data. Penelitian ini tidak melakukan tahapan preprocessing, dikarenakan

dataset telah menyediakan gambar yang telah dinormalisasi menjadi ukuran

32×32 piksel pada penelitian sebelumnya, (Junaidi, et al., 2011).

Page 58: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

34

3.3. Identifikasi Penulis

Proses dalam mengidentifikasi tulisan Aksara Lampung terdiri dari beberapa

tahap. Tahapan tersebut dimulai dari pemilihan karakter secara khusus hingga

pengukuran kinerja akurasi. Tahapan secara lengkap diilustrasikan pada

Gambar 3.15.

Gambar 3.15. Metode penelitian identifikasi penulis pada dokumen tulisan

tangan Aksara Lampung.

Page 59: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

35

3.3.1. Pembagian Karakter

Informasi jumlah karakter pada setiap dokumen Aksara Lampung telah

diketahui dan proses pemilihan dapat dilakukan secara langsung. Dataset

dibagi menjadi dua bagian, pertama adalah dataset yang dijadikan sebagai

trainingset dan bagian kedua adalah dataset yang akan digunakan untuk

identifikasi penulis. Kemudian secara random karakter dipilih dari masing-

masing dokumen yang ada di folder trainingset dan folder dataset uji.

Pemilihan karakter dilakukan sebagai salah satu cara untuk mendapatkan hasil

identifikasi yang optimal.

3.3.2. Ekstraksi Fitur Menggunakan PCA

Ekstraksi fitur merupakan suatu pengambilan nilai ciri dari sebuah objek.

Nilai yang didapatkan akan dianalisis pada tahapan selanjutnya (Duda, et al.,

2000). Nilai-nilai yang dianalisis pada tahapan selanjutnya akan menjadi

pembeda antara satu objek dengan objek yang lain. Karakter-karakter yang

sudah terpilih sebelumnya diekstraksi, dicari nilai pembedanya serta dianalisis

nilai yang sudah didapatkan dengan menggunakan Principal Component

Analysis (PCA).

Metode ekstraksi fitur menggunakan PCA adalah metode ekstraksi fitur

berdasarkan perhitungan nilai eigen dari trainingset. Terdapat beberapa

tahapan di dalam metode ekstraksi fitur menggunakan PCA sebelum

penelitian sampai pada tahap identifikasi penulis sesuai dengan algoritma

Page 60: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

36

yang telah dijelaskan pada bab tinjauan pustaka. Tahapan-tahapan ekstraksi

fitur PCA diilustrasikan pada Gambar 3.16 di bawah ini.

Gambar 3.16. Tahapan fitur ekstraksi PCA (Paul & Al Sumam, 2012).

3.3.3. Training Identifikasi Penulis

Training identifikasi penulis dilakukan setelah tahapan ekstraksi fitur.

Training identifikasi penulis dilakukan pada saat perhitungan nilai proyeksi

gambar train terpusat berlangsung. Setiap vektoreigen yang diproyeksikan

dari setiap aksara akan menjadi fitur vektor. Fitur vektor tersebut juga

memiliki dimensi yang sudah direduksi. Kumpulan-kumpulan nilai fitur

vektor tersebut yang akan digunakan sebagai referensi untuk menentukan

kemiripan yang akan dilakukan pada tahap identifikasi penulis. Tahapan

training identifikasi penulis diilustrasikan pada Gambar 3.17.

Page 61: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

37

Gambar 3.17. Tahapan training identifikasi penulis (Paul & Al Sumam, 2012).

3.3.4. Identifikasi Penulis

Langkah identifikasi penulis dilakukan ketika serangkaian tahapan training.

Tahapan identifikasi penulis bertujuan untuk menentukan apakah dapat

mengenali penulisnya setelah dilakukan serangkaian proses ekstraksi fitur

pada tahap sebelumnya. Proses identifikasi penulis merupakan tahapan yang

terpisah dengan melanjutkan proses training, namun secara teknis hampir

sama dengan proyeksi gambar train. Proses identifikasi penulis menggunakan

dokumen yang dipilih secara acak tanpa diketahui penulisnya. Nilai masing-

masing proyeksi gambar train dan gambar test akan dibandingkan dengan

meminimalkan nilai Euclidean distance. Tahapan identifikasi penulis

digambarkan pada Gambar 3.18 di bawah ini.

Gambar 3.18. Tahapan identifikasi penulis (Paul & Al Sumam, 2012).

Page 62: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

38

3.3.5. Pengukuran Hasil Identifikasi

Setelah training dan identifikasi penulis dilakukan, maka akan didapatkan

hasil keakuratan identifikasi penulisnya. Hasil kinerja identifikasi penulis

menggunakan Principal Component Analysis (PCA) dapat dinyatakan dengan

membagi jumlah data prediksi yang cocok dengan jumlah data input prediksi

dan dikalikan dengan 100%, atau dalam matematika dinyatakan dengan rumus

yang tertera dibawah ini.

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 𝐾𝑒𝑐𝑜𝑐𝑜𝑘𝑎𝑛(%) = (

Σ𝐷𝑎𝑡𝑎 𝐶𝑜𝑐𝑜𝑘

ΣData Input Pencocokan) × 100% (3.1)

3.4. Analisis Singkat Kesalahan Identifikasi Penulis

Tahapan analisis singkat yang dapat dilakukan yaitu dengan mengamati faktor

yang paling memungkinkan yang menjadi penyebab tahapan identifikasi

penulis gagal mengidentifikasi penulis berdasarkan karkater yang terpilih.

Page 63: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

66

V. SIMPULAN DAN SARAN

5.1. Simpulan

Kesimpulan yang dapat diambil berdasarkan penelitian yang telah dilakukan

adalah sebagai berikut:

1. Metode ekstraksi fitur Principal Component Analysis (PCA) telah berhasil

diaplikasikan untuk proses identifikasi penulis dokumen aksara Lampung.

2. Akurasi tertinggi didapatkan pada testingset dengan sampel gambar

tunggal, tingkat akurasi tersebut sebesar 82,92% lebih tinggi dibandingkan

akurasi testingset dengan sampel lima gambar dengan tingkat akurasi

sebesar 28,29%.

5.2. Saran

Saran yang dapat diberikan untuk penelitian selanjutnya adalah sebagai berikut:

1. Mengimplementasikan metode ekstraksi fitur Principal Component

Analysis (PCA) pada identifikasi penulis berdasarkan baris maupun

berdasarkan dokumen.

2. Menggunakan metode ekstraksi fitur Principal Component Analysis (PCA)

dengan mereduksi dimensi fitur-fiturnya.

Page 64: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

67

3. Mengembangkan proses identifikasi penulis pada dokumen tulisan aksara

Lampung dengan menggunakan metode klasifikasi lain seperti Support

Vektor Machine (SVM), Naïve Bayes, atau Decision Tree.

Page 65: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

68

DAFTAR PUSTAKA

Al-Madeed, S., 2012. Text-Dependent Writer Identificaion for Arabic Handwriting.

Journal of Electrical and Computer Engineering, Volume 2012, pp. 1-8.

Andhifani, W. R., 2013. Naskah Ulu Tanduk Kerbau: Sebuah Kajian Filologi. Forum

Arkeologi, 26(2), pp. 145-152.

Anil K, J., Duin, R. P. & Mao, J., 2000. Statistical Pattern Recognition: A Review.

IEEE Transactions on Pattern Anaysis and Machine Intelligence, 22(1), pp. 4-

37.

Awaida, S. M. & Mahmoud, S. A., 2012. State of The Art in off-line Writer

Identification of Handwritten Text and Survey of Writer Identification of Arabic

Text. Academic Journals: Educational Research and Revies, Volume 7, pp. 445-

463.

Bulacu, M. & Lambert, S., 2005. A Comparison of Clustering Methods for Writer

Identification and Verification. Seoul, IEEE Computer Society.

Chandra Paul, L. & Al Sumam, A., 2012. Face Recognition Using Principal

Component Analysis Method. International Journal of Advanced Research in

Computer Engineering & Technology (IJARCET), 1(9), pp. 135-139.

Cheriet, M., Kharma, N., Liu, C.-L. & Suen, C. Y., 2007. Character Recognition

Systems A Guide for Students and Practitioners. New Jersey: John

Willey&Sons .Inc.

Duda, R. O., Hart, P. E. & Stork, D. G., 2000. Pattern Classification. New York: Wiley.

Fiel, S. & Sablatnig, R., 2012. Writer Retrieval and Writer Identification using Local

Features. USA, IEEE.

Fukunaga, K., 1990. Introduction to Statistical Pattern Recognition 2nd Edition.

s.l.:Academic Press.

Page 66: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

69

Garnett, R., Huegerich, T., Chui, C. & He, W., 2005. A Universal Noise Removal

Algorithm with an Impulse Detetctor. IEEE Transactions on Image Processing,

14(11), pp. 1747-1754.

Jain, G. & Ko, J., 2008. Handwritten Digits Recognition Project Report, Toronto: -.

Jamil, N., Sembok, T. M. T. & Abu Bakar, Z., 2008. Noise Removal and Enhancement

of Binary Images Using Morphological Operations. Kuala Lumpur, IEEE.

Junaidi, A., 2016. Lampung Handwritten Character Recognition, Dortmund.

Junaidi, A., Vadja, S. & A. Fink, G., 2011. Lampung - A New Handwritten Character

Benchmark: Database, Labeling and Recognition. Beijing.

Karamizadeh, S., Abdullah, S. M., Manaf, A. A. & Zamani, M., 2013. An Overview of

Principal Component Analysis. Journal of Signal and Information Processing,

4(3), pp. 173-175.

Kaur, A., Singh, S. & Taqdir, 2015. Face Recognition Using PCA (Principal

Component Analysis) and LDA (Linear Discriminant Analysis) Techniques.

International Journal of Advanced Research in Computer and Communication

Engineering, 4(3), pp. 308-310.

Kumar, G. & Kumar Bhatia, P., 2014. A Detailed Review of Feature Extraction in

Image Processing Systems. India, IEEE.

Louloudis, G., Stamatopoulus, N. & Gatos, B., 2011. ICDAR 2011 Writer

Identification Contest. Beijing, IEEE.

Miller, C., 2010. A Gujarati Origin for Scripts of Sumatra, Sulawesi and the

Philippines. California, Berkeley Linguistic Society.

Paul, L. C. & Al Sumam, A., 2012. Face Recognition Using Principal Component

Analysis Method. International Journal of Advanced Research in Computer

Engineering & Technology (IJARCET), I(9), pp. 135-139.

Pudjiastuti, T., 2014. Lampong Scripts: The Writing Tradition That Almost

Disappeared. Tokyo, Research Intitute for Languages and Cultures of Asia and

Africa.

Siddiqi, I. & Vincent, N., 2009. A Set of Chain Code Based Features for Writer

Recognition. Spain, IEEE.

Virajitha, Boggavarapu, L. P., Vaddi, R. & Vankayalapati, H., 2012. Simple and

Effective Techniques for Skew Correction, Slant Correction and Core-Region

Detection for Cursive. Berlin, Springer.

Page 67: IDENTIFIKASI PENULIS PADA DOKUMEN …digilib.unila.ac.id/55743/3/SKRIPSI TANPA BAB PEMBAHASAN.pdfKarena dari tulisan tangan, setiap manusia dapat menyimpan dan mentrasmisikan sebuah

70

Wurdianarto, S. R., Novianto, S. & Rosyidah, U., 2014. Perbandingan Euclidean

Distance dengan Canbera Distance pada Face Recognition. Jurnal

Techno.COM, 13(1), pp. 31-37.

Zuo, L., Wang, Y. & Tan, T., 2002. Personal Handwriting Identification Based on

PCA. Beijing, SPIE.


Recommended