Typo Checking Menggunakan Algoritma Rabin-Karp

Irma Surya Kumala Idris, Yasin Aril Mustofa

Abstract


Kesalahan pengetikan merupakan hal yang biasa terjadi ketika membuat tulisan, misalnya  ketika membuat karya ilmiah, buku maupun lainnya. Kesalahan penulisan kata memang hal yang biasa terjadi tetapi dapat berakibat buruk sehingga perlu dilakukan pemeriksaan kata terhadap tulisan pada dokumen yang dibuat. Typo checking merupakan proses pemeriksaan kata yang dilakukan untuk mendeteksi kesalahan penulisan kata dan memberikan kandidat kata yang benar.  Pemeriksaan kesalahan penulisan membutuhkan waktu lama jika dilakukan secara manual, sehingga dibuat aplikasi untuk mendeteksi kesalahan penulisan kata menggunakan Algoritma Rabin-Karp, dengan mencocokkan string berdasarkan nilai hash pada teks dan pattern. Proses Pengecekan Penulisan Kata dilakukan dengan menghitung sampai indeks akhir dan didapatkan hasil seperti kata dan nilai hash. Proses hashing menggunakan modulo (sisa bagi) sebesar 107 dengan nilai k-gram k=3 pada setiap kata asal dan kata hasil. Proses hashing dilakukan dengan cara mengkonversi string menjadi nilai ASCII, sehingga diperoleh nilai hash a-z = 79-122. Berdasarkan hasil perhitungan manual yang telah dilakukan, jika terdapat kesalahan pengetikan akan diperoleh nilai hashing yang berbeda antara kata asal dan kata yang dihasilkan.  

Typing errors are common when writing, for example, when writing scientific papers, books, and others. Word writing errors are common but can have bad consequences, so it is necessary to check the words on the writing in the document that is made. Typo checking is a word checking process that is carried out to detect word writing errors and provide the correct word candidate. Checking writing errors takes a long time if done manually, so an application is made to detect word writing errors using the Rabin-Karp Algorithm, by matching strings based on hash values in text and patterns. The process of Checking Word Writing is done by counting to the final index and getting results such as words and hash values. The hashing process uses a modulo (remaining for) of 107 with a value of k-gram k=3 for each word of origin and word of the result. The hashing process is done by converting the string into an ASCII value so that the hash value a-z = 79-122. Based on the results of manual calculations that have been carried out, if there are typing errors, a different hashing value will be obtained between the original word and the resulting word.


Keywords


Typing Error; Rabin-Karp; Hashing; Patterns; String; Typo Checking.

Full Text:

PDF

References


Agustin Sendy, Kenny, Suryaningrum Kristien. “Aplikasi Koreksi Kesalahan Penulisan Kata Dalam Bahasa Inggris dengan Menggunakan Algoritma Rabin-Karp”. Jurnal Ilmiah Informatika Komputer, pp. 105-115, Januari 2019.

Aldiasto A.L, Witanti Wina, Yuniarti Rezki. “Sistem Koreksi Kesalahan Pengetikan Menggunakan Levenshtein Distance Pada Layout Qwerty”, Seminar Nasional Telekomunikasi dan Informatika (SELISIK) Bandung, pp. 171-176, Mei 2016.

Fahma, A., Cholissodin, I., & Perdana, R. “Identifikasi Kesalahan Penulisan Kata (Typographical Error) pada Dokumen Berbahasa Indonesia Menggunakan Metode N-gram dan Levenshtein Distance”. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 1, p. 53-62, Agustus 2017. ISSN 2548-964X.

Herriyance, Handrizal, dan S. D. Faradilla, “Analisis algoritma Rabin-Karp pada kamus umum berbasis Android”, Jurnal Riset Sistem Informasi dan Teknik Informatika, vol. 2, no.1, hal. 64 – 74, Juli 2017. ISSN 2527-5771

M.O. Braddley, M. Fachrurrozi, Novi.Y, “Pengoreksian Ejaan Kata Berbahasa Indonesia Menggunakan Algoritma Levenshtein Distance”, Prosiding Annual Research Seminar, Computer Science and ICT, vol.3, no. 1, hal. 167-171, 2017.

Nugroho, E., “Perancangan Sistem Deteksi Plagiarisme Dokumen Teks Dengan Menggunakan Algoritma Rabin-Karp”, Skripsi Jurusan Ilmu Komputer, Universitas Muhammadiyah Malang, 2011.

Viny C.M, Bagus M, Desi A., “Implementasi Spelling Correction dengan D-LD dan Rabin Karp Plagiarism Checking Pada Aplikasi Pendaftaran Skripsi”, Journal of Computer Science and Information Systems, vol. 4, no. 1, hal. 78-89, April 2020.

T. H. Cormen, C. E. Leiserson, R. L. Rivest and C. Stein, Introduction to algorithms, USA: MIT Press, 2001.

R. Feldman and J. Sanger, “The text mining handbook: advanced approaches in analyzing unstructured data, Cambridge: Cambridge University Press, 2007.

Salmuasih, Andi S., “Implementasi Algoritma Rabin Karp untuk Pendeteksian Plagiat Dokumen Teks Menggunakan Konsep Similarity”, Seminar Nasional Aplikasi Teknologi Informasi (SNATI), hal. F-23 – F-28, Juni 2013

Baskoro, S.Y., “Pencarian Pasal pada Kitab Undang-Undang Hukum Pidana (KUHP) berdasarkan Kasus Menggunakan Metode Cosine Similarity dan Latent Semantic Indexing (LSI), 2006.

C. Triawati, “Metode Pembobotan Statistical Concept Based untuk Klastering dan Kategorisasi Dokumen Berbahasa Indonesia”, Institut Teknologi Telkom Bandung, 2009.

Syaroni, Mokhamad, dan Munir, Rinaldi, “Pencocokan String Berdasarkan Kemiripan Ucapan (Phonetic String Matching) dalam Bahasa Inggris, Institut Teknologi Bandung, 2014.

Charras, Christian., et al, “Handbook of Exact String Matching”, 1997.

Astawijaya, Ali Nurcahya. “Perbandingan Levenshtein, Smith-Waterman Dan Needleman-Wunsch Dalam Typo Checking. Diss. Universitas Komputer Indonesia, 2019.




DOI: https://doi.org/10.37905/jjeee.v4i1.12150

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Published by:
Electrical Engineering Department
Faculty of Engineering
State University of Gorontalo
Jenderal Sudirman Street No.6, Gorontalo City, Gorontalo Province, Indonesia
Telp. 0435-821175; 081340032063
Email: redaksijjeee@ung.ac.id/redaksijjeee@gmail.com

Creative Commons License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.