scholarly journals PENERAPAN ALGORITMA BOYER MOORE DAN METODE N-GRAM PADA APLIKASI PENYUNTING NASKAH TEKS BAHASA INDONESIA BERBASIS WEB

2020 ◽  
Vol 8 (3) ◽  
pp. 50
Author(s):  
Dini Surianto , Dedi Triyanto , Uray Ristian
Keyword(s):  
N Gram ◽  

Literatur yang saat ini sering digunakan adalah dalam bentuk digital dengan format pdf. Untuk dapat mengolah perlu dilakukan konversi kedalam bentuk teks yang editable. Hasil konversi yang dihasilkan kebanyakan dalam bentuk yang tidak teratur format penulisannya dan perlu dilakukan pengeditan yang memerlukan waktu dan tenaga yang tidak sedikit. Untuk melakukan pengeditan yang lebih efisien diperlukanlah sebuah aplikasi yang dapat mengkoreksi teks secara otomatis. Pencarian dan perbaikan kesalahan ejaan menggunakan algoritma Boyer Moore dan metode N-Gram. Dari hasil pengujian, Penerapan Algoritma Boyer Moore pada aplikasi untuk mencari kata yang salah dalam sebuah teks mendapatkan keberhasilan 100%. Kata-kata pada teks di bandingkan dengan kata-kata dalam database dan dengan Algoritma Boyer Moore kata yang tidak sesuai dengan database berhasil dikenali dan dianggap sebagai kata yang salah. Penerapan Metode N-Gram pada aplikasi pengkoresi teks, dari hasil pengujian mendapatkan rata-rata tingkat keberhasilan mencapai 89,68%. Masih ada beberapa kata yang diperbaiki tidak sesuai dengan kata yang seharusnya karena perhitungan dengan Metode N-Gram mendapatkan hasil yang lebih tinggi dengan kata lain pada database.. Kata Kunci: Boyer Moore, N-Gram, Kata Bahasa Indonesia

2020 ◽  
Vol 7 (1) ◽  
pp. 77-84
Author(s):  
Titi Hartina ◽  
Agustin Masri
Keyword(s):  
N Gram ◽  

Karya tulis sudah menjadi salah satu sarana bagi para generasi muda untuk menuangkan idenya, ide tersebut biasa di susun membentuk sebuah karangan berupa tulisan dari hari pemikiran, pengamatan, dan tinjauan dalam berbagai bidang. Karya tulis yang dibuat haruslah memiliki kualitas yang baik sehingga pembaca akan mudah untuk menerima makna dan tujuan dari penulisan karya tulis tersebut. Akan tetapi tidak semua karya tulis yang dibuat memiliki kualitas seperti yang diharapkan. Salah satu faktor yang mempengaruhi rendahnya kualitas penulisan karya tulis yang baik adalah kesalahan dalam penggunanan kata non baku yang disengaja maupun yang tidak disengaja. Mengacu pada masalah tersebut, maka digunakan metode N-Gram untuk membantu proses penelitian yang akan dilakukan. Metode N-Gram ini digunakan untuk pembangkitan kata dan karakter yang tidak sesuai dengan penulisan kata baku dalam Bahasa Indonesia. Dengan cara ini, maka kata nonbaku yang menjadi inti pemasalahan tersebut akan mudah terdeteksi. Agar dapat mengimplementasikan tujuan dari penelitian maka metode ini dituangkan kedalam sebuah aplikasi pendeteksi kesalahan pengetikan kata nonbaku pada karya tulis berbahasa indonesia menggunakan metode N-Gram. Aplikasi ini dapat meminimalisasi kekurangan dalam penulisan karya tulis.


2021 ◽  
Vol 7 (2) ◽  
pp. 119
Author(s):  
Wahyu Hidayat ◽  
Ema Utami ◽  
Anggit Dwi Hartanto

Pengidentifikasian terkait plagiarisme terhadap dokumen berbahasa Indonesia telah dilakukan di penelitian terkait, untuk pendeteksi tingkat kesamaan dokumen. Dalam penelitian tersebut telah digunakan algoritma pendeteksi kesamaan dokumen dengan metode fingerprint sseperti Algoritma Winnowing. Algoritma Winnowing memiliki perbedaan pada penggunaan parameter seperti ada yang menggunakan k-gram dan n-gram. Dari perbedaan parameter tersebut dilakukan penelitian performa dari perbandingan penggunaan parameter yang berbeda pada pemotongan string pada tahap algoritma Winnowing sehingga dapat diketahui parameter yang mempunyai tingkat performa yang paling baik. Hasil penelitian pada k-gram memiliki tingkat nilai similarity yang tinggi namun ketika nilai jumlah k semakin besar akan mengurangi tingkat nilai similarit dengan rata-rata hasil pada k = 2 sebesar 0.5299, k = 3 sebesar 0.1689, k = 5 sebesar 0.0283 dan k = 7 sebesar 0.0095. Penerapan pemotongan string n-gram pada unigram memiliki rata-rata tingkat similarity sebesar 0.0683, bigram 0.003, pada trigram dan four-gram sebesar 0.000. Pada perbandingan kecepatan pemrosesan waktu k-gram dan n-gram tidak terlihat perbedaan yang signifikan dan keduanya mendominasi selama 6 detik.Kata Kunci—Algoritma Winnowing, Jaccard Similarity, Fingerprint, K-gram, N-gramIdentification related to plagiarism of Indonesian language documents has been carried out in related research, such as for the purpose of detecting the level of similarity documents. In this research, algorithm similarity detection algorithms have been used, especially with the fingerprint method wich Winnowing algorithm. Winnowing algorithm using parameters such as those using k-gram and n-gram. From these different parameters, a study of the performance of the comparison the use of different parameters in the string cutting at the Winnowing algorithm stage can be found out which parameter has the best level of performance. The results of research on k-gram have a high level of similarity value, but when the value of the number of k gets bigger it will reduce the level of similarity values with an average result at k = 2 of 0.5299, k = 3 of 0.1689, k = 5 of 0.0283 and k = 7 in the amount of 0.0095. The application of cutting n-gram strings on unigram has an average similarity level of 0.0683, bigram 0.003, on trigrams and four-grams of 0.000. In the comparison of the processing speed of k-gram and n-gram time, there was no significant difference, and both dominated for 6 seconds. Keywords— Winnowing algorithm, Jaccard Similarity, Fingerprint, K-gram, N-gram


2020 ◽  
Vol 18 (1) ◽  
pp. 63
Author(s):  
Candra Supriadi ◽  
Hidriyanto Dwi Purnomo ◽  
Irwan Sembiring
Keyword(s):  
N Gram ◽  

2018 ◽  
Vol 4 (1) ◽  
pp. 17
Author(s):  
Maya Salinka Simanjuntak ◽  
Herry Sujaini ◽  
Novi Safriadi

Abstrak - Kesalahan pengetikan dalam suatu dokumen merupakan human error yang sulit dihindari, akibatnya pesan yang ingin disampaikan tidak maksimal. Menggunakan fitur Spelling Corrector menjadi salah satu cara untuk mengecek kesalahan-kesalahan pengetikan. Metode-metode yang digunakan  mampu memberikan saran-saran kata yang benar, tapi tidak mampu memperbaiki kata yang salah secara langsung. Pengguna harus memilih satu kata yang diinginkan dari saran-saran kata yang dihasilkan oleh fitur. Dibutuhkan fitur Spelling Corrector yang mampu memberikan hanya satu saran kata dan langsung memperbaikinya. Melihat cara berbagai macam metode memberikan saran kata, kombinasi metode Peter Norvig dan N-Gram mampu menghasilkan satu saran kata. Kedua metode mencari saran kata menggunakan nilai probabilitas kata yang paling sering muncul di dalam kamus. Perbedaan dari kedua metode tersebut adalah Peter Norvig menggunakan algoritma yang mengkombinasikan proses menghapus, menambah, memisahkan, mengganti, dan memindahkan huruf pada kata yang salah. Sedangkan, N-Gram menggunakan algoritma yang memperhatikan kata-kata sebelum dan sesudahnya berdasarkan kalimat di dalam kamus. Kamus yang digunakan adalah dokumen hasil training corpus yang disebut ARPA file. Kombinasi metode ini diuji dalam 9 skenario kesalahan penulisan dengan 160 kalimat yang masing-masing memiliki satu kata yang salah. Hasil pengujian menyatakan bahwa kombinasi kedua metode memberikan tingkat ketepatan 65,926% dan tingkat keberhasilan 78,07% untuk menghasilkan satu saran kata yang benar dari satu kata yang salah dalam sebuah kalimat. Kombinasi kedua metode ini dapat digunakan dalam memperbaiki kesalahan pengetikan, walaupun tidak dapat memperbaiki kata dengan tingkat kesalahan dua huruf atau lebih. Hal ini dikarenakan, Peter Norvig tidak mampu memperbaiki kata dengan tingkat kesalahan dua huruf dan membutuhkan korpus yang baik.Kata kunci: Kombinasi, Spelling Corrector, Peter Norvig, N-Gram, ARPA file.


2019 ◽  
Vol 7 (1) ◽  
pp. 29-36 ◽  
Author(s):  
Elly Indrayuni

Saat ini produk kosmetik sudah menjadi kebutuhan utama kaum wanita yang merupakan target utama dari industri kosmetik. Banyak website yang menyediakan informasi tentang produk kosmetik dengan memberikan banyak informasi berupa gambar dan review pengguna. Membaca semua review yang ada pada sebuah website tentu sangat memakan waktu, karena terlalu banyak opini yang ada dari berbagai sumber website yang berbeda. Oleh karena itu, analisa sentimen merupakan salah satu solusi mengatasi masalah untuk mengelompokan opini atau review menjadi opini positif atau negatif secara otomatis. Naive Bayes memiliki kelebihan yaitu sederhana, cepat dan memiliki akurasi yang tinggi. Penerapan fitur generate            n-gram pada penelitian ini diharapkan dapat meningkatkan nilai akurasi algoritma Naive Bayes. N-gram dianggap dapat mengurangi selisih antara klasifikasi kelas positif dan negatif sehingga dapat meningkatkan rata-rata akurasi akhir suatu algoritma. Hasil klasifikasi sentimen pada penelitian ini terdiri dari dua label class, yaitu positif dan negatif. Nilai akurasi yang dihasilkan akan menjadi tolak  ukur untuk mencari model pengujian terbaik untuk kasus klasifikasi sentimen. Evaluasi dilakukan menggunakan 10 fold cross validation. Pengukuran akurasi diukur dengan confusion matrix dan kurva ROC. Hasil penelitian menunjukkan penerapan generate n-gram pada tahap preprocessing mempengaruhi nilai akurasi dan nilai AUC yang dihasilkan. Nilai akurasi terbaik yang dihasilkan pada penelitian ini yaitu 90.50% dengan nilai AUC sebesar 0.715 pada penerapan generate n-gram = 2.


2012 ◽  
Vol 5 (2) ◽  
pp. 74
Author(s):  
. Gunawan ◽  
Devi Dwi Purwanto ◽  
Herman Budianto ◽  
Indra Maryati

Sampai saat ini belum pernah ditemukan Alkitab Perjanjian Baru Bahasa Indonesia secara online yang dilengkapi dengan Strong’s Concordance. Oleh karena itu penelitian ini melakukan penyusunan Strong’s Concordance ke dalam Alkitab Perjanjian Baru Bahasa Indonesia. Penyusunan Strong’s Concordance dilakukan dengan menggunakan pedoman teori yang ada pada Natural Language Processing (NLP) dan teori Web Mining. Penyusunan nomor strong tersebut dimulai dengan melakukan pendekatan nomor strong berdasarkan kemunculan katanya. Kemudian pada tahap selanjutnya digunakan pendekatan alignment antara kata yang ada pada Alkitab Bahasa Indonesia dengan nomor strong yang terdapat pada Alkitab Bahasa Inggris dengan menggunakan word alignment. Pendekatan ketiga menggunakan pendekatan n-gram dengan perhitungan mutual information untuk mencari arti kata yang terdiri lebih dari satu kata. Pendekatan keempat dilakukan dengan cara melakukan stemming pada corpus Alkitab Perjanjian Baru Bahasa Indonesia yang mana nantinya digunakan sebagai corpus baru untuk melakukan pencarian pada tahap satu sampai dengan tahap tiga. Dilakukan juga pendekatan lain seperti pencarian proper name, pencarian nomor strong yang hanya memiliki satu frekuensi dan pendataan nomor strong yang termasuk dalam conjuction, preposition, dan pronoun. Hasil penelitian adalah adanya Alkitab Perjanjian Baru Bahasa Indonesia yang dilengkapi dengan nomor strong, pembelajaran Alkitab menjadi lebih mudah. Until now have not found a New Bible Testamen in Bahasa online which is equipped with a Strong's Concordance. Therefore, this study prepare a Strong's Concordance to the New Bible Testament Indonesian. Preparation of Strong's Concordance is done using the existing guidelines on the theory of Natural Language Processing (NLP) and the theory of Web Mining. The preparation of these strong numbers begins with based on the word strong numbers aproach. Then on the next phase alignment approach between existing words in the Bible Bahasa with strong numbers contained in the English Bible using the word alignment. The third approach uses n-gram approach with the calculation of mutual information to find the meaning of words consisting in more than one word. The fourth approach is performed by stemming the New Bible Testament corpus Bahasa which will be used as a new corpus to perform a search in stage one up to stage three. There is also another approach such as the proper name search, the search for strong numbers that have only one frequency, and data collection that included strong numbers in conjuction, preposition, and pronoun. The result is the New Bible Testament Bahasa which comes with a number of strong more easier to learn.


2019 ◽  
Vol 5 (2) ◽  
pp. 145
Author(s):  
Sarjan Kase
Keyword(s):  

Abstrak Tujuan penulisan ini adalah untuk mengetahui sejauh mana penerapan semantik dalam pembelajaran bahasa Indonesia di SMA Negeri 3 Gorontalo. Selain itu, penelitian ini juga memberikan gambaran yang spesifik terhadap persoalan pembelajaran semantik di sekolah. Data diambil dari kalimat yang disampaikan oleh seorang guru berkenaan dengan semantik. Sumber data diambil dari buku semantik yang telah ditulis oleh pakar dan wawancara kepada sesama guru bahasa Indonesia di SMA Negeri 3 Gorontalo. Hasil penelitian menunjukkan bahwa ada beberapa makna semantic yang digunakan dalam pembelajaran bahasa Indonesia yaitu, makna afektif, makna denotatif, makna deskriptif, makna emotif, makna kiasan. Selain itu, ditemukan juga beberapa upaya yang dapat dilakukan dalam mengatasi persoalan pembelajaran semantik di sekolah.


2017 ◽  
Vol 12 (1) ◽  
pp. 34-42
Author(s):  
Wawan Wiraatmaja
Keyword(s):  

Penelitian ini bertujuan untuk: (1) mengetahui aktivitas belajar peserta didik kelas V SDN-3 Pahandut Palangkaraya tahun pelajaran 2015/2016 dalam menanggapi suatu persoalan atau peristiwa dengan menggunakan media animasi, (2) untuk mengetahui ada atau tidaknya peningkatan hasil belajar peserta didik dalam menanggapi suatu persoalan atau peristiwa dengan menggunakan media animasi kelas V pada SDN-3 Pahandut Palangkaraya tahun pelajaran 2015/2016. Metode penelitian yang digunakan dalam penelitian ini adalah Penelitian Tindakan Kelas (PTK). Subjek penelitian berjumlah 19 orang peserta didik. teknik pengmpulan data berdasarkan pada hasil siklus pada saat proses pembelajaran. Hasil penelitian menunjukan bahwa: (1) aktivitas peserta didik kelas V SDN-3 Pahandut Palangkaraya tahun pelajaran 2015/2016 dalam kemampuan menanggapi suatu persoalan atau peristiwa dengan menggunakan media animasi lebih aktif dengan skor rata-rata siklus I 2,4 dengan kriteria cukup dan siklus II 3,5 dengan kriteria baik. (2) Peningkatan hasil belajar peserta didik kelas V pada SDN-3 Pahandut Palangkaraya tahun pelajaran 2015/2016 dalam menanggapi suatu persoalan atau peristiwa dengan menggunakan media animasi lebih meningkat, dibuktikan dengan hasil Siklus I 67,63 dengan ketuntasan klasikal 52,63% Dan Siklus II 80,52 dengan ketuntasan klasikal 100%. Dari hasil yang diperoleh tersebut ada peningkatan antara hasil siklus I dan siklus II.


2020 ◽  
Vol 13 (2) ◽  
pp. 01-10
Author(s):  
Alpansyah Alpansyah ◽  
Abdul Talib Hasim

The aims of this study were: (1) to identify an increase in students' understanding of the value of mutual cooperation through the use of reader response rules in Indonesian Language Learning (KRPDPBI); (2) identifying the use of the reader response principle in Indonesian Language learning (KRPDPBI) there are differences between male and female students. The design of this study used a quasi-experimental study with two different methods. The results showed that (1) the achievement of the score of understanding the value of mutual cooperation for students taught by KRPDPBI was better than for students taught by regular learning according to the curriculum; (2) the achievement of the understanding of the value of male students' mutual cooperation is no better than that of female students.


2017 ◽  
Vol 6 (1) ◽  
pp. 32
Author(s):  
Nismarni Nismarni

In the background backs Indonesian learning results obtained by the students is very low because the method of learning that are not relevant. Classroom action research aims to determine the implementation of cooperative learning model Numbered Heads Together (NHT) to improve learning outcomes Indonesian grade IV A SD Negeri 78 Pekanbaru on instructional materials do. The experiment was conducted in two cycles each cycle two meetings and one daily tests. Each cycle stages are: planning, implementation, observation and reflection. Data from the activity of teachers and students in the can from the observation sheet, while, learning outcomes in getting the daily test results. The results showed the activities of teachers and students has increased, in the first cycle of meetings I obtained a score of 33 (68.75%), in the first cycle of meetings II obtained a score of 38 (79.17%), the second cycle of meetings I obtained a score of 40 (83 , 33%), and the second cycle II meeting obtained a score of 44 (91.67%). And in the first cycle of the first meeting of student activity data obtained a score of 27 (56.25%), in the first cycle II meeting increased with the acquisition of a score of 36 (75.00%), and the second cycle first meeting increased to 41 (85.42 %), the second cycle II meeting increased to 45 (93.75%). Learning outcomes of students has increased, this is evidenced by: the preliminary data the number of students who reach KKM amounted to 10 students (28.57%) with an average of learning outcomes at 65.37. Increased in the first cycle by the number of students who completed totaling 26 students (74.28%) with an average of learning outcomes at 76.00. And the second cycle increases with the number of students 32 students (91.42%) with an average of learning outcomes at 86.86. Based on these results it can be concluded that the implementation of cooperative learning model NHT can improve learning outcomes Indonesian grade IV A SD Negeri 78 Pekanbaru. 


Sign in / Sign up

Export Citation Format

Share Document