Klasifikasi Tweets Tindak Kejahatan Berbahasa Indonesia Menggunakan Naive Bayes

Repositor ◽  
2020 ◽  
Vol 2 (7) ◽  
pp. 933
Author(s):  
Siti Maghfiroh ◽  
Setio Basuki ◽  
Yufis Azhar

Kasus tindak kejahatan konvensional seperti penganiayaan, penculikan, pencurian, dll masih jarang digunakan sebagai objek penelitian. Kasus kejahatan yang biasa diteliti hanya pada lingkup kejahatan cyber seperti pembajakan software, carding, penipuan online, dll. Maka dalam penelitian ini penulis mengangkat kasus kejahatan konvensional sebagai objek penelitian. Penulis mencoba mendapatkan informasi kejahatan dari media sosial, Twitter. Dari Twitter didapatkan data berupa cuitan para pengguna yang mengandung unsur kejahatan. Selanjutnya, akan dilakukan klasifikasi untuk menentukan mana di antara data tersebut yang benar-benar mengandung informasi kejahatan, dan bukan merupakan sebuah opini. Metode yang digunakan dalam pengklasifikasian data adalah algoritma Naive Bayes Classifier dengan 2 jenis dataset. Dataset pertama berisi fitur lexical atau bag of words dan dataset kedua berisi fitur sintaktik. Penulis menggunakan 2 dataset untuk membandingkan kinerja dari kedua fitur dalam proses klasifikasi data tweets. Rata-rata hasil akurasi model klasifikasi menggunakan fitur sintaktik adalah sebesar 88,1398% sedangkan pada fitur lexical atau bag of words sebesar 79,25%. Kemudian dari hasil klasifikasi, penulis mendapatkan lokasi di mana tindak kejahatan tersebut terjadi menggunakan metode Named Entity Recognition (NER). Dari proses NER tersebut, maka didapatkan hasil akurasi sebesar 65%.

2021 ◽  
Author(s):  
Deniz Ertuncay ◽  
Giovanni Costa

AbstractNear-fault ground motions may contain impulse behavior on velocity records. To calculate the probability of occurrence of the impulsive signals, a large dataset is collected from various national data providers and strong motion databases. The dataset has a large number of parameters which carry information on the earthquake physics, ruptured faults, ground motion parameters, distance between the station and several parts of the ruptured fault. Relation between the parameters and impulsive signals is calculated. It is found that fault type, moment magnitude, distance and azimuth between a site of interest and the surface projection of the ruptured fault are correlated with the impulsiveness of the signals. Separate models are created for strike-slip faults and non-strike-slip faults by using multivariate naïve Bayes classifier method. Naïve Bayes classifier allows us to have the probability of observing impulsive signals. The models have comparable accuracy rates, and they are more consistent on different fault types with respect to previous studies.


Sign in / Sign up

Export Citation Format

Share Document