scholarly journals Text Mining for Cyberbullying Detection: a Brazilian Portuguese Evaluation

2021 ◽  
Author(s):  
Carolina Eberhart ◽  
Luciano Ignaczak ◽  
Márcio Garcia Martins

Bullying and cyberbullying are words commonly seen in today's news. Although the scientific community has evaluated text mining techniques for cyberbullying detection, few studies have targeted Brazilian Portuguese datasets. Our study aims to assess the text mining application to detect cyberbullying messages written in Brazilian Portuguese. We gathered posts and comments from Reddit communities and extracted several text features. We then processed these features using Naïve Bayes and SVM classifiers to uncover cyberbullying activity. The outcomes of this experiment may not be used solo for cyberbullying detection; however, they can aid moderators in prioritizing content reviews and acting faster on real cyberbullying cases.

2019 ◽  
Vol 1 (2) ◽  
pp. 92
Author(s):  
Bimananda W ◽  
Insan Riski ◽  
Karina Dwi ◽  
Rani Nooraeni ◽  
Theresa Siahaan ◽  
...  
Keyword(s):  

2018 ◽  
Vol 9 (2) ◽  
pp. 1091-1098 ◽  
Author(s):  
Angga Cahyo Pradikdo ◽  
Aidina Ristyawan
Keyword(s):  

Dengan melakukan observasi pada Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri, penulis mendapati bahwa dokumen skripsi pada Program Studi tersebut selalu bertambah setiap tahun, sehingga dapat dijadikan referensi pemilihan bidang penelitian yang sesuai untuk Mahasiswa Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri. Selain itu penulis juga pernah melakukan penelitian tentang pemodelan klasifikasi abstrak prosiding yang bisa digunakan untuk penyusunan letak skripsi pada Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri. Dari hasil penelitian tersebut penulis mendapatkan saran tentang data yang digunakan. Saran tersebut berupa penggunaan data penelitian mahasiswa sebelumnya pada Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri, supaya lebih tepat dan sesuai dengan studi kasusnya. Maka dari itu penulis terinspirasi untuk melakukan penelitian dengan menggunakan data penelitian mahasiswa Program Studi Sistem Informasi yang tersimpan di SIMKI (Sistem Informasi Manajemen Karya Ilmiah) Universitas Nusantara PGRI Kediri. Dengan memanfaatkan data penelitian mahasiswa sebelumnya serta metode teknik text mining  diantaranya prepocesing dan trasformation dengan didukung dengan algoritma naive bayes sebagai proses untuk menghitung nilai probabilitas tertinggi sebagai proses klasifikasi yang akan digunakan untuk menguji data tersebut. Dari hasil pengujian 9 siklus menghasilkan pengetahuan bahwa siklus ke 1 merupakan siklus terbaik dengan akurasi 82,76%, yang dapat digunakan sebagai model klasifikasi skripsi pada Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri, untuk dapat membantu memudahkan mahasiswa untuk mencari referensi karena sudah memuat bidang kajian yang sesuai dan Program Studi Informasi mendapatkan model klasifikasi dengan data hasil dari skripsi mahasiswa Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri.


2019 ◽  
Vol 3 (2) ◽  
pp. 227-232
Author(s):  
Bobby Suryo Prakoso ◽  
Didi Rosiyadi ◽  
Heru Sukma Utama ◽  
Dedi Aridarma

Penelitian yang dilakukan ini merupakan bagian dari text mining untuk klasifikasi konten berita yang telah memiliki label berdasarkan katagori berita pada situs detik.com . Proses yang dilakukan adalah melakukan permodelan dan pengolahan data, mulai proses pre-processing, proses seleksi fitur information gain, dan penerapan model algoritma Naive Bayes Classifier dengan Bayesian Boosting. Hasil yang diperoleh atas model tersebut mendapatkan nilai evaluasi terhadap akurasi, recall, dan presisi sebesar 73.2%. Sedangkan dengan model yang lebih ringkas yaitu model algoritma Naive Bayes Classifier, dengan Bayesian Boosting mendapatkan nilai evaluasi yang sama besar yaitu 73.2%. Penilaian atas hasil evaluasi model yang telah terlaksankan berkesimpulan bahwa penerapan seleksi fitur Information Gain tidak berpengaruh besar atas kenaikan hasil performa terhadap kondisi label Polynomial.  


SISTEMASI ◽  
2021 ◽  
Vol 10 (1) ◽  
pp. 131
Author(s):  
Nila Hardi ◽  
Yuris Alkahfi ◽  
Popon Handayani ◽  
Windu Gata ◽  
Muhammad Rifqi Firdaus

2019 ◽  
Vol 12 (2) ◽  
pp. 32-38
Author(s):  
Iin Ernawati

This study was conducted to text-based data mining or often called text mining, classification methods commonly used method Naïve bayes classifier (NBC) and support vector machine (SVM). This classification is emphasized for Indonesian language documents, while the relationship between documents is measured by the probability that can be proven with other classification algorithms. This evident from the conclusion that the probability result Naïve Bayes Classifier (NBC) word “party” at least in the economic document and political. Then the result of the algorithm support vector machine (svm) with the word “price” and “kpk” contains in both economic and politic document.  


Author(s):  
Mochamad Alfan Rosid ◽  
Gunawan Gunawan ◽  
Edwin Pramana

Text mining mengacu pada proses mengambil informasi berkualitas tinggi dari teks. Informasi berkualitas tinggi biasanya diperoleh melalui peramalan pola dan kecenderungan melalui sarana seperti pembelajaran pola statistik. Salah satu kegiatan penting dalam text mining adalah klasifikasi atau kategorisasi teks. Kategorisasi teks sendiri saat ini memiliki berbagai metode antara lain metode K-Nearest Neighbor, Naïve Bayes, dan Centroid Base Classifier, atau decision tree classification.Pada penelitian ini, klasifikasi keluhan mahasiswa dilakukan dengan metode centroid based classifier dan dengan fitur TF-IDF-ICF, Ada lima tahap yang dilakukan untuk mendapatkan hasil klasifikasi. Tahap pengambilan data keluhan kemudian dilanjutkan dengan tahap preprosesing yaitu mempersiapkan data yang tidak terstruktur sehingga siap digunakan untuk proses selanjutnya, kemudian dilanjutkan dengan proses pembagian data, data dibagi menjadi dua macam yaitu data latih dan data uji, tahap selanjutnya yaitu tahap pelatihan untuk menghasilkan model klasifikasi dan tahap terakhir adalah tahap pengujian yaitu menguji model klasifikasi yang telah dibuat pada tahap pelatihan terhadap data uji. Keluhan untuk pengujian akan diambilkan dari database aplikasi e-complaint Universitas Muhammadiyah Sidoarjo. Adapun hasil uji coba menunjukkan bahwa klasifikasi keluhan dengan algoritma centroid based classifier dan dengan fitur TF-IDF-ICF memiliki rata-rata akurasi yang cukup tinggi yaitu 79.5%. Nilai akurasi akan meningkat dengan meningkatnya data latih dan efesiensi sistem semakin menurun dengan meningkatnya data latih.


2016 ◽  
Vol 8 (1) ◽  
Author(s):  
Linda Jayanti ◽  
Steven R. Sentinuwo ◽  
Oktavian A. Lantang ◽  
Agustinus Jacobus

Abstrak - Facebook memungkinkan penggunanya berinteraksi dengan orang yang kita kenal maupun orang yang tidak kita kenal, dimana hal tersebut dapat membuka peluang bagi kejahatan dunia maya seperti, penculikan, perdagangan manusia (trafficking), hingga pembunuhan. IOM mecatat bahwa korban perdagangan orang atau trafficking di Indonesia mencapai 74.616 hingga I juta per tahun, dimana tindak kejahatan teersebut banyak dilakukan melalui facebook sebagai medianya. Data teks (status) yang berada di halaman facebook sangat besar. Dengan menggunakan Teknik pengolahan data dari ilmu Data Mining, terutama di bidangtext mining, penulis memanfaatkannya untuk mengidentifikasi data teks (status facebook) yang terindikasi sebagai proses kejahatan trafficking dengan memakai salah satu teknik klasifikasi dengan teorema naïve bayes classifier (NBC).   Kata kunci : facebook, trafficking, data mining, text mining, klasifikasi, naïve bayes classifier.


Sign in / Sign up

Export Citation Format

Share Document