Text Mining for Cyberbullying Detection: a Brazilian Portuguese Evaluation

Mapping Intimacies ◽

10.5753/stil.2021.17788 ◽

2021 ◽

Author(s):

Carolina Eberhart ◽

Luciano Ignaczak ◽

Márcio Garcia Martins

Keyword(s):

Text Mining ◽

Scientific Community ◽

Naive Bayes ◽

Naïve Bayes ◽

Brazilian Portuguese ◽

Text Features ◽

Cyberbullying Detection ◽

Text Mining Application

Bullying and cyberbullying are words commonly seen in today's news. Although the scientific community has evaluated text mining techniques for cyberbullying detection, few studies have targeted Brazilian Portuguese datasets. Our study aims to assess the text mining application to detect cyberbullying messages written in Brazilian Portuguese. We gathered posts and comments from Reddit communities and extracted several text features. We then processed these features using Naïve Bayes and SVM classifiers to uncover cyberbullying activity. The outcomes of this experiment may not be used solo for cyberbullying detection; however, they can aid moderators in prioritizing content reviews and acting faster on real cyberbullying cases.

Download Full-text

Architecture of Text Mining Application in Analyzing Public Sentiments of West Java Governor Election using Naive Bayes Classification

International Journal of Computer Applications ◽

10.5120/ijca2018916916 ◽

2018 ◽

Vol 182 (13) ◽

pp. 1-5

Author(s):

Suryanto Nugroho ◽

Prihandoko P.

Keyword(s):

Text Mining ◽

Naive Bayes ◽

Naïve Bayes ◽

West Java ◽

Naive Bayes Classification ◽

Naïve Bayes Classification ◽

Text Mining Application

Download Full-text

A text mining application of emotion classifications of Twitter's users using Naïve Bayes method

2015 1st International Conference on Wireless and Telematics (ICWT) ◽

10.1109/icwt.2015.7449218 ◽

2015 ◽

Cited By ~ 12

Author(s):

Liza Wikarsa ◽

Sherly Novianti Thahir

Keyword(s):

Text Mining ◽

Naive Bayes ◽

Naïve Bayes ◽

Bayes Method ◽

Text Mining Application ◽

Naive Bayes Method

Download Full-text

Analisis Text Mining dari Cuitan Twitter Mengenai Infrastruktur di Indonesia dengan Metode Klasifikasi Naïve Bayes

EIGEN MATHEMATICS JOURNAL ◽

10.29303/emj.v1i2.36 ◽

2019 ◽

Vol 1 (2) ◽

pp. 92

Author(s):

Bimananda W ◽

Insan Riski ◽

Karina Dwi ◽

Rani Nooraeni ◽

Theresa Siahaan ◽

...

Keyword(s):

Text Mining ◽

Naive Bayes ◽

Naïve Bayes

Download Full-text

MODEL KLASIFIKASI ABSTRAK SKRIPSI MENGGUNAKAN TEXT MINING UNTUK PENGKATEGORIAN SKRIPSI SESUAI BIDANG KAJIAN

Simetris Jurnal Teknik Mesin Elektro dan Ilmu Komputer ◽

10.24176/simet.v9i2.2513 ◽

2018 ◽

Vol 9 (2) ◽

pp. 1091-1098 ◽

Cited By ~ 1

Author(s):

Angga Cahyo Pradikdo ◽

Aidina Ristyawan

Keyword(s):

Text Mining ◽

Naive Bayes ◽

Naïve Bayes

Dengan melakukan observasi pada Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri, penulis mendapati bahwa dokumen skripsi pada Program Studi tersebut selalu bertambah setiap tahun, sehingga dapat dijadikan referensi pemilihan bidang penelitian yang sesuai untuk Mahasiswa Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri. Selain itu penulis juga pernah melakukan penelitian tentang pemodelan klasifikasi abstrak prosiding yang bisa digunakan untuk penyusunan letak skripsi pada Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri. Dari hasil penelitian tersebut penulis mendapatkan saran tentang data yang digunakan. Saran tersebut berupa penggunaan data penelitian mahasiswa sebelumnya pada Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri, supaya lebih tepat dan sesuai dengan studi kasusnya. Maka dari itu penulis terinspirasi untuk melakukan penelitian dengan menggunakan data penelitian mahasiswa Program Studi Sistem Informasi yang tersimpan di SIMKI (Sistem Informasi Manajemen Karya Ilmiah) Universitas Nusantara PGRI Kediri. Dengan memanfaatkan data penelitian mahasiswa sebelumnya serta metode teknik text mining diantaranya prepocesing dan trasformation dengan didukung dengan algoritma naive bayes sebagai proses untuk menghitung nilai probabilitas tertinggi sebagai proses klasifikasi yang akan digunakan untuk menguji data tersebut. Dari hasil pengujian 9 siklus menghasilkan pengetahuan bahwa siklus ke 1 merupakan siklus terbaik dengan akurasi 82,76%, yang dapat digunakan sebagai model klasifikasi skripsi pada Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri, untuk dapat membantu memudahkan mahasiswa untuk mencari referensi karena sudah memuat bidang kajian yang sesuai dan Program Studi Informasi mendapatkan model klasifikasi dengan data hasil dari skripsi mahasiswa Program Studi Sistem Informasi Universitas Nusantara PGRI Kediri.

Download Full-text

Klasifikasi Berita Menggunakan Algoritma Naive Bayes Classifer Dengan Seleksi Fitur Dan Boosting

Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) ◽

10.29207/resti.v3i2.1042 ◽

2019 ◽

Vol 3 (2) ◽

pp. 227-232

Author(s):

Bobby Suryo Prakoso ◽

Didi Rosiyadi ◽

Heru Sukma Utama ◽

Dedi Aridarma

Keyword(s):

Text Mining ◽

Naive Bayes ◽

Information Gain ◽

Naïve Bayes ◽

Naive Bayes Classifier ◽

Bayes Classifier ◽

Naïve Bayes Classifier

Penelitian yang dilakukan ini merupakan bagian dari text mining untuk klasifikasi konten berita yang telah memiliki label berdasarkan katagori berita pada situs detik.com . Proses yang dilakukan adalah melakukan permodelan dan pengolahan data, mulai proses pre-processing, proses seleksi fitur information gain, dan penerapan model algoritma Naive Bayes Classifier dengan Bayesian Boosting. Hasil yang diperoleh atas model tersebut mendapatkan nilai evaluasi terhadap akurasi, recall, dan presisi sebesar 73.2%. Sedangkan dengan model yang lebih ringkas yaitu model algoritma Naive Bayes Classifier, dengan Bayesian Boosting mendapatkan nilai evaluasi yang sama besar yaitu 73.2%. Penilaian atas hasil evaluasi model yang telah terlaksankan berkesimpulan bahwa penerapan seleksi fitur Information Gain tidak berpengaruh besar atas kenaikan hasil performa terhadap kondisi label Polynomial.

Download Full-text

Analisis Sentimen Physical Distancing pada Twitter Menggunakan Text Mining dengan Algoritma Naive Bayes Classifier

SISTEMASI ◽

10.32520/stmsi.v10i1.1118 ◽

2021 ◽

Vol 10 (1) ◽

pp. 131

Author(s):

Nila Hardi ◽

Yuris Alkahfi ◽

Popon Handayani ◽

Windu Gata ◽

Muhammad Rifqi Firdaus

Keyword(s):

Text Mining ◽

Naive Bayes ◽

Naïve Bayes ◽

Naive Bayes Classifier ◽

Bayes Classifier ◽

Naïve Bayes Classifier

Download Full-text

Implementation of Text Mining Model to Emotions Detection on Social Media Comments Using Particle Swarm Optimization and Naive Bayes Classifier

2019 7th International Conference on Cyber and IT Service Management (CITSM) ◽

10.1109/citsm47753.2019.8965382 ◽

2019 ◽

Author(s):

Erfian Junianto ◽

Rizal Rachman

Keyword(s):

Social Media ◽

Particle Swarm Optimization ◽

Text Mining ◽

Naive Bayes ◽

Particle Swarm ◽

Naïve Bayes ◽

Bayes Classifier ◽

Naïve Bayes Classifier ◽

Swarm Optimization ◽

Mining Model

Download Full-text

NAIVE BAYES CLASSIFIER DAN SUPPORT VECTOR MACHINE SEBAGAI ALTERNATIF SOLUSI UNTUK TEXT MINING

Jurnal Teknologi Informasi dan Pendidikan ◽

10.24036/tip.v12i2.219 ◽

2019 ◽

Vol 12 (2) ◽

pp. 32-38

Author(s):

Iin Ernawati

Keyword(s):

Support Vector Machine ◽

Text Mining ◽

Naive Bayes ◽

Naïve Bayes ◽

Support Vector ◽

Classification Algorithms ◽

Naive Bayes Classifier ◽

Bayes Classifier ◽

Naïve Bayes Classifier ◽

The Relationship

This study was conducted to text-based data mining or often called text mining, classification methods commonly used method Naïve bayes classifier (NBC) and support vector machine (SVM). This classification is emphasized for Indonesian language documents, while the relationship between documents is measured by the probability that can be proven with other classification algorithms. This evident from the conclusion that the probability result Naïve Bayes Classifier (NBC) word “party” at least in the economic document and political. Then the result of the algorithm support vector machine (svm) with the word “price” and “kpk” contains in both economic and politic document.

Download Full-text

Centroid Based Classifier With TF – IDF – ICF for Classfication of Student’s Complaint at Appliation E-Complaint in Muhammadiyah University of Sidoarjo

JEEE-U (Journal of Electrical and Electronic Engineering-UMSIDA) ◽

10.21070/jeee-u.v1i1.23 ◽

2016 ◽

Vol 1 (1) ◽

pp. 17 ◽

Cited By ~ 1

Author(s):

Mochamad Alfan Rosid ◽

Gunawan Gunawan ◽

Edwin Pramana

Keyword(s):

Text Mining ◽

Decision Tree ◽

Nearest Neighbor ◽

Naive Bayes ◽

Naïve Bayes ◽

K Nearest Neighbor ◽

Base Classifier

Text mining mengacu pada proses mengambil informasi berkualitas tinggi dari teks. Informasi berkualitas tinggi biasanya diperoleh melalui peramalan pola dan kecenderungan melalui sarana seperti pembelajaran pola statistik. Salah satu kegiatan penting dalam text mining adalah klasifikasi atau kategorisasi teks. Kategorisasi teks sendiri saat ini memiliki berbagai metode antara lain metode K-Nearest Neighbor, Naïve Bayes, dan Centroid Base Classifier, atau decision tree classification.Pada penelitian ini, klasifikasi keluhan mahasiswa dilakukan dengan metode centroid based classifier dan dengan fitur TF-IDF-ICF, Ada lima tahap yang dilakukan untuk mendapatkan hasil klasifikasi. Tahap pengambilan data keluhan kemudian dilanjutkan dengan tahap preprosesing yaitu mempersiapkan data yang tidak terstruktur sehingga siap digunakan untuk proses selanjutnya, kemudian dilanjutkan dengan proses pembagian data, data dibagi menjadi dua macam yaitu data latih dan data uji, tahap selanjutnya yaitu tahap pelatihan untuk menghasilkan model klasifikasi dan tahap terakhir adalah tahap pengujian yaitu menguji model klasifikasi yang telah dibuat pada tahap pelatihan terhadap data uji. Keluhan untuk pengujian akan diambilkan dari database aplikasi e-complaint Universitas Muhammadiyah Sidoarjo. Adapun hasil uji coba menunjukkan bahwa klasifikasi keluhan dengan algoritma centroid based classifier dan dengan fitur TF-IDF-ICF memiliki rata-rata akurasi yang cukup tinggi yaitu 79.5%. Nilai akurasi akan meningkat dengan meningkatnya data latih dan efesiensi sistem semakin menurun dengan meningkatnya data latih.

Download Full-text

Analisa Pola Penyalahgunaan Facebook Sebagai Alat Kejahatan Trafficking Menggunakan Data Mining

Jurnal Teknik Informatika ◽

10.35793/jti.8.1.2016.12231 ◽

2016 ◽

Vol 8 (1) ◽

Author(s):

Linda Jayanti ◽

Steven R. Sentinuwo ◽

Oktavian A. Lantang ◽

Agustinus Jacobus

Keyword(s):

Data Mining ◽

Text Mining ◽

Naive Bayes ◽

Naïve Bayes ◽

Naive Bayes Classifier ◽

Bayes Classifier ◽

Naïve Bayes Classifier

Abstrak - Facebook memungkinkan penggunanya berinteraksi dengan orang yang kita kenal maupun orang yang tidak kita kenal, dimana hal tersebut dapat membuka peluang bagi kejahatan dunia maya seperti, penculikan, perdagangan manusia (trafficking), hingga pembunuhan. IOM mecatat bahwa korban perdagangan orang atau trafficking di Indonesia mencapai 74.616 hingga I juta per tahun, dimana tindak kejahatan teersebut banyak dilakukan melalui facebook sebagai medianya. Data teks (status) yang berada di halaman facebook sangat besar. Dengan menggunakan Teknik pengolahan data dari ilmu Data Mining, terutama di bidangtext mining, penulis memanfaatkannya untuk mengidentifikasi data teks (status facebook) yang terindikasi sebagai proses kejahatan trafficking dengan memakai salah satu teknik klasifikasi dengan teorema naïve bayes classifier (NBC). Kata kunci : facebook, trafficking, data mining, text mining, klasifikasi, naïve bayes classifier.

Download Full-text