scholarly journals Cyberbullying Detection Modelling at Twitter Social Networking

2018 ◽  
Vol 6 (2) ◽  
pp. 113 ◽  
Author(s):  
Ika Yunida Anggraini ◽  
Sucipto Sucipto ◽  
Rini Indriati

Cybercrimes often happened in social networking sites. Cyber-bullying is a form of cybercrime that recently trended in one of popular social networking sites, Twitter. The practice of cyber-bullying on teenager can cause depression, murderer or suicidal thoughts and it needs a preventing action so it will not harmful to the victim. To prevent cyber-bullying a text mining modelling can be done to classify tweets on Twitter into two classes, bullying class and not bullying class. On this research we use Naïve Bayes Classifier with five stages of pre-processing : replace tokens, transform case, tokenization, filter stopwords and n-grams. The validation process on this research used 10-Fold Cross Validation. To evaluate the performance of the model a Confusion Matrix table is used. The model on 10-Fold Cross Validation phase works well with 77,88% of precision , 94,75% of recall and 82,50% of accuracy with +/-5,12%  of standard deviation.

2019 ◽  
Vol 3 (1) ◽  
pp. 54-62
Author(s):  
Razi Aziz Syahputro ◽  
Widodo ◽  
Hamidillah Ajie

Penelitian ini dilatarbelakangi dengan dibutuhkannya sistem pengklasifikasian untuk memudahkan pihak Jurusan Teknik Elektro khususnya Program Studi PTIK untuk mengklasifikasikan judul skripsi berdasarkan peminatan. Sebelum sistem dibuat diperlukan pertimbangan dari beberapa algoritma klasifikasi yang ada, maka dari itu penelitian ini memilih 3 algoritma dari 10 algoritma terbaik menurut ICDM tahun 2006. Klasifikasi terhadap dokumen teks pendek seperti judul skripsi mahasiswa memiliki kesulitan tersendiri daripada dokumen teks panjang karena semakin sedikit kata semakin sulit diklasifikasi. Sehingga tujuan dari penelitian ini adalah untuk mengetahui algoritma yang paling efektif untuk mengklasifikasi judul skripsi. Penelitian ini terdiri dari beberapa tahap yaitu pengumpulan data, pengelompokan data melalui angket oleh dosen ahli, pre-processing text, pembobotan kata menggunakan vector space model dan tf-idf, evaluasi dengan k-fold cross validation, klasifikasi menggunakan k-nearest neighbor, naïve bayes classifier, dan support vector machine, dan analisis dengan confusion matrix. Percobaan dilakukan dengan menggunakan 266 data judul skripsi mahasiswa PTIK UNJ dari angkatan 2010-2013, dengan data terakhir berasal dari sidang skripsi pada semester 105(semester ganjil 2016/2017). Hasil dari klasifikasi menggunakan algoritma tersebut didapatkan algoritma yang paling efisien yaitu support vector machine dengan akurasi 82% dari 10 kali percobaan.


2021 ◽  
Vol 7 (2) ◽  
pp. 165-173
Author(s):  
Harliana Harliana ◽  
Fatra Nonggala Putra

Secara definisi kemiskinan merupakan suatu kondisi individu ditingkat rumah tangga yang dinilai berdasarkan karaktersitik kemiskinan. Sebagai dampak dari pandemi covid-19 prosentase rumah tangga miskin di Indonesia meningkat sekitar 9,78%. Berdasarkan hal tersebut, maka penelitian ini akan melakukan klasifikasi dengan algoritma Naïve Bayes Classification untuk menentukan rumah tangga miskin melalui parameter survey ekonomi Nasional Tahun 2020 Modul Ketahanan Sosial yang berfokus pada pengeluaran dan konsumsi perkapita responden selama pandemic. Sedangkan tujuan dari penelitian ini adalah mendapatkan akurasi tertinggi yang dihasilkan oleh Naïve Bayes Classification dalam penentuan rumah tangga miskin. Menurut hasil pengujian dengan confusion matrix dan 10-fold cross validation didapatkan bahwa rata-rata akurasi tertinggi terjadi pada fold ke-10 dengan nilai accuracy 93,21%; precision 86,3%; dan recall 80,11%. Hal ini berarti bahwa akurasi yang dihasilkan oleh naïve bayes classifier dalam melakukan clasifikasi rumah tangga miskin cukup tinggi


2018 ◽  
Vol 5 (5) ◽  
pp. 577
Author(s):  
Firman Tempola ◽  
Miftah Muhammad ◽  
Amal Khairan

<p class="JGI-AbstractIsi">Penelitian ini akan membandingkan dua algoritma klasifikasi yaitu K-Nearest Neighbour dan Naive Bayes Classifier pada data-data aktivitas status gunung berapi yang ada di Indonesia. Sedangkan untuk validasi data menggunakan k-fold cross validation. Dalam penentuan status gunung berapi pusat vulkanologi dan mitigasi bencana geologi melakukan dengan dua hal yaitu pengamatan visual dan faktor kegempaan. Pada penelitian ini dalam melakukan klasifikasi aktivitas gunung berapi menggunakan faktor kegempaan. Ada 5 kriteria yang digunakan dalam melakukan klasifikasi yaitu empat faktor kegempaan diantaranya gempa vulkanik dangkal, gempa tektonik jauh, gempa vulkanik dalam, gempa hembusan dan ditambah satu kriteria yaitu status sebelumnya. Ada 3 status yang di yang diklasifikasi yaitu normal, waspada dan siaga. Hasil penelitian yang dibagi kedalam 3 fold disetiap metode klasifikasi didapat perbandingan akurasi sistem rata-rata tertinggi pada k-nn 63,68 % dengan standar deviasi 7,47 %. Sedangkan dengan menggunakan naive bayes didapat rata-rata akurasi sebesar 79,71 % dengan standar deviasi 3,55 %. Selain itu, penggunaan naive bayes jaraknya akurasi lebih dekat dibandingan dengan k-nn.</p><p class="JGI-AbstractIsi"> </p><p class="JGI-AbstractIsi"><em><strong>Abstract</strong></em></p><p><em>This </em><em>research</em><em> will compare two classification algorithms that are K-Nearest Neighbors and Naive Bayes Classifier on data of volcanic status activity in Indonesia. While for data validation use k-fold cross validation. In determining the status of volcanology center volcanology and geological disaster mitigation to do with two things: visual observation and seismic factors. In this research in doing the classification of volcanic activity using earthquake factor. There are 5 criteria used in the classification of four seismic factors such as shallow volcanic earthquakes, distant tectonic earthquakes, volcanic earthquakes in the earthquake, blast and plus one criterion that is the previous status. There are 3 statuses in which are classified ie normal, alert and alert. The results of the study are divided into 3 fold in each classification method obtained comparison of the highest average system accuracy at 63.68% </em><em>k</em><em>-nn with a standard deviation of 7.47%. While using naive bayes obtained an average accuracy of 79.</em><em>7</em><em>1% with a standard deviation of 3.55%. In addition, the use of naive bayes is closer to the accuracy of </em><em>k-nn</em><em>.</em></p>


2019 ◽  
Vol 5 (2) ◽  
pp. 108-117
Author(s):  
Herfia Rhomadhona ◽  
Jaka Permadi

Berita kriminalitas merupakan berita yang selalu menjadi trending topik di setiap media massa, khususnya media massa online. Media massa online terlah menyediakan beberapa fasilitas untuk mempermudah masyarakan dalam mencari sebuah berita berdasarkan topik. Media massa online melabeli suatu berita berdasarkan kategorinya. Namun, media massa online tidak memberikan sub kategori pada berita tersebut. Sebagai contoh jika seorang pengguna membuka kategori kriminal, maka yang ditampilkan adalah semua jenis berita kriminal tanpa memberikan informasi yang spesifik dari jenis kriminalitasnya. Permasalahan tersebut dapat diatasi dengan mengklasifikasikan berita kriminalitas berdasarkan subkategori. Penelitian ini menggunakan metode Naïve Bayes Classifier (NBC)  untuk mengklasifikasi berita berdasarkan sub kategorinya. Adapun subkategori terbagi kedalam 5 kategori yaitu korupsi, narkoba, pencurian, pemerkosaan dan pembunuhan. Penelitian ini bertujuan untuk mengetahui kemampuan NBC dalam mengklasifikasi berita dengan melakukan pengujian menggunakan teknik K-Fold Cross Validation dengan nilai K dari 3 sampai 10. Hasil pengujian menyatakan bahwa NBC memiliki kemampuan dalam klasifikasi berita kriminal dengan nilai precision sebesar 98,53 %, nilai recall sebesar 98,44 % dan nilai accuracy sebesar 99,38 %.


Author(s):  
M. Adnan Nur

Pada analisis sentimen pengguna twitter dibutuhkan tahap preprocessing sebelum mengklasifikasikan sentimen. Preprocessing digunakan untuk menyaring kata yang dianggap perlu untuk kebutuhan klasifikasi. Kesalahan penulisan pada tweet merupakan suatu permasalahan dalam tahap preprocessing yang tentunya mempengaruhi tingkat akurasi klasifikasi. Berdasarkan hal tersebut dibutuhkan proses tambahan pada preprocessing untuk melakukan koreksi kesalahan penulisan kata. Pada penelitian ini, penulis membandingkan kinerja metode  levenshtein distance dan jaro-winkler distance dalam melakukan koreksi kesalahan penulisan kata. Penelitian ini diawali dengan melakukan survei literatur untuk mengidentifikasi masalah. Selanjutnya melakukan studi pustaka untuk menentukan objek dan parameter yang dibutuhkan dalam merancang dan memodelkan data serta perangkat lunak. Perangkat lunak dikembangkan menggunakan bahasa pemrograman python dengan beberapa library sastrawi, levenshtein, pyjarowinkler dan sklearn. Perangkat lunak ini dibangun untuk memudahkan dalam melihat kinerja metode yang digunakan. Pengujian dilakukan menggunakan confusion matrix dengan 10 fold cross validation. Pengujian melibatkan pengukuran kinerja levenshtein distance jika ditempatkan sebelum dan sesudah proses stemming. Begitupula untuk  metode jaro-winkler distance juga ditempatkan sebelum dan sesudah proses stemming dalam preprocessing. Dari hasil pengujian diperoleh nilai accuracy, recall dan f1score dari metode levenshtein distance lebih baik dibandingkan jaro-winkler distance. Penerapan koreksi kata dengan metode levenshtein distance juga meningkatkan accuracy, recall dan f1score jika dibandingkan tanpa koreksi kata pada preprocessing. Penempatan koreksi kata pada tahap preprocessing dari hasil pengujian menunjukan posisi setelah proses stemming lebih baik dari penempatan koreksi kata sebelum proses stemming


Author(s):  
Michelle Sofo ◽  
Francesco Sofo

This chapter explores the link between social capital, the bullying that can occur via social networking sites, and community education. It becomes evident that social networking sites are influential sources of informal learning despite the published literature being somewhat divided on the sociological, psychological, and emotional benefits of social networking. Through the presentation of Australian statistics and case studies, the chapter demonstrates how social capital can be eroded through the misuse of social networking sites particularly in the form of cyber bullying. The Australian government has responded to the social impacts of cyber bullying by funding an extensive community education program. Through examining this program, it is possible to see how important it is to have effective and accessible community education regarding safe and responsible social networking.


Author(s):  
T. Balamurugan ◽  
M. Aravinthan

Social networking sites over the years have changed from a few user-based sites into a phenomena that has become a platform for a huge number of users. However, the growth and development of social networking sites have brought great concerns on parents and educational authorities with respect to potential risks that are facing the university students as they use online social networking frequently for gathering information. The use of social networking sites among the university students requires much attention with increasing number of students creating profile and feeding their personal information into the sites. The increasing activity on the sites by student community can negatively impact the normal activity of students' lives. This can also become a hindrance to the academic development as well as social engagement of students. Therefore, there is a need to study, assess, and evaluate the issues revolving the usage of social networking sites among the student community. The study shows that the distribution of respondents according to their influence of SNS. It shows both section-wise distribution and their composite scores. Also, the table shows the respective mean scores and standard deviation. It may be inferred that 77.50% of the respondents have stated that the influence of SNS are high, 18.55% of the respondents have stated that the influence of SNS is moderate, and 3.95% of the respondents have stated that the influence of SNS is low. However, the composite mean score (2.72), standard deviation (0.530) depicts that the respondents have stated that the influence of SNS is high.


2019 ◽  
Vol 2019 ◽  
pp. 1-13 ◽  
Author(s):  
Yunxin Xie ◽  
Chenyang Zhu ◽  
Yue Lu ◽  
Zhengwei Zhu

Lithology identification is an indispensable part in geological research and petroleum engineering study. In recent years, several mathematical approaches have been used to improve the accuracy of lithology classification. Based on our earlier work that assessed machine learning models on formation lithology classification, we optimize the boosting approaches to improve the classification ability of our boosting models with the data collected from the Daniudi gas field and Hangjinqi gas field. Three boosting models, namely, AdaBoost, Gradient Tree Boosting, and eXtreme Gradient Boosting, are evaluated with 5-fold cross validation. Regularization is applied to the Gradient Tree Boosting and eXtreme Gradient Boosting to avoid overfitting. After adapting the hyperparameter tuning approach on each boosting model to optimize the parameter set, we use stacking to combine the three optimized models to improve the classification accuracy. Results suggest that the optimized stacked boosting model has better performance concerning the evaluation matrix such as precision, recall, and f1 score compared with the single optimized boosting model. Confusion matrix also shows that the stacked model has better performance in distinguishing sandstone classes.


2016 ◽  
Vol 43 (2) ◽  
pp. 159-173 ◽  
Author(s):  
Amer Al-Badarneh ◽  
Emad Al-Shawakfa ◽  
Basel Bani-Ismail ◽  
Khaleel Al-Rababah ◽  
Safwan Shatnawi

This paper investigates the impact of using different indexing approaches (full-word, stem, and root) when classifying Arabic text. In this study, the naïve Bayes classifier is used to construct the multinomial classification models and is evaluated using stratified k-fold cross-validation ( k ranges from 2 to 10). It is also uses a corpus that consists of 1000 normalized Arabic documents. The results of one experiment in this study show that significant accuracy improvements have occurred when the full-word form is used in most k-folds. Further experiments show that the classifier has achieved the highest accuracy in the eight-fold by using 7/8–1/8 train–test ratio, despite the indexing approach being used. The overall results of this study show that the classifier has achieved the maximum micro-average accuracy 99.36%, either by using the full-word form or the stem form. This proves that the stem is a better choice to use when classifying Arabic text, because it makes the corpus dataset smaller and this will enhance both the processing time and storage utilization, and achieve the highest level of accuracy.


2017 ◽  
Vol 1 (1) ◽  
pp. 31-38
Author(s):  
Nur Indah Pratiwi ◽  
Widodo .

Dokumen karya akhir di Jurusan Teknik Elektro Universitas Negeri Jakarta setiap tahunnya bertambah, pengklasifikasian dokumen menjadi hal yang sangat penting untuk mengorganisasikan dokumen sehingga dapat memudahkan pencarian. Pengembangan Sistem klasifikasi dokumen bertujuan untuk mengembangkan sebuah sistem yang dapat mengklasifikasikan dokumen karya akhir mahasiswa berdasarkan abstrak karya akhir menggunakan algoritma Naïve Bayes Classifier (NBC). Sehingga, dapat memudahkan pengklasifikasian dokumen karya akhir  di Jurusan Teknik Elektro. Dalam penelitian ini menggunakan metode eksperimen dan menggunakan 100 dokumen abstrak, 90 dokumen sebagai data train dan 10 dokumen sebagai data test. Data diambil dari skripsi mahasiswa Jurusan Teknik Elektro Universitas Negeri Jakarta dari 14 Maret 2014 sampai dengan 27 Maret 2014. Setelah melakukan proses pengembangan perangkat lunak, dihasilkan sebuah sistem klasifikasi yang bernama Sistem Klasifikasi Dokumen Skripsi. Sistem di implementasi menggunakan PHP dan MySQL, dan diuji menggunakan K-Fold Cross Validation (10 Fold). Berdasarkan pada hasil uji Sistem didapatkan hasil tingkat akurasi sebesar 81%. Oleh karena itu, dapat disimpulkan bahwa Sistem Klasifikasi Dokumen Abstrak Karya Akhir Menggunakan Algoritma Naïve Bayes di Jurusan Teknik Elektro telah berhasil dikembangkan.


Sign in / Sign up

Export Citation Format

Share Document