Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan NaÃ¯ve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta

Nur Indah Pratiwi; Widodo .

doi:10.21009/pinter.1.1.5

Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan NaÃ¯ve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta

PINTER Jurnal Pendidikan Teknik Informatika dan Komputer ◽

10.21009/pinter.1.1.5 ◽

2017 ◽

Vol 1 (1) ◽

pp. 31-38

Author(s):

Nur Indah Pratiwi ◽

Widodo .

Keyword(s):

Test Data ◽

Cross Validation ◽

Bayes Classifier ◽

Ve Bayes ◽

Fold Cross Validation

Dokumen karya akhir di Jurusan Teknik Elektro Universitas Negeri Jakarta setiap tahunnya bertambah, pengklasifikasian dokumen menjadi hal yang sangat penting untuk mengorganisasikan dokumen sehingga dapat memudahkan pencarian. Pengembangan Sistem klasifikasi dokumen bertujuan untuk mengembangkan sebuah sistem yang dapat mengklasifikasikan dokumen karya akhir mahasiswa berdasarkan abstrak karya akhir menggunakan algoritma NaÃ¯ve Bayes Classifier (NBC). Sehingga, dapat memudahkan pengklasifikasian dokumen karya akhir di Jurusan Teknik Elektro. Dalam penelitian ini menggunakan metode eksperimen dan menggunakan 100 dokumen abstrak, 90 dokumen sebagai data train dan 10 dokumen sebagai data test. Data diambil dari skripsi mahasiswa Jurusan Teknik Elektro Universitas Negeri Jakarta dari 14 Maret 2014 sampai dengan 27 Maret 2014. Setelah melakukan proses pengembangan perangkat lunak, dihasilkan sebuah sistem klasifikasi yang bernama Sistem Klasifikasi Dokumen Skripsi. Sistem di implementasi menggunakan PHP dan MySQL, dan diuji menggunakan K-Fold Cross Validation (10 Fold). Berdasarkan pada hasil uji Sistem didapatkan hasil tingkat akurasi sebesar 81%. Oleh karena itu, dapat disimpulkan bahwa Sistem Klasifikasi Dokumen Abstrak Karya Akhir Menggunakan Algoritma NaÃ¯ve Bayes di Jurusan Teknik Elektro telah berhasil dikembangkan.

Download Full-text

Klasifikasi Berita Kriminal Menggunakan NaÃ¯ve Bayes Classifier (NBC) dengan Pengujian K-Fold Cross Validation

Jurnal Sains dan Informatika ◽

10.34128/jsi.v5i2.177 ◽

2019 ◽

Vol 5 (2) ◽

pp. 108-117

Author(s):

Herfia Rhomadhona ◽

Jaka Permadi

Keyword(s):

Cross Validation ◽

Online Media ◽

Bayes Classifier ◽

Ve Bayes ◽

Fold Cross Validation

Berita kriminalitas merupakan berita yang selalu menjadi trending topik di setiap media massa, khususnya media massa online. Media massa online terlah menyediakan beberapa fasilitas untuk mempermudah masyarakan dalam mencari sebuah berita berdasarkan topik. Media massa online melabeli suatu berita berdasarkan kategorinya. Namun, media massa online tidak memberikan sub kategori pada berita tersebut. Sebagai contoh jika seorang pengguna membuka kategori kriminal, maka yang ditampilkan adalah semua jenis berita kriminal tanpa memberikan informasi yang spesifik dari jenis kriminalitasnya. Permasalahan tersebut dapat diatasi dengan mengklasifikasikan berita kriminalitas berdasarkan subkategori. Penelitian ini menggunakan metode NaÃ¯ve Bayes Classifier (NBC) untuk mengklasifikasi berita berdasarkan sub kategorinya. Adapun subkategori terbagi kedalam 5 kategori yaitu korupsi, narkoba, pencurian, pemerkosaan dan pembunuhan. Penelitian ini bertujuan untuk mengetahui kemampuan NBC dalam mengklasifikasi berita dengan melakukan pengujian menggunakan teknik K-Fold Cross Validation dengan nilai K dari 3 sampai 10. Hasil pengujian menyatakan bahwa NBC memiliki kemampuan dalam klasifikasi berita kriminal dengan nilai precision sebesar 98,53 %, nilai recall sebesar 98,44 % dan nilai accuracy sebesar 99,38 %.

Download Full-text

The impact of indexing approaches on Arabic text classification

Journal of Information Science ◽

10.1177/0165551515625030 ◽

2016 ◽

Vol 43 (2) ◽

pp. 159-173 ◽

Cited By ~ 10

Author(s):

Amer Al-Badarneh ◽

Emad Al-Shawakfa ◽

Basel Bani-Ismail ◽

Khaleel Al-Rababah ◽

Safwan Shatnawi

Keyword(s):

Cross Validation ◽

Arabic Text ◽

Word Form ◽

Bayes Classifier ◽

Stem Form ◽

Average Accuracy ◽

Arabic Text Classification ◽

The Impact ◽

And Storage ◽

Fold Cross Validation

This paper investigates the impact of using different indexing approaches (full-word, stem, and root) when classifying Arabic text. In this study, the naïve Bayes classifier is used to construct the multinomial classification models and is evaluated using stratified k-fold cross-validation ( k ranges from 2 to 10). It is also uses a corpus that consists of 1000 normalized Arabic documents. The results of one experiment in this study show that significant accuracy improvements have occurred when the full-word form is used in most k-folds. Further experiments show that the classifier has achieved the highest accuracy in the eight-fold by using 7/8–1/8 train–test ratio, despite the indexing approach being used. The overall results of this study show that the classifier has achieved the maximum micro-average accuracy 99.36%, either by using the full-word form or the stem form. This proves that the stem is a better choice to use when classifying Arabic text, because it makes the corpus dataset smaller and this will enhance both the processing time and storage utilization, and achieve the highest level of accuracy.

Download Full-text

CASE BASE REASONING UNTUK MENENTUKAN KEBUTUHAN BAHAN BANGUNAN RUMAH

SINTECH (Science and Information Technology) Journal ◽

10.31598/sintechjournal.v2i1.224 ◽

2018 ◽

Vol 1 (2) ◽

pp. 70-75

Author(s):

Abdul Rozaq

Keyword(s):

Test Data ◽

Building Materials ◽

Cross Validation ◽

Nearest Neighbor ◽

Training Data ◽

Consultation Process ◽

Case Base ◽

Case Base Reasoning ◽

House Building ◽

Fold Cross Validation

Building materials is an important factor to built a house, to estimate funds the needs of build a house, consumers or developers can estimate the funds needed to build a house. To solve these problems use case base reasoning (CBR) approach, which method is capable of reasoning or solving the problem based on the cases that have been there as a solution to new problems. The system built in this study is a CBR system for determine the needs of house building materials. The consultation process is done by inserting new cases compared to the old case similarity value is then calculated using the nearest neighbor. The first test by inserting test data then compared with each type of home then obtained an accuracy of 83.6%. The second test is done by K-fold Cross Validation with K = 25 with the number of data 200, the data will be divided into two parts, namely the training data and test data, training data as many as 192 data and test data as many as 8 data. K-Fold Cross Validation method. This CBR system can produce an accuracy of 85.71%

Download Full-text

Analisis Sentimen Kepuasan Pengguna Aplikasi Whatsapp Menggunakan Algoritma NaÃ¯ve Bayes Dan Support Vector Machine

is The Best [Accounting Information System & Information Technology Business Enterprise] ◽

10.34010/aisthebest.v6i2.4919 ◽

2021 ◽

Vol 6 (2) ◽

pp. 91-105

Author(s):

Acep Saepulrohman ◽

Sudin Saepudin ◽

Dudih Gustian

Keyword(s):

Support Vector Machine ◽

Cross Validation ◽

Support Vector ◽

Ve Bayes ◽

Google Play ◽

Fold Cross Validation

Teknologi informasi dan komunikasi saat ini sangat berkembang pesat, salah satunya Aplikasi Chat atau pesan instan seperti WhatsApp, Line dan Telegram. Pada bulan Oktober 2020, mayoritas pengguna aplikasi pesan instan adalah pengguna aplikasi WhatsApp, dengan total 2 miliar pengguna. Sekalipun aplikasi whatsapp tersebut masuk dalam peringkat teratas dan mendapat skor tertinggi, akan tetapi hal tersebut tidak dapat dijadikan tolak ukur kepuasan karena masih terdapat pandangan yang negatif terhadap aplikasi whatsapp, sebagian pengguna menganggap bahwa whatsapp seringkali eror pada saat digunakan, kemudian masalah lain yang muncul seperti jaringan yang digunakan pengguna tidak stabil. Untuk melakukan analisis mengenai hal tersebut diperlukan pendekatan analisis sentimen guna mengkategorikan komentar pengguna menjadi positif atau negatif. Penelitian ini menggunakan algoritma NaÃ¯ve Bayes dengan Support Vector Machine dalam menganalisa komentar positif dan negatif terhadap kepuasan pengguna aplikasi Whatsapp di Google Play Store. Dari hasil pengujian yang dilakukan terhadap 1500 data komentar pengguna, evaluasi model menggunakan 10 Fold Cross Validation menunjukan bahwa tingkat keakurasian untuk kepuasan pengguna aplikasi whatsapp berdasarkan algoritma NaÃ¯ve Bayes adalah sebesar 70,40% dan Support Vector Machine sebesar 77,00%, sedangkan nilai AUC NaÃ¯ve Bayes sebesar 0,585 dan Support Vector Machine adalah 0,876. Dari hasil tersebut algoritma Support Vector Machine dapat digunakan untuk penelitian dengan karakteristik data yang sama.

Download Full-text

Bayes Classifier dan Support Vector Machine dalam Klasifikasi Judul Karya Akhir Mahasiswa Program Studi PTIK UNJ

PINTER Jurnal Pendidikan Teknik Informatika dan Komputer ◽

10.21009/pinter.3.1.9 ◽

2019 ◽

Vol 3 (1) ◽

pp. 54-62

Author(s):

Razi Aziz Syahputro ◽

Widodo ◽

Hamidillah Ajie

Keyword(s):

Support Vector Machine ◽

Cross Validation ◽

Nearest Neighbor ◽

Confusion Matrix ◽

Vector Space Model ◽

Support Vector ◽

Bayes Classifier ◽

K Nearest Neighbor ◽

Space Model ◽

Fold Cross Validation

Penelitian ini dilatarbelakangi dengan dibutuhkannya sistem pengklasifikasian untuk memudahkan pihak Jurusan Teknik Elektro khususnya Program Studi PTIK untuk mengklasifikasikan judul skripsi berdasarkan peminatan. Sebelum sistem dibuat diperlukan pertimbangan dari beberapa algoritma klasifikasi yang ada, maka dari itu penelitian ini memilih 3 algoritma dari 10 algoritma terbaik menurut ICDM tahun 2006. Klasifikasi terhadap dokumen teks pendek seperti judul skripsi mahasiswa memiliki kesulitan tersendiri daripada dokumen teks panjang karena semakin sedikit kata semakin sulit diklasifikasi. Sehingga tujuan dari penelitian ini adalah untuk mengetahui algoritma yang paling efektif untuk mengklasifikasi judul skripsi. Penelitian ini terdiri dari beberapa tahap yaitu pengumpulan data, pengelompokan data melalui angket oleh dosen ahli, pre-processing text, pembobotan kata menggunakan vector space model dan tf-idf, evaluasi dengan k-fold cross validation, klasifikasi menggunakan k-nearest neighbor, naïve bayes classifier, dan support vector machine, dan analisis dengan confusion matrix. Percobaan dilakukan dengan menggunakan 266 data judul skripsi mahasiswa PTIK UNJ dari angkatan 2010-2013, dengan data terakhir berasal dari sidang skripsi pada semester 105(semester ganjil 2016/2017). Hasil dari klasifikasi menggunakan algoritma tersebut didapatkan algoritma yang paling efisien yaitu support vector machine dengan akurasi 82% dari 10 kali percobaan.

Download Full-text

Analisis Sentimen Review Halodoc Menggunakan Nai ̈ve Bayes Classifier

JISKA (Jurnal Informatika Sunan Kalijaga) ◽

10.14421/jiska.2021.6.2.78-89 ◽

2021 ◽

Vol 6 (2) ◽

pp. 78-89

Author(s):

Asep Hendra ◽

Fitriyani Fitriyani

Keyword(s):

Sentiment Analysis ◽

Healthcare Service ◽

Cross Validation ◽

Medical Consultation ◽

Bayes Classifier ◽

Digital Platforms ◽

Digital Platform ◽

Ve Bayes ◽

Health Control ◽

Google Play

Healthcare service has the role to help and serve people to access medical services, i.e. providing medicines, medical consultation, or health control. Healthcare service has been transforming to a digital platform. Halodoc is one of the digital platforms that people can use for free or paid, user can also give reviews of Halodoc’s performance and services on Google Play Store to give feedback that Halodoc can use to evaluate and improve the app. The Google Play Store review is increasing every day. Therefore an analysis for the review with sentiment analysis for Halodoc’s review is needed, first phase of sentiment analysis for the review is preprocessing which has tokenization, transform to lower cases, filter stopword, dan filter token (by length) processes. The data is divided into two positive and negative classes with cross-validation and a k-fold validation value of 10, using Naïve Bayes Classifier algorithm with 81,68% accuracy and AUC 0.756, categorized as fair classification.

Download Full-text

Penerapan Naïve Bayes Classifier dengan Gaussian Function Untuk Menentukan Kelompok UKT

Jurnal Ilmiah Informatika Global ◽

10.36982/jig.v9i2.583 ◽

2019 ◽

Vol 9 (2) ◽

Author(s):

Reza Ade Putra

Keyword(s):

Cross Validation ◽

Naive Bayes ◽

Gaussian Function ◽

Naïve Bayes ◽

Classification Model ◽

Naive Bayes Classifier ◽

Bayes Classifier ◽

Tuition Fees ◽

Naïve Bayes Classifier ◽

Fold Cross Validation

AbstractUang Kuliah Tunggal hereinafter abbreviated as UKT is part of a single tuition fees incurred by each student in each department or study program for diploma and degree courses. UKT is the amount of fees to be paid by the student in each semester. Basically, the purpose of UKT is to charge tuition fees according to income and family circumstances students. However, there is a problem regarding the classification UKT improperly. It is caused by several factors, including determining UKT groups still use manual method, as well as the substance of subjectivity in the determination of a new student UKT groups. Based on these problems, we need a decision support system that can help in determining the UKT group of new students. In applying UKT, Cot Kala IAIN Zawiyah Langsa split into 3 (three) categories UKT group. Naïve Bayes classifier methods is used to classify data into three UKT groups. Research results show that the results of validation testing of NBC classification model with a 3-fold cross validation generates an average accuracy of 86.67%. so that it can be concluded that the level of effectiveness of the UKT classification model with the NBC method is included in the fairly good category.Keywords : UKT Groups, Naive Bayes Classifier, K-fold cross validation AbstrakUang Kuliah Tunggal yang selanjutnya disingkat UKT merupakan sebagian dari biaya kuliah tunggal yang ditanggung oleh setiap mahasiswa pada setiap jurusan atau program studi untuk program diploma dan program sarjana. UKT merupakan besaran biaya yang harus dibayarkan oleh mahasiswa pada setiap semester. Pada dasarnya, tujuan diberlakukannya UKT yaitu untuk membebankan biaya kuliah sesuai dengan penghasilan dan kondisi keluarga mahasiswa yang bersangkutan. Akan tetapi, terjadi permasalahan tentang penggolongan UKT yang tidak tepat. Ini disebabkan oleh beberapa faktor, diantaranya dalam menentukan kelompok UKT masih menggunakan cara manual, serta adanya unsur subjektivitas dalam penentuan kelompok UKT mahasiswa baru. Berdasarkan permasalahan tersebut, dibutuhkan suatu sistem pendukung keputusan yang dapat membantu dalam menentukan kelompok UKT mahasiswa baruDalam menerapkan Uang Kuliah Tunggal, IAIN Zawiyah Cot Kala Langsa membagi kedalam 3 (Tiga) kategori kelompok UKT . Metode Naïve Bayes Classifier digunakan untuk mengklasifikasikan data menjadi tiga kelompok UKT. Hasil penelitian menunjukkan bahwa hasil validasi pengujian model klasifikasi NBC dengan 3- fold cross validation menghasilkan rata-rata akurasi sebesar 86.67%, sehingga dapat disimpulkan bahwa tingkat efektivitas model klasifikasi UKT dengan metode NBC termasuk pada kategori cukup baik..Kata kunci : Kelompok UKT, Naive Bayes Classifier, K-fold cross validation

Download Full-text

Klasifikasi Tingkat Rumah Tangga Miskin Saat Pandemi Dengan Naïve Bayes Classifier

Jurnal Sains dan Informatika ◽

10.34128/jsi.v7i2.339 ◽

2021 ◽

Vol 7 (2) ◽

pp. 165-173

Author(s):

Harliana Harliana ◽

Fatra Nonggala Putra

Keyword(s):

Cross Validation ◽

Naive Bayes ◽

Confusion Matrix ◽

Naïve Bayes ◽

Naive Bayes Classifier ◽

Bayes Classifier ◽

Naïve Bayes Classifier ◽

Naive Bayes Classification ◽

Naïve Bayes Classification ◽

Fold Cross Validation

Secara definisi kemiskinan merupakan suatu kondisi individu ditingkat rumah tangga yang dinilai berdasarkan karaktersitik kemiskinan. Sebagai dampak dari pandemi covid-19 prosentase rumah tangga miskin di Indonesia meningkat sekitar 9,78%. Berdasarkan hal tersebut, maka penelitian ini akan melakukan klasifikasi dengan algoritma Naïve Bayes Classification untuk menentukan rumah tangga miskin melalui parameter survey ekonomi Nasional Tahun 2020 Modul Ketahanan Sosial yang berfokus pada pengeluaran dan konsumsi perkapita responden selama pandemic. Sedangkan tujuan dari penelitian ini adalah mendapatkan akurasi tertinggi yang dihasilkan oleh Naïve Bayes Classification dalam penentuan rumah tangga miskin. Menurut hasil pengujian dengan confusion matrix dan 10-fold cross validation didapatkan bahwa rata-rata akurasi tertinggi terjadi pada fold ke-10 dengan nilai accuracy 93,21%; precision 86,3%; dan recall 80,11%. Hal ini berarti bahwa akurasi yang dihasilkan oleh naïve bayes classifier dalam melakukan clasifikasi rumah tangga miskin cukup tinggi

Download Full-text

Sentiment Analysis of Cyberbullying on Instagram User Comments

Journal of Data Science and Its Applications ◽

10.21108/jdsa.2019.2.20 ◽

2019 ◽

Vol 2 (1) ◽

pp. 88-98 ◽

Cited By ~ 1

Author(s):

Muhammad Zidny Naf'an ◽

Alhamda Adisoka Bimantara ◽

Afiatari Larasati ◽

Ezar Mega Risondang ◽

Novanda Alim Setya Nugraha

Keyword(s):

Social Media ◽

Feature Extraction ◽

Sentiment Analysis ◽

Cross Validation ◽

Experimental Results ◽

Training Data ◽

Bayes Classifier ◽

User Comments ◽

One Act ◽

Fold Cross Validation

Instagram is a social media for sharing images, photos and videos. Instagram has many active users from various circles. In addition to sharing submissions, Instagram users can also give likes and comments to other users' posts. However, the comment feature is often misused, for example it is used for cyberbullying which includes one act against the law. But until now, Instagram still does not provide a feature to detect cyberbullying. Therefore, this study aims to create a system that can classify comments whether they contain elements of cyberbullying or not. The results of the classification will be used to detect cyberbullying comments. The algorithm used for classification is Naïve Bayes Classifier. Then for each comment will pass the preprocessing and feature extraction stages with the TF-IDF method. For evaluation and testing using the K-Fold Cross Validation method. The experiment is divided into two, namely using stemming and without stemming. The training data used is 455 data. The best experimental results obtained an accuracy of 84% both with stemming, and without stemming.

Download Full-text

Analisis Sentimen Kebijakan Kampus Merdeka Menggunakan Naive Bayes dan Pembobotan TF-IDF Berdasarkan Komentar pada Youtube

Jurnal Sistem Informasi, Teknologi Informasi, dan Edukasi Sistem Informasi ◽

10.25126/justsi.v2i1.24 ◽

2021 ◽

Vol 2 (1) ◽

Author(s):

Dhaifa Farah Zhafira ◽

Bayu Rahayudi ◽

Indriati Indriati

Keyword(s):

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Naive Bayes Classifier ◽

Bayes Classifier ◽

Naïve Bayes Classifier ◽

Inverse Document Frequency ◽

Document Frequency ◽

Text Preprocessing ◽

Fold Cross Validation

Kebijakan Kampus Merdeka merupakan salah satu kebijakan baru yang digagas oleh Menteri Pendidikan dan Kebudayaan Republik Indonesia (Mendikbud RI). Kebijakan tersebut tengah ramai disorot publik khususnya pada platform Youtube berkaitan dengan video unggahan Mendikbud di kanalnya. Pada Youtube, opini masyarakat dapat membanjiri kolom komentar dalam sekejap karena kemunculannya sebagai platform pertama yang menawarkan fasilitas konten audio visual. Penelitian ini mencoba menganalisis opini masyarakat yang tertampung dalam kolom komentar Youtube ke dalam klasifikasi sentimen positif dan negatif. Klasifikasi diimplementasikan pada Google Colaboratory yang berbasis bahasa Python dan Jupyter Notebook dengan algoritme Naive Bayes Classifier serta pembobotan kata Term Frequency Inverse Document Frequency (TF-IDF). 5 proses utama dalam penelitian ini yang meliputi pelabelan manual, text preprocessing, pembobotan TF-IDF, validasi data menggunakan k-fold cross validation, dan klasifikasi. Hasil akurasi terbaik sebesar 97% yang didapat dengan menggunakan 900 data latih, 100 data uji, menerapkan pembobotan TF-IDF, dan 10-fold cross validation. Rata-rata akurasi yang didapat dari 10 iterasi pada k-fold cross validation yaitu sebesar 91.8% dengan nilai precision, recall, f-measure sebesar 90.35%, 93.6%, 91.95%. Berdasarkan hasil tersebut, Naive Bayes Classifier cukup baik sebagai alternatif untuk analisis sentimen.

Download Full-text