scholarly journals Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta

2017 ◽  
Vol 1 (1) ◽  
pp. 31-38
Author(s):  
Nur Indah Pratiwi ◽  
Widodo .

Dokumen karya akhir di Jurusan Teknik Elektro Universitas Negeri Jakarta setiap tahunnya bertambah, pengklasifikasian dokumen menjadi hal yang sangat penting untuk mengorganisasikan dokumen sehingga dapat memudahkan pencarian. Pengembangan Sistem klasifikasi dokumen bertujuan untuk mengembangkan sebuah sistem yang dapat mengklasifikasikan dokumen karya akhir mahasiswa berdasarkan abstrak karya akhir menggunakan algoritma Naïve Bayes Classifier (NBC). Sehingga, dapat memudahkan pengklasifikasian dokumen karya akhir  di Jurusan Teknik Elektro. Dalam penelitian ini menggunakan metode eksperimen dan menggunakan 100 dokumen abstrak, 90 dokumen sebagai data train dan 10 dokumen sebagai data test. Data diambil dari skripsi mahasiswa Jurusan Teknik Elektro Universitas Negeri Jakarta dari 14 Maret 2014 sampai dengan 27 Maret 2014. Setelah melakukan proses pengembangan perangkat lunak, dihasilkan sebuah sistem klasifikasi yang bernama Sistem Klasifikasi Dokumen Skripsi. Sistem di implementasi menggunakan PHP dan MySQL, dan diuji menggunakan K-Fold Cross Validation (10 Fold). Berdasarkan pada hasil uji Sistem didapatkan hasil tingkat akurasi sebesar 81%. Oleh karena itu, dapat disimpulkan bahwa Sistem Klasifikasi Dokumen Abstrak Karya Akhir Menggunakan Algoritma Naïve Bayes di Jurusan Teknik Elektro telah berhasil dikembangkan.

2019 ◽  
Vol 5 (2) ◽  
pp. 108-117
Author(s):  
Herfia Rhomadhona ◽  
Jaka Permadi

Berita kriminalitas merupakan berita yang selalu menjadi trending topik di setiap media massa, khususnya media massa online. Media massa online terlah menyediakan beberapa fasilitas untuk mempermudah masyarakan dalam mencari sebuah berita berdasarkan topik. Media massa online melabeli suatu berita berdasarkan kategorinya. Namun, media massa online tidak memberikan sub kategori pada berita tersebut. Sebagai contoh jika seorang pengguna membuka kategori kriminal, maka yang ditampilkan adalah semua jenis berita kriminal tanpa memberikan informasi yang spesifik dari jenis kriminalitasnya. Permasalahan tersebut dapat diatasi dengan mengklasifikasikan berita kriminalitas berdasarkan subkategori. Penelitian ini menggunakan metode Naïve Bayes Classifier (NBC)  untuk mengklasifikasi berita berdasarkan sub kategorinya. Adapun subkategori terbagi kedalam 5 kategori yaitu korupsi, narkoba, pencurian, pemerkosaan dan pembunuhan. Penelitian ini bertujuan untuk mengetahui kemampuan NBC dalam mengklasifikasi berita dengan melakukan pengujian menggunakan teknik K-Fold Cross Validation dengan nilai K dari 3 sampai 10. Hasil pengujian menyatakan bahwa NBC memiliki kemampuan dalam klasifikasi berita kriminal dengan nilai precision sebesar 98,53 %, nilai recall sebesar 98,44 % dan nilai accuracy sebesar 99,38 %.


2016 ◽  
Vol 43 (2) ◽  
pp. 159-173 ◽  
Author(s):  
Amer Al-Badarneh ◽  
Emad Al-Shawakfa ◽  
Basel Bani-Ismail ◽  
Khaleel Al-Rababah ◽  
Safwan Shatnawi

This paper investigates the impact of using different indexing approaches (full-word, stem, and root) when classifying Arabic text. In this study, the naïve Bayes classifier is used to construct the multinomial classification models and is evaluated using stratified k-fold cross-validation ( k ranges from 2 to 10). It is also uses a corpus that consists of 1000 normalized Arabic documents. The results of one experiment in this study show that significant accuracy improvements have occurred when the full-word form is used in most k-folds. Further experiments show that the classifier has achieved the highest accuracy in the eight-fold by using 7/8–1/8 train–test ratio, despite the indexing approach being used. The overall results of this study show that the classifier has achieved the maximum micro-average accuracy 99.36%, either by using the full-word form or the stem form. This proves that the stem is a better choice to use when classifying Arabic text, because it makes the corpus dataset smaller and this will enhance both the processing time and storage utilization, and achieve the highest level of accuracy.


2018 ◽  
Vol 1 (2) ◽  
pp. 70-75
Author(s):  
Abdul Rozaq

Building materials is an important factor to built a house, to estimate funds the needs of build a house, consumers or developers can estimate the funds needed to build a house. To solve these problems use case base reasoning (CBR) approach, which method is capable of reasoning or solving the problem based on the cases that have been there as a solution to new problems. The system built in this study is a CBR system for determine the needs of house building materials. The consultation process is done by inserting new cases compared to the old case similarity value is then calculated using the nearest neighbor. The first test by inserting test data then compared with each type of home then obtained an accuracy of 83.6%. The second test is done by K-fold Cross Validation with K = 25 with the number of data 200, the data will be divided into two parts, namely the training data and test data, training data as many as 192 data and test data as many as 8 data. K-Fold Cross Validation method. This CBR system can produce an accuracy of 85.71%


Author(s):  
Acep Saepulrohman ◽  
Sudin Saepudin ◽  
Dudih Gustian

Teknologi informasi dan komunikasi saat ini sangat berkembang pesat, salah satunya Aplikasi Chat atau pesan instan seperti WhatsApp, Line dan Telegram. Pada bulan Oktober 2020, mayoritas pengguna aplikasi pesan instan adalah pengguna aplikasi WhatsApp, dengan total 2 miliar pengguna. Sekalipun aplikasi whatsapp tersebut masuk dalam peringkat teratas dan mendapat skor tertinggi, akan tetapi hal tersebut tidak dapat dijadikan tolak ukur kepuasan karena masih terdapat pandangan yang negatif terhadap aplikasi whatsapp, sebagian pengguna menganggap bahwa whatsapp seringkali eror pada saat digunakan, kemudian masalah lain yang muncul seperti jaringan yang digunakan pengguna tidak stabil. Untuk melakukan analisis mengenai hal tersebut diperlukan pendekatan analisis sentimen guna mengkategorikan komentar pengguna menjadi positif atau negatif. Penelitian ini menggunakan algoritma Naïve Bayes dengan Support Vector Machine dalam menganalisa komentar positif dan negatif terhadap kepuasan pengguna aplikasi Whatsapp di Google Play Store. Dari hasil pengujian yang dilakukan terhadap 1500 data komentar pengguna, evaluasi model menggunakan 10 Fold Cross Validation menunjukan bahwa tingkat keakurasian untuk kepuasan pengguna aplikasi whatsapp berdasarkan algoritma Naïve Bayes adalah sebesar 70,40% dan Support Vector Machine sebesar 77,00%, sedangkan nilai AUC Naïve Bayes sebesar 0,585 dan Support Vector Machine adalah  0,876. Dari hasil tersebut algoritma Support Vector Machine dapat digunakan untuk penelitian dengan karakteristik  data yang sama.


2019 ◽  
Vol 3 (1) ◽  
pp. 54-62
Author(s):  
Razi Aziz Syahputro ◽  
Widodo ◽  
Hamidillah Ajie

Penelitian ini dilatarbelakangi dengan dibutuhkannya sistem pengklasifikasian untuk memudahkan pihak Jurusan Teknik Elektro khususnya Program Studi PTIK untuk mengklasifikasikan judul skripsi berdasarkan peminatan. Sebelum sistem dibuat diperlukan pertimbangan dari beberapa algoritma klasifikasi yang ada, maka dari itu penelitian ini memilih 3 algoritma dari 10 algoritma terbaik menurut ICDM tahun 2006. Klasifikasi terhadap dokumen teks pendek seperti judul skripsi mahasiswa memiliki kesulitan tersendiri daripada dokumen teks panjang karena semakin sedikit kata semakin sulit diklasifikasi. Sehingga tujuan dari penelitian ini adalah untuk mengetahui algoritma yang paling efektif untuk mengklasifikasi judul skripsi. Penelitian ini terdiri dari beberapa tahap yaitu pengumpulan data, pengelompokan data melalui angket oleh dosen ahli, pre-processing text, pembobotan kata menggunakan vector space model dan tf-idf, evaluasi dengan k-fold cross validation, klasifikasi menggunakan k-nearest neighbor, naïve bayes classifier, dan support vector machine, dan analisis dengan confusion matrix. Percobaan dilakukan dengan menggunakan 266 data judul skripsi mahasiswa PTIK UNJ dari angkatan 2010-2013, dengan data terakhir berasal dari sidang skripsi pada semester 105(semester ganjil 2016/2017). Hasil dari klasifikasi menggunakan algoritma tersebut didapatkan algoritma yang paling efisien yaitu support vector machine dengan akurasi 82% dari 10 kali percobaan.


2021 ◽  
Vol 6 (2) ◽  
pp. 78-89
Author(s):  
Asep Hendra ◽  
Fitriyani Fitriyani

Healthcare service has the role to help and serve people to access medical services, i.e. providing medicines, medical consultation, or health control. Healthcare service has been transforming to a digital platform. Halodoc is one of the digital platforms that people can use for free or paid, user can also give reviews of Halodoc’s performance and services on Google Play Store to give feedback that Halodoc can use to evaluate and improve the app. The Google Play Store review is increasing every day. Therefore an analysis for the review with sentiment analysis for Halodoc’s review is needed, first phase of sentiment analysis for the review is preprocessing which has tokenization, transform to lower cases, filter stopword, dan filter token (by length) processes. The data is divided into two positive and negative classes with cross-validation and a k-fold validation value of 10, using Naïve Bayes Classifier algorithm with 81,68% accuracy and AUC 0.756, categorized as fair classification.


2019 ◽  
Vol 9 (2) ◽  
Author(s):  
Reza Ade Putra

<p class="SammaryHeader" align="center"><strong><em>Abstract</em></strong></p><p><em>Uang Kuliah Tunggal hereinafter abbreviated as UKT is part of a single tuition fees</em><em> incurred by each student in each department or study program for diploma and degree courses. UKT is the amount of fees to be paid by the student in each semester. </em><em>Basically, the purpose of UKT is to charge tuition fees according to income and family circumstances students.</em><em> However, there is a problem regarding the classification UKT improperly. It is caused by several factors, including determining UKT groups still use manual method, as well as the substance of subjectivity in the determination of a new student UKT  groups. Based on these problems, we need a decision support system that can help in determining the UKT group of new students. In applying UKT, Cot Kala IAIN Zawiyah Langsa split into 3 (three) categories UKT group. Naïve Bayes classifier methods is used to classify data into three UKT groups. Research results show that the results of validation testing of NBC classification model with a 3-fold cross validation generates an average accuracy of 86.67%. so that it can be concluded that the level of effectiveness of the UKT classification model with the NBC method is included in the fairly good category.</em></p><p><strong><em>Keyword</em></strong><strong><em>s : </em></strong><em>UKT Groups, Naive Bayes Classifier, K-fold cross validation</em><em></em></p><p><em> </em></p><p class="SammaryHeader" align="center"><strong><em>Abstra</em><em>k</em></strong></p><p><em>Uang Kuliah Tunggal yang selanjutnya disingkat UKT merupakan sebagian dari biaya</em><em> kuliah tunggal yang ditanggung oleh setiap mahasiswa pada setiap jurusan atau program studi untuk program diploma dan program sarjana. UKT merupakan besaran biaya yang harus dibayarkan oleh mahasiswa pada setiap semester. </em><em>Pada dasarnya, tujuan diberlakukannya UKT yaitu untuk membebankan biaya kuliah sesuai dengan penghasilan dan kondisi keluarga mahasiswa yang bersangkutan. Akan tetapi, terjadi permasalahan tentang penggolongan UKT yang tidak tepat. Ini disebabkan oleh beberapa faktor, diantaranya dalam menentukan kelompok UKT masih menggunakan cara manual, serta adanya unsur subjektivitas dalam penentuan kelompok UKT mahasiswa baru. Berdasarkan permasalahan tersebut, dibutuhkan suatu sistem pendukung keputusan yang dapat membantu dalam menentukan kelompok UKT mahasiswa baruDalam menerapkan Uang Kuliah Tunggal, IAIN Zawiyah Cot Kala Langsa membagi kedalam 3 (Tiga) kategori kelompok UKT . Metode Naïve Bayes Classifier digunakan untuk mengklasifikasikan data menjadi tiga kelompok UKT. Hasil penelitian menunjukkan bahwa hasil validasi pengujian model klasifikasi NBC dengan 3- fold cross validation menghasilkan rata-rata akurasi sebesar 86.67%, sehingga dapat disimpulkan bahwa tingkat efektivitas model klasifikasi UKT dengan metode NBC termasuk pada kategori cukup baik.</em><em>.</em></p><strong><em>Kata kunci : </em></strong><em>Kelompok UKT, Naive Bayes Classifier, K-fold cross validation</em>


2021 ◽  
Vol 7 (2) ◽  
pp. 165-173
Author(s):  
Harliana Harliana ◽  
Fatra Nonggala Putra

Secara definisi kemiskinan merupakan suatu kondisi individu ditingkat rumah tangga yang dinilai berdasarkan karaktersitik kemiskinan. Sebagai dampak dari pandemi covid-19 prosentase rumah tangga miskin di Indonesia meningkat sekitar 9,78%. Berdasarkan hal tersebut, maka penelitian ini akan melakukan klasifikasi dengan algoritma Naïve Bayes Classification untuk menentukan rumah tangga miskin melalui parameter survey ekonomi Nasional Tahun 2020 Modul Ketahanan Sosial yang berfokus pada pengeluaran dan konsumsi perkapita responden selama pandemic. Sedangkan tujuan dari penelitian ini adalah mendapatkan akurasi tertinggi yang dihasilkan oleh Naïve Bayes Classification dalam penentuan rumah tangga miskin. Menurut hasil pengujian dengan confusion matrix dan 10-fold cross validation didapatkan bahwa rata-rata akurasi tertinggi terjadi pada fold ke-10 dengan nilai accuracy 93,21%; precision 86,3%; dan recall 80,11%. Hal ini berarti bahwa akurasi yang dihasilkan oleh naïve bayes classifier dalam melakukan clasifikasi rumah tangga miskin cukup tinggi


2019 ◽  
Vol 2 (1) ◽  
pp. 88-98 ◽  
Author(s):  
Muhammad Zidny Naf'an ◽  
Alhamda Adisoka Bimantara ◽  
Afiatari Larasati ◽  
Ezar Mega Risondang ◽  
Novanda Alim Setya Nugraha

Instagram is a social media for sharing images, photos and videos. Instagram has many active users from various circles. In addition to sharing submissions, Instagram users can also give likes and comments to other users' posts. However, the comment feature is often misused, for example it is used for cyberbullying which includes one act against the law. But until now, Instagram still does not provide a feature to detect cyberbullying. Therefore, this study aims to create a system that can classify comments whether they contain elements of cyberbullying or not. The results of the classification will be used to detect cyberbullying comments. The algorithm used for classification is Naïve Bayes Classifier. Then for each comment will pass the preprocessing and feature extraction stages with the TF-IDF method. For evaluation and testing using the K-Fold Cross Validation method. The experiment is divided into two, namely using stemming and without stemming. The training data used is 455 data. The best experimental results obtained an accuracy of 84% both with stemming, and without stemming.


Author(s):  
Dhaifa Farah Zhafira ◽  
Bayu Rahayudi ◽  
Indriati Indriati

Kebijakan Kampus Merdeka merupakan salah satu kebijakan baru yang digagas oleh Menteri Pendidikan dan Kebudayaan Republik Indonesia (Mendikbud RI). Kebijakan tersebut tengah ramai disorot publik khususnya pada platform Youtube berkaitan dengan video unggahan Mendikbud di kanalnya.  Pada Youtube, opini masyarakat dapat membanjiri kolom komentar dalam sekejap karena kemunculannya sebagai platform pertama yang menawarkan fasilitas konten audio visual. Penelitian ini mencoba menganalisis opini masyarakat yang tertampung dalam kolom komentar Youtube ke dalam klasifikasi sentimen positif dan negatif. Klasifikasi diimplementasikan pada Google Colaboratory yang berbasis bahasa Python dan Jupyter Notebook dengan algoritme Naive Bayes Classifier serta pembobotan kata Term Frequency Inverse Document Frequency (TF-IDF). 5 proses utama dalam penelitian ini yang meliputi pelabelan manual, text preprocessing, pembobotan TF-IDF, validasi data menggunakan k-fold cross validation, dan klasifikasi. Hasil akurasi terbaik sebesar 97% yang didapat dengan menggunakan 900 data latih, 100 data uji, menerapkan pembobotan TF-IDF, dan 10-fold cross validation. Rata-rata akurasi yang didapat dari 10 iterasi pada k-fold cross validation yaitu sebesar 91.8% dengan nilai precision, recall, f-measure sebesar 90.35%, 93.6%, 91.95%. Berdasarkan hasil tersebut, Naive Bayes Classifier cukup baik sebagai alternatif untuk analisis sentimen.


Sign in / Sign up

Export Citation Format

Share Document