scholarly journals Klasifikasi Berita Menggunakan Algoritma Naive Bayes Classifer Dengan Seleksi Fitur Dan Boosting

2019 ◽  
Vol 3 (2) ◽  
pp. 227-232
Author(s):  
Bobby Suryo Prakoso ◽  
Didi Rosiyadi ◽  
Heru Sukma Utama ◽  
Dedi Aridarma

Penelitian yang dilakukan ini merupakan bagian dari text mining untuk klasifikasi konten berita yang telah memiliki label berdasarkan katagori berita pada situs detik.com . Proses yang dilakukan adalah melakukan permodelan dan pengolahan data, mulai proses pre-processing, proses seleksi fitur information gain, dan penerapan model algoritma Naive Bayes Classifier dengan Bayesian Boosting. Hasil yang diperoleh atas model tersebut mendapatkan nilai evaluasi terhadap akurasi, recall, dan presisi sebesar 73.2%. Sedangkan dengan model yang lebih ringkas yaitu model algoritma Naive Bayes Classifier, dengan Bayesian Boosting mendapatkan nilai evaluasi yang sama besar yaitu 73.2%. Penilaian atas hasil evaluasi model yang telah terlaksankan berkesimpulan bahwa penerapan seleksi fitur Information Gain tidak berpengaruh besar atas kenaikan hasil performa terhadap kondisi label Polynomial.  

SISTEMASI ◽  
2021 ◽  
Vol 10 (1) ◽  
pp. 131
Author(s):  
Nila Hardi ◽  
Yuris Alkahfi ◽  
Popon Handayani ◽  
Windu Gata ◽  
Muhammad Rifqi Firdaus

2019 ◽  
Vol 12 (2) ◽  
pp. 32-38
Author(s):  
Iin Ernawati

This study was conducted to text-based data mining or often called text mining, classification methods commonly used method Naïve bayes classifier (NBC) and support vector machine (SVM). This classification is emphasized for Indonesian language documents, while the relationship between documents is measured by the probability that can be proven with other classification algorithms. This evident from the conclusion that the probability result Naïve Bayes Classifier (NBC) word “party” at least in the economic document and political. Then the result of the algorithm support vector machine (svm) with the word “price” and “kpk” contains in both economic and politic document.  


2016 ◽  
Vol 8 (1) ◽  
Author(s):  
Linda Jayanti ◽  
Steven R. Sentinuwo ◽  
Oktavian A. Lantang ◽  
Agustinus Jacobus

Abstrak - Facebook memungkinkan penggunanya berinteraksi dengan orang yang kita kenal maupun orang yang tidak kita kenal, dimana hal tersebut dapat membuka peluang bagi kejahatan dunia maya seperti, penculikan, perdagangan manusia (trafficking), hingga pembunuhan. IOM mecatat bahwa korban perdagangan orang atau trafficking di Indonesia mencapai 74.616 hingga I juta per tahun, dimana tindak kejahatan teersebut banyak dilakukan melalui facebook sebagai medianya. Data teks (status) yang berada di halaman facebook sangat besar. Dengan menggunakan Teknik pengolahan data dari ilmu Data Mining, terutama di bidangtext mining, penulis memanfaatkannya untuk mengidentifikasi data teks (status facebook) yang terindikasi sebagai proses kejahatan trafficking dengan memakai salah satu teknik klasifikasi dengan teorema naïve bayes classifier (NBC).   Kata kunci : facebook, trafficking, data mining, text mining, klasifikasi, naïve bayes classifier.


Sebatik ◽  
2020 ◽  
Vol 24 (1) ◽  
pp. 1-7
Author(s):  
Aida Indriani

Penggunaan forum sebagai sarana pembelajaran telah banyak digunakan pada kalangan Mahasiswa. Forum digunakan sebagai sarana berdiskusi antar sesama anggota forum untuk membahas materi sesuai dengan judul topik. Judul topik biasanya ditentukan sesuai dengan isi materi yang akan dibahas. Judul topik yang sudah terlalu banyak di dalam sebuah forum dapat berakibat salah dalam pemilihan judul. Salah satu cara untuk mengatasinya yaitu dengan melakukan klasifikasi judul topik secara otomatis sesuai dengan isi materi. Klasifikasi teks dapat diselesaikan dengan menggunakan teknik text mining. Pada proses klasifikasi yang dilakukan yaitu dengan membagi dataset menjadi 2 (dua) bagian menjadi data latih (training) dan data uji (testing). Pada tahapan awal klasifikasi dilakukan proses pre-processing yang diawali dengan tahapan tokenisasi, kemudian dilanjutkan dengan filtering dan diakhiri dengan stemming. Ada beberapa metode yang dapat digunakan dalam klasifikasi teks antara lain naïve bayes classifier (nbc), k-nearest neighbor (k-nn), rocchio, weight adjusted k-nearest neighbor (wa k-nn) dan lain-lain. Pada penelitian ini, penulis membandingkan 2 (dua) metode yaitu nbc dan k-nn. Dari hasil perbandingan kedua metode dapat disimpulkan bahwa metode k-nn lebih baik tingkat akurasinya daripada metode nbc. Hal ini dibuktikan dengan tingkat akurasi sebesar 80% untuk metode k-nn dan sebesar 73% untuk nbc yang dihitung dengan menggunakan metode confusion matrix.


JNANALOKA ◽  
2021 ◽  
pp. 81-86
Author(s):  
Sigit Suryono ◽  
Emha Taufiq Luthfi

Analisis Sentiment merupakan salah satu cabang dari bidang ilmu Text Mining. Analisis sentiment merupakan sumber penting dalam melakukan evaluasi dan pengambilan keputusan terhadap sebuah topik permasalahan. Tujuan utama dari analisis sentiment adalah untuk mengetahui polaritas dari sentiment positif, negatif ataupun netral. Sentiment-sentiment tersebut salah satunya didapatkan dari Twitter. Dalam tulisan ini, tweet-tweet yang berhubungan dengan kata kunci yang dicari dikumpulkan dari Twitter dengan menggunakan API Twitter dan data mentah yang didapatkan diolah dengan menggunakan Natural Language Toolkit pada bahasa pemrograman Python. Setelah diolah selanjutnya akan dilakukan klasifikasi dengan menggunakan Naïve Bayes Classifier untuk mengetahui tingkat akurasi dari proses klasifikasi yang dilakukan. Proses klasifikasi dilakukan dengan RapidMiner. Dari hasil uji coba sebanyak empat kali, didapatkan hasil tingkat akurasi pada percobaan pertama sebesar 62.98%, percobaan kedua sebesar 64.95%, percobaan ketiga sebesar 66.36%, dan percobaan keempat sebesar 66.79%. Dari hasil klasifikasi didapat tingkat persentase sentiment positif sebesar 28%, sentiment negatif sebesar 20% dan sentiment netral sebesar 52%.


Telematika ◽  
2020 ◽  
Vol 17 (2) ◽  
pp. 120
Author(s):  
Firna Sholihuda Sholihuda ◽  
Bambang Yuwono ◽  
Heru Cahya Rustamadji

Tahapan awal skripsi adalah pengajuan proposal skripsi. Proposal skripsi akan diproses untuk menentukan dosen pembimbing, kemudian skripsi dapat dilanjutkan ke tahap penyusunan. Saat ini pengolahan skripsi menggunakan cara manual, dari penentuan dosen pembimbing hingga pengumpulan laporan akhir. Koordinator Skripsi juga harus mencocokkan data proposal dengan data dosen pembimbing secara manual. Maka, penggunaan Sistem Informasi dapat membantu menentukan dosen pembimbing dan sebagai layanan skripsi. Langkah awal dalam menentukan dosen pembimbing adalah mengetahui tema dan konsentrasi proposal skripsi. Untuk mengetahui tema dan konsentrasi proposal dilakukan analisis isi proposal menggunakan metode Text Mining. Text Mining bekerja dengan cara preprocessing menggunakan tokenizing, filtering, dan stemming untuk mendapatkan kata dasar dari setiap kata dalam setiap kalimat. Kemudian melakukan klasifikasi dokumen proposal sesuai dengan tema dan konsentrasi menggunakan algoritma Naïve Bayes Classifier berdasarkan hasil preprocessing. Tema dan konsentrasi merupakan salah satu kriteria penentukan dosen pembimbing menggunakan algoritma Simple Additive Weighting untuk dilakukan perangkingan pembobotan setiap dosen. Berdasarkan hasil penelitian yang telah dilakukan, proses penentuan tema dan konsentrasi dari proposal skripsi mahasiswa dapat membantu dalam melakukan klasifikasi dokumen dengan tingkat akurasi mencapai 78%. Pembobotan dosen pembimbing proposal skripsi sesuai dengan kriteria menunjukkan hasil dengan nilai perangkingan yang beragam sesuai dengan bobot kriteria setiap dosen pembimbing.


2020 ◽  
Vol 10 (2) ◽  
pp. 157
Author(s):  
Siti Khomsah

<p class="JGI-AbstractIsi">Feature extraction plays an important role in the sentiment analysis process, especially of text data. The Naive Bayes Classifier performs well on low feature dimensions. However, the accuracy provided is not optimal. To acquire  optimal machine learning model,  information gain method, evolutionary algorithm, and swarm intelligent algorithm are applied. The objective of this study is to determine the performance of the Particle Swarm Optimization (PSO) to optimize the Naive Bayes Classifier. Vectorization of words is carried out using TF-IDF. In order to produce high PSO performance, the PSO-NBC model is tested with several parameters, namely the number of particles (k = 3), setting of the number of iterations and inertia weight, individual intelligence coefficient (c1 = 1), and social intelligence coefficient (c2 = 2). Inert weight is calculated using the formulation (w = 0.5+ Rand ([- 1,1])). In conclusion, PSO is able to solve the problem space of text-based sentiment analysis. PSO is able to optimize the accuracy of Naive Bayes at a value of 89% to 91.76%. PSO performance is determined by the parameters used, especially the number of particles, the number of iterations, and the weight of inertia. A large number of particles accompanied by an increase in inertia weight can increase accuracy. The number of particles 20-30 has reached the optimal accuracy.</p>


2021 ◽  
Vol 15 (1) ◽  
pp. 131
Author(s):  
Dedi Darwis ◽  
Nery Siskawati ◽  
Zaenal Abidin

Pertumbuhan twitter terus meningkat setiap waktu, sehingga hal tersebut dimanfaatkan para pengguna twitter untuk menyampaikan informasi berupa kritik maupun saran kepada pelayanan yang diberikan BMKG Nasional dengan lebih mudah. Metode yang digunakan dalam penelitian ini adalah klasifikasi data adalah Naïve Bayes Classifier (NBC). Sistem yang dikembangkan dengan menggunakan  data internal yang diambil dari internet/twitter untuk proses penentuan kalimat termasuk opini positif, netral atau negatif. Penentuan tersebut digolongkan sebagai proses pengklasifikasian. Serta menggunakan Application Python 3.74. Hasil Penelitian ini masuk kedalam fined grained sentiment analysis yaitu analisis pada suatu kalimat komentar. Data tersebut akan diproses menggunakan text mining, kemudian dilanjutkan dengan mengklasifikasikan tweet ke dalam tiga kelas, yaitu positif, negatif, dan netral. Klasifikasi ini menggunakan algoritma naive bayes. Klasifikasi dapat memberikan kemudahan bagi pengguna untuk melihat opini positif, negatif, dan netral. Hasil uji akurasi pada metode naive bayes untuk klasifikasi yaitu 69.97%.


Sign in / Sign up

Export Citation Format

Share Document