Analisis Sentimen Masyarakat di Twitter Terkait  Pandemi Covid-19

Yessi Yunitasari; Andi Rahman Putera

doi:10.32664/smatika.v11i01.520

Analisis Sentimen Masyarakat di Twitter Terkait Pandemi Covid-19

SMATIKA JURNAL ◽

10.32664/smatika.v11i01.520 ◽

2021 ◽

Vol 11 (01) ◽

pp. 22-26

Author(s):

Yessi Yunitasari ◽

Andi Rahman Putera

Keyword(s):

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes

Media sosial merupakan tempat untuk mencari pertemanan baru serta tempat untuk mengeluarkan pendapat terhadap sesuatu secara bebas. Salah satu media sosial yang banyak digunakan saat ini adalah Twitter. Banyak masyarakat yang memanfaatkan Twitter untuk mengeluarkan pendapat terhadap Pandemi Covid-19 yang terjadi di berbagai negara termasuk di Indonesia. Pandemi Covid-19 atau korona virus di Indonesia diawali dengan temuan penderita penyakit korona virus 2019 (COVID-19) pada 2 Maret 2020 hingga 8 April 2020, telah terkonfirmasi 2.738 kasus positif COVID-19, dengan 221 kasus di antaranya meninggal dan 204 kasus sembuh. Tweet yang dituliskan oleh masyarakat nantinya dapat diklasifikasikan ke dalam sentimen positif maupun sentiment negatif menggunakan analisis sentimen. Hasil dari analisis sentiment kita dapat melihat bagaimana persepsi masyarakat Indonesia terkait pandemi Covid-19 yang terjadi di Indonesia. Proses klasifikasi analisis sentimen akan menggunakan metode naïve bayes. Pengujian sentimen yang dilakukan menggunakan Cross Validation meliputi pengujian 5 Fold dan 10 Fold. Dari masing-masing pengujian tersebut akan dilihat nilai accuracy, presisi dan recall. Hasil Cross Validation pengujian 5 Fold didapatkan hasil dari rata-rata akurasi sebesar 0.756364 (75%). Hasil Cross Validation pengujian 10 Fold didapatkan hasil dari rata-rata akurasi sebesar 0.76 (76%).

Download Full-text

Sistem Informasi Posyandu Ibu Hamil dengan Penerapan Klasifikasi Resiko Kehamilan Menggunakan Metode Naïve Bayes

BERKALA SAINSTEK ◽

10.19184/bst.v6i1.7554 ◽

2018 ◽

Vol 6 (1) ◽

pp. 1

Author(s):

Qomariyatul Hasanah ◽

Anang Andrianto ◽

Muhammad Arief Hidayat

Keyword(s):

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Training Set ◽

Test Set ◽

Fold Cross Validation

Sistem informasi posyandu ibu hamil dapat mengelola data kesehatan ibu hamil yang berkaitan dengan faktor resiko kehamilan. Faktor resiko kehamilan berdasarkan ketentuan Kartu Skor Poedji Rochyati (KSPR) digunakan bidan untuk menentukan resiko kehamilan dengan memberikan skor pada masing-masing parameter. KSPR memiliki kelemahan tidak dapat memberikan skor pada parameter yang belum pasti sehingga jika belum diketahui dengan pasti maka dianggap tidak terjadi. Konsep membaca pola data yang diadopsi dari teknik datamining menggunakan metode klasifikasi naive bayes dapat menjadi alternatif untuk kelemahan KSPR tersebut yaitu dengan mengklasifikasikan resiko kehamilan. Metode naïve bayes menghitung probabilitas parameter tertentu berdasarkan data pada periode sebelumnya yang telah ditentukan sebagai data training, berdasarkan hasil perhitungan tersebut dapat diketahui resiko kehamilan secara tepat sesuai parameter yang telah diketahui. Metode naïve bayes dipilih karena memiliki tingkat akurasi yang cukup tinggi daripada metode klasifikasi lainnya. Sistem informasi ini dibangun berbasis website agar dapat diakses secara mudah oleh beberapa posyandu yang berbeda tempat. Sistem dibangun mengadopsi dari model Waterfall. Sistem informasi posyandu ibu hamil dirancang dan dibangun dengan tiga (3) hak akses yaitu admin, bidan dan kader dengan masing-masing fitur yang dapat memudahkan penggunanya. Hasil dari penelitian ini adalah sistem informasi posyandu ibu hamil dengan penerapan klasifikasi resiko kehamilan menggunakan metode naïve bayes, dengan tingkat akurasi ketika menggunakan 17 atribut didapatkan 53.913%, 19 atribut didapatkan 54.348%, , 21 atribut didapatkan 54.783%, dan 22 atribut didapatkan 56.957%. Tingkat akurasi klasifikasi diperoleh menggunakan metode pengujian menggunakan Ten-Fold Cross Validation dimana training set dibagi menjadi 10 kelompok, jika kelompok 1 dijadikan test set maka kelompok 2 hingga 10 menjadi training set. Kata Kunci: Posyandu, Resiko Kehamilan, Waterfall, Datamining, Klasifikasi, Naïve bayes

Download Full-text

Estratégias de Construções de Comitês de Classificadores Multirrótulos no Aprendizado Semissupervisionado Multidescrição

Revista de Informática Teórica e Aplicada ◽

10.22456/2175-2745.75255 ◽

2017 ◽

Vol 24 (2) ◽

pp. 71

Author(s):

Wilamis Kleiton Nunes Da Silva ◽

Araken De Medeiros Santos

Keyword(s):

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Binary Relevance ◽

Fold Cross Validation

Classificação multirrótulo é um problema de aprendizado supervisionado no qual um objeto pode estar associado a múltiplas classes. Dentre os diferentes métodos de classificação multirrótulo destacam-se os métodos BR (Binary Relevance), LP (Label Powerset) e RAkEL (RAndom k-labELsets). O trabalho realizou um estudo sobre as construções de comitês de classificadores multirrótulos construídos através da aplicação de técnicas de aprendizado semissupervisionado multidescrição. Os comitês de classificadores utilizados nos experimentos foram o Bagging, Boosting e Stacking; como métodos de transformação do problema utilizamos os métodos BR, LP e Rakel; na classificação multirrótulo semissupervisionada multidescrição foi utilizado o Co-Training; foram aplicados cinco diferentes algoritmos como classificadores base: k-NN (k Vizinhos Mais Próximos), J48 (Algoritmo de Indução de Árvores de Decisão), SVM (Máquinas de Vetores Suporte), NB (Naive Bayes) e o JRip (Extended Repeated Incremental Pruning). Todos os experimentos utilizaram a metodologia de validação cruzada com 10 grupos (10-fold Cross-Validation) e o framework MULAN, o qual é implementado utilizando o WEKA. Para os tamanhos dos comitês de classificadores adotamos os valores 3, 5, 7 e 9. Para a análise dos resultados foi utilizado o teste esta- tístico de Wilcoxon. Ao final das análises experimentais, verificou-se que a abordagem semissupervisionado apresentou resultados competitivos em relação ao aprendizado supervisionado, uma vez que as duas abordagens utilizadas apresentaram resultados estatisticamente semelhantes.

Download Full-text

Klasifikasi Berita Hoax Dengan Menggunakan Metode Naive Bayes

Walisongo Journal of Information Technology ◽

10.21580/wjit.2019.1.1.3915 ◽

2019 ◽

Vol 1 (1) ◽

pp. 1

Author(s):

Hery Mustofa ◽

Adzhal Arwani Mahfudh

Keyword(s):

Information Technology ◽

Cross Validation ◽

Naive Bayes ◽

Intelligent System ◽

Naïve Bayes ◽

The Internet ◽

Average Value ◽

Internet Media ◽

News Value ◽

False News

<p><em>Hoaxes contain false news or non-sourced news. Today, hoaxes are very widely spread through internet media. The development of information technology that has so quickly triggered the spread of hoax information through the internet has become uncontrolled. So we need an intelligent system that can classify hoax news content that is spread through internet media. The hoax classification process can be done through the preprocessing stage then weighting the word and classification using naive bayes. Measurements were made using the 10-ford cross validation method. The results obtained from these measurements, it is known that the value of fold 6 has the highest accuracy, which is equal to 85.28% which is classified as relevant documents as much as 307 and irrelevant as much as 53 or an error rate of 14.72%. While the average value based on hoax news and true news value precision 0.896 and recall 0.853</em></p>

Download Full-text

PERBANDINGAN ALGORITMA KLASIFIKASI SUPPORT VECTOR MACHINE DAN NAIVE BAYES PADA IMBALANCE DATA

JURTEKSI ◽

10.33330/jurteksi.v8i1.1185 ◽

2021 ◽

Vol 8 (1) ◽

pp. 11-18

Author(s):

Chika Enggar Puspita ◽

Oktariani Nurul Pratiwi ◽

Edi Sutoyo

Keyword(s):

Machine Learning ◽

Support Vector Machine ◽

Data Warehouse ◽

Business Intelligence ◽

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Support Vector ◽

Science System ◽

Question Classification

Abstract: Question classification is a computer science system, which aims to analyze questions and can label each question based on existing categories. Questions can be collected from several materials or topics that are many and different. Therefore, the researcher intends to create a classification system for quiz questions Data Warehouse and Business Intelligence which can be grouped into topics Data Warehouse, Business Intelligence, Data Analytics, and Performance Measurement. One way to solve this problem is by approach machine learning. In this study, researchers used a comparison of machine learning algorithms, namely the algorithm NaïveBayes and SupportVectorMachine using SMOTE and methods Cross-Validation The results of this study show the best accuracy results and are very helpful. The results obtained in the method cross-validation before SMOTE resulted in an accuracy rate of 82.02% for the results after going through the SMOTE stage of 94.79% on the algorithm Naïve Bayes, while the algorithm SupportVectorMachine get accuracy of 81.39% in the process before SMOTE for the results after going through SMOTE of 96.52%. Keywords: Cross-Validation; Machine Learning; Naive Bayes; Support Vector Machine; Question Classification Abstrak: Klasifikasi pertanyaan merupakan sebuah sistem ilmu komputer, yang bertujuan untuk menganalisis pertanyaan serta dapat memberi label pada setiap pertanyaan berdasarkan kategori yang ada. Pertanyaan soal dapat dikumpulkan dari beberapa materi atau topik yang banyak dan berbeda. Oleh karena itu, bermaksud untuk membuat sistem klasifikasi pertanyaan soal kuis Data Warehouse dan Business Intelligence yang dapat dikelompokkan menjadi topik Data Warehouse, Business Intelligence, Data Analitik, dan Pengukuran Kinerja. Cara yang dapat dilakukan untuk permasalahan ini dengan menggunakan pendekatan MachineLearning. Pada penelitian kali ini menggunakan perbandingan algoritma MachineLearning yaitu algoritma NaïveBayes dan SupportVectorMachine menggunakan metode SMOTE dan Cross-Validation. Hasil penelitian ini menunjukkan hasil akurasi yang terbaik dan sangat membantu. Hasil yang diperoleh pada metode cross-validation sebelum SMOTE menghasilkan tingkat akurasi sebesar 82.02% untuk hasil sesudah melalui tahap SMOTE sebesar 94.79 % pada algoritma Naïve Bayes, sedangkan pada algoritma Support Vector Machine menghasilkan akurasi sebesar pada proses sebelum SMOTE 81.39% untuk hasil sesudah melalui SMOTE sebesar 96.52%. Kata kunci: Klasifikasi Pertanyaan; Pembelajaran Mesin; Naive Bayes; Support Vector Machine; Cross-Validation

Download Full-text

Optimasi Stemming Porter KBBI dan Cross Validation Naïve Bayes untuk Klasifikasi Topik Soal UN Bahasa Indonesia

Jurnal Ilmiah Komputasi ◽

10.32409/jikstik.17.4.2492 ◽

2018 ◽

Vol 17 (4) ◽

Keyword(s):

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Bahasa Indonesia

Download Full-text

Perbandingan Metode Klasifikasi Data Mining untuk Nasabah Bank Telemarketing

Matrik Jurnal Manajemen Teknik Informatika dan Rekayasa Komputer ◽

10.30812/matrik.v20i1.826 ◽

2020 ◽

Vol 20 (1) ◽

pp. 139-148

Author(s):

Pungkas Subarkah ◽

Enggar Pri Pambudi ◽

Septi Oktaviani Nur Hidayah

Keyword(s):

Data Mining ◽

Cross Validation ◽

Naive Bayes ◽

Confusion Matrix ◽

Regression Trees ◽

Classification And Regression Trees ◽

Naïve Bayes ◽

University Of California ◽

Classification And Regression ◽

F Measure

Bank merupakan perusahaan yang memiliki data yang besar yang tersimpan di dalam database dan diolah menghasilkan sebuah informasi yang saling berkaitan tentang nasabah. Bank, harus memiliki ide dan terobosan baru guna mengetahui kendala pada nasabah telemarketing yang ingin melakukan deposito pada Bank tersebut, agar Bank terhindar dari ancaman krisis keuangan. Penelitian ini menguji keberhasilan Bank telemarketing dengan cara melakukan klasifikasi keputusan nasabah dengan menerapkan data mining. Metode yang di gunakan algoritma Classification and Regression Trees (CART) dan naive bayes menggunakan dataset diambil dari University of California Irvine (UCI) Repository Learning. Adapun metode validasi dan evaluasi yang digunakan yaitu 10-cross validation dan confusion matrix. Hasil akurasi pada algoritma CART yaitu 89.51% dengan nilai precision 87%, Recall 89% dan F-Measure 88% dan pada algoritma naive bayes mendapatkan nilai akurasi sebesar 86.88% dengan nilai precision 87%, Recall 86% dan F-Measure 87%. Dari hasil tersebut dapat disimpulkan bahwa algoritma CART lebih baik dalam memprediksi keputusan nasabah telemarketing tepat dalam penawaran deposito.

Download Full-text

Perbandingan kinerja metode C4.5 dan Naive Bayes dalam klasifikasi artikel jurnal PGSD berdasarkan mata pelajaran

TEKNO ◽

10.17977/um034v29i1p50-67 ◽

2019 ◽

Vol 29 (1) ◽

pp. 50

Author(s):

Utomo Pujianto ◽

Putri Yuni Ristanti

Keyword(s):

Decision Tree ◽

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Fold Cross Validation

Pendidikan mempunyai standar sebagai acuan dalam proses pembelajaran. Dalam hal ini Pemerintah telah mengatur standar pendidikan di Indonesia, mengacu pada Peraturan Pemerintah Republik Indonesia Nomor 19 Tahun 2005 Pasal 6 ayat (1) yaitu kurikulum untuk jenis pendidikan umum, kejuruan, dan khusus pada jenjang pendidikan dasar dan menengah. Sesuai dengan Peraturan Pemerintah tersebut, ditetapkannya Peraturan Menteri Pendidikan Nasional Republik Indonesia Nomor 23 Tahun 2006 pasal 1 ayat (2), tentang Standar Kompetensi Lulusan yang diantaranya memuat SK-KMP (Standar Kompetensi Kelompok Mata Pelajaran). Standar inilah yang dijadikan sebuah rujukan untuk tenaga pendidik, dan bakal tenaga pendidik khususnya mahasiswa bidang pendidikan untuk membuat sebuah media pembelajaran, jurnal sebagai bahan ajaran yang pokok. Tujuan penelitian ini untuk mengklasifikasikan minat mahasiswa PGSD terhadap tema mata pelajaran menurut SK-KMP menggunakan metode Naive Bayes dan Decision tree J48. Hasil penelitian tersebut dapat dijadikan sebagai referensi untuk pengambilan tema pada mata pelajaran di tahun mendatang untuk lebih bervariasi, tidak hanya membahas tentang salah satu mata pelajaran tersebut. Kinerja dari kedua metode tersebut akan dibandingkan, sehingga dapat diketahui kinerja metode mana yang lebih baik dalam melakukan klasifikasi dokumen. Pengujian performa algoritma klasifikasi yang digunakan adalah teknik K-fold Cross Validation. Berdasarkan pengujian performa penerapan algoritma Naïve Bayes dan Decision Tree J48 menggunakan teknik K-Fold Cross Validation terhadap 200 judul dan abstrak artikel jurnal, didapatkan algoritma Naive Bayes, tingkat akurasi sebesar 84%. Sementara itu, untuk hasil yang diperoleh dengan algoritma Decision Tree J48, tingkat akurasi sebesar 86%.

Download Full-text

Comparative Analysis of Classification Methods of KNN and Naïve Bayes to Determine Stress Level of Junior High School Students

Indonesian Journal of Information Systems ◽

10.24002/ijis.v2i2.3035 ◽

2020 ◽

Vol 2 (2) ◽

pp. 1

Author(s):

Yohanes Christopher Tapidingan ◽

Debby Paseru

Keyword(s):

High School ◽

High School Students ◽

Junior High School ◽

Cross Validation ◽

Naive Bayes ◽

Junior High ◽

Naïve Bayes ◽

Junior High School Students ◽

Classification Methods ◽

School Students

Stress is generally defined as a state where someone is mentally disturbed as the response to the adversity that he/she experiences. Junior High School students usually are not aware of the stress that they encounter. This research aims to compare two classification methods of KNN and Naïve Bayes to determine stress level. The data of this research were gathered from 254 respondents from Catholic Junior High School of Don Bosco Bitung. The tests of k-cross validation and percentage split from the data showed that Naïve Bayes method excelled KNN method. With k=3, KNN accuracy reached 86.61% at the highest and Naïve Bayes reached 87.40%. Meanwhile, based on percentage split test, the average of Naïve Bayes accuracy was higher than KNN with percentage of 88.31%. Moreover, for the precision and recall, Naïve Bayes was higher than KNN with 88.30% and 87.40% seen from the k-cross validation.

Download Full-text

Implementasi Algoritma C5.0 Untuk Menganalisa Gejala Prioritas Pada Anak Yang Mengalami Bullying

Repositor ◽

10.22219/repositor.v2i8.410 ◽

2020 ◽

Vol 2 (8) ◽

Author(s):

Nabillah Annisa Rahmayanti ◽

Yufis Azhar ◽

Gita Indah Marthasari

Keyword(s):

Feature Selection ◽

Cross Validation ◽

Evaluation Method ◽

Naive Bayes ◽

Confusion Matrix ◽

Naïve Bayes ◽

Training Data ◽

Victims Of Bullying ◽

Fold Cross Validation ◽

Selection Of

AbstrakBullying sering terjadi pada anak-anak khususnya remaja dan meresahkan para orang tua. Maraknya kasus bullying di negeri ini bahkan sampai menyebabkan korban jiwa. Hal ini dapat dicegah dengan cara mengetahui gejala-gejala seorang anak yang mengalami bullying. Kondisi seorang anak yang tidak dapat mengungkapkan keluh kesahnya, tentu membuat orang tua dan juga guru di sekolah sukar dalam mengerti apa yang sedang menimpanya. Hal tersebut bisa saja dikarenakan anak sedang mengalami tindakan bullying oleh teman-temannya. Oleh karena itu peneliti memiliki tujuan untuk menghasilkan fitur yang telah terseleksi dengan menggunakan algoritma C5.0. Sehingga dengan menggunakan fitur yang telah terseleksi dapat meringankan pekerjaan dalam mengisi kuisioner dan juga mempersingkat waktu dalam menentukan seorang anak apakah terkena bullying atau tidak berdasarkan gejala yang ada di setiap pertanyaan pada kuisioner. Untuk menunjang data dalam penelitian ini, peneliti menggunakan kuisioner untuk mendapatkan jawaban dari pertanyaan yang berisi tentang gejala anak yang menjadi korban bullying. Jawaban dari responden akan diolah menjadi kumpulan data yang nantinya akan dibagi menjadi data latih dan data uji untuk selanjutnya diteliti dengan menggunakan Algoritma C5.0. Metode evaluasi yang digunakan pada penelitian ini yaitu 10 fold cross validation dan untuk menilai akurasi menggunakan confusion matrix. Penelitian ini juga melaukan perbandingan dengan beberapa algoritma klasifikasi lainnya yaitu Naive Bayes dan KNN yang bertujuan untuk melhat seberapa akurat algoritma C5.0 dalam melakukan seleksi fitur. Hasil pengujian menunjukkan bahwa algoritma C5.0 mampu melakukan seleksi fitur dan juga memiliki tingkat akurasi yang lebih baik jika dibandingkan dengan algoritma Naive Bayes dan KNN dengan hasil akurasi sebelum menggunakan seleksi fitur sebesar 92,77% dan setelah menggunakan seleksi fitur sebesar 93,33%. Abstract Bullying often occurs in children, especially teenagers and unsettles parents. The rise of cases of bullying in this country even caused casualties. This can be prevented by knowing the symptoms of a child who has bullying. The condition of a child who cannot express his complaints, certainly makes parents and teachers at school difficult to understand what is happening to them. This could be because the child is experiencing bullying by his friends. Therefore, researchers have a goal to produce selected features using the C5.0 algorithm. So using the selected features can ease the work in filling out questionnaires and also shorten the time in determining whether a child is exposed to bullying or not based on the symptoms in each question in the questionnaire. To support the data in this study, the researcher used a questionnaire to get answers to questions that contained the symptoms of children who were victims of bullying. The answer from the respondent will be processed into a data collection which will later be divided into training data and test data for further research using the C5.0 Algorithm. The evaluation method used in this study is 10 fold cross validation and to assess accuracy using confusion matrix. This study also carried out a comparison with several other classification algorithms, namely Naive Bayes and KNN which aimed to see how accurate the C5.0 algorithm was in feature selection. The test results show that the C5.0 algorithm is capable of feature selection and also has a better accuracy compared to the Naive Bayes and KNN algorithms with accuracy results before using feature selection of 92.77% and after using feature selection of 93.33%

Download Full-text

PENERAPAN METODE SELEKSI FITUR UNTUK MENINGKATKAN HASIL DIAGNOSIS KANKER PAYUDARA

Simetris Jurnal Teknik Mesin Elektro dan Ilmu Komputer ◽

10.24176/simet.v7i1.516 ◽

2016 ◽

Vol 7 (1) ◽

pp. 283 ◽

Cited By ~ 1

Author(s):

Elvira Sukma Wahyuni

Keyword(s):

Breast Cancer ◽

Rough Set ◽

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Sequential Minimal Optimization ◽

Multi Layer Perceptron ◽

Fold Cross Validation

Tujuan utama penelitian ini adalah untuk meningkatkan peforma klasifikasi pada diagnosis kanker payudara dengan menerapkan seleksi fitur pada beberapa algoritme klasifikasi. Penelitian ini menggunakan database kanker payudara Wisconsin Breast Cancer Database (WBCD). Metode seleksi fitur F-score dan Rough Set akan dipasangkan dengan beberapa algoritme klasifikasi yaitu SMO (Sequential Minimal Optimization), Naive Bayes, Multi layer Perceptron, dan C4.5. Penelitian ini menggunakan 10 fold cross validation sebagai metode evaluasi. Hasil penelitian menunjukkan algoritme klasifikasi MLP dan C4.5 mengalami peningkatan peforma klasifikasi secara signifikan setelah dipasangkan dengan seleksi fitur rough set dan F-score, Naive Bayes menunjukan peforma terbaik ketika dipasangkan dengan metode seleksi fitur F-score saja, sedangkan SMO tidak menunjukkan peningkatan peforma klasifikas ketika dipasangkan pada kedua seleksi fitur. Kata kunci: kanker payudara, seleksi fitur, klasifikasi.

Download Full-text