scholarly journals Analisis Sentimen dan Pemodelan Topik Untuk Mengidentifikasi Topik Pandemi Covid-19 Pada Media Sosial Twitter menggunakan Naïve Bayes Classifier dan Latent Dirichleat Allocation

JNANALOKA ◽  
2021 ◽  
pp. 73-78
Author(s):  
Herjuna Ardi Prakosa ◽  
Ari Budi Riyanto ◽  
Siti Nasiroh

Virus Corona atau Covid-19 menjadi perhatian khusus diseluruh dunia. Banyak masyarakat membicarakan virus ini melalui unggahan komentar dan opini di Media Sosial.Twitter merupakan salah satu media sosial yang saat ini masih banyak digunakan masyarakat untuk menyampaikan opini berupa kumpulan kata yang disebut tweets.  Tweets yang berkaitan dengan topik covid-19 ini dapat di klasifikasikan menggunakan metode Topic Modeling untuk menghasilkan sebuah data topic yang sering dibicarakan pengguna twitter. Salah satu algoritma yang digunakan untuk melakukan Topic Modeling adalah menggunakan Latent Dirichlet Alocation (LDA). Pada penelitian ini LDA digunakan untuk  mengetahui kata-kata apa saja yang banyak muncul pada data tweets tentang Covid-19 yang telah di unggah masyarakat melalui twitter. Sebelum data tweet dimodelkan dengan LDA, dilakukan terlebih dahulu analisis sentiment dengan Naïve Bayes Classifier untuk menghasilkan sentiment Positif, Negati dan Netral.  Terdapat 5000 tweets dijadikan dataset untuk diklasifikasikan menggunakan Topic Modeling. Semua tweets yang yang di tambang masih perlu dilakukan preprocessing text yang bertujuan untuk menghapus kata-kata yang tidak baku, menghapus tanda baca, dan menghapus kata penyambung. Tweets yang sudah dilakukan preprocessing text lalu diberikan nilai bobot sehingga diketahui kata apa saja yang banyak muncul dalam tweets yang berkaitan dengan Covid-19. Kata-kata yang banyak muncul dan sudah diberikan bobot akan divisualisasikan menggunakan World Cloud sehingga dapat dilihat pemetaan kata apa saja yang banyak muncul dalam bentuk gambar.

2021 ◽  
Vol 20 (2) ◽  
pp. 177
Author(s):  
Putri Agung Permatasari ◽  
Linawati Linawati ◽  
Lie Jasa

Media sosial saat ini telah menjadi bagian penting dalam kehidupan sehari-hari tidak hanya untuk kebutuhan pribadi melainkan bisa di gunakan dalam bisnis, serta banyak hal yang bisa dilakukan. Media sosial yang digunakan seperti Facebook, Twitter, Youtube, Instagram, Likenid, dan Whatsapp. Dengan adanya media sosial tersebut banyaknya data yang ada berupa gambar, comment berupa text atau emoticon, video, dan lainnya, sehingga masyarakat bebas beropini. Dengan adanya analisis sentimen opini yang berkembang dan banyak di media sosial tersebut dapat menghasilkan data dan informasi yang bermanfaat. Dalam analisis sentimen diperlukannya algoritma klasifikasi data diantaranya Naive Bayes Classifier, Support Vector Machine, K-NN, RNN, C4.5, Lexicon Based, LDA Based Topic Modeling, dan beberapa algoritma lainnya. Artikel ini menelaah beberapa literature analisis sentimen pada media sosial. Saat ini media sosial yang sering digunakan dalam analisis adalah Twitter dan pengguna algoritma yang dapat meningkatkan tingkat akurasi adalah algoritma Naive Bayes Classifier dan Support Vector Machine.  Hasil perhitungan akurasi klasifikasi data berbeda-beda terlihat pada data uji pada penelitian tersebut.


JNANALOKA ◽  
2021 ◽  
pp. 29-34
Author(s):  
Herjuna Ardi Prakosa ◽  
Ari Budi Riyanto ◽  
Siti Nasiroh

Virus Corona atau Covid-19 menjadi perhatian khusus diseluruh dunia. Banyak masyarakat membicarakan virus ini melalui unggahan komentar dan opini di Media Sosial.Twitter merupakan salah satu media sosial yang saat ini masih banyak digunakan masyarakat untuk menyampaikan opini berupa kumpulan kata yang disebut tweets.  Tweets yang berkaitan dengan topik covid-19 ini dapat di klasifikasikan menggunakan metode Topic Modeling untuk menghasilkan sebuah data topic yang sering dibicarakan pengguna twitter. Salah satu algoritma yang digunakan untuk melakukan Topic Modeling adalah menggunakan Latent Dirichlet Alocation (LDA). Pada penelitian ini LDA digunakan untuk  mengetahui kata-kata apa saja yang banyak muncul pada data tweets tentang Covid-19 yang telah di unggah masyarakat melalui twitter. Sebelum data tweet dimodelkan dengan LDA, dilakukan terlebih dahulu analisis sentiment dengan Naïve Bayes Classifier untuk menghasilkan sentiment Positif, Negati dan Netral.  Terdapat 5000 tweets dijadikan dataset untuk diklasifikasikan menggunakan Topic Modeling. Semua tweets yang yang di tambang masih perlu dilakukan preprocessing text yang bertujuan untuk menghapus kata-kata yang tidak baku, menghapus tanda baca, dan menghapus kata penyambung. Tweets yang sudah dilakukan preprocessing text lalu diberikan nilai bobot sehingga diketahui kata apa saja yang banyak muncul dalam tweets yang berkaitan dengan Covid-19. Kata-kata yang banyak muncul dan sudah diberikan bobot akan divisualisasikan menggunakan World Cloud sehingga dapat dilihat pemetaan kata apa saja yang banyak muncul dalam bentuk gambar.


2021 ◽  
Author(s):  
Deniz Ertuncay ◽  
Giovanni Costa

AbstractNear-fault ground motions may contain impulse behavior on velocity records. To calculate the probability of occurrence of the impulsive signals, a large dataset is collected from various national data providers and strong motion databases. The dataset has a large number of parameters which carry information on the earthquake physics, ruptured faults, ground motion parameters, distance between the station and several parts of the ruptured fault. Relation between the parameters and impulsive signals is calculated. It is found that fault type, moment magnitude, distance and azimuth between a site of interest and the surface projection of the ruptured fault are correlated with the impulsiveness of the signals. Separate models are created for strike-slip faults and non-strike-slip faults by using multivariate naïve Bayes classifier method. Naïve Bayes classifier allows us to have the probability of observing impulsive signals. The models have comparable accuracy rates, and they are more consistent on different fault types with respect to previous studies.


Sign in / Sign up

Export Citation Format

Share Document