scholarly journals Automatic Question Generation (AQG) Dari Dokumen Teks Bahasa Indonesia Berdasarkan Non-Factoid Quesion

2018 ◽  
Vol 5 (2) ◽  
pp. 217
Author(s):  
Aminudin Aminudin ◽  
Azhari SN ◽  
Baaras Ahmad

<p class="Abstrak"><em><span lang="IN">Automatic Question Generation</span></em><span lang="IN"> (AQG) adalah sistem yang dapat membangkitkan pertanyaan secara otomatis dari teks atau dokumen dengan menggunakan metode atau pola-pola tertentu. Diharapkan sistem AQG yang dikembangkan bekerja seperti halnya manusia membuat pertanyaan setelah diberikan suatu teks. <span class="longtext"><span>Manusia dapat membuat pertanyaan, dikarenakan manusia dapat memahami teks yang diberikan dan berdasarkan pengetahuan-pengetahuan yang dimilikinya. Untuk mengembangkan sistem AQG penelitian ini, dilakukan kombinasi beberapa metode diantaranya algoritme <em>Naive Bayes Classifier</em> untuk mengklasifikasikan kalimat ke dalam jenis kalimat <em>non-factoid</em>. Chunking labelling untuk memberikan label pada masing-masing kalimat dari hasil klasifikasi dan pendekatan template untuk mencocokan hasil kalimat dengan template pertanyaan yang dibuat. Hasil pertanyaan yang dihasilkan oleh sistem akan diukur berdasarkan paramater yang telah ditentukan yang didasarkan atas pengukuran recall, precision dan F-Measure. Dengan adanya sistem AQG ini diharapkan dapat membantu guru mata pelajaran Biologi untuk membuat pertanyaan secara otomatis dan efektif serta efisien.</span></span></span></p><p class="Abstrak"> </p><p class="Abstrak">Abstract</p><p><em>Automatic Question Generation (AQG) is a system can generate question with automatically from text or document by using methods or certain patterns. Expected system AQG developed works like it does humans make create a question after being given a text. Humans can create a question, because humans can understand the given text and based on knowledge assets. To develop the system of AQG in this research, will do a combination of several methods including Naïve Bayes Clasifier algorithm to classify the sentence into a kind of non-sentence factoid. Chunking labelling to provide labels on each sentence and template approach to match the right results sentences with question templates created. The results of the question that are generated by the system will be measured based on predetermined parameters required that is based on the measuring precision, recall and F-Measure. With the existence of the AQG system is expected to help teachers of Biology subjects to make the question automatically, effectively and efficiently.</em></p>

2012 ◽  
Vol 5s1 ◽  
pp. BII.S8945 ◽  
Author(s):  
Irena Spasić ◽  
Pete Burnap ◽  
Mark Greenwood ◽  
Michael Arribas-Ayllon

The authors present a system developed for the 2011 i2b2 Challenge on Sentiment Classification, whose aim was to automatically classify sentences in suicide notes using a scheme of 15 topics, mostly emotions. The system combines machine learning with a rule-based methodology. The features used to represent a problem were based on lexico–semantic properties of individual words in addition to regular expressions used to represent patterns of word usage across different topics. A naïve Bayes classifier was trained using the features extracted from the training data consisting of 600 manually annotated suicide notes. Classification was then performed using the naïve Bayes classifier as well as a set of pattern–matching rules. The classification performance was evaluated against a manually prepared gold standard consisting of 300 suicide notes, in which 1,091 out of a total of 2,037 sentences were associated with a total of 1,272 annotations. The competing systems were ranked using the micro-averaged F-measure as the primary evaluation metric. Our system achieved the F-measure of 53% (with 55% precision and 52% recall), which was significantly better than the average performance of 48.75% achieved by the 26 participating teams.


2020 ◽  
Vol 4 (2) ◽  
pp. 214-221
Author(s):  
Maria Mega Mala Olhang ◽  
Sentot Achmadi ◽  
F.X Ari Wibisono

Media sosial khususnya Twitter pada saat ini banyak membahas mengenai penyebaran virus corona atau lebih dikenal dengan COVID-19. Diawali dengan ditemukan kasus pertama di Wuhan, China, pemberitaan mengenai virus corona terus berlanjut hingga penyebarannya sampai ke Indonesia. Pemberitaan melalui artikel di Twitter mengenai dampak dari adanya COVID-19 ini antra lain persediaan bahan pokok yang mulai meningkat harganya termasuk harga masker dan hand sanitizer juga penyampaian setuju dan tidak setujunya masyarakat terhadap kebijakan pemerintah yang dianggap kurang tanggap dalam menangani kasus ini sangat banyak diminati dan dikritik oleh masyarakat. Pada penelitian ini, dilakukan proses menganalisis sentimen masyarakat terhadap aspirasi yang disampaikan melalui Twitter yaitu mengembangkan sistem dengan mengacu pada berbagai sistem yang sudah ada sebelumnya dengan menggunakan metode Naïve Bayes Classifier untuk mengklasifikasikan sentimen. Masukan pada sistem ini berupa tweet yang diperoleh dari Twitter menggunakan keyword seperti #coronavirusindonesia atau #covid-19 dengan jumlah data tidak melebihi 500 data tweet. Sedangkan outputnya berupa pengelompokkan sentimen positif dan negatif dari setiap tweet yang sudah melewati tahap pre proceessing. Dari hasil pengujian, dokumen dengan jumlah sebanyak 75 tweet diperoleh hasil pengukuran akurasi recall 32%, precission 80%, F-Measure 45% serta rata-rata akurasi 36%.  


With the passage of time and the growth of ecommercea new web world needs to be built their users can share their ideas and opinions differently domains.There are thousands of websites that sell these various products. The quick growth in the number of reviews and their availability and the arrival of rich reviews for rich products for sale online, the right choice for many products has been difficult for users. Consumers will soon be able to verify the authenticity and quality of the products. What better way is there to ask people who have already bought the product? That’s where customer reviews come from. What’s worse is the popular products with thousands of updates — we don’t have the time or the patience to read all of them thousands. Therefore, our app simplifies this task by analysing and summarizing all the reviews that will help the user determine what other consumers have experienced in purchasing this product. This function focuses on mining updates from websites like Amazon, allowing the user to write freely to view. Automatically removes updates from websites. It also uses algorithms such as the Naïve Bayes classifier, Logistic Regression and SentiWordNet algorithm to classify reviews as good and bad reviews. Finally, we used quality metric parameters to measure the performance of each algo.


2018 ◽  
Vol 7 (2.21) ◽  
pp. 423
Author(s):  
U V. Anbazhagu ◽  
R Balakrishna ◽  
A Sajeev Ram ◽  
M Latha

Question answering (QA) allows all users to get information in enhanced technique. In this project we suggest a system for inspiring textual answer with appropriate media data. Our system consists of three components Interpretation median picking, Inquiry propagation, Data pick and Launching. Interpretation median picking is used to select various types of answers. Inquiry propagation is used for extracting the root words from the given query. Data pick and Launching is used for selecting the appropriate answer and producing the result. We use Stemming algorithm, Naïve Bayes classifier algorithm and page ranking algorithms. Stemming algorithm is used to extract the root word from the given searched query. Naïve Bayes classifier algorithm is used for selecting the type of medium. By using the page ranking algorithm the optimal solution is got. Our approach automatically determines which media will be a best solution for the given query. It automatically harvests the data from website for getting the answer. Our approach can enable a novel multimedia question answering (MMQA) approach as users can find multimedia answers by matching their questions with those in the pool. We are enhancing community contributed answers. Any user who is unaware of data can get the information promptly. Our approach is to deal with the complex questions in an effective way. Based on the generated queries, we vertically collect image and video data with multimedia search engines. 


2020 ◽  
Vol 10 (2) ◽  
pp. 170-179
Author(s):  
S Ramadandi ◽  
Jahring Jahring

Setiap mahasiswa memiliki kebiasaan tersendiri dalam menyerap dan memproses materi kuliah yang diberikan. Kebiasaan ini disebut dengan gaya belajar. Mengetahui gaya belajar mahasiswa merupakan hal yang sangat penting bagi seorang dosen karena dengan mengetahui gaya belajar mahasiswa dalam satu kelas, dosen dapat menerapkan metode pembelajaran yang dapat mengakomodir seluruh gaya belajar mahasiswa. Pada mata kuliah Komputer di Program Studi Pendidikan Bahasa Indonesia dan Program Studi Pendidikan Bahasa Inggris, masih terdapat beberapa mahasiswa yang kesulitan memahami materi kuliah karena metode pembelajaran yang diberikan dosen hanya terpaku pada gaya belajar tertentu. Untuk itu, penelitian ini akan membantu dosen untuk mengetahui gaya belajar mahasiswa berdasarkan data-data terdahulu dengan menggunakan metode Naïve Bayes Classifier pada Data Mining. Beberapa penelitian menyebutkan bahwa metode Naïve Bayes Classifier lebih baik dibandingkan dengan metode klasifikasi yang lain. Dalam penelitian ini, peneliti menggunakan Rapid Miner sebagai alat bantu dalam melakukan klasifikasi. Setelah melakukan pengujian terhadap data uji, diperoleh nilai akurasi sebesar 90%. Hal ini membuktikan bahwa model klasifikasi yang dibentuk dari data latih dapat memberikan hasil klasifikasi gaya belajar yang baik serta model ini dapat diterapkan oleh dosen untuk mengetahui gaya belajar mahasiswa.


2018 ◽  
Vol 4 (2) ◽  
pp. 149 ◽  
Author(s):  
Imam Fahrur Rozi ◽  
Elok Nur Hamdana ◽  
Muhammad Balya Iqbal Alfahmi

Twitter adalah salah satu media sosial dimana pengguna dapat mencari topik tertentu dan membahas isu-isu terkini. Beberapa pesan singkat atau tweet dapat memuat opini terhadap produk dan layanan yang dirasakan oleh masyarakat. Data ini dapat menjadi sumber data untuk dijadikan objek penelitian. Penelitian ini bertujuan untuk membangun aplikasi analisis sentimen yang menerapkan pendekatan Naïve Bayes Classifier untuk mengklasifikasikan kata-kata dan difokuskan pada tweet dalam bahasa Indonesia. Data diperoleh melalui cara web scrapping dan sumber teks yang digunakan sebagai topik bahasan adalah Sistem Administrasi Manunggal Satu Atap (SAMSAT) Malang Kota. Proses klasifikasi dilakukan melalui serangkaian tahapan seperti preproses (case folding, cleaning, tokenizing, dan stopword) serta proses klasifikasi dengan algoritma Naïve Bayes Classifier itu sendiri untuk mendapatkan hasil klasifikasi dengan kategori positif, negatif atau netral. Berdasarkan hasil penelitian, algoritma Naïve Bayes Classifier memberikan unjuk kerja yang baik dalam analisis sentimen. Dari hasil uji akurasi klasifikasi yang dilakukan oleh aplikasi menghasilkan nilai akurasi tertinggi pada setiap kategori positif, negatif, netral masing-masing sebesar 82%, 92%, 80% dengan jumlah data latih 200 tweet negatif, 200 tweet positif, dan 200 tweet netral.


2021 ◽  
Vol 2 (01) ◽  
pp. 16-23
Author(s):  
Shania Kaparang ◽  
Daniel Riano Kaparang ◽  
Vivi Pegie Rantung

Dampak dari pandemi covid-19 begitu besar sehingga pemerintah harus memiliki kebijakan agar dapat mengurangi dampaknya. Salah satu kebijakan pemerintah yaitu new normal yang mewajibkan seluruh masyarakat untuk pakai masker, jaga jarak dan cuci tangan. Dalam penerapannya tentu ada sentimen-sentimen baik positif maupun negatif yang diunggah ke dalam Twitter. Penelitian ini bertujuan untuk membuat pemodelan analisis sentimen masyarakat mengenai kebijakan new normal pemerintah pada masa pandemi covid-19 di Indonesia. Tahapan penelitian ini yakni crawling data, labeling, penghapusan data netral, preprocessing, pembagian training data dan testing data, pembuatan sistem klasifikasi naïve bayes, uji coba sistem dan visualisasi hasil penelitian dengan menggunakan wordcloud. Performa sistem klasifikasinya antara lain, tingkat akurasi 80,37%, presisi 87,38%, recall 82,57% dan  f-measure 84,91%. Hasil dari penelitian ini yaitu 5194 tweets terklasifikasi sentimen positif dan 2908 tweets terklasifikasi sentiment negative, hal ini menunjukkan bahwa sentimen positif lebih banyak daripada sentimen negatif. Tetapi dari jumlahnya bisa dilihat bahwa perbandingannya tidak terlalu jauh antara sentimen positif dan sentimen negatif, artinya ada respon masyarakat yang masih kurang terhadap kebijakan pemerintah new normal pada masa pandemi.


Sign in / Sign up

Export Citation Format

Share Document