scholarly journals Evaluating RNN Architectures for Handling Imbalanced Dataset in Multi-Class Text Classification in Bahasa Indonesia

Author(s):  
Kristian Indradiarta Gunawan ◽  
Joan Santoso

Seiring dengan berkembangnya informasi yang ada di sekitar dengan pesat, maka jenis informasi yang ada pun menjadi sangat bervariasi dan sangat banyak jumlahnya, dan akan semakin terus bertambah. Dengan kondisi tersebut, kita akan mengalami kesulitan untuk mengenali jenis dari informasi tersebut satu persatu. Oleh karena itu dengan adanya proses klasifikasi teks dan dokumen sangatlah membantu untuk memilah dan mengenali informasi-informasi apa saja yang ada, baik informasi yang lama maupun informasi yang baru dan belum pernah ditemui sebelumnya. Bertujuan untuk dapat mengidentifikasi dan mengklasifikasikan dokumen-dokumen berita dalam bahasa Indonesia ke dalam beberapa kategori sekaligus, maka dibuatlah sebuah penelitian berupa sistem untuk menangani klasifikasi dokumen teks dalam bahasa Indonesia. Sistem tersebut akan memproses berita-berita yang diberikan, dan kemudian akan memberikan 2 kategori yang paling mendekati terhadap isi dari berita tersebut. Sistem dibuat dengan menggunakan Python, memanfaatkan Doc2Vec untuk mengambil fitur dataset, dan SVM untuk melakukan klasifikasi terhadap banyak kelas. Dataset yang digunakan adalah kumpulan dokumen berupa berita-berita yang diperoleh dari CNN Indonesia tahun 2016-2017, dan terbagi dalam 5 kategori berita utama, yaitu: Politik, Ekonomi, Teknologi, Olahraga, dan Hiburan. Dikarenakan sedikitnya literatur untuk klasifikasi text dalam bahasa Indonesia, maka pada penelitian ini hanya menargetkan akurasi sebesar 70% saja. Namun dari hasil ujicoba, akurasi yang diperoleh melebihi 90%. Hasil prediksi untuk kelas dokumen pun memiliki tingkat keberhasilan yang tinggi. Dengan penggunaan dataset dan penanganan preprocessing yang tepat untuk dokumen bahasa Indonesia, maka hasil yang dicapai bisa lebih bagus dan akurat.


Author(s):  
Jingjing Wang ◽  
Wen Feng Lu ◽  
Han Tong Loh

The importance of mining patents to support product design has been recognized, because patents are the major information source to support innovation and contain novel ideas, which usually cannot be found in published academic papers. In patent text mining, a basic issue is patent classification. However, automatic patent classification is difficult. One potential cause of the difficulty is the imbalanced dataset i.e. the interested positive class is minor while uninterested negative class is major. To alleviate the problem of imbalanced dataset and improve the performance of a Support Vector Machine (SVM) classifier, this study proposes P-SMOTE, a new oversampling technique which focuses on the blank spaces along positive borderline of a SVM. The proposed technique was firstly investigated on Reuters-21578, which is a standard text classification dataset. Then, P-SMOTE was applied to a design patent document dataset. It was observed that a SVM classifier with P-SMOTE, compared to a SVM classifier only, successfully achieved better results.


2019 ◽  
Vol 5 (2) ◽  
pp. 145
Author(s):  
Sarjan Kase
Keyword(s):  

Abstrak Tujuan penulisan ini adalah untuk mengetahui sejauh mana penerapan semantik dalam pembelajaran bahasa Indonesia di SMA Negeri 3 Gorontalo. Selain itu, penelitian ini juga memberikan gambaran yang spesifik terhadap persoalan pembelajaran semantik di sekolah. Data diambil dari kalimat yang disampaikan oleh seorang guru berkenaan dengan semantik. Sumber data diambil dari buku semantik yang telah ditulis oleh pakar dan wawancara kepada sesama guru bahasa Indonesia di SMA Negeri 3 Gorontalo. Hasil penelitian menunjukkan bahwa ada beberapa makna semantic yang digunakan dalam pembelajaran bahasa Indonesia yaitu, makna afektif, makna denotatif, makna deskriptif, makna emotif, makna kiasan. Selain itu, ditemukan juga beberapa upaya yang dapat dilakukan dalam mengatasi persoalan pembelajaran semantik di sekolah.


2017 ◽  
Vol 12 (1) ◽  
pp. 34-42
Author(s):  
Wawan Wiraatmaja
Keyword(s):  

Penelitian ini bertujuan untuk: (1) mengetahui aktivitas belajar peserta didik kelas V SDN-3 Pahandut Palangkaraya tahun pelajaran 2015/2016 dalam menanggapi suatu persoalan atau peristiwa dengan menggunakan media animasi, (2) untuk mengetahui ada atau tidaknya peningkatan hasil belajar peserta didik dalam menanggapi suatu persoalan atau peristiwa dengan menggunakan media animasi kelas V pada SDN-3 Pahandut Palangkaraya tahun pelajaran 2015/2016. Metode penelitian yang digunakan dalam penelitian ini adalah Penelitian Tindakan Kelas (PTK). Subjek penelitian berjumlah 19 orang peserta didik. teknik pengmpulan data berdasarkan pada hasil siklus pada saat proses pembelajaran. Hasil penelitian menunjukan bahwa: (1) aktivitas peserta didik kelas V SDN-3 Pahandut Palangkaraya tahun pelajaran 2015/2016 dalam kemampuan menanggapi suatu persoalan atau peristiwa dengan menggunakan media animasi lebih aktif dengan skor rata-rata siklus I 2,4 dengan kriteria cukup dan siklus II 3,5 dengan kriteria baik. (2) Peningkatan hasil belajar peserta didik kelas V pada SDN-3 Pahandut Palangkaraya tahun pelajaran 2015/2016 dalam menanggapi suatu persoalan atau peristiwa dengan menggunakan media animasi lebih meningkat, dibuktikan dengan hasil Siklus I 67,63 dengan ketuntasan klasikal 52,63% Dan Siklus II 80,52 dengan ketuntasan klasikal 100%. Dari hasil yang diperoleh tersebut ada peningkatan antara hasil siklus I dan siklus II.


2020 ◽  
Vol 13 (2) ◽  
pp. 01-10
Author(s):  
Alpansyah Alpansyah ◽  
Abdul Talib Hasim

The aims of this study were: (1) to identify an increase in students' understanding of the value of mutual cooperation through the use of reader response rules in Indonesian Language Learning (KRPDPBI); (2) identifying the use of the reader response principle in Indonesian Language learning (KRPDPBI) there are differences between male and female students. The design of this study used a quasi-experimental study with two different methods. The results showed that (1) the achievement of the score of understanding the value of mutual cooperation for students taught by KRPDPBI was better than for students taught by regular learning according to the curriculum; (2) the achievement of the understanding of the value of male students' mutual cooperation is no better than that of female students.


Sign in / Sign up

Export Citation Format

Share Document