Analisis Perbandingan Kernel Algoritma Support Vector Machine dalam Mengklasifikasikan  Skripsi Teknik Informatika  berdasarkan Abstrak

Mahasiswa memiliki kewajiban menyelesaikan skripsi untuk menyelesaikan pendidikan jenjang S-1, namun justru menentukan topik skripsi adalah kesulitan pertama mahasiswa dalam pembuatan skripsi yang menjadi salah satu faktor mahasiswa lulus terlambat, Dengan melakukan pengklasifikasian skripsi berdasarkan abstrak dapat membantu mahasiswa dalam mencari referensi untuk menentukan topik skripsi. Metodelogi yang digunakan adalah proses text Mining dengan proses case folding, tekonizing, filtering, stemming, TF-IDF, data mining dan evaluation. Pembagian data menggunakan rasio 80% data latih dan 20% data uji. Pengklasifikasian menggunakan algoritma Support Vector Machine (SVM). Algoritma support vector machine (SVM) adalah salah satu algoritma pengklasifikasian yang memiliki beberapa kernel yaitu liniear dan 3 kernel yang paling dipertimbangkan. Validasi data menggunakan cross validation dengan 10-fold. Tingkat akurasi didapatkan 81%, presisi 82% dan recall 81% pada kernel liniear.

Download Full-text

Analisis Sentimen Twitter terhadap Tokoh Publik dengan Algoritma Naive Bayes dan Support Vector Machine

Simetris Jurnal Teknik Mesin Elektro dan Ilmu Komputer ◽

10.24176/simet.v11i2.4568 ◽

2021 ◽

Vol 11 (2) ◽

pp. 626-636

Author(s):

Tanthy Tawaqalia Widowati ◽

Mujiono Sadikin

Keyword(s):

Data Mining ◽

Support Vector Machine ◽

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Support Vector ◽

Fold Cross Validation

Salah satu media sosial yang berkembang adalah Twitter. Media sosial Twitter mempermudah masyarakat untuk bebas berpendapat melalui cuitan atau biasa disebut dengan tweets. Netizen dengan bebas menyampaikan opini pribadinya untuk topik apapun, termasuk persepsi terhadap tokoh publik. Artikel ini menyajikan hasil penelitian dan analisis sentimen masyarakat (netizen) terhadap tokoh publik, Nadiem Makariem sebagai Menteri Kementerian Pendidikan dan Kebudayaan baru. Penelitian ini menggunakan teknik data mining yang bertujuan untuk membandingkan hasil klasifikasi dari opini masyarakat yang dituliskan di Twitter. Dataset yang digunakan berasal dari tweets dengan kata kunci ”nadiem makariem”, ”kemendikbud” dan ”pak nadiem”. Tools RapidMiner digunakan untuk membantu tahap pre-processing dan klasifikasi menggunakan dua metode yaitu, Naive Bayes dan Support Vector Machine dengan evaluasi k-fold cross-validation. Dari hasil ujicoba diketahui bahwa untuk kasus yang diteliti, metode Naive Bayes menghasilkan kinerja yang lebih baik dengan accuracy 91.48%, precision 89.28% dan recall 91.58%.

Download Full-text

Efficient Data-Mining Algorithm for Predicting Heart Disease Based on an Angiographic Test

Malaysian Journal of Medical Sciences ◽

10.21315/mjms2021.28.5.12 ◽

2021 ◽

Vol 28 (5) ◽

pp. 118-129

Author(s):

Alabi Waheed Banjoko ◽

◽

Kawthar Opeyemi Abdulazeez ◽

Keyword(s):

Data Mining ◽

Support Vector Machine ◽

Heart Disease ◽

Cross Validation ◽

Classification Method ◽

Support Vector ◽

Data Mining Algorithm ◽

Machine Method ◽

Mining Algorithm ◽

Splitting Ratio

Background: The computerised classification and prediction of heart disease can be useful for medical personnel for the purpose of fast diagnosis with accurate results. This study presents an efficient classification method for predicting heart disease using a data-mining algorithm. Methods: The algorithm utilises the weighted support vector machine method for efficient classification of heart disease based on a binary response that indicates the presence or absence of heart disease as the result of an angiographic test. The optimal values of the support vector machine and the Radial Basis Function kernel parameters for the heart disease classification were determined via a 10-fold cross-validation method. The heart disease data was partitioned into training and testing sets using different percentages of the splitting ratio. Each of the training sets was used in training the classification method while the predictive power of the method was evaluated on each of the test sets using the Monte-Carlo cross-validation resampling technique. The effect of different percentages of the splitting ratio on the method was also observed. Results: The misclassification error rate was used to compare the performance of the method with three selected machine learning methods and was observed that the proposed method performs best over others in all cases considered. Conclusion: Finally, the results illustrate that the classification algorithm presented can effectively predict the heart disease status of an individual based on the results of an angiographic test.

Download Full-text

Perbandingan Metode Naïve Bayes Dan Support Vector Machine Dalam Klasifikasi Penyakit Diabetes Melitus

Journal of Information Technology Ampera ◽

10.51519/journalita.volume1.isssue3.year2020.page133-143 ◽

2020 ◽

Vol 1 (3) ◽

pp. 133-143

Author(s):

Hilda Apriyani ◽

Kurniati Kurniati

Keyword(s):

Data Mining ◽

Support Vector Machine ◽

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Support Vector ◽

Diabetes Melitus

Diabetes melitus merupakan penyakit kronis yang terjadi akibat kadar glukosa didalam darah yang terlalu tinggi sehingga tidak adanya insulin. Dalam kurun waktu data di Rumah Sakit Islam Siti Khadijah Palembang yang dipengaruhi oleh jumlah dari pasien yang melakukan pemeriksaan kesehatan seperti penyakit diabetes melitus sehingga berpengaruh dalam hal klasifikasi data yang akan menyulitkan pihak rumah sakit. Maka dengan memanfaatkan data mining, pengklasifikasian untuk menentukan pasien yang telah melakukan pemeriksaan termasuk penderita penyakit diabetes atau tidak. Dengan adanya permasalahan tersebut maka penulis melakukan analisis perbandingan dari dua algoritma yaitu algoritma naïve bayes dan algoritma support vector machine untuk klasifikasi penyakit diabetes dengan menggunakan alat bantu WEKA dengan tools options Cross Validation dan Confussion Matrix dengan hasil akurasi tertinggi yaitu algoritma support vector machine dengan kernel polynomial yang hasilnya 96.2704% dan tingkat error sebanyak 3.7296% dapat disimpulkan algoritma yang akurat dalam klasifikasi penyakit diabetes yaitu algoritma support vector machine dengan kernel polynomial.

Download Full-text

ANALISIS PERBANDINGAN ALGORITMA NAIVE BAYES DAN SUPPORT VECTOR MACHINE DALAM MENGKLASIFIKASIKAN JUMLAH PEMBACA ARTIKEL ONLINE

JIKA (Jurnal Informatika) ◽

10.31000/.v2i2.1521 ◽

2019 ◽

Vol 2 (2) ◽

Author(s):

Umbar Riyanto

Keyword(s):

Data Mining ◽

Support Vector Machine ◽

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Support Vector

PT. Linktone Indonesia merupakan salah satu perusahaan yang bergerak dalam bidang portal berita online. Semakin banyaknya portal berita online di Indonesia, para penulis yang ada di PT. Linktone Indonesia harus dapat bersaing, agar artikel yang mereka publish mendapatkan jumlah pembaca yang maksimal. Jumlah pembaca pada sebuah artikel tidaklah menentu, dan sulit untuk diprediksi. Banyaknya jumlah artikel yang dimiliki, maka dapat dilakukan penelitian data mining untuk mengklasifikasi jumlah pembaca artikel. Terdapat beberapa algoritma dalam teknik klasifikasi, akan tetapi tidak semua algoritma memiliki kinerja dan tingkat keakuratan yang baik dalam mengklasifikasi jumlah pembaca artikel. Penelitian ini membandingkan dua algoritma klasifikasi antara Naive Bayes, Support Vector Machine dan Bagging pada tiap algoritma. Peneliti membagi menjadi 5 dataset dan menggunakan tools WEKA dengan tools options K-Folds Cross Validation dan Confussion Matrix. Hasil penelitian ini, dengan jumlah dataset 7111 record. Bagging kurang memperbaiki hasil klasifikasi dengan jumlah dataset yang besar dan memerlukan waktu pembuatan model yang sangat lama dengan klasifikasi Support Vector Machine. Sementara itu Naive Bayes dalam segi waktu pembuatan model mendapatkan waktu yang paling cepat.

Download Full-text

IMPLEMENTASI SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN PENGGUNA TWITTER TERHADAP PELAYANAN TELKOM DAN BIZNET

Jurnal Pilar Nusa Mandiri ◽

10.33480/pilar.v15i2.699 ◽

2019 ◽

Vol 15 (2) ◽

pp. 171-176

Author(s):

Bety Wulan Sari ◽

Fadholi Fat Haranto

Keyword(s):

Support Vector Machine ◽

Text Mining ◽

Cross Validation ◽

Confusion Matrix ◽

Support Vector ◽

Fold Cross Validation

Sosial media merupakan suatu media yang dapat digunakan untuk berekspresi oleh penggunanya. Twitter cukup populer dan sering digunakan di Indonesia, pengguna twitter dapat berekspresi dan beraspirasi tanpa adanya batasan. Tweet yang berupa ekspresi dan aspirasi yang ditulis oleh pengguna twitter dapat digunakan untuk ulasan sebuah produk atau layanan. Pada penelitian ini, peneliti menggunakan teknik text mining dengan menerapkan algoritma Support Vector Machine yang dipergunakan untuk analisis sentimen pengguna twitter terhadap pelayanan Telkom dan Biznet. Data pada pelayanan Telkom dan Biznet akan dilakukan perhitungan pada penelitian ini dengan jumlah dataset sebanyak 500 tweet yang berasal dari crawling data twitter, terdapat 250 tweet yang dijadikan dataset pada masing-masing objek. Sejumlah data tersebut akan dipergunakan untuk data training serta data testing dalam proses pembuatan model menggunakan algoritma Support Vector Machine. Metode yang digunakan untuk pengujian model adalah Confusion Matrix sedangkan K-Fold Cross Validation ditujukan untuk untuk membagi data training dan data testing sesuai lipatan yang digunakan. Hasil pengujian yang diperoleh menggunakan metode K-Fold Cross Validation dan Confusion Matrix pada model yang dibuat menggunakan algoritma Support Vector Machine yang memberikan hasil nilai accuracy 79,6%, precision 76,5%, recall 72,8% , dan F1-score 74,6% untuk Telkom, serta accuracy 83,2%, precision 78,8%, recall 71,6%, dan F1-score 75% untuk Biznet.

Download Full-text

Perbandingan Algoritma Naive Bayes dan Support Vector Machine dalam Seleksi Kelulusan Pemberkasan Beasiswa BPP-PPA Fakultas Teknik Universitas Negeri Jakarta

PINTER Jurnal Pendidikan Teknik Informatika dan Komputer ◽

10.21009/pinter.2.2.4 ◽

2018 ◽

Vol 2 (2) ◽

pp. 108-115

Author(s):

Fakhriyani ◽

Widodo ◽

Bambang Prasetya Adhi

Keyword(s):

Data Mining ◽

Support Vector Machine ◽

Cross Validation ◽

Naive Bayes ◽

Naïve Bayes ◽

Support Vector ◽

Fold Cross Validation

Beasiswa merupakan salah satu program untuk membantu meringankan mahasiswa dalam membayar uang kuliah, namun sering terjadi kesalahan dalam pemberian beasiswa tersebut karena masih dilakukan secara manual dan tidak adanya kriteria yang jelas bagaimana seorang mahasiswa dapat memperoleh beasiswa. Untuk mengantisipasi agar tidak terjadinya kesalahan dalam pemberian beasiswa maka dibutuhkan sebuah Sistem Pendukung Keputusan, namun sebelum dilakukan pembuatan sistem tersebut dirasa perlu untuk mengetahui algoritma terbaik untuk menyeleksi berkas beasiswa tersebut. Penelitian ini menggunakan duaalgoritma Data Mining yaitu algoritma Naïve Bayes dan Support Vector Machine. Naïve Bayes merupakan metode pengklasifikasian yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class berdasarkan pengalaman di masa sebelumnya dengan kondisi antar atribut saling bebas. Support Vector Machine adalah sebuah metode prediksi dalam klasifikasi yang dapat dilakukan pada kasus yang secara linier dapat dipisahkan, maupun non-linier dengan menggunakan konsep kernel pada ruang kerja berdimensi tinggi.Data mahasiswa yang lulus dan tidak lulus seleksi berkas beasiswa BPP-PPA akan diolah menggunakan algoritma Naïve Bayes dan Support Vector Machine. Setelah diklasifikasi kedua algoritma tersebut akan dihitung hasil akurasinya menggunakan K-fold Cross Validation. Berdasarkan hasil contoh kasus seleksi menunjukan bahwa hasil perhitungan akurasi algoritma Naïve Bayes adalah 0.7542, sedangkan hasil akurasi algoritma Support Vector Machine adalah 0.99. Kedua sistem telah mampu menangani proses penyeleksiankelulusan pemberkasan beasiswa BPP-PPA Fakultas Teknik Universitas Negeri Jakarta. Algoritma Support Vector Machine menghasilkan rata-rata akurasi 0.99 yang mendekati 1, maka algoritma tersebut dinilai lebih akurat dan direkomendasikan untuk penelitian selanjutnya.

Download Full-text

KLASIFIKASI SMS SPAM MENGGUNAKAN SUPPORT VECTOR MACHINE

Jurnal Pilar Nusa Mandiri ◽

10.33480/pilar.v15i2.693 ◽

2019 ◽

Vol 15 (2) ◽

pp. 275-280

Author(s):

Agus Setiyono ◽

Hilman F Pardede

Keyword(s):

Data Mining ◽

Support Vector Machine ◽

Decision Tree ◽

Naive Bayes ◽

Naïve Bayes ◽

Support Vector ◽

Spam Detection ◽

Support Vector Machine Algorithm ◽

Data Mining Techniques ◽

To Receive

It is now common for a cellphone to receive spam messages. Great number of received messages making it difficult for human to classify those messages to Spam or no Spam. One way to overcome this problem is to use Data Mining for automatic classifications. In this paper, we investigate various data mining techniques, named Support Vector Machine, Multinomial Naïve Bayes and Decision Tree for automatic spam detection. Our experimental results show that Support Vector Machine algorithm is the best algorithm over three evaluated algorithms. Support Vector Machine achieves 98.33%, while Multinomial Naïve Bayes achieves 98.13% and Decision Tree is at 97.10 % accuracy.

Download Full-text

Combination of Support Vector Machine and K-Fold cross-validation for prediction of long-term degradation of the compressive strength of marine concrete

International Journal of Computational Physics Series ◽

10.29167/a1i1p120-130 ◽

2018 ◽

Vol 1 (1) ◽

pp. 120-130 ◽

Cited By ~ 1

Author(s):

Chunxiang Qian ◽

Wence Kang ◽

Hao Ling ◽

Hua Dong ◽

Chengyao Liang ◽

...

Keyword(s):

Support Vector Machine ◽

Environmental Factors ◽

Cross Validation ◽

Concrete Strength ◽

Simulation Method ◽

Support Vector ◽

Svm Model ◽

Artificial Neural Network Ann ◽

Influence Degree ◽

Fold Cross Validation

Support Vector Machine (SVM) model optimized by K-Fold cross-validation was built to predict and evaluate the degradation of concrete strength in a complicated marine environment. Meanwhile, several mathematical models, such as Artificial Neural Network (ANN) and Decision Tree (DT), were also built and compared with SVM to determine which one could make the most accurate predictions. The material factors and environmental factors that influence the results were considered. The materials factors mainly involved the original concrete strength, the amount of cement replaced by fly ash and slag. The environmental factors consisted of the concentration of Mg2+, SO42-, Cl-, temperature and exposing time. It was concluded from the prediction results that the optimized SVM model appeared to perform better than other models in predicting the concrete strength. Based on SVM model, a simulation method of variables limitation was used to determine the sensitivity of various factors and the influence degree of these factors on the degradation of concrete strength.

Download Full-text

Data Mining Approach to Analyze COVID-19 Clinical Dataset

10.53350/pjmhs211561812 ◽

2021 ◽

Vol 15 (6) ◽

pp. 1812-1819

Author(s):

Azita Yazdani ◽

Ramin Ravangard ◽

Roxana Sharifian

Keyword(s):

Artificial Intelligence ◽

Data Mining ◽

Support Vector Machine ◽

Nearest Neighbor ◽

Clinical Signs ◽

Study Data ◽

Mining Machine ◽

Support Vector ◽

K Nearest Neighbor ◽

Data Mining Approach

The new coronavirus has been spreading since the beginning of 2020 and many efforts have been made to develop vaccines to help patients recover. It is now clear that the world needs a rapid solution to curb the spread of COVID-19 worldwide with non-clinical approaches such as data mining, enhanced intelligence, and other artificial intelligence techniques. These approaches can be effective in reducing the burden on the health care system to provide the best possible way to diagnose and predict the COVID-19 epidemic. In this study, data mining models for early detection of Covid-19 in patients were developed using the epidemiological dataset of patients and individuals suspected of having Covid-19 in Iran. C4.5, support vector machine, Naive Bayes, logistic regression, Random Forest, and k-nearest neighbor algorithm were used directly on the dataset using Rapid miner to develop the models. By receiving clinical signs, this model diagnosis the risk of contracting the COVID-19 virus. Examination of the models in this study has shown that the support vector machine with 93.41% accuracy is more efficient in the diagnosis of patients with COVID-19 pandemic, which is the best model among other developed models. Keywords: COVID-19, Data mining, Machine Learning, Artificial Intelligence, Classification

Download Full-text

Support Vector Machine VS Information Gain: Analisis Sentimen Cyberbullying di Twitter Indonesia

Jurnal ULTIMA InfoSys ◽

10.31937/si.v11i2.1740 ◽

2020 ◽

Vol 11 (2) ◽

pp. 107-111

Author(s):

Christevan Destitus ◽

Wella Wella ◽

Suryasari Suryasari

Keyword(s):

Support Vector Machine ◽

Feature Selection ◽

Text Mining ◽

Information Gain ◽

Text Processing ◽

Support Vector ◽

Term Weighting ◽

System Process ◽

Research Stage

This study aims to clarify tweets on twitter using the Support Vector Machine and Information Gain methods. The clarification itself aims to find a hyperplane that separates the negative and positive classes. In the research stage, there is a system process, namely text mining, text processing which has stages of tokenizing, filtering, stemming, and term weighting. After that, a feature selection is made by information gain which calculates the entropy value of each word. After that, clarify based on the features that have been selected and the output is in the form of identifying whether the tweet is bully or not. The results of this study found that the Support Vector Machine and Information Gain methods have sufficiently maximum results.

Download Full-text