KLASIFIKASI SMS SPAM MENGGUNAKAN SUPPORT VECTOR MACHINE

2019 ◽  
Vol 15 (2) ◽  
pp. 275-280
Author(s):  
Agus Setiyono ◽  
Hilman F Pardede

It is now common for a cellphone to receive spam messages. Great number of received messages making it difficult for human to classify those messages to Spam or no Spam.  One way to overcome this problem is to use Data Mining for automatic classifications. In this paper, we investigate various data mining techniques, named Support Vector Machine, Multinomial Naïve Bayes and Decision Tree for automatic spam detection. Our experimental results show that Support Vector Machine algorithm is the best algorithm over three evaluated algorithms. Support Vector Machine achieves 98.33%, while Multinomial Naïve Bayes achieves 98.13% and Decision Tree is at 97.10 % accuracy.

2020 ◽  
Vol 5 ◽  
pp. 19-24
Author(s):  
Dyah Retno Utari ◽  
Arief Wibowo

Asuransi kendaraan bermotor merupakan jenis usaha pertanggungan terhadap kerugian atau risiko kerusakan yang dapat timbul dari berbagai macam potensi kejadian yang menimpa kendaraan. Persaingan dalam bisnis asuransi khususnya untuk kendaraan bermotor menuntut inovasi dan strategi agar keberlangsungan bisnis tetap terjamin. Salah satu upaya yang dapat dilakukan perusahaan adalah memprediksi status keberlanjutan polis asuransi kendaraan dengan menganalisis data-data profil dan transaksi nasabah. Prediksi terhadap keputusan pemegang polis menjadi sangat penting bagi perusahaan, karena dapat menentukan strategi pemasaran yang mempengaruhi keputusan pelanggan untuk pembaharuan polis asuransi. Penelitian ini telah mengusulkan suatu model prediksi status keberlanjutan polis asuransi kendaraan dengan teknik pemilihan mayoritas dari hasil klasifikasi menggunakan algoritma- algoritma data mining seperti Naive Bayes, Support Vector Machine dan Decision Tree. Hasil pengujian menggunakan confusion matrix menunjukkan nilai akurasi terbaik diperoleh sebesar 93,57%, apapun untuk nilai precision mencapai 97,20%, dan nilai recall sebesar 95,20% serta nilai F-Measure sebesar 95,30%. Nilai evaluasi model terbaik dihasilkan menggunakan pendekatan pemilihan mayoritas (majority voting), mengungguli kinerja model prediksi berbasis pengklasifikasi tunggal.


2019 ◽  
Vol 5 (2) ◽  
pp. 171
Author(s):  
Alfa Saleh ◽  
Meilinda Maryam

Sebagai salah satu perusahaan pengolahan pakan teknak berbahan dasar jagung, PT. Indojaya Agrinusa berusaha untuk menjaga kualitas produk-produk terbaik yang akan dipasarkan. tentu hal tersebut tidak terlepas dari usaha untuk meningkatkan mutu ataupun kualitas yang menjadi tolak ukur pelanggan dalam memilih barang atau produk mana yang akan digunakan untuk keperluan masing-masing. Belum adanya penentuan standar mutu jagung yang tersistem sehingga perusahaan lambat dalam menentukan standar mutu jagung serta cukup menghambat proses produksi pakan ternak pada perusahaan tersebut. Pada Penelitian terdahulu, telah dilakukan pengujian menggunakan teknik data mining khususnya metode Naive Bayes dalam menentukan standar mutu jagung, di mana penerapan metode tersebut menghasilkan tingkat akurasi rata-rata sebesar 83.33 %. sementara pada penelitian ini, pengujian dilakukan dengan menggunakan metode Decision Tree (C 4.5) dan Support Vector Machine (SVM) untuk menemukan metode yang lebih efektif dan akurat dalam menentukan mutu jagung sehingga layak untuk diproduksi. Hasil akurasi yang didapatkan oleh metode Decision Tree (C 4.5) meningkat dari hasil pengujian sebelumnya menjadi 86.17%, sementara hasil akurasi yang didapatkan dari penerapan metode Support Vector Machine (SVM) juga meningkat dari hasi pengujian sebelumnya yang menggunakan metode Naïve Bayes menjadi 94.03%. Sehingga dapat disimpulkan bahwa penggunaan metode Support Vector Machine (SVM) lebih baik dibandingkan metode Naïve Bayes dan Decision Tree (C 4.5). Kata kunci—Mutu Jagung, Data Mining, Naïve Bayes, Decision Tree, Support Vector Machine


2021 ◽  
Vol 7 (1) ◽  
pp. 51-54
Author(s):  
Lusa Indah Prahartiwi ◽  
Wulan Dari

Kanker payudara merupakan kanker paling umum pada wanita di seluruh dunia dengan menyumbang 25,4% dari total jumlah kasus baru yang didiagnosis pada tahun 2018.  Kanker adalah sekelompok besar penyakit yang dapat dimulai di hampir semua organ atau jaringan tubuh ketika sel abnormal tumbuh tak terkendali, melampaui batas biasanya untuk menyerang bagian tubuh yang berdekatan dan/atau menyebar ke organ lain. Penyakit kanker payudara dapat diprediksi dengan pengetahuan data mining. Data mining dapat menemukan korelasi, pola, dan tren baru yang bermakna dengan memilah-milah data dalam jumlah besar yang disimpan dalam repositori, menggunakan teknologi pengenalan pola serta teknik statistik dan matematika. Penelitian ini membandingkan performa Algoritma Naive Bayes, Decision Tree dan Support Vector Machine untuk memprediksi penyakit kanker payudara. Dataset yang digunakan adalah data sekunder Breast Cancer Coimbra yang diambil dari UCI Repository. Hasil dari penelitian ini menunjukan bahwa Algoritma Support Vector Machine menghasilkan tingkat Accuracy tertinggi yaitu sebesar 74,29% dibandingkan dengan Algoritma Naive Bayes dan Decision Tree


2018 ◽  
Vol 9 (1) ◽  
pp. 361-370
Author(s):  
Endang Supriyati ◽  
Mohammad Iqbal

Klasifikasi teks adalah proses mengkelompokan teks ke satu kelompok atau lebih dari daftar yang telah ditentukan sebelumnya. Statistik ayat-ayat Alquran dipelajari dan dijelaskan dalam literatur, seperti jumlah surah dan ayat, ukuran ayat menurut kata-kata, ukuran ayat dengan huruf dan hubungan ayat satu dengan lainnya. Ini memberi wawasan yang komprehensif tentang struktur ayat.   Penelitian ini akan membahas kedekatan tema ayat-ayat pada juz 30 yang berkaitan dengan kiamat, hisab, surga dan neraka. Langkah-langkah penelitian yaitu (1) pengumpulan data (2) preprocessing, (3) klasifikasi. Pengumpulan data dilakukan dengan me-record keseluruhan ayat pada juz 30 dilanjutkan dengan mendefiniskan tema tiap ayat yang berkaitan dengan kiamat, hisab, surga dan neraka.   Preposesing mempunyai tahapan tokenizing, filtering dan stemming. Kasifikasi dilakukan dengan menggunakan beberapa algoritma seperti Decision Tree, Support Vector Machine (SVM) dan    Naïve Bayes (NB). Dari hasil klasifikasi tersebut diperoleh hasil terbaik dengan klasifikasi decision tree akurasi 74,34%, SVM dengan akurasi 75,84%, dan Naïve Bayes dengan akurasi 66,29%. Kata kunci: data mining, teks klasifikasi, ayat Al Qur’an, similarity, algoritma klasifikasi.


2019 ◽  
Vol 13 (1) ◽  
pp. 11
Author(s):  
Yoga Pristyanto

Pada bidang data mining sering kali para peneliti tidak memperhatikan keseimbangan distribusi kelas pada dataset. Hal ini dapat menimbulkan kesulitan yang cukup serius pada algoritme klasifikasi. karena secara teori mayoritas classifier mengasumsikan distribusi yang relatif seimbang, sehingga menyebabkan kinerja suatu algoritme klasifikasi menjadi kurang maksimal. Oleh karena itu, pada penelitian ini diterapkan metode ensemble dengan penambahan adaptive boosting untuk menyelesaikan permasalahan tersebut. Dari hasil pengujian yang dilakukan pada penelitian ini, metode ensemble dengan penambahan adaptive boosting dapat meningkatkan nilai kinerja algoritme klasifikasi. Nilai kinerja algoritme Naive Bayes dengan Adaptive Boosting akurasi yang dihasilkan sebesar 91.98%, sensitifitas sebesar 91.98%, spesifisitas sebesar 96.49%, dan g-mean sebesar 94.21%. Nilai kinerja algoritme Support Vector Machine dengan Adaptive Boosting akurasi yang dihasilkan sebesar 91.52%, sensitifitas sebesar 91.52%, spesifisitas sebesar 96.29%, dan g-mean sebesar 93.88%. Sedangkan Nilai kinerja algoritme Decision Tree dengan Adaptive Boosting akurasi yang dihasilkan sebesar 94.37%, sensitifitas sebesar 94.37%, spesifisitas sebesar 97.73%, dan g-mean sebesar 96.03%. Hal ini menunjukkan bahwa metode ensemble dengan Adaptive Boosting dapat menjadi solusi untuk meningkatkan kinerja algoritme pada imbalanced dataset.Kata Kunci: adaptive boosting, data mining, ensemble, ketidakseimbangan kelas, klasifikasi.


Author(s):  
Ariesta Lestari ◽  
Elga Mariati ◽  
Widiatry Widiatry

Student in one of the stakeholder in a university. Therefore, student’s perception in the quality of learning facilities and infrastructures become important to ensure the university’s performance.  The Faculty of Engineering of University of Palangka Raya has not comprehensively evaluated the students’ satisfactory of the learning’s facilities. In this research, methods from data mining approach was implemented to classify whether the students satisfy or not with the quality of the learning’s facility in Engineering Faculty.  This research compared three data mining algorithm, Decision Tree C4.5, Support Vector Machine, and Naïve Bayes to obtain the best algorithm for the prediction system. 948 responses were collected, 61% of the respondent were satisfied with the quality of the learning facilities and infrastructures, while 39% of the respondents were dissatisfied. The Decision Tree c4.5 had the best performance with accuracy of 88%  and precision of 98% compared to the Naïve Bayes and support vector machine.


2020 ◽  
Vol 16 (2) ◽  
pp. 75
Author(s):  
Didit Widiyanto

Akurasi sebuah klasifikasi citra ditentukan oleh pengklasifikasi.  Meskipun RoI (Region of Interest) tidak menentukan secara langsung akurasi, namun RoI menentukan lingkup klasifikasi citra.   Terdapat tiga algoritma yang dapat digunakan sebagai algoritma RoI yaitu; Balanced Histogram Thresholding (BHT), algoritma Otsu, dan algoritma klasterisasi K-Means.  Paper ini meninjau algoritma Otsu dan algoritma klasterisasi K-Means yang digunakan oleh lima peneliti.  Dari ke lima peneliti; tiga peneliti menerapkan algoritma Otsu dan dua peneliti menerapkan algoritma K-Means sebagai algoritma RoI. Setelah operasi RoI, ke lima peneliti menerapkan algoritma GLCM (Gray Level Co-occurance Matrix) sebagai pengekstraksi ciri tekstur.  Hasil ekstraksi ciri diklasifikasi dengan menggunakan berbagai pengklasifikasi antara lain SVM (Support Vector Machine), Naive Bayes, dan Decision Tree. Akhirnya dengan membandingkan hasil dari ke lima peneliti, akurasi tertinggi diperoleh sebesar 100% dengan pengklasifikasi SVM menggunakan algoritma Otsu sebagai algoritma RoI, dan akurasi terendah adalah sebesar52% yang menggunakan algoritma Otsu pada kanal S dari citra HSV (Hue, Saturation Value).


Crime rate is expanding extremely more because of destitution and joblessness. With the current crime investigation techniques, officers need to invest a great deal of energy just as labor to recognize suspects and criminals. Anyway crime investigation procedure should be quicker and dynamic. As huge amount of data is gathered during crime investigation, data mining is a methodology which can be valuable in this viewpoint. Data mining is a procedure that concentrates valuable data from enormous amount of crime data with the goal that potential suspects of the crime can be recognized productively. Quantities of data mining techniques are accessible. Utilization of specific data mining system has more prominent impact on the outcomes acquired. So the exhibition of three data mining techniques will be analyzed against test crime and criminal database and best performing algorithm will be utilized against test crime and criminal database to recognize potential suspects of the crime. Data mining is a procedure of separating information from colossal amount of data put away in databases, data stockrooms and data archives. Clustering is the way toward consolidating data objects into gatherings. Here taken the Crime dataset from Chicago police website and implemented in MATLAB utilizing Support Vector Machine algorithm.


2020 ◽  
Vol 7 (1) ◽  
pp. 53
Author(s):  
Derisma Derisma ◽  
Fajri Febrian

Abstrak: Kanker payudara merupakan jenis kanker yang sering ditemukan oleh kebanyakan wanita. Di Indonesia Kanker payudara menempati urutan pertama pada pasien rawat inap di seluruh rumah sakit. Tujuan dari penelitian ini adalah melakukan diagnosis penyakit kanker payudara berbasis komputasi yang dapat menghasilkan bagaimana kondisi kanker seseorang berdasarkan akurasi algoritma. Penelitian ini menggunakan pemrograman orange python dan dataset Wisconsin Breast Cancer untuk pemodelan klasifikasi kanker payudara. Metode data mining yang diterapkan yaitu Neural Network, Support Vector Machine, dan Naive Bayes. Dalam penelitian ini didapat algoritma klasifikasi terbaik yaitu algoritma Kernel SVM dengan tingkat akurasi sebesar  98.9 % dan algoritma terendah yaitu Naive Bayes senilai 96.1 %.   Kata kunci: kanker payudara, neural network, support vector machine, naive bayes   Abstract: Breast cancer is a type of cancer that mostly found in many women. In Indonesia, breast cancer ranks first in hospitalized patients at every hospital. This study aimed to conduct a computation-based diagnose of breast cancer disease that could produce the state of cancer of an individual based on the accuracy of algorithm. This study used python orange programming and Wisconsin Breast Cancer dataset for a modeling and application of breast cancer classification. The data mining methods that were applied in this study were Neural Network, Support Vector Machine, dan Naive Bayes. In this study, Kernel SVM’s algorithm was the best classification algorithm of breast cancer disease with 98.9 % accuracy rate and Naïve Beyes was the lowest with 96.1 % of accuracy rate.   Keywords: breast cancer, neural network, support vector machine, naive bayes


Sign in / Sign up

Export Citation Format

Share Document