scholarly journals Analisa Komparasi Algoritma Decision Tree C4.5 dan Naïve Bayes untuk Prediksi Churn Berdasarkan Kelas Pelanggan Retail

2019 ◽  
Vol 3 (3) ◽  
pp. 103
Author(s):  
Ni Wayan Wardani ◽  
Ni Kadek Ariasih

Pelanggan adalah salah satu aset utama bagi perusahaan ritel. Perusahaan harus dapat mengenali bagaimana karakter pelanggan mereka sehingga mereka dapat mempertahankan pelanggan yang sudah ada agar tidak berhenti membeli dan pindah ke perusahaan ritel yang bersaing (churn). Salah satu model yang tepat untuk mengenali karakter pelanggan adalah model RFM (Recency, Frekuensi, Moneter). Model RFM mampu menghasilkan kelas pelanggan dan di setiap kelas pelanggan dapat dianalisis atau diprediksi dengan konsep data mining apakah pelanggan tetap sebagai pelanggan atau churn. Data yang digunakan berasal dari data pelanggan dan data penjualan di UD. Mawar Sari. Kelas pelanggan UD Mawar Sari yang dihasilkan dari model RFM adalah Dormant, Everyday, Golden dan Superstar. Konsep data mining dengan membangun model prediksi dalam penelitian ini menggunakan algoritma Decision Tree C4.5 dan Naïve Bayes. Di semua kelas pelanggan kinerja Algoritma Naïve Bayes lebih baik daripada Algoritma Decision Tree C4.5 dengan Recall 95,92%, Precision 84,15%, dan Accuracy 83,49% dan kelas pelanggan yang memiliki potensi churn tinggi adalah Dormant B, Dormant E, dan Dormant F.Kata Kunci: Prediksi Churn, RFM, C4.5, Naïve Bayes

2019 ◽  
Vol 15 (2) ◽  
pp. 275-280
Author(s):  
Agus Setiyono ◽  
Hilman F Pardede

It is now common for a cellphone to receive spam messages. Great number of received messages making it difficult for human to classify those messages to Spam or no Spam.  One way to overcome this problem is to use Data Mining for automatic classifications. In this paper, we investigate various data mining techniques, named Support Vector Machine, Multinomial Naïve Bayes and Decision Tree for automatic spam detection. Our experimental results show that Support Vector Machine algorithm is the best algorithm over three evaluated algorithms. Support Vector Machine achieves 98.33%, while Multinomial Naïve Bayes achieves 98.13% and Decision Tree is at 97.10 % accuracy.


Author(s):  
Poppy Sulistiawaty ◽  
Siti Nur Hasanah

Abstrak – Masalah penelitian adalah faktor risiko apa saja yang berhubungan dengan kejadian kanker payudara. Tujuan penelitian ini adalah untuk mengetahui faktor risiko yang berhubungan dengan kejadian kanker payudara di RSUD Kudus Tahun 2010. Metode penelitian adalah analitik obsevasional dengan rancangan kasus kontrol. Sampel kasus dalam penelitian ini adalah penderita kanker payudara pasien RSUD Kudus dan sampel kontrol adalah wanita bukan penderita kanker payudara yang merupakan tetangga dari penderita kanker payudara, sejumlah 59 kasus dan 59 kontrol yang diperoleh dengan teknik total sampling. Kata kunci—Data Mining, Diagnosa, Classifier, Naive Bayes, Decision Tree, Algoritma


2016 ◽  
Vol 7 (4) ◽  
Author(s):  
Mochammad Yusa ◽  
Ema Utami ◽  
Emha T. Luthfi

Abstract. Readmission is associated with quality measures on patients in hospitals. Different attributes related to diabetic patients such as medication, ethnicity, race, lifestyle, age, and others result in the calculation of quality care that tends to be complicated. Classification techniques of data mining can solve this problem. In this paper, the evaluation on three different classifiers, i.e. Decision Tree, k-Nearest Neighbor (k-NN), dan Naive Bayes with various settingparameter, is developed by using 10-Fold Cross Validation technique. The targets of parameter performance evaluated is based on term of Accuracy, Mean Absolute Error (MAE), dan Kappa Statistic. The selected dataset consists of 47 attributes and 49.735 records. The result shows that k-NN classifier with k=100 has a better performance in term of accuracy and Kappa Statistic, but Naive Bayes outperforms in term of MAE among other classifiers. Keywords: k-NN, naive bayes, diabetes, readmissionAbstrak. Proses Readmisi dikaitkan dengan perhitungan kualitas penanganan pasien di rumah sakit. Perbedaan atribut-atribut yang berhubungan dengan pasien diabetes proses medikasi, etnis, ras, gaya hidup, umur, dan lain-lain, mengakibatkan perhitungan kualitas cenderung rumit. Teknik klasifikasi data mining dapat menjadi solusi dalam perhitungan kualitas ini. Teknik klasifikasi merupakan salah satu teknik data mining yang perkembangannya cukup signifikan. Di dalam penelitian ini, model algoritma klasifikasi Decision Tree, k-Nearest Neighbor (k-NN), dan Naive Bayes dengan berbagai parameter setting akan dievaluasi performanya berdasarkan nilai performa Accuracy, Mean AbsoluteError (MAE), dan Kappa Statistik dengan metode 10-Fold Cross Validation. Dataset yang dievaluasi memiliki 47 atribut dengan 49.735 records. Hasil penelitian menunjukan bahwa performa accuracy, MAE, dan Kappa Statistik terbaik didapatkan dari Model Algoritma Naive Bayes.Kata Kunci: k-NN, naive bayes, diabetes, readmisi


2020 ◽  
Vol 5 ◽  
pp. 19-24
Author(s):  
Dyah Retno Utari ◽  
Arief Wibowo

Asuransi kendaraan bermotor merupakan jenis usaha pertanggungan terhadap kerugian atau risiko kerusakan yang dapat timbul dari berbagai macam potensi kejadian yang menimpa kendaraan. Persaingan dalam bisnis asuransi khususnya untuk kendaraan bermotor menuntut inovasi dan strategi agar keberlangsungan bisnis tetap terjamin. Salah satu upaya yang dapat dilakukan perusahaan adalah memprediksi status keberlanjutan polis asuransi kendaraan dengan menganalisis data-data profil dan transaksi nasabah. Prediksi terhadap keputusan pemegang polis menjadi sangat penting bagi perusahaan, karena dapat menentukan strategi pemasaran yang mempengaruhi keputusan pelanggan untuk pembaharuan polis asuransi. Penelitian ini telah mengusulkan suatu model prediksi status keberlanjutan polis asuransi kendaraan dengan teknik pemilihan mayoritas dari hasil klasifikasi menggunakan algoritma- algoritma data mining seperti Naive Bayes, Support Vector Machine dan Decision Tree. Hasil pengujian menggunakan confusion matrix menunjukkan nilai akurasi terbaik diperoleh sebesar 93,57%, apapun untuk nilai precision mencapai 97,20%, dan nilai recall sebesar 95,20% serta nilai F-Measure sebesar 95,30%. Nilai evaluasi model terbaik dihasilkan menggunakan pendekatan pemilihan mayoritas (majority voting), mengungguli kinerja model prediksi berbasis pengklasifikasi tunggal.


Techno Com ◽  
2019 ◽  
Vol 18 (4) ◽  
pp. 321-331
Author(s):  
Castaka Agus Sugianto ◽  
Firdi Rizky Maulana

Kelurahan Utama merupakan instansi pemerintahan di cimahi selatan. Kelurahan utama menjalankan program pemerintah yaitu program Bantuan Pangan Non Tunai, dalam menjalankan program Bantuan Pangan Non Tunai sebagian warga banyak yang mengeluh karena tidak mendapat bantuan, sedangkan ada beberapa warga yang dianggap mampu justru mendapatkan bantuan. Berdasarkan latar belakang tersebut maka penulis melakukan proses pengolahan data menggunakan data mining untuk mengklasifikasi penerima dan bukan penerima bantuan pangan non tunai dengan metode klasifikasi menggunakan Algoritma Naïve Bayes dan Algoritma Decision Tree sebagai pembanding. Diharapkan data yang dihasilkan dari proses data mining bisa menjadi bahan evaluasi untuk pemerintah. Dalam penelitian ini penulis mengklasifikasi data penerima dan bukan penerima bantuan pangan non tunai menggunakan teknik klasifikasi pada data mining menggunakan Algoritma Naïve Bayes dan Algoritma Decision Tree sebagai pembanding. Model data mining di buat menggunakan RapidMiner, dengan hasil nilai Probabilitas untuk class ‘’PENERIMA’’ yaitu 0,481 dengan pembulatan nilai menjadi 0,48 dan nilai Probabilitas untuk class ‘’Bukan Penerima’’ yaitu 0,519 dengan pembulatan nilai menjadi 0,52. Algoritma Naïve Bayes mempunyai tingkat Accuracy sebesar 58,29%, Precision 92,90%, Recall 21,84%, AUC 0,765, F-Measure 34.42%. Sedangkan algoritma Decision Tree mempunyai tingkat Accuracy sebesar 73,97%, Precision 85,04%, Recall 61,92%, AUC 0,746, F-Measure 71,17%. Dalam hasil pengujian T-Test antara Algoritma Naive Bayes dan Algoritma Decision Tree didapat alpha ≤ 0.000, maka dapat disimpulkan pengujian T-Test antara Algoritma Naïve Bayes dan Algoritma Decision Tree hasilnya signifikan.


2018 ◽  
Vol 4 (2) ◽  
pp. 83
Author(s):  
Tutus Praningki ◽  
Indra Budi

Tersedianya data histori rekam medis pasien kanker serviks pada institusi pelayanan kesehatan, tidak disertai dengan proses ekstraksi menjadi sebuah pengetahuan atau informasi. Penggunaan teknik data mining sangat berpotensi untuk diimplementasikan kedalam sistem yang dapat melakukan prediksi penyakit kanker serviks. Pada penelitian ini berfokus pada dataset diagnosa medis pasien yang akan melakukan tes Pap Smear. Algoritma yang digunakan untuk melakukan klasifikasi penyakit kanker serviks adalah Classification And Regression Trees (CART), Naive Bayes, dan k-Nearest Neighbor (k-NN). Pengujian yang dilakukan terhadap algoritma CART Decision Tree, Naive Bayes, dan k-NN, menggunakan formula Confusion Matrix, dengan menggunakan teknik pemecahan dataset Holdout. Hasil pengujian terhadap algoritma yang digunakan, menunjukkan algoritma Naive Bayes memiliki akurasi terbaik sebesar 94,44%, sedangkan tingkat akurasi yang dihasilkan algoritma CART dan k-NN adalah 88,89%, 85,04%. Performa yang didapatkan oleh masing-masing algoritma yang digunakan, memungkinkan penggunaan sistem prediksi penyakit kanker serviks untuk mendukung keputusan klinis pada pasien baru. 


Author(s):  
Yusuf Sulistyo Nugroho

SMA N 3 Boyolali merupakan salah satu sekolah menengah di kota Boyolali yang saat ini telah memiliki 2 jurusan yaitu IPA dan IPS. Penjurusan siswa ini dapat mengarahkan peserta didik agar lebih fokus dalam mengembangkan kemampuan diri dan minat yang dimiliki. Pemilihan jurusan yang tidak tepat bisa sangat merugikan siswa terhadap minat dan karir mereka di masa mendatang. Dengan penjurusan tersebut diharapkan dapat memaksimalkan potensi, bakat atau talenta individu, sehingga dapat memaksimalkan nilai akademisnya. Berdasarkan latar belakang tersebut, maka dengan menerapkan teknik data mining diharapkan dapat membantu siswa untuk menentukan jurusan yang tepat sesuai dengan kriteria yang ditetapkan. Adapaun teknik data mining yang digunakan dalam penentuan jurusan ini menggunakan 3 buah metode yaitu Algoritma C4.5, Naive Bayes dan Algoritma K-Means. Sedangkan atribut yang digunakan terdiri dari Gender, Minat, Rata-rata nilai IPA, Rata-rata nilai IPS, nilai Psikotest IPA, nilai Psikotest IPS, Asal Sekolah dan Jurusan. Analisis dilakukan dengan bantuan aplikasi RapidMiner 5 untuk mengetahui nilai-nilai perbandingan terhadap metode yang digunakan. Hasil penelitian menggunakan perbandingan 3 metode menunjukkan bahwa berdasarkan nilai precision, metode naive bayes lebih baik dibandingkan dengan metode yang lain dengan nilai 77,51%. Sedangkan berdasarkan nilai recall dan accuracy, decision tree lebih baik dibandingkan dengan metode yang lain dengan nilai recall sebesar 90,80% dan nilai accuracy sebesar 79,14%. Variabel yang paling berpengaruh dalam menentukan penjurusan yaitu rata-rata nilai IPA sehingga perlu dijadikan pertimbangan bagi pihak sekolah untuk menentukan jurusan siswa.


Sign in / Sign up

Export Citation Format

Share Document