scholarly journals Prediksi Ketepatan Kelulusan Mahasiswa Diploma dengan Komparasi Algoritma Klasifikasi

2019 ◽  
Vol 7 (3) ◽  
pp. 202
Author(s):  
Muhammad Sony Maulana ◽  
Raja Sabarudin ◽  
Wahyu Nugraha

AMIK BSI Pontianak merupakan salah satu perguruan tinggi swasta yang memiliki jumlah mahasiswa yang banyak, namun dalam perjalanannya masih terdapat permasalahan yang setiap tahun nya terjadi yaitu permasalahan jumlah kelulusan mahasiswa yang tepat waktu dan terlambat. Jumlah mahasiswa yang lulus tepat waktu menjadi indikator efektifitas dari sebuah perguruan tinggi baik negeri dan swasta. Perguruan tinggi perlu mendeteksi perilaku  dari mahasiswa aktif sehingga dapat dilihat faktor yang menyebabkan mahasiswa tidak lulus tepat waktu. Pada penelitian ini, akan mengkomparasikan atau membandingkan 5 metode data mining untuk menentukan metode mana yang paling optimal dalam menentukan ketepatan kelulusan mahasiswa dengan teknik pengujian T-Test, metode yang dibandingkan adalah metode Decision Tree, Naive Bayes, K-NN, Rule Induction, dan Random Forest. Hasil dari penelitian ini menghasilkan bahwa algoritma Rule Induction dan C4.5 adalah metode yang paling optimal performanya dalam menentukan ketepatan kelulusan mahasiswa diploma AMIK BSI Pontianak

Author(s):  
Panny Agustia Rahayuningsih

Penyakit Kanker merupakan sepuluh besar penyakit pembunuh di dunia. Kanker merupakan penyakit yang ganas dan sulit disembuhkan jika penyebarannya sudah terlalu luas. Akan tetapi, pendeteksian sel kanker sedini mungkin dapat mengurangi resiko kematian. Penelitian ini bertujuan untuk memprediksikan tingkat kematian dini kanker pada penduduk Eropa dengan menggunakan 5algoritma klasifikasi yaitu: Desecion Tree, Naïve Bayes, k-Nearset Neighbour, Random Forest dan Neural Network dari algoritma tersebut algoritma mana yang dianggap paling baik untuk penelitian ini. Pengujian dilakukan dengan beberapa tahapan penelitian antara lain: dataset (pengumpulan data), pengolahan data awal, metode yang diusulkan, pengujian metode menggunakan 10-fold cross validation, evaluasi hasil dan uji beda t-test. Nilai alpha yang digunakan adalah 0.05. jika probabilitasnya >0.05 maka H0 diterima. Sedangkan jika probabilitasnya <0.05 maka Ho ditolak.Hasil dari penelitian yang mendapatkan performe terbaik dengan nilai akurasi sebesar 98,35% adalah algoritma Neural Network. Sedangkan, hasil penelitian menggunakan uji t-test algoritma dengan model terbaik yaitu: algoritma Random Forest dan Neural Network, algoritma Naïve Bayes lumanyan baik, algoritma Desecion Tree cukup baik dan algoritma yang kurang baik adalah algoritma K-Nearset Neighbour (K-NN).


Techno Com ◽  
2019 ◽  
Vol 18 (4) ◽  
pp. 321-331
Author(s):  
Castaka Agus Sugianto ◽  
Firdi Rizky Maulana

Kelurahan Utama merupakan instansi pemerintahan di cimahi selatan. Kelurahan utama menjalankan program pemerintah yaitu program Bantuan Pangan Non Tunai, dalam menjalankan program Bantuan Pangan Non Tunai sebagian warga banyak yang mengeluh karena tidak mendapat bantuan, sedangkan ada beberapa warga yang dianggap mampu justru mendapatkan bantuan. Berdasarkan latar belakang tersebut maka penulis melakukan proses pengolahan data menggunakan data mining untuk mengklasifikasi penerima dan bukan penerima bantuan pangan non tunai dengan metode klasifikasi menggunakan Algoritma Naïve Bayes dan Algoritma Decision Tree sebagai pembanding. Diharapkan data yang dihasilkan dari proses data mining bisa menjadi bahan evaluasi untuk pemerintah. Dalam penelitian ini penulis mengklasifikasi data penerima dan bukan penerima bantuan pangan non tunai menggunakan teknik klasifikasi pada data mining menggunakan Algoritma Naïve Bayes dan Algoritma Decision Tree sebagai pembanding. Model data mining di buat menggunakan RapidMiner, dengan hasil nilai Probabilitas untuk class ‘’PENERIMA’’ yaitu 0,481 dengan pembulatan nilai menjadi 0,48 dan nilai Probabilitas untuk class ‘’Bukan Penerima’’ yaitu 0,519 dengan pembulatan nilai menjadi 0,52. Algoritma Naïve Bayes mempunyai tingkat Accuracy sebesar 58,29%, Precision 92,90%, Recall 21,84%, AUC 0,765, F-Measure 34.42%. Sedangkan algoritma Decision Tree mempunyai tingkat Accuracy sebesar 73,97%, Precision 85,04%, Recall 61,92%, AUC 0,746, F-Measure 71,17%. Dalam hasil pengujian T-Test antara Algoritma Naive Bayes dan Algoritma Decision Tree didapat alpha ≤ 0.000, maka dapat disimpulkan pengujian T-Test antara Algoritma Naïve Bayes dan Algoritma Decision Tree hasilnya signifikan.


2019 ◽  
Vol 6 (3) ◽  
pp. 341
Author(s):  
I Putu Pradnyana Iswara ◽  
Ahmad Afif Supianto

Pada penelitian ini kami mengimplementasikan algoritma klasifikasi untuk memberikan rekomendasi kepada mahasiswa keminatan apa yang lebih cocok diambil berdasarkan nilai-nilai mata kuliah prasyarat di semester-semester sebelumnya. Diharapkan dengan adanya rekomendasi ini semakin jelas pembatas antara disiplin ilmu yang ada pada Program Studi Sistem Informasi Universitas Brawijaya dimana terdapat 3 jenis jalur keminatan mata kuliah pilihan yaitu <em>Database</em>, Logika &amp; pemrograman dan Manajemen SI/TI. Data set yang terdiri dari data <em>training</em> dan data testing merupakan data akademik dari mahasiswa angkatan 2015 yang sudah mengambil mata kuliah pilihan, data target dari penelitian ini adalah data akademik mahasiswa angkatan 2016. Algoritma klasifikasi yang digunakan adalah <em>Rule Induction, CHAID, Random Forest, ID3, </em> dan <em>Naive Bayes</em>. Komposisi dari data <em>training</em> dan <em>testing</em> diubah-ubah untuk mengetahui pengaruh perubahan komposisi tersebut. Kelima algoritma tersebut diuji sebanyak 5 kali. Dari seluruh hasil pengujian didapatkan rata-rata akurasi dari kelima metode yang diusulkan berturut-turut adalah 66,48%, 67,49%, 80,62%, 86,90% dan 77,68%. Hasil tersebut menunjukkan bahwa algoritma dengan rata-rata akurasi tertinggi dimiliki oleh algoritma <em>ID3 </em>dikarenakan algoritmanya yang fleksibel dan dapat lebih akurat untuk menguji data yang digunakan<em>.</em>


Author(s):  
Nana Suryana ◽  
Pratiwi Pratiwi ◽  
Rizki Tri Prasetio

Industri telekomunikasi menghadapi persaingan yang ketat antara penyedia layanan (service provider). Persaingan ini mengakibatkan customer churn atau berpindahnya pelanggan dari satu layanan ke layanan lain. Customer churn menjadi masalah utama karena dapat mempengaruhi pendapatan perusahaan, profitabilitas, serta kelangsungan hidup perusahaan. Oleh karena itu, mengetahui pelanggan yang akan melakukan churn secara dini menjadi salah satu cara yang cukup efektif dilakukan, karena dapat membantu perusahaan dalam membuat rencana yang efektif untuk tetap mempertahankan pelanggannya. Jumlah pelanggan yang mengundurkan diri dari layanannya saat ini biasanya dimiliki perusahaan dalam jumlah yang sedikit. Kondisi kekurangan data ini menyebabkan kesulitan dalam memprediksi customer churn. Tujuan umum dari penelitian ini adalah memprediksi pelanggan yang akan berpindah ke layanan lain atau mengundurkan diri dari layanannya saat ini. Sementara tujuan khusus penelitian Penelitian ini berusaha menangani ketidakseimbangan data dalam prediksi customer churn menggunakan optimasi pada level data melalui metode sampling yaitu Synthetic Minority Over Sampling. Kemudian dikombinasikan dengan optimasi level algoritma melalui pendekatan teknik Boosting. Pada penelitian beberapa algoritma prediksi seperti random forest, naïve bayes, decision tree, k-nearest neighbor dan deep learning yang akan diimplementasikan untuk mengetahui algoritma yang paling baik setelah dilakukan optimasi menggunakan SMOTE dan Boosting. Metode penelitian yang digunakan pada penelitian ini adalah CRISP-DM, yang merupakan kerangka penelitian data mining untuk penelitian lintas industri. Hasil penelitian ini menunjukan bahwa algoritma random forest merupakan algoritma yang menghasilkan akurasi paling optimal setelah dioptimasi menggunakan SMOTE dan Boosting dengan hasil akurasi 89,19%. The telecommunications industry faces stiff competition between service providers. This competition results in customer churn. Customer churn is a major problem because it can affect company revenue, profitability, survival, and service quality of the company. Therefore, knowing which customers will churn in the future early is one of the most effective ways to do it, because it can help companies make an effective plan to keep their customers. The number of customers who withdrew from its current services is usually owned by a small number. This lack of data causes difficulties in predicting customer churn. This problem then becomes a challenging issue in machine learning. The general purpose of this research is to predict customers who will churn. While the specific purpose of this research is to try to deal with data imbalances in predicting customer churn using optimization at the data level through the sampling method, namely Synthetic Minority Over Sampling (SMOTE). Then combined with algorithm level optimization through the Boosting technique approach. In this study, several prediction algorithms like the random forest, naïve Bayes, decision tree, k-nearest neighbor, and deep learning will be implemented to find out the best algorithm after optimization using SMOTE and Boosting. The method used in this study is CRISP-DM, which is a data mining research framework for cross-industry research. The results of this study indicate that the random forest algorithm is an algorithm that produces the most optimal accuracy after being optimized using SMOTE and Boosting with an accuracy of 89.19%.


2021 ◽  
Vol 2 (7) ◽  
pp. 970-1007
Author(s):  
Muhammad Rizki Fahdia ◽  
Dwiza Riana ◽  
Fachri Amsury ◽  
Irwansyah Saputra ◽  
Nanang Ruhyana

Politeknik Tri Mitra Karya Mandiri adalah salah satu perguruan tinggi vokasi yang berada di wilayah Cikampek Kabupaten Karawang yang pada tahun akademik 2017/2018 mempunyai jumlah mahasiswa mencapai 987 orang mahasiswa.Namun sayangnya dari total jumlah mahasiswa tidak seluruhnya mempunyai orientasi minat yang sesungguhnya untuk kuliah, banyak factor yang mempengaruhinya. Tinginya tingkat orientasi minat mahasiswa yang tidak memilih kuliah, inilah yang membuat diadakan penelitian tentang sebab-sebab mengapa mahasiswa berkuliah dikampus ini serta mecari solusi guna mengurangi jumlah mahasiswa yang menjadi non aktif ketika diketahui mempunyai orientasi minat yang bukan untuk kuliah. Dengan melakukan komparasi menggunakan 3 algoritma yang termasuk dalam metode klasifikasi data mining yaitu; Decision Tree C4.5, Naïve Bayes dan K-Nearest Neighbor penelitian ini mencari nilai akurasi dan Area Under Curve (AUC) yang terbaik dari ketiga algoritma yang dikomparasi guna ditentukan model yang digunakan pada penentuan orientasi minat mahasiswa. Hasil dari komparasi yang dilakukan dalam penelitian ini adalah; algoritma Decision Tree C4.5 mempunyai nilai akurasi sebesar 91,75% dan AUC sebesar 0,969, Naïve Bayes mempunyai nilai akurasi sebesar 86,77% dan AUC sebesar 0,930 sedangngkan K-Nearest Neighbor mempunyai nilai akurasi sebesar 88,61% dan AUC sebesar 0,500. Melalui uji beda yang dilakukan menggunakan operator T-test pada Rapid Miner ditemukan hasil bahwa algoritma Decision Tree C4.5 merupakan algoritma terbaik dari 3 buah algoritma yang digunakan, maka dalam penelitian ini digunakan rule Decision Tree C4.5 untuk diterapkan pada deployment yang dilakukan.


2019 ◽  
Vol 15 (2) ◽  
pp. 275-280
Author(s):  
Agus Setiyono ◽  
Hilman F Pardede

It is now common for a cellphone to receive spam messages. Great number of received messages making it difficult for human to classify those messages to Spam or no Spam.  One way to overcome this problem is to use Data Mining for automatic classifications. In this paper, we investigate various data mining techniques, named Support Vector Machine, Multinomial Naïve Bayes and Decision Tree for automatic spam detection. Our experimental results show that Support Vector Machine algorithm is the best algorithm over three evaluated algorithms. Support Vector Machine achieves 98.33%, while Multinomial Naïve Bayes achieves 98.13% and Decision Tree is at 97.10 % accuracy.


2019 ◽  
Vol 3 (3) ◽  
pp. 103
Author(s):  
Ni Wayan Wardani ◽  
Ni Kadek Ariasih

Pelanggan adalah salah satu aset utama bagi perusahaan ritel. Perusahaan harus dapat mengenali bagaimana karakter pelanggan mereka sehingga mereka dapat mempertahankan pelanggan yang sudah ada agar tidak berhenti membeli dan pindah ke perusahaan ritel yang bersaing (churn). Salah satu model yang tepat untuk mengenali karakter pelanggan adalah model RFM (Recency, Frekuensi, Moneter). Model RFM mampu menghasilkan kelas pelanggan dan di setiap kelas pelanggan dapat dianalisis atau diprediksi dengan konsep data mining apakah pelanggan tetap sebagai pelanggan atau churn. Data yang digunakan berasal dari data pelanggan dan data penjualan di UD. Mawar Sari. Kelas pelanggan UD Mawar Sari yang dihasilkan dari model RFM adalah Dormant, Everyday, Golden dan Superstar. Konsep data mining dengan membangun model prediksi dalam penelitian ini menggunakan algoritma Decision Tree C4.5 dan Naïve Bayes. Di semua kelas pelanggan kinerja Algoritma Naïve Bayes lebih baik daripada Algoritma Decision Tree C4.5 dengan Recall 95,92%, Precision 84,15%, dan Accuracy 83,49% dan kelas pelanggan yang memiliki potensi churn tinggi adalah Dormant B, Dormant E, dan Dormant F.Kata Kunci: Prediksi Churn, RFM, C4.5, Naïve Bayes


Author(s):  
T R Stella Mary ◽  
Shoney Sebastian

<span>Data mining can be defined as a process of extracting unknown, verifiable and possibly helpful data from information. Among the various ailments, heart ailment is one of the primary reason behind death of individuals around the globe, hence in order to curb this, a detailed analysis is done using Data Mining. Many a times we limit ourselves with minimal attributes that are required to predict a patient with heart disease. By doing so we are missing on a lot of important attributes that are main causes for heart diseases. Hence, this research aims at considering almost all the important features affecting heart disease and performs the analysis step by step with minimal to maximum set of attributes using Data Mining techniques to predict heart ailments. The various classification methods used are Naïve Bayes classifier, Random Forest and Random Tree which are applied on three datasets with different number of attributes but with a common class label. From the analysis performed, it shows that there is a gradual increase in prediction accuracies with the increase in the attributes irrespective of the classifiers used and Naïve Bayes and Random Forest algorithms comparatively outperforms with these sets of data.</span>


Sign in / Sign up

Export Citation Format

Share Document