scholarly journals Prediksi Hipertensi menggunakan Decision Tree, Naïve Bayes dan Artificial Neural Network pada software KNIME

Techno Com ◽  
2020 ◽  
Vol 19 (4) ◽  
pp. 353-363
Author(s):  
Mayanda Mega Santoni ◽  
Nurul Chamidah ◽  
Nurhafifah Matondang

Hipertensi merupakan salah satu penyakit tidak menular yang dapat menyebabkan kematian karena meningkatkan resiko munculnya berbagai penyakit seperti gagal ginjal, gagal jantung, bahkan stroke. Resiko hipertensi disebabkan oleh beberapa faktor penyebab seperti usia, keturunan, pola makan dan olahraga, dan merokok. Teknologi artificial intelligence yakni machine learning dimanfaatkan di bidang kesehatan khususnya prediksi penyakit hipertensi. Pada penelitian ini diimplementasi tiga algoritma machine learning yakni decision tree, naïve bayes dan artificial neural networks. Data yang digunakan pada penelitian ini sebanyak 274 data yang diperoleh dari hasil kuesioner dengan 26 pertanyaan, dimana 25 pertanyaan adalah variabel faktor resiko dan satu pertanyaan merupakan kelas yang menyatakan responden memiliki riwayat hipertensi atau tidak. Data diolah menggunakan platform analisis data yakni KNIME. Sebelum data diolah untuk membangun model klasifikasi menggunakan decision tree, naïve bayes dan artificial neural network, data dipraproses terlebih dahulu dengan melakukan imputasi missing value, oversampling dan normalisasi data. Selanjutnya pembagian data menggunakan 5-fold cross validation. Model klasifikasi yang diperoleh dievaluasi menggunakan nilai akurasi, recall dan precision. Hasil evaluasi dari eksperimen yang dilakukan diperoleh bahwa algoritma artificial neural network memiliki tingkat performa lebih baik dibandingkan decision tree dan naïve bayes dengan nilai akurasi sebesar 94.7%, recall sebesar 91.5% dan precision sebesar 97.7%.

2020 ◽  
Vol 4 (4) ◽  
pp. 635-641
Author(s):  
Nurul Chamidah ◽  
Mayanda Mega Santoni ◽  
Nurhafifah Matondang

Oversampling is a technique to balance the number of data records for each class by generating data with a small number of records in a class, so that the amount is balanced with data with a class with a large number of records. Oversampling in this study is applied to hypertension dataset where hypertensive class has a small number of records when compared to the number of records for non-hypertensive classes. This study aims to evaluate the effect of oversampling on the classification of hypertension dataset consisting of hypertensive and non-hypertensive classes by utilizing the Naïve Bayes, Decision Tree, and Artificial Neural Network (ANN) as well as finding the best model of the three algorithms. Evaluation of the use of oversampling on hypertension dataset is done by processing the data by imputing missing values, oversampling, and transforming data into the same range, then using the Naïve Bayes, Decision Tree, and ANN to build classification models. By dividing 80% of data as training data to build models and 20% as validation data for testing models, we had an increase in classification performance in the form of accuracy, precision, and recall of the oversampled data when compared without oversampling. The best performance in this study resulted in the highest accuracy using ANN with 0.91, precision 0.86 and recall 0.99.


2019 ◽  
Vol 23 (1) ◽  
pp. 67-77 ◽  
Author(s):  
Yao Yevenyo Ziggah ◽  
Hu Youjian ◽  
Alfonso Rodrigo Tierra ◽  
Prosper Basommi Laari

The popularity of Artificial Neural Network (ANN) methodology has been growing in a wide variety of areas in geodesy and geospatial sciences. Its ability to perform coordinate transformation between different datums has been well documented in literature. In the application of the ANN methods for the coordinate transformation, only the train-test (hold-out cross-validation) approach has usually been used to evaluate their performance. Here, the data set is divided into two disjoint subsets thus, training (model building) and testing (model validation) respectively. However, one major drawback in the hold-out cross-validation procedure is inappropriate data partitioning. Improper split of the data could lead to a high variance and bias in the results generated. Besides, in a sparse dataset situation, the hold-out cross-validation is not suitable. For these reasons, the K-fold cross-validation approach has been recommended. Consequently, this study, for the first time, explored the potential of using K-fold cross-validation method in the performance assessment of radial basis function neural network and Bursa-Wolf model under data-insufficient situation in Ghana geodetic reference network. The statistical analysis of the results revealed that incorrect data partition could lead to a false reportage on the predictive performance of the transformation model. The findings revealed that the RBFNN and Bursa-Wolf model produced a transformation accuracy of 0.229 m and 0.469 m, respectively. It was also realised that a maximum horizontal error of 0.881 m and 2.131 m was given by the RBFNN and Bursa-Wolf. The obtained results per the cadastral surveying and plan production requirement set by the Ghana Survey and Mapping Division are applicable. This study will contribute to the usage of K-fold cross-validation approach in developing countries having the same sparse dataset situation like Ghana as well as in the geodetic sciences where ANN users seldom apply the statistical resampling technique.


TEKNO ◽  
2019 ◽  
Vol 29 (1) ◽  
pp. 50
Author(s):  
Utomo Pujianto ◽  
Putri Yuni Ristanti

Pendidikan mempunyai standar sebagai acuan dalam proses pembelajaran. Dalam hal ini Pemerintah telah mengatur standar pendidikan di Indonesia, mengacu pada Peraturan Pemerintah Republik Indonesia Nomor 19 Tahun 2005 Pasal 6 ayat (1) yaitu kurikulum untuk jenis pendidikan umum, kejuruan, dan khusus pada jenjang pendidikan dasar dan menengah. Sesuai dengan Peraturan Pemerintah tersebut,  ditetapkannya Peraturan Menteri Pendidikan Nasional Republik Indonesia Nomor 23 Tahun 2006 pasal 1 ayat (2), tentang Standar Kompetensi Lulusan yang diantaranya memuat SK-KMP (Standar Kompetensi Kelompok Mata Pelajaran). Standar inilah yang dijadikan sebuah rujukan untuk tenaga pendidik, dan bakal tenaga pendidik khususnya mahasiswa bidang pendidikan untuk membuat sebuah media pembelajaran, jurnal sebagai bahan ajaran yang pokok. Tujuan penelitian ini untuk mengklasifikasikan minat mahasiswa PGSD terhadap tema mata pelajaran menurut SK-KMP menggunakan metode Naive Bayes dan Decision tree J48. Hasil penelitian tersebut dapat dijadikan sebagai referensi untuk pengambilan tema pada mata pelajaran di tahun mendatang untuk lebih bervariasi, tidak hanya membahas tentang salah satu mata pelajaran tersebut. Kinerja dari kedua metode tersebut akan dibandingkan, sehingga dapat diketahui kinerja metode mana yang lebih baik dalam melakukan klasifikasi dokumen. Pengujian performa algoritma klasifikasi yang digunakan adalah teknik K-fold Cross Validation. Berdasarkan pengujian performa penerapan algoritma Naïve Bayes dan Decision Tree J48 menggunakan teknik K-Fold Cross Validation terhadap 200  judul dan abstrak artikel jurnal, didapatkan algoritma Naive Bayes, tingkat akurasi sebesar 84%. Sementara itu, untuk hasil yang diperoleh dengan algoritma Decision Tree J48, tingkat akurasi sebesar 86%.


Author(s):  
Panny Agustia Rahayuningsih

Penyakit Kanker merupakan sepuluh besar penyakit pembunuh di dunia. Kanker merupakan penyakit yang ganas dan sulit disembuhkan jika penyebarannya sudah terlalu luas. Akan tetapi, pendeteksian sel kanker sedini mungkin dapat mengurangi resiko kematian. Penelitian ini bertujuan untuk memprediksikan tingkat kematian dini kanker pada penduduk Eropa dengan menggunakan 5algoritma klasifikasi yaitu: Desecion Tree, Naïve Bayes, k-Nearset Neighbour, Random Forest dan Neural Network dari algoritma tersebut algoritma mana yang dianggap paling baik untuk penelitian ini. Pengujian dilakukan dengan beberapa tahapan penelitian antara lain: dataset (pengumpulan data), pengolahan data awal, metode yang diusulkan, pengujian metode menggunakan 10-fold cross validation, evaluasi hasil dan uji beda t-test. Nilai alpha yang digunakan adalah 0.05. jika probabilitasnya >0.05 maka H0 diterima. Sedangkan jika probabilitasnya <0.05 maka Ho ditolak.Hasil dari penelitian yang mendapatkan performe terbaik dengan nilai akurasi sebesar 98,35% adalah algoritma Neural Network. Sedangkan, hasil penelitian menggunakan uji t-test algoritma dengan model terbaik yaitu: algoritma Random Forest dan Neural Network, algoritma Naïve Bayes lumanyan baik, algoritma Desecion Tree cukup baik dan algoritma yang kurang baik adalah algoritma K-Nearset Neighbour (K-NN).


2016 ◽  
Vol 7 (4) ◽  
Author(s):  
Mochammad Yusa ◽  
Ema Utami ◽  
Emha T. Luthfi

Abstract. Readmission is associated with quality measures on patients in hospitals. Different attributes related to diabetic patients such as medication, ethnicity, race, lifestyle, age, and others result in the calculation of quality care that tends to be complicated. Classification techniques of data mining can solve this problem. In this paper, the evaluation on three different classifiers, i.e. Decision Tree, k-Nearest Neighbor (k-NN), dan Naive Bayes with various settingparameter, is developed by using 10-Fold Cross Validation technique. The targets of parameter performance evaluated is based on term of Accuracy, Mean Absolute Error (MAE), dan Kappa Statistic. The selected dataset consists of 47 attributes and 49.735 records. The result shows that k-NN classifier with k=100 has a better performance in term of accuracy and Kappa Statistic, but Naive Bayes outperforms in term of MAE among other classifiers. Keywords: k-NN, naive bayes, diabetes, readmissionAbstrak. Proses Readmisi dikaitkan dengan perhitungan kualitas penanganan pasien di rumah sakit. Perbedaan atribut-atribut yang berhubungan dengan pasien diabetes proses medikasi, etnis, ras, gaya hidup, umur, dan lain-lain, mengakibatkan perhitungan kualitas cenderung rumit. Teknik klasifikasi data mining dapat menjadi solusi dalam perhitungan kualitas ini. Teknik klasifikasi merupakan salah satu teknik data mining yang perkembangannya cukup signifikan. Di dalam penelitian ini, model algoritma klasifikasi Decision Tree, k-Nearest Neighbor (k-NN), dan Naive Bayes dengan berbagai parameter setting akan dievaluasi performanya berdasarkan nilai performa Accuracy, Mean AbsoluteError (MAE), dan Kappa Statistik dengan metode 10-Fold Cross Validation. Dataset yang dievaluasi memiliki 47 atribut dengan 49.735 records. Hasil penelitian menunjukan bahwa performa accuracy, MAE, dan Kappa Statistik terbaik didapatkan dari Model Algoritma Naive Bayes.Kata Kunci: k-NN, naive bayes, diabetes, readmisi


2021 ◽  
Vol 5 (2) ◽  
pp. 157
Author(s):  
Mohamad Efendi Lasulika ◽  
Andi Bode

Meningkatnya volume produksi jagung yang diperdagangkan dan kecenderungan harga jagung dipasaran menuntut kebijakan pemerintah dalam mengendalikan stabilasi harga jagung. Sehingga pemerintah kesulitan dalam menentukan atau memprediksi harga komoditi yang akan datang, namun pada penelitian ini hanya fokus pada beberapa algoritma klasifikasi untuk mengetahui algoritma apakah yang mempunyai tingkat akurasi tertinggi dalam hal prediksi harga jagung sehingga dapat digunakan dalam melakukan prediksi harga beberapa hari kedepannya. Dalam data mining ada beberapa algoritma klasifikasi yang dapat digunakan, seperti K-Neural Network, Artificial Neural Network, Naïve Bayes, Regresi Linear, C-45 dll, namun pada penelitian ini hanya fokus pada dua metode saja yaitu Naïve Bayes dan K- Neural Network. Berdasarkan hasil penelitian yang dilakukan metode K-nn merupakan metode yang sangat bagus atau baik dalam melakukan prediksi ataupun klasifikasi, hala ini dapat dilihat dari hasil RMSE yang di hasilkan yaitu 0,05, metode ini mampu menghasilkan nilai terbaik walaupun tanpa adanya penambahan metode lain seperti forward selection, sementara itu untuk naïve bayes metode ini juga merupakan metode terbaik dalam melakukan prediksi ataupun klasifikasi, akan tetapi naïve bayes mempunyai beberapa kekurangan apabila digunakan untuk type data univariate ataupun numerical. Penambahan forward selection kepada pengolahan data dapat membantu menghasilkan akurasi yang baik pula. Walaupun tanpa forward selection K-NN dan Naïve bayes merupakan metode komputasi yang sangat baik dalam prediksi ataupun klasifikasi. Kata kunci: Harga Jagung, Komparasi Metode, K-Neural Network, Naïve bayes, forward selection


2019 ◽  
Vol 6 (4) ◽  
pp. 444
Author(s):  
Iqbal Taufiq Ahmad Nur ◽  
Nanang Yudi Setiawan ◽  
Fitra Abdurrachman Bachtiar

<p>Mendeteksi kualitas kredit sejak dini merupakan satu tahapan penting yang wajib dilakukan oleh koperasi simpan pinjam guna meminimalisir adanya risiko kredit. Dalam penelitian ini, kami menggunakan tiga metode klasifikasi yaitu SVM, <em>Neural Network</em>, dan <em>Naïve Bayes</em> untuk menemukan metode dengan performa yang paling baik dan optimal pada kasus pendeteksian kualitas kredit di koperasi simpan pinjam. Proses yang dilakukan adalah dengan mengimplementasikan data hasil <em>pre processing</em> menggunakan algoritme SVM, <em>Neural Network</em>, dan <em>Naïve Bayes</em> dengan proses evaluasi menggunakan <em>5-fold cross validation</em>. Hasil yang didapatkan adalah metode <em>Neural Network</em> menjadi metode dengan performa paling baik. Rerata tingkat akurasi yang dihasilkan sebesar 86,81%, rerata <em>precision</em> sebesar 0,8194, rerata <em>recall</em> sebesar 0,8236, dan rerata nilai AUC sebesar 0,9158. Namun, waktu eksekusi yang dihasilkan algoritme <em>Neural Network</em> menjadikan algoritme ini sebagai algoritme paling lambat dibandingkan dengan dua metode lain. Nilai rerata waktu eksekusi dari metode <em>Neural Network</em> sebesar 3,058 detik, jauh lebih lama dibandingkan dua algoritme lain yang hanya berkisar pada nilai 0 – 1 detik.</p><p> <strong><em>Abstract</em></strong></p><p><em>Detecting credit quality at the early stage is an important step that must be done by koperasi simpan pinjam in order to minimize the credit risk. In this research, we use three classification methods i.e. SVM, Neural Network, and Naïve Bayes to find the best performance and optimal method to be used in credit quality detection for koperasi simpan pinjam. The process conducted by implementing pre-processing data using an SVM, Neural Network, and Naïve Bayes algorithm with the evaluation process using 5-fold cross validation. As the result, The Neural Network method was the best performing method. The average level of accuracy produced was 86.81%, mean precision was 0.8194, average recall was 0.8236, and the average AUC value was 0.9158. However, the execution time generated by the Neural Network algorithm made this algorithm the slowest algorithm compared to the other two methods. The average execution time of the Neural Network method was 3.058 seconds, longer than the other two algorithms which only range from 0 - 1 second.</em></p>


Sign in / Sign up

Export Citation Format

Share Document