scholarly journals Coronary Artery Disease Prediction Using Decision Trees and Multinomial Naïve Bayes with k-Fold Cross Validation

2021 ◽  
Vol 3 (2) ◽  
pp. 174-189
Author(s):  
Endang S Kresnawati ◽  
Yulia Resti ◽  
Bambang Suprihatin ◽  
M. Rendy Kurniawan ◽  
Widya Ayu Amanda

Penyakit arteri koroner (coronary artery disease) menjadi penyebab utama kematian penduduk di dunia setidaknya selama dua dekade (2000-2019) dan mengalami peningkatan kematian terbesar dalam rentang waktu tersebut dibandingkan dengan penyebab kematian lainnya. Keberhasilan memprediksi penyakit arteri koroner secara dini berdasarkan data medis bermanfaat bagi pasien dan juga bagi kestabilan perekonomian negara. Tujuan penelitian ini adalah memprediksi penyakit arteri koroner jantung dengan mengimplementasikan dua metode statistical learning yaitu Multinomial Naïve Bayes dan pohon keputusan dengan validasi silang 10-fold, dimana variabel-variabel numerik didiskritisasi untuk memperoleh variabel-variabel kategorik. Hasil penelitian menunjukkan bahwa metode Pohon Keputusan memiliki kinerja yang lebih baik dibandingkan metode Multinomial Naïve Bayes dalam memprediksi penyakit arteri koroner. Ukuran kinerja metode Pohon Keputusan memperoleh tingkat akurasi 99,63 %, sensitivitas 100 %, spesifisitas 99,33%, presisi 99,23 %, dan nilai prediksi negatif (NPV) 100 %. Ukuran-ukuran ini mengindikasikan bahwa metode Pohon Keputusan layak digunakan untuk memprediksi penyakit arteri coroner, termasuk data independent berupa data penyakit arteri coroner lainnya dengan variable predictor yang sama. Hasil penelitian ini juga menunjukkan bahwa perbedaan rujukan dengan penelitian-penelitian sebelumnya dalam mendiskritisasi variabel numerik mampu meningkatkan kinerja metode dalam memprediksi penyakit arteri coroner.

The foundation of data mining techniques using decision tree methods played a crucial role in the identification and classification of diseases. In the utilization of decision tree classifiers to develop the robust classifier for classification of Coronary Artery Disease data set namely Z-Alizadeh Sani and extension Z-Alizadeh Sani. We have used three decision tree techniques Random Forest (RF), Classification and Regression Tree (CART), J48 (C4.5) and made two ensemble models. These ensemble models have different combining rules like voting and stacking. The Voting Scheme model Vote (J48, RF, CART) and stacking Scheme model Stack (J48, RF, CART) have our proposed model. The findings are compared in individual and ensemble models classifier with 5-Fold Cross-Validation and 10-Fold Cross-Validation. The finding of the proposed ensemble models can be used in the detection and evaluation of Coronary Artery Disease (CAD).


2018 ◽  
Vol 6 (1) ◽  
pp. 1
Author(s):  
Qomariyatul Hasanah ◽  
Anang Andrianto ◽  
Muhammad Arief Hidayat

Sistem informasi posyandu ibu hamil dapat mengelola data kesehatan ibu hamil yang berkaitan dengan faktor resiko kehamilan. Faktor resiko kehamilan berdasarkan ketentuan Kartu Skor Poedji Rochyati (KSPR) digunakan bidan untuk menentukan resiko kehamilan dengan memberikan skor pada masing-masing parameter. KSPR memiliki kelemahan tidak dapat memberikan skor pada parameter yang belum pasti sehingga jika belum diketahui dengan pasti maka dianggap tidak terjadi. Konsep membaca pola data yang diadopsi dari teknik datamining menggunakan metode klasifikasi naive bayes dapat menjadi alternatif untuk kelemahan KSPR tersebut yaitu dengan mengklasifikasikan resiko kehamilan. Metode naïve bayes menghitung probabilitas parameter tertentu berdasarkan data pada periode sebelumnya yang telah ditentukan sebagai data training, berdasarkan hasil perhitungan tersebut dapat diketahui resiko kehamilan secara tepat sesuai parameter yang telah diketahui. Metode naïve bayes dipilih karena memiliki tingkat akurasi yang cukup tinggi daripada metode klasifikasi lainnya. Sistem informasi ini dibangun berbasis website agar dapat diakses secara mudah oleh beberapa posyandu yang berbeda tempat. Sistem dibangun mengadopsi dari model Waterfall. Sistem informasi posyandu ibu hamil dirancang dan dibangun dengan tiga (3) hak akses yaitu admin, bidan dan kader dengan masing-masing fitur yang dapat memudahkan penggunanya. Hasil dari penelitian ini adalah sistem informasi posyandu ibu hamil dengan penerapan klasifikasi resiko kehamilan menggunakan metode naïve bayes, dengan tingkat akurasi ketika menggunakan 17 atribut didapatkan 53.913%, 19 atribut didapatkan 54.348%, , 21 atribut didapatkan 54.783%, dan 22 atribut didapatkan 56.957%. Tingkat akurasi klasifikasi diperoleh menggunakan metode pengujian menggunakan Ten-Fold Cross Validation dimana training set dibagi menjadi 10 kelompok, jika kelompok 1 dijadikan test set maka kelompok 2 hingga 10 menjadi training set. Kata Kunci: Posyandu, Resiko Kehamilan, Waterfall, Datamining, Klasifikasi, Naïve bayes


2017 ◽  
Vol 24 (2) ◽  
pp. 71
Author(s):  
Wilamis Kleiton Nunes Da Silva ◽  
Araken De Medeiros Santos

Classificação multirrótulo é um problema de aprendizado supervisionado no qual um objeto pode estar associado a múltiplas classes. Dentre os diferentes métodos de classificação multirrótulo destacam-se os métodos BR (Binary Relevance), LP (Label Powerset) e RAkEL (RAndom k-labELsets). O trabalho realizou um estudo sobre as construções de comitês de classificadores multirrótulos construídos através da aplicação de técnicas de aprendizado semissupervisionado multidescrição. Os comitês de classificadores utilizados nos experimentos foram o Bagging, Boosting e Stacking; como métodos de transformação do problema utilizamos os métodos BR, LP e Rakel; na classificação multirrótulo semissupervisionada multidescrição foi utilizado o Co-Training; foram aplicados cinco diferentes algoritmos como classificadores base: k-NN (k Vizinhos Mais Próximos), J48 (Algoritmo de Indução de Árvores de Decisão), SVM (Máquinas de Vetores Suporte), NB (Naive Bayes) e o JRip (Extended Repeated Incremental Pruning). Todos os experimentos utilizaram a metodologia de validação cruzada com 10 grupos (10-fold Cross-Validation) e o framework MULAN, o qual é implementado utilizando o WEKA. Para os tamanhos dos comitês de classificadores adotamos os valores 3, 5, 7 e 9. Para a análise dos resultados foi utilizado o teste esta- tístico de Wilcoxon. Ao final das análises experimentais, verificou-se que a abordagem semissupervisionado apresentou resultados competitivos em relação ao aprendizado supervisionado, uma vez que as duas abordagens utilizadas apresentaram resultados estatisticamente semelhantes.   


2016 ◽  
Vol 2 (2) ◽  
pp. 105-114 ◽  
Author(s):  
M. I. Papafaklis ◽  
M. C. Mavrogiannis ◽  
P. H. Stone

Circulation ◽  
1976 ◽  
Vol 54 (5) ◽  
pp. 724-729 ◽  
Author(s):  
A C Dortimer ◽  
R L DeJoseph ◽  
R A Shiroff ◽  
A J Liedtke ◽  
R Zelis

TEKNO ◽  
2019 ◽  
Vol 29 (1) ◽  
pp. 50
Author(s):  
Utomo Pujianto ◽  
Putri Yuni Ristanti

Pendidikan mempunyai standar sebagai acuan dalam proses pembelajaran. Dalam hal ini Pemerintah telah mengatur standar pendidikan di Indonesia, mengacu pada Peraturan Pemerintah Republik Indonesia Nomor 19 Tahun 2005 Pasal 6 ayat (1) yaitu kurikulum untuk jenis pendidikan umum, kejuruan, dan khusus pada jenjang pendidikan dasar dan menengah. Sesuai dengan Peraturan Pemerintah tersebut,  ditetapkannya Peraturan Menteri Pendidikan Nasional Republik Indonesia Nomor 23 Tahun 2006 pasal 1 ayat (2), tentang Standar Kompetensi Lulusan yang diantaranya memuat SK-KMP (Standar Kompetensi Kelompok Mata Pelajaran). Standar inilah yang dijadikan sebuah rujukan untuk tenaga pendidik, dan bakal tenaga pendidik khususnya mahasiswa bidang pendidikan untuk membuat sebuah media pembelajaran, jurnal sebagai bahan ajaran yang pokok. Tujuan penelitian ini untuk mengklasifikasikan minat mahasiswa PGSD terhadap tema mata pelajaran menurut SK-KMP menggunakan metode Naive Bayes dan Decision tree J48. Hasil penelitian tersebut dapat dijadikan sebagai referensi untuk pengambilan tema pada mata pelajaran di tahun mendatang untuk lebih bervariasi, tidak hanya membahas tentang salah satu mata pelajaran tersebut. Kinerja dari kedua metode tersebut akan dibandingkan, sehingga dapat diketahui kinerja metode mana yang lebih baik dalam melakukan klasifikasi dokumen. Pengujian performa algoritma klasifikasi yang digunakan adalah teknik K-fold Cross Validation. Berdasarkan pengujian performa penerapan algoritma Naïve Bayes dan Decision Tree J48 menggunakan teknik K-Fold Cross Validation terhadap 200  judul dan abstrak artikel jurnal, didapatkan algoritma Naive Bayes, tingkat akurasi sebesar 84%. Sementara itu, untuk hasil yang diperoleh dengan algoritma Decision Tree J48, tingkat akurasi sebesar 86%.


Repositor ◽  
2020 ◽  
Vol 2 (8) ◽  
Author(s):  
Nabillah Annisa Rahmayanti ◽  
Yufis Azhar ◽  
Gita Indah Marthasari

AbstrakBullying sering terjadi pada anak-anak khususnya remaja dan meresahkan para orang tua. Maraknya kasus bullying di negeri ini bahkan sampai menyebabkan korban jiwa. Hal ini dapat dicegah dengan cara mengetahui gejala-gejala seorang anak yang mengalami bullying. Kondisi seorang anak yang tidak dapat mengungkapkan keluh kesahnya, tentu membuat orang tua dan juga guru di sekolah sukar dalam mengerti apa yang sedang menimpanya. Hal tersebut bisa saja dikarenakan anak sedang mengalami tindakan bullying oleh teman-temannya. Oleh karena itu peneliti memiliki tujuan untuk menghasilkan fitur yang telah terseleksi dengan menggunakan algoritma C5.0. Sehingga dengan menggunakan fitur yang telah terseleksi dapat meringankan pekerjaan dalam mengisi kuisioner dan juga mempersingkat waktu dalam menentukan seorang anak apakah terkena bullying atau tidak berdasarkan gejala yang ada di setiap pertanyaan pada kuisioner. Untuk menunjang data dalam penelitian ini, peneliti menggunakan kuisioner untuk mendapatkan jawaban dari pertanyaan yang berisi tentang gejala anak yang menjadi korban bullying. Jawaban dari responden akan diolah menjadi kumpulan data yang nantinya akan dibagi menjadi data latih dan data uji untuk selanjutnya diteliti dengan menggunakan Algoritma C5.0. Metode evaluasi yang digunakan pada penelitian ini yaitu 10 fold cross validation dan untuk menilai akurasi menggunakan confusion matrix. Penelitian ini juga melaukan perbandingan dengan beberapa algoritma klasifikasi lainnya yaitu Naive Bayes dan KNN yang bertujuan untuk melhat seberapa akurat algoritma C5.0 dalam melakukan seleksi fitur. Hasil pengujian menunjukkan bahwa algoritma C5.0 mampu melakukan seleksi fitur dan juga memiliki tingkat akurasi yang lebih baik jika dibandingkan dengan algoritma Naive Bayes dan KNN dengan hasil akurasi sebelum menggunakan seleksi fitur sebesar 92,77% dan setelah menggunakan seleksi fitur sebesar 93,33%. Abstract Bullying often occurs in children, especially teenagers and unsettles parents. The rise of cases of bullying in this country even caused casualties. This can be prevented by knowing the symptoms of a child who has bullying. The condition of a child who cannot express his complaints, certainly makes parents and teachers at school difficult to understand what is happening to them. This could be because the child is experiencing bullying by his friends. Therefore, researchers have a goal to produce selected features using the C5.0 algorithm. So using the selected features can ease the work in filling out questionnaires and also shorten the time in determining whether a child is exposed to bullying or not based on the symptoms in each question in the questionnaire. To support the data in this study, the researcher used a questionnaire to get answers to questions that contained the symptoms of children who were victims of bullying. The answer from the respondent will be processed into a data collection which will later be divided into training data and test data for further research using the C5.0 Algorithm. The evaluation method used in this study is 10 fold cross validation and to assess accuracy using confusion matrix. This study also carried out a comparison with several other classification algorithms, namely Naive Bayes and KNN which aimed to see how accurate the C5.0 algorithm was in feature selection. The test results show that the C5.0 algorithm is capable of feature selection and also has a better accuracy compared to the Naive Bayes and KNN algorithms with accuracy results before using feature selection of 92.77% and after using feature selection of 93.33%


2016 ◽  
Vol 7 (1) ◽  
pp. 283 ◽  
Author(s):  
Elvira Sukma Wahyuni

Tujuan utama penelitian ini adalah untuk meningkatkan peforma klasifikasi pada diagnosis kanker payudara dengan menerapkan seleksi fitur pada beberapa algoritme klasifikasi. Penelitian ini menggunakan database kanker payudara Wisconsin Breast Cancer Database (WBCD). Metode seleksi fitur F-score dan Rough Set akan dipasangkan dengan beberapa algoritme klasifikasi yaitu SMO (Sequential Minimal Optimization), Naive Bayes, Multi layer Perceptron, dan C4.5. Penelitian ini menggunakan 10 fold cross validation sebagai metode evaluasi. Hasil penelitian menunjukkan algoritme klasifikasi MLP dan C4.5 mengalami peningkatan peforma klasifikasi secara signifikan setelah dipasangkan dengan seleksi fitur rough set dan F-score, Naive Bayes menunjukan peforma terbaik ketika dipasangkan dengan metode seleksi fitur F-score saja, sedangkan SMO tidak menunjukkan peningkatan peforma klasifikas ketika dipasangkan pada kedua seleksi fitur. Kata kunci: kanker payudara, seleksi fitur, klasifikasi.


Sign in / Sign up

Export Citation Format

Share Document