scholarly journals Optimasi Pengelompokan Data Pada Metode K-means dengan Analisis Outlier

2019 ◽  
Vol 5 (2) ◽  
pp. 88-95
Author(s):  
Pasek Agus Ariawan

Data mining secara umum adalah proses analisis dan eksplorasi sejumlah besar data yang berbeda untuk menemukan pola yang bermakna. . Berbagai teknik tersedia dalam data mining untuk ekstraksi pengetahuan antara lain klasifikasi, prediksi, estimasi, asosiasi dan pengelompokan. Salah satu metode pengelompokan yang terkenal adalah metode k-means karena kesederhanaan dan efesiensinya, sehingga metode ini mudah diaplikasikan di berbagai bidang. Teknik pra-pemrosesan data diterapkan pada data mentah untuk membuat data bersih, bebas noise, dan konsisten. Dalam data mining terdapat beberapa metode yang dapat digunakan tergantung dari tujuan yang akan dicapai. Deteksi outlier adalah penelitian dari data mining untuk mendeteksi kasus – kasus abnormal pada database. Peneltian ini bertujuan mengetahui penerapan metode local outlier factor untuk optimasi pada metode k-means clustering. Hasil dari penelitian, pengunaan metode local outlier factor pada data capaian kinerja pegawai dapat mendeteksi data outlier sebesar 22.8%. Rata – rata iterasi, nilai SSE dan waktu komputasi untuk satu kali konvergen pada metode k-means dengan analisis outlier memberikan hasil yang lebih baik untuk jumlah cluster 2 – 10 dibandingkan dengan metode k-means tradisional.

2016 ◽  
Vol 9 (5) ◽  
pp. 275-282 ◽  
Author(s):  
Vishal Bhatt ◽  
Mradul Dhakar ◽  
Brijesh Kumar Chaurasia

2015 ◽  
Vol 130 (2) ◽  
pp. 17-23 ◽  
Author(s):  
Tan Yong ◽  
Emran Bin ◽  
Pratap Nair ◽  
Raman Raguraman ◽  
K. Nithiyananthan

2020 ◽  
Vol 19 (1) ◽  
pp. 33
Author(s):  
Pasek Agus Ariawan ◽  
Nyoman Putra Sastra ◽  
I Made Sudarma

Remunerasi adalah imbalan kerja berupa gaji, honor, tunjangan tetap, insentif, bonus atas prestasi, pesangon, dan/dana pensiun.  Adanya remunerasi akan menghilangkan anggapan bahwa tidak ada korelasi positif antara kinerja dengan penghasilan.  Ini berarti pegawai/karyawan yang berkinerja baik akan memiliki penghasilan yang tidak sama. Pemerintah telah berupaya mengubah sistem penggajian agar menjadi lebih baik melalui sistem remunerasi, Remunerasi terdiri dari gaji pokok yang ditambah tunjangan – tunjangan yang bersumber dari rupiah murni dan tunjangan lain yang bersumber dari Pendapatan Negara Bukan Pajak. Permasalahan  dari pemberian remunerasi adalah validasi yang dilakukan oleh atasan langsung pegawai yang bersangkutan masih diragukan validitasnya. Berdasarkan hal tersebut, diperlukan suatu sistem yang dapat mendeteksi data bersifat outlier dari data remunerasi Pegawai Negeri Sipil dan mengelompokkan data tersebut menggunakan teknik data mining. Penilitian ini bertujuan untuk mengklompokan data remunerasi pegawai negeri sipil dengan menggunakan metode k-means clustering dengan improvisasi pada tahap pre-prosesscing dan penentuan jumlah cluster optimum. Metode Local Outlier Factor dengan nilai MinPts 150 dapat mendeteksi data outlier paling banyak dengan jumlah data terdeteksi outlier sebanyak 162 data atau sebesar 22,98%. Jumlah cluster optimum dengan metode elbow berjumlah 4 cluster dengan nilai Silhoutte sebesar 0,542 dan Dunn sebesar 0,040. Kata Kunci— Clustering, K-Means, LOF, Outlier


2020 ◽  
Vol 3 (3) ◽  
pp. 187-201
Author(s):  
Sufajar Butsianto ◽  
Nindi Tya Mayangwulan

Penggunaan mobil di Indonesia setiap tahunnya selalu meningkat dan membuat perusahaan otomotif berlomba-lomba dalam peningkatan penjualannya. Tujuan dari penelitian ini untuk mengelompokan data penjualan kedalam sebuah cluster dengan metode Data Mining Algoritma K-Means Clustering. Data Penjualan nantinya akan dikelompokan berdasarkan kemiripan data tersebut sehingga data dengan karakteristik yang sama akan berada dalam satu cluster. Atribut yang digunakan adalah brand dan penjualan. Cluster yang terbentuk setelah dilakukan proses K-Means Clustering terbagi menjadi tiga cluster yaitu Cluster 0 jumlah anggota 235 dengan presentase 26% dikategorikan Laris, Cluster 1 jumlah anggota 604 dengan presentase 67% dikategorikan Kurang Laris, dan Cluster 2 jumlah angota 61 dengan presentase 7% dikategorikan Paling Laris, dari proses clustering diatas dapat diperoleh validasi DBI (Davies Bouldin Index) dengan nilai 0,341


IEEE Access ◽  
2021 ◽  
Vol 9 ◽  
pp. 132980-132989
Author(s):  
Siyu Luan ◽  
Zonghua Gu ◽  
Leonid B. Freidovich ◽  
Lili Jiang ◽  
Qingling Zhao

2020 ◽  
Vol 5 (2) ◽  
pp. 130-137
Author(s):  
Teguh Iman Hermanto ◽  
Yusuf Muhyidin
Keyword(s):  

Berdasarkan data yang tercatat pada tahun 2018 terdapat 43 organisasi perangkat daerah di kabupaten Purwakarta yang sudah mendapatkan bandwidth internet. Setiap organisasi perangkat daetah yang telah mendapatkan bandwidth mempunyai tingkat kebutuhan yang berbeda – beda ,namun saat ini jumlah pembagian bandwidth dan tingkat kebutuhan belum dapat dikelompokan. Tujuan dari penelitian ini untuk menetukan tingkat kebutuhan bandwidth di Purwakarta dengan cara melakukan analisis data mining terhadap data yang ada menggunakan algoritma DBSCAN sehingga akan terbentuk cluster yang yang dibagi berdasarkan tingkat kebutuhan. Pada penelitian ini metode analisis yang digunakan yaitu SEMMA (Sample, Explore, Modify, Model, Assess) tahapan SEMMA meliputi  Data Selection, Pre-processing / cleaning, Transformation, Data Mining dan Assess / Evaluation. Hasil dari analisis menggunakan nilai minpts = 5 dan nilai epsilon = 3. Cluster yang terbentuk yaitu sebanyak 2 cluster, cluster 1 terdapat sebanyak 15 organisasi perangkat daerah dengan tingkat kebutuhan bandwidth rendah dan cluster 2 terdapat 21 organisasi perangkat daerah dengan tingkat kebutuhan bandwidth sedang, dan Noise terdapat 7 organisasi perangkat daerah dengan kebutuhan bandwidth yang terlalu tinggi.


2021 ◽  
Vol 8 (1) ◽  
pp. 83
Author(s):  
Bagus Muhammad Islami ◽  
Cepy Sukmayadi ◽  
Tesa Nur Padilah

Abstrak: Masalah kesehatan yang ada di dalam masyarakat terutama di negara- negara berkembang seperti Indonesia dipengaruhi oleh dua faktor yaitu aspek fisik dan aspek non fisik. Berdasarkan data yang diperoleh dari karawangkab.bps.go.id data dibagi menjadi 3 cluster yaitu sedikit, sedang dan terbanyak. Algoritma yang digunakan adalah K-Means cluster yang diimplementsikan menggunakan Microsoft Excel dan Rapidminer Studio. Hasil pengolahan data fasilitas kesehatan di karawang menghasilkan 3 cluster dengan cluster 1 yang mempunyai fasilitas kesehatan sedikit sebanyak 23 kecamatan, cluster 2 yang mempunyai fasilitas kesehatan sedang sebanyak 5 kecamatan dan cluster 3 yang mempunyai fasilitas kesehatan terbanyak terdapat 2 kecamatan. Kinerja yang dihasilkan dari algoritma K-means menghasilkan nilai Davies Boildin Index sebesar 0,109.   Kata kunci: clustering, data mining, fasilitas kesehatan, K-Means.   Abstract: Health problems that exist in society, especially in developing countries like Indonesia, are built by two factors, namely physical and non-physical aspects. Based on data obtained from karawangkab.bps.go.id the data is divided into 3 clusters, namely the least, medium and the most. The algorithm used is the K-Means cluster which is implemented using Microsoft Excel and Rapidminer Studio. The results of data processing of health facilities in Karawang produce 3 clusters with cluster 1 which has 23 sub-districts of health facilities, cluster 2 which has medium health facilities as many as 5 districts and cluster 3 which has the most health facilities in 2 districts. The performance resulting from the K-means algorithm results in a Davies Boildin Index value of 0.109.   Keywords: clustering, data mining, health facilities, K-Means.


Author(s):  
Shashank Singh and Meenu Garg

It is essential that Visa organizations can distinguish false Mastercard exchanges so clients are not charged for things that they didn't buy. Such issues can be handled with Data Science and its significance, alongside Machine Learning, couldn't be more important. This undertaking expects to outline the demonstrating of an informational collection utilizing AI with Credit Card Fraud Detection. The Credit Card Fraud Detection Problem incorporates demonstrating past Visa exchanges with the information of the ones that ended up being extortion. This model is then used to perceive if another exchange is fake. Our target here is to identify 100% of the fake exchanges while limiting the off base misrepresentation arrangements. Charge card Fraud Detection is an average example of arrangement. In this cycle, we have zeroed in on examining and pre- preparing informational indexes just as the sending of numerous irregularity discovery calculations, for example, Local Outlier Factor and Isolation Forest calculation on the PCA changed Credit Card Transaction


Sign in / Sign up

Export Citation Format

Share Document