nearest neighbor imputation
Recently Published Documents


TOTAL DOCUMENTS

35
(FIVE YEARS 6)

H-INDEX

16
(FIVE YEARS 2)

2021 ◽  
Vol 2020 (1) ◽  
pp. 511-518
Author(s):  
Iman Jihad Fadillah ◽  
Chaterina Dwi Puspita

Pada tahun 2020, hampir semua negara di dunia menghadapi wabah COVID-19, termasuk Indonesia. Salah satu dampak yang terjadi karena adanya pandemi COVID-19 adalah terhambatnya kegiatan statistik, seperti tertundanya atau berhentinya pelaksanaan pengumpulan data survei dan sensus serta pengumpulan data lainnya. Sementara itu, untuk memenuhi permintaan dan kebutuhan data selama masa pandemi COVID-19, badan statistik nasional harus tetap melakukan pengumpulan data dan menyediakan data statistik. Oleh sebab itu, badan statistik nasional harus melakukan adaptasi untuk kegiatan proses sensus dan survei yang dilakukan, seperti mencari mode pengumpulan data alternatif, mengurangi ukuran sampel, memodifikasi desain sampel, mengurangi item pertanyaan di kuesioner, atau lainnya. Berdasarkan uraian tersebut, adaptasi kegiatan pengumpulan data sensus/survei yang dilakukan pada masa pandemi COVID-19 akan berpengaruh pada kualitas data yang dihasilkan. Salah satunya adanya missing data. Untuk mengatasi masalah missing data, salah satu metode yang dapat digunakan adalah imputasi data. Salah satu jenis metode imputasi berbasis machine learning yang sering digunakan adalah Weighted K-Nearest Neighbor Imputation (Weighted KNNI). Metode Weighted KNNI memiliki akurasi yang lebih baik dibandingkan kedua metode imputasi lainnya (Unweighted KNNI dan Mean Imputation) pada tiap persentase missing data baik akurasi dari sisi RMSE maupun akurasi dari sisi MAPE. Berdasarkan hasil tersebut yang dilihat dari akurasinya, metode Weighted KNNI dapat digunakan sebagai salah satu solusi untuk menangani ketidaklengkapan data pada masa pandemi COVID19 sekarang ini.


2020 ◽  
Vol 2019 (1) ◽  
pp. 275-285
Author(s):  
Iman Jihad Fadillah ◽  
Siti Muchlisoh

Salah satu ciri data statistik yang berkualitas adalah completeness. Namun, pada penyelenggaraan sensus atau survei, sering kali ditemukan masalah data hilang atau tidak lengkap (missing values), tidak terkecuali pada data Survei Sosial Ekonomi Indonesia (Susenas). Berbagai masalah dapat ditimbulkan oleh missing values. Oleh karena itu, masalah missing values harus ditangani. Imputasi adalah cara yang sering digunakan untuk menangani masalah ini. Terdapat beberapa metode imputasi yang telah dikembangkan untuk menangani missing values. Hot-deck Imputation dan K-Nearest Neighbor Imputation (KNNI) merupakan metode yang dapat digunakan untuk menangani masalah missing values. Metode Hot-deck Imputation dan KNNI memanfaatkan variabel prediktor untuk melakukan proses imputasi dan tidak memerlukan asumsi yang rumit dalam penggunaannya. Algoritma dan cara penanganan missing values yang berbeda pada kedua metode tentunya dapat menghasilkan hasil estimasi yang berbeda pula. Penelitian ini membandingkan metode Hot-deck Imputation dan KNNI dalam mengatasi missing values. Analisis perbandingan dilakukan dengan melihat ketepatan estimator melalui nilai RMSE dan MAPE. Selain itu, diukur juga performa komputasi melalui penghitungan running time pada proses imputasi. Implementasi kedua metode pada data Susenas Maret Tahun 2017 menunjukkan bahwa, metode KNNI menghasilkan ketepatan estimator yang lebih baik dibandingkan Hot-deck Imputation. Namun, performa komputasi yang dihasilkan pada Hot-deck Imputation lebih baik dibandingkan KNNI.


2019 ◽  
Vol 35 (20) ◽  
pp. 4187-4189 ◽  
Author(s):  
Adrien Leite Pereira ◽  
Olivier Lambotte ◽  
Roger Le Grand ◽  
Antonio Cosma ◽  
Nicolas Tchitchek

Abstract Motivation Flow and mass cytometry are experimental techniques used to measure the level of proteins expressed by cells at the single-cell resolution. Several algorithms were developed in flow cytometry to increase the number of simultaneously measurable markers. These approaches aim to combine phenotypic information of different cytometric profiles obtained from different cytometry panels. Results We present here a new algorithm, called CytoBackBone, which can merge phenotypic information from different cytometric profiles. This algorithm is based on nearest-neighbor imputation, but introduces the notion of acceptable and non-ambiguous nearest neighbors. We used mass cytometry data to illustrate the merging of cytometric profiles obtained by the CytoBackBone algorithm. Availability and implementation CytoBackBone is implemented in R and the source code is available at https://github.com/tchitchek-lab/CytoBackBone. Supplementary information Supplementary data are available at Bioinformatics online.


2018 ◽  
Vol 90 (1) ◽  
pp. 295-309 ◽  
Author(s):  
CARLOS ALBERTO SILVA ◽  
CARINE KLAUBERG ◽  
ANDREW T. HUDAK ◽  
LEE A. VIERLING ◽  
VERALDO LIESENBERG ◽  
...  

2017 ◽  
Vol 132 ◽  
pp. 226-252 ◽  
Author(s):  
Jianglin Huang ◽  
Jacky Wai Keung ◽  
Federica Sarro ◽  
Yan-Fu Li ◽  
Y.T. Yu ◽  
...  

Sign in / Sign up

Export Citation Format

Share Document