Seleksi Fitur Pada Klasifikasi Multi-label Menggunakan Proportional Feature Rough Selector
Proportional Feature Rough Selector (PFRS) merupakan sebuah metode seleksi fitur yang dikembangkan berdasarkan Rough Set Theory (RST). Pengembangan ini dilakukan dengan merinci pembagian wilayah dalam set data menjadi beberapa bagian penting yaitu lower approximation, upper approximation dan boundary region. PFRS memanfaatkan boundary region untuk menemukan wilayah yang lebih kecil yaitu Member Section (MS) dan Non-Member Section (NMS). Namun PFRS masih hanya digunakan dalam seleksi fitur pada klasifikasi biner dengan tipe data teks. PFRS ini juga dikembangkan tanpa memperhatikan hubungan antar fitur, sehingga PFRS memiliki potensi untuk ditingkatkan dengan mempertimbangkan korelasi antar fitur dalam set data. Untuk itu, penelitian ini bertujuan untuk melakukan penyesuaian PFRS untuk bisa diterapkan pada klasifikasi multi-label dengan data campuran yakni data teks dan data bukan teks serta mempertimbangkan korelasi antar fitur untuk meningkatkan performa klasifikasi multi-label. Pengujian dilakukan pada set data publik yaitu 515k Hotel Reviews dan Netflix TV Shows. Set data ini diuji dengan menggunakan empat metode klasifikasi yaitu DT, KNN, NB dan SVM. Penelitian ini membandingkan penerapan seleksi fitur PFRS pada data multi-label dengan pengembangan PFRS yaitu dengan mempertimbangkan korelasi. Hasil penelitian menunjukkan bahwa penggunaan PFRS berhasil meningkatkan performa klasifikasi. Dengan mempertimbangkan korelasi, PFRS menghasilkan peningkatan akurasi hingga 23,76%. Pengembangan PFRS juga menunjukkan peningkatan kecepatan yang signifikan pada semua metode klasifikasi sehingga pengembangan PFRS dengan mempertimbangkan korelasi mampu memberikan kontribusi dalam meningkatkan performa klasifikasi.