Implementation of Mel Frequency Cepstral Coefficient and Dynamic Time Warping For Bird Sound Classification

Author(s):  
Hari Prapcoyo ◽  
Bertha Pratama Adhita Putra ◽  
Rifki Indra Perwira
MIND Journal ◽  
2019 ◽  
Vol 3 (1) ◽  
pp. 61-76
Author(s):  
Irham Sidik Permana ◽  
Youllia Indrawaty ◽  
Andriana Zulkarnain

MFCC (Mel-Frequency Cepstral Coefficient ) dan DTW (Dynamic Time Warping)adalah suatu metode dalam mengolah suara, pada penelitian ini pengolahan suarayang dilakukan bertujuan untuk pengenalan jenis suara pria dan wanita.Penentuan jenis suara pria atau wanita biasanya dilakukan dalam penentuankelompok paduan suara. MFCC merupakan metode untuk ekstraksi ciri, selainMFCC digunakan metode lain yaitu DTW yang merupakan metode pencocokansuara latih dan suara uji, teknik ini berguna untuk menghitung jarak antara duadata dengan pola-pola yang berbeda dan menghitung nilai dan jarak dari datatersebut. Pada penelitian ini dibangun suatu sistem yang dapat mengenali jenissuara pria dan wanita, Jenis suara pada pria dibagi menjadi Tenor, Bariton danBass, sedangkan pada wanita dibagi menjadi Sopran, Mezzosopran dan Alto. HasilPenelitian yang didapat yaitu untuk tingkat akurasi pada wanita dengan jenis suaraalto didapatkan presentase 80%, untuk tingkat akurasi jenis suara mezzosoprandidapatkan 90%, untuk tingkat akurasi jenis suara sopran didapatkan 80%.Kemudian pada jenis suara pria, untuk jenis suara bass didapatkan tingkat akurasisebesar 80%, untuk jenis suara bariton didapatkan tingkat akurasi 70%, dan untukjenis suara tenor didapatkan tingkat akurasi sebesar 60%.


2018 ◽  
Vol 2 (1) ◽  
pp. 57
Author(s):  
Destian Tri Handoko ◽  
Patmi Kasih

bstrak - Teknologi berbasis ukuran pada tubuh manusia (disebut dengan istilahbiometrik) seperti sidik jari, wajah, kornea mata dan lain-lain digunakan untuk keperluankeamanan, salah satunya untuk keamanan sistem PC. Sistem keamanan komputer merupakan upayayang dilakukan untuk mengamankan kinerja, data, fungsi atau proses komputer. Sistem keamananPC juga berguna untuk menjaga dari user yang tidak memiliki otoritas. Layaknya gembok kuncidalam rumah yang menjaga rumah dari pencuri masuk, sistem keamanan menggunakan suara(sistem speech recognition) untuk mengunci desktop dari orang yang tidak memiliki otoritas. Nilaiamplitudo diambil dari sinyal suara masukan, sehingga didapatkan kumpulan angka real yangmenjadi nilai masukan untuk ekstraksi ciri. Metode ekstraksi ciri yang digunakan dalam sistem iniadalah Mel Frequency Cepstral Coefficient (MFCC). Tahapan awal, MFCC memecah nilaiamplitudo sinyal masukan menjadi frame-frame yang diolah dengan menggunakan mel-filterbakyang diadaptasi dari cara kerja pendengaran manusia. Hasil ekstraksi ciri kemudian dibuat menjadivektor yang digunakan sebagai inputan simbol pada DTW (Dynamic Time Warping) untukmembandingkan hasil vector MFCC. Ketika pengujian ciri dari sinyal uji yang telah dikuantisasikemudian dicocokan dengan data training yang telah dimasukan pada tahap penyimpanan,sehingga kata sandi dapat dikenali. Dari hasil pengujian, sistem dapat mengenali suara yangmemiliki otoritas dengan kriteria dalam keaadaan noise 82% dan hening 86% dengan jumlah 10data training dan diuji coba sebanyak 50x percobaan.


2021 ◽  
Author(s):  
Xiaowei Zhao ◽  
Shangxu Wang ◽  
Sanyi Yuan ◽  
Liang Cheng ◽  
Youjun Cai

Sign in / Sign up

Export Citation Format

Share Document