Implementation of Mel Frequency Cepstral Coefficient and Dynamic Time Warping For Bird Sound Classification

IMPLEMENTASI METODE MFCC DAN DTW UNTUK PENGENALAN JENIS SUARA PRIA DAN WANITA

MIND Journal ◽

10.26760/mindjournal.v3i1.61-76 ◽

2019 ◽

Vol 3 (1) ◽

pp. 61-76

Author(s):

Irham Sidik Permana ◽

Youllia Indrawaty ◽

Andriana Zulkarnain

Keyword(s):

Dynamic Time Warping ◽

Time Warping ◽

Dynamic Time ◽

Mel Frequency Cepstral Coefficient

MFCC (Mel-Frequency Cepstral Coefficient ) dan DTW (Dynamic Time Warping)adalah suatu metode dalam mengolah suara, pada penelitian ini pengolahan suarayang dilakukan bertujuan untuk pengenalan jenis suara pria dan wanita.Penentuan jenis suara pria atau wanita biasanya dilakukan dalam penentuankelompok paduan suara. MFCC merupakan metode untuk ekstraksi ciri, selainMFCC digunakan metode lain yaitu DTW yang merupakan metode pencocokansuara latih dan suara uji, teknik ini berguna untuk menghitung jarak antara duadata dengan pola-pola yang berbeda dan menghitung nilai dan jarak dari datatersebut. Pada penelitian ini dibangun suatu sistem yang dapat mengenali jenissuara pria dan wanita, Jenis suara pada pria dibagi menjadi Tenor, Bariton danBass, sedangkan pada wanita dibagi menjadi Sopran, Mezzosopran dan Alto. HasilPenelitian yang didapat yaitu untuk tingkat akurasi pada wanita dengan jenis suaraalto didapatkan presentase 80%, untuk tingkat akurasi jenis suara mezzosoprandidapatkan 90%, untuk tingkat akurasi jenis suara sopran didapatkan 80%.Kemudian pada jenis suara pria, untuk jenis suara bass didapatkan tingkat akurasisebesar 80%, untuk jenis suara bariton didapatkan tingkat akurasi 70%, dan untukjenis suara tenor didapatkan tingkat akurasi sebesar 60%.

Download Full-text

Arabic Audio News Retrieval System Using Dependent Speaker Mode, Mel Frequency Cepstral Coefficient and Dynamic Time Warping Techniques

Research Journal of Applied Sciences Engineering and Technology ◽

10.19026/rjaset.7.903 ◽

2014 ◽

Vol 7 (24) ◽

pp. 5082-5097 ◽

Cited By ~ 3

Author(s):

Hasan Muaidi ◽

Ayat Al-Ahmad ◽

Thaer Khdoor ◽

Shihadeh Alqrainy ◽

Mahmud Alkoffash

Keyword(s):

Dynamic Time Warping ◽

Retrieval System ◽

Time Warping ◽

Dynamic Time ◽

Mel Frequency Cepstral Coefficient ◽

News Retrieval

Download Full-text

Destian Tri Handoko Voice Recognition untuk Sistem Keamanan PC Menggunakan Metode MFCC dan DTW

Generation Journal ◽

10.29407/gj.v2i1.12058 ◽

2018 ◽

Vol 2 (1) ◽

pp. 57

Author(s):

Destian Tri Handoko ◽

Patmi Kasih

Keyword(s):

Speech Recognition ◽

Dynamic Time Warping ◽

Voice Recognition ◽

Time Warping ◽

Dynamic Time ◽

Mel Frequency Cepstral Coefficient

bstrak - Teknologi berbasis ukuran pada tubuh manusia (disebut dengan istilahbiometrik) seperti sidik jari, wajah, kornea mata dan lain-lain digunakan untuk keperluankeamanan, salah satunya untuk keamanan sistem PC. Sistem keamanan komputer merupakan upayayang dilakukan untuk mengamankan kinerja, data, fungsi atau proses komputer. Sistem keamananPC juga berguna untuk menjaga dari user yang tidak memiliki otoritas. Layaknya gembok kuncidalam rumah yang menjaga rumah dari pencuri masuk, sistem keamanan menggunakan suara(sistem speech recognition) untuk mengunci desktop dari orang yang tidak memiliki otoritas. Nilaiamplitudo diambil dari sinyal suara masukan, sehingga didapatkan kumpulan angka real yangmenjadi nilai masukan untuk ekstraksi ciri. Metode ekstraksi ciri yang digunakan dalam sistem iniadalah Mel Frequency Cepstral Coefficient (MFCC). Tahapan awal, MFCC memecah nilaiamplitudo sinyal masukan menjadi frame-frame yang diolah dengan menggunakan mel-filterbakyang diadaptasi dari cara kerja pendengaran manusia. Hasil ekstraksi ciri kemudian dibuat menjadivektor yang digunakan sebagai inputan simbol pada DTW (Dynamic Time Warping) untukmembandingkan hasil vector MFCC. Ketika pengujian ciri dari sinyal uji yang telah dikuantisasikemudian dicocokan dengan data training yang telah dimasukan pada tahap penyimpanan,sehingga kata sandi dapat dikenali. Dari hasil pengujian, sistem dapat mengenali suara yangmemiliki otoritas dengan kriteria dalam keaadaan noise 82% dan hening 86% dengan jumlah 10data training dan diuji coba sebanyak 50x percobaan.

Download Full-text