scholarly journals Optimalisasi Metode LPC-16 dan HMM-Forward Pada Sistem Asisten Virtual

2021 ◽  
Vol 7 (2) ◽  
pp. 101-107
Author(s):  
Chondro seto Nur Suryawan ◽  
Marisa Premitasari

Pada umumnya manusia saat ini menggunakan sistem operasi windows yang berjalan di perangkat desktop akan memasang banyak aplikasi sesuai kebutuhannya. Semakin banyak aplikasi yang di pasang maka semakin banyak pula shortcut yang tampil di bagian desktop windows. Shortcut sendiri merupakan sebuah objek alternatif yang digunakan untuk mewakili sehingga pengguna dapat dengan mudah membuka aplikasi tanpa harus pengguna membuka tempat dimana aplikasi tersebut terpasang. Banyaknya aplikasi yang terpasang pada sistem operasi windows membuat shortcut pada bagian desktop menjadi banyak dan membuat pengguna kesulitan dalam mencari  atau membuka aplikasi yang dinginkan. Oleh karena itu diperlukan aplikasi yang dapat membantu pengguna dalam mencari dan membuka aplikasi dengan mudah tanpa membuat pengguna kesulitan. Aplikasi tersebut adalah virtual asisten yang akan membantu pengguna dalam mencari dan membuka aplikasi yang diinginkan. Cara kerjanya dengan pengguna memasukan suara pengguna lalu di proses ekstraksi ciri menggunakan metode Linear Predictive Coding lalu di klasifikasikan menggunakan metode Hidden Markov Model Forward. Setelah terdeteksi maka aplikasi akan membuka aplikasi sesuai suara yang terdeksi. Penelitian ini menggunakan 120 data latih yang terdiri dari 6 label yaitu whatsapp, linkedin, Tokopedia, gmail, powerpoint, word. Untuk setiap label memiliki data latih berjumlah 20 data. Data yang diujikan berjumlah 60. Untuk setiap labelnya memiliki 10 data uji.

Author(s):  
Firra M. Mukhneri ◽  
Inung Wijayanto ◽  
Sugondo Hadiyoso

Dubbing is a term used to describe filling in the sound on film or video. Voice conversion can be done to support dubbing, for purposes such as obtaining a child’s voice for dubbing on children’s films. However, problems frequently occur with this process, including difficulty finding children’s voice resources and difficulty getting children to express the desired tone and mood while recording. Therefore, in this study, we propose a method for creating a cross-gender and age voice conversion from adult voices to children’s voices. The feature extraction method that is used is Linear Predictive Coding, and the modeling method is the Hidden Markov Model. The parts synthesized are fundamental frequency (F0) and spectral content. From the simulation test, the best results for the voice conversion are achieved by Linear Predictive Coding order 19. The best state of Hidden Markov Model modeling is the 5th state. F0 Root Mean Square Error of adult men to children after the conversion increased by 57.7%, while the F0 Root Mean Square Error of adult women to children after the conversion increased by 15.29%. Root Mean Square Error Cepstral after conversion increased by 43.69%. A subjective test was also performed in terms of the mean opinion score. In terms of similarities, mean opinion score testing for Hidden Markov Model has an average value of 2.64, and in terms of quality, testing mean opinion score for Hidden Markov Model has an average value of 3.23. It is hoped that this proposed method can be used in real terms for dubbing in the film industry, especially for Indonesian dialogue.


MATICS ◽  
2016 ◽  
Vol 8 (1) ◽  
pp. 32
Author(s):  
Ririn Kusumawati

<p class="Abstract" style="text-align: justify;"><em>Abstract</em>— Arabic language has a slightly different pronunciation than the Indonesian so to learn it takes a long time. In Arabia itself, there are variants in the pronunciation of the Arabic language or dialect. Dialect is a language, and letters are used by a particular group of people in a clump that makes the difference between the readings even greeting one another. In Indonesia, alone speakers of Indonesia itself have a different dialect to native speakers.</p><p class="Abstract" style="text-align: justify;">This study was analyzed of Arabic writing suitability by Indonesian speakers using  Linear Predictive Coding extraction techniques. The text produces different patterns of speech. This also happens if the text is spoken by a speaker who is not the mother tongue of the speakers. The data training in this study is using the Arabic speaker sound. The feature extraction is classified using Hidden Markov Model.</p><p style="text-align: justify;">In the classification, using Hidden Markov Model, voice signal is analyzed and searched the maximum possible value that can be recognized. The modeling results obtained parameters are used to compare with the sound of Arabic speakers. From the test results' Classification, Hidden Markov Models with Linear Predictive Coding extraction average accuracy of 78.6% for test data sampling frequency of 8,000 Hz, 80.2% for test data sampling frequency of 22050 Hz, 79% for frequencies sampling test data at 44100 Hz.</p>


Author(s):  
Rama Dimasatria ◽  
Agus Virgono ◽  
R. Rumani M. R. Rumani M.

Seiring perkembangan teknologi informasi, proses belajar-mengajar semakin banyak menggunakan media alternatif. Salah satu media pembelajaran alternatif yang digunakan adalah video. Untuk mempermudah pemahaman, biasanya video pembelajaran dilengkapi dengan caption atau teks keterangan tentang apa yang dibicarakan oleh pembicara. Akan lebih menghemat waktu dan energi apabila caption dihasilkan secara otomatis berdasarkan apa yang diucapkan pembicara. Oleh karena itu pada penelitian kali ini akan dibangun sistem Automatic Video Captioning menggunakan teknologi Speech Recognition. Sinyal suara dari video masukan diekstrak dan diproses dengan sistem speech recognition untuk menghasilkan teks yang sesuai. Pada penelitian ini sistem speech recognition dibangun dengan Linear Predictive Coding untuk ekstraksi ciri dan Hidden Markov Model untuk pencocokan ciri. Teks yang dihasilkan dari sistem speech recognition tersebut kemudian digunakan sebagai caption dari video masukan. Pengujian sistem dilakukan dengan mengubah-ubah jumlah data latih dan parameter HMM yaitu jumlah state dan jumlah cluster untuk mencari parameter dengan akurasi paling optimal. Dari hasil pengujian, didapatkan akurasi tertinggi sebesar 75,50% pada jumlah state 6, jumlah cluster 256, dan data latih sebesar 90 untuk setiap suku kata dalam database.Kata Kunci: automatic video captioning, speech recognition, Linear Predictive Coding (LPC), Hidden Markov Model (HMM)


2012 ◽  
Vol 132 (10) ◽  
pp. 1589-1594 ◽  
Author(s):  
Hayato Waki ◽  
Yutaka Suzuki ◽  
Osamu Sakata ◽  
Mizuya Fukasawa ◽  
Hatsuhiro Kato

MIS Quarterly ◽  
2018 ◽  
Vol 42 (1) ◽  
pp. 83-100 ◽  
Author(s):  
Wei Chen ◽  
◽  
Xiahua Wei ◽  
Kevin Xiaoguo Zhu ◽  
◽  
...  

Sign in / Sign up

Export Citation Format

Share Document