scholarly journals The first FOSD-tacotron-2-based text-to-speech application for Vietnamese

2021 ◽  
Vol 10 (2) ◽  
pp. 898-903
Author(s):  
Duc Chung Tran

Recently, with the development and deployment of voicebots which help to minimize personnels at call centers, text-to-speech (TTS) systems supporting English and Chinese have attracted attentions of researchers and corporates worldwide. However, there is very limited published works in TTS developed for Vietnamese. Thus, this paper presents in detail the first Tacotron-2-based TTS application development for Vietnamese that utilizes the publicly available FPT open speech dataset (FOSD) containing approximately 30 hours of labeled audio files together with their transcripts. The dataset was made available by FPT Corporation with an open access license. A new cleaner was developed for supporting Vietnamese language rather than English which was provided by default in Mozilla TTS source code. After 225,000 training steps, the generated speeches have mean opinion score (MOS) well above the average value of 2.50 and center around 3.00 for both clearness and naturalness in a crowd-source survey.

Author(s):  
Pamela Chaudhur ◽  
K Vinod Kumar

Telugu is one of the oldest languages in India. This paper describes the development of Telugu Text-to-Speech System (TTS) using vowel classification. Vowels are most important class of sound in most Indian languages. The duration of vowel is longer than consonants and is most significant. Here vowels are categorized as starting middle and end according to the position of occurrence in a word. The algorithm developed by us involves analysis of a sentence in terms of words and then symbols involving combination of pure consonants and vowels. Wave files are being merged as per the requirement to generate the modified consonants influenced by deergalu (vowel sign) and yuktaksharas generate the speech from a text. Speech unit database consisting of vowels (starting, middle and end) and consonants is developed. We evaluated our TTS using Mean Opinion Score (MOS) for intelligibility and voice quality with and without using vowel classification from sixty five listeners, and got better results with vowel classification.


2009 ◽  
Vol 22 (3) ◽  
pp. 391-404
Author(s):  
Zoran Milivojevic ◽  
Dragisa Balaneskovic

This paper presents an algorithm for enhancement of the noisy speech signal quality. This algorithm is based on the dissonant frequency filtering (DFF), F#, B and C# in relation to the frequency of the primary tone C (DFF-FBC algorithm). By means of the subjective Mean Opinion Score (MOS) test, the effect of the enhancement of the speech signal quality was analyzed. The analysis of the MOS test results, presented in the second part of this paper, points out to the enhancement of the noisy speech signal quality in the presence of superimposed noises. Especially good results have been found with Husky Voice signal. .


The article presents the developed method for the quantitative evaluation of involvement of countries of the world in the international open access movement. It consists in the identification of eight country open access indicators initially connected with the open access initiatives and instruments, their weighing, normalization and aggregation in the form of a weighted average value. In a second more strict approximation the number of indicators has been reduced up to six for the account of discarding the data duplicated in ROAR and Open DOAR. Budapest initiative and Berlin declaration were considered as the ОА-initiatives, and data from the international registers DOAJ, SHERPA/RoMEO, ROAR MAP and the Webometrics ОА-repositories ranking was considered as the instruments. The calculation is done on the basis of the developed method for 133 countries.


2021 ◽  
Vol 1 (2) ◽  
pp. 75-98
Author(s):  
Aji Nurcahyo Hidayat ◽  
Dadang Iskandar ◽  
Nofiyati Nofiyati

Pengguna internet di Indonesia terus mengalami peningkatan. Berdasarkan data dari Asosiasi Penyelenggara Jasa Internet Indonesia (APJII) tahun 2016, jumlah pengguna internet di Indonesia tumbuh sebesar 10,12%. Perkembangan yang semakin pesat ini di manfaatkan oleh berbagai pihak guna memaksimalkan fungsi dari kemajuan teknologi ini, yang salah satunya adalah dalam bidang jasa yaitu penyewaan atau rental barang. Banyaknya bisnis penyewaan barang yang muncul saat ini membuat penyewa barang seringkali lupa terkait informasi terkait produk yang ditawarkan. Kurangnya informasi atau promosi dari pemilik barang membuat calon penyewa sedikit kesulitan dan memerlukan usaha yang lebih untuk mendapatkan barang yang diinginkan, sehingga perlu adanya penyewaan berbasis website yang memuat informasi terkait produk yang ditawarkan. Penelitian ini bertujuan untuk membuat sistem marketplace yang memuduahkan bagi calon penyewa dalam menemukan barang yang diinginkan dan bagi pemilik barang untuk memudahkan memasarkan barangnya dan mengelola barang serta pesanannya. Cara kerja sistem ini, penyewa mencari barang yang diinginkan melalui sistem lalu memesannya. Pesanan tersebut kemudian dikirimkan ke pemilik barang oleh sistem setelah pembayaran untuk biaya sewa dikonfirmasi oleh admin dan pemilik barang dapat memberikan barangnya kepada penyewa sesuai data pesanannya. Sistem ini berbasis web dengan bahasa pemrograman PHP menggunakan framework laravel yang didukung basis data MySQL dan mengacu pada metode pengembangan waterfall pada proses pembuatannya. Tahap pengujian untuk sistem marketplace penyewaan barang dilakukan dengan metode pengujian blackbox testing dan Mean Opinion Score. Hasilnya menunjukan bahwa sitem berjalan sesuai dengan yang diharapkan dan mampu mebantu bagi calon penyewa dalam mencari informasi barang sewaan maupun bagi para pemilik barang dalam mempromosikan barangnya.


Author(s):  
W. Kinsner ◽  
R. Dansereau

This article presents a derivation of a new relative fractal dimension spectrum, DRq, to measure the dis-similarity between two finite probability distributions originating from various signals. This measure is an extension of the Kullback-Leibler (KL) distance and the Rényi fractal dimension spectrum, Dq. Like the KL distance, DRq determines the dissimilarity between two probability distibutions X and Y of the same size, but does it at different scales, while the scalar KL distance is a single-scale measure. Like the Rényi fractal dimension spectrum, the DRq is also a bounded vectorial measure obtained at different scales and for different moment orders, q. However, unlike the Dq, all the elements of the new DRq become zero when X and Y are the same. Experimental results show that this objective measure is consistent with the subjective mean-opinion-score (MOS) when evaluating the perceptual quality of images reconstructed after their compression. Thus, it could also be used in other areas of cognitive informatics.


2020 ◽  
Vol 1 (1) ◽  
pp. 25-33
Author(s):  
Nabila Khaerunnisa ◽  
Nofiyati Nofiyati

Sistem Informasi Pelayanan Administrasi Kependudukan merupakan sistem berbasis web yang digunakan untuk mengelola proses pelayanan administrasi pembuatan surat-menyurat. Adapun jenis pelayanan administrasi di antaranya adalah Surat Bedadata, Surat Kehilangan, Surat Tidak Mampu, Surat Usaha dan SKCK. Pembuatan surat-menyurat di Desa Sidakangen masih menggunakan pembukuan atau arsip secara manual. Dari pembukuan atau arsip tersebut kemudian akan di rekap kedalam Microsoft Word untuk dicetak sebagai laporan, belum lagi petugas akan melayani masyarakat dalam pembuatan surat menyurat sehingga pada prosesnya membutuhkan waktu yang lebih untuk melakukan pelayanan administrasi kependudukan dengan baik.  Atas dasar permasalahan tersebut dibangunlah sebuah Sistem Informasi Pelayanan Administrasi Kependudukan Berbasis Web yang dilengkapi dengan basis data penduduk sehingga dapat memudahkan pihak Aparat desa dalam mendata penduduk dengan efektif dan efisien, selain itu sistem informasi ini dilengkapi dengan fitur pencarian yang memudahkan aparat desa dalam melakukan pencarian data dengan cepat. Sistem Informasi Pelayanan Administrasi ini menggunakan metode pengembangan Waterfall yang dimulai dari tahap (requirement analisis), system design, implementation, integration and testing, serta maintenance. Menggunakan Bahasa pemrograman PHP, database MySQL. Dengan metode pengujian Blackbox dan MOS (Mean Opinion Score) yang membuktikan bahwa 80% sistem telah bekerja sesuai dengan kebutuhan pengguna yang telah ditentukan.


2017 ◽  
Vol 3 (1) ◽  
pp. 57-67 ◽  
Author(s):  
Alif Mukhron Amar Rizki ◽  
Nanang Ismail ◽  
Rina Mardiati

Abstrak—Sistem keamanan data yang mengkombinasikan kriptografi dan steganografi sangat diperlukan dalam proses pertukaran pesan/informasi. Hal ini diperlukan karena berkembangnya kejahatan teknologi dengan berbagai teknik interupsi, penyadapan, modifikasi, maupun fabrikasi. Pada penelitian ini digunakan teknik kriptografi dengan algoritma MARS yang dapat menerima kunci yang bervariasi antara 128 – 1248 bit dan diintegrasikan ke dalam steganografi dengan metode Least Significant Bit (LSB) dengan mengganti bit-bit yang tidak terlalu berpengaruh dari berkas audio. Metode ini diharapkan dapat melindungi pesan rahasia secara ganda. Pembangunan aplikasi pada penelitian ini menggunakan software NetBeans dan bahasa pemrograman Java. Aplikasi yang diberi nama StegadulzWav berhasil mengkombinasikan kriptografi dan steganografi baik dalam menanam pesan maupun dalam pengambilan pesan rahasia. Hasil pengujian menunjukkan bahwa semakin kecil ukuran file teks yang digunakan untuk arsip pesan maka semakin baik kualitas stego-audio yang dihasilkan. Nilai MOS (Mean Opinion Score) dari tiga puluh responden berbanding lurus dengan nilai rata-rata Peak Signal to Noise Radio (PSNR) sebesar 42,04 dB yang dapat diterima dengan baik oleh pendengaran manusia. 


Sign in / Sign up

Export Citation Format

Share Document