audio segmentation Latest Research Papers

Audio segmentation and classification are the basis of audio processing in broadcasting industries. A Dual-CNN (Dual-Convolutional Neural Network) method is proposed in this article in which it is possible to pre-train a CNN with unlabeled audio data so as to deal with the scarcity of labeled data. Auto-encoders (including an encoder and a decoder) are utilized, thus the name “Dual.” In the first place, audio sampling points and the derived STFT (Short-Time Fourier Transform) spectrograms pass through their own CNNs. Fusion of the extracted features is then performed. Finally, the merged features are sent to a fully connected network and the classification results are produced via Softmax. Being one of the segmentation-by-classification approaches, our solution also presents a novel smoothing method (SEG-smoothing) in order to deliver the best result of segmentation. A series of experiments have been conducted and their result verifies that the proposed approach for segmentation and classification outperforms alternative solutions.

Download Full-text

Sub-voice Detection and Recognition based on Hybrid Audio Segmentation and Deep Learning

Proceedings of the 2019 International Conference on Robotics, Intelligent Control and Artificial Intelligence - RICAI 2019 ◽

10.1145/3366194.3366219 ◽

2019 ◽

Author(s):

Xiaolei Zhao ◽

Chenyin Wang ◽

Xibin Xu

Keyword(s):

Deep Learning ◽

Audio Segmentation ◽

Voice Detection ◽

Detection And Recognition

Download Full-text

A Recurrent Neural Network Approach to Audio Segmentation for Broadcast Domain Data

10.21437/iberspeech.2018-19 ◽

2018 ◽

Cited By ~ 1

Author(s):

Pablo Gimeno ◽

Ignacio Viñals ◽

Alfonso Ortega ◽

Antonio Miguel ◽

Eduardo Lleida

Keyword(s):

Neural Network ◽

Recurrent Neural Network ◽

Network Approach ◽

Neural Network Approach ◽

Audio Segmentation

Download Full-text

An adapted data selection for deep learning-based audio segmentation in multi-genre broadcast channel

Digital Signal Processing ◽

10.1016/j.dsp.2018.03.004 ◽

2018 ◽

Vol 81 ◽

pp. 8-15 ◽

Cited By ~ 3

Author(s):

Xu-Kui Yang ◽

Dan Qu ◽

Wen-Lin Zhang ◽

Wei-Qiang Zhang

Keyword(s):

Deep Learning ◽

Data Selection ◽

Broadcast Channel ◽

Audio Segmentation ◽

Selection For

Download Full-text

audio segmentation
Recently Published Documents

TOTAL DOCUMENTS

H-INDEX

Generalising AUC Optimisation to Multiclass Classification for Audio Segmentation with Limited Training Data

Multiclass audio segmentation based on recurrent neural networks for broadcast domain data

Multiclass Digital Audio Segmentation with MFCC Features using Naive Bayes and SVM Classifiers

Ad-hoc mobile array based audio segmentation using latent variable stochastic model

Audio Word2vec: Sequence-to-Sequence Autoencoding for Unsupervised Learning of Audio Segmentation and Representation

Audio Segmentation and Classification Approach Based on Adaptive CNN in Broadcast Domain

An Improved Approach to Audio Segmentation and Classification in Broadcasting Industries

Sub-voice Detection and Recognition based on Hybrid Audio Segmentation and Deep Learning

A Recurrent Neural Network Approach to Audio Segmentation for Broadcast Domain Data

An adapted data selection for deep learning-based audio segmentation in multi-genre broadcast channel

Export Citation Format

audio segmentationRecently Published Documents

TOTAL DOCUMENTS

H-INDEX

Generalising AUC Optimisation to Multiclass Classification for Audio Segmentation with Limited Training Data

Multiclass audio segmentation based on recurrent neural networks for broadcast domain data

Multiclass Digital Audio Segmentation with MFCC Features using Naive Bayes and SVM Classifiers

Ad-hoc mobile array based audio segmentation using latent variable stochastic model

Audio Word2vec: Sequence-to-Sequence Autoencoding for Unsupervised Learning of Audio Segmentation and Representation

Audio Segmentation and Classification Approach Based on Adaptive CNN in Broadcast Domain

An Improved Approach to Audio Segmentation and Classification in Broadcasting Industries

Sub-voice Detection and Recognition based on Hybrid Audio Segmentation and Deep Learning

A Recurrent Neural Network Approach to Audio Segmentation for Broadcast Domain Data

An adapted data selection for deep learning-based audio segmentation in multi-genre broadcast channel

audio segmentation
Recently Published Documents