Comparaison de mesures de voisment/non-voisement dans les signaux de parole
Abstract
Cet article présente une mesure de voisement basée sur le calcul du signal analytique. Cette mesure peut être utile pour plusieurs applications concernant le traitement de la parole. Par exemple, considérant la reconnaissance automatique de la parole, elle pourrait être incorporée dans les vecteurs acoustiques communément utilisés, comme par exemple les Mel Frequency Cepstral Coefficients (MFCC) et leurs deux premières dérivées, ceci pour améliorer les performances du système. La base de données TIMIT est segmentée manuellement en phonèmes : c'est pourquoi l'évaluation de la mesure développée est effectuée sur cette base. L'information de voisement est déduite de cette segmentation. Il est montré dans cet article que la segmentation automatique voisé/non-voisé obtenue en utilisant la méthode décrite dans les sections suivantes et la segmentation manuelle voisé/non-voisé fournie dans TIMIT sont très similaires.
Origin : Files produced by the author(s)
Loading...