Comparaison de mesures de voisment/non-voisement dans les signaux de parole

Stéphane Rossignol 1 Olivier Pietquin 1
1 IMS - Equipe Information, Multimodalité et Signal
UMI2958 - Georgia Tech - CNRS [Metz], SUPELEC-Campus Metz
Résumé : Cet article présente une mesure de voisement basée sur le calcul du signal analytique. Cette mesure peut être utile pour plusieurs applications concernant le traitement de la parole. Par exemple, considérant la reconnaissance automatique de la parole, elle pourrait être incorporée dans les vecteurs acoustiques communément utilisés, comme par exemple les Mel Frequency Cepstral Coefficients (MFCC) et leurs deux premières dérivées, ceci pour améliorer les performances du système. La base de données TIMIT est segmentée manuellement en phonèmes : c'est pourquoi l'évaluation de la mesure développée est effectuée sur cette base. L'information de voisement est déduite de cette segmentation. Il est montré dans cet article que la segmentation automatique voisé/non-voisé obtenue en utilisant la méthode décrite dans les sections suivantes et la segmentation manuelle voisé/non-voisé fournie dans TIMIT sont très similaires.
Complete list of metadatas

Cited literature [5 references]  Display  Hide  Download

https://hal-supelec.archives-ouvertes.fr/hal-00652452
Contributor : Sébastien van Luchene <>
Submitted on : Thursday, December 15, 2011 - 4:14:33 PM
Last modification on : Wednesday, July 31, 2019 - 4:18:03 PM
Long-term archiving on : Friday, November 16, 2012 - 3:40:33 PM

File

GRETSI_2011_SROP.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00652452, version 1

Collections

Citation

Stéphane Rossignol, Olivier Pietquin. Comparaison de mesures de voisment/non-voisement dans les signaux de parole. GRETSI 2011, Sep 2011, Bordeaux, France. pp.1-5. ⟨hal-00652452⟩

Share

Metrics

Record views

221

Files downloads

652