59

Extension spectrale dún signal de parole de la bande téléphonique à la bande AM

Abstract

This document proposes a bandwidth extension system producing a wideband signal from a narrowband speech signal. The extension is performed independently for high and low frequencies. High-frequency extension uses the excitation-filter model. Extension of the excitation is performed in the time domain using a non-linear function, while the spectral envelope is extended in the cepstral domain using a multi-layer perceptron. Low-band extension is based on the sinusoidal model. The amplitude of sinusoids is also estimated using a multi-layer perceptron. The results show that the sound quality after extension is higher than that of narrowband speech, with a significant variation across listeners. Some of the techniques, including excitation extension, are of interest in the field of speech coding. ----- Le pr\ésent m\émoire propose un syst\`eme déxtension de la bande permettant de produire un signal en bande AM \`a partir dún signal de parole en bande t\él\éphonique. Léxtension est effectu\ée de fa\c{c}on ind\épendante pour les hautes fr\équences et les basses fr\équences. Léxtension des hautes fr\équences utilise le mod\`ele filtre-excitation. Léxtension de léxcitation est r\éalis\ée dans le domaine temporel par une fonction non lin\éaire, alors que léxtension de lénveloppe spectrale séffectue dans le domaine cepstral par un perceptron multi-couches. Léxtension de la bande basse utilise le mod\`ele sinuso\"idal. Lámplitude des sinuso\"ides est aussi estim\ée par un perceptron multi-couches. Les r\ésultats obtenus montrent que la qualit\é sonore apr\`es extension est sup\érieure \`a celle de la bande t\él\éphonique, avec une importante diff\érence entre les auditeurs. Certaines techniques d\évelopp\ées, dont léxtension de léxcitation, pr\ésentent un certain int\ér\^et pour le domaine du codage de la parole.

View on arXiv
Comments on this paper