Accueil Enseignement Recherche Oussopo Introduction Correction
de timbre
Contrôle du bruit
de quantification
Filtrage particulaire
et modèles TVAR
Projet WaRRIS Projet ICityForAll

Mes travaux de thèse avaient pour objet la correction des distorsions spectrales subies par la parole sur les réseaux téléphoniques. Ces distorsions sont dues principalement aux terminaux téléphoniques et à la partie analogique des lignes téléphoniques. Le but est de restaurer, en aveugle, un timbre le plus proche possible de la voix originale du locuteur, au moyen d'un traitement centralisé dans un équipement du réseau.[1]

Nous proposons un algorithme d'égalisation spectrale aveugle consistant à aligner, sur une bande de fréquences limitée (200-3150 Hz), le spectre à long terme du signal traité sur un spectre de référence [2,3]. Des évaluations subjectives mettent en évidence une restauration satisfaisante du timbre original des locuteurs, dans la limite de la bande d'égalisation choisie.

Il apparaît toutefois que la quantification des échantillons de sortie de l'égaliseur induit un bruit gênant en réception. Deux approches sont donc proposées pour masquer perceptivement ce bruit par un reformage spectral. Une évaluation subjective montre finalement d'une part que le bruit non reformé est préféré au bruit reformé, plus sporadique mais plus "rauque", d'autre part qu'une voix dont le timbre a été corrigé, au prix de ce bruit de quantification, est préférée à la même voix en réception d'une liaison téléphonique sans correction de timbre (et non bruitée).

Afin d'améliorer l'adéquation du spectre de référence de l'égaliseur aux différents locuteurs, une classification des locuteurs selon leur spectre est proposée, de manière à utiliser non plus un spectre de référence unique, mais un spectre de référence par classe. Il en résulte une réduction de la distorsion spectrale induite par l'égaliseur, ce qui se traduit, pour certains locuteurs, par une amélioration significative de la correction de timbre.[4,5]

Plus récemment, nous avons combiné cette méthode à une modélisation physique des lignes de transmission. Il en résulte une correction plus fine des distorsions spectrales du signal et, pour certains locuteurs, une amélioration perceptible de la correction de timbre.[6]

Publications

  1. Gaël Mahé, André Gilloire et Lætitia Gros, "Correction of the voice timbre distortions in telephone networks: method and evaluation", Speech Communication, Vol. 43, Issue 3, août 2004, pp. 241-266.
  2. Gaël Mahé et André Gilloire, "Correction of the voice timbre distortions on telephone network", Eurospeech, Aalborg, Danemark, septembre 2001, pp. 1867-1870.
  3. Brevet déposé le 28.03.01 (n° de dépôt FR0104194) : "Procédé et dispositif de correction centralisée du timbre de la parole sur un réseau de communications téléphoniques". Inventeurs : Gaël Mahé et André Gilloire.
  4. Gaël Mahé et André Gilloire, "Multi-referenced correction of the voice timbre distortions on telephone network", Eurospeech, Genève, Suisse, septembre 2003, pp. 1381-1384.
  5. Brevet déposé le 11.12.02 (n° de dépôt FR0215618, étendu à l'Europe sous le n° EP1429316 et aux USA sous le n° US20040172241) : "Procédé et système de correction multi-références des déformations spectrales de la voix introduites par un réseau de communication". Inventeurs : Gaël Mahé et André Gilloire.
  6. A. Neves, G. Mahé et M. Mboup, "Restoration of voice timbre in telephone networks, based on both voice and lines properties", Eusipco, Vienne, septembre 2004, pp. 1943-1946.