Accueil Enseignement Recherche Introduction Quantification Codage audio Séparation
de sources
Identification
de systèmes
Qualité audio Tatouage audio Signaux
biophysiques
Projets HDR
Dans la thèse de Imen Marrakchi-Mezghani, co-encadrée avec Meriem Jaïdane, Sonia Larbi et Monia Turki, nous avons étudié l’apport des concepts de tatouage dopant et de tatouage témoin à l’identification de systèmes audio linéaires et non-linéaires.

Annulation d’écho acoustique par tatouage témoin

Lors d’une communication téléphonique en mode mains-libres, le son issu du haut-parleur est transmis par le micro, après avoir subi plusieurs réflexions dans la pièce. Le correspondant perçoit alors un écho de sa propre voix. Ce désagrément peut être corrigé par un annuleur d’écho acoustique (AEC), fondé sur une identification du canal acoustique entre le haut-parleur et le micro. Cette identification est d’autant meilleure que le signal véhiculé est blanc et stationnaire ; les algorithmes classiques sont donc perturbés par la corrélation et la non-stationnarité des signaux de parole.

Nous avons proposé un AEC exploitant un tatouage témoin, qui est un signal blanc et stationnaire inséré de manière inaudible dans le signal de parole avant le haut-parleur. Notre AEC est composé de deux étages : le premier est un AEC classique piloté par le signal de parole tatoué, tandis que le second identifie l’erreur d’identification du premier. Ce second étage, piloté par le tatouage seul, bénéficie de la blancheur et de la stationnarité de ce dernier, ce qui améliore la robustesse du système global aux « mauvaises » propriétés du signal de parole. L’écho est ainsi réduit d’environ 10 dB par rapport au premier étage seul et notre implémentation est robuste au bruit de fond et à la sous-modélisation du chemin d’écho [1,2,4,5,6,8].

Caractérisation des systèmes audio non-linéaires par tatouage dopant

Pour caractériser les distorsions non-linéaires des enceintes acoustiques, les ingénieurs audio utilisent généralement des signaux simples : bruit blanc gaussien, tonales, sinusoïdes glissantes. Or le fonctionnement non-linéaire d’un haut-parleur dépend physiquement du signal d’entrée, de sorte qu’il serait plus judicieux de caractériser un haut-parleur avec les signaux d’usage, à savoir de la parole ou de la musique. Cependant, les algorithmes d’identification de systèmes non-linéaires sont sensibles à la densité de probabilité des signaux d’entrée, voire reposent sur une hypothèse (pas toujours vérifiée) de gaussianité de l’entrée.

En considérant des systèmes de modèle polynomial (cas sans mémoire) ou modélisés par des filtres de Volterra (cas avec mémoire) nous avons proposé un schéma d’identification en quatre étapes : gaussianisation sous contrainte perceptive ; blanchiment ; orthonormalisation fondée sur la gaussianité; identification adaptative. Comparé à une identification adaptative directe, ce schéma réduit nettement le temps de convergence et l’erreur en régime permanent [3,5,6,7].

Publications

  1. Mezghani-Marrakchi I., Turki-Hadj-Allouane M., Djaziri-Larbi S., Jaïdane-Saïdane M., Mahé G., "Speech processing in the watermarked domain: application in adaptive acoustic echo cancellation", Proceedings of the 14th European Signal Processing Conference (EUSIPCO 2006), Florence, Italie, septembre 2006.
  2. Mezghani-Marrakchi I., Turki-Hadj-Allouane M., Djaziri-Larbi S., Jaïdane-Saïdane M., Mahé G., "Analyse des performances d'une nouvelle structure d'AEC dans le domaine tatoué", Proc. of International Symposium on Image/Video Communications (ISIVC'06), Hammamet, Tunisie, septembre 2006.
  3. Mezghani-Marrakchi I., Mahé G., Jaïdane-Saïdane M., Djaziri-Larbi S., Turki-Hadj-Allouane M., " 'Gaussianization' method for identification of memoryless nonlinear audio systems" , Proceedings of the 15th European Signal Processing Conference (EUSIPCO 2007), Poznan, Pologne, septembre 2007, pp 2316-2320.
  4. Mezghani-Marrakchi I., Mahé G., Jaïdane-Saïdane M., Djaziri-Larbi S., Turki-Hadj-Allouane M., "Procédé et dispositif d'annulation d'écho acoustique par tatouage audio" , brevet déposé en France le 29 octobre 2009 sous le no 0957636, étendu à l’international sous le no WO/2011/051625 (procédure PCT)
  5. Imen Mezghani-Marrakchi, "Identification des systèmes audio par tatouages dopant et témoin~: Caractérisation des non-linéarités des haut-parleurs et annulation d'écho acoustique", Thèse de l'Ecole Nationale d'Ingénieurs de Tunis et de l'Université Paris Descartes, février 2010.
  6. Sonia Djaziri Larbi, Gaël Mahé, Imen Mezghani Marrakchi, Monia Turki and Meriem Jaïdane-Saïdane, "Doping and witness watermarking for audio processing" , papier invité à l'International Workshop on Systems, Signal Processing and their Applications (WOSSPA), Tipaza, Algérie, mai 2011.
  7. I. Mezghani-Marrakchi, G. Mahe, S. Djaziri-Larbi, M. Jaidane, and M. Turki-Hadj Alouane. "Nonlinear audio systems identification through audio input gaussianization". IEEE/ACM Transactions on Audio, Speech, and Language Processing, , 22(1), pp. 41–53, january 2014.
  8. Sonia Djaziri-Larbi, Gaël Mahé, Imen Mezghani, Monia Turki, Mériem Jaidane, "Watermark-Driven Acoustic Echo Cancellation" , IEEE/ACM Transactions on Audio, Speech and Language Processing, 2018, 26 (2), pp.367-378.