2:01
  • Copié
SAISON 2022 - 2023

Anicet Mbida nous livre chaque matin ce qui se fait de mieux en matière d'innovation. Ce mercredi, il s'intéresse à la possibilité d'isoler une voix en particulier au milieu du brouhaha de la foule.

L’innovation du jour c’est une nouvelle avancée en matière de reconnaissance vocale. On sait désormais isoler une voix en particulier au milieu du brouhaha de la foule.

Et c’est un vrai tour de force, car ce n’est pas donné à tout le monde. Si on est dans un restaurant, par exemple, et qu’il y a beaucoup de bruit autour. On est tous capables de suivre une conversation avec la personne en face de soi. Mais c’est déjà un peu plus compliqué d’arriver à capter les conversations des tables d’à côté. Et il faut carrément être Super Jaimie pour savoir ce qu’il se dit à l’autre bout de la pièce. Eh bien, des chercheurs ont mis une sorte de Super Jaimie dans un logiciel pour arriver à isoler des timbres de voix différents dans la foule. Du coup, cela permet de choisir une voix en particulier et de ne plus entendre que cette personne.

À quoi ça va servir. À espionner les gens ?

Oui, c’est sûr. Vous parliez d’espions : quand dans les films ils mettent la musique à fond pour ne pas qu’on les entendre… Avec ce système, cela ne marchera plus ! On pourra facilement retranscrire leurs conversations même dans les endroits bruyants.
Mais bizarrement, c'est plutôt dans les ascenseurs que l’on devrait retrouver cette technologie. Elle a été mise au point par les laboratoires de Mitsubishi Electric. Mitsubishi qui fabrique des ascenseurs et qui travaille sur des modèles à reconnaissance vocale. Ils veulent être capables de comprendre un groupe de personnes quand elles rentrent dans l’ascenseur : « Moi je vais au cinquième… Moi, au septième… Je descends au premier… ». Tout le monde pourra parler en même temps. Mais cela ne l’empêchera pas d’enregistrer le bon étage choisi par chacun.

On espère que c’est efficace, sinon ce sera le bazar…

Oui, surtout que la technologie est encore limitée. Dès qu’il y a plus de 5 personnes qui parlent en même temps, il ne comprend plus ! Vous imaginez ? « Non, non ! Vous êtes le sixième à parler, je ne peux plus enregistrer votre étage. » L’ascenseur sans boutons, ce n’est pas pour tout de suite…
En revanche, c’est une technologie que l’on retrouvera bientôt sur les assistants vocaux de nos téléphones portables. Elle leur permettra de mieux nous comprendre dans la rue ou au milieu de la foule. Et c’est tant mieux, car les téléphones ont beaucoup de mal aujourd’hui, dès qu’il y a le moindre bruit de fond.