C'EST DEMAIN

Les machines liront bientôt sur nos lèvres (et cela pourrait être bien pratique)

Des chercheurs en intelligence artificielle ont réussi à faire qu'une machine comprenne certains mots en observant notre bouche.

08/11/2016 12:38 CET | Actualisé 08/11/2016 12:50 CET
Zoonar RF
Une intelligence artificielle est capable de lire sur les lèvres (mais vous ne devriez pas vous inquiéter)

TECHNO - Les machines savent de mieux en mieux répondre à nos désirs. Récemment, une équipe de Microsoft a réussi à programmer une intelligence artificielle qui comprend aussi bien qu'un humain les mots prononcés.

D'autres chercheurs, de l'université d'Oxford, ont eux tenté une autre approche: apprendre à une machine à lire sur les lèvres, rapporte The Verge. LipNet (c'est le nom de cette intelligence artificielle), affirment les chercheurs, est capable de reconnaître une phrase dans 93% des cas.

Un humain expérimenté dans la technique de la lecture labiale, en moyenne, ne dépasse pas les 52,3%. Même s'il y a de grands écarts entre chaque individu sur ce sujet, la différence est notable.

En plus, le logiciel est si efficace qu'il retransmet la parole quasiment en temps réel. Si ces exploits sont impressionnants, LipNet a tout de même quelques défauts majeurs à corriger.

Pour entraîner l'intelligence artificielle, les chercheurs ont utilisé la technologique du deep learning. En gros, on va proposer des milliers d'exemples à des réseaux de neurones artificiels qui vont "apprendre" par eux-même, empiriquement.

Un exercice limité (pour l'instant)

La base de données en question "contient 64.000 phrases", précisent les auteurs. Mais, comme le note The Verge, ces phrases, qui n'ont pas de sens, ont toujours le même format: un verbe, une couleur, une préposition, une lettre, un chiffre et un adverbe. Et le nombre de mots est lui-même limité: il n'y a par exemple que quatre couleurs.

Pour autant, comme le rappellent les chercheurs dans leur étude, les autres expériences de reconnaissance du langage utilisant le deep learning montrent que plus la base de données grossie, meilleure est l'efficacité de la machine. Ils souhaitent donc maintenant tester LipNet en conditions réelles, en le nourrissant de millions de véritables phrases.

Concernant les applications, il y a bien sûr la possibilité d'utiliser cette technologie pour aider les personnes malentendantes, par exemple grâce à des lunettes équipées de caméras et retranscrivant le discours d'une personne. L'usage de cette technologie à des fins d'espionnage est par contre évacué par les auteurs: la lecture labiale nécessite d'être bien en face de la personne afin de voir les mouvements de sa langue et de sa gorge. Un peu compliqué pour un espion, d'autant qu'un micro directionnel sera surement plus pratique à mettre en place.

Mais un autre usage, plus global, est imaginé par les chercheurs: la dictée silencieuse à nos smartphones. Depuis quelques années, la reconnaissance vocale a fait d'énormes progrès, doublant en rapidité l'écriture classique avec un clavier tactile. Elle est également de plus en plus utilisée, notamment chez les plus jeunes. Pourtant, il est difficile dans certaines circonstances de parler à voix haute à Siri, Cortana ou Google Now. Mais s'il suffisait de chuchoter, cela résoudrait bien des problèmes.

Lire aussi :

Une intelligence artificielle a créé un "nouveau" morceau des Beatles

On a testé le nouveau WhatsApp intelligent de Google

Comment le futur de l'intelligence artificielle pourrait révolutionner le monde

Pour suivre les dernières actualités de C'est Demain, cliquez ici

Tous les matins, recevez gratuitement la newsletter du HuffPost

Retrouvez-nous sur notre page Facebook

À voir également sur Le HuffPost: