Speech2Face : l’intelligence artificielle qui est capable de reconstruire le visage d’une personne à l’aide d’un enregistrement audio.

Ibtissem LAMRI.
Des scientifiques du laboratoire d’informatique et d’intelligence artificielle du Massachusetts Institute of Technology ont dévoilé un algorithme d’intelligence artificielle appelé « Speech2Face », qui est capable de reconstruire le visage d’une personne à l’aide d’un enregistrement audio.
Les scientifiques de l’institut travaillent sur l’algorithme depuis 2019. Pour accéder à cette technologie, les chercheurs ont d’abord conçu et entraîné un réseau de neurones profonds à l’aide de millions de vidéos YouTube.
Au cours de la première phase de formation, l’IA a pu apprendre l’association entre la voix et les caractéristiques de l’orateur, et il n’y a eu aucune implication humaine dans ce premier processus, car les chercheurs n’ont pas eu besoin de nommer manuellement un sous-ensemble de données.
Des facteurs tels que la langue, l’accent et le ton de la voix entraînent des différences entre la parole et le visage, où le sexe, l’âge et l’origine ethnique n’étaient pas tout à fait corrects.
Les chercheurs ont expliqué qu’ils avaient conçu un modèle pour détecter les associations statistiques entre les traits du visage et la voix des locuteurs, et que les données d’entraînement qu’ils utilisaient étaient un ensemble de vidéos éducatives sur YouTube, et qu’elles ne représentent pas de manière égale l’ensemble de la population mondiale.
En ce qui concerne les applications réelles de ce nouvel algorithme, cette IA pourrait finir par créer un dessin animé d’une personne lors d’un appel téléphonique ou d’une vidéoconférence lorsque son identité est inconnue, une fonctionnalité qui peut être ajoutée à de nombreuses applications.
Le système peut également personnaliser encore plus les différents assistants vocaux, en leur donnant même une image du visage de la personne qui possède l’appareil.
Cette technologie pourrait donner aux forces de l’ordre et aux forces de sécurité l’avantage d’utiliser cette IA pour créer une image de ce à quoi ressemble un suspect, si la seule preuve dont ils disposent est audio.
Le ministre de la Poste et des Télécommunications, Sid Ali Zerrouki, prend part au Forum sur la gouvernance de l’Internet (FGI) 2025 à Lillestrom, près ...
La 12ᵉ édition des Journées scientifiques et techniques (JST) du groupe Sonatrach a été lancée ce mardi 24 juin à Oran. L’événement se tient jusqu’au ...
La société algérienne EPE PROXYLAN SPA et la société russe Positive Technologies ont signé, ce dimanche 25 mai, un protocole d’accord pour développer la coopération ...