Os pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) estão trabalhando desde 2019 no desenvolvimento de uma Inteligência Artificial que tem a capacidade de converter fragmentos de áudio gravados de vozes de pessoas nos rostos daqueles que falam.
O CSAIL acaba de apresentar os últimos avanços dessa IA, chamada de Speech2Face. Os resultados são impressionantes, embora a plataforma não consiga reconstruir um retrato 100% preciso.
O MIT disse que o modelo desenvolvido é treinado para capturar recursos visuais relacionados a idade, sexo, etc., que são comuns a muitas pessoas, e somente nos casos em que há evidências suficientes para conectar esses elementos com atributos de voz. Com isso, o modelo produzirá apenas rostos de aparência média, com características visuais que se correlacionam com a fala de entrada, mas não produzirá imagens de indivíduos específicos.
A forma como a IA realiza esse reconhecimento é através de bases estatísticas e científicas documentadas, onde certas características de tonalidade, timbre, modulação e ritmo são reflexo de alguma característica física específica na constituição facial dos sujeitos.
Seguiremos atentos aos avanços da IA!
Fonte: https://olhardigital.com.br/2022/04/10/seguranca/mit-cria-inteligencia-artificial-que-reconstroi-rostos-a-partir-da-voz/
Kommentare