Novas tecnologias do CPqD facilitam uso da fala em smartphones, TVs e dispositivos vestíveis

CiênciaCloudInovaçãoMobilidadeSmartphonesVestíveisVirtualização
0 4 Sem Comentários

Aplicações baseadas em síntese de fala de alta qualidade, com adaptação a ambientes embarcados em dispositivos com baixa capacidade de armazenamento e com diferentes tipos de voz. Essas são as principais vantagens da evolução das tecnologias de biometria de voz e de reconhecimento de fala que o CPqD vem trabalhando atualmente.

O CPqD utiliza metodologias de síntese diferentes, em função do tipo de aplicação.

A tecnologia de síntese concatenativa, por exemplo, oferece alta qualidade, inteligibilidade e uma voz mais próxima do natural, sendo amplamente aplicada na comunicação em call centers.

“A fala é sintetizada a partir da concatenação de trechos de fala natural, gravados por um locutor e armazenados em uma base de fala. É uma técnica indicada para aplicações que rodam em desktops ou servidores remotos, uma vez que a base de fala é grande e demanda maior capacidade de armazenamento”, explica Mário Uliani, pesquisador do CPqD.

Já com a técnica HMM (do inglês, Hidden Markov Models), a síntese de fala é feita a partir de modelos acústicos obtidos por meio de computação cognitiva. Essa técnica permite reduzir expressivamente o tamanho da base de fala, o que possibilita o uso da solução em aplicações embarcadas, no universo de Internet das Coisas (IoT) – por exemplo, no smartphone, em videogames, aparelhos de TV, GPS, geladeiras, relógios inteligentes e outros dispositivos vestíveis (wearable devices).

Muitos recursos dessas tecnologias já estão disponíveis nas soluções de síntese e de reconhecimento de fala e, também, de biometria de voz oferecidas pelo CPqD. Entre elas, destacam-se o CPqD Alcance, aplicativo que facilita o uso de smartphones touchscreen por pessoas com deficiências visuais e que, recentemente, ultrapassou 15 mil downloads na loja Google Play; o CPqD Smart Authentication, solução que usa biometria de voz (e de face) para a autenticação segura de usuários; e o CPqD Conecta, que combina tecnologias de síntese e de reconhecimento de fala em uma plataforma de comunicação por múltiplos canais digitais, que facilita a interação entre empresas e clientes ou equipes de campo.

Há também o CPqD Texto Fala, primeiro produto lançado para síntese de fala, que atualmente está instalado em grande número de caixas eletrônicos no país, de diversas instituições financeiras, facilitando o uso desses terminais por pessoas com deficiências visuais ou baixo letramento.