AWS anuncia três novos serviços Amazon de inteligência artificial

CloudInovação

A Amazon Web Services (AWS) está lançando três serviços de inteligência artificial (IA) que permitem que qualquer desenvolvedor crie apps que entendam linguagens naturais, transformam textos escritos em fala realista, conversam usando voz ou texto, analisam imagens e reconhecem rostos, objetos e cenas.

É mais um investimento na área de inteligência artificial, onde a empresa está entrando com tudo.  Os serviço são o Amazon Lex, Polly e Rekognition, com base em recursos escaláveis e gerenciados – ou seja, não há necessidade de desenvolver algoritmos de aprendizagem profunda, treinar modelos de aprendizagem automática nem se comprometer com investimentos antecipados em infraestrutura.

A ideia é que os desenvolvedores se concentrem na definição e criação de novos aplicativos, que podem ver, ouvir, falar, compreender e interagir com o mundo ao redor. Até hoje, pouquíssimos desenvolvedores conseguiram desenvolver, implementar e escalar aplicativos com recursos de IA, visto que precisavam de enormes volumes de dados e especialistas em aprendizagem automática e redes neurais. A Amazon quer eliminar todo o trabalho manual e tornar a IA acessível para todos os desenvolvedores de aplicativos.

“A combinação de algoritmos melhores com acesso amplo a volumes enormes de dados e a capacidade computacional econômica fornecida pela nuvem está tornando a IA uma realidade para desenvolvedores de aplicativos”, diz Raju Gulabani, vice-presidente de banco de dados e IA da AWS.

O executivo diz que a empresa está disponibilizando a tecnologia por trás de inovações como o assistente digital Alexa e o motor de previsão dos desejos dos clientes, por exemplo.

Conversas inteligentes com o Amazon Lex

O Amazon Lex é um novo serviço para a criação de interfaces conversacionais que utiliza voz e texto desenvolvidos com as mesmas tecnologias de reconhecimento automático de voz  e compreensão de linguagem natural utilizados no Alexa. Permite implementar recursos sofisticados de linguagem natural em praticamente qualquer aplicativo. Os desenvolvedores podem criar e testar bots (aplicativos conversacionais que realizam tarefas automatizadas, como verificar o clima ou agendar voos) diretamente do AWS Management Console, digitando algumas frases simples (“encontre um voo” ou “reserve um voo”, por exemplo), além das instruções de como obter os parâmetros necessários para completar a tarefa (data e destino da viagem, por exemplo) e perguntas de esclarecimento a serem feitas ao usuário (“quando você deseja viajar?” e “aonde você deseja ir?”, por exemplo).

Os bots podem ser utilizados em qualquer lugar, de aplicativos da web aos de mensagem e bate-papo, como o Slack e Facebook Messenger, ou por meio da voz em aplicativos de dispositivos móveis ou conectados. Além disso, os desenvolvedores não precisam se preocupar em escalar sua infraestrutura, uma vez que o Amazon Lex escala automaticamente de acordo com o aumento do tráfego direcionado a um bot e os desenvolvedores pagam apenas pelas chamadas realizadas ao API.

Fala inteligente com o Polly

O Polly possibilita a adição de recursos de fala realista a aplicativos já existentes, como leitores de notícias e plataformas de e-learning e a criação de categorias totalmente novas de produtos que tenham recursos de voz, de aplicativos móveis a eletrônicos e aparelhos domésticos. Ele é fácil de usar: os desenvolvedores enviam textos ao Amazon Polly usando SDK ou a partir do AWS Management Console, e o Polly responde com um streaming de áudio que pode ser reproduzido diretamente ou armazenado em um formato de áudio padrão.

Com 47 vozes realistas e suporte a 24 idiomas, os desenvolvedores podem escolher vozes masculinas ou femininas com diversos sotaques e desenvolver aplicativos para usuários em todo o mundo. E, como tem uma pronúncia fluída dos conteúdos de texto, os aplicativos oferecem output de voz de alta qualidade em diversos formatos de texto. Os desenvolvedores pagam apenas pelo texto convertido e podem converter as falas geradas em cache, a fim de reproduzi-las quantas vezes quiserem, sem restrições.

Análise de imagem com o Rekognition

O Rekognition permite a criação de aplicativos de análise de imagens e de reconhecimento de rostos, objetos e cenas. Ele utiliza tecnologias de aprendizagem profunda para identificar automaticamente objetos e cenas, tais como veículos, animais de estimação ou móveis, e oferece uma pontuação de confiança que permite aos desenvolvedores inserir imagens que podem ser utilizadas na pesquisa de imagens específicas com palavras-chave.

O sistema consegue localizar rostos dentro de imagens e detectar atributos, tais como o clima e se a pessoa está sorrindo ou está de olhos abertos. Ele também tem suporte para funcionalidades avançadas de análise facial, tais como pesquisa e comparação de rostos. Utilizando o Rekognition, os desenvolvedores podem criar um aplicativo que analisa a probabilidade de correspondência entre os rostos de duas imagens diferentes a fim de verificar um usuário mediante uma foto de referência quase que instantaneamente.

De forma semelhante, os usuários podem criar coleções de milhões de rostos (detectados em imagens) e podem pesquisar correspondências para sua imagem de referência na coleção. Não há custos iniciais com o Amazon Rekognition; os desenvolvedores pagam por imagem analisada e por vetor de feições faciais armazenado.

No momento, o Polly e o Rekognition estão disponíveis nas regiões leste (Ohio e norte de Virginia) e oeste (Oregon) dos EUA e na Europa (Dublin) e chegarão a outras regiões nos próximos meses. Os clientes podem se inscrever para a versão de pré-lançamento do Lex.


Clique para ler a bio do autor  Clique para fechar a bio do autor