Topo

Histórico

Anielle Guedes

Sua voz poderá controlar tudo ao seu redor

Anielle Guedes

01/08/2019 04h00

Quando você lê ou ouve a palavra 'tecnologia', o que imagina? Provavelmente, telas touch screen que com apenas alguns toques e poucos segundos enviam mensagens, realizam pesquisas aprofundadas ou colocam sua música preferida para tocar. Seja como for, é impossível pensar na vida moderna sem as telas. O que você talvez não imagine é que em um futuro breve, nossas vozes serão tão importante quanto nossas mãos.

Com o avanço das inteligências artificiais e das tecnologias de reconhecimento de voz, as interfaces auditivas têm tido cada vez mais espaço em assistentes virtuais. Seu uso já saiu dos limites de pesquisas no Google e hoje chega aos laboratórios de ciência, aos carros e aos aparelhos eletrodomésticos de nossas casas.

OMO: Online-Mistura-com-Offline  

Em poucos anos, tudo o que você possui será controlado pela sua voz. Google e a Amazon seguem em uma competição para que seus assistentes estejam disponíveis em seu carro, em sua televisão e até mesmo no seu banheiro. O que parece um pouco exagerado agora, pode ser nossa realidade cotidiana: a onipresença das interfaces de voz está ligada a uma ideia que o principal especialista em Inteligência Artificial, Kai-Fu Lee, chama de OMO, online-mistura-com-offline. 

OMO é a combinação dos mundos físico e digital, de tal forma que cada objeto em nosso ambiente se torne um ponto de interação com a internet. Ao mesmo tempo em que esses objetos atuarão como sensores de coletas de dados sobre nossas vidas. Com esse avanço, viveremos o que Lee chama de 'terceira onda' da inteligência artificial, em que os algoritmos terão uma visão abrangente de todos os nossos comportamentos e serão capazes de hiper-personalizar nossas experiências – todas as nossas experiências.

Quando você for ao mercado, por exemplo, seu carrinho de compras saberá exatamente quais itens recomendar. Como? Sua geladeira e seu carrinho deverão estar conectados à internet, onde a informação estará disponível. As interfaces de voz serão fundamentais para isso: ao instalar Alexa na sua geladeira, sua porta e todas as outras propriedades são vinculadas a um ecossistema de software. 

Atualmente, as capacidades dos sistemas de voz ainda são limitadas. Afinal, para uma máquina é difícil compreender diversos idiomas, sotaques, gírias e tons de voz diferentes, sem contar a interferência de sons externos. Isso está prestes a mudar, já que várias equipes trabalham em novas técnicas de aprendizado de máquina para obter avanços na compreensão da linguagem. É o caso da OpenAI, uma organização sem fins lucrativos que desenvolveu uma técnica de aprendizado não supervisionada para treinar sistemas em textos não estruturados, em vez de limpos e rotulados. 

Alexa e suas capacidades

Um futuro completamente OMO ainda está distante, porém a Alexa mostra promissores sinais nesta direção e tem ganhado espaço nos gadgets com algumas capacidades já maduras. A assistente virtual já vem embutida em televisores da LG com recursos de Inteligência Artificial da plataforma ThinQ. Assim, a televisão pode receber comandos de voz, controlar outros aparelhos da casa e executar uma série de tarefas.

Um pouco mais inusitado é o espelho inteligente Verdera Voice Lighted da Kohler, um dispositivo que visa substituir os espelhos comuns, com três faces ajustáveis e iluminação LED. Integrado com a Alexa, o espelho atua como um dispositivo inteligente, enquanto a pessoa se prepara para o trabalho, dita comandos por voz para enviar e-mails e conferir a agenda do dia.

Por falar em produtos que não vêm equipados com assistentes virtuais, a empresa anunciou o AmazonBasics Microwave, um micro-ondas conectado à internet que pode ser controlado por comandos de voz. Basta dizer ao micro-ondas qual alimento cozinhar, que os tempos pré-determinados dão conta do serviço. O aparelho também terá conexão com a plataforma Dash, que faz a compra de novos produtos pela Amazon. 

No ano passado, o vazamento de um site britânico da Amazon mostrou que a companhia deve lançar em breve um plug de tomada capaz de transformar qualquer eletrônico convencional em um dispositivo inteligente. Aparelhos ligados ao conector poderão receber comandos de voz por meio da assistente virtual Alexa. Segundo o texto do site, que já foi retirado do ar, o produto permite controle remoto por meio do Alexa App e agendamento de horários para desligar e ligar luzes, cafeteiras, entre outros eletrodomésticos. 

A Amazon também criou o Skill Flow Builder, uma ferramenta completa para que desenvolvedores de jogos mapeiem histórias, criem narrativas, adicionem efeitos visuais e sonoros e implementem a lógica do jogo. Todas essas capacidades de desenvolvimento têm como objetivo fomentar o mercado de jogos comandados por voz da assistente virtual Alexa. 

Jogos por voz

Segundo Dave Isbitski, da Amazon, os jogos são alguns dos aplicativos mais populares entre usuários, com um aumento de 160% no ano passado. Desde 2018, disse Isbitski, bilhões de comandos pediram a Alexa para jogar. E é claro que a Amazon quer uma fatia desse grande mercado. O Vortex, jogo do primeiro estúdio português de voz Doppio que usa Alexa, foi lançado no início deste ano e a companhia pretende lançar outro ainda em 2019.

Para Isbitski, os jogos comandados por voz têm um grande futuro, possibilitando que várias pessoas troquem uma experiência de voz juntas. Para ele, isso transforma o papel que as assistentes de voz têm, deixando de ser apenas meteorologistas ou dicionários e evoluindo para tecnologias que possibilitam envolvimento, emoção e conversas significativas. 

A Pretzel Labs é uma startup de jogos de primeira voz que está investindo na ideia: a empresa já lançou vários jogos para Alexa, Google Home e outros assistentes de voz, sendo que o mais popular deles é o Kids Court, em que os jogadores precisam resolver um caso com a ajuda da assistente virtual. Segundo a Pretzel, Alexa atua como uma tecnologia que atua em seu favor, sendo racional, não parcial e não distraída, diferentemente dos seres humanos.

A Doppio já percebeu que os jogos por voz têm o potencial de atrair novos jogadores, como pessoas que não se consideravam gamers e que começaram a experimentar o jogo. Uma nova possibilidade que vai além dos consoles, PCs e jogos de dispositivos móveis, como celulares e tablets.

Hello Google

Em 2016 o Google Assistant entrou em atividade, a princípio para o finado aplicativo de mensagens Allo, e seu funcionamento foi expandido para outras funcionalidades. Com apenas três anos em funcionamento, o Assistant da Google é capaz de realizar tarefas do dia a dia, como mandar mensagens e realizar pesquisas no Google, assim como conversar com o usuário. 

Da mesma forma que a concorrente Alexa, a assistente virtual do Google segue em expansão para aparelhos offline, como as luzes de casa, o regulador de temperatura e tarefas dentro do carro. Isso tudo sem precisar ficar preso à uma tela, apenas utilizando comandos de voz. 

Pode parecer besteira ou apenas um conforto a mais, no entanto o comando de voz tem o potencial de ser precioso para idosos e pessoas com deficiência. Neste mês, a Google anunciou a doação de 100 mil unidades do Google Mini Home para pessoas com paralisia nos Estados Unidos.

O ex-atleta de halterofilismo Garrison Rede é a prova viva de como a tecnologia pode dar autonomia a quem utiliza uma cadeira de rodas ou é cego. Por meio do Mini, o atleta organiza sua agenda de compromissos, faz sua lista de compras, acende as luzes da casa, controla a temperatura e ouve as notícias. É um caminho para mais independência. 

Para competir ainda mais diretamente com a Amazon, a Google lançou o Google Home Mini, uma alternativo ao Amazon Echo Dot, mas sua performance ficou um pouco aquém do esperado. O Mini possui algumas falhas de design, como botões de controle físico que não funcionam tão bem e a falta de pareamento com outros equipamentos para som estéreo. Com o lançamento do Mini 2, usuários esperam que esse e outros problemas sejam resolvidos. Há quem torça, ainda, para um Mini resistente à água, que seria ideal como um speaker para o seu banheiro. 

De Código aberto

Apesar de Amazon e Google serem as maiores empresas desenvolvendo assistentes de voz, elas não são as únicas. A assistente Mycroft é a primeira do mundo de código aberto, com um software que funciona em diversas plataformas Linux. O Mycroft também está disponível no o Raspberry Pi, um minicomputador compacto do tamanho de um cartão de crédito que pode ser ligado a um monitor ou televisão. Pequeno e de baixo custo, o Raspberry permite que os usuários o utilizem em qualquer lugar e invistam pouquíssimo dinheiro.

Qualquer desenvolvedor pode trabalhar em cima do Mycroft, estendendo e melhorando suas funcionalidades, que variam de projetos de ciência até a aplicação de software em modelos empresariais. O objetivo do Mycroft é desenvolver o assistente de voz de maneira conjunta, contando com a colaboração de diversas pessoas, em diferentes plataformas. O desenvolvimento do software independente também descentraliza o poder que as grandes companhias exercem no mercado. 

O speaker da Mycroft, o Mark I, se apresenta como uma alternativa aos aparelhos da Amazon e da Google. Ele tem as mesmas funcionalidades: tocar música, controlar a agenda, realizar pesquisas ou controlar a casa. O dispositivo é vendido no site da empresa com a informação de que cada venda será revertida ao desenvolvimento de inteligência artificial para todos. 

Assistentes… até para finanças e cientistas

Precisa de uma ajudinha para cuidar das suas finanças? A Finley AI é uma assistente que responde a questionamentos genéricos sobre finanças ou encontrar um consultor financeiro de acordo com as necessidades do usuário. Ele auxilia com questões relativas a planejamento para o futuro, impostos, investimentos, entre outras questões que o usuário possa apresentar. A Finley responde a por meio do Google Assistant, é só falar: "Ok Google, talk to Financial Helper".

Um pouco mais distante e profissional do que o sistema que te ajuda a pesquisar receitas para o jantar, o LabTwin será um assistente de laboratório disponível para cientistas. LabTwin permite que os pesquisadores tomem notas, coletem dados, criem listas de suprimentos e definam timers ou lembretes em qualquer lugar do laboratório. Falar diretamente com o aparelho reduz muito o tempo gasto a elaboração de listas e notas.

Para a CEO do LabTwin, Magdalena Paluch, os assistentes liberarão funcionários para trabalhar nas coisas mais importantes. "Novas formas de interação, como reconhecimento de voz ou imagem, em conjunto com a tecnologia de aprendizado de máquina, impulsionarão as empresas ainda mais do que nunca", disse.

Hoje, já são mais de 100 milhões de aparelhos que operam por voz nos EUA, número em constante crescimento. O mercado deve se expandir ainda mais com novas empresas entrando no mercado e Google e Amazon aprimorando seus sistemas de reconhecimento e gama de idiomas. Suas aplicações também são cada vez mais variadas, podendo ser aplicadas dentro de casa, na sala de aula, no trabalho e no carro. 

Eles também podem permitir que cegos utilizem as tecnologias de maneira mais simplificada, que pessoas com dificuldade de locomoção possam ter mais autonomia dentro de casa e nas ruas e que pessoas com pouca mobilidade das mãos possam navegar na internet ou jogar sem necessidade de ajuda. Os idosos também encontram nos assistentes virtuais uma forma mais fácil e ágil de lidar com a tecnologia, sem a necessidade de aprender a usar as complexas funções de computadores ou aplicativos no celular.

De maneira geral, é muito possível que assistentes virtuais controlem todos os aspectos de nossa interação digital, substituindo as telas, pois vozes são mais orgânicas à experiência humana. As vantagens são inúmeras, mas diferente das telas as interfaces auditivas permeiam o espaço onde estamos inseridos completamente e assim, acabam sendo ainda mais invasivas que as telas. Onde e quando iremos querer vozes e sons digitais? Para que iremos querer usá-los? Esperamos que o silêncio ainda possa ser encontrado em um mundo com sons onipresentes. 

 

Sobre a autora

Anielle Guedes estudou Física e Economia na Universidade de São Paulo e sem concluir os cursos de graduação embarcou em uma pós graduação nos Estados Unidos sobre inovação disruptiva na Singularity University (localizada em uma base da NASA). Assim virou especialista em tecnologias emergentes, foresight e desafios globais. Fundou uma startup de impressão 3D e manufatura avançada para construção, a qual liderou por 4 anos e atuou no Brasil, Estados Unidos e Europa. Foi eleita pela Forbes, MIT e Bloomberg como uma das jovens mais inovadoras do mundo. Tornou-se consultora em inovação e desenvolvimento econômico, participando de projetos de advisory e advocacy em governos federais e organismos multilaterais, além de ser conselheira de organizações como o Conselho Empresarial para o Desenvolvimento Sustentável. Palestrou em mais de 30 países. Atualmente cursa Economia e Ciência Política pela Universty of London, London School of Economics.