Você fala em português. A pessoa responde em chinês. E as duas se entendem mesmo sem um intérprete para ajudar. A conversa acontece normalmente, com cada uma falando seu respectivo idioma. Essa é uma possibilidade que tem ganhado forma com avanço de recursos de inteligência artificial aplicados à voz.
Um dos lançamentos mais recentes veio do Google. A empresa incorporou ao aplicativo de videochamadas Meet uma ferramenta de inteligência artificial capaz de realizar traduções simultâneas em reuniões. Com alguns cliques, o usuário pode falar em um idioma, mas ser ouvido pelos participantes daquela chamada em outro (e vice-versa).
- IA em processos seletivos: como preparar seu currículo para ser lido por algoritmos
A novidade foi apresentada durante a conferência Google I/O, que aconteceu há duas semanas. Desde então, vídeos da ferramenta funcionando viralizaram nas redes sociais. O GLOBO testou o sistema em uma chamada real e mostra, nesta edição, como é a experiência — o que impressiona, onde escorrega e o que ainda está por vir.
Por enquanto, o recurso está disponível apenas em inglês e espanhol, mas a promessa é de que novos idiomas sejam incluídos em breve, inclusive o português.
O teste foi feito com Camila Zoé Frias, head de comunicação do Google Cloud na América Latina e uma das porta-vozes do vídeo que viralizou na internet (veja abaixo). Na conversa, além de demonstrar o recurso, ela explicou melhor como a tecnologia funciona.
A tradução simultânea de voz por inteligência artificial do Google Meet foi criada para ser tão simples como outros comandos da ferramenta. O recurso fica na parte inferior da tela em um botão chamado de “tradução de discurso”. Ao clicar, o usuário escolhe entre as opções de idioma que quer falar ou “não me traduza”, para manter a voz original. Logo abaixo, está a segunda opção: para selecionar o idioma em que quer escutar ou ativar a opção “discurso original”, para ouvir sem intervenção da IA.
Durante a chamada, conversei em inglês e espanhol. Primeiro, eu ouvi a Camila (que fala espanhol) conversando comigo em inglês a partir da IA. A ferramenta começa com alguns poucos segundos de atraso em relação à fala original, mas nada muito diferente daquela pequena pausa que tradutores humanos costumam fazer.
A voz gerada pela IA não é exatamente igual a original, mas o sistema impressiona por reproduzir o tom e as pausas originais, com uma entonação que lembra a da pessoa e faz a tradução soar natural. Ela falou alguns minutos enquanto eu respondia em inglês, sem a tradução.
Aqui, vale notar que nossa conversa foi pausada. Eu falava, esperava ela responder, e então entrava na conversa de novo. Como na demonstração pública feita pelo Google, o sistema realmente é capaz de manter uma conversa fluida (embora não cheia de interrupções ou sobreposições de fala). Mas como a IA é tão rápida na hora de traduzir? Uma das explicações é o fato do sistema funcionar de áudio para áudio, sem precisar converter a fala para texto antes de traduzir e retornar com áudio.

Testamos a IA do Google que traduz reuniões no Meet em tempo real; veja o resultado
Na segunda parte do teste, foi a minha vez de falar em inglês (para o sistema traduzir para o espanhol na reunião). Quem está sendo “traduzido” não escuta a própria voz gerada pela inteligência artificial. Por isso, gravamos a chamada para que eu pudesse ver o resultado da minha versão IA que fala espanhol. A IA reproduziu as pausas da minha fala, as hesitações e até a entonação. A sensação é mesmo de que “falei” espanhol como alguém fluente.
2. Intérprete robô é perfeito?
Alguns pontos do teste merecem atenção. Em um momento eu perguntei para a Camila, em inglês, o que significava o fato de a ferramenta estar em “beta” (ou seja, ainda em testes). Talvez minha pronúncia tenha atrapalhado, mas a verdade é que a IA deslizou: traduziu mal a questão, e minha interlocutora não entendeu a pergunta.
O tropeço mostra que o sistema ainda tem limitações, claro. A Camila explica, inclusive, que o momento atual de lançamento em beta é feito para isso também: testes “no mundo real” e melhorias a partir da avaliação dos usuários. Segundo ela, o sistema também tem desempenho melhor em frases com mais contexto do que em interações curtas:
— Modelos de linguagem de inteligência artificial funcionam com base na previsão da próxima palavra, e esse caso não é diferente. É a partir dessa capacidade preditiva que ele consegue fazer a tradução em tempo real. Então, quanto mais contexto ele tem, melhores e mais precisas são as traduções — explica.
O próprio Google, na página oficial sobre o recurso, alerta que o sistema pode cometer erros de gramática, pronúncia e gênero de palavras. Um alerta, também, é que a qualidade da tradução pode variar conforme a conexão de rede. Para melhorar a experiência, a empresa recomenda: esperar o símbolo de tradução desaparecer da tela do orador antes de responder; reformular frases se a tradução parecer confusa; usar também a legenda com tradução.
E como fica a privacidade? Sua voz vai ser “roubada” para treinar a própria IA? O Google diz que não. Segundo a empresa, nenhum áudio é armazenado e os modelos não são treinados com a voz dos usuários.
3. IA tradutora de reuniões não é para todo mundo
O recurso de tradução simultânea por voz no Google Meet começou a ser liberado, em versão beta, mas somente assinantes dos planos Google AI Pro e Google AI Ultra. Ou seja, não é para todo mundo. O plano Pro custa US$ 19,99 (cerca de R$ 110) por mês. Já o Ultra, criado pelo Google para dar acesso aos sistemas mais avançados de IA da empresa, sai por US$ 249,99 por mês (aproximadamente R$ 1.420).
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2025/r/E/Au4DFbRJG2V4yamB3dyw/whatsapp-image-2025-06-03-at-09.54.41.jpeg)
A funcionalidade deve ficar mais amplamente acessível quando for disponibilizada para empresas que assinam o serviço do Google Workspace, o que deve acontecer até o fim deste ano. A conversa do GLOBO foi feita entre duas pessoas, mas é possível ativar a tradução em reuniões com vários participantes.
Além do Google, vale lembrar também que outras empresas de tecnologia têm investido em sistemas de tradução de reuniões virtuais em tempo real com IA. Quase um ano antes do lançamento do novo recurso no Meet, a Microsoft já havia apresentado o “Interpreter”, sistema de tradução simultânea por voz do Microsoft Teams.
O recurso está disponível em versão de prévia pública (inclusive em português) para usuários com licença Microsoft 365 Copilot, que custa R$110,00 por mês . Assim como o Google, a Microsoft também aposta na simulação de voz — a ferramenta usa inteligência artificial para reproduzir a voz do usuário no idioma traduzido.
Quer saber quais opções gratuitas você tem para “falar” outros idiomas? Na próxima edição te conto sobre como fazer ligações em áudios para IAs (e praticar outra língua) e quais as vantagens, riscos e cuidados ao usar o ChatGPT e sistemas semelhantes para traduzir textos.

