Tradução automática funciona?
28 abr 2023A tradução automática (em inglês, machine translation) está se desenvolvendo rapidamente. Mas, afinal, ela é confiável? Já dá para usar nas comunicações corporativas? Vou discutir esse tema neste artigo.
A tradução automática é executada por um software apoiado por diversos tipos de processadores e servidores, que executam tarefas como armazenamento de dados, comunicação e a tradução propriamente dita. Está consagrado pelo uso o termo em inglês “engine” (“motor” em português) para se referir a esse tipo de sistema. Assim, o sistema de tradução automática do Google, por exemplo, é chamado de “Google machine translation engine”, ou “motor de tradução automática do Google”. Eu não gosto do termo “motor” para identificar uma ferramenta de software, por isso usarei aqui a palavra “máquina” para esse fim.
A análise que faço aqui é baseada na máquina de tradução automática do Google, que é a mais utilizada atualmente.
Antes de começar, lembro que a tradução automática normalmente é feita por máquinas de acesso público, com sistemas de inteligência artificial que têm capacidade de aprender com o uso. Quanto mais pessoas usam uma determinada máquina de tradução e corrigem o resultado, mais rapidamente ela aprende. O Google Translate, por exemplo, é usado por milhões de pessoas todos os dias. Por isso, essa ferramenta evolui muito rapidamente. Eu diria que a tradução automática é a aplicação de computadores que mais rapidamente evolui atualmente. Por isso, os exemplos que mostro hoje podem já não valerem para o ano que vem, ou mesmo para daqui a seis meses.
Neste artigo, faço uma avaliação da tradução de português para inglês feita na máquina de tradução automática do Google. A avaliação é feita a partir de quatro critérios: qualidade da tradução, confidencialidade, aplicabilidade e custo.
- Qualidade da tradução
Vamos examinar aqui vários exemplos de tradução automática de português para inglês. Mesmo que você não seja um especialista em inglês, poderá acompanhar tranquilamente a discussão.
Em cada um dos exemplos, apresento uma tabela com o texto original na coluna da esquerda e a tradução feita pela máquina na coluna da direita. Os trechos realçados em amarelo são aqueles que serão discutidos logo depois da tabela. Os trechos sem o realce não serão discutidos, mas eu convido você a ler tudo para fazer sua própria avaliação.
NOTA 1: Para não incorrer em problemas com autores ou proprietários dos textos e para não passar a impressão de que estou promovendo algum produto, vou utilizar somente material antigo, anterior ao ano 2000, como exemplo para tradução.
NOTA 2: Ao longo desta discussão, vou usar o conceito de língua coloquial. Convido você a ler nosso artigo sobre esse assunto .
Vamos, então, aos exemplos.
Exemplo 1
Vamos começar avaliando a tradução automática de um material técnico: um trecho de um guia de comandos do MS-DOS, da década de 1990, que pode ser considerado bastante árido por um leitor que não esteja acostumado com TI. Será um bom teste inicial para a tradução automática:
Vamos traduzir as cinco primeiras linhas usando a máquina de tradução automática:
O resultado é muito bom. Mesmo a primeira linha, onde aparecem as opções do comando, que pode parecer extremamente complicada para nós, não foi danificada pela tradução automática, porque a máquina entendeu que quase nada daquilo tinha que ser traduzido (o que não é tão simples como pode parecer). Os únicos erros foram acrescentar um espaço depois de “/”, que não havia no original, e não traduzir a primeira ocorrência de “arq” (arquivo), que deveria ter sido traduzida como “file”. Veja que, na segunda ocorrência de “arq”, a máquina, corretamente, traduziu a palavra como “file”, mas na primeira ocorrência foi mantida a palavra “arq”.
Fora esses dois detalhes, o texto traduzido está perfeito. Poderia ser utilizado em inglês exatamente como foi escrito pela máquina. Isso mostra que a máquina de tradução automática funciona muito bem para textos técnicos de TI.
Uma revisão final é necessária, para corrigir alguns problemas. Mas a qualidade da tradução é boa.
Exemplo 2
Vamos agora experimentar com um texto técnico de mecânica: um manual de desmontagem de um motor.
Esta é a tradução feita pela máquina:
A tradução é muito boa. Pode ser utilizada dessa forma. Nesse caso, não houve qualquer erro.
Pelos exemplos vistos, podemos afirmar que a tradução automática funciona bem para textos técnicos, requerendo apenas uma revisão final.
Isso tem uma explicação: apesar da terminologia de um texto técnico ser muito específica, a estrutura do texto em si é bastante simples e convencional. Todas as sentenças têm sujeito e predicado explícitos e colocados na ordem normal (sujeito primeiro e predicado depois), não há duplo sentido oculto nas frases e não se utilizam gírias ou expressões idiomáticas. O texto técnico tem um estilo de linguagem muito simples. Se a máquina de tradução estiver alimentada com a tradução das palavras técnicas, ela vai conseguir traduzir bem. Como já se traduziram milhares e milhares de textos sobre esses assuntos, a máquina já conhece o vocabulário, por isso funciona bem.
Podemos então registrar isso:
A tradução automática produz bom resultado em textos que têm estrutura simples e convencional, como os textos técnicos. No entanto, uma revisão é necessária.
Bem, agora temos que testar a máquina em um texto que não seja puramente técnico. Se isto fosse um estudo exaustivo, testaríamos agora com textos jornalísticos, jurídicos, médicos etc. Mas a proposta aqui é fazer uma avaliação rápida. Vou, então, escolher apenas um estilo que é muito diferente do texto técnico, e que tem um papel central nos negócios hoje: o texto de marketing. Para isso, selecionei uma série de anúncios publicitários.
Seguindo a diretriz explicada na NOTA 1, os anúncios escolhidos como exemplo são anteriores ao ano 2000.
Vamos a eles.
Exemplo 3
A máquina da tradução automática fez um bom trabalho. Não há erros de tradução. No entanto, há uma diferença importante em relação aos exemplos anteriores. O estilo do texto traduzido é ruim. Por exemplo, a frase “Aproveite que a Chevrolet acaba de lançar…” foi traduzida como “Enjoy that Chevrolet has just launched…”. Essa tradução não poderia ser utilizada assim como está. Um tradutor humano teria que reescrever isso.
O que esse texto tem de diferente do texto técnico? A principal diferença é que a linguagem é mais coloquial. A máquina de tradução consegue escrever muito bem na linguagem formal de um manual técnico, mas ela não escreve bem na linguagem coloquial.
Podemos então registrar:
Em textos onde a linguagem é coloquial, o texto traduzido por máquina pode ter um estilo ruim, sendo necessária uma reescrita por parte de um profissional.
Além disso, esse exemplo mostra um outro tipo de problema. O texto tem a expressão idiomática “tirar o doce da criança”, para a qual a máquina de tradução teria que buscar uma expressão equivalente em inglês. No entanto, ela simplesmente traduziu literalmente: “remove the candy from the child”. A tradução não está errada, mas, para um leitor de inglês nativo, essa frase simplesmente vai parecer uma bobagem sem propósito.
Antes de registrar essa observação, vamos ver o exemplo seguinte.
Exemplo 4
Aqui, vamos a anúncio de uma bebida láctea infantil que dava brindes para as crianças. Vejamos a tradução automática:
A máquina não entendeu que “pintando o sete” é uma expressão idiomática com o sentido de fazer bagunça. Ela traduziu isso literalmente como “painting the seven”, algo absolutamente incompreeensível para um leitor de língua inglesa.
Esse exemplo, juntamente com o exemplo 3, nos permitem fazer este registro:
Em uma expressão idiomática, na qual as palavras ou frases assumem significados diferentes do que teriam isoladamente, a tradução automática pode não entender que há uma expressão idiomática e traduzir literalmente, perdendo-se o sentido do original.
Esse exemplo mostra também outro problema que ocorre na tradução automática: no título do anúncio, a máquina simplesmente errou, inexplicavelmente, ignorando a palavra “giz”. A tradução de “COLEÇÃO GIZ DE CERA” ficou sendo “WAX COLLECTION”, que significa simplesmente “COLEÇÃO DE CERA”.
Vamos para o próximo exemplo, onde ocorre algo parecido com isso.
Exemplo 5
Aí vemos o garoto-propaganda mais famoso da história da publicidade brasileira, Carlos Moreno, que personificou o BomBril durante décadas (segunda a Wikipedia, entre 1978 e 2019, ele gravou 344 comerciais para a Bombril). Neste anúncio, ele fala de um amaciante de roupas. Vejamos a tradução automática:
A máquina de tradução traduziu “toca” como “bedroom”, ou seja, como quarto de dormir. É um erro sem explicação.
Registremos isso, que inclui o que vimos no exemplo 4:
A tradução automática pode simplesmente errar a tradução de uma palavra qualquer, ou suprimir uma palavra, o que exige que qualquer tradução feita por máquina seja revisada.
Exemplo 6
Este anúncio foi parte da campanha de lançamento da cerveja mexicana Corona no Brasil, na década de 90. Vejamos como se sai a máquina de tradução com esse texto:
Em geral, o texto está traduzido corretamente, embora com um estilo ruim, que requer reescrita. Mas o título foi traduzido errado.
O título original sugere que o leitor assista a guerra das cervejas brasileiras usando um sombrero. A tradução automática entendeu que era para assistir à guerra brasileira das cervejas que usam sombrero (Watch the Brazilian sombrero beer war).
Na verdade, se aplicarmos somente lógica a essa frase, ambas interpretações são válidas: “Assistir de sombrero” ou “cervejas brasileiras de sombrero”. No entanto, ao ler isso em português, um leitor brasileiro, que sabe que cervejas não usam sombrero, vai entender que “de sombrero” se refere a “assistir”. Mas o computador não percebeu isso e traduziu errado.
Vejamos o próximo exemplo, que é um caso parecido.
Exemplo 7
Aqui temos o anúncio da caminhonete Ford F-1000, também publicado na década de 90. Vejamos a tradução feita pela máquina:
O texto do anúncio é extenso, em linguagem bastante formal. As frases utilizam sempre a ordem direta e não há expressões idiomáticas. A tradução ficou satisfatória em geral, com alguns erros:
- A palavra “garra” é uma gíria que a máquina de tradução não entendeu, e traduziu de forma bastante estranha (drive)
- A expressão “Bom de campo” é uma frase cujo predicado não é explícito, pois a frase não tem verbo. A máquina traduziu também sem verbo (good country), errando a tradução. Se a frase estivesse completa (Por exemplo, “O F-1000 é bom de campo”), provavelmente a máquina traduziria melhor.
- O título do anúncio, “0 PICK-UP QUE LEVA SEU JEITO”, foi traduzido como “0 PICK-UP THAT TAKES ITS WAY”. Aí há vários erros, como a não tradução do artigo inicial “O”, mas eu vou focar no mais importante: o pronome possessivo “seu” refere-se ao pronome pessoal “você”, ou seja, ao leitor. A intenção do texto é dizer que o produto leva o jeito do leitor. Mas a máquina de tradução entendeu que “seu” se refere ao pronome pessoal “ele”, ou seja, ao F-1000. A tradução ficou completamente errada, afirmando que o pick-up toma seu próprio caminho.
- O mesmo erro se repetiu no final, quando o texto diz “sua marca”. O texto afirma que o produto tem nele a marca do leitor. A máquina de tradução entendeu que se tratava da marca do próprio produto, ou seja, este seria um produto com uma marca dele (its brand).
Esse exemplo cai no mesmo caso do exemplo anterior: uma certa frase tem duas interpretações possíveis, e a escolha correta depende de fatores culturais e da vivência com a linguagem. Um leitor humano vai entender que “seu jeito” é o jeito dele, leitor. No entanto, a máquina não entendeu dessa forma e traduziu errado.
Vamos registrar isso, que vale para este exemplo e para o exemplo anterior:
Quando uma frase admite mais que uma interpretação, a correta compreensão depende do conhecimento do contexto, da cultura do país e da vivência com a linguagem. A tradução automática pode escolher a interpretação errada.
Exemplo 8
Em geral, o texto foi corretamente traduzido, embora com um estilo muito pobre, como nos casos anteriores de texto de marketing. No entanto, o título “Dá o maior refresco na sua sede”, que usa uma linguagem bastante coloquial, foi traduzido como “It gives the greatest refreshment at its headquarters”. Aí há vários erros graves:
- A máquina entendeu que “sede” tem o sentido de “lugar central”, como a sede de um clube ou de uma empresa”, traduzindo isso para “headquarters” (literalmente, “quartel general”);
- Da mesma forma que no exemplo anterior, o pronome possessivo “sua” foi entendido como referindo-se ao produto e não ao leitor. Daí a tradução ser “its headquarters”.
- “Dá o maior refresco” não foi entendida com uma expressão idiomática em linguagem coloquial, sendo traduzida literalmente como “It gives the greatest refreshment”, algo que, simplesmente nunca seria dito numa conversa normal.
Temos aí o mesmo caso dos dois exemplos anteriores, onde a falta de contexto cultural e de vivência com a linguagem levou a máquina a fazer uma interpretação que, embora admissível pela lógica e pela gramática, é errada.
Além disso, esse exemplo traz, na frase final do texto, um tipo diferente de problema. O original em português faz um jogo de palavras de duplo sentido, ao dizer “Dá gosto ter Arisco em casa”, que é uma expressão idiomática com o sentido de “É um prazer ter Arisco em casa”, mas que também pode ser entendido literalmente, sugerindo que ter Arisco em casa dá gosto nas comidas.
Desta vez, a máquina entendeu a expressão idiomática e traduziu como “It is a pleasure to have Arisco at home”. Mas ela não viu que a tradução literal também tinha um sentido importante, que foi perdido. Isso não é propriamente um erro, mas é algo que não deve acontecer em uma tradução de marketing. O tradutor tem que reproduzir na tradução todos os sentidos que o texto original carrega. Isso pode ser extremamente difícil em certos casos (como este) mas deve ser buscado.
Registremos mais esta observação:
Em textos com duplo sentido, a tradução automática provavelmente vai traduzir com um único sentido, o que pode tirar a força da mensagem.
Exemplo 9
Aqui vemos um anúncio de um brinquedo produzido pela tradicional fábrica brasileira Estrela, também dos anos 90. Vejamos a tradução automática:
A tradução é razoável, embora, novamente, com um estilo ruim. No entanto, há dois erros importantes:
- A palavra “brincadeira” foi erroneamente traduzida como “joke”, ou seja, “piada”.
- Na primeira ocorrência de “Estrela”, a máquina entendeu que isso era um nome próprio e não traduziu a palavra. No entanto, na segunda ocorrência dessa mesma palavra, a máquina a traduziu.
Por quê essa discrepância em relação a “Estrela”?
O que acontece é que a máquina identifica palavra iniciadas com maiúscula como nomes próprios, o que ela fez corretamente na primeira ocorrência. No entanto, a segunda ocorrência veio em uma frase em que várias outras palavras também estavam iniciando em maiúsculas (Segure a Mamma da Estrela). Nesse caso, a máquina entendeu que a as palavras estariam em maiúscula por esta frase ser um título, e essa regra prevaleceu sobre a anterior. Daí, a máquina traduziu “Estrela”.
Vamos registrar isso:
Quando duas regras se aplicam ao mesmo trecho de texto (por exemplo: “se a palavra começa com maiúscula, é um nome próprio” e “se as palavras começam com maiúscula, a frase é um título”), a máquina pode não conseguir aplicar as duas ao mesmo tempo. Ela escolhe uma das regras, o que pode levar a um erro com relação à outra.
Mas, aqui cabe a pergunta: se a máquina já tinha acertado na primeira ocorrência de “Estrela”, mesmo assim ela errou na segunda? Ela já não sabia que aquilo era um nome próprio?
Aparece aí um novo problema para nossa lista: a tradução automática (por enquanto) só olha para a frase que está traduzindo no momento. Ela (ainda) não tem capacidade de contextualizar a frase em relação ao texto inteiro. Mesmo já tendo entendido a palavra como nome próprio anteriormente, ela não levou isso em conta ao traduzir a nova frase. Ela só olha para a frase que está traduzindo em cada momento.
Registremos mais essa:
A tradução automática não leva em conta outras frases do mesmo texto ao traduzir uma determinada frase, ou seja, ela não consegue contextualizar a frase dentro do texto.
Bem, terminamos aqui os exemplos. Vamos resumir tudo que registramos:
- A tradução automática produz bom resultado em textos com estrutura simples e convencional, como os textos técnicos.
- A tradução automática sempre tem que ser revisada, pois a máquina pode cometer erros.
- A tradução automática não contextualiza a frase dentro do texto.
- Em linguagem coloquial, a tradução automática pode ter um estilo ruim. Se isso ocorrer, será preciso que um tradutor humano reescreva o texto.
- A máquina de tradução pode não entender uma expressão idiomática e traduzir literalmente, perdendo-se o sentido original.
- Quando uma frase admite mais que uma interpretação, a correta compreensão depende do conhecimento do contexto cultural e da vivência com a linguagem. A tradução automática pode escolher a interpretação errada.
- Quando um trecho de texto tem duplo sentido, a tradução automática geralmente vai traduzir com um único sentido.
- Quando duas regras se aplicam ao mesmo trecho de texto (por exemplo, como tratar palavras iniciadas com maiúscula), a máquina pode não conseguir aplicar as duas ao mesmo tempo. Ela escolhe uma das regras, o que pode levar a um erro com relação à outra.
Com isso terminamos nossa avaliação de qualidade da tradução automática. Quero deixar claro que meu objetivo não é falar mal dessa ferramenta. Na realidade, como eu já disse anteriormente, a tradução automática está evoluindo muito rapidamente e já apresenta resultados surpreendentemente bons. No entanto, ainda não é possível eliminar a intervenção humana no processo.
Lembro que estamos avaliando a máquina de tradução do Google para o par de idiomas português>inglês. Outras máquinas, com outros pares de idioma, podem ter resultados diferentes. A própria máquina do Google, no par de idiomas inverso, ou seja, inglês>português, tem uma qualidade melhor de tradução. Os problemas vistos aqui também ocorrem com inglês>português, porém com menor incidência. Isso porque a imensa maioria das traduções feitas hoje no mundo têm o inglês como idioma de origem, levando a um aprendizado maior da máquina nas traduções que partem daquele idioma.
Vamos agora para os próximos critérios de avaliação.
2. Confidencialidade
Em qualquer máquina de tradução automática, o texto é enviado ao sistema de um provedor de serviço para ser traduzido. Isso significa que o texto viaja pela internet e é armazenado e processado nos computadores de outra empresa. Tecnicamente, nada impede que alguém naquela empresa use o texto para qualquer finalidade, ou que um hacker intercepte a comunicação. Na prática, os usuários no mundo todo confiam nesses provedores de serviço e acreditam que sua comunicação não vai ser interceptada por hackers, mas é importante entender esse processo e seus riscos inerentes. Se um tradutor assina um contrato de confidencialidade com um cliente e pretende usar tradução automática, ele deve revelar isso ao cliente. Se não o fizer, estará rompendo o contrato assinado.
3. Aplicabilidade
A ferramenta de tradução automática hoje disponibilizada gratuitamente pelo Google funciona de uma forma muito rudimentar: o usuário cola o texto original numa caixa de texto e a máquina escreve a tradução numa caixa ao lado. Para pequenos volumes, isso funciona bem. No entanto, se o objetivo é traduzir grandes volumes, ou traduzir arquivos com formatos sofisticados, como manuais, website, folhetos de marketing ou contratos, esse processo é extremamente ineficiente e sujeito a erros, pois o usuário teria que colar frase por frase no Google, copiar a tradução e colar no arquivo original.
Para serviços mais profissionais, é preciso usar ferramentas de software que fazem a interface entre o tradutor e a máquina de tradução, introduzindo automaticamente a frase traduzida no documento, de forma a viabilizar a revisão e finalização do serviço. Por isso, hoje, mesmo existindo a tradução automática num estágio bastante avançado, é preciso a assistência de um profissional ou de uma agência de tradução para chegar a um documento traduzido satisfatoriamente.
4. Custo
Para pequenos textos, a tradução automática pelo Google Translate é gratuita. Já, para uso em grande volume, como ocorre em uma empresa de traduções, onde se usam ferramentas de software como interface entre o tradutor e a máquina de tradução, há um custo por palavra. Hoje esse custo está na faixa de menos que um centavo de dólar por palavra.
5. Conclusão
A tradução automática, apesar de estar bastante avançada e ter um custo muito baixo, ainda não pode ser usada para simplesmente substituir um profissional humano, pois a saída não tem a qualidade necessária. No entanto, grande parte do que ela faz pode ser aproveitada. Assim, adota-se hoje uma solução mista: roda-se a tradução automática para obter uma tradução inicial muito barata, e, em seguida, paga-se a equipe normal de tradutores para corrigir/refazer o trabalho. Como os profissionais já partem de algo aproveitável, o custo do trabalho é menor.
Dependendo do tipo de texto, a redução de custo por uso de tradução automática pode ser mais ou menos significativa:
- Para textos informativos onde a linguagem é formal e a estrutura do texto é simples e convencional, como em documentos técnicos, jornalístico ou jurídicos, a tradução automática é bastante aproveitável, resultando em uma redução de custo significativa.
- Para materiais de marketing, onde a linguagem é coloquial e a mensagem institucional é importante, a tradução automática pode requerer um retrabalho muito grande, cujo custo pode ser igual ao da tradução tradicional. Nesse caso, pode nem ser vantajoso o uso dessa ferramenta. É preciso avaliar caso a caso para decidir se vale a pena ou não usá-la.
Além disso, cada empresa, antes de usar tradução automática, ou permitir que seu fornecedor de traduções use, deve avaliar o impacto da inevitável perda de confidencialidade.
6. Para terminar
Esta análise foi feita usando o Google Translate com par de idiomas português-inglês. Usando outras ferramentas, com outros pares de idiomas, os resultados podem ser simplesmente bizarros. Um caso emblemático são as traduções no site de compras chinês AliBaba. Ali, procurando máscaras contra o coronavírus, me deparei com esta pérola:
Máscaras descartáveis prático lavável
Boca-Máscara Anti Haze Máscaras anti-pó
Boca boca à prova de Máscaras
Características: Boa permeabilidade, fácil de respirar. Tecido-não-tecido máscaras para os itens de uma vez, fáceis de usar, relevantes e fazer o tratamento de depuração. Pode ser usada para comida, médicos, farmacêuticos, eletrônicos,…
Desta vez, deixo para você os comentários.
Marcos Chiquetto is an engineer, Physics teacher, translator, and writer. He is the director of LatinLanguages, a Brazilian translation agency specialized in providing multilingual companies with translation into Portuguese and Spanish.