Acesse o menu principal
Blog do Google Brasil

Tradutor

Google Tradutor adiciona mais de 110 idiomas e faz sua maior expansão até hoje

Gif com a ilustração das 110 línguas que estão disponíveis no Tradutor

O Google Tradutor quebra barreiras linguísticas e ajuda todos a se conectarem a comunidades ao redor do mundo. Aplicamos constantemente as mais recentes tecnologias para que mais pessoas possam ter acesso à ferramenta. Em 2022, adicionamos 24 novos idiomas usando a tradução automática Zero-Shot, na qual um modelo de aprendizado de máquina aprende a traduzir para outro idioma sem nunca ter visto um exemplo antes. Também anunciamos a iniciativa dos 1.000 idiomas, um compromisso de construir modelos de Inteligência Artificial que promovam a inclusão de bilhões de pessoas que vivem em diferentes comunidades no planeta.

Agora, estamos usando a IA para expandir a variedade de idiomas que oferecemos. Graças ao nosso grande modelo de linguagem PaLM 2, estamos adicionando 111 novos idiomas ao Google Tradutor, a nossa maior expansão até hoje.

Gif mostra a experiência do Google Tradutor em diversas línguas

A tradução chega agora a mais de 500 milhões de pessoas

Do Cantonês (China) ao Q'eqchi (México e Belize), estas novas línguas representam mais de 660 milhões de falantes, o que significa traduções para cerca de 8% da população mundial, presentes em diversas regiões. Algumas são as principais línguas do mundo, com mais de 100 milhões de falantes e outras são faladas por pequenas comunidades indígenas - algumas quase não têm falantes nativos, mas há esforços ativos para recuperá-las. Cerca de um quarto das novas línguas vêm da África, representando a nossa maior expansão de línguas africanas até hoje. São elas: Fon, Kikongo, Luo, Ga, Swati (ou Swazi), Venda e Wolof.

Abaixo estão alguns dos idiomas que agora são compatíveis com o Google Tradutor:

  • Afar: é a língua tonal falada em Djibuti, Eritreia e Etiópia. De todos os idiomas incluídos neste lançamento, Afar foi o que recebeu mais contribuições da comunidade voluntária.
  • Cantonês: há muito tempo é um dos idiomas mais solicitados para inclusão no Google Tradutor. No entanto, é uma linguagem difícil de incorporar porque muitas vezes se sobrepõe ao mandarim na escrita, dificultando a localização de dados e o treinamento de modelos.
  • Manês: é a língua celta da Ilha de Man. Quase desapareceu com a morte do seu último falante nativo em 1974. Mas, graças a um movimento de revitalização em toda a ilha, agora existem milhares de falantes.
  • N'Ko: é uma forma padronizada das línguas Mandinka da África Ocidental, que unifica muitos dialetos em uma língua comum. Seu alfabeto único foi inventado em 1949 e atualmente conta com uma comunidade de pesquisa ativa, desenvolvendo recursos e tecnologias para ele.
  • Punjabi (Shahmukhi): é o tipo de escrita do alfabeto perso-árabe (Shahmukhi) e a língua mais falada no Paquistão.
  • Tamazight: é a língua berbere falada em todo o Norte da África. Embora existam muitos dialetos, a forma escrita geralmente é compreensível para todos. Está escrito no alfabeto latino e em Tifinagh, ambos compatíveis com o Google Tradutor.
  • Tok Pisin: é uma língua crioula baseada no inglês e na língua franca de Papua Nova Guiné. Se você fala inglês, tente traduzir para Tok Pisin e poderá entender o significado!

Como escolhemos as variedades de idioma

Há muitos fatores a serem considerados ao adicionar novos idiomas ao Tradutor, desde as variedades que oferecemos até as grafias específicas que usamos.

Os idiomas têm uma grande quantidade de variações: variedades regionais, dialetos e diferentes regras ortográficas. Na verdade, muitos idiomas não possuem um padrão único, por isso é impossível escolher uma variedade “correta”. Nossa abordagem tem sido priorizar as variedades mais utilizadas de cada idioma. Por exemplo, o Romani é uma língua com muitos dialetos em toda a Europa. Nossos modelos geram texto o mais próximo possível do Romani (Vlax) do Sul, uma variante frequentemente usada na Internet. No entanto, também mistura elementos de outros, como o Romani (Vlax) do Norte e o Romani Balcão.

Graças às nossas parcerias com linguistas especializados e falantes nativos, continuamos a fazer grandes progressos neste campo. À medida que a tecnologia avança, continuaremos a apoiar cada vez mais variedades gramaticais e regras ortográficas.

Visite a Central de Ajuda para saber mais sobre os novos idiomas disponíveis. Comece a traduzir em https://translate.google.com.br/ ou no aplicativo Google Tradutor para Android e iOS.