A ferramenta de tradução do Google conta com mais de cem idiomas, e agora passa a englobar a língua Guarani, falada por aproximadamente 9 milhões de pessoas no Brasil, Argentina, Paraguai e Bolívia. Junto à língua indígena, foram acrescentadas outras 23, totalizando 133 idiomas à disposição dos usuários. A novidade foi divulgada durante a Google I/O 2022, conferência anual da empresa para anunciar avanços em suas plataformas e de tecnologias.
A inclusão dos idiomas contribui para romper as barreiras linguísticas e conectar pessoas filiadas a outras culturas, permitindo a interação com populações que falam línguas pouco ou nada representadas no mundo da tecnologia. Ao sistematizar e registrar os idiomas cria-se também a possibilidade de mantê-los vivos.
A atualização foi feita com a participação de falantes nativos, professores, professoras e linguistas usando uma tecnologia inovadora. O Google afirmou que a inclusão desses idiomas representa um grande avanço técnico para a ferramenta uma vez que está utilizando pela primeira vez o mecanismo de tradução automática Zero-Shot, usando apenas textos monolíngues, ou seja, o Google tradutor aprende a traduzir para outro idioma sem jamais ter visto um exemplo.
“Embora essa tecnologia seja impressionante, ela não é perfeita. Continuaremos melhorando nossos modelos para oferecer a mesma experiência que as pessoas já conhecem em traduções de idiomas como espanhol ou alemão, por exemplo”, declarou o Google.
Além do Guarani, foram incluídas outras duas línguas indígenas, o Quechua, falado no Peru, na Bolívia no Equador, e o Aymara, falada por cerca de 2 milhões de pessoas na Bolívia, no Chile e no Peru. Dos idiomas africanos foram incluídos: o Lingala, falado por mais de 45 milhões de habitantes de países da África Central, e o Krio, dialeto do inglês falado pelos habitantes de Serra Leoa.
Confira a lista completa:
- Assamês, falada por cerca de 25 milhões de pessoas no nordeste da Índia
- Aymara, falada por cerca de dois milhões de pessoas na Bolívia, no Chile e no Peru
- Bambara, falada por cerca de 14 milhões de pessoas em Mali
- Bhojpuri, falada por cerca de 50 milhões de pessoas no norte da Índia, no Nepal e em Fiji
- Dhivehi, falada por cerca de 300 mil pessoas nas Maldivas
- Dogri, falada por cerca de três milhões de pessoas no norte da Índia
- Ewe, falada por cerca de sete milhões de pessoas em Gana e no Togo
- Guarani, falada por cerca de sete milhões de pessoas no Paraguai, na Bolívia, na Argentina e no Brasil
- Ilocano, falada por cerca de dez milhões de pessoas no norte das Filipinas
- Konkani, falada por cerca de dois milhões de pessoas na Índia Central
- Krio, falada por cerca de quatro milhões de pessoas em Serra Leoa
- Curdo (Sorani), falada por cerca de oito milhões de pessoas, sobretudo no Iraque
- Lingala, falada por cerca de 45 milhões de pessoas na República Democrática do Congo, na República do Congo, na República Centro-Africana, em Angola e na República do Sudão do Sul
- Luganda, falada por cerca de vinte milhões de pessoas em Uganda e Ruanda
- Maithili, falada por cerca de 34 milhões de pessoas no norte da Índia
- Meiteilon (Manipuri), falada por cerca de dois milhões de pessoas no nordeste da Índia
- Mizo, falada por cerca de 830 mil pessoas no nordeste da Índia
- Oromo, falada por cerca de 37 milhões de pessoas na Etiópia e no Quênia
- Quechua, falada por cerca de dez milhões de pessoas no Peru, na Bolívia no Equador e em países vizinhos
- Sânscrito, falada por cerca de vinte mil pessoas na Índia
- Sepedi, falada por cerca de 14 milhões de pessoas na África do Sul
- Tigrinya, falada por cerca de oito milhões de pessoas na Eritreia e na Etiópia
- Tsonga, falada por cerca de sete milhões de pessoas em Eswatini, Moçambique, África do Sul e no Zimbábue
- Twi, falada por cerca de onze milhões de pessoas em Gana
*Estagiária sob supervisão.
Ouça e acompanhe as edições do podcast DiversEM
Especial: "Bonequinhas": 'Quando se afirma travesti, você e uma travesti inteira'
Ep. 8: Literatura indígena e os cordéis da escritora e poeta Auritha Tabajara