A Microsoft anunciou que implementará inteligência artificial (IA) e redes neurais profundas para melhorar a tradução de idiomas em tempo real para três dos idiomas mais usados no subcontinente - hindi, bengali e tâmil. Espera-se que o uso de redes neurais profundas forneça traduções mais precisas e naturais, o que seria um alívio bem-vindo para quem tentou traduzir um idioma estrangeiro para um idioma indiano, apenas para encontrar traduções estranhas, não naturais e muitas vezes, flagrantemente incorretas.
Em nota divulgada na ocasião, Sundar Srinivasan, Gerente Geral de IA e Pesquisa da Microsoft Índia, disse que “A Microsoft celebra a diversidade de idiomas na Índia e quer tornar a vasta Internet ainda mais acessível. Oferecemos suporte a idiomas indianos na computação por mais de duas décadas e, mais recentemente, fizemos avanços significativos no acesso baseado em voz e na tradução automática em todos os idiomas ”.
Caso você fale algum dos três idiomas mencionados acima e esteja interessado em experimentar as traduções baseadas em IA da Microsoft, você pode ir ao site Bing Translate para ver as traduções baseadas em rede neural da Microsoft em ação. A nova tecnologia também está sendo implementada no aplicativo Microsoft Translator da empresa, disponível para Andriod e iOS. A tecnologia também será usada para melhorar as traduções no Skype, assim como em diversos softwares do Office 365, como Word, Excel, PowerPoint e Outlook.
Eu pessoalmente tentei traduzir o primeiro parágrafo deste artigo para o bengali (usando o Bing Translate), e os resultados foram tão desnorteantes e incompreensíveis quanto qualquer tradução para um idioma indiano jamais foi. Caso você esteja se perguntando como ele se compara ao Google Translate e esteja familiarizado com o bengali, dê uma olhada na comparação lado a lado abaixo. Observe que é uma imagem composta com a tradução do Google à direita e a tradução do Bing na parte inferior.
Embora não pareça haver muita diferença entre os dois neste estágio, o que se deve notar aqui é que, com redes neurais profundas, as traduções provavelmente melhorarão drasticamente com o tempo, porque a tecnologia tem a capacidade de incorporar conta “Conceitos como gênero (feminino, masculino, neutro), nível de polidez (gíria, casual, escrito, formal) e tipo de palavra (verbo, substantivo, adjetivo)”.
No entanto, do jeito que as coisas estão agora, as traduções de e para as línguas indianas continuarão a ser insatisfatórias, apesar do fato de que as 6 principais línguas indianas estão entre as 20 línguas mais utilizadas no mundo. Isso é porque “Não há material suficiente na Internet que possamos usar para treinar o sistema”, de acordo com Krishna Doss Mohan, Gerente de Programa Sênior, Microsoft Índia.
Esperançosamente, com a maior população indiana começando a usar a internet, teremos mais conteúdo vernáculo que deve ajudar a treinar essas redes neurais profundas para fornecer melhores traduções daqui para frente.