A Meta está diversificando seu rol de soluções em inteligência artificial por meio do lançamento do SeamlessM4T. Este é um modelo de processamento de linguagem que tem a habilidade de transcrever os discursos, bem como traduzir os conteúdos falados em quase cem línguas distintas. A iniciativa é de acesso livre para estudiosos, seguindo o mesmo padrão dos mais recentes produtos inteligentes criados pela empresa do famigerado Mark Zuckerberg.
A gigante tecnológica declara que o surgimento desse novo modelo simboliza uma “transformação de grande impacto” no âmbito da inteligência artificial. E diz-se isso ainda mais nas versões voltada para a conversão da fala em texto e a tradução de discursos. Essa é uma representação com abordagem inédita por parte da empresa. A intenção certamente é construir uma ferramenta que seja capaz de reunir variedades linguísticas de todas as partes do globo em um serviço único.
Diferencial dessa nova inteligência artificial da Meta
O diferencial que sobressai nesta inteligência artificial em comparação a outras proposições é sua aptidão para executar múltiplos procedimentos de tradução, assim como da transcrição — texto a texto, fala a fala, fala a texto e identificação de fala — dentro de um único sistema. Além do mais, o algoritmo tem a capacidade de reconhecer quando alguém utiliza mais de dois idiomas na mesma frase.
O SeamlessM4T — ou Tradução Automática Multilíngue e Multimodal Contínua (“Seamless Massively Multilingual and Multimodal Machine Translation”, em inglês) — é tido um “sucessor” do Universal Speech Translator. Esse é um dos modelos raros de conversão da fala para o texto que oferece suporte à língua hokkien, falada em toda a região do Sudeste Asiático.
Essa inovadora tecnologia é embasada na plataforma Massively Multilingual Speech da Meta. O sistema viabiliza a identificação de fala, detecção de idioma e síntese vocal em mais de 1.100 línguas diferentes. Para procedimentos de conversão da fala para a fala e do texto para a fala, o SeamlessM4T consegue identificar cem línguas de origem e as transforma em 35 línguas distintas de destino.
Paralelamente à divulgação do SeamlessM4T, a companhia também liberou metadados relativos ao conjunto dos dados da tradução aberto denominado “SeamlessAlign”. Este compreende mais de 270 mil horas de alinhamento entre texto e fala. O algoritmo de inteligência artificial já está acessível para a comunidade de desenvolvedores e pesquisadores.
Moderação do conteúdo nos mais diversos idiomas
A Meta enxerga que essa tecnologia possui uma potencialidade considerável na área de moderação do conteúdo nas plataformas de mídia social. Quando se trata dos dialetos menos comuns, a empresa pode direcionar menos recursos humanos para a supervisão na plataforma — muitas vezes, essa incumbência é automatizada. Entretanto, essa abordagem pode abrir brechas para a disseminação desinibida de discursos inadequados. O SeamlessM4T, inserido nesse contexto, demonstraria uma eficácia maior na identificação de expressões ofensivas em todas as línguas.
A companhia afirma ter desenvolvido um sistema com a capacidade de reconhecer termos sensíveis. Na visão da empresa, “palavras tóxicas” são situações onde a tradução pode potencialmente “instigar ódio, violência, linguagem vulgar ou abuso”. O propósito dessa tecnologia é rastrear o surgimento de discursos inadequados por meio da análise da tradução resultante de uma postagem, como exemplo, no Facebook.
Desta forma, o sistema se apresenta como uma ferramenta fundamental na contenção da propagação de conteúdo prejudicial. Ademais, contribuirá também na promoção de um ambiente online mais seguro e respeitoso para todos os usuários, independentemente do idioma que utilizam.
Detecção do gênero
O SeamlessM4T também possui a capacidade de discernir variações do gênero, conforme com a Meta. O modelo de inteligência artificial é capaz de quantificar essas diferenças nas traduções, por exemplo, identificando casos em que uma frase inclui uma forma de gênero para uma palavra, como “médico” ou “médica”, na língua portuguesa.
Ao detectar essas nuances linguísticas, o modelo pode introduzir um pronome feminino em uma língua de destino. É onde a gramática não contemplará uma variação de gênero correspondente e manterá um substantivo na forma masculina, se necessário.
Essa inteligência artificial apresenta um desempenho particularmente eficaz em tarefas relacionadas a idiomas. A Meta, empresa por trás do Facebook, Instagram e WhatsApp, reconhece essa característica e, portanto, lançou recentemente o modelo SeamlessM4T, capaz de traduzir e transcrever quase 100 línguas.
Atuação da inteligência artificial
O SeamlessM4T atua tanto no âmbito do texto quanto da linguagem, oferecendo diversas possibilidades:
- Tradução de fala para texto para quase 100 idiomas de entrada e saída;
- Tradução de fala para fala para quase 100 idiomas de entrada e 36 de saída;
- Reconhecimento de fala para quase 100 idiomas;
- Tradução de texto para texto para quase 100 idiomas;
- Tradução de texto para fala para quase 100 idiomas de entrada e 35 de saída.
Para conceber esse modelo, a Meta afirma ter coletado bilhões de frases escritas e quatro milhões de horas de fala disponíveis publicamente na internet.