A Meta está diversificando seu rol de soluções em inteligência artificial por meio do lançamento do SeamlessM4T. Este é um modelo de processamento de linguagem que tem a habilidade de transcrever os discursos, bem como traduzir os conteúdos falados em quase cem línguas distintas. A iniciativa é de acesso livre para estudiosos, seguindo o mesmo padrão dos mais recentes produtos inteligentes criados pela empresa do famigerado Mark Zuckerberg.
A gigante tecnológica declara que o surgimento desse novo modelo simboliza uma “transformação de grande impacto” no âmbito da inteligência artificial. E diz-se isso ainda mais nas versões voltada para a conversão da fala em texto e a tradução de discursos. Essa é uma representação com abordagem inédita por parte da empresa. A intenção certamente é construir uma ferramenta que seja capaz de reunir variedades linguísticas de todas as partes do globo em um serviço único.
Diferencial dessa nova inteligência artificial da Meta
O diferencial que sobressai nesta inteligência artificial em comparação a outras proposições é sua aptidão para executar múltiplos procedimentos de tradução, assim como da transcrição — texto a texto, fala a fala, fala a texto e identificação de fala — dentro de um único sistema. Além do mais, o algoritmo tem a capacidade de reconhecer quando alguém utiliza mais de dois idiomas na mesma frase.
O SeamlessM4T — ou Tradução Automática Multilíngue e Multimodal Contínua (“Seamless Massively Multilingual and Multimodal Machine Translation”, em inglês) — é tido um “sucessor” do Universal Speech Translator. Esse é um dos modelos raros de conversão da fala para o texto que oferece suporte à língua hokkien, falada em toda a região do Sudeste Asiático.
Essa inovadora tecnologia é embasada na plataforma Massively Multilingual Speech da Meta. O sistema viabiliza a identificação de fala, detecção de idioma e síntese vocal em mais de 1.100 línguas diferentes. Para procedimentos de conversão da fala para a fala e do texto para a fala, o SeamlessM4T consegue identificar cem línguas de origem e as transforma em 35 línguas distintas de destino.
Paralelamente à divulgação do SeamlessM4T, a companhia também liberou metadados relativos ao conjunto dos dados da tradução aberto denominado “SeamlessAlign”. Este compreende mais de 270 mil horas de alinhamento entre texto e fala. O algoritmo de inteligência artificial já está acessível para a comunidade de desenvolvedores e pesquisadores.
Moderação do conteúdo nos mais diversos idiomas
A Meta enxerga que essa tecnologia possui uma potencialidade considerável na área de moderação do conteúdo nas plataformas de mídia social. Quando se trata dos dialetos menos comuns, a empresa pode direcionar menos recursos humanos para a supervisão na plataforma — muitas vezes, essa incumbência é automatizada. Entretanto, essa abordagem pode abrir brechas para a disseminação desinibida de discursos inadequados. O SeamlessM4T, inserido nesse contexto, demonstraria uma eficácia maior na identificação de expressões ofensivas em todas as línguas.
A companhia afirma ter desenvolvido um sistema com a capacidade de reconhecer termos sensíveis. Na visão da empresa, “palavras tóxicas” são situações onde a tradução pode potencialmente “instigar ódio, violência, linguagem vulgar ou abuso”. O propósito dessa tecnologia é rastrear o surgimento de discursos inadequados por meio da análise da tradução resultante de uma postagem, como exemplo, no Facebook.



