Projeto Amplify: Ajudando a construir modelos de IA generativa culturalmente representativos para o Brasil
Minha jornada de pesquisa é dedicada a entender como humanos e máquinas interagem por meio da linguagem escrita, com foco particular em Recuperação da Informação e Processamento de Linguagem Natural. Busco aprimorar métodos que capacitem a tecnologia a interpretar, organizar e gerar texto de forma que seja sensível à diversidade cultural e social.
É com essa convicção que tenho a honra de coordenar no Departamento de Ciência da Computação (DCC) da UFMG a Iniciativa Amplify — "Avançando Aplicações de Inteligência Artificial Generativa no Contexto Brasileiro" — uma parceria com o Google Research. Nosso objetivo é ajudar a trazer maior pluralidade e representatividade linguística e social do português brasileiro para os modelos de inteligência artificial.
Hoje, os Modelos de Linguagem de Grande Escala (LLMs) globais ainda mostram lacunas significativas em relação aos aspectos e nuances linguísticas e culturais de comunidades locais. Eles são tipicamente treinados em um número limitado de idiomas, geralmente o inglês, e em realidades do Norte Global. O projeto busca ativamente preencher essas lacunas de informação e aumentar a representatividade da cultura brasileira, pois acreditamos que os modelos de IA devem ser éticos, transparentes e sensíveis às diferenças sociais e culturais.
Nosso objetivo é criar conjuntos de dados de alta qualidade e culturalmente relevantes que representem a riqueza do nosso país. Para isso, contamos com uma equipe multidisciplinar de especialistas da UFMG, incluindo professores da Faculdade de Letras (FALE) e do próprio DCC. A colaboração com o Google Research é crucial: ela nos permite combinar o rigor da pesquisa acadêmica com a escala da indústria e a capacidade tecnológica de uma plataforma que visa expandir a coleta e validação de dados globalmente.
Esforço global
Por meio de uma metodologia desenvolvida pelo Google Research e por nossos pesquisadores, buscamos identificar lacunas e vieses para incluir conhecimento e expertise que não fazem parte dos modelos de IA existentes atualmente. Esses dados serão cuidadosamente coletados, enriquecidos e curados por especialistas no assunto, garantindo a diversidade e a proteção de informações sensíveis. Os resultados esperados incluem publicações acadêmicas de alto impacto e a geração de tecnologias aplicáveis à IA generativa, contribuindo para soluções mais inclusivas e diversas.
O projeto Amplify é um esforço global, já em andamento com pesquisadores na Índia e na África Subsaariana, para garantir que a IA seja construída de forma inclusiva entre diversas culturas. Estamos orgulhosos de poder contribuir concretamente para a iniciativa a partir do Brasil e entusiasmados para que os benefícios da IA sejam compartilhados de forma mais pluralista, promovendo uma tecnologia que respeita e valoriza a diversidade cultural e linguística do Brasil.