Como o MUM ajuda a melhorar a pesquisa por vacinas de COVID-19 na Busca do Google
Tangerina, mexerica, bergamota; batata baroa e mandioquinha; “mina”, “garota”, “guria”... Com frequência, a gente usa nomes diferentes para se referir à mesma coisa. Pode ser uma questão de linguagem, de cultura ou de moda – ou simplesmente variar dependendo da região onde a gente vive no mundo. A COVID-19 é bom exemplo disso. Pessoas de todos os lugares estão em busca de informações. Com isso, o Google teve de aprender a identificar todas as diferentes frases usadas para se referir ao novo coronavírus – e, assim, garantir que os usuários vejam com destaque informações atualizadas e de alta qualidade, vindas de fontes confiáveis como a Organização Mundial de Saúde (OMS) ou o Centro para Controle e Prevenção de Doenças (CDC) dos Estados Unidos. Passado mais de um ano desse primeiro desafio, estamos diante de uma empreitada semelhante, agora relacionada aos nomes das vacinas. Desta vez, porém, contamos com uma nova ferramenta para nos ajudar: o Multitask Unified Model (MUM, ou “modelo unificado multitarefa”).
Como as pessoas fazem pesquisas sobre vacinas
AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik e outras vacinas de grande distribuição têm nomes diferentes a depender do país – mais de 800 nomes, de acordo com análises do Google. As pessoas que buscam informações sobre as vacinas podem escrever “Vacina corona Pfizer”, “mRNA-1273”, “CoVacina” – e mais uma porção de jeitos diferebtes. Nossa capacidade de identificar corretamente todos esses nomes é essencial para levar às pessoas informações confiáveis e atualizadas sobre a vacina. No entanto, identificar todas as maneiras pelas quais as pessoas se referem às vacinas no mundo leva tempo, exigindo centenas de horas de trabalho humano. Graças ao MUM, conseguimos identificar em questão de segundos mais de 800 variações de nomes de vacinas, em mais de 50 línguas. Depois de validar as descobertas do MUM, aplicamos esses conhecimentos à Busca do Google de forma que as pessoas possam encontrar informações sobre as vacinas de COVID-19 de forma rápida e confiável, em todo o mundo.
Destaque a informações confiáveis sobre vacinas na Busca do Google
Transferência de conhecimento entre diferentes idiomas
Graças às habilidades de transferência de conhecimento, o MUM é capaz de fazer em poucos segundos um trabalho que poderia levar semanas. O modelo consegue aprender a partir da transferência de conhecimento entre as mais de 75 línguas que tem em seu sistema. Um exemplo: imagine uma pessoa que lê um livro; se essa pessoa fala vários idiomas, ela pode compartilhar em diferentes línguas tudo o que aprendeu na leitura (a depender do grau de fluência, é claro). Isso porque a pessoa compreende o livro de uma forma que não depende de um idioma ou de uma tradução específica. É mais ou menos assim que o MUM transfere conhecimento entre línguas. Da mesma maneira, o MUM usa suas capacidades de transferência de conhecimento para que não seja necessário reaprender a cada novo idioma ou habilidade acrescentado ao sistema: ele simplesmente transfere o que já aprendeu para as novas línguas que vão entrando. Com isso, os aprendizados ganham escala rapidamente, mesmo que não haja muitos dados para treinar o modelo. Isso se deve, em parte, à eficiência das amostras que alimentam o MUM – ou seja, o MUM exige bem menos inputs de dados do que modelos anteriores, e mesmo assim consegue realizar as mesmas tarefas. No caso das vacinas, basta uma pequena amostra de nomes oficiais de imunizantes para que o MUM rapidamente identifique as variações existentes entre línguas.
MUM ajuda a melhorar a Busca do Google
Esta primeira aplicação do MUM nos ajuda a levar informações fundamentais para usuários de todo o mundo, de forma rápida e confiável. Estamos animados com as inúmeras possibilidades de usar o MUM para deixar a Busca do Google ainda mais útil para todos. Os primeiros testes indicam que o modelo consegue não apenas melhorar vários aspectos dos sistemas existentes, mas também ajuda a criar jeitos totalmente novos de pesquisar e explorar informações.
Postado por: Pandu Nayak, Google Fellow e vice-presidente da Busca do Google