Ontem e hoje: 5 formas de continuar aprimorando a Busca
Muita coisa está envolvida na construção de um mecanismo de busca. Embora pareça simples - a pessoa digita uma pergunta, e o Google encontra resultados correspondentes -, foi preciso enfrentar muitos desafios técnicos profundos para deixar a Busca do jeito que ela é hoje.
E a realidade é a seguinte: a Busca nunca será um problema resolvido por completo. Antigos desafios evoluem, e novos desafios não param de surgir - assim como a internet e o mundo também estão em constante mudança.
A seguir, você confere uma retrospectiva dos principais saltos tecnológicos que fizemos, e das áreas onde seguimos empurrando as fronteiras da inovação. Tudo isso para continuar sempre deixando a Busca do Google cada vez melhor.
1.Resultados de qualidade
É importante classificar a informação não apenas com base no que é relevante de acordo com a pesquisa feita pelo usuário, mas também de acordo com respostas que tenham maior probabilidade de serem úteis e confiáveis. Essa sacada diferencia o Google desde o primeiro dia de existência: nosso algoritmo PageRank não considerava apenas se as palavras numa página da web correspondiam à pesquisa digitada. Ele observava as relações entre diferentes sites, e usava essa informação para determinar quais páginas eram mais importantes ou confiáveis.
Ao longo dos anos, adaptamos nossas técnicas e evoluímos junto com a internet - e junto com os saltos tecnológicos. Um exemplo: com o aumento na desinformação, desenvolvemos maneiras de compreender quais assuntos são mais suscetíveis a conteúdo enganoso ou falso, como teorias conspiratórias ou informações médicas equivocadas. Com isso, o ranking das páginas mostradas pela Busca fica ainda mais confiável para assuntos sensíveis.
Todos os anos, realizamos centenas de milhares de avaliações de qualidade, para garantir que estamos atendendo aos mais elevados padrões. Atualizamos nossos sistemas regularmente, fazendo o que chamamos de “core updates”. Além disso, temos atualizações especializadas, como aquelas sobre conteúdo útil, que ajudam a entregar resultados cada vez mais certeiros.
Alguns aspectos da qualidade da informação continuam evoluindo, e exigem estratégias novas. Como exemplo, temos o conhecido desafio das lacunas de informação, também chamadas de “vazios de dados”. Nessas lacunas, às vezes a informação de qualidade simplesmente não está disponível. Descobrimos formas de mostrar avisos quando um assunto ainda está muito “quente”, com novas notícias chegando o tempo todo, ou quando ainda não temos grande confiança na qualidade dos resultados. Esses avisos alertam as pessoas para que elas tenham cuidado ao avaliar os resultados da pesquisa. Investimos também em outras ferramentas de letramento digital, que ajudam usuários a verificar a fonte da informação, a obter mais contexto e a avaliar os resultados que estão vendo.
2.Significado decifrado
Compreender a informação - e sobretudo compreender o significado por trás das pesquisas das pessoas - é uma área de trabalho fundamental para o Google, há anos. No início, nossos sistemas se baseavam numa simples correspondência entre palavras. Mas havia questões como a grafia das palavras, que podiam fazer uma grande diferença. Na época, quando alguém digitava uma palavra de forma errada, os resultados indicavam páginas onde… a grafia também estava errada! Assim, criamos o primeiro sistema de aprendizado de máquina da Busca, para enfrentar esse desafio.
Ao longo dos anos, nossos sistemas foram ficando cada vez mais sofisticados, e passaram a entender melhor os sinônimos e o contexto ao redor das palavras. Avanços como o Gráfico de conhecimento nos ajudaram a entender como pessoas, lugares e coisas do mundo se relacionam entre si - compreendendo o mundo da mesma forma que as pessoas o compreendem. Assim, entregamos exatamente o resultado que o usuário está procurando, e ainda vamos além. Um exemplo: uma pesquisa sobre o mais novo arrasa-quarteirão do cinema vai trazer, também, informações sobre elenco, duração do filme, salas de cinema perto do usuário que estão exibindo o título e links para comprar ingressos.
Grandes modelos de linguagem, como o BERT, foram desenvolvidos pela equipe de pesquisa do Google. Eles permitem dar grandes saltos ao decifrar pesquisas feitas em linguagem natural. Com isso, oferecemos resultados mais relevantes em vários idiomas do mundo. Esses modelos aproveitam o que aprenderam em um idioma e aplicam esse aprendizado a outras línguas. Dessa maneira, oferecemos resultados melhores nas várias línguas oferecidas pela Busca. Criamos ferramentas como o Google Tradutor, que ajudam a romper as barreiras do idioma. Assim, usuários entendem mais e melhor as informações do mundo.
As mais recentes tecnologias de IA generativa e os grandes modelos de linguagem nos ajudam a reimaginar a Busca, permitindo fazer novos tipos de perguntas e transformando o jeito de organizar as informações. Atualmente, conduzimos experimentos com o uso de IA generativa à Busca, por meio do Search Labs. Com isso, fazemos atualizações cada vez mais velozes à experiência de pesquisar, e descobrimos novas possibilidades.
3.Compreensão de vídeos, imagens e muito mais
O mundo tem tanta informação que não está em formato de texto, e tantos jeitos de fazer perguntas que não são digitar palavras numa caixinha de pesquisa.
Graças aos mais recentes avanços no processamento de linguagem natural (NPL, na sigla em inglês), em 2008 lançamos a possibilidade de fazer buscas por voz. Assim, a pesquisa em aparelhos móveis fica ainda mais natural. Em seguida, demos um passo além: passamos a oferecer o “hum to search”. Esse recurso vale para aquelas situações em que a gente está com uma música grudada na cabeça, mas não sabe qual é a canção e tampouco lembra da letra.
Depois, em 2015, avanços na visão por computador possibilitaram pesquisar aquilo que a gente vê: é esse o recurso Lens. Transformamos a câmera do celular numa ferramenta para explorar o mundo e fazer perguntas. Com isso, dá para saber mais sobre uma flor ou um inseto que a gente viu durante uma caminhada pelo bairro. Hoje em dia, o Lens “vê” mais de 12 bilhões de buscas visuais por mês.
No ano passado, lançamos a multibusca. Ela é uma evolução dessa capacidade, e permite acrescentar texto à uma pesquisa visual. Hoje é possível tirar uma foto de um sofá que a gente curtiu e depois escrever “poltrona”. Aí o Google vai usar a imagem e a palavra para mostrar móveis parecidos com aquele, que você pode usar na sua sala.
4.Identificação e proteção contra spam
Qualquer pessoa que já tenha dado uma olhada na própria pasta de spam deve ter percebido que o Google trabalha pesado para manter todo esse lixo longe da caixa de entrada do e-mail. A Busca conta com sistemas avançados de combate ao spam, e funciona da mesma maneira. Se nossas proteções avançadas não existissem, a página de resultados estaria entupida de informações totalmente irrelevantes, tentativas de phishing e links que levam a malware.
Estamos constantemente desenvolvendo novas técnicas e adotando atualizações ao nosso sistema de classificação de resultados, para proteger as pessoas do spam. Mas o spam também se adapta e evolui, e assim exige atenção constante das nossas equipes.
Recentemente, adotamos novas técnicas alimentadas por inteligência artificial para identificar spam. Elas nos ajudam a garantir que os resultados da busca se livrem de 99% das tentativas de spam. Essa segue sendo uma área de grandes investimentos para nós: enquanto as pessoas continuarem a usar o Google em busca de informações, o pessoal do spam vai continuar tentando burlar nossas proteções. Por isso, permanecemos sempre atentos e um passo adiante dessas tentativas.
5.A Busca cada vez mais segura
Ao longo dos anos, preservamos nosso sólido compromisso com o princípio de maximizar o acesso à informação e, ao mesmo tempo, garantir que as pessoas estejam seguras e tenham controle sobre seus dados. Nosso objetivo é ajudar usuários a encontrar informações que estejam dentro dos limites legais da liberdade de expressão, sem expô-los inadvertidamente a conteúdo prejudicial ou de baixa qualidade, que a pessoa não pediu para ver.
Enfrentamos essa situação ampliando nossas políticas de proteção, para que as pessoas retirem informações pessoais sensíveis dos resultados, e aprimorando nossos sistemas de classificação - sempre pensando em segurança e inclusão.
Um exemplo: lançamos melhorias para reduzir conteúdo explícito indesejado dos resultados que aparecem mais alto na Busca, e atualizamos o sistema para que imagens explícitas apareçam desfocadas, por padrão. Também melhoramos nossa classificação para limitar o alcance de sites que usam práticas de exploração. Nesse meio tempo, atualizamos políticas para que menores de 18 anos possam ter suas imagens retiradas da Busca, e lançamos ainda novas ferramentas como “Resultados sobre você” - que facilitam o controle sobre informações pessoais exibidas nos resultados da Busca.
Bilhões de pessoas usam o Google para buscar informações. Por isso, sabemos que sempre haverá melhorias a fazer, e novas perguntas a responder. Por isso trabalhamos sem trégua para que a Busca fique cada vez melhor, a cada dia que passa.