De jogos à biologia e muito mais: 10 anos do impacto do AlphaGo
Esta conquista revelou o início do que é hoje reconhecido como a era moderna da inteligência artificial (IA). Com uma única jogada criativa, o famoso "Movimento 37", o AlphaGo demonstrou o potencial da IA e sinalizou que tínhamos agora as técnicas necessárias para começar a resolver problemas científicos do mundo real.
Atualmente, esta descoberta continua a orientar o nosso trabalho na construção de sistemas rumo à Inteligência Artificial Geral (IAG). Acreditamos que a IAG vai ser a tecnologia mais profunda alguma vez inventada e, potencialmente, a ferramenta definitiva para o avanço da ciência, da medicina e da produtividade.
Uma faísca criativa
Em 2016, mais de 200 milhões de pessoas assistiram ao confronto entre o AlphaGo e o campeão mundial de Go, Lee Se-dol, em Seul. A partida ficou marcada pelo "Movimento 37" no Jogo 2, um lance tão pouco convencional que os comentadores profissionais pensaram inicialmente tratar-se de um erro. Contudo, acabou por ser decisivo. Cerca de cem jogadas mais tarde, a peça estava na posição exata para o AlphaGo vencer o jogo. Foi uma demonstração de uma previdência incrível e da capacidade do sistema de IA de ir além da mímica de especialistas humanos para encontrar estratégias inteiramente novas.
O Go tem sido, desde há muito, um campo de testes para a investigação em IA devido à enorme complexidade do jogo. Existem 10170 posições possíveis no tabuleiro — muito mais do que o número de átomos no universo observável.
Para tornar o jogo viável, a AlphaGo utilizou redes neuronais profundas combinadas com pesquisa avançada e aprendizagem por reforço – uma abordagem de IA pioneira da DeepMind.
O AlphaGo aprendeu um modelo de jogadas plausíveis no Go, primeiro com as partidas jogadas por especialistas humanos e depois ao jogar centenas de milhar de partidas contra si próprio, melhorando-se à medida que as estratégias vencedoras mais fortes eram reforçadas. O sistema considerou então apenas os caminhos potencialmente mais frutíferos e, a partir deste subconjunto mais pequeno de jogadas, encontrou aquela que tinha maior probabilidade de o levar à vitória.
Após o AlphaGo, criámos o AlphaGo Zero, que aprendeu o jogo através de partidas completamente aleatórias e tornou-se, possivelmente, no jogador mais forte da história. Depois, generalizámos ainda mais o sistema com o AlphaZero, que aprendeu sozinho a partir do zero a dominar qualquer jogo de informação perfeita para dois jogadores, incluindo Go, xadrez e shogi. Começando sem qualquer conhecimento prévio para além das regras do jogo, o AlphaZero foi capaz de dominar xadrez numa questão de horas e vencer não só os melhores jogadores humanos, mas também os melhores programas especializados em xadrez da época, como o Stockfish. E mesmo no xadrez já tendo sido amplamente analisado com a ajuda destes programas, tal como no caso do Go, o AlphaZero ainda foi capaz de desenvolver novas estratégias interessantes.
Foi mais uma prova do que eu já sabia desde o momento em que ganhámos o jogo em Seul: a tecnologia estava pronta para ser aplicada ao nosso objetivo real de acelerar as descobertas científicas.
Catalisar avanços na ciência
Ao provar que conseguia navegar pelo vasto espaço de pesquisa num tabuleiro de Go, o AlphaGo demonstrou o potencial da IA para nos ajudar a compreender melhor as imensas complexidades do mundo físico. Começámos por tentar resolver o problema do enovelamento de proteínas, um grande desafio com 50 anos de prever a estrutura tridimensional das proteínas — informação crucial para a compreensão das doenças e para o desenvolvimento de novos fármacos.
Em 2020, decifrámos finalmente este problema científico de longa data com o nosso sistema AlphaFold 2. A partir daí, modelámos as estruturas de todos os 200 milhões de proteínas conhecidas pela ciência e tornámo-las disponíveis gratuitamente para cientistas numa base de dados de código aberto. Hoje, mais de 3 milhões de investigadores em todo o mundo utilizam a base de dados do AlphaFold para acelerar o seu importante trabalho em tudo, desde vacinas contra a malária a enzimas que consomem plástico. E em 2024, foi a honra de uma vida para mim e para o John Jumper sermos galardoados com o Prémio Nobel da Química por liderarmos este projeto, em nome de toda a equipa do AlphaFold.
Desde a vitória do AlphaGo, aplicámos a sua abordagem inovadora a muitas outras áreas da ciência e da matemática, incluindo:
Raciocínio matemático: o descendente mais direto da arquitetura do AlphaGo, o AlphaProof, aprendeu a demonstrar enunciados matemáticos formais usando uma combinação de modelos de linguagem e algoritmos de aprendizagem por reforço e pesquisa do AlphaZero. Juntamente com o AlphaGeometry 2, tornou-se no primeiro sistema a atingir o patamar de medalha (prata) na Olimpíada Internacional de Matemática (IMO), provando que os métodos do AlphaGo podiam desbloquear o raciocínio matemático avançado e lançou as bases para os nossos modelos mais capazes.
Gemini, o nosso maior e mais capaz modelo foi ainda mais longe recentemente. Uma versão avançada do seu modo Deep Think alcançou um desempenho de medalha de ouro nas IMO de 2025 (Olimpíadas Internacionais de Matemática), ao utilizar uma abordagem inspirada no AlphaGo. Desde então, o Deep Think tem sido aplicado a desafios ainda mais complexos e em aberto em áreas de ciência e engenharia.
Descoberta de algoritmos: tal como o AlphaGo procurou o melhor movimento num jogo, o nosso agente de programação AlphaEvolve explora o espaço do código informático para descobrir algoritmos mais eficientes. Teve o seu próprio momento de mudança quando encontrou uma nova forma de multiplicar matrizes, uma operação matemática fundamental que alimenta quase todas as redes neurais modernas. O AlphaEvolve está agora a ser testado em problemas que vão desde a otimização de centros de dados à computação quântica.
Colaboração científica: estamos a integrar os princípios de pesquisa e de raciocínio pioneiros com o AlphaGo num cocientista de IA. Ao fazer com que os agentes "debatam" ideias e hipóteses científicas, este sistema atua como um colaborador capaz de realizar o pensamento rigoroso necessário para identificar padrões nos dados e resolver problemas sofisticados. Em estudos de validação no Imperial College London, analisou décadas de literatura e chegou de forma independente à mesma hipótese sobre a resistência antimicrobiana que os investigadores tinham passado anos a desenvolver e a validar experimentalmente.
Também usámos a IA para compreender melhor o genoma, fazer avançar a investigação sobre a energia de fusão, melhorar a previsão meteorológica e muito mais.
Por mais impressionantes que sejam os nossos modelos científicos, são altamente especializados. Para alcançar avanços fundamentais, como a criação de energia limpa ilimitada ou a resolução de doenças que não compreendemos atualmente, precisamos de sistemas de IA gerais que possam encontrar a estrutura e as ligações subjacentes entre diferentes áreas de conhecimento e ajudar-nos a criar novas hipóteses, tal como os melhores cientistas fazem.
Futuro da inteligência
Para uma IA ser verdadeiramente geral, tem de compreender o mundo físico. Criámos o Gemini para ser multimodal desde o início, para que pudesse compreender não só a linguagem, mas também o áudio, o vídeo, as imagens e o código para criar um modelo do mundo.
Para pensar e raciocinar nestas modalidades, os modelos mais recentes do Gemini usam algumas das técnicas que desenvolvemos com o AlphaGo e o AlphaZero.
A próxima geração de sistemas de IA também vai ter de ser capaz de recorrer a ferramentas especializadas. Por exemplo, se um modelo precisasse de saber a estrutura de uma proteína, podia usar o AlphaFold para isso.
Pensamos que a combinação dos modelos mundiais do Gemini, das técnicas de pesquisa e planeamento do AlphaGo e da utilização de ferramentas de IA especializadas vai ser fundamental para a IAG.
A verdadeira criatividade é uma capacidade fundamental que um sistema de IAG terá de demonstrar. O movimento 37 foi um vislumbre do potencial da IA para pensar fora da caixa, mas a verdadeira invenção original vai exigir algo mais. Não só terá de criar uma nova estratégia de Go, como o AlphaGo fez de forma impressionante, mas também inventar um jogo tão profundo e elegante, e tão digno de estudo como o Go.
Dez anos após a lendária vitória do AlphaGo, o nosso objetivo final está no horizonte. A faísca criativa vista pela primeira vez no movimento 37 catalisou avanços que estão agora a convergir para abrir caminho à IAG e dar início a uma nova era de ouro da descoberta científica.