De los juegos a la biología y más allá: 10 años del impacto de AlphaGo
Hace diez años, nuestro sistema de IA AlphaGo se convirtió en el primer programa en derrotar a un campeón del mundo en el complejo juego del go, alcanzando un hito en el campo una década antes de lo que muchos expertos creían posible. Este logro marcó el inicio de lo que hoy se conoce como la era moderna de la inteligencia artificial (IA). Con una sola jugada creativa, la famosa "jugada 37", AlphaGo demostró el potencial de la IA y señaló que ya teníamos las técnicas para empezar a abordar problemas científicos del mundo real.
Hoy en día, este avance sigue siendo la base de nuestro trabajo para crear sistemas que nos lleven a la inteligencia artificial general (IAG). Creemos que la IAG será la tecnología más trascendental jamás inventada y, posiblemente, la herramienta definitiva para avanzar en la ciencia, la medicina y la productividad.
Una chispa creativa
En el 2016, más de 200 millones de personas vieron a AlphaGo enfrentarse al campeón mundial de go, Lee Sae Dol, en Seúl. La partida se definió con la ‘Jugada 37’ de la segunda partida, una jugada tan poco convencional que los comentaristas profesionales pensaron que era un error. Pero resultó ser decisivo. Unos cien movimientos después, la piedra estaba en la posición exacta para que AlphaGo ganara la partida. Fue una demostración de una previsión increíble y de la capacidad del sistema de IA para ir más allá de imitar a los expertos humanos y encontrar estrategias completamente nuevas.
El Go ha sido durante mucho tiempo un campo de pruebas para la investigación en IA debido a su gran complejidad. Hay 10170 posiciones posibles en el tablero, muchas más que el número de átomos del universo observable.
Para que el juego fuera abordable, AlphaGo usó redes neuronales profundas combinadas con búsquedas avanzadas y aprendizaje por refuerzo, una estrategia de IA pionera de DeepMind.
AlphaGo aprendió un modelo de movimientos de Go plausibles primero aprendiendo de partidas jugadas por expertos humanos y, después, jugando cientos de miles de partidas contra sí mismo, mejorando a medida que se reforzaban las estrategias ganadoras más sólidas. Después, el sistema solo tuvo en cuenta las rutas más fructíferas y, a partir de ese subconjunto de movimientos, encontró el que tenía más probabilidades de llevarlo a la victoria.
Después de AlphaGo, creamos AlphaGo Zero, que aprendió a jugar a partir de partidas completamente aleatorias y se convirtió en el jugador más fuerte de la historia. Después, generalizamos aún más el sistema con AlphaZero, que aprendió por sí mismo desde cero a dominar cualquier juego de información perfecta para dos jugadores, como el Go, el ajedrez y el shogi. AlphaZero, que no tenía ningún conocimiento previo más allá de las reglas del juego, fue capaz de aprender a dominar el ajedrez en cuestión de horas y de vencer no solo a los mejores jugadores humanos, sino también a los mejores programas especializados de ajedrez del momento, como Stockfish. Y, aunque el ajedrez se había analizado exhaustivamente con la ayuda de estos programas, al igual que con el Go, AlphaZero fue capaz de idear nuevas estrategias interesantes.
Fue una prueba más de lo que supe en el momento en que ganamos la partida en Seúl: la tecnología estaba lista para aplicarse a nuestro objetivo real de acelerar los avances científicos.
Catalizar avances en la ciencia
Al demostrar que podía moverse por el enorme espacio de búsqueda de un tablero de Go, AlphaGo demostró el potencial de la IA para ayudarnos a comprender mejor las vastas complejidades del mundo físico. Empezamos intentando resolver el problema del plegamiento de proteínas, un gran reto de 50 años que consiste en predecir la estructura tridimensional de las proteínas, una información crucial para comprender las enfermedades y desarrollar nuevos fármacos.
En el 2020, por fin resolvimos este problema científico de larga data con nuestro sistema AlphaFold 2. A partir de ahí, plegamos las estructuras de las 200 millones de proteínas conocidas por la ciencia y las pusimos a disposición de los científicos en una base de datos de código abierto. Hoy en día, más de 3 millones de investigadores de todo el mundo utilizan la base de datos de AlphaFold para acelerar su importante trabajo en todo tipo de proyectos, desde vacunas contra la malaria hasta enzimas que se alimentan de plástico. Y en el 2024, John Jumper y yo tuvimos el honor de recibir el Premio Nobel de Química por liderar este proyecto en nombre de todo el equipo de AlphaFold.
Desde la victoria de AlphaGo, hemos aplicado su innovador enfoque a muchas otras áreas de la ciencia y las matemáticas, como las siguientes:
Razonamiento matemático: AlphaProof, el descendiente más directo de la arquitectura de AlphaGo, aprendió a demostrar enunciados matemáticos formales usando una combinación de modelos de lenguaje y los algoritmos de aprendizaje por refuerzo y búsqueda de AlphaZero. Junto con AlphaGeometry 2, se convirtió en el primer sistema en conseguir una medalla (de plata) en la Olimpiada Internacional de Matemáticas (IMO), lo que demostró que los métodos de AlphaGo podían desbloquear el razonamiento matemático avanzado y sentó las bases de nuestros modelos generales más potentes.
Gemini, nuestro modelo más grande y potente, ha ido aún más lejos recientemente. Una versión avanzada de su modo Deep Think consiguió un rendimiento de nivel de medalla de oro en la IMO del 2025 utilizando un enfoque inspirado en AlphaGo. Desde entonces, Deep Think se ha aplicado a retos aún más complejos y abiertos en los ámbitos de la ciencia y la ingeniería.
Descubrimiento de algoritmos: al igual que AlphaGo buscaba la mejor jugada en una partida, nuestro agente de programación AlphaEvolve explora el espacio del código informático para descubrir algoritmos más eficientes. Tuvo su propio momento Jugada 37 cuando encontró una nueva forma de multiplicar matrices, una operación matemática fundamental que está detrás de casi todas las redes neuronales modernas. AlphaEvolve se está probando en problemas que van desde la optimización de centros de datos hasta la computación cuántica.
Colaboración científica: estamos integrando los principios de búsqueda y razonamiento que se aplicaron por primera vez en AlphaGo en AI co-scientist. Al hacer que los agentes "debatan" ideas e hipótesis científicas, este sistema actúa como un colaborador capaz de llevar a cabo el riguroso proceso de pensamiento necesario para identificar patrones en los datos y resolver problemas complejos. En estudios de validación en el Imperial College London, analizó décadas de literatura y llegó de forma independiente a la misma hipótesis sobre la resistencia a los antimicrobianos que los investigadores habían pasado años desarrollando y validando experimentalmente.
También hemos usado la IA para comprender mejor el genoma, avanzar en la investigación sobre la energía de fusión, mejorar la predicción meteorológica y más.
Por muy impresionantes que sean nuestros modelos científicos, están muy especializados. Para lograr avances fundamentales, como crear energía limpia ilimitada o resolver enfermedades que hoy en día no entendemos, necesitamos sistemas de IA general que puedan encontrar la estructura subyacente y las conexiones entre diferentes áreas temáticas, y ayudarnos a formular nuevas hipótesis como hacen los mejores científicos.
El futuro de la inteligencia
Para que una IA sea realmente general, debe comprender el mundo físico. Hemos creado Gemini para que sea multimodal desde el principio, de modo que pueda entender no solo el lenguaje, sino también el audio, el vídeo, las imágenes y el código para construir un modelo del mundo.
Para pensar y razonar en todas estas modalidades, los modelos de Gemini más recientes usan algunas de las técnicas que desarrollamos con AlphaGo y AlphaZero.
La próxima generación de sistemas de IA también deberá poder recurrir a herramientas especializadas. Por ejemplo, si un modelo necesita conocer la estructura de una proteína, puede usar AlphaFold.
Creemos que la combinación de los modelos del mundo de Gemini, las técnicas de búsqueda y planificación de AlphaGo y el uso de herramientas de IA especializadas será fundamental para la inteligencia artificial general.
La verdadera creatividad es una capacidad clave que un sistema de IAG debería tener. La Jugada 37 fue un atisbo del potencial de la IA para pensar de forma innovadora, pero la verdadera invención original requerirá algo más. No solo tendría que idear una nueva estrategia de go, como hizo AlphaGo de forma impresionante, sino que tendría que inventar un juego tan profundo, elegante y digno de estudio como el go.
Diez años después de la legendaria victoria de AlphaGo, nuestro objetivo final está en el horizonte. La chispa creativa que se vio por primera vez en la Jugada 37 catalizó avances que ahora están convergiendo para allanar el camino hacia la IAG y dar paso a una nueva edad de oro del descubrimiento científico.
Más información sobre AlphaGo: https://deepmind.google/research/alphago
Ver el documental de AlphaGo en YouTube https://www.youtube.com/watch?v=WXuK6gekU1Y