Nuestra visión para un asistente de IA universal
En la última década, hemos forjado muchos de los cimientos de la era de la IA moderna: hemos sido pioneros de la arquitectura Transformer —en la que se basan todos los modelos de lenguaje extensos—, y hemos desarrollado sistemas de agentes como AlphaGo y AlphaZero.
Estas técnicas nos han permitido lograr avances revolucionarios en campos como la computación cuántica, las matemáticas, la biología y el descubrimiento algorítmico. Actualmente seguimos expandiendo el alcance y la profundidad de nuestra investigación básica, trabajando en busca de los siguientes grandes avances que se requieren para la inteligencia artificial general (IAG).
Este es el motivo por el que estamos expandiendo nuestro mejor modelo fundacional multimodal, Gemini 2.5 Pro. Queremos que llegue a ser un "modelo de mundo" capaz de hacer planes e imaginar nuevas experiencias simulando aspectos del mundo real, tal como hace el cerebro.
Llevamos tiempo progresando en esta dirección, desde que fuimos pioneros en entrenar a agentes para que dominaran juegos complejos como el go y StarCraft hasta crear Genie 2, que genera entornos simulados e interactivos en 3D a partir de una simple petición de imagen.
Ya estamos empezando a ver muestras de estas nuevas posibilidades en la capacidad de Gemini de aplicar el conocimiento y el razonamiento del mundo al representar y simular entornos naturales. También en la profundidad con que Veo comprende la física intuitiva, y en cómo Gemini Robotics enseña a los robots a manipular objetos, seguir instrucciones y adaptarse al instante.
Convertir Gemini en un modelo de mundo es esencial para poder crear un nuevo tipo de IA más general y útil, un asistente de IA universal. Esta nueva IA es inteligente, entiende tu contexto y puede hacer planes y actuar en tu nombre en cualquier dispositivo.
Integramos la capacidad de interactuar de Project Astra en nuestros productos
Nuestro objetivo final es transformar la aplicación Gemini en un asistente de IA universal que gestione nuestras tareas del día a día y nos dé consejos y nuevas perspectivas, haciéndonos más productivos y mejorando nuestras vidas.
El año pasado dimos un primer paso en esta dirección con nuestro prototipo de investigación Project Astra, que incluye capacidades como la comprensión de vídeos, compartir pantalla y la memoria.
A lo largo de este último año, hemos estado integrando capacidades en Gemini Live para que todo el mundo pudiera probarlas. Continuamos mejorando y explorando formas de innovar en la vanguardia. Por ejemplo, hemos optimizado las voces para que sean más naturales gracias a la generación de audio nativa, además de mejorar la memoria y añadir la capacidad de controlar un ordenador.
Hemos empezado a recabar la opinión de testers de confianza y estamos incorporando capacidades como estas a Gemini Live y a otras experiencias como la Búsqueda, la API de Live para desarrolladores y a nuevos formatos, como gafas.
En cada paso de este proceso, priorizamos la seguridad y la responsabilidad. Recientemente concluimos un exhaustivo proyecto de investigación para explorar las cuestiones éticas que plantean los asistentes de IA avanzados, y este trabajo sigue guiando nuestra investigación, desarrollo e implementación.
Desarrollamos una IA que realiza por ti varias tareas a la vez
También estamos estudiando cómo las funciones de los agentes pueden ayudar a realizar varias tareas a la vez, con Project Mariner. Se trata de un prototipo de investigación que examina el futuro de la interacción entre personas y agentes, empezando por los navegadores.
Desde que lanzamos Project Mariner en diciembre, estamos colaborando estrechamente con un grupo de testers de confianza para recabar opiniones y mejorar sus capacidades experimentales.
Project Mariner ahora incluye un sistema de agentes capaz de llevar a cabo hasta diez tareas al mismo tiempo. Estos agentes pueden ayudarte a buscar información, reservar, comprar o investigar, entre otras cosas, y todo ello simultáneamente.

La versión actualizada de Project Mariner está a disposición de los suscriptores de Google AI Ultra en Estados Unidos. Vamos a integrar sus capacidades de control de ordenadores a la API de Gemini y tenemos previsto incorporar otras de sus funciones a productos de Google a lo largo de este año.
Puedes consultar más información sobre nuestras funciones de agentes en la Búsqueda y la aplicación Gemini.
Con esto, y con nuestro trabajo revolucionario, estamos creando una IA más personal, proactiva y potente, que mejore nuestras vidas, adelante los avances científicos y nos abra las puertas de una nueva edad dorada de descubrimientos y prodigios.