Nuestra visión para construir un asistente de IA universal

May 20, 2025

Estamos expandiendo Gemini para convertirlo en un modelo que pueda simular aspectos del mundo real y sea capaz de armar planes e imaginar nuevas experiencias.

Demis Hassabis

CEO Google DeepMind

Durante la última década, sentamos gran parte de las bases de la era de la IA moderna. Fuimos pioneros en la arquitectura Transformer, en la que se basa un gran número de modelos; desarrollamos sistemas de agente capaces de aprender y planificar, como AlphaGo y AlphaZero.

Hemos aplicado avances revolucionarios en computación cuántica, matemáticas, ciencias biológicas y descubrimiento de algoritmos. Seguimos incrementando la amplitud y profundidad de nuestra investigación fundamental, impulsando el desarrollo de las próximas innovaciones necesarias para la inteligencia artificial general (AGI).

Por eso estamos trabajando para expandir nuestro mejor modelo de base multimodal, Gemini 2.5 Pro, para convertirlo en un “modelo del mundo” que pueda entender y simular aspectos del mundo real y sea capaz de armar planes e imaginar nuevas experiencias, al igual que lo hace el cerebro humano.

Ya hace tiempo que venimos avanzando en esta dirección, desde nuestro trabajo pionero con el entrenamiento de agentes que dominan juegos complejos, como Go y StarCraft, hasta la creación de Genie 2, que, a partir de una única instrucción de imagen, es capaz de generar entornos 3D simulados con los que se puede interactuar.

Ya hoy en día vemos evidencia del surgimiento de estas habilidades, por ejemplo, en la capacidad de Gemini de usar el conocimiento del mundo y el razonamiento para representar y simular entornos naturales, la comprensión profunda de la física intuitiva de Veo, y el modo en que Gemini Robotics enseña a los robots a comprender conceptos, seguir instrucciones y realizar ajustes sobre la marcha.

Hacer de Gemini un modelo del mundo es un paso fundamental para el desarrollo de un nuevo tipo de IA más general y más útil: un asistente de IA universal. Una IA que entienda el contexto en el que te encuentras y pueda planificar y actuar por ti cuando se lo solicites a través de cualquier dispositivo.

Incorporamos las capacidades de Project Astra en nuestros productos

Nuestro objetivo es transformar la aplicación de Gemini en un asistente de IA universal que realice tareas cotidianas, se ocupe de nuestra gestión administrativa rutinaria y nos sugiera nuevas recomendaciones encantadoras, haciéndonos más productivos y enriqueciendo nuestras vidas.

Esto comienza con las capacidades que exploramos por primera vez el año pasado en nuestro prototipo de investigación Project Astra, como la comprensión de video, el uso compartido de pantalla y la memoria.

El último año estuvimos integrando capacidades como estas en Gemini Live para que más personas las puedan usar hoy. Seguimos mejorando sin descanso y explorando nuevas innovaciones en la frontera. Por ejemplo, mejoramos la salida de voz para que sea más natural con reproducción de audio nativo, optimizamos la memoria y agregamos control por computadora.

Ahora comenzamos a recopilar comentarios sobre estas funciones de verificadores de confianza y estamos trabajando para incorporarlas a Gemini Live, a nuevas experiencias en el Buscador, la API de Live para desarrolladores y nuevos formatos, como los lentes.

En cada paso de este proceso, la seguridad y la responsabilidad son centrales en nuestro trabajo. En los mayores proyectos de previsión ética que realizamos hasta ahora, exploramos las problemáticas éticas en torno a los avances en los asistentes de IA, y este trabajo sigue guiando nuestras decisiones en lo que respecta a investigación, desarrollo e implementación.

Construimos una IA capaz de realizar múltiples tareas a la vez

También exploramos cómo las capacidades de agente pueden ayudar a las personas a realizar múltiples tareas con Project Mariner. Este es un prototipo de investigación que explora el futuro de la interacción entre humanos y agentes, comenzando por los navegadores.

Desde el lanzamiento de Project Mariner el diciembre pasado, trabajamos codo a codo con un grupo de verificadores de confianza para recopilar comentarios y mejorar estas capacidades experimentales.

Project Mariner ahora incluye un sistema de agentes que son capaces de llevar a cabo hasta diez tareas diferentes a la vez. Estos agentes pueden ayudarte a buscar información, hacer reservas, comprar productos, realizar búsquedas y mucho más, todo al mismo tiempo.

La versión de Project Mariner actualizada está disponible para quienes tengan una suscripción a Google AI Ultra en Estados Unidos. Estamos integrando sus capacidades de uso de computadora en la API de Gemini y planeamos sumar más capacidades a los productos de Google durante este año.

Conoce más sobre las capacidades de agente en el Buscador y en la aplicación de Gemini.

Con todos estos avances y nuestro trabajo revolucionario, estamos construyendo una IA más personal, proactiva y potente, que mejora nuestra vida, acelera los avances científicos y abre las puertas a una nueva era dorada de descubrimiento y asombro.

Publicado en:

Nuestra visión para construir un asistente de IA universal

Incorporamos las capacidades de Project Astra en nuestros productos

Construimos una IA capaz de realizar múltiples tareas a la vez

Historias relacionadas