Novedades de Gemini: generación de imágenes mejorada con Imagen 3 y más personalización con Gems
En Google I/O presentamos dos novedades que empezaremos a desplegar a partir de hoy y estarán disponibles en los próximos días. La primera de ellas es sobre los Gems, una nueva función que permite personalizar Gemini para convertirlo en una IA experta en cualquier tema que desee el usuario. Desde ahora, estará disponible para los usuarios de Gemini Advanced, Business y Enterprise en determinados idiomas y países.
La otra es Imagen 3, nuestro nuevo modelo de generación de imágenes, que se puede usar para la creación de imágenes generales en Gemini (versión gratuita) y está disponible en español.
Por último, la generación de imágenes de personas está disponible en Gemini Advanced, Business y Enterprise, en inglés.
Genera imágenes de alta calidad con Imagen 3
Hemos dado un gran paso adelante en nuestra capacidad de creación de imágenes generativas. En los próximos días, Imagen 3, nuestro último modelo de generación de imágenes, llegará a las aplicaciones de Gemini (incluida la versión gratuita) y en todos los idiomas.
Crea una imagen de un vestido de fiesta hecho con servilletas de papel en una sala de exposición elegante.
Genera una imagen de un coche futurista conduciendo por una carretera de montaña rodeado de naturaleza.
Imagen 3 abre una nueva dimensión en cuanto a calidad de imagen, y es capaz de generar imágenes a partir de instrucciones breves. Permite pedirle a Gemini que cree imágenes en distintos estilos; por ejemplo, paisajes fotorrealistas, imágenes con textura de pintura al óleo o caprichosas animaciones con plastilina.
La capacidad avanzada de generación de imágenes de Imagen 3 se acompaña de sistemas de protección y respeta nuestros principios de diseño de productos. Imagen 3 ha obtenido resultados superiores a los de otros modelos de generación de imágenes en una gran variedad de pruebas comparativas. Y utiliza SynthID, nuestra herramienta de inserción de marcas de agua en las imágenes generadas.
Nuestros principios de diseño son claros: el usuario mantiene el control del proceso creativo de principio a fin. Si la imagen inicial no cumple tus expectativas, solo tienes que decirle a Gemini qué te gustaría cambiar y obtendrás una nueva imagen.
En los próximos días empezaremos a desplegar la generación de imágenes de personas, con una versión preliminar solo en inglés y para nuestros usuarios de Gemini Advanced, Business y Enterprise. Hemos dedicado un gran esfuerzo a introducir mejoras técnicas en el producto, métodos de evaluación mejorados, ejercicios de red team y principios de producto bien definidos.
Imagen 3 supone un avance significativo en la mejora de la experiencia del usuario a la hora de generar imágenes de personas. No está permitido generar imágenes fotorrealistas de individuos identificables ni de menores. Igualmente, tampoco es posible obtener escenas excesivamente sangrientas, violentas o sexuales. Evidentemente, no todas las imágenes creadas mediante Gemini serán perfectas. Por eso, estaremos atentos a los comentarios de los usuarios de Gemini Advanced para seguir mejorando. Esta funcionalidad se irá implantando de manera gradual, con el objetivo de que llegue próximamente a más usuarios e idiomas.
Ayuda personalizada con Gems: desde código de programación hasta asesoramiento profesional
Los suscriptores de Gemini Advanced, Business y Enterprise en algunos países e idiomas (todavía no está disponible en español) podrán empezar a crear y chatear con los Gems, las versiones personalizadas de Gemini que presentamos en el último I/O. Los Gems se pueden personalizar para convertirte en un experto en cualquier tema, y se pueden refinar en línea con los objetivos específicos del usuario. Lo único que hay que hacer es escribir una serie de instrucciones y asignarle un nombre. A partir de ahí, puedes chatear con tu Gem en cualquier momento.
Presentamos Gems, una IA personalizada experta en cualquier tema
Con los Gems es como si pudieras crear un equipo de expertos que te pueden ayudar a dar forma a un proyecto complejo, aportar ideas para un evento que estás preparando o escribir el pie de foto perfecto para una publicación en tus redes sociales. Cada Gem también es capaz recordar instrucciones detalladas, con el fin de ahorrar tiempo al usuario en tareas aburridas, repetitivas o difíciles.
Para facilitar el proceso, hemos lanzado una serie de Gems adaptados a distintas temáticas, listas para utilizar:
- Tutor personal: ayuda a desbrozar información compleja, de modo que resulte más fácil de entender.
- Exploración de ideas: inspiración al alcance de tu mano; desde ideas originales para una fiesta temática hasta el regalo ideal para un cumpleaños.
- Orientación profesional: analiza tu potencial de desarrollo profesional y te propone planes detallados para mejorar tus competencias y avanzar en tu carrera.
- Revisión de escritura: te ayuda a mejorar el nivel de redacción a través de comentarios claros y constructivos, que cubren todos los aspectos de la escritura, desde la gramática hasta la estructura.
- Asistente de programación: es un complemento perfecto para escribir código de programación; ayuda a sacar adelante proyectos y a aprender sobre la marcha.
Actualmente, ha comenzado el lanzamiento de los Gems para los usuarios de Gemini Advanced, Gemini Business y Gemini Enterprise tanto móviles como ordenadores, de más de 150 países y en distintos idiomas. Por el momento no se encuentra disponible en español.
Si quieres ser de los primeros en conocer estas nuevas funciones, prueba Gemini Advanced hoy mismo o suscríbete a Gemini para Workspace.