Bienvenidas y bienvenidos a Google Cloud Next '24
Hace apenas un año, el mundo empezaba a vislumbrar todas las facetas de nuestra vida que la IA generativa tenía el potencial de transformar. Hoy, esa transformación es una realidad y avanzamos con rapidez hacia un futuro que, para Google, significa mejorar la vida de las personas y convertir a la IA en una herramienta útil para todos.
Un mundo de asistentes de IA conectados a la nube
Gracias a nuestro catálogo de IA —infraestructura, Gemini, modelos y Vertex AI—, muchas empresas están desarrollando asistentes de IA cada vez más sofisticados, con el objetivo de mejorar la atención al cliente, potenciar la colaboración entre empleados y ayudar en la generación de contenidos, entre otras muchas aplicaciones.
Los nuevos agentes de atención al cliente, posibilitan una interacción multimodal entre cliente y empresa. Esta nueva interacción, más fluida, puede llevarse a cabo a través de todos los canales (web, móvil, centro de llamadas y puntos de venta) y en distintas modalidades, como texto y voz, entre otras.
- IHG Hotels & Resorts lanzará una función de planificación de viajes basada en IA generativa que puede ayudar a los clientes a planificar fácilmente sus próximas vacaciones.
- Target está optimizando las ofertas en la aplicación Target y en Target.com.
Los asistentes para empleados ayudan a los empleados de una organización a ser más productivos y a trabajar mejor de forma colaborativa. Por ejemplo:
- Etsy utiliza la formación de Vertex AI para optimizar sus recomendaciones de búsqueda y modelos de anuncios, ofreciendo mejores sugerencias de anuncios a los compradores y aumentando las ventas.
- En Brasil, Dasa ayuda a los médicos a detectar de forma más rápida los resultados relevantes en las pruebas de diagnóstico.
Los asistentes creativos pueden ser un fantástico equipo de diseño y producción, capaz de trabajar con imágenes y diapositivas, y de ayudar a explorar conceptos. Tenemos la plataforma y la estructura tecnológica más potente para crear asistentes creativos. Por ejemplo:
- Canva está aplicando Vertex AI a su herramienta de vídeo Magic Design, para que a los usuarios les resulte más sencillo crear vídeos atractivos en cuestión de segundos.
- Carrefour también utiliza Vertex AI para poner a punto campañas de marketing dinámicas en distintas redes sociales en cuestión de semanas, en lugar de meses.
A continuación repasamos las innovaciones de producto que anunciaremos en Google Cloud Next '24. Todas ellas están dirigidas a abrir nuevas posibilidades para organizaciones de todos los tamaños en la era de la IA.
Escala con infraestructura optimizada para IA
El potencial de la IA generativa para impulsar la transformación depende de la infraestructura en la que se basa. Por nuestra parte, estamos haciendo avances importantes para ayudar a los clientes en todas las capas en el ámbito tecnológico:
- A3 mega: Desarrollada con NVIDIA utilizando GPUs H100 Tensor Core, esta nueva instancia basada en GPU está disponible de forma general y duplica el ancho de banda por GPU de las instancias A3, para soportar las cargas de trabajo más exigentes. También anunciamos Confidential A3, que permite a los clientes proteger mejor la confidencialidad e integridad de los datos sensibles y las cargas de trabajo de IA durante el entrenamiento y la inferencia.
- NVIDIA HGX B200 y NVIDIA GB200 NVL72: Los últimos chips de la plataforma NVIDIA Blackwell llegarán a Google Cloud a principios de 2025 en dos variantes: HGX B200 y GB200. El B200 está diseñado para entrenar y dar servicio a modelos convencionales, mientras que el GB200 NVL72 permite la inferencia de modelos de lenguaje de gran tamaño en tiempo real y un rendimiento de entrenamiento masivo para modelos a escala de billones de parámetros.
- TPU v5p: Anunciamos la disponibilidad general de TPU v5p, nuestro acelerador de IA más potente, escalable y flexible para entrenamiento e inferencia, con 4 veces más potencia de cálculo por pod en comparación con nuestra generación anterior. También anunciamos la disponibilidad de la compatibilidad de Google Kubernetes Engine (GKE) con TPU v5p. En el último año, el uso de GPUs y TPUs en GKE ha crecido más de un 900%.
- Opciones de almacenamiento optimizadas para IA: Estamos acelerando la velocidad de formación con nuevas funciones de almacenamiento en caché en Cloud Storage FUSE y Parallelstore, que mantienen los datos más cerca de la TPU o GPU del cliente. También estamos introduciendo Hyperdisk ML (en vista previa), nuestro servicio de almacenamiento en bloque de nueva generación que acelera los tiempos de carga de modelos hasta 3,7 veces en comparación con las alternativas comunes.
- Nuevas opciones para Dynamic Workload Scheduler: El modo calendario ofrece la opción de garantizar la hora de inicio o de aplicar un inicio flexible, con el fin de optimizar la economía. De este modo, a los clientes les resulta más sencillo gestionar los recursos de manera eficaz, a la hora de distribuir tareas complejas de entrenamiento e inferencia.
En otro orden de cosas, estamos habilitando AI Anywhere en Google Distributed Cloud (GDC): esto permitirá a los usuarios seleccionar el entorno, la configuración y los controles que mejor se adapten a las necesidades específicas de cada organización. Así, por ejemplo, Orange utiliza la IA de GDC para mejorar el rendimiento de su red y la experiencia de sus clientes; no hay que olvidar que este proveedor líder de telefonía móvil opera en 26 países que exigen almacenar los datos localmente.
Hoy anunciamos también una serie de nuevas capacidades para GDC:
- Adopción de GPU de NVIDIA en GDC: Tenemos intención de adoptar GPU de NVIDIA en GDC, tanto para configuraciones conectadas como aisladas. En ambos casos, serán compatibles con nuevas instancias basadas en GPU, que servirán para ejecutar de manera más eficiente los modelos de IA.
- GKE en GDC: GDC adoptará la misma tecnología GKE que ya utilizan en Google Cloud las principales empresas de IA.
- Certificación de modelos: Estamos certificando en GDC distintos modelos abiertos de IA, como Gemma, Llama y otros, para que funcionen en entornos conectados y aislados.
- Búsqueda vectorial en GDC: Igualmente, estamos integrando en GDC la potencia de la búsqueda vectorial, para buscar y recuperar información en conjuntos de datos privados y sensibles con una latencia extremadamente baja.
- Nube soberana: Cuando existen requisitos normativos muy estrictos, podemos ofrecer configuraciones de GDC totalmente aisladas, con operaciones locales y capacidad de supervivencia total, con gestión a cargo de Google o del socio que elija el cliente. El cliente tiene todo el control. Y, si cambia la normativa, tenemos la flexibilidad necesaria para adaptarnos con rapidez al nuevo paradigma.
Aunque no todas las cargas de trabajo son cargas de IA, no hay duda de que todas las cargas de trabajo que se ejecutan en la nube deben optimizarse. Y, además, cada aplicación tiene unas necesidades técnicas específicas. Por eso presentamos nuevas opciones de computación que ayudan a los clientes a maximizar el rendimiento, facilitan la interoperabilidad entre aplicaciones y cumplen los objetivos de sostenibilidad. Todo ello, reduciendo al mismo tiempo los costes.
- Google Axion, nuestra primera CPU de Arm diseñada para centros de datos, ofrece un rendimiento hasta un 50% superior y una eficiencia energética hasta un 60% mejor que las máquinas virtuales basadas en x86 de la generación actual.
- Otras novedades son las series N4 y C4, que se suman a nuestro catálogo de máquinas virtuales de uso general; las nuevas máquinas de la familia C3; y la disponibilidad general de bancos de almacenamiento avanzado de hiperdisco, entre otras.
Asimismo, tenemos intención de ampliar a once nuevos países la residencia de datos, para datos en reposo almacenados en servicios de Vertex AI para IA generativa. Los países son Australia, Brasil, España, Finlandia, Hong Kong, India, Israel, Italia, Polonia, Suiza y Taiwán.
- Desde ahora, los clientes podrán limitar el procesamiento de aprendizaje automático a Estados Unidos o la Unión Europea, cuando utilicen Gemini 1.0 Pro e Imagen.
- La incorporación de estas nuevas regiones a los otros 10 países que ya anunciamos el año pasado proporciona a los clientes un mayor grado de control sobre dónde se almacenan sus datos y cómo se accede a ellos. Con ello, es más sencillo cumplir requisitos normativos y de seguridad en todo el mundo.
Crear agentes con Vertex AI
Google Cloud ofrece más de 130 modelos propios y de terceros en Vertex AI. Es más, estamos ampliando el acceso a diferentes modelos con el fin de dar a los clientes más opciones a la hora de seleccionar un modelo:
- Gemini 1.5 Pro: Gemini 1.5 Pro ofrece dos tamaños de ventanas contextuales: 128.000 tokens y 1 millón de tokens. Hoy anunciamos la compatibilidad con la entrada de audio, que ya se encuentra disponible en versión pública preliminar. Los clientes pueden procesar grandes volúmenes de información en un único flujo: hasta 1 hora de vídeo, 11 horas de audio, bases con más de 30.000 líneas de código o textos de más de 700.000 palabras.
- Claude 3: La nueva familia de modelos de última generación de Anthropic ya está disponible con carácter general para los clientes de Vertex AI.
- CodeGemma: Gemma es una familia de modelos avanzados, abiertos y ligeros, creada por Google DeepMind. Desde ahora, hay una versión refinada de Gemma, llamada CodeGemma diseñada para aplicaciones de código de programación, como generación de código o asistencia para la escritura de código. Ya está disponible en Vertex AI.
- Imagen 2: Nuestra tecnología más avanzada de conversión de texto en imagen cuenta con diversas funciones de generación de imágenes para ayudar a las empresas a crear imágenes que se ajusten a los requisitos específicos de su marca. Una nueva función de conversión de texto en imagen permite a los equipos creativos y de marketing generar imágenes animadas, como gifs, equipadas con filtros de seguridad y marcas de agua digitales. Además, anunciamos la disponibilidad general de funciones avanzadas de edición de fotos, como inpainting y outpainting, y mucho más.
- Marca de agua digital: Desde hoy, se encuentra disponible con carácter general una marca de agua digital, creada mediante la herramienta SynthID de Google DeepMind, para las imágenes generadas por IA producidas con Imagen 2.0.
Los clientes obtienen mucho más de sus modelos cuando los aumentan y los basan en datos empresariales. Hoy ampliamos las capacidades de base de Vertex AI de dos maneras:
- Búsqueda en Google: Los modelos de base en Google Search combinan la potencia de los últimos modelos de base de Google junto con el acceso a información actual y de alta calidad para mejorar significativamente la integridad y precisión de las respuestas.
- Datos: Aterriza en datos de aplicaciones empresariales, como Workday o Salesforce, y conecta fácilmente las bases de datos de Google, como AlloyDB y BigQuery.
Una vez elegido el modelo adecuado, ajustado y preparado, Vertex también puede ayudar a desplegar, gestionar y supervisar los modelos. Hoy anunciamos capacidades adicionales de ML opps:
- Herramientas de gestión de prompts: Estas herramientas permiten colaborar en prompts incorporados con notas y estados, realizar un seguimiento de los cambios a lo largo del tiempo y comparar la calidad de las respuestas de diferentes prompts.
- Comparación automática: Ya disponible de forma generalizada, el cotejo automático proporciona explicaciones de por qué una respuesta supera a otra, lo que ayuda a los usuarios a comprender la precisión de la evaluación.
- Evaluación rápida: Todavía en versión preliminar, ayuda a los clientes a evaluar rápidamente los modelos en conjuntos de datos más pequeños.
Por último, Vertex AI Agent Builder reúne modelos básicos, Google Search y otras herramientas de desarrollo para facilitar la creación y el despliegue de agentes. Ofrece la comodidad de una consola de creación de agentes sin código junto con potentes funciones de base, orquestación y aumento. Con Vertex AI Agent Builder, ahora puede crear rápidamente una gama de agentes de IA genéricos, basados en Google Search y en los datos de su organización.
Acelera el desarrollo
Gemini Code Assist es nuestra solución de escritura de código de programación asistida por IA orientada a la empresa. Tenemos varios anuncios de interés para desarrolladores:
- Gemini Code Assist con Gemini 1.5 Pro: La principal novedad de esta actualización es una ventana contextual de 1 millón de tokens, que revolucionará la escritura de código de programación incluso para los proyectos más grandes. Ahora, Gemini Code Assist ofrece sugerencias de código aún más precisas, más detalles y flujos de trabajo más ágiles.
- Asistente de Gemini en la nube: Asistencia de IA a lo largo de todo el ciclo de vida de una aplicación. Para facilitar el diseño de una aplicación, hacerla segura, explotarla, resolver problemas y optimizar el rendimiento y los costes.
Hemos realizado un estudio con Gemini Code Assist y desarrolladores internos de Google. El impacto ha sido notable: las tareas comunes de desarrollo se completaron un 40% más deprisa y la escritura de código nuevo requirió un 55% menos de tiempo. De hecho, Gemini Code Assist permite que una base de código privada esté en cualquier lugar: en tus instalaciones, en GitHub, GitLab, Bitbucket o incluso en múltiples ubicaciones.
Explota todo el potencial de la IA con tus datos propios
Con Google Cloud, puedes combinar lo mejor de la IA con los datos propios de una empresa, manteniendo en todo momento la privacidad y la seguridad de tus datos. Hoy anunciamos varias novedades que ayudarán a las organizaciones a crear asistentes de datos excepcionales:
- Gemini en BigQuery: Gemini en BigQuery utiliza IA para ayudar a los equipos de datos en las operaciones de preparación, descubrimiento, análisis y gobernanza de datos. En paralelo, se puede construir y ejecutar flujos de datos con nuestro novedoso BigQuery Data Canvas. Esta herramienta ofrece una nueva experiencia, similar a la de un cuaderno, con funciones de lenguaje natural y visualizaciones incrustadas (disponibles en versión preliminar).
- Gemini en bases de datos: La incorporación de Gemini ayuda a migrar datos de sistemas heredados de manera segura. Por ejemplo, para convertir una base de datos antigua en una base de datos en la nube moderna, como AlloyDB.
- Gemini en Looker: Estamos introduciendo nuevas capacidades, actualmente en vista previa, que permiten a sus agentes de datos integrarse fácilmente con sus flujos de trabajo. También hemos añadido nuevas capacidades de IA generativa para que puedas chatear con los datos de tu empresa, y está integrado con Google Workspace.
Mejora tu postura de ciberseguridad con capacidades basadas en IA
La IA generativa tiene el potencial de inclinar la balanza a favor de los defensores, mediante el uso de asistentes de seguridad que proporcionan ayuda en todas las etapas del ciclo de la seguridad. Entre las innovaciones de la cartera de seguridad de Google Cloud que ofrecen resultados de seguridad más sólidos y permiten a todas las organizaciones convertir a Google en parte de su equipo de seguridad se incluyen:
- Gemini en inteligencia sobre amenazas: Proporciona información detallada sobre el comportamiento de los agentes maliciosos utilizando lenguaje natural. Gemini puede analizar muestras mucho mayores de código potencialmente malicioso. Al tener una ventana contextual más grande, es posible analizar las interacciones entre módulos y conocer con mayor precisión las verdaderas intenciones del código.
- Gemini en operaciones de seguridad: Una nueva función de investigación asistida convierte el lenguaje natural en detecciones, resume los datos de los sucesos, recomienda acciones a realizar y guía a los usuarios por la plataforma a través de un chat conversacional.
Aumenta la productividad con Google Workspace
Gemini para Workspace pone a disposición de las empresas un agente asistido por IA directamente integrado en Gmail, Documentos, Hojas de cálculo y otras aplicaciones. Hoy anunciamos una nueva hornada de innovaciones y mejoras en Google Workspace con Gemini:
- Google Vids: Esta nueva aplicación de creación de vídeo para el trabajo basada en IA es tu asistente de redacción, producción y edición de vídeo, todo en uno. Es un asistente para la redacción de guiones, la producción y la edición de vídeo, todo en uno. Vids estará junto a otras aplicaciones de Workspace como Docs, Sheets y Slides. Incluye una interfaz sencilla y fácil de usar y la posibilidad de colaborar y compartir proyectos de forma segura desde el navegador. Vids se lanzará en Workspace lLabs en junio.
- Complemento de IA para reuniones y mensajería: Esta herramienta, que solo costará 10 USD al mes por usuario, ofrece la función “toma notas por mí”, resume chats y ofrece traducción en tiempo real en 69 idiomas.
- Nuevo complemento de IA para seguridad: Ahora los administradores de Workspace pueden clasificar y proteger automáticamente los archivos y datos sensibles utilizando modelos de IA respetuosos con la privacidad y controles de prevención de la pérdida de datos entrenados específicamente para una organización en particular. El complemento de IA para seguridad cuesta 10 USD al mes por usuario, y puede añadirse a la mayoría de los planes de Workspace.
Si nos fijamos en lo que ha sido el último año, llama mucho la atención la rapidez con la que nuestros clientes han pasado del entusiasmo y la experimentación de los primeros momentos a implantar herramientas de IA y lanzar productos en fase inicial. Estamos impacientes por ver cuáles serán sus próximos pasos.
Este es un resumen editado, la entrada original del blog post está en inglés disponible aquí.