Bem-vindos ao Google Cloud Next '24
No ano passado, o mundo estava apenas a começar a imaginar como a tecnologia generativa de IA poderia transformar as empresas — e hoje, esta transformação está bem encaminhada. Na Google, a nossa estrela polar é a mesma: tornar a IA útil para todos, para melhorar a vida do maior número possível de pessoas.
Um mundo de agentes alimentados por IA, conectados à cloud
Com todo o nosso portfólio de IA – infraestrutura, Gemini, modelos, Vertex AI – clientes e parceiros estão a construir agentes de IA cada vez mais sofisticados que servem clientes, apoiam funcionários e os ajudam a criar conteúdo e muito mais.
Agentes de serviço ao cliente excelentes podem ajudar os seus clientes a interagir com o seu negócio de maneira conveniente em vários canais – web, dispositivos móveis, call center e ponto de venda – e em diversas modalidades como texto, voz e mais.
- IHG Hotels & Resorts irá lançar a possibilidade de planeamento de viagem alimentado por IA que ajuda os clientes a planear facilmente as próximas férias.
- A Target está a otimizar ofertas e recolhas na rua na aplicação Target e em Target.com.
Os Agentes de Funcionários ajudam todos os seus trabalhadores a serem mais produtivos e a trabalharem melhor juntos. Por exemplo:
- A Etsy usa treino Vertex AI para otimizar as suas recomendações de pesquisa e modelos de anúncios, fornecendo melhores sugestões de listagem aos compradores e aumentando as vendas.
- A Dasa no Brasil está a ajudar os médicos a detectar mais rapidamente dados relevantes nos resultados de exames.
Agentes Criativos Agentes Criativos podem servir como os melhores designers e equipas de produção - a trabalhar em imagens, slides e a explorar conceitos consigo. Disponibilizamos a plataforma mais poderosa para construir agentes criativos, por exemplo:
- O Canva está a usar a Vertex AI para alimentar o seu Magic Design for Video, ajudando os utilizadores a criar vídeos envolventes numa questão de segundos.
- O Carrefour está a usar Vertex AI. Eles foram capazes de criar campanhas de marketing dinâmicas em várias redes sociais no espaço de semanas, em vez de meses.
Eis as inovações de produtos que estamos a anunciar no Cloud Next ‘24 para ajudar as organizações de todos os tamanhos a abrir novos caminhos na era da IA.
Escale com infraestrutura otimizada para IA
O potencial da IA generativa para impulsionar uma transformação rápida é tão poderoso quanto a infraestrutura que a sustenta. Estamos a fazer avanços significativos para oferecer suporte aos clientes em toda a cadeia:
- A3 mega: Desenvolvida pela NVIDIA recorrendo a GPUs H100 Tensor Core, esta nova instância baseada em GPU está disponível de forma generalizada e oferece o dobro da largura de banda por GPU, em comparação com as instâncias A3, para suportar as cargas de trabalho mais exigentes.Também estamos a anunciar o Confidential A3, que permite aos clientes proteger melhor a confidencialidade e integridade de dados confidenciais e as cargas de trabalho de IA durante treino e inferência.
- NVIDIA HGX B200 e NVIDIA NVL72: A mais recente plataforma de chips NVIDIA Blackwell irá chegar à Google Cloud no início de 2025 em duas variantes: HGX B200 e GB200. A B200 foi projetada para treino e serviço convencional, enquanto o GB200 NVL72 potencializa a inferência em grandes modelos de linguagem em tempo real e o desempenho do treino em grande escala para modelos em escala com biliões de parâmetros.
- TPU v5p: Estamos a anunciar a disponibilidade geral do TPU v5p, nosso acelerador de IA mais poderoso, escalável e flexível para treino e inferência, com 4X o poder de computação per pod em comparação com a nossa geração anterior. Também estamos a anunciar a disponibilidade do suporte do Google Kubernetes Engine (GKE) para TPU v5p. No ano passado, o uso de GPUs e TPUs no GKE cresceu mais de 900%.
- Opções de armazenamento otimizadas para IA: estamos a acelerar a velocidade de treino com novos recursos de cache no Cloud Storage FUSE e Parallelstore, que mantêm os dados mais próximos da TPU ou GPU do cliente. Também estamos a apresentar o Hyperdisk ML (em versão prévia), o nosso serviço de armazenamento em bloco de próxima geração que acelera o tempo de carregamento do modelo em até 3,7X em comparação com alternativas comuns.
- Novas opções para o Dynamic Workload Scheduler: o modo calendário para garantia de horário de início e início flexível para optimização económica irá ajudar os clientes a garantir uma gestão eficiente de recursos para a distribuição de trabalhos complexos de treino e inferência.
Também estamos a trazer a IA para mais perto de onde os dados estão a ser gerados e consumidos – para Edge, para ambientes air-gappeds, para o Google Sovereign Clouds e Cross-Cloud. Também estamos a permitir AI Anywhere através do Google Distributed Cloud (GDC), permitindo que escolha o ambiente, a configuração e os controlos que melhor respondem às necessidades específicas da sua organização. Por exemplo, o fornecedor móvel líder Orange, que opera em 26 países onde os dados locais devem ser mantidos em cada país, tira partido da IA na GDC para melhorar o desempenho da rede e melhorar as experiências dos clientes.
Hoje estamos a anunciar uma série de novas capacidades no GDC, incluindo:
- GPUs NVIDIA para GDC: Estamos a trazer GPUs NVIDIA para o GDC para configurações connected and air-gapped. Cada um deles irá oferecer suporte a novas instâncias baseadas em GPU para executar modelos de IA com eficiência.
- GKE no GDC: a mesma tecnologia GKE que as empresas líderes de IA usam na Google Cloud estará disponível no GDC.
- Suporte a modelos de IA: estamos a permitir uma variedade de modelos de IA abertos, incluindo Gemma, Llama e muito mais no GDC para a execução em ambientes air-gapped e connected.
- Vector Search no GDC: Estamos a trazer o poder do Vector Search para permitir pesquisa e recuperação de informações no GDC nos seus dados privados e confidenciais com uma latência extremamente baixa.
- Soberania da Cloud: para requisitos regulatórios mais rigorosos, disponibilizamos GDC numa configuração air-gapped com operações locais e capacidade de sobrevivência total, gerida pela Google ou através de um parceiro à escolha. Terá o controlo total e, quando as regulamentações mudam, temos flexibilidade para ajudá-lo a responder rapidamente.
Embora nem toda a carga de trabalho seja carga de trabalho de IA, toda a carga de trabalho executada na Cloud e cada aplicação têm necessidades técnicas exclusivas. É por isso que estamos a introduzir novas opções de computação de uso geral que ajudam os clientes a maximizar o desempenho, a permitir a interoperabilidade entre aplicações e a cumprir metas de sustentabilidade, ao mesmo tempo que reduzem os custos.
- Google Axion, a nossa primeira CPU personalizada baseada em arquitetura ArmⓇ projetada para datacenter, oferece um desempenho até 50% superior e uma eficiência energética até 60% melhor face à atual geração de instâncias baseadas em x86.
- Também estamos a anunciar a N4 e C4, duas novas séries de máquinas no nosso portfólio de VMs de uso geral; tipos de máquinas bare-metal nativas na família de máquinas C3; a disponibilidade geral de Hyperdisk Advanced Storage Pools e muito mais.
Também estamos a expandir a residência de dados armazenados em repouso para a IA generativa nos serviços Vertex AI para 11 novos países: Austrália, Brasil, Finlândia, Hong Kong, Índia, Israel, Itália, Polónia, Espanha, Suíça e Taiwan.
- Além disso, os clientes agora podem limitar o processamento de aprendizagem de máquina aos Estados Unidos ou à União Europeia quando usam o Gemini 1.0 Pro e o Imagen.
- Juntando-se a outros 10 países que anunciámos no ano passado, estas novas regiões dão aos clientes maior controlo sobre onde os seus dados são armazenados e como são acedidos, facilitando aos clientes o cumprimento dos requisitos regulamentares e de segurança em todo o mundo.
Crie agentes com a Vertex AI
A Google Cloud oferece mais de 130 modelos proprietários e de terceiros na Vertex AI e estamos a expandir o acesso a uma variedade de modelos para que os clientes tenham mais opções de escolha quando se trata de seleção de modelos:
- Gemini 1.5 Pro: Gemini 1.5 Pro oferece dois tipos de dimensões de janelas de contexto - 128 mil tokens e 1 milhão de tokens - que agora estão disponíveis numa versão prévia pública. Os clientes podem processar grandes quantidades de informações num único fluxo, incluindo 1 hora de vídeo, 11 horas de áudio, bases de código com mais de 30.000 linhas de código ou mais de 700.000 palavras.
- Claude 3: A nova família de modelos de última geração da Anthropic já está disponível para clientes na Vertex AI.
- CodeGemma: Gemma é uma família de modelos abertos leves e de última geração desenvolvida pela investigação e tecnologia usadas nos modelos Gemini. Uma nova versão afinada do Gemma projetada para casos de uso de programação, como a geração e assistência em código, CodeGemma, está agora disponível na Vertex AI.
- Imagen 2: A nossa tecnologia mais avançada de conversão de texto em imagem possui uma variedade de funcionalidades de geração de imagens para ajudar as empresas a criar imagens que respondem a requisitos específicos da sua marca. Uma nova capacidade de texto para imagens animadas permite que as equipas de marketing e criativas criem imagens animadas, como gifs que estão equipados com filtros de segurança e marcas d’água digitais. Além disso, estamos a anunciar a disponibilidade geral de funcionalidades avançadas de edição de fotos, incluindo inpainting e outpainting, e muito mais.
- Marca d'água digital: Alimentado pelo SynthID da Google DeepMind, temos o orgulho de anunciar que já está disponível para imagens geradas por IA produzidas pelo Imagen 2.0.
Depois de escolher o modelo certo, ajustá-lo e fundamentá-lo, a Vertex pode ajudá-lo a implementar, gerir e monitorizar os modelos. Hoje, estamos a anunciar recursos adicionais de operações de ML:
- Ferramentas de gestão de comandos (prompts): estas ferramentas permitem colaborar em prompts integrados com notas e status, rastrear alterações ao longo do tempo e comparar a qualidade das respostas de diferentes prompts.
- Automatic side-by-side: agora com disponibilidade geral, o Auto SxS fornece explicações acerca da razão de uma resposta superar outra e certainty scores, o que ajuda os utilizadores a compreender a precisão da avaliação.
- Recurso de avaliação rápida: agora em versão preview, ajuda os clientes a avaliar rapidamente modelos em conjuntos de dados mais pequenos durante a iteração no design do prompt.
Por fim, o Vertex AI Agent Builder reúne modelos fundacionais, Pesquisa Google e outras ferramentas de programador para facilitar a criação e a implementação de agentes. Ele fornece a conveniência de uma consola de desenvolvimento de agentes sem código, juntamente com poderosos recursos de grounding, orchestration e augmentation. Com a Vertex AI Agent Builder, pode agora criar rapidamente uma variedade de agentes de IA generativa, alicerçados na Pesquisa Google e nos dados da sua organização.
Acelere o desenvolvimento
O Gemini Code Assist é a nossa solução de assistência de código de IA com foco empresarial. Para apoiar os programadores estamos a anunciar:
- Gemini 1.5 Pro no Gemini Code Assist: Esta atualização traz uma enorme janela de contexto de 1 milhão de tokens, revolucionando a programação até mesmo para os projetos maiores. O Gemini Code Assist agora oferece sugestões de código ainda mais precisas, insights mais profundos e fluxos de trabalho simplificados.
- Gemini Cloud Assist: Proporciona assistência de IA em todo o ciclo de vida da sua aplicação, tornando mais fácil projetar, proteger, operar, solucionar problemas e otimizar o desempenho e os custos da sua aplicação.
Implementámos o Gemini Code Assist num grupo de programadores dentro da Google e observámos um impacto significativo, incluindo um tempo de conclusão 40% mais rápido para tarefas comuns de programação e 55% menos tempo para escrever um novo código.Na verdade, o Gemini Code Assist permite que a sua base de código privada esteja em qualquer lugar - on premisses, GitHub, GitLab, Bitbucket ou até mesmo em vários locais.
Desbloqueie o potencial da IA com dados
A Google Cloud permite combinar o melhor da IA com grounded data corporativa mantendo os seus dados privados e seguros. Hoje, estamos a anunciar novas melhorias para ajudar as organizações a criar excelentes agentes de dados:
- Gemini no BigQuery: Gemini no BigQuery utiliza IA para ajudar as suas equipas de dados na preparação, descoberta, análise e governança de dados. Combinado com isto, pode criar e executar canais de dados com o nosso novo BigQuery Data Canvas, que oferece uma nova experiência tipo notebook com linguagem natural e visualizações incorporadas, ambas disponíveis na versão prévia.
- Gemini em bases de dados: Isto facilita a migração segura de dados de sistemas legacy, por exemplo, convertendo a sua base de dados num banco de dados moderno na Cloud como AlloyDB.
- Gemini no Looker: estamos a introduzir novos recursos, atualmente em versão prévia, que permitem aos seus agentes de dados a integração fácil nos seus fluxos de trabalho e estejam disponíveis aos utilizadores por meio de integrações ao Google Workspace.
Melhore a sua atitude de cibersegurança com capacidades orientadas por IA
A IA Generativa tem o potencial de fazer pender a balança a favor dos defensores, com os Agentes de Segurança a disponibilizarem ajuda em todas as fases do ciclo de vida da segurança. As inovações no portfolio de segurança da Google Cloud que oferecem resultados de segurança mais sólidos e permitem que todas as organizações incluam o Google na sua equipa de segurança incluem:
- Gemini em Inteligência de Ameaças: usa linguagem natural para proporcionar insights profundos sobre o comportamento do ator da ameaça. Com o Gemini, podemos analisar amostras muito maiores de códigos potencialmente maliciosos. A janela de contexto maior do Gemini permite a análise das interações entre os módulos, fornecendo novos insights sobre a verdadeira intenção do código.
- Gemini em operações de segurança: Um novo recurso de investigação assistida converte linguagem natural em detecções, resume dados de eventos, recomenda ações a serem tomadas e orienta os utilizadores na plataforma através de um chat.
Aumentar a produtividade com o Google Workspace
Com o Gemini for Workspace , as empresas têm um agente com tecnologia de IA integrado no Gmail, Documentos, Folhas de Cálculo e muito mais. Hoje anunciamos a próxima onda de inovações e melhorias do Gemini para o Google Workspace , incluindo:
- Google Vids: Esta nova aplicação para criação de vídeos alimentada por IA para ambientes de trabalho é o seu assistente de redação, produção e edição de vídeo, tudo num só. Ele pode gerar um storyboard que pode facilmente editar e depois de escolher um estilo ele reúne um primeiro rascunho com cenas sugeridas a partir de vídeos guardados, imagens e música de fundo. Ele pode também ajudá-lo a transmitir a sua mensagem com a narração certa - podendo escolher uma das vozes pré-definidas ou usando a própria voz. Vids irá ficar ao lado de outras aplicações Workspace como o Documentos e Folhas de Cálculo e Apresentações. Inclui uma interface simples e fácil de usar e a capacidade de colaboração e partilha de projetos em segurança a partir do seu navegador. O Vids será disponibilizado no Workspace Labs em junho.
- AI Meetings and Messaging add-on: Com o “tira notas para mim”, resumo de chat e tradução em tempo real em 69 línguas (equivalente a 4.600 pares de idiomas), esta ferramenta de colaboração terá um custo de apenas US$ 10 por utilizador, por mês.
- Novo add-on de segurança de IA: os administradores do Workspace podem agora classificar e proteger automaticamente ficheiros e dados sensíveis usando modelos de IA que preservam a privacidade e os controlos de prevenção contra perda de dados treinados para a sua organização. O AI Security add-on está disponível por US$ 10 por utilizador, por mês e pode ser adicionado à maioria dos planos do Workspace.
Olhando para o ano passado, é verdadeiramente notável ver a rapidez com que os nossos clientes passaram do entusiasmo e da experiência para a implementação das ferramentas de IA e para lançamento de produtos em fase inicial, e mal podemos esperar para ver o que farão a seguir.