Torna al menu principale
Blog di Google Italy

Veo e Imagen 3: nuovi modelli di generazione video e immagini su Vertex AI



L'AI generativa sta portando a una reale crescita e trasformazione per le aziende. Tra le imprese che utilizzano l'AI generativa in produzione, l'86% segnala un aumento dei ricavi, con una crescita stimata del 6%. Per questo motivo, Google sta investendo nella sua tecnologia AI con nuovi modelli come Veo, il nostro modello di generazione video più avanzato, e Imagen 3, il nostro modello di generazione di immagini di altissima qualità. Oggi, stiamo capitalizzando questo slancio in Google Cloud offrendo ai nostri clienti l'accesso a questi modelli multimediali generativi avanzati su Vertex AI:

  1. Veo, ora disponibile su Vertex AI in anteprima privata, consente alle aziende di generare video di alta qualità a partire da semplici prompt di testo o immagini. In qualità di primo hyperscaler a offrire un modello image-to-video, stiamo aiutando le aziende a trasformare i loro asset creativi esistenti in contenuti visivi dinamici. Questa tecnologia rivoluzionaria offre nuove possibilità di espressione creativa e ottimizza i flussi di lavoro di produzione video.
  2. Imagen 3 sarà disponibile per tutti i clienti di Vertex AI a partire dalla prossima settimana. Imagen 3 su Vertex AI genera le immagini più realistiche e di alta qualità di sempre, superando i modelli precedenti in termini di dettaglio, illuminazione e riduzione degli artefatti. Le aziende possono creare facilmente immagini di alta qualità che riflettano il loro stile e i loro loghi, da utilizzare a fini di marketing, pubblicità o design di prodotto.

Vertex AI offre una piattaforma di orchestrazione che semplifica la personalizzazione, la valutazione delle performance e l’implementazione di questi modelli sulla nostra infrastruttura leader nel settore. In linea con i nostri principi AI, lo sviluppo e l’implementazione di Veo e Imagen 3 su Vertex AI danno priorità alla sicurezza e alla responsabilità, con precauzioni integrate come la filigrana digitale, i filtri di sicurezza e la governance dei dati.

Veo: il nostro modello di generazione video più avanzato, ora disponibile su Vertex AI

Sviluppato da Google DeepMind, Veo genera video di alta qualità e in alta definizione basati su prompt di testo o immagini in una vasta gamma di stili cinematografici e visivi, a una velocità eccezionale. Grazie a una comprensione avanzata del linguaggio naturale e della semantica visiva, genera video che si allineano perfettamente al prompt. Veo su Vertex AI crea filmati coerenti e uniformi, in modo che persone, animali e oggetti si muovano in modo realistico all'interno delle riprese. Ecco alcuni esempi delle capacità di generazione immagine-video di Veo su Vertex AI:

Image-to-Video: Veo genera video a partire da immagini esistenti o generate dall'AI. Qui sotto alcuni esempi di come Veo utilizza immagini generate con Imagen 3 (le due immagini in alto) e immagini del mondo reale (le due immagini in basso) per creare brevi clip video.

veo image video 1
Veo itov 2

Text-to-video: Di seguito alcuni esempi di come Veo utilizza il testo per creare brevi clip video.

veo text to vid

Veo su Vertex AI consente alle aziende di creare video di alta qualità in modo semplice, partendo da prompt di testo o immagini. Questo si traduce in una produzione più rapida, in costi ridotti e nella possibilità di prototipare e iterare rapidamente i contenuti video. La tecnologia di Veo rappresenta un grande alleato per la creatività umana, permettendo ai creatori di concentrarsi su compiti a valore aggiunto mentre l'AI si occupa degli aspetti più tediosi e ripetitivi della produzione video. Clienti come Agoda stanno sfruttando la potenza dei modelli AI come Veo, Gemini e Imagen per ottimizzare la produzione di annunci video, ottenendo una riduzione significativa dei tempi di produzione. Che tu sia un marketer che crea post coinvolgenti sui social media, un team di vendita che prepara presentazioni accattivanti o un team di produzione che esplora nuove idee, Veo semplifica il tuo flusso di lavoro e apre nuove possibilità per lo storytelling visivo.

Imagen 3: il nostro modello di generazione immagini di massima qualità, ora generalmente disponibile su Vertex AI

Imagen 3 è il nostro modello text-to-image più avanzato. Genera un incredibile livello di dettaglio, producendo immagini fotorealistiche e realistiche, con molti meno artefatti visivi fastidiosi rispetto ai modelli precedenti.

A partire dalla prossima settimana, tutti i clienti di Google Cloud potranno accedere a Imagen 3 Generation su Vertex AI. Con Imagen 3 su Vertex AI, è possibile generare immagini e video in alta definizione a partire da un semplice prompt testuale. Ecco alcuni esempi delle capacità di generazione di immagini di Imagen 3:

imagen 3

Inoltre, stiamo rendendo generalmente disponibili nuove funzionalità ai clienti nella nostra allowlist, che aiutano le aziende a modificare e personalizzare le immagini per soddisfare le loro esigenze aziendali. Per ottenere l’accesso, è necessario fare richiesta qui.

  • Imagen 3 Editing offre uno strumento potente e facile per rifinire e personalizzare qualsiasi immagine. Permette di modificare le foto a partire da un semplice prompt testuale, di rifinire solo alcune parti dell’immagine (modifica basata su maschera), ad esempio aggiornando gli sfondi nelle immagini di prodotto, o di aumentare la risoluzione dell'immagine per soddisfare i requisiti di dimensione.
  • Imagen 3 Customization fornisce un maggiore controllo guidando il modello nella generazione di immagini con le caratteristiche desiderate. Ora è possibile infondere il brand, lo stile, il logo, le caratteristiche di soggetti o prodotti nella generazione di nuove immagini. Questo apre nuove possibilità creative, accelerando lo sviluppo e migliorando il processo di marketing per gli asset pubblicitari.

Progettare con sicurezza e protezione di livello enterprise

Progettare e sviluppare un’AI che sia sicura, protetta e responsabile è fondamentale. In linea con i nostri Principi AI, Veo e Imagen 3 su Vertex AI sono stati creati mettendo la sicurezza al centro.

  • Filigrana digitale: SynthID di Google DeepMind inserisce filigrane invisibili in ogni immagine e fotogramma prodotto da Imagen 3 e Veo, contribuendo a ridurre i problemi legati alla disinformazione e all’attribuzione errata.

  • Filtri di sicurezza: Veo e Imagen 3 dispongono entrambi di salvaguardie integrate per aiutare a proteggersi contro la creazione di contenuti dannosi e rispettare i principi di AI Responsabile di Google. Continueremo a investire in nuove tecniche per migliorare le protezioni di sicurezza e privacy dei nostri modelli.
  • Governance dei dati: Non utilizziamo i dati dei clienti per addestrare i nostri modelli, in conformità con i controlli sulla governance dei dati e sulla privacy integrati di Google Cloud. I dati dei clienti vengono elaborati solo secondo le loro istruzioni.

Indennità sui diritti d’autore: La nostra indennità per i servizi di AI generativa offre tranquillità con un approccio innovativo e primo nel settore per quanto riguarda le preoccupazioni legate ai diritti d’autore.