[I/O 2025] 새로운 생성형 AI 모델과 툴로 창의력을 키워 보세요

오늘 구글은 미디어 생성 분야에서 획기적인 진전을 이룬 최신 AI 모델들을 공개합니다. 이 모델들은 놀랍도록 생생한 이미지, 동영상, 음악을 생성해 아티스트들이 자신의 잠재력을 최대한 발휘하고 창의적 비전을 현실로 만들 수 있도록 지원합니다. 또한 누구나 자신을 표현할 수 있는 강력한 툴이 될 것입니다.
구글의 최신 동영상 및 이미지 생성 툴인 ‘비오 3(Veo 3)’와 ‘이마젠 4(Imagen 4)’는 미디어 생성 기술의 새로운 지평을 열며 혁신적인 기능을 선보일 것으로 기대됩니다. 또한 리리아 2(Lyria 2)에 대한 접근성을 확대함으로써, 뮤지션들에게 음악 창작을 위한 더 많은 툴을 제공하고자 합니다. 마지막으로, 비주얼 스토리텔러 여러분들을 위한 새로운 AI 영상 제작 툴, ‘플로우(Flow)’를 소개합니다. 구글 딥마인드(Google DeepMind)의 최고 수준 모델을 기반으로 한 플로우는 캐릭터, 장면, 스타일에 대한 세밀한 제어를 통해 영화처럼 몰입도 높은 영상을 생생하게 구현할 수 있도록 도와줍니다.
구글은 영화 제작자, 음악가, 예술가, 유튜브 크리에이터 등 창작 산업 분야와도 긴밀히 협력해, 책임감 있는 모델 및 제품 개발을 돕는 한편, 크리에이터들이 AI를 통해 예술적 가능성을 실현하도록 도와주는 새로운 툴을 제공해 왔습니다.
비오 3(Veo 3): 동영상, 소리를 담다
구글의 새로운 최첨단 동영상 생성 모델인 비오 3는 기존 비오 2 (Veo 2) 대비 품질이 크게 향상된 최첨단 동영상 생성 모델입니다. 특히, 처음으로 소리까지 포함된 동영상 생성이 가능해졌습니다. 도시 거리 장면에서는 배경의 교통 소음이 깔리고, 정원에서는 새가 지저귀며, 캐릭터 간의 대화까지도 실제처럼 자연스럽게 구현됩니다.
전반적으로 비오 3는 텍스트 및 이미지 프롬프트부터 실제 물리 법칙 반영과 정확한 립싱크까지 뛰어난 성능을 구현합니다. 특히 이해력이 뛰어나 프롬프트에 이야기를 담으면 모델이 그 이야기를 생생하게 구현하는 클립을 생성해 냅니다. 비오 3는 오늘부터 제미나이 앱, 플로우, 그리고 버텍스 AI(Vertex AI)의 엔터프라이즈 이용자에게 제공됩니다.
비오 2(Veo 2): 영화 제작자와 함께, 영화 제작자를 위한 새로운 기능들
비오 3의 발전과 함께, 크리에이터 및 영화 제작자들과의 작업을 바탕으로 인기 모델인 비오 2에도 여러 새로운 기능이 추가되었습니다. 오늘 새롭게 선보이는 기능은 다음과 같습니다:
- 구글의 최첨단 레퍼런스 비디오 기능: 캐릭터, 장면, 사물, 스타일 이미지까지 비오에 제공함으로써 더욱 강화된 창의적 제어와 일관성을 구현할 수 있습니다.
- 카메라 제어: 회전, 달리(dollies), 줌 등 정밀한 카메라 움직임을 설정해 완벽한 샷을 연출할 수 있습니다.
- 아웃페인팅(Outpainting): 영상의 프레임을 확장해 세로/가로 등 원하는 구도로 전환하고, 다양한 화면 크기에 맞게 장면을 지능적으로 추가해 자연스럽게 조정할 수 있습니다.
- 오브젝트 추가 및 제거: 영상에서 오브젝트를 추가하거나 제거할 수 있으며, 크기, 상호 작용, 그림자 등을 이해하고 이를 바탕으로 자연스럽고 사실적인 장면을 연출합니다.
레퍼런스 비디오 및 카메라 제어 기능은 플로우에서 현재 만나볼 수 있습니다. 이러한 새롭고 다양한 기능들은 향후 몇 주 내에 버텍스 AI API에 도입될 예정이며, 앞으로 몇 달간 더 많은 제품으로 확대될 예정입니다.
플로우: 비오 기반의 AI 영화 제작 툴
창작자와 함께, 창작자를 위해 개발된 플로우는 구글 딥마인드의 가장 진화된 모델인 비오, 이마젠, 제미나이를 통합해 영화 같은 클립, 장면, 스토리를 자유롭게 제작할 수 있는 AI 영화 제작 툴입니다. 자연어로 원하는 장면을 설명하면, 플로우는 이야기의 구성 요소(캐스팅,장소, 오브젝트, 스타일)를 한 곳에서 편리하게 관리하고, 이를 바탕으로 하나의 아름다운 장면을 완성합니다.
플로우는 오늘부터 미국 내 구글 AI 프로(Google AI Pro) 및 울트라(Ultra) 요금제 구독자에게 제공되며, 향후 더 많은 국가에서 사용할 수 있게 될 예정입니다.
이마젠 4(Imagen 4): 뛰어난 품질과 고품질 타이포그래피
구글의 최신 이마젠 모델은 속도와 정밀도를 모두 충족시키며 놀라운 이미지를 생성합니다. 이마젠 4는 섬세한 질감, 물방울, 동물의 털과 같은 미세한 디테일을 탁월하게 표현하며, 사실적인 스타일과 추상적인 스타일 모두에서 뛰어난 결과를 제공합니다. 다양한 화면 비율과 최대 2K 해상도를 지원해 인쇄 또는 발표용 자료에 활용도가 높습니다. 또한 철자와 타이포그래피 능력이 크게 향상되어 나만의 인사말 카드, 포스터, 심지어 만화까지도 손쉽게 제작할 수 있습니다.
이마젠 4는 오늘부터 제미나이 앱, 위스크(Whisk), 버텍스 AI(Vertex AI), 그리고 워크스페이스(Workspace)의 슬라이드(Slides), 비즈(Vids), 문서(Docs) 등에서 사용할 수 있습니다.
또한, 곧 이마젠 3보다 최대 10배 빠른 이마젠 4의 고속 모델을 출시될 예정입니다. 이를 통해 아이디어를 훨씬 빠르게 탐색하고 시각화해 보세요.
리리아 2(Lyria 2): 강력한 창작 기능과 끝없는 탐색
지난 4월, 구글은 ‘리리아 2(Lyria 2)’를 기반으로 한 ‘뮤직 AI 샌드박스(Music AI Sandbox)’ 에 대한 액세스를 확대했습니다. 이를 통해 뮤지션, 프로듀서, 작곡가들은 새로운 창작 가능성을 발견하고, 독창적인 음악 아이디어를 자유롭게 탐색할 수 있습니다. 구글은 음악 업계의 전문성과 피드백을 바탕으로, 창작자들에게 실질적인 도움을 제공하는 한편, AI를 예술에 접목해 다양한 가능성을 실현할 수 있도록 적극 지원하고 있습니다.
리리아 2는 강력한 창작 기능과 끝없는 음악적 탐색의 가능성을 제공하며, 현재는 유튜브 쇼츠 (YouTube Shorts) 크리에이터와 버텍스 AI 기업용 이용자에게 제공됩니다. 또한 뮤직FX DJ를 구동하는 대화형 음악 생성 모델인 ‘리리아 리얼타임(Lyria RealTime)’을 API 및 AI 스튜디오에서도 지원해 누구나 실시간으로 생성형 음악을 대화형으로 생성하고 제어하며 연주할 수 있습니다.
책임감 있는 창작과 크리에이티브 커뮤니티와의 협력
2023년 출시 이후, 신스ID(SynthID)는 100억 개 이상의 이미지, 영상, 오디오 파일 및 텍스트에 워터마크를 삽입해 해당 콘텐츠가 AI 생성물임을 식별할 수 있도록 지원했으며, 이를 통해 허위 정보나 출처 오인의 가능성을 줄이는 데 기여하고 있습니다. 비오 3, 이마젠 4, 리아아 2가 생성하는 결과물에도 지속적으로 신스ID 워터마크(SynthID watermarks)가 적용될 예정입니다.
구글은 오늘 AI 생성 콘텐츠를 식별할 수 있는 인증 포털인 신스ID 디텍터(SynthID Detector)를 출시했습니다. 이를 통해 이용자가 업로드한 콘텐츠 파일 전체 또는 일부에 신스ID가 포함되어 있는지를 판별할 수 있습니다.
구글은 모든 생성형 AI 모델을 통해 인간의 창의력을 확장하고, 아티스트와 크리에이터들이 본인의 아이디어를 그 어느 때보다 빠르고 쉽게 구현할 수 있도록 지원하는 것을 목표로 하고 있습니다.