무한한 인터랙티브 세계를 여는 ‘프로젝트 지니(Project Genie)’를 선보입니다
지난 8월, 구글은 다양하고 상호작용이 가능한 환경을 생성할 수 있는 범용 월드 모델인 '지니 3(Genie 3)'를 공개했습니다. 공개 당시 초기 단계임에도 불구하고, 신뢰할 수 있는 테스터들은 이 모델을 활용해 매우 인상적이고 매력적인 가상 세계를 구현해 냈으며, 기존에 없던 새로운 활용 사례들을 발굴하기도 했습니다. 구글은 여기서 한 발 더 나아가, 이제 몰입형 세계 창조에 특화된 전용 '인터랙티브 프로토타입(interactive prototype)'을 통해 기술의 접근성을 확장하고자 합니다.
오늘부터 미국 내 ‘구글 AI 울트라(AI Ultra)’를 구독자(18세 이상)는 ‘프로젝트 지니(Project Genie)’를 순차적으로 이용할 수 있습니다. 이용자들은 이 실험적 연구 프로토타입을 통해 자신만의 인터랙티브 세계를 직접 생성하고 탐험하며, 나아가 이를 새롭게 재구성(remix)할 수 있습니다.
월드 모델의 진화
월드 모델은 환경의 작동 원리를 시뮬레이션해 주변 환경이 어떻게 변화하고, 이용자의 행동이 그 환경에 어떤 영향을 미치는지 예측합니다. 구글 딥마인드(Google DeepMind)는 그동안 체스나 바둑처럼 특정 환경에 특화된 에이전트(agent)를 개발해왔지만, 진정한 AGI(범용 인공지능)를 구축하기 위해서는 현실 세계의 복잡성과 다양성을 이해하고 유연하게 대응할 수 있는 시스템이 필요합니다.
이러한 과제를 해결하고 AGI 달성이라는 목표를 뒷받침하기 위해 구글은 지니 3를 개발했습니다. 정적인 3D 스냅샷 안에서의 경험과 달리, 지니 3는 이용자가 이동하고 세계와 상호작용하는 모든 순간에 맞춰 앞으로 펼쳐질 경로를 실시간으로 생성합니다. 이는 역동적인 세계를 위한 물리 법칙과 상호작용을 시뮬레이션하며, 획기적인 일관성을 바탕으로 로봇 공학, 애니메이션 및 소설 모델링, 장소 탐험, 역사적 배경 체험 등 모든 실제 시나리오를 구현하도록 돕습니다.
다양한 산업 및 분야의 신뢰할 수 있는 테스터들과 함께 진행한 모델 연구를 바탕으로, 이제 다음 단계인 실험적 연구 프로토타입 '프로젝트 지니'를 선보입니다.
프로젝트 지니의 작동 원리
프로젝트 지니는 지니 3, 나노 바나나 프로(Nano Banana Pro), 제미나이(Gemini)로 구동되는 프로토타입 웹 앱으로, 이용자가 구글 월드 모델의 몰입형 경험을 직접 실험해 볼 수 있게 해주며, 이 경험은 세 가지 핵심 기능을 중심으로 이루어집니다.
1. 월드 스케치 (World sketching)
텍스트와 생성된 이미지(또는 업로드한 이미지)를 프롬프트로 사용해 생동감 넘치게 확장되는 환경을 생성해 보세요. 캐릭터와 세계를 생성하고, 걷기, 라이딩, 비행, 운전 등 탐험 방식을 자유롭게 정의할 수 있습니다.
보다 정밀한 제어를 위해 '월드 스케치' 기능을 나노 바나나 프로와 통합했습니다. 이를 통해 세계가 어떤 모습일지 미리 확인하고, 본격적으로 시작하기 앞서 이미지를 수정해 세계를 세밀하게 조정할 수 있습니다. 또한 1인칭 또는 3인칭 등 캐릭터의 시점을 정의해, 장면을 경험하는 방식을 미리 설정할 수도 있습니다.
2. 월드 탐험 (World exploration)
이용자는 생성된 세계 속에서 어디든 자유롭게 이동하며 탐험할 수 있습니다. 이용자가 움직이면, 프로젝트 지니는 이들의 행동을 기반으로 향후 경로를 실시간으로 생성합니다. 또한 생성된 세계를 가로질러 이동하는 동안 카메라 앵글을 조정할 수도 있습니다.
3. 월드 리믹스 (World remixing)
기존에 생성된 세계의 프롬프트를 바탕으로 나만의 새로운 해석을 더해보세요. 갤러리나 <랜덤 추첨 아이콘(randomizer icon)>이 추천해주는 다른 이들이 만든 세계에서 영감을 얻거나, 그 결과물 위에 자신만의 새로운 아이디어를 쌓아 올릴 수도 있습니다. 작업을 마친 후에는 여러분이 만든 세계와 탐험 과정을 영상으로 다운로드해 간직할 수 있습니다.
책임감 있는 개발
프로젝트 지니(Project Genie)는 지니 3(Genie 3)를 기반으로 구글 랩스(Google Labs)에서 진행 중인 실험적 연구 프로토타입입니다. 범용 AI 시스템을 향한 구글의 모든 노력과 마찬가지로, 구글은 모든 AI 연구에서 인류에게 실질적인 도움을 줄 수 있도록 책임감 있는 AI 구축을 최우선 사명으로 삼고 있습니다. 지니 3는 아직 초기 단계의 연구 모델이므로, 향후 개선이 필요한 몇 가지 한계점이 존재합니다.
- 생성된 세계가 실제 모습과 완전히 똑같지 않을 수 있으며, 프롬프트나 이미지, 또는 현실의 물리 법칙을 완벽히 구현하지 못할 수 있습니다.
- 캐릭터 제어가 원활하지 않거나 명령을 내릴 때 응답 지연(레이턴시)이 발생할 수 있습니다.
- 현재 영상 생성 시간은 최대 60초로 제한됩니다.
지난 8월 지니 3 모델을 발표하며 소개했던 일부 기능(예: 탐험 과정에서 세계를 실시간으로 변화시키는 프롬프트 이벤트 등)은 이번 프로토타입에는 아직 포함되지 않았습니다. 모델의 한계점과 향후 업데이트 계획에 대한 자세한 내용은 여기에서 확인하실 수 있습니다.
구글은 그동안 신뢰할 수 있는 테스터들과 긴밀히 협력해 온 성과를 바탕으로, 이번 프로토타입을 구글의 가장 진보된 AI 이용자들에게 공개하게 되어 매우 기쁩니다. 이를 통해 이용자들이 AI 연구와 생성형 미디어의 다양한 분야에서 월드 모델을 어떻게 활용하고 확장해 나갈지 더 깊이 이해할 수 있을 것으로 기대합니다.
프로젝트 지니는 오늘부터 미국 내 구글 AI 울트라(Google AI Ultra) 구독자(18세 이상)를 대상으로 순차적으로 제공되며, 추후 더 많은 지역으로 확대될 예정입니다. 이용자들이 만들어낼 무한하고 창의적인 세계를 기대하고 있으며, 앞으로 더 많은 이용자가 이러한 경험과 혁신적인 기술을 누릴 수 있도록 하는 것이 구글의 목표입니다.