[I/O 2025] 범용 AI 어시스턴트 구축을 위한 구글의 비전

지난 10년간 구글은 현대 AI의 핵심 기반을 다져오기 위해 다양한 노력을 해왔습니다. 대규모 언어 모델의 기반이 된 트랜스포머(Transformer) 아키텍처를 개척하고, 알파고(AlphaGo)와 알파제로(AlphaZero) 등 혁신적인 에이전트 시스템을 개발했습니다.
또한 이러한 방식을 통해 양자 컴퓨팅, 수학, 생명 과학, 알고리즘을 이용한 발견 등 다양한 분야에서 의미 있는 성과를 이뤄냈습니다. 구글은 지금도 기반 연구의 폭과 깊이를 계속해서 넓혀가며, 범용 인공지능(artificial general intelligence, AGI) 구현에 필수적인 다음 단계의 혁신을 창출하기 위해 지속적으로 노력하고 있습니다.
이 같은 노력의 연장선상에서 구글은 최고의 멀티모달 기반 모델인 제미나이 2.5 프로를 인간의 뇌처럼 현실 세계의 여러 측면을 시뮬레이션하고, 계획을 세우며, 새로운 경험을 상상하는 능력을 갖춘 '월드 모델(world model)'로 확장하기 위해 노력하고 있습니다.
바둑, 스타크래프트 등의 복잡한 게임을 마스터하는 에이전트 훈련과 같은 선구적인 연구부터, 단일 이미지 프롬프트만으로 상호 작용을 할 수 있는 3D 시뮬레이션 환경을 생성하는 지니 2(Genie 2)에 이르기까지, 구글은 AI의 잠재력을 현실화하기 위해 꾸준히 발전해 왔습니다.
실제로 이미 여러 제품과 사례에서 이 같은 역량을 관찰할 수 있습니다. 제미나이는 세계 지식과 추론을 활용해 자연환경을 표현하고 시뮬레이션하며, 비오(Veo)는 직관적인 물리학을 깊이 이해하고, 제미나이 로보틱스(Gemini Robotics)는 로봇이 물체를 잡고 지침을 따르며, 즉석에서 상황에 따라 유연하게 조정할 수 있도록 학습합니다.
제미나이를 월드 모델로 발전시키는 것은 새롭고, 더 보편적이며, 더 유용한 종류의 AI, 즉 범용 AI 어시스턴트 개발의 중요한 단계입니다. 범용 AI 어시스턴트란 지능적이며, 이용자의 현재 상황을 이해하고, 어떤 기기를 통해서든 요청에 따라 이용자를 대신해 행동을 수행할 수 있는 AI입니다.
프로젝트 아스트라(Project Astra)의 라이브 기능을 구글 제품에 도입
구글의 궁극적인 비전은 제미나이 앱을 일상 속 다양한 업무를 처리하고, 새로운 아이디어나 접근 방식을 제안하며, 생산성을 높이고 삶을 풍요롭게 하는 범용 AI 어시스턴트로 탈바꿈시키는 것입니다.
이러한 구글의 비전은 음성 처리, 비디오 이해, 메모리 등 구글의 연구 프로토타입인 프로젝트 아스트라(Project Astra)에서 작년에 처음 연구했던 라이브 기능에서 시작됩니다.
지난 한 해 동안 구글은 이러한 기능들을 모두가 경험할 수 있도록 제미나이 라이브에 통합하고 개선하는 동시에, 새로운 기능도 탐색해 왔습니다. 특히, 네이티브 오디오 출력을 통해 더욱 자연스러운 음성 출력을 구현하고, 메모리를 향상시키며, 컴퓨터 제어 기능을 추가했습니다.
현재 구글은 신뢰할 수 있는 테스터들로부터 피드백을 수집하고 있으며, 이러한 기능들을 제미나이 라이브 및 구글 검색, 개발자용 라이브 API(Live API) 등 다른 제품뿐만 아니라, 안경과 같은 새로운 폼팩터에도 적용하기 위해 노력하고 있습니다.
구글은 이 모든 과정에서 안전성과 책임감을 최우선 가치로 삼고 있습니다. 지금까지 진행한 가장 큰 규모의 윤리적 영향 예측 프로젝트를 통해, 첨단 AI 어시스턴트와 관련된 윤리적 문제들을 깊이 탐구했으며, 이러한 노력은 앞으로도 는 구글의 연구, 개발 및 배포 전반에 걸쳐 지속적으로 반영될 예정입니다.
이용자를 위해 멀티태스킹할 수 있는 AI 구축
구글은 또 다른 연구 프로토타입인 ‘프로젝트 마리너(Project Mariner)’를 통해, AI 에이전트 기술이 이용자의 멀티태스킹을 어떻게 도울 수 있는지에 대해 탐구하고 있습니다. 프로젝트 마리너는 브라우저를 시작으로 인간과 AI 에이전트 간 상호작용의 미래를 탐색하는 연구 프로토타입입니다.
지난 12월 프로젝트 마리너 공개 이후, 구글은 신뢰할 수 있는 테스터 그룹과 긴밀히 협력해 피드백을 수집하고 실험적 기능을 개선해 왔습니다.
현재 프로젝트 마리너에는 한 번에 최대 10가지의 작업을 동시에 처리할 수 있는 에이전트 시스템이 적용되어 있습니다. 이 에이전트들은 정보 검색, 예약, 구매, 연구 등 다양한 작업을 동시에 수행할 수 있습니다.

업데이트된 프로젝트 마리너는 미국 내 구글 AI 울트라(Google AI Ultra) 구독자 대상으로 제공되며, 올해 안으로 일부 기능을 더 많은 구글 제품에 적용할 계획입니다.
구글 검색 및 제미나이 앱의 에이전트 기능에 대해 더 자세히 알아보세요.
이러한 혁신과 노력을 통해 구글은 더욱 개인화되고, 능동적이며, 강력한 AI를 구축하고 있습니다. 이러한 기술은 단순히 우리의 삶을 편리하게 만드는 데 그치지 않고, 과학 발전의 속도를 가속화하고, 새로운 발견과 경이로움의 시대를 여는 데 중요한 역할을 할 것입니다.