[I/O 2023] PaLM 2를 소개합니다
이 블로그는 Google Keyword 블로그(영문)에서도 확인하실 수 있습니다.
지난 10년 간 인공지능(AI) 분야에서 주목을 받은 순간들을 되돌아 보면, 구글이 많은 부문을 선도해 왔다는 것을 알 수 있습니다. 파운데이션 모델 부문에서 구글의 혁신적인 노력은 현재 수십억 명의 사람들이 일상생활에서 사용하고 있는 AI 기반 제품과 산업의 기반을 만들어 왔습니다. 이러한 기술들은 계속해서 발전을 거듭하고 있으며, 의료 분야부터 인간 창의성의 영역에 이르기까지 광범위한 분야에서 다양한 방식으로 활용될 수 있는 큰 잠재력을 지니고 있습니다.
구글은 지난 수 십 년 동안 AI를 개발하면서 신경망을 확장할수록 많은 것들이 가능해짐을 확인할 수 있었습니다. 더욱 큰 규모의 모델에서 생성해낼 수 있는 놀랍고도 반가운 역량들을 이미 확인한 바 있습니다.
그러나 연구를 거듭할 수록 연구 창의력이야말로 훌륭한 머신러닝 모델을 구축하는 데 필수적이며, ‘클수록 더 좋다’는 말로 간단히 정리될 수 있는 것이 아님을 알게 되었습니다. 또한 모델을 설계하고 훈련하는 방법을 발전시켜 나가면서 멀티모달(multimodality)의 활용법과 그 과정에서 피드백의 중요성, 그리고 모델을 보다 더 효율적으로 구축하는 법을 배웠습니다. 이는 구글이 AI의 최첨단 기술을 지속적으로 발전시키는 동시에 사람들의 일상 생활에 실질적인 혜택을 줄 수 있는 모델을 구축하는 데에 있어 필수적인 구성 요소입니다.
PaLM 2
PaLM의 다음 세대 언어 모델인 PaLM 2를 소개합니다. PaLM 2는 향상된 다중 언어와 추론 능력, 그리고 코딩 능력을 갖춘 최첨단 언어 모델입니다.
- 다중언어: PaLM 2는 100개 이상의 언어에 걸쳐 다국어 텍스트를 학습했습니다. PaLM 2의 다중언어는 그동안 해결하기 어려운 문제였던 다양한 언어의 미묘한 뉘앙스를 이해, 생성, 그리고 번역할 수 있으며, 이는 속담과 시, 수수께끼도 포함합니다.
- 추론 능력: PaLM 2의 광범위한 데이터셋은 과학논문과 수학적 표현이 포함된 웹 페이지 등을 포함합니다. 따라서 논리와 상식적 추론, 수학 등에서 더욱 향상된 역량을 지니고 있습니다.
- 코딩: PaLM 2는 공개되어 있는 방대한 양의 자연어와 소스 코드 데이터셋으로 사전 훈련되었습니다. 파이썬(Python)과 자바스크립트(JavaScript) 등 널리 사용되는 프로그래밍 언어에 뛰어날 뿐만 아니라, 프롤로그(Prolog), 포트란(Fortran), 베릴로그(Verilog)와 같은 언어에 특화된 코드를 생성할 수도 있습니다.
다양한 규모의 모델 제품군
PaLM 2는 더 빠르고, 효율적이며, 유능한 모델을 다양한 규모로 제작할 수 있다는 점에서 획기적입니다. PaLM 2는 가장 작은 사이즈인 Gecko부터 Otter, Bison, 그리고 가장 큰 Unicorn 등 네 가지 사이즈로 출시됩니다. Gecko는 매우 가벼워서 오프라인은 물론 모바일 기기에서도 작업이 가능합니다. 테스트에서 삼성 갤럭시 최신 모델은 초당 20개 이상의 토큰을 전달했는데, 이는 인터랙티브 애플리케이션을 구동할 때 충분히 빠른 속도입니다. 이처럼 다재다능한 PaLM 2는 모든 분야의 제품들을 지원하고, 더욱 많은 사람들을 돕도록 세부적인 조정이 가능합니다.
25개의 구글 제품 및 기능 지원
오늘 I/O에서는 PaLM 2가 지원하는 25개의 신규 제품과 기능이 공개되었습니다. 구글의 여러 팀들은 이미 PaLM 2를 활용하고 있습니다. 이는 PaLM 2가 가장 최신의 AI 기능들을 구글 제품은 물론 전 세계의 사람들에게 직접 제공하고 있음을 의미하며, 다음 예시들에서 확인할 수 있습니다:
- PaLM 2의 향상된 다중 언어 기능은 오늘부터 바드(Bard)가 새로운 언어들로 확장될 수 있도록 지원 합니다. 또한, 최근 발표된 코딩 업데이트의 작업을 가능케 하고 있습니다.
- 지메일과 구글 문서에서 사용할 수 있는 워크스페이스(Workspace) 기능에는 PaLM 2의 기능이 적용되어 사람들이 더욱 빠른 속도로 업무를 처리할 수 있게 합니다.
- 의료 전문 지식을 지닌 건강 연구 팀이 학습시킨 Med-PaLM 2는 방대한 양의 의학 텍스트로부터 수집한 인사이트를 요약하고, 관련 질문에 대한 답변을 제공합니다. Med-PaLM 2는 의학 분야에서 가장 최첨단의 결과를 학습했으며, 미국 의료면허시험 모의 테스트에서 ‘전문가’ 수준을 보인 최초의 대규모 언어 모델입니다. 현재는 엑스레이와 유방 촬영(맘모그램) 등의 정보를 종합해 환자들의 치료 결과를 개선시킬 수 있도록 멀티모달 기능을 추가하고 있습니다. 이번 여름에는 Med-PaLM 2를 소수의 클라우드 고객들에게 공개하여 피드백을 받고, 더욱 안전하고 유용한 이용 사례를 수집할 예정입니다.
- Sec-PaLM은 보안 관련 사례를 PaLM 2에 학습시킨 보안 특화 버전으로, 사이버보안 분석에 있어 큰 잠재력을 보유하고 있습니다. 구글 클라우드에서 사용 가능한 Sec-PaLM은 AI를 활용해 잠재적인 악성 스크립트의 활동을 분석하고 설명하는 데 도움을 주며, 어떤 스크립트가 실제로 사람과 조직에 위협이 되는지를 빠른 시간 내에 더욱 잘 탐지할 수 있습니다.
- 3월부터는 클라우드 고객들과 개발자들에게 PaLM API를 프라이빗 프리뷰 버전으로 선보이고 있습니다. 오늘부터 개발자들은 PaLM 2 모델 사용 등록을 할 수 있으며, 고객들은 엔터프라이즈용의 프라이버시와 보안성, 거버넌스를 갖춘 Vertex AI에서 PaLM API를 사용할 수 있습니다. PaLM 2는 또한 이용자들이 더욱 빠르게 학습, 구축, 그리고 운영할 수 있도록 설계된 생성형 AI 어시스턴트인 ‘구글 클라우드를 위한 듀엣 AI(Duet AI for Google Cloud)’를 지원하고 있습니다.
AI의 미래를 발전시키기 위한 노력
PaLM 2는 다양한 규모와 속도의 고성능 모델이 어떤 영향을 미치는지, 그리고 다목적의 AI 모델이 어떤 실질적인 혜택을 제공하는지를 보여줍니다.