인공지능(AI)을 활용해 구글이 더 많은 사람들의 삶을 개선하는 3가지 방법

2022년 11월 7일

제프 딘(Jeff Dean)

구글 리서치 수석 부사장 겸 수석 펠로우

이 블로그는 구글 The Keyword 블로그(영문)에서도 확인하실 수 있습니다.

수십 년에 걸친 연구를 통해 인공지능(AI)은 급속한 발전을 이루었습니다. 그리고 구글은 오늘 AI를 활용해 사람들에게 도움을 줄 수 있는 새로운 3가지 방안을 발표합니다.

제가 신경망(neural networks)을 처음 접한 것은 1990년 대학생 시절이었습니다. 기술 자체는 인상적이었으나 실제로 중요한 작업을 수행할 정도는 아니었습니다. 그 당시 AI 커뮤니티의 많은 사람들은 신경망의 잠재력에 대해 큰 기대를 가지고 있었습니다. 그리고 저도 무척 기대를 했었습니다. 당시 저는 병렬 연산을 사용한 신경망 훈련에 대한 졸업 논문을 썼는데, 신경망 훈련을 위해서는 32배 정도의 더 많은 연산 역량 정도가 필요하다고 생각했습니다. 하지만 이는 완전히 잘못된 생각이었고, 실제로는 100만 배의 연산 역량이 필요했습니다.

그로부터 21년 후, 대폭 강화된 연산 역량을 기반으로 신경망에 대한 새로운 시도를 해보았습니다. 2011년, 저를 포함한 구글의 여러 직원들은 온라인 동영상에서 무작위로 선택된 수백만 개의 프레임을 사용하여 초대형 신경망을 훈련하기 시작했습니다. 결과는 아주 놀라웠습니다. 명시적인 훈련 없이도 시스템은 자동으로 다양한 대상(특히 고양이를 말이죠. 인터넷에는 고양이 영상이 무척이나 많답니다.)을 인식하는 방법을 학습했습니다. 이 연구 결과는 AI에 대한 혁신적인 발견이었고, 구글과 다른 기업에서도 여전히 이어지고 있는 성공적인 사례 중 하나라고 할 수 있습니다.

이러한 이야기를 말씀드리는 이유는 AI의 발전이 지금 당장은 빠르게 느껴질 수 있지만, 오랜 발전 과정에서 비롯된 것임을 알려 드리기 위해서 입니다. 사실, 2012년 이전에는 컴퓨터가 대화나 글을 보고, 듣고, 이해하는 데 큰 어려움을 겪었습니다. 지난 10년 동안 우리는 AI 영역에서 특히나 빠른 발전을 이루어 낸 것입니다.

그리고, 기술적인 측면 뿐만 아니라 책임감을 갖고 전 세계 사람들을 돕는 기술을 구현한다는 면에서 구글이 선도하여 이루어 낸 AI의 많은 발전에 대해 기쁘게 생각합니다. 여기에는 구글 클라우드(Google Cloud), 픽셀 폰(Pixel phones)에서 구글 검색(Google Search)에 이르는 구글의 다양한 제품들과 여러 과학 분야 및 기타 인류의 업적에 AI를 활용하는 것이 포함됩니다.

구글은 AI가 새로운 기술인 만큼 발생할 수 있는 도전과제를 인지하고 있습니다. 구글은 일련의 AI 원칙(AI Principles)을 발표하고 운영한 최초의 기업이며 실제로 이러한 원칙을 준수함으로써 (누군가는 반대할 수 있지만) 모든 사람들에게 도움이 되는 기술을 빠르게 발전시키는 데 집중할 수 있었습니다. AI를 올바르게 사용하기 위해서는 연구원 뿐만 아니라 관련 분야 전문가, 개발자, 커뮤니티 구성원, 기업, 정부 및 이용자들이 참여하는 공동의 노력이 필요합니다.

그럼 이번에 새롭게 발표되는 AI의 3가지 혁신적 영역에 대해 말씀드리겠습니다. 첫째는 사람들이 더 많은 언어로 기술을 활용하도록 AI를 사용하는 것입니다. 둘째는 AI가 창의성을 강화할 수 있는 방법을 모색하는 것, 그리고 세 번째는 기후 변화 대응과 같은 공익을 위한 AI 활용입니다.

1. AI를 활용한 1,000개의 언어 지원

언어는 사람들이 세상을 이해하고 소통하는 가장 기본적인 방법입니다. 그리고 사람들이 기술을 사용하는 데 있어서도 가장 자연스러운 방식이기도 합니다. 현재 전 세계적으로 7,000가지가 넘는 언어가 사용되지만, 오늘날 온라인에서 실제로 노출되는 언어는 소수에 불과합니다. 즉, 웹상의 텍스트를 기반으로 언어 모델을 훈련하는 기존 접근 방식으로는 전세계 사람들이 소통하는 방식의 다양성을 따라가지 못합니다. 이는 누구나 어디서든 전 세계의 정보에 접근하여 활용할 수 있도록 지원하겠다는 구글의 사명을 실현하는 데 어려움으로 작용했습니다.

이런 이유로, 구글은 ‘1,000개의 언어 지원 이니셔티브(1,000 Languages Initiative)’를 발표합니다. 이는 전 세계적으로 가장 많이 사용되는 1,000가지 언어를 지원하는 AI 모델을 구축하여 각 지역 사회 내 소외된 사람들을 더 많이 포용하겠다는 구글의 원대한 포부입니다. 이 계획을 실현하기까지는 오랜 기간이 걸리고 매우 야심 찬 계획이라 할 수도 있습니다. 그러나 구글은 그동안 의미 있는 진전을 이뤄냈으며 이번 발표를 통해 앞으로 가야할 길을 명확하게 확인했습니다. 기술을 사용하는 방식부터 기술로 실현가능한 영역에 이르기까지, 기술은 빠르게 변화하고 있습니다. 점점 더 많은 사람들이 이미지, 비디오, 음성 등의 새로운 방식을 통해 정보를 찾고 공유하고 있습니다. 현재 가장 발전된 언어 모델은 멀티 모달리티(multi-modality) 방식입니다. 다양한 형태의 정보를 활용할 수 있게 되고, 이러한 엄청난 변화를 통해 새로운 기회를 마주하게 될 것입니다.

1,000개의 언어 지원 이니셔티브 및 멀티 모달리티 방식을 실현하는 과정 중 하나로 구글은 ‘유니버설 스피치 모델(Universal Speech Model, USM)’을 개발하였습니다. USM은 400여개 이상의 언어를 지원함으로써 현재 단일 스피치 모델로는 가장 많은 언어를 지원하고 있습니다. 지원 언어를 더욱 확대하고자 구글은 전 세계 커뮤니티와 협력하여 대표적인 음성 데이터를 확보하고 있습니다. 일례로 최근 구글은 아프리카의 연구원 및 기관들과 긴밀히 협력함으로써, 지보드(Gboard) 음성 타이핑 기능에 9개의 아프리카 언어를 추가하였습니다. 그리고 남아시아 지역에서는 지방 정부, NGO 및 학술 기관과 적극적으로 협력하여 모든 지역 방언과 언어의 대표적인 오디오 샘플을 수집하고 있습니다.

2. AI를 활용한 크리에이터 및 아티스트의 역량 강화

AI 기반 생성형 모델은 이용자가 창의성을 발휘할 수 있도록 돕는 잠재력을 갖추고 있으며, 다양한 문화권의 이용자들이 새로운 방식으로 비디오, 이미지 및 디자인을 사용하여 자신을 표현할 수 있도록 지원할 수 있습니다.
구글의 연구원들은 이마젠(Imagen)과 파티(Parti)를 활용해 이용자들이 다른 인공지능 모델보다 선호하는 이미지를 생성하면서, 품질 면에서 이 분야를 선도하는 모델을 개발하기 위해 열심히 노력해 왔습니다. 또한 구글은 최근 두 가지 혁신 기술을 추가로 발표한 바 있습니다. 하나는 비디오 시퀀스에 적용된 디퓨전 모델인 이마젠 비디오(Imagen Video)이고, 다른 하나는 텍스트 프롬프트 시퀀스를 통해 일관된 내용의 비디오를 생성하는 모델인 페나키(Phenaki)입니다. 관련 부서들은 이 두 모델을 모두 사용하여 영상을 제작하기 위해 협력해 왔으며, 오늘 처음으로 AI로 생성한 초고해상도 영상을 소개할 수 있게 되었습니다.

AI 테스트 키친(AI Test Kitchen)은 사람들이 새로운 AI 기술에 대해 배우고, 경험하고, 피드백을 전달할 수 있는 데모 앱입니다. 구글은 곧 AI 테스트 키친에 텍스트-이미지 변환(Text-to-image) 생성 기술을 도입할 예정입니다. 새롭게 업데이트되는 AI 테스트 키친에서 많은 이용자들이 이러한 데모에 대한 피드백을 공유해주기를 기대하고 있습니다. AI 테스트 키친에서는 텍스트 프롬프트를 사용해 테마 도시를 건설할 수 있는 ‘시티드리머(City Dreamer)’를 비롯하여 움직이고, 춤추고, 점프할 수 있는 친근한 몬스터 캐릭터를 디자인할 수 있는 ‘워블(Wobble)’을 사용할 수 있습니다.

텍스트에서 2D 이미지로만 변환 가능한 것이 아닙니다. 텍스트를 3D로 변환할 수 있는 드림퓨전(DreamFusion)을 사용하면 어떤 각도에서도 볼 수 있고 모든 3D 환경에 합성할 수 있는 3차원 모델을 생성할 수 있습니다. 또한 연구원들은 오디오만 들어도 실제 같은 음성과 피아노 음악을 생성하는 방법을 학습하는 모델인 오디오LM(AudioLM)을 통해 오디오 생성 분야에서 엄청난 발전을 이루고 있습니다. 언어 모델이 텍스트 프롬프트 다음에 오는 단어와 문장을 예측할 수 있는 것과 동일한 방식으로 오디오LM은 오디오 프롬프트 이후에 나올 오디오를 예측할 수 있습니다.

구글은 전 세계의 창작 커뮤니티와 협력하면서 이러한 툴을 개발하고 있습니다. 예를 들어, 구글은 대화형 AI 모델인 람다(LaMDA)에 구축된 워드크래프트(Wordcraft)를 사용해 작가들과 협력하면서 AI 기반 텍스트 생성을 실험하고 있습니다. ‘워드크래프트 라이터 워크샵(Wordcraft Writers Workshop)’이라는 프로젝트 페이지에서 관련 스토리를 확인할 수 있습니다.

3. AI를 활용한 기후 변화 및 의료서비스 문제 해결

AI는 사람들이 새로운 문제 상황에 대응할 수 있도록 지원하는 것은 물론 기후 변화의 영향을 완화할 수 있는 큰 잠재력을 가지고 있습니다. 가장 심각한 문제 중 하나는 바로 산불 화재 입니다. 산불 화재는 수십만 명의 사람들에게 영향을 미치며, 그 빈도와 규모가 점점 더 증가하고 있습니다.

오늘, 구글이 AI 모델을 훈련하여 실시간으로 산불을 식별하고 추적하면서 산불의 심화 및 확산 방식을 예측할 수 있도록 위성 사진 활용 방식을 더욱 발전시켰다는 기쁜 소식을 알려드리고자 합니다. 구글은 호주, 미국, 캐나다 및 멕시코에서 산불 화재 추적 시스템을 선보였고, 지난 7월 이후 미국과 캐나다에서 30 건 이상의 대규모 산불 화재를 추적하고, 구글 검색과 지도에서 700만 회 이상 노출시켜 이용자 및 소방당국에 정보를 제공하였습니다.

이에 더해, 구글은 홍수 예보를 위해 AI를 사용하고 있습니다. 홍수는 기후 변화로 악화된 극심한 기후 패턴이라고 할 수 있습니다. 우리는 해당 기술을 활용해 이미 지역 사회가 홍수가 언제 날 것이고 수심이 얼마나 될 것인지 예측할 수 있도록 지원하였습니다. 2021년에는 구글 검색과 지도를 통해 2천3백만 명의 사람들에게 1억 1천5백만 번의 홍수 경보를 전송함으로써 수많은 목숨을 구하기도 했습니다. 오늘 구글은 이제 이러한 기술을 두 국가에 이어 남미(브라질, 콜롬비아), 아프리카(부르키나파소, 카메론, 차드, 콩고민주공화국, 코트디부아르, 가나, 기니, 말라위, 나이지리아, 시에라리온, 앙골라, 남수단, 나미비아, 라이베리아, 남아프리카) 및 남아시아(스리랑카) 지역으로 확대하여 제공합니다. 구글은 가용한 데이터가 적은 지역에서 이러한 재해 경고 기능 제공할 수 있도록 '트랜스퍼 학습(transfer learning)'이라고 불리는 AI 기술을 사용하였습니다. 추가로 구글은 홍수 허브(FloodHub)를 새롭게 오픈합니다. 홍수 허브는 홍수 발생 시점과 장소를 알려주는 새로운 모델로, 구글 검색과 지도를 통해 더 많은 사람들이 홍수 발생 시 안전한 곳으로 대피할 수 있도록 도울 수 있습니다.

마지막으로, AI는 낙후된 지역의 의료서비스 접근성을 높여주고 있습니다. 예를 들어, 구글은 AI를 통해 낮은 비용으로 초음파 기기의 검사 결과를 읽고 분석함으로써 임신 초기에 확인해야 하는 문제들에 대한 정보를 제공할 수 있도록 연구하고 있습니다. 또한, 구글의 자동화된 망막 질환 평가(ARDA) 툴을 활용해 당뇨병성 망막증 검사 접근성을 더욱 확대할 수 있도록 간병인들과 공공 보건 기관들과도 지속적으로 협업할 예정입니다. 이미 ARDA를 활용한 검사와 전향적 연구를 통해 인도, 태국, 독일, 미국 및 영국 등의 지역에서 15만명의 환자들을 검사했으며, 그 중 반 이상이 2022년 한 해에만 진행된 건입니다. 나아가, 구글은 AI 기술을 통해 스마트폰이 이용자의 호흡과 심박을 감지하는 데 어떻게 도움이 될 수 있는지 연구하고 있습니다. 이는 구글 헬스(Google Health)의 큰 비전의 일부이며, 구글 헬스는 스마트폰을 통해 모든 사람에게 의료 서비스의 접근성을 더 높일 수 있도록 노력하고 있습니다.

앞으로의 AI 기술

신경망 아키텍처 부문에서 구글이 이루어 낸 발전, 머신러닝 알고리즘, 머신러닝을 위한 하드웨어에 대한 새로운 접근 방식은 AI가 현실 세계 수십억 명의 사람들에게 있어 매우 중요한 문제들을 해결할 수 있도록 도왔습니다. 그리고 앞으로도 더 많은 발전들이 이루어질 것입니다. 오늘 소개해 드린 것은 다름아닌 미래를 위한 희망적인 비전이라고 할 수 있습니다. AI는 기술이 얼마나 유용할 수 있는지에 대해 다시금 생각하게 해줍니다. 새로운 기술과 역량을 발견하기 위한 구글의 여정에 모두가 함께 하며 기술이 세상 모든 사람들의 삶을 개선할 수 있기를 기대해봅니다.

인공지능(AI)을 활용해 구글이 더 많은 사람들의 삶을 개선하는 3가지 방법

관련 게시글