게임에서 생물학, 그 너머까지: 알파고가 남긴 10년의 발자취
10년 전, 구글 딥마인드의 AI 시스템인 알파고(AlphaGo)는 고도로 복잡한 바둑 경기에서 세계 챔피언을 꺾은 최초의 프로그램이 되었습니다. 이러한 성취는 오늘날 인공지능(AI) 시대의 서막을 알리는 신호탄이 되었습니다. 이는 당시 전문가들이 예상했던 시기를 10년이나 앞당긴 기념비적인 이정표였습니다. 전설이 된 단 하나의 수, '37수(Move 37)'를 통해 알파고는 AI의 거대한 잠재력을 증명했으며, 구글은 이를 통해 이제 현실 세계의 과학적 난제들을 해결할 기술적 토대를 갖췄음을 알렸습니다.
오늘날 이러한 비약적 발전은 범용 인공지능(AGI)을 향한 여정에서 시스템을 구축하는 구글의 연구에 지속적인 영감을 주고 있습니다. 구글 딥마인드는 AGI가 인류 역사상 가장 중대한 기술이자, 과학, 의학, 그리고 생산성을 진보시킬 궁극적인 도구가 될 것이라고 믿습니다.
창의성의 불꽃
2016년, 서울에서 열린 알파고와 세계 바둑 챔피언 이세돌 사범의 대결을 2억 명 이상의 사람들이 지켜봤습니다. 이 경기를 상징하는 순간은 단연 2국의 '37수'였습니다. 이는 전문가들이 처음에는 실수라고 생각할 정도로 파격적이고 관습을 벗어난 수였으나, 결국 승부를 결정짓는 결정타가 되었습니다. 약 100수 뒤, 그 돌은 알파고가 승리하기 위해 필요한 바로 그 자리에 놓여 있었습니다. 이는 인간 전문가의 방식을 모방하는 데 그치지 않고, 완전히 새로운 전략을 발굴하는 AI 시스템의 놀라운 통찰력과 역량을 보여준 사례였습니다.
<유튜브에서 알파고 다큐멘터리 바로보기>
바둑은 그 압도적인 복잡성 때문에 오랫동안 AI 연구의 시험장이 되어왔습니다. 바둑판 위에서 가능한 경우의 수는 10170(10의 170승)가지로, 이는 관측 가능한 우주에 존재하는 원자의 수보다 훨씬 많습니다.
이처럼 방대한 경우의 수를 처리하기 위해, 알파고는 딥마인드가 개척한 AI 방법론인 강화 학습(Reinforcement Learning)과 고도화된 탐색(Advanced Search) 기능을 결합한 심층 신경망을 사용했습니다.
알파고는 수십만 번의 자가 대국을 통해 유망한 수들을 학습했고, 승리 확률이 높은 전략을 강화하며 스스로 발전했습니다. 시스템은 승리 가능성 있는 경로들만을 선택적으로 고려했고, 이렇게 압축된 선택지 중에서 승리로 이끌 확률이 가장 높은 수를 정확히 찾아냈습니다.
알파고 이후, 구글 딥마인드는 아무런 사전 데이터 없이 무작위 대국만으로 학습해 역사상 가장 강력한 플레이어가 된 ‘알파고 제로(AlphaGo Zero)’를 개발했으며, 그 후 시스템을 더욱 일반화하여 ‘알파제로(AlphaZero)’를 개발했습니다. 알파제로는 바둑, 체스, 쇼기(일본 장기)를 포함해 모든 2인용 완전 정보 게임(2-player perfect information game)을 기초부터 스스로 학습해 마스터했습니다. 오직 게임의 규칙 외에는 아무런 사전 지식 없이 시작한 알파제로는 불과 몇 시간 만에 체스를 마스터했으며, 최고의 인간 플레이어들뿐만 아니라 스톡피쉬(Stockfish)와 같은 당시 최고 수준의 전문 체스 프로그램들마저 꺾었습니다. 체스가 이런 프로그램들의 도움으로 고도로 분석되어 왔음에도 불구하고, 바둑에서 그랬던 것처럼 알파제로는 흥미롭고 새로운 전략을 계속해서 고안해 냈습니다.
이는 서울에서의 대국에서 승리한 순간, 제가 확신했던 사실을 다시 한번 증명해 주었습니다. 바로 이 기술이 우리의 진정한 목표인 ‘과학적 비약(scientific breakthroughs)’에 적용될 준비가 되었다는 사실 말입니다.
과학적 혁신의 촉매제
바둑판이라는 방대한 탐색 공간을 성공적으로 분석해 낼 수 있음을 증명함으로써, 알파고는 AI가 물리 세계의 광대한 복잡성을 더 깊이 이해하는 데 도움을 줄 수 있다는 잠재력을 입증했습니다. 구글 딥마인드는 그 첫걸음으로 질병 이해와 신약 개발에 필수적인 정보인 단백질의 3차원 구조 예측, 즉 50년간 풀리지 않았던 과학계의 거대한 난제인 '단백질 폴딩(protein folding)' 문제 해결에 착수했습니다.
2020년, 구글 딥마인드는 마침내 '알파폴드 2(AlphaFold 2)' 시스템을 통해 이 오랜 과학적 난제를 해결했습니다. 나아가 과학계에 알려진 2억 개의 모든 단백질 구조를 예측해 이를 오픈소스 데이터베이스로 구축하고, 전 세계 과학자들에게 무료로 공개했습니다. 오늘날 전 세계 300만 명 이상의 연구자들이 말라리아 백신부터 플라스틱 분해 효소에 이르기까지, 다양한 중요 연구들을 가속화하는 데 이 알파폴드 데이터베이스(AlphaFold database)를 활용하고 있습니다. 그리고 2024년, 전체 알파폴드 팀을 대표하여 이 프로젝트를 이끈 공로로 존 점퍼(John Jumper)와 제가 노벨 화학상을 공동 수상한 것은 일생일대의 영광이었습니다.
알파고의 승리 이후, 우리는 이 혁신적인 접근 방식을 과학 및 수학의 여러 다른 분야에도 적용해 왔습니다.
- 수학적 추론(Mathematical reasoning): 알파고 구조의 가장 직계 후손인 ‘알파프루프(AlphaProof)’는 언어 모델과 알파제로의 강화 학습 및 탐색 알고리즘을 결합해 공식적인 수학 명제를 증명하는 법을 배웠습니다. 알파지오메트리 2(AlphaGeometry 2)와 함께 이 시스템은 국제수학올림피아드(IMO)에서 은메달 수준의 성적을 거둔 최초의 시스템이 되었습니다. 이는 알파고의 방법론이 고도의 수학적 추론을 풀어내고, 나아가 가장 뛰어난 범용 모델의 기반을 다질 수 있음을 입증했습니다. 구글의 가장 거대하고 뛰어난 역량을 갖춘 모델인 제미나이(Gemini)는 최근 여기서 한 걸음 더 나아갔습니다. 제미나이의 딥 씽크(Deep Think) 모드의 고급 버전은 알파고에서 영감을 얻은 접근 방식을 활용해 2025년 국제수학올림피아드(IMO)에서 금메달 수준의 성과를 달성했습니다. 이후 딥 씽크는 과학 및 공학 전반에 걸쳐 훨씬 더 복잡하고 답이 정해져 있지 않은 개방형(open-ended) 난제들에 폭넓게 적용되고 있습니다.
- 알고리즘 발견(Algorithm discovery): 알파고가 게임에서 최선의 수를 찾은 것처럼, 코딩 에이전트인 ‘알파이볼브(AlphaEvolve)’는 컴퓨터 코드의 세계를 탐색해 더 효율적인 알고리즘을 발견합니다. 이 시스템은 현대 거의 모든 신경망의 기반이 되는 행렬 곱셈의 새로운 방식을 찾아내며 자신만의 '37수의 순간'을 맞이했습니다. 알파이볼브는 현재 데이터 센터 최적화부터 양자 컴퓨팅에 이르는 다양한 문제에서 테스트되고 있습니다.
- 과학적 협업(Scientific collaboration): 구글은 알파고를 통해 개척한 탐색 및 추론 원리를 AI 코사이언티스트(AI co-scientist)에 통합하고 있습니다. 이 시스템은 에이전트들이 과학적 아이디어와 가설을 '토론'하게 함으로써, 데이터의 패턴을 식별하고 복잡한 문제를 해결하는 데 필요한 정밀한 사고를 수행합니다. 임페리얼 칼리지 런던(Imperial College London)의 검증 연구에서 이 AI는 수십 년간의 문헌을 분석해 실제 연구자들이 수년에 걸쳐 실험적으로 입증한 항생제 내성 가설과 동일한 결론에 스스로 도달했습니다.
구글은 또한 게놈 이해, 핵융합 에너지 연구, 기상 예측 개선 등 다양한 분야에서 AI를 활용해 진전을 이루고 있습니다.
구글의 과학 모델들이 놀라운 성과를 내고 있지만, 이들은 여전히 고도로 전문화되어 있습니다. 무한한 청정 에너지를 생산하거나 현재 우리가 알지 못하는 질병을 해결하는 등의 근본적인 돌파구를 마련하려면, 다양한 학문 분야 간의 숨겨진 구조와 연결 고리를 파악하고 최고의 과학자들처럼 새로운 가설을 세울 수 있도록 돕는 범용 AI 시스템이 반드시 필요합니다.
지능의 미래
AI가 진정한 의미의 '일반 지능'을 갖추려면 물리적 세계를 이해해야 합니다. 구글은 가장 거대하고 뛰어난 역량을 지닌 AI 모델 제미나이를 초기 단계부터 멀티모달(multimodal)로 설계했습니다. 이를 통해 제미나이는 언어뿐만 아니라 오디오, 비디오, 이미지, 코드까지 복합적으로 처리하고 추론하며 월드 모델(model of the world)을 구축합니다.
이러한 다양한 모달리티를 넘나들며 사고하고 추론하기 위해, 최신 제미나이 모델들은 구글이 알파고와 알파제로를 통해 개척한 기술의 일부를 활용하고 있습니다.
다음 세대의 AI 시스템은 전문화된 툴들을 호출하고 활용할 수 있는 능력도 갖춰야 합니다. 예를 들어, 모델이 단백질 구조를 알아야 할 때 알파폴드를 직접 사용하는 방식입니다.
구글은 제미나이의 월드 모델(world models), 알파고의 탐색 및 계획(search and planning) 기술, 그리고 전문화된 AI 툴 활용 능력의 결합이 AGI 실현에 결정적인 역할을 할 것으로 전망합니다.
진정한 창의성은 이러한 AGI 시스템이 반드시 증명해야 할 핵심 역량입니다. 37수는 기존의 틀을 깨는 AI의 잠재력을 엿볼 수 있는 순간이었지만, 진정한 의미의 독창적 발명을 위해서는 더 높은 차원의 능력이 요구됩니다. 알파고가 훌륭하게 해냈듯이, 새로운 바둑 전략을 고안하는 수준을 넘어 바둑만큼이나 깊이 있고 우아하며 탐구할 가치가 있는 게임 자체를 온전히 발명해낼 수 있어야 합니다.
알파고의 전설적인 승리로부터 10년이 지난 지금, 구글의 궁극적인 목표가 눈앞으로 다가왔습니다. 37수에서 처음 피어난 창의성의 불꽃은 이제 AGI로 향하는 길을 닦는 혁신을 촉진하며, 과학적 발견과 진보의 새로운 황금기를 열고 있습니다.