제미나이 해커톤 장민수 님: "단 7시간 만에 공간을 이해하는 AI 매핑 솔루션 완성"
지난 2월 28일, 서울에서 구글 최신 AI 모델 ‘제미나이 3(Gemini 3)’를 활용해 실제 서비스를 구현하는 '제미나이 3 서울 해커톤(Gemini 3 Seoul Hackathon)'이 성황리에 개최되었습니다. 이번 대회는 총 1,515명의 지원자 중 사전 심사를 통과한 219명의 실력 있는 개발자들이 참가해, 개인 및 팀(최대 4인) 단위로 총 111개의 혁신적인 프로젝트를 최종 제출했습니다.
특히 단순한 아이디어 구상을 넘어, 행사 당일 구글 클라우드 플랫폼(GCP) 상에서 실제 구동 가능한 애플리케이션을 완성해야 하는 ‘프로덕션 스프린트(The Production Sprint)’ 테마로 치열한 경합이 벌어졌습니다. 에이전틱(Agentic) 기술과 제미나이 3의 역량을 극한으로 끌어올려 최종 단계까지 오른 영광의 3인 중, 압도적인 1인 개발의 힘을 보여주며 당당히 최종 1위에 오른 장민수 님을 만나 그의 혁신적인 프로젝트 'GeminiSpace'의 생생한 개발 스토리를 들어보았습니다.
Q. 자기소개 부탁드립니다.
장민수 님: 안녕하세요, 장민수입니다. 제가 제미나이(Gemini)와 처음 친해진 계기는 다분히 개인적이었습니다. 작년 겨울, 아내를 위해 집에서 일본어 교육용 게임 앱을 사이드 프로젝트로 만들면서 구독하기 시작했거든요. 백엔드 로직부터 프론트엔드의 UI 에셋, 홍보용 영상까지 단 하나의 구독 모델로 모두 해결할 수 있는 최선의 선택이었고, 결과적으로 구글 플레이에 앱을 정식 출시하는 성과까지 거두었습니다.
이 소규모 프로젝트의 성공을 직접 경험하고 나니, AI 스튜디오(AI Studio)와 구글 클라우드를 기반으로 더 확장성 있는 프로덕트를 개발해보고 싶다는 갈증이 생겼습니다. 이를 구체화하려면 당연히 클라우드 크레딧이 필요했고요. 결국 '제미나이를 활용한 저 개인의 개발 생산성 한계를 직접 시험해 보는 것'과 '상금으로 걸린 클라우드 크레딧 쟁취'라는 두 가지 목표를 안고 제 인생 첫 해커톤에 출사표를 던지게 되었습니다. 첫 출전임에도 운 좋게 1위라는 과분한 결과를 얻어 매우 기쁩니다.
Q. 1인 참가를 결심하신 이유가 있나요?
장민수 님: 저는 2022년부터 LLM과 토의하며 연구개발을 진행하는 과정에 깊은 흥미를 느껴왔습니다. 이번 해커톤에 혼자 참가한 가장 큰 이유는 현업의 연장선이 아니라, 철저히 ‘개인의 성장과 증명’을 다뤄보고 싶었기 때문입니다.
무엇보다 제미나이라는 뛰어난 AI 파트너와 끊임없이 티키타카하며 개발하는 과정 자체가 제게는 이미 최고의 팀워크였습니다. 저는 이것이 1인 개발자로서 최대의 생산성을 발휘할 수 있는 '궁극의 방법론'이라고 확신했고, 그 가설을 현장에서 직접 증명해 보이고 싶었습니다.
Q. 이번 해커톤의 핵심은 아이디어를 넘어 실제 배포 가능한 앱을 만드는 ‘프로덕션 스프린트’였습니다. 개발하신 서비스 '제미나이스페이스(GeminiSpace)'의 핵심 기능과 해결하고자 했던 문제는 무엇인가요?
장민수 님: 저의 본업인 '로보틱스' 도메인에서 제미나이의 탁월한 멀티모달(Multimodality) 능력을 극한으로 끌어내고 싶었습니다. 로봇이 실내에서 자율 주행이나 특정 작업을 하려면 반드시 ‘지도’가 필요한데, 이는 고도의 결정론적(Deterministic) 소프트웨어 엔지니어링을 요구하는 매우 까다롭고 시간 소모적인 작업입니다.
해커톤 장소인 세빛섬으로 향하는 길에 문득 하나의 가설을 세웠습니다. 스마트폰으로 내 주변을 360도로 커버하는 사진 8장을 찍어 제미나이에게 주면, 알아서 2D 지도를 만들어주지 않을까? 나아가 이 사진과 지도를 바탕으로 공간과 사물 간의 위상 관계(Topology Graph)를 시각화하고, 3D 맵까지 생성할 수 있지 않을까?
결과적으로 이 가설은 완벽히 적중했습니다. 사용자가 주변 사진을 업로드하면 제미나이가 시각 정보를 바탕으로 지도를 생성하고, 사용자와 공간에 대해 자연어로 상호작용(예: "냉장고에서 문까지 어떻게 가?")할 수 있도록 해주는 웹 기반 솔루션이 탄생했습니다.
장민수님 발표내용 중 ‘제미나이스페이스’ 작동 영상
Q. 제미나이의 추론 능력이나 멀티모달 기능 중 프로젝트에 가장 핵심적으로 활용된 부분은 무엇인가요? 기존 모델과 비교해 체감하신 차이점이 있다면요?
장민수 님: 시각-언어-행동(VLA, Visual-Language-Action) 모델로서 제미나이가 보여준 멀티모달리티가 제 프로덕트의 전부이자 핵심입니다. 8장의 사진을 분석해 공간과 사물의 관계를 추론하고, 이를 2D 도면과 3D 복셀(Voxel) 맵으로 변환한 뒤 사용자의 질문에 자연스럽게 답하는 일련의 과정은 기존의 다른 모델들에서는 쉽게 경험하기 힘든 압도적인 능력이었습니다.
프로덕트의 뼈대를 구축하는 데 있어 텍스트 추론에 뛰어난 제미나이 3 플래시(Flash)와 최신 이미지 생성 모델인 나노 바나나가 각자의 역할을 완벽하게 수행해주었습니다. 덕분에 단 7시간이라는 짧은 시간 안에 아이디어를 실제 프로덕션 레벨로 끌어올릴 수 있었습니다.
Q. 구체적으로 어떻게 워크플로우를 가져가셨나요?
장민수 님: 저는 구글 AI 프로 구독자로서 세 가지 플랫폼인 ‘제미나이 웹(Gemini Web)’, ‘구글 AI 스튜디오(Google AI Studio)’, ‘구글 안티그래비티(Google Antigravity)’를 각 개발 단계에 맞춰 유기적으로 활용했습니다.
- 기획 및 설계(제미나이 웹): 개발 초기 단계에서 제미나이에게 가상의 CMO, CSO, CPO 페르소나를 부여하고 핵심 아이디어를 주고받으며 To-do 리스트와 브랜드 문서를 도출했습니다.
- 빠른 검증(구글 AI 스튜디오): 오전 10시 대회 시작 직후, 앞서 도출한 기획안을 바탕으로 AI 스튜디오에서 즉각적인 PoC(Proof of Concept)를 진행했습니다. API 연동과 웹 동작 테스트가 워낙 직관적이라, 불과 2시간 반 만인 낮 12시 30분경에 이미 핵심 기능이 구동되는 것을 확인하고 내심 환호성을 질렀던 기억이 납니다.
- 빌드 및 배포(구글 안티그래비티): 오후 1시부터는 안티그래비티로 넘어와 본격적인 빌드를 진행했습니다. AI 스튜디오에서 작업한 코드와 초기 기획 문서를 로컬 환경에 셋업하고, 제미나이 3.1 프로에게 개발을 이어가도록 지시했습니다. 익숙하지 않은 세팅 과정도 있었지만, 안티그래비티와 제미나이가 실시간으로 피드백을 준 덕분에 오후 4시경 git push를 끝으로 모든 개발을 마칠 수 있었습니다.
남은 1시간은 제출용 데모 영상 제작에 쏟았습니다. 비오(Veo) 모델로 인트로를 만들고, AI TTS 등을 엮어 완성도를 높인 뒤 마감 10분 전에 무사히 제출 버튼을 누를 수 있었습니다.
제미나이 기반 AI 개발 파이프라인 구성도
Q. 단 하루 만에 구글 클라우드(GCP) 상에서 구동 가능한 결과물을 배포해야 하는 빠듯한 일정이었습니다. 기술적인 고비는 없었나요?
장민수 님: 순수하게 기술적인 난관보다는, 해커톤 특성상 빠르게 코드를 대량으로 생성해 내다 보니 맞닥뜨리게 된 'API 호출 제한(Rate Limit)'이 가장 큰 허들이었습니다. 오후 1시경 AI 스튜디오에서 처음 이 문제를 겪었고, 오후 3시 30분경에는 주요 모델들의 한계에 도달하며 큰 위기가 있었습니다.
하지만 앞서 말씀드린 대로 3개의 강력한 툴을 상황에 맞게 스위칭하며 워크플로우를 분산시킨 덕분에 병목 현상을 무사히 뚫어낼 수 있었습니다. 개발 자체에서 발생하는 자잘한 버그나 이슈들은 제미나이가 워낙 똑똑하게 문맥을 파악해 주어 대화 몇 번만으로 매끄럽게 해결되었습니다.
Q. 행사장 현장에서 기억에 남는 에피소드가 있다면요?
장민수 님: 오후 3시 30분경, 제 프로덕트에 대한 객관적인 피드백을 받기 위해 테크 데스크를 찾았습니다. 구글 전문가분들께서 "구현을 위해 혹시 다른 외부 API들도 섞어 썼나요?"라고 물어보시더군요. 제가 "아닙니다. 백지상태에서 오직 제미나이 API 만 사용해서 만들었습니다"라고 답했을 때, 크게 놀라시던 그 반응이 가장 기억에 남습니다.
재미있게도 이후 진행된 1차 본 심사에서 심사위원분들께 정확히 똑같은 질문을 받았습니다. 테크 데스크를 통해 이미 한번 방어해 본 질문이라 훨씬 수월하게 답변할 수 있었죠. 돌이켜보면 테크 데스크 방문이 일종의 '0차 심사'이자 완벽한 예방주사였던 셈입니다.
Q. 우승 특전으로 ‘구글 AI 퓨처스 펀드’ 창립자와의 멘토링 기회를 얻으셨습니다. 어떤 대화를 나누셨나요?
장민수 님: 이번 우승을 계기로 제미나이의 멀티모달리티를 활용한 프로덕트 개발에 더욱 깊이 빠져들게 되었습니다.
우선, 제가 경험한 개발 파이프라인을 공유했는데요. 앞으로 구글 클라우드, 버텍스 AI, ADK, 노트북LM, 비오 등 구글의 AI 생태계 전체를 깊이 탐구하고 엮어서 훨씬 더 재미있는 것들을 빌드하고 배포할 계획입니다.
둘째, '무엇을 만들 것인가'에 대한 비전을 공유했습니다. 향후 제미나이 API를 백본(Backbone)으로 삼아 실제 서비스되는 SaaS를 구축할 때, 구글닷오알지(Google.org)에 명시된 구글의 글로벌 미션 해결에 어떻게 기여할 수 있을지 심도 있는 의견도 나눴습니다.
Q. ‘AI 네이티브’ 개발자로서의 마음가짐이 있다면 무엇일까요?
장민수 님: 대회가 끝난 후 많은 참가자분이 입을 모아 하신 말씀이 있습니다. 바로 "이제는 진짜 도메인 지식(Domain Knowledge)이 가장 중요한 시대가 왔다"는 것입니다.
자신만의 확고한 도메인 전문성을 갖춘 상태에서, AI와 에이전트라는 도구를 얼마나 레버리지(leverage)할 수 있는지가 관건이라 생각합니다. AI 도구들과 스스럼없이 친해지고, 내 도메인 속의 고질적인 문제들을 빠르고 강력하게 해결하는 솔루션을 '직접 만들어내는' 실행력. 그것이 바로 현 시대를 살아가는 'AI 네이티브' 개발자의 올바른 마음가짐이 아닐까 조심스레 제안해 봅니다.
Q. 마지막으로, 동료 빌더들에게 전하고 싶은 조언이나 응원의 메시지 부탁드립니다.
장민수 님: 운이 좋게 1등을 하게 되어 이렇게 구글코리아 블로그에서 인터뷰까지 하게 되었음에 진심으로 감사드립니다. 저는 정통파 소프트웨어 엔지니어가 아닙니다. 그저 AI와 매일 수다를 떨며 머릿속 상상을 현실의 프로덕트로 끄집어내는 과정 자체에 푹 빠져 있는 사람일 뿐입니다. 특히, 사랑하는 가족을 위해서요.
항상 모든 과정이 뜻대로 풀리고 재미있을 수만은 없겠지만, 동료 빌더 여러분 모두 이 거대한 파도 위에서 즐겁게 빌드하셨으면 좋겠습니다. 가족과 보내는 소소하고 따뜻한 시간을 최우선으로 아끼면서, 매일의 크고 작은 허들들을 기꺼이 이겨내 봅시다. 그리고 우리 끝내, 다 같이 부자 됩시다. 화이팅!
‘제미나이 3 서울 해커톤’ 심사위원 및 수상자 단체사진
장민수 님의 생생한 해커톤 참가 후기가 궁금하다면? 다음 페이지를 확인해보세요
- 개인 후기(글): mincasurong.com/gemini3-hackathon-epilogue
- 개인 후기(영상): 장민수 님 유튜브 링크
- Gemini로 개발한 일본어 교육 앱 (구마칸지): 앱 소개 영상 보기 / 구글플레이 다운로드