AI 기반 음성-텍스트 변환 서비스를 제공하는 국내 스타트업 소보로 (SOVORO)
청각장애인이 언제 어디서나 이용할 수 있는 실시간 자막
이 블로그는 구글 스타트업 캠퍼스 블로그(영문)에서도 확인하실 수 있습니다.
윤지현 대표는 대학교 3학년 때 IT 공학 전공 졸업에 필수였던 캡스톤 프로젝트에 배정되었습니다. 해당 프로젝트를 위해 윤지현 대표는 청각 장애를 가진 사람들이 대화를 하는 동안 PC나 태블릿에서 자막을 볼 수 있는 인공지능 기반 음성-텍스트 변환 번역 서비스의 프로토타입을 제작했습니다. 프로토타입 테스트를 진행해본 청각 장애 이용자들이 더 많은 농인과 난청인을 위한 리소스로 이를 공식 출시할 것을 적극 권했습니다.
윤 대표는 “청각 장애를 가진 테스터들이 창업의 동기를 부여했다”며 “창업을 위해 3년 반 동안 학교를 휴학했다”고 말했습니다.
윤 대표는 이제 27명으로 늘어난 소보로 팀에서 현재도 영업 및 마케팅을 담당하고 있는 오성우 CCO와 협업하기 위해 서울로 이사했습니다. 소보로(Sovoro)는 구글 클라우드의 STT(Speech-to-Text) 실시간 음성 인식을 이용해 이용자의 말을 PC나 태블릿에 자막으로 보여줍니다. 현재 개인 이용자 외에도 기업, 학교, 정부 기관 등 600개 이상의 조직이 소보로를 이용하고 있습니다. 소보로의 서비스는 오프라인 모임, 회의 및 난청 치료에 사용되어 태블릿과 PC에 실시간 자막으로 제공합니다. 자막은 AI를 이용해 실시간 음성-텍스트 변환 스크립트를 제공하는 드래프트 스크립팅(Draft-Scripting)을 통해 생성되며, 단어의 정확성을 100% 확신할 수 없을 때 해당 단어를 빨간색으로 표시할 수 있습니다.
윤 대표는 “구글 클라우드는 클라우드 스피치 API와 같이 당사 서비스에 AI를 이용할 수 있는 뛰어난 API를 제공한다”며 “소보로는 자연어처리(NLP), 버텍스 AI(Vertex AI) 등과 같이 아직 시도해 보지 않은 머신러닝(ML) 기능에도 관심이 있으며, 추가 개발을 위해 구글의 AI 제품을 더 많이 활용하는 데 관심을 갖고 있다”고 덧붙였습니다.
구글 기술 및 구글 포 스타트업 액셀러레이터(Google for Startups Accelerator: Korea) 프로그램
윤 대표는 구글 스타트업 캠퍼스의 뉴스레터에서 한국 액셀러레이터 프로그램에 대한 소식을 듣자마자 바로 클릭해 신청했다고 말했습니다.
윤 대표는 “소보로가 프로그램에 지원하기 딱 알맞은 단계에 있다고 생각했고, 소보로의 제품과 팀이 구글 포 스타트업 액셀러레이터 프로그램에 부합한다고 생각했다”며 “소보로의 사이버 인프라는 초기 단계부터 구글에 의존해 왔다”고 말했습니다. 또한, “우리는 기술적으로 더욱 깊이 성장해야했고, 해당 프로그램이 다음 목표인 시리즈 A 투자 유치를 달성하는 데 좋은 기회가 되기를 바랐다”고 덧붙였습니다.
소보로를 담당한 신정규 구글 포 스타트업 액셀러레이터 기술 멘토는 머신러닝 구글 개발자 전문가이자 AI 접근성에 초점을 맞춘 스타트업 래블업(Lablup)의 CEO입니다. 신정규 멘토는 소보로 팀에 데모, 추가 자료, 코드랩(codelab) 등과 같은 리소스를 연결해줘 노이즈 캔슬링 기술을 테스트해 소보로의 음질과 음성 인식을 개선할 수 있도록 도움을 제공했습니다.
또한 팀이 비즈니스 성공으로 이어지는 요인을 평가하는데 사용하는 측정지표인 KPI(핵심성과지표)와 목표를 설정하고 진행 상황을 추적하기 위해 사용하는 OKR(목표와 핵심결과)을 구글이 어떻게 활용하고 있는지 배울 수 있었다고 전했습니다. 오성우 CCO는 “다른 스타트업과 마찬가지로 소보로도 3~4명으로 시작해 20~30명의 팀으로 성장했다. 팀이 성장하면서 가끔 소통이 어렵다는 생각이 든다”고 전했습니다. 또한 “구글 포 스타트업 액셀러레이터는 개인적으로 클라우드와 리소스를 이용하는 것 이상으로 KPI와 OKR을 배울 수 있는 좋은 기회였다. 이 시스템을 소보로의 업무 환경에서 구현하고 싶었고 이제 잘 돌아가기 시작했다는 생각이 든다. 커뮤니케이션이 개선되고 있다”고 덧붙였습니다.
펀드레이징 경험 및 소보로의 향후 계획
소보로는 3차례에 걸친 펀딩 라운드를 성공적으로 완료했습니다. 회사 설립 3~4개월 후 소보로는 국내 투자사인 소풍(Sopoong)으로부터 첫 번째 투자를 받았고, 그로부터 8개월 후 두번째 투자로 국내 최대 임팩트 펀드인 D3쥬빌리의 프리시리즈 A를 받게 되었습니다. 소보로는 구글 포 스타트업 액셀러레이터에 참여한 후 성공적으로 시리즈A 투자를 유치할 수 있었습니다. 또한 포스텍 홀딩스, 디쓰리쥬빌리파트너스, IPS벤처스, 블루포인트 등의 투자사로부터 14억 상당의 투자 유치에 성공했습니다.
윤 대표는 “투자자들로부터 배운 가장 중요한 것은 그들과 소통할 때 정직해야 한다는 것”이라며 “소보로는 계속 성장하고 있고 다른 용도의 제품을 추가하며 한국에서 선도적인 보조 기술 기업이 되는 것을 목표로 한다”고 포부를 전했습니다.
어릴 때 시각 장애인을 돕는 커뮤니티에서 봉사활동을 했던 오성우 CCO는 “소보로는 이 기술을 통해 필요한 사람들에게 도움을 주는 것이 목표로, 이것이 바로 내가 소보로에 입사한 이유”라고 설명했습니다.
소보로의 다음 단계는 음성-텍스트 변환 편집기와 연결된 모바일 제품을 출시해 학생들이 웹사이트나 모바일 애플리케이션 내에서 텍스트를 저장 및 편집할 수 있도록 하는 것입니다. 윤 대표 또한 소보로가 보편적으로 사용될 수 있도록 시장 확장에 관심을 갖고 있습니다.
윤 대표는 “비장애인들로부터 녹음된 음성파일이나 동영상을 문서화하고 싶다는 요청을 많아 받고 있어 시장 확장의 가능성을 실험하기 위해 두 번째 서비스인 타입X(typeX)를 출시했다”며, “녹취록이 필요한 사람은 누구나 소보로의 사이트에 방문해 음성 파일에 대한 빠르고 저렴하며 수준 높은 녹취록을 요청할 수 있다”고 설명했습니다.
소보로의 다음 서비스는 더욱 광범위한 이용자층을 위해 설계될 예정입니다. 녹음된 음성 파일에 대한 음성-텍스트 변환 타임 스탬프가 있고 일단 AI 녹취록이 생성되면 편집자가 문서를 검토합니다. 음성 파일의 재생 속도를 조정, 일시 중지하거나 빠르게 혹은 느리게 할 수 있는 단축키가 제공됩니다. 소보로는 해당 서비스를 2022년 9월 출시할 예정이라고 밝혔습니다.
오성우 CCO는 “액셀러레이터에 참여하기 전에는 주로 일반적인 대화에 대한 텍스트를 제공했지만, 액셀러레이터에 참여한 후에는 특정 환경에서 일하는 사람이나 학교에 다니는 학생들을 위해 좀 더 맞춤화된 기능을 제공하고 싶어졌다”며 “2022년 9월까지 정확한 텍스트를 필요로 하는 학생들을 위한 다음 서비스를 출시해 이를 학습 가이드로 활용할 수 있도록 할 예정이다”라고 전했습니다. 또한, “먼저 학생부터 시작해 내년까지 청각 장애가 있는 직장인을 위한 추가적인 기능을 개발할 계획”이라고 덧붙였습니다.
윤 대표는 소보로의 강력한 팀과 스트레스가 적은 환경이 일하기 좋은 회사로 만들고 있다면서 다른 스타트업 창업자와 직원들에게 신체 건강의 중요성을 강조했습니다. 과연 윤 대표가 전한 조언은 무엇이었을까요? 윤 대표는 “운동은 번아웃을 예방하고 정신 건강을 유지하는 데 도움이 된다”고 전하며, “또한, 팀원과 투자자의 신뢰를 얻기 위해 노력해야 한다”고 말했습니다. 마지막으로는 “구글 포 스타트업 액셀러레이터에 참여하시라는 것”이라고 조언했습니다.