메인 메뉴 바로가기
구글코리아 블로그

이마젠 2로 새롭고 더 멋진 이미지를 만들어보세요

이마젠 블로그 히어로 이미지

이 블로그는 구글 The Keyword 블로그(영문)에서도 확인하실 수 있습니다.

음악을 만들거나, 코딩에 대한 도움을 받거나, 이미지를 만들 때 리리아(Lyria), 코디(Codey), 이마젠(Imagen)과 같은 작업 기반 AI 모델들은 사람들이 창의적인 아이디어를 실현할 수 있도록 돕고 있습니다.

작년에 출시된 구글의 이마젠 기술은 사람과 기업들이 단 몇 개의 단어나 문구를 직접 입력해 이미지를 생성하는 데 도움을 주고 있습니다. 예를 들어, 생성형 AI 검색(SGE)을 통해 구글 검색에서 찾아볼 내용을 바로 상상해 볼 수 있고, 워크스페이스의 듀엣 AI(Duet AI)를 통해 구글 슬라이드에서 바로 이미지를 만들 수도 있습니다. 또한 개발자와 캔바(Canva), 스냅(Snap) 등의 기업들은 구글 클라우드의 버텍스 AI(Vertex A)I의 이마젠 API를 사용해 수백만 명의 이용자가 창의력을 펼칠 수 있도록 지원하고 있습니다.

지난 12월에는 고품질의 사실적인 결과물을 제공하는 업데이트된 이마젠 2 모델을 출시했습니다. 그리고 이제 이마젠 2는 바드이미지FX(ImageFX)에서 새로운 이미지 생성 기능을 지원합니다.

구글 딥마인드로 더욱 향상된 이미지 생성 기능

이마젠 2는 확산 기반 모델(diffusion-based model)을 활용한 구글 딥마인드의 최신 텍스트-이미지 변환 기술로 구동됩니다. 이번 업데이트를 통해 역대 최고 품질의 이미지를 제공할 수 있게 됐을 뿐 아니라, 사람의 손과 얼굴을 사실적으로 렌더링하거나 이미지에 방해가 되는 시각적 아티팩트가 없도록 하는 등 텍스트-이미지 변환 시스템에서 종종 어려움을 겪었던 부분들이 개선되었습니다.

이마젠 2는 이미지와 설명을 연결짓는 학습면에서 수준 높게 훈련되어 사람들의 언어 프롬프트의 의미와 더 잘 부합하는 더 상세한 이미지를 생성합니다. 이전 시스템보다 디테일을 더 정확하게 처리하고 뉘앙스를 포착하는 능력이 뛰어나 다양한 스타일과 이용 사례 전반에서 이미지들을 더욱 사실적으로 표현해줍니다.

[다양한 스타일과 이용 사례를 통한 이마젠 2의 이미지 예시 모음]

  • 작은 유화 캔버스에 도마 위 오렌지와 흰색과 파란색의 줄무늬 패턴의 천이 그려져 있다

    프롬프트 “도마 위에 오렌지가 놓여 있는 작은 유화 캔버스. 오렌지의 단면에 빛이 통과하고 오렌지 빛이 도마에 투과된다. 배경에는 하얀색과 파란색이 있는 행주가 구겨져 있다”

  • 나이든 남성의 프로필 사진 이미지가 보인다. 얼굴 앞쪽에서는 붉은 빛이, 머리 뒷쪽에서는 푸른빛이 비춘다.

    프롬프트 “나이 든 아시아 남성 모델의 실루엣이 담긴 측면 패션 프로필. 우측에서는 붉은 조명이, 왼쪽에서는 푸른 조명이 나누어 비춘다.”

  • 검은색 바탕에 해파리 이미지

    프롬프트 “검은색 바탕에 해파리 모습”

  • 스카프와 비니를 쓴 나이든 여성이 갈색과 흰색 무늬의 강아지를 안고있는 모습

    프롬프트 “강아지를 품에 안고 프라하 거리를 걷고 있는 나이든 여성의 클로즈업 샷. 여성의 주름진 얼굴과 부드러운 미소, 당황한 강아지의 표정을 잘 표현해줘”

이제 이마젠 2는 바드, 이미지FX, SGE, 버텍스 AI에서 이용 가능합니다.

이제 이용자, 크리에이터 및 기업들은 바드를 포함한 구글 제품 전반에서 이마젠 2를 이용할 수 있습니다.

이마젠 2가 탑재된 바드는 브로셔를 만드는 일이나 블로그 포스트와 어울리는 이미지를 만드는 것까지 아이디어를 실현할 수 있도록 도와줍니다. 이마젠 2를 사용하면 바드는 단순하거나 복잡한 프롬프트를 모두 잘 이해해 다양한 고품질의 이미지를 생성할 수 있습니다. 현재 대부분의 국가에서 영어로 바드를 이용해 이미지를 생성할 수 있습니다.

바드가 블로그 포스트를 써달라고 먼저 요청받은 뒤 이에 부합하는 이미지를 생성해 달라고 요청하는 추가 프롬프트를 받는 모습을 보여주는 GIF

바드에 탑재된 이마젠 2 기능을 보여주는 애니메이션

이제 구글 애즈, 워크스페이스의 듀엣 AI, 생성형 AI 검색(SGE)에서도 이마젠 2를 활용해 텍스트-이미지 변환 기능을 사용할 수 있습니다. 또한, 구글클라우드를 이용하는 개발자들은 버텍스 AI를 기반으로 이마젠 2를 이용할 수 있습니다.

왼편에는 세면대에 진녹색으로 ‘Cymbal’이라고 적힌 하얀 치약 제품의 모습. 오른편에는 양치하고 있는 여성의 모습.

버텍스 AI에서 사용된 이마젠 2의 기능을 보여주는 두 이미지. 프롬프트 “화장실 세면대 구석에 놓인 ‘CYMBAL’이라고 적힌 치약 광고 이미지”, “환하게 웃으며 행복하게 양치하는 여성 이미지, 치약 광고”

드디어 새로운 텍스트-이미지 변환 기능인 이미지FX(ImageFX)도 소개합니다. 실험적이고 창의적인 활동을 위해 설계된 이미지FX를 사용하면 간단한 텍스트 프롬프트만으로 이미지를 생성한 다음, 풍부한 표현 칩을 사용해 새로운 프롬프트 이미지를 쉽게 수정할 수 있습니다. 이미지FX는 ‘AI 테스트 키친(AI Test Kitchen) 애플리케이션’에서 사용할 수 있으며, 뮤직FX 및 텍스트FX와 같은 다른 생성형 AI 실험을 통해 탐색하고 제작할 수 있습니다.

4개의 서로 다른 이미지로 “초현실적인 뜨개질로 만든 도시 풍경”의 이미지를 생성하는 모습. “정글”의 단어 칩이 “도시”로 변경되고 4개의 이미지가 “초현실적인 뜨개질로 만든 정글 풍경”으로 변경된다

이미지FX를 이용하여 표현 칩으로 프롬프트를 수정하는 방법을 보여주는 예시 이미지

더욱 책임감 있는 접근 방식으로 준비된 이마젠 2

사실적인 이미지를 생성하는 이마젠 2의 기능을 개선하며 구글은 해당 모델의 안전성을 최우선에 두었습니다. 구글은 처음부터 학습 데이터의 안전성에 투자하고 폭력적, 모욕적 또는 외설적인 콘텐츠 등 문제가 될 수 있는 결과물을 제한하기 위해 기술적인 규제도 추가하였습니다. 또한, 구글 AI 원칙에 입각하여, 잠재적으로 유해하거나 문제가 될만한 콘텐츠를 식별하고 줄이기 위하여 광범위한 적대적 테스트(adversarial testing)를 진행하고 레드팀을 구성했습니다. 뿐만 아니라 특정 인물의 이미지 생성을 방지하기 위해 필터를 적용하고 있습니다. 구글은 앞으로도 해당 모델의 안전성과 개인정보 보호를 더욱 강화하기 위해 새로운 기술에 지속적으로 투자할 것입니다.

구글 제품 내에서 이마젠 2로 생성된 모든 이미지들은 구글 딥마인드가 개발한 신스ID(SynthID)가 표시되며, 이 툴은 생성된 이미지의 픽셀에 직접 디지털 워터마크를 추가합니다. 신스ID 워터마크는 사람의 눈에는 보이지 않지만 디지털 기술을 통해 식별됩니다. 또한, About this image 기능을 이용해, 구글 검색이나 크롬에서 발견한 이미지가 구글의 AI 도구로 생성된 이미지인지 확인할 수도 있습니다.

‘About this image’ 페이지에 프리즘 패턴의 금속성 날개를 가진 나비 이미지가 보이는 핸드폰 화면. 텍스트로 해당 이미지가 구글 AI로 생성되었다고 설명되고 있다.

구글 AI를 통해 생성된 이미지인지 ‘About this image’ 기능을 사용해 확인하는 모습 예시

이마젠 2의 기술과 기능에 대한 더욱 자세한 내용은 구글 딥마인드 홈페이지에서 확인해보세요.