구글이 생성형 AI의 콘텐츠 안전을 구축하고 테스트하는 방식

구글은 새로운 생성형 AI 제품을 개발할 때 이용자들이 신뢰할 수 있는 정보에 접근할 수 있도록 하는 것을 가장 중요한 책무로 받아들이고 있습니다.
- 이용자가 피해를 보지 않도록 보호: 구글은 구글 AI 원칙에 따라 처음부터 안전을 최우선으로 고려해 제품을 개발하고, 피해를 유발하지 않도록 엄격한 테스트를 수행합니다.
- 신뢰할 수 있는 정보 제공: 구글은 신뢰할 수 있는 정보와 콘텐츠를 제공할 뿐만 아니라 이용자가 온라인에서 검색한 정보를 제대로 이해하고 판단할 수 있도록 지원하고자 최선을 다하고 있습니다.
- 안전한 인터넷 환경을 조성하기 위한 협력: 구글은 책임감을 가지고 안전한 AI 기술을 구축하기 위해 여러 전문가 및 단체들과 적극적으로 협력하고 있습니다.
강력한 이용자 보호 원칙
구글은 다중 완화 조치를 통해 이용자들을 유해한 불법 콘텐츠로부터 보호합니다.
- 정책: 모든 구글 제품과 마찬가지로, 생성형 AI 제품 및 개발 과정도 같은 정책이 적용되어 적절한 사용 방법과 결과 도출을 위한 안전하고 책임감 있는 결정 내릴 수 있도록 하는 안전장치가 되어 줍니다
- 안전 필터: 이용자가 프롬프트를 작성하면 이에 대한 대답을 목록으로 생성합니다. 이때 분류 기능이 작동해 안전을 비롯한 핵심 매개변수에 따라 여러 대답을 평가합니다. 그런 다음 가장 안전하고 품질이 뛰어난 답을 이용자에게 제시합니다.
- 테스트 및 조정: 새로운 생성형 AI 제품은 이용자들에게 제공되기 전에 다양한 안전 테스트를 여러 차례 진행합니다.

신뢰할 수 있는 정보 제공
이제 생성형 AI 덕분에 그 어느 때보다 간편하게 새로운 콘텐츠를 만들 수 있게 되었습니다. 그렇기에 구글은 AI가 믿을 수 있는 정보를 제공할 뿐만 아니라 이용자가 온라인에서 찾은 내용을 이해하고 신뢰도를 평가할 수 있도록 하고자 최선을 다하고 있습니다.
구글은 이용자가 AI로 생성된 콘텐츠를 구분할 수 있도록 다음과 같은 새로운 도구와 정책을 도입했습니다.
- 광고 정보 공개 문구: 광고주는 AI 도구와 디지털 기술로 변형되었거나 생성된 사실적인 합성 콘텐츠가 광고에 포함된 경우 이를 명시적으로 공개해야 합니다
- 워터마크: 구글 딥마인드(Google DeepMind)의 베타 도구인 SynthID는 AI로 생성된 이미지와 오디오에 디지털 워터마크를 직접 삽입합니다.
- 콘텐츠 라벨: 구글은 AI 도구가 생성한 이미지 파일을 표시해 이미지의 맥락을 파악하는 데 사용될 수 있도록 하고 있습니다.
- 추가적인 맥락: 검색 결과 정보, 이 이미지 알아보기, 메타데이터, 제미나이(Gemini)의 재확인 기능 등을 활용하면 생성된 정보의 신뢰성과 맥락을 모두 평가할 수 있습니다.
콘텐츠 라벨

제미나이의 재확인 기능

안전한 인터넷을 만들기 위한 협력
구글은 이용자에게 더 안전한 생성형 AI 기술을 제공하기 위해 전문가 및 단체들과 협력, 정보, 리소스, 기술 등을 함께 공유합니다. 이를 위해 다음과 같은 노력을 기울이고 있습니다.
- 안전과 책임에 관한 공개적인 약속
- 신뢰할 수 있는 파트너와 지식 및 도구 공유
- 전문가 인사이트와 유명 연구를 바탕으로 이니셔티브 출시
- 다음과 같은 미디어 리터러시프로그램
- Google의 Be Internet Awesome
- YouTube의 Hit Pause
- Jigsaw의 프리벙킹
- Google의 AI 활용 능력 가이드
구글은 업계, 사회, 학계 등 다양한 이해관계자들 함께 책임감 있는 AI 생태계를 만들어 가고 있습니다.

구글은 AI가 인간과 사회에 가져다줄 다양한 혜택을 많은 기대를 가지고 있습니다. 그렇기에 더욱 AI를 책임감 있게 구축하기 위해 최선을 다하고 있습니다. 처음부터 책임감 있게 행동하는 것만이 장기적으로 이 기술을 적극 개발하는 유일한 방법이기 때문입니다. 이를 위해서는 협력은 필수적인 요소라고 생각합니다. 앞으로 우리는 함께 많은 혁신을 이루는 동시에 부작용이 발생하지 않도록 고민하며 문제를 바로잡아야 할 것입니다.