Blog

책을 읽고, 여행을 하고, 사람을 사랑하며 삶속에서 얻은 인사이트를 나눕니다. (회원으로 가입하시면 새로운 블로그 글이 등록될 때마다 이메일로 알려드립니다!)

[AI 소식. 2024-10-25] SynthID: 생성형 AI 콘텐츠 식별 솔루션 오픈소스로 공개

고승원
2024-10-25

구글이 생성형 인공지능(AI) 모델이 만든 텍스트를 감지하고 보이지 않는 워터마크를 삽입할 수 있는 ‘신스ID 텍스트(SynthID Text)’ 기술을 오픈소스로 공개했습니다. 이 기술은 누구나 무료로 활용할 수 있도록 제공되어, 개발자와 기업이 AI 콘텐츠를 쉽게 식별하는 데 도움을 줄 것으로 기대됩니다.

구글 딥마인드는 23일(현지 시간) X(구 트위터)를 통해 이 사실을 발표했습니다. Responsible Generative AI Toolkit)와 허깅페이스에서 다운 받아 사용할 수 있습니다.

신스ID 텍스트는 기존에 이미지에 적용되던 ‘신스ID’ 기술을 텍스트로 확장한 것입니다. AI 모델이 생성한 텍스트에 보이지 않는 워터마크를 심어 해당 텍스트가 AI 산출물임을 판별할 수 있게 합니다.

이 기술의 원리는 대형언어모델(LLM)의 작동 방식에 기반합니다. LLM은 텍스트를 여러 토큰(문자나 단어 등)으로 나누고, 특정 토큰 뒤에 올 가능성이 높은 다음 토큰을 예측합니다. 각 토큰은 문장 내에서 선택될 확률 점수를 부여받는데, 신스ID 텍스트는 이러한 점수 패턴을 분석해 해당 텍스트가 AI로 생성된 것인지 확인합니다.

이 방식은 텍스트의 품질과 창의성, 정확성을 해치지 않으면서도 빠르게 워터마크를 삽입할 수 있다는 장점이 있습니다. 하지만 한계도 있습니다. 예를 들어, 짧은 문장이나 번역된 텍스트에서는 이 기술이 제대로 작동하지 않을 수 있으며, 사실적인 프롬프트에 대한 응답에서는 워터마크 적용이 어려울 수 있습니다.


SynthID의 핵심 기능

  • 이미지 워터마킹: 이미지의 픽셀에 작은 변화를 주어 육안으로는 구분할 수 없는 워터마크를 삽입합니다.
  • 텍스트 워터마킹: 텍스트 생성 시 확률 패턴을 미세하게 조정해 마치 고유한 '지문' 같은 표시를 남깁니다. 이 워터마크는 소규모 편집이나 재가공에도 유지됩니다.
  • 비디오 워터마킹: 모든 프레임에 워터마크를 추가해 색상 조정이나 압축 등의 편집 이후에도 콘텐츠 출처를 추적할 수 있게 합니다.


https://deepmind.google/technologies/synthid/





SEUNGWON.GO

contact

Email:  seungwon.go@gmail.com

social


main

Contact

Email:     seungwon.go@gmail.com