AI 뉴스

뉴스 · · 09:09 · marivelle

AI 생성 이미지와 영상, 인간의 50% 정확도로 식별

최근 연구에 따르면, 인공지능이 생성한 이미지와 영상을 인간이 식별하는 정확도가 50%에 불과한 것으로 나타났다. 남가주대학교 등 연구진은 1,276명을 대상으로 대규모 인식 실험을 실시하여, 다양한 미디어 유형에서 AI 생성 콘텐츠와 실제 콘텐츠를 구별하는 능력을 테스트했다. 이 연구는 arXiv에 '동전 던지기와 같은: AI 생성 이미지, 비디오, 오디오 및 시청각 자극의 인간 감지'라는 제목으로 발표되었으며, 생성 AI 도구가 확산됨에 따라 증가하는 취약성을 강조한다.

참가자들은 실제와 합성된 자극 쌍을 보여주고 진짜를 식별하도록 요청받았다. 전반적으로 평균 탐지율은 50%에 머물렀으며, 이는 동전 던지기와 유사했다. Stable Diffusion과 같은 모델로 생성된 이미지, SORA 시스템에서 생성된 비디오, Tortoise TTS와 같은 도구로 생성된 오디오 모두에서 이러한 경향이 나타났다. 시청각 클립과 같은 여러 모달리티를 결합할 때도 인간의 정확도는 크게 향상되지 않았으며, 합성 요소가 포함될 경우 더 낮아졌다.

연구는 AI 출력의 현실성이 경계심이 높은 관찰자조차 속일 수 있을 만큼 발전했음을 강조한다. 예를 들어, 비디오 탐지에서 참가자들은 약 53%의 정확도를 기록했으며, 얼굴 교환이나 립싱크 변경과 같은 미세한 조작이 포함된 비디오에서 오류가 급증했다. 오디오는 약간 더 쉬웠지만, 58%의 정확도로 여전히 신뢰할 수 없었으며, 억양과 악센트를 완벽하게 모방하는 음성 복제에서 특히 어려움을 겪었다.

이러한 결과는 AI가 진화함에 따라 인간의 직관만으로는 충분하지 않다는 점을 시사하며, 자동 탐지 도구의 개발을 촉구한다. 그러나 기술 기반 솔루션도 장애물을 직면하고 있다. 알고리즘은 통제된 데이터 세트에서 높은 정확도를 달성할 수 있지만, 인간 탐지기와 마찬가지로 '야생' 콘텐츠에서는 어려움을 겪는다. 워터마킹과 출처 추적은 가능성을 제공하지만, AI 개발자의 광범위한 채택이 필요하다.

결국, '동전 던지기' 현실은 인간의 인식에 의존하는 것에서 체계적인 안전장치로의 전환을 요구한다. 생성 AI가 콘텐츠 생성을 민주화함에 따라, 기술 대기업에서 정책 입안자에 이르기까지 이해관계자들은 진정성을 유지하기 위해 투명성과 검증을 우선시해야 한다. 이 연구는 경각심을 일깨우며, 조치가 없으면 대부분의 사람들이 진실과 허구를 구별하는 것이 곧 불가능해질 수 있음을 경고한다.