close

  • 서울
  • 남양주
  • 의정부
  • 수원
  • 인천
  • 부천
  • 천안
  • 대전
  • 청주
  • 광주
  • 목포
  • 부산

LAW-WIN

사건 영역

이름

전화번호

상담 신청

Case

chevron_right

지식센터

형사사건

딥페이크의 동력: 생성 기술과 합성 파이프라인의 해부

AI 영상 제작 애플리케이션 동향 및 딥페이크 기술을 이용한 불법 콘텐츠 저장 방식 연구(3)

 

IV. 기반 기술, 생성적 적대 신경망 및 딥페이크 합성

 

앞서 살펴본 디지털 성착취물의 양상과 실제 사례들이 구체적인 피해로 드러난다면, 이제는 그 배경에 놓인 기술적 기반을 들여다볼 차례입니다. 이 장에서는 딥페이크가 어떻게 만들어지는지를 기술적 관점에서 분석하고, 해당 콘텐츠가 어떤 방식으로 생성, 저장, 유통되는지를 이어서 설명합니다.

 

 

📌 GANs, 변형 오토인코더(VAEs) 및 기타 관련 AI 모델 소개

 

• 생성적 적대 신경망

두 개의 신경망, 즉 생성자와 판별자가 서로 경쟁하는 기계 학습 프레임워크의 한 종류이다. 

이 개념은 2014년 Ian Goodfellow 등에 의해 개발되었다.

 

• 생성자

훈련 데이터셋을 모방하는 사실적인 가짜 데이터(예: 이미지, 비디오 프레임)를 만들려고 시도한다. 

목표는 실제 데이터와 구별할 수 없는 가짜를 생성하는 것이다.

 

• 판별자

훈련 세트의 실제 데이터와 생성자가 만든 가짜 데이터를 구별하려고 시도한다. 

생성자에게 피드백을 제공하는 비평가 역할을 한다.

 

• 적대적 학습

두 네트워크는 제로섬 게임 방식으로 학습된다. 

생성자는 가짜를 만드는 데 더 능숙해지고, 판별자는 이를 감지하는 데 더 능숙해진다. 

이 반복적인 과정은 생성자가 점점 더 사실적인 결과물을 생성하도록 유도한다.

GANs는 매우 사실적인 딥페이크, 특히 얼굴 교환 및 합성 인간 외모 생성의 핵심 기술이다.

 

 

• 변형 오토인코더 (VAEs)

  • - 딥페이크 생성에 사용되는 또 다른 유형의 생성 모델이다.
  • - VAE는 입력 데이터(예: 이미지)를 저차원 잠재 표현(이미지 특징의 일종의 압축 코드)으로 매핑하는 인코더와 이 잠재 공간에서 원본 입력을 재구성하는 디코더로 구성된다.
  • - 딥페이크 생성 시, 공격자의 입력은 인코더에 의해 처리되고, 피해자 영상으로 학습된 디코더는 피해자의 외모와 일치하도록 신호를 재구성한다. VAE는 입력을 확률 분포에 매핑하여 기본 오토인코더보다 더 부드럽고 자연스러운 출력을 가능하게 한다.
  • - VAEs는 얼굴 표현 학습 및 새로운 얼굴 이미지 생성에 효과적이다.

 

• 확산 모델

  • - 데이터(예: 이미지)에 점진적으로 노이즈를 추가하여 손상시키고, 모델이 이러한 이미지를 순차적으로 노이즈 제거하도록 학습하는 새로운 아키텍처이다.
  • - 생성을 위해 모델은 순수한 노이즈에서 시작하여 점차적으로 상세한 이미지로 정제한다. DM은 매우 사실적인 이미지를 생성할 수 있으며 텍스트 입력에 따라 조절될 수 있다. GANs와 VAEs가 딥페이크 도구에서 더 확립되어 있지만, DM은 고품질 이미지 생성 능력으로 인기를 얻고 있으며 향후 딥페이크 합성에 더 널리 퍼질 수 있다.

 

• 트랜스포머 

  • - 자기 주의 메커니즘을 사용하는 아키텍처로, 자연어 처리(NLP)에 매우 효과적이며 텍스트 음성 변환(TTS) 시스템 및 DALL-E와 같은 다중 모드 시스템(텍스트에서 이미지 생성)에도 사용된다. 이는 사실적인 오디오 딥페이크(음성 복제) 생성 및 잠재적으로 텍스트 설명을 기반으로 전체 장면이나 시나리오를 생성하는 데 관련이 있으며, 이는 비디오 딥페이크에 통합될 수 있다.

 

🔎 GAN의 기본 설계는 적대적 관계에 있는 생성자와 판별자를 포함한다. 생성자의 유일한 목적은 판별자를 속이는 것이고, 판별자의 유일한 목적은 가짜를 더 잘 잡아내는 것이다. 이는 지속적인 피드백 루프를 만든다

 

판별자가 개선됨에 따라 생성자는 성공하기 위해 훨씬 더 미묘하고 사실적인 가짜를 만들어야 한다. 이러한 내재된 "군비 경쟁"은 GAN(또는 유사한 적대적 모델)이 주요 기술인 한, 딥페이크의 품질과 현실성은 시간이 지남에 따라 필연적으로 향상될 것임을 의미한다. 따라서 탐지 방법도 지속적으로 발전해야 한다.

 

정적 탐지 시그니처는 빠르게 구식이 될 것이다. 향후 탐지는 고급 GAN조차도 어려움을 겪는 미묘한 불일치를 식별하거나 순전히 시각적 아티팩트보다는 행동적/맥락적 단서에 더 의존할 수 있다.

 

 

📌 딥페이크 생성 파이프라인 

(주로 DeepFaceLab과 같은 도구를 사용한 얼굴 교환에 초점)

 

• 데이터 수집 (소스 이미지/비디오)

  • - 합성될 얼굴의 대상 인물에 대한 고품질 이미지 및 비디오의 대규모 데이터셋이 필요하다. 이는 종종 소셜 미디어, 공개 행사 등에서 이미지/비디오를 스크래핑하는 것을 포함한다.
  • - 소스 비디오 또는 이미지 세트(대상의 신체/장면에 배치될 얼굴, 또는 모방될 연기)도 필요하다.
  • - 학습 데이터의 품질과 양은 최종 딥페이크의 현실성에 큰 영향을 미친다. 효과적인 딥페이크 모델 학습에는 다양한 각도, 표정 및 조명 조건에서 대상 개인의 얼굴에 대한 대규모 데이터셋이 필요하다. 이러한 데이터의 주요 출처는 종종 소셜 미디어(Facebook, Instagram, TikTok), YouTube 및 기타 온라인 플랫폼의 공개 콘텐츠이다.

 

💡 광범위한 데이터에 대한 필요성은 개인 이미지 및 비디오를 대규모로 스크래핑하고 보관하기 위한 도구 및 기술의 개발과 사용을 장려한다. 종종 동의 없이 이루어지는 이러한 대량 수집은 딥페이크가 생성되기 전에도 심각한 개인 정보 침해를 구성한다.

 

수집된 데이터셋 자체는 딥페이크를 만들려는 사람들에게 귀중한 상품이 된다. 따라서 딥페이크 피해를 해결하려면 가짜 콘텐츠 자체에 초점을 맞추는 것뿐만 아니라 이러한 모델 학습을 위한 개인 데이터의 불법 수집 및 사용에도 초점을 맞춰야 한다. 이미지 스크래핑에 관한 데이터 개인 정보 보호 규정 및 플랫폼 책임이 더욱 중요해진다.

 

 

• 얼굴 추출 및 정렬

  • - 소스와 대상 모두에 대해 수집된 비디오/이미지의 모든 프레임에서 얼굴이 감지되고 추출된다.
  • - 얼굴 랜드마크(눈, 코, 입)가 식별되고, 학습 과정을 돕기 위해 얼굴이 표준 위치로 정렬(예: 회전, 크기 조정)된다.
  • - 적절한 추출 및 정렬은 AI 모델이 얼굴 특징을 정확하게 학습하는 데 매우 중요하다.

 

• 모델 학습

  • - 추출된 얼굴 세트에 대해 AI 모델(일반적으로 GAN 또는 딥페이크 도구에 특정한 오토인코더 아키텍처, 예: DeepFaceLab은 다양한 모델 아키텍처 사용)이 학습된다.
  • - 모델은 대상의 얼굴을 재구성하고 소스의 표정과 움직임을 대상의 얼굴에 매핑하거나 그 반대로 특정 딥페이크 목표에 따라 학습한다.
  • - 이는 가장 계산 집약적이고 시간이 많이 걸리는 부분으로, 종종 강력한 GPU와 수 시간 또는 수일의 학습 시간이 필요하다.
  • - 배치 크기와 같은 매개변수는 GPU 활용도를 최적화하고 메모리 오류를 방지하기 위해 조정된다.
  • - 학습 단계는 AI가 "가짜를 만드는 법"을 배우는 곳이다. 학습이 길고 좋을수록 결과는 더 설득력 있다.

 

• 콘텐츠 생성, 렌더링 (병합/변환) 및 출력

  • - 모델이 학습되면 학습된 얼굴을 대상 비디오의 프레임에 교환하거나 겹쳐 딥페이크 프레임을 생성하는 데 사용된다.
  • - 이 과정에는 합성된 얼굴을 주변 피부톤과 혼합하고, 조명 조건을 일치시키며, 가짜가 매끄럽게 보이도록 부드러운 전환을 보장하는 작업이 포함된다.
  • - 색상 보정, 선명화 또는 노이즈 추가와 같은 후처리 기술이 적용될 수 있다.
  • - 최종 프레임은 일반적으로 MP4와 같은 비디오 파일로 컴파일된다.

- 이 단계에서 실제 딥페이크 비디오가 생성된다. 렌더링 및 블렌딩 품질은 인지된 현실성에 큰 영향을 미친다.

 

📖 딥페이크 파이프라인은 데이터 수집, 얼굴 추출/정렬, 모델 학습, 렌더링/병합 등 뚜렷한 단계를 포함한다. 시각적 딥페이크와 함께 AI 음성 복제 및 텍스트-장면 생성도 발전하고 있다. 현재 많은 딥페이크는 기존 비디오에 알려진 얼굴을 배치하는 것을 포함한다.

 

그러나 서로 다른 AI 생성 기술(시각, 청각, 환경)이 성숙함에 따라 미래의 악의적인 행위자가 이를 결합할 가능성이 있다. 예를 들어, 딥페이크 얼굴, 조작된 스크립트를 말하는 복제된 음성, 그리고 이 모든 것을 AI 생성 환경이나 크게 변경된 실제 환경 내에서 결합한 가짜 비디오를 생성할 수 있다.

 

이러한 모듈성은 한 영역(예: 더 현실적인 음성 복제)의 개선이 복합 딥페이크의 전반적인 신뢰성과 잠재적 피해를 향상시킬 수 있음을 의미한다. 법의학 분석은 다중 모드 불일치를 고려해야 한다. 시각적으로 설득력 있는 딥페이크는 미묘한 오디오 아티팩트를 가질 수 있으며 그 반대의 경우도 마찬가지이다. 위협 환경은 단순한 얼굴 교환에서 잠재적으로 완전히 합성된 표적 시나리오로 확장된다.

 

 

V. 디지털 발자국, AI 생성 성착취물의 저장 및 유통

 

📌 일반적인 파일 형식, 해상도 및 메타데이터 아티팩트

 

• 파일 형식

  • MP4: 딥페이크를 포함한 비디오 파일에 매우 일반적인 형식이다. Adobe Firefly는 MP4를 출력한다. DeepFaceLab 출력물은 MP4로 변환될 수 있다. AI Hub 딥페이크 데이터셋도 MPEG 4.0을 사용한다. 일반 AI 비디오 도구도 종종 MP4를 기본값으로 사용한다.

이미지 형식 (개별 프레임 또는 이미지 기반 딥페이크용): JPG, PNG, WebP는 AI 도구에서 사용되거나 생성되는 이미지에 일반적이다. 딥페이크 생성에는 개별 프레임을 이미지로 추출하고 처리하는 과정이 포함될 수 있다.

GIF: Reface 및 유사 앱은 종종 얼굴이 바뀐 애니메이션 GIF를 출력한다.

 

• 해상도

1920x1080 (Full HD/1080p): 딥페이크 비디오 데이터셋 및 Adobe Firefly와 같은 도구의 출력물 7에 일반적인 해상도이다.

- 다른 해상도(예: 720p, 540p)도 특히 모바일 시청용 콘텐츠나 파일 크기를 줄여 배포를 용이하게 하기 위해 사용될 수 있다. GenApe AI 비디오 생성기는 1280x768을 출력한다.

 

• 메타데이터 아티팩트

특정 딥페이크 도구가 고유한 "딥페이크" 메타데이터를 포함하지 않을 수 있지만, 생성 과정에서 흔적이 남을 수 있다.

- 파일 생성/수정 시간, 소프트웨어 태그(불법 콘텐츠에서는 제거될 수 있으므로 덜 일반적임), 프레임 불일치, 압축 아티팩트 또는 노이즈나 블렌딩의 비정상적인 패턴은 법의학 분석(디지털 포렌식)을 통해 감지될 수 있다.

- 그러나 가해자는 종종 콘텐츠를 익명화하기 위해 메타데이터를 제거하려고 시도한다.

- 일반 파일 형식이 사용되어 합법적인 콘텐츠와 혼합되므로, 탐지는 종종 단순한 메타데이터 플래그보다는 콘텐츠 자체를 분석하는 데 의존한다.

 

 

📌 저장 장소 (자료가 발견되거나 보관되는 곳)

 

• 로컬 장치 저장

가해자와 소비자는 개인용 컴퓨터, 외장 하드 드라이브 및 휴대폰에 자료를 저장한다.

 

• 클라우드 저장 서비스 (예: Mega, Google Drive, Dropbox)

대용량 저장 용량, 접근 용이성 및 익명 또는 가명 계정 가능성으로 인해 불법 자료 저장 및 공유에 널리 악용된다. 파일은 직접 링크를 통해 공유될 수 있다. 클라우드 서비스는 빠른 업로드/다운로드 및 국제 서버 위치와 같은 기능을 제공하여 가해자가 국가 법적 관할권을 회피하고 삭제를 어렵게 만드는 데 도움이 된다.

 

• 소셜 미디어 플랫폼 (예: X/Twitter, Facebook, Instagram)

초기 유포에 사용되며, 종종 비공개 그룹이나 다이렉트 메시지를 통해 이루어진다. 

테일러 스위프트의 딥페이크 음란물은 X, Facebook, Reddit, Instagram에서 확산된 것으로 알려졌다. 

학생이 만든 딥페이크는 SNS 채팅방에서 공유되었다. 딥페이크 제작용 이미지는 종종 피해자의 소셜 미디어 프로필(카카오톡, 인스타그램, 페이스북)에서 공급된다.

 

• 메시징 애플리케이션 (특히 개인 정보 보호/익명성이 강화된 앱)

  • - 텔레그램: 딥페이크 성착취물의 제작, 유통 및 판매를 위한 주요 플랫폼으로 자주 언급되며, 종종 전용 그룹이나 채널 내에서 이루어진다. 텔레그램 봇은 제작 과정에서도 사용된다. 텔레그램의 대규모 그룹 수용 능력, 채널, 인지된 익명성/보안과 같은 기능은 불법 커뮤니티에 매력적이다.

 

• 전용 포럼 및 불법 웹사이트

틈새 포럼이나 웹사이트는 때로는 클리어 웹에 있지만 종종 색인되지 않거나 비공개로 운영되며, 도구, 기술 및 콘텐츠 공유 허브 역할을 한다.

 

• 다크웹 채널

자료에서 저장 형식에 대해 명시적으로 자세히 설명되어 있지는 않지만, 다크웹은 익명성으로 인해 CSAM 및 비동의적 음란물을 포함한 매우 불법적인 콘텐츠를 유통하는 것으로 알려진 장소이다. 딥페이크 콘텐츠도 그곳에서 유사한 유통 패턴을 따를 가능성이 높다.

 

✒️ 불법 딥페이크 자료의 생애 주기는 주류 플랫폼과 특수 플랫폼의 연쇄적인 활용을 통해 이루어진다. 이미지는 종종 주류 소셜 미디어(SNS, 카카오톡, 인스타그램)에서 스크랩된다. 제작에는 모바일 앱(Reface, FaceApp), 더 고급 소프트웨어(DeepFaceLab) 또는 텔레그램과 같은 플랫폼의 봇이 포함될 수 있다.

 

초기/틈새 유통은 종종 더 사적이거나 특화된 커뮤니티, 예를 들어 텔레그램 그룹, 특정 포럼 또는 직접 공유에서 발생한다. 그런 다음 주류 소셜 미디어(X/Twitter), 더 넓은 접근을 위한 클라우드 스토리지 또는 P2P 네트워크로 확산될 수 있다.

 

이는 콘텐츠가 다양한 수준의 공개 가시성과 검열을 가진 플랫폼 간에 이동하는 복잡한 웹을 만든다. 따라서 삭제 노력에는 다중 플랫폼 전략이 필요하다. 한 소셜 미디어 사이트에서 콘텐츠를 제거하는 것만으로는 메시징 앱이나 P2P 네트워크에서 공유되는 클라우드 링크를 통해 쉽게 사용할 수 있다면 불충분하다. 플랫폼 간 협력과 정보 공유가 필수적이다.

 

 

📌 유통 메커니즘 및 회피 전술

 

• P2P(Peer-to-Peer) 네트워크 및 토렌트

대용량 파일의 분산 유통에 사용되어 원본 업로더 추적 및 유통 완전 차단을 어렵게 만든다. 파일이 다수 사용자 간에 공유되기 때문이다. P2P 네트워크 사용자는 다운로드/공유하는 콘텐츠의 불법성을 항상 인지하지 못할 수 있다.

 

• 콘텐츠 전송 네트워크 (CDNs)

불법 스트리밍 사이트는 불법 콘텐츠를 저장하고 신속하게 전송하기 위해 CDN을 악용할 수 있다. CDN은 콘텐츠를 여러 서버에 분산시켜 삭제를 복잡하게 만들고, IP 주소가 자주 변경되어 차단을 방해할 수 있다. 이는 합법적인 스트리밍 서비스를 모방하여 불법 콘텐츠에 쉽게 접근할 수 있도록 한다.

 

• 암호화 및 난독화 사용

  • - 자료에서는 딥페이크에 대해 명시적으로 자세히 설명되어 있지 않지만, 저장 장치 또는 아카이브(암호가 있는 ZIP, RAR 파일)의 암호화는 불법 자료를 은닉하기 위한 일반적인 전술이다.
  • - 스테가노그래피(다른 파일 내에 데이터 숨기기)는 더 발전된 기술이지만 복잡성으로 인해 대량 유통에서는 덜 일반적으로 나타난다.
  • - 온라인 토론에서 파일 이름을 난독화하거나 코드화된 언어를 사용하는 경우도 있다.

 

• 신속한 재업로드 및 플랫폼 이동

콘텐츠가 한 플랫폼이나 링크에서 삭제되면 종종 새로운 계정, 다른 클라우드 서비스 또는 대체 플랫폼에 신속하게 재업로드되어 가용성을 유지한다.

 

• 익명성 계층

콘텐츠 업로드 또는 공유 시 VPN, 프록시 및 Tor와 같은 익명화 네트워크를 사용한다. 

일부 클라우드 서비스는 느슨한 규제 또는 사용자 익명성 기능 때문에 선택된다.

 

• 오타 및 키워드 해킹

콘텐츠 생성 또는 공유 시 플랫폼의 콘텐츠 필터를 우회하는 데 사용된다 (예: Microsoft Designer).

 

불법 딥페이크의 기술적 특징(파일 형식, 해상도)은 정교한 은닉보다는 접근성과 유포를 우선시한다. 확인된 일반적인 파일 형식(MP4, JPG, PNG)은 표준적이고 널리 지원되는 형식이다. 1080p와 같은 해상도는 양호한 시각적 품질을 위해 일반적이지만 스트리밍/다운로드도 용이하다.

 

 

개인 저장에는 암호화가 사용될 수 있지만, 주요 유통 방법(클라우드 링크, P2P, 소셜 미디어, 텔레그램)은 광범위한 청중에 의한 시청 및 공유 용이성을 위해 이러한 표준적이고 접근 지점에서 암호화되지 않은 형식에 의존한다.

 

주요 "회피" 전술은 고도로 복잡한 파일 수준 난독화보다는 플랫폼 특성(익명성, CDN/P2P/클라우드의 복원력)에 중점을 둔다. 법의학적 관점에서 볼 때, 콘텐츠는 불법이지만 파일 자체는 순전히 형식이나 해상도만으로는 즉시 비정상적으로 보이지 않을 수 있다.

 

과제는 방대한 양의 합법적인 미디어 속에서 이를 식별하고 쉬운 공유를 위해 설계된 플랫폼을 통해 유통을 추적하는 데 있다. 가해자의 초점은 유통의 도달 범위와 복원력에 있다.

 

클라우드 스토리지 서비스, CDN, 소셜 미디어, 메시징 앱(텔레그램)과 같은 합법적인 인프라를 불법 유통에 악용하는 것은 심각한 검열 및 집행 딜레마를 야기한다. 이러한 플랫폼의 핵심 기능(대규모 스토리지, 빠른 콘텐츠 전송, 광범위한 연결성)은 악의적인 행위자에 의해 불법 딥페이크 유통에 이용된다.

 

불법 사용을 억제하기 위한 지나치게 공격적이고 광범위한 조치(예: 광범위한 콘텐츠 필터링, 키워드 금지)는 합법적인 사용을 방해하고 검열 우려를 제기할 수 있다. 이러한 플랫폼의 엄청난 양의 콘텐츠는 딥페이크(특히 미묘한 것)에 대한 수동 검열을 엄청나게 어렵게 만든다. 자동 탐지는 여전히 불완전하다. 이러한 서비스의 관할권 초월적 특성은 국내법 집행을 더욱 복잡하게 만든다. 서비스 제공업체는 끊임없는 싸움과 어려운 균형 잡기를 해야 한다. 효과적인 완화에는 개선된 자동 탐지, 강력한 보고 메커니즘, 삭제 요청에 대한 신속한 대응, 법 집행 기관과의 협력이 필요하며, 합법적인 사용자에게 미치는 영향을 최소화해야 한다. 이는 또한 서로 다른 법적 관할권에 호스팅된 콘텐츠를 해결하기 위한 국제 협력의 필요성을 강조한다.

 

 

다음 표는 저장 및 유통되는 불법 딥페이크 자료의 특징을 요약한 것이다.

특징 유형

구체적인 예 / 세부 정보

가해자 사용 이유 / 중요성

탐지 / 완화 주요 과제

파일형식

MP4, JPG, PNG, GIF

광범위한 호환성, 일반적 사용

정상 트래픽과 혼재, 특정 표식 부재

해상도

 

1080p, 720p, 기타 (예: 1280x768)

 

양호한 품질 대 파일 크기 균형, 스트리밍/다운로드 용이성

해상도만으로는 불법성 판단 어려움

저장 플랫폼

 

로컬 장치, 클라우드 서비스 (Mega, Google Drive), 텔레그램, SNS

개인 보관, 대용량 저장, 익명성, 쉬운 공유, 특정 커뮤니티 형성

암호화 가능성(로컬), 접근 제한(클라우드 비공개 링크), 익명성(텔레그램)

유통 방법

P2P 네트워크 (토렌트), CDN, 직접 링크, SNS/메신저 공유

분산화, 빠른 전송, 추적 어려움, 광범위한 도달

중앙 통제 부재(P2P), IP 변경(CDN), 신속한 재유포

회피 전술

 

 

익명화 서비스 (VPN, Tor), 암호화 (파일/저장소), 플랫폼 이동, 키워드 해킹

 

신원 은닉, 콘텐츠 보호, 검열 회피, 필터 우회

 

가해자 특정의 어려움, 암호 해독, 지속적인 모니터링 필요

 

 

 

 

 

 

 

 

비슷한 지식칼럼

관련된 성공사례