OpenAI의 Sora, 텍스트로 HD급 영상 자동 제작 현실화와 부정적인 시각은

이제 본격적으로 빅테크 기업간의 생성형AI(GenAI) 기반 기술경쟁 시대에 진입한 것으로 보여집니다.
얼마전 구글이 자사의 AI 브랜드를 제미나이(Gemini)로 통합하며 차별화된 기술을 시장에 어필하자 이에 대한 대응으로
Open AI사가 Sora라는 Text-to-Video 모델을 언론에 공개하였습니다. 아직 정확한 상용화 일정은 밝혀지지 않은듯 합니다.

《 OpenAI의 Sora 모델 》

  • Sora의 기능:
    Sora는 텍스트만으로 비디오를 생성하거나, 이미지를 동영상화하거나, 비디오를 연장하거나, 빠진 프레임을 채우는 등의 작업을 할 수 있습니다.
    Sora는 최대 1분 길이의 비디오를 고품질로 생성할 수 있으며, 사용자의 프롬프트(텍스트 명령)에 최적화하여 결과물을 생성합니다.
    이 모델은 다양한 캐릭터, 특정 유형의 동작, 그리고 피사체와 배경의 정확한 디테일이 포함된 복잡한 장면을 생성할 수 있습니다.
    예를 들어, “스타일리시한 여성이 따뜻한 네온 불빛과 애니메이션 도시 간판이 가득한 도쿄 거리를 걷고 있다”라는 프롬프트를 입력하면,
    Sora는 이 설명에 따라 비디오를 생성합니다.
  • Sora의 원리:
    Sora의 기술은 OpenAI의 DALL-E 3의 기술을 기반으로 합니다. Sora는 노이즈 제거(latent diffusion) 모델로, 하나의 Transformer를
    노이즈 제거기로 사용합니다. 비디오는 3D “패치”를 노이즈 제거하여 잠재 공간에서 생성되며,
    비디오 디코프레서에 의해 표준 공간으로 변환됩니다.
    Sora는 확산 모델이라는 방식을 사용하여, 정적 잡음처럼 보이는 비디오를 점차적으로 개선하여 최종의 완성된 비디오로 변환합니다.
    Sora는 트랜스포머 아키텍처를 사용하여 비디오와 이미지를 패치라는 작은 단위로 나누고, DALL·E와 GPT 모델에서 사용한
    recaptioning 기법을 적용하여 비주얼 데이터에 대한 설명을 생성합니다.

  • 활용 가능성(잠재 시장):
    영화 및 TV 제작: 소라는 영화 및 TV 프로그램 제작 과정을 혁신할 수 있습니다. 
    예를 들어, 소라를 사용하여 특수 효과 장면을 만들거나 실제 촬영이 어려운 장면을 생성할 수 있습니다.
    교육: 소라는 교육 분야에서도 활용될 수 있습니다. 예를 들어, 소라를 사용하여 과학 개념을 시각화하거나 역사적 사건을 재현할 수 있습니다.
    마케팅: 소라는 마케팅 분야에서도 활용될 수 있습니다. 예를 들어, 소라를 사용하여 제품 광고 영상을 만들거나 브랜드 스토리를 전달할 수 있습니다.
  • Sora의 한계:
    Sora는 복잡한 물리적 상호작용이나 원인과 결과의 관계를 정확하게 모델링하는데 어려움을 겪을 수 있습니다.
    예를 들어, 쿠키에 물린 자국이 없거나, 의자가 부서지거나, 동물이 갑자기 나타나거나, 비디오의 공간적 세부사항이 혼동되거나,
    시간에 따른 이벤트의 순서가 잘못되는 등의 문제가 발생할 수 있습니다.

  • Sora의 안전성:
    Sora는 OpenAI의 제품에 적용되기 전에 여러 가지 안전 조치를 취할 예정입니다.
    예를 들어, 레드 팀이라고 하는 전문가들이 모델을 공격적으로 테스트하고, 오해의 소지가 있는 콘텐츠를 감지하는 도구를 개발하고,
    사용 정책에 위반되는 텍스트나 이미지를 거부하는 분류기를 사용하고, 정책 입안자, 교육자, 예술가 등과 협력하여 모델의 긍정적이고
    부정적인 사용 사례를 파악할 것입니다.

 

《 딥페이크에 대한 부정적인 시각 》

AI 기술의 발전은 많은 잠재력을 가지고 있지만, 동시에 여러 가지 우려사항을 불러일으키기도 합니다.
특히 Sora와 같은 고도로 발전한 AI 비디오 생성 모델은 다음과 같은 부정적인 측면을 가질 수 있습니다.

  • 가짜 뉴스와 딥페이크
    Sora와 같은 AI 모델이 생성하는 비디오는 매우 사실적이므로, 이를 악용하여 가짜뉴스를 확산하거나 딥페이크 비디오를 만드는 데
    사용될 수 있습니다. 예를 들어, 선거 기간 동안 투표자를 조작하려는 시도나, 존재하지 않는 백신 부작용을 보여주는
    비디오를 만드는 등의 시나리오가 가능합니다.

  • 신뢰성의 손실
    Sora와 같은 기술이 널리 퍼지면, 온라인에서 볼 수 있는 모든 사진이나 비디오가 가짜일 수 있다는 의심이 생길 수 있습니다.
    이로 인해 커뮤니티 콘텐츠에 대한 신뢰성이 떨어질 수 있으며, 이는 사회 전반에 걸쳐 심각한 문제를 야기할 수 있습니다.

  • 지적 재산권 문제
    AI가 창작물을 생성하는 것은 지적 재산권에 대한 새로운 이슈의 소지가 됩니다.
    예를 들어, AI가 생성한 작품의 소유권은 누구에게 있는지, 훈련 데이터에 포함된 라이선스가 없는 콘텐츠는 어떻게 다뤄져야
    하는지 등의 문제가 있습니다.

이러한 우려사항들은 Sora와 같은 AI 기술의 안전하고 윤리적인 사용을 위해 반드시 고려되어야 합니다.
이러한 문제를 해결하기 위한 제도적인 방안을 마련하는 것도 병행되어야 할 것입니다.

 

Sora (openai.com)

 

 

댓글 달기

Scroll to Top