최근 이미지 생성을 ChatGPT에 직접 통합하여 사용자가 채팅 인터페이스를 벗어나지 않고도 비주얼을 만들 수 있도록 한 OpenAI의 조치에 따라 DALL.E 3는 마침내 은퇴합니다.
이 회사는 화요일에 새로운 업데이트를 발표하면서 이러한 움직임이 다양한 미디어에서 AI 도구의 접근성과 활용도를 높이고 AI 아트 분야에서 입지를 강화하려는 회사의 광범위한 목표와 어떻게 일치하는지 설명했습니다.
새로운 업데이트는 DALL.E 3의 이미지 생성 모델을 기반으로 합니다. 그러나 2023년 출시 이후 이 AI 모델은 Flux, MidJourney v6, SD 3.5., Redraft, Reve와 같은 고급 대안을 선호하는 AI 애호가들 사이에서 인기를 유지하는 데 어려움을 겪어왔습니다.
이전에는 OpenAI가 이미지와 텍스트 생성을 분리하여 GPT는 텍스트 기반 작업을 처리하고 DALL-E 3는 이미지에 집중했습니다. 하지만 새로운 GPT-4o를 사용하면 모든 것이 단일 시스템으로 통합되어 DALL-E 3를 효과적으로 폐기할 수 있습니다.
더 스마트하고 기능적인 모델
OpenAI는 블로그 게시물에서 "GPT-4o 이미지 생성은 텍스트를 정확하게 렌더링하고, 프롬프트를 정확하게 따르며, 업로드된 이미지를 변형하거나 영감을 얻는 등 내장된 지식과 채팅 컨텍스트를 활용하는 데 탁월합니다."라고 설명했습니다.
이는 통합 프레임워크 내에서 텍스트, 이미지, 오디오를 포함한 여러 양식을 처리할 수 있는 '옴니' 모델로 거듭나겠다는 OpenAI의 비전에 한 걸음 더 다가간 것입니다. 회사에 따르면 GPT-4o는 이전 모델보다 훨씬 더 뛰어난 성능과 정확성, 지능을 갖추고 있습니다.
공개 당시 OpenAI의 CEO인 샘 알트먼은 ChatGPT-4o의 새로운 기능을 선보이며 다음과 같이 말했습니다.
많이 기다리셨겠지만 그만한 가치가 있다고 생각합니다. 너무 큰 진전이라 설명하는 가장 좋은 방법은 보여드리는 것뿐입니다."& Quot;
이 시연에서 OpenAI는 영어와 중국어로 입력된 상대성 이론을 설명하는 만화 페이지, 개인 및 실제 사진으로 생성된 맞춤형 트레이딩 카드, 여러 이미지를 투명한 배경과 합쳐서 만든 기념 주화, 매우 긴 프롬프트로 만든 매우 상세한 일러스트를 포함한 여러 사용 사례를 강조했습니다.
알트만은 이 새로운 이미지 생성 모델의 몇 가지 문제점에 대해서도 투명하게 공개했는데, 그 중 하나가 바로 이미지 생성 속도입니다. 알트만은 GPT-4o가 이미지 생성 속도가 느린 것처럼 보이지만 이는 이미지 생성의 효율성보다는 이미지의 품질에 더 중점을 두었기 때문이라고 설명합니다.
개발 초기 단계
하지만 새로운 기능은 점진적으로 출시될 예정이므로 지금 보고 있는 것은 출시의 첫 단계에 불과합니다.
DALL.E 3 모델과 새로운 ChatGPT 모델을 나란히 비교해보면 뚜렷한 차이점을 확인할 수 있습니다. DALL.E 3는 긴 로딩 화면 후에 이미지가 완전히 형성된 상태로 팝업되는 반면, 새로운 GPT-4o는 이미지를 실시간으로 위에서 아래로 점진적으로 렌더링합니다.
하지만 OpenAI 팀은 이 기술이 단순히 예쁜 이미지 그 이상이라고 강조합니다. 새로운 GPT-4o의 가장 진보된 부분은 그들이 알고 있는 정보를 시각화하고 그 정보를 시각적 이미지로 변환할 수 있다는 점입니다.
이 기능은 정확하게 렌더링된 텍스트와 주제 일관성을 갖춘 이미지 편집이 포함된 과학 도표나 정보 포스터 등 교육 영역에 적용할 때 특히 유용합니다.
기본 제공 보호 기능 및 향후 확장
그러나 AI가 할 수 있는 모든 새로운 기능과 기능에 대해 OpenAI는 딥페이크 및 불법 콘텐츠와 같은 오용을 방지하기 위한 가드레일을 구현하는 것을 잊지 않았습니다.
생성된 이미지에는 눈에 보이는 워터마크가 표시되지는 않지만, AI 출처를 표시하는 C2PA 메타데이터가 포함됩니다. OpenAI는 이미지 출처를 추적하는 도구도 개발 중입니다.
Facebook은 이 기능을 API로 확장하여 개발자가 이미지 생성을 자체 애플리케이션에 통합할 수 있도록 할 계획입니다. 또한 OpenAI의 이용 약관은 플랫폼의 정책에 따라 사용자가 생성된 이미지의 소유권을 보유한다는 것을 확인합니다.