지난 3월 25일, 오픈AI(OpenAI)가 최신 이미지 생성 도구인 ChatGPT-4o 이미지 생성(Image Generation) 모델을 출시하면서 전 세계의 이목을 다시 한번 집중시켰다. 이번 모델은 무료 사용자도 이용할 수 있도록 접근성을 대폭 확대함으로써, 대중들의 폭발적인 관심과 체험의 열기를 이끌었다. 각종 SNS에서는 이른바 ‘지브리 스타일’로 변환한 생성 이미지를 서로 포스팅하고 공유하며 삽시간에 트렌드로 확산하였다. 지브리 트렌드를 계기로 이용자들은 자신의 사진을 ChatGPT에 제공하게 되었고, 이 과정에서 개인정보에 대한 심리적 장벽은 자연스럽게 허물어졌다. 그뿐만 아니라, 최신 트렌드에 합류하기 위해 ChatGPT를 설치하거나 이용하는 사람들이 증가하였고, 지브리 스타일로 변환하는 과정을 통해 ChatGPT는 엔터테인먼트 콘텐츠의 창작 플랫폼의 경험까지 제공하였다. 실제로 국내에서는 ChatGPT가 서비스를 시작한 2023년 7월 이후, 신규 가입자와 이용 시간에서 역대 최고치를 기록하였다. ChatGPT-4o 이미지 생성 모델이 가져온 지브리 스타일 생성 열풍과 멀티모달 AI 특성 및 가능성을 살펴보고자 한다.
1
1
지브리 스타일 생성 콘텐츠 열풍
ChatGPT-4o 이미지 생성 모델은 사용자가 사진을 업로드하면 심슨, 스머프, 레고 등 유명 애니메이션 화풍으로 변환하는 기능을 갖추고 있다. 오픈AI에서 이 기능을 출시한 후, 일주일간 1억 3,000만 명의 이용자가 7억 개의 이미지를 생성했다고 밝혔다. 특히, 오픈AI CEO 샘 올트먼(Sam Altman)이 자신의 X(구 트위터) 프로필을 지브리 스타일로 바꾸고, X게시글에 지브리 스타일 이미지를 업로드하며 화제를 모았다. 이러한 지브리 열풍에 힘입어 ChatGPT의 새로운 이미지 생성 모델이 큰 인기를 얻으며, ChatGPT의 일일 이용자 수는 120만 명대를 기록하였다. 지브리 트렌드 덕분에 단순한 체험 수준에서 그치지 않고 ChatGPT의 유료 구독자 450만 명을 증가하며 전체 가입자 수가 5억 명을 넘어섰다.

/ 출처 : 샘 올트만 X 갈무리
‘지브리 스타일’ 이미지 생성이 SNS에서 바이럴 트렌드가 된 이유는 무엇일까? SNS라는 커뮤니케이션 도구와 AI의 절묘한 만남이 사람들의 흥미와 참여를 유도한 것으로 보인다. 일상에서 AI 침투력은 높아졌지만, 그동안 AI는 고도의 첨단 기술이라는 인식이 커서 일반 대중에게는 어렵게 인식되었다. 그러나 SNS에서 지브리 스타일 이미지 생성 트렌드가 릴레이처럼 확산하며, 일종의 소셜 챌린지와 같은 콘텐츠로 인식하며 부수적인 홍보 효과와 신규 이용자까지 확보한 셈이다.
1
지브리 스타일 생성과 저작권
ChatGPT를 통한 지브리풍 이미지 생성 열풍은 AI 기반 콘텐츠의 창작 가능성을 확장했다는 점에서 주목받았지만, 동시에 해당 이미지들이 저작권과 초상권 침해, 그리고 딥페이크 악용 가능성 등 다양한 법적, 윤리적 문제가 지적되고 있다. AI(OpenAI) 정책에서도 ‘실존하는 개별 예술가의 스타일’을 복제하는 프롬프트는 제한하고 있지만, 지브리 스타일의 경우에는 이를 복제로 간주하지 않고, ‘스타일’ 또는 ‘화풍’의 범주로 해석하고 있다. 일반적으로 ‘스타일’ 혹은 ‘화풍’은 저작권의 보호 대상이 될 수 없다. 하지만 저작권자의 허락이나 정당한 보상이 없는 상태에서 지브리 애니메이션을 기반으로 AI 학습이 이뤄졌다면 저작권 침해에 해당한다고 볼 수 있다. 현재 ChatGPT에서 생성된 지브리 스타일 이미지는 단순히 화풍의 재현보다는 지브리 애니메이션의 구체적 표현과 유사성을 담아내고 있어, 학습 데이터에 지브리 애니메이션이 포함되었을 가능성이 제기된다.
지브리 스타일 생성 열풍의 중심에 있는 스튜디오 지브리(Studio Ghibli)는 현재까지 공식적인 입장은 밝히지 않았다. 다만, <센과 치히로의 행방불명>, <하울의 움직이는 성>으로 유명한 ‘미야자키 하야오’ 감독의 2016년 인터뷰에서 AI가 생성한 애니메이션에 대해 모욕적이라고 언급한 내용이 다시 주목을 받을 뿐이다. 그동안 지브리는 도서 및 출판 등 인쇄물이나 굿즈(goods)와 관련된 강력한 법적 대응을 실행하며 이에 대해 공식 홈페이지에서 공개적인 입장을 밝혀왔다. 실제로 지난 2024년 12월에는 지브리에서 출판한 책이나 작품의 패턴, 그림을 허가 없이 온오프라인 매장에서 판매하는 행위에 대해 민형사상 법적 대응을 취할 것이라며 공지한 바 있다. 아울러, 지브리 작품은 “오랜 세월 동안 수많은 시간과 노력으로 만들어진 것”이며, “저작권 침해로 본질적인 지브리 작품의 인기와 영향력을 이용해 부당한 이익을 추구하는 행위를 용납하지 않는다”고 밝혔다. 지브리는 강력한 저작권 보호를 통해 전 세계 팬들에게 훌륭한 작품을 제공하고 공식 라이선스 제품을 오랫동안 제공하기 위해 노력할 것이라고 명시한 바 있다. 이러한 점에서 현재의 지브리 스타일의 생성 열풍은 지브리가 고수해 온 가치관과 상충하며, 기존의 저작권 침해보다 더 심각한 문제로 여겨질 수 있다. 그런데도 지브리는 이에 대해 침묵하며 이전과는 전혀 다른 태도를 보여서 아이러니하다.

/ 출처 : Studio Ghibli.
1
지브리 열풍에 가려진 멀티모달 AI와 가능성
오픈AI가 선보인 AI 모델은 기술적 발전을 거듭하며 놀라운 성과를 보여줬으며, 특히 이번에 출시된 GPT-4o 이미지 생성 모델은 ‘지금까지 가장 진보된 이미지 생성 모델’이라고 소개하며 자신감을 보였다. 이 모델은 텍스트와 이미지를 동시에 처리할 수 있는 최초의 멀티모달(multi modal) 모델이라는 점에서, 그 자체만으로 AI 기술의 전환점을 의미한다.
GPT-4o 이미지 생성은 언어 모델 GPT-4o와 이미지 생성 모델 DALL·E3를 통합하여 언어 지식과 이미지 생성을 동시에 처리하는 최초의 실시간 멀티모달 AI를 구현했다는 점에서 의미가 크다. 그동안 생성형 AI는 텍스트, 이미지, 비디오 등 각각의 생성 영역에서 독립적인 모델로 기술 발전이 이루어져 왔으나, 이번 모델은 텍스트와 이미지를 단일 시스템으로, 유기적으로 통합한 첫 번째 사례이다. 이러한 통합형 멀티모달 기술이 빠른 시일 내에 비디오 생성 기능까지 통합한 차세대 모델로 발전할 가능성을 시사한다는 점에서 더욱 주목할 필요가 있다.
지브리 열풍에 가려져 우리가 간과하고 있었던 핵심이 바로 이 지점이다. 별개의 텍스트와 이미지 모델을 통합한 것처럼, 조만간 비디오 모델(Sora)까지 통합을 시도하려는 가능성이 크고, 이를 통해 동적 이미지와 영상 생성이 가능해질 경우, 콘텐츠 창작과 제작을 비롯한 문화예술 전반에 미치는 AI 영향력은 더욱 커질 것이다. 이러한 변화는 단순히 기술 혁신의 수준을 넘어 기존의 콘텐츠 산업과 생태계 구조를 크게 뒤흔들 수 있는 잠재적인 위기를 내포하고 있다.
그러나, 새로운 멀티모달의 이미지 생성 모델은 광고업계에서는 높은 기대감을 모으며 긍정적 평가를 받고 있다. 영국 ‘몽크스(Monks)’의 공동 창업자이자 최고 AI 책임자 웨슬리 테르 하르(Wesley ter Haar)는 “매우 놀랍고, 광고 산업의 방향을 명확히 보여준다”고 평가하였다. 미국 디지털 에이전시 ‘코드 앤 띠어리(Code and Theory)’의 최고 크리에이티브 책임자인 크레이그 엘리멜리아(Craig Elimeliah)는 “아이디어와 완성된 이미지는 이제 며칠이 아니라 몇 초면 가능하다”라며 AI 기술의 창의적 패러다임 전환을 언급하였다.
이러한 광고업계의 반응은 AI 기술 수용과 변화에 가장 민감하게 대응하며 기민하게 변화해 온 업계의 특성과 일치한다. 실제로 광고주 인식 보고서에서 광고 전문가 57%가 투자나 최적화를 위해 AI를 신뢰한다고 응답하였고, 서베이몽키(SurveyMonkey) 조사에서는 전체 마케터의 88%가 현재 업무에서 AI를 활용하며, 이 중 93%가 AI로 콘텐츠를 생성하는 것으로 나타났다. 이처럼 광고 산업은 AI를 적극적으로 도입하고 있지만, 여전히 글로벌 조사기관 이마케터(eMarketer)에 의하면, 광고 전문가 60%가 AI의 정확성을 우려하는 것으로 나타났다.
이번 모델의 핵심은 단순히 최초로 멀티모달 기능을 구현했다는 것 이외, 기존 생성모델의 한계와 문제를 보완하여 다양한 형태의 정보를 종합적으로 처리하고 이해할 수 있는 능력을 갖추었다는 것이다. 특히 ‘텍스트 인식’, ‘복잡한 지시사항 처리’, ‘언어적 이해력’ 등에서 개선 사항을 확인할 수 있으며, 이를 바탕으로 4컷 만화, 웹툰 등을 제작해서 공유하는 사례도 증가하고 있다.
먼저, 텍스트 인식에서는 과거에는 외계어 형태의 텍스트를 생성했던 것과 달리, 이제는 이미지 내 원하는 텍스트를 정확하게 삽입할 수 있을 정도로 ‘텍스트 깨짐’ 현상이 완벽히 개선되었다. 또한 ‘삼각형 바퀴를 가진 자전거’처럼 복잡한 지시사항도 정확히 이해하고 그 특성을 시각적으로 정밀하게 묘사할 수 있다. 언어적 이해력은 크게 향상되었는데, 프롬프트에 디테일한 설명 없이도 단순히 ‘OO스타일’이라고 요청하면 ChatGPT가 직접 추론해서 그에 알맞은 결과물을 생성한다. 이러한 개선 사항을 보면, 텍스트를 이미지로 생성했던 것에서 문장의 의미나 맥락을 파악한다는 점이 크게 달라졌다.

/ 출처 : KT나스미디어(2025. 4).
1
AI와 인간의 상상력 공존과 균형
ChatGPT 이미지 생성 모델은 생성 결과의 오류를 줄이면서 높은 정밀도와 일관성을 보여준다. 생성형 AI가 콘텐츠 제작의 획기적인 변화를 가져오며, SNS를 중심으로 확산한 지브리 화풍의 바이럴 트렌드로 생성형 AI에 대한 대중들의 관심과 태도를 변화시키는 계기를 마련하며 AI 기술의 심리적 진입 장벽을 낮추는 데 기여하였다. 하지만, AI 창작물의 저작권 침해 및 권리문제, 그리고 변환을 위해 제공한 사진이 딥페이크에 악용될 수 있다는 우려를 중심으로 다양한 논쟁을 촉발하며 법적, 윤리적 문제 해결의 필요성을 확인할 수 있었다. 이러한 기술은 사용자에게 편리함과 안락함을 제공하는 동시에, 창작자로서 인간의 가치와 생존의 문제는 충분히 고려하지 않은 것으로 보인다.
이번 지브리 열풍의 중심에 있었던 ChatGPT-4o 신규 모델은 단순한 이미지 생성 모델을 넘어, 텍스트와 이미지의 통합적 처리를 가능케 한 최초의 실시간 멀티모달 모델이라는 점에서 기술적으로 큰 의미를 지닌다. 전문가들은 생성형 AI가 상상력을 바탕으로 진보된 모델로 종합적 이해와 정확성까지 더할수록 콘텐츠 산업 전반에 상당한 영향력을 미칠 것으로 전망한다. 나아가 비디오 생성 기능까지 갖춘 통합형 멀티모달의 생성형 AI 모델이 등장한다면, 그 파급력은 현재보다 훨씬 더 클 것으로 예상된다.
AI가 주도하는 산업 생태계에서 적극적인 대응 전략과 기준 마련이 시급해 보인다. 미디어 산업은 이제 상상력과 이해력, 그리고 정확성으로 무장한 생성형 AI 확산에 대응하기 위해 혁신적인 활용 방안을 모색하고, 동시에 인간의 고유한 창의성을 보존하고 확장할 방법도 고민할 시기이다.
참고문헌
강승한(2025. 4. 6).”‘지브리’ 프사가 유행” 기꺼이 지갑 열더니…챗GPT 이용자 역대 최대. 머니투데이.
이승훈(2025. 4. 1). 카톡 번진 ‘지브리 프사’…이미지 생성 열풍에 챗GPT 이용↑. 이코노미스트.
KT나스미디어(2025. 4). Media & Market Issue. 364호.
Emarketer(2025. 3. 31). OpenAI Ghibli Craze Reveals a shift in how consumers see AI.
Studio Ghibli. https://www.ghibli.jp
Tortoise Media (2025. 3. 28). Everywhere a Ghibli. technology ai, science and new things.