‘방송영상 AI 학습용 데이터 구축’ 국책사업 선정

‘방송영상 AI 학습용 데이터 구축’ 국책사업 선정

9
0

KBS, MBC, MBC충북, KT ENA가 과학기술정보통신부와 한국전파진흥협회(RAPA)가 주관하는 ‘2025년 방송영상 AI 학습용 데이터 구축’ 국책사업에 주관기관으로 선정됐다.

총사업비 193.2억 규모로 4개 컨소시엄에 각 48.3억이 지원된다. 5개월간(2025년 12월 31일까지) 수행되는 이번 사업에서 선정된 4개 사업자는 한국형 방송영상 AI 생태계 구축을 본격화하고, 콘텐츠 제작 전 과정 자동화에 나서며, 저작권 이슈가 해소된 국내 방송영상 원본 총 42,000시간을 활용하여 총 21,000시간의 고품질 방송영상 AI 학습용 데이터를 구축한다. 과기정통부는 각 컨소시엄이 고품질 데이터를 구축하도록, 데이터 품질검증 전문기관을 통해 품질기준 설정, 단계별 품질 관리ㆍ컨설팅, 품질기준 달성 검증 등 데이터 품질을 전주기 관리ㆍ검증한다. 선정된 4개 사업자의 사업 내용은 다음과 같다.

표 . 2025년 ‘방송영상 AI 학습용 데이터 구축’ 사업 지원대상 컨소시엄 선정 결과
표 . 2025년 ‘방송영상 AI 학습용 데이터 구축’ 사업 지원대상 컨소시엄 선정 결과

 

MBC
버추얼 스튜디오 등 다양한 방송콘텐츠 제작 환경에서 사용될 고정밀·고품질의 배경영상을 생성하는 AI의 학습용 데이터를 구축한다. 보도, 시사·교양, 예능, 드라마 등 10,000시간의 원본 영상을 활용하여, 3,633시간의 영상데이터, 49.2만 건의 이미지데이터 등 총 5,000시간 분량의 AI 학습용 데이터를 구축한다.

MBC충북(지역MBC 총 15개사)
우리나라 각 지역의 고유한 문화와 생활양식 등을 반영한 이미지 및 영상을 생성하는 AI의 학습용 데이터를 구축한다. 보도, 시사·교양, 다큐 등에서 각 지역의 다양한 자연·풍경, 생활·문화, 역사·사회 등과 관련된 12,000시간의 원본 영상을 활용하여, 3,600시간의 영상데이터, 84.24만 건의 이미지데이터 등 총 5,940시간 분량의 AI 학습용 데이터를 구축한다.

KT ENA
감정이 표현되는 우리나라 인물, 우리나라 배경, 예능 자막 등을 생성하는 AI의 학습용 데이터를 구축한다. 예능, 시사·교양, 다큐 등 10,000시간의 원본 영상을 활용하여, 3,600시간의 영상데이터, 50.4만 건의 이미지데이터 등 총 5,000시간 분량의 AI 학습용 데이터를 구축한다.

KBS
촬영구도 및 편집 자동화, 사극 및 시대극에서 활용되는 소품(의복, 무기, 유물 등)을 3D로 생성하는 등 방송콘텐츠 제작에 필요한 AI의 학습용 데이터를 구축한다. 보도, 예능, 다큐, 스포츠 등 10,000시간의 원본 영상을 활용하여, 4,500시간의 영상데이터, 1,500건의 3D 데이터, 20만 건의 이미지데이터 등 총 5,067시간 분량의 AI 학습용 데이터를 구축한다.

동 사업을 통해 구축된 데이터는 AI 모델 개발 등에 활용된다. 먼저, 각 컨소시엄은 데이터를 활용하여 방송제작 현장에 필요한 특화 AI 개발 및 적용을 지속 추진한다. 아울러, 구축된 데이터는 ‘독자 AI 파운데이션 모델’ 프로젝트에 선정된 정예팀 요청 시 제공되고, AI 허브 내 안심존 등에 연구·교육용 AI 개발을 위해 활용될 수 있도록 약 10~35% 이상 개방될 예정이다.

방송영상 AI 학습용 데이터가 거래 등을 통해 활용도를 높일 수 있도록 협의체도 운영된다. 선정된 컨소시엄, AI·데이터 전문가, 데이터 수요기업 등이 참여하여, 데이터 구축 현황을 공유하고 거래기준 및 체계 등을 논의할 예정이다.

댓글 없음