데이터셋 상세
AI 허브
오지큐 주식회사 - K-콘텐츠 클린본 데이터
드라마, 예능, 뉴스 등 방송 콘텐츠에서 얼굴, 번호판, 로고 등 개인식별 및 상업적 요소가 포함된 장면을 선별하여 객체 단위로 Segmentation 마스크, 다국어(한글/영어) 설명 캡션, 객체 메타정보를 포함한 비식별처리 학습용 데이터셋 구축
연관 데이터
오지큐 주식회사 - 미디어 콘텐츠 비식별처리 데이터
공공데이터포털
드라마, 예능, 뉴스 등 방송 콘텐츠에서 얼굴, 번호판, 로고 등 개인식별 및 상업적 요소가 포함된 장면을 선별하여 객체 단위로 Segmentation 마스크, 다국어(한글/영어) 설명 캡션, 객체 메타정보를 포함한 비식별처리 학습용 데이터셋 구축
KDX 한국데이터거래소 - 대용량 동영상 콘텐츠
공공데이터포털
인공지능 기술 개발을 위해 객체/행동/상황에 대한 2,931가지의 정밀하고 정제된 500시간의 학습용 데이터 구축 및 영상에 대해 연속적인 바운딩박스를 그릴 수 있는 데이터 가공 도구 제공
한국과학기술원 - 동영상 콘텐츠 하이라이트 편집 및 설명(요약) 데이터
공공데이터포털
뉴스, 유튜브 콘텐츠 등 영상을 수집하고 주요 장면의 위치를 레이블링 및 카테고리 항목에 대해 태깅하여 동영상 요약 학습용 데이터셋을 구축. 해당 데이터를 통해 인공지능 영상 요약 모델을 개발하고 자동화된 영상 편집 시스템을 제시.
아키아카 - 라이브 스트리밍 영상 일본어 통번역 데이터
공공데이터포털
- 한국 콘텐츠 산업의 해외성장세에 발맞춰, 자연어를 기반으로 하는, 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달 가능한 인공지능 학습데이터 구축 및 모델 개발
아키아카 - 라이브 스트리밍 영상 영어 통번역 데이터
공공데이터포털
- 한국 콘텐츠 산업의 해외성장세에 발맞춰, 자연어를 기반으로 하는, 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달 가능한 인공지능 학습데이터 구축 및 모델 개발
KDX한국데이터거래소 - AI 학습용 대용량 데이터 - 시간 표현 탐지 텍스트 데이터 셋
공공데이터포털
시간 표현 탐지 텍스트 데이터 셋 실제 방영된 방송 콘텐츠를 구매함으로써 인위적으로 설정한 영상이 아닌 실제 상황을 사업에 활용 연령대별, 성별 음성 분량 가능한 데이터 셋 제공 지적재산권과 초상권 이슈를 해결한 데이터 셋 제공,
트위그팜 - K-스톡 콘텐츠 데이터
공공데이터포털
한국적 분위기를 담고 있으면서도 활용도가 높은 스톡 콘텐츠 (Stock Contents) 발굴을 위해 시각적·맥락적으로 재구성된 멀티모달(이미지-텍스트) 데이터
비큐에이아이 - 전시 공연 도슨트 데이터
공공데이터포털
인공지능 자연어 처리를 활용한 전시 및 공연 문화의 자동분류, 도슨트 텍스트의 자동 작성 등에 활용하기 위해 전시공연 도슨트 데이터 셋트를 1,000세트 이상을 구축함
㈜문화방송 - 대한민국 배경영상 상세 설명문 데이터
공공데이터포털
한국 고유의 자연 및 시대 배경이 촬영된 영상의 장면 및 맥락 이해를 위한 상세 설명문 데이터 구축
한국딥러닝 주식회사 - 한국형 텍스트-3D 객체 쌍 데이터
공공데이터포털
- 3D 객체 생성 분야에서 인공지능 기술 발전에 기여하기 위한 학습용 데이터 - 문장에 맞는 3D 객체 생성을 위한 한국형 객체를 포함한 3D 애셋 데이터 및 이미지 캡션 라벨링 데이터 6,000쌍