데이터셋 상세
AI 허브
㈜더바이럴 - 문서 이해 기반 시각요소 생성 데이터
문서 내 수치 기반 설명문을 기반으로 차트를 자동 생성하고, 생성된 차트에 대한 질의응답 및 추론 수행을 위한 학습 데이터
연관 데이터
㈜메트릭스 - 차트 이미지-텍스트 쌍 데이터
공공데이터포털
- 문서 내 차트의 내용 정보를 구조화된 문장으로 자동 추출하기 위한 차트 이미지와 설명문 텍스트로 구성된 데이터셋
㈜무하유 - 학술논문 이해 데이터
공공데이터포털
학술논문 구조 이해를 위해 논문 내 텍스트, 이미지를 포함한 멀티모달 데이터 구축
㈜미디어그룹사람과숲 - 시각화 자료 질의응답 데이터
공공데이터포털
● 문서 내 그림, 표, 그래프, 다이어그램(인포그래픽 포함) 등 시각화 자료에 대한 이해 기반 질의응답 데이터로 시각 문서를 이해하고 문서의 내용에 관련된 질문에 대한 응답을 수행할 수 있는 학습데이터
㈜에이아이웍스 - 시각 상식 기반 추론 데이터 (업사이클링)
공공데이터포털
이미지 내 객체 및 상황 정보를 기반으로 상식적 판단을 요구하는 질의응답(Q&A)과 사고과정(Chain-of-Thought, CoT)을 포함한 추론형 AI 학습 데이터셋이다. 다양한 시각적 상황을 반영하여 객체 간 관계와 맥락을 이해하고, 이를 바탕으로 상식적인 판단이 가능한 데이터 구조로 구성되었다.
㈜에이아이웍스 - 카테고리 기반 추론 데이터 (업사이클링)
공공데이터포털
다양한 주제에 대한 상황 및 맥락 정보를 기반으로, 카테고리 판단 및 분류를 수행할 수 있도록 구성된 추론형 데이터셋이다. 질의응답(QA)과 사고과정(Chain-of-Thought, CoT)을 포함하여 분류 근거를 설명할 수 있는 구조로 설계되었다.
바이브컴퍼니 - 도서자료 요약
공공데이터포털
도서를 기반으로 한 원문의 핵심 내용, 의미 전달을 적절히 포함하는 요약문을 자동으로 생성하는 AI기술 개발을 위한 도서 요약 텍스트 데이터
비큐에이아이 - 문서요약 텍스트
공공데이터포털
AI가 텍스트를 이해하고 핵심내용을 자동으로 요약하는 기술개발을 위한 텍스트 및 요약내용을 생성하는 텍스트 데이터
유클리드소프트 - 시각정보 기반 질의응답
공공데이터포털
이미지와 이미지에 대한 질문과 대답으로 구성된 시각정보 기반 질의응답(Visual Question Answering, VQA) 데이터셋을 구축하여 시각정보 기반 질의응답 기술 연구의 학습용 데이터셋으로 활용 가능한 이미지 데이터 제공