데이터셋 상세
AI 허브
㈜에이아이웍스 - 융합센서 다중객체 추적 및 예측데이터 (업사이클링)
융합센서 다중객체 추적 및 예측데이터를 기반으로, 요소간의 의미적 관계 파악이 가능한 데이터로 LLM의 약점을 보완하기 위해 온톨로지, RAG 로 정확도를 높이고, 휴먼 가공과 검수, 그리고 피드백 과정을 통해 언어모델의 편향이나 오류를 수정해서 활용도 높은 이미지·텍스트 기반 데이터를 구축하였습니다.
연관 데이터
㈜에이아이웍스 - 화질변환 영상데이터 (업사이클링)
공공데이터포털
화질변환 영상데이터를 기반으로, 요소간의 의미적 관계 파악이 가능한 데이터로 LLM의 약점을 보완하기 위해 온톨로지, RAG 로 정확도를 높이고, 휴먼 가공과 검수, 그리고 피드백 과정을 통해 언어모델의 편향이나 오류를 수정해서 활용도 높은 이미지·텍스트 기반 데이터를 구축하였습니다.
㈜에이아이웍스 - 시각 상식 기반 추론 데이터 (업사이클링)
공공데이터포털
이미지 내 객체 및 상황 정보를 기반으로 상식적 판단을 요구하는 질의응답(Q&A)과 사고과정(Chain-of-Thought, CoT)을 포함한 추론형 AI 학습 데이터셋이다. 다양한 시각적 상황을 반영하여 객체 간 관계와 맥락을 이해하고, 이를 바탕으로 상식적인 판단이 가능한 데이터 구조로 구성되었다.
㈜에이아이웍스 - 인과관계 기반 추론 데이터 (업사이클링)
공공데이터포털
행동과 결과 간 관계를 기반으로 사건의 흐름을 이해하고 논리적 추론을 수행할 수 있도록 구성된 AI 학습 데이터셋이다. 다양한 상황에서 발생하는 인과관계를 반영한 데이터 구조로 구성되며, 사건 간 관계를 설명할 수 있는 질의응답(Q&A) 및 사고과정(Chain-of-Thought, CoT) 데이터로 구축되었다.
한국전자기술연구원 2D 동적객체 검출 학습 데이터
공공데이터포털
인프라엣지에서 동적 객체를 2차원 Bounding Box 형태로 검출하기 위한 인공지능 학습 데이터셋입니다.아래 링크에서 세부 정보를 확인하실 수 있으며, 협약서 작성 후 전체 데이터를 다운로드 받을 수 있습니다.https://nanum.etri.re.kr/share/jwlee0121/DataStitchingCameraObjectDetection?lang=ko_KR상기 데이터는 한국전자통신연구원, 카카오 모빌리티, 테슬라 시스템, 한국전자기술연구원, 한국과학기술원 등이 공동으로 협력하여 수행하는 자율주행혁신사업을 통해 구축한 데이터로 한국전자통신연구원에서 운영하는 ETRI AI 나눔 사이트를 통해 전체 데이터를 공개함
트위그팜 - 다국어 번역 품질 평가 데이터
공공데이터포털
- 다국어 언어쌍에 대한 양방향 병렬 번역 말뭉치 데이터 - 기계 번역 품질 예측 활용을 위한 번역 품질 평가 라벨링 데이터
국립국어원 - 속성 기반 감성 분석 말뭉치 2021
공공데이터포털
(버전 1.1) 국립국어원 감성 분석 말뭉치 2020과 동일한 문서에 속성 기반 감성 정보를 부착한 말뭉치입니다.
데이터리(Data.ly) - 민원 업무 자동화 인공지능 언어 데이터
공공데이터포털
창원시로부터 제공받은 콜센터 및 민원게시판(국민신문고) 원시 데이터에 학습에 필요한 정보(개체명, 의도분류, 부서정보, 키워드 등)를 부착하고 유사문장생성을 통해 표현의 다양성과 언어이해 능력을 향상한 인공지능 데이터셋
국립국어원 - 개체명 분석 말뭉치 개체 연결 2022
공공데이터포털
(버전 1.1) 개체명 분석 말뭉치에 위키피디아 연결 정보를 부착한 자료입니다.