데이터셋 상세
AI 허브
KAIST - I-Keyboard dataset
43명의 피실험자에게, 150개의 문구를 보여주며 화면에 보이는 문구를 책상에 놓인 투명 키보드에 마치 키보드가 있다고 상상하여 열 손가락으로 입력하게 함
데이터 정보
연관 데이터
KAIST - 순차적 의사결정 데이터셋
공공데이터포털
실제 환경 변화 시나리오를 모사한 실험 환경 구축 위의 실험 환경에서 44명을 대상으로 실험 진행, 인간의 환경 탐색/학습 과정 데이터 구축
KAIST - 웨어러블 기기 데이터셋
공공데이터포털
Fitbit 사에서 제공하는 Web API를 활용하여 주기적으로 수집된 웨어러블 기기 데이터를 취득함
한국과학기술원 (KAIST 인공지능연구소) - 카이스트 오디오북 데이터셋
공공데이터포털
소설, 동화, 자기계발, 뉴스, 어학 장르에 어울리는 음성을 합성하기 위해 활용.
한국전자통신연구원 3차원 동적객체 검출 학습 데이터
공공데이터포털
자율주행 차량에서 주변 동적객체를 3차원 Bounding Box 형태로 검출/추적하기 위한 인공지능 학습 데이터 셋입니다.아래 링크에서 세부 정보를 확인하고 전체 데이터를 다운로드 받을 수 있습니다.https://nanum.etri.re.kr/share/kimjy/3DMOD?lang=ko_KR
한국전자기술연구원 3D 동적객체 검출 학습 데이터
공공데이터포털
인프라엣지에서 동적 객체를 3차원 Bounding Box 형태로 검출하기 위한 라이다 센서 기반 인공지능 학습 데이터셋입니다.아래 링크에서 세부 정보를 확인하실 수 있으며 협약서 작성 후 전체 데이터를 다운로드 받을 수 있습니다.https://nanum.etri.re.kr/share/jwlee0121/DataStitchingLidarObjectDetection?lang=ko_KR상기 데이터는 한국전자통신연구원, 카카오 모빌리티, 테슬라 시스템, 한국전자기술연구원, 한국과학기술원 등이 공동으로 협력하여 수행하는 자율주행혁신사업을 통해 구축한 데이터로 한국전자통신연구원에서 운영하는 ETRI AI 나눔 사이트를 통해 전체 데이터를 공개함
한국과학기술정보연구원 - 국내 논문 QA 데이터셋
공공데이터포털
기계가 과학기술 문헌을 읽고 이해하는 능력을 평가하기 위한 질의응답 데이터셋 [개요] ㅇ 국내 한글 논문에서 다루는 주요 개념들인 문제, 방법, 데이터, 모델, 결과 등에 대한 이해능력을 평가할 수 있도록 구축된 질의응답 데이터 ㅇ 용량 및 건수: 276,804 건, 8 GB [특징] ㅇ [구축 및 수집 방법] - KISTI가 학술논문 데이터베이스 구축을 통해 확보한 국내 학술 논문 중 최근 10년 이내 발행된 한글 논문을 대상으로 함. - 질의 난이도를 상/중/하 중 1가지로 설정. - 핵심 어휘는 논문의 핵심 내용(문제, 방법, 모델, 데이터, 결과 등)으로 판단되는 단어, 구, 문장 등으로 선택하였음. - 핵심 어휘가 포함된 질의 문장을 작성(난이도별 작성 기준에 적합한 질의 작성)하였음. - 작성한 질의에 대한 응답을 논문 내에 존재하는 단어, 구, 문장 등 형식 상관없이 그대로 추출하였음. ㅇ [검증 방법] - 구축된 질의 문장의 핵심 어휘와 질의 의도는 변경하지 않고, 그 외 부분에 대해서 올바르게 작성되었는지 검토하였음. - 1차 응답(구축자 응답), 2차 응답(검토자 응답), 3차 응답(검수자 응답) 간의 유사도 비교 수치(F1)를 참고하여 최종 응답 선정하였음. [활용사례] ㅇ (2022년 과학기술·공공 AI 데이터 분석활용 경진대회 우수상) 사전학습을 활용한 논문 QA ※ 해당 데이터는 한국과학기술정보연구원 심사 후 이용가능합니다.
한국전자통신연구원 인프라 2D 동적객체 검출 학습 데이터
공공데이터포털
프라 엣지에서 주변 동적객체를 2차원 Bounding Box 형태로 검출하기 위한 인공지능 학습 데이터 셋입니다.아래 링크에서 세부 정보를 확인하실 수 있으며 전체 데이터를 다운로드 받을 수 있습니다.https://nanum.etri.re.kr/share/teslasystem/Infra2DObjectDetection?lang=ko_KR
㈜나라지식정보 - 일반상식 문장 생성 평가 데이터
공공데이터포털
■ 기계가 생성한 문장과 인간이 생성한 문장을 다섯 가지 기준에 따라 평가함으로써 향후 AI가 생성한 문장을 AI가 검증할 수 있도록 하는 데이 ■ 한국어 일반상식 문장 평가 과제 중 세 번째 데이터로서 두 번째 데이터(제2과제 데이터)에서 제작한 문장에 대해 사람이 만든 문장과 기계가 생성한 문장을 네 가지 속성*에 따라 3점 리커트 척도로 채점한 점수를 기술 *채점 속성 : 문법성, 사실성, 유창성, 다양성
한국전자통신연구원 인프라 3D 동적객체 검출 학습 데이터
공공데이터포털
인프라 엣지에서 주변 동적객체를 3차원 Bounding Box 형태로 검출/추적하기 위한 인공지능 학습 데이터 셋입니다.아래 링크에서 세부 정보를 확인하실 수 있으며 전체 데이터를 다운로드 받을 수 있습니다.https://nanum.etri.re.kr/share/teslasystem/Infra3DObjectDetection?lang=ko_KR