데이터셋 상세
AI 허브
㈜위지윅스튜디오 - 안면 랜드마크 데이터
- 인공지능 학습용 데이터 구축을 위한 ‘안면 랜드마크 데이터’의 원천데이터를 획득하여 AI 학습용 데이터로 정제, 가공하여 공개하는 것을 목표로 함
연관 데이터
㈜위지윅스튜디오 - 시나리오 기반 표정 3D 데이터
공공데이터포털
- 인공지능 학습용 데이터 구축을 위한 ‘시나리오 기반 표정 3D 데이터’의 원천데이터를 획득하여 AI 학습용 데이터로 정제, 가공하여 공개하는 것을 목표로 함
경기도 - 자율주행 AI 학습데이터
공공데이터포털
AI 학습용 데이터(자율주행 AI 학습데이터)는 경기도의 「2021년 공공•민간 데이터 전처리」 사업의 일환으로 구축되었습니다. 본 데이터셋은 다양한 분야에서 비영리적 연구·개발 목적으로 활용할 수 있습니다.
㈜위지윅스튜디오 - 3D 사람 간 상호작용 데이터(2인)
공공데이터포털
인공지능 학습용 데이터 구축을 위한 ‘사람 간 상호작용’ 데이터의 원천데이터를 획득하여 AI 학습용 데이터로 정제, 가공하여 공개하는 것을 목표로 함
㈜포티투마루 - 행정 문서 대상 기계독해 데이터
공공데이터포털
행정문서를 활용하여 기계독해 모델 생성을 위한 지문-질문-답변으로 구성된 인공지능 학습 데이터
㈜위지윅스튜디오 - 3D 사람 간 상호작용 데이터(3인 이상)
공공데이터포털
인공지능 학습용 데이터 구축을 위한 ‘사람 간 상호작용’ 데이터의 원천데이터를 획득하여 AI 학습용 데이터로 정제, 가공하여 공개하는 것을 목표로 함
포티투마루 - 도서자료 기계독해
공공데이터포털
기존 AI 질의응답 서비스의 기반이 되어온 지식베이스(Knowledge Base)가 가진 한계 및 비효율성 등을 극복하기 위해 자연어 형태의 질의를 받아 지식 정보를 제공하는 서비스에 활용할 수 있는 딥러닝 기반 기계 독해 학습데이터셋 구축
㈜워트인텔리전스 - 지식재산권법 LLM 사전학습 및 Instruction Tuning 데이터
공공데이터포털
사법분야 초거대 AI 학습을 위해 지식재산권법의 법령, 판결문, 심결례, 심결문 및 유권해석 원시데이터로부터 각 분야의 문장을 추출/가공하여 질의/응답 및 요약을 위한 초거대 AI 학습용 Instruction tuning data를 구축함
솔트룩스 - 온라인 구어체 말뭉치 데이터
공공데이터포털
온라인 플랫폼(게시판, 댓글 등)에서 구어체 위주의 텍스트 데이터를 수집 후 전사 도구를 활용하여 구축된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋
광개토연구소 - 인공지능 기술분야-특허-키워드 맵핑 데이터
공공데이터포털
인공지능 기술분야-특허-키워드 맵핑 데이터