데이터셋 상세
AI 허브
㈜웅진북센 - 대규모 구매도서 기반 한국어 말뭉치 데이터
인공지능 학습용 데이터를 수집하고 품질 평가 및 검증을 통하여 고품질의 학습용 데이터를 구축한다
연관 데이터
㈜코리아리서치인터내셔널 - 서베이 문항 생성 데이터
공공데이터포털
전문 리서처가 구축한, 저작권이 확보된, 적합성이 검증된 키워드 기반의 설문 구성으로 비리서치 전문가도 편리하게 활용 가능한 한국어용 설문 생성 인공지능 학습용 데이터셋
솔트룩스이노베이션 - 다국어 구어체 번역 병렬 말뭉치 데이터
공공데이터포털
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공
솔트룩스이노베이션 - 일상생활 및 구어체 한-중, 한-일 번역 병렬 말뭉치 데이터
공공데이터포털
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공
중소기업기술정보진흥원 제조 AI 교육동영상
공공데이터포털
중소기업기술정보진흥원이 운영중인 인공지능 중소벤처 제조 플랫폼(KAMP_Korea AI Manufacturing Platform) 에 제공하는 제조AI 와 빅데이터의 실세 사례 중심의 비대면 학습 영상 데이터 제공.
한국외국어대학교 - 한-영 및 한-중 음성발화 데이터
공공데이터포털
다국어 음성 합성을 위한 같은 의미의 한국어-영어/ 한국어-중국어 AI 학습용 데이터 구축
㈜와이즈넛 - 요약문 및 레포트 생성 데이터
공공데이터포털
다양한 한국어 원문 데이터로부터 정제된 추출 및 생성 요약문을 도출하고 검증한 한국어 문서요약 AI 데이터셋으로, 추출요약을 포함하여 본문에서 중요한 문장을 하나의 새로운 요약문으로 창조하는 생성요약(Abstractive Summarization)을 위한 데이터 세트를 구축하고 이를 실제 모델에 학습
솔트룩스 - 온라인 구어체 말뭉치 데이터
공공데이터포털
온라인 플랫폼(게시판, 댓글 등)에서 구어체 위주의 텍스트 데이터를 수집 후 전사 도구를 활용하여 구축된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋
롯데정보통신 - 소상공인 고객 주문 질의-응답 텍스트
공공데이터포털
무인 상점에서 고객의 질의에 답변 가능한 고객 응대 학습용 AI 텍스트 데이터
솔트룩스 - 대규모 웹데이터 기반 한국어 말뭉치 데이터
공공데이터포털
웹사이트 기반 (메가뉴스) 대용량의 텍스트 데이터를 수집 후 전사 도구를 활용하여 타이틀, 단락 제목, 본문 텍스트가 구조화된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋
한국딥러닝 주식회사 - 한국형 텍스트-3D 객체 쌍 데이터
공공데이터포털
- 3D 객체 생성 분야에서 인공지능 기술 발전에 기여하기 위한 학습용 데이터 - 문장에 맞는 3D 객체 생성을 위한 한국형 객체를 포함한 3D 애셋 데이터 및 이미지 캡션 라벨링 데이터 6,000쌍