데이터셋 상세
AI 허브
마인즈랩 - 기계독해
기계독해 개발에 활용될 수 있는 뉴스 본문 기반 학습 데이터셋 45만 건을 구축한 지식베이스 제공
연관 데이터
㈜유클리드소프트 - 표 정보 질의응답 데이터
공공데이터포털
테이블이 포함된 일반 문서 내에서 표 내의 특정 값을 탐색하기 위한 기계학습용 질의어와 정답 세트 데이터
㈜포티투마루 - 행정 문서 대상 기계독해 데이터
공공데이터포털
행정문서를 활용하여 기계독해 모델 생성을 위한 지문-질문-답변으로 구성된 인공지능 학습 데이터
㈜포티투마루 - 뉴스 기사 기계독해 데이터
공공데이터포털
국내 종합일간지 및 지역신문의 뉴스기사를 지문으로 활용, 자연어 질의 응답으로 이루어진 인공지능 학습 데이터
포티투마루 - 도서자료 기계독해
공공데이터포털
기존 AI 질의응답 서비스의 기반이 되어온 지식베이스(Knowledge Base)가 가진 한계 및 비효율성 등을 극복하기 위해 자연어 형태의 질의를 받아 지식 정보를 제공하는 서비스에 활용할 수 있는 딥러닝 기반 기계 독해 학습데이터셋 구축
MBN - 옛날신문 1966
공공데이터포털
대용량 콘텐츠 AI 원천 데이터 MK 디지털화된 지면 원천 데이터를 활용하여 인공지능 학습용 데이터를 구축 할 수 있게 제공
배임 융합데이터
공공데이터포털
112 신고 데이터와 앰진시큐러스의 배임 뉴스 데이터를 융합
솔트룩스 - 온라인 구어체 말뭉치 데이터
공공데이터포털
온라인 플랫폼(게시판, 댓글 등)에서 구어체 위주의 텍스트 데이터를 수집 후 전사 도구를 활용하여 구축된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋
MBN - 전자신문 - 2013년 (무료버전)
공공데이터포털
대용량 콘텐츠 AI 원천 데이터 MK 디지털화된 지면 원천 데이터를 활용하여 인공지능 학습용 데이터를 구축 할 수 있게 제공 무료 1,000건 제공 연구 활용 목적 이외에는 사용 할 수 없습니다.