데이터셋 상세
AI 허브
㈜포티투마루 - 행정 문서 대상 기계독해 데이터
행정문서를 활용하여 기계독해 모델 생성을 위한 지문-질문-답변으로 구성된 인공지능 학습 데이터
연관 데이터
경기도 - 자율주행 AI 학습데이터
공공데이터포털
AI 학습용 데이터(자율주행 AI 학습데이터)는 경기도의 「2021년 공공•민간 데이터 전처리」 사업의 일환으로 구축되었습니다. 본 데이터셋은 다양한 분야에서 비영리적 연구·개발 목적으로 활용할 수 있습니다.
MBN - 인물사전 DB - 경제인
공공데이터포털
MK / MBN 보도, 교양, 예능 원천 데이터를 활용하여 인공지능 학습용 데이터 구축 할 수 있게 데이터 제공
국립국어원 - 의미역 기술 모형
공공데이터포털
(버전 1.0) 술어의 필수 의미역(우리말샘과 세종 전자사전 의미 번호 부착)을 기술한 모형입니다.
국립국어원 - 맞춤법 교정 말뭉치 2022
공공데이터포털
(버전 1.0) 온라인 대화 자료를 대상으로 한국어 처리 도구가 분석할 수 있는 수준으로 오탈자 등을 교정한 말뭉치입니다.
한국과학기술정보연구원 - 한국어 대화
공공데이터포털
소상공인 및 공공 민원 10개 분야에 대한 50만 건 이상의 대화를 제공하는 자연어 데이터 제공
국립국어원 - 신문 말뭉치 2024
공공데이터포털
(버전 1.0) 2023년 생산된 신문 기사 중 매체로부터 저작권 이용 허락을 받은 기사를 기계 분석 가능한 형식으로 정제한 말뭉치입니다.
MBN - 옛날신문 1966
공공데이터포털
대용량 콘텐츠 AI 원천 데이터 MK 디지털화된 지면 원천 데이터를 활용하여 인공지능 학습용 데이터를 구축 할 수 있게 제공
국립국어원 - 신문 말뭉치 2023
공공데이터포털
(버전 1.0) 2022년 생산된 신문 기사 중 매체로부터 저작권 이용 허락을 받은 기사를 기계 분석이 가능한 형식으로 정제한 말뭉치입니다.
국립국어원 - 일상 대화 말뭉치 2020
공공데이터포털
(버전 1.4) 특정 주제 또는 제시 자료로 자유롭게 대화를 나눈 일상 대화 말뭉치입니다.