데이터셋 상세
AI 허브
바이브컴퍼니 - 도서자료 요약
도서를 기반으로 한 원문의 핵심 내용, 의미 전달을 적절히 포함하는 요약문을 자동으로 생성하는 AI기술 개발을 위한 도서 요약 텍스트 데이터
연관 데이터
비큐에이아이 - 문서요약 텍스트
공공데이터포털
AI가 텍스트를 이해하고 핵심내용을 자동으로 요약하는 기술개발을 위한 텍스트 및 요약내용을 생성하는 텍스트 데이터
바이브컴퍼니 - 논문자료 요약
공공데이터포털
요약문을 자동으로 생성하는 자료 요약 AI 기술 개발을 위한 논문 요약, 특허 명세서 요약 텍스트 데이터
㈜코리아리서치인터내셔널 - 서베이 문항 생성 데이터
공공데이터포털
전문 리서처가 구축한, 저작권이 확보된, 적합성이 검증된 키워드 기반의 설문 구성으로 비리서치 전문가도 편리하게 활용 가능한 한국어용 설문 생성 인공지능 학습용 데이터셋
바이브컴퍼니 - 한국어 대화 요약
공공데이터포털
일상 대화, 토론 등 다양한 유형의 한국어 대화 원문 텍스트 데이터를 기반으로 한국어 대화 요약 AI 기술 개발을 위한 한국어 대화 요약 텍스트 데이터
국립국어원 - 문서 요약 말뭉치
공공데이터포털
(버전 1.0) 문서에서 추출한 주제문과 문서를 요약한 글로 구성된 말뭉치입니다.
국립국어원 - 문어 말뭉치
공공데이터포털
(버전 1.2) 책, 잡지, 보고서 등으로 구성된 말뭉치입니다.
㈜와이즈넛 - 요약문 및 레포트 생성 데이터
공공데이터포털
다양한 한국어 원문 데이터로부터 정제된 추출 및 생성 요약문을 도출하고 검증한 한국어 문서요약 AI 데이터셋으로, 추출요약을 포함하여 본문에서 중요한 문장을 하나의 새로운 요약문으로 창조하는 생성요약(Abstractive Summarization)을 위한 데이터 세트를 구축하고 이를 실제 모델에 학습
국립국어원 - 구어 말뭉치
공공데이터포털
(버전 1.2) 방송, 강연 등의 공적 구어 자료, 드라마 대본 등의 준구어 자료로 구성된 말뭉치입니다.
트위그팜 - AI 허브 데이터 활용을 위한 기계 번역앱 구축과 번역기 평가 및 신규 말뭉치 구축
공공데이터포털
• 번역 메모리(TM)로 활용할 AI 허브 공개 데이터의 정제·검수 데이터 • 기계 번역기 성능 향상을 위한 신규 말뭉치를 비롯한 비교 평가 데이터
국립국어원 - 온라인 게시 자료 말뭉치 2022
공공데이터포털
(버전 1.0) 게시판, 누리 소통망 등에서 수집한 언어 자료로 구성한 말뭉치입니다.