데이터셋 상세
모두의 말뭉치
국립국어원 - 그래프 기반 문장 생성 말뭉치 2022
(버전 1.0) 그래프의 내용을 설명하는 기준 문장과 기준 문장을 환언한 유사 문장으로 구성된 말뭉치입니다.
데이터 정보
연관 데이터
국립국어원 - 무형 대용어 복원 말뭉치 2020
공공데이터포털
(버전 1.0) 문장 내 생략어를 맥락에 따라 복원한 말뭉치입니다.
국립국어원 - 구문 분석 말뭉치
공공데이터포털
(버전 2.0) 문장의 구문 구조를 분석해 의존 관계 표지를 부착한 말뭉치입니다.
국립국어원 - 의미역 분석 말뭉치
공공데이터포털
(버전 1.0) 문장의 술어가 가지는 논항을 분석하고 의미 역할을 부착한 말뭉치입니다.
국립국어원 - 상호 참조 해결 말뭉치 2019
공공데이터포털
(버전 1.0) 하나의 글 안에서 같은 대상을 다른 표현으로 나타낸 것들을 찾아 서로 연결한 말뭉치입니다.
국립국어원 - 개체명 사전 2021
공공데이터포털
(버전 1.1) 개체명 및 개체 연결 정보가 부착된 말뭉치에서 개체 표현, 개체 유형, 지식베이스 연결 정보를 추출하여 구축한 자료입니다.
국립국어원 - 일상 대화 말뭉치 2020
공공데이터포털
(버전 1.4) 특정 주제 또는 제시 자료로 자유롭게 대화를 나눈 일상 대화 말뭉치입니다.
국립국어원 - 지역어 말뭉치 2021
공공데이터포털
(버전 1.0) 2021년 구술 발화 조사결과(10개 지점 각 3세대 제보자 조사)를 정리한 원시 말뭉치
국립국어원 - 신문 말뭉치 2021
공공데이터포털
(버전 1.0) 종합지, 전문지, 인터넷 기반 신문 매체의 기사(2020년)로 구성된 말뭉치입니다.
국립국어원 - 국회 회의록 요약 말뭉치 2022
공공데이터포털
(버전 1.0) 국회 소위원회 회의록을 대상으로 쟁점별 중요 요약문, 세부 요약문 및 문서 전체에 대한 대표 요약문으로 구성된 말뭉치입니다.
한국어 생성 기반 상식추론 데이터셋
공공데이터포털
사전에 구축된 AI-HUB의 대화 요약 및 이미지 캡션 텍스트 데이터로부터 Tagger 및 신경망 네트워크를 통해 반자동화 구축 방식을 적용하여 형태소를 추출. 추출한 형태소는 하나의 개념 집합을구성하며, 개념 집합의 내용을 바탕으로 일반 상식에 부합하는 짧은 문장을 재구성하도록 하는 자연어 생성 데이터.