데이터셋 상세
모두의 말뭉치
국립국어원 - 국어 역사 자료 말뭉치 2024
(버전 1.0) 17~19세기 쓰여진 언간(한글편지) 자료와 20세기 초 신소설, 판소리계 사설, 사전류 등 32종의 원시 말뭉치입니다.
데이터 정보
연관 데이터
국립국어원 - 지역어 말뭉치 2021
공공데이터포털
(버전 1.0) 2021년 구술 발화 조사결과(10개 지점 각 3세대 제보자 조사)를 정리한 원시 말뭉치
국립국어원 - 글쓰기 말뭉치 2023
공공데이터포털
(버전 1.0) 전국 9개 권영 국공립 대학생이 2023년에 작성한 1,000자 내외 논증형 글쓰기 자료 말뭉치.
국립국어원 - 신문 말뭉치 2021
공공데이터포털
(버전 1.0) 종합지, 전문지, 인터넷 기반 신문 매체의 기사(2020년)로 구성된 말뭉치입니다.
국립국어원 - 글쓰기 채점 말뭉치 2023
공공데이터포털
(버전 1.0) 전국 9개 권역 국공립 대학생이 2023년에 작성한 1,000자 내외 논증형 글쓰기를 채점 전문가 2인이 채점한 결과 정보를 제공한 채점 자료 말뭉치
국립국어원 - 한국어-베트남어 병렬 말뭉치 2024
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 베트남어로 번역하여 구성한 병렬 말뭉치입니다.
국립국어원 - 무형 대용어 복원 말뭉치 2020
공공데이터포털
(버전 1.0) 문장 내 생략어를 맥락에 따라 복원한 말뭉치입니다.
국립국어원 - 국회 회의록 요약 말뭉치 2022
공공데이터포털
(버전 1.0) 국회 소위원회 회의록을 대상으로 쟁점별 중요 요약문, 세부 요약문 및 문서 전체에 대한 대표 요약문으로 구성된 말뭉치입니다.
국립국어원 - 신문 말뭉치
공공데이터포털
(버전 2.0) 종합지, 전문지, 인터넷 기반 신문 매체의 기사(2009년~2018년)로 구성된 말뭉치입니다.
국립국어원 - 한국어-베트남어 병렬 말뭉치 2021
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 베트남어로 번역하여 구성한 병렬 말뭉치입니다.
국립국어원 - 개체명 사전 2021
공공데이터포털
(버전 1.1) 개체명 및 개체 연결 정보가 부착된 말뭉치에서 개체 표현, 개체 유형, 지식베이스 연결 정보를 추출하여 구축한 자료입니다.