데이터셋 상세
모두의 말뭉치
국립국어원 - 무형 대용어 복원 말뭉치 2024
(버전 1.0) 문장 내 생략어를 맥락에 따라 복원하는 말뭉치입니다.
데이터 정보
연관 데이터
국립국어원 - 유사 문장 말뭉치
공공데이터포털
(버전 1.0) 컴퓨터가 만든 유사 문장과 사람이 작성한 유사 문장으로 구성된 말뭉치입니다.
국립국어원 - 개체명 사전 2022
공공데이터포털
(버전 1.0) 개체명 및 개체 연결 정보가 부착된 말뭉치에서 개체 표현, 개체 유형, 지식 베이스 연결 정보를 추출하여 구축한 자료입니다.
국립국어원 - 일상 대화 요약 말뭉치 2023
공공데이터포털
(버전 1.0) 일상 대화를 대상으로 담화 분석하여 화자별 요약문, 주제별 요약문 및 대표 요약문을 작성한 말뭉치입니다.
국립국어원 - 지역어 말뭉치 2021
공공데이터포털
(버전 1.0) 2021년 구술 발화 조사결과(10개 지점 각 3세대 제보자 조사)를 정리한 원시 말뭉치
국립국어원 - 일상 대화 말뭉치 2022
공공데이터포털
(버전 1.0) 특정 주제 또는 제시 자료로 자유롭게 대화를 나눈 일상 대화 말뭉치입니다.
국립국어원 - 일상 대화 음성 말뭉치 2020
공공데이터포털
(버전 1.4) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
국립국어원 - 묵자-점자 병렬 말뭉치 2023
공공데이터포털
(버전 1.0) 한국어 문어 데이터(신문 기사, 온라인 게시 자료)에서 한글, 로마자, 숫자, 기호의 조합 조건을 만족하는 문장을 추출하고 점역, 교정하여 구축한 병렬 말뭉치입니다.
국립국어원 - 국어 역사 말뭉치
공공데이터포털
(버전 1.0) 15세기 한글 창제 이후부터 20세기 초기까지 한글로 기로된 문헌자료 원시 말뭉치입니다.
국립국어원 - 국어 역사 자료 말뭉치 2024
공공데이터포털
(버전 1.0) 17~19세기 쓰여진 언간(한글편지) 자료와 20세기 초 신소설, 판소리계 사설, 사전류 등 32종의 원시 말뭉치입니다.
국립국어원 - 한국어-베트남어 병렬 말뭉치 2024
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 베트남어로 번역하여 구성한 병렬 말뭉치입니다.