데이터셋 상세
AI 허브
국립경국대학교 - 옛한글 문자인식(OCR) 인공지능 학습용 데이터
조선시대(15세기~20세기 초) 고문헌 및 고문서의 옛한글 이미지로부터 개별 글자들을 추출하기 위한 인공지능 학습데이터
연관 데이터
국립국어원 - 비출판물 말뭉치
공공데이터포털
(버전 1.2) 개인적 글쓰기 자료(시, 일기, 편지, 감상문 등)로 구성된 말뭉치입니다.
국립국어원 - 맞춤법 교정 말뭉치 2021
공공데이터포털
(버전 1.0) 온라인에서 나타나는 언어 표현을 한국어 처리 도구가 분석할 수 있는 수준으로 교정한 말뭉치입니다.
국립국어원 - 한국어-러시아어 병렬 말뭉치 2021
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 러시아어로 번역하여 구성한 병렬 말뭉치입니다.
국립국어원 - 한국어-러시아어 병렬 말뭉치 2022
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 러시아어로 번역하여 구성한 병렬 말뭉치입니다.
국립국어원 - 구어 말뭉치
공공데이터포털
(버전 1.2) 방송, 강연 등의 공적 구어 자료, 드라마 대본 등의 준구어 자료로 구성된 말뭉치입니다.
국립국어원 - 한국어-우즈베크어 병렬 말뭉치 2021
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 우즈베크어로 번역하여 구성한 병렬 말뭉치입니다.
국립국어원 - 한국어-우즈베크어 병렬 말뭉치 2022
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 우즈베크어로 번역하여 구성한 병렬 말뭉치입니다.
국립국어원 - 글쓰기 첨삭 지원을 위한 지시문 기반 생성(인스트럭션) 말뭉치 2024
공공데이터포털
(버전 1.0) '국립국어원 글쓰기 원시 자료 말뭉치 2023(버전 1.0)'에서 다양한 글의 단위(문서, 문단, 문장)를 고려하여 글을 선별하고 진단 기준(내용, 조직, 표현)에 따라 첨삭한 말뭉치.
국립국어원 - 한국어-힌디어 병렬 말뭉치 2021
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 힌디어로 번역하여 구성한 병렬 말뭉치입니다.
국립국어원 - 한국어-힌디어 병렬 말뭉치 2022
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 힌디어로 번역하여 구성한 병렬 말뭉치입니다.