데이터셋 상세
AI 허브
한국외국어대학교 - 교육용 한국인의 영어 음성 데이터
인공지능 외국어 발음 교육 및 평가와 말하기 교육 및 평가를 위한 한국인의 외국어 발화 음성 데이터 및 학습자별 수준 분류·평가, 언어학적 분석이 포함된 메타데이터의 구축
연관 데이터
한국전자통신연구원 한국어 및 영어 음향모델 훈련용 음성 데이터
공공데이터포털
한국어 및 영어 음성인식 기술을 개발하기 위한 과학기술정보통신부의 R&D인 “언어학습을 위한 자유발화형 음성대화처리 원천기술 개발” 과제에서 산출된 음성 학습데이터로, 음성대화 인터페이스 및 외국어교육을 위한 다양한 음성인식 기술 개발과 관련 데이터입니다.
한국전자통신연구원 한국어 언어분석 통합 말뭉치
공공데이터포털
엑소브레인 과제를 수행하면서 구축한 언어처리 학습데이터로 언어분석 6개 기술(형태소분석, 다의어 어휘의미분석, 세분류 개체명인식, 의존구문분석, 의미역인식, 상호참조해결)의 태깅 가이드라인과 자연어 질의응답을 위한 질문/정답 포맷의 뉴스기사 대상 태깅 말뭉치이 포함되어 있습니다.
국립국어원 - 맞춤법 교정 말뭉치 2021
공공데이터포털
(버전 1.0) 온라인에서 나타나는 언어 표현을 한국어 처리 도구가 분석할 수 있는 수준으로 교정한 말뭉치입니다.
문화체육관광부 국립국어원 한국수어사전 한국어대응표현정보
공공데이터포털
국립국어원의 한국수어사전에서 추출된 수어 편찬 목록의 한국어 대응표현 정보(수형설명, 한국어대응표현, 결합정보, 대/중분류 등)입니다.
한국전자통신연구원 한국어/다국어 언어음성정보
공공데이터포털
언어음성DB는 자동통/번역, 음성인식/합성, 지식마이닝/검색엔진 개발용으로 인간의 지식을 규칙화하는데 활용되고 있습니다.
국립국어원 - 문법성 판단 말뭉치
공공데이터포털
(버전 1.1) 한국어 예문 문법성(수용성)을 언어 사용자가 평가한 정보가 포함된 말뭉치입니다.
한국과학기술정보연구원 과학기술데이터 용어 정보
공공데이터포털
과학기술데이터(저널, 컨퍼런스 등의 논문)에서 추출한 한국어 및 한-영 동의어, 대역어에 대한 정보입니다. 해당 데이터가 보유한 컬럼은 다음과 같습니다. 컬럼명: 분류, 아이디, 용어, 출처, 용어변환, 값, 서브값, 언어
솔트룩스 - 한국어 방언 발화(전라도)
공공데이터포털
방언(전라도)을 사용하는 일상 대화를 인식, 음성을 문자로 바꾸어주는 방언 발화 음성 데이터
국립국어원 - 한국어-우즈베크어 병렬 말뭉치 2021
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 우즈베크어로 번역하여 구성한 병렬 말뭉치입니다.
한국남부발전(주) 발전용어집
공공데이터포털
한국남부발전(주)_발전용어집에 대한 데이터로 발전용어(한글명, 한문명, 영문명), 용어설명 항목을 제공합니다.