데이터셋 상세
AI 허브
한국외국어대학교 - 한-영 및 한-중 음성발화 데이터
다국어 음성 합성을 위한 같은 의미의 한국어-영어/ 한국어-중국어 AI 학습용 데이터 구축
연관 데이터
한국외국어대학교 - 한영 혼합 인식 데이터
공공데이터포털
대화 중 자연스럽게 구사되는 영문 단어(외래어 및 외국어) 및 관용적 표현이 포함된 문장과 스크립트를 통해 AI 학습용 데이터 구축
NHN다이퀘스트 - 한국인 외래어 발화
공공데이터포털
통역과 번역의 과정 없이 바로 한국어 음성 또는 텍스트 데이터에 맵핑할 수 있는 외래어 발화 음성 데이터
한국외국어대학교 - 다국어 통·번역 낭독체 데이터
공공데이터포털
한국어-영어, 한국어-다국어 통번역 훈련 및 평가 등에 활용하기 위한 한국어-영어, 일본어, 스페인어 AI 학습용 데이터 구축
국립국어원 - 한국어-한국수어 병렬 말뭉치 2023
공공데이터포털
(버전 1.0) 한국어 구어 자료를 한국수어로 번역하여 구성한 병렬 말뭉치입니다.
한국외국어대학교 - 교육용 한국인의 중국어·일본어 음성 데이터
공공데이터포털
인공지능 외국어 발음 교육 및 평가와 말하기 교육 및 평가를 위한 한국인의 외국어 발화 음성 데이터 및 학습자별 수준 분류·평가, 언어학적 분석이 포함된 메타데이터의 구축
국립국어원 - 한국어-한국수어 병렬 말뭉치 2022
공공데이터포털
(버전 1.0) 한국어 구어 자료를 한국수어로 번역하여 구성한 병렬 말뭉치입니다.
㈜스피치랩스 - 한국어 대학 강의 데이터
공공데이터포털
한국어 강의 영상 및 음성을 인식하여 자막 생성 등의 서비스를 위한 인공지능 학습용 한국어 대학 강의 분야 음성데이터 구축
국립국어원 - 한국어-한국수어 병렬 말뭉치 2024
공공데이터포털
(버전 1.0) 한국어 구어체 자료를 한국수어로 번역하여 구성한 병렬 말뭉치입니다.
한국외국어대학교 - 발화유형(문어, 구어, 채팅)별 기계번역 병렬 말뭉치
공공데이터포털
- 한국어 계열 기계번역의 언어별 성능, 어투, 도메인 등, 다양한 요소를 평가할 수 있도록 벤치마크 데이터셋 구축
국립국어원 - 한국어-우즈베크어 병렬 말뭉치 2022
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 우즈베크어로 번역하여 구성한 병렬 말뭉치입니다.