데이터셋 상세
AI 허브
한국외국어대학교 - 발화유형(문어, 구어, 채팅)별 기계번역 병렬 말뭉치
- 한국어 계열 기계번역의 언어별 성능, 어투, 도메인 등, 다양한 요소를 평가할 수 있도록 벤치마크 데이터셋 구축
연관 데이터
한국외국어대학교 - 다국어 통·번역 낭독체 데이터
공공데이터포털
한국어-영어, 한국어-다국어 통번역 훈련 및 평가 등에 활용하기 위한 한국어-영어, 일본어, 스페인어 AI 학습용 데이터 구축
한국외국어대학교 - 기계번역 품질 검증 데이터
공공데이터포털
- 한국어-영어 양방향에 대하여 기계번역 사후교정 및 어절, 문장, 문서 수준에서 기계번역 품질주석 데이터 구축
한국외국어대학교 - 교육용 한국인의 외국어(영·중·일 제외) 음성 데이터
공공데이터포털
인공지능 외국어 발음 교육 및 평가와 말하기 교육 및 평가를 위한 한국인의 외국어 발화 음성 데이터 및 학습자별 수준 분류·평가, 언어학적 분석이 포함된 메타데이터의 구축
한국외국어대학교 - 교육용 한국인의 중국어·일본어 음성 데이터
공공데이터포털
인공지능 외국어 발음 교육 및 평가와 말하기 교육 및 평가를 위한 한국인의 외국어 발화 음성 데이터 및 학습자별 수준 분류·평가, 언어학적 분석이 포함된 메타데이터의 구축
한국외국어대학교 - 한-영 및 한-중 음성발화 데이터
공공데이터포털
다국어 음성 합성을 위한 같은 의미의 한국어-영어/ 한국어-중국어 AI 학습용 데이터 구축
한국외국어대학교 - 교육용 한국인의 영어 음성 데이터
공공데이터포털
인공지능 외국어 발음 교육 및 평가와 말하기 교육 및 평가를 위한 한국인의 외국어 발화 음성 데이터 및 학습자별 수준 분류·평가, 언어학적 분석이 포함된 메타데이터의 구축
한국외국어대학교 - 자연어 분석 후처리용 과교정 검증 데이터
공공데이터포털
- 한국어 철자 및 문법, 음성인식 후처리용 병렬 말뭉치, 과교정 검증 데이터 구축
한국남부발전(주) 발전용어집
공공데이터포털
한국남부발전(주)_발전용어집에 대한 데이터로 발전용어(한글명, 한문명, 영문명), 용어설명 항목을 제공합니다.
셀렉트스타㈜ - 초거대 언어모델 신뢰성 벤치마크 데이터
공공데이터포털
- 한국어 초거대 언어 모델의 신뢰도를 측정하기 위한 평가(벤치마크) 데이터셋
NHN다이퀘스트 - 한국인 외래어 발화
공공데이터포털
통역과 번역의 과정 없이 바로 한국어 음성 또는 텍스트 데이터에 맵핑할 수 있는 외래어 발화 음성 데이터