데이터셋 상세
AI 허브
트위그팜 - 국제 학술대회용 전문분야 한영/영한 통번역 데이터
- 한국어와 영어 언어쌍에 대한 양방향 병렬 번역 말뭉치 데이터 - 국제 학술대회에서 활용할 수 있는 전문적 분야의 한영/영한 통번역 데이터
데이터 정보
연관 데이터
㈜ 트위그팜 - 일상생활 및 구어체 한-영 번역 병렬 말뭉치 데이터
공공데이터포털
• 신경망 기반 기계 번역기 학습 데이터로 활용하기 위한 한영, 영한 말뭉치 • 일상생활 및 구어체 번역기의 성능 향상을 위한 학습용 데이터
한국외국어대학교 - 다국어 통·번역 낭독체 데이터
공공데이터포털
한국어-영어, 한국어-다국어 통번역 훈련 및 평가 등에 활용하기 위한 한국어-영어, 일본어, 스페인어 AI 학습용 데이터 구축
솔트룩스이노베이션 - 다국어 구어체 번역 병렬 말뭉치 데이터
공공데이터포털
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공
한국과학기술정보연구원 과학기술데이터 용어 정보
공공데이터포털
과학기술데이터(저널, 컨퍼런스 등의 논문)에서 추출한 한국어 및 한-영 동의어, 대역어에 대한 정보입니다. 해당 데이터가 보유한 컬럼은 다음과 같습니다. 컬럼명: 분류, 아이디, 용어, 출처, 용어변환, 값, 서브값, 언어
한국외국어대학교 - 발화유형(문어, 구어, 채팅)별 기계번역 병렬 말뭉치
공공데이터포털
- 한국어 계열 기계번역의 언어별 성능, 어투, 도메인 등, 다양한 요소를 평가할 수 있도록 벤치마크 데이터셋 구축
한국외국어대학교 - 기계번역 품질 검증 데이터
공공데이터포털
- 한국어-영어 양방향에 대하여 기계번역 사후교정 및 어절, 문장, 문서 수준에서 기계번역 품질주석 데이터 구축
솔트룩스이노베이션 - 일상생활 및 구어체 한-중, 한-일 번역 병렬 말뭉치 데이터
공공데이터포털
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공
트위그팜 - 다국어 번역 품질 평가 데이터
공공데이터포털
- 다국어 언어쌍에 대한 양방향 병렬 번역 말뭉치 데이터 - 기계 번역 품질 예측 활용을 위한 번역 품질 평가 라벨링 데이터
한국외국어대학교 - 교육용 한국인의 외국어(영·중·일 제외) 음성 데이터
공공데이터포털
인공지능 외국어 발음 교육 및 평가와 말하기 교육 및 평가를 위한 한국인의 외국어 발화 음성 데이터 및 학습자별 수준 분류·평가, 언어학적 분석이 포함된 메타데이터의 구축
트위그팜 - 한국어-영어 번역 말뭉치(사회과학)
공공데이터포털
사회과학(정치, 경제, 금융, 행정, 교육, 법률 등) 분야 등 한-영 번역 정확도가 상대적으로 낮은 분야의 데이터 구축을 통해 AI 기반 번역 기술 개발에 활용할 수 있는 학습 데이터셋을 구축하여 보다 원활한 사회과학 분야 관련 정보 소통 도모