데이터셋 상세
모두의 말뭉치
국립국어원 - 한국수어 주석 말뭉치 2025
(버전 1.0) 2명의 농인이 수어로 대화를 나눈 수어 영상을 한국어로 번역하고 수어 단어를 분절하여 기본 주석을 단 다중 번영 주석 말뭉치입니다.
데이터 정보
연관 데이터
국립국어원 - 한국수어 주석 말뭉치 2024
공공데이터포털
(버전 1.0) 2명의 농인이 수어로 대화를 나눈 수어 영상을 한국어로 번역하고 수어 단어를 분절하여 기본 주석을 단 다중 번역 주석 말뭉치입니다.
국립국어원 - 한국수어-한국어 병렬 말뭉치 2024
공공데이터포털
(버전 1.0) 2명의 농인이 수어로 대화를 나눈 영상 자료를 한국어로 번역하여 구성한 병렬 말뭉치입니다.
국립국어원 - 한국수어 원시 말뭉치 2024
공공데이터포털
(버전 1.0) 2명의 농인이 수어로 나눈 영상으로 구성된 수어 원시 말뭉치입니다.
NHN다이퀘스트 - 자유대화 음성(일반남여)
공공데이터포털
한국인 중 일반남녀의 음성을 문자로 바꾸어 주고, 문맥을 이해하는 한국어 음성언어처리 기술 개발을 위한 한국어 음성 데이터
NHN다이퀘스트 - 자유대화 음성(노인남여)
공공데이터포털
한국인 중 노인남녀의 음성을 문자로 바꾸어 주고, 문맥을 이해하는 한국어 음성언어처리 기술 개발을 위한 한국어 음성 데이터
국립국어원 - 한국어-베트남어 병렬 말뭉치 2021
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 베트남어로 번역하여 구성한 병렬 말뭉치입니다.
한국외국어대학교 - 한영 혼합 인식 데이터
공공데이터포털
대화 중 자연스럽게 구사되는 영문 단어(외래어 및 외국어) 및 관용적 표현이 포함된 문장과 스크립트를 통해 AI 학습용 데이터 구축
㈜오픈유아이 - 농산어촌 전문분야 한국어-외국어 병렬 말뭉치 데이터
공공데이터포털
농산어촌 기술 및 전문용어를 전파하고 언어장벽 해소를 위해 농산어촌 관련 전문도서, 논문, 웹/저널과 작업 상황 시나리오를 기반으로 구축한 한국어 말뭉치(문어체, 구어체, 대화체) 400만 문장을 외국어 4종(베트남어, 인도네시아어, 캄보디아어(크메르어), 태국어)으로 각 400만 문장 씩 번역한 병렬 말뭉치
(주)에버트란 - 방송콘텐츠 한국어-영어 통번역 음성 데이터
공공데이터포털
- 인공지능 학습용 다국어 방송콘텐츠 번역 말뭉치 구축 방송 콘텐츠 분야의 영어, 스페인어, 러시아어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 통·번역 데이터 - 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural Machine Translation; NMT)용 한-영어/스페인어,러시아어 통·번역 음성 및 텍스트 pair 데이터
NHN다이퀘스트 - 자유대화 음성(소아남여, 유아 등 혼합)
공공데이터포털
한국인 중 소아남녀의 음성을 문자로 바꾸어 주고, 문맥을 이해하는 한국어 음성언어처리 기술 개발을 위한 한국어 음성 데이터