데이터셋 상세
AI 허브
솔트룩스이노베이션 - 다국어 구어체 번역 병렬 말뭉치 데이터
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공
연관 데이터
솔트룩스이노베이션 - 일상생활 및 구어체 한-중, 한-일 번역 병렬 말뭉치 데이터
공공데이터포털
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공
한국외국어대학교 - 한-영 및 한-중 음성발화 데이터
공공데이터포털
다국어 음성 합성을 위한 같은 의미의 한국어-영어/ 한국어-중국어 AI 학습용 데이터 구축
㈜코리아리서치인터내셔널 - 서베이 문항 생성 데이터
공공데이터포털
전문 리서처가 구축한, 저작권이 확보된, 적합성이 검증된 키워드 기반의 설문 구성으로 비리서치 전문가도 편리하게 활용 가능한 한국어용 설문 생성 인공지능 학습용 데이터셋
국립국어원 - 한국어-우즈베크어 병렬 말뭉치 2022
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 우즈베크어로 번역하여 구성한 병렬 말뭉치입니다.
국립국어원 - 한국어-우즈베크어 병렬 말뭉치 2021
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 우즈베크어로 번역하여 구성한 병렬 말뭉치입니다.
솔트룩스 - 온라인 구어체 말뭉치 데이터
공공데이터포털
온라인 플랫폼(게시판, 댓글 등)에서 구어체 위주의 텍스트 데이터를 수집 후 전사 도구를 활용하여 구축된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋
한국외국어대학교 - 한영 혼합 인식 데이터
공공데이터포털
대화 중 자연스럽게 구사되는 영문 단어(외래어 및 외국어) 및 관용적 표현이 포함된 문장과 스크립트를 통해 AI 학습용 데이터 구축
㈜ 씨에스리 - 인공지능 학습을 위한 외국인 한국어 발화 음성 데이터
공공데이터포털
외국어가 모국어인 화자의 한국어 음성 데이터로, 주어진 대본 내용을 읽은 음성과 주어진 질문에 자유롭게 답변한 음성과 각 음성에 대한 전사 결과를 포함한 메타데이터로 구성
국립국어원 - 한국어-힌디어 병렬 말뭉치 2022
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 힌디어로 번역하여 구성한 병렬 말뭉치입니다.
국립국어원 - 한국어-러시아어 병렬 말뭉치 2022
공공데이터포털
(버전 1.0) 한국어 문어와 구어 자료를 러시아어로 번역하여 구성한 병렬 말뭉치입니다.