데이터셋 상세
AI 허브
커뮤니케이션북스(주) - 감성 및 발화스타일 동시 고려 음성합성 데이터
다양한 감성과 발화스타일을 동시 고려하는 인공지능 기술 개발을 위한 학습용 음성합성 데이터
연관 데이터
솔트룩스 - 한국어 방언 발화(전라도)
공공데이터포털
방언(전라도)을 사용하는 일상 대화를 인식, 음성을 문자로 바꾸어주는 방언 발화 음성 데이터
국립국어원 - 일상 대화 음성 말뭉치 2021
공공데이터포털
(버전 1.1) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
국립국어원 - 일상 대화 음성 말뭉치 2022
공공데이터포털
(버전 1.0) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
솔트룩스 - 한국어 방언 발화(제주도)
공공데이터포털
방언(제주도)을 사용하는 일상 대화를 인식, 음성을 문자로 바꾸어주는 방언 발화 음성 데이터
국립국어원 - 메신저 말뭉치
공공데이터포털
(버전 2.0) 두 명 이상의 대화 참여자가 메신저로 나눈 대화 자료로 구성된 말뭉치입니다.
한국전자통신연구원 한국어 및 영어 음향모델 훈련용 음성 데이터
공공데이터포털
한국어 및 영어 음성인식 기술을 개발하기 위한 과학기술정보통신부의 R&D인 “언어학습을 위한 자유발화형 음성대화처리 원천기술 개발” 과제에서 산출된 음성 학습데이터로, 음성대화 인터페이스 및 외국어교육을 위한 다양한 음성인식 기술 개발과 관련 데이터입니다.
국립국어원 - 일상 대화 음성 말뭉치 2024
공공데이터포털
(버전 1.0) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
AI 학습용 원시데이터 - 굿모닝 MBN
공공데이터포털
매경미디어그룹 MBN방송 동영상 데이터로 AI 인공지능 학습 활용 및 연구 개발 할 수 있는 원시 데이터 및 메타 데이터 셋을 제공 합니다. (동영상 가격 및 제공 프로토콜은 협의)
한국과학기술원 (KAIST 인공지능연구소) - 카이스트 오디오북 데이터셋
공공데이터포털
소설, 동화, 자기계발, 뉴스, 어학 장르에 어울리는 음성을 합성하기 위해 활용.
국립국어원 - 일상 대화 말뭉치 2020
공공데이터포털
(버전 1.4) 특정 주제 또는 제시 자료로 자유롭게 대화를 나눈 일상 대화 말뭉치입니다.