데이터셋 상세
AI 허브
한국과학기술원 (KAIST 인공지능연구소) - 카이스트 오디오북 데이터셋
소설, 동화, 자기계발, 뉴스, 어학 장르에 어울리는 음성을 합성하기 위해 활용.
데이터 정보
연관 데이터
㈜ 아크릴 - 감정 음성합성 데이터셋
공공데이터포털
30대 여성 성우 1인, 7가지 감정에 대해서 각각 3,000개 발화에 대한 음성 녹음을 수행하였음. 총 21,000개 음성 파일 구축
서울특별시 한양도성 오디오 해설정보(일문)
공공데이터포털
서울한양도성 관광지 내 오디오 음성해설 서비스를 일문으로 제공합니다.(오디오 음성번호, 제목, 캡션, 소개 등)
서울특별시 한양도성 오디오 해설정보(중문)
공공데이터포털
서울한양도성 관광지 내 오디오 음성해설 서비스를 제공합니다.(중문) 오디오 음성번호, 제목, 캡션, 소개 등을 중문으로 소개합니다.
서울특별시 한양도성 오디오 해설정보(영문)
공공데이터포털
서울한양도성 관광지 내 오디오 음성해설 서비스를 영문으로 제공합니다. 제목, 캡션, 소개, 오디오 등의 데이터를 제공합니다.
한국전자통신연구원 음성인식 기술
공공데이터포털
최신 인공지능 기술에 기반하여 한국어, 영어, 다국어(일본어/중국어/독어/불어/스페인어/러시아어/베트남어/아랍어/태국어)에 대해 고성능의 음성인식 정확률을 제공하는 서비스로서, 사용자가 발성한 녹음된 입력 음성 데이터(단위 파일 또는 버퍼)를 음성인식 서버로 전달하여 문자(텍스트)로 제공합니다. 음성인식 API는 HTTP 기반의 REST API 인터페이스로 JSON 포맷 기반의 입력 및 출력을 지원하며 ETRI에서 제공하는 API Key 인증을 통해 사용할 수 있는 Open API 입니다.
커뮤니케이션북스(주) - 감성 및 발화스타일 동시 고려 음성합성 데이터
공공데이터포털
다양한 감성과 발화스타일을 동시 고려하는 인공지능 기술 개발을 위한 학습용 음성합성 데이터
국립국어원 - 일상 대화 음성 말뭉치 2020
공공데이터포털
(버전 1.4) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
한국지능정보사회진흥원 AI허브 오픈데이터 목록
공공데이터포털
본 데이터는 AI허브에서 국내외 인공지능 개발을 위해 공개한 다양한 오픈 데이터 목록을 수록하고 있습니다. 각 항목은 데이터 분류(음성, 이미지, 텍스트 등), 제목(데이터셋 명칭), 내용(데이터 구성 및 활용 목적 등 설명)으로 구성되어 있으며, 인공지능 학습용 데이터의 접근성과 활용도를 높이는 데 기여합니다. AI 기술 개발자, 연구자, 기업 등이 원하는 분야별 데이터를 효율적으로 탐색하고 활용할 수 있도록 구성되어 있으며, 데이터 품질, 구축 방식, 사용 예시 등에 대한 간략한 정보도 포함될 수 있습니다. 이 목록은 AI 생태계 전반의 개방형 데이터 전략 수립과 데이터 기반 서비스 개발에 필수적인 자료입니다.
서울특별시 한양도성 오디오 해설정보(국문)
공공데이터포털
서울한양도성 관광지 내 오디오 음성해설 서비스를 제공합니다. 제목, 캡션, 소개, 오디오 등의 데이터를 제공합니다.
한국전자통신연구원 텔레매틱스 목적지 인식을 위한 음향모델 적응용 음성 데이터
공공데이터포털
한국어 및 영어 음성인식 기술을 개발하기 위한 과학기술정보통신부의 R&D인 “언어학습을 위한 자유발화형 음성대화처리 원천기술 개발” 과제에서 산출된 음성 학습데이터로, 음성대화 인터페이스 및 외국어교육을 위한 다양한 음성인식 기술 개발과 관련 데이터입니다.