데이터셋 상세
AI 허브
㈜마인즈랩 - 립리딩(입모양) 음성인식 데이터
다양한 환경에서 복잡한 음성인식 기반 서비스 제공을 위해 음향 외 시각 정보를 활용하여 입모양 인식을 위한 다양한 각도 및 소음환경에서 녹화된 오디오 및 비주얼 데이터로 구성된 융합 데이터
연관 데이터
커뮤니케이션북스(주) - 감성 및 발화스타일 동시 고려 음성합성 데이터
공공데이터포털
다양한 감성과 발화스타일을 동시 고려하는 인공지능 기술 개발을 위한 학습용 음성합성 데이터
한국전자통신연구원 텔레매틱스 목적지 인식을 위한 음향모델 적응용 음성 데이터
공공데이터포털
한국어 및 영어 음성인식 기술을 개발하기 위한 과학기술정보통신부의 R&D인 “언어학습을 위한 자유발화형 음성대화처리 원천기술 개발” 과제에서 산출된 음성 학습데이터로, 음성대화 인터페이스 및 외국어교육을 위한 다양한 음성인식 기술 개발과 관련 데이터입니다.
국립국어원 - 일상 대화 음성 말뭉치 2020
공공데이터포털
(버전 1.4) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
전북특별자치도 국악기 사운드코드별 정보 목록조회
공공데이터포털
전주 국악기 사운드코드별 정보 목록조회악기 구분 데이터타입 내용 키값 사운드아이디 타입가야금(현악기) / 전성, 추성, 퇴성 등
한국전자통신연구원 음성인식 기술
공공데이터포털
최신 인공지능 기술에 기반하여 한국어, 영어, 다국어(일본어/중국어/독어/불어/스페인어/러시아어/베트남어/아랍어/태국어)에 대해 고성능의 음성인식 정확률을 제공하는 서비스로서, 사용자가 발성한 녹음된 입력 음성 데이터(단위 파일 또는 버퍼)를 음성인식 서버로 전달하여 문자(텍스트)로 제공합니다. 음성인식 API는 HTTP 기반의 REST API 인터페이스로 JSON 포맷 기반의 입력 및 출력을 지원하며 ETRI에서 제공하는 API Key 인증을 통해 사용할 수 있는 Open API 입니다.