데이터셋 상세
AI 허브
미디어젠㈜ - 화자 인식용 음성 데이터
화자의 여러 발화 패턴으로부터 발화자를 구분할 수 있는 화자인식 인공지능을 훈련하기 위한 데이터셋
연관 데이터
㈜코테크시스템 - 소음 환경 음성인식 데이터
공공데이터포털
음성인식기술 성능개선을 위한 학습데이터 구축을 위해 주변 소음이 자연스럽게 혼합된 음성데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋을 구축
㈜미디어그룹사람과숲 - 자연 및 인공적 발생 非언어적 소리 데이터
공공데이터포털
– 자연적, 인공적으로 발생하는 각종 비언어적인 소리 데이터 – 대분류 10개, 중분류 28개, 소분류125개의 데이터셋 구축
㈜코테크시스템 - 극한 소음 음성인식 데이터
공공데이터포털
음성인식 성능개선을 위해 다양한 극한 소음환경에서 발성된 음성데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축
㈜코테크시스템 - 극한 소음 환경 소리 데이터
공공데이터포털
극한 소음환경의 특정 소리 구분을 위해 극한 소음환경에서 녹음 된 소리데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축
㈜마인즈랩 - 립리딩(입모양) 음성인식 데이터
공공데이터포털
다양한 환경에서 복잡한 음성인식 기반 서비스 제공을 위해 음향 외 시각 정보를 활용하여 입모양 인식을 위한 다양한 각도 및 소음환경에서 녹화된 오디오 및 비주얼 데이터로 구성된 융합 데이터
커뮤니케이션북스(주) - 감성 및 발화스타일 동시 고려 음성합성 데이터
공공데이터포털
다양한 감성과 발화스타일을 동시 고려하는 인공지능 기술 개발을 위한 학습용 음성합성 데이터
국립국어원 - 일상 대화 음성 말뭉치 2020
공공데이터포털
(버전 1.4) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
국립국어원 - 일상 대화 음성 말뭉치 2021
공공데이터포털
(버전 1.1) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
미디어젠 - 비대면 진료를 위한 의료진 및 환자 음성
공공데이터포털
비대면 진료를 위한 의사, 간호사의 음성 데이터 및 환자 음성 데이터
AI 학습용 원시데이터 - 굿모닝 MBN
공공데이터포털
매경미디어그룹 MBN방송 동영상 데이터로 AI 인공지능 학습 활용 및 연구 개발 할 수 있는 원시 데이터 및 메타 데이터 셋을 제공 합니다. (동영상 가격 및 제공 프로토콜은 협의)