데이터셋 상세
AI 허브
㈜코테크시스템 - 소음 환경 음성인식 데이터
음성인식기술 성능개선을 위한 학습데이터 구축을 위해 주변 소음이 자연스럽게 혼합된 음성데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋을 구축
연관 데이터
㈜코테크시스템 - 극한 소음 음성인식 데이터
공공데이터포털
음성인식 성능개선을 위해 다양한 극한 소음환경에서 발성된 음성데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축
㈜코테크시스템 - 극한 소음 환경 소리 데이터
공공데이터포털
극한 소음환경의 특정 소리 구분을 위해 극한 소음환경에서 녹음 된 소리데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축
미디어젠㈜ - 화자 인식용 음성 데이터
공공데이터포털
화자의 여러 발화 패턴으로부터 발화자를 구분할 수 있는 화자인식 인공지능을 훈련하기 위한 데이터셋
㈜마인즈랩 - 립리딩(입모양) 음성인식 데이터
공공데이터포털
다양한 환경에서 복잡한 음성인식 기반 서비스 제공을 위해 음향 외 시각 정보를 활용하여 입모양 인식을 위한 다양한 각도 및 소음환경에서 녹화된 오디오 및 비주얼 데이터로 구성된 융합 데이터
㈜지뉴소프트 - 생활환경소음 AI학습용 데이터 및 민원 관리 서비스 구축 사업
공공데이터포털
층간소음, 공사장소음, 사업장소음, 교통소음 크게 4가지 카테고리에서 세부적으로는 총 38종류의 소음으로 구성되어 있으며, 각 소음은 음원과 스펙트로그램 이미지로 구성되어 있는 38,658건의 인공지능 학습용 데이터
㈜미디어그룹사람과숲 - 자연 및 인공적 발생 非언어적 소리 데이터
공공데이터포털
– 자연적, 인공적으로 발생하는 각종 비언어적인 소리 데이터 – 대분류 10개, 중분류 28개, 소분류125개의 데이터셋 구축
커뮤니케이션북스(주) - 감성 및 발화스타일 동시 고려 음성합성 데이터
공공데이터포털
다양한 감성과 발화스타일을 동시 고려하는 인공지능 기술 개발을 위한 학습용 음성합성 데이터
전주대학교 산학협력단 컨소시엄 - 이미지 사운드 매칭 데이터
공공데이터포털
이미지와 사운드라는 서로 다른 특징을 가지는 매체 간의 상관관계를 학습하기 위한 AI 학습용 데이터  이미지 표상 학습(image representation learning)에 적합한 이미지 데이터 100,000장  사운드 표상 학습(sound representation learning)에 적합한 사운드 데이터 10,000개
국립국어원 - 일상 대화 음성 말뭉치 2020
공공데이터포털
(버전 1.4) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.