데이터셋 상세
AI 허브
미디어젠(주) - 감성 및 발화 스타일별 음성합성 데이터
7가지 대표 감정(기쁨, 슬픔, 분노, 불안, 상처, 당황, 중립)과 5가지 발화스타일, 3가지 발성캐릭터, 12가지 감정X발화스타일 조합으로 분류된 음성데이터 셋으로 50명의 전문 성우를 섭외하여 총 1,067시간의 녹음 데이터 구축
연관 데이터
㈜ 아크릴 - 감정 음성합성 데이터셋
공공데이터포털
30대 여성 성우 1인, 7가지 감정에 대해서 각각 3,000개 발화에 대한 음성 녹음을 수행하였음. 총 21,000개 음성 파일 구축
㈜ 아크릴 - 감정 분류용 데이터셋
공공데이터포털
감정 유추가 가능한 대화 데이터를 사람이 연기하여 결과를 저장하고, 동시에 해당 데이터의 감정 상태와 감정 주체 부여 연기 지망생/연기 전문가 100명 대상, 7가지 감정에 대해 1인당 약 100번씩 발화 및 연기 수행, 총 10,351개 영상 구축
커뮤니케이션북스(주) - 감성 및 발화스타일 동시 고려 음성합성 데이터
공공데이터포털
다양한 감성과 발화스타일을 동시 고려하는 인공지능 기술 개발을 위한 학습용 음성합성 데이터
㈜ 아크릴 - 한국어 감정 정보가 포함된 단발성 대화 데이터셋
공공데이터포털
SNS 글 및 온라인 댓글에 대한 웹 크롤링을 실시하여 문장을 선정함 문장 단위 작업을 수행할 수 있도록 문장 분리 작업을 거침 7개 감정(기쁨, 슬픔, 놀람, 분노, 공포, 혐오, 중립) 레이블링 수행
한림대학교산학협력단 - 우울증 라벨링 음성 데이터(2022년)
공공데이터포털
우울을 호소하는 환자 대상의 우울, 불안 척도, 다른 심리학적 평가를 측정하고, 각 환자의 통증, 심리학적 상태에 태깅된 자연발화와 음색, 피치, 리듬, 속도, 볼륨과 같은 음성신호 데이터
한림대학교산학협력단 - 우울증 라벨링 음성 데이터 경로(2022년)
공공데이터포털
우울을 호소하는 환자 대상의 우울, 불안 척도, 다른 심리학적 평가를 측정하고, 각 환자의 통증, 심리학적 상태에 태깅된 자연발화와 음색, 피치, 리듬, 속도, 볼륨과 같은 음성신호 데이터 *경로 데이터
한림대학교산학협력단 - 우울증 라벨링 음성 데이터
공공데이터포털
우울을 호소하는 환자대상의 우울, 불안 척도, 다른 심리학적 평가를 측정하고, 각 환자의 통증, 심리학적 상태에 태깅된 자연발화와 음색, 피치, 리듬, 속도, 볼륨 과 같은 음성신호 데이터
한림대학교산학협력단 - 우울증 라벨링 음성 데이터 경로
공공데이터포털
우울을 호소하는 환자대상의 우울, 불안 척도, 다른 심리학적 평가를 측정하고, 각 환자의 통증, 심리학적 상태에 태깅된 자연발화와 음색, 피치, 리듬, 속도, 볼륨 과 같은 음성신호 데이터의 경로테이블
㈜ 아크릴 - 한국어 감정 정보가 포함된 연속적 대화 데이터셋
공공데이터포털
웹 크롤링 등의 방법으로 대화를 수집하고, 적정 길이와 turn 수 및 주제를 가진 대화를 선정하였으며 감정 레이블링 수행 챗봇이 말하기 부적절한 용어(지나치게 전문적인 용어, 비속어 등)을 가능한 범위에서 필터링 하였음
한림대학교산학협력단 - 통증 라벨링 음성데이터 경로(2022년)
공공데이터포털
통증을 호소하는 환자 대상의 통증 척도, 다른 심리학적 평가를 측정하고, 각 환자의 통증, 심리학적 상태에 태깅된 자연발화와 음색, 피치, 리듬, 속도, 불륨과 같은 음성신호 데이터 * 경로 데이터