데이터셋 상세
AI 허브
아크릴 - 멀티모달 영상
AI 8종 임무 유형을 고려한 감정, 성별, 연령대, 발화 스크립트, 개체 및 관계 정보, 상황 설명 정보, 발화별 대화 의도 및 대화 전략 정보 의미 정보를 구축한 영상 데이터 제공
연관 데이터
㈜ 아크릴 - 감정 분류용 데이터셋
공공데이터포털
감정 유추가 가능한 대화 데이터를 사람이 연기하여 결과를 저장하고, 동시에 해당 데이터의 감정 상태와 감정 주체 부여 연기 지망생/연기 전문가 100명 대상, 7가지 감정에 대해 1인당 약 100번씩 발화 및 연기 수행, 총 10,351개 영상 구축
KAIST 인공지능연구소 - 감정 분류를 위한 대화 음성 데이터셋
공공데이터포털
감성대화 어플리케이션을 이용한 수집 일정 기간동안 사용자들이 어플리케이션과 자연스럽게 대화하고, 수집된 데이터를 정제 작업을 거쳐 선별 7가지 감정(happiness, angry, disgust, fear, neutral, sadness, surprise)에 대해 5명이 라벨링
한국전자기술연구원 - 멀티모달
공공데이터포털
감정, 사용자 의도 등 다양한 관점의 멀티모달 데이터와 영상/음성/텍스트 정보가 있는 멀티모달 원시 데이터를 구축한 영상 데이터 제공
㈜ 아크릴 - 한국어 감정 정보가 포함된 연속적 대화 데이터셋
공공데이터포털
웹 크롤링 등의 방법으로 대화를 수집하고, 적정 길이와 turn 수 및 주제를 가진 대화를 선정하였으며 감정 레이블링 수행 챗봇이 말하기 부적절한 용어(지나치게 전문적인 용어, 비속어 등)을 가능한 범위에서 필터링 하였음
무하유 - 채용면접 인터뷰 데이터
공공데이터포털
실제 채용면접과 유사한 환경의 질문과 답변의 음성을 제작하여 텍스트로 변환한후 내용 요약, 채용면접에서 표현되는 답변의 감정과 의도를 라벨링하여 원격 면접의 서비스를 고도화
미디어젠(주) - 감성 및 발화 스타일별 음성합성 데이터
공공데이터포털
7가지 대표 감정(기쁨, 슬픔, 분노, 불안, 상처, 당황, 중립)과 5가지 발화스타일, 3가지 발성캐릭터, 12가지 감정X발화스타일 조합으로 분류된 음성데이터 셋으로 50명의 전문 성우를 섭외하여 총 1,067시간의 녹음 데이터 구축
㈜ 아크릴 - 감정 음성합성 데이터셋
공공데이터포털
30대 여성 성우 1인, 7가지 감정에 대해서 각각 3,000개 발화에 대한 음성 녹음을 수행하였음. 총 21,000개 음성 파일 구축
한국과학기술원 - 한국인 감정인식을 위한 복합 영상
공공데이터포털
장면의 맥락 정보를 통한 감정 분석을 위한 얼굴 표정 이미지 데이터
국립국어원 - 감성 분석 말뭉치 2020
공공데이터포털
(버전 1.0) 작성자의 주관성이 드러나는 감성 표현을 대상으로 감성 분석 정보를 부착한 말뭉치입니다.
㈜ 아크릴 - 라이프로그 신호 기반 감정 분류용 데이터셋
공공데이터포털
20~40대의 일반인 사용자 180명 대상으로 1개월간 수집 진행 텍스트 작성 기준 총 2,800건 수집 (TPO 정보 포함)