데이터셋 상세
AI 허브
㈜ 아크릴 - 감정 분류용 데이터셋
감정 유추가 가능한 대화 데이터를 사람이 연기하여 결과를 저장하고, 동시에 해당 데이터의 감정 상태와 감정 주체 부여 연기 지망생/연기 전문가 100명 대상, 7가지 감정에 대해 1인당 약 100번씩 발화 및 연기 수행, 총 10,351개 영상 구축
데이터 정보
연관 데이터
㈜ 아크릴 - 감정 음성합성 데이터셋
공공데이터포털
30대 여성 성우 1인, 7가지 감정에 대해서 각각 3,000개 발화에 대한 음성 녹음을 수행하였음. 총 21,000개 음성 파일 구축
KAIST 인공지능연구소 - 감정 분류를 위한 대화 음성 데이터셋
공공데이터포털
감성대화 어플리케이션을 이용한 수집 일정 기간동안 사용자들이 어플리케이션과 자연스럽게 대화하고, 수집된 데이터를 정제 작업을 거쳐 선별 7가지 감정(happiness, angry, disgust, fear, neutral, sadness, surprise)에 대해 5명이 라벨링
미디어젠(주) - 감성 및 발화 스타일별 음성합성 데이터
공공데이터포털
7가지 대표 감정(기쁨, 슬픔, 분노, 불안, 상처, 당황, 중립)과 5가지 발화스타일, 3가지 발성캐릭터, 12가지 감정X발화스타일 조합으로 분류된 음성데이터 셋으로 50명의 전문 성우를 섭외하여 총 1,067시간의 녹음 데이터 구축
㈜ 아크릴 - 한국어 감정 정보가 포함된 연속적 대화 데이터셋
공공데이터포털
웹 크롤링 등의 방법으로 대화를 수집하고, 적정 길이와 turn 수 및 주제를 가진 대화를 선정하였으며 감정 레이블링 수행 챗봇이 말하기 부적절한 용어(지나치게 전문적인 용어, 비속어 등)을 가능한 범위에서 필터링 하였음
㈜ 아크릴 - 한국어 감정 정보가 포함된 단발성 대화 데이터셋
공공데이터포털
SNS 글 및 온라인 댓글에 대한 웹 크롤링을 실시하여 문장을 선정함 문장 단위 작업을 수행할 수 있도록 문장 분리 작업을 거침 7개 감정(기쁨, 슬픔, 놀람, 분노, 공포, 혐오, 중립) 레이블링 수행
아크릴 - 멀티모달 영상
공공데이터포털
AI 8종 임무 유형을 고려한 감정, 성별, 연령대, 발화 스크립트, 개체 및 관계 정보, 상황 설명 정보, 발화별 대화 의도 및 대화 전략 정보 의미 정보를 구축한 영상 데이터 제공
한국과학기술원 - 한국인 감정인식을 위한 복합 영상
공공데이터포털
장면의 맥락 정보를 통한 감정 분석을 위한 얼굴 표정 이미지 데이터
안산시 - 안산시 뉴스기사 감정분석 라벨링
공공데이터포털
* 해당 데이터는 경기도 안산시에서 개방한 데이터입니다. 이 데이터는 안산 지역과 관련된 여러 언론사의 기사를 체계적으로 분석한 자료입니다. 각 기사의 날짜, 언론사, 제목, 원문 링크와 같은 기본 정보는 물론, 기사의 논조를 긍정, 부정, 중립으로 분류한 감성 분석 결과를 포함하고 있습니다. 더 나아가 분류에 대한 구체적인 사유, 기사에 등장하는 핵심 인물, 주요 동사, 관련 지역명까지 추출하여 사건의 맥락을 깊이 있게 이해할 수 있도록 돕습니다.
심심이㈜ - 공감형 대화
공공데이터포털
- 인간과 같이 공감할 수 있는 능력을 갖고 자연스러운 공감 대화 인터페이스를 위한 인공지능 학습용 대화 데이터 - 한 화자(감정화자)에게는 주어진 ‘감정과 상황에 처해진 것처럼 대화’하라는 임무를, 다른 화자(공감화자)에게는 ‘상대방에게 적절하게 공감’하라는 임무를 부여한 후 생성한 대화 데이터
케이티디에스 (구 알파디엑스솔루션) - 속성기반 감정분석 데이터
공공데이터포털
상품 리뷰데이터에 포함된 사용자 감정을 태깅한 데이터로 총 25만건 가량의 데이터셋을 구축