데이터셋 상세
AI 허브
㈜ 아크릴 - 라이프로그 신호 기반 감정 분류용 데이터셋
20~40대의 일반인 사용자 180명 대상으로 1개월간 수집 진행 텍스트 작성 기준 총 2,800건 수집 (TPO 정보 포함)
데이터 정보
연관 데이터
㈜ 아크릴 - 감정 분류용 데이터셋
공공데이터포털
감정 유추가 가능한 대화 데이터를 사람이 연기하여 결과를 저장하고, 동시에 해당 데이터의 감정 상태와 감정 주체 부여 연기 지망생/연기 전문가 100명 대상, 7가지 감정에 대해 1인당 약 100번씩 발화 및 연기 수행, 총 10,351개 영상 구축
KAIST 인공지능연구소 - 감정 분류를 위한 대화 음성 데이터셋
공공데이터포털
감성대화 어플리케이션을 이용한 수집 일정 기간동안 사용자들이 어플리케이션과 자연스럽게 대화하고, 수집된 데이터를 정제 작업을 거쳐 선별 7가지 감정(happiness, angry, disgust, fear, neutral, sadness, surprise)에 대해 5명이 라벨링
㈜ 아크릴 - 감정 음성합성 데이터셋
공공데이터포털
30대 여성 성우 1인, 7가지 감정에 대해서 각각 3,000개 발화에 대한 음성 녹음을 수행하였음. 총 21,000개 음성 파일 구축
㈜ 아크릴 - 한국어 감정 정보가 포함된 연속적 대화 데이터셋
공공데이터포털
웹 크롤링 등의 방법으로 대화를 수집하고, 적정 길이와 turn 수 및 주제를 가진 대화를 선정하였으며 감정 레이블링 수행 챗봇이 말하기 부적절한 용어(지나치게 전문적인 용어, 비속어 등)을 가능한 범위에서 필터링 하였음
셀바스에이아이 - 웰니스 대화 스크립트 데이터셋
공공데이터포털
강남 세브란스에서 전달받은 상담데이터 1만 6천건에서 초진이고 환자 본인이 직접 내원한 경우인 4200건 추출 추출된 상담 데이터를 기준으로 문장별 분리 및 대화 의도 분류 분류별로 유저-챗봇 대화스크립트 생성
㈜ 아크릴 - 한국어 감정 정보가 포함된 단발성 대화 데이터셋
공공데이터포털
SNS 글 및 온라인 댓글에 대한 웹 크롤링을 실시하여 문장을 선정함 문장 단위 작업을 수행할 수 있도록 문장 분리 작업을 거침 7개 감정(기쁨, 슬픔, 놀람, 분노, 공포, 혐오, 중립) 레이블링 수행
케이티디에스 (구 알파디엑스솔루션) - 속성기반 감정분석 데이터
공공데이터포털
상품 리뷰데이터에 포함된 사용자 감정을 태깅한 데이터로 총 25만건 가량의 데이터셋을 구축
연세대학교 - 심리상담을 위한 멀티모달 데이터셋
공공데이터포털
스트레스 상황 하에서의 100명 한국인의 피부전도도, 광용적맥파, 피부 온도, 가속도계 정보를 수집 실험 단계 별로 시작 시간과 끝 시간을 저장하고 각 단계의 스트레스 단계 정의
미디어젠(주) - 감성 및 발화 스타일별 음성합성 데이터
공공데이터포털
7가지 대표 감정(기쁨, 슬픔, 분노, 불안, 상처, 당황, 중립)과 5가지 발화스타일, 3가지 발성캐릭터, 12가지 감정X발화스타일 조합으로 분류된 음성데이터 셋으로 50명의 전문 성우를 섭외하여 총 1,067시간의 녹음 데이터 구축
연세대학교 교수 - 인공지능 윤리 연구를 위한 비정형 텍스트 데이터셋
공공데이터포털
네이버 뉴스 기사에 등록된 댓글들과 한국어 트위터 사용자의 트윗들을 수집 비속/비윤리적 표현의 빈도수가 많은 특정 온라인 커뮤니티의 댓글들을 수집하여 구축