KAIST 인공지능연구소 - 감정 분류를 위한 대화 음성 데이터셋
공공데이터포털
감성대화 어플리케이션을 이용한 수집 일정 기간동안 사용자들이 어플리케이션과 자연스럽게 대화하고, 수집된 데이터를 정제 작업을 거쳐 선별 7가지 감정(happiness, angry, disgust, fear, neutral, sadness, surprise)에 대해 5명이 라벨링
미디어젠(주) - 감성 및 발화 스타일별 음성합성 데이터
공공데이터포털
7가지 대표 감정(기쁨, 슬픔, 분노, 불안, 상처, 당황, 중립)과 5가지 발화스타일, 3가지 발성캐릭터, 12가지 감정X발화스타일 조합으로 분류된 음성데이터 셋으로 50명의 전문 성우를 섭외하여 총 1,067시간의 녹음 데이터 구축
㈜ 아크릴 - 한국어 감정 정보가 포함된 단발성 대화 데이터셋
공공데이터포털
SNS 글 및 온라인 댓글에 대한 웹 크롤링을 실시하여 문장을 선정함 문장 단위 작업을 수행할 수 있도록 문장 분리 작업을 거침 7개 감정(기쁨, 슬픔, 놀람, 분노, 공포, 혐오, 중립) 레이블링 수행
안산시 - 안산시 뉴스기사 감정분석 라벨링
공공데이터포털
* 해당 데이터는 경기도 안산시에서 개방한 데이터입니다. 이 데이터는 안산 지역과 관련된 여러 언론사의 기사를 체계적으로 분석한 자료입니다. 각 기사의 날짜, 언론사, 제목, 원문 링크와 같은 기본 정보는 물론, 기사의 논조를 긍정, 부정, 중립으로 분류한 감성 분석 결과를 포함하고 있습니다. 더 나아가 분류에 대한 구체적인 사유, 기사에 등장하는 핵심 인물, 주요 동사, 관련 지역명까지 추출하여 사건의 맥락을 깊이 있게 이해할 수 있도록 돕습니다.