데이터셋 상세
AI 허브
셀바스에이아이 - 웰니스 대화 스크립트 데이터셋
강남 세브란스에서 전달받은 상담데이터 1만 6천건에서 초진이고 환자 본인이 직접 내원한 경우인 4200건 추출 추출된 상담 데이터를 기준으로 문장별 분리 및 대화 의도 분류 분류별로 유저-챗봇 대화스크립트 생성
데이터 정보
연관 데이터
㈜ 아크릴 - 한국어 감정 정보가 포함된 연속적 대화 데이터셋
공공데이터포털
웹 크롤링 등의 방법으로 대화를 수집하고, 적정 길이와 turn 수 및 주제를 가진 대화를 선정하였으며 감정 레이블링 수행 챗봇이 말하기 부적절한 용어(지나치게 전문적인 용어, 비속어 등)을 가능한 범위에서 필터링 하였음
연세대학교 - 심리상담을 위한 멀티모달 데이터셋
공공데이터포털
스트레스 상황 하에서의 100명 한국인의 피부전도도, 광용적맥파, 피부 온도, 가속도계 정보를 수집 실험 단계 별로 시작 시간과 끝 시간을 저장하고 각 단계의 스트레스 단계 정의
경기도 - 정신질환 상병별 진료실인원 집계현황
공공데이터포털
국민건강보험공단에서 제공하는 경기도 정신질환 상병별 진료실인원 집계현황(건강보험) 입니다. * 2016년 자료는 2017년 6월 청구분까지 반영 ※ 국민건강보험공단의 연구 종료로 인하여 집계가 중단된 데이터입니다(향후 연구 재개 시 갱신도 재개될 수 있음).
병무청 - 정신건강의학과 부령별 처분현황
공공데이터포털
'23년도 병무청 정신질환(부령코드)별 병역처분 현황 [개요] ㅇ ‘23년도 병무청 정신질환(부령코드)별 병역처분 현황 [특징] ㅇ 용량 : 1.4MB ㅇ 데이터 건수 : 15,994 건 [활용사례] ㅇ 활용목적: '25년 병무청·방사청·질병청 합동 데이터분석 및 아이디어 공모전 출품
한국과학기술정보연구원 - 한국어 대화
공공데이터포털
소상공인 및 공공 민원 10개 분야에 대한 50만 건 이상의 대화를 제공하는 자연어 데이터 제공
인사이트베슬 - 대화/구어체 한영 말뭉치 코퍼스 데이터 15만 건 [데이터셋1호]
공공데이터포털
실제 대화, 발화, 영상을 번역하면서 파생된 한영 말뭉치. 한영/영한 번역 AI에 필수적인 데이터이며 추가로 코퍼스 연구나 언어 교육 자료 제작에도 사용될 수 있는 데이터. 1차 MTPE로 생성되었고, 2차, 3차 전문가 교정, 4차 데이터 검수 완료
㈜ 아크릴 - 한국어 감정 정보가 포함된 단발성 대화 데이터셋
공공데이터포털
SNS 글 및 온라인 댓글에 대한 웹 크롤링을 실시하여 문장을 선정함 문장 단위 작업을 수행할 수 있도록 문장 분리 작업을 거침 7개 감정(기쁨, 슬픔, 놀람, 분노, 공포, 혐오, 중립) 레이블링 수행