데이터셋 상세
AI 허브
㈜솔트룩스 - 전문분야 심층인터뷰 데이터
ㅇ인공지능 요약 서비스와 오탈자 교정 서비스 위한 전문분야 심층인터뷰 음성인식 데이터 확보 ㅇ데이터 기반 지능화 혁신서비스 확산, AI서비스 창출을 위한 유효성, 활용성 검증된 학습 데이터 모델 구축 ㅇ전문분야 심층인터뷰 데이터, 15개 이상 분류의 2,000시간 구축
연관 데이터
무하유 - 채용면접 인터뷰 데이터
공공데이터포털
실제 채용면접과 유사한 환경의 질문과 답변의 음성을 제작하여 텍스트로 변환한후 내용 요약, 채용면접에서 표현되는 답변의 감정과 의도를 라벨링하여 원격 면접의 서비스를 고도화
㈜코리아리서치인터내셔널 - 인터뷰 진행 멀티턴 데이터
공공데이터포털
멀티턴 형식의 인터뷰 데이터로 다양한 상황과 목적에 맞는 인터뷰 멀티턴 질의 생성을 위한 인공지능 학습용 데이터셋
㈜타임게이트 - 민간분야 고객 상담 데이터
공공데이터포털
민간분야 5개 클래스(교통/차량, 금융, 보험, 생활/패션, 의료/보건) 3,300시간 고객 상담 음성 데이터 수집 및 감정·의도 태깅 및 요약문 등으로 이루어진 학습데이터 구축 ※ 의료/보건 클래스의 경우, 개인정보/민감정보 보호를 위해 시나리오 기반 음성데이터 수집
솔트룩스 - 온라인 구어체 말뭉치 데이터
공공데이터포털
온라인 플랫폼(게시판, 댓글 등)에서 구어체 위주의 텍스트 데이터를 수집 후 전사 도구를 활용하여 구축된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋
㈜타임게이트 - 공공분야 고객응대 데이터
공공데이터포털
공공분야 6개 클래스(문화/관광, 보건/복지, 도시/교통, 전자상거래, 환경, 우편) 3,300시간 고객 응대 음성 데이터 수집 및 감정·의도 태깅 및 요약문 등으로 이루어진 학습데이터 구축
㈜엔에스데블 - 교육용 중·일어 모국어 사용자의 한국어 음성 데이터
공공데이터포털
● 인공지능 학습용 중일어 사용자의 한국어 음성 데이터 수집 및 가공 ● 발음 및 말하기 교육과 평가에 활용할 수 있는 인공지능 프로그램 개발에 실질적으로 도움을 줄 수 있는 고품질의 음성데이터 수집 및 가공
한국과학기술정보연구원 - 한국어 대화
공공데이터포털
소상공인 및 공공 민원 10개 분야에 대한 50만 건 이상의 대화를 제공하는 자연어 데이터 제공
㈜솔트룩스 - 방송콘텐츠 대화체 음성인식 데이터
공공데이터포털
방송콘텐츠 상에서 한국인 대화체의 음성인식(STT) 기술 및 문맥을 이해하는 언어처리 기술 개발을 위한 인공지능 학습용 데이터로서 8개 카테고리, 대화체 음성인식, 문장별 의도 인공지능 학습용으로 정제된 7,000시간의 음성 데이터
커뮤니케이션북스(주) - 감성 및 발화스타일 동시 고려 음성합성 데이터
공공데이터포털
다양한 감성과 발화스타일을 동시 고려하는 인공지능 기술 개발을 위한 학습용 음성합성 데이터
㈜엔에스데블 - 교육용 영어 모국어 사용자의 한국어 음성 데이터
공공데이터포털
● 인공지능 학습용 영어 사용자의 한국어 음성 데이터 수집 및 가공 ● 발음 및 말하기 교육과 평가에 활용할 수 있는 인공지능 프로그램 개발에 실질적으로 도움을 줄 수 있는 고품질의 음성데이터 수집 및 가공