데이터셋 상세
AI 허브
㈜마인즈랩 - 음성 및 모션 합성 데이터
한국어 발화 기반 동작 생성 기술을 위한 음성 모션이 동기화된 멀티모달 데이터셋 4,070시간 구축 및 공개
연관 데이터
㈜팀벨 - 한국어 텍스트-비디오-사운드 데이터
공공데이터포털
- 텍스트-비디오-사운드 페어를 통해 시각-언어 분석 및 이를 활용한 서비스 제공을 위한 멀티모달 데이터 - 텍스트 기반의 검색을 통해 비디오 및 사운드 검색이 가능한 학습용 데이터 - 한국어 텍스트-비디오-사운드 쌍 데이터 50만 건 이상 구축
㈜마인즈랩 - 립리딩(입모양) 음성인식 데이터
공공데이터포털
다양한 환경에서 복잡한 음성인식 기반 서비스 제공을 위해 음향 외 시각 정보를 활용하여 입모양 인식을 위한 다양한 각도 및 소음환경에서 녹화된 오디오 및 비주얼 데이터로 구성된 융합 데이터
한국전자통신연구원 - 한국어 음성
공공데이터포털
대화형 음성 인식 성능 개선을 위한 음향 모델용 한국어 자유 발화 음성 데이터 구축 및 2,000여명의 발성 대화 음성 1,000시간을 구축한 자연어 데이터 제공
미디어젠(주) - 일상대화 한국어 멀티세션 데이터
공공데이터포털
- 일상대화 맥락에서 자연스러운 연속 대화가 가능한 AI를 구축하기 위한 학습용 데이터 - 멀티세션 대화 및 발화에 활용한 문서 정보, 검색어 등이 태깅된 대화 데이터
솔루게이트 - 한국인 대화음성
공공데이터포털
한국인의 일상 대화를 인식하고 음성을 문자로 실시간 변환하는 AI개발용 대화 한국어 음성 데이터
㈜스피치랩스 - 한국어 대학 강의 데이터
공공데이터포털
한국어 강의 영상 및 음성을 인식하여 자막 생성 등의 서비스를 위한 인공지능 학습용 한국어 대학 강의 분야 음성데이터 구축
㈜솔트룩스 - 방송콘텐츠 대화체 음성인식 데이터
공공데이터포털
방송콘텐츠 상에서 한국인 대화체의 음성인식(STT) 기술 및 문맥을 이해하는 언어처리 기술 개발을 위한 인공지능 학습용 데이터로서 8개 카테고리, 대화체 음성인식, 문장별 의도 인공지능 학습용으로 정제된 7,000시간의 음성 데이터
솔트룩스 - 한국어 방언 발화(전라도)
공공데이터포털
방언(전라도)을 사용하는 일상 대화를 인식, 음성을 문자로 바꾸어주는 방언 발화 음성 데이터
솔트룩스 - 한국어 방언 발화(제주도)
공공데이터포털
방언(제주도)을 사용하는 일상 대화를 인식, 음성을 문자로 바꾸어주는 방언 발화 음성 데이터
㈜코리아리서치인터내셔널 - 인터뷰 진행 멀티턴 데이터
공공데이터포털
멀티턴 형식의 인터뷰 데이터로 다양한 상황과 목적에 맞는 인터뷰 멀티턴 질의 생성을 위한 인공지능 학습용 데이터셋