데이터셋 상세
AI 허브
㈜ 유핏 - 인터페이스(자판/음성)별 고빈도 오류 교정 데이터
한글 입력 인터페이스(일반 키보드, 스마트폰 쿼티 및 천지인, 음성)에서 특징적으로 나타나는 오탈자 및 띄어쓰기 등 오류를 탐지하고 적절한 맞춤법으로의 자동전환을 학습하기 위한 데이터
연관 데이터
솔트룩스 - 한국어 방언 발화(경상도)
공공데이터포털
방언(경상도)을 사용하는 일상 대화를 인식, 음성을 문자로 바꾸어주는 방언 발화 음성 데이터
한국외국어대학교 - 한영 혼합 인식 데이터
공공데이터포털
대화 중 자연스럽게 구사되는 영문 단어(외래어 및 외국어) 및 관용적 표현이 포함된 문장과 스크립트를 통해 AI 학습용 데이터 구축
비디 - 명령어 음성(일반남여)
공공데이터포털
한국인 일반남녀 명령어를 문자로 바꾸어 주는 AI기술을 위한 음성 데이터
한국전자통신연구원 한국어/다국어 언어음성정보
공공데이터포털
언어음성DB는 자동통/번역, 음성인식/합성, 지식마이닝/검색엔진 개발용으로 인간의 지식을 규칙화하는데 활용되고 있습니다.
한국전자통신연구원 음성인식 기술
공공데이터포털
최신 인공지능 기술에 기반하여 한국어, 영어, 다국어(일본어/중국어/독어/불어/스페인어/러시아어/베트남어/아랍어/태국어)에 대해 고성능의 음성인식 정확률을 제공하는 서비스로서, 사용자가 발성한 녹음된 입력 음성 데이터(단위 파일 또는 버퍼)를 음성인식 서버로 전달하여 문자(텍스트)로 제공합니다. 음성인식 API는 HTTP 기반의 REST API 인터페이스로 JSON 포맷 기반의 입력 및 출력을 지원하며 ETRI에서 제공하는 API Key 인증을 통해 사용할 수 있는 Open API 입니다.
비디 - 차량 내 대화 및 명령어 음성
공공데이터포털
차량 내 대화 및 명령어를 인식하여 문자로 바꾸어 주는 AI기술을 위한 음성 데이터
NHN다이퀘스트 - 한국인 외래어 발화
공공데이터포털
통역과 번역의 과정 없이 바로 한국어 음성 또는 텍스트 데이터에 맵핑할 수 있는 외래어 발화 음성 데이터
㈜ 씨에스리 - 인공지능 학습을 위한 외국인 한국어 발화 음성 데이터
공공데이터포털
외국어가 모국어인 화자의 한국어 음성 데이터로, 주어진 대본 내용을 읽은 음성과 주어진 질문에 자유롭게 답변한 음성과 각 음성에 대한 전사 결과를 포함한 메타데이터로 구성
NHN다이퀘스트 - 자유대화 음성(일반남여)
공공데이터포털
한국인 중 일반남녀의 음성을 문자로 바꾸어 주고, 문맥을 이해하는 한국어 음성언어처리 기술 개발을 위한 한국어 음성 데이터
테스트웍스 - 수어 영상
공공데이터포털
지숫자, 지문자의 데이터 영상 생성을 통해 길찾기, 교통, 주소 등과 관련된 한국수어 인식 인공지능 기술 및 서비스 개발에 활용 가능한 총 536,000개의 영상 데이터 제공