데이터셋 상세
AI 허브
전주대학교 산학협력단 컨소시엄 - 이미지 사운드 매칭 데이터
이미지와 사운드라는 서로 다른 특징을 가지는 매체 간의 상관관계를 학습하기 위한 AI 학습용 데이터  이미지 표상 학습(image representation learning)에 적합한 이미지 데이터 100,000장  사운드 표상 학습(sound representation learning)에 적합한 사운드 데이터 10,000개
연관 데이터
MBN - AI 학습용 원시데이터 - 맛있는 수다
공공데이터포털
매경미디어그룹 MBN방송 동영상 데이터로 AI 인공지능 학습 활용 및 연구 개발 할 수 있는 원시 데이터 및 메타 데이터 셋을 제공 합니다. (동영상 가격 및 제공 프로토콜은 협의),,
MBN - AI 학습용 원시데이터 - 대박의 비밀
공공데이터포털
매경미디어그룹 MBN방송 동영상 데이터로 AI 인공지능 학습 활용 및 연구 개발 할 수 있는 원시 데이터 및 메타 데이터 셋을 제공 합니다. (동영상 가격 및 제공 프로토콜은 협의),,
국립국어원 - 일상 대화 음성 말뭉치 2020
공공데이터포털
(버전 1.4) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
국립국어원 - 개체명 사전 2022
공공데이터포털
(버전 1.0) 개체명 및 개체 연결 정보가 부착된 말뭉치에서 개체 표현, 개체 유형, 지식 베이스 연결 정보를 추출하여 구축한 자료입니다.
한국전자통신연구원 텔레매틱스 목적지 인식을 위한 음향모델 적응용 음성 데이터
공공데이터포털
한국어 및 영어 음성인식 기술을 개발하기 위한 과학기술정보통신부의 R&D인 “언어학습을 위한 자유발화형 음성대화처리 원천기술 개발” 과제에서 산출된 음성 학습데이터로, 음성대화 인터페이스 및 외국어교육을 위한 다양한 음성인식 기술 개발과 관련 데이터입니다.
한국지능정보사회진흥원 AI허브 오픈데이터 목록
공공데이터포털
본 데이터는 AI허브에서 국내외 인공지능 개발을 위해 공개한 다양한 오픈 데이터 목록을 수록하고 있습니다. 각 항목은 데이터 분류(음성, 이미지, 텍스트 등), 제목(데이터셋 명칭), 내용(데이터 구성 및 활용 목적 등 설명)으로 구성되어 있으며, 인공지능 학습용 데이터의 접근성과 활용도를 높이는 데 기여합니다. AI 기술 개발자, 연구자, 기업 등이 원하는 분야별 데이터를 효율적으로 탐색하고 활용할 수 있도록 구성되어 있으며, 데이터 품질, 구축 방식, 사용 예시 등에 대한 간략한 정보도 포함될 수 있습니다. 이 목록은 AI 생태계 전반의 개방형 데이터 전략 수립과 데이터 기반 서비스 개발에 필수적인 자료입니다.
한국전자통신연구원 객체검출 API
공공데이터포털
이미지 인식 기술은 이미지 분석을 통해 다양한 종류의 객체 (사람, 자동차 등), 사람 속성 (상의, 하의 등)을 인식하고 해당 정보를 제공하는 기술입니다.
한국전자통신연구원 음성인식 기술
공공데이터포털
최신 인공지능 기술에 기반하여 한국어, 영어, 다국어(일본어/중국어/독어/불어/스페인어/러시아어/베트남어/아랍어/태국어)에 대해 고성능의 음성인식 정확률을 제공하는 서비스로서, 사용자가 발성한 녹음된 입력 음성 데이터(단위 파일 또는 버퍼)를 음성인식 서버로 전달하여 문자(텍스트)로 제공합니다. 음성인식 API는 HTTP 기반의 REST API 인터페이스로 JSON 포맷 기반의 입력 및 출력을 지원하며 ETRI에서 제공하는 API Key 인증을 통해 사용할 수 있는 Open API 입니다.