데이터셋 상세
AI 허브
트위그팜 - 영상 교육자료 기반 문제 생성 데이터
본 데이터셋은 학습자의 학습 패턴을 분석하고, 개별 학습자의 특성에 맞춘 문제 데이터를 생성하기 위해 교육 영상과 텍스트를 활용하여 구축된 데이터
연관 데이터
줌인터넷 - 영유아 교육 영상콘텐츠 방송
공공데이터포털
영유아 교육 영상콘텐츠를 기반으로 동영상의 콘텐츠를 이해하고 분석하는 AI 기술 개발을 위한 영상 데이터
한국지능정보사회진흥원 AI허브 교육과정 정보
공공데이터포털
본 데이터는 AI허브에서 제공하는 인공지능 학습용 데이터 라벨링 관련 교육 콘텐츠에 대한 정보를 담고 있습니다.각 콘텐츠는 교육명, 교육 구분(전문가/프로젝트관리자), 난이도 수준(기본/전문/심화 등), 유형(PM과정/비전기술/보안/품질관리 등), 교육 동영상 URL 및 조회수 항목으로 구성되어 있으며, 사용자 수요와 교육 효과성을 분석하는 데 활용됩니다. 본 자료는 인공지능 데이터 가공 인력의 역량 향상 및 표준화된 라벨링 교육 제공을 위한 기반자료로서 유용하며, 공공 AI 학습 데이터 구축 사업 참여자, 민간 데이터 라벨러, 교육 기획자들이 교육 콘텐츠 수립 및 개선 방향을 도출하는 데 활용될 수 있습니다.
㈜데이터드리븐 - 학생 청소년 핵심역량분석 교육 데이터
공공데이터포털
실제 교육 현장에서 학생을 관찰한 텍스트데이터를 정규화하여, 정규화된 결과를 교육적 역량으로 치환하고 이를 기준으로 수업기록을 교육 전문가를 통한 어노테이션을 진행하여, 교육 텍스트에서 정량적 역량 점수를 예측할 수 있는 인공지능 학습용 데이터셋
한국과학기술원 - 동영상 콘텐츠 하이라이트 편집 및 설명(요약) 데이터
공공데이터포털
뉴스, 유튜브 콘텐츠 등 영상을 수집하고 주요 장면의 위치를 레이블링 및 카테고리 항목에 대해 태깅하여 동영상 요약 학습용 데이터셋을 구축. 해당 데이터를 통해 인공지능 영상 요약 모델을 개발하고 자동화된 영상 편집 시스템을 제시.
㈜위지윅스튜디오 - 안면 랜드마크 데이터
공공데이터포털
- 인공지능 학습용 데이터 구축을 위한 ‘안면 랜드마크 데이터’의 원천데이터를 획득하여 AI 학습용 데이터로 정제, 가공하여 공개하는 것을 목표로 함
㈜워트인텔리전스 - 지식재산권법 LLM 사전학습 및 Instruction Tuning 데이터
공공데이터포털
사법분야 초거대 AI 학습을 위해 지식재산권법의 법령, 판결문, 심결례, 심결문 및 유권해석 원시데이터로부터 각 분야의 문장을 추출/가공하여 질의/응답 및 요약을 위한 초거대 AI 학습용 Instruction tuning data를 구축함
㈜플랜인피닛 - 전술 판정 영상 데이터(핸드볼)
공공데이터포털
종목별 프로 경기 영상 원시데이터 수집 후, 프레임별 선수 검출 및 추적 작업 등 정제작업을 통한 원천데이터 구축 원천데이터의 동영상 분석 및 이미지 분석 데이터 인플레이 영상 추출 후 데이터의 스탯이벤트, 전략전술 분석 등 학습모델 구축 라벨링 데이터 학습모델 설계 및 개발 완료 후 비식별화 작업 진행
소상공인시장진흥공단 교육시스템 운영중인 교육과정 마스터
공공데이터포털
교육시스템_운영중인 교육과정_마스터에 대한 데이터로 과정코드, 과정명, 과정개요, 교육대상 학습환경 등에 대한 항목들을 제공합니다.
충청남도 금산군 평생학습 프로그램 수강현황 합성데이터
공공데이터포털
해당 데이터는 금산군 평생학습 프로그램 수강현황을 기반으로 인공지능 생성모델 알고리즘에 적용하여 산출된 합성데이터입니다. 합성데이터는 원천데이터와 통계적으로 유사한 패턴을 가진 가상데이터로, 익명화와 통계적 변형 기법을 통해 개인정보를 철저히 보호합니다. 합성 모델(CTGAN, GMM)에 따라 각각 9,999건, 9,955건의 데이터가 수록되어 있습니다. 해당 합성데이터를 활용하여 프로그램별 요일·시간·장소 대비 신청 패턴을 분석해 인기 강좌·시간대를 식별하고, 차기 분기 편성·강의실 배정을 최적화할 수 있습니다. 또한 읍면·성별 분포에 따른 참여 편차를 파악해 대상자 맞춤 홍보·찾아가는 강좌 기획에 반영할 수 있습니다.