데이터셋 상세
AI 허브
㈜미디어그룹사람과숲 - 국어 교과 지문형 문제 데이터
- 학년별/과목별 교육과정과 매핑되는 문제(지문과 연결된 문항, 답)와 해설 세트를 국어 교과 교육과정의 지문별 문제 데이터 구축하고 인공지능 모델을 개발하여 국어 교과 지문 학습을 위한 문제인지 판단에 대한 유효성 검증을 진행한 AI 데이터셋으로 구축
연관 데이터
㈜미디어그룹사람과숲 - 수학 교과 문제 풀이과정 데이터
공공데이터포털
- 2022 개정 교육과정의 수학 성취기준과 매핑되는 문제 생성을 위한 교육단계별, 교육과정별 수학 문제, 풀이, 정답 이미지 데이터를 구축하고 인공지능 모델을 개발하여 풀이의 정오답 판단에 대한 유효성을 검증하는 AI 데이터셋으로 구축
㈜미디어그룹사람과숲 - 교과 단계별 교과 데이터
공공데이터포털
- 교육단계별 교육과정의 교과서, 참고서 등에서 확보한 교과 텍스트 및 이미지 학습을 위한 데이터를 2022 개정 교육과정의 교과별 성취기준과 매핑되는 데이터를 확보하여 교육과정 교과 데이터를 AI 데이터셋으로 구축
㈜미디어그룹사람과숲 - 자연 및 인공적 발생 非언어적 소리 데이터
공공데이터포털
– 자연적, 인공적으로 발생하는 각종 비언어적인 소리 데이터 – 대분류 10개, 중분류 28개, 소분류125개의 데이터셋 구축
㈜미디어그룹사람과숲 - 시각화 자료 질의응답 데이터
공공데이터포털
● 문서 내 그림, 표, 그래프, 다이어그램(인포그래픽 포함) 등 시각화 자료에 대한 이해 기반 질의응답 데이터로 시각 문서를 이해하고 문서의 내용에 관련된 질문에 대한 응답을 수행할 수 있는 학습데이터
㈜데이터드리븐 - 학생 청소년 핵심역량분석 교육 데이터
공공데이터포털
실제 교육 현장에서 학생을 관찰한 텍스트데이터를 정규화하여, 정규화된 결과를 교육적 역량으로 치환하고 이를 기준으로 수업기록을 교육 전문가를 통한 어노테이션을 진행하여, 교육 텍스트에서 정량적 역량 점수를 예측할 수 있는 인공지능 학습용 데이터셋
㈜나라지식정보 - 일반상식 문장 생성 평가 데이터
공공데이터포털
■ 기계가 생성한 문장과 인간이 생성한 문장을 다섯 가지 기준에 따라 평가함으로써 향후 AI가 생성한 문장을 AI가 검증할 수 있도록 하는 데이 ■ 한국어 일반상식 문장 평가 과제 중 세 번째 데이터로서 두 번째 데이터(제2과제 데이터)에서 제작한 문장에 대해 사람이 만든 문장과 기계가 생성한 문장을 네 가지 속성*에 따라 3점 리커트 척도로 채점한 점수를 기술 *채점 속성 : 문법성, 사실성, 유창성, 다양성
㈜데이터드리븐 - 진로문장완성검사 텍스트 데이터
공공데이터포털
- 진로문장완성검사를 통해 청소년의 진로 관련 발달 수준(진로성숙도) 파악 및 진로상담 지표로 활용하기 위한 텍스트 데이터. 1. 학생(피검자)의 응답 데이터(원천데이터)와 전문가의 문항별 해석 2. 데이터(라벨링 데이터) - 진로성숙도 분류 (상·중·하) - 문항별 전문가 해석 (전문가 해석 텍스트)
트위그팜 - 영상 교육자료 기반 문제 생성 데이터
공공데이터포털
본 데이터셋은 학습자의 학습 패턴을 분석하고, 개별 학습자의 특성에 맞춘 문제 데이터를 생성하기 위해 교육 영상과 텍스트를 활용하여 구축된 데이터
서울대학교 산학협력단 - 서울 지역 중학생들의 국어, 수학 교과용 감성 AI 튜터 데이터
공공데이터포털
청소년들이 스마트기기를 활용한 국어, 수학 교과목 학습과정에서의 언어적 표현을 담은 질의응답 데이터셋과 그 과정 속에서 자연히 표출되는 청소년들의 기질적 표상인 스마트기기 센서 데이터 셋을 구축함.
성균관대 산학협력단 - 문장 유형(추론, 예측 등) 판단 데이터
공공데이터포털
ㅇ 문장 유형(추론, 예측 등) 판단 데이터 16만 5천 문장 이상 구축 ㅇ 역사, 사회, 금융, 문화, IT·과학, 생활·건강 카테고리에 해당하는 원시데이터를 수집·정제, 라벨링하여 인공지능 기술 개발에 필요한 학습용 문장 유형 데이터셋 구축 ⋅ 문장 유형 판단 라벨링으로 확실성, 시간성, 긍정/부정 극성 별로 스타일 태그 라벨링 ⋅ 최고의 전문기업들과의 협업을 통해 문장 유형 판단 학습용 데이터를 안정적으로 구축