데이터셋 상세
AI 허브
㈜데이터드리븐 - 진로문장완성검사 텍스트 데이터
- 진로문장완성검사를 통해 청소년의 진로 관련 발달 수준(진로성숙도) 파악 및 진로상담 지표로 활용하기 위한 텍스트 데이터. 1. 학생(피검자)의 응답 데이터(원천데이터)와 전문가의 문항별 해석 2. 데이터(라벨링 데이터) - 진로성숙도 분류 (상·중·하) - 문항별 전문가 해석 (전문가 해석 텍스트)
연관 데이터
㈜데이터드리븐 - 학생 청소년 핵심역량분석 교육 데이터
공공데이터포털
실제 교육 현장에서 학생을 관찰한 텍스트데이터를 정규화하여, 정규화된 결과를 교육적 역량으로 치환하고 이를 기준으로 수업기록을 교육 전문가를 통한 어노테이션을 진행하여, 교육 텍스트에서 정량적 역량 점수를 예측할 수 있는 인공지능 학습용 데이터셋
데이터마케팅코리아 - 맘카페 교육학원 연관어 분석 데이터
공공데이터포털
ㅇ 데이터 소개 - 맘카페(커뮤니티)에서 자녀교육에 대한 원문 데이터를 유형별 분석키워드(유아영어, 초등영어 등)에 대한 연관어와 랭킹을 추출한 데이터입니다. - 연관어 추출 기준은 원문데이터에서 '분석키워드(유아영어, 초등영어 등)'의 거리간 유의미를 판단하여 같이 중요하게 나오는 단어를 랭킹으로 추출하였습니다. - 분석키워드(검색어명), 연관어, 순위 등의 결과를 월단위로 제공합니다. ㅇ 활용 분야 - 자녀교육에 대한 엄마들의 Real Buzz에 대한 연관어 분석 - 연관어 분석 결과를 통해 워드클라우드(시각화) 활용 ㅇ 데이터 출처 - [데이터] 맘카페(커뮤니티) 데이터 기반으로 데이터마케티코리아 자체 제공 ㅇ 특이사항 - 데이터 수집기간 : 2020-01-01 ~ - 1년(12개월) 데이터를 하나의 파일로 다운로드 받으시려면, "맞춤데이터신청" 에서 신청해주세요. - 맞춤데이터신청 방법 : 상단메뉴[데이터 상담소 > 맞춤형 데이터 신청] 요청내용에 "데이터 상품명", "데이터기간" 을 작성해주세요! * 데이터 갱신 주기가 Monthly이므로, 데이터기간은 '시작일'과 '마지막일'을 월 단위로 입력해주세요. ex. 2020-01-01 ~ 2020-07-31 (O) 혹은 2020년 1월~ 2020년 7월 (O) 2020-01-15 ~ 2020-07-20 (X) ㅇ 특이사항 - 해당 데이터는 관련사업 종료로 인해 2022년부터 업데이트 주기가 Monthly에서 Quarterly로 변경됩니다. 추가적인 문의는 데이터 상담소 > 데이터 문의 게시판을 이용해주세요.
㈜미디어그룹사람과숲 - 국어 교과 지문형 문제 데이터
공공데이터포털
- 학년별/과목별 교육과정과 매핑되는 문제(지문과 연결된 문항, 답)와 해설 세트를 국어 교과 교육과정의 지문별 문제 데이터 구축하고 인공지능 모델을 개발하여 국어 교과 지문 학습을 위한 문제인지 판단에 대한 유효성 검증을 진행한 AI 데이터셋으로 구축
㈜딥로딩 - 연령대별 특징적 발화(은어·속어 등) 음성 데이터
공공데이터포털
문맥 이해 및 인식 성능개선을 위해 다양한 연령대별 특징적 발화(은어·속어 등) 음성 데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축 이때 학습 데이터셋은 녹음한 음성 파일이며, 전사데이터는 txt 기반의 데이터 셋 목록 및 메타 정보로 구성됨.
서울대학교 산학협력단 - 서울 지역 중학생들의 국어, 수학 교과용 감성 AI 튜터 데이터
공공데이터포털
청소년들이 스마트기기를 활용한 국어, 수학 교과목 학습과정에서의 언어적 표현을 담은 질의응답 데이터셋과 그 과정 속에서 자연히 표출되는 청소년들의 기질적 표상인 스마트기기 센서 데이터 셋을 구축함.
교육부 하이점프 직업계고 기초학력향상 영어보정학습
공공데이터포털
인사나누기, 소개하기, 일상생활, 의견교환하기, 짧은글 읽기, 친숙한소재글 읽기, 실용문읽기, 친숙한소재 글쓰기, 실용문 쓰기 등의 영어 보정학습 자료영상 및 교사용 지도서
성균관대 산학협력단 - 문장 유형(추론, 예측 등) 판단 데이터
공공데이터포털
ㅇ 문장 유형(추론, 예측 등) 판단 데이터 16만 5천 문장 이상 구축 ㅇ 역사, 사회, 금융, 문화, IT·과학, 생활·건강 카테고리에 해당하는 원시데이터를 수집·정제, 라벨링하여 인공지능 기술 개발에 필요한 학습용 문장 유형 데이터셋 구축 ⋅ 문장 유형 판단 라벨링으로 확실성, 시간성, 긍정/부정 극성 별로 스타일 태그 라벨링 ⋅ 최고의 전문기업들과의 협업을 통해 문장 유형 판단 학습용 데이터를 안정적으로 구축
㈜유핏 - 논술형 글쓰기 평가 데이터
공공데이터포털
글쓰기 자동 평가 및 피드백 모델 개발을 위한 데이터 구축을 통해 교육 개혁에 따른 창의력 및 문제해결력 중심의 평가 혁신을 위한 논술형 평가의 효율적 수행 기반 체계 확보
㈜유핏 - 서술형 글쓰기 평가 데이터
공공데이터포털
글쓰기 자동 평가 및 피드백 모델 개발을 위한 데이터 구축을 통해 교육 개혁에 따른 창의력 및 문제해결력 중심의 평가 혁신을 위한 서술형 평가의 효율적 수행 기반 체계 확보