데이터셋 상세
미국
KAIROS Evaluation Software
The KAIROS Evaluation Software Suite was developed by NIST in support of evaluation of DARPA's Program on Knowledge Directed Artificial Intelligence Reasoning Over Schemas (KAIROS). Some of the capabilities of this software include:* calculating a variety of metrics and scores indicative of performance of individual KAIROS systems* processing and format conversion of KAIROS system output, data annotations, and human assessment results* analyzing metrics, scores, and assessment results* generating statistics and charts summarizing these results
데이터 정보
연관 데이터
㈜나라지식정보 - 일반상식 문장 생성 평가 데이터
공공데이터포털
■ 기계가 생성한 문장과 인간이 생성한 문장을 다섯 가지 기준에 따라 평가함으로써 향후 AI가 생성한 문장을 AI가 검증할 수 있도록 하는 데이 ■ 한국어 일반상식 문장 평가 과제 중 세 번째 데이터로서 두 번째 데이터(제2과제 데이터)에서 제작한 문장에 대해 사람이 만든 문장과 기계가 생성한 문장을 네 가지 속성*에 따라 3점 리커트 척도로 채점한 점수를 기술 *채점 속성 : 문법성, 사실성, 유창성, 다양성
한국과학기술정보연구원 - 국내 논문 QA 데이터셋
공공데이터포털
기계가 과학기술 문헌을 읽고 이해하는 능력을 평가하기 위한 질의응답 데이터셋 [개요] ㅇ 국내 한글 논문에서 다루는 주요 개념들인 문제, 방법, 데이터, 모델, 결과 등에 대한 이해능력을 평가할 수 있도록 구축된 질의응답 데이터 ㅇ 용량 및 건수: 276,804 건, 8 GB [특징] ㅇ [구축 및 수집 방법] - KISTI가 학술논문 데이터베이스 구축을 통해 확보한 국내 학술 논문 중 최근 10년 이내 발행된 한글 논문을 대상으로 함. - 질의 난이도를 상/중/하 중 1가지로 설정. - 핵심 어휘는 논문의 핵심 내용(문제, 방법, 모델, 데이터, 결과 등)으로 판단되는 단어, 구, 문장 등으로 선택하였음. - 핵심 어휘가 포함된 질의 문장을 작성(난이도별 작성 기준에 적합한 질의 작성)하였음. - 작성한 질의에 대한 응답을 논문 내에 존재하는 단어, 구, 문장 등 형식 상관없이 그대로 추출하였음. ㅇ [검증 방법] - 구축된 질의 문장의 핵심 어휘와 질의 의도는 변경하지 않고, 그 외 부분에 대해서 올바르게 작성되었는지 검토하였음. - 1차 응답(구축자 응답), 2차 응답(검토자 응답), 3차 응답(검수자 응답) 간의 유사도 비교 수치(F1)를 참고하여 최종 응답 선정하였음. [활용사례] ㅇ (2022년 과학기술·공공 AI 데이터 분석활용 경진대회 우수상) 사전학습을 활용한 논문 QA ※ 해당 데이터는 한국과학기술정보연구원 심사 후 이용가능합니다.
한국과학창의재단 SW중심사회 사업성과물
공공데이터포털
일반 국민이 SW AI를 포함하는 디지털 교육, 산업, 정책, 문화 등에 대해 친숙하고 긍정적으로 인식할 수 있는 성과물 제작보급
㈜나라지식정보 - 일반상식 문장 교정 데이터
공공데이터포털
■ 국어를 사용하는 사람들이 매일매일의 생활에서 듣고 보고 사용하는 기초적이고 핵심적인 문장으로 구성된 데이터로 이를 통해 AI 모델이 사람의 생활에서 납득 가능한 논리적 추정을 할 수 있을 것으로 기대함 ■ 데이터 구축 목적에 부합하는가는 AI 모델이 일상생활에서 두루 쓰이는 용어 및 문장을 이해하고 이로부터 기대되는 감정과 상황 변화에 대한 보편적 지식을 산출해 내는지가 중요한 요인으로 작용함
한국지능정보사회진흥원 AI허브 데이터셋 정보
공공데이터포털
AI 허브에서 제공하는 인공지능 학습용 데이터셋 현황입니다.데이터셋별 구축년도, 분야, 유형, 접속링크 등 정보를 제공합니다.
전북개발공사 전자문서 내 일정 자동 등록 시스템(TimeGuardian 프로그램) 소스코드
공공데이터포털
본 데이터는 그룹웨어 문서 분석 및 일정 자동 등록 시스템에 대한 개발자 가이드와 소스 코드로 구성되어 있습니다. 시스템은 OpenAI API를 활용하여 문서의 내용을 분석하고, 일정 관련 정보를 자동으로 추출한 뒤 해당 일정을 그룹웨어 시스템에 등록하는 기능을 제공합니다.개발자는 제공된 가이드를 통해 소스코드 실행 방법, 데이터베이스 연동 절차, 예외 처리 및 오류 관리 방안을 확인하여 다양한 환경에 적용할 수 있습니다.이를 통해 사용자는 회의 일정, 마감일, 업무 계획 등 문서에 포함된 일정을 별도의 입력 없이 자동으로 캘린더에 반영할 수 있으며 행정 업무의 효율성과 데이터 활용성을 동시에 향상시킬 수 있습니다.
한국지능정보사회진흥원 스마트워크 자가진단 스코어
공공데이터포털
한국지능정보사회진흥원(NIA)에서 제공하는 스마트워크 도입을 위한 자가진단 스코어에 관한 정보(가중치일련번호, 상위그룹일련번호, 가중치유형명 등)입니다.
포티투마루 - 도서자료 기계독해
공공데이터포털
기존 AI 질의응답 서비스의 기반이 되어온 지식베이스(Knowledge Base)가 가진 한계 및 비효율성 등을 극복하기 위해 자연어 형태의 질의를 받아 지식 정보를 제공하는 서비스에 활용할 수 있는 딥러닝 기반 기계 독해 학습데이터셋 구축