데이터셋 상세
공공데이터포털
행정안전부 정부 공문서 AI 학습데이터 조회 서비스
정부 문서를 기반으로 생성된 LLM모델을 위한 AI학습용 데이터입니다. 보도자료, 연설문, 발간사, 정책보고서, 회의/행사 계획 공문서를 활용하여 구축된 말뭉치 학습 데이터 및 질의응답, 재구성, 요약을 위한 목적형 태스크 학습 데이터로 구성되어 있습니다. 주요 특징으로는 다음과 같은 특징을 가지고 있습니다. ● 멀티모달 LLM 대응과 복잡한 표를 가진 문서에 대한 LLM의 이해도 향상을 위해 말뭉치에 표(html)와 그림(별도 저장후 경로 표기)이 포함됩니다. ● LLM을 지시에 따르도록 파인튜닝하기 위해 활용될 수 있는 Q&A, 요약, 재작성용 태스크 데이터셋이 포함됩니다.
데이터 정보
연관 데이터
경상남도 김해시 AI기반 대형생활폐기물 학습데이터
공공데이터포털
김해시 AI기반 대형생활폐기물 학습데이터를 통해 빅데이터를 활용하여 정책결정, 업무개선의 기반 마련
한국지능정보사회진흥원 AI허브 수행기관 정보
공공데이터포털
본 데이터는 AI허브에서 추진하는 인공지능 학습용 데이터 구축 사업에 참여하는 수행기관의 정보를 담고 있습니다. 각 항목은 데이터명(해당 기관이 담당하는 데이터셋 주제), 기관명(주관·참여기관 등), 그리고 구체적인 담당업무(데이터 수집, 정제, 라벨링 등)를 포함합니다. 이 정보는 인공지능 데이터 구축 생태계 내 각 기관의 역할을 파악하고, 향후 사업 참여 및 협업 기획에 참고할 수 있는 기초자료로 활용됩니다. 특히 정부 주도의 AI 데이터 구축 과제 수행현황 분석, 기관별 전문분야 식별, 데이터 활용성과 분석 등에 유용하며, 정책 수립 및 사업 평가를 위한 기반자료로도 적합합니다.
한국지능정보사회진흥원 AI허브 데이터셋 정보
공공데이터포털
AI 허브에서 제공하는 인공지능 학습용 데이터셋 현황입니다.데이터셋별 구축년도, 분야, 유형, 접속링크 등 정보를 제공합니다.
한국지능정보사회진흥원 AI허브 교육과정 정보
공공데이터포털
본 데이터는 AI허브에서 제공하는 인공지능 학습용 데이터 라벨링 관련 교육 콘텐츠에 대한 정보를 담고 있습니다.각 콘텐츠는 교육명, 교육 구분(전문가/프로젝트관리자), 난이도 수준(기본/전문/심화 등), 유형(PM과정/비전기술/보안/품질관리 등), 교육 동영상 URL 및 조회수 항목으로 구성되어 있으며, 사용자 수요와 교육 효과성을 분석하는 데 활용됩니다. 본 자료는 인공지능 데이터 가공 인력의 역량 향상 및 표준화된 라벨링 교육 제공을 위한 기반자료로서 유용하며, 공공 AI 학습 데이터 구축 사업 참여자, 민간 데이터 라벨러, 교육 기획자들이 교육 콘텐츠 수립 및 개선 방향을 도출하는 데 활용될 수 있습니다.
한국지능정보사회진흥원 인공지능 학습용 데이터 구축 현황
공공데이터포털
한국지능정보사회진흥원(NIA)에서 제공하는 인공지능 학습용 데이터 구축 현황 자료(연도, 분야, 주요내용 등) 입니다.
경기도 - 자율주행 AI 학습데이터
공공데이터포털
AI 학습용 데이터(자율주행 AI 학습데이터)는 경기도의 「2021년 공공•민간 데이터 전처리」 사업의 일환으로 구축되었습니다. 본 데이터셋은 다양한 분야에서 비영리적 연구·개발 목적으로 활용할 수 있습니다.
한국지능정보사회진흥원 AI학습용데이터구축사업 참여기관 정보
공공데이터포털
2021년 부터 2023년 까지 AI 학습용 데이터 구축사업 참여기관 정보입니다. 사업년도, 과제명, 구분(주관/참여), 기관명 데이터가 포함되어 있습니다.
대구광역시교육청 대구미래교육연구원 인공지능기준관리
공공데이터포털
대구광역시교육청 대구미래교육연구원 인증기준관리 목록 데이터 입니다.대구광역시교육청 인증기준관리에 대한 데이터로 인공지능이해,인공지능활용,인공지능윤리 관련으로 초급중급고급 항목에 대한 내용의 데이터입니다.이로 구성된 공공데이터를 대구광역시교육청 대구미래교육연구원에서 제공을 하고 있습니다.*해당 정보데이터에 대한 상세한 문의나 개선 요청은 대구광역시교육청 대구미래교육연구원 정보운영부를 통해 가능합니다.-대구광역시교육청 대구미래교육연구원 정보운영부(053-231-1444)
공정거래위원회 페어데이터 가맹정보 자연어 기반 질의 학습데이터 목록 제공서비스
공공데이터포털
정보공개서 약1만건의 중목차의 데이터를 "자연어처리(NLP) 모델"을 활용하여 학습데이터(JSON)파일을 생성하였습니다. 주요 제공 항목으로는 가맹사업 기준년도, 가맹본부 상호명, 브랜드명, SQL 데이터, 자연어 질문, TABLE, META 정보가 있습니다. 해당 데이터 통해 인공지능 모델 학습 및 통계, 분석 등에 활용할 수 있습니다.
한국지능정보사회진흥원 AI허브 오픈데이터 목록
공공데이터포털
본 데이터는 AI허브에서 국내외 인공지능 개발을 위해 공개한 다양한 오픈 데이터 목록을 수록하고 있습니다. 각 항목은 데이터 분류(음성, 이미지, 텍스트 등), 제목(데이터셋 명칭), 내용(데이터 구성 및 활용 목적 등 설명)으로 구성되어 있으며, 인공지능 학습용 데이터의 접근성과 활용도를 높이는 데 기여합니다. AI 기술 개발자, 연구자, 기업 등이 원하는 분야별 데이터를 효율적으로 탐색하고 활용할 수 있도록 구성되어 있으며, 데이터 품질, 구축 방식, 사용 예시 등에 대한 간략한 정보도 포함될 수 있습니다. 이 목록은 AI 생태계 전반의 개방형 데이터 전략 수립과 데이터 기반 서비스 개발에 필수적인 자료입니다.