로그인
데이터검색
데이터맵
공모전
이용안내
통합검색
데이터셋 검색
교육분야 포털 모음
데이터맵
공모전 안내
공모전 공지사항
공모전 참여하기
공모전 수상작
공모전 문의하기
공지사항
자주묻는 질문
자료실
문의하기
데이터 검색
통합검색
데이터셋검색
교육분야 포털 모음
데이터맵
데이터맵
공모전
공모전 공지사항
공모전 참여하기
공모전 수상작
공모전 문의하기
이용안내
자료실
공지사항
문의하기
자주묻는 질문
공모전 수상작
공모전 공지사항
공모전 문의하기
홈
데이터검색
데이터셋 검색
데이터셋 상세
AI 허브
나라지식정보 - 민간 민원 상담 LLM 사전학습 및 Instruction Tuning 데이터
1건당 500글자 이상, 최소 3턴 이상의 질의·답변으로 구성된 민간 민원 상담 텍스트 데이터 1만 건 이상(12,303건)을 수집하여 분류, 요약, 질의응답 유형의 Instruction Tuning Data 구축
데이터 정보
데이터 포털
AI 허브
META URL
https://www.aihub.or.kr/aihubdata/data/view.do?pageIndex=2&currMenu=115&topMenu=100&srchOptnCnd=OPTNCND001&srchDetailCnd=DETAILCND001&srchOrder=ORDER001&srchPagePer=20&aihubDataSe=data&dataSetSn=71844
라이선스
cc-zero
비용
무료
제공기관
수행기관(주관) : 나라지식정보
관리부서
데이터
3.13-23_민간 민원 상담 LLM 사전학습 및 Instruction Tuning 데이터활용 가이드라인_보완조치.hwp
랜딩 페이지
13-23_2024 데이터설명서_수정.hwp
연관 데이터
나라지식정보 - 공공 민원 상담 LLM 사전학습 및 Instruction Tuning 데이터
공공데이터포털
단답형 7천쌍, 서술형 3천 쌍으로 된 공공 분야 민원 상담 텍스트 데이터 10,182건 수집하여 분류, 요약, 질의 응답 등 3가지 유형의 Instruction Tuning Data 가공 구축
㈜에프아이솔루션 - 행정법 LLM 사전학습 및 Instruction Tuning 데이터
공공데이터포털
행정법 법령, 판결문, 결정례, 해석례 내용을 활용하여 법률서비스 향상을 위한 질의응답와 텍스트 요약 태스크의 Instruction Tuning 데이터
㈜에프아이솔루션 - 형사법 LLM 사전학습 및 Instruction Tuning 데이터
공공데이터포털
형사법 법령, 판결문, 결정례, 해석례 내용을 활용하여 법률서비스 향상을 위한 질의응답와 텍스트 요약 태스크의 Instruction Tuning 데이터
㈜워트인텔리전스 - 민사법 LLM 사전학습 및 Instruction Tuning 데이터
공공데이터포털
사법분야 초거대 AI 학습을 위해 민사법의 법령, 판결문, 심결례 및 유권해석 원시데이터로부터 각 분야의 문장을 추출/가공하여 질의/응답 및 요약을 위한 초거대 AI 학습용 Instruction tuning data를 구축함
㈜워트인텔리전스 - 지식재산권법 LLM 사전학습 및 Instruction Tuning 데이터
공공데이터포털
사법분야 초거대 AI 학습을 위해 지식재산권법의 법령, 판결문, 심결례, 심결문 및 유권해석 원시데이터로부터 각 분야의 문장을 추출/가공하여 질의/응답 및 요약을 위한 초거대 AI 학습용 Instruction tuning data를 구축함
주식회사 테스트웍스 - AI 교관 데이터
공공데이터포털
군사 교범/교수안/CBT를 기반으로 구축한 교육자료 데이터 50,000건 이상 및 질의응답 데이터 12,000건 이상의 텍스트데이터와 해군의 문어/답어로 구축한 100시간 이상(100,000건 이상)의 음성데이터로 구성
㈜윤즈정보개발 - 법률/규정 텍스트 분석 데이터 (고도화)- 상황에 따른 판례 데이터
공공데이터포털
- 학계와 산업계의 법률 자연어처리 및 인공지능 연구와 기술 개발에 필요한 60,000건 이상의 판례 데이터를 라벨링한 학습용 데이터를 구축 - 인공지능 학습에서 판례 데이터의 비율 분포를 실제 비율과 유사하도록 고른 비율로 수집하고 카테고리별 2,000건 이상이 되도록 데이터를 구성 - 활용도가 높은 판례 데이터를 수집하고 판례의 주요 내용을 추출요약하고, 질의응답 셋을 작성, 용어 정보(키워드)를 라벨링하여 인공지능 학습에 도움이 되는 데이터를 구축
㈜타임게이트 - 민간분야 고객 상담 데이터
공공데이터포털
민간분야 5개 클래스(교통/차량, 금융, 보험, 생활/패션, 의료/보건) 3,300시간 고객 상담 음성 데이터 수집 및 감정·의도 태깅 및 요약문 등으로 이루어진 학습데이터 구축 ※ 의료/보건 클래스의 경우, 개인정보/민감정보 보호를 위해 시나리오 기반 음성데이터 수집
국가평생교육진흥원 학점은행제정보시스템 교육훈련기관 관리 기관별 교강사별 학습과목
공공데이터포털
학점은행제 교육훈련기관별 교강사별 학습과목에 대한 데이터로 학습과정명, 교강사구분, 구분, 차수 등의 항목을 제공합니다. 정보공개법 제9조제1항제6호에 의거 부분공개
㈜아키아카 - 법률/규정 (판결서, 약관 등) 텍스트 분석 데이터
공공데이터포털
1만 건 이상의 판결문을 대상으로 기초사실, 주장 등을 가공한 데이터와 판례 내용을 기반으로 판결문 분석 데이터 구축, 1만 건 이상의 약관의 유·불리 조항 판단. 위법성과 유리 판단 이유 태깅 및 라벨링을 통해 소비자 입장에서의 유·불리 확인을 위한 법률 텍스트 분석 데이터셋 구축
목록