데이터셋 상세
공공데이터포털
한국전자통신연구원 엑소브레인 QA Datasets 목록
한국어 분석 및 질의응답 기술을 개발하고 있는 엑소브레인 과제를 수행하면서 구축한 언어처리 학습데이터(엑소브레인 QA Datasets) 목록입니다. 다양한 지식산업 환경에서 전문가 수준의 질의응답 서비스를 제공하고자 하며, 언어처리 학습데이터를 공개하여 유사분야 연구애 도움이 되고자 합니다. 컬럼명: 데이터셋명, 데이터 크기, 단위, 데이터 포맷, 내용
데이터 정보
연관 데이터
한국전자통신연구원 위키백과 QA API
공공데이터포털
사용자의 자연어 질문을 분석하여 질문의 의도를 이해하고, 주어진 단락 및 위키백과 문서와 법령문서로부터 정답을 찾아서 제공하는 기술입니다.
한국산업인력공단 실기시험 지참물 정보
공공데이터포털
한국산업인력공단 국가자격 정보 시스템 에 등록되어 있는 종목별 실기시험 지참물 정보로 지참물, 규격, 표준, 단위 등의 항목을 제공합니다.
한국산업인력공단 Q-net 컨텐츠 관련 정보
공공데이터포털
국가 기술자격 정보 시스템에 등록되어 있는 Q-Net 컨텐츠 관련 정보를 제공한다.
한국외국어대학교 - 발화유형(문어, 구어, 채팅)별 기계번역 병렬 말뭉치
공공데이터포털
- 한국어 계열 기계번역의 언어별 성능, 어투, 도메인 등, 다양한 요소를 평가할 수 있도록 벤치마크 데이터셋 구축
㈜와이즈넛 - 요약문 및 레포트 생성 데이터
공공데이터포털
다양한 한국어 원문 데이터로부터 정제된 추출 및 생성 요약문을 도출하고 검증한 한국어 문서요약 AI 데이터셋으로, 추출요약을 포함하여 본문에서 중요한 문장을 하나의 새로운 요약문으로 창조하는 생성요약(Abstractive Summarization)을 위한 데이터 세트를 구축하고 이를 실제 모델에 학습
한국인터넷진흥원 분쟁조정처리 관련 질의응답 정보
공공데이터포털
한국인터넷진흥원에서 운영중인 분쟁조정처리시스템의 Q&A 정보 데이터로, 주제 일련번호, 질문 일련번호, 유형, 내용, 답변내용1, 답변내용2 항목을 포함하고 있습니다.
한국동서발전(주) 전자결재 QNA 및 FAQ 현황
공공데이터포털
한국동서발전의 전자결재 QNA 및 FAQ 현황 데이터는 기관 내부에서 전자결재 시스템과 관련된 주요 질문과 답변, 그리고 자주 묻는 사항을 체계적으로 정리한 자료입니다. 데이터 항목에는 순서, 제목, 구분, 조회수, 생성일이 포함되어 있어 어떤 주제가 가장 많이 다루어졌는지, 구성원들이 주로 어떤 부분에서 어려움을 겪는지, 그리고 활용 빈도가 높은 항목은 무엇인지 파악할 수 있습니다. 일반 국민은 이 데이터를 통해 공기업의 전자 행정 시스템 운영 방식과 투명성을 이해할 수 있으며, 전자결재 시스템이 공공 행정 효율성을 높이는 사례로 참고할 수 있습니다.
㈜나라지식정보 - 일반상식 문장 생성 데이터
공공데이터포털
■ 문장을 자동으로 생성하고 상황에 맞는 대답을 할 수 있는 지능형 어플리케이션 개발을 위한 문장 생성 학습용 데이터셋 ■ ‘한국어 일반 상식 문장 데이터 구축’ 과제 중 15-1 데이터(일반상식 문장 교정 데이터)에서 추출한 개념 정보(동사·명사, 체언, 용언)를 재구성하여 일반 상식에 부합하는 자연스러운 한국어 문장을 생성한 텍스트 데이터셋
솔트룩스이노베이션 - 다국어 구어체 번역 병렬 말뭉치 데이터
공공데이터포털
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공
솔트룩스이노베이션 - 일상생활 및 구어체 한-중, 한-일 번역 병렬 말뭉치 데이터
공공데이터포털
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공