로그인
데이터검색
데이터맵
공모전
이용안내
통합검색
데이터셋 검색
교육분야 포털 모음
데이터맵
공모전 안내
공모전 공지사항
공모전 참여하기
공모전 수상작
공지사항
통계이야기
자주묻는 질문
자료실
문의하기
데이터 검색
통합검색
데이터셋검색
교육분야 포털 모음
데이터맵
데이터맵
공모전
공모전 공지사항
공모전 참여하기
공모전 수상작
이용안내
공지사항
통계이야기
자주묻는 질문
자료실
문의하기
공모전 공지사항
공모전 수상작
홈
데이터검색
데이터셋 검색
데이터셋 상세
AI 허브
누리IDT - 고서 한자 인식 (OCR)
고서 한자 이미지를 인식하기 위한 이미지 데이터
데이터 정보
데이터 포털
AI 허브
META URL
https://www.aihub.or.kr/aihubdata/data/view.do?pageIndex=43&currMenu=115&topMenu=100&srchOptnCnd=OPTNCND001&srchDetailCnd=DETAILCND001&srchOrder=ORDER001&srchPagePer=20&aihubDataSe=data&dataSetSn=234
라이선스
cc-zero
비용
무료
제공기관
수행기관(주관) : 누리IDT
관리부서
데이터
랜딩 페이지
37. [고서 한자 인식 과제] 고서 한자 인식.pdf
133.고서 한자 인식(OCR)_데이터_구축_가이드라인.pdf
03.AI모델.zip
연관 데이터
쇼우테크 - 고서 한자 인식 OCR 데이터
공공데이터포털
현존 고문헌의 대부분을 차지하고 있는 조선시대 고서의 원문 한자를 AI 기반의 OCR 기술을 통해 디지털 텍스트로 자동 확보하기 위하여, 고서 원문 내의 각 낱자 한자들에 대한 바운딩박스와 라벨링(유니코드 한자) 정보로 구성된 JSON 파일과 해당 고서 원문이미지 파일의 쌍으로 구성된 한자 글자수 기준 1천만 자 규모의 고서 한자 인식(OCR) AI 학습용 데이터셋
쇼우테크 - 대용량 손글씨 OCR 데이터
공공데이터포털
산업 및 실생활에서 사용되는 각종 신청서등에 포함된 다양한 한글 손글씨를 AI 기반의 OCR 기술을 통해 디지털 텍스트로 자동 확보하기 위하여, 다양한 손글씨 원문을 수집하고 작성된 손글씨에 대한 바운딩박스와 라벨링 정보로 구성된 JSON 파일과 해당 손글씨 원문이미지 파일의 쌍으로 구성된 OCR AI 학습용 데이터셋
동양시스템즈 - 다양한 형태의 한글 문자 OCR
공공데이터포털
한글의 광학글자인식(OCR, Optical Character Recognition) 알고리즘 성능 개선을 위한 다양한 형태(테이블 내 텍스트, 숫자, 문장부호 등 포함)의 한글 글자체(인쇄체 + 손글씨) 데이터셋 구축
동양시스템즈 - 공공행정문서 OCR
공공데이터포털
공공 행정 문서에 특화된 문자 인식 AI 모델을 개발하기 위한 공공 행정 문서 이미지 데이터
국립국어원 - 개체명 분석 말뭉치 2022
공공데이터포털
(버전 1.1) 문장에 나타난 개체명의 경계를 표시하고 분석 표지를 부착한 말뭉치입니다.
국립국어원 - 개체명 사전 2022
공공데이터포털
(버전 1.0) 개체명 및 개체 연결 정보가 부착된 말뭉치에서 개체 표현, 개체 유형, 지식 베이스 연결 정보를 추출하여 구축한 자료입니다.
넥스인테크놀러지(舊 키니앤파트너스) - 한국어 글자체 이미지
공공데이터포털
현대 한글 11,172자를 사용한 폰트 50종의 글자체와 성별, 연령층 별로 직접 제작한 이미지 파일 구축 및 간판, 상표, 교통 표지판 등의 한글이 포함된 이미지 10만 장을 구축한 이미지 데이터 제공
㈜미니게이트 - 동화 삽화 생성 데이터
공공데이터포털
- 동화 구성 및 내용에 적절한 그림 삽화를 손쉽게 제공하기 위한 동화 이미지 (이미지 변환) 및 텍스트 데이터, 이미지 캡션 데이터
국립국어원 - 묵자-점자 병렬 말뭉치 2023
공공데이터포털
(버전 1.0) 한국어 문어 데이터(신문 기사, 온라인 게시 자료)에서 한글, 로마자, 숫자, 기호의 조합 조건을 만족하는 문장을 추출하고 점역, 교정하여 구축한 병렬 말뭉치입니다.
㈜딥브레인AI(舊머니브레인) - 딥페이크 변조 영상
공공데이터포털
신경망 기반의 변조 알고리즘을 통해 생성된 변조 영상(딥페이크)을 탐지·검출하는 AI 기술 개발을 위해 다양한 탐지 방해의 가능성을 고려하여 학습용 변조영상 데이터 구축
목록