데이터셋 상세
미국
UMLS
Ontology for use in Phenotyping Natural Language Processing (NLP)
데이터 정보
연관 데이터
LOINC
공공데이터포털
Ontology for use in Phenotyping Natural Language Processing (NLP)
ICD-10
공공데이터포털
Ontology for use in Phenotyping Natural Language Processing (NLP)
MESH
공공데이터포털
Ontology for use in Phenotyping Natural Language Processing (NLP)
LOINC
공공데이터포털
Logical Observation Identifiers Names and Codes (LOINC) is a database and universal standard for identifying medical laboratory observations. This data is being used as an Ontology for use in Phenotyping Natural Language Processing (NLP)
한국전자통신연구원 한국어 언어분석 통합 말뭉치
공공데이터포털
엑소브레인 과제를 수행하면서 구축한 언어처리 학습데이터로 언어분석 6개 기술(형태소분석, 다의어 어휘의미분석, 세분류 개체명인식, 의존구문분석, 의미역인식, 상호참조해결)의 태깅 가이드라인과 자연어 질의응답을 위한 질문/정답 포맷의 뉴스기사 대상 태깅 말뭉치이 포함되어 있습니다.
국립국어원 - 구문 분석 말뭉치
공공데이터포털
(버전 2.0) 문장의 구문 구조를 분석해 의존 관계 표지를 부착한 말뭉치입니다.
MetaMap
공공데이터포털
MetaMap is a highly configurable application developed by the Lister Hill National Center for Biomedical Communications at the National Library of Medicine (NLM) to map biomedical text to the UMLS Metathesaurus or, equivalently, to identify Metathesaurus concepts referred to in English text. MetaMap employs a knowledge-intensive approach, natural-language processing (NLP), and computational-linguistic techniques, and is used worldwide in industry and academia. At NLM, MetaMap is one of the foundations of NLM's Medical Text Indexer (MTI), which is applied to both semiautomatic and fully automatic indexing of biomedical literature. Technical documentation at http://metamap.nlm.nih.gov/#Downloads
솔트룩스이노베이션 - 다국어 구어체 번역 병렬 말뭉치 데이터
공공데이터포털
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공