데이터셋 상세
라이프로그 빅데이터 플랫폼
한림대학교산학협력단 - 경도인지장애코호트 유전체검사데이터(2022년)
경도인지장애 환자들의 혈액 샘플을 이용해 Whole Genome Sequencing, 특정 질병발생과 관련하여 유전적 질병의 위험도를 분석한 데이터(ex: 특정 암에 걸릴 확률)
데이터 정보
연관 데이터
고려대학교 산학협력단 - 후두질환 판독을 위한 후두 내시경 데이터
공공데이터포털
후두암의 조기진단이 가능한 인공지능 모델을 위한 인공지능 데이터셋을 구축하기 위한 후두내시경 데이터
아주대학교 산학협력단 - 악성 림프종 예후 예측 융합 데이터
공공데이터포털
악성 림프종의 예후 예측 인공 지능 모델 개발에 활용할수 있는 2천명의 악성 림프종 환자 융합 데이터 (CT,PET,임상 지표/조직병리/치료 데이터)
아주대학교 산학협력단 - 폐암 예후 예측 융합 데이터
공공데이터포털
폐암의 예후 예측 인공 지능 모델 개발에 활용할수 있는 1만명의 폐암 환자 융합 데이터 (CT, 디지털 병리 영상,임상 지표/조직병리/치료 데이터)
국립암센터 대장암 라이브러리 분자병리 NRASMUTATION 검사결과
공공데이터포털
국립암센터 대장암 분자병리 NRAS MUTATION 종류 데이터로 인증키, 페이지수, 결과코드, 기준년도, 목록리스트 등의 항목을 제공합니다. 국립암센터 대장암 분자병리 NRAS MUTATION 종류 공공데이터는 아래의 URL을 통해서도 신청 및 사용하실 수 있습니다. https://www.bigdata-cancer.kr/ncc/viewOpenApiDetail.do?datasetIdentifier=15240
Challenging Medically-Relevant Genes Benchmark Set
공공데이터포털
CMRG v1.00 of a small variant benchmark and structural variant benchmark focused on 273 challenging medically relevant genes for the Genome in a Bottle (GIAB) sample HG002 (aka Ashkenazi son). These benchmarks were generated from a trio-based hifiasm v0.11 (https://doi.org/10.1038/s41592-020-01056-5) diploid assembly of HG002 using PacBio HiFi reads for HG002 for assembly and partitioning into phased haplotypes using Illumina reads for the parents, HG003 and HG004. This benchmark contains vcfs for small and structural variants along with corresponding benchmark bed files indicating regions that are homozygous reference if they do not have a variant in the vcf. We extensively curated the variant calls, excluding any found to be questionable or errors. This benchmark helps measure performance in important challenging regions, including challenging segmental duplications, regions with complex variants, regions with structural variants, and regions affected by false duplications in GRCh37 or GRCh38. This benchmark is described in https://doi.org/10.1101/2021.06.07.444885.
Challenging Medically-Relevant Genes Benchmark Set
공공데이터포털
CMRG v1.00 of a small variant benchmark and structural variant benchmark focused on 273 challenging medically relevant genes for the Genome in a Bottle (GIAB) sample HG002 (aka Ashkenazi son). These benchmarks were generated from a trio-based hifiasm v0.11 (https://doi.org/10.1038/s41592-020-01056-5) diploid assembly of HG002 using PacBio HiFi reads for HG002 for assembly and partitioning into phased haplotypes using Illumina reads for the parents, HG003 and HG004. This benchmark contains vcfs for small and structural variants along with corresponding benchmark bed files indicating regions that are homozygous reference if they do not have a variant in the vcf. We extensively curated the variant calls, excluding any found to be questionable or errors. This benchmark helps measure performance in important challenging regions, including challenging segmental duplications, regions with complex variants, regions with structural variants, and regions affected by false duplications in GRCh37 or GRCh38. This benchmark is described in https://doi.org/10.1101/2021.06.07.444885.
국립암센터 대장암 라이브러리 분자병리 MSI 검사결과코드
공공데이터포털
국립암센터 대장암 분자병리 MSI 여부 데이터로 인증키, 페이지수, 결과코드, 기준년도, 목록리스트 등의 항목을 제공합니다. 국립암센터 대장암 분자병리 MSI 여부 공공데이터는 아래의 URL을 통해서도 신청 및 사용하실 수 있습니다. URL : http://bigdata-cancer.kr/ncc/viewOpenApiDetail.do?datasetIdentifier=15220
국립암센터 간암 라이브러리 진단검사 종류별
공공데이터포털
국립암센터 간암 진단검사 종류 데이터로 인증키, 페이지수, 결과코드, 기준년도, 목록리스트 등의 항목을 제공합니다. 국립암센터 간암 진단검사 종류 공공데이터는 아래의 URL을 통해서도 신청 및 사용하실 수 있습니다. URL : https://www.bigdata-cancer.kr/ncc/viewOpenApiDetail.do?datasetIdentifier=18140
보건복지부 암 발생자수
공공데이터포털
보건복지부에서 제공하는 암 발생자수 자료로 2017년~2020년까지의 암종별 발생자수 데이터를 제공하고 있습니다.