데이터셋 상세
데이터안심구역
KAIST - 문서형악성코드 HWP 모델 데이터 셋
HWP악성코드 분석/분류를 위한 PDF내 존재하는 위협식별인자 [개요] ㅇ HWP악성코드 분석/분류를 위한 PDF내 존재하는 위협식별인자 [특징] ㅇ 입력 파일을 전처리하여 AI/기계학습 모델의 학습 데이터로 활용 가능 ㅇ 악성, 정상 구분 없이 외부 라이브러리 및 추가 작업으로 전처리 함수 생성 [활용 사례] ㅇ 연구/교육 데이터로 활용 ㅇ 악성HWP 탐지 및 분류를 위한 AI/기계학습 모델의 학습데이터에 활용
데이터 정보
연관 데이터
한국인터넷진흥원 악성코드 은닉사이트 탐지 동향 보고서
공공데이터포털
o 연구명 : 악성코드 은닉사이트 탐지 동향 보고서
한국인터넷진흥원 - 악성코드 탐지 학습 데이터셋
공공데이터포털
악성코드 탐지를 위한 학습 데이터셋입니다. 이 데이터셋은 malwares.com에 등재된 머신러닝을 위한 악성코드 바이너리 원본을 포함합니다. ● 암호 알고리즘 : AES-256 ● 패스워드 : Kisa@infecteD
한국인터넷진흥원 - 트로이목마 악성코드 데이터셋
공공데이터포털
PC환경에서 동작하는 트로이목마 악성코드 샘플이다. 이 데이터셋은 데이터가 수집된 날짜와 악성코드 바이너리의 해시값, 그리고 악성코드 바이너리 샘플 데이터를 포함한다. ● 암호 알고리즘 : AES-256 ● 패스워드 : Kisa@infecteD
한국인터넷진흥원 - 지능형 악성코드 데이터셋
공공데이터포털
지능형 악성코드 데이터셋입니다. 이 데이터셋은 정보보호 R&D 데이터 챌린지 대회의 '악성코드 탐지' 트랙에 활용된 지능형 악성코드 바이너리 원본을 포함합니다. ● 암호 알고리즘 : AES-256 ● 패스워드 : Kisa@infecteD
한국인터넷진흥원 - 웜바이러스 악성코드 데이터셋
공공데이터포털
PC환경에서 동작하는 웜바이러스 악성코드 샘플이다. 이 데이터셋은 데이터가 수집된 날짜와 악성코드 바이너리의 해시값, 그리고 악성코드 바이너리 샘플 데이터를 포함한다. ● 암호 알고리즘 : AES-256 ● 패스워드 : Kisa@infecteD
한국인터넷진흥원 - 루트킷 및 백도어 악성코드 데이터셋
공공데이터포털
PC환경에서 동작하는 루트킷 및 백도어 악성코드 샘플이다. 이 데이터셋은 데이터가 수집된 날짜와 악성코드 바이너리의 해시값, 그리고 악성코드 바이너리 샘플 데이터를 포함한다. ● 암호 알고리즘 : AES-256 ● 패스워드 : Kisa@infecteD
Trojan Detection Software Challenge - cyber-pdf-dec2022-train
공공데이터포털
Round 12 Train DatasetThis is the training data used to create and evaluate trojan detection software solutions. This data, generated at NIST, consists of pdf malware classification AIs trained Contaigio dataset feature vectors. A known percentage of these trained AI models have been poisoned with a known trigger which induces incorrect behavior. This data will be used to develop software solutions for detecting which trained AI models have been poisoned via embedded triggers. This dataset consists of 120 AI models using a small set of model architectures. Half (50%) of the models have been poisoned with an embedded trigger which causes misclassification of the input when the trigger is present.
Trojan Detection Software Challenge - cyber-pdf-dec2022-train
공공데이터포털
Round 12 Train DatasetThis is the training data used to create and evaluate trojan detection software solutions. This data, generated at NIST, consists of pdf malware classification AIs trained Contaigio dataset feature vectors. A known percentage of these trained AI models have been poisoned with a known trigger which induces incorrect behavior. This data will be used to develop software solutions for detecting which trained AI models have been poisoned via embedded triggers. This dataset consists of 120 AI models using a small set of model architectures. Half (50%) of the models have been poisoned with an embedded trigger which causes misclassification of the input when the trigger is present.
Trojan Detection Software Challenge - image-classification-jun2020-holdout
공공데이터포털
Round1 Holdout DatasetThe data being generated and disseminated is the holdout data used to evaluate trojan detection software solutions. This data, generated at NIST, consists of human level AIs trained to perform a variety of tasks (image classification, natural language processing, etc.). A known percentage of these trained AI models have been poisoned with a known trigger which induces incorrect behavior. This data will be used to develop software solutions for detecting which trained AI models have been poisoned via embedded triggers. This dataset consists of 1000 trained, human level, image classification AI models using the following architectures (Inception-v3, DenseNet-121, and ResNet50). The models were trained on synthetically created image data of non-real traffic signs superimposed on road background scenes. Half (50%) of the models have been poisoned with an embedded trigger which causes misclassification of the images when the trigger is present.
한국인터넷진흥원 - 랜섬웨어 바이너리 데이터셋
공공데이터포털
PC환경에서 동작하는 랜섬웨어 악성코드 샘플이다. 이 데이터셋은 데이터가 수집된 날짜와 악성코드 바이너리의 해시값, 그리고 악성코드 바이너리 샘플 데이터를 포함한다.● 암호 알고리즘 : AES-256 ● 패스워드 : Kisa@infecteD