Phát hiện mã độc dựa vào máy học và thông tin PE Header (Phần II)
MỘT SỐ MÔ HÌNH
Qua phân tích PE Header (trong Phần I), ta thu được hai tập đặc trưng dùng cho huấn luyện và thử nghiệm: Tập 1 có 55 đặc trưng (trong Phần I) và Tập 2 có 14 đặc trưng (Bảng 1, Phần I). Từ đây ta có thể áp dụng một số mô hình máy học để phân lớp như sau:
- Mô hình phân lớp theo xác xuất NB (Naive Bayes - NB);
- Mô hình Mạng nơ-ron nhân tạo ANN (Artificial Neural Network - ANN);
- Mô hình Cây quyết định DT (Decision Tree - DT);
- Mô hình Rừng ngẫu nhiên RF (Random Forest – RF).
Quý độc giả quan tâm mời xem chi tiết tại đây.
Trần Ngọc Anh (Bộ Tư lệnh 86), Võ Khương Lĩnh (Đại học Nguyễn Huệ)