Chuyển đổi an ninh mạng với trí tuệ nhân tạo và học máy
Thời đại số - thời đại mà hệ sinh thái kỹ thuật số trở thành nền tảng quan trọng trong cuộc sống hàng ngày, đây cũng là thời đại gia tăng nhiều loại hình tấn công mạng. Với tốc độ gia tăng báo động và ngày càng tinh vi hơn, các cuộc tấn công nhắm vào thiết bị IoT, spam, lừa đảo, gian lận tiền điện tử, phát tán mã độc di động và mã độc tống tiền... tiếp tục gây thiệt về cả tiền bạc lẫn danh tiếng cho nhiều tổ chức/ doanh nghiệp.
Việc chống lại các loại hình tấn công mạng cũng được nhiều tổ chức, doanh nghiệp tập trung nghiên cứu, trong đó có việc ứng dụng trí tuệ nhân tạo (Artificial Intelligence - AI) và máy học (Machine Learning - ML). AI và ML ứng dụng hiệu quả trong việc phát hiện các mối đe dọa an ninh mạng và những sự bất thường một cách kịp thời. Một lợi thế lớn của ML là khả năng phân tích tập dữ liệu lớn, phát hiện sự bất thường và các mẫu đáng ngờ trong thời gian rất ngắn. Việc tự động cập nhật phần mềm hiện có dựa trên phân tích tinh vi của ML và AI hỗ trợ phòng chống các cuộc tấn công có quy mô.
Một ví dụ điển hình là việc những nhà cung cấp dịch vụ email lớn đang sử dụng kỹ thuật học sâu (Deep learning - DL) để ngăn chặn những bức ảnh bạo lực, quét bình luận, phát hiện lừa đảo, mã độc và thanh toán gian lận. Các nhà cung cấp cũng đang sử dụng những mô hình mạng nơron để phát hiện và phân loại các email lừa đảo và độc hại. Đặc biệt, ML là lựa chọn hữu hiệu trong phát hiện mã độc và phòng chống mã độc. Việc phát hiện mã độc hiện nay thường dựa trên kỹ thuật dấu hiệu (signature-based), chủ yếu xác định mã độc cụ thể và trích xuất dấu hiệu riêng biệt của mã độc đó. Trong khi đó, việc phát hiện mã độc dựa trên AI và ML tập trung vào những đặc điểm của mã độc hơn là một dấu hiệu cụ thể, giúp nắm bắt những thay đổi của mã độc một cách hiệu quả.
Bên cạnh đó, các tổ chức/ doanh nghiệp cũng cần đặc biệt tập trung vào việc phòng chống mất mát dữ liệu (Data loss prevention - DLP). Mất mát dữ liệu nhạy cảm là một vấn đề nghiêm trọng để lại nhiều hậu quả. Bằng việc phân loại dữ liệu dựa vào mức độ nhạy cảm, kiểm soát bảo mật được tiến hành dựa trên sự phân loại này. Một số nhà cung cấp dịch vụ đám mây lớn sử dụng ML và xử lý ngôn ngữ tự nhiên (Natural language processing - NLP) để tự động xác định thông tin nhạy cảm hay hành vi bất thường đối với dữ liệu. Những thuật toán ML khám phá, phân loại, giám sát và bảo vệ dữ liệu nhạy cảm, như thông tin nhận dạng cá nhân, thông tin sức khỏe, tài sản trí tuệ, dữ liệu pháp lý hoặc tài chính, mã nguồn,...
Nhiễm độc dữ liệu cũng một là thách thức và mối đe dọa đối với việc áp dụng ML. Tại đây, người dùng độc hại đưa dữ liệu đầu vào sai với mục đích làm nhầm lẫn thuật toán và hỏng mô hình luyện. Nhiễm độc dữ liệu có thể làm sai lệch hoạt động thuật toán ML và đưa ra kết quả sai lầm. Có nhiều phương pháp để phòng chống vấn đề nhiễm độc dữ liệu. Phát hiện và loại bỏ ngoại lai trong tập dữ liệu huấn luyện là một cách thức để xử lý tấn công nhiễm độc dữ liệu. Trong đó, các máy dò ngoại lai được huấn luyện độc lập và không bị ảnh hưởng bởi dữ liệu độc hại.
Nhiều công ty khởi nghiệp như Darktrace, SAP NS2, CrowdStrike, Vade Secure, Blue Hexagon,... đã tập trung vào việc giải quyết những vấn đề an ninh mạng bằng việc áp dụng AI và ML. Trong đó, nhiều công ty đang phát triển những nền tảng sử dụng học máy không giám sát để phân tích dữ liệu mạng có quy mô và thực hiện hàng tỷ phép tính xác suất dựa trên những bằng chứng sẵn có. Những nền tảng này thay vì dựa trên tri thức về những mối đe dọa trong quá khứ, thì chúng độc lập phân loại dữ liệu và phát hiện các sai lệch trong các mẫu và gắn cờ chú ý lên chúng. Hay một số công ty khởi nghiệp đang sử dụng cảm biến dữ liệu tại điểm cuối nhằm phân tích bằng AI. Trong khi đó, các công ty khác như Immuniweb, Cyware, Deep Instinct, Fortinet,... lại tập trung vào vấn đề bảo mật thiết bị di động và tìm kiếm giải pháp để phòng chống các cuộc tấn công web tự động.
Quang Minh
(Theo CISO.in)