Thu thập thông tin tình báo từ các nguồn mở trong cuộc cách mạng công nghiệp 4.0
Vụ Quốc phòng Hoa Kỳ (The U.S. Department of Defense - DoD) định nghĩa: OSINT là tin tức được tổng hợp từ các thông tin được công bố rộng rãi và được thu thập, khai thác, thông báo kịp thời cho đối tượng thích hợp nhằm mục đích giải quyết một yêu cầu tình báo cụ thể. Nguồn OSINT được phân biệt với các nguồn thông tin khác bởi tính hợp pháp và công khai, không vi phạm bất cứ luật bản quyền và quyền riêng tư nào. Sự khác biệt này làm cho phạm vi thu thập của OSINT là rất lớn, không chỉ trong lĩnh vực tình báo, quốc phòng an ninh, mà còn được sử dụng trong các lĩnh vực khác như chính trị, tài chính, kinh tế, xã hội… [1]
Các loại nguồn thông tin OSINT
Các nguồn thông tin OSINT được phân chia thành 4 loại, cụ thể [2]:
- Dữ liệu nguồn mở (Open Source Data - OSD) là dữ liệu có nguồn gốc từ một nguồn xác định, như: hình ảnh vệ tinh, dữ liệu cuộc gọi điện thoại, siêu dữ liệu, tập hợp dữ liệu, số liệu khảo sát, hình ảnh, file ghi âm hoặc video được ghi lại từ một sự kiện đã xảy ra.
- Thông tin nguồn mở (Open Source Information - OSINF) là dữ liệu đã được lọc sơ bộ để đáp ứng một tiêu chí hay nhu cầu cụ thể. Dữ liệu này cũng có thể được gọi là một nguồn thứ cấp. Ví dụ: cuốn sách về một chủ đề cụ thể, các bài báo, luận văn, tác phẩm nghệ thuật hay các cuộc phỏng vấn.
- Trí thông minh nguồn mở bao gồm tất cả các thông tin đã được phát hiện, lọc và chỉ định để đáp ứng một nhu cầu hay mục đích cụ thể. Những thông tin này có thể được sử dụng trực tiếp trong bất kỳ bối cảnh nào.
- Trí thông minh nguồn mở được xác nhận (Validated OSINT - OSINT-V) là thông tin OSINT được xác nhận. Các dữ liệu cần được xác nhận sử dụng từ một nguồn non-OSINT hoặc từ một nguồn OSINT có uy tín. Đây là điều cần thiết, bởi đối thủ có thể lan truyền thông tin không chính xác làm cho việc phân tích thông tin OSINT bị sai lệch.
Một số dạng thông tin OSINT
Thông tin OSINT bao gồm tất cả các nguồn thông tin được tiếp cận công khai. Những thông tin này có thể được thu thập một cách trực tuyến hoặc ngoại tuyến, bao gồm một số loại thông tin sau [3]:
Hình 1. Một số dạng thông tin OSINT (theo ict.org.il)
- Các bản ghi cơ sở dữ liệu công khai;
- Các trang web, tài liệu, báo cáo của chính phủ;
- Các thông tin trên các phương tiện thông tin đại chúng;
- Các thông tin trên mạng xã hội;
- Các hình ảnh và bản đồ thương mại;
- Các hình ảnh và video;
- Các trang web đen;
- Các thông tin khác trên Internet.
Ưu điểm của công tác thu thập thông tin OSINT
Trong kỷ nguyên công nghệ hiện nay, không ai có thể chối cãi vai trò của thông tin OSINT trong các lĩnh vực khác nhau. Dưới đây là một số ưu điểm của công tác thu thập thông tin OSINT:
- Ít rủi ro: Thu thập thông tin tình báo thông qua việc sử dụng các thông tin OSINT tồn tại ít rủi ro hơn so với các hình thức khác. Bởi để thu thập thông tin OSINT, người sử dụng chỉ cần có một máy tính có kết nối Internet cùng với các kỹ năng tìm kiếm nhất định. Việc thu thập này hoàn toàn công khai thông qua các nguồn thông tin mở, trong khi các đối tượng không hề biết về hoạt động thu thập của các cơ quan tình báo. Mặt khác, để thu thập thông tin tình báo bằng cách truyền thống như sử dụng gián điệp, nếu bất cẩn thì các đối tượng sẽ dễ bị phát hiện và đề phòng.
- Giảm thiểu chi phí: Thu thập thông tin OSINT nói chung là ít tốn kém so với các nguồn tin tình báo khác, như sử dụng các nguồn nhân lực hoặc gián điệp vệ tinh để thu thập dữ liệu là tốn kém. Các doanh nghiệp nhỏ với ngân sách tình báo hạn chế có thể khai thác nguồn thông tin OSINT với chi phí tối thiểu.
- Dễ tiếp cận: Nguồn thông tin OSINT luôn có sẵn, công khai và luôn được cập nhật. Nguồn thông tin OSINT có thể được các bên khác nhau sử dụng trong bất kỳ bối cảnh nào. Tất cả những gì chúng ta cần là những kỹ năng cần thiết, công cụ để thu thập, khai thác và phân tích thông tin OSINT đúng cách. Ví dụ, lực lượng quân đội có thể dự đoán các cuộc tấn công trong tương lai bởi các hoạt động phân tích trên các mạng xã hội. Trong khi các tập đoàn có thể sử dụng nó để xây dựng chiến lược mở rộng thị trường mới của họ.
- Vấn đề pháp lý: Nguồn thông tin OSINT có thể được chia sẻ giữa các bên khác nhau mà không lo lắng về việc vi phạm bất kỳ giấy phép bản quyền hoặc quyền riêng tư, vì nó đã được công bố công khai.
Nhược điểm của công tác thu thập thông tin OSINT
Tất cả các phương pháp thu thập thông tin tình báo đều có những hạn chế nhất định và phương pháp thu thập thông tin OSINT cũng không tránh khỏi đặc điểm chung này.
- Lượng dữ liệu khổng lồ: Thu thập thông tin OSINT sẽ tạo ra một lượng dữ liệu lớn và các dữ liệu này cũng cần được phân tích để có giá trị. Có rất nhiều chính phủ và các công ty lớn đã xây dựng và phát triển các hệ thống riêng của họ để thu thập, khai thác, phân tích dữ liệu thu thập được. Tuy nhiên, lượng dữ liệu khổng lồ vẫn là một thách thức đối với công tác này.
- Độ tin cậy của các nguồn thông tin: Cần phải đánh giá, phân loại các nguồn thông tin trước khi tin tưởng sử dụng các thông tin OSINT trong bất cứ hoàn cảnh nào. Bởi lẽ, nhiều tổ chức sẽ phát đi những thông tin không chính xác để đánh lừa quá trình thu thập OSINT.
- Con người: Đây là yếu tố có tính chất quyết định trong quá trình thu thập thông tin OSINT. Mặc dù đã có các hệ thống, công cụ thu thập, phân tích tự động nhưng con người vẫn cần phải xem xét kết quả của các hệ thống, công cụ đó; đánh giá các dữ liệu đã thu thập được có đáng tin cậy hoặc phù hợp hay không. Vì vậy, nếu trình độ chuyên môn của người thu thập thông tin OSINT không tốt thì sẽ dẫn đến những kết luận sai lệch, gây ra những hậu quả đáng tiếc trong hoạt động tình báo.
Một số công cụ phục vụ công tác thu thập thông tin OSINT
Một trong những công cụ tìm kiếm điển hình nhất là Google. Google cung cấp dịch vụ tìm kiếm thông tin miễn phí và tính năng tìm kiếm nâng cao (https://www.google.com/advanced_search).
Hình 2. Giao diện tìm kiếm nâng cao của Google
Bing
Bing (https://www.bing.com) là công cụ tìm kiếm phổ biến thứ hai sau Google. Công cụ này được phát triển bởi Microsoft và là công cụ tìm kiếm mặc định trong trình duyệt Internet Explorer và Edge. Bing có nhiều điểm tương đồng với tìm kiếm cơ bản của Google.
Shodan
Shodan (https://www. shodan.io) là công cụ tìm kiếm đầu tiên trên thế giới dành cho các thiết bị có kết nối Internet như máy chủ, webcam, máy in… Công cụ này do John Matherly - cử nhân sinh tin học (bioinformatics) tại Đại học California (Mỹ), phát triển và đưa vào sử dụng từ năm 2009. Shodan có khả năng thu thập thông tin từ hơn 500 triệu thiết bị và dịch vụ kết nối mỗi tháng.
Hình 3. Giao diện tìm kiếm nâng cao của Shodan
Internet Archive
Internet Archive (https://archive.org) là trang web lưu trữ phổ biến nhất hiện nay. Nó lưu trữ hơn 308 tỷ trang web theo thời gian và bất cứ ai có thể chụp một trang web trong thời điểm hiện tại và sử dụng nó trong tương lai như một đầu mối hoặc một cách tham chiếu.
Hình 4. Giao diện web công cụ Internet Archive
Kết luận
Bài viết đã trình bày tổng quan về thu thập thông tin tình báo từ các nguồn mở, cách phân loại, các dạng thông tin OSINT cũng như ưu, nhược điểm của phương pháp này. Không một phương pháp thu thập thông tin nào có thể cho kết quả chính xác 100%. Tuy nhiên, bằng phương pháp thu thập thông tin OSINT, nếu có kế hoạch, mục tiêu rõ ràng, cùng với nguồn lực và chuyên môn cao, thì phương pháp này sẽ đem lại kết quả tối ưu nhất trên quy mô lớn.
TÀI LIỆU THAM KHẢO [1] Nihad A.Hassan, Rami Hijazi, Open Source Intelligence Methods and Tools – A Practical Guide to Online Intelligence, Apress, 2018. [2] W.F. Kernan, General, U.S. Army, NATO Open Source Intelligence Handbook, 2001. [3] https://www.einvestigator.com/open-source-intelligence-tools/ |
ThS. Đào Ánh Hương