Học sâu và ứng dụng phương pháp học sâu có đảm bảo tính riêng tư?

17:00 | 18/12/2023 | GP ATM

Ngày nay, Trí tuệ nhân tạo (AI) hiện diện trong mọi lĩnh vực của đời sống con người, từ kinh tế, giáo dục, y khoa cho đến những công việc nhà, giải trí hay thậm chí là trong quân sự. Học máy là một ứng dụng của trí tuệ nhân tạo cung cấp cho các hệ thống khả năng tự động học hỏi và cải thiện từ kinh nghiệm mà không cần lập trình rõ ràng. Học máy tập trung vào việc phát triển các chương trình máy tính có thể truy cập dữ liệu và sử dụng nó để tự học. Do đó, vấn đề đảm bảo tính riêng tư trong ứng dụng phương pháp học sâu đang là một vấn đề được quan tâm hiện nay.

Lý thuyết về học sâu

Những năm gần đây, khi khả năng tính toán của các máy tính được nâng lên một tầm cao mới với lượng dữ liệu khổng lồ được thu thập thì học máy đã tiến thêm một bước dài, đẫn đến việc ra đời một lĩnh vực mới được gọi là học sâu.

Học sâu là một nhánh của ngành học máy dựa trên một tập hợp các thuật toán để cố gắng mô hình hóa dữ liệu trừu tượng ở mức cao, bằng cách sử dụng nhiều lớp xử lý với cấu trúc phức tạp, hoặc bằng cách khác bao gồm nhiều biến đổi phi tuyến, được lấy cảm hứng từ cấu trúc và chức năng của bộ não được gọi là mạng thần kinh nhân tạo.

Một mạng thần kinh nhân tạo bao gồm ba lớp chính, đó là: lớp đầu vào, lớp ẩn và lớp đầu ra với một số mô hình học sâu (Mạng nơ ron tích chập (Convolutional Neural Network - CNN) và Mạng nơ ron hồi quy (Recurrent Neural Network - RNN)).

Đảm bảo tính riêng tư cho học sâu

Bài toán bảo vệ tính riêng tư cho học máy đã được nghiên cứu rộng rãi bởi cộng đồng khai thác dữ liệu trong những năm gần đây. Để đảm bảo tính riêng tư cho học máy nói chung và cho mô hình học sâu phân tán nói riêng có thể thực hiện theo các phương pháp khác nhau, mỗi phương pháp sẽ có những ưu, nhược điểm riêng của nó.

Tuy nhiên, các phương pháp này luôn tồn tại một sự đánh đổi cố hữu giữa tính đúng đắn của tính toán, tính riêng tư của những dữ liệu nhạy cảm và tính hiệu quả của giải pháp. Việc lựa chọn phương pháp nào phù hợp sẽ phụ thuộc vào mục tiêu của bài toán cần xử lý. Các giải pháp học máy đảm bảo tính riêng tư dựa trên tính toán bảo mật nhiều thành viên thường đảm bảo được độ chính xác và bảo vệ được các thông tin riêng tư, nhạy cảm trong dữ liệu của mỗi người dùng [1].

Tính toán bảo mật nhiều thành viên

Tính toán bảo mật (Sercure Computation - SC), tính toán nhiều bên (Multi-party Computation - MPC) hay tính toán bảo mật nhiều thành viên (Secure Multi-party Computation - SMC) là một lĩnh vực của mật mã với mục tiêu tạo ra các phương thức cho phép các bên cùng tính toán một hàm dựa trên các giá trị đầu vào của họ mà vẫn đảm bảo tính riêng tư của những giá trị đầu vào này.

Để thực hiện giao thức SMC chỉ cần mỗi bên tham gia có một máy tính đáng tin cậy để chạy phần giao thức của mình và cách (có thể không an toàn) để giao tiếp với các bên tham gia khác. Giao thức bao gồm một loạt các thông điệp được trao đổi giữa những bên tham gia và cuối cùng mỗi bên tham gia tìm hiểu đầu ra của giao thức. Bản thân giao thức là công khai, cho phép mỗi bên tham gia xác minh độc lập rằng phần mềm chạy trên máy của chính họ là hợp lệ [1].

Các giao thức tính toán bảo mật nhiều thành viên cho độ an toàn cao và đảm bảo được mức độ riêng tư mạnh. Tuy nhiên, những vấn đề về hiệu năng đang cản trở sự phát triển của các giao thức này.

Để làm rõ độ an toàn và mức độ đảm bảo riêng tư mạnh của phương pháp này, tác giả trình bày một giao thức học sâu có đảm bảo tính riêng tư hiệu quả dựa trên phương pháp tính toán bảo mật nhiều thành viên dựa trên giao thức tính tổng bảo mật cho bài toán an toàn thông tin phát hiện thư rác và tiến hành thử nghiệm.

Giao thức học sâu có đảm bảo tính riêng tư hiệu quả dựa trên tính toán bảo mật nhiều thành viên

Trong mô hình huấn luyện mạng học sâu phân tán, cần định nghĩa bài toán đảm bảo tính riêng tư cho mô hình này.

Có 𝑁 bên 𝒫 = {𝑃1, 𝑃2, . . . , 𝑃𝑁} tham gia huấn luyện mô hình, trong đó mỗi bên sở hữu một bộ dữ liệu huấn luyện riêng tư tương ứng 𝐷1, 𝐷2, . . ., 𝐷𝑁. Các bên này muốn kết hợp để thực hiện việc huấn luyện một mô hình chung tổng quát mà không tiết lộ các thông tin cục bộ của mình bao gồm:

Các thuộc tính của dữ liệu đầu vào;
Nhãn dữ liệu đầu ra hoặc phản hồi của mô hình với dữ liệu;
Kiến trúc chi tiết của mô hình bao gồm: kiến trúc mạng, tham số, các hàm mất mát;
Thông tin định danh về đóng góp của một bên dữ liệu đối với một bản ghi cụ thể.

Để làm được điều này, các bên cần xây dựng và thực thi một giao thức an toàn 𝜋. Trong bài toán đặt ra, tác giả trình bày giao thức huấn luyện mạng học sâu phân tán sử dụng giao thức tính tổng bảo mật an toàn.

Quý độc giả vui lòng đọc toàn văn bài báo tại đây.

Tài liệu tham khảo

[1] Adi Shamir, Ronald L Rivest, and Leonard M Adleman. Mental poker. In The mathematical gardner, pages 37–43. Springer, 1981.

[2] Yann LeCun and Corinna Cortes. MNIST handwritten digit database. 2010.

[3] Tiago A Almeida, José María G Hidalgo, and Akebo Yamakami. Contributions to the study of sms spam filtering: new collection and results. In Proceedings of the 11th ACM symposium on Document engineering, pages 259–262, 2011.

[4] Yann LeCun, Léon Bottou, Yoshua Bengio, and Patrick Haffner. Gradient-based learning applied to document recognition. Proceedings of the IEEE,

86(11):2278–2324, 1998.

[5] Sepp Hochreiter and J¨urgen Schmidhuber. Long short-term memory. Neural computation, 9(8):1735–1780, 1997.

[6] Andreas Stein and Edlyn Teske. Optimized baby step-giant step methods. J. Ramanujan Math. Soc, 20(1):1–32, 2005.

Nguyễn Thị Hồng Hà, Học viện Kỹ thuật mật mã

Học sâu và ứng dụng phương pháp học sâu có đảm bảo tính riêng tư?

Lý thuyết về học sâu

Đảm bảo tính riêng tư cho học sâu

Giao thức học sâu có đảm bảo tính riêng tư hiệu quả dựa trên tính toán bảo mật nhiều thành viên

Tin cùng chuyên mục

Trí tuệ nhân tạo giúp phát hiện lỗ hổng bảo mật tồn tại hơn 20 năm

Bẫy lừa đảo an sinh xã hội: Nhận diện và phòng tránh
10:00|30/10/2024

Sự phù hợp của Tetra trong hệ thống liên lạc vô tuyến di động số chuyên dùng
09:00|17/09/2024

Tội phạm mạng đã chuẩn bị sẵn sàng để nhắm đến Thế vận hội Paris 2024
09:00|25/07/2024

Giải pháp chống can thiệp vật lý trái phép thiết bị bảo mật
10:00|05/02/2024

Tin mới

Nguy cơ rò rỉ dữ liệu lưu trữ từ máy in
17:00|14/01/2025

Nghiên cứu giải pháp nâng cao khả năng phòng chống mã độc cho các sản phẩm, ứng dụng công nghệ thông tin trong cơ quan Đảng, Chính phủ
15:00|10/01/2025

Giải pháp ứng dụng công nghệ thiết kế lõi trên nền tảng FPGA phát triển thiết bị cổng truyền dữ liệu một chiều
09:00|06/01/2025

Ransomware: Phòng ngừa và giảm thiểu (Phần 2)
17:00|03/01/2025

Vai trò của các chứng chỉ SSL trong bảo mật website
08:00|02/01/2025

Áp dụng công nghệ nhận diện khuôn mặt để giám sát trẻ em sử dụng mạng xã hội
09:00|30/12/2024

6 lựa chọn phần mềm mã hóa tốt nhất năm 2024
15:00|26/12/2024

Nhận diện văn bản tiếng Việt dựa trên mô hình Transformer
12:00|23/12/2024

Công nghệ 5G: Nền tảng cho tương lai kết nối toàn cầu (Phần 2)
16:00|18/12/2024

Công nghệ 5G: Nền tảng cho tương lai kết nối toàn cầu (Phần 1)
10:00|16/12/2024

Cảnh giác với thủ đoạn lừa đảo qua PayPal khi mua sắm dịp cuối năm
08:00|12/12/2024

Thực trạng nguồn nhân lực an toàn thông tin chất lượng cao trong bối cảnh hiện nay (phần 2)
16:00|06/12/2024

Thực trạng nguồn nhân lực an toàn thông tin chất lượng cao trong bối cảnh hiện nay (phần 1)
16:00|06/12/2024

Phát hiện phần mềm độc hại SpyLoan Android trên Google Play với hơn 8 triệu lượt cài đặt
14:00|06/12/2024

Trí tuệ nhân tạo giúp phát hiện lỗ hổng bảo mật tồn tại hơn 20 năm
13:00|02/12/2024

Học sâu và ứng dụng phương pháp học sâu có đảm bảo tính riêng tư?

Lý thuyết về học sâu

Đảm bảo tính riêng tư cho học sâu

Giao thức học sâu có đảm bảo tính riêng tư hiệu quả dựa trên tính toán bảo mật nhiều thành viên

Tin cùng chuyên mục

Trí tuệ nhân tạo giúp phát hiện lỗ hổng bảo mật tồn tại hơn 20 năm

Bẫy lừa đảo an sinh xã hội: Nhận diện và phòng tránh 10:00|30/10/2024

Sự phù hợp của Tetra trong hệ thống liên lạc vô tuyến di động số chuyên dùng 09:00|17/09/2024

Tội phạm mạng đã chuẩn bị sẵn sàng để nhắm đến Thế vận hội Paris 2024 09:00|25/07/2024

Giải pháp chống can thiệp vật lý trái phép thiết bị bảo mật 10:00|05/02/2024

Tin mới

Nguy cơ rò rỉ dữ liệu lưu trữ từ máy in 17:00|14/01/2025

Nghiên cứu giải pháp nâng cao khả năng phòng chống mã độc cho các sản phẩm, ứng dụng công nghệ thông tin trong cơ quan Đảng, Chính phủ 15:00|10/01/2025

Giải pháp ứng dụng công nghệ thiết kế lõi trên nền tảng FPGA phát triển thiết bị cổng truyền dữ liệu một chiều 09:00|06/01/2025

Ransomware: Phòng ngừa và giảm thiểu (Phần 2) 17:00|03/01/2025

Vai trò của các chứng chỉ SSL trong bảo mật website 08:00|02/01/2025

Áp dụng công nghệ nhận diện khuôn mặt để giám sát trẻ em sử dụng mạng xã hội 09:00|30/12/2024

6 lựa chọn phần mềm mã hóa tốt nhất năm 2024 15:00|26/12/2024

Nhận diện văn bản tiếng Việt dựa trên mô hình Transformer 12:00|23/12/2024

Công nghệ 5G: Nền tảng cho tương lai kết nối toàn cầu (Phần 2) 16:00|18/12/2024

Công nghệ 5G: Nền tảng cho tương lai kết nối toàn cầu (Phần 1) 10:00|16/12/2024

Cảnh giác với thủ đoạn lừa đảo qua PayPal khi mua sắm dịp cuối năm 08:00|12/12/2024

Thực trạng nguồn nhân lực an toàn thông tin chất lượng cao trong bối cảnh hiện nay (phần 2) 16:00|06/12/2024

Thực trạng nguồn nhân lực an toàn thông tin chất lượng cao trong bối cảnh hiện nay (phần 1) 16:00|06/12/2024

Phát hiện phần mềm độc hại SpyLoan Android trên Google Play với hơn 8 triệu lượt cài đặt 14:00|06/12/2024

Trí tuệ nhân tạo giúp phát hiện lỗ hổng bảo mật tồn tại hơn 20 năm 13:00|02/12/2024

Bẫy lừa đảo an sinh xã hội: Nhận diện và phòng tránh
10:00|30/10/2024

Sự phù hợp của Tetra trong hệ thống liên lạc vô tuyến di động số chuyên dùng
09:00|17/09/2024

Tội phạm mạng đã chuẩn bị sẵn sàng để nhắm đến Thế vận hội Paris 2024
09:00|25/07/2024

Giải pháp chống can thiệp vật lý trái phép thiết bị bảo mật
10:00|05/02/2024

Nguy cơ rò rỉ dữ liệu lưu trữ từ máy in
17:00|14/01/2025

Nghiên cứu giải pháp nâng cao khả năng phòng chống mã độc cho các sản phẩm, ứng dụng công nghệ thông tin trong cơ quan Đảng, Chính phủ
15:00|10/01/2025

Giải pháp ứng dụng công nghệ thiết kế lõi trên nền tảng FPGA phát triển thiết bị cổng truyền dữ liệu một chiều
09:00|06/01/2025

Ransomware: Phòng ngừa và giảm thiểu (Phần 2)
17:00|03/01/2025

Vai trò của các chứng chỉ SSL trong bảo mật website
08:00|02/01/2025

Áp dụng công nghệ nhận diện khuôn mặt để giám sát trẻ em sử dụng mạng xã hội
09:00|30/12/2024

6 lựa chọn phần mềm mã hóa tốt nhất năm 2024
15:00|26/12/2024

Nhận diện văn bản tiếng Việt dựa trên mô hình Transformer
12:00|23/12/2024

Công nghệ 5G: Nền tảng cho tương lai kết nối toàn cầu (Phần 2)
16:00|18/12/2024

Công nghệ 5G: Nền tảng cho tương lai kết nối toàn cầu (Phần 1)
10:00|16/12/2024

Cảnh giác với thủ đoạn lừa đảo qua PayPal khi mua sắm dịp cuối năm
08:00|12/12/2024

Thực trạng nguồn nhân lực an toàn thông tin chất lượng cao trong bối cảnh hiện nay (phần 2)
16:00|06/12/2024

Thực trạng nguồn nhân lực an toàn thông tin chất lượng cao trong bối cảnh hiện nay (phần 1)
16:00|06/12/2024

Phát hiện phần mềm độc hại SpyLoan Android trên Google Play với hơn 8 triệu lượt cài đặt
14:00|06/12/2024

Trí tuệ nhân tạo giúp phát hiện lỗ hổng bảo mật tồn tại hơn 20 năm
13:00|02/12/2024