Microsoft phát hành PyRIT - Công cụ xác định rủi ro dành cho các hệ thống AI tạo sinh

15:00 | 01/03/2024 | TIN TỨC SẢN PHẨM

Microsoft đã phát triển Python Risk Identification Tool (PyRIT) như một công cụ hỗ trợ quan trọng cho các đội ngũ Red Teaming trong việc đánh giá và phát hiện rủi ro trong hệ thống AI tạo sinh.

Ram Shankar Siva Kumar, trưởng nhóm Red Team AI tại Microsoft cho biết: “Công cụ này được thiết kế để cho phép mọi tổ chức trên toàn cầu có trách nhiệm hơn khi đổi mới trí tuệ nhân tạo.”

Công ty cho biết PyRIT có thể được sử dụng để đánh giá tính mạnh mẽ của các điểm cuối trong mô hình ngôn ngữ lớn (LLM) nhằm chống lại các nội dung bịa đặt, sử dụng sai mục đích, nội dung cấm… Công cụ này cũng có thể được sử dụng để xác định các tác hại về bảo mật từ việc tạo phần mềm độc hại đến bẻ khóa, cũng như các tác động đến quyền riêng tư như đánh cắp danh tính.

PyRIT gồm 5 phần: mục tiêu, bộ dữ liệu, bộ đánh giá, khả năng hỗ trợ nhiều chiến lược tấn công và tích hợp một thành phần bộ nhớ, có thể ở dạng JSON hoặc cơ sở dữ liệu để lưu trữ các tương tác giữa đầu vào, đầu ra trung gian. Bộ đánh giá cũng cung cấp hai tùy chọn khác nhau để đánh giá các đầu ra từ hệ thống AI mục tiêu, cho phép Red Team sử dụng một bộ phân loại học máy cổ điển hoặc tận dụng một điểm cuối LLM để tự đánh giá.

Microsoft cho biết: “Mục tiêu là cho phép các nhà nghiên cứu có cơ sở về mức độ hoạt động của mô hình, toàn bộ quy trình của họ đối với các tác hại khác nhau và có thể so sánh dựa trên phiên bản hiện tại với với các phiên bản tương lai của mô hình”. Điều này cho phép Microsoft có nguồn dữ liệu qua các đánh giá về hiệu suất của mô hình và phát hiện bất kỳ sự suy giảm hiệu suất dựa trên các cải tiến trong tương lai.

PyRIT không phải là phương pháp thay thế cho việc kiểm tra Red Teaming thủ công mà là công cụ bổ trợ cho kỹ năng chuyên môn hiện có của đội ngũ Red Teaming. Theo đó, công cụ này giúp xác định các "điểm nóng" rủi ro bằng cách tạo ra các dấu nhắc có thể được sử dụng để đánh giá hệ thống AI và chỉ ra các lĩnh vực cần được điều tra thêm.

Microsoft đã phát triển PyRIT như một công cụ hỗ trợ quan trọng cho các đội ngũ Red Teaming trong việc đánh giá và phát hiện rủi ro trong hệ thống AI tạo sinh. Công cụ này không nhằm thay thế hoàn toàn cho các phương pháp kiểm tra thủ công mà là để tăng cường khả năng phát hiện các điểm rủi ro tiềm ẩn, giúp các chuyên gia có thể tập trung vào việc điều tra sâu hơn vào những vấn đề cụ thể. PyRIT đóng vai trò như một bước tiến quan trọng trong việc bảo mật AI, đặc biệt là trong bối cảnh ngày càng có nhiều hệ thống AI tạo sinh được triển khai rộng rãi.

Sự phát triển này xảy ra khi Protect AI tiết lộ nhiều lỗ hổng nghiêm trọng trong các nền tảng chuỗi cung ứng AI phổ biến như ClearML, Hugging Face, MLflow và Triton Inference Server có thể dẫn đến việc thực thi mã tùy ý và tiết lộ thông tin nhạy cảm.

Quốc Trung

(Theo The Hacker news)

Microsoft phát hành PyRIT - Công cụ xác định rủi ro dành cho các hệ thống AI tạo sinh

Tin cùng chuyên mục

ABAII Unitour tại Đại học Kinh tế Quốc dân: Mở ra kỷ nguyên mới về Blockchain và AI cho sinh viên

Google dán nhãn ảnh tạo bởi AI trong kết quả tìm kiếm
13:00|09/10/2024

Google vướng thêm rắc rối pháp lý mới về AI từ EU
07:00|23/09/2024

Ứng dụng biên tập video CapCut qua mặt ChatGPT
08:00|26/08/2024

Microsoft cảnh báo về lỗ hổng Office chưa được vá dẫn đến rò rỉ dữ liệu
10:00|20/08/2024

Tin mới

Khai trương Nền tảng diễn tập an toàn thông tin Việt Nam
15:00|21/11/2024

An toàn thông tin cho hạ tầng dữ liệu và nền tảng số quốc gia
15:00|21/11/2024

Amazon bị mạo danh nhằm chiếm đoạt tài sản
10:00|21/11/2024

Cơ quan hành pháp Mỹ lo lắng khi iPhone tự khởi động lại
10:00|20/11/2024

Google Maps tạo bước đột phá khi tích hợp AI Gemini
10:00|19/11/2024

Google AI Overviews được triển khai tại hơn 100 quốc gia
13:00|18/11/2024

Copilot có thể bị thay thế bằng Windows Intelligence
09:00|18/11/2024

Hội nghị quốc tế lần thứ 3 về những tiến bộ trong công nghệ thông tin và truyền thông
09:00|18/11/2024

Meta đối mặt với vụ kiện mới do không chặn quảng cáo giả mạo
07:00|17/11/2024

Microsoft xác nhận nhiều lỗ hổng nghiêm trọng trong hệ sinh thái Windows
14:00|15/11/2024

Văn phòng Quốc hội tổ chức Diễn tập thực chiến bảo đảm an toàn thông tin mạng
10:00|15/11/2024

Microsoft tố Google "chơi xấu"
08:00|15/11/2024

Hợp tác quốc tế để bảo vệ cơ sở hạ tầng số quan trọng của Việt Nam
08:00|15/11/2024

Fortanix và Sectigo hợp tác nâng cao bảo mật chuỗi cung ứng phần mềm
13:00|14/11/2024

Vi phạm quy định chống độc quyền trên App Store, Apple đối mặt án phạt 38 tỷ USD
09:00|14/11/2024

Microsoft phát hành PyRIT - Công cụ xác định rủi ro dành cho các hệ thống AI tạo sinh

Tin cùng chuyên mục

ABAII Unitour tại Đại học Kinh tế Quốc dân: Mở ra kỷ nguyên mới về Blockchain và AI cho sinh viên

Google dán nhãn ảnh tạo bởi AI trong kết quả tìm kiếm 13:00|09/10/2024

Google vướng thêm rắc rối pháp lý mới về AI từ EU 07:00|23/09/2024

Ứng dụng biên tập video CapCut qua mặt ChatGPT 08:00|26/08/2024

Microsoft cảnh báo về lỗ hổng Office chưa được vá dẫn đến rò rỉ dữ liệu 10:00|20/08/2024

Tin mới

Khai trương Nền tảng diễn tập an toàn thông tin Việt Nam 15:00|21/11/2024

An toàn thông tin cho hạ tầng dữ liệu và nền tảng số quốc gia 15:00|21/11/2024

Amazon bị mạo danh nhằm chiếm đoạt tài sản 10:00|21/11/2024

Cơ quan hành pháp Mỹ lo lắng khi iPhone tự khởi động lại 10:00|20/11/2024

Google Maps tạo bước đột phá khi tích hợp AI Gemini 10:00|19/11/2024

Google AI Overviews được triển khai tại hơn 100 quốc gia 13:00|18/11/2024

Copilot có thể bị thay thế bằng Windows Intelligence 09:00|18/11/2024

Hội nghị quốc tế lần thứ 3 về những tiến bộ trong công nghệ thông tin và truyền thông 09:00|18/11/2024

Meta đối mặt với vụ kiện mới do không chặn quảng cáo giả mạo 07:00|17/11/2024

Microsoft xác nhận nhiều lỗ hổng nghiêm trọng trong hệ sinh thái Windows 14:00|15/11/2024

Văn phòng Quốc hội tổ chức Diễn tập thực chiến bảo đảm an toàn thông tin mạng 10:00|15/11/2024

Microsoft tố Google "chơi xấu" 08:00|15/11/2024

Hợp tác quốc tế để bảo vệ cơ sở hạ tầng số quan trọng của Việt Nam 08:00|15/11/2024

Fortanix và Sectigo hợp tác nâng cao bảo mật chuỗi cung ứng phần mềm 13:00|14/11/2024

Vi phạm quy định chống độc quyền trên App Store, Apple đối mặt án phạt 38 tỷ USD 09:00|14/11/2024

Google dán nhãn ảnh tạo bởi AI trong kết quả tìm kiếm
13:00|09/10/2024

Google vướng thêm rắc rối pháp lý mới về AI từ EU
07:00|23/09/2024

Ứng dụng biên tập video CapCut qua mặt ChatGPT
08:00|26/08/2024

Microsoft cảnh báo về lỗ hổng Office chưa được vá dẫn đến rò rỉ dữ liệu
10:00|20/08/2024

Khai trương Nền tảng diễn tập an toàn thông tin Việt Nam
15:00|21/11/2024

An toàn thông tin cho hạ tầng dữ liệu và nền tảng số quốc gia
15:00|21/11/2024

Amazon bị mạo danh nhằm chiếm đoạt tài sản
10:00|21/11/2024

Cơ quan hành pháp Mỹ lo lắng khi iPhone tự khởi động lại
10:00|20/11/2024

Google Maps tạo bước đột phá khi tích hợp AI Gemini
10:00|19/11/2024

Google AI Overviews được triển khai tại hơn 100 quốc gia
13:00|18/11/2024

Copilot có thể bị thay thế bằng Windows Intelligence
09:00|18/11/2024

Hội nghị quốc tế lần thứ 3 về những tiến bộ trong công nghệ thông tin và truyền thông
09:00|18/11/2024

Meta đối mặt với vụ kiện mới do không chặn quảng cáo giả mạo
07:00|17/11/2024

Microsoft xác nhận nhiều lỗ hổng nghiêm trọng trong hệ sinh thái Windows
14:00|15/11/2024

Văn phòng Quốc hội tổ chức Diễn tập thực chiến bảo đảm an toàn thông tin mạng
10:00|15/11/2024

Microsoft tố Google "chơi xấu"
08:00|15/11/2024

Hợp tác quốc tế để bảo vệ cơ sở hạ tầng số quan trọng của Việt Nam
08:00|15/11/2024

Fortanix và Sectigo hợp tác nâng cao bảo mật chuỗi cung ứng phần mềm
13:00|14/11/2024

Vi phạm quy định chống độc quyền trên App Store, Apple đối mặt án phạt 38 tỷ USD
09:00|14/11/2024