[ad_1]
Khi ngày càng nhiều cơ sở giáo dục sau trung học áp dụng trí tuệ nhân tạo, bảo mật dữ liệu trở thành mối quan tâm lớn hơn. Với các cuộc tấn công mạng vào giáo dục đang gia tăng và các nhà giáo dục vẫn đang thích nghi với công nghệ xa lạ này, mức độ rủi ro là rất cao. Các trường đại học nên làm gì?
1. Thực hiện theo Quy tắc sao lưu 3-2-1
Tội phạm mạng không phải là mối đe dọa duy nhất mà các tổ chức sau trung học phải đối mặt – mất dữ liệu do hỏng hóc, mất điện hoặc lỗi ổ cứng thường xảy ra. Quy tắc 3-2-1 nêu rõ rằng các tổ chức phải có ba bản sao lưu ở hai phương tiện khác nhau. Một bản sao lưu phải được lưu trữ ngoài cơ sở để ngăn ngừa các yếu tố như lỗi của con người, thời tiết và hư hỏng vật lý ảnh hưởng đến tất cả các bản sao.
Vì học máy và các mô hình ngôn ngữ lớn dễ bị tấn công mạng, nên các quản trị viên trường đại học nên ưu tiên sao lưu các tập dữ liệu đào tạo của họ theo quy tắc 3-2-1. Đáng chú ý, trước tiên họ phải đảm bảo thông tin sạch và không bị hỏng trước khi tiến hành. Nếu không, họ có nguy cơ tạo ra các bản sao lưu bị xâm phạm.
2. Kiểm kê tài sản thông tin AI
Khối lượng dữ liệu được tạo ra, sao chép, thu thập và tiêu thụ sẽđạt khoảng 181 zettabyte vào năm 2025, tăng từ chỉ 2 zettabyte vào năm 2010 – tăng gấp 90 lần trong vòng chưa đầy hai thập kỷ. Nhiều tổ chức mắc sai lầm khi coi lượng thông tin dồi dào này là một tài sản thay vì một vấn đề bảo mật tiềm ẩn.
Trường đại học lưu trữ càng nhiều dữ liệu thì càng dễ bỏ qua việc giả mạo, truy cập trái phép, trộm cắp và tham nhũng. Tuy nhiên, xóa hồ sơ sinh viên, hồ sơ tài chính hoặc hồ sơ học tập vì lý do bảo mật không phải là một lựa chọn. Kiểm kê tài sản thông tin là một giải pháp thay thế hiệu quả vì nó giúp nhóm công nghệ thông tin (IT) hiểu rõ hơn về phạm vi, quy mô và rủi ro.
3. Triển khai bảo vệ tài khoản người dùng
Tính đến năm 2023,chỉ có 13% thế giới có biện pháp bảo vệ dữ liệu. Các trường đại học nên cân nhắc mạnh mẽ việc chống lại xu hướng này bằng cách triển khai các biện pháp bảo mật cho tài khoản của sinh viên. Hiện tại, nhiều trường coi mật khẩu và CAPTCHA là biện pháp bảo vệ đầy đủ. Nếu kẻ xấu vượt qua được các biện pháp phòng thủ đó – mà chúng có thể dễ dàng thực hiện bằng một cuộc tấn công vũ phu – chúng có thể gây ra thiệt hại.
Với các kỹ thuật như kỹ thuật nhanh chóng, kẻ tấn công có thể buộc AI tiết lộ thông tin ẩn danh hoặc thông tin nhận dạng cá nhân từ dữ liệu đào tạo của nó. Khi thứ duy nhất ngăn cách chúng và dữ liệu giáo dục có giá trị là một mật khẩu mỏng manh, chúng sẽ không ngần ngại. Để bảo mật tốt hơn, các quản trị viên trường đại học nên cân nhắc tận dụng các biện pháp xác thực.
Mật khẩu một lần và câu hỏi bảo mật giúp ngăn chặn kẻ tấn công ngay cả khi chúng dùng vũ lực để lấy mật khẩu hoặc sử dụng thông tin đăng nhập bị đánh cắp. Theo một nghiên cứu, các tài khoản được bật xác thực đa yếu tố cótỷ lệ tổn thương ước tính trung bình là 0,0079%trong khi những người không có tỷ lệ này là 1,0071% – nghĩa là công cụ này giúp giảm rủi ro tới 99,22%.
4. Sử dụng Nguyên tắc thu nhỏ dữ liệu
Theo nguyên tắc giảm thiểu dữ liệu, các tổ chức chỉ nên thu thập và lưu trữ thông tin nếu nó có liên quan trực tiếp đến một trường hợp sử dụng cụ thể. Sau đó có thểgiảm đáng kể nguy cơ vi phạm dữ liệu bằng cách đơn giản hóa việc quản lý cơ sở dữ liệu và giảm thiểu số lượng giá trị mà kẻ xấu có thể xâm phạm.
Các tổ chức nên áp dụng nguyên tắc này vào tài sản thông tin AI của họ. Ngoài việc cải thiện bảo mật dữ liệu, nó có thể tối ưu hóa quy trình tạo ra hiểu biết – việc cung cấp cho AI nhiều chi tiết có liên quan gián tiếp thường làm rối loạn kết quả đầu ra của nó thay vì tăng độ chính xác hoặc tính phù hợp của nó.
5. Kiểm tra thường xuyên các nguồn dữ liệu đào tạo
Các tổ chức sử dụng mô hình lấy thông tin từ net nên tiến hành thận trọng. Kẻ tấn công có thể phát động các cuộc tấn công đầu độc dữ liệu, đưa thông tin sai lệch để gây ra hành vi không mong muốn. Đối với các tập dữ liệu chưa được quản lý, nghiên cứu cho thấytỷ lệ ngộ độc thấp tới 0,001% có thể có hiệu quả trong việc thúc đẩy phân loại sai hoặc tạo ra cửa hậu cho mô hình.
Phát hiện này đáng lo ngại vì theo nghiên cứu, kẻ tấn công có thể đầu độc ít nhất 0,01% bộ dữ liệu LAION-400M hoặc COYO-700M – các tùy chọn mã nguồn mở phổ biến trên quy mô lớn – chỉ với 60 đô la. Rõ ràng, chúng có thể mua các tên miền đã hết hạn hoặc một phần của bộ dữ liệu một cách tương đối dễ dàng. PubFig, VGG Face và Facescrub cũng được cho là có nguy cơ.
Quản trị viên nên chỉ đạo nhóm CNTT của mình kiểm tra các nguồn đào tạo thường xuyên. Ngay cả khi họ không lấy dữ liệu từ net hoặc cập nhật theo thời gian thực, họ vẫn dễ bị tấn công tiêm nhiễm hoặc giả mạo. Đánh giá định kỳ có thể giúp họ xác định và giải quyết bất kỳ điểm dữ liệu hoặc miền đáng ngờ nào, giảm thiểu mức độ thiệt hại mà kẻ tấn công có thể gây ra.
6. Sử dụng công cụ AI từ các nhà cung cấp có uy tín
Một số lượng không nhỏ các trường đại học đã trải qua tình trạng vi phạm dữ liệu của bên thứ ba. Các nhà quản lý muốn tránh kết quả này nên ưu tiên lựa chọn một nhà cung cấp AI có uy tín. Nếu họ đã sử dụng một nhà cung cấp, họ nên xem xét lại thỏa thuận hợp đồng và tiến hành kiểm toán định kỳ để đảm bảo các tiêu chuẩn về bảo mật và quyền riêng tư được duy trì.
Cho dù một trường đại học có sử dụng nhà cung cấp dịch vụ AI hay đã ký hợp đồng với nhà phát triển bên thứ ba để xây dựng một mô hình cụ thể thì trường đó cũng nên cân nhắc kỹ lưỡng việc xem xét lại các công cụ của mình. Vì60% nhà giáo dục sử dụng AI trong lớp học, thị trường đủ lớn để nhiều công ty không có uy tín đã tham gia vào.
Bảo mật dữ liệu nên là ưu tiên hàng đầu của người dùng AI
Các nhà quản lý trường đại học có kế hoạch sử dụng các công cụ AI nên ưu tiên bảo mật dữ liệu để bảo vệ quyền riêng tư và sự an toàn của sinh viên và nhà giáo dục. Mặc dù quá trình này mất thời gian và công sức, nhưng việc giải quyết các vấn đề tiềm ẩn ngay từ đầu có thể giúp việc triển khai dễ quản lý hơn và ngăn ngừa các vấn đề phát sinh sau này.
Bài 6 Mẹo bảo mật dữ liệu khi sử dụng công cụ AI trong giáo dục đại học xuất hiện đầu tiên trên Dữ liệu.
[ad_2]
Source link