[ad_1]
Giá trị của dữ liệu là con dao hai lưỡi. Một mặt, dữ liệu số đặt nền tảng cho các ứng dụng AI mạnh mẽ, nhiều ứng dụng trong số đó có thể thay đổi thế giới tốt đẹp hơn. Ngược lại, việc lưu trữ quá nhiều thông tin chi tiết về con người sẽ tạo ra rủi ro rất lớn về quyền riêng tư. Dữ liệu tổng hợp cung cấp một giải pháp khả thi.
Dữ liệu tổng hợp là gì?
Dữ liệu tổng hợp làmột tập hợp con của dữ liệu ẩn danh – dữ liệu không tiết lộ bất kỳ chi tiết thực tế nào. Cụ thể hơn, nó đề cập đến thông tin trông và hoạt động giống như dữ liệu trong thế giới thực nhưng không có mối liên hệ nào với con người, địa điểm hoặc sự kiện thực tế. Tóm lại, dữ liệu giả có thể tạo ra kết quả thật.
Trong nhiều trường hợp, dữ liệu tổng hợp là sản phẩm của học máy. Các mô hình thông minh phân tích tập dữ liệu trong thế giới thực để tìm hiểu dữ liệu thực trông như thế nào và cách thức hoạt động của dữ liệu đó. Sau đó, họ tạo ra các bộ dữ liệu mới phục vụ cùng mục đích nhưng không phản ánh bất kỳ điều gì trong thế giới thực.
5 cách sử dụng dữ liệu tổng hợp trong an ninh mạng
Dữ liệu tổng hợp đã trở nên phổ biến trong lĩnh vực tài chính và y tế, nhưng nó cũng có ứng dụng rộng rãi trong an ninh mạng. Dưới đây là năm trường hợp sử dụng bảo mật hứa hẹn nhất cho dữ liệu ẩn danh này.
1. Học máy
Ứng dụng phổ biến nhất của dữ liệu tổng hợp nằm ở việc đào tạo các mô hình AI. Học máy đóng nhiều vai trò trong an ninh mạng, từ sinh trắc học hành vi đến ngăn chặn lừa đảo, nhưng việc đào tạo các mô hình này trên dữ liệu thực có thể khiến thông tin nhận dạng cá nhân (PII) bị vi phạm. Thay vào đó, việc sử dụng dữ liệu tổng hợp sẽ loại bỏ mối lo ngại đó.
Trong một số trường hợp, các mô hình học máy được đào tạo trên dữ liệu tổng hợpthậm chí còn chính xác hơn hơn so với những người sử dụng thông tin trong thế giới thực. Điều đó một phần là do dữ liệu tổng hợp có ít vấn đề liên quan đến tính nhất quán và lỗi hơn và một phần là do dễ tạo ra nhiều dữ liệu hơn cho cỡ mẫu lớn hơn.
Những lợi ích này giúp các công cụ bảo mật hỗ trợ AI trở nên dễ tiếp cận và đáng tin cậy hơn mà không ảnh hưởng đến quyền riêng tư của mọi người. Sẽ không có vấn đề gì nếu tin tặc vi phạm các tập dữ liệu huấn luyện này vì chúng sẽ không nhận được bất kỳ PII nào từ chúng.
2. Kiểm tra và đào tạo bảo mật
Dữ liệu tổng hợp cũng là một công cụ hữu ích để kiểm tra lỗ hổng bảo mật và đào tạo nhân viên về bảo mật. Những xét nghiệm này là một phần quan trọng trong việc ngăn ngừathua lỗ hàng triệu USD các cuộc tấn công lừa đảo gây ra, nhưng các phương pháp thông thường có nhiều rủi ro. Các doanh nghiệp có thể vô tình để lộ PII thực cho kẻ tấn công khi kiểm tra lỗ hổng hoặc chạy mô phỏng lừa đảo.
Việc hoán đổi PII lấy dữ liệu tổng hợp có nghĩa là các nhà nghiên cứu bảo mật có thể chạy các thử nghiệm này mà không gặp rủi ro vi phạm quyền riêng tư. Họ có thể sao chép mạng công ty của mình bằng cách sử dụng dữ liệu giả để thử nghiệm thâm nhập an toàn hơn. Ngoài ra, họ có thể thử nghiệm hệ thống ngăn chặn lừa đảo bằng hồ sơ giả thay vì thông tin chi tiết về nhân viên thực. Dù chi tiết cụ thể là gì, dữ liệu tổng hợp đều có những lợi ích như nhau nhưng không có những mối nguy hiểm giống nhau.
3. Phát hiện xâm nhập
Tương tự, các chuyên gia an ninh mạng có thể sử dụng dữ liệu tổng hợp để bảo mật vành đai. Một cách để làm như vậy là tạo ra các honeypot để thu hút tội phạm mạng tránh xa các hệ thống và dữ liệu thực, nhạy cảm. Tin tặc có thể nhắm mục tiêu vào những phiền nhiễu này vì chúng giống với dữ liệu trong thế giới thực, nhưng ngay khi chúng làm vậy, nhân viên an ninh sẽ nhận ra hành vi vi phạm.
Cách tiếp cận này giúp bảo toàn tài nguyên CNTT bằng cách hướng kẻ tấn công đến một số điểm được giám sát liên tục thay vì phải theo dõi toàn bộ mạng. Hiệu quả sử dụng nguồn lực này rất quan trọng vì ngân sách eo hẹp và các vấn đề về nhân sự đanghai trong ba thử thách được trích dẫn nhiều nhất đến an ninh mạng triệt để.
Việc thu hút tội phạm đến một khu vực cụ thể giúp dễ dàng phát hiện và ngăn chặn các hành vi vi phạm trước khi chúng gây ra nhiều thiệt hại. Mặc dù điều đó có thể thực hiện được với dữ liệu trong thế giới thực nhưng nó sẽ khiến thông tin nhạy cảm gặp rủi ro. Dữ liệu tổng hợp là một sự thay thế an toàn hơn nhiều.
4. Bảo vệ bằng mật khẩu
Dữ liệu tổng hợp cũng có thể đóng một vai trò quan trọng trong việc bảo vệ mật khẩu. Nhiều doanh nghiệp sử dụng trình quản lý mật khẩu để chống lại các cuộc tấn công vũ phu đằng sau89% sự cố hack Hôm nay. Tuy nhiên, ngay cả những hệ thống này cũng không hoàn hảo, vì tin tặc có thể bẻ khóa mật khẩu được mã hóa trong các cơ sở dữ liệu này thông qua các cuộc tấn công vũ phu hơn nữa.
Một giải pháp là sử dụng cả băm và muối. Băm đề cập đến việc mã hóa mật khẩu trong bộ lưu trữ. Salting là phương pháp thêm dữ liệu tổng hợp ngẫu nhiên vào quá trình băm. Những số liệu bổ sung này khiến việc bẻ khóa mật khẩu băm trở nên cực kỳ khó khăn vì nhiều thông tin không tương quan với thông tin xác thực thực.
5. Xác thực sinh trắc học
Mật khẩu không phải là biện pháp xác thực duy nhất được hưởng lợi từ dữ liệu tổng hợp. Những bộ dữ liệu giả này cũng có thể làm cho thuật toán xác thực sinh trắc học trở nên đáng tin cậy hơn.
Mặc dù an toàn hơn mật khẩu nhưng xác thực sinh trắc học – đặc biệt là nhận dạng khuôn mặt – lại có vấn đề sai lệch. Một số nghiên cứu đã phát hiện ra rằng chúngkém chính xác hơn đối với người da màu, phần lớn là do những người mẫu này chủ yếu được đào tạo trên khuôn mặt nam giới da trắng. Việc đào tạo họ trên một tập dữ liệu đa dạng hơn có thể giải quyết vấn đề đó nhưng cũng có thể gây ra những lo ngại đáng kể về quyền riêng tư.
Các mô hình deep studying có thể tạo ra các hình ảnh deepfake tổng hợp trông giống người thật nhưng thực tế không phải vậy. Việc đào tạo các thuật toán sinh trắc học trên những hàng giả này sẽ khiến chúng trở nên đáng tin cậy hơn đối với nhiều người hơn mà không có khả năng làm lộ dữ liệu sinh trắc học của bất kỳ ai.
Dữ liệu tổng hợp là một công cụ bảo mật quan trọng
Dữ liệu tổng hợp có thể không phải là giải pháp hoàn hảo cho mọi vấn đề nhưng tiềm năng của nó rất ấn tượng. Năm trường hợp sử dụng này nêu bật cách nó có thể giúp ngành an ninh mạng an toàn hơn và chính xác hơn.
Khi các mô hình tạo ra dữ liệu tổng hợp được cải tiến thì các ứng dụng này cũng vậy. Theo đuổi công nghệ này bây giờ có thể đảm bảo một ngày mai an toàn hơn.
Bài Vai trò của dữ liệu tổng hợp trong an ninh mạng xuất hiện đầu tiên trên Datafloq.
[ad_2]
Source link