[ad_1]
Tuy nhiên, có một số cảnh báo lớn. Meta cho biết họ chưa có kế hoạch áp dụng hình mờ cho âm thanh do AI tạo ra bằng các công cụ của mình. Hình mờ âm thanh vẫn chưa được áp dụng rộng rãi và không có tiêu chuẩn công nghiệp nào được thống nhất cho chúng. Và hình mờ cho nội dung do AI tạo ra có xu hướng dễ bị giả mạo—ví dụ: bằng cách loại bỏ hoặc giả mạo chúng.
Elsahar cho biết, khả năng phát hiện nhanh và khả năng xác định thành phần nào của tệp âm thanh do AI tạo ra sẽ rất quan trọng để làm cho hệ thống trở nên hữu ích. Ông cho biết nhóm đã đạt được độ chính xác từ 90% đến 100% trong việc phát hiện hình mờ, kết quả tốt hơn nhiều so với những nỗ lực trước đây trong việc tạo hình mờ cho âm thanh.
AudioSeal có sẵn trên GitHub miễn phí. Bất kỳ ai cũng có thể tải xuống và sử dụng nó để thêm hình mờ vào các clip âm thanh do AI tạo. Cuối cùng, nó có thể được phủ lên trên các mô hình tạo âm thanh AI để nó được tự động áp dụng cho bất kỳ giọng nói nào được tạo ra bằng cách sử dụng chúng. Các nhà nghiên cứu tạo ra nó sẽ trình bày công trình của họ tại Hội nghị quốc tế về học máy ở Vienna, Áo vào tháng 7.
AudioSeal được tạo bằng hai mạng thần kinh. Một người tạo ra các tín hiệu hình mờ có thể được nhúng vào các bản âm thanh. Những tín hiệu này tai người không thể cảm nhận được nhưng có thể được phát hiện nhanh chóng bằng cách sử dụng mạng lưới thần kinh khác. Hiện tại, nếu bạn muốn cố gắng phát hiện âm thanh do AI tạo ra trong một clip dài hơn, bạn phải xem qua toàn bộ nội dung theo từng đoạn dài thứ hai để xem liệu có đoạn nào trong số chúng có chứa hình mờ hay không. Đây là một quá trình chậm chạp, tốn nhiều công sức và không thực tế trên các nền tảng truyền thông xã hội với hàng triệu phút phát biểu.
AudioSeal hoạt động theo cách khác: bằng cách nhúng hình mờ xuyên suốt từng phần của toàn bộ bản âm thanh. Điều này cho phép hình mờ được “bản địa hóa”, nghĩa là nó vẫn có thể được phát hiện ngay cả khi âm thanh bị cắt hoặc chỉnh sửa.
Ben Zhao, giáo sư khoa học máy tính tại Đại học Chicago, cho biết khả năng này và độ chính xác phát hiện gần như hoàn hảo giúp AudioSeal tốt hơn bất kỳ hệ thống đóng dấu âm thanh nào trước đây mà ông từng gặp.
Claire Leibowicz, người đứng đầu bộ phận AI và tính toàn vẹn của phương tiện truyền thông tại Tổ chức phi lợi nhuận Quan hệ đối tác về AI, cho biết: “Thật có ý nghĩa khi khám phá nghiên cứu cải thiện tính năng hiện đại trong hình mờ, đặc biệt là trên các phương tiện như lời nói thường khó đánh dấu và phát hiện hơn nội dung trực quan”.
Nhưng có một số sai sót lớn cần phải khắc phục trước khi các loại hình mờ âm thanh này có thể được áp dụng rộng rãi. Các nhà nghiên cứu của Meta đã thử nghiệm các cuộc tấn công khác nhau để loại bỏ hình mờ và nhận thấy rằng càng có nhiều thông tin được tiết lộ về thuật toán hình mờ thì nó càng dễ bị tấn công. Hệ thống cũng yêu cầu mọi người tự nguyện thêm hình mờ vào tệp âm thanh của họ.
[ad_2]
Source link