[ad_1]
Việc một mô hình AI có khả năng hành xử theo cách lừa đảo mà không có bất kỳ hướng dẫn nào để làm điều đó có vẻ đáng lo ngại. Nhưng nó chủ yếu phát sinh từ “vấn đề hộp đen” điều đó đặc trưng cho các mô hình học máy tiên tiến: không thể nói chính xác bằng cách nào hoặc tại sao chúng tạo ra kết quả như vậy—hoặc liệu chúng có luôn thể hiện hành vi đó trong tương lai hay không, Peter S. Park, một nghiên cứu sinh sau tiến sĩ cho biết. đồng nghiệp đang nghiên cứu về an toàn sinh tồn AI tại MIT, người đã làm việc trong dự án.
Ông nói: “Chỉ vì AI của bạn có những hành vi hoặc xu hướng nhất định trong môi trường thử nghiệm không có nghĩa là những bài học tương tự sẽ có giá trị nếu nó được thả ra ngoài tự nhiên”. “Không có cách nào dễ dàng để giải quyết vấn đề này—nếu bạn muốn tìm hiểu xem AI sẽ làm gì khi nó được triển khai vào thế giới hoang dã, thì bạn chỉ cần triển khai nó vào thế giới hoang dã.”
Xu hướng của chúng tôi nhân cách hóa các mô hình AI thay đổi cách chúng tôi kiểm tra các hệ thống này và suy nghĩ của chúng tôi về khả năng của chúng. Suy cho cùng, việc vượt qua các bài kiểm tra được thiết kế để đo lường sự sáng tạo của con người không có nghĩa là các mô hình AI thực sự sáng tạo. Điều quan trọng là cơ quan quản lý và các công ty AI cân nhắc cẩn thận khả năng gây hại của công nghệ so với lợi ích tiềm năng của nó cho xã hội và phân biệt rõ ràng giữa những gì các mô hình có thể và không thể làm, Harry Legislation, một nhà nghiên cứu AI tại Đại học Cambridge, người không làm việc trên cho biết. nghiên cứu. “Đây thực sự là những câu hỏi khó,” ông nói.
Về cơ bản, hiện tại không thể đào tạo một mô hình AI không có khả năng lừa dối trong mọi tình huống có thể xảy ra, ông nói. Ngoài ra, khả năng xảy ra hành vi lừa dối là một trong nhiều vấn đề—cùng với xu hướng khuếch đại sự thiên vị và thông tin sai lệch—cần được giải quyết trước khi các mô hình AI được tin cậy thực hiện các nhiệm vụ trong thế giới thực.
Legislation nói: “Đây là một nghiên cứu hay để chứng minh rằng sự lừa dối có thể xảy ra”. “Bước tiếp theo sẽ là cố gắng tiến xa hơn một chút để tìm hiểu xem hồ sơ rủi ro là gì và khả năng xảy ra những tác hại có thể phát sinh từ hành vi lừa đảo và theo cách nào.”
[ad_2]
Source link