[ad_1]
Mạng nơ-ron đã tạo ra tác động địa chấn đến cách các kỹ sư thiết kế bộ điều khiển cho rô-bốt, thúc đẩy các máy móc thích ứng và hiệu quả hơn. Tuy nhiên, các hệ thống máy học giống não này là con dao hai lưỡi: Độ phức tạp của chúng khiến chúng trở nên mạnh mẽ, nhưng cũng khiến việc đảm bảo rằng một rô-bốt được cung cấp năng lượng bởi mạng nơ-ron sẽ hoàn thành nhiệm vụ của mình một cách an toàn trở nên khó khăn.
Cách truyền thống để xác minh tính an toàn và ổn định là thông qua các kỹ thuật được gọi là hàm Lyapunov. Nếu bạn có thể tìm thấy một hàm Lyapunov có giá trị liên tục giảm, thì bạn có thể biết rằng các tình huống không an toàn hoặc không ổn định liên quan đến các giá trị cao hơn sẽ không bao giờ xảy ra. Tuy nhiên, đối với các rô-bốt được điều khiển bởi mạng nơ-ron, các phương pháp tiếp cận trước đây để xác minh các điều kiện Lyapunov không mở rộng tốt cho các máy phức tạp.
Các nhà nghiên cứu từ Phòng thí nghiệm Khoa học máy tính và Trí tuệ nhân tạo (CSAIL) của MIT và những nơi khác hiện đã phát triển các kỹ thuật mới chứng nhận nghiêm ngặt các phép tính Lyapunov trong các hệ thống phức tạp hơn. Thuật toán của họ tìm kiếm và xác minh hiệu quả một hàm Lyapunov, cung cấp sự đảm bảo ổn định cho hệ thống. Phương pháp này có khả năng cho phép triển khai an toàn hơn các robotic và phương tiện tự hành, bao gồm máy bay và tàu vũ trụ.
Để vượt trội hơn các thuật toán trước đây, các nhà nghiên cứu đã tìm ra một lối tắt tiết kiệm cho quá trình đào tạo và xác minh. Họ tạo ra các phản ví dụ rẻ hơn — ví dụ, dữ liệu đối nghịch từ các cảm biến có thể làm mất bộ điều khiển — và sau đó tối ưu hóa hệ thống rô-bốt để tính đến chúng. Hiểu được các trường hợp ngoại lệ này đã giúp máy móc học cách xử lý các tình huống đầy thách thức, cho phép chúng hoạt động an toàn trong nhiều điều kiện hơn so với trước đây. Sau đó, họ đã phát triển một công thức xác minh mới cho phép sử dụng trình xác minh mạng nơ-ron có thể mở rộng, α,β-CROWN, để cung cấp các đảm bảo kịch bản xấu nhất nghiêm ngặt ngoài các phản ví dụ.
Lujie Yang, nghiên cứu sinh tiến sĩ khoa học máy tính và kỹ thuật điện (EECS) tại MIT và là cộng tác viên của CSAIL, đồng tác giả chính của một bài báo mới về dự án cùng với nhà nghiên cứu Hongkai Dai, SM ’12, PhD ’16 tại Viện nghiên cứu Toyota, cho biết: “Chúng tôi đã chứng kiến một số hiệu suất thực nghiệm ấn tượng ở các máy do AI điều khiển như máy móc hình người và chó rô-bốt, nhưng các bộ điều khiển AI này lại thiếu các đảm bảo chính thức vốn rất quan trọng đối với các hệ thống quan trọng về an toàn”. Yang lưu ý rằng “Công trình của chúng tôi thu hẹp khoảng cách giữa mức hiệu suất đó từ các bộ điều khiển mạng nơ-ron và các đảm bảo an toàn cần thiết để triển khai các bộ điều khiển mạng nơ-ron phức tạp hơn trong thế giới thực”.
Đối với một cuộc trình diễn kỹ thuật số, nhóm đã mô phỏng cách một máy bay không người lái bốn cánh quạt có cảm biến lidar sẽ ổn định trong môi trường hai chiều. Thuật toán của họ đã hướng dẫn thành công máy bay không người lái đến vị trí lơ lửng ổn định, chỉ sử dụng thông tin môi trường hạn chế do cảm biến lidar cung cấp. Trong hai thí nghiệm khác, cách tiếp cận của họ cho phép vận hành ổn định hai hệ thống rô-bốt mô phỏng trong phạm vi điều kiện rộng hơn: một con lắc ngược và một phương tiện theo dõi đường đi. Những thí nghiệm này, mặc dù khiêm tốn, nhưng tương đối phức tạp hơn những gì cộng đồng xác minh mạng nơ-ron có thể thực hiện trước đây, đặc biệt là vì chúng bao gồm các mô hình cảm biến.
“Không giống như các vấn đề học máy thông thường, việc sử dụng chặt chẽ các mạng nơ-ron dưới dạng hàm Lyapunov đòi hỏi phải giải quyết các vấn đề tối ưu hóa toàn cục khó, do đó khả năng mở rộng là nút thắt chính”, Sicun Gao, phó giáo sư khoa học máy tính và kỹ thuật tại Đại học California ở San Diego, người không tham gia vào công trình này, cho biết. “Công trình hiện tại đóng góp quan trọng bằng cách phát triển các phương pháp tiếp cận thuật toán phù hợp hơn nhiều với việc sử dụng cụ thể các mạng nơ-ron dưới dạng hàm Lyapunov trong các vấn đề điều khiển. Nó đạt được sự cải thiện đáng kể về khả năng mở rộng và chất lượng của các giải pháp so với các phương pháp tiếp cận hiện có. Công trình mở ra những hướng đi thú vị để phát triển thêm các thuật toán tối ưu hóa cho các phương pháp Lyapunov nơ-ron và việc sử dụng chặt chẽ học sâu trong điều khiển và robotic nói chung”.
Cách tiếp cận ổn định của Yang và các đồng nghiệp có tiềm năng ứng dụng rộng rãi trong đó việc đảm bảo an toàn là rất quan trọng. Nó có thể giúp đảm bảo hành trình mượt mà hơn cho các phương tiện tự hành, như máy bay và tàu vũ trụ. Tương tự như vậy, máy bay không người lái giao hàng hoặc lập bản đồ các địa hình khác nhau có thể được hưởng lợi từ các đảm bảo an toàn như vậy.
Các kỹ thuật được phát triển ở đây rất tổng quát và không chỉ dành riêng cho ngành robotic; các kỹ thuật tương tự có khả năng hỗ trợ các ứng dụng khác, chẳng hạn như y sinh học và chế biến công nghiệp, trong tương lai.
Mặc dù kỹ thuật này là bản nâng cấp từ các công trình trước đây về khả năng mở rộng, các nhà nghiên cứu đang khám phá cách nó có thể hoạt động tốt hơn trong các hệ thống có kích thước cao hơn. Họ cũng muốn tính đến dữ liệu ngoài các phép đo lidar, như hình ảnh và đám mây điểm.
Với tư cách là hướng nghiên cứu trong tương lai, nhóm muốn cung cấp các đảm bảo ổn định tương tự cho các hệ thống trong môi trường không chắc chắn và dễ bị nhiễu loạn. Ví dụ, nếu máy bay không người lái gặp phải gió giật mạnh, Yang và các đồng nghiệp muốn đảm bảo máy bay vẫn bay ổn định và hoàn thành nhiệm vụ mong muốn.
Ngoài ra, họ có ý định áp dụng phương pháp của mình vào các bài toán tối ưu hóa, trong đó mục tiêu là giảm thiểu thời gian và khoảng cách mà một robotic cần để hoàn thành một nhiệm vụ trong khi vẫn giữ được trạng thái ổn định. Họ có kế hoạch mở rộng kỹ thuật của mình sang người máy và các máy móc thực tế khác, trong đó một robotic cần phải giữ được trạng thái ổn định trong khi tiếp xúc với môi trường xung quanh.
Russ Tedrake, Giáo sư Toyota về EECS, Hàng không và Du hành vũ trụ, và Kỹ thuật cơ khí tại MIT, phó chủ tịch nghiên cứu robotic tại TRI và thành viên CSAIL, là tác giả chính của nghiên cứu này. Bài báo cũng ghi nhận nghiên cứu sinh tiến sĩ Zhouxing Shi của Đại học California tại Los Angeles và phó giáo sư Cho-Jui Hsieh, cũng như trợ lý giáo sư Huan Zhang của Đại học Illinois Urbana-Champaign. Công trình của họ được hỗ trợ một phần bởi Amazon, Quỹ khoa học quốc gia, Văn phòng nghiên cứu hải quân và chương trình AI2050 tại Schmidt Sciences. Bài báo của các nhà nghiên cứu sẽ được trình bày tại Hội nghị quốc tế về học máy năm 2024.
[ad_2]
Source link