[ad_1]
Khi nước đóng băng, nó chuyển từ pha lỏng sang pha rắn, dẫn đến sự thay đổi mạnh mẽ về các tính chất như mật độ và thể tích. Sự chuyển pha trong nước phổ biến đến mức hầu hết chúng ta có thể không nghĩ đến chúng, nhưng sự chuyển pha trong các vật liệu mới hoặc hệ thống vật lý phức tạp là một lĩnh vực nghiên cứu quan trọng.
Để hiểu đầy đủ về các hệ thống này, các nhà khoa học phải có khả năng nhận biết các pha và phát hiện sự chuyển tiếp giữa chúng. Nhưng làm thế nào để định lượng sự thay đổi pha trong một hệ thống chưa biết thường không rõ ràng, đặc biệt khi dữ liệu khan hiếm.
Các nhà nghiên cứu từ MIT và Đại học Basel ở Thụy Sĩ đã áp dụng các mô hình trí tuệ nhân tạo tổng quát cho vấn đề này, phát triển một khung học máy mới có thể tự động vạch ra sơ đồ pha cho các hệ thống vật lý mới.
Phương pháp học máy dựa trên vật lý của họ hiệu quả hơn các kỹ thuật thủ công tốn nhiều công sức dựa vào chuyên môn lý thuyết. Điều quan trọng là vì cách tiếp cận của họ thúc đẩy các mô hình tổng quát nên nó không yêu cầu các tập dữ liệu đào tạo khổng lồ được gắn nhãn được sử dụng trong các kỹ thuật học máy khác.
Một khung như vậy có thể giúp các nhà khoa học nghiên cứu các đặc tính nhiệt động của các vật liệu mới hoặc phát hiện sự vướng víu trong các hệ lượng tử chẳng hạn. Cuối cùng, kỹ thuật này có thể giúp các nhà khoa học có thể tự động khám phá các giai đoạn chưa biết của vật chất.
“Nếu bạn có một hệ thống mới với những đặc tính hoàn toàn chưa biết, bạn sẽ chọn đại lượng quan sát nào để nghiên cứu? Hy vọng, ít nhất là với các công cụ dựa trên dữ liệu, là bạn có thể quét các hệ thống lớn mới theo cách tự động và nó sẽ chỉ cho bạn những thay đổi quan trọng trong hệ thống. Đây có thể là một công cụ trong quá trình khám phá khoa học tự động về các đặc tính mới, kỳ lạ của các pha,” Frank Schäfer, một postdoc tại Phòng thí nghiệm Julia thuộc Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL) và đồng tác giả của một bài báo về cách tiếp cận này.
Tham gia cùng Schäfer trong bài báo này còn có tác giả đầu tiên Julian Arnold, một sinh viên tốt nghiệp tại Đại học Basel; Alan Edelman, giáo sư toán ứng dụng tại Khoa Toán và lãnh đạo Phòng thí nghiệm Julia; và tác giả cao cấp Christoph Bruder, giáo sư Khoa Vật lý tại Đại học Basel. Nghiên cứu là được xuất bản ngày hôm nay TRONG Thư đánh giá thể chất.
Phát hiện chuyển pha bằng AI
Trong khi nước chuyển sang dạng băng có thể là một trong những ví dụ rõ ràng nhất về sự thay đổi pha, thì những thay đổi pha kỳ lạ hơn, chẳng hạn như khi một vật liệu chuyển từ trạng thái dẫn điện bình thường sang chất siêu dẫn, là mối quan tâm sâu sắc của các nhà khoa học.
Những chuyển đổi này có thể được phát hiện bằng cách xác định “tham số thứ tự”, một đại lượng quan trọng và dự kiến sẽ thay đổi. Ví dụ, nước đóng băng và chuyển sang pha rắn (nước đá) khi nhiệt độ của nó giảm xuống dưới 0 độ C. Trong trường hợp này, một tham số thứ tự thích hợp có thể được xác định theo tỷ lệ các phân tử nước là một phần của mạng tinh thể so với các phân tử vẫn ở trạng thái mất trật tự.
Trước đây, các nhà nghiên cứu đã dựa vào chuyên môn vật lý để xây dựng sơ đồ pha một cách thủ công, dựa trên hiểu biết lý thuyết để biết tham số thứ tự nào là quan trọng. Điều này không chỉ tẻ nhạt đối với các hệ thống phức tạp và có lẽ là không thể thực hiện được đối với các hệ thống chưa biết có hành vi mới mà còn đưa sự thiên vị của con người vào giải pháp.
Gần đây hơn, các nhà nghiên cứu đã bắt đầu sử dụng học máy để xây dựng các bộ phân loại phân biệt có thể giải quyết nhiệm vụ này bằng cách học cách phân loại một thống kê đo lường đến từ một giai đoạn cụ thể của hệ thống vật lý, giống như cách các mô hình đó phân loại hình ảnh là mèo hoặc chó.
Các nhà nghiên cứu của MIT đã chứng minh cách sử dụng các mô hình tổng quát để giải quyết nhiệm vụ phân loại này hiệu quả hơn nhiều và theo cách hiểu biết về vật lý.
Các Ngôn ngữ lập trình JuliaSchäfer cho biết thêm, một ngôn ngữ phổ biến dành cho tính toán khoa học cũng được sử dụng trong các lớp đại số tuyến tính giới thiệu của MIT, cung cấp nhiều công cụ giúp nó trở nên vô giá trong việc xây dựng các mô hình tổng quát như vậy.
Các mô hình tổng hợp, giống như các mô hình làm nền tảng cho ChatGPT và Dall-E, thường hoạt động bằng cách ước tính phân bố xác suất của một số dữ liệu mà chúng sử dụng để tạo ra các điểm dữ liệu mới phù hợp với phân phối (chẳng hạn như hình ảnh con mèo mới tương tự với hình ảnh con mèo hiện có) .
Tuy nhiên, khi có sẵn các mô phỏng của một hệ thống vật lý sử dụng các kỹ thuật khoa học đã được thử và đúng, các nhà nghiên cứu sẽ nhận được mô hình phân bố xác suất của nó miễn phí. Phân phối này mô tả số liệu thống kê đo lường của hệ thống vật lý.
Một mô hình hiểu biết hơn
Cái nhìn sâu sắc của nhóm MIT là phân bố xác suất này cũng xác định một mô hình tổng quát mà dựa trên đó một bộ phân loại có thể được xây dựng. Họ cắm mô hình tổng quát vào các công thức thống kê tiêu chuẩn để trực tiếp xây dựng một bộ phân loại thay vì học nó từ các mẫu, như đã được thực hiện với các phương pháp phân biệt đối xử.
“Đây là một cách thực sự hay để kết hợp những điều bạn biết về hệ thống vật lý của mình vào sâu trong sơ đồ học máy của bạn. Nó vượt xa việc chỉ thực hiện kỹ thuật tính năng trên các mẫu dữ liệu của bạn hoặc các thành kiến quy nạp đơn giản,” Schäfer nói.
Trình phân loại tổng quát này có thể xác định hệ thống đang ở pha nào với một số tham số nhất định, như nhiệt độ hoặc áp suất. Và bởi vì các nhà nghiên cứu ước tính trực tiếp các phân bố xác suất cơ bản của các phép đo từ hệ thống vật lý, nên bộ phân loại có kiến thức về hệ thống.
Điều này cho phép phương pháp của họ hoạt động tốt hơn các kỹ thuật học máy khác. Và bởi vì nó có thể hoạt động tự động mà không cần đào tạo chuyên sâu nên phương pháp của họ nâng cao đáng kể hiệu quả tính toán trong việc xác định các chuyển pha.
Vào cuối ngày, tương tự như cách người ta có thể yêu cầu ChatGPT giải một bài toán, các nhà nghiên cứu có thể hỏi các câu hỏi phân loại tổng quát như “mẫu này thuộc về giai đoạn I hay giai đoạn II?” hoặc “mẫu này được tạo ra ở nhiệt độ cao hay nhiệt độ thấp?”
Các nhà khoa học cũng có thể sử dụng phương pháp này để giải các nhiệm vụ phân loại nhị phân khác nhau trong các hệ vật lý, có thể là phát hiện sự vướng víu trong các hệ lượng tử (Trạng thái có bị vướng víu hay không?) hoặc xác định xem lý thuyết A hay B phù hợp nhất để giải quyết một vấn đề cụ thể. Họ cũng có thể sử dụng phương pháp này để hiểu rõ hơn và cải thiện các mô hình ngôn ngữ lớn như ChatGPT bằng cách xác định cách điều chỉnh các tham số nhất định để chatbot mang lại kết quả đầu ra tốt nhất.
Trong tương lai, các nhà nghiên cứu cũng muốn nghiên cứu những đảm bảo về mặt lý thuyết liên quan đến số lượng phép đo họ cần để phát hiện hiệu quả các chuyển pha và ước tính lượng tính toán cần thiết.
Công trình này được tài trợ một phần bởi Quỹ khoa học quốc gia Thụy Sĩ, Quỹ hạt giống Lockheed Martin của MIT-Thụy Sĩ và Sáng kiến khoa học và công nghệ quốc tế MIT.
[ad_2]
Source link