[ad_1]
Trường hợp sử dụng của bạn có phải là sản phẩm ML khả thi theo góc nhìn ML truyền thống và sản xuất không?
Bạn đã bao giờ nghĩ đến việc xây dựng một ứng dụng dữ liệu nhưng không biết các yêu cầu để xây dựng một hệ thống ML chưa? Hoặc có thể bạn là một quản lý cấp cao tại công ty của mình với tham vọng sử dụng ML nhưng bạn không chắc chắn liệu trường hợp sử dụng của mình có thân thiện với ML hay không.
Nhiều doanh nghiệp đang phải vật lộn để theo kịp tốc độ tăng trưởng theo cấp số nhân của công nghệ AI/ML, nhiều doanh nghiệp nhận thức được rằng việc không đưa AI/ML vào lộ trình của họ có thể dẫn đến những hậu quả nghiêm trọng.
Các công ty nhìn thấy sức mạnh của Mô hình ngôn ngữ lớn (LLM) và nghĩ rằng AI/ML là một ‘viên đạn bạc’ cho các vấn đề của họ. Hầu hết các doanh nghiệp đang chi tiền cho các nhóm dữ liệu mới, sức mạnh tính toán và công nghệ cơ sở dữ liệu mới nhất, nhưng họ có biết liệu vấn đề của họ có thể được giải quyết bằng ML không?
Tôi đã chắt lọc một danh sách kiểm tra để xác thực xem ý tưởng ML của bạn có khả thi hay không góc nhìn ML truyền thống bao gồm:
1. Bạn có đủ các đặc điểm phù hợp để đưa ra dự đoán không?
2. Có mẫu nào có thể học được từ dữ liệu của bạn không?
3. Bạn có đủ dữ liệu để ML có hiệu quả không hay bạn có thể thu thập dữ liệu từ các nguồn không?
4. Trường hợp sử dụng của bạn có thể được định hình như một vấn đề dự đoán không?
5. Dữ liệu bạn muốn dự đoán có liên quan đến các mẫu dữ liệu đào tạo không?
Và, theo quan điểm của sản xuất các giải pháp ML:
1. Trường hợp sử dụng của bạn có lặp lại không?
2. Liệu những dự đoán sai có gây ra hậu quả nghiêm trọng cho người dùng cuối không?
3. Trường hợp sử dụng của bạn có khả năng mở rộng không?
4. Trường hợp sử dụng của bạn có phải là vấn đề mà các mẫu liên tục thay đổi không?
Arthur Samuel là người đầu tiên phổ biến cụm từ này ‘Học máy’ vào năm 1959 tuyên bố rằng “lĩnh vực nghiên cứu cung cấp cho máy tính khả năng học tập mà không cần được lập trình rõ ràng”.
Một định nghĩa có hệ thống hơn về ML được Chip Huyền đưa ra — một nhà lãnh đạo và doanh nhân AI/ML — trong cuốn sách của cô ấy ‘Thiết kế hệ thống học máy’ — một bài đọc bắt buộc đối với bất kỳ ai quan tâm đến ML sản xuất:
“Học máy là một phương pháp để (1) tìm hiểu (2) các mẫu phức tạp từ (3) dữ liệu hiện có và sử dụng các mẫu này để đưa ra (4) dự đoán về (5) dữ liệu chưa thấy.”
Chip chia nhỏ các thành phần của ML thành năm phần và mở rộng chúng bằng cách đưa vào bốn lý do hiện đại để áp dụng ML mà chúng ta sẽ phân tích kỹ hơn bên dưới.
Cơ hội để học hỏi
Bạn có đủ các đặc điểm phù hợp để đưa ra dự đoán không?
Dữ liệu là nền tảng của ML. Nó cung cấp cả đầu vào và đầu ra, tạo ra dự đoán phản ánh các mô hình với dữ liệu.
Ví dụ, bạn có thể là một người hâm mộ bóng đá cuồng nhiệt và bạn muốn dự đoán giá trị thị trường cầu thủ Premier League dựa trên hiệu suất trong quá khứ
Dữ liệu đầu vào sẽ bao gồm số liệu thống kê của cầu thủ như bàn thắng và hỗ trợ, và giá trị cầu thủ liên quan. Một mô hình ML có thể học các mẫu từ dữ liệu đầu vào này để dự đoán dữ liệu cầu thủ chưa được biết đến.
Các mẫu phức tạp
Có mẫu nào có thể học được từ dữ liệu của bạn không?
ML phát huy hiệu quả tốt nhất khi dữ liệu phức tạp và con người không thể dễ dàng xác định được các mẫu cần thiết để dự đoán đầu ra.
Trong ví dụ về giá trị thị trường của cầu thủ bóng đá, có thể khó để nói chính xác giá trị của một cầu thủ bóng đá vì có nhiều biến số mà giá trị phụ thuộc vào. Các mô hình ML có thể lấy giá trị (đầu ra) và số liệu thống kê hiệu suất (đầu vào) và tự động tính ra giá trị định giá.
Tính khả dụng của dữ liệu
Bạn có đủ dữ liệu để ML có hiệu quả không hay bạn có thể thu thập dữ liệu từ các nguồn không?
Có một cuộc tranh luận đang diễn ra về việc liệu dữ liệu hay thuật toán tốt hơn có dẫn đến sức mạnh dự đoán lớn hơn hay không. Mặc dù, cuộc tranh luận này đã lắng xuống gần đây khi xem xét những bước nhảy vọt về hiệu suất của LLM khi kích thước tập dữ liệu tăng lên hàng trăm tỷ, thậm chí hàng nghìn tỷ tham số.
Dữ liệu cần phải có sẵn để ứng dụng ML của bạn có thể học hỏi. Nếu dữ liệu khan hiếm, thì ML có thể không phải là phương pháp tốt nhất.
Trong bóng đá, dữ liệu liên tục được tạo ra về hiệu suất của cầu thủ bởi các nhà cung cấp dữ liệu như Opta, Tài liệu tham khảoVà Chuyển nhượng thị trường khi các đội tìm cách áp dụng các quyết định dựa trên dữ liệu vào mọi khía cạnh của câu lạc bộ, từ hiệu suất của cầu thủ đến tuyển dụng.
Tuy nhiên, việc thu thập dữ liệu từ bên thứ ba như Opta rất tốn kém do quá trình thu thập dữ liệu rất phức tạp và nhu cầu cao về số liệu thống kê chi tiết để mang lại lợi thế cho các đội.
Vấn đề được giải quyết bằng dự đoán
Trường hợp sử dụng của bạn có thể được coi là một vấn đề dự đoán không?
Chúng ta có thể định hình ví dụ về giá trị thị trường của cầu thủ bóng đá như một bài toán dự đoán theo nhiều cách.
Hai hướng chung của dự đoán ML là hồi quy Và phân loại. Hồi quy trả về một tiếp diễn dự đoán (tức là một con số) trong cùng một thang đo như biến đầu vào (tức là giá trị). Trong khi đó, phân loại có thể trả về một nhị phân (1 hoặc 0), nhiều lớp (1, 2, 3…n), hoặc đa nhãn (1, 0, 1, 0, 1) dự đoán.
Vấn đề dự đoán giá trị cầu thủ có thể được định hình như một vấn đề hồi quy và đa lớp. Hồi quy chỉ trả về một con số như dự đoán giá trị của Jude Bellingham là 100 triệu bảng Anh dựa trên thành tích mùa giải của anh ấy.
Ngược lại, nếu chúng ta giải quyết vấn đề này như một vấn đề phân loại, chúng ta có thể phân loại định giá thành các nhóm và dự đoán nhóm định giá mà một cầu thủ nằm trong đó. Ví dụ, nhóm dự đoán có thể là 1 triệu bảng Anh – 10 triệu bảng Anh, 10 triệu bảng Anh – 30 triệu bảng Anh và 30 triệu bảng Anh trở lên.
Dữ liệu tương tự chưa thấy
Dữ liệu bạn muốn dự đoán có liên quan đến các mẫu dữ liệu đào tạo không?
Dữ liệu chưa biết mà bạn muốn dự đoán phải có các mẫu tương tự với dữ liệu được sử dụng để đào tạo mô hình ML.
Ví dụ, nếu tôi sử dụng dữ liệu cầu thủ từ năm 2004 để đào tạo mô hình ML nhằm dự đoán định giá cầu thủ. Nếu dữ liệu chưa thấy là từ năm 2020, thì dự đoán sẽ không phản ánh những thay đổi trong định giá thị trường trong 16 năm từ khi đào tạo đến khi dự đoán.
Phát triển mô hình ML chỉ là một phần nhỏ trong một hệ thống lớn hơn nhiều cần thiết để hiện thực hóa ML.
Nếu bạn xây dựng một mô hình riêng lẻ mà không hiểu mô hình đó sẽ hoạt động như thế nào ở quy mô lớn thì khi đưa vào sản xuất, bạn có thể thấy mô hình của mình không khả thi.
Điều quan trọng là trường hợp sử dụng ML của bạn có thể kiểm tra các tiêu chí ở cấp độ sản xuất.
Công việc lặp đi lặp lại
Trường hợp sử dụng của bạn có lặp lại không?
ML cần phải lặp lại các mẫu để học. Các mô hình cần được cung cấp một số lượng lớn mẫu để học đầy đủ các mẫu, nghĩa là nếu mục tiêu dự đoán của bạn xảy ra thường xuyên, bạn có thể sẽ có dữ liệu tốt mà ML có thể học các mẫu.
Ví dụ, nếu trường hợp sử dụng của bạn liên quan đến việc cố gắng dự đoán điều gì đó hiếm khi xảy ra, như tình trạng bệnh lý không phổ biến, thì có khả năng là dữ liệu của bạn không có đủ tín hiệu để mô hình ML phát hiện, dẫn đến dự đoán kém.
Vấn đề này được gọi là mất cân bằng lớpvà các chiến lược như lấy mẫu quá mức và lấy mẫu dưới mức đã được phát triển để khắc phục vấn đề này.
Bài viết của Travis Tang đã giải thích rất hay về sự mất cân bằng giai cấp và các biện pháp khắc phục chi tiết hơn đây.
Hậu quả nhỏ cho dự đoán sai
Liệu những dự đoán sai có gây ra hậu quả nghiêm trọng cho người dùng không?
Các mô hình ML sẽ khó có thể dự đoán chính xác 100% mọi lúc, điều đó có nghĩa là khi mô hình của bạn đưa ra dự đoán sai, liệu nó có gây ra tác động tiêu cực không?
Đây là vấn đề thường gặp trong ngành y tế, nơi tỷ lệ dương tính giả và âm tính giả là mối quan tâm.
Một dự đoán dương tính giả chỉ ra sự hiện diện của một điều kiện khi nó không làm tồn tại. Điều này có thể dẫn đến việc phân bổ nguồn lực không hiệu quả và gây căng thẳng không đáng có cho bệnh nhân.
Có lẽ tệ hơn nữa, một kết quả âm tính giả không chỉ ra sự hiện diện của một tình trạng khi nó làm tồn tại. Điều này có thể dẫn đến việc chẩn đoán sai bệnh nhân và trì hoãn điều trị, có thể dẫn đến các biến chứng y khoa và tăng chi phí lâu dài để điều trị các tình trạng bệnh nghiêm trọng hơn.
Tỉ lệ
Trường hợp sử dụng của bạn có khả năng mở rộng không?
Chi phí sản xuất có thể cực kỳ tốn kém, bản thân tôi đã thấy điều này khi tôi tổ chức một XGBRegressor mô hình trên Google Đỉnh AI tốn 11 bảng Anh cho 2 ngày! Phải thừa nhận là tôi không nên để nó chạy, nhưng hãy tưởng tượng đến chi phí cho các ứng dụng quy mô lớn.
Một ví dụ nổi tiếng về giải pháp ML có khả năng mở rộng là hệ thống đề xuất sản phẩm của Amazon tạo ra 35% doanh thu của công ty.
Mặc dù là một ví dụ cực đoan, nhưng hệ thống này tận dụng và chứng minh được chi phí cho sức mạnh tính toán, dữ liệu, cơ sở hạ tầng và nhân lực tài năng, minh họa cho những nguyên tắc cơ bản của việc xây dựng giải pháp ML có khả năng mở rộng và tạo ra giá trị.
Các mẫu tiến hóa
Trường hợp sử dụng của bạn có phải là vấn đề mà các mẫu liên tục thay đổi không?
ML đủ linh hoạt để dễ dàng áp dụng các mô hình mới và ngăn chặn nhu cầu phải mã hóa cứng các giải pháp mới mỗi khi dữ liệu thay đổi.
Giá trị của cầu thủ bóng đá liên tục thay đổi khi chiến thuật thay đổi dẫn đến những thay đổi trong mong muốn của các đội bóng đối với cầu thủ, nghĩa là các đặc điểm sẽ thay đổi trong việc dự đoán giá trị.
Để theo dõi những thay đổi, các công cụ như Dòng chảy Và Trọng số & Độ lệch giúp theo dõi và ghi lại hiệu suất của các mô hình của bạn và cập nhật chúng để phù hợp với các mẫu dữ liệu đang phát triển.
Quyết định sử dụng ML cho trường hợp sử dụng của bạn cần cân nhắc nhiều hơn là chỉ sử dụng một số dữ liệu lịch sử bạn có, áp dụng một thuật toán phức tạp vào đó và hy vọng điều tốt nhất.
Nó đòi hỏi phải suy nghĩ về các mô hình phức tạp nếu bạn có dữ liệu hiện tại và trong tương lai, cũng như các mối quan tâm về sản xuất như chi phí cho một dự đoán sai có rẻ không? Trường hợp sử dụng của tôi có thể mở rộng quy mô không? Và các mô hình có liên tục phát triển không?
Có những lý do khiến bạn KHÔNG NÊN sử dụng ML, bao gồm vấn đề đạo đức, hiệu quả về mặt chi phí và liệu một giải pháp đơn giản hơn có đủ hay không, nhưng chúng ta có thể để dành vấn đề đó cho lần sau.
Vậy là hết!
Cảm ơn bạn đã đọc! Hãy cho tôi biết nếu tôi bỏ sót điều gì và tôi rất muốn nghe mọi người chia sẻ về các trường hợp sử dụng ML của họ!
Kết nối với tôi trên Linkedin
Người giới thiệu
Huyền, C. (2022). Thiết kế hệ thống học máy. Sebastopol, CA: O’Reilly
Geron, A. (2019). Học máy thực hành với Scikit-Be taught, Keras và TensorFlow: các khái niệm, công cụ và kỹ thuật để xây dựng các hệ thống thông minh (ấn bản lần 2). O’Reilly.
[ad_2]
Source link