[ad_1]
Bạn đã bao giờ tự hỏi cần những gì để thành công với tư cách là một kỹ sư học máy chưa? Bạn có gặp khó khăn trong việc xác định vai trò của mình trong lĩnh vực năng động này không? Tôi cũng từng trải qua điều đó!
Xin chào! Tôi là Kartik Singhal, Kỹ sư học máy cao cấp tại Meta. Với sáu năm kinh nghiệm trong lĩnh vực này, tôi vẫn thấy mình học hỏi mỗi ngày. Hôm nay, tôi sẽ chia sẻ năm mẹo đã giúp tôi đạt được xếp hạng ‘vượt quá mong đợi’ với tư cách là kỹ sư học máy cao cấp tại BigTech.
Bạn cần hiểu rõ về những nguyên tắc cơ bản của máy học và nhận thức được những hạn chế của nó trong các ứng dụng thực tế.
Hiểu các khái niệm cốt lõi:
- Nắm bắt những kiến thức cơ bản về học có giám sát so với học không giám sát, phân loại so với hồi quy và các nguyên tắc cơ bản của học sâu.
- Việc biết số liệu đo lỗi, hàm mục tiêu và những hạn chế của từng phương pháp là rất quan trọng.
Mẹo chuyên nghiệp:
Bắt đầu với Coursera Học máy giới thiệu cho bạn tất cả các khái niệm cốt lõi.
Tôi cũng khuyên bạn nên xem “Cuốn sách Machine Studying dày một trăm trang” Và “Kỹ thuật học máy” qua Andriy Burkov để tìm hiểu thêm về ứng dụng máy học.
Kiểm tra coursera Chuyên ngành Học sâu nếu bạn quan tâm nhiều hơn đến học sâu. Khuyến nghị nên nắm vững những kiến thức cơ bản về ML với khóa học cơ bản trước khi học khóa này.
Tìm hiểu về thư viện:
- Có hiểu biết về các thư viện ML cốt lõi như TensorFlow, PyTorch và scikit-learn.
- Làm việc trên các dự án nhỏ trên các nền tảng như Kaggle sẽ giúp bạn làm quen với các thư viện này ngay từ đầu sự nghiệp.
Mẹo chuyên nghiệp:
Rất khuyến khích educative.io Kỹ sư học máy Khóa học giới thiệu hầu hết các thư viện và chức năng.
Cập nhật thông tin nghiên cứu mới nhất
Cập nhật những nghiên cứu mới nhất trong lĩnh vực của bạn bằng cách đọc các bài báo gần đây và tham dự các hội nghị như KDD. Điều này sẽ giúp bạn tự tin hơn và nắm bắt được xu hướng hiện tại.
Vì tôi quan tâm đến các ứng dụng NLP trong Tìm kiếm, tôi đã làm quen với các bài báo mang tính bước ngoặt như Từ2Vec, BERT và những phát triển mới nhất trong các mô hình ngôn ngữ lớn.
Với tư cách là MLE, hãy tập trung vào điểm mạnh của bạn và tìm kiếm sự trợ giúp trong những lĩnh vực mà bạn ít kinh nghiệm hơn. Sau đây là một số trách nhiệm chính mà bạn có thể thực hiện:
1) Kỹ thuật dữ liệu và tính năng: Bạn thường cần phải tự tìm và chuẩn bị dữ liệu của mình. Điều này bao gồm:
- Hiểu vấn đề:Nắm bắt vấn đề và xác định dữ liệu nào là quan trọng nhất.
- Xác định nguồn dữ liệu: Tìm kiếm các nguồn dữ liệu thô có liên quan
- Tiền xử lý dữ liệu: Làm sạch và định dạng dữ liệu để có thể sử dụng được.
2) Mô hình hóa:Điều này liên quan đến việc biến dữ liệu thành thông tin chi tiết có thể hành động được bằng cách sử dụng các mô hình ML. Các bước chính bao gồm:
- Hiểu về miền: Hãy nghiên cứu về lĩnh vực bạn đang làm việc. Mỗi lĩnh vực đều có những thách thức riêng.
- Công thức hóa vấn đề: Xác định những gì bạn đang tối ưu hóa và hàm mục tiêu bạn cần sử dụng.
- Tạo đường cơ sở: Xác định hiệu suất tối thiểu có thể chấp nhận được cho dự án của bạn.
- Mô hình đào tạo: Tìm kiếm và đào tạo các mô hình phù hợp.
3) Triển khai mô hình và khả năng mở rộng:
- Hiểu về quy mô: Biết quy mô mà mô hình sẽ hoạt động và công nghệ nào bạn cần để đáp ứng các yêu cầu đó. Có một số công nghệ như Amazon Sagemaker và Tensorflow Serving cung cấp các khuôn khổ triển khai mô hình quy mô lớn.
- Sự mạnh mẽ: Đảm bảo suy luận của mô hình tích hợp tốt với các hệ thống hiện có và có thể xử lý lưu lượng truy cập thực tế.
- Mẹo chuyên nghiệp: Kiểm tra Udacity Kỹ sư học máy Nano-degree cho các triển khai sử dụng Sagemaker. Đối với Tensorflow Serving, người dùng của họ hướng dẫn khá tốt.
Cá nhân tôi đã vật lộn với điều này và tôi biết nhiều MLE cũng vậy. Chúng tôi thường cải thiện các mô hình mà không xem xét các mục tiêu kinh doanh. Việc căn chỉnh với các mục tiêu này đảm bảo các dự án đáp ứng được kỳ vọng và mang lại giá trị.
- Xác định mục tiêu kinh doanh hoặc mục tiêu của người dùng:Hiểu được mục tiêu kinh doanh — doanh thu, trải nghiệm của người dùng, giảm gian lận, v.v.
- Xác định một câu lệnh vấn đề: Soạn thảo một tuyên bố vấn đề phù hợp với mục tiêu kinh doanh.
Ví dụ:Để tăng số lượng phiên người dùng trong dịch vụ phát trực tuyến (mục tiêu kinh doanh), tối ưu hóa tỷ lệ nhấp chuột để cải thiện mức độ tương tác của người dùng (tuyên bố vấn đề).
- Xác thực Giả thuyết với Dữ liệu: Hỗ trợ vấn đề của bạn bằng cách phân tích dữ liệu.
Ví dụ:Đối với hệ thống đề xuất tối ưu hóa tỷ lệ nhấp chuột, hãy phân tích dữ liệu tương tác của người dùng để xác định các mẫu hình và sở thích.
- Hiểu những hạn chế: Chọn mô hình phù hợp với lĩnh vực và nhu cầu kinh doanh.
Ví dụ:Nếu mục tiêu là cung cấp sự minh bạch cho người bán về tính năng sản phẩm nào thúc đẩy doanh số bán hàng trên nền tảng thương mại điện tử, thì một mô hình đơn giản hơn, dễ diễn giải hơn như cây quyết định có thể phù hợp hơn so với mô hình học sâu.
Bạn có thể triển khai một mô hình ngôn ngữ lớn (LLM) với hàng triệu tham số trong một ứng dụng hướng đến người dùng với độ trễ 100 ms không? Có lẽ là không. Các ràng buộc về tài nguyên là những cân nhắc quan trọng và thường bị bỏ qua.
- Sự đánh đổi: Hiểu được sự đánh đổi của dự án và đặt ra các mốc quan trọng rõ ràng. Cân bằng thời gian, nguồn lực và hiệu suất mô hình.
Ví dụ:Lựa chọn giữa dự án kéo dài một năm với bốn kỹ sư để phát triển một mô hình phức tạp đạt hiệu suất cao hoặc dự án kéo dài sáu tháng với hai kỹ sư với hiệu suất mô hình thấp hơn một chút dựa trên mục tiêu và kết quả của dự án.
- Lợi tức đầu tư: Đánh giá lợi tức đầu tư cho các mô hình của bạn. Chọn các mô hình cân bằng hiệu suất với hạn chế ngân sách.
Ví dụ:Nếu một mô hình hiện đại đòi hỏi hàng trăm GPU, nhưng một mô hình đơn giản hơn có thể chạy hiệu quả trên ít tài nguyên hơn, thì mô hình sau có thể thực tế hơn.
- Quá trình lặp lại:Bắt đầu với các mô hình tiết kiệm tài nguyên và cải thiện chúng theo từng bước.
Học máy là thử nghiệm và lặp đi lặp lại. Bạn bắt đầu với một vấn đề mơ hồ, xây dựng giả thuyết, triển khai giải pháp, học hỏi và tinh chỉnh.
- Sự thẩm định: Nghiên cứu và phân tích miền một cách kỹ lưỡng để dự đoán và giảm thiểu những bất ngờ tiềm ẩn.
- Học hỏi từ phản hồi:Sử dụng phản hồi của người dùng và số liệu hiệu suất để cải thiện mô hình liên tục.
- Học hỏi từ những thất bại: Phân tích những thất bại của bản thân và của người khác để xác định điểm yếu, cải thiện cấu trúc mô hình và hiểu rõ các vấn đề về tập dữ liệu.
Xây dựng các mối quan hệ trong ngành có thể đẩy nhanh quá trình học tập của bạn, mở ra những cơ hội mới và cung cấp sự hỗ trợ có giá trị trong suốt sự nghiệp của bạn.
- Tìm kiếm và trở thành người cố vấn: Tìm người cố vấn để được hướng dẫn và cố vấn cho người khác để củng cố kiến thức của bạn. Có sự hỗ trợ cố vấn mạnh mẽ ngay từ đầu sự nghiệp đã giúp tôi vượt qua những trở ngại.
- Mạng lưới hoạt động tích cực: Tham dự các hội nghị, buổi gặp mặt và hội thảo trên net. Tham gia cộng đồng trực tuyến để cập nhật và chia sẻ kiến thức.
Như một lưu ý chia tay, tôi muốn nói rằng tôi không cho rằng mình có tất cả các câu trả lời, nhưng tôi tin vào sức mạnh của việc học tập liên tục và chia sẻ kiến thức. Bài viết này là cách tôi thực hiện điều đó. Tôi cam kết xuất bản các bài viết là nguồn tài nguyên có giá trị cho bất kỳ ai quan tâm đến máy học, từ người mới bắt đầu đến các chuyên gia giai đoạn đầu. Sự hỗ trợ và phản hồi của bạn sẽ vô cùng quý giá. Cảm ơn bạn đã đọc.
[ad_2]
Source link