[ad_1]
Những lỗi thường gặp với phản hồi tốt và xấu
#1 Nhảy thẳng vào mô hình
Một số ứng viên chuyển thẳng sang thuật toán ML mà họ sẽ sử dụng để giải quyết vấn đề mà không cần nêu rõ trước về ứng dụng kinh doanh, mục tiêu của giải pháp và các thước đo thành công.
Phản ứng xấu: “Để phát hiện gian lận, tôi sẽ sử dụng mạng lưới thần kinh sâu vì nó rất mạnh.”
Phản hồi tốt: “Liệu giải pháp này có được sử dụng để phát hiện gian lận theo thời gian thực trong mỗi lần quẹt thẻ không? Điều này có nghĩa là chúng ta cần một mô hình nhanh chóng và hiệu quả. Hãy để tôi xác định tất cả dữ liệu tôi có thể sử dụng cho mô hình này. Đầu tiên, tôi có siêu dữ liệu giao dịch như số tiền, địa điểm và thời gian giao dịch. Tôi cũng có dữ liệu giao dịch trước đây của thẻ này — tôi có thể tra cứu trước tối đa 30 ngày để giảm lượng dữ liệu tôi cần phân tích trong thời gian thực hoặc tôi có thể tính toán trước các đặc điểm phân loại/nhị phân dẫn xuất từ lịch sử giao dịch, chẳng hạn như ‘is_transaction_30_days’, ‘most_frequent_transaction_location_30days’, v.v. Ban đầu, tôi sẽ sử dụng hồi quy logistic để đặt đường cơ sở trước khi xem xét các mô hình phức tạp hơn như mạng nơ-ron sâu nếu cần.”
#2 Giữ nó ở mức quá cao
Bạn không chỉ muốn đưa ra một chiến lược soạn sẵn mà còn đưa ra các ví dụ cụ thể ở mỗi bước có liên quan đến vấn đề kinh doanh nhất định.
Phản ứng xấu: “Tôi sẽ thực hiện phân tích dữ liệu khám phá, loại bỏ các ngoại lệ và xây dựng mô hình để dự đoán mức độ tương tác của người dùng.”
Phản hồi tốt: “Tôi sẽ phân tích dữ liệu lịch sử của người dùng, bao gồm lượt xem trang, tỷ lệ nhấp và thời gian dành cho trang net. Tôi sẽ phân tích các đặc điểm phân loại như danh mục sản phẩm, thương hiệu và xóa chúng nếu thiếu hơn 75% giá trị. Nhưng tôi sẽ thận trọng ở bước này vì việc thiếu một số tính năng đôi khi cũng có thể mang lại rất nhiều thông tin. Mô hình hồi quy logistic có thể đóng vai trò là điểm khởi đầu, tiếp theo là các mô hình phức tạp hơn như Rừng ngẫu nhiên nếu cần.”
#3 Chỉ giải quyết trường hợp vui
Không khó để nhận ra sự thiếu kinh nghiệm trong ngành nếu ứng viên chỉ nói về chiến lược dữ liệu và mô hình hóa mà không thảo luận về các vấn đề chất lượng dữ liệu hoặc các sắc thái khác được thấy trong dữ liệu và ứng dụng trong thế giới thực.
Phản ứng xấu: “Tôi sẽ đào tạo trình phân loại bằng cách sử dụng các lần nhấp vào mục người dùng trong quá khứ cho một truy vấn tìm kiếm nhất định để dự đoán lần nhấp vào quảng cáo.”
Phản hồi tốt: “Các lần nhấp vào mục của người dùng trong quá khứ cho truy vấn vốn có thể có sai lệch vị trí vì các mục được hiển thị ở vị trí cao hơn trong kết quả tìm kiếm có nhiều khả năng được nhấp vào hơn. Tôi sẽ sửa sai lệch vị trí này bằng cách sử dụng xu hướng có trọng số nghịch đảo bằng cách ước tính xác suất nhấp chuột trên mỗi vị trí (xu hướng), sau đó cân nhắc tất cả các nhãn theo vị trí đó.”
#4 Bắt đầu với những mô hình phức tạp nhất
Bạn muốn thể hiện sự thiên vị đối với hành động bằng cách sử dụng các mô hình nhẹ, dễ phát triển, ít tốn kém và tốn thời gian và giới thiệu độ phức tạp khi cần thiết.
Phản ứng xấu: “Tôi sẽ sử dụng kiến trúc deep studying mã hóa kép hiện đại nhất cho hệ thống đề xuất.”
Phản hồi tốt: “Tôi sẽ bắt đầu với phương pháp lọc cộng tác đơn giản để thiết lập đường cơ sở. Khi chúng tôi hiểu được hiệu suất của nó, chúng tôi có thể giới thiệu độ phức tạp với hệ số ma trận hoặc các mô hình học sâu như bộ mã hóa kép nếu kết quả ban đầu cho thấy cần thiết.”
#5 Không xoay người khi ném bóng cong
Người phỏng vấn có thể làm gián đoạn chiến lược của bạn và đặt các câu hỏi tiếp theo hoặc đề xuất các tình huống thay thế để hiểu sâu hơn về hiểu biết của bạn về các kỹ thuật khác nhau. Bạn sẽ có thể điều chỉnh chiến lược của mình khi chúng đưa ra những thách thức hoặc biến thể mới.
Phản ứng xấu: “Nếu chúng tôi không có quyền truy cập vào Thông tin nhận dạng cá nhân cho người dùng, chúng tôi không thể xây dựng mô hình được cá nhân hóa.”
Phản hồi tốt: “Đối với những người dùng chọn không tham gia (hoặc không chọn tham gia) chia sẻ PII hoặc dữ liệu tương tác trong quá khứ của họ, chúng tôi có thể coi họ là những người dùng mới bắt đầu và hiển thị cho họ các đề xuất dựa trên mức độ phổ biến. Chúng tôi cũng có thể bao gồm RNN phiên trực tuyến để điều chỉnh các đề xuất dựa trên hoạt động trong phiên của họ.”
Hiệu chỉnh phản hồi theo cấp độ
Khi cấp độ công việc tăng lên, kỳ vọng về chiều rộng và chiều sâu trong phản hồi cũng tăng lên. Điều này được giải thích tốt nhất thông qua một câu hỏi ví dụ. Giả sử bạn được yêu cầu thiết kế hệ thống phát hiện gian lận cho nền tảng thanh toán trực tuyến.
Trình độ đầu vào (0–2 năm kinh nghiệm trong ngành liên quan)
Ở cấp độ này, ứng viên nên tập trung vào dữ liệu (tính năng, kỹ thuật tiền xử lý), mô hình (mô hình cơ sở đơn giản, mô hình nâng cao hơn, hàm mất mát, phương pháp tối ưu hóa) và số liệu đánh giá (số liệu ngoại tuyến, thiết kế thử nghiệm A/B). Một dòng chảy tốt sẽ là:
- Xác định các tính năng và xử lý trước: ví dụ: số tiền giao dịch, địa điểm, thời gian trong ngày và các tính năng phân loại khác thể hiện lịch sử thanh toán.
- Mô hình cơ sở và mô hình nâng cao: ví dụ: mô hình hồi quy logistic làm đường cơ sở, xem xét cây tăng cường độ dốc cho phiên bản tiếp theo.
- Các chỉ số đánh giá: ví dụ: độ chính xác, thu hồi, điểm F1.
Kinh nghiệm cấp trung (3–6 năm kinh nghiệm trong ngành liên quan)
Ở cấp độ này, ứng viên nên tập trung vào vấn đề kinh doanh và các sắc thái trong việc triển khai các mô hình trong sản xuất. Một dòng chảy tốt sẽ là:
- Yêu cầu kinh doanh: ví dụ: cân bằng giữa khả năng thu hồi và độ chính xác vì chúng tôi muốn giảm số lượng gian lận trong khi vẫn giữ tỷ lệ dương tính giả ở mức thấp để có trải nghiệm người dùng tốt hơn; nhấn mạnh sự cần thiết của các mô hình có thể giải thích được.
- Sắc thái dữ liệu: ví dụ: số lượng giao dịch gian lận ít hơn nhiều so với giao dịch không lừa đảo, có thể giải quyết sự mất cân bằng lớp bằng cách sử dụng các kỹ thuật như SMOTE.
- Sự cân bằng mô hình: ví dụ: mô hình cơ sở dựa trên kinh nghiệm, tiếp theo là hồi quy logistic, tiếp theo là mô hình dựa trên cây vì chúng dễ diễn giải hơn so với hồi quy logistic sử dụng các phép biến đổi tính năng phi tuyến tính khó diễn giải.
- Thảo luận về các sắc thái triển khai: ví dụ: xử lý giao dịch theo thời gian thực và nhịp làm mới mô hình để thích ứng với các mô hình gian lận đang phát triển.
Cấp cao/Nhân viên/Hiệu trưởng Kinh nghiệm (6 năm trở lên)
Đối với cấp độ này, ứng viên phải sử dụng kinh nghiệm nhiều năm của mình để suy nghĩ chín chắn về hệ sinh thái rộng lớn hơn, xác định những thách thức cốt lõi trong không gian này và nêu bật cách các hệ thống con ML khác nhau có thể kết hợp với nhau để giải quyết vấn đề lớn hơn. Giải quyết các thách thức như xử lý dữ liệu theo thời gian thực và đảm bảo độ bền của mô hình trước các cuộc tấn công đối nghịch. Đề xuất cách tiếp cận nhiều lớp: các hệ thống dựa trên quy tắc để gắn cờ ngay lập tức và các mô hình học sâu để nhận dạng mẫu. Bao gồm các vòng phản hồi và kế hoạch giám sát để đảm bảo mô hình thích ứng với các hình thức gian lận mới. Ngoài ra, hãy thể hiện rằng bạn luôn cập nhật các xu hướng mới nhất của ngành ở bất kỳ nơi nào có thể áp dụng (ví dụ: sử dụng GPU, học biểu diễn, học tăng cường, điện toán biên, ML liên kết, xây dựng mô hình không có dữ liệu PII, tính công bằng và sai lệch trong ML, v.v.)
[ad_2]
Source link