[ad_1]
Chúng ta đều biết rằng “Tương quan không ngụ ý quan hệ nhân quả”. Nhưng tại sao?
Có hai kịch bản chính. Thứ nhất, như minh họa bên dưới trong Trường hợp 1, mối quan hệ tích cực giữa tai nạn đuối nước và doanh số bán kem có thể chỉ là do một nguyên nhân chung: thời tiết. Khi trời nắng, cả hai đều xảy ra, nhưng không có mối liên hệ nhân quả trực tiếp nào giữa tai nạn đuối nước và doanh số bán kem. Đây là những gì chúng ta gọi là tương quan giả tạo. Kịch bản thứ hai được mô tả trong Trường hợp 2. Có tác động trực tiếp của giáo dục đến hiệu suất, nhưng khả năng nhận thức ảnh hưởng đến cả hai. Vì vậy, trong tình huống này, mối tương quan tích cực giữa giáo dục và hiệu suất công việc bị nhầm lẫn với tác động của khả năng nhận thức.
Như tôi đã đề cập trong phần giới thiệu, suy luận dự đoán khai thác các mối tương quan. Vì vậy, bất kỳ ai biết rằng ‘Tương quan không ngụ ý nhân quả’ nên hiểu rằng Học máy không phù hợp với suy luận nhân quả. Doanh số bán kem có thể là dự đoán tốt của nguy cơ tai nạn đuối nước trong cùng ngày ngay cả khi có không có mối liên hệ nhân quả. Mối quan hệ này chỉ mang tính tương quan và được thúc đẩy bởi một nguyên nhân chung: thời tiết.
Tuy nhiên, nếu bạn muốn nghiên cứu tác động nhân quả tiềm tàng của doanh số bán kem đối với các vụ tai nạn đuối nước, bạn phải tính đến biến thứ ba này (thời tiết). Nếu không, ước tính của bạn về mối liên hệ nhân quả sẽ bị sai lệch do Sai lệch biến bị bỏ sót nổi tiếng. Khi bạn đưa biến thứ ba này vào phân tích của mình, bạn chắc chắn sẽ thấy rằng doanh số bán kem không còn ảnh hưởng đến các vụ tai nạn đuối nước nữa. Thông thường, một cách đơn giản để giải quyết vấn đề này là đưa biến này vào mô hình để nó không còn bị “bỏ sót” nữa. Tuy nhiên, các yếu tố gây nhiễu thường không được quan sát thấy, do đó không thể chỉ đơn giản đưa chúng vào mô hình. Suy luận nhân quả có nhiều cách để giải quyết vấn đề về các yếu tố gây nhiễu không được quan sát thấy này, nhưng việc thảo luận về chúng nằm ngoài phạm vi của bài viết này. Nếu bạn muốn tìm hiểu thêm về suy luận nhân quả, bạn có thể làm theo hướng dẫn của tôi tại đây:
Do đó, sự khác biệt cơ bản giữa suy luận nhân quả và suy luận dự đoán là cách bạn chọn “các tính năng”.
Trong Học máy, bạn thường bao gồm các tính năng có thể cải thiện chất lượng dự đoán và thuật toán của bạn có thể giúp chọn các tính năng tốt nhất dựa trên sức mạnh dự đoán. Tuy nhiên, trong suy luận nhân quả, một số tính năng phải được đưa vào bằng mọi giá (yếu tố gây nhiễu/nguyên nhân phổ biến) ngay cả khi sức mạnh dự đoán thấp và hiệu ứng không có ý nghĩa thống kê. Không phải sức mạnh dự đoán của yếu tố gây nhiễu là mối quan tâm chính mà là cách nó ảnh hưởng đến hệ số của nguyên nhân mà chúng ta đang nghiên cứu. Hơn nữa, có những tính năng không nên đưa vào mô hình suy luận nhân quả, ví dụ như các yếu tố trung gian. Một yếu tố trung gian biểu thị một con đường nhân quả gián tiếp và việc kiểm soát các biến như vậy sẽ ngăn cản việc đo lường tổng hiệu ứng nhân quả quan tâm (xem hình minh họa bên dưới). Do đó, sự khác biệt chính nằm ở chỗ việc đưa hay không đưa tính năng vào suy luận nhân quả phụ thuộc vào mối quan hệ nhân quả được giả định giữa các biến.
Đây là một chủ đề tế nhị. Vui lòng tham khảo “Khóa học cấp tốc về các biện pháp kiểm soát tốt và xấu” Cinelli và cộng sự (2002) để biết thêm chi tiết.
Hãy tưởng tượng rằng bạn diễn giải mối liên hệ tích cực giữa doanh số bán kem và tai nạn đuối nước là nguyên nhân. Bạn có thể muốn cấm kem bằng mọi giá. Nhưng tất nhiên, điều đó có khả năng ít hoặc không ảnh hưởng đến kết quả.
Một mối tương quan nổi tiếng là mối tương quan giữa việc tiêu thụ sô cô la và những người đoạt giải Nobel (Messerli (2012)). Tác giả đã tìm thấy hệ số tương quan tuyến tính 0,8 giữa hai biến ở cấp độ quốc gia. Mặc dù điều này nghe có vẻ như là một lập luận tuyệt vời để ăn nhiều sô cô la hơn, nhưng không nên diễn giải theo quan hệ nhân quả. (Lưu ý rằng các lập luận về mối quan hệ nhân quả tiềm tàng được trình bày trong Messerli (2012) đã bị bác bỏ sau đó (ví dụ: P Maurage và cộng sự (2013)).
Bây giờ tôi xin chia sẻ một ví dụ nghiêm túc hơn. Hãy tưởng tượng bạn đang cố gắng tối ưu hóa các bài đăng của một người sáng tạo nội dung. Để làm như vậy, bạn xây dựng một mô hình ML bao gồm nhiều tính năng. Phân tích cho thấy các bài đăng được đăng vào cuối buổi chiều hoặc buổi tối có hiệu suất tốt nhất. Do đó, bạn đề xuất một lịch trình chính xác, trong đó bạn chỉ đăng bài từ 5 giờ chiều đến 9 giờ tối. Sau khi triển khai, lượt hiển thị cho mỗi bài đăng đã giảm mạnh. Điều gì đã xảy ra? Thuật toán ML dự đoán dựa trên các mẫu hiện tại, diễn giải dữ liệu khi nó xuất hiện: các bài đăng được đăng vào cuối ngày có tương quan với lượt hiển thị cao hơn. Cuối cùng, các bài đăng được đăng vào buổi tối là những bài đăng tự phát hơn, ít được lên kế hoạch hơn và tác giả không nhằm mục đích làm hài lòng đối tượng cụ thể mà chỉ chia sẻ điều gì đó có giá trị. Vì vậy, thời điểm không phải là nguyên nhân; mà là bản chất của bài đăng. Bản chất tự phát này có thể khó nắm bắt hơn bằng mô hình ML (ngay cả khi bạn mã hóa một số tính năng như độ dài, giọng điệu, v.v., thì việc nắm bắt điều này có thể không dễ dàng).
Trong tiếp thị, các mô hình dự đoán thường được sử dụng để đo lường ROI của một chiến dịch tiếp thị.
Thông thường, các mô hình như đơn giản Mô hình hóa hỗn hợp tiếp thị (MMM) bị ảnh hưởng bởi sai lệch biến bị bỏ sót và thước đo ROI sẽ bị sai lệch.
Thông thường, hành vi của đối thủ cạnh tranh có thể tương quan với chiến dịch của chúng tôi và cũng ảnh hưởng đến doanh số của chúng tôi. Nếu điều này không được tính đến đúng cách, ROI có thể bị đánh giá thấp hoặc quá cao, dẫn đến các quyết định kinh doanh và chi tiêu quảng cáo không tối ưu.
Khái niệm này cũng quan trọng đối với chính sách và việc ra quyết định. Vào đầu đại dịch Covid-19, một “chuyên gia” người Pháp đã sử dụng một biểu đồ để lập luận rằng lệnh phong tỏa phản tác dụng (xem hình bên dưới). Biểu đồ cho thấy mối tương quan tích cực giữa mức độ nghiêm ngặt của lệnh phong tỏa và số ca tử vong liên quan đến Covid (các lệnh phong tỏa nghiêm ngặt hơn có liên quan đến nhiều ca tử vong hơn). Tuy nhiên, mối quan hệ này rất có thể bị thúc đẩy bởi mối quan hệ nhân quả ngược lại: khi tình hình trở nên tồi tệ (nhiều ca tử vong), các quốc gia sẽ áp dụng các biện pháp nghiêm ngặt. Điều này được gọi là nguyên nhân ngược. Thật vậy, khi bạn nghiên cứu đúng cách quỹ đạo của số ca bệnh và ca tử vong trong một quốc gia xung quanh lệnh phong tỏa, kiểm soát các yếu tố gây nhiễu tiềm ẩn, bạn sẽ thấy một tác động tiêu cực mạnh (so sánh Bonardi và cộng sự (2023)).
Học máy và suy luận nhân quả đều rất hữu ích; chúng chỉ phục vụ những mục đích khác nhau.
Như thường lệ với các con số và thống kê, hầu hết thời gian vấn đề không phải là số liệu mà là cách diễn giải chúng. Do đó, mối tương quan mang tính thông tin, nó chỉ trở thành vấn đề nếu bạn diễn giải nó một cách mù quáng như một hiệu ứng nhân quả.
Khi nào sử dụng suy luận nhân quả: Khi bạn muốn hiểu mối quan hệ nhân quả và đánh giá tác động.
- Đánh giá chính sách: Để xác định tác động của chính sách mới, chẳng hạn như tác động của chương trình giáo dục mới đến kết quả học tập của học sinh.
- Nghiên cứu y học: Để đánh giá hiệu quả của một loại thuốc hoặc phương pháp điều trị mới đối với sức khỏe.
- Kinh tế học: Để hiểu tác động của việc thay đổi lãi suất đến các chỉ số kinh tế như lạm phát hoặc việc làm.
- Tiếp thị: Để đánh giá tác động của chiến dịch tiếp thị đến doanh số bán hàng.
Những câu hỏi chính trong suy luận nhân quả:
- Tác dụng của X lên Y là gì?
- Liệu việc thay đổi X có dẫn tới sự thay đổi của Y không?
- Điều gì sẽ xảy ra với Y nếu chúng ta can thiệp vào X?
Khi nào sử dụng suy luận dự đoán:Khi bạn muốn thực hiện dự đoán chính xác (liên kết giữa các tính năng và kết quả) và tìm hiểu các mô hình từ dữ liệu.
- Đánh giá rủi ro: Để dự đoán khả năng vỡ nợ tín dụng hoặc yêu cầu bảo hiểm.
- Hệ thống đề xuất: Gợi ý sản phẩm hoặc nội dung cho người dùng dựa trên hành vi trước đây của họ.
- Chẩn đoán: Phân loại hình ảnh y tế để phát hiện bệnh.
Những câu hỏi chính cho suy luận dự đoán:
- Giá trị mong đợi của Y khi biết X là bao nhiêu?
- Chúng ta có thể dự đoán Y dựa trên dữ liệu mới về X không?
- Chúng ta có thể dự báo Y chính xác đến mức nào khi sử dụng dữ liệu hiện tại và lịch sử về X?
[ad_2]
Source link