[ad_1]
Khi nghĩ về những thách thức liên quan đến việc tìm hiểu các hệ thống phức tạp, tôi thường nghĩ lại những điều đã xảy ra trong thời gian tôi làm việc tại Tripadvisor. Tôi đang giúp nhóm Machine Studying của chúng tôi tiến hành phân tích cho nhóm Tiếp thị tăng trưởng để hiểu những hành vi của khách hàng có thể dự đoán về LTV cao. Chúng tôi đã làm việc với một tiến sĩ tài năng. Nhà khoa học dữ liệu, người đã đào tạo mô hình hồi quy logistic và in ra các hệ số ngay lần vượt qua đầu tiên.
Khi chúng tôi xem xét bản phân tích của nhóm Tăng trưởng, họ đã bối rối — các hệ số hồi quy logistic rất khó diễn giải vì quy mô của chúng không tuyến tính và các đặc điểm mang tính dự đoán cao nhất không phải là những thứ mà nhóm Tăng trưởng có thể dễ dàng tác động . Tất cả chúng tôi đều vuốt cằm trong một phút và mở một phiếu cho một số phân tích tiếp theo, nhưng như thường lệ, cả hai đội nhanh chóng chuyển sang ý tưởng sáng giá tiếp theo của mình. Nhà khoa học dữ liệu có một số công việc có mức độ ưu tiên cao cần thực hiện đối với thuật toán xếp hạng tìm kiếm của chúng tôi và vì tất cả các mục đích thực tế, nhóm Phát triển đã ném phân tích vào đống rác.
Tôi vẫn nghĩ về bài tập đó – Chúng ta đã bỏ cuộc quá sớm phải không? Điều gì sẽ xảy ra nếu vòng phản hồi chặt chẽ hơn? Điều gì sẽ xảy ra nếu cả hai bên tiếp tục đào bới? Lần vượt qua thứ hai hoặc thứ ba sẽ tiết lộ điều gì?
Giai thoại trên mô tả một phân tích thăm dò điều đó không hoàn toàn đúng. Phân tích thăm dò khác với phân tích mô tả, chỉ nhằm mục đích mô tả những gì đang xảy ra. Phân tích thăm dò tìm cách đạt được sự hiểu biết sâu sắc hơn về một hệ thống, thay vì một câu hỏi được xác định rõ ràng. Hãy xem xét các loại câu hỏi sau đây mà người ta có thể gặp phải trong bối cảnh kinh doanh:
Lưu ý rằng các câu hỏi khám phá có kết thúc mở và nhằm mục đích nâng cao hiểu biết của một người về một không gian vấn đề phức tạp. Phân tích thăm dò thường đòi hỏi nhiều chu kỳ hơn và mối quan hệ hợp tác chặt chẽ hơn giữa “chuyên gia trong lĩnh vực” và người thực sự tiến hành phân tích, những người hiếm khi là cùng một người. Trong giai thoại trên, mối quan hệ hợp tác chưa đủ chặt chẽ, các vòng phản hồi không đủ ngắn và chúng tôi không dành đủ chu kỳ.
Những thách thức này là lý do tại sao nhiều chuyên gia ủng hộ phương pháp “phân tích theo cặp” để khám phá dữ liệu. Tương tự như lập trình ghép nối, phân tích cặp đôi tập hợp nhà phân tích và người ra quyết định để tiến hành thăm dò trong thời gian thực. Thật không might, kiểu hợp tác chặt chẽ giữa nhà phân tích và người ra quyết định này hiếm khi xảy ra trong thực tế do hạn chế về nguồn lực và thời gian.
Bây giờ hãy nghĩ về tổ chức mà bạn đang làm việc – điều gì sẽ xảy ra nếu mọi người ra quyết định đều có một nhà phân tích có kinh nghiệm làm việc cùng họ? Điều gì sẽ xảy ra nếu họ thu hút được sự chú ý hoàn toàn của nhà phân tích đó và có thể tùy ý đưa ra các câu hỏi tiếp theo? Điều gì sẽ xảy ra nếu những nhà phân tích đó có thể dễ dàng chuyển đổi bối cảnh, theo dòng ý thức của đối tác của họ trong một liên kết tự do giữa các ý tưởng và giả thuyết?
Đây là cơ hội mà LLM mang lại trong không gian phân tích – lời hứa rằng bất kỳ ai cũng có thể tiến hành phân tích thăm dò với lợi ích của nhà phân tích kỹ thuật bên cạnh họ.
Chúng ta hãy xem điều này có thể biểu hiện như thế nào trong thực tế. Nghiên cứu trường hợp và bản trình diễn sau đây minh họa cách người ra quyết định có kiến thức chuyên môn về miền có thể kết hợp hiệu quả với nhà phân tích AI, người có thể truy vấn và trực quan hóa dữ liệu. Chúng tôi sẽ so sánh trải nghiệm khám phá dữ liệu của mô hình 4o của ChatGPT với phân tích thủ công bằng Tableau, hoạt động này cũng sẽ đóng vai trò kiểm tra lỗi chống lại các ảo giác tiềm ẩn.
Lưu ý về quyền riêng tư dữ liệu: Các video demo được liên kết trong phần sau sử dụng các tập dữ liệu tổng hợp thuần túy, nhằm mô phỏng các mô hình kinh doanh thực tế. Để xem các lưu ý chung về quyền riêng tư và bảo mật dành cho Nhà phân tích AI, hãy xem Quyền riêng tư dữ liệu.
Hãy hình dung thế này: bạn là giám đốc điều hành bận rộn của một trang internet thương mại điện tử về quần áo. Bạn có bảng điều khiển Tóm tắt thực hiện gồm các KPI cấp cao, được xác định trước, nhưng một buổi sáng, bạn nhìn vào và thấy điều gì đó đáng lo ngại: doanh thu tiếp thị hàng tháng giảm 45% nhưng không rõ lý do ngay lập tức.
Tâm trí của bạn kéo bạn theo một số hướng khác nhau cùng một lúc: Điều gì góp phần khiến doanh thu sụt giảm? Nó có bị cô lập với một số kênh nhất định không? Sự cố có giới hạn ở một số loại tin nhắn nhất định không?
Nhưng hơn thế nữa, chúng ta có thể làm gì với nó? Gần đây điều gì đang hoạt động tốt? Cái gì không hoạt động? Những xu hướng theo mùa nào chúng ta thấy vào thời điểm này trong năm? Làm thế nào chúng ta có thể tận dụng những điều đó?
Để trả lời những loại câu hỏi mở này, bạn sẽ cần tiến hành phân tích đa biến, phức tạp ở mức độ vừa phải. Đây là loại bài tập chính xác mà Nhà phân tích AI có thể trợ giúp.
Hãy bắt đầu bằng cách xem xét kỹ hơn sự sụt giảm đáng lo ngại về doanh thu hàng tháng.
Trong ví dụ của chúng tôi, chúng tôi đang xem xét sự sụt giảm lớn trong tổng doanh thu do hoạt động tiếp thị. Với tư cách là một nhà phân tích, có 2 luồng suy nghĩ track track để bắt đầu chẩn đoán nguyên nhân gốc rễ:
Chia tổng doanh thu thành nhiều số liệu đầu vào:
- Tổng số tin nhắn đã gửi: Chúng tôi đã gửi ít tin nhắn hơn phải không?
- Tỷ lệ mở: Mọi người có mở những tin nhắn này không? Tức là có vấn đề gì với chủ đề tin nhắn không?
- Tỷ lệ nhấp qua: Người nhận có ít khả năng nhấp qua tin nhắn hơn không? Tức là có vấn đề với nội dung tin nhắn phải không?
- Tỷ lệ chuyển đổi: Người nhận có ít khả năng mua hàng hơn sau khi nhấp qua không? Tức là có vấn đề với trải nghiệm hạ cánh phải không?
Cô lập những xu hướng này trên các khía cạnh phân loại khác nhau
- Kênh: Sự cố này có xảy ra trên tất cả các kênh hay chỉ một tập hợp con?
- Loại thông báo: Vấn đề này có xảy ra trên tất cả các loại thông báo không?
Trong trường hợp này, chỉ sau một vài lời nhắc, LLM có thể xác định sự khác biệt lớn trong loại tin nhắn được gửi trong 2 khoảng thời gian này – cụ thể là đợt giảm giá 50% được thực hiện vào tháng 7 chứ không phải vào tháng 8.
Vì vậy, việc giảm giá bây giờ có ý nghĩa hơn, nhưng chúng tôi không thể giảm giá 50% mỗi tháng. Chúng ta có thể làm gì khác để đảm bảo rằng chúng ta đang tận dụng tối đa các điểm tiếp xúc tiếp thị của mình? Chúng ta hãy xem xét các chiến dịch hoạt động hiệu quả nhất của chúng tôi và xem liệu có chiến dịch nào ngoài khuyến mại bán hàng lọt vào prime 10 hay không.
Các công cụ trực quan hóa dữ liệu hỗ trợ giao diện trỏ và nhấp để xây dựng trực quan hóa dữ liệu. Ngày nay, các công cụ như ChatGPT và Julius AI đã có thể sao chép một cách trung thực quy trình trực quan hóa dữ liệu lặp đi lặp lại.
Các công cụ này tận dụng các thư viện python để tạo và hiển thị cả trực quan hóa dữ liệu tĩnh cũng như biểu đồ tương tác, ngay trong giao diện người dùng trò chuyện đó. Khả năng điều chỉnh và lặp lại các hình ảnh trực quan này thông qua ngôn ngữ tự nhiên khá mượt mà. Với việc giới thiệu các mô-đun mã, hiển thị hình ảnh và các thành phần biểu đồ tương tác, giao diện trò chuyện gần giống với định dạng “sổ ghi chép” quen thuộc được phổ biến bởi sổ ghi chép jupyter.
Chỉ cần một vài lời nhắc, bạn có thể thường xuyên quay số trực quan hóa dữ liệu nhanh chóng như thể bạn là người sử dụng thành thạo công cụ trực quan hóa dữ liệu như Tableau. Trong trường hợp này, bạn thậm chí không cần tham khảo tài liệu trợ giúp để tìm hiểu cách hoạt động của Tableau Biểu đồ trục kép làm.
Ở đây, chúng ta có thể thấy rằng tin nhắn “New Arrivals” mang lại doanh thu cao cho mỗi người nhận, ngay cả với số lượng gửi lớn:
Vì vậy, “Hàng mới đến” dường như đang gây được tiếng vang, nhưng chúng ta nên đảm bảo giảm những loại hàng mới nào vào tháng tới? Chúng ta sắp bước vào tháng 9 và chúng tôi muốn hiểu cách thức mua hàng của khách hàng thay đổi như thế nào trong thời gian này trong năm. Những loại sản phẩm nào chúng ta mong đợi sẽ tăng? Làm giảm xuống?
Một lần nữa, chỉ sau một vài lời nhắc, chúng tôi đã có được hình ảnh trực quan hóa dữ liệu chính xác, rõ ràng và thậm chí chúng tôi không cần phải tìm ra cách sử dụng các công cụ phức tạp của Tableau. Tính toán bảng nhanh tính năng!
Bây giờ chúng tôi đã biết danh mục sản phẩm nào có khả năng tăng trong tháng tới, chúng tôi có thể muốn đưa ra một số đề xuất bán chéo của mình. Vì vậy, nếu Quần áo thể thao nam có mức tăng lớn nhất, làm thế nào chúng ta có thể biết những danh mục nào khác được mua phổ biến nhất cùng với những mặt hàng đó?
Điều này thường được gọi là “phân tích giỏ thị trường” và việc chuyển đổi dữ liệu cần thiết để thực hiện nó hơi phức tạp. Trên thực tế, thực hiện một phân tích giỏ hàng thị trường trong excel thực sự là không thể nếu không sử dụng các tiện ích bổ sung phức tạp. Nhưng với LLM, tất cả những gì bạn cần làm là tạm dừng một chút và đặt câu hỏi của mình một cách rõ ràng:
“Xin chào GPT, đối với các đơn đặt hàng có mặt hàng là áo khoác ngoài thể thao nam, loại sản phẩm nào thường được cùng một khách hàng mua trong cùng một giỏ hàng?”
Các bản trình diễn ở trên minh họa một số ví dụ về cách LLM có thể hỗ trợ việc ra quyết định dựa trên dữ liệu tốt hơn trên quy mô lớn. Những người chơi chính đã xác định được cơ hội này và hệ sinh thái đang phát triển nhanh chóng để kết hợp LLM vào quy trình phân tích. Hãy xem xét những điều sau:
- Khi OpenAI phát hành phiên bản beta “trình thông dịch mã” vào năm ngoái, họ đã nhanh chóng đổi tên tính năng này thành “Phân tích dữ liệu nâng cao” để phù hợp với cách những người dùng đầu tiên sử dụng tính năng này.
- Với GPT4o, OpenAI hiện hỗ trợ kết xuất biểu đồ tương tácbao gồm khả năng thay đổi mã màu, hiển thị chú giải công cụ khi di chuột, sắp xếp/lọc biểu đồ, chọn cột biểu đồ và áp dụng các phép tính.
- Công cụ như Julius.ai đang nổi lên để giải quyết cụ thể các trường hợp sử dụng phân tích chính, cung cấp quyền truy cập vào nhiều mô hình khi thích hợp. Julius cung cấp quyền truy cập vào các mô hình từ cả OpenAI và Anthropic.
- Các nhà cung cấp đang giúp việc chia sẻ dữ liệu ngày càng dễ dàng hơn, mở rộng từ tải tệp tĩnh lên trình kết nối Google Trang tính và các tùy chọn API nâng cao hơn.
- Công cụ như Luồng giọng nói đang nổi lên để hỗ trợ phát triển ứng dụng AI với trọng tâm là các trường hợp sử dụng thế hệ tăng cường truy xuất (RAG) (như phân tích dữ liệu). Điều này giúp các nhà phát triển bên thứ 3 kết nối các tập dữ liệu tùy chỉnh với nhiều LLM khác nhau giữa các nhà cung cấp ngày càng dễ dàng hơn.
Với suy nghĩ này, chúng ta hãy dành chút thời gian và tưởng tượng xem phân tích BI có thể phát triển như thế nào trong 12–24 tháng tới. Dưới đây là một số dự đoán:
[ad_2]
Source link