[ad_1]
Với những điểm tương đồng và khác biệt nêu trên giữa tư vấn khoa học dữ liệu và các loại hình tư vấn khác, việc tự hỏi làm thế nào chúng ta có thể điều chỉnh cách tiếp cận của mình để đảm bảo thành công và khả thi lâu dài cho các dự án của mình là điều dễ hiểu. Ngoài các yếu tố rõ ràng như chất lượng sản phẩm, giao dự án đúng hạn và quản lý chặt chẽ các bên liên quan, còn những thành phần nào khác cần có để thành công?
Đảm bảo sản phẩm dữ liệu mạnh mẽ
Trong khi tư vấn quản lý thường tập trung vào những thay đổi tổ chức tức thời và các sản phẩm một lần, tư vấn khoa học dữ liệu đòi hỏi một góc nhìn dài hạn về tính mạnh mẽ và bền vững. Điều này có một vài hậu quả. Bạn có thể và sẽ được đánh giá dựa trên hiệu suất liên tục của công việc và nên thực hiện các bước để đảm bảo bạn mang lại kết quả tốt không chỉ tại thời điểm bàn giao mà còn có khả năng trong nhiều năm tới. (Điều này tương tự như tư vấn CNTT, trong đó hiệu suất và bảo trì liên tục là điều cần thiết.)
Ví dụ, tôi đã xây dựng các sản phẩm dữ liệu đã được đưa vào sản xuất trong hơn 6 năm! Tôi đã thấy những tác động trực tiếp của việc có các đường ống dữ liệu không đủ mạnh mẽ, dẫn đến sự cố hệ thống và kết quả mô hình sai. Tôi cũng đã thấy các biến và nhãn mô hình trôi đi đáng kể theo thời gian, dẫn đến suy giảm hiệu suất hệ thống và trong một số trường hợp là những hiểu biết hoàn toàn sai.
Tôi biết rằng đây rõ ràng không phải là chủ đề hấp dẫn nhất, và trong một dự án có ngân sách eo hẹp và thời gian ngắn, có thể khó đưa ra lập luận để dành thêm thời gian và nguồn lực cho các đường ống dữ liệu mạnh mẽ và giám sát sự trôi dạt của biến. Tuy nhiên, tôi thực sự thúc giục bạn dành thời gian cho khách hàng của mình về các chủ đề này, tích hợp chúng trực tiếp vào thời gian biểu của dự án.
– Tập trung vào tính bền vững lâu dài.
– Triển khai đường truyền dữ liệu mạnh mẽ.
– Theo dõi liên tục sự trôi dạt của mô hình và biến đổi.
Tôi đã viết về một khía cạnh của đường ống dữ liệu (mã hóa một lần các biến) trong bài viết trước nhằm mục đích minh họa chủ đề và cung cấp các giải pháp bằng Python và R.
Tài liệu và chuyển giao kiến thức
Tài liệu thích hợp và chuyển giao kiến thức là rất quan trọng trong tư vấn khoa học dữ liệu. Không giống như tư vấn phân tích, có thể liên quan đến các mô hình ít phức tạp hơn, các dự án khoa học dữ liệu yêu cầu tài liệu đầy đủ để đảm bảo tính liên tục. Khách hàng thường phải đối mặt với những thay đổi về nhân sự và các quy trình được ghi chép đầy đủ giúp giảm thiểu tình trạng mất thông tin. Tôi đã nhiều lần được các khách hàng trước đây liên hệ và yêu cầu giải thích các khía cạnh khác nhau của các mô hình và hệ thống mà chúng tôi đã xây dựng. Điều này không phải lúc nào cũng dễ dàng — đặc biệt là khi bạn đã không nhìn thấy cơ sở mã trong nhiều năm — và sẽ rất hữu ích khi có các tài liệu Jupyter Notebooks hoặc Markdown được ghi chép đầy đủ, mô tả quy trình ra quyết định và phân tích. Điều này đảm bảo rằng mọi quyết định hoặc kết quả ban đầu đều có thể dễ dàng được theo dõi và giải quyết.
– Đảm bảo ghi chép đầy đủ.
– Sử dụng Jupyter Notebooks, tài liệu Markdown hoặc tương tự.
– Thúc đẩy chuyển giao kiến thức để giảm thiểu sự thay đổi về mặt nhân sự.
Xây dựng các giải pháp toàn diện
Xây dựng các giải pháp đầu cuối là một cân nhắc quan trọng khác trong tư vấn khoa học dữ liệu. Không giống như tư vấn phân tích, có thể tập trung vào việc cung cấp thông tin chi tiết và báo cáo, tư vấn khoa học dữ liệu cần đảm bảo khả năng triển khai và vận hành của các mô hình. Điều này tương tự như tư vấn CNTT, trong đó tích hợp vào các đường ống CI/CD hiện có là rất quan trọng.
Tôi đã thấy các công ty lãng phí nhiều năm từ khi phát triển một mô hình đến khi triển khai sản xuất do thay đổi nhân sự và các nhiệm vụ tích hợp chưa hoàn thành. Nếu chúng tôi kiên quyết đưa dự án đến trạng thái sẵn sàng sản xuất hoàn toàn, khách hàng sẽ có được toàn bộ lợi ích của mô hình sớm hơn nhiều. Một cải tiến đáng kể khi chi phí dự án có thể lên tới hàng triệu euro.
– Xây dựng các mô hình có thể triển khai.
– Đảm bảo vận hành.
– Tích hợp vào hệ thống CI/CD hiện có.
Hiện vật trực quan
Bao gồm các hiện vật trực quan, chẳng hạn như bảng điều khiển hoặc tiện ích, giúp chứng minh giá trị do dự án tạo ra. Trong khi các sản phẩm tư vấn quản lý bao gồm các kế hoạch và đánh giá chiến lược — thường ở dạng một bản trình bày powerpoint một lần — tư vấn khoa học dữ liệu được hưởng lợi từ các công cụ trực quan cung cấp thông tin chi tiết liên tục về tác động và lợi ích của giải pháp. Các hiện vật này đóng vai trò như lời nhắc nhở về giá trị của dự án và giúp đo lường thành công của dự án, tương tự như vai trò của hình ảnh hóa trong tư vấn phân tích.
Một trong những dự án thành công nhất của tôi là khi chúng tôi xây dựng giải pháp định giá cho một khách hàng và họ bắt đầu sử dụng trực tiếp thành phần bảng điều khiển trong các cuộc họp định giá hàng tháng của họ. Mặc dù bảng điều khiển chỉ là một phần nhỏ của dự án, nhưng đó là thứ duy nhất mà ban quản lý và giám đốc công ty có thể tương tác, và do đó cung cấp lời nhắc nhở mạnh mẽ về công việc của chúng tôi.
– Tạo các hiện vật trực quan như bảng thông tin.
– Thể hiện giá trị của dự án một cách trực quan.
– Sử dụng các hiện vật để đo lường thành công và duy trì sự phù hợp với khách hàng.
Đánh giá sự trưởng thành của tổ chức
Đánh giá mức độ trưởng thành của tổ chức trong khi lập kế hoạch cho dự án là điều cần thiết để tránh thiết kế quá mức giải pháp. Việc điều chỉnh độ phức tạp của các giải pháp theo mức độ trưởng thành của khách hàng đảm bảo khả năng áp dụng và khả năng sử dụng tốt hơn. Luôn nhớ rằng khi bạn hoàn thành dự án, quyền sở hữu thường chuyển sang các nhà khoa học dữ liệu và kỹ sư dữ liệu nội bộ. Nếu khách hàng có một nhóm gồm 20 nhà khoa học dữ liệu và cơ sở hạ tầng dữ liệu hiện đại sẵn sàng tích hợp các mô hình của bạn trực tiếp vào DevOps hiện có của họ, thì điều đó thật tuyệt vời, nhưng thường không phải vậy. Thay vào đó, hãy xem xét tình huống bạn đang phát triển một công cụ cho một công ty có 20 nhân viên, chỉ có một nhà khoa học dữ liệu cấp cơ sở và một kỹ sư dữ liệu làm việc quá sức. Bạn sẽ điều chỉnh chiến lược của mình như thế nào?
– Đánh giá mức độ trưởng thành về mặt tổ chức và phân tích.
– Tránh các giải pháp kỹ thuật quá mức.
– Điều chỉnh độ phức tạp theo mức độ sẵn sàng của khách hàng.
Thực hiện theo các phương pháp hay nhất trong phát triển CNTT
Việc tuân thủ các thông lệ tốt nhất trong phát triển CNTT đang ngày càng trở nên quan trọng và thường được yêu cầu trong tư vấn khoa học dữ liệu. Không giống như tư vấn phân tích, có thể không liên quan đến mã hóa mở rộng, tư vấn khoa học dữ liệu phải trung thành với các thông lệ phát triển phần mềm để đảm bảo khả năng mở rộng và khả năng bảo trì. Điều này tương tự như tư vấn CNTT hiện đại, trong đó việc viết mã theo mô-đun, được ghi chép đầy đủ và bao gồm dữ liệu mẫu để thử nghiệm là những thông lệ thiết yếu.
Điều này cũng liên quan trở lại điểm trước đó về tài liệu và chuyển giao kiến thức. Mã được lập tài liệu và cấu trúc hợp lý, được đóng gói thành các gói phần mềm và thư viện dễ cài đặt dễ bảo trì và quản lý hơn nhiều so với hàng nghìn dòng mã spaghetti. Khi có sự thay đổi về nhân sự, bạn sẽ ở vị trí tốt hơn nhiều nếu mã được phát triển đúng cách.
– Thực hiện các biện pháp phát triển CNTT tốt nhất.
– Viết mã theo mô-đun và có tài liệu hướng dẫn đầy đủ.
– Bao gồm dữ liệu mẫu để thử nghiệm.
[ad_2]
Source link