[ad_1]
Khi chúng ta đang dần ổn định với cách làm việc sau đại dịch, các tổ chức đang tái cấu trúc hệ thống công nghệ và chiến lược phần mềm của họ cho lực lượng lao động mới, phân tán. Truyền dữ liệu theo thời gian thực đang nổi lên như một cách cần thiết và tiết kiệm chi phí để các doanh nghiệp mở rộng quy mô một cách linh hoạt. Năm ngoái, IDC nhận thấy rằng 90% các công ty lớn nhất thế giới sẽ sử dụng trí tuệ thời gian thực để cải thiện trải nghiệm của khách hàng và các dịch vụ chính vào năm 2025. Họ cũng nhận thấy thị trường xử lý luồng dữ liệu dự kiến sẽ tăng trưởng với tốc độ tăng trưởng kép hàng năm (CAGR) là 21,5% từ năm 2022 đến năm 2028.
Sự gia tăng của truyền dữ liệu là không thể phủ nhận và ngày càng trở nên phổ biến. Đồng xu truyền dữ liệu có hai mặt với lợi thế về chi phí kép – kiến trúc và vận hành:
Từ góc độ kiến trúc, nó hợp lý hóa luồng dữ liệu. Trước đây, dữ liệu được nhận từ các ứng dụng và được lưu trữ trực tiếp trong cơ sở dữ liệu. Việc phân tích dữ liệu này yêu cầu quy trình Trích xuất, Chuyển đổi, Tải (ETL), thường được thực hiện một lần mỗi ngày theo đợt. Tuy nhiên, sự xuất hiện của các nền tảng truyền dữ liệu đã cách mạng hóa kiến trúc này. Bất kể nguồn dữ liệu nào, việc thiết lập chủ đề trên nền tảng phát trực tuyến đều rất dễ dàng. Việc kết nối với các chủ đề này cho phép luồng dữ liệu liền mạch. Tương tự, việc tiêu thụ dữ liệu được đơn giản hóa. Bạn có thể thiết lập đích đến cho dữ liệu và chỉ định tần suất phân phối—theo thời gian thực hoặc theo đợt. Các nền tảng truyền dữ liệu tập trung, như Sao xung Apache, cho phép mở rộng quy mô linh hoạt và hợp nhất các đường dẫn dữ liệu đã được lưu trữ trước đó thành các dịch vụ nền tảng nhiều bên thuê thống nhất. Điều này làm giảm lượng chất thải cung cấp quá mức đi kèm với việc duy trì các đường ống khác nhau.
Những lợi thế hoạt động có sức thuyết phục đáng kinh ngạc. Bằng cách tập trung toàn bộ quy trình luồng dữ liệu, truyền dữ liệu giúp loại bỏ nhu cầu quản lý nhiều công nghệ để truyền dữ liệu từ điểm A đến điểm B. Do đó, dữ liệu trở nên dễ truy cập hơn, đặc biệt là khi nhân viên phân tán ở các gia đình và văn phòng. Truyền dữ liệu đã phát triển thành luồng kết nối đồng bộ hóa các hoạt động và hiểu biết sâu sắc của các nhóm phân tán. Việc cho phép truyền phát dữ liệu đầu ra dưới dạng sản phẩm dữ liệu trực tiếp, có thể truy cập được trong toàn tổ chức sẽ hỗ trợ hoạt động cộng tác từ xa theo thời gian thực cho các doanh nghiệp.
Chúng ta tới đây bằng cách nào nhỉ?
Làm cách nào chúng tôi đến được thời điểm quan trọng này để truyền dữ liệu? Sự hấp dẫn của công nghệ này bắt đầu từ đầu những năm 2000 với sự gia tăng của hàng đợi tin nhắn có thông lượng cao như Apache Kafka. Điều này cho phép các tổ chức sử dụng dữ liệu theo thời gian thực. Họ đã xây dựng một kiến trúc tách biệt người sản xuất và người tiêu dùng dữ liệu, từ đó tạo ra các đường dẫn dữ liệu đáng tin cậy và có thể mở rộng. Tuy nhiên, điều này chủ yếu được xây dựng cho các trường hợp sử dụng nhập dữ liệu. Các trường hợp sử dụng phát trực tuyến ban đầu khá hẹp – sử dụng dữ liệu khối lượng lớn để tạo bảng điều khiển tương tác theo thời gian thực, gửi dữ liệu cảm biến để bảo trì dự đoán, cung cấp năng lượng cho các ứng dụng thời gian thực như máy đánh dấu chứng khoán hoặc công cụ cá cược. Hầu hết các doanh nghiệp đều cảm thấy rằng dữ liệu thời gian thực là cần thiết cho các trường hợp sử dụng riêng biệt và vẫn dựa vào việc trích xuất dữ liệu theo đợt để phân tích hoạt động. Tuy nhiên, có những trường hợp sử dụng quan trọng cũng cần có dữ liệu thời gian thực. Ví dụ: ô tô tự lái yêu cầu dữ liệu tức thời để đưa ra quyết định trong tích tắc. Phân tích vị trí, chẳng hạn như bản đồ và điều hướng, dựa vào dữ liệu thời gian thực để báo hiệu kịp thời các tai nạn và sự chậm trễ. Ngoài ra, nhiều công nghệ tiếp thị, như đặt giá thầu quảng cáo và phân tích cảm tính của khách hàng, phụ thuộc vào dữ liệu thời gian thực trong hệ thống giao dịch của họ.
Khi việc áp dụng đám mây tăng tốc vào những năm 2010, đề xuất giá trị kiến trúc của dữ liệu phát trực tuyến trở nên rõ ràng hơn. Các doanh nghiệp bắt đầu hợp nhất Message Queue tại chỗ và các silo phát trực tuyến dữ liệu độc quyền vào các dịch vụ phát trực tuyến dựa trên đám mây. Điều này cho phép tập trung hàng chục đường ống cho mỗi đơn vị kinh doanh vào các nền tảng phát trực tuyến dữ liệu đa thuê bao.
Các nền tảng truyền dữ liệu gốc trên nền tảng đám mây hiện đại cũng giúp doanh nghiệp vận hành các sản phẩm dữ liệu truyền phát trực tuyến dễ dàng hơn cho các bên liên quan và khách hàng nội bộ. Thay vì vận chuyển dữ liệu hoàn toàn ở phía sau, việc phát trực tuyến đã biến thành một cơ chế phân phối hiệu quả để cung cấp quyền truy cập dữ liệu cập nhật liên tục.
COVID-19 vào cuộc trò chuyện
Chất xúc tác cuối cùng là nhu cầu ngày càng tăng về tính linh hoạt trong kinh doanh theo thời gian thực và khả năng phục hồi hoạt động trong thời kỳ gián đoạn do đại dịch. Các doanh nghiệp đổ xô sử dụng nền tảng truyền dữ liệu đám mây để kích hoạt các trường hợp phân tích từ xa, AI/ML và hoạt động được hỗ trợ bởi dữ liệu luôn cập nhật. Trong thời gian diễn ra dịch bệnh COVID-19, doanh thu của Thứ Hai Điện Tử đã vượt qua Thứ Sáu Đen. Trong mùa mua sắm cao điểm hoặc trong đợt khuyến mại chớp nhoáng, nền tảng thương mại điện tử phụ thuộc vào dữ liệu thời gian thực để quản lý hàng tồn kho một cách hiệu quả, tối ưu hóa chiến lược giá và đưa ra các đề xuất được cá nhân hóa ngay lập tức. Trong kỷ nguyên hậu COVID, đã có sự thay đổi đáng kể đối với việc tiêu thụ dữ liệu trực tuyến, với nhu cầu cao hơn bao giờ hết về việc truyền dữ liệu nhanh hơn.
Ngày nay, truyền dữ liệu đã trở thành phương pháp thực tế để cung cấp và chia sẻ dữ liệu trong doanh nghiệp phân tán, hiện đại. Hiệu quả chi phí của nó đến từ việc hợp lý hóa các quy trình khác nhau trước đây trong khi tận dụng tối đa tính linh hoạt và tính kinh tế theo quy mô của đám mây.
Khi cơ sở hạ tầng từ xa của doanh nghiệp được củng cố và kiến trúc đám mây theo sự kiện phát triển, tính năng phát trực tuyến sẽ ngày càng trở nên phổ biến và mang tính quan trọng hơn. Apache Pulsar và các nền tảng tương tự sẽ đóng một vai trò quan trọng trong sự phát triển liên tục này. Sự phát triển của dịch vụ phát trực tuyến là một hành trình kéo dài hai thập kỷ phát triển công nghệ nhằm đáp ứng nhu cầu cấp bách mới về hoạt động.
Giới thiệu về tác giả
Sijie Guo là Người sáng lập và Giám đốc điều hành của Truyền trực tiếp. Hành trình của Sijie với Apache Pulsar bắt đầu tại Yahoo! nơi anh ấy là thành viên của nhóm làm việc để phát triển nền tảng nhắn tin toàn cầu cho công ty. Sau đó, anh chuyển sang Twitter, nơi anh lãnh đạo nhóm cơ sở hạ tầng nhắn tin và đồng sáng tạo DistributedLog và Twitter EventBus. Năm 2017, anh đồng sáng lập Streamlio, công ty được Splunk mua lại và vào năm 2019, anh thành lập StreamNative. Ông là một trong những người sáng tạo ban đầu của Apache Pulsar và Apache BookKeeper, đồng thời vẫn là Phó chủ tịch của Apache BookKeeper và Thành viên PMC của Apache Pulsar.
Đăng ký nhận tin tức InsideAI miễn phí bản tin.
Tham gia với chúng tôi trên Twitter: https://twitter.com/InsideBigData1
Tham gia cùng chúng tôi trên LinkedIn: https://www.linkedin.com/company/insidebigdata/
Tham gia cùng chúng tôi trên Fb: https://www.facebook.com/insideAI NewsNOW
[ad_2]
Source link