Các công ty AI cuối cùng cũng bị buộc phải trả tiền để đào tạo dữ liệu

[ad_1]

Nhưng có một vấn đề. Các công ty AI đã cướp bóc web để đào tạo dữ liệu và nhiều trang internet và chủ sở hữu bộ dữ liệu đã bắt đầu hạn chế khả năng thu thập dữ liệu trang internet của họ. Chúng tôi cũng đã thấy phản ứng dữ dội đối với hoạt động thu thập dữ liệu trực tuyến bừa bãi của ngành AI, dưới hình thức người dùng chọn không cung cấp dữ liệu của họ cho mục đích đào tạo và các vụ kiện tụng từ các nghệ sĩ, nhà văn và Thời báo New Yorktuyên bố rằng các công ty AI đã lấy cắp tài sản trí tuệ của họ mà không có sự đồng ý hoặc bồi thường.

Tuần trước, ba hãng thu âm lớn—Sony Music, Warner Music Group và Common Music Group—đã thông báo rằng họ đang kiện các công ty âm nhạc AI Suno và Udio vì cáo buộc vi phạm bản quyền. Các hãng thu âm này tuyên bố các công ty đã sử dụng nhạc có bản quyền trong dữ liệu đào tạo của họ “ở quy mô gần như không thể tưởng tượng được”, cho phép các mô hình AI tạo ra các bài hát “bắt chước chất lượng của các bản ghi âm âm thanh thực sự của con người”. Đồng nghiệp của tôi, James O’Donnell, đã phân tích các vụ kiện trong câu chuyện của mình và chỉ ra rằng những vụ kiện này có thể quyết định tương lai của âm nhạc AI. Đọc nó ở đây.

Nhưng khoảnh khắc này cũng đặt ra một tiền lệ thú vị cho tất cả sự phát triển AI tạo sinh. Nhờ vào sự khan hiếm dữ liệu chất lượng cao và áp lực to lớn cùng nhu cầu xây dựng các mô hình thậm chí còn lớn hơn và tốt hơn, chúng ta đang ở trong một khoảnh khắc hiếm hoi mà chủ sở hữu dữ liệu thực sự có một số đòn bẩy. Vụ kiện của ngành công nghiệp âm nhạc gửi đi thông điệp lớn nhất từ trước đến nay: Dữ liệu đào tạo chất lượng cao không miễn phí.

Có lẽ sẽ mất ít nhất vài năm nữa trước khi chúng ta có được sự rõ ràng về mặt pháp lý xung quanh luật bản quyền, sử dụng hợp lý và dữ liệu đào tạo AI. Nhưng các trường hợp này đã mở ra những thay đổi. OpenAI đã đạt được thỏa thuận với các nhà xuất bản tin tức như Chính trịcác Đại Tây Dương, Thời giancác Thời báo Tài chínhvà những người khác, và trao đổi kho lưu trữ tin tức của nhà xuất bản để lấy tiền và trích dẫn. Và YouTube đã công bố vào cuối tháng 6 rằng họ sẽ cung cấp các thỏa thuận cấp phép cho các hãng thu âm hàng đầu để đổi lấy âm nhạc cho mục đích đào tạo.

Những thay đổi này là một hỗn hợp. Một mặt, tôi lo ngại rằng các nhà xuất bản tin tức đang thực hiện một thỏa thuận Faustian với AI. Ví dụ, hầu hết các đơn vị truyền thông đã ký kết thỏa thuận với OpenAI đều nói rằng thỏa thuận quy định rằng OpenAI phải trích dẫn nguồn của mình. Nhưng các mô hình ngôn ngữ về cơ bản không có khả năng là sự thật và chỉ giỏi bịa đặt. Các báo cáo đã chỉ ra rằng ChatGPT và công cụ tìm kiếm hỗ trợ AI Perplexity thường xuyên ảo tưởng các trích dẫn, khiến OpenAI khó có thể thực hiện lời hứa của mình.

Điều này cũng khó khăn đối với các công ty AI. Sự thay đổi này có thể khiến họ xây dựng các mô hình nhỏ hơn, hiệu quả hơn, ít gây ô nhiễm hơn nhiều. Hoặc họ có thể bỏ ra một khoản tiền lớn để truy cập dữ liệu ở quy mô họ cần để xây dựng công ty lớn tiếp theo. Chỉ những công ty có nhiều tiền nhất và/hoặc có bộ dữ liệu hiện có lớn của riêng họ (như Meta, với dữ liệu truyền thông xã hội trong hai thập kỷ) mới có thể đủ khả năng làm điều đó. Vì vậy, những diễn biến mới nhất có nguy cơ tập trung quyền lực hơn nữa vào tay những người chơi lớn nhất.

Mặt khác, ý tưởng đưa sự đồng ý vào quy trình này là một ý tưởng hay—không chỉ dành cho những người nắm giữ quyền, những người có thể hưởng lợi từ sự bùng nổ của AI, mà còn cho tất cả chúng ta. Tất cả chúng ta nên có cơ quan quyết định cách dữ liệu của mình được sử dụng và một nền kinh tế dữ liệu công bằng hơn sẽ có nghĩa là tất cả chúng ta đều có thể hưởng lợi.

Học sâu hơn

Trò chơi điện tử AI có thể giúp khám phá những bí ẩn trong tâm trí con người như thế nào

[ad_2]

Source link

Google cuối cùng cũng hành động để hạn chế deepfake không có sự đồng thuận

Hệ thống AI mới của Google DeepMind hiện có thể giải quyết các bài toán phức tạp

Một công cụ mới dành cho chủ sở hữu bản quyền có thể hiển thị liệu tác phẩm của họ có nằm trong dữ liệu đào tạo AI hay không

Sự khác biệt giữa ANN, CNN và RNN

Quy trình mua hàng để thanh toán & cách tối ưu hóa chu trình P2P

AI và Nguồn nhân lực: Chuyển đổi Tương lai của Quản lý Lực lượng lao động

Giá InVideo, Ưu điểm Nhược điểm, Tính năng, Các lựa chọn thay thế

Đi sâu vào AutoGen và Multi-Agent Frameworks | của Matthew Gunton | Tháng 6, 2024

Most Popular

Sự khác biệt giữa ANN, CNN và RNN

Quy trình mua hàng để thanh toán & cách tối ưu hóa chu trình P2P

AI và Nguồn nhân lực: Chuyển đổi Tương lai của Quản lý Lực lượng lao động

Our Picks

Google cuối cùng cũng hành động để hạn chế deepfake không có sự đồng thuận

Nghiên cứu đồng hành của Cognizant & Oxford Economics với Báo cáo “Công việc mới, Thế giới mới” cho thấy sự lạc quan thận trọng trong các doanh nghiệp áp dụng AI

Làm thế nào để truy cập mô hình GitHub trong vài bước?

Các công ty AI cuối cùng cũng bị buộc phải trả tiền để đào tạo dữ liệu

Học sâu hơn

Related Posts