[ad_1]
Nền tảng video ngắn có hơn 600 triệu người dùng hoạt động đã công bố công cụ mới vào ngày 6 tháng 6. Nó tên là Kling. Giống như mô hình Sora của OpenAI, Kling có thể tạo video “dài tối đa hai phút với tốc độ khung hình 30 khung hình/giây và độ phân giải video lên tới 1080p”. công ty nói trên trang web của mình.
Nhưng không giống như Sora, công chúng vẫn chưa thể tiếp cận được bốn tháng sau khi OpenAI thử nghiệm nó, Kling đã sớm bắt đầu cho phép mọi người tự mình thử mô hình này.
Tôi là một trong số họ. Tôi có quyền truy cập vào nó sau khi tải xuống công cụ chỉnh sửa video của Kuaishou, đăng ký bằng số Trung Quốc, lọt vào danh sách chờ và điền vào biểu mẫu bổ sung thông qua các nhóm phản hồi của người dùng Kuaishou. Mô hình không thể xử lý các lời nhắc được viết hoàn toàn bằng tiếng Anh nhưng bạn có thể giải quyết vấn đề đó bằng cách dịch cụm từ bạn muốn sử dụng sang tiếng Trung hoặc bao gồm một hoặc hai từ tiếng Trung.
Vì vậy, điều đầu tiên trước tiên. Dưới đây là một số kết quả tôi tạo ra bằng Kling để cho bạn thấy nó như thế nào. Hãy nhớ đến video demo ấn tượng của Sora về Cảnh đường phố Tokyo hoặc con mèo phóng qua khu vườn? Đây là quan điểm của Kling:
Nhớ hình ảnh phi hành gia cưỡi ngựa của Dall-E? Tôi cũng đã yêu cầu Kling tạo một phiên bản video.
Có một vài điều đáng hoan nghênh ở đây. Không có video nào trong số này sai lệch nhiều so với lời nhắc và vật lý có vẻ đúng — chuyển động lia máy, những chiếc lá xù xì cũng như cách con ngựa và phi hành gia quay, cho thấy Trái đất phía sau chúng. Quá trình tạo mất khoảng ba phút cho mỗi người trong số họ. Không phải là nhanh nhất, nhưng hoàn toàn chấp nhận được.
Nhưng cũng có những thiếu sót rõ ràng. Các video ở định dạng 720p có vẻ mờ và nhiễu hạt; đôi khi Kling bỏ qua một yêu cầu quan trọng trong lời nhắc; và quan trọng nhất, tất cả các video được tạo hiện nay đều có độ dài tối đa là 5 giây, khiến chúng kém năng động hoặc phức tạp hơn nhiều.
Tuy nhiên, thật không công bằng khi so sánh những kết quả này với những thứ như bản demo của Sora, được OpenAI chọn lọc kỹ lưỡng để phát hành ra công chúng và có thể cho kết quả tốt hơn mức trung bình. Những video Kling này là từ những lần thử đầu tiên của tôi với mỗi lời nhắc và tôi hiếm khi đưa vào các từ khóa kỹ thuật nhắc nhở như “8k, chủ nghĩa quang học” để tinh chỉnh kết quả.
[ad_2]
Source link