[ad_1]
1.5 Flash vượt trội trong việc tóm tắt, ứng dụng trò chuyện, chú thích hình ảnh và video, trích xuất dữ liệu từ các tài liệu và bảng dài, v.v. Điều này là do nó đã được 1.5 Professional đào tạo thông qua một quy trình có tên là “chưng cất”, trong đó kiến thức và kỹ năng cần thiết nhất từ mô hình lớn hơn được chuyển sang mô hình nhỏ hơn, hiệu quả hơn.
Đọc thêm về 1.5 Flash trên Trang công nghệ Song Tửvà tìm hiểu về 1.5 Tính sẵn có và giá cả của Flash. Chúng tôi sẽ sớm chia sẻ thêm thông tin chi tiết trong báo cáo kỹ thuật Gemini 1.5 cập nhật.
Cải thiện đáng kể 1.5 Professional
Trong vài tháng qua, chúng tôi đã cải thiện đáng kể 1.5 Professional, mẫu máy tốt nhất của chúng tôi cho hiệu suất chung trong nhiều tác vụ.
Ngoài việc mở rộng cửa sổ ngữ cảnh lên 2 triệu mã thông báo, chúng tôi còn nâng cao khả năng tạo mã, lập kế hoạch và lập luận logic, trò chuyện nhiều lượt cũng như khả năng hiểu âm thanh và hình ảnh thông qua các tiến bộ về dữ liệu và thuật toán. Chúng tôi nhận thấy những cải thiện mạnh mẽ về các tiêu chuẩn công khai và nội bộ cho từng nhiệm vụ này.
1.5 Professional giờ đây có thể tuân theo các hướng dẫn ngày càng phức tạp và nhiều sắc thái, bao gồm cả các hướng dẫn chỉ định hành vi ở cấp sản phẩm liên quan đến vai trò, định dạng và kiểu dáng. Chúng tôi đã cải thiện khả năng kiểm soát phản hồi của mô hình cho các trường hợp sử dụng cụ thể, chẳng hạn như tạo phong cách phản hồi và cá tính của tổng đài viên trò chuyện hoặc tự động hóa quy trình công việc thông qua nhiều lệnh gọi chức năng. Và chúng tôi đã cho phép người dùng điều khiển hành vi của mô hình bằng cách cài đặt hướng dẫn hệ thống.
Chúng tôi đã thêm khả năng hiểu âm thanh trong API Song Tử Và Studio AI của Google, vì vậy 1.5 Professional giờ đây có thể suy luận về hình ảnh và âm thanh cho các video được tải lên trong Google AI Studio. Và chúng tôi hiện đang tích hợp 1.5 Professional vào các sản phẩm của Google, bao gồm Song Tử nâng cao và trong Không gian làm việc ứng dụng.
Đọc thêm về 1.5 Professional trên Trang công nghệ Song Tử. Thông tin chi tiết sẽ sớm có trong báo cáo kỹ thuật Gemini 1.5 cập nhật của chúng tôi.
Gemini Nano hiểu đầu vào đa phương thức
Gemini Nano đang mở rộng ra ngoài các đầu vào chỉ có văn bản để bao gồm cả hình ảnh. Bắt đầu với Pixel, các ứng dụng sử dụng Gemini Nano với Đa phương thức sẽ có thể hiểu thế giới theo cách mọi người hiểu — không chỉ thông qua văn bản mà còn thông qua hình ảnh, âm thanh và ngôn ngữ nói.
Đọc thêm về Gemini 1.0 Nano trên Android.
[ad_2]
Source link