[ad_1]
GPT-4 cung cấp các khả năng tương tự, mang đến cho người dùng nhiều cách để tương tác với các dịch vụ AI của OpenAI. Nhưng nó đã tách chúng thành các mô hình riêng biệt, dẫn đến thời gian phản hồi lâu hơn và có lẽ chi phí tính toán cao hơn. GPT-4o hiện đã hợp nhất những khả năng đó thành một mô hình duy nhất mà Murati gọi là “omnimodel”. Điều đó có nghĩa là phản hồi nhanh hơn và chuyển tiếp mượt mà hơn giữa các nhiệm vụ, cô nói.
Kết quả, cuộc trình diễn của công ty cho thấy, là một trợ lý đàm thoại giống như Siri hoặc Alexa nhưng có khả năng xử lý các lời nhắc phức tạp hơn nhiều.
Murati nói về bản demo: “Chúng tôi đang hướng tới tương lai của sự tương tác giữa chúng ta và máy móc”. “Chúng tôi nghĩ rằng GPT-4o đang thực sự chuyển mô hình đó sang tương lai của sự cộng tác, nơi sự tương tác này trở nên tự nhiên hơn nhiều”.
Barret Zoph và Mark Chen, cả hai đều là nhà nghiên cứu tại OpenAI, đã xem qua một số ứng dụng cho mô hình mới. Ấn tượng nhất là cơ sở vật chất với cuộc trò chuyện trực tiếp. Bạn có thể làm gián đoạn mô hình trong quá trình phản hồi của nó và nó sẽ dừng lại, lắng nghe và điều chỉnh hướng đi.
OpenAI cũng cho thấy khả năng thay đổi tông màu của mô hình. Chen yêu cầu người mẫu đọc truyện trước khi đi ngủ “về robotic và tình yêu”, nhanh chóng chuyển sang yêu cầu giọng nói kịch tính hơn. Mô hình ngày càng mang tính sân khấu hơn cho đến khi Murati yêu cầu nó nhanh chóng chuyển sang giọng nói robotic thuyết phục (điều mà nó đã làm rất xuất sắc). Mặc dù có thể đoán trước được một số khoảng dừng ngắn trong cuộc trò chuyện trong khi mô hình suy luận về những gì sẽ nói tiếp theo, nhưng nó nổi bật như một cuộc trò chuyện AI có nhịp độ tự nhiên đáng chú ý.
Mô hình cũng có thể giải quyết các vấn đề về thị giác trong thời gian thực. Sử dụng điện thoại, Zoph quay phim chính mình đang viết phương trình đại số (3x + 1 = 4) trên một tờ giấy có kèm theo GPT-4o. Anh ấy hướng dẫn nó không đưa ra câu trả lời mà thay vào đó là hướng dẫn anh ấy nhiều như một giáo viên.
“Bước đầu tiên là có được tất cả các điều khoản với x ở một bên,” người mẫu nói với giọng thân thiện. “Vậy bạn nghĩ chúng ta nên làm gì với số cộng một đó?”
Theo Murati, GPT-4o sẽ lưu trữ hồ sơ về các tương tác của người dùng với nó, nghĩa là mô hình “hiện có cảm giác liên tục trong tất cả các cuộc hội thoại của bạn”. Các điểm nổi bật khác bao gồm dịch trực tiếp, khả năng tìm kiếm thông qua các cuộc hội thoại của bạn với mô hình và khả năng tra cứu thông tin trong thời gian thực.
[ad_2]
Source link