Theo bà Murati, GPT-4o không chỉ nhanh hơn rất nhiều so với phiên bản tiền nhiệm mà còn có những cải tiến vượt bậc về khả năng xử lý “văn bản, hình ảnh và âm thanh”.
Điều này hứa hẹn sẽ mang lại trải nghiệm người dùng mượt mà và hiệu quả hơn. Đặc biệt, phiên bản mới này sẽ được cung cấp miễn phí cho tất cả người dùng, trong khi người dùng trả phí sẽ được hưởng lợi từ dung lượng sử dụng gấp 5 lần so với người dùng miễn phí.
Một trong những điểm nổi bật của GPT-4o là tính chất đa phương thức. Giám đốc điều hành của OpenAI, Sam Altman chia sẻ rằng: “GPT-4o có khả năng hiểu và tạo ra nội dung từ giọng nói, văn bản hoặc hình ảnh”. Điều này mở ra nhiều cơ hội mới cho việc ứng dụng AI trong các lĩnh vực khác nhau, từ giáo dục, truyền thông đến chăm sóc sức khỏe.
Trong một bài đăng trên blog của công ty, OpenAI cho biết các khả năng của GPT-4o “sẽ được triển khai lặp đi lặp lại”, nhưng khả năng hỗ trợ nhập dữ liệu đầu vào bằng giọng nói và văn bản của nó sẽ bắt đầu được triển khai ngay hôm nay trong ChatGPT.
Các tính năng mới sắp có trong chế độ giọng nói của ChatGPT cũng sẽ xuất hiện trong phiên bản GPT-4o. Ứng dụng có thể hoạt động như một trợ lý ảo thông minh giống như Her-like, phản hồi theo thời gian thực và quan sát thế giới xung quanh bạn. Chế độ giọng nói hiện tại bị hạn chế hơn, chỉ phản hồi từng lời nhắc một và chỉ hoạt động với những gì nó có thể nghe thấy.