OpenAI đã phát triển một loạt các mô hình AI mới được thiết kế để dành nhiều thời gian hơn để suy nghĩ trước khi phản hồi. Chúng có thể suy luận qua các nhiệm vụ phức tạp và giải quyết các vấn đề khó hơn so với các mô hình trước đây trong khoa học, lập trình và toán học.
OpenAI ra mắt mô hình đầu tiên của loạt này trong ChatGPT và API của OpenAI. Đây là một bản xem trước và OpenAI mong đợi các bản cập nhật và cải tiến thường xuyên. Cùng với việc phát hành này, OpenAI cũng bao gồm các đánh giá cho bản cập nhật tiếp theo, hiện đang được phát triển.
Cách hoạt động
OpenAI đã huấn luyện các mô hình này để dành nhiều thời gian hơn để suy nghĩ qua các vấn đề trước khi phản hồi, giống như cách một người sẽ làm. Thông qua quá trình huấn luyện, chúng học cách tinh chỉnh quá trình suy nghĩ của mình, thử các chiến lược khác nhau và nhận ra sai lầm của mình.
Trong các bài kiểm tra của OpenAI, bản cập nhật mô hình tiếp theo hoạt động tương tự như các sinh viên tiến sĩ trong các nhiệm vụ chuẩn khó khăn về vật lý, hóa học và sinh học. OpenAI cũng nhận thấy rằng nó xuất sắc trong toán học và lập trình. Trong một kỳ thi đủ điều kiện cho Olympic Toán học Quốc tế (IMO), GPT-4o chỉ giải đúng 13% các vấn đề, trong khi mô hình suy luận đạt 83%. Khả năng lập trình của chúng cũng được đánh giá trong các cuộc thi và đạt đến phân vị thứ 89 trong các cuộc thi Codeforces. Bạn có thể đọc thêm về điều này trong bài viết nghiên cứu kỹ thuật của OpenAI.
Là một mô hình ban đầu, nó chưa có nhiều tính năng làm cho ChatGPT hữu ích, như duyệt web để tìm thông tin và tải lên tệp và hình ảnh. Trong nhiều trường hợp phổ biến, GPT-4o sẽ có khả năng hơn trong thời gian ngắn.
Nhưng đối với các nhiệm vụ suy luận phức tạp, đây là một bước tiến đáng kể và đại diện cho một cấp độ mới của khả năng AI. Do đó, OpenAI đang đặt lại bộ đếm về 1 và đặt tên cho loạt này là OpenAI o1.
Sự an toàn
Là một phần của việc phát triển các mô hình mới này, OpenAI đã đưa ra một phương pháp huấn luyện an toàn mới tận dụng khả năng suy luận của chúng để tuân thủ các hướng dẫn về an toàn và căn chỉnh. Bằng cách có thể suy luận về các quy tắc an toàn của OpenAI trong ngữ cảnh, nó có thể áp dụng chúng hiệu quả hơn.
Một cách được OpenAI đo lường an toàn là kiểm tra xem mô hình của OpenAI tiếp tục tuân thủ các quy tắc an toàn của nó tốt như thế nào nếu người dùng cố gắng vượt qua chúng (được gọi là “jailbreaking”). Trong một trong những bài kiểm tra jailbreaking khó nhất của OpenAI, GPT-4o đạt 22 (trên thang điểm 0-100) trong khi mô hình o1-preview của OpenAI đạt 84. Bạn có thể đọc thêm về điều này trong thẻ hệ thống và bài viết nghiên cứu của OpenAI.
Để phù hợp với các khả năng mới của các mô hình này, OpenAI đã củng cố công việc an toàn, quản trị nội bộ và hợp tác với chính phủ liên bang của mình. Điều này bao gồm các thử nghiệm và đánh giá nghiêm ngặt sử dụng Khung Chuẩn bị của OpenAI, đội ngũ red teaming hàng đầu và các quy trình đánh giá cấp hội đồng, bao gồm cả Ủy ban An toàn & Bảo mật của OpenAI.
Để thúc đẩy cam kết của OpenAI đối với an toàn AI, OpenAI gần đây đã chính thức hóa các thỏa thuận với Viện An toàn AI của Hoa Kỳ và Vương quốc Anh. OpenAI đã bắt đầu thực hiện các thỏa thuận này, bao gồm việc cấp quyền truy cập sớm cho các viện vào phiên bản nghiên cứu của mô hình này. Đây là một bước quan trọng đầu tiên trong quan hệ đối tác của OpenAI, giúp thiết lập quy trình nghiên cứu, đánh giá và thử nghiệm các mô hình tương lai trước và sau khi phát hành công khai.
Uỷ quyền
Các khả năng suy luận nâng cao này có thể đặc biệt hữu ích nếu bạn đang giải quyết các vấn đề phức tạp trong khoa học, lập trình, toán học và các lĩnh vực tương tự. Ví dụ, o1 có thể được các nhà nghiên cứu y tế sử dụng để chú thích dữ liệu giải trình tự tế bào, bởi các nhà vật lý để tạo ra các công thức toán học phức tạp cần thiết cho quang học lượng tử, và bởi các nhà phát triển trong tất cả các lĩnh vực để xây dựng và thực hiện các quy trình làm việc nhiều bước.
OpenAI o1-mini
Loạt o1 xuất sắc trong việc tạo ra và gỡ lỗi mã phức tạp một cách chính xác. Để cung cấp một giải pháp hiệu quả hơn cho các nhà phát triển, OpenAI cũng ra mắt OpenAI o1-mini, một mô hình suy luận nhanh hơn, rẻ hơn, đặc biệt hiệu quả trong lập trình. Là một mô hình nhỏ hơn, o1-mini rẻ hơn 80% so với o1-preview, làm cho nó trở thành một mô hình mạnh mẽ, tiết kiệm chi phí cho các ứng dụng yêu cầu suy luận nhưng không cần kiến thức rộng về thế giới.
Cách sử dụng OpenAI o1
Người dùng ChatGPT Plus và Team sẽ có thể truy cập các mô hình o1 trong ChatGPT bắt đầu từ hôm nay. Cả o1-preview và o1-mini có thể được chọn thủ công trong trình chọn mô hình, và khi ra mắt, giới hạn hàng tuần sẽ là 30 tin nhắn cho o1-preview và 50 cho o1-mini. OpenAI đang làm việc để tăng các giới hạn đó và cho phép ChatGPT tự động chọn mô hình phù hợp cho một yêu cầu cụ thể.
Người dùng ChatGPT Enterprise và Edu sẽ được truy cập cả hai mô hình bắt đầu từ tuần tới.
Các nhà phát triển đủ điều kiện cho cấp sử dụng API 5 có thể bắt đầu tạo mẫu với cả hai mô hình trong API hôm nay với giới hạn tốc độ là 20 RPM. OpenAi đang làm việc để tăng các giới hạn này sau khi thử nghiệm thêm. API cho các mô hình này hiện không bao gồm gọi hàm, phát trực tuyến, hỗ trợ cho các tin nhắn hệ thống và các tính năng khác. Để bắt đầu, hãy xem tài liệu API của OpenAI.
OpenAI cũng đang lên kế hoạch mang quyền truy cập o1-mini đến tất cả người dùng ChatGPT Free.
Đây là một bản xem trước sớm của các mô hình suy luận này trong ChatGPT và API. Ngoài các bản cập nhật mô hình, OpenAI mong đợi thêm duyệt web, tải lên tệp và hình ảnh, và các tính năng khác để làm cho chúng hữu ích hơn cho mọi người.
OpenAI cũng có kế hoạch tiếp tục phát triển và phát hành các mô hình trong loạt GPT của OpenAI, ngoài loạt OpenAI o1 mới.
Bản o1 preview và o1 mini đã có mặt trên Kaikun AI, mọi người có thể tham khảo.
cre: medium