Mô hình nhúng mới của OpenAI cung cấp những gì?

ldanh01691248772340 · 29 Tháng Một 2024 15:47

Lĩnh vực trí tuệ nhân tạo tiếp tục phát triển với các mô hình nhúng mới của OpenAI. Chúng được thiết lập để định nghĩa lại cách các nhà phát triển tiếp cận xử lý ngôn ngữ tự nhiên. Trước khi khám phá hai mô hình đột phá, mỗi mô hình được thiết kế để nâng cao khả năng của các ứng dụng AI, đây là ý nghĩa của nhúng:

Nhúng văn bản của OpenAI phục vụ như một thước đo để đánh giá mối tương quan giữa các chuỗi văn bản, tìm thấy ứng dụng trong các lĩnh vực khác nhau, bao gồm:

Tìm kiếm: Sử dụng để xếp hạng kết quả dựa trên mức độ liên quan đến chuỗi truy vấn đã cho, nâng cao độ chính xác của kết quả tìm kiếm.
Phân cụm: Sử dụng để nhóm các chuỗi văn bản dựa trên sự tương đồng của chúng, tạo điều kiện tổ chức thông tin liên quan.
Đề xuất: Áp dụng trong hệ thống đề xuất để gợi ý các mặt hàng có điểm chung trong chuỗi văn bản của chúng, nâng cao sự cá nhân hóa của các đề xuất.
Phát hiện bất thường: Sử dụng để xác định các điểm ngoại lệ với mức độ liên quan tối thiểu, giúp phát hiện mô hình hoặc điểm dữ liệu bất thường.
Đo lường đa dạng: Sử dụng để phân tích sự phân phối sự tương đồng, cho phép đánh giá độ đa dạng trong tập dữ liệu hoặc kho văn bản.
Phân loại: Triển khai trong các nhiệm vụ phân loại nơi chuỗi văn bản được phân loại theo nhãn tương tự nhất của chúng, đơn giản hóa quá trình gắn nhãn trong các ứng dụng học máy.

Giờ bạn đã sẵn sàng để khám phá các mô hình nhúng mới của OpenAI!

Các mô hình nhúng mới của OpenAI

Sự giới thiệu các mô hình nhúng mới của OpenAI đánh dấu một bước tiến lớn trong xử lý ngôn ngữ tự nhiên, cho phép các nhà phát triển biểu diễn và hiểu nội dung văn bản tốt hơn. Hãy cùng khám phá chi tiết của những mô hình sáng tạo này: text-embedding-3-small và text-embedding-3-large.

Khám phá các mô hình nhúng mới của OpenAI - text-embedding-3-small và text-embedding-3-large - giá cả phải chăng, hiệu suất cao hơn và nhiều hơn nữa!

text-embedding-3-small

Mô hình nhỏ gọn nhưng mạnh mẽ này thể hiện sự tăng cường hiệu suất đáng chú ý so với người tiền nhiệm của nó, text-embedding-ada-002. Trên tiêu chuẩn đánh giá khả năng truy xuất đa ngôn ngữ (MIRACL), điểm trung bình đã tăng vọt từ 31.4% lên ấn tượng 44.0%. Tương tự, trên tiêu chuẩn đánh giá nhiệm vụ tiếng Anh (MTEB), điểm trung bình cũng đã có sự tăng đáng khen ngợi từ 61.0% lên 62.3%. Tuy nhiên, điều làm nên sự khác biệt của text-embedding-3-small không chỉ là hiệu suất cải thiện mà còn ở mức giá phải chăng của nó.

Eval benchmark	ada v2	text-embedding-3-small	text-embedding-3-large
MIRACL average	31.4	44.0	54.9
MTEB average	61.0	62.3	64.6

OpenAI đã giảm giá đáng kể, làm cho nó trở nên hiệu quả về chi phí hơn gấp 5 lần so với text-embedding-ada-002, với giá cho mỗi 1k token được giảm từ $0.0001 xuống còn $0.00002. Điều này làm cho text-embedding-3-small không chỉ là một lựa chọn hiệu quả hơn mà còn dễ tiếp cận hơn đối với các nhà phát triển.

text-embedding-3-large

Đại diện cho thế hệ tiếp theo của các mô hình nhúng, text-embedding-3-large giới thiệu sự tăng cường đáng kể về kích thước, hỗ trợ nhúng với tới 3072 chiều. Mô hình lớn hơn này cung cấp một biểu diễn chi tiết và tinh tế hơn về nội dung văn bản. Về mặt hiệu suất, text-embedding-3-large vượt trội so với người tiền nhiệm của mình trên các tiêu chuẩn đánh giá. Trên MIRACL, điểm trung bình đã tăng vọt từ 31.4% lên ấn tượng 54.9%, làm nổi bật khả năng của nó trong việc truy xuất đa ngôn ngữ.

Tương tự, trên MTEB, điểm trung bình đã tăng từ 61.0% lên 64.6%, thể hiện sự vượt trội trong các nhiệm vụ tiếng Anh. Với giá $0.00013 cho mỗi 1k token, text-embedding-3-large tạo ra một sự cân bằng giữa xuất sắc về hiệu suất và hiệu quả về chi phí, cung cấp cho các nhà phát triển một giải pháp mạnh mẽ cho các ứng dụng yêu cầu nhúng có số chiều cao.

Native support for shortening embeddings

Nhận ra nhu cầu đa dạng của các nhà phát triển, OpenAI đã giới thiệu tính năng hỗ trợ thu gọn nhúng một cách tự nhiên. Kỹ thuật sáng tạo này cho phép các nhà phát triển tùy chỉnh kích thước của nhúng bằng cách điều chỉnh tham số API về kích thước chiều. Bằng cách này, các nhà phát triển có thể đánh đổi một phần hiệu suất để có được kích thước vector nhỏ hơn mà không làm mất đi tính chất cơ bản của nhúng. Sự linh hoạt này đặc biệt quý giá trong các tình huống mà hệ thống chỉ hỗ trợ nhúng với kích thước tối đa nhất định, cung cấp cho các nhà phát triển một công cụ đa năng cho nhiều kịch bản sử dụng khác nhau.

Sự phải chăng về giá của text-embedding-3-small được nhấn mạnh bởi việc giảm giá 5 lần so với người tiền nhiệm của nó, text-embedding-ada-002, làm cho nó trở thành một lựa chọn tiết kiệm chi phí cho các nhà phát triển.

Tóm lại, các mô hình nhúng mới của OpenAI đại diện cho một bước tiến quan trọng về hiệu quả, khả năng chi trả, và hiệu suất. Dù các nhà phát triển chọn biểu diễn nhỏ gọn nhưng hiệu quả của text-embedding-3-small hay nhúng chi tiết và rộng lớn hơn của text-embedding-3-large, những mô hình này trao quyền cho các nhà phát triển với công cụ linh hoạt để khai thác sâu hơn các thông tin từ dữ liệu văn bản trong các ứng dụng AI của họ.

Để biết thêm thông tin chi tiết về các mô hình nhúng mới của OpenAI: bấm vào đây và nhận thông báo chính thức
cre : dataconomy