công ty đã nâng cấp mạng lưới sức mạnh điện toán hiệu suất cao (HPC) cho tác vụ trí tuệ nhân tạo (AI) lên phiên bản 2.0, có tên Xingmai, cải thiện hiệu suất mạng lưới thông tin và huấn luyện LLM tương ứng 60% và 20%.
Hiện các doanh nghiệp công nghệ Trung Quốc đang tìm cách tăng cường năng lực đào tạo AI với hệ thống và thiết bị sẵn có, giữa bối cảnh quốc gia thúc đẩy tự chủ công nghệ, thay vì đối đầu trực tiếp với đối thủ Mỹ như OpenAI về chi tiêu và chất bán dẫn tiên tiến.
Mạng HPC kết nối các cụm bộ xử lý đồ họa (GPU) mạnh mẽ để xử lý dữ liệu và giải quyết vấn đề ở tốc độ siêu cao.
Theo công nghệ hiện có, các cụm máy tính đang mất nhiều thời gian để giao tiếp với nhau, khiến một phần đáng kể dung lượng GPU không được tận dụng. Do đó, Tencent đã nâng cấp mạng lưới này để tăng tốc quá trình liên lạc, từ đó tối ưu hoá hiệu suất và giảm chi phí.
Mạng Xingmai có thể hỗ trợ một cụm điện toán đơn với hơn 100.000 GPU, tăng gấp đôi quy mô so với phiên bản đầu tiên được phát hành vào năm 2023. Hiệu suất được cải thiện giúp rút ngắn thời gian cần thiết để xác định sự cố xuống chỉ còn vài phút, giảm từ vài ngày trước đó.
Sự phát triển nhanh chóng của dịch vụ AI tạo sinh đã khiến ngành công nghiệp AI của Trung Quốc rơi vào cuộc chiến về giá, trong đó tất cả các hãng lớn đều giảm giá xuống thấp hơn nhiều so với mức mà các công ty phương Tây đưa ra khi họ tìm cách thương mại hoá sản phẩm.
Vào tháng 5, Tencent đã cung cấp miễn phí phiên bản rút gọn của Hunyuan LLM, đồng thời giảm giá cho các phiên bản tiêu chuẩn. Điều này xảy ra sau khi các đối thủ cạnh tranh bao gồm ByteDance, Baidu và gã khổng lồ thương mại điện tử Alibaba Group Holding cũng có những động thái tương tự.
Cuộc chạy đua nhằm nâng cao hiệu quả đào tạo mô hình, một quy trình tiêu tốn nhiều năng lượng và tốn kém, có ý nghĩa quan trọng trong cuộc chiến giá cả bằng cách làm cho công nghệ trở nên hợp lý hơn cho các nhà khai thác và khách hàng.
Hồi tháng 4, Robin Li Yanhong, người sáng lập và giám đốc điều hành Baidu cho biết, hiệu suất đào tạo Ernie - LLM hàng đầu của họ đã cải thiện hơn 5 lần trong vòng một năm qua. Theo đó, hiệu suất suy luận của mô hình đã tăng 105 lần, giảm 99% chi phí.
OpenAI cũng cho rằng, mức tăng hiệu suất gần đây là lý do giúp mẫu GPT-4o ra mắt vào tháng 5 có mức giá thấp hơn nhiều.
(Theo SCMP, Yahoo Finance)