Bảng xếp hạng cuối tháng 2 của OpenRouter – nền tảng hỗ trợ đơn giản hóa việc tích hợp và tương tác với các mô hình AI – cho thấy nhiều mô hình Trung Quốc đang góp mặt trong nhóm LLM được sử dụng nhiều nhất thế giới.

Đáng chú ý, mô hình M2.5 của MiniMax dẫn đầu toàn cầu với khoảng 1,7 nghìn tỷ token được xử lý mỗi tuần. Đứng thứ hai là Gemini 3 Flash Preview của Google với khoảng 997 tỷ token. Vị trí tiếp theo thuộc về DeepSeek V3.2 của DeepSeek, đạt khoảng 798 tỷ token mỗi tuần.
Ngoài ra, các mô hình khác của Trung Quốc như Kimi K2.5 của Moonshot AI và GLM-5 của Zhipu AI cũng lọt nhóm dẫn đầu, với mức sử dụng vượt 600 tỷ token.
Trong tuần từ ngày 9-15/2, tổng lượng token của các mô hình Trung Quốc đạt 4,12 nghìn tỷ, lần đầu vượt Mỹ (2,94 nghìn tỷ token). Sang tuần 16-22/2, con số này tiếp tục tăng lên 5,16 nghìn tỷ token, trong khi các mô hình Mỹ giảm xuống còn 2,7 nghìn tỷ.
Các nhà phân tích cho rằng xu hướng này xuất phát từ hai nguyên nhân chính: nhu cầu ứng dụng AI tăng cao dịp Tết Nguyên đán và sự phổ biến của các tác nhân AI (AI agents), vốn làm gia tăng đáng kể lượng token tiêu thụ cho mỗi tác vụ. OpenRouter ghi nhận nhu cầu tạo văn bản dài tăng mạnh trong thời gian gần đây, đặc biệt ở nhóm sử dụng từ 100.000 đến một triệu token – mức tiêu thụ phổ biến trong các quy trình làm việc dựa trên tác nhân AI. Trong nhóm này, MiniMax M2.5 đang chiếm ưu thế.
Token là đơn vị dữ liệu cơ bản mà mô hình AI xử lý, có thể là một từ, một phần của từ, ký tự hoặc dấu câu. Theo National Business Daily, lượng token tiêu thụ ngày càng được xem là chỉ số quan trọng phản ánh mức độ triển khai thực tế và tần suất ứng dụng của các mô hình.
Bảng xếp hạng mới cho thấy cuộc cạnh tranh toàn cầu trong lĩnh vực AI đang ngày càng gay gắt, khi các nhà phát triển không chỉ quan tâm đến năng lực mô hình mà còn ưu tiên khả năng triển khai ở quy mô lớn và hiệu quả sử dụng.

Bình luận
0