AI & Blockchain

Cuộc chiến tìm ngôi minh chủ giữa các mô hình AI của Trung Quốc

Bùi Tú • 30/07/2025 11:00

Ngành trí tuệ nhân tạo (AI) của Trung Quốc đang chứng kiến sự chuyển mình khi DeepSeek — từng là kẻ thống trị tuyệt đối trong lĩnh vực mô hình mã nguồn mở — nay dần đánh mất vị thế vào tay các đối thủ mới nổi.

Dữ liệu mới từ nền tảng điện toán đám mây PPIO cho thấy thị phần từng gần như tuyệt đối của DeepSeek đang suy giảm, trong khi các mô hình khác — đặc biệt là dòng Qwen của Alibaba — đang trỗi dậy mạnh mẽ.

Thị phần của DeepSeek sụt giảm khi các đối thủ vươn lên

DeepSeek từng là thế lực dẫn đầu trong lĩnh vực AI mã nguồn mở tại Trung Quốc. Trong quý I năm 2025, các mô hình AI của hãng chiếm hơn 99% lượng sử dụng trên nền tảng PPIO. Tuy nhiên, đến tháng 6, thị phần này đã giảm xuống còn khoảng 80%, theo dữ liệu được PPIO công bố cuối tuần trước.

PPIO lý giải sự sụt giảm này là do sự xuất hiện của nhiều đối thủ mạnh. Công ty cho biết: “Kể từ tháng 5, thị phần của DeepSeek [trên nền tảng chúng tôi] đã giảm do sự đổ bộ của nhiều mô hình xuất sắc, mang đến cho người dùng nhiều lựa chọn hơn”.

HIện giờ, DeepSeek và Qwen là đối thủ chính của nhau

Một trong những đối thủ đáng chú ý nhất là dòng mô hình Qwen của Tập đoàn Alibaba. Đến cuối tháng 5, Qwen đã vượt mặt DeepSeek trên PPIO, đạt mức sử dụng đỉnh điểm 56%. Alibaba ra mắt dòng Qwen3 vào tháng 4 và chỉ trong vòng vài tháng, thị phần của họ đã tăng từ dưới 1% vào tháng 1 lên hơn 10% vào tháng 6.

Các tân binh thúc đẩy cuộc đua AI mã nguồn mở tại Trung Quốc

PPIO là một trong những nền tảng đầu tiên cung cấp các mô hình V3 và R1 của DeepSeek cho các nhà phát triển bên thứ ba vào tháng 1, góp phần thúc đẩy làn sóng áp dụng AI trên toàn quốc. Tuy nhiên, các đối thủ khác nhanh chóng gia nhập cuộc chơi. Ngày 12.7, PPIO bổ sung mô hình Kimi-K2-Instruct — một mô hình mã nguồn mở do MoonShot AI phát triển, start-up được Alibaba hậu thuẫn. Mô hình này nhanh chóng thu hút sự quan tâm rộng rãi trên toàn cầu.

Cuộc cạnh tranh trong hệ sinh thái AI Trung Quốc vẫn vô cùng khốc liệt. Hiện có hơn 1.500 mô hình AI đang được phát triển hoặc triển khai tại quốc gia này, với nhiều start-up tập trung vào việc cải thiện tốc độ và khả năng sử dụng của hệ thống. Trong khi các đối thủ mới tích cực cải tiến mô hình và mở rộng khả năng tiếp cận, DeepSeek lại khá kín tiếng về các phiên bản kế tiếp, tạo cơ hội cho các đối thủ lấn lướt.

Các mô hình mã nguồn mở từ những công ty Trung Quốc khác, như Zhipu AI có trụ sở tại Bắc Kinh, cũng ghi nhận mức sử dụng tăng trên PPIO trong nửa đầu năm 2025.

Sự công nhận toàn cầu vẫn giúp DeepSeek duy trì hiện diện

Dù mất một phần thị phần trên PPIO, DeepSeek vẫn giữ được vị thế trên trường quốc tế. Theo OpenRouter — một chợ AI có trụ sở tại Mỹ — DeepSeek xếp trong top 10 nhà cung cấp mô hình AI hàng đầu toàn cầu vào giữa tháng 7. Trên nền tảng này, DeepSeek chiếm 20% lượng sử dụng, so với 10,5% của Qwen. Chỉ có Google và Anthropic (được Amazon hậu thuẫn) xếp cao hơn.

Ngoài ra, một cuộc khảo sát toàn cầu gần đây của hãng tư vấn Artificial Analysis cho thấy DeepSeek vẫn được giới chuyên gia đánh giá cao. Hơn một nửa số người được hỏi, gồm nhiều chuyên gia Trung Quốc, cho biết họ sẵn sàng sử dụng các mô hình của DeepSeek — phản ánh sức hút bền bỉ của công ty này trên thị trường quốc tế.

Khi cuộc cạnh tranh ngày càng gay gắt và các mô hình mới không ngừng xuất hiện, bước đi tiếp theo của DeepSeek — đặc biệt là việc tung ra các hệ thống thế hệ mới được mong đợi từ lâu — sẽ có vai trò quyết định liệu họ có thể duy trì vị thế dẫn đầu trong ngành AI Trung Quốc đang chuyển động nhanh chóng hay không.

6 điểm mà Qwen3 hơn DeepSeek

Thứ nhất, Qwen3 được đánh giá cao về khả năng nghiên cứu, tóm tắt và cấu trúc văn bản. Điều này rất hữu ích cho các tác vụ cần phân tích và tổng hợp thông tin từ nhiều nguồn khác nhau.

Thứ hai, dù cả Qwen3 và DeepSeek V3/R1 đều sử dụng kiến trúc Mixture of Experts (MoE), Qwen3 được cho là đã tối ưu hóa cách tiếp cận này để trở nên hiệu quả và linh hoạt hơn.

Cân bằng hiệu suất và tài nguyên: Qwen3-235B-A22B (MoE) có thể đạt hiệu suất vượt trội so với DeepSeek R1 671B trong nhiều tiêu chí, dù chỉ với 22B tham số hoạt động. Điều này cho thấy khả năng tối ưu hóa để chạy các mô hình lớn mà không đòi hỏi quá nhiều tài nguyên phần cứng.

Chế độ lý luận linh hoạt: Các mô hình MoE của Qwen3 có khả năng chuyển đổi liền mạch giữa các chế độ "suy nghĩ" và "không suy nghĩ", giúp tối ưu hóa cả thời gian phản hồi nhanh chóng lẫn khả năng lý luận sâu sắc tùy thuộc vào độ phức tạp của tác vụ.

Thứ ba, Qwen3 cho thấy sự vượt trội trong các tác vụ viết và lập trình mã (coding). Qwen3-235B-A22B và Qwen3-30B-A3B đã đạt được kết quả cạnh tranh hoặc vượt trội hơn các mô hình nhẹ hơn như GPT-4 Omni và Gemma 3 trong các thử nghiệm lập trình (HumanEval) và toán học.

Đặc biệt, Qwen3-Coder của Alibaba được giới thiệu là mô hình AI lập trình tác nhân tiên tiến nhất của họ, đạt các tiêu chuẩn tiên tiến.

Trong khi DeepSeek R1 có thể giữ lợi thế ở các tác vụ toán học phức tạp và tốc độ lý luận, Qwen3 tỏ ra mạnh mẽ và tinh tế hơn trong việc tạo ra kết quả mã hóa.

Thứ tư, Qwen3 còn có ưu điểm nổi bật về khả năng đa phương thức, tức là có thể xử lý và tích hợp dữ liệu từ nhiều nguồn khác nhau như văn bản, hình ảnh. Điều này giúp Qwen3 linh hoạt hơn cho các nhu cầu đa dạng, từ tạo văn bản nhanh chóng đến giải quyết vấn đề phức tạp. DeepSeek được đánh giá là còn hạn chế về các tùy chọn đa phương thức mở.

Thứ năm, người dùng nhận thấy Qwen3 có đầu ra nhanh hơn, nhất quán hơn và thân thiện hơn. Nó được cho là hiểu rõ hơn các sắc thái và yêu cầu của người dùng, làm cho trải nghiệm tương tác tự nhiên và hiệu quả hơn cho các tác vụ đơn giản.

Thứ sáu, Qwen3 cung cấp một loạt các biến thể mô hình đa dạng, gồm cả kiến trúc Dense (từ 0.5B đến 32B tham số) và MoE (30B/235B tham số). Sự đa dạng này đảm bảo người dùng có thể lựa chọn mô hình phù hợp nhất với yêu cầu cụng thể, cân bằng giữa hiệu suất và mức tiêu thụ tài nguyên.