Mô hình AI mã nguồn Qwen mở của Tập đoàn Alibaba đã cung cấp sức mạnh cho một khung tác nhân mới mang tên DeepSWE, giúp hệ thống này dẫn đầu trong một bảng xếp hạng quan trọng toàn cầu.
Thế giới số

Tác nhân AI của Alibaba đạt điểm cao nhất trong các mô hình mã nguồn mở

Anh Tú 05/07/2025 09:58

Mô hình AI mã nguồn Qwen mở của Tập đoàn Alibaba đã cung cấp sức mạnh cho một khung tác nhân mới mang tên DeepSWE, giúp hệ thống này dẫn đầu trong một bảng xếp hạng quan trọng toàn cầu.

alibaba.jpeg
DeepSWE sẽ giúp ích nhiều cho các lập trình viên

Vì sao DeepSWE vươn lên dẫn đầu?

Được phát triển bởi Agentica và Together AI có trụ sở tại San Francisco, DeepSWE đã đạt độ chính xác 59% trong bài kiểm tra SWEBench-Verified, vượt qua mọi mô hình mã nguồn mở khác, gồm cả V3-0324 của DeepSeek.

DeepSWE là một tác nhân phần mềm được xây dựng trên mô hình ngôn ngữ lớn Qwen3-32B, thuộc thế hệ thứ ba mới nhất của dòng AI đến từ Alibaba Cloud.

Các khung tác nhân (agentic frameworks) như vậy là nền tảng phần mềm cho phép các tác nhân AI hoạt động giống con người hơn – từ lập kế hoạch, cộng tác, ra quyết định, đến giải quyết vấn đề một cách độc lập.

Nếu bạn sử dụng các ứng dụng hoặc công cụ tự động hóa công việc – từ hỗ trợ khách hàng, tạo nội dung cho đến phát triển phần mềm, thì chiến thắng của DeepSWE là điều đáng quan tâm.

Các tác nhân AI như DeepSWE không chỉ được huấn luyện để trò chuyện, mà còn có thể viết mã, sửa lỗi và giải các bài toán phức tạp trên nền tảng như GitHub.

Về bản chất, chúng hoạt động như các trợ lý kỹ thuật số cho lập trình viên, giúp giảm bớt khối lượng công việc nặng nề trong ngành kỹ thuật phần mềm.

Điều gì khiến DeepSWE trở nên khác biệt?

DeepSWE được huấn luyện bằng rLLM, một hệ thống học tăng cường mô-đun do Agentica phát triển. Đặc biệt, nhóm phát triển không giữ kín kết quả mà công bố mã nguồn mở toàn bộ.

Điều này có nghĩa là các nhà phát triển trên toàn thế giới có thể truy cập bộ dữ liệu, mã nguồn, quy trình huấn luyện, và cả nhật ký đánh giá, từ đó giúp các đội nhóm khác phát triển, cải tiến và mở rộng các tác nhân AI của riêng mình nhanh hơn.

Mô hình này được huấn luyện trong 6 ngày liên tục trên các máy tính hiệu suất cao, sử dụng bộ xử lý đồ họa cao cấp Nvidia H100. Việc huấn luyện chuyên sâu này giúp mô hình học và xử lý hiệu quả các tác vụ phần mềm chi tiết và cấp cao.

Sự trỗi dậy của Alibaba trong lĩnh vực AI mã nguồn mở

Thành công này góp phần khẳng định tầm ảnh hưởng ngày càng tăng của Alibaba trong lĩnh vực AI mã nguồn mở toàn cầu. Tập đoàn có trụ sở tại Hàng Châu bắt đầu công khai phát hành các mô hình Qwen từ tháng 8.2023.

Tính đến tháng 4.2024, Alibaba đã phát hành hơn 200 mô hình Qwen mã nguồn mở, được tải xuống hơn 300 triệu lần và truyền cảm hứng cho hơn 100.000 mô hình dẫn xuất trên toàn thế giới.

Dòng Qwen3, ra mắt vào tháng 4, hỗ trợ các nền tảng như Ollama, LM Studio, SGLang và vLLM. Theo kết quả thử nghiệm nội bộ của Alibaba, một số mô hình như Qwen3-235B và Qwen3-4B đã ngang bằng hoặc thậm chí vượt qua các mô hình như o1 của OpenAI, Gemini của Google và R1 của DeepSeek trong các tác vụ như hỗ trợ lập trình, sinh văn bản và giải toán phức tạp.

Tháng trước, Chủ tịch Joe Tsai và CEO Eddie Wu Yongming của Alibaba đã tuyên bố trong thư gửi cổ đông rằng Qwen hiện là họ mô hình AI mã nguồn mở lớn nhất thế giới.

Họ nhấn mạnh chiến lược này là một phần trong nỗ lực rộng lớn nhằm thúc đẩy việc ứng dụng toàn cầu các hệ thống AI do Trung Quốc phát triển.

Đầu tư khổng lồ cho tương lai AI

Alibaba Cloud chưa có dấu hiệu chậm lại. Ngày 4.7, công ty công bố khoản đầu tư hơn 60 triệu USD để thúc đẩy đổi mới AI thông qua hệ sinh thái đối tác, trước khi năm tài chính hiện tại kết thúc vào tháng 3.

Khoản đầu tư này tiếp nối cam kết từ tháng 2 của CEO Wu, đầu tư ít nhất 380 tỉ nhân dân tệ (tương đương 53 tỉ USD) trong ba năm tới vào cơ sở hạ tầng điện toán đám mây và AI – một trong những dự án điện toán lớn nhất từng được hậu thuẫn bởi một công ty tư nhân tại Trung Quốc.

DeepSWE không phải chatbot

DeepSWE không giống một chatbot mà bạn nhập câu hỏi và nhận câu trả lời. Nó hoạt động trong một môi trường cụ thể (ví dụ: môi trường phát triển phần mềm mô phỏng, hoặc một dự án code thực tế) và sử dụng các "công cụ" để thực hiện nhiệm vụ:

Nhận nhiệm vụ (Problem): DeepSWE được cung cấp một "vấn đề" (ví dụ: một issue từ GitHub, một lỗi cần sửa).

Suy nghĩ và Lập kế hoạch: Dựa trên mô hình ngôn ngữ nền tảng (Qwen3-32B), DeepSWE sẽ "suy nghĩ" về vấn đề, phân tích code, tìm hiểu các tệp liên quan và lập kế hoạch các bước để giải quyết.

Sử dụng công cụ (Tool Use): Đây là điểm mấu chốt.

Ai sử dụng DeepsSWE?

DeepSWE là một dự án nghiên cứu tiên tiến, hoàn toàn nguồn mở, và việc sử dụng nó đòi hỏi kiến thức chuyên sâu về AI, lập trình, và hạ tầng máy học. Đối tượng sử dụng DeepSWE gồm:

Nhà nghiên cứu AI và Học máy: Muốn khám phá cách học tăng cường (RL) có thể được áp dụng để huấn luyện các tác nhân AI cho kỹ thuật phần mềm.

Các nhà phát triển AI: Muốn xây dựng các công cụ tự động hóa hoặc trợ lý lập trình tiên tiến cho riêng mình, dựa trên một AI agent mã nguồn mở hàng đầu.

Các công ty phần mềm: Quan tâm đến việc tích hợp các giải pháp tự động sửa lỗi hoặc tự động phát triển tính năng vào quy trình làm việc.

Bài liên quan

(0) Bình luận
Nổi bật Một thế giới
Đổi mới sáng tạo vì nông nghiệp bền vững và kinh tế số
một giờ trước Khoa học - công nghệ
Ba mô hình khởi nghiệp trong lĩnh vực nông nghiệp tái sinh, năng lượng sinh học và tài sản số được chia sẻ tại Founder Meet Up đầu tháng 7 cho thấy hướng đi thực tiễn, giàu tiềm năng ứng dụng.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Tác nhân AI của Alibaba đạt điểm cao nhất trong các mô hình mã nguồn mở