Scott White vẫn chưa hết ngạc nhiên về tốc độ mà trí tuệ nhân tạo (AI) đã chuyển mình từ một điều mới mẻ thành cộng sự làm việc thực sự.
Chỉ hơn một năm trước, Scott White (Trưởng bộ phận sản phẩm Claude AI tại công ty khởi nghiệp Anthropic) còn chứng kiến các công cụ lập trình AI sơ khai hầu như không thể hoàn thành nổi một dòng mã. Ngày nay, ông đang tự xây dựng các tính năng phần mềm sẵn sàng đưa vào sản xuất dù bản thân không phải là lập trình viên chuyên nghiệp.
“Tôi không còn nghĩ công việc của mình là viết PRD (tài liệu yêu cầu sản phẩm) và cố thuyết phục ai đó thực hiện nữa. Việc đầu tiên tôi làm là liệu có thể tự xây dựng một nguyên mẫu hoạt động được trên máy chủ thử nghiệm. Sau đó, tôi chia sẻ bản demo về việc nó thực sự hoạt động không”, Scott White chia sẻ tại một buổi trò chuyện tại VB Transform 2025 - hội nghị AI doanh nghiệp thường niên của trang tin VentureBeat tại thành phố San Francisco (Mỹ).
PRD là tài liệu quan trọng trong quá trình phát triển sản phẩm, đặc biệt là trong lĩnh vực công nghệ.
PRD thường mô tả chi tiết về một sản phẩm hoặc tính năng mới của sản phẩm. Cụ thể gồm:
Mục tiêu và tầm nhìn: Sản phẩm/tính năng này ra đời để giải quyết vấn đề gì, đạt được mục tiêu kinh doanh nào.
Đối tượng người dùng: Ai sẽ sử dụng sản phẩm này và nhu cầu của họ là gì.
Các tính năng và chức năng: Liệt kê cụ thể các tính năng mà sản phẩm/tính năng mới sẽ có, cách chúng hoạt động và tương tác với nhau.
Yêu cầu phi chức năng: Các yêu cầu về hiệu suất, bảo mật, khả năng mở rộng, khả năng sử dụng…
Tiêu chí chấp nhận: Các tiêu chí để đánh giá sản phẩm/tính năng đã hoàn thành và đáp ứng yêu cầu.
Phạm vi: Những gì sẽ được có và không được có trong phiên bản hiện tại.
Mục đích chính của PRD
Đảm bảo sự rõ ràng và thống nhất: Giúp tất cả các bên liên quan (nhóm phát triển, thiết kế, tiếp thị, kinh doanh...) có cùng một sự hiểu biết về sản phẩm/tính năng.
Định hướng phát triển: Cung cấp lộ trình và hướng dẫn cho nhóm phát triển trong suốt quá trình xây dựng sản phẩm.
Làm cơ sở cho việc kiểm thử: Dựa vào các yêu cầu trong PRD để xây dựng các trường hợp kiểm thử, đảm bảo sản phẩm hoạt động đúng như mong đợi.
Quản lý kỳ vọng: Giúp quản lý kỳ vọng của các bên liên quan và khách hàng về sản phẩm.
Sự thay đổi này phản ánh bước chuyển lớn hơn trong cách các doanh nghiệp ứng dụng AI, từ chatbot đơn giản trả lời câu hỏi đến các hệ thống tác tử tinh vi có thể tự chủ thực hiện công việc. Trải nghiệm của Scott White mang đến cái nhìn thoáng qua về những gì có thể đến với hàng triệu nhân viên trí thức khác.
Tác tử AI là hệ thống hoặc chương trình máy tính được thiết kế để thực hiện các tác vụ tự động bằng cách sử dụng AI. Các tác tử AI có khả năng tương tác với môi trường, thu thập thông tin, xử lý dữ liệu, ra quyết định và thực hiện các hành động dựa trên mục tiêu được đặt ra.
Từ hoàn thiện mã đến lập trình tự động: AI phát triển với tốc độ chóng mặt
Sự phát triển diễn ra nhanh đến khó tin. Khi Scott White gia nhập Anthropic, mô hình Claude 2 của công ty này chỉ mới có khả năng hoàn thiện văn bản cơ bản. Việc Anthropic ra mắt Claude 3.5 Sonnet đã cho phép xây dựng cả ứng dụng hoàn chỉnh, dẫn đến các tính năng như Artifacts - giúp người dùng có thể tạo giao diện tùy chỉnh. Giờ đây, Claude 4 đạt điểm 72,5% trên SWE-bench, có thể hoạt động như “kỹ sư phần mềm tác tử hoàn toàn từ xa”, Scott White mô tả.
SWE-bench là bài kiểm tra tiêu chuẩn dùng để đánh giá khả năng lập trình phần mềm của các mô hình AI, đặc biệt là mức độ hiểu và sửa lỗi trong mã nguồn thực tế, giống kỹ sư phần mềm làm việc hàng ngày.
“Kỹ sư phần mềm tác tử hoàn toàn từ xa” là cách diễn đạt để mô tả một mô hình AI có thể tự lập trình như kỹ sư phần mềm, nhưng có khả năng tự hành động, tự đặt mục tiêu, ra quyết định và thực hiện nhiều bước để đạt được điều đó, không cần người giám sát trực tiếp, giống nhân viên làm việc từ xa toàn thời gian.
Claude Code, công cụ lập trình mới nhất của Anthropic, có thể phân tích toàn bộ cơ sở mã, tìm kiếm tài liệu API (giao diện lập trình ứng dụng) trên internet, tạo pull request (yêu cầu gửi mã mới hoặc mã đã sửa từ một nhánh vào nhánh chính trong dự án phần mềm), phản hồi các bình luận đánh giá mã và cải tiến giải pháp. Tất cả quy trình này có thể chạy song song, độc lập trong nhiều giờ. White cho biết 90% Claude Code là do chính hệ thống AI viết ra.
“Đó giống như một quy trình tác tử hoàn chỉnh chạy nền, điều chưa thể làm được cách đây 6 tháng”, Scott White giải thích
Các tập đoàn lớn rút ngắn thời gian làm việc từ vài tuần còn vài phút nhờ tác tử AI
Ảnh hưởng của công nghệ này vượt xa ra ngoài lĩnh vực phát triển phần mềm. Novo Nordisk, tập đoàn dược phẩm Đan Mạch, đã tích hợp Claude vào quy trình làm báo cáo lâm sàng vốn mất 10 tuần, giờ chỉ cần 10 phút. GitLab (Mỹ) sử dụng Claude cho đủ thứ từ đề xuất bán hàng đến tài liệu kỹ thuật. Hãng nghệ tài chính Intuit (Mỹ) triển khai Claude để đưa ra lời khuyên về thuế cho người tiêu dùng.
GitLab cung cấp nền tảng DevOps (phát triển + vận hành) tất cả trong một, dùng để quản lý mã nguồn, phát triển phần mềm, kiểm thử, tích hợp liên tục và triển khai tự động - tất cả trên cùng một hệ thống.
Scott White phân biệt các mức độ tích hợp AI: Mô hình ngôn ngữ đơn giản chỉ trả lời câu hỏi; mô hình có công cụ hỗ trợ như tìm kiếm web; quy trình có cấu trúc tích hợp AI vào hoạt động doanh nghiệp; tác tử hoàn chỉnh có thể tự đặt mục tiêu và dùng nhiều công cụ, lý luận nhiều bước nhằm đạt được mục tiêu đó.
“Tôi xem tác tử là thứ có một mục tiêu, rồi nó có thể làm nhiều thứ để đạt được mục tiêu đó”, Scott White cho hay. Yếu tố then chốt giúp điều này xảy ra là mối quan hệ “không thể tách rời” giữa trí tuệ của mô hình và các khả năng sản phẩm mới.
Cuộc cách mạng hạ tầng: Xây dựng mạng lưới cộng tác viên AI
Một bước tiến quan trọng về hạ tầng là giao thức ngữ cảnh mô hình của Anthropic. Thay vì từng công ty phải xây kết nối riêng đến từng nguồn dữ liệu hay công cụ, giao thức ngữ cảnh cung cấp cách chuẩn hóa để hệ thống AI truy cập phần mềm doanh nghiệp, từ Salesforce đến kho tri thức nội bộ.
“Nó thực sự dân chủ hóa quyền truy cập dữ liệu”, Scott White tuyên bố, lưu ý rằng các tích hợp do một công ty tạo ra có thể được chia sẻ và tái sử dụng bởi các hãng khác nhờ vào giao thức mã nguồn mở.
Với các tổ chức muốn ứng dụng tác tử AI, Scott White khuyên nên bắt đầu từ việc nhỏ và phát triển từng bước.
“Đừng cố xây cả hệ thống tác tử hoàn chỉnh ngay từ đầu. Hãy xây một thành phần, đảm bảo nó hoạt động, rồi mới tiếp tục phát triển phần kế tiếp”, ông nói.
Scott White cũng nhấn mạnh tầm quan trọng của hệ thống đánh giá hiệu suất AI. “Nó là PRD mới”, Scott White nói, nhấn mạnh rằng các công ty cần phát triển phương pháp mới để đo lường hiệu suất AI trong các nhiệm vụ cụ thể của doanh nghiệp.
Nhìn về tương lai, Scott White hình dung việc phát triển AI sẽ trở nên dễ tiếp cận với cả những người không có kỹ thuật, tương tự cách năng lực lập trình đã phát triển. Ông tưởng tượng một tương lai mà mỗi người không chỉ quản lý một tác tử AI, mà là một tổ chức gồm các hệ thống AI chuyên biệt.
Sự chuyển mình mà Scott White mô tả phản ánh xu thế rộng hơn trong ngành khi các doanh nghiệp vật lộn với khả năng mở rộng ngày càng nhanh của AI. Trong khi giai đoạn đầu là các thử nghiệm mang tính khám phá, giờ đây các doanh nghiệp đang tích hợp AI vào quy trình cốt lõi, làm thay đổi căn bản cách công việc được thực hiện.
Khi các tác tử AI ngày càng tự chủ và có năng lực hơn, thách thức là chuyển từ việc dạy máy làm việc sang quản lý cộng tác viên AI có thể hoạt động độc lập thời gian dài. Với Scott White, tương lai mà AI trở thành cộng sự làm việc đang dần hình thành, từng bước một, qua từng tính năng sản phẩm cụ thể.