Trải nghiệm ChatGPT AgentTrợ lý AI mới của OpenAI còn nhiều hạn chế
Mới đây, The Verge (trang tin công nghệ của Mỹ) đã có trải nghiệm thực tế về phiên bản ChatGPT Agent của OpenAI. Liệu có đúng như những gì được quảng bá, trí tuệ nhân tạo này trong thực tế là như thế nào?
Cách đây không lâu, Open AI ra mắt ChatGPT Agent - một trợ lý về trí tuệ nhân tạo được kỳ vọng có thể tự động thực hiện những tác vụ phức tạp, đa bước thay người dùng nhờ khả năng vận hành “máy tính ảo” riêng biệt. Nhưng vì nhu cầu cho ChatGPT Agent cao vượt dự tính, OpenAI đã trì hoãn việc phát hành cho người dùng Plus và nhóm, nên The Verge đã mua gói ChatGPT Pro với giá 200 USD/tháng để trải nghiệm sớm.
Theo ghi nhận ban đầu của người dùng trải nghiệm này thì đây là bước tiến mới trong lĩnh vực các AI agent (tác nhân AI), nhưng nó khá chậm chạp, không phải lúc nào cũng hoạt động ổn định và thỉnh thoảng có lỗi.
Khi bật chế độ “Agent Mode”, ChatGPT Agent gợi ý các nhiệm vụ, ví dụ tìm máy xay cà phê dưới 150 USD được đánh giá cao, tạo danh sách hiệu bánh tại Copenhagen, hoặc tìm mua đèn phong cách cổ điển trên Etsy dưới 200 USD. Trang tin công nghệ này đã chọn thử nhiệm vụ tìm đèn cổ điển trên Etsy với yêu cầu chi tiết về giá, hình ảnh và đánh giá người bán.
Quá trình thực hiện rất chi tiết nhưng mất đến gần 50 phút, mà kết quả lại chưa thật sự hoàn hảo. Dù tác nhân thông báo đã thêm 5 món hàng vào giỏ trên Etsy, nhưng khi kiểm tra tài khoản thật thì họ lại thấy trống trơn do agent (tác nhân) chỉ thao tác trên máy ảo, không thể truy cập trình duyệt hay tài khoản cá nhân. Điều này làm giảm hiệu quả và trải nghiệm đặt hàng tự động như quảng cáo.

Ngoài ra, tác nhân ChatGPT còn chậm và thiếu ổn định. Khi thử yêu cầu thực hiện các hành động tài chính như chuyển khoản ngân hàng, tác nhân báo lỗi và từ chối hỗ trợ vì các tác vụ nhạy cảm hiện vẫn bị giới hạn. OpenAI giải thích rằng để bảo mật, người dùng phải giám sát quá trình với chế độ “Watch Mode” và tác nhân chỉ xử lý các giao dịch tiêu dùng thông thường, không bao gồm thanh toán hay giao dịch tài chính phức tạp.
Người dùng của tờ The Verge cũng thử yêu cầu tác nhân này mua hoa tặng bạn sống tại Colorado. Nó rất kỹ lưỡng trong khâu nghiên cứu, cung cấp danh sách chọn lựa kèm đánh giá dựa trên các nguồn uy tín. Tuy nhiên, khi đi đến bước đặt hàng, tác nhân chỉ có thể hướng dẫn chứ không thể tự động hoàn tất đơn hàng do thiếu quyền truy cập thanh toán và đăng nhập trên trang bán, dù chính nó đã giới thiệu và thậm chí đề nghị giúp đặt hàng.
Điều này khiến người dùng bối rối, vì OpenAI từng quảng bá tác nhân có thể tự đặt mua đồ cho bạn, ví dụ mua thực phẩm cho gia đình 4 người. Khi người dùng của The Verge hỏi kỹ hơn, tác nhân nói nó không có quyền truy cập thanh toán, không thể đăng nhập hoặc điền thông tin thay họ trên trang web bên thứ 3, dù có thể hướng dẫn từng bước. Agent tự nhận là trợ lý mạnh mẽ có thể thu thập, so sánh và hỗ trợ viết nội dung nhưng không thể đặt chỗ hay thanh toán giúp.
Từ trải nghiệm này, rõ ràng ChatGPT Agent là bước tiến quan trọng, hứa hẹn mở ra kỷ nguyên mới cho trí tuệ nhân tạo trợ lý ảo tự động làm việc đa nhiệm. Nhưng để trở thành trợ lý đắc lực trong “cuộc sống số”, tác nhân này còn phải khắc phục nhiều vấn đề về tốc độ, ổn định và khả năng thao tác trực tiếp trên hệ thống bên ngoài.
Việc thử nghiệm thực tế giúp người dùng có cái nhìn khách quan về điểm mạnh và hạn chế hiện tại của ChatGPT Agent, đồng thời kỳ vọng OpenAI sẽ liên tục nâng cấp để biến công cụ này thành trợ thủ tin cậy trong quá trình số hóa và tự động hóa công việc hằng ngày.