Mô hình AI đắt giá nhất của Google dường như vừa vượt qua cột mốc lớn: "Phá đảo" - một game điện tử ra đời cách đây 29 năm.
Cuối tuần qua, CEO Google - Sundar Pichai, hào hứng đăng tải trên X: “Một cái kết tuyệt vời! Gemini 2.5 Pro vừa chinh phục Pokémon Blue!”.
Để làm rõ: Livestream “Gemini chơi Pokémon” thực chất là dự án cá nhân của một kỹ sư phần mềm 30 tuổi có biệt danh Joel Z, không thuộc Google. Tuy nhiên, các lãnh đạo Google đã liên tục cổ vũ nỗ lực này.
Logan Kilpatrick – người phụ trách sản phẩm của Google AI Studio, đã đăng vào tháng trước rằng Gemini đang “tiến triển rất tốt trong việc chinh phục Pokémon” và đã “kiếm được huy hiệu thứ 5 (mô hình tốt thứ nhì mới chỉ có 3 huy hiệu, dù dùng một bộ công cụ khác)”, khiến Pichai đùa lại: “Chúng tôi đang phát triển API – Artificial Pokémon Intelligence”.
Vào tháng 2.2025, Anthropic từng nêu bật thành tựu của các mô hình Claude AI khi chơi “Pokémon Red”, cho rằng “năng lực tư duy mở rộng và huấn luyện tác tử” giúp Claude có “lợi thế lớn” trong các nhiệm vụ bất ngờ như chơi game cổ điển. (Pokémon Red và Blue là hai phiên bản của game GameBoy ra mắt lần đầu năm 1996, gắn liền với thương hiệu Pokémon lâu đời.) Joel Z thậm chí còn lấy cảm hứng từ kênh Twitch “Claude chơi Pokémon”.
Tuy đạt được tiến bộ, Claude hiện vẫn chưa hoàn thành “Pokémon Red”. Vậy Gemini vượt trội hơn? Trên trang Twitch của mình, Joel Z nhấn mạnh: “Xin đừng xem đây là thước đo khả năng chơi Pokémon của các mô hình ngôn ngữ lớn. Không thể so sánh trực tiếp, bởi Gemini và Claude sử dụng công cụ khác nhau, nhận thông tin khác nhau”.
Cả hai mô hình AI đều cần trợ giúp để chơi game – đó chính là vai trò của các bộ công cụ tác tử (agent harness): chúng cung cấp ảnh chụp màn hình trò chơi đã được bổ sung thông tin, cho phép AI đưa ra hành động phù hợp (thậm chí gọi thêm tác tử chuyên biệt), rồi nhấn nút tương ứng với lựa chọn của AI.
Joel Z thừa nhận rằng Gemini có nhận được một số can thiệp kỹ thuật từ nhà phát triển, nhưng khẳng định điều đó không phải gian lận.
Joel Z khẳng định: “Các can thiệp của tôi giúp cải thiện khả năng ra quyết định và suy luận tổng thể của Gemini. Tôi không đưa ra gợi ý cụ thể, không có hướng dẫn từng bước hay chỉ dẫn trực tiếp nào cho các thử thách như Núi Moon cả. Gần nhất chỉ là tôi cho Gemini biết rằng nó phải nói chuyện với tên Rocket Grunt hai lần để lấy chìa khóa thang máy – một lỗi đã được sửa trong bản Pokémon Yellow sau này”.
Joel Z cũng cho biết thêm: “Gemini chơi Pokémon vẫn đang trong quá trình phát triển và khung chương trình liên tục được cải tiến”.