Yann LeCun, Giám đốc khoa học về trí tuệ nhân tạo (AI) của Meta Platforms, chỉ ra 4 khả năng cốt lõi ở con người mà mô hình AI vẫn chưa chạm tới.
Nhịp đập khoa học

Ông trùm AI tại Meta: Các mô hình AI hiện thiếu 4 năng lực cốt lõi mà con người sở hữu

Sơn Vân 27/05/2025 12:42

Yann LeCun, Giám đốc khoa học về trí tuệ nhân tạo (AI) của Meta Platforms, chỉ ra 4 khả năng cốt lõi ở con người mà mô hình AI vẫn chưa chạm tới.

Theo trang Insider, Yann LeCun gần đây đã chia sẻ định nghĩa cơ bản của ông về trí thông minh với Anthony Annunziata – lãnh đạo AI của IBM.

“Có bốn đặc điểm thiết yếu của hành vi thông minh mà mọi loài động vật, hoặc những động vật tương đối thông minh, đều có thể làm được và tất nhiên con người cũng vậy. Hiểu biết về thế giới vật lý, có trí nhớ bền vững, khả năng suy luận và lập kế hoạch, đặc biệt là lập kế hoạch phức tạp và có tính phân cấp”, Giám đốc khoa học về AI của Meta Platforms nói.

Yann LeCun cho rằng AI, đặc biệt là các mô hình ngôn ngữ lớn, vẫn chưa đạt đến ngưỡng này và việc tích hợp các năng lực đó sẽ đòi hỏi sự thay đổi trong cách huấn luyện chúng. Đó là lý do tại sao nhiều hãng công nghệ lớn đang cố gắng lắp ghép các khả năng mới vào các mô hình hiện có trong cuộc đua thống trị lĩnh vực AI, Yann LeCun nói.

“Để hiểu thế giới vật lý, bạn huấn luyện một hệ thống thị giác riêng biệt, sau đó gắn nó lên mô hình ngôn ngữ. Với trí nhớ, bạn dùng RAG, hoặc gắn thêm một hệ thống ghi nhớ liên kết, hay đơn giản là làm cho mô hình lớn hơn”, ông cho hay.

RAG (tạo sinh có tăng cường truy xuất) là một cách để cải thiện kết quả đầu ra của các mô hình ngôn ngữ lớn bằng cách sử dụng các nguồn kiến thức bên ngoài. Thay vì chỉ dựa vào thông tin đã được học trong quá trình đào tạo ban đầu (có thể bị lỗi thời hoặc thiếu chi tiết), kỹ thuật này kết hợp hai bước chính:

- Truy xuất: Khi nhận được câu hỏi từ người dùng, mô hình AI trước tiên sẽ tìm kiếm và truy xuất thông tin liên quan từ kho kiến thức bên ngoài, chẳng hạn cơ sở dữ liệu, tập hợp tài liệu, trang web…

- Tạo sinh: Mô hình AI sẽ sử dụng những thông tin vừa tìm thấy để tạo ra câu trả lời chính xác và có căn cứ hơn, thay vì chỉ dựa vào những gì đã học từ trước.

Phương pháp nêu trên được phát triển tại Meta Platforms.

Tuy nhiên, tất cả những thứ đó chỉ là “các mẹo vá víu tạm thời”, Yann LeCun tuyên bố.

ong-trum-ai-tai-meta-mo-hinh-ai-con-thieu-4-nang-luc-cot-loi-ma-con-nguoi-co.png
Yann LeCun nói rằng các mô hình AI hiện tại thiếu 4 đặc điểm then chốt của con người - Ảnh: Internet

Đào tạo mô hình AI dựa trên thế giới thực

Lãnh đạo AI tại Meta Platforms đã nhiều lần đề cập đến một phương án thay thế mà ông gọi là mô hình dựa trên thế giới thực. Đây là những mô hình được huấn luyện từ các tình huống đời thực và có mức độ nhận thức cao hơn so với AI dựa trên mô hình theo mẫu.

Trong cuộc trò chuyện với Anthony Annunziata, Yann LeCun đưa ra một định nghĩa khác: “Bạn có nhận thức hoặc thông tin về tình hình hiện tại của môi trường xung quanh vào một thời điểm nhất định. Mô hình thế giới có thể dự đoán cách thế giới sẽ tiến triển như thế nào do hậu quả của một hành động mà bạn thực hiện”.

Theo Yann LeCun, do thế giới quá phức tạp và khó lường, cách duy nhất để huấn luyện mô hình AI theo hướng đó là thông qua khái niệm trừu tượng, thay vì chỉ học từ dữ liệu cụ thể hoặc mô hình theo mẫu.

Meta Platforms đang thử nghiệm điều này thông qua V-JEPA, mô hình AI mà họ đã công bố rộng rãi vào tháng 2. Công ty mẹ Facebook mô tả đây là mô hình AI không tạo sinh, học bằng cách dự đoán các phần bị thiếu hoặc bị che khuất trong một video.

Yann LeCun nói rằng thay vì bắt mô hình AI phải học từng điểm ảnh một cách chính xác (rất khó và tốn kém), nên dạy nó hiểu bản chất và logic trừu tượng của video. Điều đó sẽ giúp mô hình AI dự đoán tốt hơn và bỏ qua những chi tiết không quan trọng hoặc ngẫu nhiên.

Khái niệm này tương tự như cách các nhà hóa học xây dựng một hệ thống phân cấp cơ bản cho các thành phần cấu tạo nên vật chất, ví dụ hạt → nguyên tử → phân tử → vật chất.

“Chúng ta tạo ra các khái niệm trừu tượng. Hạt → nguyên tử → phân tử → vật chất. Mỗi lần đi lên một tầng, chúng ta loại bỏ rất nhiều thông tin từ tầng dưới mà không còn liên quan đến nhiệm vụ đang thực hiện”, ông cho hay.

Tóm lại, đó là một cách khác để nói rằng chúng ta đã học cách hiểu thế giới vật lý bằng cách tạo ra các hệ thống phân cấp.

Yann LeCun được mệnh danh là “cha đẻ của AI” vì những đóng góp mang tính nền tảng trong lĩnh vực học sâu, đặc biệt là trong việc phát triển mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs). Đây là một trong những công nghệ cốt lõi đứng sau nhiều tiến bộ AI hiện nay, từ nhận diện hình ảnh đến xử lý ngôn ngữ tự nhiên.

Học sâu là một nhánh của học máy, sử dụng mạng nơ-ron nhiều lớp để tự động học từ dữ liệu rất lớn và phức tạp. Học máy là một nhánh của AI, cho phép máy tính tự học từ dữ liệu và cải thiện hiệu suất theo thời gian mà không cần được lập trình rõ ràng từng bước.

"Mở rộng quy mô không làm AI thông minh hơn"

Trong nhiều năm, ngành công nghiệp AI đã tuân thủ một tập hợp các nguyên tắc được gọi là "quy luật mở rộng quy mô". Các nhà nghiên cứu của OpenAI (công ty tạo ra ChatGPT) đã phác thảo chúng trong bài viết mang tính bước ngoặt năm 2020.

Các nhà nghiên cứu này viết: "Hiệu suất mô hình AI phụ thuộc nhiều nhất vào quy mô, gồm ba yếu tố là số lượng tham số mô hình N (không bao gồm cả embeddings), kích thước của tập dữ liệu D và lượng điện toán C được sử dụng để đào tạo".

Trong lĩnh vực AI, embeddings là một kỹ thuật dùng để chuyển đổi các đối tượng dữ liệu (từ ngữ, câu, hình ảnh, hoặc âm thanh) thành véc tơ số học, giúp các hệ thống máy tính có thể xử lý và hiểu được chúng dễ dàng hơn. Cụ thể hơn, embeddings giúp biểu diễn thông tin phức tạp dưới dạng các vectơ trong không gian đa chiều.

Về bản chất, càng nhiều thì càng tốt khi nói đến việc xây dựng AI có trí thông minh cao. Ý tưởng này đã thúc đẩy các khoản đầu tư lớn vào các trung tâm dữ liệu cho phép mô hình AI xử lý và học hỏi từ lượng thông tin khổng lồ có sẵn.

Song gần đây, các chuyên gia AI trên khắp Thung lũng Silicon (Mỹ) đã bắt đầu thách thức học thuyết đó.

"Hầu hết các vấn đề thú vị lại không thể mở rộng quy mô một cách hiệu quả. Bạn không thể chỉ đơn giản cho rằng nhiều dữ liệu hơn và nhiều điện toán hơn đồng nghĩa AI thông minh hơn", Yann LeCun phát biểu tại Đại học Quốc gia Singapore cuối tháng 4.

Luận điểm của Yann LeCun xoay quanh ý tưởng rằng việc đào tạo AI trên lượng lớn kiến thức cơ bản, chẳng hạn dữ liệu internet, sẽ không dẫn đến một dạng siêu trí tuệ nào đó. Theo ông, AI thông minh là một loại khác biệt.

Yann LeCun nói: “Sai lầm là khi các hệ thống AI rất đơn giản hoạt động tốt cho các vấn đề đơn giản, nhiều người sẽ suy diễn rằng chúng sẽ hoạt động tốt với cả những vấn đề phức tạp. AI làm được những điều tuyệt vời, nhưng điều đó tạo nên một suy nghĩ sai về việc mở rộng quy mô, rằng bạn chỉ cần mở rộng hệ thống hơn nữa là chúng sẽ tự nhiên trở nên thông minh hơn”.

Hiện tại, tác động từ việc mở rộng quy mô được phóng đại, vì nhiều bước đột phá mới nhất trong AI thực ra đến “rất dễ dàng”, ông nói. Theo Yann LeCun, các mô hình ngôn ngữ lớn nhất hiện nay được đào tạo dựa trên lượng thông tin tương đương trong vỏ não thị giác của đứa trẻ 4 tuổi. Vỏ não thị giác là khu vực chính trong vỏ não của bộ não, chịu trách nhiệm xử lý thông tin thị giác nhận được từ võng mạc của mắt.

Yann LeCun nói thêm: “Khi bạn giải quyết các vấn đề trong thế giới thực với sự mơ hồ và không chắc chắn, thì đó không chỉ là việc mở rộng quy mô nữa”.

Bài liên quan
Ông trùm AI tại Meta: Châu Âu nên giữ mô hình mã nguồn mở như DeepSeek hoặc có nguy cơ bị tụt hậu
Châu Âu nên giữ các mô hình trí tuệ nhân tạo (AI) mã nguồn mở hoặc có nguy cơ bị tụt lại phía sau, theo lời Yann LeCun - Giám đốc khoa học AI của Meta Platforms.

(0) Bình luận
Nổi bật Một thế giới
Hợp nhất Cần Thơ-Sóc Trăng-Hậu Giang: 'Thiên thời, địa lợi, nhân hòa'
6 giờ trước Sự kiện
Tổng Bí thư nhấn mạnh khi hợp nhất Cần Thơ-Sóc Trăng-Hậu Giang sẽ mở rộng đáng kể không gian phát triển, hội tụ đầy đủ các yếu tố "thiên thời, địa lợi, nhân hòa" để dẫn dắt cả vùng ĐBSCL đi lên.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Ông trùm AI tại Meta: Các mô hình AI hiện thiếu 4 năng lực cốt lõi mà con người sở hữu