Nhịp đập khoa học

Đội ngũ Llama của Meta chảy máu chất xám, 5 nhân tài chuyển sang startup AI hàng đầu Pháp

Sơn Vân • 26/05/2025 22:47

Các mô hình Llama mã nguồn mở đã góp phần định hình chiến lược trí tuệ nhân tạo (AI) cho Meta Platforms. Tuy nhiên, phần lớn các nhà nghiên cứu xây dựng phiên bản gốc Llama hiện đã rời đi.

Trong số 14 tác giả được ghi nhận trong bài báo nổi bật năm 2023 giới thiệu Llama ra thế giới, chỉ còn ba người vẫn làm việc tại Meta Platforms, đó là nhà khoa học nghiên cứu Hugo Touvron, kỹ sư nghiên cứu Xavier Martinet và lãnh đạo chương trình kỹ thuật Faisal Azhar. Phần còn lại đã rời Meta Platforms, nhiều người trong số đó gia nhập hoặc sáng lập các đối thủ mới nổi.

Sự chảy máu chất xám này hiện rõ nhất thông qua Mistral AI, công ty khởi nghiệp AI hàng đầu Pháp có trụ sở tại thủ đô Paris, do hai cựu nghiên cứu viên Meta Platforms là Guillaume Lample và Timothée Lacroix (cũng là hai kiến trúc sư chính của Llama) đồng sáng lập. Cùng với ba cựu nhân viên Meta Platforms khác, Guillaume Lample và Timothée Lacroix đang xây dựng những mô hình AI mã nguồn mở mạnh mẽ, trực tiếp cạnh tranh với nỗ lực AI chủ đạo của công ty cũ.

doi-ngu-llama-cua-meta-chay-mau-chat-xam-5-nhan-tai-chuyen-sang-startup-ai-hang-dau-phap.jpg — Timothée Lacroix, Arthur Mensch và Guillaume Lample là những người đồng sáng lập Mistral AI - Ảnh: Insider

Làn sóng rời đi theo thời gian đặt ra câu hỏi về khả năng giữ chân nhân tài AI của Meta Platforms, đúng vào lúc công ty mẹ Facebook đang đối mặt với áp lực cả bên ngoài lẫn nội bộ. Theo The Wall Street Journal, Meta Platforms đã trì hoãn phát hành Behemoth, mô hình AI lớn nhất từ trước đến nay của mình, do lo ngại nội bộ về hiệu suất và năng lực lãnh đạo.

Llama 4, mô hình AI mới nhất của Meta Platforms, nhận phản ứng khá lạnh nhạt từ các nhà phát triển. Nhiều người trong số họ hiện chuyển sang các mô hình AI mã nguồn mở phát triển nhanh hơn như DeepSeek và Qwen của Alibaba để tìm kiếm khả năng tiên tiến hơn.

Bên trong Meta Platforms, nhóm nghiên cứu cũng đang trải qua sự thay đổi lớn. Bà Joelle Pineau, người lãnh đạo nhóm Nghiên cứu AI Cơ bản (FAIR) của công ty trong suốt 8 năm, đã tuyên bố rút lui vào tháng trước. Người kế nhiệm bà Joelle Pineau là ông Robert Fergus - đồng sáng lập FAIR vào năm 2014, từng có 5 năm làm việc tại Google DeepMind trước khi quay lại Meta Platforms vào tháng 5 này.

"Chảy máu chất xám" âm thầm

Cuộc tái cơ cấu lãnh đạo đội ngũ AI của Meta Platforms diễn ra sau một giai đoạn "chảy máu chất xám" âm thầm. Nhiều nhà nghiên cứu góp phần làm nên thành công ban đầu cho Llama đã rời FAIR sau khi công bố bài báo bước ngoặt, dù Meta Platforms vẫn tiếp tục xem dòng mô hình này là trung tâm trong chiến lược AI của mình. Với việc phần lớn những kiến trúc sư ban đầu đã rời đi và các đối thủ đang đổi mới mã nguồn mở nhanh hơn, Meta Platforms giờ đây đối mặt với thử thách duy trì vị thế mà không còn đội ngũ ban đầu.

Điều này đặc biệt đáng chú ý vì bài báo Llama năm 2023 không chỉ là cột mốc kỹ thuật, mà còn giúp hợp pháp hóa các mô hình ngôn ngữ lớn có trọng số mở, với mã nguồn và tham số được chia sẻ công khai để người khác sử dụng, chỉnh sửa và phát triển. Đó như một giải pháp thay thế khả thi cho các hệ thống AI độc quyền thời điểm đó, chẳng hạn GPT-3 của OpenAI và PaLM của Google.

Meta Platforms huấn luyện các mô hình AI của mình bằng dữ liệu công khai và tối ưu hóa chúng để đạt hiệu quả, giúp các nhà nghiên cứu và nhà phát triển vận hành các hệ thống AI tiên tiến trên một GPU (bộ xử lý đồ họa) duy nhất. Đã có thời điểm Meta Platforms trông như thể sẽ dẫn đầu cuộc cách mạng mã nguồn mở.

Hai năm sau, lợi thế đó đã dần mai một và Meta Platforms không còn là đơn vị đi đầu nữa.

Chưa có mô hình suy luận

Dù đã đầu tư hàng tỉ USD vào AI, Meta Platforms vẫn chưa có một mô hình chuyên về suy luận, được thiết kế để xử lý các tác vụ cần suy nghĩ nhiều bước, giải quyết vấn đề, hoặc gọi những công cụ bên ngoài để hoàn thành lệnh phức tạp. Google và OpenAI ưu tiên tính năng này trong các mô hình AI mới nhất của họ.

Thời gian làm việc trung bình của 11 tác giả bài báo về Llama đã rời Meta Platforms là hơn 5 năm, cho thấy họ không phải là nhân sự tạm thời mà là các nhà nghiên cứu gắn bó sâu sắc với nỗ lực AI của công ty. Một số rời Meta Platforms từ tháng 1.2023; số khác ở lại đến hết chu kỳ Llama 3; vài người thì mới đi trong năm nay. Cùng nhau, sự ra đi của họ đánh dấu sự tan rã âm thầm trong đội ngũ từng giúp Meta Platforms khẳng định danh tiếng AI trên các mô hình mã nguồn mở.

Danh sách dưới đây cho biết nơi họ đang làm việc (dựa trên thông tin từ hồ sơ LinkedIn của 11 nhà nghiên cứu):

Naman Goyal

Chức vụ hiện tại: Thành viên bộ phận kỹ thuật tại Thinking Machines Lab

Rời Meta tháng 2.2025

Thời gian tại Meta: 6 năm 7 tháng.

Baptiste Rozière

Chức vụ hiện tại: Nhà khoa học AI tại Mistral AI

Rời Meta tháng 8.2024

Thời gian tại Meta: 5 năm 1 tháng.

Aurélien Rodriguez

Chức vụ hiện tại: Giám đốc huấn luyện mô hình nền tảng tại Cohere

Rời Meta tháng 7.2024

Thời gian tại Meta: 2 năm 7 tháng.

Eric Hambro

Chức vụ hiện tại: Thành viên bộ phận kỹ thuật tại Anthropic

Rời Meta tháng 11.2023

Thời gian tại Meta: 3 năm 3 tháng.

Timothée Lacroix

Chức vụ hiện tại: Đồng sáng lập và Giám đốc công nghệ tại Mistral AI

Rời Meta tháng 6.2023

Thời gian tại Meta: 8 năm 5 tháng.

Marie-Anne Lachaux

Chức vụ hiện tại: Thành viên sáng lập và kỹ sư nghiên cứu AI tại Mistral AI

Rời Meta tháng 6.2023

Thời gian tại Meta: 5 năm.

Thibaut Lavril

Chức vụ hiện tại: Kỹ sư nghiên cứu AI tại Mistral AI

Rời Meta tháng 6.2023

Thời gian tại Meta: 4 năm 5 tháng.

Armand Joulin

Chức vụ hiện tại: Nhà khoa học xuất sắc tại Google DeepMind

Rời Meta tháng 5.2023

Thời gian tại Meta: 8 năm 8 tháng.

Gautier Izacard

Chức vụ hiện tại: Thành viên bộ phận kỹ thuật tại Microsoft AI

Rời Meta tháng 3.2023

Thời gian tại Meta: 3 năm 2 tháng.

Edouard Grave

Chức vụ hiện tại: Nhà nghiên cứu tại Kyutai

Rời Meta tháng 2.2023

Thời gian tại Meta: 7 năm 2 tháng.

Guillaume Lample

Chức vụ hiện tại: Đồng sáng lập và Giám đốc khoa học tại Mistral AI

Rời Meta đầu năm 2023

Thời gian tại Meta: 7 năm.