Các mô hình Llama mã nguồn mở đã góp phần định hình chiến lược trí tuệ nhân tạo (AI) cho Meta Platforms. Tuy nhiên, phần lớn các nhà nghiên cứu xây dựng phiên bản gốc Llama hiện đã rời đi.
Trong số 14 tác giả được ghi nhận trong bài báo nổi bật năm 2023 giới thiệu Llama ra thế giới, chỉ còn ba người vẫn làm việc tại Meta Platforms, đó là nhà khoa học nghiên cứu Hugo Touvron, kỹ sư nghiên cứu Xavier Martinet và lãnh đạo chương trình kỹ thuật Faisal Azhar. Phần còn lại đã rời Meta Platforms, nhiều người trong số đó gia nhập hoặc sáng lập các đối thủ mới nổi.
Sự chảy máu chất xám này hiện rõ nhất thông qua Mistral AI, công ty khởi nghiệp AI hàng đầu Pháp có trụ sở tại thủ đô Paris, do hai cựu nghiên cứu viên Meta Platforms là Guillaume Lample và Timothée Lacroix (cũng là hai kiến trúc sư chính của Llama) đồng sáng lập. Cùng với ba cựu nhân viên Meta Platforms khác, Guillaume Lample và Timothée Lacroix đang xây dựng những mô hình AI mã nguồn mở mạnh mẽ, trực tiếp cạnh tranh với nỗ lực AI chủ đạo của công ty cũ.
Làn sóng rời đi theo thời gian đặt ra câu hỏi về khả năng giữ chân nhân tài AI của Meta Platforms, đúng vào lúc công ty mẹ Facebook đang đối mặt với áp lực cả bên ngoài lẫn nội bộ. Theo The Wall Street Journal, Meta Platforms đã trì hoãn phát hành Behemoth, mô hình AI lớn nhất từ trước đến nay của mình, do lo ngại nội bộ về hiệu suất và năng lực lãnh đạo.
Llama 4, mô hình AI mới nhất của Meta Platforms, nhận phản ứng khá lạnh nhạt từ các nhà phát triển. Nhiều người trong số họ hiện chuyển sang các mô hình AI mã nguồn mở phát triển nhanh hơn như DeepSeek và Qwen của Alibaba để tìm kiếm khả năng tiên tiến hơn.
Bên trong Meta Platforms, nhóm nghiên cứu cũng đang trải qua sự thay đổi lớn. Bà Joelle Pineau, người lãnh đạo nhóm Nghiên cứu AI Cơ bản (FAIR) của công ty trong suốt 8 năm, đã tuyên bố rút lui vào tháng trước. Người kế nhiệm bà Joelle Pineau là ông Robert Fergus - đồng sáng lập FAIR vào năm 2014, từng có 5 năm làm việc tại Google DeepMind trước khi quay lại Meta Platforms vào tháng 5 này.
"Chảy máu chất xám" âm thầm
Cuộc tái cơ cấu lãnh đạo đội ngũ AI của Meta Platforms diễn ra sau một giai đoạn "chảy máu chất xám" âm thầm. Nhiều nhà nghiên cứu góp phần làm nên thành công ban đầu cho Llama đã rời FAIR sau khi công bố bài báo bước ngoặt, dù Meta Platforms vẫn tiếp tục xem dòng mô hình này là trung tâm trong chiến lược AI của mình. Với việc phần lớn những kiến trúc sư ban đầu đã rời đi và các đối thủ đang đổi mới mã nguồn mở nhanh hơn, Meta Platforms giờ đây đối mặt với thử thách duy trì vị thế mà không còn đội ngũ ban đầu.
Điều này đặc biệt đáng chú ý vì bài báo Llama năm 2023 không chỉ là cột mốc kỹ thuật, mà còn giúp hợp pháp hóa các mô hình ngôn ngữ lớn có trọng số mở, với mã nguồn và tham số được chia sẻ công khai để người khác sử dụng, chỉnh sửa và phát triển. Đó như một giải pháp thay thế khả thi cho các hệ thống AI độc quyền thời điểm đó, chẳng hạn GPT-3 của OpenAI và PaLM của Google.
Meta Platforms huấn luyện các mô hình AI của mình bằng dữ liệu công khai và tối ưu hóa chúng để đạt hiệu quả, giúp các nhà nghiên cứu và nhà phát triển vận hành các hệ thống AI tiên tiến trên một GPU (bộ xử lý đồ họa) duy nhất. Đã có thời điểm Meta Platforms trông như thể sẽ dẫn đầu cuộc cách mạng mã nguồn mở.
Hai năm sau, lợi thế đó đã dần mai một và Meta Platforms không còn là đơn vị đi đầu nữa.
Chưa có mô hình suy luận
Dù đã đầu tư hàng tỉ USD vào AI, Meta Platforms vẫn chưa có một mô hình chuyên về suy luận, được thiết kế để xử lý các tác vụ cần suy nghĩ nhiều bước, giải quyết vấn đề, hoặc gọi những công cụ bên ngoài để hoàn thành lệnh phức tạp. Google và OpenAI ưu tiên tính năng này trong các mô hình AI mới nhất của họ.
Thời gian làm việc trung bình của 11 tác giả bài báo về Llama đã rời Meta Platforms là hơn 5 năm, cho thấy họ không phải là nhân sự tạm thời mà là các nhà nghiên cứu gắn bó sâu sắc với nỗ lực AI của công ty. Một số rời Meta Platforms từ tháng 1.2023; số khác ở lại đến hết chu kỳ Llama 3; vài người thì mới đi trong năm nay. Cùng nhau, sự ra đi của họ đánh dấu sự tan rã âm thầm trong đội ngũ từng giúp Meta Platforms khẳng định danh tiếng AI trên các mô hình mã nguồn mở.
Danh sách dưới đây cho biết nơi họ đang làm việc (dựa trên thông tin từ hồ sơ LinkedIn của 11 nhà nghiên cứu):
Naman Goyal
Chức vụ hiện tại: Thành viên bộ phận kỹ thuật tại Thinking Machines Lab
Rời Meta tháng 2.2025
Thời gian tại Meta: 6 năm 7 tháng.
Baptiste Rozière
Chức vụ hiện tại: Nhà khoa học AI tại Mistral AI
Rời Meta tháng 8.2024
Thời gian tại Meta: 5 năm 1 tháng.
Aurélien Rodriguez
Chức vụ hiện tại: Giám đốc huấn luyện mô hình nền tảng tại Cohere
Rời Meta tháng 7.2024
Thời gian tại Meta: 2 năm 7 tháng.
Eric Hambro
Chức vụ hiện tại: Thành viên bộ phận kỹ thuật tại Anthropic
Rời Meta tháng 11.2023
Thời gian tại Meta: 3 năm 3 tháng.
Timothée Lacroix
Chức vụ hiện tại: Đồng sáng lập và Giám đốc công nghệ tại Mistral AI
Rời Meta tháng 6.2023
Thời gian tại Meta: 8 năm 5 tháng.
Marie-Anne Lachaux
Chức vụ hiện tại: Thành viên sáng lập và kỹ sư nghiên cứu AI tại Mistral AI
Rời Meta tháng 6.2023
Thời gian tại Meta: 5 năm.
Thibaut Lavril
Chức vụ hiện tại: Kỹ sư nghiên cứu AI tại Mistral AI
Rời Meta tháng 6.2023
Thời gian tại Meta: 4 năm 5 tháng.
Armand Joulin
Chức vụ hiện tại: Nhà khoa học xuất sắc tại Google DeepMind
Rời Meta tháng 5.2023
Thời gian tại Meta: 8 năm 8 tháng.
Gautier Izacard
Chức vụ hiện tại: Thành viên bộ phận kỹ thuật tại Microsoft AI
Rời Meta tháng 3.2023
Thời gian tại Meta: 3 năm 2 tháng.
Edouard Grave
Chức vụ hiện tại: Nhà nghiên cứu tại Kyutai
Rời Meta tháng 2.2023
Thời gian tại Meta: 7 năm 2 tháng.
Guillaume Lample
Chức vụ hiện tại: Đồng sáng lập và Giám đốc khoa học tại Mistral AI
Rời Meta đầu năm 2023
Thời gian tại Meta: 7 năm.