Giám đốc AI của Meta cho biết các mô hình ngôn ngữ lớn sẽ không đạt được trí tuệ như con người
Yann LeCun cho rằng các phương pháp AI hiện tại có nhiều khuyết điểm khi ông thúc đẩy tầm nhìn về "mô hình thế giới" để đạt được siêu trí tuệ
Giám đốc trí tuệ nhân tạo của Meta tuyên bố rằng các mô hình ngôn ngữ lớn (LLMs) đang cung cấp sức mạnh cho các sản phẩm AI tạo sinh như ChatGPT sẽ không bao giờ đạt được khả năng lý luận và lập kế hoạch như con người. Thay vào đó, ông tập trung vào một phương pháp thay thế triệt để để tạo ra "siêu trí tuệ" trong máy móc.
Yann LeCun, nhà khoa học AI chính của gã khổng lồ mạng xã hội sở hữu Facebook và Instagram, cho biết các LLMs có “hiểu biết rất hạn chế về logic... không hiểu thế giới vật lý, không có bộ nhớ liên tục, không thể lý luận theo bất kỳ định nghĩa hợp lý nào và không thể lập kế hoạch... theo thứ tự.”
Trong một cuộc phỏng vấn với Financial Times, ông lập luận rằng không nên dựa vào việc phát triển LLMs để đạt được trí tuệ ngang tầm con người, vì các mô hình này chỉ có thể trả lời đúng các yêu cầu nếu chúng đã được huấn luyện đúng dữ liệu và do đó, “về bản chất là không an toàn.”
Thay vào đó, ông đang làm việc để phát triển một thế hệ hệ thống AI hoàn toàn mới mà ông hy vọng sẽ cung cấp cho máy móc trí tuệ ngang tầm con người, mặc dù ông cho biết tầm nhìn này có thể mất 10 năm để đạt được.
Meta đã đổ hàng tỷ đô la vào việc phát triển các LLMs của riêng mình khi AI tạo sinh bùng nổ, nhằm bắt kịp các nhóm công nghệ đối thủ, bao gồm OpenAI được Microsoft hỗ trợ và Google của Alphabet.
LeCun dẫn dắt một đội ngũ khoảng 500 nhân viên tại phòng thí nghiệm Nghiên cứu AI Cơ bản (Fair) của Meta. Họ đang làm việc để tạo ra AI có thể phát triển trí tuệ chung và học cách thế giới vận hành theo những cách tương tự như con người, trong một phương pháp được gọi là “mô hình thế giới.”
Tầm nhìn thử nghiệm của Giám đốc AI của Meta là một canh bạc tiềm ẩn rủi ro và tốn kém cho tập đoàn mạng xã hội này trong bối cảnh các nhà đầu tư đang sốt ruột muốn thấy lợi nhuận nhanh chóng từ các khoản đầu tư vào AI.
Tháng trước, Meta đã mất gần 200 tỷ USD giá trị khi Giám đốc điều hành Mark Zuckerberg cam kết tăng chi tiêu và biến tập đoàn mạng xã hội này thành “công ty AI hàng đầu thế giới,” khiến các nhà đầu tư trên phố Wall lo lắng về chi phí tăng lên mà không có tiềm năng doanh thu ngay lập tức.
“Chúng tôi đang ở giai đoạn mà chúng tôi nghĩ rằng chúng tôi đang trên đà phát triển các hệ thống AI thế hệ tiếp theo,” LeCun nói.
Nhận định của ông được đưa ra khi Meta và các đối thủ của mình tiến hành nâng cao các LLMs. Các nhân vật như Giám đốc điều hành OpenAI Sam Altman tin rằng chúng cung cấp một bước quan trọng hướng tới việc tạo ra trí tuệ nhân tạo tổng quát (AGI) — điểm mà máy móc có khả năng nhận thức vượt trội hơn con người.
Tuần trước, OpenAI đã ra mắt mô hình GPT-4o mới nhanh hơn, và Google đã giới thiệu một tác nhân AI “đa phương thức” mới có thể trả lời các câu hỏi thời gian thực qua video, âm thanh và văn bản gọi là Project Astra, được cung cấp bởi một phiên bản nâng cấp của mô hình Gemini.
Meta cũng đã ra mắt mô hình Llama 3 mới của mình vào tháng trước. Giám đốc toàn cầu của công ty Sir Nick Clegg cho biết LLM mới nhất của họ có “khả năng cải thiện đáng kể như lý luận” — khả năng áp dụng logic cho các yêu cầu. Ví dụ, hệ thống sẽ suy luận rằng một người bị đau đầu, đau họng và chảy nước mũi bị cảm lạnh, nhưng cũng có thể nhận ra rằng dị ứng có thể là nguyên nhân gây ra các triệu chứng.
Tuy nhiên, LeCun cho rằng sự phát triển này của LLMs là hời hợt và hạn chế, với các mô hình chỉ học khi các kỹ sư con người can thiệp để huấn luyện nó trên thông tin đó, thay vì AI tự mình rút ra kết luận như con người.
“Nó chắc chắn xuất hiện với hầu hết mọi người như là lý luận — nhưng chủ yếu nó đang khai thác kiến thức tích lũy từ nhiều dữ liệu huấn luyện,” LeCun nói, nhưng thêm rằng: “[LLMs] rất hữu ích mặc dù có những hạn chế của chúng.”
Google DeepMind cũng đã dành nhiều năm theo đuổi các phương pháp thay thế để xây dựng AGI, bao gồm các phương pháp như học tăng cường, trong đó các tác nhân AI học từ môi trường của chúng trong một môi trường ảo giống như trò chơi.
Tại một sự kiện ở London vào thứ Ba, giám đốc DeepMind Sir Demis Hassabis cho biết điều còn thiếu trong các mô hình ngôn ngữ là “họ không hiểu ngữ cảnh không gian mà bạn đang ở... vì vậy điều đó hạn chế tính hữu ích của họ cuối cùng.”
Meta đã thành lập phòng thí nghiệm Fair vào năm 2013 để tiên phong nghiên cứu AI, tuyển dụng các học giả hàng đầu trong lĩnh vực này.
Tuy nhiên, vào đầu năm 2023, Meta đã tạo ra một đội ngũ GenAI mới, đứng đầu là giám đốc sản phẩm chính Chris Cox. Đội ngũ này đã thu hút nhiều nhà nghiên cứu và kỹ sư AI từ Fair, và dẫn đầu công việc trên Llama 3 và tích hợp nó vào các sản phẩm, như trợ lý AI mới của họ và các công cụ tạo hình ảnh.
Việc tạo ra đội ngũ GenAI diễn ra khi một số người trong cuộc cho rằng văn hóa học thuật trong phòng thí nghiệm Fair một phần là nguyên nhân khiến Meta đến muộn trong cơn bùng nổ AI tạo sinh. Zuckerberg đã thúc đẩy nhiều ứng dụng thương mại hơn của AI dưới áp lực từ các nhà đầu tư.
Tuy nhiên, LeCun vẫn là một trong những cố vấn cốt lõi của Zuckerberg, theo những người gần gũi với công ty, bởi vì thành tích và danh tiếng của ông như là một trong những người sáng lập AI, giành giải Turing cho công trình của mình về mạng nơ-ron.
“Chúng tôi đã tập trung lại Fair vào mục tiêu dài hạn của AI ngang tầm con người, chủ yếu là vì GenAI hiện đang tập trung vào những thứ mà chúng tôi có con đường rõ ràng để đạt được,” LeCun nói.
“[Đạt được AGI] không phải là một vấn đề thiết kế sản phẩm, nó thậm chí không phải là một vấn đề phát triển công nghệ, nó rất nhiều là một vấn đề khoa học,” ông thêm vào.
LeCun đã lần đầu tiên công bố một bài báo về tầm nhìn mô hình thế giới của mình vào năm 2022 và kể từ đó Meta đã phát hành hai mô hình nghiên cứu dựa trên phương pháp này.
Hôm nay, ông cho biết Fair đang thử nghiệm các ý tưởng khác nhau để đạt được trí tuệ ngang tầm con người vì “có rất nhiều sự không chắc chắn và khám phá trong điều này, [vì vậy] chúng tôi không thể nói cái nào sẽ thành công hoặc được chọn.”
Trong số này, đội ngũ của LeCun đang cung cấp cho hệ thống hàng giờ video và cố tình để trống các khung hình, sau đó yêu cầu AI dự đoán điều gì sẽ xảy ra tiếp theo. Đây là để bắt chước cách trẻ em học từ việc quan sát thụ động thế giới xung quanh chúng.
Ông cũng cho biết Fair đang khám phá việc xây dựng “một hệ thống mã hóa văn bản phổ quát” cho phép hệ thống xử lý các đại diện trừu tượng của kiến thức trong văn bản, sau đó có thể được áp dụng cho video và âm thanh.
Một số chuyên gia nghi ngờ về khả năng tầm nhìn của LeCun.
Aron Culotta, phó giáo sư khoa học máy tính tại Đại học Tulane, cho biết trí tuệ thông thường từ lâu đã là “một cái gai trong mắt AI”, và rằng việc dạy các mô hình về nhân quả rất khó khăn, khiến chúng “dễ bị những thất bại không mong đợi.”
Một cựu nhân viên AI của Meta mô tả việc đẩy mạnh mô hình thế giới là “mơ hồ và không cụ thể,” thêm rằng: “Nó giống như đang cắm cờ.”
Một nhân viên hiện tại cho biết Fair vẫn chưa chứng tỏ mình là một đối thủ thực sự của các nhóm nghiên cứu như DeepMind.
Về lâu dài, LeCun tin rằng công nghệ này sẽ cung cấp năng lượng cho các tác nhân AI mà người dùng có thể tương tác thông qua công nghệ đeo trên người, bao gồm thực tế tăng cường hoặc kính “thông minh”, và vòng đeo tay EMG (điện cơ).
“[Để các tác nhân AI] thực sự hữu ích, chúng cần phải có điều gì đó tương tự như trí tuệ ngang tầm con người,” ông nói.
Theo Finacial Times