Công ty mẹ của Facebook cho biết phiên bản Llama 3 lớn nhất có thể trò chuyện bằng 8 ngôn ngữ, viết mã máy tính chất lượng cao hơn và giải quyết các bài toán phức tạp hơn so với các phiên bản trước đó.
Với 405 tỉ tham số, tức các biến mà thuật toán xem xét để tạo phản hồi cho các câu hỏi của người dùng, phiên bản mới Llama 3 vượt xa phiên bản trước được Meta phát hành năm ngoái. Tuy nhiên, nó vẫn nhỏ hơn so với mô hình AI hàng đầu của các đối thủ như GPT-4 của OpenAI với 1.000 tỉ tham số hay mô hình có 2.000 tỉ tham số mà Amazon đang đầu tư vào.
Ngoài mô hình Llama 3 với 405 tỉ tham số, Meta cũng phát hành các phiên bản cập nhật nhẹ hơn với 8 tỉ và 70 tỉ tham số, từng được giới thiệu vào mùa xuân.
Cả ba mô hình AI mới của Meta đều đa ngôn ngữ, có thể xử lý các yêu cầu của người dùng lớn hơn thông qua "cửa sổ ngữ cảnh" mở rộng và sẽ cải thiện trải nghiệm tạo mã máy tính đặc biệt.
Cửa sổ ngữ cảnh (còn được gọi là bộ nhớ dài) là kỹ thuật được sử dụng trong các mô hình ngôn ngữ lớn như Llama 3 để giúp chúng xử lý các yêu cầu phức tạp và tạo ra phản hồi chính xác hơn.
Cửa sổ ngữ cảnh hoạt động bằng cách cho phép mô hình AI xem xét một lượng lớn văn bản trước và sau truy vấn của người dùng, giúp nó hiểu rõ hơn về bối cảnh của truy vấn và tạo ra phản hồi phù hợp hơn.
"Đó là phản hồi hàng đầu mà chúng tôi nhận được từ cộng đồng" - Reuters dẫn lời ông Ahmad Al-Dahle, trưởng bộ phận AI tạo sinh của Meta Platforms, đồng thời lưu ý rằng các cửa sổ ngữ cảnh lớn hơn cung cấp cho các mô hình những yêu cầu nhiều bước. Dù tốc độ phát triển AI rất khó đo lường nhưng kết quả kiểm tra do Meta cung cấp dường như cho thấy mô hình Llama 3 gần ngang bằng và trong một số trường hợp trội hơn so với Claude 3.5 Sonnet của Anthropic lẫn GPT-4o của OpenAI.
Chẳng hạn trên điểm chuẩn MATH của các bài toán đố bằng lời ở cấp độ thi đấu, phiên bản Llama 3 lớn nhất đạt 73,8 điểm, so với 76,6 của GPT-4o và 71,1 của Claude 3.5 Sonnet.
Phiên bản Llama 3 lớn nhất đạt được 88,6 điểm trên MMLU (điểm chuẩn bao gồm hàng chục môn về toán học, khoa học và nhân văn), trong khi GPT-4o được 88,7 điểm và Claude 3.5 Sonnet được 88,3 điểm.
Claude 3.5 Sonnet và GPT-4o được coi là hai mô hình AI tiên tiến mạnh nhất trên thị trường hiện nay.
Meta ngoài ra cũng giới thiệu các phiên bản "đa phương thức" cho các mô hình AI dự kiến ra mắt cuối năm nay, bổ sung khả năng hình ảnh, video và giọng nói cho mô hình Llama 3 cốt lõi. Công ty này tiết lộ những thử nghiệm ban đầu cho thấy các mô hình AI đó có khả năng cạnh tranh với mô hình đa phương thức khác như Gemini 1.5 của Google hay Claude 3.5 Sonnet của Anthropic.
Khi phát hành miễn phí mô hình Llama 3, Giám đốc điều hành Mark Zuckerberg kỳ vọng Meta sẽ được "đền đáp" bằng các sản phẩm sáng tạo và mức độ tương tác cao hơn trên các mạng xã hội cốt lõi của công ty. Tham vọng của tỉ phú Mỹ còn giúp các phiên bản Llama vượt qua các đối thủ vào năm tới.
Meta cũng có thể thu được lợi ích nếu các nhà phát triển chọn sử dụng các mô hình AI miễn phí của mình thay vì mô hình trả phí, vì điều này sẽ làm suy yếu mô hình AI của các đối thủ cạnh tranh.
Mặc dù vậy, một số nhà đầu tư đã nghi ngờ sẽ có các chi phí liên quan chứ không hoàn toàn sử dụng miễn phí Llama 3.
Bình luận (0)