متا از مدل‌های هوش مصنوعی سری Llama 4 رونمایی کرد

یوسف اسفندیاری

۱۷ فروردین ۱۴۰۴ | ۰۷:۰۰ زمان مورد نیاز برای مطالعه: ۲ دقیقه

شرکت متا شب گذشته از سری جدید مدل‌های هوش مصنوعی خود با نام Llama 4 پرده برداشت. این مدل‌ها قرار است به‌عنوان دستیار هوشمند متا در برنامه‌هایی مانند واتس‌اپ، مسنجر و اینستاگرام به کار گرفته شوند. تا به امروز، متا دو مدل از این مجموعه را در دسترس قرار داده و دو مدل دیگر، که از قدرت بیشتری برخوردارند، هنوز رونمایی نشده‌اند.

مدل Llama 4 Scout، با 109 میلیارد پارامتر، یک گزینه‌ی کوچک‌تر محسوب می‌شود که حتی با پردازنده‌ی گرافیکی انویدیا H100 نیز قابل اجرا خواهد بود. در مقابل، مدل Llama 4 Maverick با 400 میلیارد پارامتر، عملکردی هم‌سطح با GPT-4o و Gemini 2.0 Flash ارائه می‌دهد. این دو مدل هم‌اکنون برای دانلود از وب‌سایت متا یا پلتفرم Hugging Face آماده هستند.

به گفته‌ی متا، مدل Llama 4 Behemoth همچنان در مرحله‌ی آموزش قرار دارد. مارک زاکربرگ، مدیرعامل این شرکت، این مدل را «قدرتمندترین مدل پایه‌ی جهان» توصیف کرده است. همچنین مدل چهارم، که Llama 4 Reasoning نامیده می‌شود، قرار است در ماه آینده‌ی میلادی اطلاعات بیشتری درباره‌اش منتشر شود. مدل Scout از یک پنجره‌ی زمینه‌ی 10 میلیون توکنی بهره می‌برد و توانسته مدل‌هایی مانند Gemma 3، Gemini 2.0 Flash-Lite و Mistral 3.1 را، که همگی متن‌باز هستند، پشت سر بگذارد. متا همچنین ادعا می‌کند که Maverick در مقایسه با GPT-4o و Gemini 2.0 Flash عملکرد برتری دارد و در زمینه‌ی کدنویسی و استدلال، با DeepSeek-V3 رقابت می‌کند، آن هم با استفاده از کمتر از نیمی از پارامترهای فعالش.

مدل Behemoth، با 288 میلیارد پارامتر فعال و مجموع 2 تریلیون پارامتر، هنوز به بازار عرضه نشده است. با این حال، متا پیش‌بینی می‌کند که این مدل در بنچمارک‌های حوزه‌ی STEM از رقبایی مانند GPT-4.5 و Claude Sonnet 3.7 پیشی بگیرد. متا برای توسعه‌ی Llama 4 به سراغ معماری «ترکیبی از متخصصان» (MoE) رفته است. در این روش، بخش‌های مختلف مدل به‌صورت تخصصی وظایف را بر عهده می‌گیرند. این چهار مدل همچنین به‌صورت چندوجهی طراحی شده‌اند و توانایی پردازش و تولید متن، تصویر و ویدیو را دارند، هرچند اشاره‌ای به قابلیت پردازش صدا نشده است.

متا این مجموعه را همچنان «متن‌باز» می‌نامد، اما محدودیت‌های مجوز استفاده از آن انتقادهایی را به دنبال داشته است. برای نمونه، شرکت‌های تجاری با بیش از 700 میلیون کاربر فعال ماهانه باید پیش از به‌کارگیری این مدل‌ها از متا مجوز دریافت کنند. سال گذشته، سازمان «پیشگامان متن‌باز» (OSI) اعلام کرد که مدل‌های متا را از فهرست متن‌باز خارج می‌کند.

متا قرار است در کنفرانس LlamaCon، که روز 29 آوریل (9 اردیبهشت) برگزار می‌شود، جزئیات بیشتری درباره‌ی برنامه‌های آینده‌ی این مدل‌ها و محصولات هوش مصنوعی خود ارائه دهد. این رویداد فرصتی خواهد بود تا علاقه‌مندان به فناوری با جهت‌گیری‌های بعدی این شرکت آشنا شوند. با توجه به رقابت فزاینده در حوزه‌ی هوش مصنوعی، عرضه‌ی Llama 4 می‌تواند گامی مهم برای متا در این عرصه باشد. این شرکت امیدوار است با تکیه بر این مدل‌ها، جایگاه خود را در بازار فناوری‌های نوین تقویت کند و تجربه‌ی کاربرانش را در پلتفرم‌های مختلف بهبود ببخشد.