متا از مدلهای هوش مصنوعی سری Llama 4 رونمایی کرد

شرکت متا شب گذشته از سری جدید مدلهای هوش مصنوعی خود با نام Llama 4 پرده برداشت. این مدلها قرار است بهعنوان دستیار هوشمند متا در برنامههایی مانند واتساپ، مسنجر و اینستاگرام به کار گرفته شوند. تا به امروز، متا دو مدل از این مجموعه را در دسترس قرار داده و دو مدل دیگر، که از قدرت بیشتری برخوردارند، هنوز رونمایی نشدهاند.
مدل Llama 4 Scout، با 109 میلیارد پارامتر، یک گزینهی کوچکتر محسوب میشود که حتی با پردازندهی گرافیکی انویدیا H100 نیز قابل اجرا خواهد بود. در مقابل، مدل Llama 4 Maverick با 400 میلیارد پارامتر، عملکردی همسطح با GPT-4o و Gemini 2.0 Flash ارائه میدهد. این دو مدل هماکنون برای دانلود از وبسایت متا یا پلتفرم Hugging Face آماده هستند.
به گفتهی متا، مدل Llama 4 Behemoth همچنان در مرحلهی آموزش قرار دارد. مارک زاکربرگ، مدیرعامل این شرکت، این مدل را «قدرتمندترین مدل پایهی جهان» توصیف کرده است. همچنین مدل چهارم، که Llama 4 Reasoning نامیده میشود، قرار است در ماه آیندهی میلادی اطلاعات بیشتری دربارهاش منتشر شود. مدل Scout از یک پنجرهی زمینهی 10 میلیون توکنی بهره میبرد و توانسته مدلهایی مانند Gemma 3، Gemini 2.0 Flash-Lite و Mistral 3.1 را، که همگی متنباز هستند، پشت سر بگذارد. متا همچنین ادعا میکند که Maverick در مقایسه با GPT-4o و Gemini 2.0 Flash عملکرد برتری دارد و در زمینهی کدنویسی و استدلال، با DeepSeek-V3 رقابت میکند، آن هم با استفاده از کمتر از نیمی از پارامترهای فعالش.
مدل Behemoth، با 288 میلیارد پارامتر فعال و مجموع 2 تریلیون پارامتر، هنوز به بازار عرضه نشده است. با این حال، متا پیشبینی میکند که این مدل در بنچمارکهای حوزهی STEM از رقبایی مانند GPT-4.5 و Claude Sonnet 3.7 پیشی بگیرد. متا برای توسعهی Llama 4 به سراغ معماری «ترکیبی از متخصصان» (MoE) رفته است. در این روش، بخشهای مختلف مدل بهصورت تخصصی وظایف را بر عهده میگیرند. این چهار مدل همچنین بهصورت چندوجهی طراحی شدهاند و توانایی پردازش و تولید متن، تصویر و ویدیو را دارند، هرچند اشارهای به قابلیت پردازش صدا نشده است.
متا این مجموعه را همچنان «متنباز» مینامد، اما محدودیتهای مجوز استفاده از آن انتقادهایی را به دنبال داشته است. برای نمونه، شرکتهای تجاری با بیش از 700 میلیون کاربر فعال ماهانه باید پیش از بهکارگیری این مدلها از متا مجوز دریافت کنند. سال گذشته، سازمان «پیشگامان متنباز» (OSI) اعلام کرد که مدلهای متا را از فهرست متنباز خارج میکند.
متا قرار است در کنفرانس LlamaCon، که روز 29 آوریل (9 اردیبهشت) برگزار میشود، جزئیات بیشتری دربارهی برنامههای آیندهی این مدلها و محصولات هوش مصنوعی خود ارائه دهد. این رویداد فرصتی خواهد بود تا علاقهمندان به فناوری با جهتگیریهای بعدی این شرکت آشنا شوند. با توجه به رقابت فزاینده در حوزهی هوش مصنوعی، عرضهی Llama 4 میتواند گامی مهم برای متا در این عرصه باشد. این شرکت امیدوار است با تکیه بر این مدلها، جایگاه خود را در بازار فناوریهای نوین تقویت کند و تجربهی کاربرانش را در پلتفرمهای مختلف بهبود ببخشد.
منبع: Engadget