برنامه نویسی

Llama 4 Unleashed: انقلابی در AI با مدل های چند مدلی و ویندوزهای زمینه عظیم

سلام dev.to جامعه! من به عنوان یک علاقه مندان به فناوری و محتوا ، من هیجان زده ام که به آخرین بمب های متا شیرجه بزنم: نسخه Llama 4. این فقط یک بروزرسانی دیگر نیست-این یک تغییر دهنده بازی برای توسعه دهندگان AI در همه جا است. با ضربه زدن به Llama 4 Scout و Llama 4 Maverick به صحنه ، ما در حال صحبت کردن با مدل های بومیان چند حالته ، طول زمینه های مجنون و یک رویکرد با وزن باز است که باعث افزایش جمعیت منبع باز می شود. بیایید این جانور یک اعلامیه را باز کنیم و ببینیم که برای شما ، سازندگان AI فردا چه معنی دارد.


The Big Assure: Llama 4 چه چیزی را به میز می آورد؟

هوش مصنوعی به سرعت در حال حرکت است ، و سوئیت Llama 4 متا این اتهام را بر عهده دارد. این مدل ها – Llama 4 Scout و Llama 4 Maverick – از زمین ساخته شده اند تا متن ، تصاویر و موارد دیگر را کنترل کنند ، همه در حالی که برخی از معماری های کارآمد را بسته بندی می کنند. اوه ، و آنها دارای وزن آزاد هستند ، بنابراین می توانید همین حالا آنها را بگیرید و شروع به کار کنید. در اینجا کمترین سطح وجود دارد:

شرح تصویر

Llama 4 Scout: کوچک اما توانا

  • مشخصات: 17 میلیارد پارامتر فعال ، 16 متخصص.
  • متناسب: به یک پردازنده گرافیکی NVIDIA H100 منفرد.
  • ابرقدرت: یک پنجره زمینه 10 میلیون توکن در حال ریزش-مناسب برای خرد کردن مجموعه داده های عظیم ، خلاصه کردن اسناد متعدد یا غواصی در عمق کد.
  • عمل: Outshines Gemma 3 ، Mistral 3.1 و Gemini 2.0 Flash-Lite در معیارها. بله ، این یک مدعی جمع و جور است.

Llama 4 Maverick: Multimodal Maestro

  • مشخصات: 17 میلیارد پارامتر فعال ، 128 متخصص.
  • متناسب: روی یک میزبان H100 واحد اجرا می شود.
  • ابرقدرت: بهترین قابلیت های چند حالته در کلاس ، تعالی در کارهای متن و تصویر مانند تجارت هیچ کس.
  • عمل: معاملات با Flash GPT-4O و Gemini 2.0 ، با DeepSeek V3 در استدلال و برنامه نویسی مطابقت دارد-همه با پارامترهای فعال کمتری. به علاوه ، در نسخه چت آزمایشی Lmarena نمره ELO 1417 را کسب کرده است.

هر دو مدل هوشمند خود را مدیون Llama 4 Behemoth هستند ، 288 میلیارد جانور فعال پارامتر که هنوز در آموزش است. Behemoth در حال حاضر از GPT-4.5 و Claude Sonnet 3.7 در معیارهای STEM پیشی گرفته است ، و این “معلم” است که خرد خود را در پیشاهنگ و ماوریک تقطیر می کند. بعداً در مورد آن


موارد فنی: زیر کاپوت چیست؟

شرح تصویر

خوب ، بیایید کمی از آن استفاده کنیم. Llama 4's برخی از فناوری های پیشرفته را بدست آورد که باعث می شود قلب قلب هر توسعه دهنده ای باشد.

MIGHTER-EXPERTS (MOE) جادو

  • چگونه کار می کند: فقط بخشی از پارامترها در هر نشانه فعال می شوند و این مدل ها را لاغر و متوسط ​​می کند. به عنوان مثال ، ماوریک 400 میلیارد پارامتر کل دارد اما فقط از 17 میلیارد در یک زمان استفاده می کند.
  • چرا مهم است: هزینه های کمتری ، استنباط سریعتر – استقرار کارآمد را بدون شکستن بانک فکر کنید.

چند حالته از بدو تولد

  • همجوشی: متن و نشانه های بینایی از ابتدا یکپارچه مخلوط می شوند ، که بر روی ترکیبی عظیم از متن ، تصاویر و فیلم آموزش داده می شوند.
  • بازپرداخت: ناخن های پیشاهنگ زمین (اشاره به اشیاء در عکس) ، در حالی که ماوریک برنامه های پیشرفته AI را که به هم افزایی تصویر متن نیاز دارند ، خرد می کند.

تمرین مانند قهرمانان

  • اندازه: بیش از 30 تریلیون توکن – متن ، تصاویر و فیلم های Across ، Doble Llama 3's Haul.
  • دقت: آموزش FP8 390 TFLOPS/GPU در GPU 32K برای Behemoth. این قدرت خام است که برای کارآیی بهینه شده است.
  • تکنیک ها: تنظیم دقیق با نظارت سبک (SFT) ، یادگیری آرماتور آنلاین (RL) و بهینه سازی اولویت مستقیم (DPO) این مدل ها را تیز و چرب نگه می دارد.

معیار حقوق لاف زدن

شرح تصویر

اعداد دروغ نمی گویند ، و لاما 4 برای انعطاف پذیری زیاد است:

  • پیشاهنگ: Beats Gemma 3 و Mistral 3.1 دست پایین.
  • عیاشی: خود را در برابر GPT-4O و Gemini 2.0 Flash ، Rivals Deepseek V3 با نیمی از پارامترهای فعال نگه می دارد.
  • عیار: هنوز آموزش ، اما در حال حاضر در صدر GPT-4.5 ، Claude Sonnet 3.7 و Gemini 2.0 Pro در کارهای STEM مانند MATH-500 و GPQA Diamond قرار دارد.

این مدل ها فقط سریع نیستند-آنها باهوش ، کارآمد و آماده مقابله با چالش های Dev در دنیای واقعی هستند.


عشق منبع باز: دسترسی برای همه

دو برابر شدن متا در مورد باز بودن ، و این موسیقی به گوش های Dev.to است. Llama 4 Scout و Maverick در Llama.com و در آغوش گرفتن چهره آماده هستند. هیچ دروازه بان در اینجا وجود ندارد – فقط خوب و خالص و قابل بارگیری هوش مصنوعی. این فقط برای شما خوب نیست ؛ این یک پیروزی برای کل اکوسیستم است و باعث ایجاد نوآوری در سراسر هیئت مدیره می شود. به علاوه ، می توانید متا AI ساخته شده با Llama 4 را در WhatsApp ، Messenger ، Instagram Direct و Meta.ai آزمایش کنید.


ایمن و عادلانه آن

شرح تصویر

قدرت مانند این به Guardrails نیاز دارد و متا روی آن:

  • امنیت: فیلتر داده ها ، نگهبان Llama ، نگهبان سریع و تیم سازی قرمز خطرات را در معرض خطر قرار می دهد.
  • تعصب: نرخ امتناع لاما 4 در مباحث بحث شده از 7 ٪ (LLAMA 3.3) به زیر 2 ٪ کاهش یافته است ، با یک رویکرد متعادل که با Grok رقابت می کند. این کامل نیست ، اما پیشرفت است.

نوبت شما: با Llama 4 بسازید

خوب ، بعد چیست؟ دستان خود را در Llama 4 Scout و Maverick بگیرید و شروع به آزمایش کنید! این که آیا شما در حال ساخت یک چت بابات هستید ، تجزیه و تحلیل کد های عظیم کد ، یا ترکیب متن و تصاویر به روش های جدید وحشی ، این مدل ها زمین بازی شما هستند. پنجره زمینه 10 متری به تنهایی درهای پروژه هایی را که ما فقط در آن خواب دیده ایم باز می کند. و با رویکرد وزن باز ، شما فقط یک کاربر نیستید-شما یک سازنده در این انقلاب هوش مصنوعی هستید.

اکنون آنها را بارگیری کنید در llama.com یا بغل کردن صورت ، و بیایید ببینیم چه چیزی می سازید. پروژه های خود را در نظرات به اشتراک بگذارید – من برای ایجاد خلاقیت های شما پمپ شده ام!


Big thanks to Meta's partners fueling this release: Accenture, AWS, AMD, Arm, CentML, Cerebras, CloudFlare, Databricks, Deepinfra, DeepLearning.AI, Dell, Deloitte, Fireworks AI, Google Cloud, Groq, Hugging Face, IBM Watsonx, Infosys, Intel, Kaggle, Mediatek, Microsoft Azure, Nebius, Nvidia ، Ollama ، Oracle Cloud ، PWC ، Qualcomm ، Red Hat ، Sambanova ، Sarvam AI ، مقیاس AI ، Scaleway ، Snowflake ، Tensorwave ، با هم AI ، VLLM و Wipro.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا