DeepSeek v3، Microsoft Phi 4، OpenAI o3، ابزارهای جدید و موارد دیگر

ek3nk4r 2025-01-13

0 4 خواندن این مطلب 6 دقیقه زمان میبرد

DeepSeek v3، Microsoft Phi 4، OpenAI o3، ابزارهای جدید و موارد دیگر

پیشنهاد ویژه

خرید فالوور واقعی خرید لایک اینستاگرام خرید ویو اینستاگرام خرید فالوور اینستاگرام

سلام به علاقه مندان هوش مصنوعی!

به اولین نسخه خوش آمدید “این هفته در مهندسی هوش مصنوعی“— بنابراین می توانید هر هفته، در عرض 4 دقیقه یا کمتر، همه آخرین مدل ها و اعلان های منبع باز را دریافت کنید.

از DeepSeek-V3 که کارایی انقلابی را با معماری MoE خود معرفی می کند تا مایکروسافت Phi-4 را راه اندازی می کند، یک مدل زبان کوچک که قابلیت های استدلال را بازتعریف می کند، و OpenAI با رونمایی از o3، مدلی نزدیک تر از همیشه به AGI، به همه این به روز رسانی ها می پردازیم. برخی از ابزارهای ضروری برای تسهیل توسعه عوامل و برنامه های هوش مصنوعی.

فهرست مطالب

DeepSeek-V3: هوش مصنوعی منبع باز پیشگام با معماری MoE

DeepSeek-V3، یک پیشرو مدل زبان ترکیبی از کارشناسان (MOE).راندمان استثنایی با 671B پارامتر به ارمغان می آورد و تنها 37B در هر توکن فعال می شود.

پیشرفت های کلیدی عبارتند از:

معماری: یک استراتژی متعادل کننده بار بدون تلفات کمکی، کاهش عملکرد را کاهش می دهد. پیش‌بینی چند رمزی (MTP) رمزگشایی گمانه‌زنی سریع‌تری را برای استنتاج امکان‌پذیر می‌کند.
کارایی آموزش: دقت FP8 را در مقیاس تأیید می‌کند و بر تنگناهای ارتباطی بین گره‌ها برای همپوشانی تقریباً کامل محاسبات و ارتباطات غلبه می‌کند. به پیش‌آموزشی روی توکن‌های 14.8T تنها با 2.664 میلیون ساعت GPU دست یافت.
بعد از آموزش: به طور خلاقانه مهارت های استدلال را از DeepSeek-R1 استخراج می کند، استدلال، بازتاب و خروجی کنترل شده را تقویت می کند.
DeepSeek-V3 از مدل های منبع باز پیشی گرفته و از رهبران منبع بسته رقیب است و در کارهای ریاضی و کد برتری دارد.

Phi-4: مدل جدید زبان کوچک مایکروسافت

مایکروسافت رونمایی می کند فی-4، پیشرفته ترین پارامتر 14B مدل زبان کوچک (SLM) بهینه شده برای استدلال پیچیده، به ویژه در ریاضیات. موجود در Azure AI Foundry و صورت در آغوش گرفته، Phi-4 در طراحی مدل فشرده و در عین حال قدرتمند هوش مصنوعی مرزها را جابجا می کند.

تحولات کلیدی:

استدلال پیشرفته: عملکرد بهتری از مدل‌های بزرگ‌تری مانند Gemini Pro 1.5 در معیارهای رقابت ریاضی دارد، و از مجموعه داده‌های مصنوعی و مدیریت‌شده با کیفیت بالا در کنار تکنیک‌های نوآورانه پس از تمرین استفاده می‌کند.
بازتعریف کارایی: ترکیبی از اندازه کوچکتر با عملکرد برتر، ارائه دقت بالا در کارهای مختلف.

ساخته شده برای ایمنی:

فیلترهای محتوا: ابزارهایی مانند محافظت سریع و تشخیص زمین بودن استفاده اخلاقی را تضمین می کنند.
نظارت در زمان واقعی: ویژگی‌های مدیریت ریسک شامل هشدار برای درخواست‌های متخاصم و مسائل مربوط به یکپارچگی داده‌ها است.

ترانسفورماتور نهفته بایت (BLT)

را ترانسفورماتور نهفته بایت (BLT) یک معماری پیشرفت‌کننده است که توکن‌سازی واژگان ثابت را با رویکردی مبتنی بر پچ پویا و قابل یادگیری جایگزین می‌کند. BLT کارایی تمرین را با لاما 3 در مقیاس تا پارامترهای 8B و 4T بایت در حالی که یک چارچوب قوی برای مدل سازی داده های دم بلند ارائه می دهد.

نکات فنی کلیدی:

تخصیص محاسبات پویا: BLT به صورت پویا بایت ها را بر اساس تقسیم بندی آگاه از آنتروپی به وصله ها گروه بندی می کند و محاسبه را بر اساس پیچیدگی پیش بینی تخصیص می دهد.
کارایی فلاپ: بدون به خطر انداختن عملکرد، 50 درصد فلاپ‌های استنتاج کمتری نسبت به همتایان توکن‌شده به دست می‌آورد.
نوآوری در معماری: شامل یک ترانسفورماتور نهفته جهانی برای نمایش پچ و مدل‌های سطح بایت محلی برای رمزگذاری و رمزگشایی کارآمد است.
مقیاس پذیری: مقیاس‌بندی همزمان اندازه مدل و اندازه پچ را در یک بودجه استنتاج ثابت باز می‌کند.
استحکام بیشتر: اکسل در مدیریت ورودی های پر سر و صدا، وظایف کم منابع و ساختارهای زیر کلمه با درک املایی و واجی بهبود یافته است.

o3: مدل استدلال جدید OpenAI

OpenAI مدل های o3 را معرفی کرده است –o3 و o3-mini، جانشین حالت استدلال o1 آن است.

در اینجا به روز رسانی های کلیدی برای دانستن آمده است:

محاسبه قابل تنظیم: o3 اجازه می دهد تا زمان استدلال قابل تنظیم (کم، متوسط، زیاد)، بهبود عملکرد در سطوح محاسباتی بالاتر.
بهبود ایمنی: برای کاهش توهمات و تراز کردن خروجی ها با اصول ایمنی از همسویی مشورتی استفاده می کند.

معیارها:

به دست آورد 87.5٪ در ARC-AGI در محاسبات بالا، اینچ به معیارهای AGI نزدیک تر است.
بهتر از o1 توسط 22.8 امتیاز در SWE-Bench Verified.
با حل کردن، رکورد جدیدی در ریاضیات مرزی ثبت کنید 25.2٪ از مشکلات

معاوضه ها:

دقت استدلال بالا با افزایش تاخیر و هزینه های محاسبه همراه است.

پیش نمایش o3 mini برای محققان ایمنی باز است و انتظار می رود در ژانویه منتشر شود.

ارقام پروژه انویدیا: ابررایانه هوش مصنوعی شخصی

در CES 2025، Nvidia معرفی کرد ارقام پروژه، یک “ابر کامپیوتر هوش مصنوعی شخصی” برای محققان، توسعه دهندگان و دانشجویان طراحی شده است.

به روز رسانی های کلیدی:

سخت افزار قدرتمند: روی سوپرچیپ گریس بلک ول انویدیا اجرا می‌شود که می‌تواند مدل‌هایی با حداکثر 200 میلیارد پارامتر را پردازش کند.
طراحی فشرده: بر روی میز قرار می گیرد اما قدرت محاسباتی در سطح ابری را ارائه می دهد.
آماده همکاری: دو واحد را می توان برای مقابله با مدل های هوش مصنوعی حتی بزرگتر به هم متصل کرد.

در حالی که قیمت در 3000 دلارانویدیا معتقد است که Project Digits دسترسی به منابع پیشرفته هوش مصنوعی را دموکراتیک می کند و به توسعه دهندگان این امکان را می دهد تا از دسکتاپ خود نوآوری کنند.

ابزارها و نسخه هایی که باید درباره آنها بدانید

فلش Eleven Labs: سریعترین مدل تبدیل متن به گفتار تا به امروز، با زمان پاسخگویی تنها 75 میلی ثانیه. Flash v2 از زبان انگلیسی پشتیبانی می کند، در حالی که نسخه 2.5 به 32 زبان گسترش می یابد، که آن را برای برنامه های جهانی بلادرنگ عالی می کند. قابل دسترسی از طریق API، سرعت و کیفیت را برای تعاملات صوتی فوری متعادل می کند.
رایتر: بدون زحمت محتوایی ایجاد کنید که با صدای منحصر به فرد شما مطابقت داشته باشد. Rytr با بیش از 40 الگو و ویژگی مانند AI Autocomplete، Grammar Checker و Paragraph Generator، وضوح، خلاقیت و گردش کار را تضمین می کند.
هوش مصنوعی آباکوس: بهره وری را با ChatLLM تغییر دهید، LLM های پیشرفته را برای کدنویسی، تجزیه و تحلیل داده ها و ایجاد تصویر یکپارچه کنید. پلتفرم Enterprise پیش‌بینی، شخصی‌سازی و بهینه‌سازی را خودکار می‌کند و باعث رشد کسب‌وکار با عوامل هوش مصنوعی می‌شود.
قطعات: با مدیریت قطعه، فراخوانی متن، و پردازش آفلاین داده ها برای امنیت با شکاف هوا، گردش کار توسعه دهندگان را بهبود بخشید. قطعات از چندین LLM و بسیاری از IDE ها پشتیبانی می کنند و داده های شما را خصوصی نگه می دارند و در عین حال کارایی و تمرکز را افزایش می دهند.
پیچ: به سرعت برنامه های تمام پشته را از مرورگر خود بسازید، ویرایش کنید و اجرا کنید. Bolt نمونه های اولیه را بر اساس دستورات ساده تولید می کند و از چارچوب هایی مانند React، Next.js و Vite پشتیبانی می کند. ایده آل برای نمونه سازی سریع، شروع رایگان با طرح های مقیاس پذیر موجود است.

در اخبار دیگر

چشم انداز OpenAI برای ابر هوش
سام آلتمن نقشه راه OpenAI برای AGI و ابر هوش را فاش می‌کند و پیش‌بینی می‌کند که می‌تواند ظرف «چند هزار روز» برسد. با پتانسیل ایجاد انقلاب در صنایع و سرعت بخشیدن به پیشرفت ها، OpenAI قصد دارد از این ابزارها استفاده کند و در عین حال چالش مهم کنترل سیستم های فوق هوشمند را دنبال کند.

فشار شفافیت هوش مصنوعی اپل
پس از انتقاد در مورد نادرستی خلاصه هوش مصنوعی، اپل محتوای تولید شده توسط هوش مصنوعی را با وضوح بیشتری در یک به روز رسانی نرم افزار برچسب گذاری می کند. این حرکت با تلاش‌های گسترده صنعت برای افزایش شفافیت و رفع نگرانی‌های عمومی در مورد تفسیر نادرست در سیستم‌های خودکار هماهنگ است.

Samsung Vision AI در CES 2025
سامسونگ Vision AI را راه‌اندازی کرد و تلویزیون‌ها را به همراهان هوشمند با ویژگی‌هایی مانند هوش مصنوعی روی دستگاه برای «کلیک به جستجو»، ترجمه زیرنویس بی‌درنگ، و تصویر زمینه تولیدی تبدیل کرد. برای ارائه Insights در خانه و مراقبت از حیوانات خانگی و خانواده، عمیقاً با SmartThings ادغام می شود. ادغام Microsoft Copilot وعده‌های شخصی‌سازی شده را می‌دهد و انتظار می‌رود همکاری‌های آینده با Google ارائه شود.

پلتفرم Umi Wellness پاناسونیک
در نمایشگاه CES 2025، پاناسونیک Umi را معرفی کرد، دستیار سلامت خانواده مبتنی بر هوش مصنوعی که توسط کلود آنتروپیک پشتیبانی می‌شود. این مربیگری شخصی، بینش رفتاری در زمان واقعی، و مشارکت با مارک‌هایی مانند Calm را برای توصیه‌های متناسب ارائه می‌دهد. Umi که با هوش مصنوعی تطبیقی ساخته شده است، تعاملات ایمن، مناسب خانواده و ادغام مقیاس پذیر در اکوسیستم پاناسونیک را تضمین می کند.

خیزش شهاب‌سنگ Anysphere's
توسعه دهنده Cursor، Anysphere، 100 میلیون دلار سری B را با ارزش 2.6 میلیارد دلار تضمین می کند، که نشان دهنده جهش 6.5 برابری نسبت به سری A اخیر 400 میلیون دلاری خود است. با افزایش درآمد از 4 میلیون دلار به 48 میلیون دلار ARR در شش ماه و حمایت غول های فناوری، سازنده دستیار برنامه نویسی هوش مصنوعی. پتانسیل رشد انفجاری در ابزارهای توسعه دهنده را نشان می دهد. مشتریان برجسته از جمله OpenAI و Shopify موقعیت خود را در برابر GitHub Copilot در بازار رقابتی دستیار کدنویسی AI تأیید می کنند.

و این به پایان می رسد این شماره از “این هفته در مهندسی هوش مصنوعی”، که توسط jam.dev برای شما آورده شده است – ابزاری که ارسال گزارش اشکال بد را برای تیم شما غیرممکن می کند.

از شما برای تنظیم کردن متشکرم حتماً این خبرنامه را با علاقه مندان به هوش مصنوعی خود به اشتراک بگذارید.

تا دفعه بعد، ساختمان مبارک!