DeepSeek v3، Microsoft Phi 4، OpenAI o3، ابزارهای جدید و موارد دیگر

سلام به علاقه مندان هوش مصنوعی!
به اولین نسخه خوش آمدید “این هفته در مهندسی هوش مصنوعی“— بنابراین می توانید هر هفته، در عرض 4 دقیقه یا کمتر، همه آخرین مدل ها و اعلان های منبع باز را دریافت کنید.
از DeepSeek-V3 که کارایی انقلابی را با معماری MoE خود معرفی می کند تا مایکروسافت Phi-4 را راه اندازی می کند، یک مدل زبان کوچک که قابلیت های استدلال را بازتعریف می کند، و OpenAI با رونمایی از o3، مدلی نزدیک تر از همیشه به AGI، به همه این به روز رسانی ها می پردازیم. برخی از ابزارهای ضروری برای تسهیل توسعه عوامل و برنامه های هوش مصنوعی.
DeepSeek-V3: هوش مصنوعی منبع باز پیشگام با معماری MoE
DeepSeek-V3، یک پیشرو مدل زبان ترکیبی از کارشناسان (MOE).راندمان استثنایی با 671B پارامتر به ارمغان می آورد و تنها 37B در هر توکن فعال می شود.
پیشرفت های کلیدی عبارتند از:
-
معماری: یک استراتژی متعادل کننده بار بدون تلفات کمکی، کاهش عملکرد را کاهش می دهد. پیشبینی چند رمزی (MTP) رمزگشایی گمانهزنی سریعتری را برای استنتاج امکانپذیر میکند.
-
کارایی آموزش: دقت FP8 را در مقیاس تأیید میکند و بر تنگناهای ارتباطی بین گرهها برای همپوشانی تقریباً کامل محاسبات و ارتباطات غلبه میکند. به پیشآموزشی روی توکنهای 14.8T تنها با 2.664 میلیون ساعت GPU دست یافت.
-
بعد از آموزش: به طور خلاقانه مهارت های استدلال را از DeepSeek-R1 استخراج می کند، استدلال، بازتاب و خروجی کنترل شده را تقویت می کند.
-
DeepSeek-V3 از مدل های منبع باز پیشی گرفته و از رهبران منبع بسته رقیب است و در کارهای ریاضی و کد برتری دارد.
Phi-4: مدل جدید زبان کوچک مایکروسافت
مایکروسافت رونمایی می کند فی-4، پیشرفته ترین پارامتر 14B مدل زبان کوچک (SLM) بهینه شده برای استدلال پیچیده، به ویژه در ریاضیات. موجود در Azure AI Foundry و صورت در آغوش گرفته، Phi-4 در طراحی مدل فشرده و در عین حال قدرتمند هوش مصنوعی مرزها را جابجا می کند.
تحولات کلیدی:
-
استدلال پیشرفته: عملکرد بهتری از مدلهای بزرگتری مانند Gemini Pro 1.5 در معیارهای رقابت ریاضی دارد، و از مجموعه دادههای مصنوعی و مدیریتشده با کیفیت بالا در کنار تکنیکهای نوآورانه پس از تمرین استفاده میکند.
-
بازتعریف کارایی: ترکیبی از اندازه کوچکتر با عملکرد برتر، ارائه دقت بالا در کارهای مختلف.
ساخته شده برای ایمنی:
-
فیلترهای محتوا: ابزارهایی مانند محافظت سریع و تشخیص زمین بودن استفاده اخلاقی را تضمین می کنند.
-
نظارت در زمان واقعی: ویژگیهای مدیریت ریسک شامل هشدار برای درخواستهای متخاصم و مسائل مربوط به یکپارچگی دادهها است.
ترانسفورماتور نهفته بایت (BLT)
را ترانسفورماتور نهفته بایت (BLT) یک معماری پیشرفتکننده است که توکنسازی واژگان ثابت را با رویکردی مبتنی بر پچ پویا و قابل یادگیری جایگزین میکند. BLT کارایی تمرین را با لاما 3 در مقیاس تا پارامترهای 8B و 4T بایت در حالی که یک چارچوب قوی برای مدل سازی داده های دم بلند ارائه می دهد.
نکات فنی کلیدی:
-
تخصیص محاسبات پویا: BLT به صورت پویا بایت ها را بر اساس تقسیم بندی آگاه از آنتروپی به وصله ها گروه بندی می کند و محاسبه را بر اساس پیچیدگی پیش بینی تخصیص می دهد.
-
کارایی فلاپ: بدون به خطر انداختن عملکرد، 50 درصد فلاپهای استنتاج کمتری نسبت به همتایان توکنشده به دست میآورد.
-
نوآوری در معماری: شامل یک ترانسفورماتور نهفته جهانی برای نمایش پچ و مدلهای سطح بایت محلی برای رمزگذاری و رمزگشایی کارآمد است.
-
مقیاس پذیری: مقیاسبندی همزمان اندازه مدل و اندازه پچ را در یک بودجه استنتاج ثابت باز میکند.
-
استحکام بیشتر: اکسل در مدیریت ورودی های پر سر و صدا، وظایف کم منابع و ساختارهای زیر کلمه با درک املایی و واجی بهبود یافته است.
o3: مدل استدلال جدید OpenAI
OpenAI مدل های o3 را معرفی کرده است –o3 و o3-mini، جانشین حالت استدلال o1 آن است.
در اینجا به روز رسانی های کلیدی برای دانستن آمده است:
-
محاسبه قابل تنظیم: o3 اجازه می دهد تا زمان استدلال قابل تنظیم (کم، متوسط، زیاد)، بهبود عملکرد در سطوح محاسباتی بالاتر.
-
بهبود ایمنی: برای کاهش توهمات و تراز کردن خروجی ها با اصول ایمنی از همسویی مشورتی استفاده می کند.
معیارها:
-
به دست آورد 87.5٪ در ARC-AGI در محاسبات بالا، اینچ به معیارهای AGI نزدیک تر است.
-
بهتر از o1 توسط 22.8 امتیاز در SWE-Bench Verified.
-
با حل کردن، رکورد جدیدی در ریاضیات مرزی ثبت کنید 25.2٪ از مشکلات
معاوضه ها:
- دقت استدلال بالا با افزایش تاخیر و هزینه های محاسبه همراه است.
پیش نمایش o3 mini برای محققان ایمنی باز است و انتظار می رود در ژانویه منتشر شود.
ارقام پروژه انویدیا: ابررایانه هوش مصنوعی شخصی
در CES 2025، Nvidia معرفی کرد ارقام پروژه، یک “ابر کامپیوتر هوش مصنوعی شخصی” برای محققان، توسعه دهندگان و دانشجویان طراحی شده است.
به روز رسانی های کلیدی:
-
سخت افزار قدرتمند: روی سوپرچیپ گریس بلک ول انویدیا اجرا میشود که میتواند مدلهایی با حداکثر 200 میلیارد پارامتر را پردازش کند.
-
طراحی فشرده: بر روی میز قرار می گیرد اما قدرت محاسباتی در سطح ابری را ارائه می دهد.
-
آماده همکاری: دو واحد را می توان برای مقابله با مدل های هوش مصنوعی حتی بزرگتر به هم متصل کرد.
در حالی که قیمت در 3000 دلارانویدیا معتقد است که Project Digits دسترسی به منابع پیشرفته هوش مصنوعی را دموکراتیک می کند و به توسعه دهندگان این امکان را می دهد تا از دسکتاپ خود نوآوری کنند.
ابزارها و نسخه هایی که باید درباره آنها بدانید
-
فلش Eleven Labs: سریعترین مدل تبدیل متن به گفتار تا به امروز، با زمان پاسخگویی تنها 75 میلی ثانیه. Flash v2 از زبان انگلیسی پشتیبانی می کند، در حالی که نسخه 2.5 به 32 زبان گسترش می یابد، که آن را برای برنامه های جهانی بلادرنگ عالی می کند. قابل دسترسی از طریق API، سرعت و کیفیت را برای تعاملات صوتی فوری متعادل می کند.
-
رایتر: بدون زحمت محتوایی ایجاد کنید که با صدای منحصر به فرد شما مطابقت داشته باشد. Rytr با بیش از 40 الگو و ویژگی مانند AI Autocomplete، Grammar Checker و Paragraph Generator، وضوح، خلاقیت و گردش کار را تضمین می کند.
-
هوش مصنوعی آباکوس: بهره وری را با ChatLLM تغییر دهید، LLM های پیشرفته را برای کدنویسی، تجزیه و تحلیل داده ها و ایجاد تصویر یکپارچه کنید. پلتفرم Enterprise پیشبینی، شخصیسازی و بهینهسازی را خودکار میکند و باعث رشد کسبوکار با عوامل هوش مصنوعی میشود.
-
قطعات: با مدیریت قطعه، فراخوانی متن، و پردازش آفلاین داده ها برای امنیت با شکاف هوا، گردش کار توسعه دهندگان را بهبود بخشید. قطعات از چندین LLM و بسیاری از IDE ها پشتیبانی می کنند و داده های شما را خصوصی نگه می دارند و در عین حال کارایی و تمرکز را افزایش می دهند.
-
پیچ: به سرعت برنامه های تمام پشته را از مرورگر خود بسازید، ویرایش کنید و اجرا کنید. Bolt نمونه های اولیه را بر اساس دستورات ساده تولید می کند و از چارچوب هایی مانند React، Next.js و Vite پشتیبانی می کند. ایده آل برای نمونه سازی سریع، شروع رایگان با طرح های مقیاس پذیر موجود است.
در اخبار دیگر
چشم انداز OpenAI برای ابر هوش
سام آلتمن نقشه راه OpenAI برای AGI و ابر هوش را فاش میکند و پیشبینی میکند که میتواند ظرف «چند هزار روز» برسد. با پتانسیل ایجاد انقلاب در صنایع و سرعت بخشیدن به پیشرفت ها، OpenAI قصد دارد از این ابزارها استفاده کند و در عین حال چالش مهم کنترل سیستم های فوق هوشمند را دنبال کند.
فشار شفافیت هوش مصنوعی اپل
پس از انتقاد در مورد نادرستی خلاصه هوش مصنوعی، اپل محتوای تولید شده توسط هوش مصنوعی را با وضوح بیشتری در یک به روز رسانی نرم افزار برچسب گذاری می کند. این حرکت با تلاشهای گسترده صنعت برای افزایش شفافیت و رفع نگرانیهای عمومی در مورد تفسیر نادرست در سیستمهای خودکار هماهنگ است.
Samsung Vision AI در CES 2025
سامسونگ Vision AI را راهاندازی کرد و تلویزیونها را به همراهان هوشمند با ویژگیهایی مانند هوش مصنوعی روی دستگاه برای «کلیک به جستجو»، ترجمه زیرنویس بیدرنگ، و تصویر زمینه تولیدی تبدیل کرد. برای ارائه Insights در خانه و مراقبت از حیوانات خانگی و خانواده، عمیقاً با SmartThings ادغام می شود. ادغام Microsoft Copilot وعدههای شخصیسازی شده را میدهد و انتظار میرود همکاریهای آینده با Google ارائه شود.
پلتفرم Umi Wellness پاناسونیک
در نمایشگاه CES 2025، پاناسونیک Umi را معرفی کرد، دستیار سلامت خانواده مبتنی بر هوش مصنوعی که توسط کلود آنتروپیک پشتیبانی میشود. این مربیگری شخصی، بینش رفتاری در زمان واقعی، و مشارکت با مارکهایی مانند Calm را برای توصیههای متناسب ارائه میدهد. Umi که با هوش مصنوعی تطبیقی ساخته شده است، تعاملات ایمن، مناسب خانواده و ادغام مقیاس پذیر در اکوسیستم پاناسونیک را تضمین می کند.
خیزش شهابسنگ Anysphere's
توسعه دهنده Cursor، Anysphere، 100 میلیون دلار سری B را با ارزش 2.6 میلیارد دلار تضمین می کند، که نشان دهنده جهش 6.5 برابری نسبت به سری A اخیر 400 میلیون دلاری خود است. با افزایش درآمد از 4 میلیون دلار به 48 میلیون دلار ARR در شش ماه و حمایت غول های فناوری، سازنده دستیار برنامه نویسی هوش مصنوعی. پتانسیل رشد انفجاری در ابزارهای توسعه دهنده را نشان می دهد. مشتریان برجسته از جمله OpenAI و Shopify موقعیت خود را در برابر GitHub Copilot در بازار رقابتی دستیار کدنویسی AI تأیید می کنند.
و این به پایان می رسد این شماره از “این هفته در مهندسی هوش مصنوعی”، که توسط jam.dev برای شما آورده شده است – ابزاری که ارسال گزارش اشکال بد را برای تیم شما غیرممکن می کند.
از شما برای تنظیم کردن متشکرم حتماً این خبرنامه را با علاقه مندان به هوش مصنوعی خود به اشتراک بگذارید.
تا دفعه بعد، ساختمان مبارک!
مراجع
DeepSeek V3
مایکروسافت فی-4
ترانسفورماتور نهفته بایت (BLT)
OpenAI o3 و o3 mini
Samsung Vision AI: تبدیل صفحه نمایش به همراهان هوشمند
پاناسونیک از Umi در CES 2025 رونمایی کرد
جاده OpenAI به سوپرهوشی
به روز رسانی شفافیت هوش مصنوعی اپل: پاک کردن هوا
ارقام پروژه انویدیا: ابررایانه هوش مصنوعی شخصی
Anysphere 100 میلیون دلار جمع آوری کرد
فلش Elevenlabs
رایتر
چرتکه
قطعات
پیچ و مهره