برنامه نویسی

منبع باز LLMS سزاوار کد است ، نه Promenss! (dspy ، voila!)

1. DSPY چیست؟

شرح تصویر

ما در دوره از مدل های بزرگ زبان (LLM) ، و ما هر هفته دیگر فقط برای دیدن یک LLM جدید معرفی می شویم. اکنون ، این LLM ها دارای خود هستند واقعی بالقوه اغلب توسط تنگنا توسط مهندسی سریع – که اساساً یک فرایند مستعد خطا است. بنابراین اکنون ، بیایید مستقیماً وارد چارچوب ابرقهرمانان شویم که این مشکل را حل می کند (رول طبل) -> DSPYبشر DSPY یک چارچوب منبع باز است که به نحوه تعامل ما با LLMS می پردازد. به جای ثابت پیش می رود ، DSPY با اعلان ها رفتار می کند اجزای قابل آموزش و مدولار که به صورت برنامه ای بهینه شده اند.

2. چرا DSPY؟

مشکل سوابق سنتی

فوریت سنتی به دستورالعمل های شکننده و دست ساز متکی است. به عنوان مثال ، درخواست از LLM برای “نوشتن شعر در مورد DSPY” ممکن است نتایج متناقض برای شما به همراه داشته باشد. توسعه دهندگان هستند الزام برای بی وقفه روحاب های خود را بی پایان ، اما این رویکرد بسیار بد است ، اما چرا؟
(i) برای کارهای پیچیده مانند استدلال چند مرحله ای نمی تواند مقیاس کند.
(ب) از تعمیم ضعیف در مدل ها یا دامنه ها رنج می برد.
(iii) نیاز به محاکمه و خطای دستی ، هدر رفتن زمان و منابع دارد.

راه حل DSPY در اینجا:

DSPY چکیده ها به ماژول های اعلامیه ، مانند کد که به طور خودکار برای بهترین عملکرد بهینه می شوند. با LLMS رفتار می کند قابل آموزش اجزای موجود در یک خط لوله ، با استفاده از از راه دور (با نام مستعار ، بهینه سازها) برای تکرار سریع و وزنه ها.

فلسفه کلیدی پشت این:

(من) تمرکز روی کد ، بیش از حد: توسعه دهندگان باید روی آنچه مدل باید انجام دهد تمرکز کنند ، و نه چگونهبشر
(ب) برنامه های خودسازی: برنامه های DSPY از داده ها برای بهینه سازی مطالب و منطق خود یاد می گیرند.
(iii) الگوی: با هر LLM کار می کند ، از GPT4 تا Llama 3 تا Claude و غیره

3. اجزای اصلی DSPY:

A. ماژول ها

ماژول ها بلوک های ساختمانی خاص و خاص هستند. تعدادی از آنها عبارتند از:
(من) dspy.Predict: به تولید تکمیل با استفاده از یک الگوی سریع کمک می کند.
(ب) dspy.ChainOfThought: برای استدلال گام به گام استفاده می شود.
(iii) dspy.Retrieve: این به یکپارچه سازی نسل بازیابی و آگوست کمک می کند (با نام مستعار ، RAG)

یک تعریف ساده ماژول را می توان از این طریق انجام داد:

کله پا

ب – امضاها

امضاها طرح های ورودی/خروجی را برای این ماژول ها تعریف می کنند. آنها مانند یک عمل می کنند قرارداد برای بهینه سازی سریع وقتی وظایف خود را به LMS (مدل های زبان) در DSPY اختصاص می دهیم ، رفتاری را که به عنوان یک امضا نیاز داریم مشخص می کنیم.
به عنوان مثال: topic -> poem
این در اصل به DSPY می گوید که سریعاً نقشه برداری از موضوع را به یک شعر بهینه کند.

ج. Teleprompters (بهینه سازها)

اینها در اتوماسیون بهینه سازی سریع کمک می کنند. چند نوع محبوب:
(من) قایقرانی: این تعداد چند نمونه از شات از داده های آموزش ایجاد کرد.
(ب) بیزیانوپتیمر: از جستجوی بیزی برای یافتن بهینه ترین اعلان ها استفاده می کند.
(iii) مگس: aka ، نسخه بهینه ساز پیشنهادی دستورالعمل چندگانه. این به بهینه سازی چند کاره برای خطوط لوله پیچیده کمک می کند.

یک مثال ساده:

نهایی

D. معیارها:

معیارها (به عنوان مثال ، دقت ، نمره Bleu) بهینه سازی راهنما. DSPY این موارد را با تنظیم اعلان ها و نمونه ها به حداکثر می رساند.

4. چگونه DSPY کار می کند:

DSPY کار کردن

(من) برنامه را تعریف کنید: اولا ، همه ماژول ها را در یک خط لوله جمع کنید.
(ب) شروع کردن: سوابق اولیه و وزن مدل را تنظیم کنید.
(iii) بهینه کردن: TelePrompter به طور تکراری تغییرات سریع در برابر داده های آموزش را آزمایش می کند.
(IV) ارزیابی کردن: معیارها تعیین می کنند که آیا سریع سریع عملکرد را بهبود می بخشد یا خیر.
(v) مستقر کردن: بهترین اقدامات عملکردی برای استنباط یخ زده است.

DSPY در مقابل رویکرد سنتی:

رویکرد سنتی:

رویکرد سنتی

رویکرد DSPY:

راه DSPY
حالا ، شما گفتن من – کدام یک از کولر!

5. DSPY در عمل: از مواردی برای نگاه کردن استفاده کنید

A. نسل بازیابی- augmenter (RAG)

دلهره

  • مسائل اصلی در مورد خطوط لوله RAG استاتیک این بود که آنها اغلب محتوای بی ربط را بازیابی می کردند.
  • رفع DSPY: به طور مشترک ، بازه های بازیابی و نسل را بهینه می کند.

B. هماهنگی تنظیم دقیق

لحن خوب

  • تنظیم دقیق به طراحی سریع دقیق نیاز دارد.
  • DSPY رفع: از این برای تولید نمونه آموزشی استفاده کنید!

در اسناد رسمی بیشتر کاوش کنید: DSPY

معماری DSPY:

قوس
(من) لایه برنامه: در اینجا خطوط لوله تعریف شده کاربر با استفاده از ماژول ها وجود دارد.
(ب) لایه بهینه سازی: این شامل TelePrompter + معیارها است!
(iii) لایه مدل: LLMS ، Retrievers و ابزارهای خارجی را ادغام می کند.

پایان

DSPY پارادایم را از مهندسی سریع به برنامه نویسی سریع که به ما کمک می کند ، توسعه دهندگان برای ساختن برنامه های قوی و خودآموزی LLM. DSPY با انتزاع به ماژول های قابل آموزش و اتوماسیون بهینه سازی ، به ما کمک می کند تا در مقیاس و بسیار عملکردی بسازیم. بنابراین ، شما در حال ساختن سیستم های RAG ، عوامل چند مدلی یا خطوط لوله خود در زمینه خود هستند ، DSPY کلید استفاده از LLM های منبع باز در مقیاس است.

القاء

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا