برنامه نویسی

مهندسی سریع برای هوش مصنوعی: مهندسی سریع چیست و چگونه می توان نتایج خوبی از موتورهای هوش مصنوعی گرفت

هوش مصنوعی تسخیر شده است! به هر کجا که نگاه کنید، ابزار هوش مصنوعی جدیدی برای تقریباً هر جنبه از زندگی ما وجود دارد. بین ChatGPT، AutoGPT، Midjourney، Dall-E و GitHub Copilot، می‌توانید بسازید، کدنویسی کنید، پاسخ‌ها را دریافت کنید، و آثار هنری زیبایی خلق کنید… یا حداقل برخی از ما می‌توانیم.

چرا برخی از افراد هنگام استفاده از هوش مصنوعی مولد نتایج بهتری نسبت به دیگران دریافت می کنند؟ چرا برخی از مردم آثار هنری تولید می کنند که ارزش موزه لوور را داشته باشد، در حالی که برخی دیگر چیزی نزدیک به صبحانه یک سگ دریافت می کنند؟

همه چیز به ورودی هایی که استفاده می کنید برمی گردد. به این ورودی “prompt” می گویند. درخواست سوالی است که می‌پرسید یا کلماتی که برای ایجاد چیزی استفاده می‌کنید. کسانی که در حال «تولید» درخواست‌ها یا استراتژیک بودن در مورد ورودی‌های خود هستند، آن را «مهندسی سریع» می‌نامند.

مهندسی سریع چیست؟

مهندسی سریع به طراحی خاص یک اعلان به گونه ای اشاره دارد که نتایج بهتری از هوش مصنوعی دریافت کنید.

کسانی که سیستم‌های هوش مصنوعی مانند OpenAI، Google و بسیاری دیگر را ایجاد می‌کنند، حتی «مهندسین فوری» را برای کمک به آموزش مدل‌های خود استخدام می‌کنند. برخی از «سازندگان» حتی تا آنجا پیش رفته‌اند که درخواست‌های Midjourney خود را در پلتفرم‌هایی مانند Etsy بفروشند.

به طور خلاصه، سیستم‌های هوش مصنوعی مانند داده‌ها هستند: آشغال‌ها، ناخواسته‌ها. اگر ورودی بدی داشته باشید، احتمالاً نتیجه بدی خواهید گرفت. مهندسی سریع به شدت تحت تأثیر زمینه است.

زمینه زمانی که صحبت از هوش مصنوعی می شود

زمینه یکی از بزرگترین مسائل در مورد نتایجی است که به دست می آوریم. برای مثال، اگر «دونات» (یا «دونات» 🍩) را در گوگل جستجو کنم، می‌توانم طیف وسیعی از نتایج را دریافت کنم. از دستور پخت دونات گرفته تا تصاویر دونات و یا از کجا این دسر خوشمزه را بخریم. این به این دلیل است که من به موتور جستجو زمینه دیگری نداده ام. مطمئناً Google از مواردی مانند سابقه جستجوی قبلی و موقعیت مکانی من برای کمک به تعیین نتایج استفاده خواهد کرد، اما تا آنجا که پیش می رود.


عبارت «دونات» برای یک موتور جستجو می‌تواند به معنای هر چیزی باشد، از شکل، افزونه Slack، برنامه یا این دونات‌های خوشمزه GitHub که در GitHub Universe 2022 ارائه شده‌اند.

برای مثال، اگر می‌خواستم آموزشی در مورد ایجاد یک مدل سه‌بعدی یک دونات در بلندر پیدا کنم، اگر فقط «دونات» را تایپ کرده باشم، نتایج جستجو برای آن احتمالاً نشان داده نخواهد شد. من باید خیلی دقیق تر صحبت کنم. چیزی مانند “آموزش دونات Blender3D” نتایج بسیار دقیق تری را برای چیزی که به دنبال آن بودم به من می دهد.

وقتی صحبت از هوش مصنوعی به میان می‌آید، همین‌طور است. شما باید زمینه کافی برای هوش مصنوعی فراهم کنید تا نتایج بهتری برای آنچه می‌خواهید دریافت کنید.

مهندسی سریع برای برنامه های چت

افراد زیادی به ما برخی از نتایج دیوانه کننده از ChatGPT را نشان داده اند. در حالی که آنها همیشه دقیق نیستند، ChatGPT در یک چیز واقعا خوب است: نثر. نوشتن جملات خوب و خوش ساخت، که به خوبی جریان دارند، فوق العاده شگفت انگیز است. خواندن نتایج آسان است و واقعا عالی به نظر می رسد. اما دریافت پاسخ های دقیق کاملاً چیز دیگری است. برای مثال، مردم از نوشتن مقاله‌های تاریخ با استفاده از ChatGPT خسته شده‌اند و در حالی که ممکن است مقاله به خوبی خوانده شود، ممکن است از نظر تاریخی دقیق نباشد. به عنوان مثال، اگر از ChatGPT بخواهید “یک مقاله 2000 کلمه ای در مورد سقوط چین بنویسد”، برای شما یک مقاله 2000 کلمه ای در مورد سقوط چین می نویسد. اما ممکن است لزوماً از نظر واقعی درست نباشد.

پاسخ زیستی ChatGPT
در حالی که ممکن است چیزی خوب خوانده شود، ممکن است از نظر واقعی درست نباشد. نکته: من دکتری ندارم 😉

این به این دلیل است که ChatGPT اطلاعات را از منابع مختلف می گیرد و آنها را با هم ترکیب می کند. آن منابع ممکن است خودشان دقیق نباشند. ChatGPT نیز نمی داند که سقوط چین که شما به آن اشاره می کنید. بنابراین می تواند به راحتی تاریخ های مرجع را به اشتباه عبور دهد. با دادن اطلاعات به ChatGPT به روش مکالمه و سپس درخواست از آن برای نوشتن یک مقاله 2000 کلمه ای به نتایج بسیار بهتری دست خواهید یافت.

منظور من از آن دقیقا چیست؟ برخی از مردم فکر می کنند ChatGPT یک روش ورودی یک طرفه، مکالمه ای و تکی برای به دست آوردن اطلاعات است. اما اینطور نیست. به دلیلی به آن “چت” می گویند. مکالمه داشته باشید، سوالات خود را اصلاح کنید، زمینه را برای پاسخ های خود فراهم کنید.

برای مثال، اگر من می‌خواستم پاراگراف‌ای درباره «کنفرانس‌های NDC» برای گزارش سفر نوشته شود، ChatGPT خود را با «نوشتن یک گزارش سفر پاراگراف برای NDC» شروع نمی‌کردم. در عوض، من با کشف اینکه ChatGPT چقدر درباره NDC می‌داند، شروع می‌کنم و زمینه را در طول مسیر فراهم می‌کنم. ورودی هایی که ارائه می کنید تا حد زیادی خروجی را تعیین می کنند. به همین دلیل است که برخی از افراد می توانند نتایج واقعاً خوبی کسب کنند و برخی دیگر نمی توانند.

پاسخ ChatGPT
بدون هیچ زمینه ای، ChatGPT نمی داند به چه NDC اشاره می کنم

مثال دیگر: اگر برای یک مصاحبه شغلی می‌روید و نکاتی می‌خواهید، از ChatGPT بخواهید که “نکاتی در مورد آماده شدن برای مصاحبه شغلی به من بدهد”، پاسخ‌های خوبی به شما می‌دهد، اما کاملاً مشخص نیست. در عوض، چیزی شبیه به “من برای یک مصاحبه شغلی در یک استارتاپ هوش مصنوعی برای سمت توسعه دهنده نرم افزار می روم. لطفاً می توانید نکاتی در مورد آماده شدن برای مصاحبه شغلی به من بدهید؟” نتایج شخصی تر و شخصی تر به شما خواهد داد. مثل این است که اگر از یک متخصص روی صحنه بخواهید به 1000 نفر از مخاطبان پاسخ دهد، احتمالاً چیزی کلی ارائه می دهند تا همه پیام برداشتن داشته باشند. اما اگر از یک فرد یک به یک بپرسید، احتمالاً از شما سؤالات بعدی می پرسند تا وضعیت شما را درک کنند و بنابراین پاسخ شخصی تر و مشخص تری ارائه می دهند.

مهندسی سریع برای برنامه های هنری

ممکن است برخی از آثار هنری زیبایی را که برخی افراد با برنامه‌های انتشار پایدار ایجاد می‌کنند، دیده باشید. و سپس اثر هنری وجود دارد که فقط “اشتباه” به نظر می رسد. بسیاری از اینها به زمینه مربوط می شود. به عنوان مثال، اگر من از Night Café (یکی از ژنراتورهای مورد علاقه من) استفاده کنم و فقط کلمه “سگ” را تایپ کنم، این چیزی است که دریافت کردم:

توضیحات تصویر
تصویر تولید شده با استفاده از کافه شب، و اعلان “سگ”

یک کلمه تصادفی “سگ” به عنوان علامت نوشته شده است، یک سگ عجیب و غریب در پیش زمینه وجود دارد و بسیار رنگارنگ عجیبی است. حالا اگر من تصویری شبیه عکاسی از یک ژرمن شپرد بالغ در یک پارک در یک روز آفتابی را تصور کنم، احتمالاً این چیزی نیست که به دست بیاورم. هوش مصنوعی آن زمینه را ندارد. نمی تواند ذهن من را بخواند (هنوز!). وقتی می‌خواهید اثر هنری خلق کنید، باید تصاویر را همانطور که در ذهن خود به تصویر می‌کشید، توصیف کنید. هرچه جزئیات بیشتری ارائه دهید، خروجی بهتری خواهید داشت. اینجاست که کار مشکل می شود. بسیاری از کاربردهای انتشار پایدار تعداد کاراکترهای محدودی دارند. بنابراین، شما باید در مورد نحوه ساخت سریع خود، معنادار و استراتژیک باشید.

مشابه ChatGPT، شما باید به طور مداوم درخواست های خود را دوباره ساخته و آنها را اصلاح کنید. با این حال، هوش مصنوعی مبتنی بر چت این مزیت را دارد که می‌توانید مکالمه را ادامه دهید و به منظور دریافت پاسخ خوب، اطلاعات بیشتر و سوالات مختلف را به هوش مصنوعی بدهید. در حالی که برخی از مولدهای هنری به شما اجازه می دهند که خروجی خود را “ریمیکس” کنید، اما همچنان به یک درخواست جدید متکی است. بنابراین شما به طور مداوم منتظر یک خروجی هستید، آنچه را که جمع نمی شود مشاهده می کنید، و سپس یک درخواست جدید را ارسال می کنید که بهینه سازی شده است. برخی از کاربران ساعت‌ها را در Midjourney می‌گذرانند، خروجی‌ها را دریافت می‌کنند و درخواست‌های خود را برای تولید قطعات خیره‌کننده بازسازی می‌کنند. همه چیز تمرین است. به همین دلیل است که برخی از سازندگان درخواست های خود را در Etsy می فروشند!

خرگوش جنگی تولید شده توسط هوش مصنوعی
آثار هنری ایجاد شده توسط دوست من ژان با استفاده از Midjourney ساخته شده است

یک چیز مطمئن است، اگر می‌خواهید اثر هنری با کیفیتی تولید کنید، انتظار نداشته باشید که چند ثانیه برای نوشتن یک درخواست، زدن دکمه «ایجاد» و دیدن یک مونه وقت صرف کنید. جواب منفی! درعوض، باید زمان (و پول) بگذارید تا صدها اثر هنری خلق کنید، و با هر بار تکرار، دستورات خود را دوباره کار کنید تا شاهکار خود را تولید کنید.

مهندسی سریع برای کد

من نمی‌خواهم زمان زیادی را صرف صحبت در مورد چگونگی ایجاد اعلان‌های خوب برای چیزهایی مانند GitHub Copilot کنم. همکار من رایزل پست های وبلاگ شگفت انگیزی نوشت که به مهندسی سریع برای GitHub Copilot می پردازد:

چیزی که من خواهم گفت این است که – مشابه ChatGPT – GitHub Copilot به زمینه متکی است. چه کد دیگری در مخزن نوشته شده است؟ پسوند (و بنابراین زبان) فایل چیست؟ GitHub Copilot چه چیز دیگری برای شما ساخته است؟ چه نظراتی را در کد قرار داده اید؟ همه این موارد به GitHub Copilot کمک می کند تا کدهای دقیق تری را برای شما ترکیب کند.

در مورد آن اینگونه فکر کنید: اگر نظری بنویسید که می‌خواهید یک تابع پیچیده ایجاد کنید که از داده‌های باطن استفاده می‌کند و یک مشکل خاص را حل می‌کند، احتمالاً تنها با یک نظر پاسخ خوبی دریافت نخواهید کرد. بسیار شبیه به کد شما – حداقل باید اینطور باشد – به بسیاری از توابع تقسیم شده است، با (امیدواریم) نظرات مفید فراوان، GitHub Copilot زمانی بهتر کار می کند که چیزها را تجزیه می کنید.

به جای اینکه از GitHub Copilot بخواهید:
//reverse a sentence (با استفاده از جاوا اسکریپت)

به این فکر کنید که چگونه می توانید مشکل را به معنای منطقی تجزیه کنید. به عنوان مثال، اگر به صورت فیزیکی یک تکه کاغذ با جمله ای روی آن به من داده شود و به من بگویند آن را برگردانم، چگونه این کار را انجام می دهم؟ نوشتن چنین نظراتی بسیار سودمندتر خواهد بود. اگر این کار را انجام دهید، GitHub Copilot زمینه بسیار بیشتری دارد و درک بهتری از آنچه می خواهید دارد.

تفاوت دیگری که GitHub Copilot در مقایسه با چیزی مانند ChatGPT دارد، این است که GitHub Copilot در نظر گرفته است. همه زمینه ای که دارید تمام مواردی که در بالا ذکر کردم:

  • پسوند فایل چیست؟
  • چه فایل های دیگری در پروژه وجود دارد
  • نظرات دیگر را چگونه نوشته اید
  • کدهای دیگر چگونه ساخته شده است
  • نظری که وارد می کنید چیست؟
  • کدی که وارد می کنید چیست؟

ChatGPT و سایر برنامه های چت به آخرین نظری که در چت داده اید اهمیت بیشتری می دهند. یعنی آخرین اطلاعاتی که به مکالمه اضافه کردید. با این حال، GitHub Copilot همیشه زمینه را برای تولید نتایج کد بهتر در نظر می گیرد.

مهندسی سریع بهتر

هنگامی که کار به پایان می رسد، دریافت نتایج خوب از هر نوع هوش مصنوعی مولد به عهده شماست – شخصی که ورودی را ارائه می دهید. همانطور که در ابتدا گفتم: آشغال به داخل، آشغال بیرون. بنابراین این نکات مهم را در هنگام ساخت دستورات خود در نظر بگیرید:

  • خوبی فراهم کند متن نوشته; ارائه مثال ها و اطلاعات در مورد آنچه می خواهید به آن برسید
  • بودن خاص; اگر برای مخاطب خاصی است، آن را بگویید
  • درهم شکستن مشکل
  • در نحوه پرسیدن سوالات خود **روشن* باشید. اگر چیزی برگشت که درست به نظر نمی رسد، آن را روشن کنید
  • بازنویسی کنید و پالودن برای درخواست های شما

و در نهایت، همیشه، همیشه اطلاعاتی را که از یک هوش مصنوعی دریافت می‌کنید تأیید کنید. وقتی صحبت از تولیدکننده‌های آثار هنری می‌شود، اهمیت کمتری دارد، اما اگر به کد و اطلاعات نگاه کنید، مهم است. بررسی کنید که آیا کدی که دریافت می‌کنید همان‌طور که می‌خواهید کار می‌کند یا خیر. صحت اطلاعات مکتوب ارائه شده به شما را بررسی کنید.

به یاد داشته باشید، مهم نیست چه اتفاقی می افتد، شما همچنان خلبان هستید. شما هنوز مسئول هستید، و در مورد اینکه چه قطعه های هنری، چه قطعه کد و چه اطلاعاتی استفاده می کنید و به اشتراک می گذارید، حرف آخر را می زنید.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

همچنین ببینید
بستن
دکمه بازگشت به بالا