مهندسی سریع برای هوش مصنوعی: مهندسی سریع چیست و چگونه می توان نتایج خوبی از موتورهای هوش مصنوعی گرفت
هوش مصنوعی تسخیر شده است! به هر کجا که نگاه کنید، ابزار هوش مصنوعی جدیدی برای تقریباً هر جنبه از زندگی ما وجود دارد. بین ChatGPT، AutoGPT، Midjourney، Dall-E و GitHub Copilot، میتوانید بسازید، کدنویسی کنید، پاسخها را دریافت کنید، و آثار هنری زیبایی خلق کنید… یا حداقل برخی از ما میتوانیم.
چرا برخی از افراد هنگام استفاده از هوش مصنوعی مولد نتایج بهتری نسبت به دیگران دریافت می کنند؟ چرا برخی از مردم آثار هنری تولید می کنند که ارزش موزه لوور را داشته باشد، در حالی که برخی دیگر چیزی نزدیک به صبحانه یک سگ دریافت می کنند؟
همه چیز به ورودی هایی که استفاده می کنید برمی گردد. به این ورودی “prompt” می گویند. درخواست سوالی است که میپرسید یا کلماتی که برای ایجاد چیزی استفاده میکنید. کسانی که در حال «تولید» درخواستها یا استراتژیک بودن در مورد ورودیهای خود هستند، آن را «مهندسی سریع» مینامند.
مهندسی سریع چیست؟
مهندسی سریع به طراحی خاص یک اعلان به گونه ای اشاره دارد که نتایج بهتری از هوش مصنوعی دریافت کنید.
کسانی که سیستمهای هوش مصنوعی مانند OpenAI، Google و بسیاری دیگر را ایجاد میکنند، حتی «مهندسین فوری» را برای کمک به آموزش مدلهای خود استخدام میکنند. برخی از «سازندگان» حتی تا آنجا پیش رفتهاند که درخواستهای Midjourney خود را در پلتفرمهایی مانند Etsy بفروشند.
به طور خلاصه، سیستمهای هوش مصنوعی مانند دادهها هستند: آشغالها، ناخواستهها. اگر ورودی بدی داشته باشید، احتمالاً نتیجه بدی خواهید گرفت. مهندسی سریع به شدت تحت تأثیر زمینه است.
زمینه زمانی که صحبت از هوش مصنوعی می شود
زمینه یکی از بزرگترین مسائل در مورد نتایجی است که به دست می آوریم. برای مثال، اگر «دونات» (یا «دونات» 🍩) را در گوگل جستجو کنم، میتوانم طیف وسیعی از نتایج را دریافت کنم. از دستور پخت دونات گرفته تا تصاویر دونات و یا از کجا این دسر خوشمزه را بخریم. این به این دلیل است که من به موتور جستجو زمینه دیگری نداده ام. مطمئناً Google از مواردی مانند سابقه جستجوی قبلی و موقعیت مکانی من برای کمک به تعیین نتایج استفاده خواهد کرد، اما تا آنجا که پیش می رود.
عبارت «دونات» برای یک موتور جستجو میتواند به معنای هر چیزی باشد، از شکل، افزونه Slack، برنامه یا این دوناتهای خوشمزه GitHub که در GitHub Universe 2022 ارائه شدهاند.
برای مثال، اگر میخواستم آموزشی در مورد ایجاد یک مدل سهبعدی یک دونات در بلندر پیدا کنم، اگر فقط «دونات» را تایپ کرده باشم، نتایج جستجو برای آن احتمالاً نشان داده نخواهد شد. من باید خیلی دقیق تر صحبت کنم. چیزی مانند “آموزش دونات Blender3D” نتایج بسیار دقیق تری را برای چیزی که به دنبال آن بودم به من می دهد.
وقتی صحبت از هوش مصنوعی به میان میآید، همینطور است. شما باید زمینه کافی برای هوش مصنوعی فراهم کنید تا نتایج بهتری برای آنچه میخواهید دریافت کنید.
مهندسی سریع برای برنامه های چت
افراد زیادی به ما برخی از نتایج دیوانه کننده از ChatGPT را نشان داده اند. در حالی که آنها همیشه دقیق نیستند، ChatGPT در یک چیز واقعا خوب است: نثر. نوشتن جملات خوب و خوش ساخت، که به خوبی جریان دارند، فوق العاده شگفت انگیز است. خواندن نتایج آسان است و واقعا عالی به نظر می رسد. اما دریافت پاسخ های دقیق کاملاً چیز دیگری است. برای مثال، مردم از نوشتن مقالههای تاریخ با استفاده از ChatGPT خسته شدهاند و در حالی که ممکن است مقاله به خوبی خوانده شود، ممکن است از نظر تاریخی دقیق نباشد. به عنوان مثال، اگر از ChatGPT بخواهید “یک مقاله 2000 کلمه ای در مورد سقوط چین بنویسد”، برای شما یک مقاله 2000 کلمه ای در مورد سقوط چین می نویسد. اما ممکن است لزوماً از نظر واقعی درست نباشد.
در حالی که ممکن است چیزی خوب خوانده شود، ممکن است از نظر واقعی درست نباشد. نکته: من دکتری ندارم 😉
این به این دلیل است که ChatGPT اطلاعات را از منابع مختلف می گیرد و آنها را با هم ترکیب می کند. آن منابع ممکن است خودشان دقیق نباشند. ChatGPT نیز نمی داند که سقوط چین که شما به آن اشاره می کنید. بنابراین می تواند به راحتی تاریخ های مرجع را به اشتباه عبور دهد. با دادن اطلاعات به ChatGPT به روش مکالمه و سپس درخواست از آن برای نوشتن یک مقاله 2000 کلمه ای به نتایج بسیار بهتری دست خواهید یافت.
منظور من از آن دقیقا چیست؟ برخی از مردم فکر می کنند ChatGPT یک روش ورودی یک طرفه، مکالمه ای و تکی برای به دست آوردن اطلاعات است. اما اینطور نیست. به دلیلی به آن “چت” می گویند. مکالمه داشته باشید، سوالات خود را اصلاح کنید، زمینه را برای پاسخ های خود فراهم کنید.
برای مثال، اگر من میخواستم پاراگرافای درباره «کنفرانسهای NDC» برای گزارش سفر نوشته شود، ChatGPT خود را با «نوشتن یک گزارش سفر پاراگراف برای NDC» شروع نمیکردم. در عوض، من با کشف اینکه ChatGPT چقدر درباره NDC میداند، شروع میکنم و زمینه را در طول مسیر فراهم میکنم. ورودی هایی که ارائه می کنید تا حد زیادی خروجی را تعیین می کنند. به همین دلیل است که برخی از افراد می توانند نتایج واقعاً خوبی کسب کنند و برخی دیگر نمی توانند.
بدون هیچ زمینه ای، ChatGPT نمی داند به چه NDC اشاره می کنم
مثال دیگر: اگر برای یک مصاحبه شغلی میروید و نکاتی میخواهید، از ChatGPT بخواهید که “نکاتی در مورد آماده شدن برای مصاحبه شغلی به من بدهد”، پاسخهای خوبی به شما میدهد، اما کاملاً مشخص نیست. در عوض، چیزی شبیه به “من برای یک مصاحبه شغلی در یک استارتاپ هوش مصنوعی برای سمت توسعه دهنده نرم افزار می روم. لطفاً می توانید نکاتی در مورد آماده شدن برای مصاحبه شغلی به من بدهید؟” نتایج شخصی تر و شخصی تر به شما خواهد داد. مثل این است که اگر از یک متخصص روی صحنه بخواهید به 1000 نفر از مخاطبان پاسخ دهد، احتمالاً چیزی کلی ارائه می دهند تا همه پیام برداشتن داشته باشند. اما اگر از یک فرد یک به یک بپرسید، احتمالاً از شما سؤالات بعدی می پرسند تا وضعیت شما را درک کنند و بنابراین پاسخ شخصی تر و مشخص تری ارائه می دهند.
مهندسی سریع برای برنامه های هنری
ممکن است برخی از آثار هنری زیبایی را که برخی افراد با برنامههای انتشار پایدار ایجاد میکنند، دیده باشید. و سپس اثر هنری وجود دارد که فقط “اشتباه” به نظر می رسد. بسیاری از اینها به زمینه مربوط می شود. به عنوان مثال، اگر من از Night Café (یکی از ژنراتورهای مورد علاقه من) استفاده کنم و فقط کلمه “سگ” را تایپ کنم، این چیزی است که دریافت کردم:
تصویر تولید شده با استفاده از کافه شب، و اعلان “سگ”
یک کلمه تصادفی “سگ” به عنوان علامت نوشته شده است، یک سگ عجیب و غریب در پیش زمینه وجود دارد و بسیار رنگارنگ عجیبی است. حالا اگر من تصویری شبیه عکاسی از یک ژرمن شپرد بالغ در یک پارک در یک روز آفتابی را تصور کنم، احتمالاً این چیزی نیست که به دست بیاورم. هوش مصنوعی آن زمینه را ندارد. نمی تواند ذهن من را بخواند (هنوز!). وقتی میخواهید اثر هنری خلق کنید، باید تصاویر را همانطور که در ذهن خود به تصویر میکشید، توصیف کنید. هرچه جزئیات بیشتری ارائه دهید، خروجی بهتری خواهید داشت. اینجاست که کار مشکل می شود. بسیاری از کاربردهای انتشار پایدار تعداد کاراکترهای محدودی دارند. بنابراین، شما باید در مورد نحوه ساخت سریع خود، معنادار و استراتژیک باشید.
مشابه ChatGPT، شما باید به طور مداوم درخواست های خود را دوباره ساخته و آنها را اصلاح کنید. با این حال، هوش مصنوعی مبتنی بر چت این مزیت را دارد که میتوانید مکالمه را ادامه دهید و به منظور دریافت پاسخ خوب، اطلاعات بیشتر و سوالات مختلف را به هوش مصنوعی بدهید. در حالی که برخی از مولدهای هنری به شما اجازه می دهند که خروجی خود را “ریمیکس” کنید، اما همچنان به یک درخواست جدید متکی است. بنابراین شما به طور مداوم منتظر یک خروجی هستید، آنچه را که جمع نمی شود مشاهده می کنید، و سپس یک درخواست جدید را ارسال می کنید که بهینه سازی شده است. برخی از کاربران ساعتها را در Midjourney میگذرانند، خروجیها را دریافت میکنند و درخواستهای خود را برای تولید قطعات خیرهکننده بازسازی میکنند. همه چیز تمرین است. به همین دلیل است که برخی از سازندگان درخواست های خود را در Etsy می فروشند!
آثار هنری ایجاد شده توسط دوست من ژان با استفاده از Midjourney ساخته شده است
یک چیز مطمئن است، اگر میخواهید اثر هنری با کیفیتی تولید کنید، انتظار نداشته باشید که چند ثانیه برای نوشتن یک درخواست، زدن دکمه «ایجاد» و دیدن یک مونه وقت صرف کنید. جواب منفی! درعوض، باید زمان (و پول) بگذارید تا صدها اثر هنری خلق کنید، و با هر بار تکرار، دستورات خود را دوباره کار کنید تا شاهکار خود را تولید کنید.
مهندسی سریع برای کد
من نمیخواهم زمان زیادی را صرف صحبت در مورد چگونگی ایجاد اعلانهای خوب برای چیزهایی مانند GitHub Copilot کنم. همکار من رایزل پست های وبلاگ شگفت انگیزی نوشت که به مهندسی سریع برای GitHub Copilot می پردازد:
چیزی که من خواهم گفت این است که – مشابه ChatGPT – GitHub Copilot به زمینه متکی است. چه کد دیگری در مخزن نوشته شده است؟ پسوند (و بنابراین زبان) فایل چیست؟ GitHub Copilot چه چیز دیگری برای شما ساخته است؟ چه نظراتی را در کد قرار داده اید؟ همه این موارد به GitHub Copilot کمک می کند تا کدهای دقیق تری را برای شما ترکیب کند.
در مورد آن اینگونه فکر کنید: اگر نظری بنویسید که میخواهید یک تابع پیچیده ایجاد کنید که از دادههای باطن استفاده میکند و یک مشکل خاص را حل میکند، احتمالاً تنها با یک نظر پاسخ خوبی دریافت نخواهید کرد. بسیار شبیه به کد شما – حداقل باید اینطور باشد – به بسیاری از توابع تقسیم شده است، با (امیدواریم) نظرات مفید فراوان، GitHub Copilot زمانی بهتر کار می کند که چیزها را تجزیه می کنید.
به جای اینکه از GitHub Copilot بخواهید://reverse a sentence
(با استفاده از جاوا اسکریپت)
به این فکر کنید که چگونه می توانید مشکل را به معنای منطقی تجزیه کنید. به عنوان مثال، اگر به صورت فیزیکی یک تکه کاغذ با جمله ای روی آن به من داده شود و به من بگویند آن را برگردانم، چگونه این کار را انجام می دهم؟ نوشتن چنین نظراتی بسیار سودمندتر خواهد بود. اگر این کار را انجام دهید، GitHub Copilot زمینه بسیار بیشتری دارد و درک بهتری از آنچه می خواهید دارد.
تفاوت دیگری که GitHub Copilot در مقایسه با چیزی مانند ChatGPT دارد، این است که GitHub Copilot در نظر گرفته است. همه زمینه ای که دارید تمام مواردی که در بالا ذکر کردم:
- پسوند فایل چیست؟
- چه فایل های دیگری در پروژه وجود دارد
- نظرات دیگر را چگونه نوشته اید
- کدهای دیگر چگونه ساخته شده است
- نظری که وارد می کنید چیست؟
- کدی که وارد می کنید چیست؟
ChatGPT و سایر برنامه های چت به آخرین نظری که در چت داده اید اهمیت بیشتری می دهند. یعنی آخرین اطلاعاتی که به مکالمه اضافه کردید. با این حال، GitHub Copilot همیشه زمینه را برای تولید نتایج کد بهتر در نظر می گیرد.
مهندسی سریع بهتر
هنگامی که کار به پایان می رسد، دریافت نتایج خوب از هر نوع هوش مصنوعی مولد به عهده شماست – شخصی که ورودی را ارائه می دهید. همانطور که در ابتدا گفتم: آشغال به داخل، آشغال بیرون. بنابراین این نکات مهم را در هنگام ساخت دستورات خود در نظر بگیرید:
- خوبی فراهم کند متن نوشته; ارائه مثال ها و اطلاعات در مورد آنچه می خواهید به آن برسید
- بودن خاص; اگر برای مخاطب خاصی است، آن را بگویید
- درهم شکستن مشکل
- در نحوه پرسیدن سوالات خود **روشن* باشید. اگر چیزی برگشت که درست به نظر نمی رسد، آن را روشن کنید
- بازنویسی کنید و پالودن برای درخواست های شما
و در نهایت، همیشه، همیشه اطلاعاتی را که از یک هوش مصنوعی دریافت میکنید تأیید کنید. وقتی صحبت از تولیدکنندههای آثار هنری میشود، اهمیت کمتری دارد، اما اگر به کد و اطلاعات نگاه کنید، مهم است. بررسی کنید که آیا کدی که دریافت میکنید همانطور که میخواهید کار میکند یا خیر. صحت اطلاعات مکتوب ارائه شده به شما را بررسی کنید.
به یاد داشته باشید، مهم نیست چه اتفاقی می افتد، شما همچنان خلبان هستید. شما هنوز مسئول هستید، و در مورد اینکه چه قطعه های هنری، چه قطعه کد و چه اطلاعاتی استفاده می کنید و به اشتراک می گذارید، حرف آخر را می زنید.