GitHub Copilot چیست؟ – انجمن DEV

1. کمک خلبان چه کسی؟ کدهای خودکار منبع باز کنترل را به دست می گیرند
این LLM های جدید ساخته شده برای کدنویسی ممکن است گیرنده بعدی سخاوت جامعه منبع باز باشند.
نشت LLaMA موج LLM منبع باز را شعله ور کرد و دیگران را ترغیب کرد که از آن پیروی کنند. اخیراً دو کدنویسی LLM ظاهر شده اند که نشان دهنده روند رو به رشد است. با LLM های منبع باز که با قابلیت های GitHub Copilot رقابت می کنند، توسعه دهندگان احساسات متفاوتی را ابراز می کنند.
انتشار LLaMA باعث تحریک تعداد زیادی LLM منبع باز شد و LLM های کدنویسی جدید احتمالاً همین کار را برای کدگذارهای خودکار انجام خواهند داد. StarCoder BigCode و Replit’s Code V1 جایگزین های منبع باز را برای LLM اختصاصی مبتنی بر GPT-4 Copilot ارائه می دهند که آزمایش و ادغام جامعه محور را تشویق می کند.
2. آیا منبع باز آینده هوش مصنوعی است؟
چندی پیش، یکی از محققین گوگل در یک سند فاش شده اعلام کرد که نه OpenAI و نه گوگل هیچ مزیت رقابتی قابل توجهی در رابطه با مدل های زبان بزرگ (LLM) ندارند، که نتیجه آن پیروزی برای جامعه منبع باز است. این محقق بر موارد زیر تاکید کرد:
ما نباید پیشبینی کنیم که با منبع باز مواجه شویم. اینترنت مدرن بنا به دلایل معتبر متعددی با منبع باز رشد می کند. منبع باز مزایای انکارناپذیر خاصی را ارائه می دهد که ما قادر به تکرار آنها نیستیم.”
این بیانیه صادق است، به ویژه با توجه به تأثیر قدرتمندی که LLaMA بر اکوسیستم منبع باز داشته است. نوآوری های پیشگامانه متعددی توسط این مدل معرفی شده است، با پیشرفت های ضروری بی شماری که توسط علاقه مندان داوطلب هوش مصنوعی مشتاق توسعه یک محصول برتر انجام شده است.
اگرچه به نظر میرسد متا کمترین سود را از نشت LLaMA داشته است، پیشرفتهای ارائه شده توسط اعضای جامعه اساساً حجم عظیمی از کار بدون دستمزد را برای آنها فراهم میکند. این بدون شک مهمترین ارزش پیشنهادی منبع باز است که داوطلبان را قادر میسازد تا حتی در بزرگترین پروژهها مشارکت معناداری داشته باشند.
پیش از این، مانع اصلی برای جامعه منبع باز در مورد LLM ها هزینه گزاف آموزش بود که اغلب برای مدل های بزرگتر به میلیون ها می رسید. با این وجود، توسعه دهندگان با موفقیت توانستند هزینه آموزش LLaMA را به تنها 300 دلار کاهش دهند و همزمان عملکرد آن را برای اجرای روان بر روی Raspberry Pi بهینه کنند.
قبل از معرفی LLaMA، برنامه نویسان و توسعه دهندگان کدگذاری خودکار با گزینه های محدودی در مورد LLM های موجود روبرو بودند. آنها می توانند به راه حل های اختصاصی و منبع بسته مانند GPT-4 OpenAI، GitHub Copilot یا Tabnine متوسل شوند یا به طور قابل توجهی در تنظیم دقیق یک LLM منبع باز موجود سرمایه گذاری کنند.
هر دوی این استراتژیها برای تحقق پتانسیل کامل منبع باز مناسب نبودند، زیرا مجوزها و شرایط استفاده سختگیرانه مانع آن شدند. با این حال، پیشرفتهای نوآورانه مانند StarCoder و CodeV1 اکنون فرصتی منحصر به فرد برای پیشرفت پروژههای مبتنی بر کدگذاری خودکار در بازار ارائه میکند.
3. نوآوری در انتظار وقوع است
اگرچه هر دو CodeV1 و StarCoder تحت مجوزهای منبع باز معرفی شدند (Creative Commons BY-SA برای CodeV1 و OpenRAIL-M برای StarCoder)، به نظر می رسد که آنها اهداف متمایزی در جامعه منبع باز دارند. از بین این دو، به نظر میرسد که StarCoder به صراحت برای مخاطبان منبع باز طراحی شده است، زیرا هر دو مدل و مجموعه داده عظیم 6.4 ترابایتی از کد منبع به طور همزمان به عنوان منابع منبع باز منتشر شدند.
علاوه بر این، StarCoder کیفیت کلی بهتری را در مقایسه با Replit’s Code V1 نشان داده است، که به نظر می رسد در درجه اول بر اقتصادی بودن از نظر آموزش و اجرا متمرکز شده است. در معیار HumanEval، StarCoder امتیاز 40.8٪ را به دست آورد، در حالی که Code V1 تنها 30.5٪ را کسب کرد. علاوه بر این، StarCoder می تواند بیش از پیش بینی کد انجام دهد. همچنین می تواند به برنامه نویسان در بررسی کد و حل مشکلات با استفاده از ابرداده کد کمک کند.
یکی از اشکالات قابل توجه StarCoder نیازهای سخت افزاری قابل توجه آن است که حداقل 32 گیگابایت حافظه GPU را در حالت 16 بیتی ضروری می کند. با این وجود، اگر LLaMA نشانهای باشد، جامعه منبع باز ممکن است فقط چند هفته دیگر برای بهینهسازی این مدل به منظور کارکرد بر روی دستگاههای تلفن همراه و لپتاپ نیاز داشته باشد.
در مقابل، Replit’s CodeV1 به عنوان یک افزودنی ارزشمند به اکوسیستم نرم افزاری موجود آنها به نظر می رسد. به نظر می رسد CodeV1 گامی بیشتر به سوی اجرای استراتژی آنها برای دموکراتیک کردن دسترسی به پلتفرم های نرم افزاری مبتنی بر هوش مصنوعی باشد. با انجام این کار، هدف آن هدف قرار دادن مجموعه گستردهتری از توسعهدهندگان است که بهجای محدود شدن در اکوسیستمهای خاص مانند GitHub Copilot به دنبال استقلال در استفاده از هوش مصنوعی هستند.
رتبه دوم کاربر هکر نیوز در مورد CodeV1 این بینش را داشت: «راهحلی مانند GitHub Copilot به من اجازه نمیدهد از هوش مصنوعی آنها بر اساس ترجیحاتم در برابر پایگاه کدم استفاده کنم. بنابراین، اگر Replit بتواند روشهای خلاقانهتر و پیشگامانهتری را برای ترکیب مدلهای زبانی بزرگ (LLM) کاوش کند، ممکن است لزوماً به بهترین کیفیتهای LLM برای ارائه یک تجربه کاربری استثنایی نیاز نداشته باشد.
نکته حائز اهمیت این است که اگر این مدل ها اجرا چالش برانگیز باشند یا فاقد دقت باشند، نگرانی مهمی نیست. جامعه متن باز می تواند به راحتی این کاستی ها را برطرف کند. داوطلبانی که روی LLaMA کار میکنند، با مشارکت در پروژههایی مانند RLHF با منبع جمعی، نشان دادهاند که میتوانند مدلها را هم در دسترستر و هم دقیقتر کنند. یک چیز روشن است: این نوآوری تنها آغازی برای چنین مدل های منبع باز است.
4. همکاری و مشارکت جامعه
کدگذارهای خودکار منبع باز همکاری و مشارکت جامعه را تقویت می کنند. توسعه دهندگان نه تنها می توانند از قابلیت های موجود این کدهای خودکار بهره مند شوند بلکه می توانند فعالانه در بهبود و ارتقای آنها مشارکت کنند. این تلاش جمعی می تواند منجر به سرعت بیشتر نوآوری و توسعه مدل های کدگذاری قوی شود که نیازهای برنامه نویسی متنوع را برآورده می کند.
5. دموکراتیک کردن کدنویسی مبتنی بر هوش مصنوعی
در دسترس بودن کدهای خودکار منبع باز نشان دهنده گامی به سوی دموکراتیک کردن کدنویسی مبتنی بر هوش مصنوعی است. در حالی که راه حل های اختصاصی مانند GitHub Copilot قابلیت های قدرتمندی را ارائه می دهند، ممکن است با محدودیت هایی مانند محدودیت های دسترسی یا هزینه همراه باشند. جایگزینهای متنباز راه در دسترستری را برای توسعهدهندگان فراهم میکنند تا از هوش مصنوعی در گردشهای کاری کدنویسی خود استفاده کنند و جامعه وسیعتری از برنامهنویسان را برای بهرهمندی از این فناوری توانمند میسازد.
به طور کلی، ظهور کدهای خودکار منبع باز نشان دهنده یک تغییر هیجان انگیز در چشم انداز کدنویسی است که به توسعه دهندگان انتخاب های بیشتری ارائه می دهد، نوآوری را تقویت می کند و همکاری را در جامعه توسعه دهندگان ارتقا می دهد.