چه چیزی در ChatGPT-4 جدید است؟ کاوش ویژگی های جدید | پردازش تصویر به Acing در تست ها

ek3nk4r 2023-03-23

0 33 خواندن این مطلب 6 دقیقه زمان میبرد

پیشنهاد ویژه

خرید فالوور واقعی خرید لایک اینستاگرام خرید ویو اینستاگرام خرید فالوور اینستاگرام

سلام! آیا خبر هیجان انگیز را شنیده اید؟ OpenAI به تازگی GPT-4، آخرین و بهترین مدل زبان AI را منتشر کرده است. این نسخه جدید مملو از ویژگی های جدید باورنکردنی است که توانایی های آن را به سطح جدیدی می رساند.

GPT-4 می تواند همه چیز را انجام دهد – از تجزیه و تحلیل تصاویر گرفته تا ایجاد یک بازی در مرورگر شما. این یک حلال مشکل خلاق تر و تواناتر از همیشه است. این شرکت در مورد قدرت های مدل زبان جدید خود به خود می بالید و به خود می بالید که از هر نسخه قبلی همکاری و تخیل بیشتری دارد.

کلاه خود را نگه دارید، مردم! این یک خبر بزرگ است – GPT-4 یک تغییر دهنده بازی است. در حالی که سلف آن، ChatGPT مجهز به GPT-3.5، فقط می‌توانست ورودی‌های متنی را بپذیرد، GPT-4 همه چیز را به سطح جدیدی می‌برد. این می تواند تصاویر را تجزیه و تحلیل کند و حتی بر اساس آنها زیرنویس ایجاد کند. اما این همه ماجرا نیست. در این وبلاگ، ما همچنین بررسی خواهیم کرد که چه چیزی GPT-4 قادر به انجام آن است، محدودیت های آن، و اینکه چگونه از سلف خود برتری دارد.

فهرست مطالب

GPT-4 چیست؟

توضیحات تصویر
OpenAI به طور رسمی آخرین ساخته خود را راه اندازی کرد – یک مدل چندوجهی قابل توجه که فراتر از متن است. در 14 مارس 2023، GPT-4 برای گرفتن ورودی های تصویر مجهز شد. برخلاف پیشینیان خود، GPT-3 و GPT-3.5، که به ورودی های متنی محدود می شدند، GPT-4 امکانات را برای کاربرانی که دیگر نیازی به تایپ پرس و جوها ندارند، گسترش می دهد. این یک تغییر دهنده بازی در مدل های زبان هوش مصنوعی است و ما هیجان زده هستیم که پتانسیل کامل آن را کشف کنیم.

به‌روزرسانی‌های سریع درباره GPT-4:

GPT-4 اکنون می‌تواند ورودی‌های متنی طولانی‌تر تا 25000 کلمه را بپذیرد
می تواند از HTML و جاوا اسکریپت برای تبدیل عکس یک مدل دستی برای یک وب سایت کوچک به یک وب سایت واقعی استفاده کند.
GPT-4 اکنون به کاربران امکان آپلود تصاویر و تجزیه و تحلیل و توصیف آنها را می دهد
قادر به مدیریت دستورالعمل های بسیار پیچیده تر از GPT-3.5 است
می تواند کل بازی های ویدیویی را در مرورگرها کدنویسی کند
به عنوان API برای توسعه دهندگان برای ساخت برنامه ها و خدمات در دسترس خواهد بود

چه چیزی در GPT-4 جدید است و چقدر از GPT-3 متفاوت است؟

GPT-4 اکنون می تواند تصاویر را تجزیه و تحلیل کند
توضیحات تصویر

GPT-4 یک پیشرفت قابل توجه را معرفی می کند، زیرا می تواند چندین روش اطلاعاتی را درک کند و آن را به یک مدل زبان چندوجهی تبدیل می کند. در مقابل، پیشینیان آن، GPT-3 و GPT-3.5 ChatGPT محدود به پردازش ورودی و خروجی متنی بودند و نمی توانستند انواع داده های دیگر را تفسیر کنند. با این حال، GPT-4 می تواند اطلاعات بصری مانند تصاویر را پردازش کند و بر اساس آن اطلاعات از جمله توانایی GPT-4 برای تشخیص طعنه و کنایه در متن، کار مرتبط ایجاد کند.

این ویژگی ممکن است لنز گوگل را به ذهن متبادر کند، که با تصاویر برای بازیابی اطلاعات نیز کار می کند، اما GPT-4 در توانایی آن برای تجزیه و تحلیل و درک اطلاعات بصری از لنز پیشی می گیرد. به عنوان مثال، OpenAI نشان داد که چگونه GPT-4 می تواند طنز را در یک تصویر بزرگ اتصال آیفون توضیح دهد.

لازم به ذکر است که قابلیت پردازش تصاویر هنوز در مرحله تحقیقاتی است و هنوز برای استفاده عمومی در دسترس نیست، اما به زودی خواهد بود.

عملکرد در سطح انسانی
OpenAI گزارش داده است که علاوه بر قابلیت‌های پردازش تصویر، GPT-4 همچنین عملکردی همتراز با انسان‌ها در معیارهای متعدد دانشگاهی و حرفه‌ای نشان می‌دهد. مدل زبان با کسب امتیاز در 10 درصد برتر شرکت کنندگان در آزمون وکالت شبیه سازی شده و حل مسائل پیچیده با دقت قابل توجه، به لطف دانش عمومی گسترده و مهارت های حل مسئله، استعداد استثنایی خود را نشان داده است.

توانایی های GPT-4 فراتر از پاسخ دادن به سؤالات مربوط به مالیات یا برنامه ریزی جلسات برای افراد متعدد است. همچنین می‌تواند سبک نوشتن خلاقانه کاربر را در کنار سایر وظایف بیاموزد.

فریب دادن GPT-4 سخت تر است
مدل‌های تولیدی مانند ChatGPT و Bing مستعد یک اشکال قابل توجه هستند – آنها می‌توانند گهگاه پیام‌هایی ایجاد کنند که نگرانی‌هایی را ایجاد می‌کنند یا حتی بدتر، باعث هشدار می‌شوند. آنها همچنین مستعد عدم دقت واقعی هستند و اطلاعات نادرست تولید می کنند.

برای رسیدگی به این نگرانی ها، OpenAI به طور گسترده برای اصلاح GPT-4 کار کرده است، و شش ماه را صرف آموزش مدل زبان با درس هایی از “برنامه تست خصمانه” و مدل ChatGPT کرده است. در نتیجه، این شرکت به “بهترین نتایج خود در زمینه واقعی بودن، فرمان پذیری و پایبندی به نرده های محافظ” دست یافته است.

GPT-4 این قابلیت را دارد که به طور قابل توجهی اطلاعات بیشتری را در یک زمان مدیریت کند
مدل‌های زبان بزرگ (LLM) با وجود آموزش روی میلیاردها پارامتر با حجم وسیع داده، هنوز محدودیت‌هایی در میزان اطلاعاتی که می‌توانند در طول مکالمه پردازش کنند، دارند. با این حال، GPT-4 یک مزیت قابل توجه دارد. این می تواند تا 25000 کلمه متن را مدیریت کند، تبادلات گسترده، جستجو و تجزیه و تحلیل اسناد و حتی ایجاد محتوای طولانی را انجام دهد.

در مقایسه با نسخه قبلی خود، ChatGPT، که می‌توانست تا 8000 کلمه را قبل از از دست دادن مسیر متن پردازش کند، GPT-4 می‌تواند دقت خود را در طول مکالمات طولانی‌تر حفظ کند. علاوه بر این، می تواند اسناد طولانی را تجزیه و تحلیل کند و محتوای طولانی و جامع تولید کند، که قبلا در GPT-3.5 چالش برانگیزتر بود.

GPT-4 دارای دقت بهبود یافته است
اگرچه GPT-4 هنوز محدودیت هایی دارد و ممکن است مانند نسخه های قبلی خود خطاهای استدلالی داشته باشد، OpenAI اذعان می کند که پیشرفت های قابل توجهی داشته است. به طور خاص، GPT-4 به طور قابل توجهی توهمات کمتری را نسبت به مدل های قبلی نشان می دهد و در ارزیابی واقعیت 40 درصد بیشتر از GPT-3.5 امتیاز می گیرد. در نتیجه، دستکاری GPT-4 برای تولید خروجی های ناخواسته مانند زبان نفرت و اطلاعات نادرست چالش برانگیزتر خواهد بود.

GPT-4 در درک زبان هایی که انگلیسی نیستند بهبود یافته است
آموزش مدل‌های زبان بزرگ (LLM) به زبان‌هایی غیر از انگلیسی می‌تواند چالش برانگیز باشد، زیرا بیشتر داده‌های یادگیری ماشین و اطلاعات آنلاین به زبان انگلیسی هستند. با این حال، GPT-4 پیشرفت قابل توجهی در قابلیت های چند زبانه داشته است، همانطور که توسط تست های OpenAI نشان داده شده است. با پاسخ دادن دقیق به هزاران سوال چند گزینه ای در ۲۶ زبان، از GPT-3.5 و سایر LLM ها پیشی می گیرد. اگرچه در زبان انگلیسی با دقت 85.5 درصد بهترین عملکرد را دارد، اما در زبان های هندی مانند تلوگو نیز دقت قابل توجهی را با میزان دقت 71.4 درصد نشان می دهد.

این پیشرفت به این معنی است که کاربران می توانند انتظار داشته باشند که از چت بات های مبتنی بر GPT-4 برای تولید خروجی هایی با وضوح بهتر و دقت بالاتر در زبان مادری خود استفاده کنند.

آیا در حال حاضر امکان امتحان GPT-4 وجود دارد؟
GPT-4 قبلاً برای اهداف مختلف در محصولاتی مانند Duolingo، Stripe و Khan Academy گنجانده شده است. در حالی که به صورت رایگان در دسترس عموم نیست، دسترسی فوری را می توان با اشتراک در ChatGPT Plus ماهانه 20 دلار به دست آورد. نسخه رایگان ChatGPT همچنان بر روی GPT-3.5 کار می کند.

خط پایین

در پایان، انتشار GPT-4 توسط OpenAI یک نقطه عطف قابل توجه در هوش مصنوعی است. GPT-4 یک مدل زبان بسیار پیشرفته است که می تواند تصاویر را پردازش و تجزیه و تحلیل کند، خروجی های دقیق و خلاقانه تولید کند و مقادیر قابل توجهی از اطلاعات را به طور همزمان مدیریت کند. از قابلیت های آن می توان به حل مسائل پیچیده با دقت قابل توجه، یادگیری سبک نوشتن کاربر و کدنویسی بازی های ویدئویی در مرورگرها اشاره کرد.

علاوه بر این، فریب دادن GPT-4 سخت تر و دقیق تر از GPT-3.5 قبلی است. به طور کلی، GPT-4 یک تغییر دهنده بازی است که انتظار می رود فرصت های جدیدی را برای توسعه دهندگان و محققان باز کند و ما نمی توانیم منتظر باشیم تا ببینیم چگونه چشم انداز هوش مصنوعی را متحول می کند.

بدون شک در توسعه توانایی هایی مانند انسان داشت و می تواند کد بنویسد، اما در خلاقیت و هوش هیچ کس نمی تواند انسان ها را شکست دهد! در توسعه اپلیکیشن موبایل و وب نیز همین اتفاق می افتد! اگر می‌خواهید برنامه‌های موبایل یا وب ایجاد کنید، دو بار فکر نکنید، به توسعه اپلیکیشن وب یا شرکت توسعه اپلیکیشن موبایل دسترسی پیدا کنید.

روز خوبی داشته باشی!

ek3nk4r 2023-03-23

0 33 خواندن این مطلب 6 دقیقه زمان میبرد