چه چیزی در ChatGPT-4 جدید است؟ کاوش ویژگی های جدید | پردازش تصویر به Acing در تست ها
سلام! آیا خبر هیجان انگیز را شنیده اید؟ OpenAI به تازگی GPT-4، آخرین و بهترین مدل زبان AI را منتشر کرده است. این نسخه جدید مملو از ویژگی های جدید باورنکردنی است که توانایی های آن را به سطح جدیدی می رساند.
GPT-4 می تواند همه چیز را انجام دهد – از تجزیه و تحلیل تصاویر گرفته تا ایجاد یک بازی در مرورگر شما. این یک حلال مشکل خلاق تر و تواناتر از همیشه است. این شرکت در مورد قدرت های مدل زبان جدید خود به خود می بالید و به خود می بالید که از هر نسخه قبلی همکاری و تخیل بیشتری دارد.
کلاه خود را نگه دارید، مردم! این یک خبر بزرگ است – GPT-4 یک تغییر دهنده بازی است. در حالی که سلف آن، ChatGPT مجهز به GPT-3.5، فقط میتوانست ورودیهای متنی را بپذیرد، GPT-4 همه چیز را به سطح جدیدی میبرد. این می تواند تصاویر را تجزیه و تحلیل کند و حتی بر اساس آنها زیرنویس ایجاد کند. اما این همه ماجرا نیست. در این وبلاگ، ما همچنین بررسی خواهیم کرد که چه چیزی GPT-4 قادر به انجام آن است، محدودیت های آن، و اینکه چگونه از سلف خود برتری دارد.
GPT-4 چیست؟
OpenAI به طور رسمی آخرین ساخته خود را راه اندازی کرد – یک مدل چندوجهی قابل توجه که فراتر از متن است. در 14 مارس 2023، GPT-4 برای گرفتن ورودی های تصویر مجهز شد. برخلاف پیشینیان خود، GPT-3 و GPT-3.5، که به ورودی های متنی محدود می شدند، GPT-4 امکانات را برای کاربرانی که دیگر نیازی به تایپ پرس و جوها ندارند، گسترش می دهد. این یک تغییر دهنده بازی در مدل های زبان هوش مصنوعی است و ما هیجان زده هستیم که پتانسیل کامل آن را کشف کنیم.
بهروزرسانیهای سریع درباره GPT-4:
- GPT-4 اکنون میتواند ورودیهای متنی طولانیتر تا 25000 کلمه را بپذیرد
- می تواند از HTML و جاوا اسکریپت برای تبدیل عکس یک مدل دستی برای یک وب سایت کوچک به یک وب سایت واقعی استفاده کند.
- GPT-4 اکنون به کاربران امکان آپلود تصاویر و تجزیه و تحلیل و توصیف آنها را می دهد
- قادر به مدیریت دستورالعمل های بسیار پیچیده تر از GPT-3.5 است
- می تواند کل بازی های ویدیویی را در مرورگرها کدنویسی کند
- به عنوان API برای توسعه دهندگان برای ساخت برنامه ها و خدمات در دسترس خواهد بود
چه چیزی در GPT-4 جدید است و چقدر از GPT-3 متفاوت است؟
GPT-4 اکنون می تواند تصاویر را تجزیه و تحلیل کند
GPT-4 یک پیشرفت قابل توجه را معرفی می کند، زیرا می تواند چندین روش اطلاعاتی را درک کند و آن را به یک مدل زبان چندوجهی تبدیل می کند. در مقابل، پیشینیان آن، GPT-3 و GPT-3.5 ChatGPT محدود به پردازش ورودی و خروجی متنی بودند و نمی توانستند انواع داده های دیگر را تفسیر کنند. با این حال، GPT-4 می تواند اطلاعات بصری مانند تصاویر را پردازش کند و بر اساس آن اطلاعات از جمله توانایی GPT-4 برای تشخیص طعنه و کنایه در متن، کار مرتبط ایجاد کند.
این ویژگی ممکن است لنز گوگل را به ذهن متبادر کند، که با تصاویر برای بازیابی اطلاعات نیز کار می کند، اما GPT-4 در توانایی آن برای تجزیه و تحلیل و درک اطلاعات بصری از لنز پیشی می گیرد. به عنوان مثال، OpenAI نشان داد که چگونه GPT-4 می تواند طنز را در یک تصویر بزرگ اتصال آیفون توضیح دهد.
لازم به ذکر است که قابلیت پردازش تصاویر هنوز در مرحله تحقیقاتی است و هنوز برای استفاده عمومی در دسترس نیست، اما به زودی خواهد بود.
عملکرد در سطح انسانی
OpenAI گزارش داده است که علاوه بر قابلیتهای پردازش تصویر، GPT-4 همچنین عملکردی همتراز با انسانها در معیارهای متعدد دانشگاهی و حرفهای نشان میدهد. مدل زبان با کسب امتیاز در 10 درصد برتر شرکت کنندگان در آزمون وکالت شبیه سازی شده و حل مسائل پیچیده با دقت قابل توجه، به لطف دانش عمومی گسترده و مهارت های حل مسئله، استعداد استثنایی خود را نشان داده است.
توانایی های GPT-4 فراتر از پاسخ دادن به سؤالات مربوط به مالیات یا برنامه ریزی جلسات برای افراد متعدد است. همچنین میتواند سبک نوشتن خلاقانه کاربر را در کنار سایر وظایف بیاموزد.
فریب دادن GPT-4 سخت تر است
مدلهای تولیدی مانند ChatGPT و Bing مستعد یک اشکال قابل توجه هستند – آنها میتوانند گهگاه پیامهایی ایجاد کنند که نگرانیهایی را ایجاد میکنند یا حتی بدتر، باعث هشدار میشوند. آنها همچنین مستعد عدم دقت واقعی هستند و اطلاعات نادرست تولید می کنند.
برای رسیدگی به این نگرانی ها، OpenAI به طور گسترده برای اصلاح GPT-4 کار کرده است، و شش ماه را صرف آموزش مدل زبان با درس هایی از “برنامه تست خصمانه” و مدل ChatGPT کرده است. در نتیجه، این شرکت به “بهترین نتایج خود در زمینه واقعی بودن، فرمان پذیری و پایبندی به نرده های محافظ” دست یافته است.
GPT-4 این قابلیت را دارد که به طور قابل توجهی اطلاعات بیشتری را در یک زمان مدیریت کند
مدلهای زبان بزرگ (LLM) با وجود آموزش روی میلیاردها پارامتر با حجم وسیع داده، هنوز محدودیتهایی در میزان اطلاعاتی که میتوانند در طول مکالمه پردازش کنند، دارند. با این حال، GPT-4 یک مزیت قابل توجه دارد. این می تواند تا 25000 کلمه متن را مدیریت کند، تبادلات گسترده، جستجو و تجزیه و تحلیل اسناد و حتی ایجاد محتوای طولانی را انجام دهد.
در مقایسه با نسخه قبلی خود، ChatGPT، که میتوانست تا 8000 کلمه را قبل از از دست دادن مسیر متن پردازش کند، GPT-4 میتواند دقت خود را در طول مکالمات طولانیتر حفظ کند. علاوه بر این، می تواند اسناد طولانی را تجزیه و تحلیل کند و محتوای طولانی و جامع تولید کند، که قبلا در GPT-3.5 چالش برانگیزتر بود.
GPT-4 دارای دقت بهبود یافته است
اگرچه GPT-4 هنوز محدودیت هایی دارد و ممکن است مانند نسخه های قبلی خود خطاهای استدلالی داشته باشد، OpenAI اذعان می کند که پیشرفت های قابل توجهی داشته است. به طور خاص، GPT-4 به طور قابل توجهی توهمات کمتری را نسبت به مدل های قبلی نشان می دهد و در ارزیابی واقعیت 40 درصد بیشتر از GPT-3.5 امتیاز می گیرد. در نتیجه، دستکاری GPT-4 برای تولید خروجی های ناخواسته مانند زبان نفرت و اطلاعات نادرست چالش برانگیزتر خواهد بود.
GPT-4 در درک زبان هایی که انگلیسی نیستند بهبود یافته است
آموزش مدلهای زبان بزرگ (LLM) به زبانهایی غیر از انگلیسی میتواند چالش برانگیز باشد، زیرا بیشتر دادههای یادگیری ماشین و اطلاعات آنلاین به زبان انگلیسی هستند. با این حال، GPT-4 پیشرفت قابل توجهی در قابلیت های چند زبانه داشته است، همانطور که توسط تست های OpenAI نشان داده شده است. با پاسخ دادن دقیق به هزاران سوال چند گزینه ای در ۲۶ زبان، از GPT-3.5 و سایر LLM ها پیشی می گیرد. اگرچه در زبان انگلیسی با دقت 85.5 درصد بهترین عملکرد را دارد، اما در زبان های هندی مانند تلوگو نیز دقت قابل توجهی را با میزان دقت 71.4 درصد نشان می دهد.
این پیشرفت به این معنی است که کاربران می توانند انتظار داشته باشند که از چت بات های مبتنی بر GPT-4 برای تولید خروجی هایی با وضوح بهتر و دقت بالاتر در زبان مادری خود استفاده کنند.
آیا در حال حاضر امکان امتحان GPT-4 وجود دارد؟
GPT-4 قبلاً برای اهداف مختلف در محصولاتی مانند Duolingo، Stripe و Khan Academy گنجانده شده است. در حالی که به صورت رایگان در دسترس عموم نیست، دسترسی فوری را می توان با اشتراک در ChatGPT Plus ماهانه 20 دلار به دست آورد. نسخه رایگان ChatGPT همچنان بر روی GPT-3.5 کار می کند.
خط پایین
در پایان، انتشار GPT-4 توسط OpenAI یک نقطه عطف قابل توجه در هوش مصنوعی است. GPT-4 یک مدل زبان بسیار پیشرفته است که می تواند تصاویر را پردازش و تجزیه و تحلیل کند، خروجی های دقیق و خلاقانه تولید کند و مقادیر قابل توجهی از اطلاعات را به طور همزمان مدیریت کند. از قابلیت های آن می توان به حل مسائل پیچیده با دقت قابل توجه، یادگیری سبک نوشتن کاربر و کدنویسی بازی های ویدئویی در مرورگرها اشاره کرد.
علاوه بر این، فریب دادن GPT-4 سخت تر و دقیق تر از GPT-3.5 قبلی است. به طور کلی، GPT-4 یک تغییر دهنده بازی است که انتظار می رود فرصت های جدیدی را برای توسعه دهندگان و محققان باز کند و ما نمی توانیم منتظر باشیم تا ببینیم چگونه چشم انداز هوش مصنوعی را متحول می کند.
بدون شک در توسعه توانایی هایی مانند انسان داشت و می تواند کد بنویسد، اما در خلاقیت و هوش هیچ کس نمی تواند انسان ها را شکست دهد! در توسعه اپلیکیشن موبایل و وب نیز همین اتفاق می افتد! اگر میخواهید برنامههای موبایل یا وب ایجاد کنید، دو بار فکر نکنید، به توسعه اپلیکیشن وب یا شرکت توسعه اپلیکیشن موبایل دسترسی پیدا کنید.
روز خوبی داشته باشی!