برنامه نویسی

وضوح تصویر خود را با Real-ESRGAN افزایش دهید: راهنمای کامل

آیا تا به حال احساس ناامیدی از یک تصویر درخشان که با وضوح کم از بین می رود را احساس کرده اید؟ عکسی از یک گوشی قدیمی، اسکرین شات اشتباهی، یا یک تصویر آرشیوی ارزشمند، نوید کیفیت بالا که با پیکسل‌سازی مخدوش شده است؟ خب تو خوش شانسی وارد Real-ESRGAN شوید، یک مدل هوش مصنوعی که بهبود تصویر با کیفیت بالا را ارائه می‌کند، حتی برای عکس‌هایی با وضوح فوق‌العاده پایین که فکر می‌کردید غیرقابل نجات هستند.

این راهنما شما را با جادوی مدل Real-ESRGAN آشنا می‌کند، ورودی‌ها و خروجی‌های آن را توضیح می‌دهد و به شما آموزش می‌دهد که چگونه از آن برای حل کابوس‌های وضوح تصویر خود گام به گام استفاده کنید. و سلام، این فقط یک مدل دیگر نیست – Real-ESRGAN از نظر محبوبیت در رتبه 10 در AIModels.fyi قرار گرفته است و آن را به یکی از گزینه‌های پیشنهادی برای بهبود تصویر تبدیل می‌کند. و به عنوان یک گیلاس در بالا، ما به شما نشان خواهیم داد که چگونه از AIModels.fyi برای یافتن مدل های مشابه استفاده کنید و تصمیم بگیرید که کدام یک به بهترین وجه با تلاش های خلاقانه شما سازگار است. بنابراین، دست و پنجه نرم کنید و بیایید شیرجه بزنیم!

درباره Real-ESRGAN

مدل Real-ESRGAN که توسط NightmareAI ماهر ایجاد شده است، یک شگفتی در دنیای تبدیل تصویر به تصویر است. این به طور خاص طراحی شده است تا تصاویر را با کیفیت بالا حفظ کند (یا حتی کیفیت آنها را افزایش دهد). ESRGAN مخفف عبارت Enhanced Super-Resolution Generative Adversarial Network است. به زبان ساده، از هوش مصنوعی برای تولید یک تصویر با وضوح بالا از ورودی با وضوح پایین استفاده می کند، فرآیندی که به عنوان “فوق وضوح” شناخته می شود. شما می توانید جزئیات بیشتر در مورد مدل را در صفحه جزئیات آن بیابید.

چیزی که Real-ESRGAN را متمایز می‌کند، گزینه‌ای برای تصحیح چهره و قابل تنظیم است. بنابراین، اگر یک سلفی پیکسلی یا یک عکس خانوادگی تار دارید، Real-ESRGAN نه تنها می‌تواند تصویر کلی را بهبود بخشد، بلکه می‌تواند پیشرفت‌های خاصی را روی چهره‌ها اعمال کند. این قابلیت آن را برای احیای عکس های قدیمی، بهبود تصاویر رسانه های اجتماعی و موارد دیگر عالی می کند. Real-ESRGAN با هزینه تنها 0.00605 دلار در هر اجرا و میانگین زمان اجرا تنها 11 ثانیه، راه حلی مقرون به صرفه و کارآمد برای بهبود تصویر ارائه می دهد.

مربوط: با هوش مصنوعی به عکس های قدیمی جان تازه ای بدهید: راهنمای مبتدیان برای GFPGAN

Real-ESRGAN چگونه کار می کند – مروری فنی

بیایید کمی عمیق تر به پیچ و مهره های Real-ESRGAN بپردازیم. جزئیات در اینجا از مقاله تحقیقاتی اصلی گرفته شده است، در صورتی که علاقه مند به مطالعه جامع تری هستید.

هدف Real-ESRGAN در هسته خود حل مشکلی در حوزه وضوح فوق العاده کور است، که فرآیند بهبود تصاویر با وضوح پایین است که در معرض تخریب های ناشناخته و پیچیده قرار گرفته اند. به عبارت ساده، هدف آن بهبود کیفیت تصاویر تار یا پیکسلی است.

یکی از جنبه های تعیین کننده Real-ESRGAN فرآیند آموزش آن است. برخلاف سایر مدل‌ها، با داده‌های مصنوعی آموزش داده می‌شود که به طور مصنوعی برای تقلید سناریوهای دنیای واقعی ایجاد شده‌اند. این بدان معنا نیست که داده ها از کیفیت کمتری برخوردار هستند. این فقط به این معنی است که به جای جمع آوری از تصاویر دنیای واقعی ایجاد شده است.

برای شبیه‌سازی تخریب‌های پیچیده در دنیای واقعی، Real-ESRGAN یک فرآیند مدل‌سازی تخریب مرتبه بالا را ترکیب می‌کند. این به مدل اجازه می‌دهد تا انواع روش‌هایی که ممکن است یک تصویر در یک محیط واقعی کاهش یابد، بهتر توضیح دهد.

علاوه بر این، این مدل به‌گونه‌ای طراحی شده است که مصنوعات رایجی را که می‌توانند در طول فرآیند سنتز تصویر رخ دهند، مانند زنگ زدن و بیش از حد، نشان دهد. اینها اختلالاتی هستند که می توانند بر کیفیت تصویر حاصل تأثیر بگذارند.

علاوه بر این ویژگی ها، Real-ESRGAN از یک تشخیصگر U-Net با نرمال سازی طیفی استفاده می کند. نقش متمایز کننده تمایز بین خروجی های مدل و تصاویر واقعی است. با استفاده از معماری U-Net، توانایی تفکیک کننده افزایش یافته و پویایی آموزش تثبیت می شود.

از طریق مقایسه‌های متعدد، Real-ESRGAN ثابت کرده است که عملکرد فوق‌العاده‌ای در مجموعه داده‌های واقعی مختلف دارد و از مدل‌های قبلی در حوزه بهبود تصویر بهتر عمل می‌کند.

در نهایت، Real-ESRGAN می تواند به طور موثر جفت های تمرینی را در پرواز ترکیب کند و یک لایه کارآمدی اضافی به کل فرآیند اضافه کند.

به طور خلاصه، Real-ESRGAN با استفاده از تکنیک ها و معماری های پیشرفته برای تبدیل تصاویر با وضوح پایین به تصاویر با کیفیت بالا کار می کند. این ترکیبی قوی از ریاضیات و قدرت محاسباتی است که این تحول را زنده می کند.

درک ورودی ها و خروجی های Real-ESRGAN

قبل از اینکه شروع به بهبود تصاویر خود کنیم، مهم است که بدانیم چگونه با Real-ESRGAN ارتباط برقرار کنیم، و این مهم از طریق ورودی ها و خروجی های آن است.

ورودی ها

Real-ESRGAN دو نوع ورودی را می پذیرد:

  1. فایل تصویری: این تصویری است که می خواهید آن را تقویت کنید. به عبارت ساده، این تصویر ورودی با وضوح پایین شماست.

  2. عدد ترازو: این عاملی است که می خواهید تصویر خود را با آن مقیاس کنید. مقدار پیش فرض 4 است، اما می توانید آن را بر اساس نیاز خود تنظیم کنید.

  3. تقویت صورت: یک مقدار بولی (درست/نادرست). وقتی روی true تنظیم شود، مدل پیشرفت‌های خاصی را روی چهره‌های تصویر اعمال می‌کند.

خروجی ها

خروجی Real-ESRGAN بسیار ساده است. رشته ای را برمی گرداند که نشان دهنده یک URI است که در آن می توانید تصویر پیشرفته خود را پیدا کنید.

اکنون که با نحوه صحبت با Real-ESRGAN آشنا شدیم، بیایید به قسمت سرگرم کننده آن برویم – از آن برای بهبود تصاویر خود استفاده کنیم!

راهنمای گام به گام استفاده از Real-ESRGAN

زمان آن رسیده است که شاهد جادوی بهبود تصویر مبتنی بر هوش مصنوعی باشیم. می‌توانید مستقیماً با «دمو» مدل در Replicate از طریق رابط کاربری آن‌ها تعامل داشته باشید

اگر در حال حاضر تمایلی به کار با کد ندارید. می توانید از این لینک برای بازی با پارامترهای مدل و دریافت بازخورد سریع استفاده کنید.

مرحله 1: کلاینت Node.js را نصب کنید

ابتدا باید Replicate Client را برای Node.js با اجرای دستور زیر نصب کنیم:

npm install replicate

مرحله 2: با استفاده از کد API خود احراز هویت کنید

سپس، کد API خود را کپی کنید و با تنظیم آن به عنوان یک متغیر محیطی، احراز هویت کنید:

export REPLICATE_API_TOKEN=[token]

مرحله 3: مدل را اجرا کنید

با تنظیم همه چیز، ما آماده اجرای مدل هستیم. در اینجا یک مثال ساده از نحوه انجام این کار آورده شده است:

import Replicate from "replicate";

const replicate = new Replicate({
  auth: process.env.REPLICATE_API_TOKEN,
});

const output = await replicate.run(
  "nightmareai/real-esrgan:42fed1c4974146d4d2414e2be2c5277c7fcf05fcc3a73abf41610695738c1d7b",
  {
    input: {
      image: "..." // replace with your image
    }
  }
);
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

تنظیم وب هوک

اگر می‌خواهید زمانی که پیش‌بینی شما آماده است مطلع شوید، می‌توانید یک URL webhook را مشخص کنید. در اینجا نحوه انجام آن آمده است:

const prediction = await replicate.predictions.create({
  version: "42fed1c4974146d4d2414e2be2c5277c7fcf05fcc3a73abf41610695738c1d7b",
  input: {
    image: "..." // replace with your image
  },
  webhook: "https://example.com/your-webhook",
  webhook_events_filter: ["completed"]
});
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

ادامه آن – یافتن مدل‌های تصویر به تصویر دیگر با AIModels.fyi

AIModels.fyi معدن طلایی برای کشف مدل های هوش مصنوعی است که طیف وسیعی از نیازها را برآورده می کند. از تولید تصویر تا تبدیل تصویر به تصویر، یک پایگاه داده قابل جستجو، قابل فیلتر و برچسب گذاری شده از همه مدل ها در Replicate ارائه می دهد. اگر علاقه مند به یافتن مدل های مشابه Real-ESRGAN هستید، در اینجا نحوه انجام این کار آورده شده است:

مرحله 1: از AIModels.fyi دیدن کنید

برای شروع جستجوی خود برای مدل های مشابه، به AIModels.fyi بروید.

مرحله 2: از نوار جستجو استفاده کنید

از نوار جستجو در بالای صفحه برای جستجوی مدل‌هایی با کلمات کلیدی خاص مانند «رزولوشن فوق‌العاده» یا «بهبود تصویر» استفاده کنید. با این کار لیستی از مدل های مرتبط با درخواست جستجوی شما را نشان می دهد.

مرحله 3: نتایج را فیلتر کنید

در سمت چپ صفحه نتایج جستجو، فیلترهای متعددی پیدا خواهید کرد که می توانند به شما در محدود کردن لیست مدل ها کمک کنند. می توانید مدل ها را بر اساس نوع (تصویر به تصویر، متن به تصویر و غیره)، هزینه، محبوبیت یا حتی سازندگان خاص فیلتر و مرتب کنید.

screenshotr 2023 5 27T8 51 34

یافتن افزایش‌دهنده تصویر به تصویر اضافی در AIModels.fyi

نتیجه

در این راهنما، ما عمیقاً به عملکرد مدل Real-ESRGAN پرداختیم، یاد گرفتیم که چگونه از آن برای بهبود تصاویر خود استفاده کنیم، و حتی نحوه یافتن مدل های مشابه را با استفاده از AIModels.fyi بررسی کردیم. ما همچنین کشف کردیم که چگونه از ویژگی‌های جستجو و فیلتر در AIModels.fyi برای یافتن مدل‌هایی که به بهترین وجه با نیازهای ما مطابقت دارند، استفاده کنیم و افق‌های ما را در دنیای بهبود تصویر مبتنی بر هوش مصنوعی گسترش دهیم.

امیدوارم این راهنما الهام بخش شما باشد تا امکانات خلاقانه هوش مصنوعی را کشف کنید و تخیل خود را زنده کنید. فراموش نکنید که برای آموزش‌های بیشتر، به‌روزرسانی‌های مدل‌های جدید و بهبودیافته هوش مصنوعی و الهام‌بخشی برای شما مشترک شوید.

پروژه خلاقانه بعدی می‌توانید از آخرین بررسی‌های من در مورد هوش مصنوعی به‌روز باشید توییترو فراموش نکنید که راهنماها و منابع بیشتری را در notes.aimodels.fyi بررسی کنید. بهبود تصویر مبارک، و در اینجا به سفر شما به دنیای هوش مصنوعی با AIModels.fyi است!

مشترک شوید یا من را دنبال کنید توییتر برای مطالب بیشتر مانند این!

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا