برنامه نویسی

WAN 2.1: انقلاب ویدیویی هوش مصنوعی که خارج از این جهان است (اما هنوز هم روی رایانه شما اجرا می شود)

انسانهای همکار ، دموسین عصر دیجیتال ، آیا تا به حال به هرج و مرج چرخان اینترنت خیره شده اید و فکر کرده اید ، “خدایا ، آرزو می کنم فیلم های بیشتری از گربه ها که پیانو یا سگ های سوار بر اسکیت بازی می کردند ، وجود داشته باشد؟” خوب ، دیگر ، دیگر ، زیرا دوره جدیدی از تولید ویدیو طلوع کرده است و نام آن WAN 2.1 است.

اکنون ، من می دانم که شما چه فکر می کنید: “سعید ، این فقط یک فاضلاب دیگر نیست؟ آیا ما به اندازه کافی Deepfakes را ندیده ایم تا یک عمر دوام بیاورد؟” اما به من اعتماد کن ، این متفاوت است. WAN 2.1 فقط مربوط به تقلید از واقعیت نیست. این در مورد ایجاد واقعیت های کاملاً جدید است که فقط با تخیل شما محدود شده است (و شاید حافظه GPU شما).

به رایانه های سنتی فکر کنید به عنوان آن دستگاه های اضافه شده قدیمی ، با جدیت تعداد اعداد را خرد می کنند اما فاقد جرقه خلاقیت واقعی هستند. WAN 2.1 ، از طرف دیگر ، مانند یک داور دیجیتال داوینچی ، استاد هم منطق و هم هنری است. این می تواند فیلم هایی را از هوای نازک ایجاد کند و موسیقی متنی شما را به تصاویر پر جنب و جوش و متحرک تبدیل کند.


چه چیزی WAN 2.1 را بسیار خاص می کند؟

این هوش مصنوعی مادربزرگ شما نیست. WAN 2.1 دارای مجموعه ای از ویژگی های پیشگامانه است که آن را از رقابت جدا می کند:

  • یک ماشین زمان ویدیویی: تصور کنید که یک فیلم را فشرده می کنید ، نه فقط از نظر اندازه بلکه در زمان خود. این قدرت WAN-VAE ، یک معماری انقلابی سه بعدی است که جوهر حرکت و جریان یک فیلم را ضبط می کند. این مانند داشتن یک ماشین زمان برای فیلم است ، به مدل اجازه می دهد توالی های طولانی تر و منسجم تری با راندمان بی سابقه تولید کند.
  • صحبت کردن در زبانها (بصری): WAN 2.1 اولین مدل ویدیویی است که می تواند متن انگلیسی و چینی را در فیلم ها تولید کند. این دنیای کاملاً جدیدی از امکانات را باز می کند ، از تولید فیلم ها با زیرنویس های چند زبانه گرفته تا ایجاد اشکال کاملاً جدید از داستان پردازی بصری. مستندهای تولید شده توسط AI را به زبان های مختلف یا فیلم های آموزشی که برای مخاطبان جهانی تهیه می شود ، روایت کنید.
  • سمفونی بینایی و صدا: اما صبر کنید ، چیزهای بیشتری وجود دارد! WAN 2.1 فقط تصویری ایجاد نمی کند. همچنین می تواند جلوه های صوتی هماهنگ و موسیقی پس زمینه ایجاد کند. دنیایی را تصور کنید که هوش مصنوعی می تواند موسیقی متن فیلم را کاملاً متناسب با احساسات و اقدامات آشکار روی صفحه آهنگسازی کند. این نوع تجربه همهجانبه WAN 2.1 است که قادر به ارائه است.
  • تسلط بر قوانین فیزیک (و رقص): WAN 2.1 فراتر از انیمیشن اساسی است ، با دقت شبیه سازی حرکت پیچیده و فیزیک دنیای واقعی. این که آیا این یک رقصنده با خوشحالی است ، یک دوچرخه سوار که در یک خیابان شلوغ حرکت می کند ، یا اشیاء در تعامل با روشی واقع بینانه ، WAN 2.1 ظرافت های حرکت را با دقت چشمگیر ضبط می کند.

چرا باید به خوانندگان توجه داشته باشد؟

از آنجا که این آینده آفرینش ویدیو است و اکنون اتفاق می افتد. WAN 2.1 منبع باز و در دسترس است ، به این معنی که توسعه دهندگان و سازندگان می توانند با آن آزمایش کنند و آن را در پروژه های خود ادغام کنند. امکانات را تصور کنید:

  • ابزارهای ویرایش ویدیویی AI: ویرایش فیلم ها را با سهولت متن ویرایش تصور کنید. WAN 2.1 می تواند یکپارچه اشیاء را جایگزین کند ، صحنه ها را گسترش دهد و حتی فیلم های کاملاً جدیدی تولید کند ، همه با چند دستور ساده.
  • محتوای ویدیوی شخصی: تصور کنید که فیلم های سفارشی متناسب با بینندگان شخصی ایجاد کنید. WAN 2.1 می تواند فیلم هایی را بر اساس ترجیحات کاربر ، جمعیت شناسی یا حتی روحیه فعلی آنها تولید کند و راه های جدیدی را برای بازاریابی و سرگرمی شخصی باز کند.
  • داستان پردازی تعاملی: فیلم هایی را تصور کنید که به ورودی بیننده پاسخ می دهند و یک تجربه واقعاً همهجانبه و تعاملی ایجاد می کنند. WAN 2.1 می تواند برای تولید بازی های ویدیویی پویا ، شبیه سازی های آموزشی یا حتی تاسیسات هنری تعاملی استفاده شود.

WAN 2.1 چیست؟

WAN 2.1 فقط یک مدل نیست ، بلکه مجموعه ای از چهار مدل مجزا است که هر کدام برای کارهای خاص و قابلیت های سخت افزاری طراحی شده اند:

نام مدل وضوح پارامترها شرط VRAM ویژگی های کلیدی
T2V-1.3b 480p 1.3 میلیارد 8.19 گیگابایت سبک وزن ، درجه یک سازگار با GPU ، سرعت تولید سریع
T2V-14B 480p/720p 14 میلیارد بالاتر با کیفیت پیشرفته ، از تولید متن چینی و انگلیسی پشتیبانی می کند
I2V-14B-720p 720p 14 میلیارد بالاتر تبدیل تصویر به ویدئو در وضوح 720p
I2V-14B-480p 480p 14 میلیارد بالاتر تبدیل تصویر به ویدئو در وضوح 480p

Alibaba Cloud سخاوتمندانه این مدل ها را تحت مجوز Apache 2.0 منبع باز کرده است و امکان استفاده علمی و تجاری را با محدودیت های خاصی فراهم می کند. این امکان دسترسی به فناوری تولید ویدیوی هوش مصنوعی پیشرفته ، تقویت نوآوری و همکاری در زمینه های مختلف را دموکراتیک می کند.


شرح تصویر

Defing Deeper: تحقیقات پشت WAN 2.1

توسعه WAN 2.1 شامل یک فرآیند تحقیق دقیق است و مرزهای تولید ویدیوی هوش مصنوعی را تحت فشار قرار می دهد. نوآوری های کلیدی عبارتند از:

  • از بین بردن: این معماری رمان رمان VAE ، فشرده سازی ویدیو ، راندمان حافظه و قوام زمانی را بهبود می بخشد. این مدل به مدل اجازه می دهد تا فیلم های 1080p را از هر طول رمزگذاری و رمزگشایی کند بدون از دست دادن اطلاعات حرکتی تاریخی ، و آن را برای تولید توالی های ویدیویی طولانی تر و منسجم تر ایده آل می کند.

  • ترانسفورماتور انتشار با رمزگذار T5: WAN 2.1 از یک معماری ترانسفورماتور انتشار ، مشابه موارد مورد استفاده در تولید تصویر استفاده می کند ، اما با تفاوت اساسی. این یک رمزگذار T5 را در بر می گیرد و این امکان را برای درک و تولید متن به دو زبان انگلیسی و چینی فراهم می کند. این دستیابی به موفقیت امکان تولید فیلم با زیرنویس های چند زبانه را فراهم می کند و راه های جدیدی را برای داستان پردازی بصری باز می کند.

علاوه بر این ، WAN 2.1 در مجموعه داده های عظیم 1.5 میلیارد فیلم و 10 میلیارد تصویر آموزش داده شد و این امر به عملکرد چشمگیر و توانایی تولید فیلم های با کیفیت بالا کمک می کند


نحوه شروع کار با WAN 2.1

آماده گرفتن شیرجه هستید؟ در اینجا چند سیستم عامل وجود دارد که می توانید با WAN 2.1 به آن دسترسی پیدا کرده و آزمایش کنید:

  • صورت بغل کردن: برای شروع مدل های از پیش آموزش و نمونه های کد را پیدا کنید.
  • ModelsCope: یکی دیگر از سکوهای میزبان مدل های WAN 2.1.
  • Pollo AI: WAN 2.1 را به صورت رایگان با یک رابط کاربر پسند امتحان کنید.
  • Comfyui: سازنده گردش کار مبتنی بر گره که روند استفاده از WAN 2.1 را ساده می کند
  • Swarmui: سکویی که برای اجرای مدل های بزرگ زبان ، از جمله WAN 2.1 طراحی شده است

نتیجه گیری: جهانی از امکانات

WAN 2.1 چیزی بیش از یک مدل هوش مصنوعی است. این نگاهی اجمالی به آینده ایجاد ویدیو است. این ابزاری است که به ما این امکان را می دهد تا داستان ها را بگوییم ، تجربیات را به اشتراک بگذاریم و مرزهای خلاق جدید را کشف کنیم. همانطور که ما همچنان به مرزهای هوش مصنوعی ادامه می دهیم ، یک چیز مسلم است: آینده فیلم پویا ، همهجانبه و فقط با تصور ما محدود است. و با WAN 2.1 ، این آینده نزدیکتر از گذشته است.


منابع:

  1. Alibaba از مدل های تولید ویدیویی WAN 2.1 AI پرده برداشت ، و به سمت سورا Operform Openi Openai ، دسترسی پیدا کرد ، در 3 مارس 2025 ، https://www.businesstoday.in/technology/news/story/alibaba-unveils-wan-21-ai-video- generation-models-claming-toperform-openais-sora-2025-02-28-028-028-028-028-028
  2. یک راهنمای مبتدی برای مدل WAN-2.1-T2V-480P توسط Wavespeedai در تکرار ، دسترسی به 3 مارس 2025 ، https://dev.to/mikeyoung44/a-beginners-guide-to-the-wan-van-480p-model-model-model-model-by-wavespeedai-n-n-ne29b
  3. Alibaba از WAN 2.1 پرده برداری می کند: یک مدعی منبع باز در تولید ویدیو-opentools.ai ، دسترسی به 3 مارس 2025 ، https://opentools.ai/news/alibaba-unveils-wan-n-an-open-source-contender-in-pindeo-generation
  4. Alibaba مدل تولید ویدیوی منبع باز 2.1 ، Outperforms Openai's Sora-Magazine Analytics India ، دسترسی به 3 مارس 2025 ، https://analyticsindiamag.com/ai-newsupdates-preleases-source-video-genera-modelwan-modelwan-d-penera-d-penais-penais-penais-penais-penais-penais-penais-penais-penais-penais-penais-pena-source–sourreleases-pena-sourreleases-mode–sourreleases-modiamag.
  5. Medium.com ، دسترسی به 3 مارس 2025 ، https://medium.com/@cognidownunder/wan-2-1-alibabas-open-source-source-text-video-model-hanges-every-ed1dc4c19f85#:text=wan٪202.1٪20T202202202202202202202202202202
  6. Alibaba با انتشار منبع باز 2.1 مجموعه مدل های تولید ویدیویی هوش مصنوعی ، ادعا کرد که از سورا Openi-Openai بهتر است | اخبار فناوری-Getgets 360 ، دسترسی به 3 مارس 2025 ، https://www.gadgets360.com/ai/news/alibaba-wan-2-1-ai-vide-models-source-source-penai-sora-sora-sora-sora-sora-sora-7807308073080730807308073080730807303
  7. Wan2.1: Best open-sourced AI Video generation model, beats OpenAI Sora – Medium, accessed March 3, 2025, https://medium.com/data-science-in-your-pocket/wan2-1-best-open-sourced-ai-video-generation-model-beats-openai-sora-6ea081cbb8f8
  8. WAN2.1: یک مدل هوش مصنوعی منبع باز از Sora | توسط novita ai | فوریه 2025-متوسط ​​، دسترسی به 3 مارس 2025 ، https://medium.com/@marketing_novita.ai/WAN2-1-An-Open-Source-Ai-OutperForms-5a7Dbe18a66a
  9. Alibaba's New WAN 2.1 Text-to-Video AI باورنکردنی است-BGR ، دسترسی به 3 مارس 2025 ، https://bgr.com/tech/alibabas-new-ضچه-1–1–1-to –video-i-is-unbelievable/
  10. Alibaba باعث می شود Generator Video WAN 2.1 رایگان برای استفاده-PetApixel ، دسترسی به 3 مارس 2025 ، https://petapixel.com/2025/02/26/alibaba-ai-ai-video-generator-2-1-1le-equest-te-use//
  11. WAN2.1 گردش کار Comfyui-راهنمای کامل ، دسترسی به 3 مارس 2025 ، https://comfyui-wiki.com/en/tutorial/advanced/wan21-video-model
  12. WANX AI FREE: مدل تولید ویدیوی WAN 2.1 AI اکنون | Pollo AI ، دسترسی به 3 مارس 2025 ، https://pollo.ai/m/wanx-ai
  13. WAN2.1 ژنراتور ویدیویی AI-ابزار ایجاد ویدیوی منبع آزاد-Yeschat.ai ، دسترسی به 3 مارس 2025 ، https://www.yeschat.ai/features/wan-ai
  14. آزمایش رایگان! Krea مدل WAN 2.1 را راه اندازی کرد: جلوه های پویا خیره کننده و درک سریع پیچیده – AIBase ، دسترسی به 3 مارس 2025 ، https://www.aibase.com/news/15839
  15. من از تحقیقات عمیق خواستم تا بهترین شیوه ها را برای WAN 2.1 بدست آورد و این همان چیزی است که به آن بازگشت. – Reddit ، دسترسی به 3 مارس 2025 ، https://www.reddit.com/r/stablediffusion/comments/1j0zmgs/i_asked_deep_research_to_get_best_practices_for/
  16. نحوه اجرای مدل WAN 2.1-متن به ویدیو/تصویر به ویدیو VLM با استفاده از swarmui ، دسترسی به 3 مارس 2025 ، https://opentools.ai/youtube-summary/how-to-run-wan-model-text-to-video-video-vlm-vlm-using-swarmuii
  17. WAN-2.1 متن به-ویدئو | متن به فیلم | مستندات API | fal.ai ، دسترسی به 3 مارس 2025 ، https://fal.ai/models/fal-ai/wan-t2v/api
  18. WANX 2.1 و API / شیرجه به نسل بعدی ایجاد ویدیویی با WAN 2.1! – پیاپی ، دسترسی به 3 مارس 2025 ، https://piapi.ai/wanx
  19. WAN 2.1 480p تصویر به ویدیو رایگان API بدون سرور-Segmind ، دسترسی به 3 مارس 2025 ، https://www.segmind.com/models/wan2.1-i2v-480p

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا