WAN 2.1: انقلاب ویدیویی هوش مصنوعی که خارج از این جهان است (اما هنوز هم روی رایانه شما اجرا می شود)

ek3nk4r 2025-03-03

0 5 خواندن این مطلب 7 دقیقه زمان میبرد

WAN 2.1: انقلاب ویدیویی هوش مصنوعی که خارج از این جهان است (اما هنوز هم روی رایانه شما اجرا می شود)

پیشنهاد ویژه

خرید فالوور واقعی خرید لایک اینستاگرام خرید ویو اینستاگرام خرید فالوور اینستاگرام

انسانهای همکار ، دموسین عصر دیجیتال ، آیا تا به حال به هرج و مرج چرخان اینترنت خیره شده اید و فکر کرده اید ، “خدایا ، آرزو می کنم فیلم های بیشتری از گربه ها که پیانو یا سگ های سوار بر اسکیت بازی می کردند ، وجود داشته باشد؟” خوب ، دیگر ، دیگر ، زیرا دوره جدیدی از تولید ویدیو طلوع کرده است و نام آن WAN 2.1 است.

اکنون ، من می دانم که شما چه فکر می کنید: “سعید ، این فقط یک فاضلاب دیگر نیست؟ آیا ما به اندازه کافی Deepfakes را ندیده ایم تا یک عمر دوام بیاورد؟” اما به من اعتماد کن ، این متفاوت است. WAN 2.1 فقط مربوط به تقلید از واقعیت نیست. این در مورد ایجاد واقعیت های کاملاً جدید است که فقط با تخیل شما محدود شده است (و شاید حافظه GPU شما).

به رایانه های سنتی فکر کنید به عنوان آن دستگاه های اضافه شده قدیمی ، با جدیت تعداد اعداد را خرد می کنند اما فاقد جرقه خلاقیت واقعی هستند. WAN 2.1 ، از طرف دیگر ، مانند یک داور دیجیتال داوینچی ، استاد هم منطق و هم هنری است. این می تواند فیلم هایی را از هوای نازک ایجاد کند و موسیقی متنی شما را به تصاویر پر جنب و جوش و متحرک تبدیل کند.

فهرست مطالب

چه چیزی WAN 2.1 را بسیار خاص می کند؟

این هوش مصنوعی مادربزرگ شما نیست. WAN 2.1 دارای مجموعه ای از ویژگی های پیشگامانه است که آن را از رقابت جدا می کند:

یک ماشین زمان ویدیویی: تصور کنید که یک فیلم را فشرده می کنید ، نه فقط از نظر اندازه بلکه در زمان خود. این قدرت WAN-VAE ، یک معماری انقلابی سه بعدی است که جوهر حرکت و جریان یک فیلم را ضبط می کند. این مانند داشتن یک ماشین زمان برای فیلم است ، به مدل اجازه می دهد توالی های طولانی تر و منسجم تری با راندمان بی سابقه تولید کند.
صحبت کردن در زبانها (بصری): WAN 2.1 اولین مدل ویدیویی است که می تواند متن انگلیسی و چینی را در فیلم ها تولید کند. این دنیای کاملاً جدیدی از امکانات را باز می کند ، از تولید فیلم ها با زیرنویس های چند زبانه گرفته تا ایجاد اشکال کاملاً جدید از داستان پردازی بصری. مستندهای تولید شده توسط AI را به زبان های مختلف یا فیلم های آموزشی که برای مخاطبان جهانی تهیه می شود ، روایت کنید.
سمفونی بینایی و صدا: اما صبر کنید ، چیزهای بیشتری وجود دارد! WAN 2.1 فقط تصویری ایجاد نمی کند. همچنین می تواند جلوه های صوتی هماهنگ و موسیقی پس زمینه ایجاد کند. دنیایی را تصور کنید که هوش مصنوعی می تواند موسیقی متن فیلم را کاملاً متناسب با احساسات و اقدامات آشکار روی صفحه آهنگسازی کند. این نوع تجربه همهجانبه WAN 2.1 است که قادر به ارائه است.
تسلط بر قوانین فیزیک (و رقص): WAN 2.1 فراتر از انیمیشن اساسی است ، با دقت شبیه سازی حرکت پیچیده و فیزیک دنیای واقعی. این که آیا این یک رقصنده با خوشحالی است ، یک دوچرخه سوار که در یک خیابان شلوغ حرکت می کند ، یا اشیاء در تعامل با روشی واقع بینانه ، WAN 2.1 ظرافت های حرکت را با دقت چشمگیر ضبط می کند.

چرا باید به خوانندگان توجه داشته باشد؟

از آنجا که این آینده آفرینش ویدیو است و اکنون اتفاق می افتد. WAN 2.1 منبع باز و در دسترس است ، به این معنی که توسعه دهندگان و سازندگان می توانند با آن آزمایش کنند و آن را در پروژه های خود ادغام کنند. امکانات را تصور کنید:

ابزارهای ویرایش ویدیویی AI: ویرایش فیلم ها را با سهولت متن ویرایش تصور کنید. WAN 2.1 می تواند یکپارچه اشیاء را جایگزین کند ، صحنه ها را گسترش دهد و حتی فیلم های کاملاً جدیدی تولید کند ، همه با چند دستور ساده.
محتوای ویدیوی شخصی: تصور کنید که فیلم های سفارشی متناسب با بینندگان شخصی ایجاد کنید. WAN 2.1 می تواند فیلم هایی را بر اساس ترجیحات کاربر ، جمعیت شناسی یا حتی روحیه فعلی آنها تولید کند و راه های جدیدی را برای بازاریابی و سرگرمی شخصی باز کند.
داستان پردازی تعاملی: فیلم هایی را تصور کنید که به ورودی بیننده پاسخ می دهند و یک تجربه واقعاً همهجانبه و تعاملی ایجاد می کنند. WAN 2.1 می تواند برای تولید بازی های ویدیویی پویا ، شبیه سازی های آموزشی یا حتی تاسیسات هنری تعاملی استفاده شود.

WAN 2.1 چیست؟

WAN 2.1 فقط یک مدل نیست ، بلکه مجموعه ای از چهار مدل مجزا است که هر کدام برای کارهای خاص و قابلیت های سخت افزاری طراحی شده اند:

نام مدل	وضوح	پارامترها	شرط VRAM	ویژگی های کلیدی
T2V-1.3b	480p	1.3 میلیارد	8.19 گیگابایت	سبک وزن ، درجه یک سازگار با GPU ، سرعت تولید سریع
T2V-14B	480p/720p	14 میلیارد	بالاتر	با کیفیت پیشرفته ، از تولید متن چینی و انگلیسی پشتیبانی می کند
I2V-14B-720p	720p	14 میلیارد	بالاتر	تبدیل تصویر به ویدئو در وضوح 720p
I2V-14B-480p	480p	14 میلیارد	بالاتر	تبدیل تصویر به ویدئو در وضوح 480p

Alibaba Cloud سخاوتمندانه این مدل ها را تحت مجوز Apache 2.0 منبع باز کرده است و امکان استفاده علمی و تجاری را با محدودیت های خاصی فراهم می کند. این امکان دسترسی به فناوری تولید ویدیوی هوش مصنوعی پیشرفته ، تقویت نوآوری و همکاری در زمینه های مختلف را دموکراتیک می کند.

شرح تصویر

Defing Deeper: تحقیقات پشت WAN 2.1

توسعه WAN 2.1 شامل یک فرآیند تحقیق دقیق است و مرزهای تولید ویدیوی هوش مصنوعی را تحت فشار قرار می دهد. نوآوری های کلیدی عبارتند از:

از بین بردن: این معماری رمان رمان VAE ، فشرده سازی ویدیو ، راندمان حافظه و قوام زمانی را بهبود می بخشد. این مدل به مدل اجازه می دهد تا فیلم های 1080p را از هر طول رمزگذاری و رمزگشایی کند بدون از دست دادن اطلاعات حرکتی تاریخی ، و آن را برای تولید توالی های ویدیویی طولانی تر و منسجم تر ایده آل می کند.
ترانسفورماتور انتشار با رمزگذار T5: WAN 2.1 از یک معماری ترانسفورماتور انتشار ، مشابه موارد مورد استفاده در تولید تصویر استفاده می کند ، اما با تفاوت اساسی. این یک رمزگذار T5 را در بر می گیرد و این امکان را برای درک و تولید متن به دو زبان انگلیسی و چینی فراهم می کند. این دستیابی به موفقیت امکان تولید فیلم با زیرنویس های چند زبانه را فراهم می کند و راه های جدیدی را برای داستان پردازی بصری باز می کند.

علاوه بر این ، WAN 2.1 در مجموعه داده های عظیم 1.5 میلیارد فیلم و 10 میلیارد تصویر آموزش داده شد و این امر به عملکرد چشمگیر و توانایی تولید فیلم های با کیفیت بالا کمک می کند

نحوه شروع کار با WAN 2.1

آماده گرفتن شیرجه هستید؟ در اینجا چند سیستم عامل وجود دارد که می توانید با WAN 2.1 به آن دسترسی پیدا کرده و آزمایش کنید:

صورت بغل کردن: برای شروع مدل های از پیش آموزش و نمونه های کد را پیدا کنید.
ModelsCope: یکی دیگر از سکوهای میزبان مدل های WAN 2.1.
Pollo AI: WAN 2.1 را به صورت رایگان با یک رابط کاربر پسند امتحان کنید.
Comfyui: سازنده گردش کار مبتنی بر گره که روند استفاده از WAN 2.1 را ساده می کند
Swarmui: سکویی که برای اجرای مدل های بزرگ زبان ، از جمله WAN 2.1 طراحی شده است

نتیجه گیری: جهانی از امکانات

WAN 2.1 چیزی بیش از یک مدل هوش مصنوعی است. این نگاهی اجمالی به آینده ایجاد ویدیو است. این ابزاری است که به ما این امکان را می دهد تا داستان ها را بگوییم ، تجربیات را به اشتراک بگذاریم و مرزهای خلاق جدید را کشف کنیم. همانطور که ما همچنان به مرزهای هوش مصنوعی ادامه می دهیم ، یک چیز مسلم است: آینده فیلم پویا ، همهجانبه و فقط با تصور ما محدود است. و با WAN 2.1 ، این آینده نزدیکتر از گذشته است.

منابع:

Alibaba از مدل های تولید ویدیویی WAN 2.1 AI پرده برداشت ، و به سمت سورا Operform Openi Openai ، دسترسی پیدا کرد ، در 3 مارس 2025 ، https://www.businesstoday.in/technology/news/story/alibaba-unveils-wan-21-ai-video- generation-models-claming-toperform-openais-sora-2025-02-28-028-028-028-028-028
یک راهنمای مبتدی برای مدل WAN-2.1-T2V-480P توسط Wavespeedai در تکرار ، دسترسی به 3 مارس 2025 ، https://dev.to/mikeyoung44/a-beginners-guide-to-the-wan-van-480p-model-model-model-model-by-wavespeedai-n-n-ne29b
Alibaba از WAN 2.1 پرده برداری می کند: یک مدعی منبع باز در تولید ویدیو-opentools.ai ، دسترسی به 3 مارس 2025 ، https://opentools.ai/news/alibaba-unveils-wan-n-an-open-source-contender-in-pindeo-generation
Alibaba مدل تولید ویدیوی منبع باز 2.1 ، Outperforms Openai's Sora-Magazine Analytics India ، دسترسی به 3 مارس 2025 ، https://analyticsindiamag.com/ai-newsupdates-preleases-source-video-genera-modelwan-modelwan-d-penera-d-penais-penais-penais-penais-penais-penais-penais-penais-penais-penais-penais-pena-source–sourreleases-pena-sourreleases-mode–sourreleases-modiamag.
Medium.com ، دسترسی به 3 مارس 2025 ، https://medium.com/@cognidownunder/wan-2-1-alibabas-open-source-source-text-video-model-hanges-every-ed1dc4c19f85#:text=wan٪202.1٪20T202202202202202202202202202202
Alibaba با انتشار منبع باز 2.1 مجموعه مدل های تولید ویدیویی هوش مصنوعی ، ادعا کرد که از سورا Openi-Openai بهتر است | اخبار فناوری-Getgets 360 ، دسترسی به 3 مارس 2025 ، https://www.gadgets360.com/ai/news/alibaba-wan-2-1-ai-vide-models-source-source-penai-sora-sora-sora-sora-sora-sora-7807308073080730807308073080730807303
Wan2.1: Best open-sourced AI Video generation model, beats OpenAI Sora – Medium, accessed March 3, 2025, https://medium.com/data-science-in-your-pocket/wan2-1-best-open-sourced-ai-video-generation-model-beats-openai-sora-6ea081cbb8f8
WAN2.1: یک مدل هوش مصنوعی منبع باز از Sora | توسط novita ai | فوریه 2025-متوسط ، دسترسی به 3 مارس 2025 ، https://medium.com/@marketing_novita.ai/WAN2-1-An-Open-Source-Ai-OutperForms-5a7Dbe18a66a
Alibaba's New WAN 2.1 Text-to-Video AI باورنکردنی است-BGR ، دسترسی به 3 مارس 2025 ، https://bgr.com/tech/alibabas-new-ضچه-1–1–1-to –video-i-is-unbelievable/
Alibaba باعث می شود Generator Video WAN 2.1 رایگان برای استفاده-PetApixel ، دسترسی به 3 مارس 2025 ، https://petapixel.com/2025/02/26/alibaba-ai-ai-video-generator-2-1-1le-equest-te-use//
WAN2.1 گردش کار Comfyui-راهنمای کامل ، دسترسی به 3 مارس 2025 ، https://comfyui-wiki.com/en/tutorial/advanced/wan21-video-model
WANX AI FREE: مدل تولید ویدیوی WAN 2.1 AI اکنون | Pollo AI ، دسترسی به 3 مارس 2025 ، https://pollo.ai/m/wanx-ai
WAN2.1 ژنراتور ویدیویی AI-ابزار ایجاد ویدیوی منبع آزاد-Yeschat.ai ، دسترسی به 3 مارس 2025 ، https://www.yeschat.ai/features/wan-ai
آزمایش رایگان! Krea مدل WAN 2.1 را راه اندازی کرد: جلوه های پویا خیره کننده و درک سریع پیچیده – AIBase ، دسترسی به 3 مارس 2025 ، https://www.aibase.com/news/15839
من از تحقیقات عمیق خواستم تا بهترین شیوه ها را برای WAN 2.1 بدست آورد و این همان چیزی است که به آن بازگشت. – Reddit ، دسترسی به 3 مارس 2025 ، https://www.reddit.com/r/stablediffusion/comments/1j0zmgs/i_asked_deep_research_to_get_best_practices_for/
نحوه اجرای مدل WAN 2.1-متن به ویدیو/تصویر به ویدیو VLM با استفاده از swarmui ، دسترسی به 3 مارس 2025 ، https://opentools.ai/youtube-summary/how-to-run-wan-model-text-to-video-video-vlm-vlm-using-swarmuii
WAN-2.1 متن به-ویدئو | متن به فیلم | مستندات API | fal.ai ، دسترسی به 3 مارس 2025 ، https://fal.ai/models/fal-ai/wan-t2v/api
WANX 2.1 و API / شیرجه به نسل بعدی ایجاد ویدیویی با WAN 2.1! – پیاپی ، دسترسی به 3 مارس 2025 ، https://piapi.ai/wanx
WAN 2.1 480p تصویر به ویدیو رایگان API بدون سرور-Segmind ، دسترسی به 3 مارس 2025 ، https://www.segmind.com/models/wan2.1-i2v-480p