Hunyuan3D-1 – SOTA متن باز متن به 3 بعدی و تصویر به 3 بعدی

Summarize this content to 400 words in Persian Lang
Hunyuan3D-1 – SOTA متن باز متن به 3 بعدی و تصویر به 3 بعدی – 1- روی Install کلیک کنید و از هر دو به صورت محلی در Windows و Cloud استفاده کنید – RunPod و Massed Compute
Hunyuan3D-1 – SOTA متن باز متن به 3 بعدی و تصویر به 3 بعدی – 1- روی Install کلیک کنید و از هر دو به صورت محلی در Windows و Cloud استفاده کنید – RunPod و Massed Compute
نصب کننده ها اینجا هستند: https://www.patreon.com/posts/115412205
نصب کننده های خودکار
بنابراین Hunyuan3D-1 چیست
مخزن رسمی: https://github.com/tencent/Hunyuan3D-1
Tencent Hunyuan3D-1.0: چارچوب یکپارچه برای تولید متن به سه بعدی و تصویر به سه بعدی
چکیده
در حالی که مدلهای مولد سهبعدی گردش کار هنرمندان را بسیار بهبود بخشیده است، مدلهای انتشار موجود برای نسل سه بعدی از تولید کند و تعمیم ضعیف رنج میبرند. برای پرداختن به این مشکل، ما یک رویکرد دو مرحلهای به نام Hunyuan3D-1.0 را پیشنهاد میکنیم که شامل یک نسخه ساده و یک نسخه استاندارد میشود، که هر دو از تولید مشروط متن و تصویر پشتیبانی میکنند.
در مرحله اول، ما از یک مدل انتشار چند نمایه استفاده می کنیم که به طور موثر RGB چند نمایه را در حدود 4 ثانیه تولید می کند. این تصاویر چند نمایه جزئیات غنی از دارایی سه بعدی را از دیدگاه های مختلف ثبت می کنند و کارها را از بازسازی تک نمای تا چند نمای راحت می کند. در مرحله دوم، ما یک مدل بازسازی پیشخور را معرفی میکنیم که با توجه به تصاویر چند نمای تولید شده در حدود 7 ثانیه، دارایی سه بعدی را سریع و صادقانه بازسازی میکند. شبکه بازسازی یاد می گیرد که با نویزها و ناسازگاری های معرفی شده توسط انتشار چند نمای مدیریت کند و از اطلاعات موجود از تصویر وضعیت برای بازیابی موثر ساختار سه بعدی استفاده کند.
چارچوب ما شامل مدل متن به تصویر، به عنوان مثال، Hunyuan-DiT است، که آن را به یک چارچوب یکپارچه برای پشتیبانی از تولید سه بعدی متن و تصویر شرطی شده تبدیل می کند. نسخه استاندارد ما 3 برابر پارامترهای بیشتری نسبت به مدل Lite و دیگر مدل های موجود ما دارد. Hunyuan3D-1.0 ما به تعادل قابل توجهی بین سرعت و کیفیت دست می یابد و زمان تولید را به میزان قابل توجهی کاهش می دهد و در عین حال کیفیت و تنوع دارایی های تولید شده را حفظ می کند.
Hunyuan3D-1 – SOTA متن باز متن به 3 بعدی و تصویر به 3 بعدی – 1- روی Install کلیک کنید و از هر دو به صورت محلی در Windows و Cloud استفاده کنید – RunPod و Massed Compute
Hunyuan3D-1 – SOTA متن باز متن به 3 بعدی و تصویر به 3 بعدی – 1- روی Install کلیک کنید و از هر دو به صورت محلی در Windows و Cloud استفاده کنید – RunPod و Massed Compute
نصب کننده ها اینجا هستند: https://www.patreon.com/posts/115412205
نصب کننده های خودکار
بنابراین Hunyuan3D-1 چیست
مخزن رسمی: https://github.com/tencent/Hunyuan3D-1
Tencent Hunyuan3D-1.0: چارچوب یکپارچه برای تولید متن به سه بعدی و تصویر به سه بعدی
چکیده
در حالی که مدلهای مولد سهبعدی گردش کار هنرمندان را بسیار بهبود بخشیده است، مدلهای انتشار موجود برای نسل سه بعدی از تولید کند و تعمیم ضعیف رنج میبرند. برای پرداختن به این مشکل، ما یک رویکرد دو مرحلهای به نام Hunyuan3D-1.0 را پیشنهاد میکنیم که شامل یک نسخه ساده و یک نسخه استاندارد میشود، که هر دو از تولید مشروط متن و تصویر پشتیبانی میکنند.
در مرحله اول، ما از یک مدل انتشار چند نمایه استفاده می کنیم که به طور موثر RGB چند نمایه را در حدود 4 ثانیه تولید می کند. این تصاویر چند نمایه جزئیات غنی از دارایی سه بعدی را از دیدگاه های مختلف ثبت می کنند و کارها را از بازسازی تک نمای تا چند نمای راحت می کند. در مرحله دوم، ما یک مدل بازسازی پیشخور را معرفی میکنیم که با توجه به تصاویر چند نمای تولید شده در حدود 7 ثانیه، دارایی سه بعدی را سریع و صادقانه بازسازی میکند. شبکه بازسازی یاد می گیرد که با نویزها و ناسازگاری های معرفی شده توسط انتشار چند نمای مدیریت کند و از اطلاعات موجود از تصویر وضعیت برای بازیابی موثر ساختار سه بعدی استفاده کند.
چارچوب ما شامل مدل متن به تصویر، به عنوان مثال، Hunyuan-DiT است، که آن را به یک چارچوب یکپارچه برای پشتیبانی از تولید سه بعدی متن و تصویر شرطی شده تبدیل می کند. نسخه استاندارد ما 3 برابر پارامترهای بیشتری نسبت به مدل Lite و دیگر مدل های موجود ما دارد. Hunyuan3D-1.0 ما به تعادل قابل توجهی بین سرعت و کیفیت دست می یابد و زمان تولید را به میزان قابل توجهی کاهش می دهد و در عین حال کیفیت و تنوع دارایی های تولید شده را حفظ می کند.