منبع:
بتنی بر هوش مصنوعی، در کوتاهترین زمان اقدام به تبدیل متن به ویدیو کنند.
اگرچه برای استفاده از ابزارهای تبدیل متن به ویدیو با هوش مصنوعی، نیاز به مهارت خاص یا تجربه قبلی وجود ندارد؛ اما با تسلط بر دستورات ورودی، محدودیتها و قابلیتهای هر سرویس، میتوانید نتیجه بهتری را در اختیار داشته باشید. در پایین به تعدادی از بهترین هوش مصنوعی های تبدیل متن به ویدیو اشاره شده است؛ اگرچه گزینههای موجود در این حوزه به صورت پیوسته در حال افزایش است و با جستجو میتوانید ابزارهای متعدد دیگری را هم پیدا کنید.
۱. هوش مصنوعی نوشتار به ویدئو Kaiber
سرویس Kaiber یکی از گزینههای مطرح در زمینه خود به شمار میرود که با استفاده از یادگیری ماشینی و پردازش انبوهی از فریمها، آموزش دیده است. برای استفاده از این سرویس، میتوانید به نسخه تحت وب به آدرس
مراجعه کنید و پس از ثبتنام و تایید هویت از طریق ایمیل، به امکانات مختلف دسترسی داشته باشید. حداقل و حداکثر طول ویدئوهای ساخته شده توسط کایبر، به ترتیب ۵ و ۳۰ ثانیه است.
هوش مصنوعی تبدیل نوشتار به ویدیو Kaiber
کاربران میتوانند هنگام استفاده از Kaiber، اقدام به تبدیل مستقیم متن به ویدیو نمایند؛ با این حال، گزینه اختصاصی برای آپلود عکس نیز در این پلتفرم درنظر گرفته شده است که به کمک آن، میتوان پیشزمینهای برای فریمهای خروجی و حالوهوای ویدئو، تعیین نمود. هوش مصنوعی قادر خواهد بود از تصویر بارگذاری شده توسط کاربر به عنوان ایده اولیه، بهره بگیرد و ویدئو نهایی را حول آن ایجاد کند. امکان انتخاب استایلهای مختلف، یکی دیگر از نقاط قوت این سرویس است که گزینههای پیشروی کاربران را افزایش میدهد.
۲. ساخت آواتارهای سخنگو با Deep Brain/h2>
سایت
گزینه مناسبی برای تولیدکنندگان محتوا است که قصد دارند یک سناریو را بدون نیاز به
فیلمبرداری برای مخاطبین خود در قالب یک ویدئو، بازگو نمایند. همچنین اگر علاقهمند به ساخت ویدئوهای یوتیوب هستید، اما از امکانات لازم مانند دوربین، نورپردازی و پرده سبز برای تولید محتوا بهرهمند نیستید، میتوانید از سایت گفته شده، کمک بگیرید.
سرویس Deep Brain چندین آواتار گوناگون را درون خود جای داده است که کاربران میتوانند متن دلخواه خود را از طریق آنها، بازگو نمایند. متاسفانه تبدیل متن فارسی به ویدیو با هوش مصنوعی دیپ برین فعلاً امکانپذیر نیست؛ اما احتمال دارد در آینده شاهد پشتیبانی از زبان فارسی نیز در داخل پلتفرم مذکور باشیم.
۳. هوش مصنوعی تبدیل متن به ویدیو ModelScope
سروی
modelscope-text-to-video-synth…
ModelScope محصولی از غول بزرگ فناوری چین، علی بابا، است که امکان اجرای آن توسط کاربران روی رایانه
یا بهرهمندی از نسخه تحت وب وجود دارد. این مدل براساس Diffusion ساخته شده و با استفاده از ۱.۷ میلیارد پارامتر، آموزش یافته است. البته در مقایسه با نمونههای رقیب، محدودیتهای متعددی از جمله مدت کوتاه ویدئوها (تنها ۲ ثانیه) یا درج واترمارک روی خروجی در ModelScope به چشم میخورد.
برای دسترسی به فایلهای مورد نیاز برای اجرای ModelScope میتوانید به صفحه اختصاصی آن در گیتهاب، مراجعه کنید. با توجه به محدودیتهای گفته شده، نمیتوان کاربردهای چندانی را برای خروجیهای این مدل، متصور شد و بیشتر جنبه سرگرمی و آشنایی با یادگیری ماشینی و دستورات ورودی هوش مصنوعی را دارد.
Zeroscope یکی از مدلهای ساخته شده برمبنای ModelScope است که از محتوای بیشتری برای تعلیم آن استفاده شده است. به همین دلیل عملکرد آن در مقایسه با نسخه اصلی خود، کمی بهتر است و میتواند ویدئوهایی با حداکثر رزولوشن ۱۰۲۴ در ۵۷۶ پیکسل به کاربران ارائه کند. زیروسکوپ از دو زیر مدل تشکیل شده است که مدل V2_576w برای ساخت ویدئوها از دستورات کاربر و مدل V2_XL برای افزایش رزولوشن خروجی، کاربرد دارند و به ترتیب ۸ و ۱۶ گیگابایت حافظه گرافیکی (VRAM) جهت اجرا نیاز خواهند داشت. از طریق
این لینک
میتوانید اقدام به استفاده از مدل گفته شده به صورت رایگان و بدون واترمارک، نمایید که
خروجی با نسبت تصویر ۱۶ به ۹ را فراهم میسازد.