هوش مصنوعی ویدیویی ادوبی در دسترس کاربران قرار گرفت
ادوبی ماهها قبل از مدل هوش مصنوعی ویدیویی خود رونمایی کرد و حالا این مدل پیشرفته از طریق ابزارهای مختلفی در دسترس کاربران ادوبی قرار میگیرد.
ابزارهای جدید ادوبی: انقلابی در دنیای ویدیو
یکی از مهمترین ابزارهایی که ادوبی معرفی کرده، «Generative Extend» نام دارد که به صورت آزمایشی در نرمافزار محبوب Premiere Pro در دسترس قرار گرفته است. این ابزار به کاربران اجازه میدهد تا ابتدا یا انتهای ویدیوهایی را که کمی کوتاه هستند، گسترش دهند. علاوه بر این، امکان اعمال تغییرات در میانهی ویدیو نیز فراهم شده است که میتواند برای اصلاح مواردی مانند تغییر ناگهانی جهت نگاه یا حرکات غیرمنتظره مورد استفاده قرار گیرد.
هرچند Generative Extend در حال حاضر تنها قادر به افزودن دو ثانیه به ابتدا یا انتهای ویدیو است، اما همین مقدار نیز میتواند برای بسیاری از تدوینگران و فیلمسازان بسیار ارزشمند باشد. این ابزار میتواند نیاز به فیلمبرداری مجدد برای رفع مشکلات جزئی را از بین ببرد و در زمان و هزینهی تولید صرفهجویی قابل توجهی ایجاد کند. ویدیوهای گسترش یافته با این ابزار میتوانند در کیفیت 720p یا 1080p و با نرخ ۲۴ فریم بر ثانیه تولید شوند.
علاوه بر ویدیو، Generative Extend قابلیتهایی نیز در زمینهی صدا ارائه میدهد. این ابزار میتواند جلوههای صوتی و صدای محیط را تا ۱۰ ثانیه گسترش دهد، هرچند در حال حاضر قادر به کار با دیالوگها یا موسیقی نیست.
قدرت خلاقیت با Text-to-Video و Image-to-Video
دو ابزار دیگر که توسط ادوبی معرفی شدهاند، Text-to-Video و Image-to-Video نام دارند که در حال حاضر به صورت بتای عمومی محدود در وباپلیکیشن Firefly در دسترس قرار گرفتهاند. این ابزارها که برای اولین بار در ماه سپتامبر معرفی شدند، قابلیتهای جدیدی را در اختیار کاربران قرار میدهند.
Text-to-Video، همانطور که از نامش پیداست، به کاربران اجازه میدهد تا با وارد کردن توضیحات متنی، ویدیوهای مورد نظر خود را ایجاد کنند. این ابزار قادر است سبکهای مختلفی از جمله فیلم واقعی، انیمیشن سهبعدی و حتی استاپ موشن را شبیهسازی کند. کاربران میتوانند با استفاده از مجموعهای از «کنترلهای دوربین»، جنبههایی مانند زاویهی دوربین، حرکت و فاصلهی تصویربرداری را شبیهسازی کرده و نتایج را بیشتر بهبود بخشند.
Image-to-Video یک قدم فراتر میرود و به کاربران اجازه میدهد علاوه بر دستور متنی، یک تصویر مرجع نیز برای کنترل بیشتر بر روی نتایج اضافه کنند. ادوبی پیشنهاد میکند که از این ابزار میتوان برای ایجاد تصاویر b-roll از عکسها و تصاویر استفاده کرد یا به تجسم فیلمبرداری مجدد با آپلود یک فریم از ویدیوی موجود کمک کرد.
محدودیتها و چشمانداز آینده
با وجود قابلیتهای هیجانانگیز این ابزارها، محدودیتهایی نیز وجود دارد. در حال حاضر، حداکثر طول ویدیوهای تولید شده با Text-to-Video و Image-to-Video پنج ثانیه است و کیفیت آنها به 720p و ۲۴ فریم بر ثانیه محدود میشود. این در حالی است که رقبایی مانند OpenAI ادعا میکنند Sora، ابزار مشابه آنها، میتواند ویدیوهایی تا یک دقیقه تولید کند.
زمان تولید برای هر سه ابزار Generative Extend، Text-to-Video و Image-to-Video حدود ۹۰ ثانیه است، اما ادوبی اعلام کرده که در حال کار بر روی یک «حالت توربو» برای کاهش این زمان است.
یکی از مزایای قابل توجه ابزارهای ادوبی، امنیت تجاری آنهاست. این شرکت اعلام کرده که مدل هوش مصنوعی ویدیویی آنها با استفاده از محتوایی آموزش دیده که اجازهی استفاده از آنها را داشتهاند. این در حالی است که برخی از رقبا مانند Runway با اتهاماتی مبنی بر استفاده از هزاران ویدیوی یوتیوب برای آموزش مدلهای خود روبرو هستند.
علاوه بر این، ویدیوهای ایجاد یا ویرایش شده با استفاده از مدل ویدیویی Firefly ادوبی میتوانند با Content Credentials همراه شوند که به افشای استفاده از هوش مصنوعی و حقوق مالکیت هنگام انتشار آنلاین کمک میکند.
در حالی که هنوز مشخص نیست این ابزارها چه زمانی از مرحلهی بتا خارج خواهند شد، در دسترس بودن عمومی آنها مزیت قابل توجهی نسبت به برخی رقبا مانند Sora از OpenAI، Movie Gen از Meta و Veo از Google محسوب میشود که هنوز برای عموم قابل دسترسی نیستند.
با معرفی این ابزارها، ادوبی نشان داده که در خط مقدم نوآوری در زمینهی هوش مصنوعی و تولید محتوا قرار دارد. این پیشرفتها میتواند تأثیر عمیقی بر صنعت تولید ویدیو و محتوای دیجیتال داشته باشد و راه را برای خلاقیتهای جدید و کارآمدی بیشتر در این حوزه هموار کند.
منبع:The Verge