هوش مصنوعی ویدیویی ادوبی در دسترس کاربران قرار گرفت

یوسف اسفندیاری

۲۴ مهر ۱۴۰۳ | ۰۸:۰۰ زمان مورد نیاز برای مطالعه: ۳ دقیقه

ادوبی ماه‌ها قبل از مدل هوش مصنوعی ویدیویی خود رونمایی کرد و حالا این مدل پیشرفته از طریق ابزارهای مختلفی در دسترس کاربران ادوبی قرار می‌گیرد.

ابزارهای جدید ادوبی: انقلابی در دنیای ویدیو

یکی از مهم‌ترین ابزارهایی که ادوبی معرفی کرده، «Generative Extend» نام دارد که به صورت آزمایشی در نرم‌افزار محبوب Premiere Pro در دسترس قرار گرفته است. این ابزار به کاربران اجازه می‌دهد تا ابتدا یا انتهای ویدیوهایی را که کمی کوتاه هستند، گسترش دهند. علاوه بر این، امکان اعمال تغییرات در میانه‌ی ویدیو نیز فراهم شده است که می‌تواند برای اصلاح مواردی مانند تغییر ناگهانی جهت نگاه یا حرکات غیرمنتظره مورد استفاده قرار گیرد.

هرچند Generative Extend در حال حاضر تنها قادر به افزودن دو ثانیه به ابتدا یا انتهای ویدیو است، اما همین مقدار نیز می‌تواند برای بسیاری از تدوینگران و فیلمسازان بسیار ارزشمند باشد. این ابزار می‌تواند نیاز به فیلمبرداری مجدد برای رفع مشکلات جزئی را از بین ببرد و در زمان و هزینه‌ی تولید صرفه‌جویی قابل توجهی ایجاد کند. ویدیوهای گسترش یافته با این ابزار می‌توانند در کیفیت 720p یا 1080p و با نرخ 24 فریم بر ثانیه تولید شوند.

علاوه بر ویدیو، Generative Extend قابلیت‌هایی نیز در زمینه‌ی صدا ارائه می‌دهد. این ابزار می‌تواند جلوه‌های صوتی و صدای محیط را تا 10 ثانیه گسترش دهد، هرچند در حال حاضر قادر به کار با دیالوگ‌ها یا موسیقی نیست.

قدرت خلاقیت با Text-to-Video و Image-to-Video

دو ابزار دیگر که توسط ادوبی معرفی شده‌اند، Text-to-Video و Image-to-Video نام دارند که در حال حاضر به صورت بتای عمومی محدود در وب‌اپلیکیشن Firefly در دسترس قرار گرفته‌اند. این ابزارها که برای اولین بار در ماه سپتامبر معرفی شدند، قابلیت‌های جدیدی را در اختیار کاربران قرار می‌دهند.

Text-to-Video، همانطور که از نامش پیداست، به کاربران اجازه می‌دهد تا با وارد کردن توضیحات متنی، ویدیوهای مورد نظر خود را ایجاد کنند. این ابزار قادر است سبک‌های مختلفی از جمله فیلم واقعی، انیمیشن سه‌بعدی و حتی استاپ موشن را شبیه‌سازی کند. کاربران می‌توانند با استفاده از مجموعه‌ای از «کنترل‌های دوربین»، جنبه‌هایی مانند زاویه‌ی دوربین، حرکت و فاصله‌ی تصویربرداری را شبیه‌سازی کرده و نتایج را بیشتر بهبود بخشند.

Image-to-Video یک قدم فراتر می‌رود و به کاربران اجازه می‌دهد علاوه بر دستور متنی، یک تصویر مرجع نیز برای کنترل بیشتر بر روی نتایج اضافه کنند. ادوبی پیشنهاد می‌کند که از این ابزار می‌توان برای ایجاد تصاویر b-roll از عکس‌ها و تصاویر استفاده کرد یا به تجسم فیلمبرداری مجدد با آپلود یک فریم از ویدیوی موجود کمک کرد.

محدودیت‌ها و چشم‌انداز آینده

با وجود قابلیت‌های هیجان‌انگیز این ابزارها، محدودیت‌هایی نیز وجود دارد. در حال حاضر، حداکثر طول ویدیوهای تولید شده با Text-to-Video و Image-to-Video پنج ثانیه است و کیفیت آن‌ها به 720p و 24 فریم بر ثانیه محدود می‌شود. این در حالی است که رقبایی مانند OpenAI ادعا می‌کنند Sora، ابزار مشابه آن‌ها، می‌تواند ویدیوهایی تا یک دقیقه تولید کند.

زمان تولید برای هر سه ابزار Generative Extend، Text-to-Video و Image-to-Video حدود 90 ثانیه است، اما ادوبی اعلام کرده که در حال کار بر روی یک «حالت توربو» برای کاهش این زمان است.

یکی از مزایای قابل توجه ابزارهای ادوبی، امنیت تجاری آن‌هاست. این شرکت اعلام کرده که مدل هوش مصنوعی ویدیویی آن‌ها با استفاده از محتوایی آموزش دیده که اجازه‌ی استفاده از آن‌ها را داشته‌اند. این در حالی است که برخی از رقبا مانند Runway با اتهاماتی مبنی بر استفاده از هزاران ویدیوی یوتیوب برای آموزش مدل‌های خود روبرو هستند.

علاوه بر این، ویدیوهای ایجاد یا ویرایش شده با استفاده از مدل ویدیویی Firefly ادوبی می‌توانند با Content Credentials همراه شوند که به افشای استفاده از هوش مصنوعی و حقوق مالکیت هنگام انتشار آنلاین کمک می‌کند.

در حالی که هنوز مشخص نیست این ابزارها چه زمانی از مرحله‌ی بتا خارج خواهند شد، در دسترس بودن عمومی آن‌ها مزیت قابل توجهی نسبت به برخی رقبا مانند Sora از OpenAI، Movie Gen از Meta و Veo از Google محسوب می‌شود که هنوز برای عموم قابل دسترسی نیستند.

با معرفی این ابزارها، ادوبی نشان داده که در خط مقدم نوآوری در زمینه‌ی هوش مصنوعی و تولید محتوا قرار دارد. این پیشرفت‌ها می‌تواند تأثیر عمیقی بر صنعت تولید ویدیو و محتوای دیجیتال داشته باشد و راه را برای خلاقیت‌های جدید و کارآمدی بیشتر در این حوزه هموار کند.