هوش مصنوعی کاری میکند که دیگر به هیچ ویدیویی اعتماد نکنید
هوش مصنوعی کاربردهای زیادی دارد، اما شاید بیشتر اوقات فراموش میکنیم که از این تکنولوژی میتوان برای ساخت ویدیو و صدا هم استفاده کرده؛ آن هم ویدیوهایی که ساختگی هستند، اما تفاوتی با واقعیت ندارند. فوتوشاپ کاری کرده است که نمیتوانیم دیگر به هیچ تصویری اعتماد کنیم، ولی هوش مصنوعی میتواند حتی اعتماد به دیگر حسهایمان را هم از ما بگیرد.
میتوانیم در جدیدترین مثال، به تکنولوژی جدیدی که محققان دانشگاه واشگنتن ساختهاند، اشاره کنیم. محققان توانستهاند ابزاری بسازند که فایلهای صوتی را دریافت میکند و از روی فایلهای صوتی، حرکات واقعی دهان را میسازد. سپس این حرکات دهان را روی یک ویدیوی دیگر، قرار میدهد. نتیجهی نهایی ویدیویی از کسی است که آن حرفها را نزده است.
شاید توضیح این روند، کمی سخت باشد. بهتر است قبل از هر چیز ویدیوی زیر را ببینید.
دو ویدیو از باراک اوباما کنار همدیگر قرار داده شدهاند. ویدیوی سمت چپ، منبع صدا است و ویدیوی سمت راست، از یک سخنرانی دیگر برداشته شده. الگوریتمی که محققان ساختهاند، میتواند صوت را از سمت چپ بردارد و آن را طوری روی ویدیوی سمت راست قرار دهد که انگار، شاهد همان صحبتها هستید. نتیجهی نهایی بدون نقص نیست، اما به راحتی میتوان مشکلات آن را برطرف کرد و ویدیو را به عنوان واقعیت، به مردم قالب کرد.
محققان میگویند به این دلیل از باراک اوباما به عنوان تست استفاده کردهاند، چون ویدیو از او زیاد وجود دارد و هوش مصنوعی آنها میتواند با بررسی تمام ویدیوهای اوباما، بهتر تمرین کند و یاد بگیرد. هفده ساعت ویدیو به هوش مصنوعی داده شده است. سپس هوش مصنوعی حرکات دهن اوباما را بررسی کرده و کاملا آن را بازسازی کرده است.
منبع: The Verge
خیلی جالبه و اگر خیلی دقیق نشیم نمیتونیم بفهمیم که واقعیه یا ساختگی.
اما اگر حالت چهره، بر اساس صحبت تغییر میکرد طبیعی تر بود. مثلا وقتی شخص داره فکر میکنه توی چهره و چشم ها هم اینو میدیدم نه تنها در لب ها و دهان
زیر ده ثانیه بدون برطرف کردن خطاها هم قابل قبوله
بالای ده ثانیه با کاهش کیفیت تصویر باز هم قابل قبوله
ولی دستمریزاد
با این روش میشه تاریخ رو جور دیگه ایی نوشت