هوش مصنوعی از عکس ویدیو میسازد
اگر به یک انسان، عکسی را نشان دهیم، او میتواند با دقت زیادی پیشبینی کند که در لحظات بعد چه اتفاقی میافتد. مثلا زنی که دوچرخهسواری میکند، به حرکتش ادامه میدهد؛ یک سگ فریزبی را میگیرد؛ مردی به زمین میخورد. این مهارت آنقدر ساده و ابتدایی است که ما حجم عظیم اطلاعات برای انجام این پیشبینیها را در نظر نمیگیریم. اما آموزش این مهارت به کامپیوترها یکی از چالشهای بزرگ هوش مصنوعی است.
محققان دانشگاه MIT در تلاششان برای حل این مشکل به نتایج شگفتانگیزی رسیدهاند. آنها به طور ویژه به شبکههای عصبی آموزش دادند تا تصاویر را به ویدیو تبدیل کنند. به این طریق، کامپیوترها میتوانند پیشبینی کنند که چه اتفاقی میافتد. این مدل آنها محدودیتهایی دارد، ویدیوهای آنها تنها چند ثانیه، بسیار کوچک و اغلب کابوسوار هستند. اما در هر حال، شاهکار جالبی از تخیل یک ماشین است و یک قدم به سمت کامپیوترهایی است که میتوانند دنیای انسانها را کمی بهتر بفهمند.
محققان با استفاده از بیش از ۲ میلیون ویدیو به شبکه عصبی آموزش دادند. این ویدیوها به چهار دسته زمین گلف، ساحل، ایستگاه قطار و بیمارستان تقسیم شده بودند. این شبکه عصبی با استفاده از این دادهها نه تنها توانست ویدیوهای کوتاهی شبیه به این صحنهها تولیدکند، بلکه با نگاه به تصاویر ثابت، ویدیوهایی تولید کرد که نشان میداد چه اتفاقی میافتد. این شبکه عصبی حدس میزند که پس از مدتی چه اتفاقی میافتد؛ البته این کار را با پیشبینی درباره نحوه تغییر پیکسلها انجام میدهد.
به راحتی میتوانیم در تصاویر بالا ببینیم که ماشین در کدام موارد نبستا دقیق عمل کرده و در کدام عکسها اشتباه کرده است. مثلا در تصویر ساحل، امواج را میبینیم که به ساحل برخورد میکنند و در ایستگاه قطار این مدل میداند که احتمالا قطار از مقابل دوربین حرکت میکند. اما در تصویر زمین گلف، نتیجه هیچ شباهتی به انسان ندارد، آنها محو و غیرواقعی هستند.
منبع: The Verge
جالب بید