هوش مصنوعی از عکس ویدیو می‌سازد

زهرا غلامی

۱۹ فروردین ۱۳۹۸ | ۱۱:۳۸ زمان مورد نیاز برای مطالعه: ۱ دقیقه

اگر به یک انسان، عکسی را نشان دهیم، او می‌تواند با دقت زیادی پیش‌بینی کند که در لحظات بعد چه اتفاقی می‌افتد. مثلا زنی که دوچرخه‌سواری می‌کند، به حرکتش ادامه می‌دهد؛ یک سگ فریزبی را می‌گیرد؛ مردی به زمین می‌خورد. این مهارت آنقدر ساده و ابتدایی است که ما حجم عظیم اطلاعات برای انجام این پیش‌بینی‌ها را در نظر نمی‌گیریم. اما آموزش این مهارت به کامپیوتر‌ها یکی از چالش‌های بزرگ هوش مصنوعی است.

محققان دانشگاه MIT در تلاش‌شان برای حل این مشکل به نتایج شگفت‌انگیزی رسیده‌اند. آنها به طور ویژه به شبکه‌های عصبی آموزش دادند تا تصاویر را به ویدیو تبدیل کنند. به این طریق، کامپیوترها می‌توانند پیش‌بینی کنند که چه اتفاقی می‌افتد. این مدل آنها محدودیت‌هایی دارد، ویدیوهای آنها تنها چند ثانیه، بسیار کوچک و اغلب کابوس‌وار هستند. اما در هر حال، شاهکار جالبی از تخیل یک ماشین است و یک قدم به سمت کامپیوترهایی است که می‌توانند دنیای انسان‌ها را کمی بهتر بفهمند.

محققان با استفاده از بیش از ۲ میلیون ویدیو به شبکه عصبی آموزش دادند. این ویدیوها به چهار دسته زمین گلف، ساحل، ایستگاه قطار و بیمارستان تقسیم شده بودند. این شبکه عصبی با استفاده از این داده‌ها نه تنها توانست ویدیوهای کوتاهی شبیه به این صحنه‌ها تولیدکند، بلکه با نگاه به تصاویر ثابت، ویدیوهایی تولید کرد که نشان می‌داد چه اتفاقی می‌افتد. این شبکه عصبی حدس می‌زند که پس از مدتی چه اتفاقی می‌افتد؛ البته این کار را با پیش‌بینی درباره نحوه تغییر پیکسل‌ها انجام می‌دهد.

به راحتی می‌توانیم در تصاویر بالا ببینیم که ماشین در کدام موارد نبستا دقیق عمل کرده و در کدام عکس‌ها اشتباه کرده است. مثلا در تصویر ساحل، امواج را می‌بینیم که به ساحل برخورد می‌کنند و در ایستگاه قطار این مدل می‌داند که احتمالا قطار از مقابل دوربین حرکت می‌کند. اما در تصویر زمین گلف، نتیجه هیچ شباهتی به انسان ندارد، آنها محو و غیرواقعی هستند.

منبع: The Verge

برچسب‌ها : کامپیوتر هوش مصنوعی یادگیری ماشینی