با هوش مصنوعی فیسبوک، نابینایان هم میبینند!
شرکت فیسبوک، ابزار جدیدی معرفی کرده که به افراد نابینا و کمبینا کمک میکند تصاویر را بیینند. در واقع منظور از «دیدن» این است که نابینایان میتوانند با توضیحی که سیستم از محتوای عکس در اختیارشان قرار میدهد دیدی کامل از تصاویر پیدا کنند.
فیسبوک میخواهد به کمک هوش مصنوعی کاری کند که کاربران نابینا و کمبینا هم بتوانند از شبکههای اجتماعی بهره ببرند. این شرکت اخیرا ابزار جدیدی را با نام Automatic Alternative Text یا AAT معرفی کرده است. این سرویس فعلا فقط در سیستم عامل iOS در دسترس است. قابلیت AAT به کمک تکنولوژی تشخیص اشیا، توضیحاتی را در مورد تصاویر تولید میکند و آنها را در اختیار نابینایان قرار میدهد.
فیسبوک چندین ماه است که روی این پروژه کار میکند. «مت کینگ» (Matt King) اولین مهندس نابینای فیسبوک چند ماه پیش به نویسندهی سایت TechCrunch گفته بود: « این روزها فیدهای خبری از تصاویر پر شدهاند؛ معمولا کاربران شرحی در مورد تصاویر مینویسند یا نظرشان را دربارهی تصاویر منتشر میکنند. اما فردی مثل من میخواهد بداند در داخل تصویر چه میگذرد.» جالب است بدانید که چند روز پیش، مایکروسافت هم یکی از باتهای هوشمند خود را در اختیار کاربران قرار داد. سرویس CaptionBot هم تقریبا کار مشابهی را انجام میدهد.
قبل از اینکه فیسبوک، AAT را معرفی کند، کاربران نابینا تنها میتوانستند به کمک نرمافزارهای Screen Reader، نام فردی که روی فیسبوک پست گذاشته را بشنوند و در بهترین حالت به پیامهای متنی کاربران گوش بدهند. اما حالا آنها میتوانند بفهمند دقیقا در تصاویر چه میگذرد.
در سیستم AAT از یک شبکهی عصبی با میلیاردها پارامتر استفاده شده. این سرویس فیسبوک که بر اساس هوش مصنوعی کار میکند، تا حالا توسط میلیونها مثال مورد سنجش قرار گرفته. این مثالها به یادگیری ماشینی کمک کردهاند.
تکنولوژی ارایهشده بهوسیلهی فیسبوک، قادر است محتوای تصاویر مربوط به حملونقل (خودرو، موتور، قایق،…)، طبیعت (محیطهای خارجی، کوه، موج، خورشید، علف،…)، ورزش (تنیس، شنا، استادیوم،…)، غذا (بستنی، سوشی، دسر،…) را بهخوبی تشخیص بدهد.
سرویس AAT فعلا برای سیستم عامل iOS در دسترس است؛ اما احتمالا بهزودی برای اندروید و همچنین وب ارایه میشود. در حال حاضر این قابلیت فقط به زبان انگلیسی میتواند محتوای تصاویر را توصیف کند. اما تیمی که روی این پروژه کار میکند قول اضافه شدن زبانهای دیگر را هم داده است.
منبع: TechCrunch
ممنون جناب زرین صدف به خاطر اطلاعرسانی عالیتون.
من به عنوان یک کاربر نابینا بیصبرانه منتظر عملیاتی شدن این سرویس در بستر وب هستم.
ادامه این روند واقعاً آزاردهندهست. آدم وقتی بین خودش و بقیه اینقدر فاصله میبینه فکر میکنه دنیا رو عوضی اومده. 🙂
ای کاش دیجیکالا و دیجیکالامگ هم به نوع خود قدمی برای این قشر برداره. من بارها از طریق مرکز تماس اعلام کردم که خبرنامه های شما بخاطر عکس بودنشون به هیچ وجه برای ما قابل رویت نیست.
منطق میگه که شما باید محتوای متنی رو در فرمتهای متنی و محتوای گرافیکی رو هم در فرمتهای خاص خودش نمایش بدید، به قول معروف هر چیزی رو برای کاری ساختن و عکس باید عکس باشه و متن هم متن. ولی متأسفانه شما عکس و متن رو توأمان در فرمتهای گرافیکی وارد میکنید که در نتیجه این کار، متن هم بخشی از عکس میشه که نرم افزارهای ما قادر به پردازشش نیست.
لطفاً این تفکیک رو قائل بشید یا اینکه متن خبرنامه رو به صورت جداگونه هم قرار بدید.
به امید روزهای بهتر.
ایده بسیار جالب و کاربردی