سیستم تشخیص چهره چگونه کار میکند؟
بیشتر کاربران برای بهرهگیری از فیلترهای اینستاگرام و تکنولوژی فیس آیدی مشکلی با سیستم تشخیص چهره ندارند اما در هر صورت این تکنولوژی جدید میتواند تا حدی ترسناک به نظر برسد. چهره شما مانند اثر انگشت است و تکنولوژی پشت پرده این سیستم بسیار پیچیده محسوب میشود.
مانند هر تکنولوژی جدید دیگری، این سیستم هم معایبی دارد. با توجه به استقبال روزافزون نهادهایی مانند ارتش، پلیس و خالقان ویدیوهای «دیپفیک» (DeepFake) برای سوءاستفاده از این سیستم، معایب آن بیشتر به چشم میآید. حالا بیشتر از هر زمان دیگری، لازم است که کاربران با مفاهیم مربوط به سیستمهای تشخیص چهره آشنا شوند و همچنین آشنایی با محدودیتهای این تکنولوژی هم اهمیت زیادی دارد.
مبنای سیستم تشخیص چهره بسیار ساده است
سیستم تشخیص چهره برای کارهای مختلفی مورد استفاده قرار میگیرد و در ادامه به سه مورد از قابلیتهایی میپردازیم که بر مبنای این سیستم هستند و چگونگی کارکرد آنها را تا حدی توضیح میدهیم.
- تشخیص چهره ابتدایی: برای قابلیتهایی مانند انیموجی یا فیلترهای اینستاگرام، سیستم به دنبال ویژگیهای چهره مانند دو چشم، یک بینی و یک دهان میگردد. سپس با بهرهگیری از الگوریتمهای موجود، جهت حرکت چهره، باز یا بسته بودن دهان و موارد این چنینی را تشخیص میدهد. لازم به ذکر است که به چنین چیزی سیستم تشخیص چهره نمیگویند بلکه این سیستم فقط به دنبال چهرهها میگردد.
- فیس آیدی و دیگر برنامههای مشابه: برای راهاندازی فیس آیدی (و دیگر سیستمهای مشابه) ابتدا عکسهای مختلفی از چهره ثبت میشود تا فاصله بین مشخصههای موجود در چهره شناسایی شود و سپس هر بار که میخواهید گوشی را آنلاک کنید، دوربین مذکور به چهره شما نگاه میکند و در کسری از ثانیه این اطلاعات را با اطلاعات ثبت شده مقایسه میکند. در ضمن سیستمهایی مانند فیس آیدی، اطلاعات مربوط به عمق چهره را هم در نظر میگیرند و به همین خاطر دقیقتر و ایمنتر هستند.
- شناسایی افراد غریبه: زمانی که یک سازمان به هر دلیلی میخواهد از میان انبوهی از نفرات، اشخاص موردنظر خود را شناسایی کند، با بهرهگیری از الگوریتمهایی باید چهرهها را با یک پایگاه داده از چهرههای ثبت شده مقایسه کند. فرایند این موضوع تقریبا مشابه فیس آیدی ولی در ابعاد بسیار وسیعتری است. از لحاظ تئوری، هرگونه پایگاه داده شامل عکسهای مثلا کارتهای شناسایی و تصویر پروفایل فیسبوک میتواند برای این کار مورد استفاده قرار بگیرد اما بهتر است که از عکسهای کاملا واضح استفاده شود.
بیشتر سیستمهای تشخیص چهره مبتنی بر تصاویر دوبعدی هستند
همانطور که احتمالا میدانید، بیشتر سیستمهای تشخیص چهره بهطور کامل بر تصاویر دو بعدی متکی هستند. این موضوع به دقت بالای این تصاویر برنمیگردد بلکه چنین کاری بسیار سادهتر است. بیشتر گوشیهایی که از این قابلیت پشتیبانی میکنند، کاری به عمق چهره ندارند و همین موضوع برای سیستمهای تشخیص چهره عمومی هم صدق میکند.
اما چرا عکسهای دو بعدی چندان دقیق نیستند؟ چنین عکسهایی میتوانند فاصله بین دو چشم، اندازه دهان و موارد این چنینی را ارائه دهند ولی در مورد مثلا طول بینی و برآمدگی پیشانی حرفی برای گفتن ندارند. علاوه بر این، تصویربرداری دوبعدی برای اینکه بتواند کار خود را به خوبی انجام دهد به نور مرئی نیاز دارد و این یعنی در محیطهای کمنور و تاریک عملکرد قابل توجهی ندارد.
برای حل این مشکل، سیستم تشخیص چهره سهبعدی توسعه پیدا کرد. اما این سیستم چگونه کار میکند و برای تصویربرداری سهبعدی از چهره باید تجهیزات پیشرفتهای فراهم شود؟
دوربین مادون قرمز برای تصویربرداری سهبعدی از چهره
اگرچه بیشتر سیستمهای تشخیص چهره مبتنی بر تصاویر دوبعدی هستند، اما سیستمهای متکی بر تصویربرداری سهبعدی هم چندان نادر نیستند. سیستم فیس آیدی آیفون، برای این کار از پروژکتور نقطهای استفاده میکند که حدود ۳۰ هزار نقطه مادون قرمز بر چهره میتاباند و دوربین مادون قرمز مخصوصی هم این اطلاعات را دریافت میکند.
در این میان، دوربین مادون قرمز زمان رفتوبرگشت هرکدام از این نقاط نورانی را محاسبه میکند و با این کار نقشه سهبعدی دقیقی از چهره کاربر ایجاد میشود. وقتی این فناوری در کنار فناوری سنتی دو بعدی مورد استفاده قرار بگیرد، دقت آن تا حد قابل توجهی افزایش مییابد.
تصویربرداری حرارتی برای تشخیص چهره در شب
یکی از محدودیتهای تصویربرداری دو بعدی این است که برای بهرهگیری از آن به نور مرئی نیاز داریم. این یعنی در محیطهای تاریک نمیتواند از این تکنولوژی استفاده کرد ولی تصویربرداری حرارتی چنین محدودیتی ندارد. این نوع تصویربرداری هم مبتنی بر نور مادون قرمز است ولی با این تفاوت که چنین نوری از جانب دوربین منتشر نمیشود و باید یادآوری کنیم که اشیاء گرم نور مادون قرمز زیادی را ساطع میکنند که چنین نوری برای اشیاء سرد چندان دیده نمیشود. تجهیزات گرانقیمت مربوط به تصویربرداری حرارتی میتوانند کوچکترین اختلاف دمایی را در سطوح مختلف تشخیص بدهند و به همین خاطر برای تشخیص چهره تکنولوژی مؤثری محسوب میشود.
برای بهرهگیری از این سیستم میتوان از روشهای مختلفی استفاده کرد. تمام این روشها به شدت پیچیده هستند ولی شباهتهایی هم با یکدیگر دارند و در ادامه بهصورت بسیار ساده آنها را توضیح میدهیم:
- نیاز به چندین عکس: دوربین مبتنی بر تصویربرداری حرارتی، باید چندین عکس مختلف از چهره کاربر ثبت کند. هرکدام از عکسها بر طیف خاصی از نور مادون قرمز (طول موج کوتاه، متوسط و بلند) تمرکز دارد و معمولا عکسهای مبتنی بر طول موج بلند بیشترین جزییات چهره را ارائه میدهند.
- مفید بودن نقشه رگهای صورت: این تصاویر میتوانند شکل و شمایل رگهای موجود در صورت را هم تشخیص بدهند. نقشه رگهای صورت مانند نوعی اثر انگشت هستند و در صورت فقدان تصاویر شفاف، میتوانند برای اندازهگیری فاصله بخشهای مهم چهره و تشخیص زخمها و کبودیها مورد استفاده قرار بگیرند.
- شناسایی سوژه: با استفاده از این تصاویر میتوان پایگاه دادهای از تصاویر مبتنی بر نور مادون قرمز تشکیل داد و سپس مقایسه آن با پایگاه داده شامل تصاویر دوبعدی برای شناسایی افراد امکانپذیر میشود.
البته این تکنولوژی عمدتا فقط توسط ارتش مورد استفاده قرار میگیرد و چیزی نیست که انتظار ارائهی آن به گوشی را داشته باشید. علاوه بر این، تنها در محیطهای تاریک میتوان از این تکنولوژی تشخیص چهره استفاده کرد و به همین خاطر به غیر از ارتش، برای نهادهای دیگر چندان کاربردی ندارد.
محدودیتهای سیستم تشخیص چهره
همانطور که دیدید، با بهرهگیری از سیستمهای مادون قرمز و متکی بر تصویربرداری حرارتی تا حدی میتوان محدودیتهای تصویربرداری دو بعدی را پشت سر گذاشت ولی در هر حال همچنان محدودیتهای دیگری هم دیده میشود:
- پوشیدگی: همانطور که احتمالا میدانید، بهرهگیری از وسایلی مانند عینک آفتابی و کلاه تا حد زیادی میتوانند سیستم تشخیص چهره را دچار مشکل کنند.
- ژستهای مختلف: سیستم تشخیص چهره زمانی بهترین عملکرد خود را دارد، که چهره موردنظر را از زاویه مستقیم ثبت کند. چرخش سر حتی سیستمهای مبتنی بر مادون قرمز را هم دچار مشکل میکند. علاوه بر این، کارهایی مانند خندیدن و انجام دیگر کارها با صورت میتوانند دقت تشخیص را کاهش دهند.
- نور: تمام سیستمهای تشخیص چهره بر نور متکی هستند؛ حالا این نور میتواند در طیف مرئی قرار داشته باشد یا بهصورت نور مادون قرمز باشد. به همین خاطر نور محیط میتواند عملکرد آن را تحت تأثیر قرار دهد.
- پایگاه داده: بدون یک پایگاه داده مناسب، سیستم تشخیص چهره نمیتواند کار خود را انجام دهد. این پایگاه داده میتواند شامل فقط یک چهره (مثلا برای گوشی) باشد، یا اینکه از میلیونها تصویر بهره ببرد.
- پردازش داده: با توجه به اندازه و فرمت پایگاه داده، تشخیص چهرهها میتواند تا حد قابل توجهی طول بکشد. نهادهایی مانند پلیسها، برای موارد روزمره معمولا از چنین سیستمهایی استفاده نمیکنند و عمدتا برای کارهای مهم به بهرهگیری از سیستم تشخیص چهره روی میآورند.
روزبهروز سیستمهای تشخیص چهره پیشرفتهتر میشوند و در آینده نهچندان دور، احتمالا شاهد بهرهگیری از تکنولوژی سونار (فاصلهیابی صوتی) برای خلق تصویر سهبعدی چهره در محیطهای مختلف خواهیم بود و در ضمن تشخیص چهره در مکانهای عمومی مرتبا سریعتر و پیشرفتهتر میشوند. در هر صورت، این تکنولوژی در کنار مزایایی که دارد، به دولتها و نهادهای مختلف قدرت زیادی را برای سوء استفاده به ارمغان میآورد.
بیشتر بخوانید: ۶ حقیقت جالب در مورد سیستمهای تشخیص چهره
منبع: How To Geek