سیستم تشخیص چهره چگونه کار می‏کند؟

تشخیص چهره انسان از دیگر اجسام و موجودات محیط، برای کامپیوترها یک مشکل بسیار بزرگ محسوب می‏شود. علاوه‌بر این، حل این مساله نیز نیازمند تلاش و هزینه بسیار بالایی خواهد بود. امروزه تکنولوژی تشخیص چهره و بینایی کامپیوتر از اصلی‏ترین نیازهای علم و صنعت به‏شمار می‏آیند. پیشرفت بسیاری از تکنولوژی‏های امروزی از جمله خودروهای بدون راننده، نرم‏افزارهای تشخیص چهره، کارخانه‏های هوشمند که بتوانند وجود خطا و ناهماهنگی در خط تولید را تشخیص دهند و نرم‏افزارهایی که به شرکت‌های بیمه امکان پردازش و دسته‏ بندی اتوماتیک اسناد را بدهند، همگی به پیشرفت سیستم تشخیص تصویر و بینایی کامپیوتر بستگی دارند.

مبنای سیستم تشخیص چهره بسیار ساده است

سیستم تشخیص چهره برای کارهای مختلفی مورد استفاده قرار می‌گیرد و در ادامه به سه مورد از قابلیت‌هایی می‌پردازیم که بر مبنای این سیستم هستند و چگونگی کارکرد آن‌ها را تا حدی توضیح می‌دهیم.

  • تشخیص چهره ابتدایی: برای قابلیت‌هایی مانند انیموجی یا فیلترهای اینستاگرام، سیستم به دنبال ویژگی‌های چهره مانند دو چشم، یک بینی و یک دهان می‌گردد. سپس با بهره‌گیری از الگوریتم‌های موجود، جهت حرکت چهره، باز یا بسته بودن دهان و موارد این چنینی را تشخیص می‌دهد. لازم به ذکر است که به چنین چیزی سیستم تشخیص چهره نمی‌گویند بلکه این سیستم فقط به دنبال چهره‌ها می‌گردد.
  • فیس آی‌دی و دیگر برنامه‌های مشابه: برای راه‌اندازی فیس آی‌دی (و دیگر سیستم‌های مشابه) ابتدا عکس‌های مختلفی از چهره ثبت می‌شود تا فاصله بین مشخصه‌های موجود در چهره شناسایی شود و سپس هر بار که می‌خواهید گوشی را آنلاک کنید، دوربین مذکور به چهره شما نگاه می‌کند و در کسری از ثانیه این اطلاعات را با اطلاعات ثبت شده مقایسه می‌کند. در ضمن سیستم‌هایی مانند فیس آی‌دی، اطلاعات مربوط به عمق چهره را هم در نظر می‌گیرند و به همین خاطر دقیق‌تر و ایمن‌تر هستند.
  • شناسایی افراد غریبه: زمانی که یک سازمان به هر دلیلی می‌خواهد از میان انبوهی از نفرات، اشخاص موردنظر خود را شناسایی کند، با بهره‌گیری از الگوریتم‌هایی باید چهره‌ها را با یک پایگاه داده از چهره‌های ثبت شده مقایسه کند. فرایند این موضوع تقریبا مشابه فیس آی‌دی ولی در ابعاد بسیار وسیع‌تری است. از لحاظ تئوری، هرگونه پایگاه داده شامل عکس‌های مثلا کارت‌های شناسایی و تصویر پروفایل فیسبوک می‌تواند برای این کار مورد استفاده قرار بگیرد اما بهتر است که از عکس‌های کاملا واضح استفاده شود.
سیستم تشخیص چهره

بیشتر سیستم‌های تشخیص چهره مبتنی بر تصاویر دوبعدی هستند

 بیشتر سیستم‌های تشخیص چهره به‌طور کامل بر تصاویر دو بعدی متکی هستند. این موضوع به دقت بالای این تصاویر برنمی‌گردد بلکه چنین کاری بسیار ساده‌تر است. بیشتر گوشی‌هایی که از این قابلیت پشتیبانی می‌کنند، کاری به عمق چهره ندارند و همین موضوع برای سیستم‌های تشخیص چهره عمومی هم صدق می‌کند.

اما چرا عکس‌های دو بعدی چندان دقیق نیستند؟ چنین عکس‌هایی می‌توانند فاصله بین دو چشم، اندازه دهان و موارد این چنینی را ارائه دهند ولی در مورد مثلا طول بینی و برآمدگی پیشانی حرفی برای گفتن ندارند. علاوه بر این، تصویربرداری دوبعدی برای اینکه بتواند کار خود را به خوبی انجام دهد به نور مرئی نیاز دارد و این یعنی در محیط‌های کم‌نور و تاریک عملکرد قابل توجهی ندارد.

برای حل این مشکل، سیستم تشخیص چهره سه‌بعدی توسعه پیدا کرد.

سیستم تشخیص چهره

دوربین مادون قرمز برای تصویربرداری سه‌بعدی از چهره

اگرچه بیشتر سیستم‌های تشخیص چهره مبتنی بر تصاویر دوبعدی هستند، اما سیستم‌های متکی بر تصویربرداری سه‌بعدی هم چندان نادر نیستند. سیستم فیس آی‌دی آیفون، برای این کار از پروژکتور نقطه‌ای استفاده می‌کند که حدود ۳۰ هزار نقطه مادون قرمز بر چهره می‌تاباند و دوربین مادون قرمز مخصوصی هم این اطلاعات را دریافت می‌کند.

در این میان، دوربین مادون قرمز زمان رفت‌وبرگشت هرکدام از این نقاط نورانی را محاسبه می‌کند و با این کار نقشه سه‌بعدی دقیقی از چهره کاربر ایجاد می‌شود. وقتی این فناوری در کنار فناوری سنتی دو بعدی مورد استفاده قرار بگیرد، دقت آن تا حد قابل توجهی افزایش می‌یابد.

محدودیت‌های سیستم تشخیص چهره

همانطور که دیدید، با بهره‌گیری از سیستم‌های مادون قرمز و متکی بر تصویربرداری حرارتی تا حدی می‌توان محدودیت‌های تصویربرداری دو بعدی را پشت سر گذاشت ولی در هر حال همچنان محدودیت‌های دیگری هم دیده می‌شود:

  • پوشیدگی: همانطور که احتمالا می‌دانید، بهره‌گیری از وسایلی مانند عینک آفتابی و کلاه تا حد زیادی می‌توانند سیستم تشخیص چهره را دچار مشکل کنند.
  • ژست‌های مختلف: سیستم تشخیص چهره زمانی بهترین عملکرد خود را دارد، که چهره موردنظر را از زاویه مستقیم ثبت کند. چرخش سر حتی سیستم‌های مبتنی بر مادون قرمز را هم دچار مشکل می‌کند. علاوه بر این، کارهایی مانند خندیدن و انجام دیگر کارها با صورت می‌توانند دقت تشخیص را کاهش دهند.
  • نور: تمام سیستم‌های تشخیص چهره بر نور متکی هستند؛ حالا این نور می‌تواند در طیف مرئی قرار داشته باشد یا به‌صورت نور مادون قرمز باشد. به همین خاطر نور محیط می‌تواند عملکرد آن را تحت تأثیر قرار دهد.
  • پایگاه داده: بدون یک پایگاه داده مناسب، سیستم تشخیص چهره نمی‌تواند کار خود را انجام دهد. این پایگاه داده می‌تواند شامل فقط یک چهره (مثلا برای گوشی) باشد، یا اینکه از میلیون‌ها تصویر بهره ببرد.
  • پردازش داده: با توجه به اندازه و فرمت پایگاه داده، تشخیص چهره‌ها می‌تواند تا حد قابل توجهی طول بکشد. نهادهایی مانند پلیس‌ها، برای موارد روزمره معمولا از چنین سیستم‌هایی استفاده نمی‌کنند و عمدتا برای کارهای مهم به بهره‌گیری از سیستم تشخیص چهره روی می‌آورند.
سیستم تشخیص چهره

آیا مزیت های تشخیص چهره ارزش فدا کردن حریم خصوصی را دارد؟

تکنولوژی تشخیص چهره جنجال های زیادی با خود به همراه دارد و شاید هیچ فناوری دیگری به گرد پای آن نرسد. از میان تمامی تکنولوژی های بیومتریک دنیا (که البته تعدادشان هم کم نیست) هیچکدامشان مانند تشخیص چهره خودکار حاوی این حجم اطلاعات حیاتی نیستند. اما شاید این مساله تا حدودی نیز به سوابق تاریخی این فناوری مربوط باشد. مدتها قبل از آنکه تشخیص چهره مدرن چهره ها را به هویت های حقیقی پیوند بزند محققان قرن نوزدهم میلادی نظیر هاگ ولچ دیاموند روانشناس و فرانسیس گالتون ژن شناس، تئوری های شبه علمی خود در مورد شاخص های چهره را برای همه چیز (از بی گناهی تا مجرمیت) مطرح کردند. این دیدگاه های بیولوژیک تعیین کننده در ادامه توجیه بسیاری از نظریه های نژادپرستانه در سال های بعد را ممکن کردند.

و گرچه این پیش داوری را نمی توان با دقت پایین برخی تکنولوژی های تشخیص چهره در یک سطح قرار دارد اما چنین نظراتی میتواند برای مردمی که این روزها تکنولوژی مذکور را به تعصب و تبعیض علیه سیاهپوستان متهم می کنند تحریک کننده باشد.