A Comparative Study of Deep Learning Based Face Recognition Algorithms for Video Under Adverse Conditions

Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği (İngilizce) Anabilim Dalı, Türkiye

Tezin Onay Tarihi: 2019

Tezin Dili: İngilizce

Öğrenci: GALİP PALA

Danışman: Çiğdem Eroğlu Erdem

Özet:

DERİN ÖĞRENME TABANLI YÜZ TANIMA YÖNTEMLERİNİN ZORLAYICI KOŞULLAR ALTINDAKİ VİDEOLAR İÇİN PERFORMANS KARŞILAŞTIRILMASI Yüz tanıma, bilgisayarlı görüde birçok uygulama alanı alan önemli bir problemdir. Son zamanlarda, litaratürde büyük resim ve video veritabanlarında yüksek başarım, önemli sonuçlar gösteren, derin öğrenme tabanlı yüz tanıma ve doğrulama metotları önerilmiştir. Her ne kadar bu büyük veri tabanları derin öğrenme mimarilerinin, eğitim ve testi için kullanılırlar ve ifade varyasyonları, baş pozisyonu ve aydınlatma içerirlerse de bulanıklık ve düşük çözünürlük gibi zor bozulmaları her zaman yansıtmazlar. Bu çalışmada, amacımız, zorlayıcı şartlar altındaki videoları kullanarak, yüz tanıma için yakın zamanda geliştirilmiş derin öğrenme tabanlı yöntemleri sistematik olarak karşılaştırmaktır. Openface, VGGFace2 ve Arcface olmak üzere 3 farklı derin öğrenme modelini değerlendirilmiştir. UvA-NEMO video veri setinde elde edilen sonuçlar, en başarılı derin öğrenme tabanlı yüz tanıma yöntemlerinin dahi gürültü, bulanıklık, kontrast gibi zorlu bozulmalarda düşük performans verdiğini gösterdi. -------------------- A COMPARATIVE STUDY OF DEEP LEARNING BASED FACE RECOGNITION ALGORITHMS FOR VIDEO UNDER ADVERSE CONDITIONS Face identification is an important problem in computer vision, which has many application areas. Recently, a number of deep-learning-based face identification and verification methods have been proposed in the literature, which demonstrate remarkable results on large image and video databases. Although the databases used for training and testing deep-learning architectures contain expression variations, head pose and illumination and they do not reflect the difficult distortions (such as blur and low resolution), which may be encountered when using data from various sources (e.g. surveillance cameras). In this work, our goal is to systematically compare the performance of recent deep-learning-based methods for face identification using video under challenging conditions. We evaluate three deep learning architectures OpenFace, VGGFace2 and ArcFace. The experimental results on the UvA-NEMO video dataset indicate that even the most successful deep-learning based face identification methods show poor performance under challenging distortions on the images such as noise, blur and contrast variations.