Technologies biométriques physiques et comportementales - 8
Divers modèles et techniques utilisés en reconnaissance faciale
Ravi Das se penche sur les différents modèles et techniques de reconnaissance faciale, ainsi que sur les facteurs scientifiques et mathématiques qui les soutiennent.
L'ensemble du processus de reconnaissance faciale commence par la localisation de l'image réelle d'un visage dans un cadre défini. La présence du visage réel peut être détectée à partir de divers signaux ou déclencheurs, tels que la couleur de la peau, tout type de rotation de la tête, la présence du visage ou même la forme de la tête, ainsi que la détection et la présence des deux yeux dans le visage.
Certains des défis impliqués dans la localisation du visage dans le cadre incluent l'identification de la différenciation entre le teint et la couleur de fond, ainsi que les différentes formes du visage (en fonction bien sûr de l'angle sous lequel l'image brute est présentée au système de reconnaissance faciale). système). Lorsque le système de reconnaissance faciale est utilisé de manière secrète, par exemple dans une très grande foule, il peut être difficile de différencier de nombreuses images de visages capturées dans une seule image.
Les modèles et techniques de Reconnaissance Faciale
Pour aider à atténuer les obstacles de la reconnaissance faciale et fournir une solution dans laquelle une seule image faciale peut être détectée dans une seule image, diverses techniques ont été développées et appliquées à la reconnaissance faciale. Ces techniques se répartissent en deux catégories : basées sur l’apparence et basées sur le modèle.
- Avec les techniques de reconnaissance faciale basées sur l'apparence, un visage peut être représenté dans plusieurs vues d'objet, et il est basé sur une seule image ; Les modèles tridimensionnels ne sont jamais utilisés. Les méthodologies spécifiques ici incluent l'analyse en composantes principales (ACP) et l'analyse discriminante linéaire (LDA).
- Les techniques de reconnaissance faciale basées sur des modèles construisent et créent un modèle tridimensionnel du visage humain, et à partir de ce moment, les variations faciales peuvent être capturées par ordinateur à l'aide d'une méthodologie connue sous le nom de cartographie graphique Elastic Bunch (EBCM).
Toutes les techniques entrant dans ces deux catégories seront maintenant abordées plus en détail.
Analyse en composantes principales (ACP)
Cette technique linéaire remonte à 1988, date à laquelle elle a été utilisée pour la première fois pour la reconnaissance faciale. Cette technique utilise principalement ce que l’on appelle les « Eigenfaces ». En termes simples, les visages propres sont des images faciales spectrales bidimensionnelles, composées de caractéristiques en niveaux de gris.
Des centaines de visages propres peuvent être stockés dans la base de données d’un système de reconnaissance faciale. Lorsque des images faciales sont collectées par le système, cette bibliothèque de visages propres est placée sur les images brutes puis superposées les unes sur les autres. À ce stade, le niveau de variance entre les faces propres et les images brutes est calculé, moyenné ensemble et différents poids sont attribués.
Le résultat final est une image unidimensionnelle du visage, qui est ensuite traitée par le système de reconnaissance faciale. En termes mathématiques, la PCA est simplement une transformation linéaire dans laquelle les images faciales brutes sont converties en un système de coordonnées géométriques. Imaginez si vous voulez, un système basé sur des quadrants. Avec la technique PCA, l'ensemble de données présentant la plus grande variance se trouve sur la première coordonnée du système de quadrants (c'est également appelé première analyse en composantes principales). Ensuite, l'ensemble de données présentant la deuxième plus grande variance tombe sur la deuxième coordonnée, et ainsi de suite, jusqu'à ce que la face unidimensionnelle soit créée.
Le plus gros inconvénient de cette technique est qu’elle nécessite une image frontale complète et, par conséquent, une image complète du visage. Ainsi, toute modification d’une caractéristique du visage nécessite un recalcul complet de l’ensemble du processus Eigenface. Cependant, une approche raffinée a été développée, réduisant ainsi considérablement le temps de calcul et de traitement requis.
Analyse discriminante linéaire (LDA)
Dans cette approche linéaire, le but est de projeter le visage sur un espace vectoriel, l'objectif principal étant d'accélérer les processus de vérification et d'identification en réduisant considérablement le nombre total de traits du visage qui doivent être assortis.
Les mathématiques derrière LDA consistent à calculer les variations qui se produisent entre un seul point de données brutes à partir d'un seul enregistrement de données brutes. Sur la base de ces calculs, les relations linéaires sont ensuite extrapolées et formulées. L'un des avantages de la technique LDA est qu'elle peut effectivement prendre en compte les différences d'éclairage et les différents types d'expressions faciales qui peuvent survenir, mais une image complète du visage est néanmoins nécessaire.
Une fois la relation linéaire établie à partir des calculs de variance, les valeurs des pixels sont capturées et tracées statistiquement. Il en résulte une image brute calculée, qui est simplement une relation linéaire entre les différentes valeurs de pixels. Cette image brute s’appelle un Fisher Face. Malgré ses avantages, un inconvénient majeur de la technique LDA est qu’elle nécessite une grande base de données.
Correspondance de graphiques de groupe élastique (EBGM)
Cette technique basée sur un modèle examine les relations mathématiques non linéaires du visage, qui incluent des facteurs tels que les variations d'éclairage et les différences dans les poses et les expressions du visage. Cette technique, connue sous le nom de Gabor Wavelet Mathematics, est similaire à la technique utilisée pour la reconnaissance de l'iris.
Avec la technique EBGM, une carte faciale est créée. L'image du visage sur la carte est simplement un séquençage de graphiques, avec divers nœuds situés au niveau des caractéristiques du visage, notamment les yeux, les bords des lèvres, le bout du nez, etc. Ces caractéristiques des bords deviennent une distance bidimensionnelle. vecteurs, et pendant les processus d'identification et de vérification, divers filtres mathématiques de Gabor sont utilisés pour mesurer et calculer la variance de chaque nœud sur l'image faciale.
Ensuite, les ondelettes mathématiques de Gabor sont utilisées pour capturer jusqu'à cinq fréquences spatiales et jusqu'à huit orientations faciales différentes. Bien que la technique EBGM ne nécessite pas une image faciale complète, le principal inconvénient de cette technique est que les repères de la carte faciale doivent être marqués de manière extrêmement précise, avec une grande précision.