Aller au contenu principal

Tracking par ré-identification

Un autre moyen d'effectuer du tracking est de le faire en se basant sur la ré-identification des personnes.
En appliquant un réseau de neurones de ré-identification à chaque détection sur une image et en stockant ces données, on peut les comparer avec ce que va nous donner l'application du réseau de neurones aux nouvelles détections.
Ainsi, de même que pour le tracking prédictif, on peut appliquer un algorithme d'optimisation combinatoire pour déterminer quelles détections actuelles correspondent quelles détections précédentes.

Ce type de tracking possède l'avantage, par rapport au tracking prédictif, de pouvoir reconnaître la même personne quelque soit sa position et trajectoire sur la vidéo, voir de la détecter à nouveau alors qu'elle a disparu pendant un certain temps. Cependant, c'est une méthode bien plus lourde car il faut appliquer un réseau de neurones à chaque détection sur la vidéo, et ce en général plusieurs fois par secondes. De plus, il existe d'autres méthodes pour utiliser aussi le visuel lors du tracking sans pour autant appliquer un gros réseau de neurones. Ce n'est donc pas forcément une bonne solution dans le cadre d'un tracking avec une seule caméra.

Cependant, cette méthode devient bien meilleure dans le cadre du tracking inter-caméras. En effet, même si les angles de vue de deux caméras ne sont pas les mêmes, un réseau de neurones de ré-identification est entraîné pour arriver à reconnaître quand même une même personne détectée. En échangeant les vecteurs produits par ces réseaux, il est donc possible de reconnaître la même personne depuis plusieurs caméras.