El reconocimiento automático de personas mediante imágenes faciales es una tarea aún en vías de desarrollo. Mientras que esta tarea está ampliamente resuelta para imágenes faciales de alta calidad obtenidas a una corta distancia, el reconocimiento en imágenes faciales obtenidas a mayores distancias o en las que la calidad de la imagen no es buena es un tema sobre el que aún quedan grandes avances por hacer. Este Trabajo de Fin de Máster (TFM) aborda el problema del reconocimiento automático de personas mediante imágenes faciales cuando estas imágenes están tomadas a distancias considerables o sufren de condiciones adversas (resolución, ruido, iluminación, etc.). El desarrollo de este trabajo consistirá en un estudio y análisis inicial del estado del arte en cuanto al reconocimiento genérico de objetos y, más específicamente, al reconocimiento de caras de personas. El grueso del trabajo consistirá en la realización de múltiples pruebas usando unas redes neuronales conocidas como Vision Transformers (creadas recientemente por Google) para llevar a cabo el reconocimiento de sujetos mediante imágenes faciales. Para dicha tarea, se contará con una base de datos de imágenes de potenciales sospechosos que trataran de encontrarse en secuencias de vídeo grabadas en entornos controlados (e.g., iluminación, etc.) y no controlados. Buscamos alumnos con experiencia en Python, Computer Vision y Deep Learning (Keras, Tensorflow, Pytorch, …).