Título

Detección automática y seguimiento de personas utilizando fusión de secuencias de imágenes multimodales

Autor

METZLI RAMIREZ MARTINEZ

Colaborador

LEOPOLDO ALTAMIRANO ROBLES (Asesor de tesis)

Nivel de Acceso

Acceso Abierto

Resumen o descripción

This thesis presents the development of a method for automatic detection and tracking of multiple people for images sequences captured at 4 fps, in exterior environments, with no controlled illumination, with presence of uniformed people and with occlusion. This group of characteristics was selected because recently it has been noted that the big variety of scenes and circumstances that occur in different environments are a big challenge when we speak about to create global methods of people tracking (i.e. methods that work for all kind of circumstances). Consequently, at the present it is opting by create methods of tracking specialized for each environment; this achieves better results than with a global method. For that reason, the tracking methods for institutional environments, like hospitals, schools, laboratories, sport associations, military camps, etc., have to be suitable for working with the image sequences with the characteristics described above, looking for satisfying a specific necessity.

The developed method is based in the sequences fusion of infrared and visual images, this involve a pre-processing that include the calibration of both kind of cameras and the images registration, this pre-processing also is described along the thesis. For the automatic detection, HOG [1] method was implemented for each kind of image independently, and later both results were fused in a global result. Finally, for the tracking stage a model of characteristics was designed and with this model a comparison between the people in the scene was made, to after that identify and determine the people positions and their trajectories along the image sequence.

The developed method has a true positives rate of 74.5% for image sequences with a high grade of difficulty, described above. Our method was compared with the method [2] and we obtained better results by 9.2%. The method [2] was tested previously with images sequences captured at 30 fps, in interior environments, with light changes and changes in the objects position, and it showed a miss rate of only 1%. This show the unlike complexity between the test sequences.

Esta tesis presenta el desarrollo de un método de detección automática y seguimiento de múltiples personas para secuencias de imágenes capturadas a una tasa de 4 fps, en ambientes exteriores con iluminación no controlada, con presencia de personas uniformadas y que presentan oclusión entre sí. Este conjunto de características fue elegido debido a que actualmente se ha notado que la gran variedad de escenarios y circunstancias que pueden ocurrir en diferentes entornos presentan un gran reto en cuanto a crear métodos globales de seguimiento de personas, es decir que funcionen bajo todo tipo de circunstancias, por lo cual actualmente se está optando por generar métodos de seguimiento especializados para cada ambiente, logrando mejores resultados que si se plantea hacer un método global. Es por eso que los métodos de seguimiento en ambientes institucionales, como lo son hospitales, escuelas, laboratorios, asociaciones deportivas, campos militares, entre otros, deben ser aptos para trabajar con secuencias de imágenes con las características antes descritas. Buscando solucionar de esta forma una necesidad específica.

El método desarrollado está basado en la fusión de las secuencias de imágenes infrarrojas y visuales, lo cual implica un preprocesamiento que incluye la calibración de ambas modalidades de cámaras y el registro de las imágenes, dicho preprocesamiento también es descrito a lo largo de la tesis. Para la detección automática se implementó el método HOG [1] de forma independiente para cada tipo de imagen y posteriormente se fusionan ambos resultados obteniendo un resultado global. Finalmente, para la etapa de seguimiento se diseñó un modelo de características a partir del cual se realiza una comparación entre las personas en la escena, para posteriormente identificarlas y determinar su posición y trayectoria seguida a lo largo de la secuencia.

El método desarrollado obtuvo una tasa de 74.5% de verdaderos positivos para secuencias de imágenes con un alto grado de dificultad, descritas anteriormente. Se comparó con el método [2] superándolo en promedio por un 9.2%. Cabe mencionar que el método [2] probado anteriormente con secuencias de imágenes capturadas a 30 fps, en ambientes interiores, con cambios de iluminación y cambios en la posición de los objetos, mostro una tasa de perdida de tan solo 1%, lo cual muestra la diferencia de complejidad entre las secuencias de prueba.

Editor

Instituto Nacional de Astrofísica, Óptica y Electrónica

Fecha de publicación

noviembre de 2013

Tipo de publicación

Tesis de maestría

Versión de la publicación

Versión aceptada

Formato

application/pdf

Idioma

Español

Audiencia

Estudiantes

Investigadores

Público en general

Sugerencia de citación

Ramirez-Martinez M.

Repositorio Orígen

Repositorio Institucional del INAOE

Descargas

4953

Comentarios



Necesitas iniciar sesión o registrarte para comentar.