Instituto Polit�cnico Nacional
Instituto Politécnico Nacional
"La Técnica al Servicio de la Patria"

Boletín No. 73
1o. de julio de 2019




CONSIDERACIONES PRÁCTICAS DE UN MODELO LINEAL PARA LA CORRESPONDENCIA DE IMÁGENES DIGITALES

 

Escárcega Martínez Enrique Santos
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
Anzueto Ríos Álvaro
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Laboratorio de Biomecánica
UPIITA Instituto Politécnico Nacional

 

Resumen

En este trabajo se desarrolla un modelo lineal para la correspondencia de puntos en el espacio, entre pixeles de imágenes secuenciales. Se construyó un sistema mecánico que permite la captura de imágenes, tomando como referencia un punto denominado pivote que se encuentra en el eje axial de la cámara. Se presentan los resultados obtenidos y se describen consideraciones para trabajos futuros.

 

 

Introducción

 

La correspondencia espacial entre pixeles, en imágenes secuenciales o juego de imágenes, es un procedimiento que tiene como objetivo establecer correspondencias de los puntos en el espacio a su posición en diferentes imágenes, es decir, un punto en el espacio puede encontrarse en diferentes imágenes que sean consecutivas.

Esta correspondencia es empleada en varias aplicaciones de visión artificial, por ejemplo, la estabilización de imagen [81], la construcción de imágenes en alta resolución y/o la construcción de imágenes panorámicas (técnica conocida como “Stitching”) [181].

Es posible definir el problema de la correspondencia o también llamado registro de imágenes, como la búsqueda de una transformación matemática que permita mapear las coordenadas de los elementos en una imagen hacia las coordenadas del elemento correspondiente en otra imagen (representado por un traslape).

Actualmente existe un marco de trabajo desarrollado que no solamente trata los problemas del ajuste, sino que, ahonda en problemáticas posteriores. Sin embargo, los fundamentos básicos del ajuste pocas veces son desarrollados como parte de modelos enteramente geométricos, y transformaciones lineales elementales, además, de que carecen de una descripción sobre las problemáticas prácticas que surgen de los modelos lineales y los resultados a los cuales es posible llegar.

 

Modelo para ajuste de imágenes en movimiento rotacional de la cámara con pivote fijo

 

El esquema geométrico de un problema particular, en el ajuste de imágenes que han sufrido movimiento rotacional sobre un pivote fijo, se establece en el esquema de la Figura 1.

 

Figura 1. Esquema geométrico. a) Perspectiva de toma frontal desde el punto pivote. b) Perspectiva superior al sistema de captura de imágenes.

 

Sistema de adquisición de imágenes

 

Se construyó un sistema que permite generar una secuencia de imágenes que tienen como punto de referencia un pivote en el eje axial de la cámara, como se muestra en la Figura 2.

La cámara que se utilizo es de la marca Logitech® modelo C170, cuyas especificaciones se muestran en la Tabla 1.

 

Figura 2. Esquema conceptual del sistema de adquisición de imágenes construido.

 

 

Tabla 1. Especificaciones técnicas de la cámara utilizada.

 

Podemos definir una secuencia de imágenes obtenida por el sistema descrito anteriormente dentro del conjunto:

 

 

Donde n es el número de tomas necesarias para lograr un giro completo sobre el pivote Pv.

Para el proceso de alineación se trabaja con un subconjunto de dos imágenes, al resto de las imágenes se les aplica el mismo procedimiento:

 

 

Correspondencia mediante modelo lineal

 

La propuesta de ajuste para la secuencia de imágenes se construye a partir de las siguientes observaciones realizadas sobre el subconjunto definido por k=4 de un conjunto en el cual se añadió como referencia una cinta graduada, Figura 4.

 

Figura 4.Subconjunto de tomas k=4 a) Imagen 3 b) Imagen 4

 

  • Se considera el desplazamiento sobre la horizontal del elemento k – 1, del conjunto de imágenes, con lo cual, se logra la superposición mostrada en la imagen de salida, figura 5. Sin embargo, es necesario considerar un parámetro de profundidad que ajuste la inclinación que sufre la segunda imagen; si consideramos ambas imágenes como un plano; el plano de la segunda imagen se incrusta en el plano de la primera imagen, generando con esto un error de perspectiva en la profundidad.
  • El primer modelo propuesto no soluciona el error mostrado en el rectángulo rojo, desplazamiento vertical.

 

Figura 5. Imagen de salida con región de interés resaltada.

 

Se propone obtener una transformación lineal de la forma:

 

 

Los parámetros m y b, se obtuvieron a partir de una medición manual de los puntos de referencia mostrados en la Figura 6.

 

Figura 6. Extracción de características.

 

Para cada punto de referencia obtuvimos los datos mostrados en la Tabla 2 y Tabla 3.

 

 

 

 

El desplazamiento horizontal que se aplicara, se determina a partir de la coordenada horizontal del punto

De la imagen en el subconjunto k-1 se procesan los pixeles a partir de:

 

 

Calculamos el parámetro “m”, en el cual es necesario considerar la diferencia entre los cálculos de una imagen y la siguiente en la secuencia:

 

 

A partir de la formula punto pendiente obtenemos la ecuación general de la recta:

 

 

El modelo para aplicar sería:

 

 

Donde:

 

 

A partir de la formula punto pendiente obtenemos la ecuación general de la recta:

 

 

El resultado de la correspondencia realizada entre las imágenes de prueba sobre la región de interés se presenta en la Figura 6.

 

Figura 6. Región de interés de la imagen de salida, se presenta en escala de grises.

 

V. Conclusiones

 

El problema de la correspondencia especial de pixeles fue abordado en este trabajo. Se presenta una solución basado en un modelo lineal empleando la ecuación general de la recta. Para obtener la solución se emplearon puntos de referencia; la técnica de selección de los puntos no es automática, es el usuario quien los determina. La imagen resultante muestra lo eficiente del sistema. Para una mejora en la imagen de salida, se recomienda emplear los parámetros intrínsecos de la cámara, aunque al considerarlos aumenta la complejidad matemática del modelo.

 

Referencias

 

  1. C. C. Slama (1980) Manual of Photogrammetry. Cuarta edición, Falls Church, Virginia. American Society of Photogrammetry.

  2. M. Hansen, P. Anandan, K. Dana, G. van der Wal, and P. Burt (1994) Real-time scene stabilization and mosaic construction, en IEEE Workshop on Applications of Computer Vision (WACV’94) (Sarasota), pp. 54–62, December 1994. IEEE Computer Society.

Nota: los autores pueden obsequiar las líneas de código generadas en el desarrollo de este trabajo. De ser necesario contactar a la dirección de correo electrónico del primer autor.