Instituto Polit�cnico Nacional
Instituto Politécnico Nacional
"La Técnica al Servicio de la Patria"

Boletín No. 87
1o. de noviembre de 2021




ÍNDICES PARAMÉTRICOS DIFUSOS PARA LA MEJORA AUTOMATIZADA DE IMÁGENES

 

Adame Galeano María Fernanda
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
Pérez Salazar Tania
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
M. en C. Álvaro Anzueto Ríos
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

UPIITA-IPN

 

Resumen

El presente artículo muestra la mejora de contraste en una imagen con base al principio detrás de la percepción humana al brillo, utilizando la lógica difusa para asignar un nivel de pertenencia a cada tono de gris y aplicando una función S, comúnmente empleada en la teoría de lógica difusa, para adaptar la distribución de grises en todo el histograma. Los resultados muestran que la mejora de imagen está presente cuando se aplica el conjunto de parámetros P, que modifican a la función S, haciendo que el índice paramétrico de difusividad (PIF) sea maximizado, lo cual representa en la imagen mejorar el contraste, es decir aumenta la diferencia numérica entre los niveles de grises que conforman a diferentes objetos dentro de la imagen. El proceso presentado modela la ambigüedad y vaguedad en la visión humana.

El concepto de contraste es fundamental cuando se habla de mejora de imágenes, hace referencia a las distintas tonalidades presentes en una imagen dada por la diferencia entre el valor de intensidad de gris mínimo y máximo, la relación de contraste sirve como medida de la preservación de detalles donde sí el contraste es alto con un rango dinámico alto se consigue distinguir perfectamente una línea puramente negra y otra blanca; por el contrario, teniendo una imagen con contraste bajo ambas líneas se percibirán como grises. Limitando así el aspecto de la imagen a tonos de gris apagados y ligeramente distinguibles entre sí. [González, 2018]

La implementación de la lógica difusa es práctica y eficaz como modelo para la comprensión de una gran parte de procesos y problemas complejos cuyo entendimiento se basa en gran medida a través del razonamiento impreciso del ser humano, al considerar el uso de lógica difusa en un problema dado se debe de tener en consideración la tolerancia a la imprecisión que se está dispuesto a tolerar. [Ross, 2004]

El contraste de una imagen es un fenómeno entendido mediante el razonamiento humano usando valores cualitativos como rango; sí bien se puede obtener una diferencia numérica entre un valor de gris y otro, es la percepción humana la que determina si un nivel de intensidad es distinguible de otro y en qué medida. Además, se tiene una tolerancia a la imprecisión considerable puesto que en una escala de gris con valores de 0 hasta 255 la diferencia entre dos valores consecutivos es imperceptible a simple vista. Es por esto que se estima la lógica difusa como una herramienta con gran potencial para la mejora de contraste de una imagen.

El procesamiento difuso de una imagen consiste en los siguientes pasos:

  • 1) Fuzzificación
  • 2) Modificación de los valores de membresía pertinentes
  • 3) Defuzificación

Para el primer paso del algoritmo propuesto se tiene la función de membresía

 

 

Donde g corresponde al nivel de gris evaluado, los niveles máximo y mínimo de la imagen respectivamente. Para modificar los valores de membresía de los distintos niveles de gris se planteó el uso de una función S que comúnmente se aplica para describir distintos grupos difusos, por lo tanto, es nombra aquí como Sf.

 

 

Se considera como la variable independiente. P se define como el grupo conformado por los parámetros a, b y c que determinan la forma de la función S satisfaciendo la condición:

Teniendo la función que denota la modificación de los niveles de gris se puede obtener la imagen resultante a partir de la siguiente expresión:

 

 

Donde la imagen resultante f(x,y) se obtiene a partir del índice en dado por el nivel de gris en la imagen original en el mismo pixel. [Vlachos, 2006]

El vector de parámetros P , está conformado por el conjunto de valores [a,b,c], que dan forma a la función descrita en la ecuación (2), este vector de parámetros es definido para cada tipo de imagen que se tenga que procesar y a su vez implica uniformizar él histograma de cada imagen procesada, el conjunto de valores ideales para este vector puede ser calculado de forma iterativa proponiendo diferentes valores para [a, b, c] y teniendo como criterio el índice paramétrico de difusividad (PIF). El valor de “a” representa el valor mínimo desarrollado por función, el valor de “b” es el punto de inflexión de la función, este término es asociado al valor de 0.5, el valor de “c”, es considerado como el punto de saturación de la función, para nuestro caso la saturación se presenta en el valor de máxima pertenencia que es igual a 1.

Con el propósito de comprobar la eficiencia de este método lo aplicamos a tres distintas imágenes con rangos bajos de contraste; una muy oscura, otra muy clara y la última con niveles muy claros y oscuros.

Como primer caso analizado se tiene la imagen con un bajo rango de contraste y niveles de grises con valores cercanos a la región oscura (ver histograma en Fig. 1 (b).

 

Figura 1. (a) Imagen de bajo contraste oscura. (b) histograma normalizado de la imagen (a).

 

Para esta imagen se tomaron los parámetros óptimos del vector P=(0.1,0.4,0.9). Los resultados tras realizar la mejora se muestran a continuación:

 

Figura 2. (a) Imagen oscura mejorada. (b) histograma normalizado de la imagen mejorada(a).

 

Para una segunda prueba se ha considerado modificar el contraste a una imagen que tiene un rango de contraste bajo pero fuerte valor en brillo, lo que representa tener una imagen demasiado clara. Para este caso el vector de parámetros P está compuesto de P=(0.51,0.99,1).

 

Figura 3. . (a) Imagen de bajo contraste brillante. (b) histograma normalizado de la imagen (a). (c) Imagen brillante mejorada con el vector de parámetros P. (d) histograma normalizado de la imagen (c).

 

Finalmente, se ha considerado modificar el contraste a una imagen que tiene un rango de contraste bajo, pero el histograma muestra dos agrupaciones en los extremos de su representación, lo cual indica que la imagen tiende a tener únicamente dos tonos de gris, blanco y negro. Para este caso el vector de parámetros P está compuesto de P=(0.004,0.5, 0.97).

 

Figura 4. (a) Imagen de bajo contraste con dos zonas marcadas a los extremos del histograma. (b) histograma normalizado de la imagen (a). (c) Imagen mejorada con el vector de parámetros P. (d) histograma normalizado de la imagen (c).

 

La implementación de la lógica difusa para la mejora del contraste en imágenes ofrece resultados prometedores; el método de optimización mediante índices paramétricos es un proceso fácil de implementar, rápido de calcular y la mejora de imagen es significativa con respecto a la percepción humana en el brillo o escala de gris. La mayor dificultad de este método es la obtención de los parámetros óptimos P que determinan la forma de la función S, esta problemática se discutirá en mayor detalle en posteriores artículos.

Los autores están en la mejor disposición de compartir las líneas de código generadas en este trabajo, realizado en el lenguaje de programación Python; solicitamos únicamente que se envié un correo a la dirección: Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Referencias

  1. Gonzalez, Rafael C., Richard E. Woods (2018). Digital image processing (4th ed.) New York: Pearson

  2. Ross Timothy J. (2004). Fuzzy logic with engineering applications (2nd ed.) John Wiley & Sons

  3. Vlachos Ioannis K., Sergiadis George D. (2006). Parametric indices of fuzziness for automated image enhancement, Fuzzy Sets and Systems 153 1126-1138.