Introducción al tratamiento de imágenes

Monografias.com

1
Preprocesamiento 1
Las entradas y salidas del sistema son imágenes de intensidad. Sus objetivos son:
Rectificar distorsiones que se pueden modelar.
Mejorar la calidad de la imagen.
Se emplean como procesos generales en las etapas iniciales.
Los métodos de preprocesamiento se clasifican en 4 categorías según el tamaño de la vecindad del pixel.
Transformaciones de brillo del pixel. (Point Operations)
Transformaciones geométricas.
Transformaciones de vecindad del pixel.
Otra clasificación es métodos de mejora o de restauración.

Monografias.com

2
Preprocesamiento 2
Para corregir efectos de la degradación de la imagen es importante la naturaleza de la información a priori:
Grupo de métodos que no usan conocimientos acerca de la naturaleza de la degradación.
Grupo que asume conocimientos acerca del dispositivo de adquisición de la imagen y las condiciones con que se adquirió.
Grupo que usa conocimientos acerca de lo que se busca en la imagen.

Monografias.com

3
Transformaciones de brillo del pixel.
La transformación depende del valor del pixel. 2 categorías.
Corrección del brillo: Modifica el valor atendiendo al valor original del pixel y a su posición en la imagen.
f(i,j) = e(i,j) * g(i,j) g(i,j) : imagen ideal
e(i,j) : cambios en la imagen ideal (calcular)
f(i,j) : imagen captada
Transformación de escala de gris: No dependen de la posición del pixel en la imagen.
q = T(p) [p0 , pk] ? [q 0 , q ]
Estas transformaciones se realizan fácilmente con tablas LUT (tablas de consulta), hardware o software.
En general no son reversibles, suele haber mapeos varios a uno.
Se utilizan mucho cuando la imagen va a ser vista por un observador humano.

Monografias.com

4
Operaciones con LUT (Look Up Table)
p1
p2

p
0
0
0
0
1
2
95
96
255
255
255
255
Tabla LUT
(tabla de consulta)
(Gp:) a
(Gp:) a) transf. inversa

(Gp:) b
(Gp:) b) realce entre p1 y p2

(Gp:) c
(Gp:) c) umbralización

Monografias.com

5
Compresión de rango
En comparación con la visión humana la imagen digital tiene un rango dinámico menor.
El bajo contraste en las imágenes digitales las hace aparecer de baja calidad cuando nos enfrentamos a escenas en las que hay un contraste alto.
Podemos perdernos detalles en las partes oscuras.
Las partes brillantes se blanquean.
El rango dinámico se puede incrementar por medio de la transformación ganma.

Esta transformación aumente el rango dinámico en las partes más oscuras a costa de las partes más claras de la imagen.
Se adapta así mejor a la característica logarítmica del ojo humano.

Monografias.com

6
Ejemplo de mejora del contraste
Imagen original
(Gp:) Imagen con mejor contraste

(Gp:) Transformación del nivel de gris

Monografias.com

7
Corrección de iluminación no uniforme
A pesar de nuestros esfuerzos por tener una iluminación homogénea esta no será posible de obtener por completo.
Estos efectos se hacen más aparentes en casos de fondo uniforme.
El propio dispositivo sensor introduce errores.
Es posible corregir estos efectos teniendo un conocimiento a priori de su naturaleza y contando con imágenes de referencia.
Asumimos que los valores de gris se deben a la irradiancia no homogénea de la imagen y la reflectividad del objeto.
Se puede suponer un coeficiente de error multiplicativo g(i,j)=e(i,j)f(i,j)
Se supone que puede tomar una imagen de referencia constante C, la imagen degradada de esta referencia será fc(i,j) => e(i,j)=fc(i,j)/c
El error sistemático puede eliminarse con g(i,j)=(fc(i,j)/c ))f(i,j)
Este método puede usarse si la degradación es estable.

Monografias.com

8
Ejemplo de iluminación no uniforme 1
Imagen con iluminación no uniforme
Histograma de la imagen

Monografias.com

9
Ejemplo de iluminación no uniforme 2
Imagen del fondo
Histograma del fondo

Monografias.com

10
Ejemplo de iluminación no uniforme 3
Imagen corregida, sustrayendo el fondo y estirando el histograma
Histograma de la nueva imagen

Monografias.com

11
Transformación del histograma.
El histograma es una representación de la distribución de pixels con un nivel de gris.
Trata a cada valor r, nivel de gris como una variable aleatoria. Sobre ella puede aplicarse una transformación s=T(r).
T debe cumplir ser monótona creciente.
Debe abarcar todo el rango de valores de r.
La función inversa r=T-1(s) cumple las mismas condiciones.
Se pueden definir funciones de densidad de probabilidad pr(r) ps(s) entonces si se conoce T y se verifican las condiciones impuestas:

Las técnicas de mejora siguientes se basan en modificar la apariencia del histograma mediante una transformación T.

Monografias.com

12
Ecualización
Se define una transformación T(r), que es la integración

Ejemplo Sea pr(r) una función de transformación entre 0 y 1 pr(r)=-2r+2

Monografias.com

13
Aplicación al caso discreto
Se definen las probabilidades para los niveles de gris.

Por efecto del cálculo discreto esta función de densidad de probabilidad ps(s) no resulta plana.
La transformación inversa no se emplea en la ecualización de los histogramas aunque si en otras aplicaciones.
Pueden realizarse ajustes a histogramas con distintas formas, esto se conoce como especificación de histograma.
Es posible aplicar ecualizaciones locales dividiendo la imagen en regiones.

Monografias.com

14
Ejemplo de ecualización
Imagen original Imagen ecualizada
Transformación de nivel de gris

Monografias.com

15
Especificación de histogramas
Se puede transformar una imagen de tal forma que su histograma se ajuste a uno cualquiera predeterminado.
Como en el caso de la ecualización en el caso continuo la solución es exacta mientras que en el discreto solo se aproxima.
Se parte de suponer conocida la imagen que deseamos obtener.
(Gp:) Imagen g igualada de f
(Gp:) T(r)
(Gp:) s

(Gp:) Imagen l igualada de h
(Gp:) G(z)
(Gp:) v

(Gp:) G-1(s)

(Gp:) Imagen f original
(Gp:) r
(Gp:) pf(r)

(Gp:) Imagen h especificada
(Gp:) z
(Gp:) ?
(Gp:) ph(z)

Monografias.com

16
Transformación de la escala de grises
Con la dilatación (stretching) se pretende aprovechar todos los niveles de la escala de grises.

También es posible dilatar un intervalo a la vez que se contrae otro.

r0 a b rL-1 rk
rk
niveles de salida
niveles de entrada
rL-1

Monografias.com

17
Transformaciones geométricas
Permiten eliminar distorsiones geométricas introducidas a la hora de la captura de la imagen.
También se emplean en gráficos por computador (traslación, escalado, rotación, perspectiva).
x’ = Tx (x , y) y’ = Ty (x , y)

La transformación se realiza en dos pasos.
Transformación de las coordenadas del pixel, tratándolas como números reales, luego se ajustan a la rejilla ya que en general no coincidirán con un punto de la misma.
El brillo se ajusta como una interpolación de niveles de gris.

Monografias.com

18
Interpolación del brillo
Se debe obtener el valor de nivel de gris para cada nuevo punto de la rejilla tras la transformación de coordenadas.
La interpolación puede verse como una operación de convolución.
Interpolación en la vecindad más cercana.
Puede producir efecto de escalonado.
Interpolación lineal (bilineal)
Establece una recta entre dos puntos de la rejilla (muestreo) y calcula en ella el valor de un punto intermedio.

Difumina un poco los contornos, efecto de promediado.

4
3
2
1
1
(x,y)

Monografias.com

19
Interpolación lineal 1
La interpolación bilineal es separable, puede por tanto establecerse a partir de dos transformaciones lineales.
Adoptando coordenadas espaciales normalizadas
Dos puntos de la rejilla caerían en -1/2 1/2, entonces :
Kernel de la convolución

Monografias.com

20
Interpolación lineal 2

1/4
3/4
1/4
1/2
3/4
1/2
1
Transformada de la interpolación lineal

Monografias.com

21
Interpolación del brillo 2
Interpolación bicúbica. (polinomial de orden 3)
Es más costosa computacionalmente.

Interpolación por Spline
Evita la perdida de derivabilidad en los puntos de la rejilla.

Monografias.com

22
Zoom e interpolación
(Gp:) Interpolación por el más cercano

(Gp:) Interpolación bilineal

(Gp:) Interpolación bicúbica

Monografias.com

23
Preprocesamiento local 1
Usan los valores de brillo de una vecindad pequeña para calcular el brillo del pixel en la nueva imagen. Se pueden establecer varias clasificaciones con dos categorías en cada una:
Suavizamiento (filtro pasa bajos, elimina ruido y difumina).
Operadores de gradiente (filtro pasa altos, resalta los contrastes).

Operadores lineales (convoluciones, filtros).
Operadores no lineales.

Operadores en el dominio del espacio.
Operadores en el dominio de la frecuencia.
Se usa poco conocimiento a priori.

Monografias.com

24
Preprocesamiento local 2
Debe fijarse un tamaño de vecindad, que se llama ventana o máscara del filtro.
Puede ser rectangular o de cualquier otra forma, generalmente cuadrado y número de elementos impar.
Debe definirse la posición del pixel de estudio respecto a la ventana, generalmente y por simetría el central.
En una convolución las propiedades del filtro vienen dadas por los coeficientes de la máscara.
Hay problemas de orlado del contorno.
Duplicación periódica.
Duplicación del borde.
Puesta a cero del contorno.
Suprimir borde

Monografias.com

25
Filtros recursivos.
Incorporan los resultados que se están obteniendo durante la convolución en la operación que se realiza con el siguiente pixel.
Si el filtro solo depende de valores anteriores
de señal se denomina causal.
En el dominio del tiempo los filtros deben ser causales, con imágenes pueden no serlo.
Suelen actuar como filtros paso-baja.
Entre las propiedades de los filtros recursivos están:
La respuesta impulso (PSF) es infinita, por ello también se les conoce como filtros IIR en contraposición con los FIR (donde el tamaño de la respuesta es igual al de la máscara).
Los filtros IIR, al contrario que los FIR, no son siempre estables.
Cualquier filtro recursivo puede sustituirse por uno no recursivo, generalmente de máscara infinita (dada por la PSF del IIR).

Monografias.com

26
Filtros no recursivos (FIR)
No incorporan los resultados que se están obteniendo durante la convolución en la operación que se realiza con el siguiente pixel.
Solo dependen de los valores de la señal de entrada.
En el procesamiento de imagen en el dominio temporal los filtros más empleados son FIR no causales.
Trabajan sobre un conjunto infinito de frecuencias.
Se emplean filtros lineales e invariantes (LSI). Entre sus propiedades destacan:
Conmutatividad (no confundir con producto de matrices).
Asociatividad (máscaras separables).
9 productos y 8 sumas pasan a 6 productos
y 4 sumas. No todos los filtros son separables
Distributiva respecto a la adición.

Monografias.com

27
Filtros combinados
Hay filtros que pueden considerarse una combinación de los anteriores.
Parten de un compromiso entre la actuación en el dominio del tiempo y el de la frecuencia.
Marr y Hildreth establecieron un parámetro de incertidumbre
donde ? y X son la extensión de actuación en el dominio de la frecuencia y espacial respectivamente.
La incertidumbre está acotada inferiormente ?U ? 1/2
Un operador de suavizado es más óptimo cuanto más se acerque al valor 1/2 en su incertidumbre.

Monografias.com

28
Suavizamiento de imagen (smoothing)
El objetivo es eliminar ruido. La idea básica es que en pixels pertenecientes a una región los valores deben ser semejantes.
Puede hacerse tomando varias imágenes de una escena estática.

Se calcula el valor promedio en una vecindad por convolución.

Promediado : hay diversas máscaras posibles, todas ellas se normalizan.

Monografias.com

29
Suavizamiento de imagen 2
El ruido, cambio brusco de intensidad, es una señal de alta frecuencia.
El principal inconveniente de este método es que difumina los contornos (bluring). A mayor ventana mayor difuminado.
Para evitarlo se pueden emplear varias opciones:
Promediar solamente pixels que cumplan cierta condición:
El valor del pixel cae en un rango f(i,j) ?[min,max]
La diferencia de pixels no excede de una cota.
Utilización previa de gradientes, solo se emplearán los puntos cuyo gradiente sea inferior a un umbral.
Promediar de acuerdo a un gradiente inverso.
Promediar utilizando máscaras rotatorias, busca partes homogéneas en la vecindad del pixel.

Monografias.com

30
Propiedades de los filtros de suavizamiento
No deben desplazar la posición de los objetos en la imagen.
Deben ser de fase cero, por tanto su función de transferencia es real, deben tener una máscara simétrica.
Deben preservar la media
La componente de f=0 debe ser 1, la suma de todos los coeficientes de la máscara es 1.
Función de transferencia decreciente monótona. Deben eliminarse los objetos pequeños antes que los grandes.
La función de transferencia decrece monótonamente con la f.
Isotropía, no debe favorecerse ninguna dirección (en los espacios discretos solo se consigue aproximadamente).

Monografias.com

31
Tipos de filtros de suavizamiento
Filtros de caja (por convolución).
Suavizamiento de la mediana. Reemplaza el valor del pixel por el de la mediana de un entorno de vecindad.
No emplean técnicas de convolución, ordenación de números.
Muy buen resultado con ruido impulsional.
Son computacionalmente más costosos.
Filtros definidos en frecuencia:
El ruido es alta frecuencia, eliminable con filtros paso bajo:
Filtros discretos finitos (FIR).
Filtros discretos infinitos (IIR).
Filtros analógicos discretizados (Buterworth u otros).
Filtrado por convolución con una máscara de tipo Gaussianno. La desviación típica condiciona el tamaño de la máscara.

Monografias.com

32
Filtros de caja
Funcionan promediando en un entorno de vecindad.

Se observa su labor de suavizamiento, pero no respetan bien las escalas.

R=1/3+2/3*cos(?K)
El uso de filtros mayores no mejora significativamente los resultados
Los filtros de caja son separables.
No son isótropos
(Gp:) 3
(Gp:) 5
(Gp:) 7
(Gp:) 9

Monografias.com

33
Filtros binomiales 1.
A partir de un filtro sencillo B=1/2[11] pueden obtenerse por convolución filtros más complejos Bp=B*B*B…..*B (p veces).
p f Coeficientes del filtro ?2
0 1 1 0
1 1/2 1 1 1/4
2 1/4 1 2 1 1/2
3 1/8 1 3 3 1 3/4
4 1/16 1 4 6 4 1 1
5 1/32 1 5 10 10 5 1 5/4
6 1/64 1 6 15 20 15 6 1 3/2
La función de transferencia se obtiene a partir de:

Monografias.com

34
Filtros binomiales 2.
Ofrecen un mejor suavizado
que los filtros de caja.
Para máscaras grandes se
aproxima a una distribución
gaussiana.
A mayor máscara menor
es la frecuencia de corte.
Es más isotrópico que los
filtros de caja.
Son separables para el caso 2D.
Bp=Bpx Bpy.

2
4
8
16

Monografias.com

35
Filtros Gaussianos 1.
Se aplican mediante convolución con una máscara cuyo tamaño y valor depende de la varianza ? según la fórmula:

A mayor ? más atenúa y más voluminoso y lento es el filtro.
Mediante ? se afecta a la resolución del filtro, a menos varianza menor cantidad de detalle que se pierde.
Se trata de un filtro separable

Son también base para filtros detectores de contorno.
Se puede asumir como ancho de caja W

Monografias.com

36
Filtros Gaussianos 2.

Monografias.com

37
Filtros de mediana
Son filtros no lineales que funcionan bien con ruido impulsional.
Su funcionamiento se basa en el ordenamiento de una vecindad contenida en el tamaño de una máscara. Tras ordenar los pixels de la vecindad el valor del pixel en estudio es sustituido por la mediana de la vecindad.
Ejemplo con máscara 1*3
…..1 2 3 7 8 9 …… …..1 2 3 7 8 9 ……
…..1 2 36 4 5 6 …… …..1 2 4 5 5 6 ……
…..0 0 0 9 9 9…… ….. 0 0 0 9 9 9 ……
Preservan bastante bien los contornos sin difuminarlos.
Computacionalmente son más costosos que los basados en convoluciones.

Monografias.com

38
Comparación filtro de promediado y de mediana.
Ventana 5*1
Imagen original Filtro promediado Filtro de mediana

Monografias.com

39
Suavizamiento de una imagen con ruido impulsional
Imagen original
Imagen con ruido
Imagen filtrada
Promediado 3*3
Mediana 3*3

Monografias.com

40
Suavizamiento de una imagen con ruido gaussiano
Imagen original
Imagen con ruido
Imagen filtrada
Promediado 3*3
Mediana 3*3

Monografias.com

41
Propiedades de los detectores de contorno 1
La detección de contornos es un paso típico, previo a muchos procesos de segmentación.
La visión humana emplea mucho la detección de contornos.
Hay dos tendencias:
Uso de derivadas.
Encaje de modelos.
Un buen detector de contorno debería verificar:
El contorno obtenido debe ser fino. (única respuesta).
El contorno debe aparece en su lugar correcto, no estar desplazado.
No debe mostrar respuestas en regiones uniformes. (Buena detección)
Los contornos implican cambios bruscos en los niveles de gris:
Esto es una señal de alta frecuencia. La derivada de la función de intensidad luminosa es alta, más cuanto más fuerte sea el contorno.

Monografias.com

42
Detectores de contorno derivativos
(Gp:) Derivada primera

(Gp:) Derivada segunda

Monografias.com

43
Propiedades de los detectores de contorno 2
Un filtro derivativo de orden p corresponde a una multiplicación por (ik)p en el espacio frecuencial (k=frecuencia).
Sin desplazamiento:
En los filtros de promediado implica que la función de transferencia es real y que la máscara de convolución es simétrica.
Para un filtro derivativo de primer orden la función de transferencia debe ser imaginaria y la máscara de convolución antisimétrica. (h-n = – hn ).
Para una máscara con nº pixels impar => pixel central=0.
Un filtro derivativo de 2º orden debe ser simétrico, como los de suavizamiento.
Supresión del valor medio, no deben responder a niveles continuos.
La suma de los coeficientes debe ser cero
La función de transferencia debe ser 0 para k=0.

Monografias.com

44
Propiedades de los detectores de contorno 3
Derivación no selectiva, amplifica más las escalas pequeñas que las grandes, la función de transferencia debería incrementarse con la frecuencia monótonamente.
Propiedades de simetría, para permitir el cálculo de la convolución de manera más eficiente.
También ayuda en el uso de la función de transferencia pues solo existen términos en senos (imaginarios).
Isotropía, no debe haber direcciones privilegiadas. Esta propiedad se puede analizar mejor estudiando las funciones de transferencia.

Monografias.com

45
Detectores de contorno basados en derivadas
Hay dos clases principales de detectores
Emplean derivadas de primer orden.
Emplean derivadas de 2º orden.
Se puede utilizar el vector gradiente que da información de la dirección de máxima variación de la magnitud.

El módulo del gradiente informa acerca de la fuerza del borde.

La dirección de contorno viene dada por:

Monografias.com

46
Aproximaciones al gradiente
Diferencias discretas de primer orden .

Calculo en dos dimensiones
Detección de filas
Detección de columnas
Combinación del gradiente
F(j,k)

Monografias.com

47
Operadores de gradiente
El gradiente se puede calcular por aproximación discreta:

También es posible calcular la laplaciana de manera discreta.

Este último operador no suele emplearse directamente, produce bordes dobles y es muy sensible al ruido. Sin embargo sus pasos por cero si son buenos indicadores de contornos.

Monografias.com

48
Detección con máscaras múltiples
Se toma una base de vectores y se proyecta sobre ella una vecindad de pixels.
En esencia se basa en realizar convoluciones con una serie de máscaras que forman una base.
Se calcula el módulo para cada proyección.
La respuesta mayor da ya el módulo y la dirección del gradiente.

3 de las 12 máscaras de Kirsch.
En esencia se correla la imagen con patrones en todas las direcciones posibles.

Monografias.com

49
Detección de contornos con operadores de gradiente 1

Imagen original con borde
en escalón
0 0 0 10 10 10 10 10 0 0 0
0 0 0 10 10 10 10 10 0 0 0
0 0 0 10 10 10 10 10 0 0 0
0 0 0 10 10 10 10 10 0 0 0
0 0 0 10 10 10 10 10 0 0 0
0 0 0 10 10 10 10 10 0 0 0
0 0 0 10 10 10 10 10 0 0 0

Monografias.com

50
Detección de contornos con operadores de gradiente 2

(Gp:) 0 0 20 20 0 0 0 20 20 0 0
0 0 30 30 0 0 0 30 30 0 0
0 0 30 30 0 0 0 30 30 0 0
0 0 30 30 0 0 0 30 30 0 0
0 0 30 30 0 0 0 30 30 0 0
0 0 30 30 0 0 0 30 30 0 0
0 0 20 20 0 0 0 20 20 0 0
(Gp:) 1 0 -1
2 0 -2
1 0 -1
(Gp:) Sobel

(Gp:) 0.1667 0.6667 0.1667
0.6667 -3.3333 0.6667
0.1667 0.6667 0.1667
(Gp:) Laplaciana
(Gp:) 0 0 8 18 9 9 9 18 8 0 0
0 0 10 9 0 0 0 9 10 0 0
0 0 10 9 0 0 0 9 10 0 0
0 0 10 9 0 0 0 9 10 0 0
0 0 10 9 0 0 0 9 10 0 0
0 0 10 9 0 0 0 9 10 0 0
0 0 8 18 9 9 9 18 8 0 0

Monografias.com

51
Imagen de prueba, bordes en rampa

Monografias.com

52
Detección de contornos en rampa

(Gp:) 0 0 0 12 24 24 24 24 12 0 0 0
0 0 0 16 32 32 32 32 16 0 0 0
0 0 0 16 32 32 32 32 16 0 0 0
0 0 0 16 32 32 32 32 16 0 0 0
0 0 0 16 32 32 32 32 16 0 0 0
0 0 0 16 32 32 32 32 16 0 0 0
0 0 0 16 32 32 32 32 16 0 0 0
0 0 0 12 24 24 24 24 12 0 0 0
(Gp:) Con operador de Sobel

(Gp:) 0 0 0 3 3 8 11 15 23 19 19 19
0 0 0 4 0 0 0 0 3 0 0 0
0 0 0 4 0 0 0 0 3 0 0 0
0 0 0 4 0 0 0 0 3 0 0 0
0 0 0 4 0 0 0 0 3 0 0 0
0 0 0 4 0 0 0 0 3 0 0 0
0 0 0 4 0 0 0 0 3 0 0 0
0 0 0 3 3 8 11 15 23 19 19 19
(Gp:) Con operador de Laplace

Monografias.com

53
Detección de contornos con filtros de Sobel
(Gp:) Imagen original

Imagen filtrada

(Gp:) Contornos horizontales
Contornos verticales

Monografias.com

54
Detectores de gradientes
Máscaras comunes para el cálculo de gradientes.
(Gp:) Gradiente de fila
(Gp:) Gradiente de columna
(Gp:) Gradiente de fila
(Gp:) Gradiente de columna

Hf(i,j)
Hc(i,j)
| · | +| · |
F(i,j)
> umbral en (i0,j0) ?
|G(i,j)|
Si, es punto de borde
No, no es punto de borde

Monografias.com

55
Combinación de suavizado y gradiente
Para que el operador gradiente sea menos vulnerable al ruido puede suavizarse la imagen previamente.

HG es un operador cualquiera de gradiente y HS lo es de suavizado.
Un operador que combina gradiente y suavizado de manera más eficaz es DroG (“Derivative of Gaussian”).

Monografias.com

56
DroG
Dado que gradiente y convolución son operadores lineales:

El operador DroG se define, teniendo en cuenta el carácter separable de la gaussiana:

Es preciso discretizar esta fórmula, dependerá del valor de ?.

Monografias.com

57
Detección con Laplaciana de la Gaussiana.
Este tipo de detección se realiza en varios pasos:
Convolución de la imagen con una máscara de Gauss G(x,i).
Convolución del resultado con una máscara de Laplace.
Detección de los pasos por cero de la imagen resultado.
Tiene varias propiedades que simplifican su uso:
Los operadores son conmutativos, por lo que para una varianza dada puede derivarse un filtro único llamado LOG.

Es separable en 4 convoluciones unidimensionales (reduce las operaciones del orden n2 a 4n).

Monografias.com

58
El operador LOG
El operador Laplaciana es muy sensible al ruido, por lo que se combina con la Gaussiana.

El operador LoG presenta simetría radial y se parece a un sombrero mejicano.
La combinación de un filtro pasa-baja (gaussina) y pasa-alta (Laplaciana) da lugar a un filtro pasa banda controlado por ?.
Su calculo se puede separar.

Monografias.com

59
El operador DOG
Una alternativa a la expresión anterior es aproximar el cálculo de LOG por una Diferencia de Gaussianas (DOG) para desviaciones típicas ?1 < ?2

Marr y Hildreth demostraron que la proporción ?2 / ?1=1.6 es la que mejor se aproxima al operador LOG.
Al igual que sucede con la Laplaciana los cruces por cero obtenidos tras aplicar el LOG suelen producir contornos cerrados.
Tras aplicar LOG (DOG) se requiere detectar los cruces por cero.

Monografias.com

60
Detector de Marr y Hildreth
Establecieron que los cambios de intensidad en imágenes reales ocurren sobre un amplio rango de escalas o resoluciones. Un único filtro no pude ser óptimo para todas ellas.
Proponen un suavizado previo a distintas escalas o niveles.
Después detectan los cambios de intensidad en cada nivel.
A la hora de suavizar una imagen se considerará:
Debe reducir el rango de escalas en el que se producirán cambio de intensidad. Su actuación debe estar localizada en frecuencia.
Las discontinuidades se originan por distintos motivos. En el dominio espacial todos estos cambios pueden producirse a distintas escalas espaciales.

Monografias.com

61
Detección de contornos con laplaciana de la gaussiana (LOG)
(Gp:) Imagen original

(Gp:) Filtrada con varianza 2.3

(Gp:) Filtrada con varianza 1.5

(Gp:) Filtrada con varianza 0.8

Monografias.com

62
Detector de Canny
Está basado en un desarrollo analítico de optimización partiendo de un modelo continuo unidimensional de un escalón.
La función h buscada debe satisfacer los criterios:
Buena detección maximizando la relación señal ruido
Buena localización
Respuesta única
En señales bidimensionales discretas el operador de Canny se aproxima mediante la derivada de la Gaussina en la dirección perpendicular al borde.
Calcular módulo y gradiente de la imagen suavizada aplicando DroG
En la dirección del gradiente eliminar los puntos que no sean máximos locales (equivale a buscar pasos por 0)

Monografias.com

63
Segmentación de la imagen
Es el proceso que divide la imagen en regiones u objetos cuyos píxeles poseen atributos similares (niveles de gris, textura etc.)
Se pueden clasificar en :
Técnicas basadas en la detección de fronteras
Técnicas de umbralización.
Técnicas basadas en el agrupamiento de píxeles..
En las dos últimas categorías se estima que:
Píxeles de una misma región deben ser similares.
Píxeles de regiones distintas deben ser no-similares.
Las regiones resultantes deben tener cierto significado para el procesamiento posterior.

Monografias.com

64
Enlazado de bordes y detección de límites
Idealmente, tras pasar un detector de contornos, se obtendrían líneas continuas de alta intensidad sobre un fondo oscuro pero:
El ruido introduce puntos espureos.
Una iluminación no uniforme falsea los contornos.
Hay contornos que pueden aparecer debilitados.
Se deben aplicar algoritmos de seguimiento de contornos, algunos métodos son:
Procesamiento local.
Procesamiento global con la transformada de Hough.
Procesamiento global con técnicas de la teoría de grafos.

Monografias.com

65
Procesamiento local.
Se analizan las características de los pixels en una pequeña vecindad (3*3 o 5*5) respecto a cada (x,y) susceptible de pertenecer a un contorno. Luego se enlazan.
Las propiedades que se suelen analizar son:
Intensidad (módulo) del gradiente.
Dirección del gradiente.
T,A umbrales
Un punto en una vecindad de (x,y) estará enlazado con el mismo si satisface los criterios anteriores.
El proceso se repite para cada punto de la imagen actualizandose un registro.

Monografias.com

66
Procesamiento global con la transformada de Hough 1.
Busca enlazar puntos que se encuentran en una curva específica.
Búsqueda de rectas en un subconjunto de n puntos.

La ecuación de una recta se puede expresar como:

Se hace un cambio de espacio paramétrico.
(Gp:) y
(Gp:) x
(Gp:) (xi,yi)
(Gp:) b
(Gp:) (xj,yj)

(Gp:) b
(Gp:) a
(Gp:) (a’,b’)
(Gp:) yi
(Gp:) yj

Monografias.com

67
Procesamiento global con la transformada de Hough 2.
Se subdivide el nuevo espacio en células acumuladoras. Inicialmente
todas las celdas a cero. Para cada (xk,yk) del plano imagen se prueba con cada ai de los acumuladores y se busca el b correspondiente según la expresión de la recta vista antes. Se redondea al b más próximo y se incrementa el acumulador ai,bj.
Las rectas corresponderán a los acumuladores más altos.
El algoritmo resulta computacionalmente más eficiente expresando la recta en coordenadas polares.

Existen versiones generalizadas para detectar otras figuras geométricas (círculos, elipses etc.)
(Gp:) bmin
(Gp:) bmax
(Gp:) 0
(Gp:) 0
(Gp:) amin
(Gp:) amax

Monografias.com

68
Ejemplo de transformada de Hough
Imagen con recta vertical en el centro
Espacio de acumuladores

Monografias.com

69
Procesamiento global por medio de la teoría de grafos
Es un proceso más complicado pero con buenos resultados aún con imágenes ruidosas.
Se establece un grafo, formado por un conjunto N de nodos y un conjunto de pares desordenados de elementos de N (arcos).
Los arcos se dirigen de nodo ni al nj, entonces nj se dice sucesor de ni.
Se asocia un coste c(ni,nj) con cada arco.
Una sucesión de nodos acarrea un coste.
Se debe establecer un tipo de vecindad.
Se decide cual es la función de coste que interesa.
Se expande el grafo desde un nodo fuente hasta llegar a un nodo meta.