Monografias.com > Ingeniería
Descargar Imprimir Comentar Ver trabajos relacionados

Introducción al tratamiento de imágenes




Enviado por Pablo Turmero



    Monografias.com

    1
    Preprocesamiento 1
    Las entradas y salidas del sistema son imágenes de intensidad. Sus objetivos son:
    Rectificar distorsiones que se pueden modelar.
    Mejorar la calidad de la imagen.
    Se emplean como procesos generales en las etapas iniciales.
    Los métodos de preprocesamiento se clasifican en 4 categorías según el tamaño de la vecindad del pixel.
    Transformaciones de brillo del pixel. (Point Operations)
    Transformaciones geométricas.
    Transformaciones de vecindad del pixel.
    Otra clasificación es métodos de mejora o de restauración.

    Monografias.com

    2
    Preprocesamiento 2
    Para corregir efectos de la degradación de la imagen es importante la naturaleza de la información a priori:
    Grupo de métodos que no usan conocimientos acerca de la naturaleza de la degradación.
    Grupo que asume conocimientos acerca del dispositivo de adquisición de la imagen y las condiciones con que se adquirió.
    Grupo que usa conocimientos acerca de lo que se busca en la imagen.

    Monografias.com

    3
    Transformaciones de brillo del pixel.
    La transformación depende del valor del pixel. 2 categorías.
    Corrección del brillo: Modifica el valor atendiendo al valor original del pixel y a su posición en la imagen.
    f(i,j) = e(i,j) * g(i,j) g(i,j) : imagen ideal
    e(i,j) : cambios en la imagen ideal (calcular)
    f(i,j) : imagen captada
    Transformación de escala de gris: No dependen de la posición del pixel en la imagen.
    q = T(p) [p0 , pk] ? [q 0 , q ]
    Estas transformaciones se realizan fácilmente con tablas LUT (tablas de consulta), hardware o software.
    En general no son reversibles, suele haber mapeos varios a uno.
    Se utilizan mucho cuando la imagen va a ser vista por un observador humano.

    Monografias.com

    4
    Operaciones con LUT (Look Up Table)
    p1
    p2

    q

    p
    0
    0
    0
    0
    1
    2
    95
    96
    255
    255
    255
    255
    Tabla LUT
    (tabla de consulta)
    (Gp:) a
    (Gp:) a) transf. inversa

    (Gp:) b
    (Gp:) b) realce entre p1 y p2

    (Gp:) c
    (Gp:) c) umbralización

    Monografias.com

    5
    Compresión de rango
    En comparación con la visión humana la imagen digital tiene un rango dinámico menor.
    El bajo contraste en las imágenes digitales las hace aparecer de baja calidad cuando nos enfrentamos a escenas en las que hay un contraste alto.
    Podemos perdernos detalles en las partes oscuras.
    Las partes brillantes se blanquean.
    El rango dinámico se puede incrementar por medio de la transformación ganma.

    Esta transformación aumente el rango dinámico en las partes más oscuras a costa de las partes más claras de la imagen.
    Se adapta así mejor a la característica logarítmica del ojo humano.

    Monografias.com

    6
    Ejemplo de mejora del contraste
    Imagen original
    (Gp:) Imagen con mejor contraste

    (Gp:) Transformación del nivel de gris

    Monografias.com

    7
    Corrección de iluminación no uniforme
    A pesar de nuestros esfuerzos por tener una iluminación homogénea esta no será posible de obtener por completo.
    Estos efectos se hacen más aparentes en casos de fondo uniforme.
    El propio dispositivo sensor introduce errores.
    Es posible corregir estos efectos teniendo un conocimiento a priori de su naturaleza y contando con imágenes de referencia.
    Asumimos que los valores de gris se deben a la irradiancia no homogénea de la imagen y la reflectividad del objeto.
    Se puede suponer un coeficiente de error multiplicativo g(i,j)=e(i,j)f(i,j)
    Se supone que puede tomar una imagen de referencia constante C, la imagen degradada de esta referencia será fc(i,j) => e(i,j)=fc(i,j)/c
    El error sistemático puede eliminarse con g(i,j)=(fc(i,j)/c ))f(i,j)
    Este método puede usarse si la degradación es estable.

    Monografias.com

    8
    Ejemplo de iluminación no uniforme 1
    Imagen con iluminación no uniforme
    Histograma de la imagen

    Monografias.com

    9
    Ejemplo de iluminación no uniforme 2
    Imagen del fondo
    Histograma del fondo

    Monografias.com

    10
    Ejemplo de iluminación no uniforme 3
    Imagen corregida, sustrayendo el fondo y estirando el histograma
    Histograma de la nueva imagen

    Monografias.com

    11
    Transformación del histograma.
    El histograma es una representación de la distribución de pixels con un nivel de gris.
    Trata a cada valor r, nivel de gris como una variable aleatoria. Sobre ella puede aplicarse una transformación s=T(r).
    T debe cumplir ser monótona creciente.
    Debe abarcar todo el rango de valores de r.
    La función inversa r=T-1(s) cumple las mismas condiciones.
    Se pueden definir funciones de densidad de probabilidad pr(r) ps(s) entonces si se conoce T y se verifican las condiciones impuestas:

    Las técnicas de mejora siguientes se basan en modificar la apariencia del histograma mediante una transformación T.

    Monografias.com

    12
    Ecualización
    Se define una transformación T(r), que es la integración

    Ejemplo Sea pr(r) una función de transformación entre 0 y 1 pr(r)=-2r+2

    Monografias.com

    13
    Aplicación al caso discreto
    Se definen las probabilidades para los niveles de gris.

    Por efecto del cálculo discreto esta función de densidad de probabilidad ps(s) no resulta plana.
    La transformación inversa no se emplea en la ecualización de los histogramas aunque si en otras aplicaciones.
    Pueden realizarse ajustes a histogramas con distintas formas, esto se conoce como especificación de histograma.
    Es posible aplicar ecualizaciones locales dividiendo la imagen en regiones.

    Monografias.com

    14
    Ejemplo de ecualización
    Imagen original Imagen ecualizada
    Transformación de nivel de gris

    Monografias.com

    15
    Especificación de histogramas
    Se puede transformar una imagen de tal forma que su histograma se ajuste a uno cualquiera predeterminado.
    Como en el caso de la ecualización en el caso continuo la solución es exacta mientras que en el discreto solo se aproxima.
    Se parte de suponer conocida la imagen que deseamos obtener.
    (Gp:) Imagen g igualada de f
    (Gp:) T(r)
    (Gp:) s

    (Gp:) Imagen l igualada de h
    (Gp:) G(z)
    (Gp:) v

    (Gp:) G-1(s)

    (Gp:) Imagen f original
    (Gp:) r
    (Gp:) pf(r)

    (Gp:) Imagen h especificada
    (Gp:) z
    (Gp:) ?
    (Gp:) ph(z)

    Monografias.com

    16
    Transformación de la escala de grises
    Con la dilatación (stretching) se pretende aprovechar todos los niveles de la escala de grises.

    También es posible dilatar un intervalo a la vez que se contrae otro.

    r0 a b rL-1 rk
    rk
    niveles de salida
    niveles de entrada
    rL-1

    Monografias.com

    17
    Transformaciones geométricas
    Permiten eliminar distorsiones geométricas introducidas a la hora de la captura de la imagen.
    También se emplean en gráficos por computador (traslación, escalado, rotación, perspectiva).
    x’ = Tx (x , y) y’ = Ty (x , y)

    La transformación se realiza en dos pasos.
    Transformación de las coordenadas del pixel, tratándolas como números reales, luego se ajustan a la rejilla ya que en general no coincidirán con un punto de la misma.
    El brillo se ajusta como una interpolación de niveles de gris.

    Monografias.com

    18
    Interpolación del brillo
    Se debe obtener el valor de nivel de gris para cada nuevo punto de la rejilla tras la transformación de coordenadas.
    La interpolación puede verse como una operación de convolución.
    Interpolación en la vecindad más cercana.
    Puede producir efecto de escalonado.
    Interpolación lineal (bilineal)
    Establece una recta entre dos puntos de la rejilla (muestreo) y calcula en ella el valor de un punto intermedio.

    Difumina un poco los contornos, efecto de promediado.

    4
    3
    2
    1
    1
    (x,y)

    Monografias.com

    19
    Interpolación lineal 1
    La interpolación bilineal es separable, puede por tanto establecerse a partir de dos transformaciones lineales.
    Adoptando coordenadas espaciales normalizadas
    Dos puntos de la rejilla caerían en -1/2 1/2, entonces :
    Kernel de la convolución

    Monografias.com

    20
    Interpolación lineal 2

    1/4
    3/4
    1/4
    1/2
    3/4
    1/2
    1
    Transformada de la interpolación lineal

    Monografias.com

    21
    Interpolación del brillo 2
    Interpolación bicúbica. (polinomial de orden 3)
    Es más costosa computacionalmente.

    Interpolación por Spline
    Evita la perdida de derivabilidad en los puntos de la rejilla.

    Monografias.com

    22
    Zoom e interpolación
    (Gp:) Interpolación por el más cercano

    (Gp:) Interpolación bilineal

    (Gp:) Interpolación bicúbica

    Monografias.com

    23
    Preprocesamiento local 1
    Usan los valores de brillo de una vecindad pequeña para calcular el brillo del pixel en la nueva imagen. Se pueden establecer varias clasificaciones con dos categorías en cada una:
    Suavizamiento (filtro pasa bajos, elimina ruido y difumina).
    Operadores de gradiente (filtro pasa altos, resalta los contrastes).

    Operadores lineales (convoluciones, filtros).
    Operadores no lineales.

    Operadores en el dominio del espacio.
    Operadores en el dominio de la frecuencia.
    Se usa poco conocimiento a priori.

    Monografias.com

    24
    Preprocesamiento local 2
    Debe fijarse un tamaño de vecindad, que se llama ventana o máscara del filtro.
    Puede ser rectangular o de cualquier otra forma, generalmente cuadrado y número de elementos impar.
    Debe definirse la posición del pixel de estudio respecto a la ventana, generalmente y por simetría el central.
    En una convolución las propiedades del filtro vienen dadas por los coeficientes de la máscara.
    Hay problemas de orlado del contorno.
    Duplicación periódica.
    Duplicación del borde.
    Puesta a cero del contorno.
    Suprimir borde

    Monografias.com

    25
    Filtros recursivos.
    Incorporan los resultados que se están obteniendo durante la convolución en la operación que se realiza con el siguiente pixel.
    Si el filtro solo depende de valores anteriores
    de señal se denomina causal.
    En el dominio del tiempo los filtros deben ser causales, con imágenes pueden no serlo.
    Suelen actuar como filtros paso-baja.
    Entre las propiedades de los filtros recursivos están:
    La respuesta impulso (PSF) es infinita, por ello también se les conoce como filtros IIR en contraposición con los FIR (donde el tamaño de la respuesta es igual al de la máscara).
    Los filtros IIR, al contrario que los FIR, no son siempre estables.
    Cualquier filtro recursivo puede sustituirse por uno no recursivo, generalmente de máscara infinita (dada por la PSF del IIR).

    Monografias.com

    26
    Filtros no recursivos (FIR)
    No incorporan los resultados que se están obteniendo durante la convolución en la operación que se realiza con el siguiente pixel.
    Solo dependen de los valores de la señal de entrada.
    En el procesamiento de imagen en el dominio temporal los filtros más empleados son FIR no causales.
    Trabajan sobre un conjunto infinito de frecuencias.
    Se emplean filtros lineales e invariantes (LSI). Entre sus propiedades destacan:
    Conmutatividad (no confundir con producto de matrices).
    Asociatividad (máscaras separables).
    9 productos y 8 sumas pasan a 6 productos
    y 4 sumas. No todos los filtros son separables
    Distributiva respecto a la adición.

    Monografias.com

    27
    Filtros combinados
    Hay filtros que pueden considerarse una combinación de los anteriores.
    Parten de un compromiso entre la actuación en el dominio del tiempo y el de la frecuencia.
    Marr y Hildreth establecieron un parámetro de incertidumbre
    donde ? y X son la extensión de actuación en el dominio de la frecuencia y espacial respectivamente.
    La incertidumbre está acotada inferiormente ?U ? 1/2
    Un operador de suavizado es más óptimo cuanto más se acerque al valor 1/2 en su incertidumbre.

    Monografias.com

    28
    Suavizamiento de imagen (smoothing)
    El objetivo es eliminar ruido. La idea básica es que en pixels pertenecientes a una región los valores deben ser semejantes.
    Puede hacerse tomando varias imágenes de una escena estática.

    Se calcula el valor promedio en una vecindad por convolución.

    Promediado : hay diversas máscaras posibles, todas ellas se normalizan.

    Monografias.com

    29
    Suavizamiento de imagen 2
    El ruido, cambio brusco de intensidad, es una señal de alta frecuencia.
    El principal inconveniente de este método es que difumina los contornos (bluring). A mayor ventana mayor difuminado.
    Para evitarlo se pueden emplear varias opciones:
    Promediar solamente pixels que cumplan cierta condición:
    El valor del pixel cae en un rango f(i,j) ?[min,max]
    La diferencia de pixels no excede de una cota.
    Utilización previa de gradientes, solo se emplearán los puntos cuyo gradiente sea inferior a un umbral.
    Promediar de acuerdo a un gradiente inverso.
    Promediar utilizando máscaras rotatorias, busca partes homogéneas en la vecindad del pixel.

    Monografias.com

    30
    Propiedades de los filtros de suavizamiento
    No deben desplazar la posición de los objetos en la imagen.
    Deben ser de fase cero, por tanto su función de transferencia es real, deben tener una máscara simétrica.
    Deben preservar la media
    La componente de f=0 debe ser 1, la suma de todos los coeficientes de la máscara es 1.
    Función de transferencia decreciente monótona. Deben eliminarse los objetos pequeños antes que los grandes.
    La función de transferencia decrece monótonamente con la f.
    Isotropía, no debe favorecerse ninguna dirección (en los espacios discretos solo se consigue aproximadamente).

    Monografias.com

    31
    Tipos de filtros de suavizamiento
    Filtros de caja (por convolución).
    Suavizamiento de la mediana. Reemplaza el valor del pixel por el de la mediana de un entorno de vecindad.
    No emplean técnicas de convolución, ordenación de números.
    Muy buen resultado con ruido impulsional.
    Son computacionalmente más costosos.
    Filtros definidos en frecuencia:
    El ruido es alta frecuencia, eliminable con filtros paso bajo:
    Filtros discretos finitos (FIR).
    Filtros discretos infinitos (IIR).
    Filtros analógicos discretizados (Buterworth u otros).
    Filtrado por convolución con una máscara de tipo Gaussianno. La desviación típica condiciona el tamaño de la máscara.

    Monografias.com

    32
    Filtros de caja
    Funcionan promediando en un entorno de vecindad.

    Se observa su labor de suavizamiento, pero no respetan bien las escalas.

    R=1/3+2/3*cos(?K)
    El uso de filtros mayores no mejora significativamente los resultados
    Los filtros de caja son separables.
    No son isótropos
    (Gp:) 3
    (Gp:) 5
    (Gp:) 7
    (Gp:) 9

    Monografias.com

    33
    Filtros binomiales 1.
    A partir de un filtro sencillo B=1/2[11] pueden obtenerse por convolución filtros más complejos Bp=B*B*B…..*B (p veces).
    p f Coeficientes del filtro ?2
    0 1 1 0
    1 1/2 1 1 1/4
    2 1/4 1 2 1 1/2
    3 1/8 1 3 3 1 3/4
    4 1/16 1 4 6 4 1 1
    5 1/32 1 5 10 10 5 1 5/4
    6 1/64 1 6 15 20 15 6 1 3/2
    La función de transferencia se obtiene a partir de:

    Monografias.com

    34
    Filtros binomiales 2.
    Ofrecen un mejor suavizado
    que los filtros de caja.
    Para máscaras grandes se
    aproxima a una distribución
    gaussiana.
    A mayor máscara menor
    es la frecuencia de corte.
    Es más isotrópico que los
    filtros de caja.
    Son separables para el caso 2D.
    Bp=Bpx Bpy.

    2
    4
    8
    16

    Monografias.com

    35
    Filtros Gaussianos 1.
    Se aplican mediante convolución con una máscara cuyo tamaño y valor depende de la varianza ? según la fórmula:

    A mayor ? más atenúa y más voluminoso y lento es el filtro.
    Mediante ? se afecta a la resolución del filtro, a menos varianza menor cantidad de detalle que se pierde.
    Se trata de un filtro separable

    Son también base para filtros detectores de contorno.
    Se puede asumir como ancho de caja W

    Monografias.com

    36
    Filtros Gaussianos 2.

    Monografias.com

    37
    Filtros de mediana
    Son filtros no lineales que funcionan bien con ruido impulsional.
    Su funcionamiento se basa en el ordenamiento de una vecindad contenida en el tamaño de una máscara. Tras ordenar los pixels de la vecindad el valor del pixel en estudio es sustituido por la mediana de la vecindad.
    Ejemplo con máscara 1*3
    …..1 2 3 7 8 9 …… …..1 2 3 7 8 9 ……
    …..1 2 36 4 5 6 …… …..1 2 4 5 5 6 ……
    …..0 0 0 9 9 9…… ….. 0 0 0 9 9 9 ……
    Preservan bastante bien los contornos sin difuminarlos.
    Computacionalmente son más costosos que los basados en convoluciones.

    Monografias.com

    38
    Comparación filtro de promediado y de mediana.
    Ventana 5*1
    Imagen original Filtro promediado Filtro de mediana

    Monografias.com

    39
    Suavizamiento de una imagen con ruido impulsional
    Imagen original
    Imagen con ruido
    Imagen filtrada
    Promediado 3*3
    Mediana 3*3

    Monografias.com

    40
    Suavizamiento de una imagen con ruido gaussiano
    Imagen original
    Imagen con ruido
    Imagen filtrada
    Promediado 3*3
    Mediana 3*3

    Monografias.com

    41
    Propiedades de los detectores de contorno 1
    La detección de contornos es un paso típico, previo a muchos procesos de segmentación.
    La visión humana emplea mucho la detección de contornos.
    Hay dos tendencias:
    Uso de derivadas.
    Encaje de modelos.
    Un buen detector de contorno debería verificar:
    El contorno obtenido debe ser fino. (única respuesta).
    El contorno debe aparece en su lugar correcto, no estar desplazado.
    No debe mostrar respuestas en regiones uniformes. (Buena detección)
    Los contornos implican cambios bruscos en los niveles de gris:
    Esto es una señal de alta frecuencia. La derivada de la función de intensidad luminosa es alta, más cuanto más fuerte sea el contorno.

    Monografias.com

    42
    Detectores de contorno derivativos
    (Gp:) Derivada primera

    (Gp:) Derivada segunda

    Monografias.com

    43
    Propiedades de los detectores de contorno 2
    Un filtro derivativo de orden p corresponde a una multiplicación por (ik)p en el espacio frecuencial (k=frecuencia).
    Sin desplazamiento:
    En los filtros de promediado implica que la función de transferencia es real y que la máscara de convolución es simétrica.
    Para un filtro derivativo de primer orden la función de transferencia debe ser imaginaria y la máscara de convolución antisimétrica. (h-n = – hn ).
    Para una máscara con nº pixels impar => pixel central=0.
    Un filtro derivativo de 2º orden debe ser simétrico, como los de suavizamiento.
    Supresión del valor medio, no deben responder a niveles continuos.
    La suma de los coeficientes debe ser cero
    La función de transferencia debe ser 0 para k=0.

    Monografias.com

    44
    Propiedades de los detectores de contorno 3
    Derivación no selectiva, amplifica más las escalas pequeñas que las grandes, la función de transferencia debería incrementarse con la frecuencia monótonamente.
    Propiedades de simetría, para permitir el cálculo de la convolución de manera más eficiente.
    También ayuda en el uso de la función de transferencia pues solo existen términos en senos (imaginarios).
    Isotropía, no debe haber direcciones privilegiadas. Esta propiedad se puede analizar mejor estudiando las funciones de transferencia.

    Monografias.com

    45
    Detectores de contorno basados en derivadas
    Hay dos clases principales de detectores
    Emplean derivadas de primer orden.
    Emplean derivadas de 2º orden.
    Se puede utilizar el vector gradiente que da información de la dirección de máxima variación de la magnitud.

    El módulo del gradiente informa acerca de la fuerza del borde.

    La dirección de contorno viene dada por:

    Monografias.com

    46
    Aproximaciones al gradiente
    Diferencias discretas de primer orden .

    Calculo en dos dimensiones
    Detección de filas
    Detección de columnas
    Combinación del gradiente
    F(j,k)

    Monografias.com

    47
    Operadores de gradiente
    El gradiente se puede calcular por aproximación discreta:

    También es posible calcular la laplaciana de manera discreta.

    Este último operador no suele emplearse directamente, produce bordes dobles y es muy sensible al ruido. Sin embargo sus pasos por cero si son buenos indicadores de contornos.

    Monografias.com

    48
    Detección con máscaras múltiples
    Se toma una base de vectores y se proyecta sobre ella una vecindad de pixels.
    En esencia se basa en realizar convoluciones con una serie de máscaras que forman una base.
    Se calcula el módulo para cada proyección.
    La respuesta mayor da ya el módulo y la dirección del gradiente.

    3 de las 12 máscaras de Kirsch.
    En esencia se correla la imagen con patrones en todas las direcciones posibles.

    Monografias.com

    49
    Detección de contornos con operadores de gradiente 1

    Imagen original con borde
    en escalón
    0 0 0 10 10 10 10 10 0 0 0
    0 0 0 10 10 10 10 10 0 0 0
    0 0 0 10 10 10 10 10 0 0 0
    0 0 0 10 10 10 10 10 0 0 0
    0 0 0 10 10 10 10 10 0 0 0
    0 0 0 10 10 10 10 10 0 0 0
    0 0 0 10 10 10 10 10 0 0 0

    Monografias.com

    50
    Detección de contornos con operadores de gradiente 2

    (Gp:) 0 0 20 20 0 0 0 20 20 0 0
    0 0 30 30 0 0 0 30 30 0 0
    0 0 30 30 0 0 0 30 30 0 0
    0 0 30 30 0 0 0 30 30 0 0
    0 0 30 30 0 0 0 30 30 0 0
    0 0 30 30 0 0 0 30 30 0 0
    0 0 20 20 0 0 0 20 20 0 0
    (Gp:) 1 0 -1
    2 0 -2
    1 0 -1
    (Gp:) Sobel

    (Gp:) 0.1667 0.6667 0.1667
    0.6667 -3.3333 0.6667
    0.1667 0.6667 0.1667
    (Gp:) Laplaciana
    (Gp:) 0 0 8 18 9 9 9 18 8 0 0
    0 0 10 9 0 0 0 9 10 0 0
    0 0 10 9 0 0 0 9 10 0 0
    0 0 10 9 0 0 0 9 10 0 0
    0 0 10 9 0 0 0 9 10 0 0
    0 0 10 9 0 0 0 9 10 0 0
    0 0 8 18 9 9 9 18 8 0 0

    Monografias.com

    51
    Imagen de prueba, bordes en rampa

    Monografias.com

    52
    Detección de contornos en rampa

    (Gp:) 0 0 0 12 24 24 24 24 12 0 0 0
    0 0 0 16 32 32 32 32 16 0 0 0
    0 0 0 16 32 32 32 32 16 0 0 0
    0 0 0 16 32 32 32 32 16 0 0 0
    0 0 0 16 32 32 32 32 16 0 0 0
    0 0 0 16 32 32 32 32 16 0 0 0
    0 0 0 16 32 32 32 32 16 0 0 0
    0 0 0 12 24 24 24 24 12 0 0 0
    (Gp:) Con operador de Sobel

    (Gp:) 0 0 0 3 3 8 11 15 23 19 19 19
    0 0 0 4 0 0 0 0 3 0 0 0
    0 0 0 4 0 0 0 0 3 0 0 0
    0 0 0 4 0 0 0 0 3 0 0 0
    0 0 0 4 0 0 0 0 3 0 0 0
    0 0 0 4 0 0 0 0 3 0 0 0
    0 0 0 4 0 0 0 0 3 0 0 0
    0 0 0 3 3 8 11 15 23 19 19 19
    (Gp:) Con operador de Laplace

    Monografias.com

    53
    Detección de contornos con filtros de Sobel
    (Gp:) Imagen original

    Imagen filtrada

    (Gp:) Contornos horizontales
    Contornos verticales

    Monografias.com

    54
    Detectores de gradientes
    Máscaras comunes para el cálculo de gradientes.
    (Gp:) Gradiente de fila
    (Gp:) Gradiente de columna
    (Gp:) Gradiente de fila
    (Gp:) Gradiente de columna

    Hf(i,j)
    Hc(i,j)
    | · | +| · |
    F(i,j)
    > umbral en (i0,j0) ?
    |G(i,j)|
    Si, es punto de borde
    No, no es punto de borde

    Monografias.com

    55
    Combinación de suavizado y gradiente
    Para que el operador gradiente sea menos vulnerable al ruido puede suavizarse la imagen previamente.

    HG es un operador cualquiera de gradiente y HS lo es de suavizado.
    Un operador que combina gradiente y suavizado de manera más eficaz es DroG (“Derivative of Gaussian”).

    Monografias.com

    56
    DroG
    Dado que gradiente y convolución son operadores lineales:

    El operador DroG se define, teniendo en cuenta el carácter separable de la gaussiana:

    Es preciso discretizar esta fórmula, dependerá del valor de ?.

    Monografias.com

    57
    Detección con Laplaciana de la Gaussiana.
    Este tipo de detección se realiza en varios pasos:
    Convolución de la imagen con una máscara de Gauss G(x,i).
    Convolución del resultado con una máscara de Laplace.
    Detección de los pasos por cero de la imagen resultado.
    Tiene varias propiedades que simplifican su uso:
    Los operadores son conmutativos, por lo que para una varianza dada puede derivarse un filtro único llamado LOG.

    Es separable en 4 convoluciones unidimensionales (reduce las operaciones del orden n2 a 4n).

    Monografias.com

    58
    El operador LOG
    El operador Laplaciana es muy sensible al ruido, por lo que se combina con la Gaussiana.

    El operador LoG presenta simetría radial y se parece a un sombrero mejicano.
    La combinación de un filtro pasa-baja (gaussina) y pasa-alta (Laplaciana) da lugar a un filtro pasa banda controlado por ?.
    Su calculo se puede separar.

    Monografias.com

    59
    El operador DOG
    Una alternativa a la expresión anterior es aproximar el cálculo de LOG por una Diferencia de Gaussianas (DOG) para desviaciones típicas ?1 < ?2

    Marr y Hildreth demostraron que la proporción ?2 / ?1=1.6 es la que mejor se aproxima al operador LOG.
    Al igual que sucede con la Laplaciana los cruces por cero obtenidos tras aplicar el LOG suelen producir contornos cerrados.
    Tras aplicar LOG (DOG) se requiere detectar los cruces por cero.

    Monografias.com

    60
    Detector de Marr y Hildreth
    Establecieron que los cambios de intensidad en imágenes reales ocurren sobre un amplio rango de escalas o resoluciones. Un único filtro no pude ser óptimo para todas ellas.
    Proponen un suavizado previo a distintas escalas o niveles.
    Después detectan los cambios de intensidad en cada nivel.
    A la hora de suavizar una imagen se considerará:
    Debe reducir el rango de escalas en el que se producirán cambio de intensidad. Su actuación debe estar localizada en frecuencia.
    Las discontinuidades se originan por distintos motivos. En el dominio espacial todos estos cambios pueden producirse a distintas escalas espaciales.

    Monografias.com

    61
    Detección de contornos con laplaciana de la gaussiana (LOG)
    (Gp:) Imagen original

    (Gp:) Filtrada con varianza 2.3

    (Gp:) Filtrada con varianza 1.5

    (Gp:) Filtrada con varianza 0.8

    Monografias.com

    62
    Detector de Canny
    Está basado en un desarrollo analítico de optimización partiendo de un modelo continuo unidimensional de un escalón.
    La función h buscada debe satisfacer los criterios:
    Buena detección maximizando la relación señal ruido
    Buena localización
    Respuesta única
    En señales bidimensionales discretas el operador de Canny se aproxima mediante la derivada de la Gaussina en la dirección perpendicular al borde.
    Calcular módulo y gradiente de la imagen suavizada aplicando DroG
    En la dirección del gradiente eliminar los puntos que no sean máximos locales (equivale a buscar pasos por 0)

    Monografias.com

    63
    Segmentación de la imagen
    Es el proceso que divide la imagen en regiones u objetos cuyos píxeles poseen atributos similares (niveles de gris, textura etc.)
    Se pueden clasificar en :
    Técnicas basadas en la detección de fronteras
    Técnicas de umbralización.
    Técnicas basadas en el agrupamiento de píxeles..
    En las dos últimas categorías se estima que:
    Píxeles de una misma región deben ser similares.
    Píxeles de regiones distintas deben ser no-similares.
    Las regiones resultantes deben tener cierto significado para el procesamiento posterior.

    Monografias.com

    64
    Enlazado de bordes y detección de límites
    Idealmente, tras pasar un detector de contornos, se obtendrían líneas continuas de alta intensidad sobre un fondo oscuro pero:
    El ruido introduce puntos espureos.
    Una iluminación no uniforme falsea los contornos.
    Hay contornos que pueden aparecer debilitados.
    Se deben aplicar algoritmos de seguimiento de contornos, algunos métodos son:
    Procesamiento local.
    Procesamiento global con la transformada de Hough.
    Procesamiento global con técnicas de la teoría de grafos.

    Monografias.com

    65
    Procesamiento local.
    Se analizan las características de los pixels en una pequeña vecindad (3*3 o 5*5) respecto a cada (x,y) susceptible de pertenecer a un contorno. Luego se enlazan.
    Las propiedades que se suelen analizar son:
    Intensidad (módulo) del gradiente.
    Dirección del gradiente.
    T,A umbrales
    Un punto en una vecindad de (x,y) estará enlazado con el mismo si satisface los criterios anteriores.
    El proceso se repite para cada punto de la imagen actualizandose un registro.

    Monografias.com

    66
    Procesamiento global con la transformada de Hough 1.
    Busca enlazar puntos que se encuentran en una curva específica.
    Búsqueda de rectas en un subconjunto de n puntos.

    La ecuación de una recta se puede expresar como:

    Se hace un cambio de espacio paramétrico.
    (Gp:) y
    (Gp:) x
    (Gp:) (xi,yi)
    (Gp:) b
    (Gp:) (xj,yj)

    (Gp:) b
    (Gp:) a
    (Gp:) (a’,b’)
    (Gp:) yi
    (Gp:) yj

    Monografias.com

    67
    Procesamiento global con la transformada de Hough 2.
    Se subdivide el nuevo espacio en células acumuladoras. Inicialmente
    todas las celdas a cero. Para cada (xk,yk) del plano imagen se prueba con cada ai de los acumuladores y se busca el b correspondiente según la expresión de la recta vista antes. Se redondea al b más próximo y se incrementa el acumulador ai,bj.
    Las rectas corresponderán a los acumuladores más altos.
    El algoritmo resulta computacionalmente más eficiente expresando la recta en coordenadas polares.

    Existen versiones generalizadas para detectar otras figuras geométricas (círculos, elipses etc.)
    (Gp:) bmin
    (Gp:) bmax
    (Gp:) 0
    (Gp:) 0
    (Gp:) amin
    (Gp:) amax

    Monografias.com

    68
    Ejemplo de transformada de Hough
    Imagen con recta vertical en el centro
    Espacio de acumuladores

    Monografias.com

    69
    Procesamiento global por medio de la teoría de grafos
    Es un proceso más complicado pero con buenos resultados aún con imágenes ruidosas.
    Se establece un grafo, formado por un conjunto N de nodos y un conjunto de pares desordenados de elementos de N (arcos).
    Los arcos se dirigen de nodo ni al nj, entonces nj se dice sucesor de ni.
    Se asocia un coste c(ni,nj) con cada arco.
    Una sucesión de nodos acarrea un coste.
    Se debe establecer un tipo de vecindad.
    Se decide cual es la función de coste que interesa.
    Se expande el grafo desde un nodo fuente hasta llegar a un nodo meta.

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter