Escolar Documentos
Profissional Documentos
Cultura Documentos
Unidad 1 introduccin
1.1 Panormica de la Visin Artificial
La visin artificial, tambin conocida como visin por
computador (del ingls computer vision) o visin tcnica, es un subcampo de
la inteligencia artificial. El propsito de la visin artificial es programar
un computador para que "entienda" una escena o las caractersticas de una
imagen.
Los objetivos tpicos de la visin artificial incluyen:
Correccin radiomtrica
Tipos de error:
Interferencia atmosferica
Correccin geomtrica
Mejoramiento de imagen
Filtracin
Transformaciones especiales
ndices de vegetacin
Ej., fotointerpretacin
Clasificacin no-supervisada
Clasificacin supervisada
Deteccin de cambios
2. Umbral multinivel. Dada una imagen con x clase de objetos, para separarlos
todos hacen falta x-1 umbrales de forma que los pxeles que se encuentran
entre cada par de umbrales Ti y Tj representarn a una clase de objeto.
Los umbrales elegidos pueden ser de varios tipos dependiendo de las
caractersticas tenidas en cuenta para su eleccin.
Segmentacin basada en modelos
La hiptesis central de este enfoque es que las estructuras de inters tienen una
forma geometra repetitiva. Por lo tanto, se puede buscar un modelo probabilstico
para explicar la variacin de la forma de la estructura y luego cuando se segmenta
una imagen se imponen limitaciones para tomar la imagen como el modelo elegido
a priori. Esta tarea implica:
1. La seleccin de los ejemplos de entrenamiento (ejemplos que se usan para
probar los modelos).
2. La representacin probabilstica de la variacin de los ejemplos
seleccionados.
3. La inferencia estadstica entre el modelo y la imagen.
El estado del arte para la segmentacin basada e en el conocimiento implica la
forma activa y los modelos de apariencia, contornos activos y una plantilla
deformable y mtodos basados en niveles.
Segmentacin multi-escala
Las segmentaciones de la imagen se calculan en mltiples escalas y a veces se
propaga de gran escala a pequea escala. Los criterios de segmentacin pueden
ser arbitrariamente complejos y se pueden tener en cuenta tanto criterios globales
como locales. Un requisito comn es que cada regin debe estar conectada en
algn sentido.
Segmentacin jerrquica de seales unidimensionales
El trabajo de Witkin en el espacio escalar incluye la nocin de que una seal
unidimensional podra ser inequvocamente segmentado en regiones, con un
parmetro de control de la escala de segmentacin. Una observacin clave es que
los pases por cero de las derivadas segundas (mnimos y mximos de la primera
derivada o pendiente) de las versiones multi-escala-alisadas de una seal forman
un nido de rbol, que define las relaciones jerrquicas entre los segmentos a
estructuras de la imagen con las escalas han sido recogidos por Florack y Kuijper.
Bijaoui y Rue asociaron las estructuras detectadas en la escala espacial por
encima de un umbral mnimo en un rbol de objetos que abarca mltiples escalas
y se corresponde con un tipo de funcin en la seal original. Las caractersticas
extradas son exactamente reconstruida usando un mtodo iterativo conjugado
con de la matriz de gradiente.
Segmentacin Semi-automtica
En este tipo de segmentacin, el usuario define las regiones de inters con clics
del ratn y los algoritmos se aplicarn de forma que se elige el camino que mejor
se ajusta al borde de la imagen. Tcnicas como la SIOX, Livewire, o tijeras
inteligentes se utilizan en este tipo de segmentacin.
Redes neuronales de segmentacin
Las redes neuronales de segmentacin se basan en el procesamiento de
pequeas reas de una imagen utilizando una red neuronal artificial o un conjunto
de redes neuronales. Despus de este proceso de decisin se construye un
mecanismo que marca las reas de una imagen de acuerdo a la categora
reconocida por la red neuronal. Un tipo de red diseada especialmente para esto
es el mapa de Kohonen. Las redes neuronales de parejas de pulsos (PCNNs) son
modelos neuronales propuesto por modelos corteza visual de un gato y
desarrollado para un alto rendimiento de procesamiento de imgenes
biomimticas. En 1989, Eckhorn present un modelo neuronal para emular el
mecanismo de la corteza visual del gato. El modelo de Eckhorn proporciona una
herramienta sencilla y eficaz para estudiar la corteza visual de mamferos
pequeos, y pronto fue reconocido por ser una aplicacin con un gran potencial en
el procesamiento de imgenes. En 1994, el modelo de Eckhorn fue adaptado para
ser un algoritmo de procesamiento de imgenes por Johnson, quien calific este
algoritmo como Pulse-Coupled Neural Network. Aproximadamente desde el ao
2000, PCNNs (por sus siglas en ngles) han sido utilizados para una variedad de
aplicaciones de procesamiento de imagen, incluyendo: segmentacin de
imgenes, generacin de caractersticas, generacin de funciones, la extraccin
de rostros, deteccin de movimiento, deteccin de regiones en crecimiento,
reduccin de ruido, etc. Un PCNN es una red neuronal de dos dimensiones. Cada
neurona en la red corresponde a un pxel en una imagen de entrada, recibiendo la
informacin del color de su correspondiente pixel como un estmulo externo. Cada
neurona se conecta con sus neuronas vecinas, recibiendo estmulos locales de
ellas. Los estmulos externos y locales se combinan en un sistema de activacin
interna, que acumula los estmulos hasta que se excede un umbral dinmico,
dando como resultado una salida de pulsos. A travs de clculos iterativos, las
neuronas PCNN producen series temporales de impulsos de salidas. La serie
temporal de impulsos de salidas contiene informacin de la imagen de entrada y
puede ser utilizado para varias aplicaciones de procesamiento de imgenes, tales
como la segmentacin de la imagen y la generacin de caractersticas.
Comparado con los medios convencionales de procesamiento de imgenes,
PCNNs tienen varias ventajas importantes, incluida la robustez frente al ruido, la
independencia de las variaciones en los patrones geomtricos de entrada,
capacidad para pasar por pequeas variaciones en los patrones de intensidad de
entrada, etc.