Visión Artificial Unidad 1

Visin artificial
Unidad 1 introduccin
1.1 Panormica de la Visin Artificial
La visin artificial, tambin conocida como visin por
computador (del ingls computer vision) o visin tcnica, es un subcampo de
la inteligencia artificial. El propsito de la visin artificial es programar
un computador para que "entienda" una escena o las caractersticas de una
imagen.
Los objetivos tpicos de la visin artificial incluyen:
La deteccin, segmentacin, localizacin y reconocimiento de ciertos

objetos en imgenes (por ejemplo, caras humanas).
La evaluacin de los resultados (por ejemplo, segmentacin, registro).
Registro de diferentes imgenes de una misma escena u objeto, es decir,

hacer concordar un mismo objeto en diversas imgenes.
Seguimiento de un objeto en una secuencia de imgenes.
Mapeo de una escena para generar un modelo tridimensional de la escena;

este modelo podra ser usado por un robot para navegar por la escena.
Estimacin de las posturas tridimensionales de humanos.
Bsqueda de imgenes digitales por su contenido.
Estos objetivos se consiguen por medio de reconocimiento de

patrones, aprendizaje estadstico, geometra de proyeccin, procesamiento de
imgenes, teora de grafos y otros campos. La visin artificial cognitiva est muy
relacionada con la psicologa cognitiva y la computacin biolgica.
1.1.1 Aspectos generales sobre imgenes

Una imagen es una representacin visual de un objeto iluminado por una fuente
radiante. Las que se perciben en las actividades cotidianas provienen
normalmente de la luz reflejada por los objetos. La naturaleza bsica de una
imagen, representada por, est caracterizada por dos componentes: la cantidad de

luz incidente que procede de la fuente de la escena contemplada; y la cantidad de
luz reflejada por los objetos de la escena. Las componentes reciben el nombre de
iluminacin y reflactancia, notndose y respectivamente. Estas funciones al
combinarse como producto obtienen
En el proceso de formacin de la imagen intervienen los siguientes elementos: el
objeto, la fuente radiante y el sistema de formacin de la imagen que consiste,
bsicamente, en un sistema ptico, un sensor y un digitalizador. La imagen digital
puede ser representada por una matriz de dimensiones de la forma:
donde cada elemento, pixel, da la intensidad de la imagen en ese punto

(Gonzlez, 2006).
La digitalizacin de una imagen electrnica o de video capturada por un
microscopio ptico permite obtener un incremento espectacular en las
posibilidades de ampliar caractersticas, extraer informacin o modificar la imagen.
En comparacin con el mecanismo tradicional de captura de imgenes,
la fotomicrografa en pelcula, la digitalizacin de la imagen y el proceso de
postadquisicin/recuperacin permiten una modificacin reversible de la imagen
como matriz ordenada de enteros fundamentalmente libre de ruido, ms que una
mera serie de variaciones anlogas en color e intensidad. Esta seccin trata sobre
diversos temas de actualidad acerca de la adquisicin y procesamiento de
imgenes para microscopa ptica.
Las imgenes de seal continua se reproducen mediante dispositivos electrnicos
analgicos que registran los datos de la imagen con precisin utilizando varios
mtodos, como una secuencia de fluctuaciones de la seal elctrica o cambios en
la naturaleza qumica de la emulsin de una pelcula, que varan continuamente en
los diferentes aspectos de la imagen. Para procesar o visualizar en el ordenador
una seal continua o una imagen analgica, se debe convertir primero a un
formato comprensible para el ordenador o formato digital. Este proceso se aplica a
todas las imgenes, independientemente de su origen, de su complejidad y de si
son en blanco y negro (escala de grises) o a todo color. Una imagen digital se
compone de una matriz rectangular (o cuadrada) de pxeles que representan una
serie de valores de intensidad ordenados en un sistema de coordenadas (x,y).
1.1.2 Sistemas de visin Artificial (SVA).
El sistema de visin artificial (SVA) nace con el desarrollo de la inteligencia

artificial con el fin que una mquina pueda asimilar todos los elementos de una
imagen, as se concibe la visin artificial como el proceso de extraccin de
informacin del mundo fsico a partir de imgenes utilizando para ello un
computador (Cha K. et al. 1992).
El sistema de visin artificial (SVA) surgi a partir del desarrollo de la inteligencia
artificial, con el propsito de programar un computador para que sea capaz de
entender una escena o las caractersticas de una imagen. Por lo que se puede
definir a la visin artificial como el proceso de extraccin de informacin del
mundo fsico a partir de imgenes utilizando para ello un computador. Otra
definicin bastante aceptada es ciencia que estudia la interpretacin de imgenes
mediante computadores digitales.
Diagrama de bloques de un sva
1.1.3 Elementos de un SVA.

Los elementos mnimos necesarios para un sistema de visin artificial (SVA) son
los siguientes:
Sensor ptico: Es un dispositivo capaz de capturar una escena y digitalizarla,
puede ser una cmara. Las cmaras industriales ms populares estn basadas en
CCD (dispositivo de carga acoplada), que consisten en una serie de sensores
(pixeles) compuestos cada uno de ellos por una fotoclula y un capacitor
(Peterson, 2001).
Tarjeta de adquisicin de imagen: Permite digitalizar la seal de video entregada
por el sensor ptico.
Computadora: Su funcionamiento es para almacenar y procesar la escena

capturada por un programa.
Monitor de video: Permite visualizar las imgenes o escenas captadas como
resultados del procesamiento de dichas imgenes.
1.1.4 Clases Fundamentales de procesado de imgenes.
EL PROCESAMIENTO de imgenes tiene como objetivo mejorar el aspecto de las
imgenes y hacer ms evidentes en ellas ciertos detalles que se desean hacer
notar. La imagen puede haber sido generada de muchas maneras, por ejemplo,
fotogrficamente, o electrnicamente, por medio de monitores de televisin. El
procesamiento de las imgenes se puede en general hacer por medio de mtodos
pticos, o bien por medio de mtodos digitales, en una computadora. En la
siguiente seccin describiremos muy brevemente estos dos mtodos, pero antes
se har una sntesis brevsima de los principios matemticos implcitos en ambos
mtodos, donde el teorema de Fourier es el eje central.
Procesamiento optico
Los principios del procesamiento ptico de imgenes estn bien
establecidos desde el siglo pasado, cuando se desarroll la teora de la
difraccin de la luz. Sin embargo, su aplicacin prctica data apenas del
principio de la dcada de los sesenta, cuando se comenz a disponer del
rayo lser.
El procesamiento ptico se basa en el hecho de que la imagen de
difraccin de Fraunhofer de una transparencia colocada en el plano focal
frontal de una lente es una distribucin luminosa que representa la
distribucin de las frecuencias de Fourier que componen la imagen, a la
que se le llama tcnicamente transformada de Fourier.
Consideremos el arreglo ptico de la figura 42. En el plano focal frontal de
la lente L1 se ha colocado la transparencia T, la cual est siendo iluminada
por un haz de rayos paralelos provenientes de un lser de gas. Sobre el
plano focal F1 de la lente L1 se forma una distribucin luminosa que
representa la transformada de Fourier de la transparencia. Si ahora se
coloca otra lente L2 como se muestra en la misma figura, se puede formar
una imagen de la transparencia en el plano focal F 2 de esta lente. Si ahora
se coloca cualquier objeto o diafragma sobre el plano F 1, se pueden
eliminar las porciones que se deseen de la transformada de Fourier de la
transparencia, eliminando as de la imagen las frecuencias de Fourier
deseadas.
Cada porcin de la transformada de Fourier corresponde a una frecuencia
espacial diferente sobre el objeto. Por lo tanto, mediante los diafragmas
adecuados se pueden eliminar las frecuencias espaciales, llamadas

tambin de Fourier, que se deseen quitar.
Procesamiento digital
Al igual que en el caso del procesamiento ptico, los principios
fundamentales del procesamiento digital de imgenes estn establecidos
hace muchos aos, pero no se llevaban a cabo debido a la falta de
computadoras. Con la aparicin de las computadoras de alta capacidad y
memoria, era natural que se comenzara a desarrollar este campo. Uno de
los primeros lugares donde se empez a realizar el procesamiento digital
fue en el Jet Propulsion Laboratory, en 1959, con el propsito de mejorar
las imgenes enviadas por los cohetes. Los resultados obtenidos en un
tiempo relativamente corto fueron tan impresionantes que muy pronto se
extendieron las aplicaciones del mtodo a otros campos.
El procesamiento digital de imgenes se efecta dividiendo la imagen en
un arreglo rectangular de elementos, como se muestra en la figura 43.
Cada elemento de la imagen as dividida se conoce con el nombre de
pixel. El siguiente paso es asignar un valor numrico a la luminosidad
promedio de cada pixel. As, los valores de la luminosidad de cada pixel,
con sus coordenadas que indican su posicin, definen completamente la
imagen.
Todos estos nmeros se almacenan en la memoria de una computadora.
El tercer paso es alterar los valores de la luminosidad de los pixeles
mediante las operaciones o transformaciones matemticas necesarias, a
fin de hacer que resalten los detalles de la imagen que sean
convenientes. El paso final es pasar la representacin de estos pixeles a
un monitor de televisin de alta definicin, con el fin de mostrar la imagen
procesada (Figura 44).
Pre-procesamiento para clasificacin
Correccin radiomtrica
Propsito: recuperar los valores reflectancia correctos de

los objetos telesensados.
Tipos de error:
Fallas del instrumento
Reflectancia modificada por topografia
Interferencia atmosferica
Correccin geomtrica
Mejoramiento de imagen
Mejoramiento de contraste (estiramiento de histograma)
Filtracin
Transformaciones especiales
Extraccin de componentes principales
ndices de vegetacin
Extraccin de informacin temtica
Por interpretacin visual
Ej., fotointerpretacin
Por interpretacin espectral
Clasificacin no-supervisada
Clasificacin supervisada
Clasificacin por inteligencia artificial
Deteccin de cambios
1.1.5 Algoritmos y aplicaciones sobre imgenes digitales.
La segmentacin en el campo de la visin artificial es el proceso de dividir

una imagen digital en varias partes (grupos de pxeles) u objetos. El objetivo de la
segmentacin es simplificar y/o cambiar la representacin de una imagen en otra
ms significativa y ms fcil de analizar. La segmentacin se usa tanto para
localizar objetos como para encontrar los lmites de estos dentro de una imagen.
Ms precisamente, la segmentacin de la imagen es el proceso de asignacin de
una etiqueta a cada pxel de la imagen de forma que los pxeles que compartan la
misma etiqueta tambin tendrn ciertas caractersticas visuales similares.
El resultado de la segmentacin de una imagen es un conjunto de segmentos que

cubren en conjunto a toda la imagen, o un conjunto de las curvas de
nivel extradas de la imagen (vase la deteccin de bordes). Cada uno de los
pxeles de una regin son similares en alguna caracterstica, como el color,
la intensidad o la textura. Regiones adyacentes son significativamente diferentes
con respecto a la(s) misma(s) caracterstica(s).
Mtodos de agrupamiento (Clustering)

El Algoritmo de las K-medias es una tcnica iterativa que se utiliza para dividir una
imagen en K clusters. El algoritmo bsico es:
1. Escoger K centros de clusters, ya sea de forma aleatoria o basndose en
algn mtodo heurstico.
2. Asignar a cada pxel de la imagen el clster que minimiza la varianza entre
el pixel y el centro del cluster.
3. Recalcular los centros de los clusters haciendo la media de todos los
pixeles del cluster.
4. Repetir los pasos 2 y 3 hasta que se consigue la convergencia (por
ejemplo, los pixeles no cambian de clusters).
En este caso, la varianza es la diferencia absoluta entre un pxel y el centro del
cluster. La diferencia se basa tpicamente en color, la intensidad, la textura, y la
localizacin del pixel, o una combinacin ponderada de estos factores. El nmero
K se puede seleccionar manualmente, aleatoriamente, o por una heurstica. Este
algoritmo garantiza la convergencia, pero puede devolver una solucin que no sea
ptima. La calidad de la solucin depende de la serie inicial de clusters y del valor
de K. En estadstica y aprendizaje automtico, el algoritmo de las k-medias es un
algoritmo de agrupamiento para dividir objetos en k grupos, donde k <n. Es similar
al algoritmo de maximizacin de expectativas para las mezclas de gaussianas ya
que ambos pretenden encontrar los centros de agrupaciones naturales de los
datos. El modelo requiere que los atributos del objeto correspondan a los
elementos de un espacio vectorial. El objetivo es intentar alcanzar al mnima
varianza total entre clusters, o, la funcin de error al cuadrado. El algoritmo de las
k-medias fue inventado en 1956. La forma ms comn del algoritmo usa una
heurstica de refinamiento conocido como el algoritmo de Lloyd. El algoritmo de

Lloyd comienza dividiendo los puntos de entrada en k conjuntos inciales, ya sea al
azar o usando algunos datos heursticos y a continuacin, calcula el punto medio o
centro de gravedad de cada conjunto. Se construye una nueva particin,
asociando cada punto con el centro de gravedad ms cercano. Luego se
recalculan los baricentros es para los nuevos clusters, y el algoritmo se repite
alternando la aplicacin de estos dos pasos hasta que la converja, que se obtiene
cuando los puntos ya no cambiar de cluster (o los centros de gravedad ya no se
modifican). Los algoritmos de Lloyd y de las K-medias a menudo se utilizan como
sinnimos, pero en realidad el algoritmo de Lloyd es una heurstica para resolver
el problema de las K-medias, como ocurre con ciertas combinaciones de puntos
de partida y baricentros, el algoritmo de Lloyd puede converger a una solucin
incorrecta. Existen otras variantes, pero el algoritmo de Lloyd es el ms popular,
porque converge muy rpidamente. En cuanto al rendimiento, el algoritmo no
garantiza que se devuelva un ptimo global. La calidad de la solucin final
depende en gran medida del conjunto inicial de clusters, y puede, en la prctica,
ser mucho ms pobre que el ptimo global. Dado que el algoritmo es
extremadamente rpido, es un mtodo comn ejecutar el algoritmo varias veces y
devolver las mejores agrupaciones obtenidas. Un inconveniente del algoritmo de
las k-medias es que el nmero de clusters k es un parmetro de entrada. Una
eleccin inadecuada de k puede dar malos resultados. El algoritmo tambin
asume que la varianza es una medida adecuada de la dispersin del cluster.
Demostracin del algoritmo estndar
1) Se selecionan k puntos de la imagen, 3 en este caso(los mostrados en color).
2) Se crean k clusters a partir de los puntos anteriores.
3) El centro de gravedad de cada uno de los grupos k se convierte en el nuevo

medio.
4) Los pasos 2 y 3 se repiten hasta que se alcance la convergencia.

Mtodos basados en el histograma
Los mtodos basados en el histograma son muy eficientes en comparacin con
otros mtodos de segmentacin de la imagen, ya que normalmente requieren slo
una pasada por los pixeles. En esta tcnica, un histograma se calcula a partir de
todos los pxeles de la imagen, y los picos y valles en el histograma se utilizan
para localizar los grupos en la imagen (el color o la intensidad pueden ser usados
como medida). Un refinamiento de esta tcnica consiste en aplicar de forma
recursiva el mtodo de bsqueda de histograma a los clusters de la imagen con el
fin de dividirlos en grupos ms pequeos. Esto se repite con las agrupaciones,
cada vez ms pequeos hasta que no se puedan formar ms agrupaciones. Una
desventaja del mtodo de bsqueda de histograma es que puede ser difcil de

identificar los picos y valles importantes en la imagen.
Deteccin de bordes
La deteccin de bordes es un campo bien desarrollado por s mismo en el
procesamiento de imgenes. Los lmites de regiones y los bordes estn
estrechamente relacionados, ya que a menudo hay un fuerte ajuste en la
intensidad en los lmites de las regiones. Las tcnicas de deteccin de bordes
pueden ser usadas como otra tcnica de segmentacin ms. Los bordes
identificados por la deteccin de bordes en ocasiones estn desconectados. Para
segmentar un objeto a partir de una imagen sin embargo, es necesario que los
bordes formen figuras cerradas.
Mtodos de crecimiento de regiones
El primer mtodo de crecimiento de regiones fue el mtodo de crecimiento de
regiones a partir de semillas. Este mtodo toma un conjunto de semillas como
entrada junto con la imagen. Las semillas marcan cada uno de los objetos que
tienen que ser segmentados. Las regiones crecen iterativamente mediante la
comparacin de todos los pxeles vecinos no asignados a ninguna regin. La
diferencia entre el valor de la intensidad de un pixel y el de la media de la regin,
, se utiliza como una medida de similitud. Cada pixel se asigna a la regin con la
que su diferencia con la media es menor, de esta forma todos los pixeles se
asignan a sus respectivas regiones. Este proceso contina hasta que todos los
pixeles tienen asignada una regin. El mtodo de crecimiento de regiones por
semillas requiere semillas como entrada adicional. Los resultados de la
segmentacin dependen de la eleccin de las semillas. El ruido en la imagen
puede hacer que las semillas queden mal colocadas. El mtodo de crecimiento de
regiones sin semillas es un algoritmo modificado que no requiere semillas
explcitas. Comienza con una nica regin A1 - el pxel elegido aqu no influyen
significativamente en la segmentacin final. En cada iteracin se considera los
pxeles vecinos de la misma manera que con el algoritmo anterior. Se diferencia
del algoritmo el mtodo de crecimiento de regiones a partir de semillas en que si el
mnimo es menor que un umbral predefinido T entonces se agrega a la regin
respectiva Aj. Si no, entonces el pxel se considera significativamente diferente de
todas las actuales regiones Ai y se crea una nueva regin An + 1 con ese pxel.
Una variante de esta tcnica, propuesta por Haralick y Shapiro (1985), se basa en
la intensidad de pxel. La media y la dispersin de una regin y la intensidad del
pxel candidato se utiliza para calcular un test estadstico. Si la prueba estadstica
es suficientemente pequea, el pxel se aade a la regin, y la media de la regin

y de dispersin se vuelven a calcular. De lo contrario, el pxel es rechazado, y se
utiliza para formar una nueva regin.
Mtodo del conjunto de nivel
La propagacin de curvas es una tcnica popular en el anlisis de imgenes para
la extraccin de objetos, seguimiento de objetos, la reconstruccin en 3D, etc. La
idea central de este enfoque consiste en desarrollar una curva hacia el menor
potencial de una funcin de coste que en su definicin refleja la tarea a la que est
dirigida e impone ciertas limitaciones de suavidad. Las tcnicas de Lagrange se
basan en la parametrizacin del contorno de acuerdo con alguna estrategia de
muestreo y luego desarrollar cada elemento de acuerdo a la imagen y sus
condiciones internas. Si bien esta tcnica puede ser muy eficiente, tambin sufre
varias limitaciones, como decidir sobre la estrategia de muestreo, la estimacin de
las propiedades geomtricas internas de la curva, el cambio de su topologa,
abordar los problemas de dimensiones superiores, etc. En cada caso, una
ecuacin en derivadas parciales llamada la ecuacin del conjunto de nivel es
resuelto por diferencia finita. El mtodo del conjunto de nivel fue propuesto
inicialmente para realizar un seguimiento de interfaces mviles por Osher y
Sethian en 1988 y se ha diseminado a travs de varios dominios de imgenes a
finales de los noventa. Se puede utilizar para hacer frente de manera eficiente al
problema de la propagacin de la curva/superficie/etc. de una manera implcita. La
idea central consiste en representar la evolucin del contorno usando una funcin
con signo, donde su nivel cero corresponde al contorno actual. Entonces, de
acuerdo a la ecuacin de movimiento de las curvas de nivel, se puede obtener
fcilmente un flujo similar de la superficie implcita que cuando se aplica al nivel de
cero reflejar la propagacin del contorno. El mtodo del conjunto de nivel tiene
numerosas ventajas: es implcito, no tiene parmetros, ofrece una manera directa
para estimar las propiedades geomtricas de la estructura que evoluciona, puede
cambiar la topologa y es intrnseco. Adems, pueden utilizarse para definir un
marco de optimizacin como el propuesto por Zhao, Merriman y Osher en 1996.
Por lo tanto, se puede concluir que es un ma-rco muy conveniente para hacer
frente a numerosas aplicaciones de visin artificial y anlisis de imgenes
mdicas. Adems, la investigacin en varias estructuras de datos para representar
los conjuntos de nivel ha dado lugar a implementaciones muy eficientes de este
mtodo.
Mtodos de particionamiento grfico
Los mtodos de particionamiento grfico se pueden usar con eficacia en la

segmentacin de imgenes. En estos mtodos, la imagen se modela como
un grafo ponderado no dirigido. Por lo general, un pixel o un grupo de pixeles se
asocian con los nodos y los pesos de las aristas definen la similitud entre los
pxeles vecinos. El grfico (imagen) se divide de acuerdo a un criterio de diseo
para modelar "bien" los clusters. Cada una de las particiones de nodos (pixeles)
da como salida de estos algoritmos los objetos segmentados que hubiese en la
imagen. Algunos algoritmos populares de esta categora son cortes normalizados,
camino aleatorio, el mnimo corte, particionamiento isoperimtrico y rboles de
expansin mnima.
Transformacin divisoria (watershed)
La transformacin divisoria (watershed) calcula las lneas divisorias (de aguas).
Una imagen en escala de grises puede ser vista como un relieve topogrfico,
donde se interpreta el nivel de gris de un pxel como su altura en el relieve.
Tambin, se puede considerar la magnitud del gradiente de una imagen como una
superficie topogrfica. Los pxeles que tienen las ms altas intensidades de
gradiente corresponden a las lneas divisorias, que representan los lmites de las
regiones.
El agua puesta sobre cualquier pxel encerrado por una lnea divisoria comn fluye
colina abajo a un mnimo de intensidad local comn. Los pxeles que drenan a un
mnimo comn forman una cuenca, que representa un segmento de la imagen (un
objeto).
Mtodo del valor umbral (umbralizacin)
El mtodo del valor umbral (umbralizacin) consiste en fijar unos umbrales
(lmites) de forma que los pxeles que se encuentre entre cada par de lmites
formarn un objeto al realizar la segmentacin. En el mtodo del valor umbral hay
dos posibles situaciones:
1. Umbral nico. Se da cuando solamente hay dos agrupaciones de pxeles
semejantes en una imagen (un objeto y el fondo), para separarlos se
establece un umbral T. Los puntos mayores al umbral T sern puntos del
objeto, y los menores a dicho umbral formarn una parte del fondo.
2. Umbral multinivel. Dada una imagen con x clase de objetos, para separarlos
todos hacen falta x-1 umbrales de forma que los pxeles que se encuentran
entre cada par de umbrales Ti y Tj representarn a una clase de objeto.
Los umbrales elegidos pueden ser de varios tipos dependiendo de las
caractersticas tenidas en cuenta para su eleccin.
Segmentacin basada en modelos
La hiptesis central de este enfoque es que las estructuras de inters tienen una
forma geometra repetitiva. Por lo tanto, se puede buscar un modelo probabilstico
para explicar la variacin de la forma de la estructura y luego cuando se segmenta
una imagen se imponen limitaciones para tomar la imagen como el modelo elegido
a priori. Esta tarea implica:
1. La seleccin de los ejemplos de entrenamiento (ejemplos que se usan para
probar los modelos).
2. La representacin probabilstica de la variacin de los ejemplos
seleccionados.
3. La inferencia estadstica entre el modelo y la imagen.
El estado del arte para la segmentacin basada e en el conocimiento implica la
forma activa y los modelos de apariencia, contornos activos y una plantilla
deformable y mtodos basados en niveles.
Segmentacin multi-escala
Las segmentaciones de la imagen se calculan en mltiples escalas y a veces se
propaga de gran escala a pequea escala. Los criterios de segmentacin pueden
ser arbitrariamente complejos y se pueden tener en cuenta tanto criterios globales
como locales. Un requisito comn es que cada regin debe estar conectada en
algn sentido.
Segmentacin jerrquica de seales unidimensionales
El trabajo de Witkin en el espacio escalar incluye la nocin de que una seal
unidimensional podra ser inequvocamente segmentado en regiones, con un
parmetro de control de la escala de segmentacin. Una observacin clave es que
los pases por cero de las derivadas segundas (mnimos y mximos de la primera
derivada o pendiente) de las versiones multi-escala-alisadas de una seal forman
un nido de rbol, que define las relaciones jerrquicas entre los segmentos a
diferentes escalas. En concreto, la pendiente en los extremos a gran escala se

refiere a las correspondientes caractersticas a pequea escala. Cuando una
pendiente mxima y otra mnima se cruzan entre s en una escala mayor, los tres
segmentos que se separaron se funden en un segmento, as se define la jerarqua
de los segmentos.
Segmentacin de imgenes y el boceto original
Ha habido numerosos trabajos de investigacin en esta rea, de los cuales unos
pocos han llegado a un estado en el que puede ser aplicado con la intervencin
manual interactivo (por lo general en aplicacin de imgenes mdicas) o
totalmente automtica. La siguiente es una breve resea de algunas de las ideas
principales ideas en las que se basan las investigaciones actuales. La estructura
de anidacin que Witkin describe es, sin embargo, especfica para las seales de
una sola dimensin y no es trivial la aplicacin a las imgenes de dimensiones
superiores. Sin embargo, esta idea general ha inspirado a algunos otros autores a
investigar el paso de esquemas de grande escala a pequea escala para la
segmentacin de imgenes. Koenderink propone el estudio de cmo la intensidad
de iso-contornos evolucionan en escalas y este enfoque se investig en mayor
detalle por Lifshitz y Pizer. Lamentablemente, sin embargo, la intensidad de las
caractersticas de la imagen cambia con las escalas, lo que implica que es difcil
de rastrear las caractersticas de la imagen a gran escala a pequea escalas
utilizando la informacin de iso-intensidad. Lindeberg estudio el problema de
vincular los extremos locales y los puntos de silla con las escalas, y propuso una
representacin de la imagen primitiva llamada el boceto a escala original que hace
explcitas las relaciones entre las estructuras a escalas diferentes, y tambin que
las caractersticas que la imagen son estables en grandes rangos de escala
incluyendo las escalas apropiadas para ellas. Bergholm propuso para la deteccin
de bordes a gran escala en escalas de espacio y despus llevarlo a pequea
escala con la opcin manual tanto de la deteccin a gran escala como a pequea
escala. Gauch y Pizer estudiaron el problema complementario de las crestas y los
valles en mltiples escalas y desarrollarn una herramienta para la segmentacin
interactiva de imgenes basadas en escalas mltiples watershed. El uso de multiescala watershed con aplicacin al mapa de gradiente tambin ha sido investigado
por Olsen y Nielsen y ha sido portada para el uso clnico por Dam Vincken et al.
que propuso un hyperstack para definir las relaciones probabilsticas entre las
estructuras de la imagen a diferentes escalas. El uso de estructuras estables de
imagen sobre las escalas ha sido promovido por Ahuja y sus colaboradores en un
sistema totalmente automatizado. Ms recientemente, estas ideas para la
segmentacin de imgenes en mltiples escalas mediante la vinculacin de las
estructuras de la imagen con las escalas han sido recogidos por Florack y Kuijper.
Bijaoui y Rue asociaron las estructuras detectadas en la escala espacial por
encima de un umbral mnimo en un rbol de objetos que abarca mltiples escalas
y se corresponde con un tipo de funcin en la seal original. Las caractersticas
extradas son exactamente reconstruida usando un mtodo iterativo conjugado
con de la matriz de gradiente.
Segmentacin Semi-automtica
En este tipo de segmentacin, el usuario define las regiones de inters con clics
del ratn y los algoritmos se aplicarn de forma que se elige el camino que mejor
se ajusta al borde de la imagen. Tcnicas como la SIOX, Livewire, o tijeras
inteligentes se utilizan en este tipo de segmentacin.
Redes neuronales de segmentacin
Las redes neuronales de segmentacin se basan en el procesamiento de
pequeas reas de una imagen utilizando una red neuronal artificial o un conjunto
de redes neuronales. Despus de este proceso de decisin se construye un
mecanismo que marca las reas de una imagen de acuerdo a la categora
reconocida por la red neuronal. Un tipo de red diseada especialmente para esto
es el mapa de Kohonen. Las redes neuronales de parejas de pulsos (PCNNs) son
modelos neuronales propuesto por modelos corteza visual de un gato y
desarrollado para un alto rendimiento de procesamiento de imgenes
biomimticas. En 1989, Eckhorn present un modelo neuronal para emular el
mecanismo de la corteza visual del gato. El modelo de Eckhorn proporciona una
herramienta sencilla y eficaz para estudiar la corteza visual de mamferos
pequeos, y pronto fue reconocido por ser una aplicacin con un gran potencial en
el procesamiento de imgenes. En 1994, el modelo de Eckhorn fue adaptado para
ser un algoritmo de procesamiento de imgenes por Johnson, quien calific este
algoritmo como Pulse-Coupled Neural Network. Aproximadamente desde el ao
2000, PCNNs (por sus siglas en ngles) han sido utilizados para una variedad de
aplicaciones de procesamiento de imagen, incluyendo: segmentacin de
imgenes, generacin de caractersticas, generacin de funciones, la extraccin
de rostros, deteccin de movimiento, deteccin de regiones en crecimiento,
reduccin de ruido, etc. Un PCNN es una red neuronal de dos dimensiones. Cada
neurona en la red corresponde a un pxel en una imagen de entrada, recibiendo la
informacin del color de su correspondiente pixel como un estmulo externo. Cada
neurona se conecta con sus neuronas vecinas, recibiendo estmulos locales de
ellas. Los estmulos externos y locales se combinan en un sistema de activacin
interna, que acumula los estmulos hasta que se excede un umbral dinmico,
dando como resultado una salida de pulsos. A travs de clculos iterativos, las
neuronas PCNN producen series temporales de impulsos de salidas. La serie
temporal de impulsos de salidas contiene informacin de la imagen de entrada y
puede ser utilizado para varias aplicaciones de procesamiento de imgenes, tales
como la segmentacin de la imagen y la generacin de caractersticas.
Comparado con los medios convencionales de procesamiento de imgenes,
PCNNs tienen varias ventajas importantes, incluida la robustez frente al ruido, la
independencia de las variaciones en los patrones geomtricos de entrada,
capacidad para pasar por pequeas variaciones en los patrones de intensidad de
entrada, etc.

Visión Artificial Unidad 1

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Visión Artificial Unidad 1

Enviado por

Direitos autorais:

Formatos disponíveis

Visin artificial

La deteccin, segmentacin, localizacin y reconocimiento de ciertos

La evaluacin de los resultados (por ejemplo, segmentacin, registro).

Registro de diferentes imgenes de una misma escena u objeto, es decir,

Seguimiento de un objeto en una secuencia de imgenes.

Mapeo de una escena para generar un modelo tridimensional de la escena;

Estimacin de las posturas tridimensionales de humanos.

Bsqueda de imgenes digitales por su contenido.

Estos objetivos se consiguen por medio de reconocimiento de

1.1.1 Aspectos generales sobre imgenes

imagen, representada por, est caracterizada por dos componentes: la cantidad de

donde cada elemento, pixel, da la intensidad de la imagen en ese punto

El sistema de visin artificial (SVA) nace con el desarrollo de la inteligencia

Diagrama de bloques de un sva

1.1.3 Elementos de un SVA.

Computadora: Su funcionamiento es para almacenar y procesar la escena

adecuados se pueden eliminar las frecuencias espaciales, llamadas

Pre-procesamiento para clasificacin

Propsito: recuperar los valores reflectancia correctos de

Fallas del instrumento

Reflectancia modificada por topografia

Mejoramiento de contraste (estiramiento de histograma)

Extraccin de componentes principales

Extraccin de informacin temtica

Por interpretacin visual

Por interpretacin espectral

Clasificacin por inteligencia artificial

1.1.5 Algoritmos y aplicaciones sobre imgenes digitales.

La segmentacin en el campo de la visin artificial es el proceso de dividir

El resultado de la segmentacin de una imagen es un conjunto de segmentos que

Mtodos de agrupamiento (Clustering)

heurstica de refinamiento conocido como el algoritmo de Lloyd. El algoritmo de

Demostracin del algoritmo estndar

1) Se selecionan k puntos de la imagen, 3 en este caso(los mostrados en color).

2) Se crean k clusters a partir de los puntos anteriores.

3) El centro de gravedad de cada uno de los grupos k se convierte en el nuevo

4) Los pasos 2 y 3 se repiten hasta que se alcance la convergencia.

desventaja del mtodo de bsqueda de histograma es que puede ser difcil de

es suficientemente pequea, el pxel se aade a la regin, y la media de la regin

Los mtodos de particionamiento grfico se pueden usar con eficacia en la

diferentes escalas. En concreto, la pendiente en los extremos a gran escala se

Você também pode gostar