Escolar Documentos
Profissional Documentos
Cultura Documentos
Captulo 1 Introduccin
Captulo 1 Introduccin
1. INTRODUCCIN
La visin es conocida como uno de los principales procesos de adquisicin de informacin
utilizado por el ser humano para realizar el proceso de percepcin. Remarcamos el aspecto
de que visin es un proceso, ya que la definicin que tratamos de abarcar no es la de captar
solo una imagen sino la de llegar a percibir e interpretar lo que se ve. Lo cual implica
adems de un proceso fisiolgico, un proceso cognitivo incluso hasta cultural. Es decir si
mostramos una imagen a una persona lo que ver la persona no solo depende de lo que es
captado como energa luminosa sino que intervienen adems procesos deductivos e
interpretativos de acuerdo al conocimiento y cultura de la persona. Respecto al proceso de
la percepcin se puede decir que es la interpretacin de estmulos percibidos por los
sentidos humanos que representan el ambiente en que se encuentra una persona.
Al ser la visin un proceso que le permite a una persona obtener una gran cantidad de
informacin del entorno, la cual a su vez le permitir a la persona poder desenvolverse y
realizar actividades en su ambiente, llega a ser un rea de gran inters como objeto de
investigacin cuyo objetivo es tratar de desarrollar mquinas que en cierto grado imiten el
comportamiento de una persona. De aqu entonces podemos tratar de derivar una definicin
de Visin por Computadora. Indicamos una, ya que generalmente dependiendo del rea
donde se trabaja se tiende a dar la definicin. Tratando de no excluir alguna lnea de
investigacin sobre Visin por Computadora diremos que es todo trabajo enfocado a
generar conocimiento, y desarrollar algoritmos para tratar de lograr que una mquina
simule en cierto gado el proceso de visin de una persona.
Captulo 1 Introduccin
creativo ms que mecnico, en el cual podemos diferenciar entre ver y percibir. Ver es el
registro fsico del patrn de energa de luz recibida del mundo que nos rodea. Percepcin es
la interpretacin de lo que vemos.
A continuacin se muestran las partes bsicas del ojo humano y se describen las
funciones principales implicadas en el proceso de visn. La Figura 1.1 muestra las partes
bsicas del proceso de visin, ojo y corteza visual cerebral, y las partes principales del ojo
humano.
La funcin del iris es la de controlar la cantidad de luz que entra al ojo. El lente o
cristalino permite enfocar la imagen sobre la retina. La retina contiene conos y bastones, los
cuales realizan la transformacin de energa luminosa a impulsos elctricos. Los conos que
son aproximadamente 6-7 millones se encuentran principalmente en la parte central de la
retina, llamada fovea y son altamente sensibles al color por lo que se utilizan para captar
detalles finos. Los bastones en un nmero de 75 a 150 millones distribuidos sobre la
superficie de la retina, (M.A. Fischler [1987]), proporciona una imagen general del campo
de visin. Los bastones son sensitivos a niveles bajos de iluminacin. Por eso en ocasiones
se recomienda para ver mejor al entrar a un lugar con baja iluminacin no fijar la vista. Si
fijamos la vista el ojo enfocar la luz principalmente en la fovea donde hay una mayor
concentracin de conos pero que tiene menos sensibilidad que los conos. En cambio si
tratamos de no fijar la vista el sistema de visin captar una visin perifrica la cual es
formada principalmente por los bastones, los cuales son ms sensibles a la luz y como
consecuencia percibiremos una mejor imagen.
Los procesos ms complejos del proceso de visin como el anlisis e interpretacin se
realizan en la corteza visual. En estos procesos intervienen diferentes tipos de neuronas y
redes de neuronas que realizan funciones especializadas sobre la imagen recibida. Para
mayor informacin sobre este punto se puede consultar (M.A. Fischler [1987], Deutch
[1993], Chengiun [2003]).
Captulo 1 Introduccin
1.2 Modelo de Visin por Computadora
Un modelo para realizar visin mediante una computadora define los niveles y procesos
que se realizan sobre una escena para llegar a su interpretacin. La Figura 1.2 muestra que
el modelo se puede dividir en el procesamiento de nivel bajo, nivel intermedio y nivel alto.
En el nivel bajo encontramos acciones sobre la imagen que define a la escena
correspondientes a suavizado, umbralizacin, eliminacin de ruido, definicin de bordes,
anlisis de textura, etc. En el nivel intermedio en cambio tenemos acciones como definicin
de lmites, regiones, superficies, que estn relacionadas a generar objetos presentes en la
imagen. Por ltimo en el nivel alto se entablarn relaciones entre objetos para realizar la
interpretacin o descripcin de la escena.
Nivel bajo:
Operaciones de
preprocesamiento
Nivel
intermedio:
Determinar
objetos
Nivel alto:
Relacin
entre objetos
y descripcin
Captulo 1 Introduccin
ilustra como se puede generar informacin distinta al sensar diferente tipo de energa de
una misma escena. En la Figura 1.5 y 1.6 se muestran algunas imgenes que muestran
aplicaciones de PDI. La Figura1.5a es referente a la determinacin de la fertilidad humana
mediante el anlisis de trayectorias de espermas. La Figura1.5b, muestra una imagen para
realizar el anlisis de defectos cosmetolgicos en la fabricacin de lentes. La Figura 1.5c es
una imagen de un documento sobre el cual se lleva acabo la tarea de clasificar reas con
texto y reas con imgenes. La Figura1.6a presenta un mejoramiento de una imagen de
rayos X. En la Figura1.6b se ilustra parte del procesamiento de imgenes de autos para la
localizacin de placas. La Figura1.6c muestra procesamiento realizado para la clasificacin
de camarones por talla. En la Figura1.6d se ilustra la aplicacin de la generacin de objetos
en 3D de imgenes de resonancia magntica y su procesamiento por capas y la Figura1.5e
muestra una imagen obtenida durante la noche con una cmara con sensor cercano a
infrarrojo para aplicaciones de seguridad.
Gama
Uv
0.4E-6
Violeta
0.5E-6
Azul
IR
0.6E-6
Verde Amarillo
Mo
Radio
0.7E-6
Naranja Rojo
Captulo 1 Introduccin
a)
b)
Figura1. 4 a) Rango infrarrojo b) Rango Radio.
a)
b)
c)
Figura 1. 5 Ejemplos de imgenes y sus aplicaciones. a) Espermas, anlisis de fertilidad, b) Defectos en lente,
calidad de producto c) Documento, anlisis de documentos.
Captulo 1 Introduccin
a)
b)
c)
d)
e)
Figura1. 6 Ejemplos de imgenes y sus aplicaciones, a)Imagen de rayos X, anlisis clnico, e)Localizacin de
placas, sistemas de seguridad, f) Clasificacin de camarn, control de calidad, g) Imagen de resonancia
magntica, anlisis clnico, h) Imagen cercana a infrarrojo, sistemas de seguridad.
Problemas
1.1 Realice una investigacin sobre fuentes bibliogrficas del rea de procesamiento de
imgenes.
1.2 Haga un estudio de investigaciones recientes del funcionamiento del sistema visual
humano.
1.3 Haga un estudio de investigaciones recientes sobre percepcin visual humana.
Captulo 1 Introduccin
1.4 Realice una investigacin sobre productos de sistemas de visin, programas de
desarrollo, cmaras, ptica, accesorios.
1.5 Investigue los principales pasos de diseo de un sistema de visin de mquina.
Referencias
Chacn Murgua Mario I., Jay B. Jordan,[1999], Document region classification using low resolution images:
a human visual perception approach, SPIE International Symposium on Optical Science, Engineering and
Instrumentation.
Chacn Murgua Mario I., Valdez Antonio, [1999],Spermatoza Motion Detection and Trajectory Tracking
Algorithm Based on Orthogonal Search, SPIE International Symposium on Optical Science, Engineering and
Instrumentation.
Chacn Murgua Mario I., Jordan Jay, [1999],Fuzzy Neural Nertwork for Document Region Classification
Using Human Visual Perception Features, International Joint Neural Network, Washington D.C.
Chacn Murgua Mario Ignacio, [1998],Document Segmentation Using Texture Variance and Low
Resolution Images, IEEE Southwest Symposium on Image Analysis and Interpretation , Tucson, AZ, USA.
Chacn Murgua Mario Ignacio,[1997], "Document Segmentation Using a global Fuzzy Edge Detector,"
Artificial Neural Networks in Engineering, St Louis Missouri U.S.A.
Chengjun L. y Wechsler H., [2003], Independent component analysis of Gabor features for face recognition,
IEEE Trans. Neural Networks, Vol 14, pp. 919-928.
Deutsch S. y Deutsch A.,[1993], Understanding the Nervous System, IEEE Press, New York.
Fischler M.A. y Firshcein O., [1987], Intelligence, The Eye, The Brain and the Compute, Addison Wesley,
Reading Massachusetts.
Haber N.R., Hershenson M.,[1973], The Psychology of Visual Perception, Holt, Rinehart and Winston Inc.,
Held R. y Richards W., [1972], Perception: Mechanics and Models, W.H. Freeman and Company, San
Francisco.
Jimnez D., Chacn M., Rivera M.,[1998], Frequency Domain Model of an Error Criterion for Image Noise
Reduction, International Conference on System, Signal, Control and Computers, Durban, South Africa.
Lindblad T. y Kinser j. ,[1998], Image Processing Using Pulse-Coupled Neural Networks, Ed. Springer.
Malamas E., Petrakis E., Zervakis M., Petit L. y Legat J.,[2003], A Survey on Industrial Vision Systems,
Applications and Tools, Image and Vision Computing, 21, pp171-188.
McCafferty J.,[1990], Human and Machine Vision, Computing Perceptual Organization, Ellis Horwood, Ney
York.
Sarkar S. y Boyer K., [1994], Computer Perceptual Organization in Computer Vision, World Scientific
Singapure.
Ullman S.,[1997], High Level Vision, The MIT Press, Cambridge Massachusetts, London England.