lll:rrrlri:,rl:iri

:l:t::ll
¡¡
i:i
l.l,!::..,,
lrj.:ili;'i
lilillii'i li:
r:,'t t t,,¡l.,:rl
i
:',;pa:irlp:l
REDES NEURONALES,
VISIÓN COMPUTACIONAL
Y MICROMECÁNICA
!-
REDES NEURONALES,
VISIÓN COMPUTACIONAL
Y MICROMECÁNICA
TaÍiana Baidyk
Ernst Kussul
rt:rGÉ;
_bry
,.r.:l i r' ' i ' .'
^
' i
, ,
W*#
| . r
¡ r ¡ ¡ l r l ¡ 1; r t i o¡ r t l t , t . sl t ,
I os r l t . l l ¡ r , c: , f i l l i r ci ( ) n
c
. l l i l Cl ol l
_Y t l es; r r ¡ ol l o
r l C
i i l i ; :, : ::l i l l , :,
i ,r)(,),( ) (tct
l .r1u,,u,
rr tl c A
¡,oyo ¿r
provec_
::l :,:l ).].' ,",' l .ccrrt,l i gi c;r
I,A t,t.t_r. I l v I i r,i 0Al
i ,,"i .,,-
t ¡ n sl st cnl a
dc vi si r j ¡ l
cot . nJ) ut uci ( ) n11, r . r , , , , , l , . , o"i u, i u,
Indice
Tatiana
Baidyk y Ernst Kussul
Kedes tteurotnles,
visión
coneufuciottal
y nticrontecónica
Primera
edición,
2009
Portada:
diseño
de Efraín Hcrrera
R I :
Tatiana
Baidyk y Ernsr Kussut
rr. t(.
" Unrversidad
Nacional
Auntónoma
de México
D. R.
@
2009 David
Moreno
Soto
Editorial
Itaca
lirlna
l.0, Colonia
det Mar,
c.
p.
13270,
Méxi co,
D. F.
Tel. 5840 5452
i tacaitaca@prodigy.
net. mx
www. editorialitaca.
com. mx
ISBN:
978-60 7 -2 -00021 _6
Impreso y hecho en N{éxico
I ¡ ¡ r noouccr óN . . . . . . 11
l . Raoes NEURoN¡ , r - Es . . . . . . . 13
1. 1. Sr r u¡ cr ónAcl uAL . . . . . . . . . . 13
I .1. I. Algunos da¡os sobre el cerebro
L2.
1.L2. Ni vel es de si mul aci ón de redes trcurotnl es ........16
Reors NeUxoNALES nASADi \s
eN cool pl c¡ ct óN DI STRTBUTD¡ \ . . . . . . . . . . . . . . . . . 18
Cl ¡ sr nc, . \ oon¡ s ¡ - EURoNALES . . . . , . . . . . . . . . . 18
1. 3. 1. Cl asi f i codor es neur onal es r l c y r sc. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 8
1. 3. 2. Cl as$cador neur onal L| RA. . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.3.3. Clasificador neuronal de pernutacióu
de códi gos ( PCNC) . . . . . . . . . . . . . . . . . . . . . . 29
L3.4. Descri ptores al eotori os l ocal es (RLD) ..............42
2. Vr sl ór . r coNr pur Acr oNAl . . . . . . . . . . . . . . . . . . . . . 53
2. l . Sr sr el ¡ ¡ DE vr sr óN coNr pur Acr oNAt - . . . . . . . . . 53
2. 1. 1. Cánar as u, ¿D. . . . . . . . . . . . . . . . . . . . . . . . . . 54
2. 1. 2. Capt ur c¿ de i t nr i genes di güal es . . . . . . . . . . . . . . . . . . . . . . 55
2.1.3. Extracción
de l as car act er í st i cas de l a i naget t . . . . . . . . . . . . . . . . . . . . . 57
2. 1. 4. Cl asi f i cador es. . . . . . . . . . . . . . . . . . . . . . . . . 64
2.2. Aplrc¡cróN oe vrsróN coMpurAcroNAL
EN NucRot l t ANUFAc' r uRA . . . . . . . . . . . . . . . . . . . . . . . 65
2.3. Pr¡cxlernlrs EN Los PRocEsos
¡\DAPTATIVOS PARA TAREAS DE CORTE
coNt t l l cRoNt ÁQul NAsI I ERRAI \ {I ENTA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2. 3. l. Recottocitnienlo
con cl asi f cador neur onal PCNC. . . . . . . . . . . . . . . . . . . . . . . . 69
2. 3. 2. Reconoci mi ent o con cl asi f cador t t cur onal L| M. . . . . . . . . . . . . . . . . . . . 75
2. 3. 3. Descripciótr y clasificaciótt
de mi cr ot or ni l l os. . . . . . . . . . . . . . . . . . . . . . . . . 76
-
, / , I t t
¡ t t t l , t t t ) t t t l t , l t t r i t r t t t , : i t , i l t , t
.
' l t . t t , t l t :
t l t , i l t ¡ (
t t ) J! ) i l t ¡ l l 0\ .
\
' . I t r . t t t t , ) i l t l t , l t . t , t t . ¡ i l t t l ( ,
,
; ' / '
t , ' , ""' ' , r , , t t i ( ' n/ o
\ '
¡ l r t t cl t t t
, (¡,
t.)t,.strt.t.o!l tt
¿ ¡¡¡¡¡1¡¿¡¡¡¿tttQ(.¡ói l
,
, ,,,' ,1 ,:.' ..1:'
t.' ct! ttcttronol
(tn¡,/¡(,i al .
'
, . ' ) "
l r \ r I ( ) \ I ) L I . \ \ ' r sr ó\
col f pur , \ ( r o\
\ ; . j
N Nt { I ( O¡ NSA\ i l l r
r r
1.1.l.
Rcttut
c¡¿,,
¿, ,,,,n i,i,,);:,,
;O
2 r"r"' :^i .' :' n' Qan
¡tl ¿¡¡n QD;.....
. , .,,-u..r,.)!jrollo
da tos protott!,o.\
2 o :,,' ::::.o,,
t)or contputodoni
......
..4. r,. JoJl tttat.e
par1
al si sl ai l n
, o"f '!,t'o':
'o",¡,,,rnrio),nt ... r. a. Kes t t l todo.t
ol ¡t cn i tl us...
) Z< ¡ ' r ¡ ( ' uJ. . . .
-
. t, .,o.t.(.\-lr(t.iilt(ntos
con tutera
ltase tla dotos
, , r r . ,
n4, i t t t t i ge
nes. . . . . . .
2. 4. 6.. Itt t e rpo
n r¡ i,i, *,,)1",,n
i
, ,rt;
ytot.rlatnrlus tla postciones, . r
41
^
t ui l ( s. . . .
..4. /. KA.ttl tatl os
de rt,cottuci Dti attl o
, . n
, o, ,
ut l cr l ) ol odor
t t aur ot n!
. . . . . . . .
¿. J. . KI CONOC| \ I I I NI
O DE ] \ I I CROPI TZ, \ S
[ N Nt oNTóN p¡ RA
uN n, , . , ^
) | t t
". , . , r ¡ r xut \ f , \ NI I , UL^DOR. .
_r", ,.,
1",
?.tpcr¡tnctuos
.' .
Í,;i Íf?,,."ci i l ¡i attrtt
¿e !cts pos.i ci ottcs
^
tle los nticropie:os
.
L ONCLUSI oNEs
.
-
1f
' . . . . . . . . . . . / t ,
. . . . . - 77
. . . . . . . . . . . . . . . . . . . . . . 86
. . . . . . . . . . . . . . . . . . . . . . 88
. . . . . . . . . . . . . . . . . . . . . 93
. . . . . . . . . . . . . . . . . 96
98
99
105
, ,,?;^ffi;1;;#;;"";,;;",
;;;;"",;;",;;;,;,
ii:
t , l *I ; : : , : g^i n
dr, ), i i r, . rq, , ¡p"
f ui ri
. . . . . . . . . . . . .
111
",,t¿..ttuu
.(lt
gettentciottes
tle nicrontóqttittas
,
"rtarronicnto
.v nticronntti¡tttladorcs '
. ... J' ¿' J, ' - Rel aci ot t cs
ct t r r e
el t unt año
"""' . . . . ' 114
3.3.1. Estntctt¡ru tle ln ttricnfiibrirn
-1.
3. 2. Cot¡troL o(l0ptil ¡t' o
3.3.3. Costt¡ ilc l¡.)s
P¡odu(1os
dc los tnit' roJtiltt icas . .
3.3.4. Lo rnicrrtftibrica corr¡o tcstbccl paru los tttólodos
de i nÍ cl i gcr t ci n Qt r i l i ( ¡ al . . . . . . .
N' l l cl ¡ ou¡ l s, r i r l t t Li r At Jt ot r l A' l l Z: \ l ) o . . . . . . . . .
3.4.1 . Algorittno odlltlt¡\' 0
del t t i vcL t ní r s baj o. . . . . . .
3.4.2. Algorittno gettéfico poro lt coroctat' izrtciótt
de lo nicrontúqu¡tns ¡tcrratn¡ettla.
1. 5. Mt cnot r l ¡ xt t ' Lt t . ADoR I ) n I JAJ. \ I \ - Lt t cl A . .
' - [ .
Al ' t . r <; , l cl oNt ] s . . . .
1. l . ( ' t ( l , \ ( t ¡ , \ I r l . Nl l . \ l ( ¡ l {1. \ 1- 1' . 1¡ 1¡ ¡ r ' \ s¡ r r
PAl t,\ NIl ti l t()C' O¡1Pl .j f ,\ I)OIi As
i . 2. Dos rt )l , ot . o(i Í As
oc l nol l t t ccl t i ¡ l Dl l oBJL' l os. .
J ) |
( ) l t i t t t t - t ( t t - t ( t t t t bl ot l n\ t t t t l
t i l u' t ocqt npot l ct l l ( s. . . . . . . . .
1.2.2. Objetos cttsotttblctdos tlc
cstfutdar (borras l' ttorlr.ts) .
ni l c ro(:oi l l p()i l al l tcs
J. 3. CoNcl , Nl nADoREs sol . \ Rr i s
( oN [ sPI ] Jos Pl - ^Nos
,1.
3. I . Cottcetttrador solor
1.3.2. Fattricur¡¿,, Y ,uo,,tri,
rl el concent rat l or sol ct r
(' ot t csPei os pl anos . . . . . . . . . . "
152
1.3.3. Volorociones oproxitnodas dcl costo
rl el cot t t : cnl rarl or sol t u'
. ' "
""" " '
15' 1
t.tó
l ) l
t21
131
13:
. 78
82
137
137
138
143
j . l l
1.1-s
1. 16
l ,16
150
1. 5 I
-
PRESENTACIÓN
I:n este iibro se presentan tres de las tecnologías de frontera que se
l rl l l desarrol l ado en l as úl ti mas décadas: l as redes neuronal es, l a vi -
sirin computacional y la micro-robótica, las cuales se articulan para el
tl i scño y producci ón de si stemas ni cromecáni cos automati zados. Estos
\i stemas poseen múl ti pl es apl i caci ones en l a mi ni aturi zaci ón, tal es
t onl o l a producci ón de mi crodi sposi ti vos, el di seño de mi crofábri cas
i rutonrati zadas y el mi croensambl e.
La primera parte del libro está dedicada a las redes neuronales.
,,\r¡uí los autores presentan algunos de los rnodelos de redes neuronales
rl esarrol l ados por el l os en Ucrani a y en Méxi co. En pri mer térmi no
se anal i za l a estructura de l os cl asi fi cadores neuronal es por umbral es
rrl ei rtori os (Random Threshol d Cl assi fi er) desarrol l ados por l os autores
:r
¡rl i nci pi os
de l os años noventa, a parti r de l os perceptrones mul ti ca-
¡r:rs
de Rosenbl att. Este model o, basado en una sol a capa de neuronas
t' rrtrcnabl es, es rl uy el i ci ente y se compl ementa con el cl asi fi cador de
.,rrbcspaci o
al eatori o (Random Subspace Cl assi fi er) que permi te di smi -
r¡rri r cl tamaño del espaci o paramétri co.
I'ara abordar el problerna de la clasificación de irnágenes, los autores
rrrtroducen el cl asi fi cador neuronal I Greyscal e (Li mi ted Recepti ve
,.\r ca Greyscale), desarrollado tarnbién por ellos, que se complementa
,,rn el cl asi fi cador neuronal de permutaci ón de códi gos (Permutati on
( ' otl i ng
Neural Cl assi fi er), el cual i ntegra un extractor de propi edades,
r¡rr codi fi cador y un cl asi fi cador neuronal , y que se ha apl i cado con éxi to
crr cl rcconoci mi ento de caracteres manuscri tos y de rostros y en el
t ontrol de cal i dad. Fi nal mente en este capítul o se i ncl uye el reconoci -
rrric¡rto por enrarecimiento dependiente del contexto (Context Dependent
I l ri nni ng), dedi cado a reconocer al guna pi eza en una i magen compuesta.
lin la segunda parte del libro se expone la técnica de visión com-
prrt:rci onal apl i cada a l a mi cromanufactura. Después de una breve des-
, r i¡rc itiu cle la problemática que supone utilizar la visión computacional,
' ,,' :r¡rl i can l os cl asi fi cadores neuronal es que se presentan en l a pri mera
l ,:rrt('
i r un conj unto de tareas esenci al es en l a mi cromanufactura, tal es
,,rrro l As tareas de corte y de mi croensambl e, y el reconoci mi ento de
rnrr' ro¡ri czas y su posi ci ón. Todas estas tareas se i l ustran con numero-
i i t r ¡ ; ¡ ¡ i r l i {) \ , \ 1 Ls
SOS L' l ci ) t l l l oS ¡ - ' . \ l ) i . t
¡ t ¡ ( . ) l i i ( . : , , r , , i , . ,
cqui pos i r t i l i ; : l r r i i l s
: i l i 1) i i t b de i os
. l : I l i ¡ t i er . ccl l t l , i | i i \ : | \ . l . l ] l . , 1. l : ] ] l , i , l
r ecl es
' l eur o. al cs
y l a r i si t . ) , cr i r r r ¡ . , : , i ¡ ¡ ¡ r , , ; , ; I r
: ' l
' r
:
' ) i 1i ' l
{l i r l : i s
como l apr oi r ur : ci ó.
ci c t t t i l r r i ! l sl i ( ; i , : , . ,
; . ,
. ,
.
' . ' ' , '
' r r r L' r r ' r l l i {' : i i .
t al es
raci onesi e
n.ri .roti l ui nas j l en.;rnl i r.i l l ,,.y
,,,,,,,,' t,,,1,,,,,,
.,,, ,' .' ,,,,' ;;;]:;
que cada generaci ón
proi l uce
el e¡neni us ,1r,: r,r,
a su vez, se eÍnprean en ra corsrr*cción
de;' :ili;;:,,;:' :i:J:i::TJ
máqui nas
aún más pequeñas.
Eut. p.or*ro
r" pu.u* el i tender
a cscal as
cada vez más recl uci cl as
hasta l l egai a i a construcci ri n
de nl i croÍábri cas
completas
que quepaü en la supeifici.
,i" ;;; ;
penniran
ri ra¡ricacion
a
sran
escara de
',,.i.l:lü3ffi¿::HT:";
l as apl i caci ones
que se cl i sJuten
,q"i .r-.r
i ru..ro de mi croensarnbl e
autol ' ati zado
a través de nl i cromani pul acrores
robóti cos.
Entre l os
ejemplos
concretos que se ofiecen esá la t¿rtrri.ucif,n
y el urontaje de
concentradores
solares construiclos
con pequeitos
espejos planos.
Este trabajo es producto
cle varios ancis ¿e i,.,u.rtigorion
y clesarroiro
tecnol ógi co
de al to ni vel y está cl i ri gi cl o u i nu"rti go,fores,
i ngeni eros
y estudi antes
i nteresacl os
en ra apl i cáci ón
ae ra vi si ón computaci o' al
a partir
de moclelos novedosos
y eticlent"s
O. ..0., neuronales
para
ll::oit:
construir y operar sistemas
¿e mic.o..cánica
automatizacla
aplicables
en ¡nuchas
cre las áreas t..norofi.ur
,re vanguardia
cono ra
micromanufactura
y la bioingeniería.
Feiipe Lara Rosano
-
INTRODUCCION
| .l
¡rresente
obra está basada en los trabajos de investigación y desarrollo
rr' cnoi ógi co real i zados por l os autores durante l os úl ti mos años en el
(' cntro
de Ci enci as Apl i cadas y Desarrol l o Tecnol ógi co (CCADET)
,l c l ¿r UNAM. Tal es trabaj os t' ueron posi bl es graci as a l os proyectos
l'.,\1)trlT IN 108606-3 "Investigación y desarrollo de micromanipuladores
rl r baj i r i nerci a", PAPIIT IN-116306 "Investi gaci ón y desarrol l o de un
.'
rstclna de visión computacional para microequipo" ,
PAPIIT IN- 1 I 8799
' l nvesti gaci ón
de mi crotecnol ogía para el desarrol l o de mi cromáqui nas
Ire rrarnientas y micromanipuladores para la f'abricación cle microliltres"
, i ' APIIT IN-112102 "Investi gaci ón y dcsarrol l o de si stemas de control
I
' rrl a
mi cromáqui nas herrami entas y nri crornani pul adores" . Tambi én de-
i rcnl os reconocer l a ayuda parci al de al gunos proyectos de CONACYT.
La información presentada en libro fue aprobada en cursos impar-
{i ti Lrs en l a UNAM. La Dra. T. Baydyk y el Dr. E. Kussul i mparti eron
l l círtedra Vi si ón computaci onal en el posgrado en Ci enci a e Ingeni ería
tl t' l a Computaci ón de l a UNAM durante el peri odo 2005-2008. Entre
' 0()l y 2005 el doctor Kussul i rnparti ó l a cl ase de Mi crornecáni ca en
, l
¡rosgrado
de Ingeniería en Mecánica de la Facultad de Ingeniería
,k' l ¿ UNAM. La doctora Bai dyk i mparti ó Computaci ón apl i cada a l a
rnstrunl entaci ón en el posgrado en Ingeni ería El éctri ca de l a Facul tad
,l e l n¡¡cni ería de l a UNAM entre 200.1 y 2008.
lrluchos de estos resultados f'ueron presentados en congresos nacio-
rurl cs c i nternaci onal es y publ i cados en revi stas naci onal es y extranj eras
r on un buen intpact
factctr.
Estas publicaciones tienen varias citas a
rri vcl i nternaci onal que se i ncl uyen enel Ci tati on Index.
lrn los últimos años los resultados de gran impacto que se obtienen en
rrrrrclurs írreas tle la ciencia son resultaclo de esfuerzos multidisciplinarios.
l\ rr c' jcnrplo, el trabajo conjunto entre químicos y físicos ha permititlo crear
I r: nrnotubos de carbón. La tecnología MEMS (MicroelectoMechanical
:i\'\rt: nr:i) es resultado de la unión entre la microelectrónica y la mecánica.
,,\
¡rri urcra
vi sta es di fíci l defi ni r esta di sci pl i na que reúne a esferas
,l , l t onoci r.ni ento tan di símbol as como l a mi cromecáni ca, l as redes
rr, rrrr¡rurl e s y l a vi si ón computaci onal . En este l i bro se i ntenta descri bi r
r r r.¡rliclrr los desarrollos que demandan aplicación cle conocimiento en
t-
¡ . )
l i I t , l \ \ l Li RoN \ l _l , s
estas írreas.
para
el l t:
ción rreproto,ñ;,;Jfijillliri;l.llilll'l:1"
".
r.s rt'|¡r,rt's
c' ra crea-
dispositivos
q"l
"r0,,
ro ur; ;;;; ;,:";,,;J",1''i.:il1:l:ll:l
liilf#;
de estas redes en cl i ferentes
ni veres ,ta p.u..r,,,r,i .l rf
. tre i rri ,.rrl rci ó' y
l os
problemas
relacionados
con recles naurn,r,,ta', y ru crlrrl.'rcir.r¡r
cre lleuro_
computadoras'
En estas pági nas
se presta gran ate' crti '
u
' rs
pri nci pi os
de procesamiento
jerárquicá
¿. inrá.ru.ián*.,r
ra., errru.f uras cre recles
neuronales,
a la construcción
de bases de conocimiento
y a ros nroclelos
del medio ambiente sobre Ia base de .r,u, .ri,u.,uras;
se describen
los
algoritrnos
funcionales
de algunas ..¿., n.*onales,
y se muestran los
::::Y1:
r.1 invesrigaciones
experimentor.r.
artrtrmo,
se presenran
eJemplos
concretos
de crasirrcadores
neuronales que resuerven problemas
de reconocimiento
de irnágenes
¿. ¿f...ntes
clases, por ejemplo,
de cifras
escritas, rostros humanos y tareas de microlnecánica.
,
Este libro refleja también tu r"p..i.n"iu
¿. lo, uuto.", en ra creació¡r
de si sremas
cl e conrrol para.ni croeqri ñ;;;;r"
de vi són compuraci o_
nal basándose
en ra reoría ,e r.¿.r n.r-n;r;;,
r. ana,zala
aplicación
de estas redes en diferentes
niveres ,t. pro..lurniento
de información,
se describen
los algoritmos
funcionalei
á. lu, ..,1", neuronales y se
muestran los resultados
de investigaciones
experimentales.
En el prirner
capítulo de esta obrise pr;;;"*
hs redes neuronales y los
cl¿uilicadoras
neuronales
capín rro,",r.,.,ib.n
",v,T,*,bf
i:Tiili,Hfll,iiüllij,
:l::xt:
siste¡lus compuncionales
en nlicrornanuructrra
y ,r,i.roensamble.
El tcrcero
se encuentra
dedicado a los métodos cle nlicronlecánica,
es¡reciatmen;;l;,
microfábricas
autornatizadas,
at ,nic.oensambi.
uuro,nor^¿o
y a los microma-
nipuladores'
En er cuarto se presentan
apricaciones
en ras que se utilizan todos
los sisremas y ras áreas del conocinie*;
¿;;;;;.n
,os capíturos
anreriores.
E¡ este capíturo se presenran
Ios p.ototipos
y;l;"*,
desarrotar,os
en los
últimos años y se proponen
nuevas tareas
¡ror
resolver en futuro.
Esta obra es resulrado
Oe un traUá¡o i,rt..Oir.ipfnario
dirigido
a
i nvesti gadores,
i ngeni eros
y estudi antes
i nteresacl os
en l a apl i caci ón
de sistemas de intericencia
ártificial pr.; i;; ,;.rrs cre reconocimiento
de imágenes,
auromátización
de microfáb;i.;
y sistemas
de conrrol
par a
ni cr odi sposi t i vos.
- - ' r
v' Jl v¡ ¡ r qr
uL Lur r t r ul
,
_ ,!l ?.:
Kussul agradece
a todos sus familiares
por su apoyo. La Dra.
T. Baydyk agradece
a su familia po,,u
uffil u,r.,or, especialmente
a
su hijo Oleksandr
Makeyev,
a su madre t la.iyu'nuyOyk
y a su heramana
Ol ga Mal i ni na.
Decl i camos
este l i bro a el l os.
1. REDES NEURONALES
SlrueclóN ACTUAL
[-as redes neuronales -junto con los algoritmos evolutivos y la lógica
borrosa- forman parte de una rama de la ciencia informática conocida
como inteligencia artificial (et)
Los científicos siempre se han interesado en la estructura del cerebro
llumano y en los principios que rigen su funcionamiento. Los primeros
csfuerzos destinados a la creación de agentes racionales no vivos datan
dc los años cuarenta del siglo xx y fueron emprendidos por expertos en
cibernética neuronal [1].'
Estos investigadores trataban de desarrollar una
lurtoorganización de sistemas capaces de enseñar la conducta intelectual
cn el proceso de interacción con el mundo circundante; los componentes
tlc sus sistemas a menudo eran modelos derivados de la estructura de las
cú'lulas nerviosas. Al mismo tiempo renació la técnica del cálculo y de
lrrs ciencias relacionadas con ella, especialmente la lógica matemática y
lrr rcoría de las máquinas automáticas. Ello ha ejercido una inlluencia
nuly importante en todas las áreas de investigación relacionadas con el
t t'rcbro. La analogía simplificada que presentan W.S. McCulloch y W.
l'itts
[2]
entre la estructura y las funciones de redes neuronales y los
t rrcuitos lógicos digitales permitió la creación de la computadora mo-
rlt'r nu
],
al mismo tiempo, ha dado pie a la generación de una serie de
rrocioncs simplificadas sobre la actividad del cerebro. La segunda etapa
t.¡r cl clcsarrollo de las recles neuronales se inició a partir de los trabajos
¡t'rrlizados por Frank Rosenblatt[3] en torno a su perceptrón' Después
:r¡r:rrccie ron muchos otros paradigmas relacionados con las redes neuro-
r¡.rlcs. Ill clesarrollo de la microelectrónica y de las computadoras sentÓ
l.r'; lrrscs técnicas para la simulación de redes neuronales complejas, a
l,.rrtir
dc lo cual fue posible aumentar la velocidad de proceso de infor-
rn:rt.iri¡ a¡álogO al paraleliSmo que Se observa en laS redeS neuronales
,L l tcrcbrr) gracias a un paralelismo integral. Asimismo se generó una
, r,nrlre¡rsirin más profuncla de las funciones intelectuales y aumentó el
,,,rroti nri cnto de l a anal ogía entre el cerebro humano y un di sposi ti vo
l {
' r' r(
o (corl ' tputadora).
t L, . ' ¡ r ( . r osc¡ t r ccgr cl l ct esLcnr i t cnal asl el ' cr cnci asbi bl i ogr l i f i cas, a[ l l nal dcl pr cscnl c
, l r r r r , l t
-
l l ,
. .
i \ t | ¡ t ON, \ l _t r s
i \ pr i nci pi os
de l , s añi l s, cl l e r t t : t c( ) r . 1. ¡ r , / ( ) ; r , ¡ . r ¡ , r r , , r , r . , ( . , r l r . r . ccl ent e
¡1:.l a,r-.:::l os
ci entíl i cos
c_tr [()' 1o rr l ,s' r.t.,i ,,,
r' . rt.tl ts r)eLrrona_
:tY::::
rla analogía.enrre
el rnoclcl.,l.
,..,1 ,;;,;,;,;,,1
il;ll. ;iJ;
y una cl ase parti cul ar
de si ste¡nas físi cos.
Desde 1986' y ya con er tirming neuroco'rpur¿rdor¿r
e
'
sLr vtrcu'ulario,
esta área ha entrado en una fase cle rápicio delarrotto.
i . ) .1. Algunos datos sobre el cerebro
El cerebro es el sistema cle procesamiento
de información
más complejo
que col l ocemos.
Baste
' enci onar
que conti e' e aproxi ' racl a' .,.nt"
l óo
mi l mi l l ones cre neuronas,
cacl a una de l as cual es posee en promedi o
10 nl i l conexi ones
[5].
Las cél ul as nervi osas (o neuronas) son cél ul as especi al i zacl as
que
se.encuentran
en los organismos
vivos y tienen activiclacl eléctrica.
Su
objetivo principar
consiste en el controi operativo
del organismo.
La
Fi gura 1.1 nos ofrece u
'
"
i
y."l
p.",
"
no un J;.il:
i:ffi
ii:::
:,'r'"tTli:fi
fi
l;l,'l'.,."l;i
y salidas (axón y sus terminales)
2.
I
i .
Fi g. l . l . I{cpresentaci ón
esquemáti ca cl e una neurona. l :
2: axón y t er mi nal es, 3: mont í cul o de axón, 4: dendr i t as
Cuerpo de l a neurona (soma),
5: col at er ai es.
,
El. soma mide algunas clecenas .e micrórnetro y la longitucl cle las
dendritas puede arcanzar 1 mm. Estas úrtimas se ramifican
hasfa cubrir
un.espacio
bastante amplio alredeclor de la neurona. La longitud
de un
a'xÓn puede
arcanzar cientos cle milímetros.
El segmento inicial de un
axón 3, adyacente
al cuerpo cle la célula, se hace más grueso.
A veces
esre segmenro
se denomina
montícuio de axón. Ar alejaise oe ra celulál
éste se reduce gracrua'nente
y, a una cristancia de una crocena de micro-
nes, la membrana de mierina tiene una alta resistencia
eléctrica. sobre el
soma y las dendritas se encuentran
terminales (colaterales)
de axones que
RLot , s Nt : unol , r t - t , s I )
vienen de otras células nerviosas. Cada tenninal 5 es gruesa y se conoce
como piaca sináptica o sinapsis. El tamaño de las sinapsis es de varios
micrones; con frecuencia alcanzan a medir un micrómetro.
Las señales de entrada de un árbol de dendritas (potenciales post
sinápticos) se multiplican y se suman en el trayecto al montículo de
axón, donde se genera el impulso de salida ("spike") o paquete de im-
pul sos. Su presenci a (o i ntensi dad), por consi gui ente, representa una
función ponderada de señales de entrada. La señal de salida pasa por
las ramas clel axón y alcanza la sinapsis que conecta los axones con los
árboles de dendritas de otras neuronas. A través de la sinapsis, la señal
de salida se transforma en una nueva señal de entrada para las neuronas
contiguas. Esta señal de entracla puede ser positiva o negativa (excitada
o fienada), dependientlo del tipo de sinapsis.
El valor de la señal de entracla generada por la sinapsis puede ser
di ferente i ncl uso si el val or de l a señal que entró a l a si napsi s es i dén-
tico al cle aquélla. Estas diferencias son determinadas por la eficacia
o el peso cl e l a si napsi s. El peso si nápti co puede cambi ar durante el
l'ur.icionamiento de la sinapsis. Muchos científicos consideran tal cambio
colro un fenómeno neurofisiológico (huella) de la memoria. Gracias
ir estos mecanismos, la memoria molecular retiene a largo plazo estas
i r uel l as.
Las neuronas pueden dividirse en tres grandes grupos: de entrada
(fcceptor), intermedio y de salida (efector). Las neuronas receptoras
¡rcrnriten
que entre al cerebro la información sensorial. Ellas transfor-
¡narr l as señal es que i ngresan en l os órganos de l os senti dos (señal es
i ,¡rti cas en l a reti na del oj o, acústi co en el caracol de l a orej a u ol fati vo
, rr cl c¡ui rni orreceptor de Ia nari z) en i mpul sos el éctri cos que ci rcul an
,r l nrr' és de sus axones. Las neuronas de sal i da transmi ten l as señal es
.r tos íi rganos actuacl ores. Al l i nal de l os axones están l as conexi ones
,rrui ¡rti cus especi al es con l os órganos actuadores, por ej empl o con l os
r r rr rsr' rrk)s, donde l a exci taci ón cl e l as neuronas se transforrna en contrac-
I ¡ttr Lrrs ueuronas i ntermedi as ej ecutan el proceso de transformaci ón
,l , l rr rnl i rrmaci ón obteni da de l os receptores y forman l as señal es de
,,,nt¡ol
¡ral a
l os efectores. Este conj unto de el ementos conforma el
r l L r l l r r t cr vi oso cent r al .
l l l r ¡ l s Hr . t l r oN, r I , l , :
'ri
.'.1.2. u¡rrlos
de sinutroció,
rrc ruras
,crtr(ntar(,s
La simulación
cle funciones
de un siste''a
nervioso se hace a aiferentes
niveles de organizaciór
categorías
u lor rno¿.tlJ:::.t-r:cción
[5]' Es posible
asignar tas sigulenies
nas,.recres".,."";¿;'::;,;?:";:;,:,'J,::'lii;f,T,illii:;ffi
l."ilT:;
cerebro
en su conjunto.
yá: ud.h;;;;;;..ror
lu, recles neuronales,
en las cuales
es posibledisti"g"i;;;;;;r"i""rto"o
de modetos inrerco-
nectados
de neuronas.
tr¡*#.^**,,:,;*1.,,.,.üüx,,"J:.Jl[üü1,:,ffi
Jlil:**;
nivel de simulación
U,,rt.ur
y adaptables
(tal
como tienen lugar en el
corecrivosq"";;;;;;::'::i1ff:,:Tj;ll;,li"illf
llllfr,,..,,T?: células neuronales.
EI papel p.¡""¡pui"J'.rü""0"
aquí a la estructura
de conexiones
entre n.u.onur,
b
ü.;;..t,."uru. ,o¿.los sencillos de neuronas y simular red
run.ú.onuil*'Jiff
:H:ff
;J;,'S::r","i:1,1r,.,11Íii;,u"0"
I¡!-es
neuronales
se muestja.en
Ia Figura
l,-z.ua
neurona artificial
rngresa
un conj unto
desei al es
¿".ni .uou
_rl , *r, ...,x,,, (o vector cl e entrada
x) que representan
ras sc¡ares
cre-r"il'iu
o. otras neuronas arti_ fi ci al es.
Este vectór cl e,
s inaps i s d., u, ;;;;;
illli¡::1""",:,:Hiil:
:x15:::: Hfi l*
j
por el corresponcliente
peso oé.on"*iOn
,r,,'"..,
, *,,,que es análogo a la efi caci a de l a si napsi s.
Él p.roJ.;;;;;l r' un
uul o, escal ar posi ti vo
fi:'.n:;:n'J.*":ii"ili::.r:"Hr;*nffi*ii**iTft
corresponde
ar cuerpo cre la célula,
¿""¿.-r.l."riza
su suma argebraica y se deline el nivel de excitación
á. ilil."*
artificial S:
l t : .
t
: J. 1
l a
t +
' ' . : i . : r , 9: . 1. ; . .
Figura 1.2 Neurona artificial.
\ r .
I
!
Ret ¡ r sNr : u¡ r r >¡ r , r Ll s l ' 7
N{
^
s'r
J= ) w. x,
z-t
l - l
La señal de salida de la neurona y es delinida por la vía de paso del
nivel de excitación S a través de la función no lineal f,
r : i ( s- o) ( r . 2)
clonde 0 es algún desplazamiento constante (análogo al escalón de la
neurona). Normalmente se usan las funciones no lineales elementales:
l ri nari a (Fi gura 1.3, a)
o si gmoi dal (Fi gura 1.3, b)
[ ] ,
cuando S >0,
'
[ 0,
cuando S<0
( 1. 3)
( 1. 1)
( 1. 4)
I
v: -
-l s{l I
l - e'
I r ' r ¡ r : r 1. 3. La señal de sal i da de l a neur ona.
lrn cste modelo de neurona se desprecian muchas características
, ,rrrocidas del prototipo biológico que algunos investigadores han con-
' ,rrl t' r:rdo críti cas. Por ej empl o, en el l a no se consi dera l a no l i neal i dad
rl t' srrnur espaci o-ti empo que se mani fi esta sobre todo para l as señal es
-
I ( r
, . r r r r r r , , . r \ r r \
I .I .2. Ni y,etcs tl c si ntul ot.i ón
dt, t.ttl r.s tt(,ut t)tttttt,\
La si mul aci ón
de f unci ones
de u' si st et l a
. cr . vr ( ) s( ) st . r r ; r t r . r r r r r r t . ¡ r , l ¡ ( cs
ni vel es de organi zaci óny
abstracci on
tsr. ¡sp,rsrrrl c
asi g.rrr r:rs si ¡i rri r.rrtcs
categorías
a los model
nas,.recles".".""rr.r,';;i.?:;$"::or::"Ífi
;irTi::üffiil
jliü,;:;
cerebro en su conjunto.
Más adelante.riuJü..rno,
las redes neuro'ales,
en las,cuales
es posible
-distinguir
unu grun .un,icrad de modelos interco-
nectados de neuronas'
Nuestro €studi; inctuye no sólo una simulación
cuidadosa
de las propiedades
de lu n.u.onu loir et propósito
de investigar
sus características
dinámicas y aclaptables (tal
como tienen lugar en el
nivel de simulación
de ne,,r..,r,r"
".^"""u^.]i-'
.
corecrivosqu.,on.",,l*l:T::i1"TJ,ffiT:l;,ll"J.lllllllfr',..Ti::
células neuronales.
El papel principal
"r
urignuoo aquí a Ia estructura
de conexiones
entre neuronas,
ro qúe permitJusar
modelos sencillos
cle
neuronas y simular redes neuronales
considerablemente
grandes.
La neurona artificial que normalm.n*
," uru en la simulación
de
redes neuronales
se muestra en ra Figura 1.2. Ala neurona artificial
ingresa un conjunto deseñales
tfe etriracfa _r, x., ...,r,, (o vector de
entrada
!
qut representan
las señales cle sali'ia de otras neuronas
arti-
ficiales' Este vector de entrada co.responde
aüs señales que entran a la
sinapsis de las neuronas biológicas.
cu¿u r.¡uf,le entrada se multiplica
por el correspondi ente
peso Oé conexi ón ,r,, ..., y, gue es anál ogo a l a
elicacia de ra sinapsis' El peso ¿e conexiolLr'un
uuro. escalar positivo
para conexiones
de excitación y negativo para conexiones
de inhibición.
Las conexiones
con peso de señalei ¿. .ntruJu uun al bloque suma, que
corresponde
al cuerpo de la célula, donde se realizaru
,un'u
"ü;;"'i;;
y se define el nivel de excitación
de la neurona artificial
S;
. ' 1
i i '
I
I l l or s Nl uRr ) N, \ Lt : s l 7
1\{
^s\
J= ) w. x
i - l
La señal de salida de la neurona y es definida por la vía de paso del
nivel de excitación S a través de la función no lineal f
v=r ( s- e) ( r . 2)
donde 0 es algún desplazamiento constante (análogo al escalón de la
neurona). Normalmente se usan las funciones no lineales elementales:
bi nari a (Fi gura | .3, a)
( 1. 1)
cuando S > 0,
cuando S<0
( 1. 3) '
:{l
rr si gmoi dal (Fi gura 1.3, b)
I
v: -
'
t -
"-(s+)
( 1. 4)
e
I l ' ur: r L3. I -a señal de sal i da de l a neurona.
Irn cste modelo de neurona se desprecian muchas características
, orrrrcidlrs del prototipo biológico que algunos investigadores han con-
,,rrl t' r;rtkr
críti cas. Por ej empl o, en el l a no se consi dera l a no l i neal i dad
(l( 5u¡lllt cspacio-tiempo que se manifiesta sobre todo para las señales
l i r r , ¡ 5 ¡ ¡ l n{) \ \ r _t , s
( [ l e
Vi l ) i 0f on
dc l ¿
séneros ,r"r ri;;pj,:i:li::::;:i:-l:,:,f "',,,cri,
r,,,', r,,s trilcre,rrcs
rnotl ul aci ón
cl c l i ec
r as rectes n"u.onu,
"r.nc
ia, para r a .e riacc ioi
l:1.1.;]:1il:i::
lJ Jr,::
¡il*:',
;ffi
':
:ffi
ffi
lliJi.'"T ffi Ti: :
T:"ni,tru*:
1.2. Raoas
NEURoNALES
tsASADAS
EN coDrFrcACróN
olstnrguloe
Las redes neuronales
son un instrumento
mr
los sisremas
,r.
"i;i;;;;;ilj,:::::lto
muv usado
v
muy poputar
en
t i v o y en il,* ;';;;lp."n[Hfi
:11"J1,i1"' lli"ju'
á. . o n,.J',r.p,,
-
,Tff
ffi::::::
J;,
recres
en r o, q,.,u,r
u ll.Tn:'::
ffi:'"TT i;
semánricas,
; i ;,;;
$f li,#ilil-';i[,?..i,0, ",
r o' ."¿., i.u
-,u,., a conexiones
entre tér¡nrnos.
as neuronas
corresponden
Nosotros proponemos
las redes
neuronares
que usan codificación di stri bui da
en doncl e cacta paránerr"
;;;;;;;.acterísri ca
es cocti fi caoo con conjuntos
cle neuronas.
¡Ua, u¿.lant.
,norf
cle recres neuronares
con cociificación
distribullremos
algunos
ejemplos
1.3. Cusr¡l cADoRES
NEURoNALES
1.3.1.
Clasificadores
neuronoles
RTCy
RSC
Cl asi l l cador
neuronal
RTC
Para resorver
muchos probl emas
reraci onacros
con er reconoci mi ento
de i mágenes
se uri l i zan
rl i f-erenres
,l p";;;;.s
neuronal es
t6l _tl 1l . Muchos
cl e el l os ofrecen
buenos
*rrl i r¿*
p.ro
rl enen una vel oci dacl de reconoci mi ento
baj a.
o,rr,
"".rl ".r,ri o."
backpropagaÍi on,
presenran
al tas vel oci dades
de procesa;;;;;p..o
requi eren
un l arso
fi ü::.l'ff Til"Il"J :: ; i.11
n-'-"n
" " "*'
rl n cI a s i n c a <r o, n",.o,il,
c o mo e n e r d e p ro c e s
raaü,il;",,
:
".
ii,1iffii:,h:T:.i1ffif
;lt'ii,'ii'
cle umbrales
ar.u ro.ro,
iñffi; rhresrrorcr
crassi'er,
Rr:l rt,s xt.uti ct¡r,u-t,s l 9
La idea básica es hacer perceptrones multicapas con una sola capa
de conexiones de entrenamiento, lo cual permite una alta velocidad de
entrenalniento. Para obtener nrejores resultados en el reconocimiento
de imágenes se colocan otras capas no modificables de conexiones, y
neuronas bi nari as que perrni ten transfbrmaci ones no l i neal es de pará-
metros de entrada espaciales a parámetros espaciales binarios que tienen
r.nuy al tas di rnensi ones.
Una vez obtenida la imagen, podemos describirla de diferentes modos,
como por ejenrplo por lnedio <le un histograma de brillo, un histograrna
de contrasle, un histograma de orientaciones de microcontomos, etcétera.
Cada una de estas descripciones nos da una codificación de la itnagen y
ésta, a su vez, r.ros cla n paránretros. Siguicndo con el ejemplo de los histo-
gral.nas, si cada uno de éstos cuenta con 16 niveles, entonces tendríamos
un total de 48 parárnetros.
La l ri gura 1.4. l nuestra l a estructura cl el RTC. Veamos ahora cómo
l a red posee capas i ni ci al es no modi l l cabl es.
I : i gura I . 4. Cl asi f i crdor RTC.
La estructura de la red está formada por s grupos similares con una
s¿rlida neuronal en cada grupo (ór, ..., b,). Las entradas de cada grupo son
llirnentadas por un juego
completo de características (Xr, ..., X,,). Cada
el rracterísti ca X al i menta dos neuronas, h,,y 1,, donde i (í :1,2,
..., n)
r cpresenta el número de característi ca, y j (j
:
1,2, ..., s) representa el
_- -
- - - . - t
20
Rcr ; t , s N¡ uno¡ l ¡ l _t s
número de grupo neuronal. El valor umbral de /, es menor que el umbral
de /¿-'.Estos valores son fijados co.la ayuda de un proceclimiento
aleatorio
especial' La salida de la neurona /,., es conectada a ra entrada excitada de
la siguiente neurona a,,, y la salidá cle la neurona ft,, es conectada a una
salida inhibicla cle una úeurona a .Enlasalicta
de
";á
il;;;;;,.i;,
ocurre sólo cuando ra señal de uúa entrada excitacla es iguar u l
í."u"¿"
la inhibida es cero. Todas las salidas de neuronas r¿, en un grupoj, son
conectadas a las entradas excitadas cle una neurona U,,
WJ
r.prér.nt,
la salida de todo el grupo neuronal.
El valor umbral de la neurona á- es iguar al número cle caracterís-
ti cas; por ej empl o, en ra sal i da neu/onal 7, ra señar ocurre cuando son
exci tadas todas l as neuronas c, en el grupo. Lu sal i cl a neuronal para cada
grupo es conectada con todas las salidas neuronares del crasificador (c)
mediante conexiones entrenabres.
Entonces las neuronas a en la capa
de respuesta tienen asociado un peso w. el cual ,. u. ,rro,iifi.udo;;;
las neuronas á- durante cada etapá de enirenamiento.
Cada neurona en
esta capa representa una respuesta cle clasificación
clel sistema, y se
elige. aquella que tenga el varor de excitación más alto. El clasificador
funciona de dos maneras: entrenamiento y reconocimiento.
usamos ra
regla de Hebbian para las conexiones de Lntrenamlento.
.
El
.número
de grupos
S puede llegar a 32,000 para casos reales
dene$l9fo de la capacidad de cómputo con la que se cuente y cle ta
complejidad del problema.
La red neuronal pasa por una fase de entrenamiento
cuyo objetivo
es reconocer correctamente
el mayor número de patrones.
-El
.niranu_
miento consiste en disminuir todos los pesos de ras conexiones de la
clase incorrecta y aumentar los cre ra claie correcta, ro cual nos
'eva
a
un entrenamiento
ilamado supervisado o con maestro. como concrición
de terminación del entrenamiento
es común que se cumpla cualquiera de
Ias si gui entcs dos conc.l i ci ones:
l. El número de errores es menor al número definiclo.
2. Dado un número fijo cle iteraciones de entrenamiento,
llegar a
la última iteración.
-
La interpretación geométrica
del clasificadorpuede
ayuclar a entender
los principios
mencionados.
Consideremo, ,n óuro con dos caracterís_
ticas X1 y X2 (Figura
1.5).
Rross Neu¡c¡t,ql r' s 2l
yl '
]i ¡"
Figura 1.5. Identificación geométrica de la neurona'
En este caso /rres igual a X1 ', y el valor de /1.,,, es igual a X/ ", el valor
I, igriral a X2', y el valor /t, es igual a X2". Es obvio que la neurona
b, será excitada en todos los casos cuando el punto que representa un
vector cle características se localiza dentro del rectángulo sombreado.
Como el clasificador posee suficientes grupos neuronales similares,
todas las características espaciales aparecen en suficientes rectángulos
localizados en planos aleatorios y tienen también un tamaño aleatorio.
En el espacio multidimensional, en vez de rectángulos, tendremos
paralelepípedos multidimensionales.
EI número de rectángulos es igual al número de neuronas b,, .
'.,
b,.
Podemos analizar un punto del espacio (Xl*, X2*) (figura 1.6), donde
se cubrió un gran número de rectángulos (lz).
Figura 1.6. lnterpretación geométrica del clasilicador.
Ves el valor aleatorio para diferentes puntos en el espacio, y usual-
mente seleccionamos parámetros de clasificadores para obtener un valor
medio de V, equivalente a 3.5Vo del número de neuronas b.
Consideremos la necesidad de reconocer dos clases (clase 1 y clase
2 dela Figura 1.7). Permitamos que el punto (X1*; X2*) pertenezca a
la segunda clase. Si el punto se encuentra lejos de la frontera de clases,
n
x2
-
) )
l l t , r r t _s l {, r Ro\ . \ r . r : s
éste es c'bierto con rectángulos cuyas áreas están clentro clel límite de la
segunda clase. Esto significa que durante el proceso cle entrenarniento
los pesos de las conexiones entre las neuronas corresponclientes a ó v
las salidas neuronales de la seguncla clase serán.noyoi., qu" tos p.sti
de las conexiones de neuronas ái con neuronas de la primera claie.
Por consi gui ente, el punto (X1*; X2*) se reconocerá como perte_
neci ente a l a segunda cl ase.
h2
Fi gura 1.7. Reconoci mi ento tJe un punto nuevo con RTC.
Hemos desarrollado varias versiones de RTC, algunas cre ras cuales
usan algorit'ros ge'éticos para optirnizar la parte no entrenable clel
clasificador. Diferentes versiones cle los clasificaclores fueron probairas
en reconocimiento de texturas naturales, reconocimiento de escritura,
reconocimiento de palabras, reconocimiento cle series de señales (inclu-
yendo el reconocimiento de voz y el reconocimiento de las condiciones
de micromáquinas por el sonido que generan) y otras características
semejantes. Con todas ellas se obtuvieron buenos resultados.
Clasificador neuronal RSC
El clasificador neuronal con espacio aleatorio o RSC (Random
Subspace
classifier) se ha desarrollado a partir del clasificaclor neuronai RTC.
Su característica principal es que no toclos los parámetros (Xt, ..., X,,)
participan en procesos de entrenamiento y reconocimiento Oe imageneí.
Eligen un conjunto aleatorio de todo este juego.
Este procediÁiento
permite disminuir el tamaño del espacio paramétrico y acelerar los
procesos de tratamiento de información.
1.3.2. Clasfficador neuronal LIRA
Para resolver efproblema que implica la clasificación de las imágenes
se ha elegido emplear la red neuronal denominada Limited Rece tive
luse#ú*tu.
Rtol s Nt,u¡rou,.rt-t,s 23
Al ea Grayscal e (LIRA Grayscal e), l a cual es una extensi ón del cl asi -
l i cador neuronal Li mi ted Recepti ve Area (LIRA)
t131, t14l
di señado
¡lrra
iurágenes binarias y que ha perrnititlo obtener buenos resultados
t ¡r diversas tareas de reconocimiento (más
adelante nos referiremos a
:rl l :unas de el l as). Ambos cl asi fi cadores están basados en l os pri nci pi os
tl cl nrodel o del perceptrón de Rosenbl att
[5], [16].
La red neuronal LIRA Grayscale será adaptada e implementada en
r' l si stema de vi si ón para l a tarea de reconoci rni ento y cl asi fi caci ón de
l:rs irnágenes de microtornillos manufacturados por micromáquinas.
La entrada para esta red neuronal será la imagen del microtornillo y
l .r sl l i da será l a cl ase a l a que pertenece l a i magen de l a mi cropi eza.
I rrtrenami euto y prueba de l a red neuroual LIRA
l rrur vez construi do el cl asi fi cador neuronal LIRA Grayscal e, j unto
r ()n
l os conj untos de i mágenes de entrenami ento y prueba, comenzará
rrrr;r ctaps durante l a cual se l l evarán a cabo experi mentos prel i mi nares
,l ,,,ti nadoS a encontrar l os val ores ópti mos para l os parámetros del
.r' ,t(¡nu que no serán modi fi cabl es durante l a etapa de aprendi zaj e de
l ,r rt' tl ncuronal . Nos referi mos a número de neuronas asoci ati vas, di -
'
r( nsiolles de ventana y la excitación adicional de la neurona ganadora,
, ntr(' ()[ros. Más adel ante descri bi remos cada una de estas constantes
' .r¡ l i ui ci ón dentro del si stema.
,,\l túrnrino de la mencionada fase, comenzará la de entrenamiento
,1, I
.,¡stenri l ,
l a cual requeri rá supervi si ón. En esta etapa se real i zarán
1,,, rrj rrstcs de l os parámetros i nternos de l a red neuronal propuesta, de
,,r u r( r :i t¡uc cl cl asi fi cador reconozca correctamente todas l as i mágenes
,l ' n ri ( rotorrl i l l os que l e sean presentadas durante este proceso. El con-
t,,rrr. rk' i rni rgenes de esta fase será di sti nto al uti l i zado durante l a etapa
, I
I ' ¡
r rt' l rl r, e s deci r, se repeti rán l os pasos descri tos anteri ormente para
' I r nuevos conjuntos de entrenamiento y de prueba.
I' r r' ,tq' ¡ i 1¡¡111.nte se real i zará el proceso de val i daci ón del cl asi fi cador
r,, ,' ,' r):rl , con el correspondi ente conj unto de i mágenes de prueba para
"r,r, rr.r t' l
¡l rl rcentaj e
de reconoci mi ento que el si stema ha al canzado
, r r r \ ( ' , t l el
¡ r r oceso
de ent r enami ent o. Asi r ni smo se podr án r eal i zar
"' , ' ,l rtr,
,rr' i ol rcs y correcci ones al si stema de acuerdo con l os resul tados
l , l , r r r r l o' ,
Rt t r us ¡ ; l . t , Ho¡ . r ¡ r s
I rr r¡ rl crrrent uci ón
del si st ema
El sistema de clasificación cre imágenes fue desarrolrado a través de
C + + Burilder 6, que es un lenguaje de programación
orientado a oUletás
y que favorece un desarrollo rápido cre las aplicaciones, permit" Jr"u.
programas eficientes para Microsoft Winclows Xp con un mínimo de
código manual, y provee toclas las herramientas necesarias para desa_
rrollar y probar aplicaciones, incluyendo librerías con componentes
que penniten un fácil manejo de imágenes.
La plataforma de implementación
clel sistema fue windows Xp
professional
como ya dijimos, el clasificador neuronal LIRA está basado en los
principios del
¡rerceptrón de Rosenblatt
[15], [16]. Este clasificador
fue probado en tareas de microensamble y ieconocimento
de dígitos
escritos a mano mostrando buenos resultadoi
¡t:¡, [14]. Se aOaptO lina
para clasificar imágenes de microtornillos. La red neuronal iesultante
se denominó LIRA Grayscale
[14]. A continuación se .escribirá ra
estructura general de este clasificador.
Arqui tectura
LIRA Grayscale consiste de cuatro capas: de entrada (.s), intermedia
(1),.asociativa
(A) y cle salicla (R). Toclas las neuronas en estas capas
están conectadas como se muestra en la Ficura l
g.
Las neuronas de la capa de entrada co-rresponclen
al valor de un
pixel de la imagen y tienen salidas en el rango
tO, ZSSI. La capa S esta
conectada a la capa I a través cle la capa 1 por medio de un proceso
aleatorio que se describirá posteriorment".
-Értu,
no son conexiones
entrenables.
La capa intermedia l contiene dos tipos de neuronas: neuronas ON
y neuronas oFF. Estas neuronas tienen dos estados como valores de
sal i da
{0,
l }.
La capa asociativa corresponde a un extractor cle características que
contiene neuronas con dos estados cle salida
{0,
l}. Todas las n"u.onu,
de la capa A están conectadas con todas lai neuronas cle la cap,a R,
mediante conexiones cuyos pesos podrán ser ¡nodificado, ¿uruni" ei
proceso de entrenamiento.
La capa de salida consiste cre neuronas con función de activación cre
tipo lineal. El número cle neuronas en esta capa corresponde al número
de clases por reconocer.
^ . l )
I r
Rt , ol , s¡ l eunou, l l . t s 25
---
_l,l
capa- I {
t C"p"-S I
c.u,r"-A
capa- l
Figura 1.8. Arquitectura dc LIRA Grayscalc.
Conexi ones entre capas y acti vaci ón de neuronas
El procedimiento para conectar la capa de entrada S con la capa asocia-
tiva A a través de la capa intermedia / es el siguiente: Sea N el número
total de neuronas asociativas. Para cada neurona asociativa a*, donde
k: 1,..., N, se sel ecci ona al eatori amente un área rectangul ar en l a
capa S (definida como ventana) de /l x lt neuronas (como en la Figura
1.8). De esta ventana se eligen aleatoriamente ,?t puntos (neuronas)
que serán divididos de manera aleatoria en p puntos "positivos" y n
puntos "negativos". Cada punto positivo y cada punto negativo será
conectado a una neurona oN y oFF de la capa /, respectivamente, y cada
uno de estos puntos tendrá relacionado un umbral Z,,o seleccionado de
manera aleatoria del rango
[0,
255]. Este grupo de ¡n neuronas en la
capa intermedia se conectará a la neurona dr.
Sea xu una neurona de entrada de la capa S, la salida de una neurona
oN será igual a I (estado activo) si su valor de entrada rü es mayor o
igual al umbral T,o; y será 0 en otro caso, esto es:
x' , =
I , * (1. 5)
x, i
' I n
C' r¡' ¡-$
Rr,t¡l ,s ru¡i ul to¡l rr.l ,s
| , r
. . , r t r , l , r
t l r . r r ¡ ; r
' cur o' i l
OFF ser á i gual a I ( est ado act i vo) si su
r , r l , r r l t ' t ' ¡ ¡ t r ; r t l l r . r . : s nt enor o i gual a un umbr al
4, *;
y ser á i gual a 0
( ' n ( ) l t ( )
Cl r S( ) , CSI O' gS:
x¡ =
L*
( 1. 6)
x,i t
Tn
una neurona asociativa tendrá salida igual a I (estado activo) si toclas
las neuronas oN y oFF del grupo conectado a ella están en estado acti-
vo, de cualquier otra manera su salida será 0. cada neurona asociativa
actúa como una característica cle la imagen, cuya salicla indica si clicha
característi ca está presente o ausente en l a i magen.
Proceso de entrenanriento
La red neuronal propuesta emplea un proceso de entrenamiento super_
visado en el que se aplica un método de selección clel ganador. Este
¡nétodo consiste en aplicar a la regla simple de selección clel ganador
la siguiente modilicación: sea y! la salida de la neurona ganadora y y-
l a sal i da de l a neurona competi dora. Si
( y*
_
y. )
. ,
( 1. 7)
y8
la neurona competidora es considerada ahora como ganadora, donde
I
es una constante llamada excitación adicional de la neurona ganadora.
Esta modificación fue introducicla para hacer más robusto y estable
el proceso de entrenamiento, eliminanclo las posibilidades de que la
neurona que resultó ganadora lo haya sido por azar.
Antes de iniciar el entrenamiento, los pesos de las conexiones entre
neuronas de l as capas,4 y R son i ni ci al i zados a cero. El proceso de
aprendizaje consiste de tres fases que se describen a continuación.
Fase i ni ci al
El entrenamiento inicia con la presentación cle la imagen a la capa de
entrada S de la red neuronal. Las características de la imagen son ex-
traídas y codificadas a través de la capa I y la capa A, respectivamente.
.o"",-,r:
iá,
L
l .rrs sal i das de l as neuronas de l a capa R son
.,rsui ente
fórmul a:
N
y =) w, , ' d,
lr
Rtt¡t,s ¡.¡t:u¡ro¡r,.rt-cs 27
calculadas mediante la
(1 8)
clonde y, es la salida (excitación) de la i-ésima neurona de la capa
/i , rr* es l a sal i da (0 ó 1) de l a k-ési ma neurona de l a capa,4, tv^, es el
pcso de l a conexi ón entre l a k-ési ma neurona de l a capa / y l a i -ési ma
ne rl rona de l a capa R.
\l [' todo de sel ecci ón del ganador
I In¿r vez cal cul ada l a sal i da de todas l as neuronas de l a capa R, l a sal i da
\' ,. correspondi ente a l a neurona de l a cl ase real , es decrementada por
t l l ¿r ct or
0
- f . . ) , est o es,
Y, : Y. ' ( l - I )
( l e)
A continuación, la neurona con excitación máxima es seleccionada
t oulo la neurona ganadora.
,\tl aptaci ón
de pesos
llna vez que se ha obtenido la neurona ganadora (clase reconocida
¡rol
la red neuronal), si la neurona r correspondiente a la clase real es
i rl tral a l a neurona g correspondi ente a l a cl ase ganadora, esto es, si r
g entonces no se modifica ningún peso en las conexiones; pero si r
,1
,q,
entonces:
tlonde w*,(f) es el peso de la conexión entre la k-ésima neurona de
l .l (
i rl )a,,1 y l a i -ési ma neurona de l a capa R antes del refuerzo, w,Q +
Vk, w*( t + 1)
= w*( t ) + a*
Vk, wks ( t + 1)
= w*, ( t ) - a*
( 1. l 0)
si ( w. , ( t
+ l ) < o)
-
w*, ( t + l )
=
o
28
Rror:s Ncuno¡rnLes
l) es el peso de la misma conexión después del refuerzo, a,. es el valor
de salida de la ft-ésima neurona de la capa.4.
Este proceso será repetido hasta arcanzar un criterio de convergencia,
en este caso hasta llegar al número máximo de épocas de entrenamiento.
Mejoras en el proceso de aprenclizaje
Las características cle imagen extraíclas y codificadas en las primeras
capas son las mismas para cada época de entrenamiento.
por
este mo-
tivo se optó por realizar el proceso de codificación de características
solamente una vez para todas las imágenes, almacenando en disco ra
lista de los índices de las neuronas asociativas activas por cacla imagen.
Posteriormente, durante la fase de entrenamiento, se emplearon dichas
listas en lugar de las imágenes mismas, obteniendo con esto una dismi-
nución del tiempo necesario para realizar el entrenamiento.
La referencia
[17] muestra que el desempeño de los sistemas de
reconocimiento puede ser mejorado por medio de la implementación
de distorsiones (desplazamientos
de posición y rotaciones) sobre la
imagen de entrada durante el proceso de entrenamiento. En este trabaio
se emplean diferentes combinaciones de desplazamientos horizontales
y verti cal es y rotaci ones (Fi gura 1.9).
En la parte 2 del presente trabajo mostraremos algunas aplicaciones
de este clasificador neuronal LIRA para realizar diferentes tareas de reco-
nocimiento de imágenes, por ejemplo, de formas de microtornillos
[1g].
Ret >t l sxct l *o¡ ' r t . i : s
Zq
t.3.3. Cl asi fi cador
neuronal
de pernwtaci ótt
dt: cótligos
(PCNC)
lrste ar;artado
está dedicado
al clasifrcador
neuronal
de permutación
de
cridigós
(Permutation
cíJtiÑt"tt1-91-ut:lttl
PCNC)'
El clasificador
pcNc ha si do proputJt-tí i rsl ' tzol '
Este.cl asi fi cador
se probó en
tir tarea tle reconocim#";J;;tlit'
ttt'ltos
con la base de datos
¡.rNrsr danclo una tasa d;';t;
¿r*o'zln [21]'
Se rrrobó
también
en la
turea cle reconocimien'"
tjt;;
con tauaseOe
daios onr- obteniéntlose
una tasa
promedio
O" t*"tá"
O J%
pata 10 exrlerimentos'
Asimismo
cl PCNC ha sido pt";;;;
tn
"tontti']1iento
rle microobjetos [22]'
l)ara ello se produ¡eroi
+O tornittos
cle 3 mm de cliámetro
con un torno
trc. Diez tornillos
f"tton
producidos
correctamente
y 30 con errores
tlcliberados
mediante
et cambio
en la posición clel cortador
del torno'
lrsta posición fue ¿e O' t **
'otno'
que lo correcto
para 10 tornillos
y
tlc 0.1 mm más
que t"
""ttttt"
para otros.diez
tornillos'
Los restantes
l0 se produje,on
ton u?d"ñit"itn'o
de 0'2 mrn' Las imágenes
de
lus cuerdas
de estos torniiloi
se capturaron
con una cárnara.u.:f
:'
crcó con ellas una Uu'"t át á"tot' Oc ca¿a uno de los cuatro
grupos oe
tornillos
(l correcto
y 3 con errores)-se
tomaron'
en forma aleatorta'
cinco imágen.'
pu'u"n'iJnut"itnto
iel-clasificador
y 5 para prueba'
Sc hicieron
uu'io' t^it'i;;;;
con diferentes
parámetros gltli:to
caclor. La *.¡o' tu'oi"
reconocitniento
de estoi experimentos
fue de
"
llJ l33l"ru''nt's
incisos
ofrecemos
t":,91:]1"
del clasificador
I,CNCasícomol osexperi mentoscorrespondi entes.
Si bien
presenta diferencias
sustanclales-con
respecto
al clasificador
l.lRA, el PCNC también
ostenta algunas
similitudes'
A continuación
se
dcscribe
O.t.niOu*.iüi"";'r-ñ#"
del PCNC,
los procesos
que lleva
a cabo
y .t pto"t'o;;;;"*t*iento
del mismo'
Los últimos
rnclsos
cstán dedicados
a la discusión
sobre este clasificador'
I istructura
lll PCNC está basado
en la estructura
genérica del paradigma
APNN
tlcscrita en[2¡1, fzii'"#rt";;;ig*"
itttuv"
el clasificador
de umbral
,,r. ;;i" tist, rzol',
"t.r
u, in.uooi
n"*****::t;"#lriül
;
l.llfA [27j, [28],
y el clasificador
neuronal
l'CNC 122)'EIPCÑ¡";iic*l
que el clasificuáo'
ntutonul
LIRA' tra-
trlia con imágt*""
t'á^lt
g'i"'' La estructura
del PCNC consta de
4
i l 1 +,
I
,4
+,t: x
{ 1
*
4,
4
;
1 I! 4
Figura 1.9. Distorsiones de las imásenes
-
:10
tres partes que trabajan en fon.na serial. Dichas partes son un extractor
de propiedades, un codilicador y un clasilicador neuronal (Figura 1 . I 0) .
Dicho de forr'a muy general, el
pCNC
inicia su trabajo cuanclo
una imagen en escala de grises se presenta a la entracla clel extractor
de propiedades; las propiedades extraíclas por este último
pCNC
se
presentan al codilicador, que a su vez las transforma en un vector bi-
nario de gran dimensión, vector que, finalmente, se le da al clasificaclor
neuronal de una capa para que éste lo procese ya sea para propósitos
de entrenamiento, de prueba o de reconocimiento de alguna clase pre-
viamente entrenada.
,! ,''
i :l .*
-
,l ]
tr
\-/
Fi gura 1.10. Estructura del
pCNC.
Extractor de propiedades
El extractor de propi edades (Fi gura 1.11) i ni ci a su trabaj o con una
imagen en escala de grises sobre la cual selecciona una serie cle puntos
específicos. Se pueden utilizar diferentes métoclos de selección de estos
puntos específicos; lo importante es que dichos puntos representen las
propiedades de la imagen que intervengan en su clasificación o cliferen-
ciación entre otras imágenes distintas por ser reconocidas. Dos métoclos
para definir los puntos específicos son los siguientes: por umbral cle
brillo y por extracción de contornos.
para
el primer método se selec-
ciona un umbral de brillo determinado B y los puntos específicos de la
imagen serán todos aquellos pixeles cuyo brillo á.. sea mayor que B. El
método de contorno requiere que se utilice un algoritmo de extracción
de contorno sobre la imacen.
R¡ot,s ¡i r,u¡tr.¡ru,r¡.¡s
Rl r . r i , s xr , l r ol . r t . t , s i I
a
I i i gura 1. I l . Ext ract or de propi edades
Se parte cle una irlagen nonnalizada y se aplica un operador de ex-
trucción cle borcles Sobel. Cor¡o resultado de la selección de los puntos
cspecílicos sobre las imágenes respectivas de arriba, todas los pixeles
r)cgros en la imagen son puntos específicos seleccionados.
Para el presente trabajo se ha utilizado el método de extracción de
contornos meciiante un operador Sobel
[29].
El método de umbral de brillo
rrplicado a imágenes relativamente grandes como las utilizadas en este
trabajo (100 x 100 o 150 x 150) permite obtener como resultado numerosos
¡lrnios
específicos que irnplican el incremento nasivo de recursos nece-
sarios para el procesamiento de éstos y las posteriores etapas del PCNC.
Para cada punto específico se define un rectángulo de dimensión w x
ir en cuyo centro está precisamente este punto (Figura 1.12)'
l
l l
l
1.12. Selección de puntos específicos.
32 R¡o¡s NeunoN¡t,L,s
Del interior de este rectángulo se extraen múltiples propiedades de
la imagen mediante el procedimiento que se explica a continuación.
Un conjunto de puntos positivos p y negativos n determinan cada una
de las propiedades dentro del rectángulo. Estos puntos se distribuyen
aleatoriamente dentro del rectángulo y su número es fijo para toda la
estructura. Cada punto P,, tiene un umbral
f,
el cual se define aleato-
riamente en el rango:
T^u, 3 Tu 3 Tr,,r, (1' 11)
Los puntos positivos serán activos siempre que su brillo sea:
b
>7. (r. r2)
Los puntos negativos serán activos siempre que su brillo sea:
b, , 3 7, , . ( 1. 13)
Existirá una determinada propiedad en el rectángulo si todos los
puntos, tanto positivos como negativos, se encuentran activos.
Se procura que ninguno de estos rectángulos de búsqueda de pro-
piedades en la imagen salga de la misma. Debe recordarse que una
característica de las imágenes que se procura reconocer en este trabajo
(imágenes normalizadas) es que éstos no tienen puntos de interés en
las orillas. Sin embargo si se eligen los parámetros de ventana w y h
relativamente grandes con respecto a las dimensiones de la imagen Wy
H existirán más probabilidades de que haya rectángulos que salgan de
los límites de la imagen. Esto se hace más probable si existen puntos
específicos cerca de las orillas. Considerando lo anterior, se expande la
imagen rvl2 pixeles a cada lado y hlL plxeles arriba y abajo con color
blanco, es decir, significando ausencia de todo punto específico posible
y evitando que cualquiera de estos rectángulos salga de la imagen.
Se uti l i zan muchas propi edades di sti ntas FtQ
:
1,...,
D,
donde Ses
por lo general del orden de miles. El extractor de propiedades examina
las S propiedades para cada uno de los puntos específicos definidos.
Todas las propiedades extraídas de todos los puntos específicos deflnidos
son entregadas al codiflcador.
Codificador
El codificador (Figura 1.10) transforma las propiedades dadas por el
extractor de propiedades a un vector binario:
Rt uus Nt , unr >N, ql l s i 3
V:
{v, l
u, :
{0,
1}, i : ( 1, . . . , 10} ( 1. 14)
Para cada propi edad extraída
d,
el codi fi cador crea un vector
:rdi ci onal bi nari o:
g:
{u, l
a, :
{0,
l }, i : ( 1, . . . , 10} ( 1. 15)
Este vector contiene K 1's, donde K < < N, al menos cien veces
menor. Un procedimiento aleatorio que se explica más tarde es utilizado
para elegir las posiciones de los unos en el vector U para cada propiedad
/1 . Este procedimiento genera la lista de posiciones de unos para cada
característica y salva todas estas listas en memoria no volátil. El vector
U, es llamado máscara cle la propiedad Fo.
Primero se definen S propiedades. Cada una mediante p puntos
positivos y r? puntos negativos aleatoriamente distribuidos sobre un
rectángul o de ry x ft pi xel es (Fi gura 1.12). En el cuadro pri nci pal se
muestran los puntos específicos de una imagen. Para cada uno de estos
puntos se prueba la existencia de las S propiedades. En la imagen se
muestra el proceso de búsqueda de la propiedad
{.
En la siguiente etapa del proceso de codiflcación se hace necesario
transformar el vector auxiliar U al nuevo vector U*, el cual corresponde
a la propiedad localizada en la imagen. Esta transformación se hace
mediante permutaciones de los componentes del vector U. El número de
perrnutaciones depende de la localización de la propiedad en la imagett.
Las pernutaciones correspondientes a las direcciones horizontal ()O y
vertical (I) son permutaciones diferentes.
Una perrnutación de ¿r¿ elementos P,, puede ser representada como
un vector rr-dimensional. Para aplicar esta permutación a un vector éste
debe ser de dimensión n. En términos formales:
P, , , ( V' ) : V' l r ' : {v' , }
( 1. l 6)
Lo cual significa que el resultado de aplicar la permutación P
,
a un
vector V resulta en un nuevo vector V' cuyos componentes se definen
tomando cada componente v- de V' y colocándolo en la posición p,
de V', es decir. a la que apunta el índice correspondiente del vector
de permutaci ón
{,.
En l a Fi gura 1.13 se muestra un ej empl o gráfi co
simple de lo anterior.
l'
!
l -l
Rt' l l l ' s Nt' tl l ol ' l t-t-s
( ' l l i i l t cl t ci i r t t de l as pr t l pi edades
[:i r)f(j hl cnl a
es obtcuer tal es córl i gos bi nari os cl e l as propi edades l os
i . , l . , , , i . , . r r , t g. , r cor r el aci ónf uer t esi l adi st anci aent r el asl ocal i zaci ones
i l e i i r:,
i )íupi edacl es
es pequeña, y que tengan correl aci ón débi l si l a
Ll i :,r¡ne i .t enrre l as l ocai i zaci o' es
tl e l as propi edades es grande'
fi,rl
=0 J/'D
=l E(t)=2
E(x):3
qrho ¿(iFl
a
Evts2
s.114
Rl , l l , s xl ' t t l t t t : i r l . t , s . l 5
existienclo entre éStos una correlación clébil o ausencia de correlación. En el
caso cie que la misrna propieda1l se encuentre en puntos vecinos entonces éStos
deben ser cociificados con los mismos vectores
(J*
rry
U*
rr.
Esta propiedad que
se acaba de describir permite que el sistema de reconocimiento sea insensibie
a pequeños desplazarnientos de los objetos en la imagen'
Para cociificar la localización de la propiedad 1i* en ia imagen es
necesario def,nir y dar vaior a la distancia de correlación D,.' Sea la
propiedad F, cletectacla en dos puntos tlistintos P,(x,,
f ,\
Y
Pr(xr,
).),
sean U*", y U*rrkts vectores bi nari os que codi fi can a
d
para estos
puntos respectivamente y sea ¿/ la distancia euclidiana entre estos pulltos
dados por:
u
: . 8; , ) ' . 1y, " yJ
( l . i 7)
Los vectores U*r,
Y
L/*"restán correl aci onados si d
(
D,, y no
están correl aci onados si r/
>
D,.
Para tratar de cumpiir con eslas propieclacles, se deben calcular los si-
gui entes val ores para una propi edad detectada /i ^ en un punto P(¡' i ):
X: i l D, ,
E(E
:
í nr (X¡,
(1. 18)
R( E: i - E( n' D, ,
Y
:
JID,,
E( n: i nt ( Y¡
,
( 1. 1e)
R( v) : j - E( v) ' D, ,
n( x) N
n-
r \
D
( I . 20)
n( v) N
P, s
' D.
donde ir¡¡(D es la función entera, por lo tanto E(X) y f(Y) son las
partes enteras cle X y Y, respectivamente, y R(E y R(y
)
son Ias partes
fi acci onari as de Xy { respecti vamente.
A la máscara de la propiedad
{
se ie considera como un cócligo de
esta propieclad localizado en el punto origen de la imagen: O (0' 0)' k-t
cuat iignitrca un punto izquierdo y superior cle la imagen. Se definen las
e{t c
oat t
b.
Fi gur a 1. 13. Per l nut aci ón y su r epr esent aci ón sobr e un vect or '
Por ejemplo, si una mislla propiedacl
d
se extrae tanto en un extremo de
la letra eicrita en la imagen como en el otro extremo de esta letra' entonces
éstas cleben ser cotlificadas comc vectores binarios distintos U*''
Y
U*r"
$;
¡{
l 6
permutaciones
P, y Pi como requisito
para obtener
los cócli!'tls corres-
pondientes de tas propreJades existentes
en cualquier
pullrc cle la irnagen
fuera del origen. u" g."ttuf,
fara
obtener.el
cócligo <te la propiedad
d
p.ti.*ti.",.
al punto P(i,
)
ie procecle de la siguiente
forlua:
1. Primero se trata el clesplazamiento
horizontal'
para lo cual
.se
aplica E(l) veces la permuiaciOn
{
al vector U*' después *.
"p]lt^1
la misma
permutacián
una vez máí pero solamente
a los primeros
{
comPonentes
del vector U*'
-. -r:
2. Segundo,
se trata el desplazamiento
vertical de misma forma' Se
aplica la permutación
P, ¿ill veces,con una permutación
adicional
para l os pri meros P, componentes
oe ui '
Ejemplo cle
Permutaciones
El procedimiento
anterior se ilustra mediante un ejemplo
para facilitar
su comprensión.
La áit*"tiO"
del vector U y los valgre¡ X y Y del
pun,o f ," eligen peqrreños con el propósito de dar claridad al proceso
'
Tomemos
"o.o
po.o.ttros del
p-CNC
D.
:
8 y N
:
9' y sean
{ Y
P, dos permutaciones
de dimensión
N'
Supóngase
qu. tu piopitdad F* está detectada
en el punto P (11'
22) y seael vector U la máscara correspondiente
a esta propiedad' La
tarea consiste en codificar U en un nuevo vector U* atendiendo
a las
coori l enacl as
del punto P' Como
pri mer paso se apl i can
(1' 18)' (1.' 19)
y (1. 20) resul t ando
; @
:
t , ni v)
:
?' Pr:
3
v
l r. : .
6' se apl i ca
a continuación
E(x¡
='f psrrnutaciones
P, al vector {'r (Figura I
'
14) y
i";;;
"i
resultaclo
(U,) sÉ aplica una permutación
adicional únicamente
a los primero' r'
:
á'ffiontntt''
dt lo cual se-obtiene
"
"t:-'::^y^:
toclos los componentes
qut no sean clefinidos mediante
la permutacton
parcial se copian del veótor anterior correspondiente
no importando
si
fueron permutados.
A partir clel proceso anterior tenemos las siguientes
trayectorias
de ejemPlo:
ur - 2 un- 2 u7- > u6- > u1'
( 1' 21)
REo¡s Neuno¡¡¡Les 37
fü#=3
aaa
eil.n=0
pf v- l
a
Fi }L)
s.4=J
aaa
b
Figura I . 14. Ejemplo de permutaciones: a) X permutaciones; b) Y permutaciones.
Una vez hechas las permutaciones X, realizamos las permutaciones
f con el mismo procedimiento, sólo que ahora lo haremos con el vector
U' y aplicaremos la permutación P,, y los parámetros E(Y) y Pr. En la
Figura 1.15 se muestra gráficamente este procedimiento. El resultado
de esta permutación proviene de ambas permutaciones aplicadas sobre
el vector máscara U dela propiedad Foy le llamamos vector U*. Este
U1
\ ,
¡ / -
-V
,''
-'M
]'f
'
,ilt;
-t.'4\
',,/
\
UI
-rvl"'
.r''
*'k".,*
- "\ Va
-,,Vt'''
-,"t,
A
Y \
----t
-/v
J
/'\'r
/ n\
ut
\ . , / -
-\,r/ ¿n
-I ¡'
P
- ' \
' r . /
-
\ /k:
-\
Y.¡
"+
)Xi,A,
x \--"-r
-/.{\
- / \ \ , - r
j
¡4"-
u'' \
U1
u2 U?
U1 L)l
U} U3 U3 U]
U4 U4 U4 U4
t 1<
u5 U5
U5
U6 U6 ud
v6
U7 u7 U7
ffi
UB U8 U8
U8
Ug U9 U9
U9
l 8
l {l l ) l s Nl l t l t oN, \ l . l : S
vector coclilica la propieclad
d
en l¿i ubicaci(ltl tlcl
¡luttttl
P, es tlecir en
l a posi ci (rn (11, 22) cl e l a i magen correspondi ente'
Posi ci ones de l os componentes del vcctor U
Dcspués dc X DesPtrÓs cl c Y
Ini ci al
pct' tnu"aci otrcs pcrtnutacl ol l cs
Fi gur a Ll 5. Rcsul t ar l os de X v l / pcr l nut l t ci oncs'
Propi cdades dc l as pernl utacl ones
Consideremos ahora las pro¡rieilacles de las permutaciones descritas'
Supóngase
que la propiedad F* ha sido detectada en dos puntos P
íx t'
y
')
y br(i ,l r). sea U^ l a máscára correspondi ente
para esta propi edad'
Se definen d.r
Y
dY cotllo
, ¿¡
:
I , r ,
- x, l ,
( 1. 21)
¿, v
:
l y,
- y, l (t . 22)
Después cle realizar las X pernutaciones horizontales' los vectores
corresponclientes
U*, y U*, serán clistintos' Sea Arl la distangia 114-
mrning entre dos vectores Ú*,Y U*r' Se puecle mostrar que el valor
promedio cle A¿ puede calcularse de forma aproximada con
l ¿x
l An: 2' K *, i t ( dxcD, ) ,
j D.
f nn
: z
. K,
i f ( cl x > D. ) ,
R¡ : t ¡ l , s ¡ ' l l : t R{) \ \ t . t , s ] 9
( 1. 23)
ti onde D, es cl i stanci a predetermi nada de correl aci ón.
Después de las permutaciones verticales f, los vectores resultantes
correspondientes U*/ y U*, tendrán la distancia Hanming que puede
ser esti mada nor
Ln' : 2 K An
donde
( r . 24)
)
and (dr < D,
),
e. z5)
Por l o anteri or l os vectores U*,y U*restarán correl aci onados sol a-
mente si se cumpl e d* < D,y dy < D,. La correl aci ón se i ncrementará
si dr y d,y se decrementan.
En l a Fi gura 1 . 15 se muestra cómo se puede pretender que di sti ntos
componentes del vector U se queden en la misma posición luego de
realizar las permutaciones. Por ejemplo, luego de las permutaciones X
el componente ¡le ocupa dos posiciones en U', o luego de aplicar ambas
permutaciones el componente u, termina en dos posiciones y el lr, en
dos. Estos eventos son indeseables. La probabilidad de que tales eventos
indeseables sucedan es inversamente proporcional a la dimensión de Ny
a l a rel aci ón Nl K, y atendi endo a l os val ores grandes de Ny pequeños
para K la probabilidad de estos eventos es menor de 0.01 %
tl9l.
Vector códi go V
Una vez cal cul ados todos l os vectores U*, de todas l as propi edades
detectadas en la imasen se crea el vector códiso def,nido como
-
40
Rt,ol ,s ¡l euRo¡t¡t-t,s
v,
=
LJu, , ,
( 1. 26)
donde U es el símbolo de la disyunción, il*.' es el i-ésimo componente
del vector U*., que corresponde a la propiedad detectada
{'
Al utilizar números aleatorios independientes para la generación de
las máscaras se logra que este proceso de codificación produzca repre-
sentaciones mayoritariamente independientes para todas las propiedades.
La única, pero débil, influencia entre las distültas propiedades aparece
cuando se atrsorbe algún 1 en la disyunción
(1.26)'
Enrarecinliento dependiente de contexto
(Context Dependent Thi nni ng, CDT)
Para reconocer alguna pieza en una imagen se hace necesario utilizar
una combinación de propiedades, es <lecir, combinar la existencia de
ciertas propieclades con la ausencia de otras' Para lograr este propósito
de combinación cle propiedades se ha utilizado con éxito el cDT o
enrarecirniento dependiente de contexto t301.
El CDT ha sido desarro-
llado con base en el proceso de normalización de vectores
[31].
Existen
diversos procedimientos de implementación del CDT. En este trabajo
se utiliza el procedimiento que se ilustra en la Figura 1.16. Este nuevo
esquema de permutaciones no depende de X y Y permutaciones' Se
prueba cada cornponente v, del vector V; si v'
:
0 no se hace nada; si
i,: I se considera la trayectoria de este componente individual durante
uigunur permutaciones siguiendo las flechas en la Figura 1.16. Si esta
truy..toiiu pasa por al menos un elemento " 1" del vector
y,
el valor
de v. se convierte en 0'
Ün ejemplo gráfico de lo anterior se tiene en la Figura 1'16' Si se
representa la permutación mediante flechas, la permutación del elemento
v, sigue la triyectoria indicada: rr
t
vo -t ,,
-
v' S^i cualquiera de
l ás componentes v' vso vzes i gual a 1 entonces v,
:
0' Lo mi smo se
hace para todos los elementos de vconstruyendo un nuevo vector y sln
alterar el vector original.
ReorsxLu¡¡or, rrr, r, s 4l
Figura 1.16. Permutaciones para CDT.
Una vez que se aplica el CDT al vector V se ha cumplido con el
proceso correspondiente del codificador. El vector V'de dimensión N
representa el código de la imagen presentada originalmente al extractor
de propiedades. Este resultado permite pasar al clasificaclor neuronal.
Clasificador neuronal
En la sección 1.3.2 mencionamos el perceptrón de Rosenblatt. Este per-
ceptrón posee muy buena convergencia; sin embargo, requiere que en el
espacio paramétrico las clases tengan separabilidad lineal.
para
obrener
esta separabilidad lineal, las etapas anteriores del PCNC (el extractor
de propiedades y el codificador) convierten el espacio paramétrico de
una imagen representado por el brillo de todos los pixeles de ésta a
un espacio paramétrico de mayor dimensión. En general, tenemos un
espacio paramétrico de dimensión IV
*i.l
convertido a otro de dimensión
N, donde Wy F1 son el'ancho y el alto medidos en pixeles cle las imáge-
nes que se van a procesar mediante el PCNC, y N es el parámetro del
PCNC igual a la dimensión del vector V'. Este procedimiento mejora
considerablemente la separabilidad lineal del espacio paramétrico que
representa la imagen y el objeto que ésta contiene.
En la Figura 1.10 se presenta la estructura del clasificador neuronal
PCNC. Es decir, respecto al clasificador LIRA, se sustituyen las capas
S e l por los dos bloques previamente descritos. Nótese que con esta
Permutaci ones para CDT
-
+l
Rl ' l ¡ t : s ] t l l ' t l ncl ¡ ¡ t ' t ' s
{u\ti l i .i i :i i rl -, i ;r r' .' i l ri l .1 r-l el ¡:l asi l i r--i i dor i l cur()nal pasa a contetl cr exacta-
l n.rrl f ¡i i v{.rr{{tr V' i xl r }o cuül t"l cbe tener N el ementos'
Pfor' c¡rl r.i r: r ¡rtt l l tatrl i c¡rl tl
lii a{uirdil;¡ ilis similituiies el}tfe las estructuras tlei PCNC y del clasilicaclor
nei¡ronal l.lRA tcneuros que la úrica parte de ambos que varíl durante el
pri)ct::iio de cn{renatlliel.ito son las conexitttles entrc lirs capas
'4
y R' por
l cl a¡ l t oel pr occsot l ccnt r cnat r r i ent t l i l escr i t opar ael cl asi f i cador Ll R¡ \
(rpartaclo i.3.2; tunciona igual para el PCNC y por lo tanto es aplicailo'
f r l nr o' , , , , u, , dccr xl i l l cl ci t i nt j el asi r nágenesapi i cadoaLI RAesvál i dopar i t
ei PCN{I ptr itl rlue tambiún se elllica en éste' Esto se clebe a c¡ue cada
i nl i i g,:n ttri drá rl ¡t vrct-(]r 11' que ctrdi l i ce sus propi ccl ades extraícl as' por l o
cuafpueci e' rl sarse.sta:; a tfi l vós de l ' ' cn l ugat' ri c l i r i rl rage' para t.dos
prop(]sitos cle cl¡trr::ira¡l'riento,
coll lo tll't': sc aliorran lgcursos dc cómputo
y ti et!!i r{l del
i trt.' cesi l ,
l ,3.4. Dt'-stri¡tlrtres
'-tIcrLtrtríos
IttcrtIes
(RLD)
Dcspuú.s anal r¿ar todos l ()s pari rdtgtrtas tl e l os cl asi fl cacl ores neuronal cs
podenros gencrai i zar l a i cl ea tl e extracci ón de l as característi cas'
La i deá de dcscri ptores al eatori os l ocal es
(Random Local Descri p-
tors, III-D) apareci ó menci onada
por pri mera vez en l as publ i caci ones
t 3j , t i l l , t 2l l .
LosRLDsebasanendosi r i easbi enconoci cl as"Lai deadel osdes-
criptores aleatorios de la intagelt fue propuesta por Frank Rosenblatt'
En su perceptrón de tr., .opu, [3]
cada neurona cle la capa asociativa
desempena et papet clel descriptor aleatorio de la imagen' Tal neurona
está cánectacli con alguno, puntot aleatoriamente seleccionados
en la
retina (intagen de la Jntrada) y se calcula su función usando el brillo
cle estos puntor. Es importante clecir que las conexiones de la neurona
no son modificables duiante el proceso del entrenamiento' Otra idea de
descriptores locales procecle ¿efclescubrirniento
de Hubel y Wiesel [33],
[34].
Ambos demostraron
que en la corteza visual (vlsrlcl coñex) de los
animates hay descriptores locales que corresponden a la orientación local
de los elementos ilel contorno, loi movimientos, etcétera. El cdnjunto
cle descriptores locales clescubiertos es probablemente incompleto porque
en los experimentos de Hubel y Wiesel fueron detectados solamente los
clescriptores o características
que habían sitlo preparados de antemano
pu.u pr.r.ntur a los animales. Es posible que no todos los descriptores
Rt , nr ' s Nl , t Ror . r t . r , s ' l ]
(características) clue se pueden cxtraer de la corteza visual de los animales
hayan sido investigados. Los descriptores aleatorios de F. Rosenblatt
pueden superar esta desventaja, pero el uso de estos descriptores al mismo
tamaño de las irnágenes disminuye la eficacia de la aplicación.
Introduci rnos RLD que sean si mi l ares a l os descri ptores de Rosen-
bl att pero l os apl i camos en el área l ocal de l a i magen. En l a pri mera
versión de nuestro sistel.ua de reconocimiento cada desciiptor aleatorio se
apl i ca a su propi a área l ocal , sel ecci onacl a al eatori an.rente en l a i magen.
Este si stemadel reconoci l ni ento fue nombrado LIRA (apartado 1.3.2.).
El LIRA fue probado en la base de datos cle ttNIsr con resultados bastante
buenos. (Más attelante nos referirentos a las aplicaciones de LIRA.) Una
de las desventa.ias del LIRA es su sensibilidad a los desplazamientos de
las características en la irnagen. Compensamtls esta desventaia agregando
ilistorsiones de las irnágenes de la entrada durante el proceso del entrena-
mi ento. Pero este métocl o no se puede uti l i zar para l os despl azami entos
grandes. Por esta razón desarrol l amos un si stema rnl ts sofl sti cacl o para
el r cconoci nr i cnt o cl e l l i r r r agen.
El esquema del si stema de l os obj eti vos general ers del reconoci mi ento
de i magen se nr uest r a en l a l i i gur a l . i 7.
dt l
dzt
ffi5
4''
Fi gura 1.17. Esquenta tl el si stenra dc obj cti vos gcncral es del reconoci mi ento dc l a i magen.
-
A t R¡ . l r t s xt t l Ho¡ nLt s
La base de este sistema consiste en una red neuronal de múltiples
capas. La primera capa S (capa sensorial) corresponde a la imagen de
la entrada. La segunda capaD, contiene RLD del nivel más bajo' La
capaDrcontiene RLD del nivel más alto. La capa asociativa,4 contiene
lai neuronas asociativas. La capa R contiene las neuronas de la salida;
cada una de estas neuronas corresponde a la clase de la imagen bajo
reconocimiento.
El esquema del RLD del nivel más bajo se presenta en Figura 1'18'
cada RLD contiene varias neuronas (las neuronas se indican con
los números 1-5 en Figura 1.18). Todas las neuronas del RLD están
conectadas con el área local de capa s (ventana rectangular con el ta-
maño ft*w). Las neuronas con los números 2 a 5 sirven para probar los
pixeles de capa S, seleccionados aleatoriamente en Ia vetrtana'
^,
ON neurona
*\J

OFF neurona
Fi gura 1.18. Esquema de RLD del ni vel más baj o'
Llamamos a estas neuronas las neuronas simples' Hay dos tipos de
neuronas simples: ON-neuronas
y OFF-neuronas
(similares a ON- y
oFF_neuronai de redes neuronales naturales). La salida de la neurona
si mpl e es 0 o l .
Reu¡-.s url ;non.rLts 45
ON-neurona tiene salida 1 si el brillo xu del pixel correspondiente es
más grande que el umbral de la neurona Try 0 si su umbral es menor
(formul a 1.5).
OFF-neurona tiene salida I si el brillo del pixel correspondiente es
más pequeño que el umbral de la neurona
!
(forrnula 1.6).
En la Figura 1.18 las neuronas con los números 2 y 4 son las ON-
neuronas, las neuronas con los números 3 y 5 son OFF-neuronas. Los
umbrales
{
se seleccionan aleatoriamente en el intervalo dinámico del
brillo de la imagen de la entrada.
La número I es una neurona compleja. Tiene conexiones excitatorias
con todos los pixeles que pertenecen al pequeño rectángulo (E-rectángulo
en la Figura 1.18) localizado en el centro de la ventana ft*rv y de las
conexiones inhibitorias con todos los pixeles que se localizan fuera del
E-rectángulo pero dentro del l-rectángulo. El filtrado que realiza la
neurona número I es determinado por los pesos de estas conexiones.
Utilizamos solamente dos tipos de filtros. Uno de ellos selecciona los
puntos donde el brillo es mayor que el umbral predefinido. Utilizamos
este filtro en el sistema del reconocimiento de las cifras escritas. El
segundo tipo de filtro selecciona ios puntos donde el gradiente del brillo
está más grande que el umbral predefinido. Utilizamos este filtro en el
sistema del reconocimiento de las caras y en sistemas de aplicaciones
micromecánicas. Los puntos seleccionados por el filtro son llamados
puntos del interés.
La neurona de la salida del descriptor D tiene salida I si todas las
neuronas con los números I a 5 tienen salida 1. Si por lo menos una
de estas neuronas tiene salida 0 entonces la salida de la neurona D es
0. La neurona D se puede llamar AND-neurona.
La capa neuronal D, (Figura 1.17) consiste en un número de planos
d,,, d12,..., d,*. Cada plano contiene el número de las AND-neuronas
igual al número de los pixeles de la imagen de la entrada. Cada plano d,,
preserva la topología de la imagen de la entrada, es decir cada neurona
del plano d' corresponde al pixel situado en el centro de la ventana
correspondiénte ft*w (Figura 1.18). La topología de conexiones entre
la capa sensorial y las neuronas 2-5 (Figura 1.18) es la misma en el
intervalo de cada plano d,,(Figura 1.17). La topología de conexiones
entre la capa sensorial y la neurona número 1 es igual para todas las
neuronas en todos los planos de la capa D,.La meta de cada plano es
detectar la presencia de una característica concreta en cualquier lugar de
la imagen. El número de planos corresponde al número de características
-
46 l {l , ul , s ¡ , r . t . Hosr t - t s
extraídas (en nuestro sistema cada característica corresponde a ult clt's-
criptor). Un número grande de características permite que obtengamos
una buena descri pci ón de l a i magen baj o reconoci mi ento. Uti l i zamos
12,800 características para la base de datos tvtxlsr y 200 características
para la base de datos onl. Es necesario solucionar el problema del
riesgo estructural para estimar el número requerido de características.
Resulta dernasiaclo difícil obtener una soluci(ln de carácter analítico de
este problerna para un sistema complejo del tipo que proponemos. Esa es
la razón por la cual estimábamos el núlnero requerido de características
experirnentalmente para cada problerna de reconocimierlto.
La capa D, (Fi gura I . 1 7) tambi én conti ene M pl anos de ne uronas.
Cada neurona del plano d, está conectada con todas las neuronas del d,-
l ocal i zadas dentro de l a ventana rectangul ar. La sal i da de cada neurona
es I si por l o menos una de l as neuronas conectadas cl e d,rti ene sal i da
i . Tal neuro¡l ¿r sc l l ama O-neurona. La topol ogía de l as neuronas de
dr- corresponde a la topología de las neuronas de d,, y a la topología
de S capa.
A todas l as neuronas que ti enen sal i da I l as l l amal ' nos neuronas
acti vas. El térmi no "neurona acti va" se rel aci ona con el estado actual
de l a neurona. Los térmi nos ON- y OFF-neuronas especi l i can el ti po
de la neurona.
La capa asoci ati va,4 conti ene N el etnentos asoci ati vos que recogen
l a acti vi dad de l as neuronas al eatori amente sel ecci onadas D' Esta capa
también realiza la función de interconexión obligatoria que será clescrita
en detal l e más abaj o.
En la práctica demanda mucho tientpo la realización cotrto progralna
de conrputacl ora del si stema de reconoci mi ento de i ntágenes propuesto.
Para reduci r el ti crnpo de córrputo u¡i l i zanos el ntétodo si gui ente: para
cada pi xel de l a i ni agen de l a entrada cal cul arnos l a acti vi dad de l a
neurona corn¡rl ej a I (Fi gura 1.18). Si esta neurona es acti va hacemos
cál cul os secuenci al es sol amente para l os el ementos de l a red neuronal
que estén conectados con esta neurona acti va. En nuestro trabaj o el
número de neuronas complejas activas es ntucho [lenor que el número
entero de neuronas compl ej as. Segui mos este pri nci pi o tambi én en
otros cál cul os, hasta el cl e l as exci taci ones de l as R-neuronas, eÉ deci r
anal i zamos sol amente l as conexi ones que correspondan a l as neuronas
acti vas de l as capas D,, D, y,4. Este método recl uce el ti empo del
cál cul o y permi te si mul ar el si stema propuesto del reconoci mi ento en
ti emno real .
Rr . o¡ , sxl , ut t os, r r . r , s 41
Di storsi ones
De forma similar que con el clasificador neuronal LIRA, y con el obje-
tivo de arnpliar el conjunto de imágenes destinadas para entrenamiento
del PCNC, se consi deró l a apl i caci ón de di storsi ones sobre l as i mágenes
nonnal i zadas ori gi nal es. En vi rtud de que el PCNC no es sensi bl e a
clesplazamientos cartesianos de la inragen, sólo se aplicaron ilistorsiones
angul ares (Fi gura 1.9). Las di storsi ones angul ares apl i cadas sobre l as
i rnágenes represel ttan pequeñas vari aci ones en l a exacta al i neaci ón de
l as pi czas en el ej e hori zontal de l a i magen que pasa por el centro. Por
esto se real i zaron experi mentos con di versas di storsi ones angul ares.
Tal es experi ntentos se expl i can en el si gui ente capítul o.
Para real i zar estas di storsi ones se ha uti i i zado el mi smo nrétodo cl e
creaci ón de i rnágenes di storsi onadas que para el cl asi fi cador LIRA. Se
consi der(r l a creaci ón de tal es tl i storsi ones en pares con el mi srno val or
absol uto angul ar pero con senti do contrari o.
Di scusi ón
Se ha comprobado que el cl asi l i cador PCNC es si mi l ar al LIRA en l o
que respecta a su método de cl asi fi caci ón; si n embargo, ambos di l i eren
en l a fbr¡na en que se crean o extraen l as propi edades de l a i magen que
se va a cl asi fi car. Así, es en l os procesos de extracci ón de propi edacl es
y de codificación clonde está la rlif'erencia entre el FCNC y LIRA. Esta
diferencia tiene dos características cle importancia, una es la capacidacl
de aplicar y probar diversos métodos de extracción de puntos específicos
y no l i mi tarse úni camente a ui vel es de bri l l o a través de un umbral , l o
cual abre paso a l as posi bi l i i l ades que ofi ece cl preprocesanti enro en
l as i mágenes por cl asi fi car. La otra característi ca es l a consi deraci ón
expl íci ta de l a posi ci ón de l as propi edades encontracl as en l a i rnagen
que l l eva a cabo el codi fi cador.
La pri nci pai desventaj a del PCNC sobre el cl asi fi cador LIRA
consi ste en que sus requeri mi entos de cómputo son mayores. E,l l o se
clebe a la necesidad de realizar gran cantidad de cálculos con vectores
durante el proceso de codi fi caci ón de una i magen. Al comparar l a
parte de extracci ón de propi edades de LIRA y del PCNC se observa
que ambos ubican ventanas aleatoriamente en la imagen de entrada y
que el número de puntos de cada una de el l as puede ser si mi l ar; si n
ernbargo, mientras la cantidacl total de ventanas aleatorias en LIRA será
i gual al número de grupos en l a capa 1, -que es un parárnetro de.este
-
48
Reor:s Neuno¡¡el es
clasificador del orden de 100,000 para la tarea de reconocimiento que
nos ocupa-, en el PCNC el número de tales ventanas será el número
de puntos específicos extraídos de la imagen multiplicado por el pará-
metro S, y dado que este parámetro está entre 1000 y 10'000' tenemos
que para el caso de S
:
1000 con 100 puntos específicos igualamos los
requerimientos del clasificador LIRA y en el orden en que este último
número sea rebasado lo serán los requerimientos del PCNC respecto
de LIRA en términos generales. Si consideramos que las imágenes
normalizadas con las que se ha trabajado poseen una dimensión de 100
x 100 como mínimo, igual a 10,000 pixeles, se tiene que el número de
puntos específicos que se requierenpara igualar los requerimientos de LIRA
deberá ser de aproximadamente I %. Esto lleva a intentar mejorar el
método de selección de puntos específicos o a trabajar con las imáge-
nes normalizadas reducidas a cierta escala. Por lo anterior, de usarse
el tamaño original de las imágenes, el método de selección de puntos
específicos por umbral arrojará gran porcentaje de puntos respecto al
total de pixeles de la imagen por lo que los requerimientos computacionales
y de tiempo crecerán mucho.
Referencias
1. Feigenbaum, E.A., J. Feldman (eds.), Computers andThought, McGraw-
Hi l l , Nueva York, 1963.
2. McCulloch, W. S., W. Pitts, "A Logical Calculus of the Ideas Immanent
in Nervous Activity", Bulletin of Mathematicall Biophysics' no. 5' 1943'
pp. l l 5- 133.
3 . Rosenblatt, F . ,
Principles of Neurodynamics: Perceptons and the Theory of
Brah Mechanisns, Spartan Books, Washington, 1962, p. 616.
4. Hopfield, J.J., "Neural Netwo¡ks and Physical Systems with Emergent
Collective Computational Abilities", Proceedings of National Academy of
Sciences, USA, 1982,
'79,
pp.2554-2558.
5. Amosov, N.M., T.N. Bai dyk, A.D. Gol tsev, A.M. Kasatki n, L.M. Ka-
satkina, E.M. Kussul, D.A. Rachkovski, Neurocomputadoras y robots
inteligentes, Naukova Dumka, Kiev, 1991.
6. Basak, J., C.A. Murthy, S. Chaudhury, D.D. Majumder, "A Connectionist
Model for Category Perception. Theory and Implementation", IEEE Tran-
sactions on Neural Neworks, vol. 4, no. 2, marzo,1993' pp. 257-269'
Rcors¡.¡ru¡roN¡r-l-s 49
7. Carpenter, G.A., D. Grossberg, "The Art of Adaptive
pattern
Recognition
by a Self-organizing Neural Network", Computer, vol. 21, no. 3, marzo,
1988, pp. 77-88.
8. Fukushima, K., "A Neural Network for Visual
pattern
Recognition", Cozr-
puter, vol .2l , na.3, marzo, 1988, pp. 65-75.
9. Kohonen, T., "Speech Recognition Based on Topology-preserving Neural
Maps", in Neural Computing Architectures. The design of Brain-Like
Machines, ed. By I. Aleksander, North Oxford Academic
publishers,
Londres, 1989, p. 26-40.
10. Lippmann R.P., "A Critical Overview of Neural Network
pattern
Classi-
fi.ers"
, Proceedings of IEEE Conference, París, 1991, pp. 266-275.
11. Huang, W.Y., R.P. Li ppmann, "Neural Net and Tradi ti onal Cl assi fi ers",
Neural Infurmation Processing Systems; lst IEEE Conference, Denver,
noviembre 8-12, 19871 D.Z. Anderson, Nueva
york,
1988, American
Insti tute of Physi cs, 1988, pp.387-396.
12. Kussul , E., T. Bai dyk, V.V. Lukovi tch, D.A. Rachkovski j ,
..Adapti ve
High Performance Classifier Based on Rrandom Threshold Neurons",
Proceedings of Twelfth European Meeting on Cybernetics and Systems
Research (EMCSR-94), Vi ena, abri l 5-8, 1994, en R. Trappl (ed.),
Cybernetics and Systems'94, World Scientific
publishing
Co.
pte.
Ltd,
Si ngapur, pp. 1687-1695.
13. Bai dyk, T., E. Kussul , O. Makeyev, A. Cabal l ero, L. Rui z, G. Carrera y
G. Velasco, "Flat Image Recognition in the Process of Microdevice Assem-
bly" , Pattern Recognition Letters, vol. 25, no. 1, enero, 2004, pp. 107- I 1g.
14. Kussul, E., T. Baidyk, "Improved Method of Handwritten Digit Recognition
Tested on MNIST Darabase", Image and Vision Computing, vol. 22, no.
12, octubre 2004, pp. 971-981.
15. Rosenblatt, F., "The Perceptron: A Probabilistic Model for Information
Storage and Organization in the Brain", Psychological Revíew, vol. 65,
1965, pp. 386-408.
16. Rosenblatt
, F . , Prürciples of Neurodynarlics, Spartan Books, Washington,
1962.
17. LeCun, Y., L. Bottou, Y. Bengio, y P. Haffner, "Gradient-based Learning
Applied to Document Recognition", Proceeding of the IEEE, vol. 86, no.
11, noviembre, 1998, pp. 2278-2344.
18. Martín, A., T. Baidyk, "Neural Classifier for Microscrew Shape Recog-
nition in Micromechanics", Conferencia Latinoamericana de Informática
CLEI 2006, IFIP World Computer Congress WCC AI 2006, Santiago de
Chi l e, agosto 2L-24,2006, p. 10.
--
50
Rt ' l l ¡ s l l t ' t l l l ol l t l ' s
l g. Kussul , E. , T. Bai dyk, . . Pernl ut at i veCorl i ngTechni quef br}I andwri t t enDi gi t
Recogni t i on' ' , Proceedüt gsof i l rcI nt eri l af ¡o| l al Joüt t Conf erenceot t NeuroL
N¿nlor*s. vol. 3, Portland' Oregon,
julio 20-24' 2003' pp 2163-2168'
20. Bai dyk T. , E' Kussul , "Neural Net work Based Vi si on Syst em t br Mi cro
Workpi eces Manuf act uri ng"' WSEI S Transct cl i ot t s on Syst ent s' vol 3' no'
2, abri l , 200' 1,
PP.
483-488.
21. Kussul , E. , T. Bai <1yk, D' Wunsch, O' Makeyev' A' Mart i n"' l mage
Recognition Systems Basetl on Ran<lorn Local Descriptors"
'
lnternatiottol
Joinr CortJerettce on Neurctl Nettvorks, Vancuver'
julio 16-21 2006' pp'
4722-412"1.
22. Kussul E. , T. Bai dyk, D. Wunsch, "I mage Recogni t i on Syst ems wi t l i
Permutative Coding"
'
lnternational Joitrt Conference on Neural Networks
'
Mont r eal ,
j ul i o
31, 2005' pp' 1788- 1793'
23. Kussul , E. , D. Racl i kovski j , T' Bai cl yk, "On I mage Text ure Recogni t i on by
Associ at i vePr oj ect i veNeur oconl put er ' ' ' enPr oceet ] i ngsof t heANNI E' 91
cont er ence. . I nt ei l i gcnt engi neer i ngsyst emst hr oughar t i f i ci al neur al nct -
works", ASME Press, C. H' Dagl i ancl S Kunl ara an<l Y' C' Shi n' 1991'
pp. 453- 458.
24. Kussul , E. , D. Rachkovski j ' T Bai t l yk, "Associ at i ve-proj ect i ve
Ncural
Net works: Archi t ect ure, I mpl ement at i on, Appl i cat i ons"' Ni rnes' novi embre
4- 8, 1991, PP. 463- 416'
25. Kussul, E., T. Baiclyk, Neural RandotnThreshold
Classif er in OCR Appli-
cat i on, Ki ev, Ucrai na, 1994, pp' 154-151 '
26. Kussul , E. , T. Bai dyk, V. Lukovi t ch, D' Rachkovski j "' Adapt i ve
l l i gl t
Perf brnl anceCl assi f i erBasecl onRandonrThreshol dNeurons' , ' Cy*berneri cs
at t d SysÍ ems' 94, en R. Trappl (Ecl
),
Worl cl Sci ent i f i c Publ i shi ng Co' Pt e
Lt d. , Si ngapur ' 1994, pp' 1687- 1695'
2T. Kussul , E. , T. Bai cl yk, "I mpr ove<l Met hocl of Fl andwr i t t enDdi gi t Recog-
nition
.I' esterl
on MNIST Database' ' ,
Proceetlittgs of the I5-tlt Internatioltal
Cotference ott Visiott Interface ,
Calgary' mayo 27 -29
'
2002' pp' 192-197 '
28. Kussul , E. , T' Bai dyk, L. Kasat ki na, V Lukovi ch' "Rosenbl at t Percep-
t ronst brHandwri t t enDi gi t Recogni t i on' , , Proceedi t t gsof t hel | úernat i ornl
Joint Cottference ott Neural Nefworks' Washington'
julio l5-19' 2001' pp'
1516- 1520.
29. Sobel , I . , G. Fel cl man"' A 3x3 I sot ropi c Gradi ent Operat or f or Lnage
Pr ocessi ng' ' , St at t f or r l Ar t i f i ci al Pr oj ect , l g63, enPat | er t t Cl assi f i cat i ot t
at t t l Scene Arnl ysi s, Duda, R and P Hart ' John Wi l ey and Sons' 1973'
oo. 2' 71-2"72.
R¡. ot , s xt . l t t o: r, rt Ls 5 |
30. RachkovskU, D. A. , E. Kussul , "Bi ndi ng and Normal i zat i on of Bi nary Spar-
se Di st ri but ed Represent at i ons by Cont ext Dependent Thi nni ng", Nel rnl
Cont put cüi ot t , vol . 13, no. 2, l ' cbrcro 2001, pp. 111-152.
31. Ar t ykut sa, S. Y. , T. N. Baydyk, E. l vf . Kussul , D. A. Rachkovski l , Rc-
t' otr¡citttic¡¡to da Ía.tÍuros cott ctyudct de rtcuroconpulctcloro, Instituto de
Ci ber nét i ca, Ki ev, Ucr ani a, 1991, pr epr i nt 9l - 8.
32. Kussul , E. , T. Bai dyk, D. Wunsch, O. Makeyev, A. Mart i n, "Permut ¿rt i on
Coding
"lcchnique
for Irnagc Rccognition Systcms", IEEE T-rrutsactiotts ott
Naurt l Nrt v. r¡t ks, vol . 17, no. 6, novi embre 2006, pp. 1566-1579.
33 . I I ube I , D. , T. Wi escl , " Recept i ve Fi cl ds, I l i nocul ar I nt eract i on and Funct i o-
nal Architecture in the Cat' s Visual Cortex", Journol of Pltysiology, vol.
106, no. i , l - ondr es, 1962, pp. 106- 154.
-14.
t l ubcl , D. , l ' . Wi esel , "Recept i ve Fi el ds and Funct i onal Archi t ect ure i n
Two Nonst ri at e Vi sual Areas (18 and l 9) of t he cat ", Jounml of Neut ' ol ogy,
vol . 28, no. 2, 1965, p1t . 229-289.
-
2. VISIÓN COMPUTACIONAL
Los sistemas de visión por computadora o computacional son cada día
más comunes en áreas como la automatización de procesos industriales
y la robótica, por mencionar solamente dos ámbitos de la actividad
humana. Los algoritmos adaptativos y los sistemas de inteligencia arti-
ficial permiten construir sistemas de control muy flexibles y adaptables
a los diferentes tipos de trabajos. La inteligencia artificial como área de
investigación científica incluye redes neuronales artificiales, algoritmos
genéticos y lógica borrosa. En nuestras investigaciones y desarrollos
tecnológicos hemos empleado con frecuencia redes neuronales. La com-
binación de sistemas de visión computacional con paradigmas de redes
neuronales nos permite resolver numerosas tareas de automatización.
En el siguiente apartado explicaremos con amplitud qué es un sistema
de visión computacional.
2.1. Srsrsu¡
pe
vl sl óN coMpurACroNAL
Los sistemas de visión poseen numerosas aplicaciones en las más
diversas disciplinas, tanto científicas (biología, astronomía, medicina,
meteorología, etcétera) como tecnológicas (robótica, procesamiento de
documentos, biometría, etcétera).
Como ocurre con otros desafíos científicos, los problemas de visión
computacional se pueden resolver de una manera metódica y estructu-
rada
[ 1] , [ 2] , [ 3] .
El análisis y el diseño eficiente de los algoritmos usados en las
aplicaciones que trabajan sobre imágenes son componentes fundamen-
tales en toda metodología de procesamiento de imágenes y de visión
computacional.
Desde sus inicios, la visión por computadora se ha inspirado en el
estudio del sistema visual humano. Este último sugiere la existencia de
diferentes tipos de tratamiento de la información visual dependiendo de
metas u objetivos específicos, es decir, la información visual percibida
es procesada de distintas formas según las características particulares de
la tarea por realizar. Por eso, la visión por computadora propone varias
técnicas que permiten obtener una representación del mundo a partir
-
Ri , l ) l , S N[ ] l r RON. \ i . l , S
clel análisis de imágenes obtenidas desde cámaras web como modelos
de visión (sistemas artiliciales).
Un sistema de visión computacional contiene los siguientes bloques:
Fi gura 2.1. Si stema de vi si ón cornputaci onal "
2.1 .1. Cámarl s wel )
La vi si ón computaci ol tal es ei conj unto de técni cas y moc.l el os que nos
permi ten el procesami ento, anál i si s y expl i caci ón de cual qui er ti po de
i nformaci ón espaci al obteni da a través de i mágenes di gi tal es.
Debido a que la infbrmación visual es una de las principales fuentes
de clatos del munclo real resulta útil simular estas posibilidades mediante
una computadora
(a partir de imágenes tomadas con cámaras digitales o
analógicas) para que, junto con mecanisnos tales como el aprendizaje,
hagan de ella una herramienta capaz de detectar y ubicar objetos en
el muncl o real , obj eti vo pri nci pal de l a vi si ón por computacl ora. En l a
Fi gura 2.2. presentarnos al gunos ej empl os de cámaras di gi tal es'
La cámara Creative Labs Video Blaster WebCam NX (Figura 2.2' a)
tiene un costo de enIre22 y 39 dólares, puede usar puerto USB y tiene
una resolución de 640 x 480 ó 352 x288 pixeles. La cámara Creative Labs
Video Blaster WebCam NX PRO (Figura 2.2, b) cuesta entre 39 y 62 dó-
lares, tiene conexión con puerto USB y resolución de 1024 x 768 pixeles.
La cámara D-Link DCS - 5300 (Figura 2'2, c) cuesta 378 dólares, tiene
Ethernet, Fast Ethernet; su resolución es de 380 TV líneas. Púede rotar y
capturar imágenes y video en270 grados.
l l xt r accr t n
(l c
a I ri l c I c r i sl I c i i s
Ii EDDS NEUJIONALIJS. VISION CON' f PU' TACIONAL
b. c
Figura2.2. Cámaras digitales: a) Creative Labs Video Blaster Webcam NX; b)
Creative Labs Video Blaster WebCam NX PRO: c) D-Link DCS-5300.
2.1 .2. Captura de intógenes digitales
El tamaño de la imagen se ref,ere a las dimensiones físicas de ésta, ya
sea que se mida en centímetros, pulgadas o pixeles. La resolución de
la imagen es la canticiacl de pixeles por unidad de medida (por ejemplo,
pixeleles por pulgada
:
ppp).Asumiendo que el número de pixeles por
unidad de medida se mantiene constante eu una irnagen, al aumentar
el tamaño de ésta disminuye su resolución y viceversa. De la misma
forma, al aumentar la resolución de una imagen -o sea, el número
de pixeles por unidad de medida- su tamaño se reduce, ya que será
necesaria una menor superficie para acomodar el mismo número de
pixeles. Otro factor que hay que tomar en cuenta cuando se habla cle
las dimensiones de una imagen es el espacio en bytes que ésta ocupa
en un disco. Si el tamaño de la imagen (ancho y altura) se mantiene
igual, a mayor resolución mayor espacio requerirá una imagen para
su almacenamiento. Es por esta razón que al digitalizar eDurr scanner
imágenes muy pequeñas, a veces se obtiene un archivo muy grande si
se escogió una resolución demasiado alta.
55
$
$
ry-
a
56
REDES NEURONALES
La captura de la imagen
puede realizarse
en diferentes
formatos'
Los dos principales
'on
Jf i-tuto
vectorial
y el de matriz de puntos
(raster) o birmap.
u* i*ugtn to:" t:'i, t-"Ttituida
por un conjunto
de pequeños
puntos llamados
pixeles que tienen diferentes colores'
Los
ila;
...uriun
patrón, el cual forma la imagen'
una imagen almacenada
en formato
vectorial es aquella
que se en-
cuentra definicla matemáticamente
por líneas' curvas' círculos' etcétera'
los cuales se guardan t*o iátt"ias
matemáticas'
A diferencia
de las
imágenes
raster,aquí
únicamente
se almacenan
las fórmulas'
Esto hace
queel t amañodel archi vorl el ai magenSeamuypequeño. Unai magen
vectorial
provee una alta calidad,
réquiere
poco espacio de almacena-
mi ento Y
es fáci l de edi tar'
A conti nuaci On
unui i ' u' "mos
l os formatos
BMP' JPG' GIF y
TIFF).
BMP es el fbrmato estánclar
de Microsoft
para imágenes'
No soporta
compresión
y ur-u.tnu1u'
imágenes
con lacalidad
máxima
por la cual
es el que ocupa más ;t;ali.o-
íurgió culn{o cierta compañía
llego al
mundo de las compuiuáo'u'
y selercató
de que nolenía un formato
propio. Así que t"O un" uunqut no fuera específicamente
para el
manejo de imágenes'
El formato JPG (JPEG) fue producido
por Joint Photographic
Ex-
perts Group, cuyas siglas le dieron su nombre' Es muy utilizado
en
Internet
para reducir io"' tittpo' de descarga
de páginas web' Almacena
las fbtografía,
.on un'p'oiun¿iOuO
de colór de Z¿ ¡itt' es decir' 16 mi-
llones de colores, V
tápá* oittintos
grados de compresión'
Este formato
recluce una imagen
"
i^it"^ á¿timá
pa't" (o menos)' w1o
a un
111¡io
muy alto: la pérdida de calidad' Pero este no es el único inconveruente
pues si hacemos
modificaciones
a la imagen V
lu tt-gulTlt^,9::tdundo
enel mi smof br mat ol l egar áaunpunt o. enqueyanonosSl r va. .
GIF son fu, ,igr^ á."Craphicsinterchan'e
Format Y
fu^e producido
poriu..pr"sa
CómpuServe'-Al
igual qu:
IPG'
soporta compresron
y
F:ll':**:::,i:1ffi :llffi'J"'J::H,'ü'5#l::Xin.;:H::
de descarga
de
Pagl
didad de color de S bitt, tiil¿"ndo
una p-aleta personaliza$a
para cada
imagen de 256.oro*'
to-o máximo'
Uno de los colores de la paleta
se puede .onngu'u;-toiio
t'un'puttntt'
GIF emplea
el algoritmo
de
compresión
LZW
(iempel Ziv Welch)
para reducir el peso de la irnagen
sin pérdida ¿. outot' iiiorma
más sencilla de reducir el tamaño de un
ut"ttiuo GIF es disminuir
el número de colores'
RFDES NI ] UI {ON^I - [ S, VI SI Ó\ CO] \ Í PT| TACI ONAI , 57
TIFF ('IIF) son las siglas de Tag Image File Format. Es el fbrmato
que emplean los profesionales del diseño gráfico porque puede guardar
todos los detalles que contiene una imagen. Permite generar imágenes
de tipo bitmap en alta resolución. Es ideal para fotografías e imágenes
complejas para ser utilizadas en impresión. El formato fue creado por
la compañía Adobe Systems y es una de sus aportaciones al diseño de
imágenes para la plataforma Apple.
2.1.3. Extracci ón
de las características de la imagen
Entre las características de una imagen están el color, la textura, la forma
y las relaciones espaciales, FFT, Wavelets, histogramas de brillo, de
contraste y de orientación de contornos. A continuación nos referiremos
a estos elelnentos.
Color: la información que contiene color facilita nuestras vidas y es útil,
por ejemplo, en el diseño de equipos de deportes o de automóviles. En
sistemas de reconocimiento de imágenes la información que nos brinda
el color es una herramienta poderosa. Se usa RGB (rojo, verde, azul)
para representar a todos los colores.
Textura: Junto con el color, la textura es una poderosa característica
discriminatoria. Está presente en casi cualquier parte en la naturaleza.
La textura puede ser descrita de acuerdo con su espacio, frecuencia o
propiedades perceptuales. La periodicidad, la dirección y el grado de
complejidad son algunos de estos atributos perceptuales. Ciertas ca-
racterísticas espaciales basadas en estos atributos son particularmente
útiles para reconocer imágenes por similitud de textura.
Resulta casi imposible describir la textura por medio de palabras.
Una ef'ectiva descripción de la textura puede estar basada en propiedades
estadísticas y estructurales de patrones del brillo. Algunos investiga-
dores han usado algunas de estas propiedades para buscar, reconocer y
clasificar imágenes. Existen muchas técnicas para extraer descriptores
de textura significante de las imágenes basadas en diferentes moclelos y
asunciones. Más adelante describiremos el reconocimiento de las texturas
metálicas usando los histogramas de brillo, de contraste y de orientación
de microcontornos como características de las texturas.
Rl l ) l S \ l j l t ( O\ \ l f i s
l ó
Coincidencia
de formas' No hay una clefirlición universal de fbrma;
sóio hay explicaciones
generales y aceptatlas sobre el significado de
este coricepto. Forma
",
l".nun"tu en la que se ve de un objeto definido
por sus línrites, es la apariencia externa Ce algo [4]'
Cornparar fbrmas
es uno de los aspectos más cliticiles del reconocirniento
de información
visual ya que la representación
de formas frecuentemente
es rnás com-
pleja lá del color y lu t.^tutu. Esto se debe al hecho de que una forma
com¡nnecesi tanuchosparámetrospafaSerrepresentadaexpi íci tamente.
Determinar la similitud de dos formas es una tarea muy difícil tanto en
sistemas humanos como mecánicos' El procesamiento de imágenes y
la visión computacional
han proveído diferentes formas de representar
imágenes así como también iift"nt"t mediclas para calcular
qué tan
similar es una imagen en relación con otra'
Esposi bl edi sti ngui rtrescategoríasdi ferentesdetécni caspararepre-
sentarlatbrma:caracteríSticadeacercanrientodeVectores,deacercamiento
relacional y de acercamiento de transformación [5]'
El acercamiento de
vectores consiste ell representar la forma colrlo un vector numérico y la
similitud entre dos formas se calcula usanclo alguna medicla de distan-
cia, por ejemplo, la clistancia euclidiana o distancia cle HausdorlT' La
di stanci a eucl i di ana es
,r-(t, r,)
=
( 2. 1)
dondef Yl ,
denotan dos vectores'
En el acercami ento rel aci onal ' una forma es di vi di da entre un con-
junto de componentes
salientes; el descriptor total es resultado cle los
áescri ptores áe cacl a componente sal i ente yde l a rel aci ón entre el l os'
Fi nahnente, el acerci rni ento
de transformaci ón
se uti l i za para
describir una forma basacla en el esfuerzo necesario para transformar
una forma en otra. La clistancia transformacional
se usa para calcular
la similitucl entre tlos formas' Para elegir el acercamiento
adecuado se
deben considerar factores como tolerancia a obstrucción
y deformación'
robustez al ruido, viabilidacl
para intlexar, así como también las nece-
sidades de la aPlicación.
Una de las características
que se emplean con más frecuencia es.la
Fast Fourier Transform
(FFT). Se trata de un aigoritmo que permrte
calcular la transformación
discreta de Fourier
(DFT' por sus siglas en
inglés) y su inversa. Tiene una amplia variedail de aplicaciones' desde
f rJ'
I t t l D[ s NI I I ] RONALUS. Vt St Ó: l CO\ l PU' , l ACl ONAl . 59
procesamiento digital de señales para resolver diferenciales parciales
hasta algoritmos para multiplicar rápidamente números enteros grandes.
La FFT no es una nueva transformación sino un algoritmo que permite
reducir el tiempo de cálculo de la DFT, la cual se usa para analizar
frecuencias de las imágenes.
La superposición de funciones data cle principios del siglo XIX,
cuando Joseph Fourier descubrió que era posible superponer senos y
cosenos para representar otras funci ones.
En años recientes para caracterizar las imágenes se emplean los
Wavelets, que son funciones matemáticas que cortan datos a diferentes
componentes de fiecuencia y permiten estudiar cada componente con
una solución emparejada con su escala. Los Wavelets ofrecen ventajas
sobre los métodos tradicionales de Fourier al analizar situaciones físicas
donde la señal contiene discontinuidades y puntos agudos. Los Wavelets
fueron desarrollados inclependientelnente en las matemáticas, la física
la quántica, la ingeniería electrónica y la geología sísmica. La interre-
lación entre estos calnpos durante los últimos diez años ha conducido
a nuevas apl i caci ones para l os Wavel ets, tal es como l a compresi ón de
i mágenes, l a turbul enci a, l a vi si ón humana, l os radares y l a predi cci ón
de terremotos.
El problema central del reconocimiento cle imágenes consiste en
el reconocimiento cle sus propiedades y éstas pueden ser usadas en
apl i caci ones nl ecáni cas.
Las texturas usualmente proporcionan información sobre deter-
minada sección de la imagen
t3l, t61.
En nuestro caso consideramos
texturas que son constantes a lo largo de una importante extensión de
la imagen, como por ejemplo en las hojas de los árboles, el césped o
la carpeta asfáltica.
Las características de textura que utilizantos son las que se repre-
sentan en histogramas de brillo, de color, de contraste y de las orien-
taciones de contornos. Cada uno de estos parámetros o características
se exarnina para una zona específica. Normalrnente usamos ventanas
de 15 por 15 pi xel es.
Para generar el histograma de brillo, dividimos la escala total de
brillo entre k y obtenemos intervalos. Se calcula el número de pixeles
dentro de cada intervalo creado y este número se considera como el
parámetro que describe a la textura.
Para el histograma de contraste usamcs la misma técnica, recurriendo
ahora, como parámetro, a la diferencia de brillo entre pixeles vecinos.
-
60
REDES NTURT) NAI - ES
Para elaborar el histograma de contornos se calculan los ángulos de
orientación de todas las líneas cortas de contorno. Cada ángulo determi-
nado es considerado como un vector perpendicular al gradiente de brillo.
Este gracliente lo definimos por el plano formado por cuatro pixeles
vecinos. El algoritmo que utilizamos es una extensión del método de
Schwarz
ÍTl.Laorientacióndel
ángulo de contorno sólo es considerada
cuando el valor del gradiente excede el valor límite.
En el histograma de colores se usan los valores de un espectro de
componentes concretos. Entonces, para sistemas comunes de visión con
tres colores, sólo pueden ser construidos los histogramas RGB, que,
junto con el histograrna de brillo, proporcionan información represen-
tativa sobre la ventana seleccionada.
Por lo general muy pocas texturas tienen un número suficiente de
características distintivas y precisas. Comúnmente, es necesario consi-
clerar combinaciones complejas de características para el reconocimiento
de texturas.
Como se mencionó anteriormente, cada componente de cada his-
tograma es considerado como una característica diferente de textura.
Dependiendo del número de intervalos dentro de los cuales cada histo-
grama es dividido, el número total de características de textura puede
variar de una a varias centenas. El espacio para características puede ser
muy grande. Pero es necesario si queremos obtener un buen patrón de
reconocimiento dado que desconocemos cuáles son las caracteríSticas
más importantes para un reconocimiento específico'
Por otrro lado, para el reconocimiento de formas, se ha desarrollado
un método matemático de transformación de espacios paramétricos que
permite obtener un reconocimiento que no dependa de afinar transfor-
maciones de imagen. Desde esta perspectiva, el trabajo de Hough
[8]'
[9]
es útil aunque su aplicación requiere cálculos complejos.
Un procedimiento prometedor para el reconocimiento de imágenes es
la selección informativa de características. La selección de bosquejos y de
segmentos y puntos característicos así como la definición de ángulos de
orientación, pueden proporcionarmos mucha información importante en
relación con la percepción de la forma del objeto.
Frecuentemente el factor de forma es seleccionado como,inu cata"-
terística informativa. Este factor puede ser definido como la relación
entre el perímetro de una figura y la raíz cuadrada del área de la figura'
También pueden ser utilizadas otras características de forma que no
dependen del tamaño o de la orientación de la imagen.
REDES NEURONALLS, VIS¡ON CO]\,IPUTACIONAL
En
[10]
y
I
l] se proponen métodos para reconocer formas analizando
los elementos más característicos de estructuras complejas. Tal es el
caso de las hojas de roble o arce, las cuales se distinguen por el elevado
número de concavidades y convexidades que presentan. El factor de
forma resulta significativo en estos casos. De cualquier manera, para
el reconocimiento de formas complejas es importante determinar los
parámetros de las partes características y usar esos parámetros para
reconocimiento de la forma del objeto.
Como características informativas podemos seleccionar aspectos tales
como la concavidad o la convexidad que presenta el contorno exterior del
objeto. A éstas las llamamos características primarias. Para tales casos se
propuso un algoritmo que trabaja con la imagen binaria de la figura (unos
y ceros, o claro y oscuro). Para extraer la información de convexidad o
concavidad es necesario, adicionalmente a la figura bajo reconocimiento,
construir dos nuevas figuras, una de ellas inscrita y la otra circunscrita.
Para la construcción de las figuras inscritas y circunscritas, se utiliza la
técnica de escaneo de la figura con un círculo de radio conocido.
Consideremos el proceso de inscribir una figura dentro de la figura
original. La imagen es escaneada bajo el círculo pequeño de radio r.
Se calculan los valores I dentro del círculo. Si esta cantidad es menor
que un valor P de umbral -donde P es definido experimentalmente-
entonces el pixel del centro del círculo se define como cero. Después
de algunas repeticiones, el proceso resulta en truncar todas las partes
convexas y así obtenemos una flgura inscrita. Después, se obtienen
las áreas de la figura inicial y de la figura inscrita y se calculan sus
relaciones. La última se usa después como la principal característica
para el reconocimiento de imágenes con la ayuda de redes neuronales.
Para obtener las zonas cóncavas de una figura compleja usamos un
procedimiento similar de escaneo con un círculo, pero ahora cuando
el número de valores I dentro del círculo exceda el mismo valor P. en
el centro del círculo se pondrá un valor de uno. Después de algunas
repeticiones la imagen inicial se transforma en una imagen circunscrita
que difiere por sus partes cóncavas. Calculando sus áreas iniciales y sus
relaciones, podemos obtener la segunda característica necesaria para
el reconocimiento de imágenes. El procedimiento para obtener zonas
cóncavas y convexas es independiente de la posición de la imagen.
El procedimiento descrito puede repetirse para cada zona cóncava y
convexa con el fin de obtener más información acerca de la forma. Las
6t
-
RI Dt l s Nl ] t i RONAI - LS
(.}l
características
así obtenidas se definen como segundas características.
Es
posible continuar el proceso y así obtener características
de orden mayor'
Muchas características
útiles pueden obtenerse de las líneas de con-
torno. Tales característica'
pu'd-tn presentar los segmentos
de líneas
directas con diferentes ángritos de áeclinación'
arcos de círculos de
varios radios y orientacioñes,
intersecciones
de segmentos'
etcétera'
Cada característica
puede estar presente o ausente
para cada punto
definido de la imagen. Para la caücterística
ft-th' el valor yk(l)
:
I si
la característica
se presenta en el punto seleccionado
de la imagen' cl
yk(i)
:0 si está ausente en el punto seleccionado'
Después de la extracción
ilit contorno' diferentes líneas de con-
torno pueOen tener diferentes espesores' Para obtener la característica
.orr.",u,
podemos ejecutar preiiminarrnente
operaciones adicionales
con las líneas de contorno:
1. Arlelgazamiento
de la línea a un pixel'
2. Ensanchami ento
de l a l ínea a un pi xel '
E. Kussul y T. Baiclyk [11]
desarrollaron
y probaron algoritmos
de
operaciones
páralelas .on utttottt binarios
para la aplicación de estos'
Consideremos
una imagen cle tres por tres pixeles' donde el pixel
central tiene coordenadas
(ij)' En la Figura 2'3 se muestran nueve
pixeles. Los valores de-x pueden ser 0 o 1' Si una línea de contorno se
orar"ntu
en un pixel su valor es 1, en caso contrario es cero'
xi i - l
xu
r i j + I
xi I l . ¡ - l l i + / . i f ¡ t - l . j +l
Fi gura 2.3. Ventana de
Pi xel es'
Describamos
ahora los algoritmos de operaciones
paralelas con vec-
tores. Para adelgazar las líneas utilizamos las siguientes ecuaclones:
x,
: (x
o
& @,,
rrJ-rdn,
))
u
Qr
r&
x,,, & -
x
r,
)
Y
gj
&j.
"'
& - x,
*',)
I
u
:
Qi
u*
{r,,
-,u
-'
r
u,))
u
(uu'r,,., &
-
i
r,,)
tl
{x
ua
x,*,i,' & - 4' n'i)
Q'2)
xr: (xo&@r,,1) -xi*ü))v
(xú&x,
,,,&-xr)u
@¡&xr,¡,,
&-x¡nt)
x,
= (x
r&
(x,*,,U -x,.,r))
U
@
¡&
x
i n t¡ t
& -
x
u,)
tJ (r
u&
x,
*,, *,
& - x
¡
*,
)
R EDES N- EURONALES. VI SI ON Col t l PI J f , \ ( l l O\ . \ I
donde el val or r,,: 0, si el pi xel con coordenadas i ,7 no pertenece a
l a l ínea, y x,,:l ' si el pi xel con coorcl enadas i , j pertenece a l a l ínea.
La priméra fórmula del grupo permite adelgazar la línea de \a iz--
t t l l ü11
qui erda. Así, por ej empl o, para
tl l l
l a fórmul a recl uci rá a
L' tül
Dl i 011
La segunda irnagen es más delgada que la primera.
Los operadores mencionados en las fórmulas se ejecutan de manera
secuencial. EI algoritmo se detiene si antes del último escáner de toda la
imagen el número de valores I en la imagen permanece sin carnbios.
Todos los operadores del algoritmo pueden ejecutarse en paralelo
para cada bit de la cadena binaria de la imagen. La imagen completa
es procesada mediante la secuencia de dicha cadena. En computadoras
reales, la longitud de la cadena es limitada por el tamaño de la palabra
de la computadora. Para computadoras con longitud de palabra de 32 bits
el proceso en paralelo proporciona una gran ventaja. El funcionamiento
de este algoritmo es muy veloz en la platafoma de neuroconrputadoras
desarrolladas por la compañía Wacom en Japón con la cooperación de E,.
Kussul y T. Baidyk. La neurocomputadora tiene palabras de 512 bits
[12].
Con el propósito de acelerar el algoritrno de operación, se desa-
rrolló y probó una versión simplificada del proceso de adelgazamiento
de líneas. Se consideraron tres pixeles para la versión y el algoritmo de
adelgazamiento a la izquierda, a la derecha, arriba y abajo. El algoritmo
consiste en una secuencia de aplicaciones de los cuatro algoritmos. Se
toma un adelgazamiento hacia la izquierda, por ejemplo cuando en la
imagen ocurre la siguiente situación de posicionamiento de pixeles (0
I l) y es posible quitar una unidad apropiada de la línea.
x, , : x, , & - ( *, , *, &x, & - x, ¡ , , ) .
( 2. 3)
En la situación en la que los pixeles se encuentran colocados vertica-
ü
mente I es posible ejecutar el adelgazamiento de la manera ante-
rior. Para este caso se utiliza la fórmula
x, j : x, j & -
( - x, . , , &x, , &x, *, , ) . ( 2. 4)
Para el adelgazamiento del lado derecho (l I 0) se procede de manera
similar utilizando las fórrnulas sisuientes:
63
-
64
REDES NEURONALES
x, j : xi & - ( x¡ ¡ t &xu&
- x, j *, ) ;
( 2. 5)
x,,
:
x
u&
-
(- x
¡n tj
& x,,& x,.,,
)'
REDES NEURONAI-ES. VISION COI\{PUTACIONAL
En este libro compararemos los resultados obtenidos con nuestros
clasificadores neuronales con otros clasif,cadores. entre ellos la SVM.
2.2. Apt.tcaclóN oE vrsróN coMpurACroNAL
EN MICROMANUFACTURA
Entre las aplicaciones de los métodos de visión computacional están
algunas tareas relacionadas con la micromecánica
[16], [17], [18].
Este
tema será abordado con más detalle en el siguiente capítulo. Por lo pronto
nos referiremos aquí sólo a algunos aspectos de la micromecánica, espe-
cíficamente al microensamble.
En la micromecánica se relaciona el reconocimiento de forma con
numerosos procedimientos empleados en las microfábricas; tal es el
caso del ensamble de microdispositivos
[18],
la manufactura de micro-
piezas
[19] [20],
el reconocimiento y ubicación de micropiezas
f}lf,
entre otros.
En 1990 se construyó en Japón una microfábrica sobre mesa
IZ3).
EI
propósito del concepto de microfábrica es la construcción de unidades
de producción en miniatura que reducen espacios, consumo de energía
y costos de producción.
En el Instituto de Cibernética de Ucrania y en el CCADET de la
UNAM se propuso la tecnología de microequipo para la producción
de l os mi crodi sposi ti vos a baj o costo
[16], [17].
Este método abre l a
posibilidad de crear generaciones sucesivas de microequipo. Actualmente
ya se han desarrollado y evaluado algunos prototipos de micromáquinas
de pri mera generaci ón
[17].
La desventaja del microequipo propuesto es la falta de control auto-
matizado de sus procesos. Por este motivo, se propone la construqción
de microfábricas compuestas con micromáquinas que posean un control
automatizado de sus procesos.
Uno de los principales problemas en el diseño de microfábricas es la
automatización con base en sistemas de visión computacional. Existen
diferentes métodos para construir sistemas de visión computacional para
diversos propós itos en micromec ánica
123l-1251.
Uno de los componentes micromecánicos producidos por las micro-
máquinas (por ejemplo, con microtorno). Son los microtornillos. Éstos
son componentes necesarios para construir mecanismos en miniatura. El
problema con el maquilado de estas micropiezas es que en algunas de
ellas se puedenpresentar defectos. Tales errores están relacionados con
65
El algoritmo simPlificado Puede,
continuos de línea,
Pero
funciona
buenos resultados'
en principio, adelgazar contornos
mucho más ráPido
Y ProPorciona
líneas se ejecuta mediante las
El algoritmo de ensanchamiento
de
siguientes fórmulas:
x' ,
= x,,[-f x,-,,U^,.,,LJ*,,-,LJ*,,., Q
6)
donde U es la disYunción lógica.
El ciclo de ensanchamiento
de líneas se realiza una o dos veces
dependiendo de los procedimientos futuros de extracción de caracte-
rísiicas. La elección final de ciclos completos se puede hacer después
de pruebas experimentales
de todos los algoritmos de reconocimiento'
Lai operaciones
para ensanchar las líneas también se pueden hacer en
paralelo.
2.1.4. Clasificadores
Para reconocer o clasificar las imágenes se usan diferentes tipos de
clasificadores. En el primer capítulo de esta obra se habló de los clasi-
fi cadoresneuronal esdesarrol l adosenel CentrodeCi enci asApl i cadas
y Desarrollo Tecnológico
(CCADET) de la UNAM'
Exi stenotrosmétodospararesol verel probl emadel acl asi fi caci ón.
Entre ellos está la máquina de vectores soporte (Support Vector Ma-
chine, SVM) desarrollada
por Vladimir Vapnik t13l' t14l'
En ésta los
vectores de entrada son multidimensionales
y mediante el método que se
emplea con ella se construyen hiperplanos para separar las clases' Para
,.pur", las clases se utilizá un entrenamiento con maestro
(supemised
Ieárning). Para hacer un clasificador no lineal, V' Vapnik continuó las
investigaciones de M. Aizerman, E' Braverman y L' Rozonoer
para
funcioies potenciales [15].
En este caso se emplea una función del
núcleo
(kernet
functíon)
no lineal' Ésta permite buscar hiperplanos en
el espacio traniformado de las características. La transformación
puede
, . rnol i neal yel espaci omul t i di mensi onal ; ent oncesel cl asi f i cador
puede ser no lineal para el espacio original de entrada'
-
REDES NI ] URON, \ LES
66
la posición de la herramienta de corte que se emplea en la elaboración
del mi crotorni i l o
(Fi gura 2.4).
Debiclo al reclucido tamaño de las micrornáquinas es imposible utilizar
instrumentos orclinarios
(a gran escala) para el control de los procesos'
Esnecesar i ocr ear unsi st emacl evi si ónquecont r ol eaut omát i cament e
los procesos de manufactura de estas piezas de trabajo por medio de
u,., pro.aro de reconocimiento
de forma' De esta manera se obtendrían
rnióropiezas
producidas con alto grado de calidad'
Fi gura2' 4,Posi ci onesdel aherrami entadecortedemi crotorni l l osenrel aci ón
alapierude trabajo. Cortadores ubicados en: a) 0'1 mm por debajo de la
posición correcta, b) posición @rrecta c) 0'1 mm por encima de la posición
correcta y d) 0.2 mm por encima de la posición correcta'
En el presente trabajo proponemos el desarrollo de dos versiones del
sistema dé visión computuiionut
para asistir el proceso de fabricación de
microtornillos mediante micromáquinas: la primera versión éstá basada
en el clasificador neuronal PCNC (véase el capítulo 1) y la segunda
Seapoyaenunaredneuronal arti fi ci al denomi nadaLi mi tedRecepti ve
Arei Grayscale
(LIRA Grayscale)
(véase el capítulo l)'
c. r, rnd1)¡ -l I
r . r , er ¡ Pf , , , al l
r-
v\^/\
I V"'/V
'
a"'
I t UDES NEUnONAt _ES, \ ' l Sl ON CO\ t pUTAct oN¡ \ I
2.3. Pnost-sl tAs F.N l -os PRocl l sos
ADAPTATIVOS PARA TAREAS DE CORTE
CON MtCRON,,f ÁQUINAS HERRAMIENTA
En el CCADET de l a UNAM se ha desarrol l ado un si stema basado
en la visión computacional para la fabricación de microobjetos. El
propósito de este sistema es reconocer las formas de los rnicroobjetos
y brindar así la información necesaria para la corrección de los errores
detectados en el proceso de fabricación de aquéllos. Con el fin de eva-
luar el sistema desarrollado, se maquilaron tornillos de tres milímetros
utilizanclo un torno CNC con errores relacionados con la posición del
cortador empl eado. El si stenl a de vi si ón computaci onal propuesto
reconoce correctamente 92.5% de l as i mágenes asoci adas a di versas
posiciones clel cortador. Esta información se podría utilizar en el futuro
para corregir en forma automática la posición del cortador en procesos
de fabricación de microobjetos.
Con este propósito se fabricaron cuatro grupos de torniilos colocando
el cortador en diversas posiciones en la tnicromáquina herramienta. Las
imágenes de estos tornillos se utilizaron en el entrenamiento y verificación
del sistema propuesto.
El sistema cle visión cornputacional está basado en la red ncuronal con
l a técni ca de cocl i fi caci ón tl e permutaci ones descri ta en
[19.1, t26)y t27)
(véase también el capítulo I). Este tipo de red mostró buenos resultados
en tareas cle reconocimiento de cifias escritas y de rostros humanos.
Ahora se probó en algoritmos adaptativos para la manufactura.
Para increlnentar la precisión de la manufactura de las micromáqui-
nas herrami enta es posi bl e uti l i zar procesos adaptati vos de corte
[171.
Consideremos un torno equipado con una cámara que puede lllover-
se automáti camente de l a posi ci ón I a l a posi ci ón 2 (Fi gura 2.5). Las
i mágenes de l a cámara en l a posi ci ón 1 se uti l i zan para rnedi r el tamaño
cle los objetos parciahnente manufhcturados y para realizar las correc-
ci ones necesari as en el proceso del corte. Las i mágenes de l a cámara
en l a posi ci ón 2 se empl ean para corregi r l a posi ci ón de l a herrami enta
cl e corte con respecto a l a materi a pri ma (Fi gura2.6).
Como resultado del trabajo que se realiza con este microequipo
podemos obtener uno de los componentes micromecánicos que es el
microtornillo. El problema que se plantea en el proceso cle maquilado
de estas micropiezas es que algunas de ellas pueden presentar defectos
en su forma. Estos errores están relacionados con la posición de la he-
61
-
68
REDES NEURON¡\I-ES
rramienta de corte del microtornillo (Figura 2.4). La posición correcta
del cortador se muestra en la Figura 2.7.
'
' ^*^"a
t v vdl l l ql
( posi ci ón
pri mera)
: . , i
. -
uamar a t v
( posi ci ón
^^^, , - ¡ ^
\
Dt r gul l uq
. l
1
' -
Mat eri a pri ma
Figura 2.5. Torno equipado con cámara de TV.
Cort ador
( posi ci ón
i ncor r ect a)
Mal ena
pr i ma
I
Cor t ador
-
( posi ci ón
correct a)
Figura 2.6. Posición de la herramienta de cone con respecto a la materia prima.
REDES NEUIi oNALLS, vtstóN coNtPU' rACl oNAL 69
Torno -i
Figlura 2.7 . Cortador ubicado en posición correcta.
En la figura 2.5, las dos posiciones de la cámara pueden brindar in-
formación útil sobre el desarrollo del proceso de corte como por ejemplo
Ia formación de virutas, el contacto del cortador con la materia prima,
etcétera. Todas las imágenes obtenidas deben tratarse con el sistema
de reconocimiento de imágenes. Para este caso se propone crear este
sistema con base en una red neuronal con codificación de permutaciones
PCNC (véase el capítulo 1).
2.3.1. Reconocimiento
con clasificador neuronal PCNC
En la Figura 2.8 se representa la estructura del clasificador neuronal PCNC.
La estructura incluye como primera etapa la extracción de caracterís-
ticas de la imagen. Las características extraídas se aplican a la entrada
del codificador. El codificador produce un vector binario de salida de
dimensión grande, que se presenta a la entrada del clasificador neuronal
de una capa. La salida del clasificador corresponde a la clase reconocida.
Figura 2.8. Estructura del clasificador neuronal con codificación de
mutaciones.
Ext ract or
de
car act e -
rí st ¡ras
Codi f i cador Cl asi f i cadot
las per-
-
10
RI--Dl l s NEURoNAI-l l s
La imagen inicial (Figura 2.9) es introducida en el extractor de característi-
cas. Éste comienza con la selección de los puntos específicos en la imagen.
En principio, pueclen ser propuestos varios métodos para la selección
de puntos específicos. En nuestro trabajo se emplearon los puntos del
contorno como
Puntos
esPecífi cos.
En la Figura 2.10, el rectángulo de tamaño /¡ x w se forma alrededor
de cada punto esPecíf,co.
Punt os
especí f i cos
Funt' :s
freiJatlvr:r9
- r I I
h-l rffI -Csril f+rrill
abc
Fi gura 2. 9. I mhgenes i ni ci al es.
Punt ns FL"rSl t l ri ü$
Figura 2.10. Puntos especílicos seleccionados por el extractor de caracterís-
t i cas.
Los punt os especí f i cos f ueron sel ecci onados usando el si gui ent e
procedimiento. Para cada grupo de cuatro pixeles vecinos, se calculan
l as si gui ent es expresi ones:
. ' l ,
:
l ut ,
- bl . ' ' , , l
, 1 -
,
' ¡ v. l )
d,
:
l bt , , ,
- ht , ,
| , 1 ,
| ,
t . . E)
A
:
max( d, , d, ) ,
( 2' 9)
clonde br,, es el brillo del pixel (i
rt).
Si A;8, entonces el pi xel (i j ) corresponde al punto específi co
seleccionaclo en la imagen, donde .B es el valor del umbral para la
selección del punto esPecífico.
I t l l DLS Nt - l URo\ , \ LI i S. VI SI O^' CI OI I PU]
^Cl ONAl -
11
Cada característica se extrae del rectángulo señalado en la Figura
2.10. Los puntos posi ti vos p y l os puntos negati vos r¡ descri ben una
característica. Estos puntos se distribuyen aleatoriamente en el rec-
tángulo. A cada punto P,, le corresponde un umbral 7 seleccionado
aleatoriamente del rango
T 3 Tr r 3T, , , or ' ( 2' l o)
donde s es el número de característica y r es el número del punto.
El punto posi ti vo es "acti vo" si en l a i magen i ni ci al ti ene un bri l l o
ó., tal que,
b>T ( 2. 1 l )
El punto negati vo es "acti vo" si ti ene un bri l l o á,.. tal que,
b, , 37, , . ( 2. 12)
La característi ca estudi ada está presente en el rectángul o si todos sus
puntos posi ti vos y negati vos son acti vos. De otro rnodo, l a característi ca
está ausente en di cho rectángul o.
El codi fi cador (Fi gura 2.8) transforma l as característi cas extraídas
en un vector bi nari o
V
:
{v, }
( i :
1, . . . , A) ( 2. t 3)
donde v,
:
0 o l. Para cada característica extraída
{
el codificador crea
un vector bi nari o auxi l i ar:
U
:
{u, }
( i :
1, . . . , 10
Q. t 4)
donde ¿¿-
:
0 o l.
Se utiliza un procedimiento aleatorio especial se utiliza para obtener
l as posi ci ones de l os "I' s" en el vector U, por cada característi ca
{.
Este procedi mi ento genera una l i sta de posi ci ones de "I' s" para cada
característica y guarda todas estas listas en la memoria. El vector U es
l l amado "l a máscara" de l a característi ca F.
En la etapa siguiente del proceso de codificación es necesario trans-
formar el vector auxiliar U en un nuevo vector U* que corresponde
a la posición de la característica en la imagen. Esta transfomación
se hace mediante las permutaciones de los componentes del vector U
( Fi gur a 2. 11) .
-
't2 REDES NEURO¡-ALES
E(4=D
aao
ooo
Figura 2.1l. Patrón de las permutaciones.
Es necesario obtener los códigos binarios que representen las ca-
racterísticas correlacionadas. Si la distancia entre las posiciones de la
característica es pequeña, los códigos binarios se correlacionan fuerte-
mente, y si la diitancia es grande su correlación es débil' Esta propie-
dad del código se puede obtener mediante el siguiente procedimiento'
El número de permutaciones depende cle la posición de la característica
en la imagen. son rliferentes las permutaciones en la dirección horizontal
X (Fi gura 2.11, a) y verti cal Y (Fi gura 2. 1 I
'
b)'
REDES NEURoN^LES, vt st oN coNr pur ACt oNAL 73
Para codif,car la posición de la característica
{
en la imagen es
necesari o sel ecci onar l a di stanci a de correl aci ón D,.y cal cul ar l os si -
guientes valores (como se muestra en el capítulo 1):
v: j / Dc
E(X)
: (itrt)X,
R( x) : j - E( x)
Y: i / D, ,
E(Y)
: (inr)Y
R( Y) : i - E( Y)
R( X) . N
D=
D
R( Y) . N
D:
¡ y
D"
donde E(X) es la parte entera de X, R(n es la parte fiaccional de X
i es la coordenada vertical de la característica detectada, j es la coor-
denada horizontal de la característica detectada y N es el número de
neuronas.
La máscara de
{
se considera como un codigo de esta característica
situada en la esquina superior izquierda de la imagen. Para cambiar la po-
sición de la característica en la dirección horizontal es necesario hacer per-
mutaciones del vector binario E(X) veces y hacer una permutación adicional
para los componentes P del vector. Posterionnente, es necesario cambiar el
código a la dirección vertical realizando las permutaciones del vector binario
E(Y1 veces y una perrnutación adicional para los componentes
{.
Resultados
Para evaluar el desempeño del PCNC en el reconocimiento de la for-
ma de objetos micromecánicos se fabricaron 40 tornillos de 3 mm de
diámetro con un torno CNC de la compañía Boxford. Se produjeron
diez tornillos con el cortador en posición correcta (Figura 2.9, b) y 30
tornillos colocando el cortador en posiciones erróneas, Diez de ellos
(Figura 2.9, a) tuvieron una distancia entre el cortador y el eje del
D
D
(2. 15)
(2. 16)
(2. r7)
( 2. 18)
(2.re)
(2.20)
(2.2r)
(2.22)
-
14
REDES NEt,]RONALES
tornillo 0.1 mm menos de la posición correcta, otros diez (Figura 2'9,
c) fueron produciclos con una distancia de 0'1 mm por encima de la
posición correcta y los diez restantes con una distancia de 0'2 mm por
encima de la posición correcta (Figura 2.9, d). La base de datos de estos
tornillos se generó con la ayucla de una cámara de videoconferencia
marca Samsung y un microscoPio.
Se emplearon cinco imágenes de cada grupo de tornillos para el
entrenamiento ctel clasificador neuronal, las cuales se eligieron en forma
aleatoria, y el resto se empleó para la evaluación del mismo'
Los experimentos se realizaron con un parámetro B de selección
de puntos específi cos di ferente. En l a Tabl a 2.1,l a pri mera col umna
corresnonde al umbral B.
Tabi a 2. 1
llcsultados cle l¿r cvaluaciór.r
cl el si stcm¿r dc rcconoci .mi ento dc i mhgcncs
(l
ntl ¡rttl .
. . Nti nu' o Núnrcrct
r ) ot 0 I a scl ( ( ct ol l
o( '
( I t ot L' s( cl t ol t ' o t t t ct l i ot l e
t t . l os l ) . l t t t l os
cxpt ' r i nr ' t t l os) ct ' t or es
c.?¿fc¿l ¿cos
')1t
d.e
reconoci ni .ento
cor t ' ecl o
2. 25 88. 75
1.5 92.5
Se realizaron cuatro experimentos diferentes para cada valor de
umbral B con el fin de obtener resultados estadísticamente confiables.
Se garantiza que cada experimento sea estadísticamente independiente
de los otros debido a que el sistema selecciona las muestras en forma
aleatoria y por la estructura del esquema de las permutaciones, ase-
gurando de esta manera resultados más conflables. Por esta razón se
obtuvieron diferentes rangos de errores en experimentos distintos. En la
misma tabla2.1 la segunda columna contiene el número de errores para
;l
4
1
3
2
2
2
e
1
1
1
20
60
RI]DES NEURONALES. VISION CONIPU' IACIONAI-
cada uno de los experimentos, la tercera columna proporciona el valor
medio del número de errores para cada valor de B, y la cuarta columna
contiene el porcentaje medio del reconocimiento correcto.
2.3.2. Reconocimiento con clasificador neuronal LIRA
El clasificador neuronal LIRA se define en el primer capítulo de la
presente obra con todo detalle. En este capítulo vamos presentar una
de las aplicaciones de este sistema.
El objetivo del sistema a desarrollar será el reconocimiento y cla-
sificación de la forma de los microtornillos producidos, brindando de
esta manera la información requerida para la corrección en el proceso
de fabricación de los mismos. De esta manera se podrán obtener micro-
piezas elaboradas con un alto grado de calidad. Iniciamos los trabajos de
investigación con la estudiante de maestría Anabel Martín para mejorar
los resultados obtenidos en los trabajos previos. Estos últimos estuvieron
basados en el uso del clasificador neuronal PCNC y mostraban el mejor
resulrado de reconocimienro de 92,5 %
Il9l, t28l
(Tabla 2.1).
Las metas a largo plazo son la investigación y desarrollo de sistemas
de control automático (ver parágrafo 2.3.I) para todos los niveles de
una tábrica sobre mesa. Tales sistemas podrán utilizar redes neuronales,
algoritmos genéticos, etcétera
[291.
La meta a corto plazo consiste en crear los prototipos de visiótt por
computadora para reconocer la calidad de superficies de micropiezas.
Estos prototipos podrán basarse en redes neuronales.
Las líneas de trabajo son las siguientes:
l. Investigación de las redes neuronales y el clasificador neuronal
para el reconocimiento de imágenes.
2. Investigación y desarrollo de los sistemas de control adaptivo
para la automatización total de los procesos de producción con
micromáquinas.
3. Investigación de los algoritmos de reconocimiento de patrones
basados en redes neuronales.
Presentamos adelante la descripción de la metodología para resolver
este problema.
75
't'l
REDES NEURONALES, VI SI ON COMPUTACI ONAL
REDf i s NEI I RONALES
76
2. 3. 3. Descripciótt y- clasíficación
de microtontillos
En l os experi nei l tos se empl earon 40 mi crotorni l l os de 3 mm de
diámetro manuf-acturados con un torno CNC de la compañía Boxford
clasificados en cuatro grupos diferentes' Cada uno de estos grupos
corresponde a piezas producidas con una posición determinada de la
herramienta de corte emPleada.
Tres de los cuatro grupos están conformados
por microtornillos de-
t'ectuosos, esto es, tres errores de fabricación cliferentes relacionados con
la ubicación del cortaclor. Cada uno de los cuatro grupos consta de un
total de 10 microtornillos. A continuación se hará una breve descripción
cle los grupos de microtornillos:
Grtrpo 0: Microtornillos manufacturaclos con una distancia de 0' 1 mm
poriebajo cle la posición correcta entre el cortador y el eje de la pieza'
'Grupo
i: Microtornillos manufacturados con la posición correcta
del cortador.
Grupo 2: Microtornillos manufacturados con una distancia de 0' 1 mm
por encinu de la posición correcta entre el cortador y el eje de la pieza'
GrupoS:Mi crotorni l l osmanufacturacl osconunadi stanci ade0.2mm
por encirna cle la posición correcta entre el coftador y el eje de la pieza'
Cadaunodeest osgr uposdemi cr ot or ni l l osper mi t i r áobt ener var i as
muestras cle la forma de la micropieza como resultado de cuatro distintas
ubicaciones de la herramienta de corte'
2.3.4. Descripción de las imagenes
di gitales de microtornillos
Las imágenes cle los microtornillos se atlquirieron mediante una compu-
tadora PC acoplada a una cámara digital Sarnsung MPC-M10 Anycam
Couple ,nontuáu sobre un microscopio óptico Iroscope NZ-14T con un
adaptador fabricado en el propio laboratorio del CCADET' Un software
de imagen comercial
(Anycam couple) permitió la transferencia de las
imágenis digitales, capturadas con la cámara a la PC' En la Figura
2.ll se pueJe apreciar el conjunto de los dispositivos utilizados
para
la captura de las imágenes.
Lasi mágenesasí capt ur adasdel osmi cr ot or ni l l osseempl eanenel
entrenamiento
y prueba del sistema'
Figura 2.12. Dispositivos para la captura de las imágenes de microtornillos'
2.3.5. Creacíón del coniunto
de entrenamiento
Y Prueba
Del conjunto de imágenes de microtornillos se crean dos subconjuntos
de imágenes, uno para entrenamiento
y el otro para prueba del sistema.
Los conjuntos de imágenes de entrenamiento y de prueba están cons-
tituidos por un porcentaje del total de imágenes capturadas. Por ejemplo,
sea 440 el número total de imágenes, donde por cada uno de los 40 micro-
tornillos hay 1l imágenes capturadas; si 80% de las imágenes se emplea
para entrenar y 207o paraprobar, entonces las 88 imágenes de prueba se
elisen aleatoriamente de acuerdo con el siguiente procedimiento:
-
78
REDF.S NEti RONAI-l rS
1. Se seleccionan aleatoriamente dos microtornillos de los diez
posibles por cada una de las cuatro clases existentes, dando un total de
ocho índices de microtornillos escogidos.
2. Se toman las 11 imágenes correspondientes a cada uno de los
ocho microtornillos seleccionados, formando así las 88 imágenes del
conjunto de prueba.
:. Unu vez seleccionadas las imágenes de prueba, las 352 imá-
genes de los 32 microtornillos restantes son asignadas al conjunto de
entrenamiento.
Este proceso cle clivisión asegura la independencia entre los dos con-
juntos de imágenes de microtornillos, ya que las micropiezas presentadas
en el proceso cle entrenamiento y en el proceso de prueba son diferentes.
2. 3. 6. D esarrollo e implemenlaciótl
de la red neuronal artificial'
Para realizar esta tarea usamos dos clasificadores neuronales. Primero
el clasificador neuronal PCNC (véase el capítulo 1, páragrafo 2'3'1)'
El segunclo clasificador neuronal que usamos en este trabajo fue LIRA
Grayscal e (véase el capítul o 1)
t301, t311.
El primer clasificador neuronal diseñado para esta tarea de reconoci-
miento PCNC fue el que mostró el mejor resultado de reconocimiento'
de 92,5 %
119),128).
Para probar el desempeño del clasificador neuronal LIRA Grayscale
se creó una base cle datos con 440 imágenes en escala de grises de 40
microtornillos
(11 imágenes por microtornillo en diferentes posiciones)
cle 3 mm de diámetro, con una resolución de 320 x 280 pixeles en
formaro BMP
1301, [31].
Se trabaj ó con cuatro cl ases di sti ntas con i l 0
imágenes de microtornillos por clase. Los microtornillos de la clase
0 fueron rnanufacturados con una posición del cortador 0' I mm por
debajo de la posición correcta, los microtornillos de la clase I fueron
manufacturados con la posición correcta del cortador y los microtornillos
de las clases 2 y 3 fueron manufacturados con una posición del cortador
por arriba de la posición correcta, 0.1 rnm y 0.2 mm respectivamente
( Fi gur a 2. 13) .
REDES NEURO¡ VALI S. \ r l Sl ON COMPU1 ¡ \ Cl ONAt .
(c) (d)
Figura 2.13. Imágenes de microtornillos: (a) Microtornillo de clase 0, (b) Micro-
torni l l o de cl ase 1, (c) Mi crotorni l l o de cl ase 2, (d) Mi crotorni l l o dc cl ase 3.
El número total de imágenes de la base de datos se dividió aleato-
riamente para formar los conjuntos de entrenamiento y prueba para el
clasifi cador neuronal LIRA Grayscale.
Previo a la realización cle los experimentos de evaluación del sistema,
se llevó a cabo una serie de experimentos preliminares para seleccionar
los valores de los parámetros fijos del clasificador que maxirnizaran el
desempeño del mismo. Éstos fueron los siguientes: número de neuronas
asociativas l/
:
512,000, excitación adicional de la neurona ganadora
d
:
0.3, ventana de di mensi ones 20x20, 4 puntos posi ti vos y 3 puntos
negati vos.
Se realizaron tres experimentos para evaluar el sistema
[31].
Cada
experimento fue corrido 30 veces para asegurar una confiabilidad esta-
dística. Así, el número total de imágenes por reconocer se calculó como
79
REDES NET]RONAI-ES
Rl l i )l i s NEtIRON^LhS. VISION (l ol \' fPti I
ACIONAI 8l
80
el número de imágenes de prueba multiplicaclo
por 30 y el número de
errores de reconocimiento como la suma de las imágenes mal clasificadas
de cada corrida.
En el primer experimento se eligieron las imágenes de 6 microtornillos
por clase para el proceso de entrenamiento
y los 4 restantes para el proceso
i" pruebu, de untotal de 10 microtornillos por clase (Tabla 2'2)' El segundo
experimento incluyó las imágenes de 7 microtomillos por clase para el proceso
de entrenamiento y 3 para el proceso de prueba (Tabla 2'3)' En el último
experimento se eligieron las imágenes de 8 microtornillos por clase para el
ptó..to de entrenamiento
y 2 para el proceso de prueba (Tabla 2'4)'
Errores
r ntaPcnes
de recottociniento/
oe entrctnnu¿illo/
Total de imúgenes
tnuR(' tres ae prucDa
a reconocer
Tabl a 2. 4
Porcentajes dc reconocimiento
80% ent renami ent o / 20% prueba
Número
de distorsiones
de imagen
Porcentaje
de reconocimiento
(7o)
0
Á
8
352 / 88
I , 760 / 88
3, 168 / 88
34 I 2, 640
33 I 2, 640
29 I 2,640
98. 71
98. 75
98. 90
Tabla2.2
Porcentajes de reconocimiento
60% entrenamiento / 40%
Prueba
Con base en los resultados obtenidos se puede apreciar que el tamaño
de la muestra de entrenamiento es un parámetro importante ya que a
medida que el número de imágenes de entrenamiento crece se observa
un incremento del porcentaje de reconocimiento. Por ejemplo, en la
Tabla2.2 se muestra que con 264 muestras de entrenamiento se obtuvo
un porcentaje de 98.33 % y en la Tabla 2.4 con 352 muestras se obtuvo
98.71 %, esto es, 0.38% más de exacti tud en el reconoci mi ento.
Otro factor que ayudó a incrementar el rango de reconocimiento es
la aplicación de distorsiones de imagen. Por ejemplo, en la Tabla 2.3 se
muestra que a medida que el número de distorsiones de imagen aumenta
se incrementa el rango de reconocimiento.
Así, pues, en resumen, el sistema basado en el clasificador neuronal
LIRA Grayscale para el reconocimiento de imágenes de microtornillos
fue entrenado y probado con una base de datos constituida por imágenes
de 40 microtornillos, de 3 mm de diámetro, agrupados en cuatro clases
distintas cada una de las cuales está relacionada con una determinada
posición de la herramienta de corte. El porcentaje de reconocimiento
para la fase de entrenamiento fue de 100% y para la fase de prueba cle
98.90% en el mej or de l os casos. Estos resul tados son aceptabl es, si n
embargo, no se debe eliminar la posibilidad de optimizar los métoclos
desarrollados para mejorar el reconocimiento.
Finalmente, hagamos notar que la mayor contribución del clasificador
LIRA Grayscale es su universalidad. No fue diseñado para una tarea
particular de reconocimiento de forma sino para resolver diferentes
problemas de reconocimiento de imágenes.
Número tle distor- Imágenes de
siones enlrenamie,Ío/
tle imagen Imágenes de
Prueba
Errore.s de
Porcenraie
reconoci ni enl o
dereconoci nrcnto
/ Total de imágencs o
Uo)
reconocer
0
A
8
264 I 176
t,320 | 1' 76
2. 376 | 176
88 / s,280
86 / 5,280
84 | 5,280
98. 33
98.37
98. 41
Tabl a 2. 3
Porcentajes de reconocitniento
70% ent renami ent o / 30%
Prueba
Número Inúgenes
de distorsiones de entrenam¡ento/
de imagen Inúgenes de
Prueba
.
Errorls.
Porcenta¡e
dereconoctmtentol
dereconocimienlo
Total de imágenes
&)
0
^
8
308 | 132
r,540 | 132
2,7'12 I 132
5' 7 | 3,960
56 I 3,960
52 | 3,960
98. 56
98. 59
98. 69
82
REDI:S NIIURONAI-F' S
2.4. Apl l c,q.ctóN DE LA vl sl ÓN coMPUTACIoNAL
EN MICROENSAMBLE
Lat ecnol ogí amoder napar ael di señodemi cr odi sposi t i vosseencuen-
tra fundamintada en técnicas de microlitografía.
Las ventajas de esta
tecnología se relaciona con la alta precisión de los equipos' así como
con su elevado grado de ef,ciencia para la fabricación de grandes lotes'
Estas cualidades hacen que dichos dispositivos tengan buena calidad
y bajo costo. Entre sus desventajas está la de que no permite generar
álspáritiuos 3D, es decir, solamente se puede trabajar con dispositivos
llanos, lo cual complica los procesos de ensamble de microdispositivos
generados cOn esta tecnol ogía.
Para evitar los problemas mencionados' se propone utilizar una técnica
relativamente nueva para la fabricación de microdispositivos.
Esta técnica
utiliza todos los procesos convencionales de la mecánica para producir
máquinas herramientas
y dispositivos de ensamble' Por este motivo nos
basaremos en una secuencia de generacioues de equipo' la primera de
las cuales es producida con máquinas convencionales' Las máquinas de
la primera generación producirán a su vez máquinas más pequeñas que
continuarán produciendo máquinas cada vez más pequeñas [16]'
Cabe
aclarar que nuestro objetivo es hacer tantas generaciones como sea nece-
sario paia cada aplicación aprovechando
y explotando cada generación'
Actualmente ya ie han probado algunas máquinas pertenecientes a la
primera generación de máquinas herramientas [32]' [33]'
Lat écni caexpuest aper r ni t i r ádi señar cual qui er t i podedi sposi t i vo
mecánico qu. pré,lu fabricarse actualmente a escala humana' Pero para
obtener procluctos comercialmente
aceptables es necesario producir
mi crofábri castotal menteautomati zadas.Paral astareasdeautomati za-
ción se propone utilizar sistemas de reconocimiento de imágenes' En
el CCADEThemosel abor acl odi f er ent esal gor i t mospar ael r econoci -
miento tle imágenes y adaptamos tlichos algoritmos
para el desarrollo
cl e equi po l ui cromecáni co.
La principal aplicación de reconocimiento
de imágenes aplicado
a microfábricas se encuentra relacionacla con procesos de ensamble'
Las tolerancias manejadas son muy cerradas,
y para realizar la unión
de clispositivos o piezas se requiere una gran exactitud' Los manipu-
ladorei y grippers existentes no poseen per se la precisión necesaria'
por tal motivo se sugiere el uso de sistemas de visión que capturen la
información de posición de manera real y automática' Con este fin se
REDES NEURoNAl es. vl stóN corvl ptl ' fAcl oNAl - 83
suelen utilizar dos cámaras colocadas en diferentes ángulos para generar
sistemas de visión estéreo. Otras técnicas consisten en realizar tomas
con una cámara desde diferentes puntos de vista o bien cambiar las
fuentes de luz utilizadas.
Otra aplicación se relaciona con diferentes procesos de inspección
como la calidad de superficies, el estado de las herramientas, contami-
nación por material cortado, etcétera; que pueden ser inspeccionados
mediante el análisis de textura.
En el área de la micromecánica existe un serio problema para
controlar los procesos de microensamble. Como en el micromundo no
es posible controlar todos los procesos con un operador es necesario
automatizar todos o la mayoría de los procesos. Este problema puede
ser resuel to con l a ayuda de l os si stemas de vi si ón computaci onal . En
el presente trabajo se muestra la aplicación de un sistema de visión
computacional para el control de un sistema de ensamble automático
en el área de la micromecánica
[3a].
Se tomará como caso de estudio el
ensamble de un microfiltro mecánico que fonna parte de las aplicaciones
de micromecánica. El microfiltro está confbrmado por mil microanillos
de aproximadamente 1.2 mm de diámetro exterior y 0.6 rnm de diá-
metro interior los cuales se colocan en varias columnas dentro de un
cilindro. El sistema de ensamble cuenta con un manipulador que clebe
introducir los microanillos por un orificio para que ocupen su lugar
dentro del microfiltro.
El sistema de visión computacional propuesto se basa en un algoritmo
de reconocimiento de imágenes con redes neuronales. Aplicando nuestra
experiencia enesta áreal35l,
[36],
se ha creado una base de datos con
441 imágenes de la microflecha colocada en distintas posiciones con
respecto al orificio.
2.4.1. Reducción de una imagen 3D
a una imagen plana (2D)
A continuación presentamos un método para la reducción de imágenes
3D a imágenes planas (2D). Otros ejemplos de reducción de imágenes
3D se exponen en
[37]
y
t38l .En
l a Fi gura 2.14 se i l ustra el proceso
de ensamble. Se trata de colocar una flecha mecánica sobre un orificio
(Fi gura 2.14).
-
84
Fi gura 2.14. Local i zaci ón de fl echa y ori fi ci o.
Esquemáticamente,
podemos ver el proceso al observar las sombras
producidas por focos cle iluminación colocados en diferentes posiciones
ifigu.u
2. tl;. oespués, vamos a extraer los contornos en cada imagen
(Figura 2.16) y juntar las cuatro imágenes con sus contornos
(Figura
2.r1).
La información que proporciona la irnagen de las sombras y el orifi-
cio puede ser interpretada y tratada como un símbolo (letra o número)'
Analizando los símbolos, el clasificador puede determinar la posición de
la flecha sobre el orificio. Si la posición en que nos encontramos no es
la deseada será necesario determinar cuál es la dirección o direcciones
en las que debemos mover la flecha para que coincida con el orificio o
cualquür otro punto planteado. Es obvio que diferentes posiciones de
ta fletna propoicionan diferentes imágenes que deben ser procesadas y
reconociáas usando algoritmos de reconocimiento de símbolos ópticos.
Estos algoritmos producirán como salida un símbolo reconocido que
puede sár relacionado con el movimiento necesario para corregir la
posición actual y llegar así a la posición deseada'
REDES NEURONAI , ES
REDES NEURONALES. VISION COMPUTACIONAL
c
Figura 2.16. Contornos de sombras.
ü-*
!'-**
85
l r---l Frectral I l r-{FE¡¡
v' t {
I _ | |
^. l Sonbr ¿2|
ú--= #=-
¿h
l-1.-lFr..";l I l,_@
I Y
t l l l
l*_J
r-_l
,
=_
$--
Figura 2.15. Sombras ptoou.iou, por dit' erentes a.n,l, o. tur.
l-l
J--i::;:""1
-o{"tqtfj
>---l"F;i
L:TJ1 I
|c."..*;J
lsqnbm
3
I
-
86 RLDIi S NEURO¡-^LLS
REDES NLURON¡ \ LES. VI SI ON COl vf PU' l ACl ON/ \ L 8'7
{rt Lt r | j
Cuatro
l ámparas
*f \
\
Cámai a
Samsung
Fi gura 2.17. Cuatro sombras j untas.
2.4.2. Desarrollo de los
¡trototipos
de visiótt por computodora
Hernos diseñado dos prototipos de sistema de visión computacional para
reconocimiento de imágenes para microensamble.
Uno de los prototipos consiste en cuatro lámparas, flecha con mo-
vimientos a 1o largo de ejes X y Y, orificio y cámara Samsung (Figura
2.18). Las i mágenes de l a cámara entran a l a computadora de mi cro-
máqui nas herrami entas.
El otro prototipo de sistema de visión computaciollal para recono-
ci mi ento de i mágenes i ncl uye una cámara marca SONY (Fi gura 2.19:
vista general, Figura 2.20 :lr.tás cerca).
I"igura 2
\
Cont t ¡ r ni t
cl c l l ccha
Conl o r no
de ori fl ci o
Fi gur a 2. 19. Pr ot ot i po 2 con cámar r Sony t vi st a gener al ) .
'
lsffiIiltl+
YYr"]
-
88
REDES NEURON¡ \ LES
Figura 2.20. Prototipo 2 con cámara Sony (más cerca).
Para el reconocimiento de imágenes se ha elaborado un software con C + + .
2.4.3. Sofiware para el sistemz
de visión compulacional
Ilemos desarrollado el sistema de visión computacional para dispositi-
vos micromecánicos usando el paquete de programación C * * Builder
4. Este ambiente Builder es muy cómodo para trabajar con lenguajes
c+ + y windows.
En la Figura 2.21 se muestra una forma "Form 1" diseñada para
diferentes etapas de investigación en reconocimiento de imágenes. La
primera base de clatos tuvo 23 imágenes. En la parte superior de esta
forma existe un menú con los siguientes elementos: "Parameters",
"Masks", "Codi ng", "Trai ni ng" y "Recogni ti on". El procedi mi ento de
presentación de imágenes en códigos de redes neuronales se conecta con
los puntos de menú "Masks" y "Coding". El entrenamiento de redes
neuronales está ubicado en "Training" y el reconocimiento de imágenes
enjuego de la prueba se ubica en "Recognition"' Está prevista la posi-
bilidad de interrupción de los procesos de codificación y entrenamiento.
Para este propósito sirve la tecia "STOP". Para continuar el proceso
hay submenús (véanse las Figuras 2.22y 2.23).
I{tDIts NEtj l toNALDS, vl stóN coñl purAcl oNAL
Fi gur a 2. 21. For ma l .
ffiffiffilW$Wlsfli$li$ttll'$l':"¡¡$1"1"\lirrlitl'r iiiri: I i,i
89
El proceso para codificar de imágenes está representado en la Fi_
gura2.24.
Wffi,-,N.Hlli}l'ti'lllll;liliilij[rt i
.r;irLr,],i;r,:rii:,,: : i l
ti !k
Edr 5cdc"h !k A:oi¿.: 8ú !:wwd gd*sé
l*
ts4 i
D !S - B #S
d1"[
S
rüdddIadddi wul ,¡/nJ¿| tdw,l Hrul l Ddnas*sl gd¿[dohl gg*rl ¡cr*i
i ¡ : 1. ¡ : u - n_, , , ' t f f
+Af ; r , El sJF
oSEB*i - Ei t , f f
Cdo rr$q
&sl
ctrtu
I
bl¿ ¡dt Sedrh l6y botpd gw (trmd
EdÁ5e Ists deb
n *
¡
b, m :f ¿¡ i "¡ rtOl i
sl "d"d
l ;m;tb;j :t' s*ul roo*rt¡ao¿""$stD¡rácdñbt6RNri Di dMl ú
, df i l : ' u' l t : ,
, ,
t ,
. f f
4* ar ur
d r ¡ . J r o
t r H*r - i Ér i
$
Fi gur a 2. 22. Ej empl o de submenú par a coci i f i car
Eecb
I
Ldb*
I
RI I DES NI ] UI t ONALLS, VI SI ON COÑI PUTACI ON, \ L
2. 4. 4. Resultados obtenidos
En la Figura 2.25 se presentan algunos ejemplos de imágenes obtenidas
con los prototipos de sistema de visión computacional.
.-,ñ
Fi gura2.25.l mágenes obteni das con un si stema de cuatro fuentes de i l umi naci ón.
La posición de las sombras y el orificio contiene toda la informa-
ción sobre sus desplazamientos. Cuando éstos ocurren sobre el plano
horizontal (d:c, dy) se obtienen directamente de la imagen; pero si
la flecha se desplaza verticalmente (dz), entonces se obtienen de la
distancia entre las sombras. Para calcular dichos desplazamientos es
necesario tener todas las sombras en una imagen. Si se encienden las
cuatro fuentes de luz, el contraste de las sombras será insuficiente para
extraer sus contornos. Por esta razón se capturan cuatro imágenes cada
una de las cuales corresponde a cada fuente de luz. Después se combinan
las cuatro imágenes y, por consiguiente, es necesario extraer los contornos
y sobreponerl as (Fi gura 2.26).
En la Figura 2.27 se muestran otros ejemplos de mutua posición de
flecha, orificio y sombras. En la primera imagen (a) se muestra cómo
se mueve la flecha de la posición inicial a la izquierda; en la segunda (b)
9l
90
ffiSNilffiii\.il$Si'ffi [iitll,llr',li t"ii" ] l',l iiir:,r l
R8DF.S ñ' EURONALES
- l úl x
-
l ¡r¡J
Fi gura 2.23. Submcnú de entrenaml ento
ffilffiNlilx:I.ll1_sl\.\$lilltliiltllli\ril]]
r.rf ,,
"r,'ii
rrürli ii.,,
Ee
g#
:eetn !€B Sarett ¡ú i@(M [dtu¿ ldt tj¿le
n 6
. g
AW
g)
üd hd S
sr dsd
I f f i M- | vül r I : " r *¡ l r ae. al ! dd¡ ' a*i 0d¿c( ü*l 0Émor I Dr +i osi úJl
sá¡ =
-
- l l -
l . Er -
q, AFf r cl ; r ' i i r a
Cf l É*-
É
l t r
&pi
(1t!*
|
t¡e
qd :É4ili t6i E¡Én Bun Él@netr t¡t$se l¡ok *& '
o J,
q
N5r dr i s
g , , ór dddl addo, r l wñr r l a*F. l hu, t r , l ¡ d, kce$| Ddcc , a¡ oeudl od*"I , : r i '
. nÁ; j ] =
i ' l r - , , . ' u
gr {, AFt i di l r r ; r i #g*-
: $
Fi gur a 2. 24. Un pr occso pl r a codi f i cl r l as i nt ágenes
-
92
REDES NEURON, . \ I - ! S
hacia abajo; en la tercera (c) hacia arriba, y, finaimente, en la cuarta,
(d) a la derecha. Se utiliza un clasificador neuronal para reconocer la
posi ci ón de l a fl echa
[35].
En Figura 2.26 se muestra una imagen con cuatro fuentes de luz
preprocesada con un algoritmo para determinar contornos que trabajan
con imágenes binarias. En una primera aproximación, trabajamos con
23 imágenes que corresponden a los desplazamientos de la flecha a lo
l argo de l os ej es Xy Y con un paso de 0.5 mm, de l as cual es 12 eran
para entrenarniento y el resto para pruebas. Para esta primera base de
datos se crearon dos clasificadores de las posiciones cle la flecha. El
primero tiene tres reconocimientos de los desplazamientos en X: X-..
(
X,,o¡"i Xpin: Xnorl Xr,,) Xnr".Y el segunclo tiene tres reconocimiJfitos
de l os despl azami entos
"n!t
yr,,
1
ynr,l yp,,: y¡,l "| y,,,u) yoo,.SC
usaron 12 imágenes seleccionadas aleatoriamente de la primera base
de datos para entrenar a los clasificadores y las 1 I imágenes restantes
para comprobarlas.
Como resultado de este primer experimento, observamos la necesidad
de incrementar la base de datos para entrenamiento, por lo que se hizo
otra base de imásenes.
Figura2.26.Imagen de cuatro fuentes de iluminación para una posición (imagen binaria)
REDEs NEURoN^LES, v¡ st óN coMpu. t - ACI oNAL
Figura 2.27 . Imágenes con clifcrentes posiciones de la flccha en relaci(rn al orificio.
2.4.5. Los experimentos con nueva base de dans
de 441 imágenes
La segunda base contiene 441 imágenes que corresponden a los des-
plazamientos de la flecha en X,
y,
con un paso de 0. I mm. La altura
de la flecha en ambos casos se mantiene constante.
En la actualidad se está usando la segunda base cle datos para un
reconocimiento más detallado de los desplazamientos de la flecha.
Las salidas del clasificador contienen más clases que los clasiricaclo-
res anteriores: 2l clases para las coordenadas X y 2r clases para las
coordenadas l', es decir, la capa R tiene 21 neuronas para Xyla capa
R tiene 21 neuronas paray (véase el capítulo r). caáa neuróna dela
capa R tiene 64, 000 conexiones con capa anterior (es decir, la capa A
tiene 64,000 neuronas).
Se sabe
[39]
que la proporción de reconocimiento de símbolos
escritos a mano puede aumentar esencialmente si durante el ciclo de
entrenamiento las imágenes se representan no sólo en su estado inicial
94
Ri i DDS NI : l l RoNAI - uS
sino también con desplazamientos de la imagen (a las que se llamó
distorsiones). En experimentos finales se usan además de las imágenes
iniciales 16 variantes de cada imagen (sus distorsiones).
Las distorsiones se usan para aumentar el tamaño de un conjunto de
datos. En este caso se usaron 16 variantes de distorsión: l2 movimientos
y 4 rotaciones.
De 441 imágenes se formaron dos conjuntos, uno para el entrena-
miento y otro para la prueba, con procedimientos aleatorios. En la Tabla
2.5 se presentan los resultados de la investigación empleando un número
di f' erente de di storsi ones: 1,5, 9, 13. El número de reconoci mi entos
correctos se presenta en la primera columna de las coordenadas X y f.
En la segunda columna se presentan las proporciones (%) del reconoci-
miento, las cuales no son altas pero es necesario analizar estos errores
más detalladamente. El error en el reconocimiento de la posición es
proporcional a la diferencia entre los números de la clase correcta y
las de la clase reconocida. Si se tiene en cuenta el reconocimiento con
una precisión de 0.1 mm la calidad resulta bastante alta (parte derecha
de l a Tabl a 2. 5) .
Tabl a 2. 5
Resul tados de l a i nvesti gaci ón con el cl asi fi cador
REDES NEURoNALEs, vtsl óN col \' {PUTAcIoNAL
95
En la Tabla 2.6 se presentan los resultados de la investigación para
una red neuronal con 256, 000 neuronas. En la Tabla2.7 se presentan
los resultados de la investigación para una red neuronal con 512, 000
neuronas.
Tabl a 2.6
Resultados de la investigación del clasificador neuronal
con 256, 000 neuronas (formación de conjuntos
para entrenamiento y validación con el principio
de "tabl ero de ai edrez")
Distorsio-
nes
X*0. 1mm
Vo
Y+0. 1nm
Vo
5 205.4
9 202"2
13 198. 6
92.94 74.8 33.85
9t . 49 50. 6 22. 9
89. 86 36. 6 16. 56
100 212.2 96.02
99. 1 185. 2 83. 8
100 t49.2 67.51
221
2r9
221
Tabla2.7
Resultados de la investigación de clasificador neuronal
con 512, 000 neuronas (formación de conjuntos
para entrenamiento y validación con el principio
de "tablero de ajedrez")
Distor
SrcIICS
X+0. I nun Y+0. 1 mn
X+0. 1 mm
%
Y+0. 1 mm
%
Distor-
siones
7o
220
22r
219.8
5
9
13
44
40
42
57
i
l 3
l t z 50. 7
t 45 65. 9
t 49 67. 7
138 62. 8
19.9 213 96.2 l' 71
18. 4 2t 9 99. 2 195
19. 5 220 99. 5 199
26.4 219 99.3 l9Z
77. 5
88. 2
89. 9
86. 9
33.94
22.44
16.02
203.8 92.22
'75
206.4 93.39 49.6
t99 90.05 35.4
99. 55 216. 6 98. 01
100 l 9l 86. 43
99.46 l4' 1 .6 66.79
Para definir la posición correcta de la flecha es necesario hacer
experimentos adicionales con una precisión más alta.
Otra serie de experimentos se hacen con otro procedimiento mediante
la división de las 441 imágenes en dos conjuntos (para el entrenamiento
y para la prueba). En este caso dividimos las imágenes con el principio
del tablero de ajedrez.
La base de datos inicial se presenta como un tablero de ajedrez de
2l x2l. Cada célula "negra" se considera como ejemplo para entrenar
a la red neuronal y cada célula "blanca" se considera como un ejemplo
para verificar la red neuronal. Usamos dos versiones de la red neuronal:
una con 256, 000 neuronas y otra con 512, 000 neuronas en l a.A-capa.
Para definir la posición correcta de la flecha es necesario hacer
experimentos adicionales.
La nueva propuesta para el desarrollo de dispositivos micromecánicos
[16]
requiere de un alto grado de automatización de los procesos de
manufactura. Como base para este proceso de automatización podemos
usar algoritmos para el reconocimiento desarrollados anteriormente.
Los algoritmos propuestos son técnicas especiales para la extracción
de características, clasificadores neuronales y algoritmos genéticos
para la optimización de la estructura neuronal. Todos los algoritmos
fueron probados en diferentes tareas de reconocimiento con buenos
resultados. Actualmente intentamos aplicarlos a la automatización de
procesos micromecánicos.
9'7 96 REDES NEURONALES
Los experimentos demuestran que el sistema de visión computacional
puede reconocer la posición relativa de flecha-orificio con una tolerancia
0.1 milímetros. El clasificador neuronal para esta tolerancia da un reco-
nocimiento correcto en 100% de los casos para X y 86,7 % para Y.
2. 4. 6. Interpoiación neuronal
de coordenadas de posiciones
Para obtener resul tados no di scretos pero más suaves y adecuados,
O. Makeyev ha desarrollado un método de interpolación de las coor-
denadas de posiciones
[40], [41].
El interpolador neuronal difiere del clasificador neuronal en que
el sistema considera a las excitaciones de las neuronas de salida como
valores de las funciones continuas
J\dx)
y g(dy). Para determinar las
funcionesfldr) y
e@il
utilizamos la ecuación parabólica de la regresión,
la cual se construye con base en los cinco valores numéricos selecciona-
dos de excitaciones de las neuronas de salida según la regla siguiente:
como un punto central se selecciona el punto con máximo valor de la
excitación
{""
(Figura 2.28, a). Además de este punto se seleccionan
dos puntos del lado izquierdo y dos puntos del derecho de E
"*.
Si el
punto E**está situado en el borde de la secuencia de los puntos, los
puntos adicionales se obtienen como reflexión del espejo (Figura 2.28,
b) de los puntos, que se sitúan en el otro lado de E_--.
I ¡ ¡ ¡ ¿i o , J
Figura2.28. Curvas de la regresión.
Después de la definición de las funcionesfldx) y q (dy) se determinan
los parámetros dxoy dyo, debajo de cuales las funciones
fdx) V
g
@y)
tienen valores máximos. Los parámetros dxoy dlose consideran como
desplazamientos reconocidos de la flecha en relación al orificio.
REDES NEURONAI - ES. VI SI ÓN CON, I PUTACI ONAL
El algoriftno de entrenamiento del interpolador neuronal tiene también
diferencias respecto del algoritrno de entrenamiento del clasificador neuronal.
En este caso la regla de entrenamiento es la siguiente:
En cada paso se rnodifican los pesos de acuerdo con la ecuación:
Wi j (t + l )
=
W,,(t) + a¡* (Aw, + 6rur), (2.23)
donde Wu(r) es el peso de conexión entre la i-neurona de la ,4-capa
y la j-neurona de la R-capa antes del entrenamiento, W,,(t * l) es el
peso después del entrenamiento, a, es la señal de salida'(0 o l) de la
i-neurona de la A-capa.
Aw=
' ( dx,
- dx. ) ' + r
I
' ( dx, - dxu) ' +e
(2.24)
órv
donde dx. el desplazamiento correcto de flecha-orificiol' dro es desplaza-
miento reconocido de flecha-orificio; Aw y 6nr. son factores positivos y
negativos del entrenamiento para la j-neúrona:"drres el desplazamiento
de flecha-orificio que corresponde a la j-neurona (Figura 2.29). Parala
coordenada I se utilizan fórmulas similares.
Curva de
regesión
Posi ci ón correcta de l l echa v ori fi rro
Fi gr.rra 2.29. La posi ci ón correcta y l a posi ci ón reconoci cl a.
2.4.7. Resultados de reconocimiento
con interpolador neuronal
Podemos interpolar los resultados de estas tablas para obtener los re-
sultados intermedios. Para la investigación del interpolador neuronal
usamos dos conjuntos de imágenes que fueron divididos de acuerdo con
el principio de "tablero de ajedrez" (ver arriba). Los resultados están
representados en dos tablas: la Tabla 2.8 es para la coordenada Xy la
Tabla2.9 es para la coordenada L
Tabl a 2.8
Los resultados para la coordenada X
REDEs NEURoNALES, vl sl ÓN cor' l PUTAcl oNAL
limitado por la resolución de un pixel. Este resultado se podría explicar
por el hecho de que cada objeto en la imagen contiene muchos pixeles
y estos pixeles dan información más detallada que un pixel.
2.5. RscoNocl Ml ENTo DE MICRoPIEZAS
EN MONTÓN PARA UN MICROMANIPULADOR
Otra tarea muy importante en el microensamble es el reconocimiento
de micropiezas en montón para un micromanipulador. El propósito de
este sistema de reconocimiento es desarrollar un software orientado a
objetos para el sistema automático de manejo de micropiezas durante
el microensamble. La tarea general del sistema es reconocer redes
neuronales mediante las distintas piezas de trabajo y sus posiciones. El
software está orientado a objetos y fue desarrollado por el estudiante de
doctorado Gengis Khang Toledo Ramírez
l2ll, [42]-144].
En la Figura 2.30 se presentan ejemplos de las imágenes de siete
clases de piezas colectadas para la base de datos.
99
98
Para el recono- X+0.025
ci mi ento mm
X+0.05 X+0.075
mm mm
x+0. 1
mm
xt 0. 15
mm
xx%xx%
0000
XXVoX
74 33.6 2s
X%X
11. 4 4
88. 6 216
X7o
1. 8
98.2
Error
Reconoci -
nri ento
correcto
t46 66.4 195 220 100 220 100
Los resultados para la coordenada f se muestran en la Tabla 2.9.
Tabla2.9
Los resultados para la coordenada f
Para el recono- YX 0.025 YI 0.05
cimiento mm m,n
Yt 0.075
mm
Yx 0.1
ntm
Yt 0. 15
mm
Error
Reconoci-
miento
correcto
Y Y%o
l 0l 45. 9
I 19 54. 1
YY%
00 1l
209
Y
48
172
Y7o
20.9
79. 1
Y%Y
5 0. 3
Y7o
0. r 4
9s 219.7 99.86 220 r00
El interpolador neuronal da Iffi% para el eje X (Tabla 2.8) y para
el eje Y99,86% (Tabla 2.9). El interpolador neuronal permite también
obtener los datos para tolerancias más pequeñas. Por ejemplg, para el
eje X con tolerancia 0.05 milímetros da 88,6% y para el eje I con la
tolerancia 0.05 milímetros da 79,1%.
Es interesante mencionar que la tolerancia 0.05 para el eje Yes menos
de un pixel en la imagen. El valor 79.1% del reconocimiento en este
caso demuestra que hay la posibilidad de que el reconocimiento no esté
{e}
ts)
$
ffiJr,
(d)

(e)
(b) (c)
Wt
t s; ¡
Fi gura. 2.30. Imágenes de base de datos de si ete di ferentes cl ases'
2.5. 1. Los exPerimentos
La base de datos utilizada en la primera etapa de estos experimentos
estuvo formada por 4 tipos de piezas de trabajo y se utilizó una cámara
-
l 0l
100 RIDES NET]RONALI]S
CCD de baja resolución y un programa de computadora especialmente
diseñado para este fin. La base de datos contiene imágenes en escala de
grises de dimensiones f,jas (150 x 150 pixeles). Las piezas de trabajo
han sido centradas y tienen una orientación fija de 0o con respecto a su
eje de simetría más grande. Se aplicó un algoritmo de ventana circular
a las imágenes para permitir su rotación. Las piezas de trabajo no están
solas en las imágenes de la base de datos ya que éstas contienen otras
piezas junto o cerca de la pieza central. Esta base de datos contiene
30 imágenes para cada una de las 5 diferentes clases utilizadas, 15
destinadas al conjunto de entrenamiento (el cual puede ser aumentado
agregando perturbaciones) y 15 destinadas al conjunto de prueba. Las 5
clases consisten en 4 tipos distintos de piezas (tornillo I, tornillo fI, base
de tubo y cono) y una clase adicional que corresponde a la ausencia de
cualquier pieza en el centro de la irnagen (Figura 2.31). Las imágenes
de la base de datos son de baja resolución, diversa iluminación y algunas
de ellas presentan sombras.
u) bl c) d) e)
Fi gura 2.31. Un ej empl o de cada una de l as i mágenes correspondi entes a l as cl ases
uti l i zadas en l a base tl e datos: a) torni l l o I, b) torni l l o II, c) base de tubo, d) cono, e)
no pi eza central .
El clasificador neuronal LIRA (véase el Capítulo 1) ha sido aplicado
a las imágenes de la base de datos para encontrar los parámetros que
permiten un mejor rendimiento de reconocimiento. Se realizaron para
este propósito varios experimentos. Se efectuaron experimentos de otro
tipo para el reconocimiento de posición de las piezas. En la Figura 2.32
se presenta el rnódulo de software para marcar 'y' extraer las muestras
de imágenes (las muestras se presentan en el lado derecho de la figura).
E¡cdr dc gh¡et
*N' ' M, .
',Wq-
'$1
1,* 5T*
$i#';
"
\$l
Wi -
m- t
it{jnw-,
$eJ
M\
,t.W'*
.
B. .,1
F\
* fr[YS
\M ,¡
N- \
, $üffiirs
\.-W
r t
Wt r ,
\h'J
rffi-t
t t
$Élwst
' "i
I
t dhü, * s$)s *t*
[[*
t', f¡rs¡rtN
li*
,,*o
lÍ_
;;: :il
\u ¡! ¡. :¡i g,¡ri ¡j 4r
. {{ r . i t +¡ {r . l $4 '
c. ¡ , ! , ¡
I r i l r l ¡ . r i r r , ¡
¡ ¡ ¡
< i ¡ t ! qr . ¡ r : t L. . i r ; ¡ .
. { . 1' ¡ r . ¡ r ¡ r i . i i t
l . t r , , l
r \
l*' * ,
[ )
6h-l
L)
REDEs NEURoNALES, vl sróN coMpuTAcroNAL
il*,H$iww{Í,h-W.1$*}{tl\rl$itÁ+i lifililriii!ii''iri,:,rii,,i:,r:'inÍ,';r:.
,¡u ilqF¡ {ffi I#} 4st
I
f r{s¡ *ffie
' tl***lerdrp.
. ¡s4ts¡4
f M*FF
W
Figura 2.32. Módulo de software para marcar y extraer las muestras.
Hemos probado varias combinaciones de parámetro para el clasificador
neuronal. En la primera serie de experimentos (serie A) no utilizamos
distorsiones en el conjunto de entrenamiento. En la Tabla 2.10 se
muestran algunos de los experimentos más significativos. Los mejores
resultados se obtuvieron en el experimento VIII, con una ventana LIRA
(w'h) de 15 x 15 pixeles, 175, 000 neuronas en la capa,4 y cada grupo
se compone de la capa 1de 4 neuronas tipo ON y 3 neuronas tipo OFF,
eta (r/) se hizo igual a | .0 y TE igual a 0. 15 . Para estos parámetros el
porcentaj e de neuronas acti vas en l a capa,4 fue de 0.164%.
-
102 REDES NEURON¡\LES
Ventana LIRA l2xl2 l5xl5 15x15 l0xl0 13x13 l7xl7 I7xl7
Et a 0. 80 1. 00 1. 00 1. 00 1. 00 1. 00 1. 00
Tabl a 2. 10
Algunos experimentos de la serie A
Número
oe exDenmento
Neuronas
en capa
A
Neuronas
ON por grupo
Neuronas OFF
por grupo
7o de
neuronas
activas
%de
aciertos
r75 t75
mi l mi l
175 175 r7s r75 t75
mi l mi l mi l mi l mi l
9x9
1. 00
t75
mi l
J
0. 06 0. 09 0. 164 0. 123 0. 129 0. 084 0. 146 0. 14
%VoVo%%%%%
68. 0 89. 0 94. 0 93. 00 85. 0 88. 0 89. 00 85. 0
7o%Vo%%%%Vo
En estos experimentos el porcentaje de reconocimientos correctos
fue de 94%. Hemos verificado que el porcentaje de aciertos para un
conjunto dado de parámetros converge para un cierto número de ciclos
de entrenamiento. Para los experimentos de la Serie A el mejor desem-
peño se alcanzó con 40 ciclos de entrenamiento.
Los parámetros utilizados en el segundo grupo de experimentos
(serie B) fueron tomados del mejor experimento del grupo anterior.
Al probar distintos conjuntos de parámetros siempre se alcanzó menor
desempeño. Estos experimentos se realizaron agregando distorsiones
al conjunto de imágenes de entrenamiento; el propósito fue mejorar la
capacidad del clasificador para el reconocimiento de piezas con distintas
orientaciones. Los resultados de esta serie de experimentos se muestran
en la Tabla 2.11 . EI mayor resultado se obtuvo en el experimento I, en
el que se agregaron 3 pares de di storsi ones (+50, l 0o, 15o). Él ti empo
<le entrenamiento para 75 imágenes en los experimentos de la serie A
fue inferior a 1.5 minutos, el tiempo de entrenamiento utilizando el
conjunto de entrenamiento aumentado por 16 distorsiones fue cercano
a los 16 minutos; el tiempo de reconocimiento de cualquier imagen de
RI ] DLs NEURoNALES, \ ' t Si ÓN Co] \ I PUTACI oNAI
la base de datos fue menor a 0.4 segundos. Todos los experimentos
fueron hechos con una computadora InteI'M
p4
a2.66 GHz.
Tabl a 2. 11
Algunos experimentos de la serie B
Nlinero de
E.\pcrinetrto.
I II II d III N IV a
Número de pares de
di storci ones
103
Interval o
s
(grados)
Ángul os +/ - 5, 10,
de di st or ci ones 15
Ci ci os de
entrenanti ento
Aci er t os ( %)
92%
+/ _ ? Á
+/ - 3, 6, 9,
o , i ' i i
12. 15, 18.
11 1A
ó0 60
88% 89%
l 0
+/ - 10, 20,
30, 40, 50
l 0
68%
80
90%
80
90%
Más adelante se presentan algunos ejemplos de interfase de usuario
de este si stema (Fi gura 2.33, Fi gura2.34).
En la versión actual del software que hemos elaborado, la base de imá-
genes de las piezas de trabajo incluye información de carácter general
como el nombre, l a descri pci ón, el materi al e i nformaci ón geométri ca
como la longitud (definida como la dimensión más grancle de la pieza
de trabaj o), l a anchura (segunda l a más grande), l a al tura (tercera),
el peso y el volumen. La información sobre cada pieza del trabajo se
puede corregi r para modi fi car l os datos (Fi gura 2.35).
La información almacenada en la base de datos de la imagen de la
pieza del trabajo se puede utilizar en varios procesos del sistema con
el fin de manejar los objetos con mayor confiabilidad.
por
ejemplo,
esta información relativa al material y las dimensiones de ta piezá de
trabajo permite juntar
las piezas y manejarlas con mejores parámetros
del manipulador que va a mover la pieza en el área de trabaio.
-
104 REDES NEURON¡\I-ES
RT]DES NELIRONALES, VISIÓN CO]\IPUTACIONAI
¡!4r,¡c
fflllf mm
*a+rr
fillJJ
,r*
ái*fiJiiil ,rs
t' 6r1, i l i ' "'
""
.,
t i r ai #r f l l " '
r05
Jf f i
ü{to i
9qq* |
,i*.ry
J
'.lwtfi¡r:rnrf
Ficura 2.33. Interfase de usuarro
ñNty
I rñ!¡ I
Fi gura 2.35. Ventana de di ál ogo para corregi r l os datos de cacl a pi eza de trabai o.
2.5.2. Reconocimiento
de las posiciones
de las nticropiezas
En la Figura 2.36 se presenta la pieza de trabalo y sus coordenadas
l] ii]
como el ángulo de la orientación de ta piLza O" truUu¡o. A,
lmportante
encontrar en la imagen las coordenadas y ra orientaclón de
una pieza de trabajo en tiempo aceptable.
f *}JrflffiJ.#H"l
Mhrrá t
.
t¿rMb !
¡*, Lú..¡
! *w, - . - . l í i _* F_'
¿i*s lfurd¡Iá*ú t
I
I
j
I
I
l
I
I
I
I
¡ 1
l
1
t,
s
N¡iC,r trsJ," t
s, l f t Ht ¡ áf f i ! l i ,
F*
.ffffitrr$ffii
tffi¿#J
srlrlil
f .
Pieca de
h'abajo
{)
{'ü},ú}}
,: P{s*rn¡
s.¡
r_- _s,
'"1*l*
I
l ' "{
i
.4.
"i*IgJ
ii
Figura 2'36' Ejempro de pieza de trabajo representada en un sistema de coordenadas
cartesianas (r, y).
una vez que el clasificador
neuronal LIRA ha sido entrenado con
distorsiones está preparado para reconocer piezas de trabaio en una
Figura 2.34. Interfase de usuario con búsqueda de la pcsición de pieza de trabajo.
-
106
REDI j S NE(] R' JNALI ] S
l{ 146' l: 1ll,l
X; 216Y: 9,1
? pie¿¿s r¿con¡cdas
Saito de
Paso de
I
lmdgen Paró
Fuscór
I
ft,:no
v
I
r -
Sysra Pie¿¿J
lE,¡$snrTiidail
Figura 2.37. Reconocimiento de posición de piezas de trabajo'
como el centro de las piezas no se encuentra con exactitud a veces
las piezas no se reconocen de manera correcta
(Figura 2'38)' Para
mejlrar estos algoritmos se requiere más trabajo y se deben hacer más
experimentos.
imagen cle dimensiones
(w.14 pixeles. Luego aplicamos un algoritmo de
posición para encontrar la pieza requerida en la imagen' Primeramente
la inugen es convertida a escala de grises. El algoritmo contiene un pro-
ceclimiento que mueve una ventana de climensiones
(w'ft) a través de toda
la imagen. Este movimiento se realiza en contra de las manecillas del
reloj en forma cle caracol o espiral con lo cual se busca hallar una pieza
específica t441.
En cada posición de la ventana una muestra de imagen
es extraícla y asignacla al clasificador neuronal para su reconocimiento.
La muestra cle imagen rota hasta que alguna pieza es reconocida o se
realiza una vuelta conpleta. Cuando se encuentra lapieza específlca el
sistema dibuja sobre la imagen un rectángulo que representa la ventana
y coloca en el centro una marca que indica el centro de la pieza' En la
Figutu 2.3i se muestran clos conos que han sido reconocidos. El sistema
muestra las coordenadas del centro de los conos.
Vent¿n¿ {puelas}:
fn*
Folacrón {$ados}
fÉ*
t f r
rl
t,,'
REDES NEURONALES. VISION CONIPUI' ACIONAL r07
tilffi{"""
l . X: 176 Y: 164 ang: 330, 2. X: 236Y: 164 ang: 150
3. X: 196 Y: 164 ang: 150
Figura 2.38. Reconocimiento incorrecto (caso 3) de posición de piezas de trabajo.
Aquí es necesario decir que el algoritmo de búsquecla puede organi-
zarse de diferentes rnaneras. Por ejernplo, podernos escanear Ia imagen
con una ventana pequeña inicianclo de punto superior izquierdo para
observar si hay una pieza de trabajo o no. El Dr. Toledo Ramírez ha
propuesto otro algoritmo
[43]
que opera con una ventana (ru x /r) que
se mueve a través de toda la imagen. Este movilniento comienza en
el centro de la imagen inicial (,ro
)r),
se clesplaza en forma de caracol
hacia la derecha y sirve para encontrar una pieza de trabajo específica
(En la Figura 2.39, el cuadrado pequeño es el centro de la ventana).
Los pasos verticales y horizontales de este movimiento son Ar y
Ay, respectivamente. En cada posición el centro de la ventana es rotado
por un paso angul ar A0. En cada posi ci ón angul ar el si stenl a busca l a
pieza de trabajo. La ventana continúa rotando hasta que se reconoce
una cierta pieza de trabajo o se completa una revolución. El centro
de la ventana se desplaza hasta que se reconoce una cierta pieza de
trabajo o se alcanza el límite de la imagen. Si una pieza de trabajo se
reconoce, el sistema almacena las coordenadas Ar, Ay, A0 y concluye
la tarea de reconocimiento. El usuario puede indicar los parámetros de
desplazamientos de la ventana (Ar, Ay, ¿0) de acuerdo a las metas de
la investigación. En la Figura 2.38 se muestra un ejemplo de la imagen
reconocida. En la irnagen se reconocen tres terminales de alambre (1,
2,3). La casilla blanca pequeña en esta figura representa la posición en
que la pieza de trabajo solicitada fue encontrada y el cuadrado grande
-
i 08
RSDBS NEURoNALÉs
representa la ventana de búsqueda unida a esta posición. En el fondo
de las imágenes se leen las coordenadas y la orientación de la posición
encontradas por el sistema para cada pieza de trabajo reconocida. El
clasificador LIRA es un método flexible que no siempre reconoce un
centro exacto de la pieza de trabajo aunque sí reconoce un punto que
está suficientemente cerca de lapieza de trabajo.
Pw
Figura 2.39. Esquema de movimiento espiral de la ventana
[44].
En ocasiones el sistema puede reco;rocer varias veces una pieza de
trabajo. En la Figura 2.40 se muestra el reconocimiento múltiple de
una pieza de trabajo (casos I y 3). En algunos casos esto sucede porque
el sistema puede encontrar una pieza de trabajo lejana de su punto de
centro (por ej empl o, l as marcas 2 y 3 en l a Fi gura 2.40). Esto se debe
a que el paso del movilniento de la ventana (Ar, Ay, A0) es demasiado
grande (por ej empl o l a marca I en l a Fi gura 2.40).La marca 4 en l a
Figura 2.40 tiene suficiente exactitud para el trabajo del manipulador.
El clasificador neuronal LIRA con escala de grises ha sido probado
en el reconocimiento de 5 clases. El rnejor porcentaje de reconocimiento
obtenido sin utilizar distorsiones fue de 94%, y utilizanclo distorsiones
alcar:zó 92%. El clasificador neuronal previamente entrenado utili-
zando distorsiones en el conjunto del entrenamiento se utiliz'ó junto
con un algoritmo de búsqueda para encontrar una pieza determinada
dentro de una imagen. Los resultados de esta serie de experimentos
son aceptables pero es necesario mejorar la precisión de la detección
de posición de las piezas de trabajo. El clasificador neuronal LIRA con
REDEs NEURoNALE: ; , vl sl ót c- ol \ t put Acl oNAl 109
escala de grises tuvo buen desempeño en el reconocimiento de piezas
sobre imágenes de baja calidad. Este sistema tiene también buenas
perspectivas para encontrar la posición de una pieza dada dentro de una
imagen. El tiempo de entrenamiento y reconocimiento utilizado por la
computadora es aceptable.
l . X: 196 Y: 124 ang: 90,2. X: 136 Y: l 8a ang: 300
3. X:176 Y: 84 ang:50, 4. X: 256 Y: 84 ang: 270.
Fi gura 2.40. Reconoci mi ento de l a posi ci ón de l as pi ezas de trabaj o con redundanci a.
CoNcr-usloxes
Este trabajo tiene como objetivo principal utilizar ios sistemas de visión
computacional en la producción de microdispositivos
[16].
Como primera tarea se propone el microensamble. Para este propó-
sito proponemos reducir las tareas de 3D a imágenes de 2D (planas) y
aplicar los algoritmos de reconocimiento de símbolos y clasificadores
neuronales. De igual manera se describen algunos métodos de reconoci-
miento de imágenes planas diseñadas anteriormente y que pretendernos
usar para realizar tareas de micromecánica.
La nueva propuesta para la producción de dispositivos microme-
cánicos planteada en 1996
[6]
por los autores del presente volumen
requiere de un alto grado de automatización de los procesos de manu-
factura. Como base para este proceso de automatización podemos usar
algoritmos en el reconocimiento diseñados anteriormente por nosotros.
Los algoritmos propuestos son técnicas especiales para la extracción
de características clasificadores neuronales para el reconocimiento de
diferentes clases de imágenes. Todos los algoritmos fueron probados
en distintas tareas de reconocimiento obteniéndose buenos resultados.
T
T
h:
l
, AX'
r ' 1
' >L+L
+qI
v, , ) |
t
.+-E
É
+
<-c <- ó
( ¡ , ' FÉ
t '
t . - .
tl (x,
t -
o.{-tr
o<- É
r ó8
f--t'

vl
n
t
I
o{-
Ly
_l-
rl
l l t
110 REDES NLURON¡ \ I , ES
Referencias
1 . Duda, R., y P. Hart, Pattem Cktssification and Scene Srwt¡\srs, Wiley-lnterscience
Publ, Nueva York, 1973, 482 pp.
2. Duda, R., y P. Hart, D. Stork, Pattent Cktssifcation,2daed.., Wiley Interscience,
2000, 680 pp.
3. Man, D.,Visiott, Freeman, SanFrancisco, 1982.
4.1-ew,MichaelS.(ed.), PrinciplesofWswllnfonnaionRetrievol(AdvoncesinPattent
Recogttition), Springer Verlag, 2001, 356 pp.
5. Del Binrbo, Alberto, Viswl Infomntion Retrieval, Elsevier Science, Ltd Morgan
Kaufnrann, 1999, 210 pp.
6. Julesz, 8., Erpeiments h the Visual Perception of Texture, Sci. Am., 19'75, 232,
pp.3443.
7. Patent 4433912, USA G05819/405,,4 Way and Devícefor Seleaion of Ouflürcs ott
the Innge, Schwa¡2, Publ.28.02. 84.
8. Davies, E.R.,Applicaionof tlrc GetteralisedHoughTransfotmto ComerDeÍeuiott,
IEE Proc., E135, N l , 1988, pp.49-54.
9. l¡avers, V.F., y Boyce I.F., An Intplementaion of the Hough Transfonn Usilry a
ünear Arrcry Processor fu Cottjunctiontt'ith a PDP/l I // Nctt. Phys. ktb. Div. htf.
Tech¡tol.tutd Cont¡tttl. Rept., nrr:n.74,1986, pp. 1-11.
10. Baidyk, T.N., Applicotiort of Neural Nefrtorks
for
ilte Fonn Recognition of the
Object // Irt "Modelírovcue i Süruilirovone ott ChovesltJirta Patl¡el
", MNEMO'89,
III conf. with intemational paticipation, Vanu, 1989, pp. 68-69.
1 1. Kussul, E.M., y Baidyk T.N., "Design of a Neural-Like Network Architecture for
Recognition of Object Shapes in Images" , Soviet Jourutl of Awonxttion orul hrfor-
nntion Sciences (formerly Sovrel Aulomatic Cotttrot),Y .23, N 5, 1990, pp. 53-59.
12. Baidyk, T.N., N¿¡rral Network and Artifcial Intelligence Problems, Naukova
Dumka, Kiev, 2001, 264 pp.
13. Vapnik, Y., The Nature of Smistical lranting Tlrcory, Spnnger-Verlag, 195,
188 pp.
14. Vapnik, V., y S. Kolu, Estintrúiott of Dependences Based ott Empiical Dota,
Springer, 2006, 510 pp.
15. Aizerman, M., E. Braverman y L. Rozonoer, "Theoretical Foundations of the
Potential Function Mettrod in Pattem Recognition l-earning", AuÍcnntiut anrl
Rennte Cofi¡ol25,19&, pp. 821-837.
16. Kussul, E., D. Rachkovskij, T. Baidyk y S. Talayev, "Micromechanical Engi-
neering: A Basis for the [¡w Cost Manufacturing of Mechanical Microdevices
Using Microequipment", Jounnl of Micromecfuuiu and Microengineíring, vol.
6, núm. 4, diciembre, 1D6, pp. 410425.
17. Kussul, E., T. Baidyk, L. Ruiz, A. Caballero, G. Velasco y L. Kasatkirn, "De-
velopment of Micromachine Tool Protorylrs lbr Microfactories", Joumal of
Mic rome clani c s and M í croen gi nee ring, v ol. 12, 2W2, pp. 1 95-812.
Ii IDES Nr]uti oN^ t.ES, vrstóN cot\.l pl l rACroNA L
18. Baidyk, T., E. Kussul, O. Makeyev, A. Caballero, L. Ruiz, G. Canera y G. Ve_
lasco' "Flat Image Recognition in the Process of Microdevice Assembly"
,
panent
RecognüionktÍers, vol.25, no. l, enero,20O4, pp. 107-11g.
19. Baidyk, T., y E. Kussul, "Neural Nehvork Based Vision System for Micro Wor_
kpieces Manufacnrring", WSEASTrarcactions on Systems, vol. 3, núm. 2, abril,
2004, pp. 483488.
20. Baidyk, T., E. Kussul, y O. Makeyev, "Texh-rre recognition with random subspace
neural classifier"
, WSEAS Tnauactiotu on Ciranits arul Systens, vol. 4, núm. 4,
abril, 2005, pp. 319-32a.
21. Toledo, G.K., E. Kussul y T. Baidyk,, Neural Cktssifier IIMforRecogtütion of
Micro work Pieces rutd their Positiotu in tlrc
processes
of Microossembly rud Mi-
cromrawfacturing, TheTo All-ukainianlntemational conference, Kiev, ucrania,
octubre2004, pp. 11-15, 17-20.
22. Ooyan'n, N., S. Kokaji, M. Tanaka, K. Ashida, N. Mishima, H. Maekawa, T.
Tanikawa y K. Kaneko, "Desktop Machining Microfacto
ry" ,The 2-ru1htenntio,ttl
Worl<slnp on Microfactories, Suiza, octubre, 2000, pp. 13-16.
23. Wu,
Q.M.J., M.F.R. tre, y C.W. De Silva,
..Intelligent3-D
Sensing inAutomated
Manuf'acturing hocesses", IEEE/ASME httemrúíotnl conference on Advcatcecl
htte lli gent Mechntronics, Italia, 200 1, pp. 36ó-370.
24.[-re,S.i., K. Kim, D.H. Kim,J.O.
parkyG.T. park,
,,RecognizingandTracking
of 3-D Shaped Micro Parts using Multiple Visions for Micromanipuration"
,IEEE
Intenntiorul Symposium on Micromechotronics rurl Hwtan kience,2001, pp.
203-2t0.
25' Kirn, J.Y., y H.S. cho, "A vision Based Eror-conective Algorirhm fbr Flexible
Pars Assembly"
, Proceedings of the IEEE Intenruioml symposiwn on Assentbty
atdTosk PLamLng, Porrugal, l9g, pp. 205-210.
26. E'M., Kussul, y T. Baidyk, "Permutative coding Technique fbr Handwritren Digir
Recognition", Proceedütgs of tlrc 2ffi3 IEEE httemruional Assembly conference
on Neural Nefivo¡k (lJCt{N'2N3), portland,
2003, pp. 2t63-2I68.
27. Kussul, E.M., y T. Baidyk, "Neural Network System tbr Face Recognition",
2N1 IEEE Intenutfio¡nL Symposium on Circuits &td Systetns, Vancouver, V_
768-V:771,2W.
28. Baidyk' T., E. Kussul y A. Manín, "problem¿rs en los procesos adaptativos para
tareas de corte en micromáquirns he'amienta", congreso soMI nx,
pachuca,
Hidalgo, ocnrbre 25-29, 2UlA, p. 6.
29. t¿ra-Rosano, F., E. Kussul, T. Baidyk, L. Ruiz, A. Caballero y G. Velasco,
"Artificial Intelligence systems in Micromechanics", en Anifcíal Intelligence
Applicafiorts and hnovaliotx, ed. By Max Bramer, Boston/Dordrechvl¡ndres,
Kluwer Academic Publishers, pp. l-10.
30. Mafiín, A., y T. Baidyk, "Neural Classifier for Micro Screw Shape Recognition
in Micromechanics", CIEI 2006, IFI? WCC Al2ffó, Santiago de Chile, agosto
21-242C06,p.10.
I12
RI]D[]S NEURONAI-ES
31'MaftÍn,A.'yT.Bay<lyk,..Clasificaclorneuronalparaelreconocimientodeformas
de microtomillos en micromecánca", soMI )fi1, Ensenada, Baja Califomia'
ocubre22-25,2006, P.
5.
32. Kusql, E., L. Ruiz, ¡. Ca¡olero, L. IGsatkina y T' Baydyk' "cxc Machirp Tools for
t¡w cost Mbro Deüces rrlanutrcnuing", Ft¡st ltenuniorcl Cafaatce ot Meúrtrcnia
rndRfutia, M&R2m,SartPetenburgo,
mayo 2gjunio 2' 200' vol' 1' pp' 9&103'
33. Kussul, E., L. Ruiz, A. Caballero, L. Kasatkirn, yT. Baydyk,
"The Perspectives
of Micro Mechanical Filters Application for Fine Filtration of Liquids and Gases",
FirstlntemntionalConferenceonMechafronicsalldRobotics,M&R2N0,Sn
Petersburgo, mayo 29-junio z,zCfJfJ.'vol' 1, pp' 103-108'
34. Baidyk, f., "Application of Flat Image Recognition Technique for Automation
of Micro Device Assembly", IEEE/ASME hllemolional conference on Advancerl
Itttelligent Mechtttronics, 2C[1, pp' 4884%'
35. KusJ, E., T. Baidyk, L. Kasatkim y V' Lukovich, "Rosenblatt Perceptrons for
Handwritten Digit Recognition" ,
Proceedings of htemational Joitt¡ cottJerence ott
Neural Neworl<s, IJCNN'1| , Washington, 2001 ,
pp' 1516-1521
'
36. Baidyk, T., y E. Kussul, "Application of Neural Classifier for Flat Image Recogru-
tion in the
process
of Microoiipositivos Assembly" , Proceedings ofthe 2m2 IEEE
World Congress on Compufcúiowl Intelligence, IJCNN'2N2' 2CfJ.2'pp' 160-1Ó+'
3?.Sin-Yeung'Cho,ChowT.W.S.,"ShapeandSurfaceMeasurementTechnology
by an Imfroved shape_from_shading
Neural Algorithm", IEEE Transacions on
Industrial Elearon¡cs, vol. 47, febrero 2000, pp' 225230'
38. Neubauer' C.,
..Fast
Detection and Classification of Defecs on Treated Metal
Surfaces using Backpropagation Neural Network" ,
191 IEEE Intema¡ional Joittt
Conference oi Neural Netwo/rc,1991, vol' 2, pp' 1148-1153'
3g. I-eCun, Y., L. Bottou, Y. Bengio y P. Hafmer, "Gradient-based kaming Applied
to DocumentRecognition" ,
Pioceetlings of the IEEE,voL 86' núm' 1l' noviembre'
1998,
PP.
2218-2344'
a0.Makeyev,o.,..NeurallrrterpolatorfbrlmageRecognitionintheProcessofMt-
cro<leviceAssembly",ert'Proceedingsof\EEEIJCNN'2n3'Porrland'Oregon'
julio 2G24, vol' 3, 2003, pp.2222-2226'
41. Éaidyk,T., E. KussulyO. Makeyev, "lmageRecognitionSystemforMicrodevice
Assembly'',Twenty-FirstIASTEDInemationalMuki-ConferenceonAppliedlttfor-
matics AI2003,LASTED, Irursbruck, Aust¡ia, febrero 10-13' 2003' pp' 243-248'
42.ToledoRamírez,G.K.,E.Kt¡ssrrlyT.Baidyk,..NeuralClassifierforMicroWorkPie.
cesRecognition" ,Image
mdWionConqtwittg,vol'24'
núm' 8' 2006' pp' 8n-$6'
43. Toledo c.r., E. KusJul y T. Baidyk,
,.objecr
orienred Software for Micro work
Piece Recognition in Microassemúly" , Joumal of Applied Researcñ mdTechtw-
logy,vol.4, núm. 1' abril 2006, pp' 59-74'
¿¿. tole¿o RamÍrez, G. K.,
,.tnvestigación
y desanollo de sistemas de conftol mediante
visióncomputacionalparamicromáquirnsherramientasymicromanipuladoles'''
tesis para óbtener el grado de Doctor en lngeniería Mecánica (Mecánica-Diseño
tr¡ecánico), Facultad de Ingeniería, UNAM, México' 2007'
3. 1. I Nr noouccl óN
como ya hemos señalaclo el objetivo de nuestra investigación es el
diseño de una microfábrica sobre mesa para producir microdispositivos
<le bajo costo de manera automática. La microfábrica está conformada
por micromáquinas herrantientas y micromanipuladores
cuyos tamaños
son relativos a las dimensiones de los microdispositivos. para
lograr
nuestro objetivo se tendrán que producir varias generaciones
de mi-
croequipos cada uno de los cuales tendrá menores dimensiones que el
anreri or [t], [z], [g].
Este proceso está basado en los siguientes principios:
I
'
El diseño del microequipo debe permitir escalar éste a dimensio-
nes menores; la producción de toclos sus componentes debe efectuarse
co.n los microequipos de las generaciones
anteriores y el ensamble del
microequipo debe realizarse con los micromanipulad'ores
de las gene-
raciones anteriores.
2. El diseño del rnicroequipo debe ser tan sencillo como sea posibre
para reducir su costo.
3. El microequipo no debe ernplear componentes industriales que
no se puedan producir con el mismo microequipo.
Los prototipos que se han producido hasta este momento tienen
co.mo base estos principios. Actualmente se cuenta con prototipos de
micromáquinas herramientas y se están desarrolrando prototiios de
micromanipuladores,
entre ellos un micromanipulador ae ua¡a inercia.
En este capítulo se describen algunas partes del microequipo que
proponemos y se explica cómo influyen los principios citados anterior_
mente en estas partes.
3.2. Dos lvrÉrooos or
pnopuccróN
DE MrcRoDlspostrrvos
Hoy en día existe una fuerte tendencia a la miniaturización de los dispositi-
vos mecánicos. Existen dos métodos principales paraproducir
dispoiitivos
3 MICROMECÁNICA
fl
REDES NEURON¡\l -l i S Ml cnoi uecÁNtcA 1 15
En 1996, en Ucrania, se patentó la idea de hacer los prototipos de
mi croequi po a parti r de di sti ntas generaci ones [r], [z], [g]. t-os pri nci -
pios básicos para el diseño del microequipo enfocado a la manufactura de
microdispositivos se basan en la idea de generaciones de microequipo,
cacla una de las cuales tiene dimensiones menores que la anterior y las
generaciones previas se utilizan para producir las siguientes. Todas
las piezas del microequipo deben ser producidas empleando equipo de
generaciones anteriores y sin usar piezas industriales puesto que éstas
no pueden ser reducidas al tamaño requerido.
En últimos años se han producido varios prototipos de la primera
generaci ón (Fi gura 3.1) [Z]-[i O]. Este prototi po de mi cromáqui na
herramienta tiene un tamaño 130 x 160 x 85 mm3 y es controlado por
una computadora personal. Los ejes Xy Ztienen desplazamiento de
20 milímetros y el eje X de 35 milímetros. Todos poseen la misma
configuración. La resolución es 1.87 pm para el paso del motor (los
movimientos de carril en cada eje los ejecutan motores de pasos).
Al comparar estos prototipos con los dispositivos de la microfábrica
japonesa se observa que los componentes de estos prototipos cuestan en-
tre 30 y 50 veces menos que los de ésta. La precisión inicial de nuestros
prototipos es más baja que la de los japoneses pero puede aumentarse
mediante el uso de algoritmos adaptativos.
En trabajos anteriores [rr], [rZ] se muestra que recurriendo a
algoritmos adaptativos, principalmente a algoritmos de reconocimiento
de imágenes, mediciones con lazo cerrado, métodos de inteligencia
artificial, etcétera, es posible obtener buenos resultados' De hecho,
usando los algoritmos adaptativos se han obtenido resultados similares a
los conseguidos por los proyectos japoneses. Mediante estos últimos se
torneó una flecha de latón con un diámetro de 50
¡rm
y una longitud de
600
¡rm [6]. Nosotros hemos producido una flecha de diámetro 50
¡rm
y una longitud de 550
¡rm
(Figura 3.2) con nuestro equipo, que es muy
barato aunque no tan preciso [Z] . Otros ejemplos de piezas producidas
con ayuda de nuestro equipo se presentan en la Figura 3.3'
i 14
mecánicosenminiatura'ElprimermétodoeselMicroElectroMechanical
Systems
(MEMS) [¿], [s]. El segundo es el que proponemos y que se
denomina MicroEquipmentTechnology
(MET)' En el siguiente apartado
analizamos ambos métotlos y comparamos sus ventajas y desventajas'
3.2.]. MEMS/NEMS
Los componentes mecánicos con tamaño menor a I mm se fabrican a
partir cle una tecnología de microelectrónica
que recibe el nombre ge-
nérico de Micro ElectroMechanicalsystems
(MEMS)
t4l, t5l.
Entre los
dispositivos
que emplea la tecnología MEMS se encuentran cartuchos
paia impresoras, acelerómetros, microrobots, micromotores
y sensores
ie ine.óiu, de presión, de gasto, microbombas, etcétera' Se estima que
el mercadomundi al ¿et r, l pt vt sest ] emásdel 0mi l mi l l onesdedól ares'
Una desventaja de esta tecnología es que los detalles producidos por
ella son de dos o dos y media dimensiones' Esto provoca la necesidad
de rediseñar los dispositivos mecánicos lo que aumenta su precio y
di fi cul ta su promoci ón en el mercado' Otra desventaj a es que requi ere
el uso de materiales compatibles con tecnología de silicón' Una tercera
<lesventajaesqueestatecnologíasólopermiteproducirnricrodispositivos
de estruitura iencilla pues casi no están desarrollados los procesos de
microensamble.
3.2.2. Tecnotogía de microequipo
(MET)
basada en generaciones de micromáquinas
he rrami enta y mi c ro manip ulado r e s
Existe otra opción para producir piezas mecánicas
que se basa en el uso
de tecnologías traclicionales de tratamiento mecánico de materiales' En
este caso,
lara
producir productos competitivos es necesario construir
micromáqúinas
herramienta automáticas
y micromanipuladores
cuyas
<limensiones sean proporcionales a los productos producidos' Esta idea
esresul tadocl eunproyectodemi crofábri cael aboradoenJapónquedata
¿e fqqf [O].
pictro
proy..to demostró la viabilidad de la producción
de microequipos. Entre sus resultados estuvo la creación de un prototi-
po de micioflbrica sobre mesa' En esta fábrica se usaron dispositivos
para microensamble.
La desventaja de dicho trabajo fue que requirió
el empleo de componentes demasiado costosos' Otra desventaja fue la
n ."ridud de recurrir al microensamble
manual. Esto dificulta obtener
productos comPetitivos.
r 16 REDES NEURONALES
Fi gura 3.1. Vari os prototi pos de mi croequi po de l a pri mera generaci ón
Fi gura 3.2. Fl echa de di ámetro 50 pm produci da con nuestro mi croequi po y uti l i zando
al gori tmos adaptati vos.
Figura 3.3. Ejemplos de microtornillos producidos con nuestro equipo.
A continuación abordamos dos problemas: la producción de mi-
cro balines y microalambre. Ambas tareas pueden llevarse a buen
fin recurriendo al micromaquinado con microequipo de generaciones
anteriores. Son dos ejemplos de cómo no es posible emplear piezas
comerciales en la fabricación de microequipo, por lo que es necesario
buscar tecnologías que permitan sustituir a las tecnologías industriales
en el micromundo. Hay más ejemplos de este tipo que muestran que
cada día hay más recursos para desarrollar la tecnología que permita
producir microequipo.
Podemos evaluar los tamaños de cada microequipo y de las partes
básicas de generaciones siguientes. En este momento no es posible
MrcnouEcÁNl c¡ 117
definir con seguridad qué factor de escalamiento vamos a emplear para
reducir los tamaños de los equipos de cada generación.
proponemos
usar como primera aproximación un factor de escala F.E.: % que nos
permite evaluar los problemas que se pueden presentar en la produc-
ción de las diferentes generaciones. En la Tabla 3.1 se muestran las
dimensiones de éstas.
Tabl a 3.1
Tamaño de la micromáquina y de sus partes
por generación (en mm)
Toda Motores
la de
máquina paso
Guías Alanbre
Boteros
,',?:::',:,
de cerros masn¿t¡co
(otametro)
klidnetro)
(diómetro)
2
3
4
o
7
8
9
l 0
Los datos presentados en la Tabla 3.1, relativos a la primera gene-
ración de micromáquinas herramienta, son reales y fueron obtenidos del
prototipo de micromáquina herramienta desarrollada en el Centro de
Ciencias Aplicadas y Desarrollo Tecnológico de la UNAM y se calcu-
laron empleando el factor de escala F.E.:
t/2.
Enla Tabla 3.1 podemos
observar que la micromáquina herramienta de décima generación debe
tener un tamaño máximo de 300
¡rm.
Si comparamos esta micromáquina
herramienta con una máquina herramienta convencional que no tiene una
exactitud alta, veremos que ésta puede tener medidas de I m x 1 m x 1
m y puede manufacturar piezas con medidas de 200 mm x 200 mm x
200 mm con una tolerancia de 0. I mm. Si el escalamiento es lineal, la
micromáquina de décima generación va a tener la capacidad de producir
piezas con medidas de 60
¡rm
x 60
¡rm
x 60 pm con una tolerancia de
0.03
¡^rm
(30 nm). En este momento no existe una tecnología industrial
capaz de ofrecer tal resolución. En un principio no es necesario contar
160
80
40
20
l 0
2. 5
t . 2
0. 6
u.
-1
40
20
10
2. 5
t . 2
0. 6
0. 3
0. l 5
0.07
l 0
2. 5
1. 2
0. 6
0. 3
0. l 5
0.07
0.035
0. 017
2
I
0. 5
0. 25
0. 12
0. 06
0. 03
0. 0r5
0.007
0.004
o
1. 5
0. 7
0. 4
0. 2
0. 1
0.05
0.02s
0. 012
0. 2
0. I
0.05
0.025
0. 012
0.006
0.003
0. 0015
0.0007
0.0003s
-
I 18
RIIDES NDURoN¡\I.ES
con tecnologías de alto nivel para obtener las micromáquinas herramientas
de décima generación, pero se requiere observar algunos principios para
la pro<lucción de estas micromáquinas. Vamos a utilizar los ejemplos de
la Tabla 3.1 para aclarar estos principios.
Los experimentos realizados con el prototipo de la primera generación
cle micromáquinas muestran que las piezas básicas para el desarrollo de la
segunda generación de una micromáquina herramienta pueden ser manu-
t-acturadas con ese prototipo. El prototipo de la primera generación puede
producir sin ningún problema las guías de 3 mm de diámetro, los tornillos
de 1 mm de diámetro para ensamblar la micromáquina, los engranes y
las piezas para fabricar los motores de paso, con excepción del alambre
rnagnético. El prototipo permite manufacturar los tornillos sinfín para
desplazar los carros. Algunas piezas de la micromáquina de la segunda
generación son excesivamente grandes como para ser producidas con la
ayuda del prototipo de primera generación. Tal es el caso de las partes
del cuerpo de la micromáquina de la segunda generación, que pueden
tener dimensiones de hasta 80 mm. El prototipo de la primera generación
tiene capacidad para fresar piezas con dimensiones de 20 mm por lo que
puede fabricar las partes que sirven para producir micromáquinas de cuaÍa
generación. Pero estas partes son tan grandes que pueden ser fabricadas cott
equipo convencional sin problemas.
Mediante el prototipo de primera generación no se pueden producir
balines para baleros, los cuales se emplean para soportar los tornillos
sinfín de carros y eI choque. Los baleros para soportar los tornillos sinfín
de los carros de la máquina herramienta de la segunda generación tendrán
un diámetro de 5 mm. La industria convencional produce baleros de este
tamaño, pero para la tercera generación es necesario conseguir bale-
ros con un di ámetro de2.5 mm (Tabl a 3.1) y para l as generaci ones
siguientes el tamaño de los baleros debe ser aun menor. La industria
no produce baleros de dimensiones tan pequeñas. Para resolver este
problema proponemos dos soluciones:
1. No utilizar baleros con balines en las micromáquinas de generacio-
nes posteriores a la segunda generación. La cual no es una solución
aceptable debido a que crece el desgaste ocasionado po¡ la fricción.
2. Otra solución es contar con un equipo especial para la producción
de balines cuyas dimensiones correspondan al tamaño de las micro-
máquinas. Esta solución es la más aceptable, por múltiples razones'
incluso para la fabricación de microbalines que pueden utilizarse en
Mrcnou¡cÁnrc¡ 119
dispositivos ópticos y en nanotecnología. Consideremos un ejemplo
de dicho equipo.
Es posible producir microbalines de forma robusta mediante la micro-
máquina herramienta de cada generación. para
emplear estos balines en
baleros es necesario mejorar la forma y la calidad de zu superficie.
para
ello
es posible emplear la tecnología que se utiliz en la mecánica convencional.
Los balines robustos se colocan entre dos discos como se muestra en Ia
Figura 3.4. El disco de abajo tiene una ranura circular. En esta ranura se
colocan los balines robustos, se añade abrasivo y se cubren con otro disco:
posteriormente
se rota el disco de aniba quedando el disco de abaio inmóvil.
Mediante este procedimiento
todas las deflexiones de forma .rféri.u ,on
eliminadas de manera automática.
por
último se retira el abrasivo que se
aplicó en un principio y se añade un abrasivo muy fino con el fin de obte-
ner una superficie de alta calidad.
para
producir microbalines es necesario
manufacturar microdiscos con microranuras que, por ende, también deben
ser incluidos en el equipo micromecánico de cada generación.
Figura 3.4. Dispositivo para dar acabado a balines.
Otro problema que se plantea en la micromecánica es cómo obtener
alambre magneto de las dimensiones adecuadas para los motores de
paso' La industria produce alambre magneto de hasta 0.02 mm. Este
tamaño es suficiente para la cuarta generación, pero después de ésta los
motores deben de fabricarse con alambre de menor tamaño. También
existen diferentes soluciones para este problerna.
La industria produce papel aluminio de hasta 0.0007 mm de espesor.
Es posible cortar dicho papel con ayuda de las micromáquinas ilerra-
mientas de generaciones
avanzadas con el fin de obtenei alambre de
aluminio (no obligatoriamente redondo). Es necesario oxidar el alambre
con el fin de crear una capa aislante que lo proteja. con este método
ñ;r
G;.-l
til;l
f-^",-f¡
120 REDES NEURoN^LEs
se puede obtener alambre para las generaciones de la quinta hasta la
novena, pero para generaciones más avanzadas es necesario recurrir a
otra tecnología.
Una solución es producir microequipo para rolar las hojas y el alambre
más delgados que se producen en la industria. Para equipo grande es difícil
producir papel y especialmente alambre delgados porque las bobinas y
otras partes del equipo tienen gran inercia y con mucha frecuencia rompen
el material. Las partes del microequipo tienen baja inercia y pueden rolar
papel y alambre delgados.
Otra solución es no usar alambre convencional para las bobinas de
los motores. Es posible preparar un tipo particular de "alambre" usando
un microtorno. Para esto es necesario preparar un cilindro de aluminio
y cubrirlo con una placa delgada de cobre (Figura 3.5, a). Después, es
necesario hacer una ranura en espiral (Figura 3.5, b) y cubrir todo con
plástico (Figura 3.5, c). Al eliminar el aluminio mediante una solución
de potasio se obtiene "alambre" de cobre recubierto con plástico. Esta
tecnología permite reducir el tamaño de las bobinas y, en consecuencia,
el de los motores.
3.2.3. Relaciones entre el tamaño
del microequipo y su precisión
Los dispositivos de la primera generación tienen tamaños que oscilan
entre 100 mm y 200 mm; la segunda generación debe de ser de un
menor tamaño y se produce empleando la primera generación; la
tercera generación debe tener un menor tamaño que la segunda, y así
sucesivamente. En el CCADET de la UNAM se han diseñado varios
prototipos de la primera generación. El principio general de la creación
de estos prototipos es el bajo costo de todos sus componentes.
La caracterización de los prototipos mostró que en principio es
posible obtener alta precisión utilizando componentes de bajo costo
empleando métodos especiales de control, por ello es importante analizar
las principales fuentes de error que se producen en estos microequipos.
A continuación analizamos dos de los principales factores que influyen
en la precisión del equipo mecánico. Se muestra que los errores relacio-
nados con estos factores disminuyen cuando el tamaño del microequipo
se reduce. En la literatura hay investigaciones en torno a diferentes
tipos de factores que varían con respecto al tamaño de un dispositivo
[fa], [f¿]. Los principales factores a los que hacemos referencia son
Ml cnovrcÁNrc¡
l l I
la extensión térmica y la vibración
[f]. Bn un ensayo publicado
en lu
revista Precision Engineering
hacemos un anárisis detallado de est¿r
cuesrión
[9]' Hemos etegioo átguno, .;.Áproriipicos
para mosrrarros
con las ecuaciones
correspondientes.
=- T_*,
----------
Li:""T__,1
F'*
-l
F'il;_l
l..'*
*l
ll-** I
Fi gur a 3. 5. Pr oceso dc l ahr i cacón de mi cr oal ambr q.
Fn el presente
trabajo se consideran dos dispositivos
mecánicos (pueden
ser dos microcentros de maquinado o dos miórorrobots),
los cuales nom_
braremos disposirivo r y dispositivo B. Los dos tienen áí ,¡r,n" Jir"n"" y
están fabricados
con el mismo material, pero el tamaño del dispositivo l y
sus componentes
son S veces. más grandes que los del disposiiivo A y sus
..om.p9.n"nt!r: por
ejemplo, si el dispositivo.B
tiene una fleiha de diámetro
d, el dispositivo I tiene una flecha de diámetro d, tal que:
du: S. dB.
e. l )
Estas ecuaciones muestran que reduciendo el tamaño s veces es
posible disminuir ros errores por lo menos en una magnitud de escala
de S veces.
f*" I
-
t22
A continuación se presentan las ecuaciones que describen el com-
portamiento de dichos factores de error en el proceso de disminución
del tamaño del microequipo.
3.2.3.1. Extensi ones térmi cas
La extensión térmica de un componente que tiene longitud L se puede
expresar como sigue:
M
:
Q. L. LT ( 3. 2)
donde AL es la deformación térmica, a es el coeficiente de la extensión
térmica y AZes la diferencia de temperatura. El parámetro 4 es el mismo
tanto para la máquina herramienta,4 como para la B debido a que éste
sólo depende del material del componente.
La longitud de un componente B es S-veces más pequeños que la
longitud de un componente.,4, es decir:
Ln: S' Lu
'
(3. 3)
La diferencia de temperatura ATconsiste en dos componentes: A{,
que es la diferencia interna de la temperatura, y Ad,
lue
es diferencia
externa de la temperatura. La máquina herramienta B exige un espacio
más pequeño que la máquina herramienta/. Asimismo, podemos decir
que es más fácil mantener una temperatura constante en el volumen
más pequeño que en el más grande; por lo tanto, podemos decir que
A1^ = 41".
(3.4)
Para comparar la diferencia de temperatura interna, consideramos
un esquema simplificado como el que se muestra en la Figura 3.6 para
establecer el origen de la diferencia de temperatura'
Mrcnolrr' cÁNrc¡ 12,-]
Supongamos que la temperaÍra T, del fregadero de calor (HS) cs
constante y que la energía producida por el generador del calor sea W.
La diferencia de temperatura se obtiene mediante la fórmula
REDES NEURONAT. TS
^T
T T
w' L*'
al =1,
t r ' S",
( 3. 5)
(3. 6)
( 3. 7)
(3. 8)
donde L". es la longitud del elemento de transferencia térmica (HT),
Srr.es el área de secuencia del elemento HT y i' es el coeficiente de
transferencia térmica.
El parámetro .l es el mismo para las máquinas herramientas A y B.
Para L,,, y Sn se tiene
donde V"* es el volumen del generador de calor y w es la energía volu-
métrica que se produce por unidad de volumen del generador de calor.
En este análisis se consideran dos casos principales. En el primero,
el parámetro w es el mismo en las máquinas herramientas,{ y B, por
lo que para este caso se tiene
wn: s' wu, ( 3' 9)
dado que Vn:St' Vu.
Con base en (3.5), (3.6), (3.7) y (3.9), obtenemos
Lnr ^
=
S' L"r "'
S, , r ^ =St ' S, , r ".
La estimación del parámetro lV es
W: w' Vo*
w"
W^
=-
^S
En el segundo caso, la energía volumétrica aumenta al disminuir el
tamaño de la máquina herramienta del siguiente modo:
( 3. 10)
Figura 3.6. Esquema del origen de la diferencia de la temperatura'
( 3. 11)
t24
Por l o tanto:
Wn: S' Wu
J
( 3. 12)
AT^
. A\ '
( 3' 13)
¡.
. s, , -
t r
. s' . s, , r"
Amboscasosmuest ranquel adi f erenci adet emperat urai nt ernaen
la máquina herramienta B es más pequeña que en la máquina herra-
mienta /.
Si regresamos a la ecuación
(3'1), obtenemos:
ALn: a' Ln' LTn2 a' S ' LB' LTu: S ' &u
'
MrcnouecÁNIc¡ 125
La influencia de la viscosidad del ambiente afecta más a los dispo-
sitivos pequeños que a los grandes, por eso tenemos que
9o
>Qt '
Y como resul tado:
Arl *' r S ' Az! *)
( 3. 18)
( 3. 1e)
Entonces, con la reducción del tamaño de los microdispositivos
las deformaciones de las vibraciones disminuyen más rápido que en
forma lineal.
Con estas ecuaciones mostramos cómo en las máquinas herramienta
las fuentes de error decrecen en función de la disminución de su tamaño,
por lo que al reducir el tamaño de las micromáquinas herramienta de
las generaciones sucesivas podemos reducir en forma lineal, o aún más,
los errores de las generaciones anteriores. En otras palabras, podemos
concluir que las máquinas grandes producen errores grandes y las
máquinas pequeñas errores pequeños.
3.2.3. Comparación de MEMS/NEMS
con la tecnología MET
Al comparar las tecnologías de MEMS/NEMS con la MET podemos
decir que ésta es muy prometedora y no tiene las desventajas de la
MEMS. La tecnología MET puede trabajar con cualquier tipo de los
materiales (por ejemplo, metales, plásticos, etcétera). Puede producir los
detalles en 3D (en tres dimensiones). Con desarrollo de microensamble
automático se pueden ensamblar dispositivos de diferentes niveles de
complejidad.
3.3. Mrcno¡ÁBRIcAS AUToMATIZADAS
En Japón se diseñó uno de los primeros proyectos de microfábrica h¿],
If f].
gn
la Figura 3.7 se muestra este proyecto.
El prototipo de microfábrica que presentamos aquí fue terminado en
1999 y está compuesto por varias máquinas herramienta: un tomo, una
fresadora, una prensa y una máquina para ensamble conformada por un
brazo de traslado y dos tenazas de dos elementos. Esta microfábrica tiene
unas dimensiones externas de 625 x 490 x 380 mm con un peso de 34 kg.
Emplea tres cámaras CCD con despliegue en un monitor de 5.8 plgs para
monitorear las áreas de trabajo dentro de la microfábrica. La micromáquina
REDES NEURONALES
( 3. 14)
( 3. 16)
Esto significa que las deformaciones térmicas disminuyen lineal-
mente (o mas rapiOo¡ con la disminución de tamaño de la máquina
herramienta.
3.2.3.2. Vi braci ones
Las ecuaciones anteriores se relacionan con las deformaciones estáticas,
pero cuandO una fuerza afecta perióclicamente prtede ocurrir una resonan-
cia. La amplitud de deformación resonante
A-
"'' s5¡{ clefinida así:
Az( *)
=
\ ' Lz,
( 3. 1s)
donde Az es la deformación estática y q es el factor de calidad del
sistema mecánico.
Las dos fuerzas periódicas que más influyen en la amplitud de la
vibración son la fuerza centrífuga y la fuerza de corte. Estos dos tipos
de fuerza corresponden a la ecuación:
az^
=L=+=s. azB
t
S' t u
Si consideramos
que el factor de calidad
4
de las máquinas herra-
mienta Ay B es el mismo, obtenemos:
Azf *)
=
Qo' Azo
=
Q"' S'
Lz"=S' Az! *)
( 3. 17)
126
herramienta que se emplea es seleccionada mediante un selector y controlada
manualmente. La microfábrica es capaz de producir pequeños componentes
y ensamblarlos como es el caso de un rodamiento en miniatura'
En la empresa Olympus Optical Co., Ltd' se diseñó otra microfábrica
(véase Fi gura 3.8) h6l .
Figura 3.7. Fábrica sobre mesa
Japonesa
Mrcno¡¡rcÁNrc ¡ 127
Figura 3.9. Estructura de la microfábrica.
3. 3.2. Control adaptativo
El sistema de control de la microtábrica será adaptativo y tendrá varios
niveles jerárquicos.
Cada nivel de control utilizará sistemas adaptativos
basados en sistemas de visión por computadora. Los niveles de control
mencionados pueden incluir a toda la microfábrica para coordinar el
trabajo de todos los módulos. Este nivel de control incluye los sistemas
de alarma para el mantenimiento del microequipo durante el proceso de
trabajo. El siguiente nivel (más bajo) incluye a cada módulo o a cada
celda de trabajo. Abarca sistemas de limpieza del equipo, como por
ejemplo virutas producidas durante la manufactura de alguna pieza.
Este nivel incluye también el control para el cambio de instrumentos
en la celda de manufactura. Es muy importante controlar la calidad de
las piezas durante el proceso de manufactura; por ejemplo, la forma
de los microtornillos producidos.
Cada nivel de control de la microfábrica utilizará sistemas adapta-
tivos basados en sistemas de visión por computadora. En el capítulo
2 analizamos diferentes sistemas de visión computacional e indicamos
cuáles podemos usar para automatizar el trabajo y el funcionamiento de
los diferentes módulos y celdas de manufactura de una microfábrica.
3.3.3. Costo de los productos de las microfobricas
El tamaño de la micromáquina herramienta de primera generación
(Fi gura 3.10) es de 130 x 160 x 85 mm3, con un peso de g",: 1.08 kg.
REDES NEURONALES
Figura 3.8. Microfábrica diseñada por la empresa Olympus Optical Co" Ltd'
3 .3 . I . Estructura de Ia microfabrica
En la Figura 3.9. se representa la estructura de una microfábrica. Los
dispositños de entrada de la microfábrica
permiten transportar e iniciar
el iratamiento
preliminar de la materia prima. La microfábrica consiste
encel dasdemanufacturaquepuedenserunaovari as.Conti epedi spo.
sitivos como bandas de transporte, micromanipuladores,
etcétera'
que
permiten transportar las piezas de trabajo de un área de trabajo a otra y
*O¿uto de ensámble pari agtegu, diferentes elementos a un dispositivo'
Para coordinar todos estos módulos y celdas se cuenta con un módulo
de control. Éste puede dividirse en diferentes niveles'
Cont rol dc I a mi crol ' i ' rbri ca
t
REDES NEURONALES Mr cnol r ucÁNr r ' , r l l ( )
Si la productividad de una micromáquina herramienta es de 12 nricro
piezas por hora, la microtábrica sobre mesa producirá 96 micropiezas
¡ror
hora. El peso de este conjunto de micropiezas será de 480 gr.
Consideramos el factor S de disminución del microequipo cle cadrr
si gui ente generaci ón como S:0.5.
En este caso evaluemos el costo de producción para generación r¡
_ (r.
Los tamaños de los componentes serán menores que los de la prinrcr.ir
generaci ón 0.5(' ur)veces. Por ej empl o, el tamaño de l a mi cromáqui rl r
herrami enta será de 4.1 x 5 x2.7 mm3. El vol umen y peso de cl cl l r
componente se reduce a 0.53(¡-r). El número de componentes crece c()nt()
23(''r). Esto significa que en el mismo volumen de I m3 vamos a tener. ll
xzts
:
262 L44 celclas de manufactura. El peso de la microfábric¿r rltr
la sexta generación será el mismo que el de la primera generaci(ln, cs
deci r, de 60 kg, porque peso de Ia cel da producti va di smi nuye conl i rr.-
me a la potencia 3 de los tamaños lineales y el número de celdas cl-ccc
también de acuerdo a la misma potencia 3.
Se ha demostrado que es posible disminuir el tiempo de manufacftrra de
una pieza en proporción a los tamaños lineales
[9].
En este caso el tienr¡to
de manufactura será de /u
:
9.4 seg. De este mocl o, l a mi crofál tr.i cl r
de la sexta generación consumirá más energía que la rnicrofábrica de
l a pri mera generaci ón en proporci ón a l a di smi nuci ón de l os ta' l rri rrs
l i neal es.
El consumodeener gí a ser áp, u: 560x 32: i 7 920W: 17. ( ) - t
kw.
De esta manera en cada hora una celda ele manufactura va a prot!rrt.rr
m,o
:
360019.4
:
383 pi ezas. El peso de cada pi eza de l a gencrrrci orr
6 será gru:
Br,x
0.515
:
5 x 0.00003
:
0.00015 gr.
El número de micropiezas que se producen con la microfábrictr scr:i
ttxro: mce x262144: 383 x 262144: 100 401 152pi ezas por l ror:r
El peso global de estas piezas será g
:15060.2
gr = kg.
Estimemos ahora el costo de producción de una microfábrica
¡re
rlt:
neciente a la sexta generación. Para ello debemos tomar en cucntu l()s
siguientes parámetros de costo: materia prima, energía, trabajo de rrn
operador, renta de área de trabajo, microequipo. El costo corrcspontle
a una hora de trabaio de la microfábrica.
128
Esta micromáquina
herramienta
permite manufacturar
piezas de tamaño
de hasta 10 x 10 x l0 mm3' Si istas piezas son de acero o de latón el
pá* p".¿t ser gn,:5 gr' El tiempo de manufactura
es f/
:
5 minutos'
La energía eléctrica
qu. .on'urn" la micrornáquina
herramienta
puede
ser de hasta
P.:50
W.
Figura 3.10. Micromáquina
herramienta de primera generación'
Suponemos
que cada celda de manufactura
automática contiene 5
dispositivos
de tamaño
y complejidad
igual a la micromáquina
herra-
mienta
(pueden ,., unu'*i"'o*aquina
herramienta'
un micromanipu-
lador, un dispositivo
para transpo;te,
un almacén de materia
prima y
un almacén de piezas manufacturadas)'
El volumen de celda puede ser
V:O.125 mr
(Fi gura:' f f). E' f peso de l a cel da puede ser-de 9' :6
ló.
gi'Ál.t"tuniputuoo'y el dispositivo.de
transporte no funcionan
todo el tiempo en que está án *"'"hu la micromáquina
herramienta'
Si
evaluamos el consumo de energía de estos dispositivos
auxiliares como
p":20W, en total l a cel da va a consumi r
p.:70 W'
En este caso, toda la microfábrica
sobre mesa puede tener 8 celdas
V
o.upu' un volumen de Vr:l m3
'
Esta microfábrica' iunto
con el lugar
de trabajo de un operadoi,
puede ocupar- un área A: l0 m2' El peso
total de esta microfábrica'puede
ttt 6O tg y su consumo de energía
al canzaPr:560
W.
REDES NEURONALES
Mrcnou¡cÁrtcA l 3l
Ello significa que el costo de una hora de trabajo será de 0.03 dólares
por metro cuadrado. Si la microfábrica ocupa 10 metros cuadrados, el
costo de renta por una hora será de 0.3 dólares.
5. El costo del microequiPo
La idea básica de las generaciones sucesivas de microequipos es producir
microequipo en microfábricas. Por eso el costo del microequipo será igual
al costo de producción de las microfábricas. Más adelante mostraremos
que el costo de producción es un poco más alto que el costo de la materia
prima. Por eso aquí evaluamos el costo del microequipo como 1.5 del
costo de la materia prima. El peso de la microfábrica es 60 kg. Entonces,
el peso de la materia prima es 75 kg. El costo del microequipo es de 1.5
x4 x'75: 450 dólares. Supongamos que el período de reembolso de
microequipo es de un año. Con 200 horas de trabajo al mes, esto corres-
ponde a 2,400 horas. Entonces el costo del microequipo en una hora es
de 0.19 dólares por hora.
Al sumar estos cinco componentes tenemos que la producción de la
microfábrica en una hora costari71 * 1.8 + 15 +0.3 +0.19
:
92.29 dólares'
Este significa que el costo de producción del producto global es 1.23 veccs
más que el costo de la materia prima.
3.3.4. La microfabrica como testbed para los tttétodos
de int eli gencía anificial
Algunos métodos de inteligencia artificial (AI, por sus siglas en irrrllt's)
podrían utilizarse para mejorar el funcionamiento dos Sistemlts tlc :rtr
tomatización en procesos de fabricación. Sin embargo, en la pliicticrt
la introducción de estos métodos en la industria ha sido lenta dcbithr
al alto costo de los experimentos con la fabricación convenciottltl y lo:'
si stemas de AI. Para reduci r l os costos que i mpl i can l os expcri rttcnl os
en este campo, hemos desarrollado un equipo micromecánico cs¡rccirrl,
Similar al equipo meCániCo convencional pero de un tamano Ittttclttr
más pequeño y por lo tanto menos costoso. En este equiptl sc
¡Xrth'írr
utilizar para la evaluación de diversos métodos la AI de una rllan(jlrl
fáci l y barata [18], [19].
Con el escal ami ento apropi ado l os Itról otl os
probados se podrían transferir a la industria. En este apartado sc dcs
cribe cómo los prototipos de microequipo de bajo costo se pueclctt trsrtt
para algunas pruebas prácticas que permiten aumentar la prccisiírn dt'l
mi croequi po. Así, por ej empl o, para el ensambl e de l os nri crodi s¡xr
sitivos podemos usar los sistemas de visión por computador¿t b¿ts¡tdos
130
Fi gura 3.11. Cel da de manufactura automáti ca'
l. El costo de la materia
Prima
Suponemos
que un kilogiamo de materia prima cuesta 4 dólares de
Esiados Unidos 1ver,
poi ejemplo' los costos corrientes de los metales
[17]).
Supon..no, tu*bién que durante el tratamiento mecánico la ma-
i.rií prmu perderá 20% de su peso inicial. La microfábrica
produce
tS ti Oe piezas. Para obtener esta producción se requieren 18'75 kg
de materia prima que costará 75 dólares'
2. El costo de la energía
Si el cost odeunkWhdeenergí ael éct ri caparal ai ndust ri aesunpoco
menos de 0.1 dólares de Estados Unidos, y la microfábrica consume
17 .gZkW ,
entonces el costo de la energía que se consume en una hora
será aproximadamente
de 1.8 dólares'
3. Costo del trabajo de un oPerador
Suponemos
que un operadoi
gana 15 dólares por hora (incluyendo el
costo del seguro soci al e i mpuestos)'
4. El costo de la renta del área de trabajo
Suponemos
que la renta de un metro cuadrado es de 6 dólares estado-
unidenses
por mes y que la microfábrica trabaja 200 horas en ese lapso'
r32
en las redes neuronales y para la caracterización dei microequipo los
algoritmos genéticos.
I-as tecnologías basadas en AI permiten su utilización no solamente
para tareas convencionales
(sistemas expertos, bases de datos inteligentes
[ZO], et diagnóstico técnico [27] 1221, etcétera), sino también para la
automatización total de los procesos de fabricación mecánica. Los méto-
dos de Ai tales como el diseño crítico adaptivo (Adaptive Critic Design)
Ízg),Ízql,las
redes borrosas adaptivas de Petri [25], [26], los sistemas
basaclos en la visión computacional con redes neuronales [ZZ]-[gO], et-
cétera, podrían utilizarse para solucionar problemas de automatización.
Para comprobar toilo esto, eS necesario crear una fábrica experimental
cuyos procesos de fabricación estén completamente autontatizados. Cabe
advertir que ello constituye una tarea muy difícil y costosa.
Se ha propuesto una nueva tecnología para la construcción de un
mi croequi po muy pequeño t1]-t31. Esta tecnol ogía se basa en l as mi -
crorráquinas herramienta y los dispositivos de microensamble que se
pue<len proclucir en generaciones secuenciales. Cada generación debe
incluir el equipo (máquinas herramienta, micromanipuladores, disposi-
tivos de microensamble, instrumentos de n-redición, etcétera) suficiente
para fabricar un sistema de equipo idéntico de un tamaño más pequeño'
Cacla generación sucesiva podrá producirse mediante el equipo de la
generación anterior. El tamaño del equipo de cada generación es más pe-
queño que el de la generación precedente. El microequipo de la primera
generación puede ser producido por un equipo convencional. Mediante
el microequipo tle la primera generación se puede producir el de la
segunda, la cual posee un tamaño más reducitlo. Originalmente, esta
tecnología recibió el nombre de tecnología de producción de microequipo
(Microequipment based Manufacturing, MbM)
[l],
y después del año
2002 se le conoce como tecnología de microequipo
(MicroEquipment
Technol ogy, MET) (véase el apartado 3.2.2) l 7l .
La tecnología MET tiene rnuchas ventajas:
I La miniatur\zación del equipo permite disminuir el espacio ocu-
pado así como el consumo de energía y, por lo tanto, el costo de
l os productos. '
2 Los costos de trabajo disminuyen debido a la reducción de los
costos de mantenimiento y al nivel más alto de automatización
esperado en MET.
Nf t cnopt ecÁ¡ t t c¡ l . l l
3 La miniaturización del equipo de MET disminuye su costo. Ésto cs
consecuencia del propio desarrollo del microequipo. La realización
del microequipo universal que es capaz de la reproducción exten-
dida de sí mismo permitirá la fabricación de microequipo barato
debido al consumo más bajo de materiales, de energía, de trabajo'
y de espacio en MET. Así, la miniaturización del equipo permite
una disminución drástica del costo unitario del proceso individual.
con un costo unitario más bajo de la micromáquina individual, la
manera más natural de alcanzar un alto rendimiento de procesamiento
consiste en efectuar los procesos de manera paralela. En lugar de traba-
jar con una máquina es mejor usar una gran cantidad de micromáquinas
herramienta de la misma clase. La explotación de ese gran número de
micromáquinas herramienta solamente es factible si su operación es au-
tomática y con un control altamente automatizado de la microfábrica en
su totaliclad. Contamos con que muchos conceptos, ideas y técnicas útiles
y probadas de automatización se pueden usar en la ingeniería industrial.
e.unqu.los principios de la automatización de fábrica (FMS y CAM) y
las tétnicas áe control numérico varían, la automatización de una micro-
fábrica tiene particularidacles que requieren métodos especiales de AI.
consideremos una estructura
jerárquica general del sistema de control
automático para una fábrica nricromecánica. El nivel rnás bajo (el primero)
en el sistema de control esrá relacionada con el equipo micromecánico
(las
máquinas herramienta y los micromanipuladores
para microensamble)
y pósibilita el diagnóstico más simple del microequipo, la medición y la
prueua final de la producción. El segundo nivel del sistema de control se
ielaciona con los dispositivos que transportan los objetos, las herramien-
tas, las piezas y esas partes enteras del equipo; coordina la operación de
los dispósitivoi d.l nñ.I más bajo; proporciona la inspección intermedia
¿e ta catida¿ de la producción y el diagnóstico más avanzado de la con-
dición del equipo. El tercer nivel de control contiene el sistema para la
selección aut,omática de modos de manufactura y las rutas para producir
las piezas. El nivel superior (el cuarto) del sistema de control permite
detectar las situaciones no estándar y de alarma y toma la decisiones'
incluyendo la comunicación con el operador'
Partimos de la hipótesis de que el manejo de la microfábrica correrá
a cargo de un único operador. Ello significa que casi todos los problemas
que se presenten en cualquier nivel de control durante el proceso dc
iroAucóiOn
deben ser solucionados automáticamente
y que el operador
REDES NEURONALES
debe solucionar sólo aquellas diñcultades que sean demasiado complejas
o inusuales como para que puedan resolverse de manera automática'
El sistema de control debe ser adaptable puesto que son muchos los
factores que pueden afectar a un proceso de producción. También debe ser
autodidactico porque es imposible prever todas las fallas que pueden ocurrir'
La AI tiene instrumentos que permiten construir los algoritmos adaptativos
y reducir al mínimo la participación del operador. La AI incluye diversos
métoclos para crear sistemas autónomos de control. Los clasificadores
neuronales serán especialmente útiles en el nivel más bajo del sistema de
control. Podían ser utilizados para la selección de los modos del tratamiento,
verificar las condiciones de la herramienta de corte, el control de los proce-
sos de ensamble, etcétera. Permiten hacer más flexible el sistema de control.
Este sistema compensará automáticamente las pequeñas desviaciones de las
condiciones de la producción tales como el cambio de la forma de la herra-
mienta de corte o de los parámetros externos del ambiente, variaciones en
la estructura de los materiales del objeto, etcétera. La AI permitirá diseñar
clasificadores adaptativos y debe proporcionar la oportunidad de excluir la
participación del operador humano en este nivel del control.
En el segundo nivel de control, el sistema de inteligencia artificial debe
detectar todas las desviaciones del proceso de producción normal y tomar
decisiones para modificar el proceso para compensar esta desviación. La
compensación debe hacerse ajustando los parámetros de los sistemas de
control de nivel inferior. Ejemplos de 1o anterior son las desviaciones del
plan de fabricación, faltas en algunos dispositivos, producción de piezas
no estándar, etcétera. En este nivel el sistema de AI debe contener las
estructuras en las que se representan las interrelaciones de los componentes
del proceso de producción. como en el caso anterior, es deseable tener
los algoritmos de trabajo sin la participación de un supervisor'
El tercer nivel de control está relacionado con el cambio de la nomencla-
tura o del volumen de producción alcanzado por la fábrica. Es conveniente
este sistema para que sean mínimos los costos generados por los cambios
para una nueva producción o para cambiar el volumen de producción.
Las estructuras adaptivas de la AI que formaron el nivel más bajo podrían
proporcionar la base para tales cambios, para la selección de los paráme-
tror d. proceso y la configuración del equipo para trabajar con máquirlas
herramienta y con ensamble, etcétera. En el tercer nivel de control las
estructuras la AI deben detectar la semejanza de los productos nuevos con
los que fueron fabricados en el pasado. con base en esta semejanza, se
formarán automáticamente las ofertas de horarios de fabricación, los modos
Mrcnovrec, i Nt c¡ 135
de proceso, el encaminamiento, etcétera. Entonces los productos serárt
comprobados mediante métodos de cómputo, generalmente con sistenlas
de fabricación con aluda de computadora (Computer Aided Manufactu-
ring, CAM). Los resultados de la comprobación, así como la informaci(tn
subsiguiente relativa a la eficacia de las decisiones tomadas en este nivel,
se pueden utilizar para mejorar el sistema de la AI.
En el nivel superior de control se deben aplicar estructuras más
complejas de AI. Este nivel del sistema debe tener la capacidad de re-
velar las características inusuales en el proceso de producción, evaluar
la influencia posible de estas nuevas características en el proceso clc
producción y tomar las decisiones que permitan cambiar los parámetros
del sistema de control en los distintos niveles
jerárquicos o para llantar
a un operador que se haga cargo. En este nivel el sistema de control
debe contener la base de conocimientos de la inteligencia, la cual sc
puede crear usando los resultados de la operación de los sistemas dc
control de nivel inferior y del conocimiento experto. En un principio,
puede ser utilizado el conocimiento del experto en mecánica.
Actualmente se utilizan con éxito en la industria muchos métodos dc
AI [31], [gZ]
que podrían ser utilizados también en micromecánica.
Pero los problemas que implica la creación de una microfábrica corrr-
pletamente automatizada no se pueden investigar experimentalmento crt
la industria convencional debido al alto costo de los experimentos. At¡rrí
proponemos desarrollar un ambiente micromecánico de prueba de bltio
costo para solucionar estos problemas.
Los prototipos de microequipo de la primera generación que lire r otr
diseñados y examinados por nosotros utilizan algoritmos adaptativos tlcl
nivel más bajo. Actualmente se están desarrollando algoritmos sof istit :r
dos basados en redes neuronales y algoritmos genéticos. Más aclclrrrrtc
describimos nuestros experimentos en el desarrollo de los algoritrttos
y sus aplicaciones.
3.4. MTcnoeNSAMBLE AUToMATIZADo
Para fabricar microequipo de bajo costo es necesario utilizar colnpo-
nentes que no sean muy caros. Ello tiene el inconveniente de que tt<t
podemos obtener mucha exactitud en los dispositivos del ensamble. l)lrit
compensar esta desventaja hemos diseñado un algoritmo adaptaivtl plrlrr
el microensamble usando un sistema de visión computacional.
t34
136
El objetivo principal del microensamble automatizado es resolver el
problema que supone la construcción del sistema de visión computacio-
nal. Nuestra propuesta es sustituir el sistema de visión estereoscópica,
que exige dos cámaras digitales, por un sistema que emplea una cámara
digital para teleconferencias, cuyo costo aproximado es de 40 dólares,
con cuatro fuentes de luz. Esta tarea está descrita con detalle en el
capítulo 2, parágrafo 2.4, del presente libro.
Las sombras de ia flecha que obtenemos con ayrda de las cuatro fuentes
de luz permiten obtener ia posición en 3-D de la flecha con microanillo
que aparece en la irnagen. Este último debe ser insertado en el orificio.
Utilizamos un clasificaclor neuronal para reconocer las posiciones relativas
de la flecha y del orificio.
El problema del ensamble automático de los microdispositivos es
muy importante en mecatrónica y rnicromecánica. Para obtener una alta
precisión es necesario utilizar algoritmos adaptativos como base de los
sisternas de visión computacional. Hemos propuesto un méfodo que
permite construir algoritmos adaptativos basados en redes neuronales.
Consideremos la tarea convencional de colocar una flecha en su
orificio usando un sistema de visión computacional de bajo costo.
Para este propósito es necesario conocer los desplazamientos (dx,
dy, dz) de la flecha en relación al orificio. Este método permite utilizar
solamente una cámara digital.
Se utilizan cuatro fuentes de luz para obtener las sombras de la flecha.
La localización mutua de estas sombras y de la flecha contiene toda la
información que se requiere sobre los desplazamientos de la flecha en
relación al orificio. Los desplazamientos en el plano horizontal (dr,
riy) se podrían obtener directamente mediante desplazamientos de los
centros de sombras en relación al centro de la flecha. El desplazamiento
vertical de la flecha se puede obtener a partir de la distancia entre las
sombras. Para calcular los desplazamientos es necesario tener todas
las sombras en rJna imagen. Capturamos cuatro imágenes que corres-
ponden a cada fuente de luz secuencialmente y después extraemos sus
contornos y sobreponemos cuatro imágenes de contorno. Utilizamos
la imagen resultante para reconocer la posición de Ia flecha en relación
al orificio. El sistema de red neuronal que permite reconocer los'des-
plazamientos de la flecha en relación al orificio tiene errores de menos
de 1 pi xel [331.
MI cnouEcÁN¡ c¡ l . l /
3.4. l. Algoritmo adaptativo
del nivel más bajo
Para compensar los errores de la micromáquina herramienta henlos
desarrollado un algoritmo especial para medir el diámetro del ol.r-jcto
usando el contacto eléctrico del objeto con el disco de la rnedida (Figrnr
3 . 12). Esta medida permite elaborar el algoritmo para el corte de llcchrr
de latón [f O]
, [Z f ] . Obtuvimos una flecha de latón con un diárnetro dc
50
¡rm
y una longitud de 550
¡^rm
(Figura 3.13), que es casi igual a ll
flecha producida con la tecnologíajaponesa [15J.
Fi gura 3.12. Pi eza con di sco para medi ci ones.
Figura 3.13. Flecha con diámetro de 50 pm.
3.4.2. Algoritmo genético para la caracterización
de la micromáquinas herramienta
Para mejorar la precisión de la micromáquina herramienta cs nce csrr rr )
corregi r sus errores. Para obtener l a i nformaci ón sobre l os cnt' rts
utilizamos un esquema con dos bolas para la medida de los paránrclros
de la máquina herramienta. Se fija una bola en el soporte especirrl rlrrt' st'
inserta al husillo de la máquina herramienta. La seguncla ltola sc f ii:r t'rr t'l
cano de la máquina herramienta (Figura 3.14).
REDI : S NEURONALES
-
b.d'ffit
l i i gura 3.i 4. Bol as de contacto en l a mi cromáqui na herrami enta.
.A.l mover el carro con la segunda bola hasta que haga contacto con
la primera en diversas posiciones es posible obtener la información
necesaria sobre las características geométricas de la máquina herra-
lnienta. Pero los parámetros geométricos dependen de las posiciones
del contasto de una manera muy compleja. Para resolver el sistema de
las ecuaciones no lineales que representan la dependencia mencionada
utilizamos un algoritmo genético. Este método permite reducir en un
tercio los errores de las micromáquinas herramienta [84] .
Los algoritmos de AI se podrían utilizar para aumentar el nivel de
automatización de los procesos de fabricación. Los experimentos con
algoritmos de AI en fábricas reales resultan demasiado costosos. En este
capítulo se propone unalestbed de bajo costo para probar los métodos
de AI. Esta testbed se compone de los modelos micromecánicos de los
dispositivos convencionales de la industria. Los prototipos de micro-
máquinas herramienta que diseñamos fueron elaborados y examinados
con algunos algoritmos de AI. Los resultados de la reexaminación de
testbed demuestran que los sistemas de inteligencia artificial se podrían
probar con bajo costo.
3.5. MIcnoltANrpuLADoR DE BAJA INERCTA
Para aumentar la productividad de la microfábrica es necesario reducir
la inercia de todos eslabones del microequipo, especialmente de
Jos
micromanipuladores. El micromanipulador tiene muchos eslabones
conectados secuencialmente y cada eslabón posee un motor eléctrico
que aumenta el peso del eslabón y su inercia. Además, la miniaturiza-
MI cnol t ucÁxr t , r l i ( )
ción de los motores eléctricos presenta dificultades más grandes t¡uc l:r
miniaturización de otros componentes mecánicos t¿], ttg].
Por eso proponemos colocar todos los motores en la base clcl rni
cromanipulador y transferir el movimiento de la base a los eslaboncs
usando cadenas de engranes. En l a Fi gura 3.15 se muestra un ej ernpkr
de eslabón de manipulador de baja inercia. Éste contiene cadenas dc
engranes para transferir el movimiento. Estas cadenas se muestran crl
l a Fi gura 3.16, a, b. En l a Fi gura 3.16 están representadas dos cadcnl s
de engranes. Una de el l as conti ene l os engranes l , 3, 5, 7, 9, l l y Il
otra conti ene l os engranes con números 2, 4, 6,8, 10, 12.
El movimiento del eslabón previo se transfiere a los engranes I y 2
de las cadenas (Figura 3.16, a) y después se transfiere hasra los engnr
nes l 1 y 12. En l as sal i das de cadenas el movi mi ento se transfi erc a l .s
engranes termi nal es 13 y 14 (Fi gura 3.16, b).
Fi gur a 3. 15. Esl abón de mani pul ador de bai a i ner ci a
r 38
REDES NEURONALES
i , I l i ¡
I
¡lr
Fi gura 3.16, a. Cadena de engranes de un esl abón
REDES NEURONALES
Fi gura 3.16, b. Engranes termi nal es de cadenas de un esl abón.
Desde estos engranes, el movimiento se transfiere al siguiente
eslabón. En nuestro caso. este último es el eslabón de movimiento
traslacional.
Esta solución permite obtener una velocidad de trabajo más alta
y además miniaturizar el micromanipulador y su base con diferentes
escalas. Por ejemplo, es posible usar una escala de 0.5 para el micro-
manipulador y una escala de 0.7 para los motores y la base. Con estas
escalas es posible miniaturizar los motores [13] .
Referencias
l. Kussul, E., D.A. Rachkovskij, T.N. Baidyk, S.A. Talayev, "Micromechanical
Engineering: A Basis fbr the Low-cost Manufacturing of Mechanical Micro
Devices Using Microequipment", Journal of Micromechanics and Microen-
gineering,6, vol. 6, 1996, pp. 410-425.
2. Kussul, E., T.N. Baydyk, D.A. Rachkovskij, S.A. Talayev, "Método de manu-
factura de dispositivos micro mecánicos", Patente 96ñ2125.02, Rusia, 1997.
3. Kussul , E.M., T.N. Baydyk, D.A. Rachkovski j , S.A. Tal ayev, "Método de
producción de productos micromecánicos", Patente 24091, Ucrania, 1998.
4. "Micromechanics and MEMS", Classic and Seminal Papers to 1990,Trin-
mer, W.S., IEEE Press, 1991 ,
p.70L.
5. "Micro Mechanical Systems. Principles and technology" Fukuda T., W.
Menz, Elsevier, 1998, 268 pp.
,
6. "Microfactory", editado por Swiss Foundation for Research in Microtechnology,
2nd International Worlcshop on Microfoctories, Suiza, 2000, 206 pp.
7. Kussul, E., T. Baidyk, L. Ruiz-Huerta, A. Caballero, G. Velasco, L. Kasat-
kina, "Development of Micromachine Tool Prototypes for Microfactories",
Journal of Micromechanics and Microengineering, 12,2002, pp. 795-813.
9.
]Vticttor' lt,r
' ,i
lirt .' , I I i
Kussul , E. , T. Bai dyk, L. Rui z, A. Cabal l ero, G. Vel asco, "I )evel t t pt t r. t , t
of Low-cost Microequipment. 2002 International Symposium oit Mict or rtt'
catrónica and Human Science", 1EEE, Nagoya, octubre 20-23,2002, yp.
r25-t34.
Kussul , E. , T. Bai dyk, L. Rui z-Huert a, A. Cabal l ero-Rui z, G. Vcl usco.
"Scaling Down of Microequipment Parameters", Precision Engitrt' ct irtt¡,
vol . 30, núm. 2, 2006, pp. 2l l - 222.
10. Kussul , E. , T. Bai dyk, L. Rui z-Huert a, A. Cabal l ero-Rui z, G. Vel asco,
()
Makeyev, "Techniques in the Development of Micromachine Tool Prototy¡res
and their Applications in Microfactories", en NÍEMS/NEMS, Handbook,
"Techniques and Applications", T. Cornelius Leondes, Springcr, r' ol. .1.
2006, pp. l -61.
11. Bai dyk, T. , E. Kussul , O. Makeyev, A. Cabal l ero, L. I t ui z, G. Carrcrl .
(
i
Velasco, 2004, "Flat Lnage Recognition in the Process of Microdevic:c r\s
sembly", Pattern Recognition Letters, vol. 25, pp. 107-118.
12. Bai dyk, T. , E. Kussul , O. Makeyev, "General Purpose hnage Rccogt t i t ri , rr
Systems Based on Neural Classifiers", en Neurocotrtpttt ing Res r:urclt' l' t' t' t t, l s.
G. B. Kang, NOVA Publ i shers, 2007, p. 30.
13. Trimmer, W.S.N., "Microrobots and Micromechanical Systents", crl .l¿' rt.ror t
and Actuators, 19, 1989, pp. 267 -281 .
14. Tanaka, M. , "Devel opment of Deskt op Machi ni ng Mi crol act ory". / l / A/ : , \
REVI EW, núm. 34, abri l 2001, Japón.
15. Okazaki , Yu. , T. Ki t ahara, "Mi cro-Lat he Equi pped wi t l . t Cl osccl l . ort ¡r
Numerical Control", Proceedings of the 2+d Internafionul Wttt' kllttt¡t ,,rt
Microfactories, Suiza, 2000, pp. 87-90.
16. Haruo, Ogawa, "Micro-assembly Systems", J apani lctí s-s uotttt t l t t i s t' r t l t r t t
¡'
puseminaarin materianlia, Kesákuu, Helsinki, 2001, p. 4. http://:rksclr tr' f t
filopencms/opencms/OhjelmaPortaali/ohjelmat/Presto/fi/DokunlcrrlIr:rt k l l,
'
Viestintaja_aktivointi/Seminaarit/Seminaari060l/Micro-assenttrly S1' slt r r r'
pdf
17. Metal Prices & News on the Internet, http://www.metalpriccs.c()rrr/
18. Lara-Rosano, F. , E. Kussul , T. Bai dyk, L. Rui z, A. Cabal l ero,
(
i . Vcl rt r' t , ,
,
"Art i f i ci al I nt el l i gence Syst ems i n Mi cromechani cs", Bost orr/ l )ort l ¡ t t l rt i
London, Kluwer Academic Publishers, enArtificial Intelligerr:e A¡t¡tliatrrrtrt:
and Innovationr, Max Bramer,2004, pp. 1-10.
19. Kussul , E. , T. Bai dyk, F. Lara-Rosano, O. Makeyev, A. Mart i rl , l ). Wt t nscl r,
"Micromechanics as a Testbed for Artificial Intelligence Metltocls Iivrrlrr:r
tion" , in IFIP International Federationfor Infornntion Processirtg, vol .l I li.
Proi ' essi onal Pract i ce i n Art i f i ci al l nt el l i gence, eds. J. Debenl t rt t rr,
-l Oot r.
Boston, Springer pp. 27 5-284.
20. Eberhart , R. , "Overvi ew of Comput at i onal I nt el l i gcnce (rt t t t l I l i ot t t t rl rt , rl
Engineering Applications)" ,
Proceedings of the 20lh Attttttttl lt¡ttrttttttt¡tt,tl
-
t Aa
REDES NEURONALT] S
Conference of the IEEE Engineering in Medicine and Biology Society 3,
1998, pp. 1125-1129.
21. Hui, T., D. Brown, B. Haynes, Xirxian Wang, "Embedded Ediagnostic for Dis-
tributed Industrial Machinery", IEEE In¡emntional Symposium on Compaaional
httelligence
for
Measurentenf Systems wtd Applicatiors, 2003, pp. 156-16l .
22. Awadallah, M., M. Morms, "Appücationof AltoolsinFaultDiagnosisof Electrical
Machines and drives-an overview" ,lEEETransactions on Energy Conversion 18,
núm 2, 2003, pp. 245-251.
23. Werbos, P. ,
"Advarrced Forecasting Methods for Global Crisis Waming and Models
of Intelligence"
, en General Systems Yearbook 22, 1977, pp.25-38.
24. hokhorov, D., D. Wunsch, "Adaptive Critic Designs" , IEEE Trau. on Neural
Nem¡orks 8, núm. 5, L997, pp. 99-1007.
25. Xiaoou, Li, F. l¡¡a-Rosano, "A Weighted Fuzzy Petri net Mdel fbr Knowledge
Learning and Reasoning", Intemuioml Joint Conference on Neural Networlcs,
pp.2368-2372.
26. Xiaoou, Li, Yu Wen, F. l¿ra-Rosano, "Dyrnmic Knowledge lnference and [ram-
ing under Adaptive Fuzry Petri Net Fnmework" ,lEEETransadions on Syslems,
Mru\ and Cybemetics 39, núm. 4,20f,0,pp. M2450.
27. Bottou, L., C. Cortes, J. Denker, H. Drucker, L. Guyon, L. Jackel, J. I-eCun, U.
Muller, E. Sackinger, P. Simard, V. Vapnik, "Comparisonof ClassifierMethods:
a Case Sudy in Handwritten Digit Recognition", en Proceedings of lZh UPR
htenrttional Conference on Panent Recognition 2, 1994, pp. 77 -82.
28. Fuk'ushima, K., "Neocognitron: A hierarchical neural network capable of visual
panem recognition", Neural Nenuorks /, 1988, pp. 119-130.
29. Roska, T., A. Rodriguez-Vazquez, "Toward Visual Micro Processors" , Proceed-
ings of the IEEE 90, núm . 7 ,
julio 2ü2 ,
pp . I2dA-1251 .
30. Baidyk, T., "Applicationof FlatImageRecognitionTechniqueforAutoÍiationof
Micro Device Production", Proceedings of the Intemrtiornl Conference on Ad-
vanced htelli ge nt Mecu róü ca " AIM' 0 1 ", Italia, 200 1, pp. 4884%.
31. Wenxin, Liu, G. Venayagamoorthy, D. Wunsch, "A Heuristic Dynamic Program-
ming Based Power System Stabilizer for a Turbogenerator in a Single Machine
Power System", 39h IAS Atutual Meeting on Industry Applicntions 1,2Cf'3,pp.
270-276.
32. Croce, F., B. Delfino, et al. ,
"Operations and Management of the Electric System
for Industrial Plants: An Expert System Prototype for ttad-shedding Operator As-
sistance", /EEETra¡uactíons on hrdtutry Applicaioru 37,n(trt.3,2001,701-708.
33. Kussul, 8., T. Baidyk, "Improved Method of Handwritten Digit Recognition
Tested on MNIST Database", Image cwl Vision Computíng, vol.22ll2,20[/.,
pp. 971-981.
34. Caballero-Ruiz A.., Ruiz-Huerta L., Baidyk T., Kussul E. "Geometrical
Errors Analyisis of a CNC Micromachine Tool", Mechatronics, vol. 17,
núms. 4-5, mayo junio 2007, pp. 231-243.
4. APLICACIONES
4. l . Cr s¡ cr óN DE MEMoRI A NANoMECÁNr cA
PARA NEUROCOMPUTADORAS
La computación neuronal constituye una parte importante de las tecno-
logías de la información. cada año se celebran en el mundo numerosos
congresos internacionales que incluyen a la compukción neuronal en sus
programas. Además, existen muchas revistas internacionales en donde
se publican trabajos relacionados con las redes neuronales artificiales
y la computación neuronal.
Tomando como base las redes neuronales, hemos diseñado siste-
mas de control de robots movibles
[l],
sistemas de reconocimiento
de imágenes
t2]-t51, neurocomputadoras que aceleran los procesos de
computación neuronal
[1], [6]-[13], sistemas para la representació¡r
distribuida de conocimientos
[14]-[16], entre otros logros. Las neuro_
computadoras se han utilizado en diversas instituciones y empresas, tales
como la compañía japonesa
WACOM. En los capítulos I y 2 cle este
libro hemos descrito paradigmas de redes neuronales y de aplicacioncs
de tales paradigmas.
Las neurocomputadoras poseen un número elevado de procesatlrr.cs
en paralelo que incluyen instrucciones especiales que permiten acclcr.:'
la computación neuronal (con registros de hasta 512 bits). una de esr.s
instrucciones es la multiplicación de un vector binario por una marriz
binaria. El problema principal para la creación de neurocomputadorus
es la ausencia de una memoria especial capaz de leer y guardar vectorcs
binarios de alta dimensión. En la compañía japonesa
WACOM la nre,
moria que trabajaba en paralelo con vectores de 512 bits fue construidil
con ayuda de 64 chips, cada uno de los cuales trabajó con
g
bits. Esta
memoria costaba aproximadamente 15 veces más que los otros collpo-
nentes de esta neurocomputadora. Actualmente las neurocomputadorus
tienen que trabajar en paralelo con vectores que contienen varias <Jeccnas
o varios cientos de miles de bits, pero la elaboración de estas ncur'
computadoras con memoria convencional es muy costosa.
Durante el último año, en el Centro de Ciencias Aplicadas y Desrr
rrollo Tecnológico de la UNAM hemos realizado el diseño conceprurrl
de una memoria electromecánica que contiene propiedades y caractc
r44
rísticas útiles para producir neurocomputadoras porque va a permitir
el trabajo en paralelo con vectores binarios de alta dimensión, siendo
posible multiplicar un vector binario por una matriz binaria mediante
una sola operación. Una de las ventajas de esta memoria es que su
diseño permitiría reducirla hasta tamaños de nanoescala.
En la actualidad existe literatura que propone muchas versiones
de nanomemoria pero no todas las propuestas tienen la tecnología
para producirlas, y aquellas que sí la tienen no poseen la capacidad
de trabajo en paralelo con vectores de grandes dimensiones o, en todo
caso, el trabajo que pueden realizar es lento, comparable con el de los
discos duros. La ventaja de la memoria que proponemos es que tiene
una tecnología de implementación que consiste en la disminución del
equipo mecánico en forma de generaciones secuenciales [17]-[19]
que
fue desarrollada en los últimos años. Esta línea de investigación no
tiene hoy en día análogos cercanos en el mundo, lo que permite preveer
que tendrá un gran impacto en las tecnologías de la información y el
desarrollo de dispositivos nanomecánicos en un futuro. El objetivo a
largo plazo de estos estudios es la creación de nanoneurocomputadoras
(memoria nanomecánica) que pueden revoluciclnar muchas áreas de las
tecnologías de la información.
La idea de fabricar manipuladores nanomecánicos usando métodos
mecánicos convencionales fue propuesta por el premio Nóbel Richard
Feinmann en sus artículos
1201, Í21)
. El primer paso en la realización de
estas ideas se dio en un proyecto japonés
l22l
en el que se explica que
para manufacturar microobjetos y manipularlos es necesario emplear
un microequipo comparable a los microobjetos producidos. En dicho
proyecto se diseñó un microequipo de 30 hasta 150 mffi,
Y
no se crearon
nuevas generaciones con tamaños menores de las que se necesitan para
la nanomecánica.
Entre otros proyectos, podemos mencionar'los realizados en el
CCADET que se fundamentan en las ideas propuestas en 1996 en el
Instituto de Cibernética de la Academia de Ciencias de Ucrania en los
que se ofrece una ruta práctica para concretizar las ideas de Feinmann
usando generaciones secuenciales de microequipo en donde la siguiente
generación es producida mediante las generaciones previas
[17].
Los
primeros resultados de la investigación sobre la primera generación
fueron publicados en
1231.
Los fundamentos teóricos que muestran la
posibilidad de disminuir el tamaño del microequipo hasta dimensiones
nanométricas han sido publicados en el libro MEMS/NEMS Handbook:
APLr cAcr oNES 145
Techniques and Applications y en la revista internacional Precision
Engine eríng
1241, 1251.
Los di sposi ti vos nanométri cos pueden usarse para mej orar el
funcionamiento de las redes neuronales en sistemas de tratamiento de
información. En los últimos años desarrollamos un principio de creación
de una memoria nanomecánica, es decir, una memoria electromecáni-
ca que tiene la posibilidad de reducirse hasta tamaños nanométricos.
Continuando nuestro trabajo, se investigarán los procesos de nanoma-
nufactura y nanoensamble de esta memoria. Una propiedad específica
de esta memoria que puede servir como base de las redes neuronales
artificiales aumenta la velocidad de trabajo de las redes y también puede
ser útil como una aplicación de dispositivos nanomecánicos en tecno-
logías de información basadas en redes neuronales. En este sentido,
investigamos y desarrollamos diferentes tipos de redes neuronales que
pueden usarse en el reconocimiento de imágenes y en la presentación
distribuida de conocimientos, También estudiamos la aplicación de las
redes neuronales en sistemas de control para robots movibles. Estos
resultados pueden usarse en sistemas de control de nanorrobr)ts, cn
reconocimiento de nanoimágenes y en otras aplicaciones dc tccrrologíus
de información en nanomecánica.
Las redes neuronales pueden presentar informaciírn cn lirrrrlr rlist r i
buida cuando cada idea o relación entre conceptos se reprcscnlcn cor r rr r
ensamble de neuronas. Esta forma de presentación realiza la dc¡rcntle rrcirr
de los conceptos de contexto de manera sencilla y puede ofieccr nrrcv( )s
resultados en el terreno de la intelisencia artificial.
4.2. Dos rorolocí¡s
r¡e
pnooucclóN
DE oBJETos
A nuestro alrededor hay muchos objetos ensamblados con macrocor.n-
ponentes. En este apartado se propone una alternativa de producción
para objetos de diferentes formas y tamaños. Estos objetos pueden ser
armados con barras y nodos en estructuras tridimensionales
[6].
La
forma de los objetos se determina con las longitudes relativas de las
barras. Para cubrir todas las formas y todos los tamaños es suficientc
un número limitado de longitudes. Los nodos para conectar las barras
también podrían tener variedad de tamaños aunque no necesariamentc
tan grande. Para formar las superficies externas de los objetos es posiblc
usar placas triangulares de diferentes longitudes de lados de triángulo.
REDES NEURONALES
-
t46 REDES NEURONALES
Con estas diferentes piezas es posible ensamblar una enorme cantidad
de objetos de formas diferentes. Las ventajas de este método son el
relativamente pequeño número de piezas estándar, la disponibilidad de
una técnica única para producir estas piezas, la posibilidad de desarmar
objetos innecesarios y armar objetos nuevos con los mismos materiales.
Esta tecnología requiere un alto nivel de automatización.
4.2.1. Objetos ensamblados con
macrocomponentes
Consideremos, por ejemplo, el automóvil moderno, que está constitui-
do a partir de macrocomponentes (chasis, carrocería, motor, ruedas,
etcétera). Cuando el vehículo concluye su vida útil estos componentes
no pueden ser usados en automóviles nuevos por diferentes motivos.
Una razón importante es que la forma de los componentes cambia de
acuerdo con los cambios de diseño o las modas. Para los automóviles
nuevos es necesario manufacturar nuevos moldes y herramientas. Los
componentes antiguos se tiran a la basura. Esto ocurre no sólo en el
caso de los automóviles sino también en la gran mayoría de los objetos
que produce la tecnología moderna.
Actualmente casi todos los objetos se producen con una forma fija.
Este método de producción tiene muchas desventajas. Tal diversidad de
formas requiere muchos estándares, muchas herramientas y diferentes
tecnologías de producción de objetos. Por ejemplo, para la fabricación
de sillas de plástico se requieren moldes y máquinas de inyección.
Para hacer libreros o anaqueles de metal se requieren dispositivos para
producir hojas de metal, tornillos, tuercas, armadores, etcétera. Es
claro que este método de producción dificulta el reciclaje de la materia
prima. Además, es difícil usar el metal del anaquel para hacer sillas sin
recurrir a complejos procesos de metalurgia.
4. 2. 2. Obj etos ensantblados de microcomponente s
estándar (bamas y nodos)
En este apartado proponemos otro método de producción de objetos-de
diferentes formas y tamaños los cuales deberían armarse con barras y
nodos en estructuras tridimensionales. La forma del objeto se determina
con las longitudes relativas de las barras. Para cubrir todas las formas
y todos los tamaños sería suficiente un número limitado de longitudes
(por ejemplo, 100-200). Los nodos para conectar las barras también
APLI cACI ONns l , l 1
podrían tener una variedad no tan grande. Para formar las superficies
externas de los objetos es posible usar las placas de forma triangular
de diferentes longitudes de lados de triángulo. El número de diferentcs
triángulos debería ser más grande que el número de barras y noclos
pero también este número es limitado (podría ser de entre 2000 y 3000
triángulos). Con esta cantidad de piezas diferentes es posible armar una
enorme variedad de los objetos de diferentes formas. Entre las venta-
jas de este método están la cantidad relativamente pequeña de piezas
estándar requeridas, una tecnología única para producir estas piezas,
la posibilidad de desarmar objetos innecesarios y armar nuevos cnr-
pleando los mismos materiales. Esta tecnología permite hacer cambios
frecuentes sin consumir mucha materia prima. Esta tecnología necesita
un alto nivel de automatización.
En este trabajo discutimos varios problemas relacionados con tal
tecnología y describimos algunos prototipos de microequipo que
¡ruederr
ser usados para ella.
Diversos objetos pueden ser armados mediante barras y nodos t¿rl
como se muestra en l a Fi sura 4.l .
Figura 4.1. Estrucfura de barras.
Usando barras de diferentes longitudes es posible crear cualc¡uicr'
estructura tridimensional, mientras que las superf,cies externas clc di-
chas estructuras se pueden cubrir con placas triangulares de dif'erentcs
tamaños.
El tamaño de las barras y de las placas triangulares depende de las
dimensiones y formas del objeto. Es posible establecer varios tamaños
estándar que dependen de las aplicaciones. Por ejemplo, para crear ob-
jetos de ingeniería civil se emplean barras de las siguientes longitudes:
200 mm, 220mm,240 mm,260 mm, 280 mm y 300 mm. Para mueblcs
es posible usar barras de 20 mm, 22 mm,24 mm,26 mm,28 mm y 30
mm. Mientras que para juguetes
infantiles pueden emplearse barras de
2 mm, 2. 2mm, 2. 4mm, 2. 6mm, 2. 8 mm y 3. 0 mm.
-
148
REDES NEURoNALEs
Para conectar las barras es necesario crear nodos de 20 mm para inge_
niería civil y de hasta 0.2 mm para objetos pequeños como
¡uguetes.
En
las figuras 4.2 y 4.3 se muestra un ejemplo de nodos.
Los nodos y las barras de estas dimensiones se pueden producir con
micromáqui'as herramienta diseñadas en el ccADET.
para
automa-
tizar los procesos de ensamble es necesario usar micromanipuladores
con visión computacional que están en proceso de construcción en el
CCADET.
Figura 4.2. Ejemplos de nodos.
Las ventajas de esta tecnología son las siguientes:
1. La posibilidad de emplear varios elementos estándares para armar
una gran variedad de objetos de diferentes formas y tamaños.
2. Los elementos tendrían un costo bajo gracias a la producción
masiva.
3' La posibilidad de aumentar el nivel de automatización en procesos
de ensamble. Los elementos estándar van a permitir el uso de robots
para ensamblar objetos de ingeniería civil, muebles, etcétera, donde
ahora no se aplican.
API - I C^CI ONI Ts l . l ( )
4. La tecnología de barras permite conservar los recursos ambicnt¿rlcs
porque los objetos ya usados no se desechan una vez clesarnrados y
los materiales utilizados se emplean para annar otros objetos.
Figura 4.3. Un prototipo de nodo.
Algunos prototipos de esta tecnología elaborados en el CCAI)Ij'l'
se muestran en la Figura 4.4.
Para desarrollar la tecnología de barras es necesario contar con lus
siguientes condiciones :
l . Desarrol l ar l os pri nci pi os para crear l as uni oncs dc l as bl rrl rs
con los nodos.
2. Desarrol l ar l os pri nci pi os de aproxi maci ón cl e cl i l l ' re ¡rrcs l i rr nr:rs
geométricas con estructuras de barras.
3. Desarrol l ar l os al gori tmosy el sofi ware para o¡.rti rrri zl r l l rs l i rrrrr:r.,
geométricas con estructuras de barras.
4. Desarrollar los procesos de manufactura cle las barras y k rs rrr xlos
5. Desarrollar los procesos de ensamble de estructuras rncnciorr:ul:rs
Figura 4.4. Elementos de tecnología de barras.
- -
150 REDES NEURONALES
4.3. CoNc¡NTRADoRES SoLARES coN ESpEtos PLANoS
Se propone un concentrador solar de microfacetas de bajo costo consis-
tente en un gran número de pequeños espejos planos que se sitúan en
una superficie parabólica para aproximar un espejo parabólico grande.
Se pueden utilizar espejos planos comerciales de bajo costo para la fa-
bricación de este concentrador. El análisis geométrico del concentrador
muestra que tendrá un índice de concentración de algunos centenares
de soles. El dispositivo de soporte de los espejos planos se haría con
base en una tecnología de barras y nodos (véase el apartado 4.2.2 del
presente capítulo). Las primeras valoraciones económicas muestran
que el costo del concentrador sería de aproximadamente 55 dólares por
metro cuadrado de superficie del concentrador.
El interés en la energía solar y su aprovechamiento es hoy en día muy
grande
Q6l-1281.
Hay dos métodos principales que se utilizan para construir
plantas de energía solar. Uno de ellos utiliza transformadores fotovoltaicos
que convierten la luz del sol en corriente eléctrica; el otro calienta un líquido
o un gas que se utiliza en motores térmicos (las turbinas o los motores de
Stirling). En ambos tipos se utilizan concentradores solares para aument¿r la
eficacia de la transformación de la energía solar. Hay tres tipos principales
de concentradores: parabólicos con canales, parabólicos de tipo plato y de
torre. l,os primeros permiten alcanzar temperaturas hasta de 400
oC,
los con-
centradores de torre generan temperaturas de 600
oC
y los parabólicos de
plato logran 750 "C. Una temperatura más elevada permite obtener mayor
eficacia. En este capítulo consideraremos solamente los concentradores
parabólicos de plato. El problema principal de la construcción de concen-
tradores parabólicos es el alto costo de su fabricación. Hay proyectos que
incluyen una célula de energía basada en un plato parabólico de 87.7 m2
que cuesta 150, 000 dólares. Los autores de esos proyectos esperan que
una versión industrial de los mismos cueste 50, 000 dólares y compita
con las tecnologías convencionales de combustible [29].
El costo de 1m2
(aproximadamente 500 dólares) sigue siendo muy alto. La razón principal
es que estos reflectores parabólicos están hechos de espejos especiales. El
cristal de los espejos tiene un grueso de entre 0.7 y l.0 milímetros
l29l.Y
se requiere para fabricar dicho cristal una tecnología especial.
Cabe aclarar que no es necesario hacer facetas flexibles. Si el tamaño
de la faceta es suficientemente pequeño es posible hacerlas con espejos
planos convencionales. Es posible utilizar para este propósito los espe-
jos comerciales de bajo costo y obtener un índice de concentración de
APLtcAcroNr,s 1.5 I
algunos centenares de soles colocando algunos millares de facetas planas
en un concentrador. El costo de tales concentradores puede ser nluy
bajo si se automatiza completamente la producción de sus componentes
y procesos de ensamble.
4.3. l. Concentrador solar
Vamos a analizar un concentrador parabólico de plato (Figura 4.5)
que contiene el receptor colocado cerca del punto focal F.
t _l
I r*--t
{4\{-
lR"'"pt"4
-\:r----.--rl
IUoncenrra4torl
Figura 4.5. Concentrador parabólico de plato.
El diseño del concentrador parabólico de plato
se presenta en la Figura 4.6.
Fig' ra 4.6. Estructura de concentrador parabólico de plato con microes¡rej.s,
Esta estructura consiste en dos capas de células triangulares. Cada
célula se compone de tres barras y tres nodos. Las células de la capa
inferior (Figura 4.6) son más grandes que las células de la capa superior.
Ambas capas están conectadas con las barras múltiples que tienen Ia
misma longitud. una selección apropiada de los tamaños de las células
superiores e inferiores permite obtener la forma parabólica de la capa
superior. Cada célula de la capa superior se cubre con un espejo plancr
\ 52 REDEs NEURoNALES
de forma triangular. De este modo obtenemos un concentrador de plato
de forma parabólica con una aproximación con facetas planas.
El análisis muestra que este método permite obtener un factor de
concentraci ón de más de 1000 sol es
[31], [32].
4. 3.2. Fabricación y montaj e
del concentrador solar con espeios planos
Los espejos planos comerciales son muy baratos y es relativamente fácil
cortarl os en tri ángul os pequeños.
Para fabricar y ensamblar el soporte proponentos utilizar los métodos
de tecnología de microequipo descritos en
[17]
y
I23).
En la Figura 4.7 se muestra un ejemplo de sopofe para concentrador
solar.
Figura 4.7. Soporte pata concentrador solar hecho de barras y nodos.
Durante la decada pasada realizamos investigaciones relacionados con
esta tecnología que se basa en generaciones secuenciales de equipo micro-
mecánico
U7l, 1231.
La idea es obtener herramientas micromecánicas y
dispositivos de ensanrble comparables con los tamaños de los componentes
que se producirán. En nuestro caso los tamaños de las barras tienen un orden
de 50-70 milímetros. Estas barras se podrían producir, por ejemplo, con tu-
bos de acero que tengan una longitud de 50-70 milímetros, diámetros de 34
milímetros y un espesor de pared cercano a los 0.2 milímetros. Para hacer
estos tubos de hoja de acero es posible utilizar máquinas henamientas que
tienen tamaños totales de 100-200 milímetros. Las dimensiones de los nodos
que conectan estas piezas tendran tamaños de 3-5 milímetros. Para producir
tales nodos es posible utilizar herramientas micromecánicas con un tamaño
total de 10-20 milimetros. Se ha demostrado que tales henamientas ofrecen
/ r Pt . l ( A( t oNl : S | 5 I
buenas tolerancias sin usar tecnología sú¡rer exacta
[24]. Tales her^rrric.lr¡s
micromecánicas exigen un espacio pequeño, tienen consumo cle energía llu
i.
y se pueden emplazar en fábricas de escritorio que realizan el prcrcc,-s. t,riirt
de fabricación paralela
[17].
Este proceso permiie una producción quc ricrrc
costos comparables a los de ios materiales
[23].
El montaje del sopor-te se hará usando micromanipuladores
con co.-
trol de visión por computadora
t2l, t4l, t5l, t321. Estamos elabor.¿rntlo
actualmente los dispositivos de microensamble con sistemas de visión rxrr
computadora. Para este propósito hemos diseñado varios algoritmos
¡rrr..
el reconocimiento de imágenes basados en redes neuronales. El clasificacl.r
neuronal LIRA fue probario en una tarea cle microensamble
[2j
para cl
reconocimiento de la fonna de microtornillos
[4.]
y para diversas piucbas;
por ejemplo, el reconocimiento de rexturas
[5], de cifras escritas
[33],
et,
cétera. Otro sistema, el clasificador neuronal PCNC
[34], fue p.otrd,,
",, el reconocimiento de la fbrma de tornillos, de texturas, de caras huma.us
y de cifras escritas. Todas las pruebas mostraron buenos resultaclos. Nos
proponernos
aplicar este control adaptativo basado en los sistemas cle reco_
nocimiento en los dispositivos de microensamble, incluyendo el clispositiv.
de ensamble de soporte para los concentraclores solares.
En la Figura 4.8 se presenta un prototipo de concentraclor solar con
espejos planos.
Figura 4.8. Prototipo de concentrador solar con espejos planos
R¡]DES NEURONALES
APLICACIONES I \"
la tecnología micromecánica con sistemas dc visión por computadorrr
que están siendo desarrollados por los autores del presente libro.
Referencias
1. Amosov, N.M., T.N. Bai dyk, A.D. Gol tsev, A.M. Kasatki n, L.M' Kasatki
na, E. Kussul, D.A. Rachkov ski, Neurocomptúadoras y robots inteligenlcs.
Naukova Dumka, Ki ev, 1991,
PP.272.
2. Bai dyk, T., E. Kussul , O. Makeyev, A. Cabal l ero, L. Rui z' G' Carrera, G'
Velasco, "Flat Image Recognition in the Process of Microdevice Assembly",
Pattern Recognition Letters, vol. 25, 2004, pp. 107-118.
3. Bai dyk, T., E. Kussul , "Neural Network Based Vi si on System for Mi cro
Workpieces Manufacturing", WSEAS Transactions on Systems, núm' 2'
vol . 3, 2004, pp. 483-488.
4. Kussul, E., T. Baidyk, "Improved Method of Handwritten Digit Recognition
Testecl on MNIST Database", Image and Vision Computing, vol' 22112'
2004, pp. 97l - 981.
5. Baidyk, T., E. Kussul, O. Makeyev, "Texture Recognition with Randonr
Subspace Neural Classifi et" , WSEAS Transactions on Circuits and Systems ,
núm. 4, vol . 4, abri l 2005, pp' 319-325.
6. Dyabi n, M.1., N.G. Karpi nski j , E' Kussul , A.I. Pol ovyanyuk, V.G' Red' ko'
V.A. Serzhechenko, O.V. Urgant, "Design of Neurocomputer with Binary
Memory Array", Rattiophysics and Quanfum
Electonics (Springer Verlag),
vol. 37, núm. 9, septiembre 1994,pp.694-698.
7. Kussul , E., T.N. Bai dyk, V.V. Lukovi ch, D.A' Rachkovski j , "Adapti vc
Neural Network Classifier with Multifloat Input Coding" , en Neural Nct
works and Their Industrial Applicatiotrs, Nimes' EC2-publishing' 1993'
pp. 2Q9- 2r 6.
8. Kussul . E.. V.D. Fomenko, "Cél ul a de memori a el ectro-quími ca", Uni órt
Sovi éti ca, 1974.
9. Kussul , 8.M., A.K. Mal etski j , V.D. Fomenko, "Método de guardar i nfor-
mación en célula electro-química", Unión Soviética, 1978'
10. Kussul, E., E.A. Babinskaya, V.D. Fomenko, "Dispositivo electro-químico
para guardar información", Unión Soviética, 1979.
1 I . Kussul, E. ,
"Dispositivo electro-químico para guardar información", Unión
Sovi éti ca, 1986.
12. Amosov, N.M., E. Kussul , D.A. Rachkovski j , "Modul o de red neuronal ",
Uni ón Sovi éti ca, 1991.
13. Kussul, E., D.A. Rachkovskij, T.N. Baidyk, "Associative-projective Neural
Networks: Architecture, Implementation, Applications , en Neural Netyvorks
& Their Apptications, Nimes, EC2 Publishing, 1991, pp.463-416'
154
4.3.3. Valoraciones aproximadas del costo
del concentrador solar
Primero vamos a estimar el costo de los materiales para fabricar un
concentrador solar con 15,000 espejos' El costo de los espejos comer-
ciales es de menos de 20 dólares por metro cuadrado. si el concentrador
ii"n. * área A,
:
16.24 metros cuadrados el costo de los espejos será
de 325 dólares.
Para estimar el costo del material para una barra calcularemos el
peso de esta barra, que sería
Wo
=
n xdo xl o xt b x
P*
( 4' 1)
donde d, es el difunetro de la bana, /, es la longitud de la bana' /, es el espesor
de las paredes de la barra
Y P'
es ia densidact del acero' Suponemos d,
:
4.10-3 m, la:1 'lÜ' m, tn:2'104 m, pr,
=7
800 kg/m1' Con estos valores
tendremos íurpeso de una"bana de 1.372i1O3 kilogramos' Este concentrador
solar contiene 93,786barras. El peso de todas las banas será128.7 kilogra-
mos. Para estimar el peso de los nodos que conectan es necesario conocer su
diseño. Estimaremos el peso de nodos que conectan como aproximadamente
0.3del pesodel asbarras.El pesodel osnodosqueconectanseráentonces
de 42.9 kilogramos y el peso total del soporte será 171'6 kilogramos' El
costo de 0.2 milímetro oó tro¡a de acero es aproximadarnente
0.7 dólares
porl ki l ogramo.El costodel osmateri al esparasoporteserá120dól ares'
Así el costo total de los materiales será de 444
'8
dólares'
Aquíestimaremoselcostodelamicrofabricaciónyeldelmicroensamble
como;proximadamente
iguales al costo de los materiales. En este caso
el costo del concentrador solar se puede estimar en 889 dólares. EI costo
de cada metro cuadrado de superficie solar del concentrador será de 55
dólares. Como puede verse' esto representa un costo muy inferior al de
los concentradores solares parabólicos existentes'
En resumen, se proponé un concentrador solar compuesto de una
gran cantidad Oe espi;oi planos pequeños unidos a un plato parabólico'
Él fu"to, calculado de la óoncentración
puede ser de más de 1000 soles'
Unaval oraci ónaproxi madadel cost osol ardel concent radoresde55
dól arespormet rocuadrado. Est econcent radorsol arpuedere' duci r
sustanci;hente
el costo de las plantas de energía solar y permitirá el
uso de estos concentradores
en los sistemas solares para el servicio
doméstico individual de energía' El soporte se puede hacer empleando
156 RLDES NEURoNAT. ES
14. Kussul , E., T.N. Baydyk, V.V. Lukovi ch, D.A. Rachkovski j , "Cl asi fi cador
neuronal con codificación dist¡ibuida"
, Neurocomputadora, núm. 3-4,
1994, pp. 13-24.
15. Rachkovski j , D.A., E.M. Kussul , "Bui l di ng Large-scal e Hi erarchi cal
Models of the World with Binary Sparse Distributed Representations, BBS
publ i cati on, http://cogpri nts.soton.ac.uk/documenrs/di sk}l 00l 00l 12l B7 I
cog00001287-00/Bbsapnnl .pdf ., 2001, pp. 80.
16. Kussul , E., G. Ascani o, T. Bai dyk, L. Rui z-Huerta, A. Cabal l ero-Rui z, P.
López-Meyer, B. Patiño, "Desarrollo de micromotores de alta potencia",
Congreso SOMI XX, León, Guanajuato, octubre 24-28, 2005
,
pp. 12.
17. Kussul , 8., T.N. Baydyk, D.A. Rachkovski j , S.A. Tal ayev, "Mi crome-
chanical Engineering: A Basis for the Low-cost Manufacturing of Mechani-
cal Micro Devices Using Microequipment", Journal of Micromechanics
and Microengineering,6, vol. 6, 1996, pp. 410-425
18. Kussul , E., T.N. Baydyk, D.A. Rachkovski j , S.A. Tal ayev, "Método de
producción de productos micromecánicos", Ucrania, i998.
19. Kussul , E., T.N. Baydyk, D.A. Rachkovski j , S.A. Tal ayev, "Método de
manufactura de di sposi ti vos mi cromecáni cos", Rusi a, 1997.
20, Feynman, R., "There is Plenty of Room at the Bottorn"
, en Micromechan-
ics and MEMS. Classic and Seminal Papers to 1990, edítado por W.S.,
Tri mmer, IEEE Press,1996, pp. 3-9.
21. Feynman, "lnfinitesimal Machinery", en Micromechanics and MEMS.
Classic and Seminal Papers to 1990, editado por W.S., Trimmer, IEEE
Press, 1996, pp. 10-20.
22. Ooyarna, N., S. Kokaji, M. Tanaka, N. Mishima, H. Maekawa, K. Kaneko, T.
Tanikawa, K. Ashida, "Desktop Machining Microfactory", 2ru1 Intemational
Worl<shop on Microfactoríes, Suiza, octr¡bre 9-10, 2000, pp. 13-17.
23. Kussul, E., T. Baidyk, L. Ruiz-Huerta, A. Caballero, G. Velasco, L: Kasatkina,
"Developrnent of Micromachine Tool Prototypes for Microfactories"
, Joumal of
Micromechrnics rutd Microengineering, 12, 2ü2, pp. 795-812.
24. Kussul , E., T. Bai dyk, L. Rui z-Huerta, A. Cabal l ero-Rui z, G. Vel asco,
"Scaling Down of Microequipment Parameters"
, Precision Engineering,
vol . 30,2006, pp. 211-222.
25. Kussul, E., T. Baidyk, L. Ruiz-Huerta, A. Caballero-Ruiz, G. Velasco, O.
Makeyev, "Techniques in the Development of Micromachine Tool Prototypes
and Their Applications in Microfactories", en MEMS/NEMS Hantlbook:
Techniques and Applications, editado por T. Leondes, Cornelius, Springer,
vol . 3, 2006, pp. l - 61.
26. Lopez, Ch., y K. Stone, "Performance of the Southern California Edison
Company Stirling Dish", Contractor Report, SAND93-7098 (unlimited
release), 1993. http://www.osti.gov/bridge/servlets/purl/101 10545-9ZA1vs/
webviewable/ 10 I 10545.pdf
\ r' r ri . \ ( I oNEs L5' 1
27. Mast ers, G. M. , "Renewabl e and Ef f i ci ent El ect ri c I \ rr. vcl Sysl ct t t s"
, Wi l ey'
IEEE Press,2004, pp. 680.
28. Farret , F. A. , M. G. Si moes, "I nt egrat i onof Al t ernat i ve Sot ¡¡ct ' s ol l i nergy",
Wiley-IEEE Press, 2Q06, pp. 504.
29. Fraser, J. , "The Energy Bl og. The Energy Revol ut i on l t rt s l rcgt rt t and wi l l
Change your Lifestyle" ,
About Dish/Engine Concentratitr.q Sttlttr Potver,
agosto 16, 2005, 7 . hnp://thefraserdomain.typepad.coni/ctrcrsy/2005/08/
about_dishengin.html
30. Kussul, E., T. Baidyk, O. Makeyev, F. Lara-Rosano, J. M. Sanigcr, N. Bruce,
"Development of Micro Mirror Solar Concentratof" ,The
2-ttd IASI'ÍL:/WSEAS
International Conference on Energy and Environmenf (EE'07), Portoroz,
Portotose, Slovenia, mayo 15-17,2007, pp. 294-299.
31. Kussul E. , Bai dyk T. , Makeyev O. , Lara-Rosano F. , Sani ger J. M. , Bmce
N., "Flat Facet Parabolic Solar Concentrator with Support Cell for One and
More Mirrors", WSEAS Transactions on Power Systems, núm. 8, vol.3,
agosto 2008, flSSN
1790-5060), pp. 5' 77-586.
32. Kussul E. , Bai dyk T. , Lara F. , Sani ger J. , Bruce N. , Est rada C. , "Mi cro
Facet Solar Concentrador" , Intenntional Journal of Sustainable Energy,
2008, vol . 27, núm. 2, pp. 61- 71.
33. Kussul, E., T. Baidyk, "LIRA Neural Classifier for Handwritten Digit
Recognition and Visual Controlled Microassembly" ,
Neurocomputing,
2006 , 69 ( 1 6- 1 8) ,
pp . 2227 -2235 .
34. Kussul , E., T. Bai dyk, D. Wunsch, O. Makeyev, A. Martín, "Permutati on
Coding Technique for Image Recognition Systems", IEEE Transactions on
Neural Nenvorks, 2006, 17(6), pp. 1566-1579.

Sign up to vote on this title
UsefulNot useful