Inteligencia Artificial Una Nueva Sintesis Nils J. Nilsson

--
CONSULTORESEDITORIALES
READEINFORMTICAy COMPUTACIN
AntonioVaqueroSnchez
CatedrticodeLenguajeySistemasInfonnticos
EscuelaSuperiordeInformtica
UniversidadComplutensedeMadrid
ESPAA
GerardoQuirozVieyra
IngenierodeComunicacionesyElectrnica
porlaESIMEdelInstitutoPolitcnicoNacional
ProfesordelaUniversidadAutnomaMetropolitana
UnidadXochimilco
MXICO
OOf
NIL
r-
l n L..
INTELIGENCIA
ARTIFICIAL
Unanuevasntesis
-\
NILSJ. NILSSON
- StanfordUniversity
1
1
i
GHANA[)k \ I "/2
':>:> .::::.
\ ._,---,- 1
N,Q Documento 8(3- S13
,.(,
N,Q Copia-
Traduccin
ROQUEMARNMORALES
JOSTOMSPALMAMNDEZ
ENRIQUEPANIAGUAARIS
DepartamentodeInformtica,InteligenciaArtificialyElectrnica
UniversidaddeMurcia
Revisintcnica
SEBASTINDORMIDOBENCOMO
DepartamentodeInfonnticayAutomtica
UniversidadNacionaldeEducacinaDistancia
MADRIDBUENOSAIRES CARACAS GUATEMALA USBOA MXICO

NUEVAYORK PANAM. SANJUAN SANTAFDEBOGOT. SANTIAGO SAOPAULO
AUCKLAND HAMBURGO LONDRES MILN MONTREAL NUEVADELHI PARs
SANFRANCISCO SIDNEY SINGAPUR STo LOUIS TOKIO TORONTO
Contenido
Prefacio xvii
1. Introduccin 1
1.1. QueslalA? .................................................... 1
1.2. AproximacionesalaInteligenciaArtificial. ............................. 5
1.3. BrevehistoriadelalA.............................................. 7
1.4. Plandellibro ..................................................... 10
1.5. Lecturasy consideracionesadicionales................................. 12
Ejercicios............................................................ 15
l. SISTEMASREACTIVOS............................................. 17
2. Agentesdeestmulo-respuesta. ......................................... 19
2.1. Percepciny accin ................................................ 19
2.1.1. Percepcin ........................................... ..... 22
2.1.2. Accin ..................................................... 22
2.1.3. lgebrabooleana ............................................ 23
2.1.4. Clasesy formasdelasfuncionesbooleanas........................ 24
2.2. Representacineimplementacindelasfunciones paralaseleccindeacciones 24
2.2.1. Sistemasdeproduccin ....................................... 25
2.2.2. Redes ..................................................... 26
2.2.3. Laarquitecturadesubsuncin .................................. 29
2.3. Lecturasyconsideracionesadicionales. ................................ 30
Ejercicios............................................................ 31
vii
ix
vi Contenido
3. Redesneuronales ..................................................... 33
3.1. Introduccin...................................................... 33
3.2. EntrenamientodeunaULU.......................................... 34
3.2.1. InterpretacingeomtricadelfuncionamientodeunaULU ........... 34
3.2.2. Ladimensinn +1 '" ........................................ 35
3.2.3. Mtodosdelgradientedescendente .............................. 35
3.2.4. ElprocedimientodeWidrow-Hoff............................... 37
3.2.5. Elprocedimientodeltageneralizado ............................. 37
3.2.6. Elprocedimientodecorreccindelerror .......................... 39
3.3. Redesneuronales .................................................. 40
3.3.1. Motivacin ................................................. 40
3.3.2. Notacin ................................................... 41
3.3.3. Elmtododelaretropropagacin ................................ 42
3.3.4. Clculode] cambiodelospesosenlaltimacapa................... 43
3.3.5. Clculodelcambiodelospesosenlascapasintermedias ............. 44
3.4. Generalizacin,precisinysobreajuste ................................ 46
3.5. Lecturasyconsideracionesadicionales ................................. 50
Ejercicios................................................. .......... 51
4. Sistemasevolutivos ................................................... 53
4.1. Computacinevolutiva ............................................. 53
4.2. Programacingentica ............................................. 54
4.2.1. RepresentacindelosprogramasenPG .......................... 54
4.2.2. E] procesoPG ............................................... 57
4.2.3. Desarrollodeunrobotseguidordeparedes ........................ 58
4.3. Lecturasyconsideracionesadicionales ................................. 62
Ejercicios............................................................ 62
5. Sistemasconestados .................................................. 63
5.1. Representacindelentornomediantevectoresdecaractersticas ............. 63
5.2. RedesdeElman ................................................... 65
5.3. Representacionesicnicas ........................................... 66
5.4. Sistemasbasadosenpizarras. ..................................... .. 69
5.5. Lecturasyconsideracionesadicionales................................. 71
Ejercicios............................................................ 71
6. Visinartificial ...................................................... 75
6.1. Introduccin...................................................... 75
6.2. Conduciendounautomvil .......................................... 76
6.3. Lasdosetapasdelavisinporcomputador ............................. 78
6.4. Procesamientodeimgenes.......................................... 80
6.4.1. Promediado ................................................. 80
6.4.2. Deteccindebordes .......................................... 83
Contenido
6.4.3. Unoperadorparaelpromediadoyladeteccindebordes.............
85
6.4.4. Bsquedaderegiones .........................................
86
6.4.5. Otrosatributosdeimagendistintosalaintensidad ..................
89
6.5. Anlisisdeescenas ................................................
91
6.5.1. Interpretacindelneasycurvasenunaimagen ....................
92
6.5.2. Visinbasadaenmodelos ......................................
94
6.6. Visinestereoscpicaeinformacinsobrelaintensidad ...................
96
6.7. Lecturasyconsideracionesadicionales .................................
98
99
Ejercicios............................................................
II. BSQUEDAENESPACIOSDEESTADO ...............................
103
7. Agentesqueplanifican
.. ~ .." .. . .. .. .. .. ....... .. ...." .. .. . ..... .. .. .. .. ......" ..... " .... 105
7.1. Memoriaoclculo,.................................................
105
7.2. Grafosdeestados ..................................................
106
7.3. Bsquedaenestadosexplcitos .......................................
109
7.4. Estadosbasadosencaractersticas ....................................
110
7.5. Notacindegrafos.................................................
111
112
Ejercicios............................................................
112
()8.
Bsquedaa ciegas ................... ................................
115
8.1. Especificacindelespaciodebsqueda ................................
115
8.2. Elementodeungrafodeestadosimplcito ..............................
116
8.3. Bsquedaprimeroenanchura ........................................
117
8.4. Bsquedaprimeroenprofundidadobsquedaconvueltaatrs ..............
118
8.5. Descensoiterativo .................................................
120
122
Ejercicios............................................................
122
~ 't'
\.:)9. BsquedaheurlslC8
.. ".... ".......... "" ......" 5 ..... " ..........,, ........." 125
9.1. Funcionesdeevaluacin ............................................ ]25
9.2. Algoritmogenricodebsquedaengrafos ..............................
127
9.2.1. AlgoritmoA* ....................'<'
128
9.2.2. AdmisibilidaddelalgoritmoA* .................................
131
9.2.3. Lacondicindeconsistenciaomonotoma ........................
134
9.2.4. DescensoiterativoA*........................................ .
138
9.2.5. Bsquedaprimeroelmejorrecursiva ...........................
139
9.3. Funcionesheursticasyeficienciadelprocesodebsqueda.................
140
143
Ejercicios............................................................ ]44
x
Contenido
10. Planificacin,actuacinyaprendizaje .................................. 147
10.1. Elciclopercibir/planificar/actuar ................................... 147
10.2. Bsquedaaproximada ............................................ 149
10.2.1. Bsquedaorientadaasubobjetivos ........................... 149
10.2.2. Bsquedajerrquica ....................................... 150
10.2.3. Bsquedaconhorizonte .................................... 152
10.2.4. Ciclos .................................................. 153
10.2.5. Construccindeprocedimientosreactivos ...................... 153
10.3. Aprendizajedefuncionesheursticas ................................ 155
10.3.1. Grafosexplcitos .......................................... 155
10.3.2. Grafosimplcitos ......................................... 156
10.4. Recompensasenvezdeobjetivos ................................... 158
10.5. Lecturasyconsideracionesadicionales .............................. 160
Ejercicios........................................................... 160
11. Mtodosalternativosdebsquedayotrasaplicaciones .................... 163
11.1. Problemasdeasignacin .......................................... 163
11.2. Mtodosconstructivos ........................................... 165
11.3. Reparacinheurstica ............................................ 169
11.4. Optimizacindefunciones ........................................ 171
Ejercicios........................................................... 174
12. Bsquedaenproblemasdejuegos ...................................... 175
12.1. Juegosdedosjugadores .......................................... 175
12.2. Elprocedimientominimax ........................................ 177
12.3. Elprocedimientoalfa-beta ........................................ 181
12.4. Eficienciadelprocedimientoalfa-beta............................... 186
12.5. Otrascuestionesimportantes ...................................... 187
12.6. Juegosdeazar.................................................. 187
12.7. Aprendizajedefuncionesdeevaluacin.............................. 189
Ejercicios. .......................................................... 191
III.REPRESENTACINDELCONOCIMIENTOYRAZONAMIENTO......... 193
13. Elclculoproporcional............................................... 195
13.1. Imponiendorestriccionesalosvaloresdelascaractersticas .............. 195
13.2. Ellenguaje..................................................... 197
13.3. Lasreglasdeinferencia. .......................................... 198
13.4. Definicindedemostracin ....................................... 198
Contenido xi
13.5. Lasemntica ................................................... 199
13.5.1. Interpretaciones .......................................... 199
13.5.2. Latabladeverdadproposicional ............................. 200
13.5.3. Satisfacibilidadymodelos .................................. 201
13.5.4. Validez ................................................. 202
13.5.5. Equivalencia ............................................. 202
13.5.6. Consecuencialgica ....................................... 202
13.6. Solidezycompletitud ............................................ 203
13.7. ElproblemadeSATP ............................................ 204
13.8. Otrascuestionesimportantes ...................................... 205
13.8.1. Distincinentreloslenguajes ................................ 205
13.8.2. Metateoremas ............................................ 205
13.8.3. Leyesasociativas ......................................... 205
13.8.4. Leyesdistributivas ........................................ 206
Ejercicios ........................................................... 206
14. Laresolucinenelclculoproporcional................................. 207
14.1. Unanuevaregladeinferencia: laresolucin .......................... 207
14.1.1. Lasclusulascomoibfs .................................... 207
14.1.2. Laresolucinaplicadaalasclusulas ......................... 207
14.1.3. Lacorreccindelaresolucin............................... 208
14.2. Conversindeibfsaconjuncionesdeclusulas........................ 208
14.3. Refutacinmedianteresolucin .................................... 209
14.4. Estrategiasdebsquedaenrefutacinmedianteresolucin. .............. 211
.14.4.1. Estrategiasdeordenacin................................... 211
14.4.2. Estrategiasderefinamiento ................................. 212
14.5. ClusulasdeHorn ............................................... 212
Ejercicios. .......................................................... 213
15. Elclculodepredicados .............................................. 215
15.1. Introduccin 215
15.2. Ellenguajeysusintaxis .......................................... 216
15.3. Lasemntica ................................................... 217
15.3.1. Mundos................................................. 217
15.3.2. Interpretaciones .......................................... 218
15.3.3. Modelosyotrosconceptosrelacionados ....................... 219
15.3.4. Conocimiento............................................ 219
15.4. Cuantificacin.................................................. 220
15.5. Semnticadeloscuantificadores ................................... 222
15.5.1. Cuantificadoresuniversales................................. 222
15.5.2. Cuantificadoresexistenciales ................................ 222
15.5.3. Equivalenciastiles ....................................... 222
15.5.4. Reglasdeinferencia....................................... 222
xiii xii Contenido
15.6. Elclculodepredicadoscomounlenguajederepresentacindelconocimiento. 223
15.6.1. Conceptualizaciones ....................................... 223
15.6.2. Ejemplos................................................ 223
Ejercicios ........................................................... 225
16. Laresolucinenelclculodepredicados ................................ 227
16.1. Unificacin .................................................... 227
16.2. Resolucinenelclculodepredicados ............... .............. 230
16.3. Completitudysolidez............................................ 230
16.4. Conversindetbfsarbitrariasenclusulas............................ 231
16.5. Utilizacindelaresolucinparademostrarteoremas ................... 233
16.6. Obtencinderespuestas .............. ........................... 234
16.7. Elpredicadodeigualdad.......................................... 235
Ejercicios. .......................................................... 238
17. Sistemasbasadosenconocimiento...................................... 241
17.1. El enfrentamientoconel mundo .................................... 241
17.2. RazonamientoconclusulasdeRom ................................ 242
17.3. Mantenimientodebasesdeconocimientodinmicas.................... 247
17.4. Sistemasexpertosbasadosenreglas ................................. 251
17.5. Aprendizajedereglas ............................................ 255
17.5.1. Aprendizajedereglasdeclculoproposicional.................. 256
17.5.2. Aprendizajedereglasenlgicadepredicados................... 260
17.5.3. Generalizacinbasadaenexplicaciones ....................... 264
Ejercicios ........................................................... 266
18. Representacindelsentidocomn ..................................... 269
18.1. Elmundodelsentidocomn....................................... 269
18.1.1. Queselconocimientodelsentidocomn?.................... 269
18.1.2. Problemasdelarepresentacindelconocimientodelsentidocomn. 271
18.1.3. Laimportanciadelconocimientodelsentidocomn.............. 272
18.1.4. reasdeinvestigacin ..................................... 272
18.2. Eltiempo...................................................... 273
18.3. Representacindelconocimientomedianteredes ...................... 275
18.3.1. Conocimientotaxonmico.................................. 275
18.3.2. Lasredessemnticas ...................................... 276
18.3.3. Razonamientonomontonoenredessemnticas ................ 277
18.3.4. Guiones................................................. 279
Ejercicios ........................................................... 281
19. Razonamientoconincertidumbre ......................... ........... 285
19.1. Repasoalateoradeprobabilidades ................................. 285
19.1.1. Conceptosfundamentales ................................... 285
19.1.2. Probabilidadescondicionales ................................ 288
19.2. Inferenciaprobabilstica .......................................... 290
19.2.1. Unmtodogeneral.............................. ......... 290
19.2.2. Independenciacondicional.................................. 292
19.3. Redesbayesianas ........................................ ....... 293
19.4. Patronesdeinferenciaenredesbayesianas ............................ 295
19.5. Evidenciaconincertidumbre ...................................... 296
19.6. Separacin-d ................................................... 297
19.7. Inferenciaprobabilsticaenpolirboles .............................. 298
19.7.l. Apoyocausal ............................................ 299
19.7.2. Apoyoevidencial ......................................... 300
19.7.3. Apoyoscausalyevidencial ................................. 302
19.7.4. Unejemplonumrico...................................... 302
Ejercicios........................................................... 305
20. Aprendizajey actuacinconredesbayesianas............................ 309
20.1. Aprendizajederedesbayesianas................... ................ 309
20.1.1. Unaestructuraderedconocida ............... .............. 309
20.1.2. Aprendizajedelaestructuradelared ......................... 312
20.2. Inferenciaprobabilsticayactuacin ................. .............. 316
20.2.1. Elescenariogenrico...................................... 316
20.2.2. Unejemploextendido......................... ............ 317
20.2.3. Generalizacindelejemplo ................................. 321
Ejercicios. ................................................ ......... 322
IV. MTODOSDEPLANIFICACINBASADOSENLGICA............... 325
21. Elclculodesituaciones .............................................. 327
21.1. Razonamientoacercadeestadosy situaciones......................... 327
21.2. Algunasdificultades ............................................. 330
21.2.1. Axiomasdemarco ........................................ 330
21.2.2. Cualificaciones ..........:................................ 332
21.2.3. Ramificaciones ........................................... 332
21.3. Generacindeplanes ............................................ 333
Ejercicios........................................................... 334
xiv Contenido
22. Planificacin 337
22.1. SistemasdeplanificacinbasadosenSTRIPS ........................ . 337
22.1.1. Descripcindeestadosyobjetivos............................ 337
22.1.2. Mtodosdebsquedahaciadelante ........................... 338
22.1.3. STRIPS recursivo ......................................... 341
22.1.4. Planesconcondicionesentiempodeejecucin ....;............. 343
22.1.5. LaanomaladeSussman ................................... 344
22.1.6. Mtodosdebsquedahaciaatrs ............................. 344
22.2. Espaciodeplanesyplanificacinparcialmenteordenada ................ 348
22.3. Planificacinjerrquica........................................... 354
22.3.1. ABSTRIPS ............................................. . 354
22.3.2. Combinacindelaplanificacinjerrquicaylaplanificacinparcial-
menteordenada........................................... 356
22.4. Aprendizajedeplanes ............................................ 357
Ejercicios........................................................'... 361
v. COMUNICACINEINTEGRACIN .................................. 365
23. Mltiplesagentes .................................................... 367
23.1. Interaccinentreagentes.......................................... 367
23.2. Modelosdeotrosagentes ......................................... 368
23.2.1. Tiposdemodelos ......................................... 368
23.2.2. Estrategiasdesimulacin................................... 369
23.2.3. Basesdedatos simuladas................................... 369
23.2.4. Laactitudintencional...................................... 370
23.3. Unalgicamodalpararepresentarelconocimiento ..................... 371
23.3.1. Operadoresmodales....................................... 371
23.3.2. Axiomasdelconocimiento.................................. 372
23.3.3. Razonamientoacercadelconocimientodeotrosagentes .......... 374
23.3.4. Prediccindelasaccionesdeotrosagentes..................... 375
Ejercicios. .......................................................... 376
24. Comunicacinentreagentes .......................................... 379
24.1. Actosdehabla.................................................. 379
24.1.1. Planificacindelosactosdehabla............................ 380
24.1.2. Implementacindelosactosdehabla ......................... 381
24.2. Comprensindelascadenasdesmbolosdeunlenguaje ................. 383
24.2.1. Gramticasconestructuradefrase. ........................... 383
24.2.2. Anlisissemntico ........................................ 386
24.2.3. Extensindelagramtica. .................................. 390
24.3. Comunicacineficiente........................................... 392
24.3.1. Utilizacindelcontexto.................................... 392
24.3.2. Utilizacindeconocimientopararesolverambigedades. ......... 393
Contenido xv
24.4. Procesamientodellenguajenatural. ................................. 394
24.5. Lecturasdeconsideracionesadicionales.............................. 397
Ejercicios ........................................................... 397
25. Arquitecturasdeagente 399
25.1. Arquitecturadetresniveles........................................ 400
25.2. Evaluacinyseleccindeobjetivos ................................. 402
25.3. Arquitecturadetresmdulos 403
25.4. Introspeccinyevolucin ......................................... 404
Ejercicios ........................................................... 406
Bibliografa 407
ndice ................................................................. 433
Prefacio
ste es un libro de texto de nivel introductorio en el que estudiaremos, desde una perspectiva
novedosa, los diversos temas encuadrados bajo el trmino inteligencia artificial (lA). A lo largo
de los sucesivos captulos, iremos considerando una progresin de sistemas de IA o agentes,
cada uno ligeramente ms complejo que su predecesor. Comenzaremos con agentes elementales
que reaccionan a las propiedades que perciben en su entorno. Incluso unas mquinas tan simples
nos permitirn abordar temas complejos, como la visin artificial, el aprendizaje o los sistemas
artificiales evolutivos. Despus, introduciremos en sucesivas fases algunas tcnicas que permiten
a los agentes sacar partido de informacin sobre su entorno que no puede ser percibida directa-
mente. Este conocimiento puede consistir en informacin declarativa sobre el estado del entorno,
en modelos icnicos del entorno, en grafos definidos en el espacio de estados o en representa-
ciones lgicas. Llamaremos inteligencia artificial evolutiva a esta aproximacin, debido a que
nuestra progresin seguir lo que pueden haber sido los pasos ms plausibles de la evolucin de
los animales. Se pretende que este libro sea tanto una propuesta acerca de cmo pensar sobre la
lA como una descripcin de las tcnicas propias de la lA. A lo largo de l propondremos nume-
rosos ejemplos con el objetivo de proporcionar suficiente motivacin y fundamento.
Aunque usaremos a los agentes como ejemplos con los que ilustraremos la aplicacin de las
tcnicas de lA que vamos a estudiar, stas tienen en s mismas un campo de aplicacin mucho
ms amplio. Muchas de las ideas inventadas por los investigadores en lA han sido despus asi-
miladas por la informtica para aplicaciones en sistemas expertos, en procesamiento de lengua-
je natural, en interaccin hombre-ordenador, en recuperacin de informacin, en procesamiento
de grficos e imgenes, en minera de datos y en robtica, por nombrar slo unos ejemplos. El
uso de los agentes como tema central nos servir para unificar lo que, de otra forma, nos parecera
una coleccin de temas dispares.
Con respecto al alcance del libro, la intencin es situarnos en el terreno intermedio entre teo-
ra y aplicaciones. Este terreno intermedio es realmente rico en ideas importantes para la lA; por
ello, intentaremos motivar y explicar, las que, presumiblemente, perdurarn como valiosas.
(Como humano sujeto a la equivocacin, admito que he podido cometer errores por accin u omi-
sin, al seleccionar los ternas a incluir en el libro.) Por otra parte, algunos temas sern tratados en
xvii
xix
xvi Prefacio
ms profundidad que otros -tanto porque pienso que son ms importantes, como porque quera
proporcionar al menos algunos ejemplos con una mayor profundidad expositiva-. Aunque pre-
sentaremos algunos algoritmos en pseudocdigo, ste no es un libro sobre programacin e
implementacin en lA. (Algunos libros sobre tcnicas de lA son: [Shoham, 1994; Norvig,
1992, y Tracy y Bouthoom, 1997J.) No veremos las demostraciones de todos los resultados te-
ricos importantes, pero intentaremos dar argumentos intuitivos y citar las referencias donde
pueden encontrarse las demostraciones formales. Mis objetivos son presentar un libro de texto de
tamao modesto, apropiado para un curso introductorio de un semestre de duracin, dar al estu-
diante y al lector una motivacin y preparacin suficientes para abordar cursos de lA ms avan-
zados y hacer accesible la extensa cantidad de literatura sobre lA actualmente existente.
Una caracterstica poco convencional de este libro es que el aprendizaje no se trata como un
tema aparte; en su lugar, los diferentes aspectos del aprendizaje van surgiendo de forma natural a
lo largo del libro. Se introducirn las redes neuronales y, junto a ellas, algunas ideas fundamen-
tales sobre aprendizaje no supervisado; las tcnicas para el aprendizaje de heursticas de bsqueda
y de polticas de accin sern discutidas en los captulos sobre bsqueda; el aprendizaje de
reglas, la programacin lgica inductiva y el aprendizaje basado en explicaciones sern tratados
hacia el final del captulo sobre lgica; finalmente, el aprendizaje de planes ser presentado tras
discutir la planificacin basada en lgica.
En mis libros previos, se inclua una seccin denominada comentarios bibliogrficos e
histricos al final de cada captulo. (Algunos lectores pueden encontrar que estas secciones son
an de inters). Esta vez no 10 he hecho as, en parte porque la historia de la lA ha crecido ya
demasiado, y en parte porque el texto de [Russell y Norvig, 1995], ya ha hecho un trabajo
minucioso y profundo a este respecto. En su lugar, se incluirn comentarios y citas a lo largo del
texto, proporcionando algunas adicionales en las secciones de discusin situadas al final de la
mayora de los captulos. Seguramente, el estudiante serio que quiera especializar su investigacin
en el rea de la lA desear consultar muchas de estas referencias. Espero que al lector fortuito no
le resulten molestas estas numerosas citas.
Al fmal de cada captulo se incluyen algunos ejercicios de muestra. Varan en dificultad, des-
de la aplicacin rutinaria de ideas, ya presentadas en el texto, hasta cuestiones moderadamente
difciles. Seguramente, los profesores que utilicen el libro querrn suplementar estos problemas
con otros de su propia cosecha, incluyendo prcticas de ordenador y proyectos. (Siendo coherente
con mi decisin de concentrarme en las ideas ms que en los programas, no he incluido ninguna
prctica de ordenador ni ningn proyecto. Pueden encontrarse buenas ideas sobre proyectos y
sobre programacin en textos dedicados a las tcnicas de programacin de la lA.)
Las convenciones tipogrficas utilizadas a lo largo del libro son las siguientes. Usaremos el
tipo de letra univers para los nombres de las acciones y para las sentencias del protolenguaje
empleado por los agentes para comunicarse entre ellos. Usaremos UNIVERS maysculas para los
nombres de los lenguajes de programacin, para los algoritmos y para los nombres de los siste-
mas. Usaremos letras maysculas en negrita, tales como W y X, para los vectores, las matrices y
los operadores modales. El tipo couri er ser utilizado para los algoritmos genticos, las
expresiones y subexpresiones del clculo de predicados y para las reglas y operadores STRIPS.
Las letras griegas minsculas se reservarn para las metavariables con las que representaremos las
expresiones y subexpresiones del clculo de predicados y, ocasionalmente, para las sustituciones.
Las probabilidades se denotarn mediante la letra p minscula.
Estudiantes e investigadores pueden encontrar una gran cantidad de material til en Internet.
No daremos ninguna direccin URL; cualquier lista que escribisemos hoy quedara incompleta
e inexacta al cabo de unos meses. El lector puede utilizar cualquier motor de bsquedas de Inter-
net para encontrar rpidamente sitios con aplicaciones, listas de preguntas frecuentemente reali-
zadas (FAQ, o Frequently Asked Questions), extensas bibliografas, artculos de investigacin,
Prefacio
programas, demostraciones interactivas, anuncios de reuniones y congresos, pgina,> personales
de investigadores y mucho material adicional.
Mi anterior libro de texto sobre lA, Principles ofArtificial Intelligence (Morgan Kaufmann,
1980)*, est hoy en da completamente obsoleto, pero parte del material introducido en l puede
an ser til, y lo he usado libremente para preparar el presente volumen. La comparacin con
otros libros de texto de lA (particularmente [Russell y Norvig, 1995; Rich y Knight, 1991, YSte-
fik, 1995]) ha sido tambin muy til.
Mis estudiantes y los profesores ayudantes de mis cursos sobre inteligencia artificial y
aprendizaje en Stanford han hecho diversas sugerencias tiles. La siguiente lista incluye, espero,
a la mayora de ellos: Eyal Amir, David Andre, Scott Benson, George John, Steve Ketchpel, Ron
Kohavi, Andrew Kosoresow, Ofer Matan, Karl Pfleger y Charles Richards. Colegas y revisores de
Stanford y de otros sitios me han ayudado a aprender lo que ellos ya saban. Gracias a Helder
Coelho, Oscar Firschein, Carolyn Hayes, Giorgio Ingargiola, Leslie Kaelbling, Daphne Koller,
John Roza, Richard Korf, Pat Langley, John McCarthy, Bart Selman, Yoav Shoham, Devika
Subramanian, Gheorghe Tecuci y Michael Wellman. Gracias especialmente a Cheri Palmer, mi
editora de produccin en Morgan Kaufmann, que consigui que me atuviese al plan establecido,
aceptando amablemente mis interminables cambios, y que trabaj muy duro para conseguir
que un libro difcil como ste fuese publicado en la fecha prevista. El trabajo sobre este libro fue
realizado en el Robotics Laboratory del Stanford's Departrnent of Computer Science y en el San-
ta Fe lnstitute. Tambin quiero agradecer el continuo soporte econmico recibido de la National
Science Foundation.
* Editado en castellano como Principios de Inteligencia Artificial. Daz de Santos, 1987. (N. del T.)
Introduccin
En mi opinin, para comprender la inteligencia hay que comprender cmo se adquiere, se
representa y se almacena el conocimiento; cmo se genera y se aprende el comportamiento inte-
ligente; cmo se desarrollan y se usan las motivaciones, las emociones y las prioridades; cmo
las seales sensoriales son transfonnadas en smbolos; cmo se manipulan los smbolos para
aplicar la lgica, para razonar sobre el pasado y para planificar el futuro, y cmo los mecanis-
mos de la inteligencia producen los fenmenos de la ilusin, las creencias, las esperanzas, los
temores y los sueos --y, s, incluso la bondad y el amor-o Comprender estas funciones en un
nivelfundamental sera, creo yo, un logro cientfico de la misma escala que lafsica nuclear, la
relatividad y la gentica molecular.
James Albus, en respuesta a Henry Hexmoor, citado en la direccin URL:
http://tommy.jsc.nasa.gov/er/er6/mrl/papers/symposium/albuS.txt
13 de febrero de 1995
Qu es la lA?
La Inteligencia Artificial (lA), en una definicin amplia y un tanto circular, tiene por objeto el
estudio del comportamiento inteligente en las mquinas. A su vez, el comportamiento inteligen-
te supone percibir, razonar, aprender, comunicarse y actuar en entornos complejos. Una de las
metas a largo plazo de la lA es el desarrollo de mquinas que puedan hacer todas estas cosas
igual, o quiz incluso mejor, que los humanos. Otra meta de la lA es llegar a comprender este tipo
de comportamiento, sea en las mquinas, en los humanos o en otros animales. Por tanto, la lA
persigue al mismo tiempo metas cientficas y metas de ingeniera. En este libro, nos dedicaremos
principalmente a la lA como ingeniera, focalizando nuestra atencin sobre los conceptos e ide-
as ms importantes que subyacen en el diseo de mquinas inteligentes.
La lA ha estado siempre rodeada de controversia. La cuestin bsica de la lA -Pueden
pensar las mquinas?- ha interesado tanto a filsofos como a cientficos e ingenieros. En un
1
2
3
Inteligencia artificial. Una nueva sntesis
famoso artculo, Alan Turing, uno de los fundadores de la informtica, expres esta misma
cuestin, pero formulada en trminos ms adecuados para su comprobacin emprica. Es lo
que se ha dado en llamar el Test de Turing [Turing, 1950]. Describiremos este test un poco ms
adelante, en esta misma seccin, pero primero es importante destacar lo que ya observara Turing:
que la respuesta a la pregunta Pueden pensar las mquinas? depende de cmo definamos las
palabras mquina y pensar. Turing podra haber aadido que la respuesta depende tambin de
cmo se defina la palabra pueden.
Consideremos primero la palabra pueden. Queremos decir que las mquinas pueden pensar
ya ahora, o que algn da podrn pensar? Queremos decir que las mquinas podran ser capaces
de pensar, en principio (incluso aunque nunca lleguemos a construir ninguna que lo haga), o lo
que perseguimos es una implementacin real de una mquina pensante? Estas cuestiones son real-
mente importantes puesto que todava no disponemos de ninguna mquina que posea amplias
habilidades pensantes.
Algunas personas creen que las mquinas pensantes tendran que ser tan complejas, y dis-
poner de una experiencia tan compleja (por ejemplo, interaccionando con el entorno o con otras
mquinas pensantes), que nunca seremos capaces de disearlas o construirlas. Una buena ana-
loga nos la proporcionan los procesos que regulan el clima global del planeta: incluso aunque
conocisemos todo 10 que es importante acerca de estos procesos, este conocimiento no nos capa-
citara necesariamente para duplicar el clima en toda su riqueza. Ningn sistema menos complejo
que el formado por la superficie de la tierra, la atmsfera y los ocanos --embebido en un
espacio interplanetario, calentado por el sol e influenciado por las mareas- sera capaz de
duplicar los fenmenos climticos con todo detalle. De forma similar, la inteligencia de nivel
humano, a escala real, podra ser demasiado compleja, o al menos demasiado dependiente de la
fisiologa humana, para existir fuera de su encarnacin en seres humanos inmersos en su entor-
no. (Para una discusin acerca de la importancia de la nocin de encarnacin vase, por ejemplo,
[Lakoff, 1987; Winograd y Flores, 1986; Harnad, 1990, y Matarlc, 1997].) La cuestin de si algu-
na vez seremos capaces, o no, de construir mquinas pensantes de nivel humano no admite an
una respuesta definitiva. El progreso de la lA hacia esta meta ha sido constante, aunque ms len-
to de lo que algunos pioneros del tema haban predicho. Personalmente, soy optimista sobre nues-
tro eventual xito en esta empresa.
Consideremos ahora la palabra mquina. Para mucha gente, una mquina es todava un
artefacto ms bien estpido. La palabra evoca imgenes de engranajes rechinando, de chorros
de vapor siseando y de piezas de acero martilleando. Cmo podra llegar a pensar una cosa
como sa? Sin embargo, hoy en da, los ordenadores han ampliado en gran medida nuestra
nocin de lo que una mquina puede ser, y nuestra creciente comprensin de los mecanismos
biolgicos est expandindose incluso ms an. Consideremos, por ejemplo, un virus simple,
como el denominado Bacterifago E6, mostrado esquemticamente en la Figura 1.1. Su cabe-
za contiene ADN vrico. Este virus es capaz de adherirse a la pared celular de una bacteria
mediante las fibras de su cola, pinchar la pared e inyectar su ADN ella. Este ADN hace que la
bacteria fabrique millares de copias de cada una de las piezas del virus. Despus, las piezas se
ensamblan automticamente ellas mismas, formando nuevos virus que salen de la bacteria para
repetir el proceso. El ensamblaje completo se parece mucho al de una mquina, por lo que
podramos, con toda propiedad, decir que se trata de una mquina -una mquina hecha de pro-
tenas.
Pero qu ocurre con otros procesos y organismos biolgicos? El genoma completo de la
bacteria Haemophilus influenzae Rd ha sido secuenciado recientemente [Fleischmann, et al.,
1995]. Este genoma consta de 1.830.137 pares de bases (identificadas con las letras A, G, C Y T).
Esto equivale, aproximadamente, a 3,6 x 1()6 bits, es decir, casi medio megabyte. Aunque todava
no se conoce la funcin de todos y cada uno de sus 1.743 genes, los cientficos estn comenzando
Introduccin
Figura 1.1.
Ilustracin esquemtica del Bacterifago E6.
a explicar el desarrollo y el funcionamiento de este organismo en los mismos trminos en los que
explicaran una mquina, -una mquina muy compleja, desde luego. De hecho, hay tcnicas que
son muy familiares a los informticos, tales como el uso de cronogramas para los circuitos
lgicos, que estn demostrando ser tiles para entender cmo los genes regulan los complejos
procesos bioqumicos de un virus que infecta a bacterias [McAdams y Shapiro, 1995]. La
secuenciacin de los genomas completos de otros organismos, incluyendo el genoma humano,
est en curso. Una vez que conozcamos estas marcas, pensaremos en estos organismos -bac-
terias, gusanos, moscas, ratones, delfines, humanos- como mquinas? Si los humanos fuesen
mquinas, entonces es que las mquinas pueden pensar! Tendramos una demostracin de su exis-
tencia. Lo que ocurre, simplemente, es que no conocemos an cmo funciona la mquina
humana.
Sin embargo, aunque estuvisemos de acuerdo acerca de lo que es una mquina, este ltimo
argumento es rebatible. Aunque una mquina hecha de protenas puede pensar, quiz una hecha
de silicio no sera capaz de hacerlo. Un conocido filsofo, John Searle, cree que la materia de la
que estamos hechos es fundamental para la inteligencia [Searle, 1980; Searle, 1992]. Para l, el
pensamiento slo puede ocurrir en mquinas muy especiales -las mquinas vivientes hechas de
protenas.
La hiptesis del sistemafsico de smbolos de Newell y Simon [Newell y Simon, 1976] est
en oposicin directa a las creencias de Searle (y a la nocin de encarnacin mencionada ante-
riormente). Esta hiptesis establece que un sistema fsico de smbolos dispone de los medios
necesarios y suficientes para desarrollar una actividad general inteligente. De acuerdo con
Newell y Simon, un sistema fsico de smbolos es una mquina, tal como un ordenador digital,
que es capaz de manipular datos simblicos -sumar nmeros, reordenar listas de smbolos (por
ejemplo, ordenar alfabticamente una lista de nombres), reemplazar algunos smbolos por otros,
etctera. Un aspecto importante de esta hiptesis es que no importa de qu est hecho el sistema
fsico de smbolos. Decimos que la hiptesis de Newell y Simon es neutral respecto al sustrato.
4
5
r
Inteligenciaartificial. Unanuevasntesis
Unaentidadinteligentepodraestarhechadeprotenas,derelsmecnicos,detransistores,ode
cualquierotracosa,contaldequeseacapazdeprocesarsmbolosl.
Otrospensadorescreenquenoesrealmenteimportantequelasmquinasestnhechasdesili-
cioodeprotenas;piensanqueelcomportamientointeligentees,ensumayorparte,elresultado
de loqueellos llamanprocesamientosubsimblico, es decir, procesamientodeseales, node
smbolos. Consideremos, porejemplo, el reconocimiento de rostros familiares. Los humanos
hacemos estosinesfuerzoalguno, yaunque nosesabeexactamentecmolohacemos, sesos-
pechaquelamejorexplicacinparaelprocesoeslaquesebasaeneltratamientodeimgenes,o
departesdeellas,comosealesmultidmensionales, nocomosmbolos.
Podramoscitarmuchosotrospuntosdevistasobreeltipodemquinasquepodransercapa-
cesdedesarrollarhabilidadespensantescomolas deloshumanos.Algunasdelashiptesisque
seoyenamenudosonlassiguientes:
Elcerebroprocesalainformacinenparalelo, mientrasquelos ordenadoresconvencio-
nales lohacen secuencialmente. Portanto, tenemosque construirnuevas variedades de
ordenadoresparalelospararealizarprogresosenlalA.
Lamaquinariacomputacionalconvencionalestbasadaenlalgicabinaria(verdaderoofalso).
Portanto, lossistemasrealmenteinteligentestendrnqueusaralgntipodelgicaborrosa.
Lasneuronasanimalessonmuchomscomplejasquesimplesconmutadores-losbloques
constructivos bsicosdelos ordenadores actuales-o Portanto, necesitaremos neuronas
artificialesverdaderamenterealistasparaconstruirmquinasinteligentes.
QuizesandemasiadoprontoparaquesealcanceunconsensoenelcampodelaIAsobre
eltipodemaquinariarequerida,aunquemuchosinvestigadoresaceptanyalahiptesisdelsiste-
mafsicodesmbolos.
Finalmente,llegamosalapalabramsdifcil:pensar. Enlugardeintentardefinirestapala-
bra,Turingpropusountest,elllamadoTestdeTuring,medianteelcualpudieradecidirsesiuna
mquinaparticularesonointeligente.Eltestfuedescritooriginalmentecomounjuego.Citemos
delartculodeTuring[Turing, 1950]:
En eljuegoparticipantrespersonas,unhombre(A),unamujer(B)yuninterrogador(C),que
puedeserdecualquiersexo.Elinterrogadorpermaneceenunasala,separadodelosotrosdos,
peropudiendo comunicarse con ellos mediante un teletipo. El objetivo del juego para el
interrogadoresdeterminarculdelosotrosdosesel hombreyculeslamujer.Elinterroga-
dorlosdesignamediantelasetiquetasXeY, yalfinaldeljuegodebedecirXesAeYesB
oXesBeYesA.Paraello,elinterrogadorpuedeplantearpreguntasaAyaB,talescomo:
C: PodradecirmeXculeslalongituddesupelo?
SupongamosqueXesrealmenteA; entoncesesAquiendeberesponder. ElobjetivodeAen
eljuegoesintentarqueChagaunaidentificacinerrnea.
Elobjetivodeljuegoparaeltercerparticipante(B)esayudaralinterrogador.
Ahorapodemos plantearnos la siguientecuestin: Qu sucederasi una mquina inter-
pretaseel papel deAen el juego? El interrogadorhartantas identificaciones errneas
comocuandoeljuegoesinterpretadoporunhombreyunamujer?Estascuestionesreem-
plazananuestracuestinoriginal:Puedenpensarlasmquinas?
1 Obviamente,si tomamosencuentaaspectosprcticoscomola velocidad,laestabilidad,lafiabilidad,lacapacidadde
procesamientoparalelo,lasensibilidadalatemperatura,etc.,algunosmaterialesdeconstruccinsernmejoresqueotros.
Introduccin
A menudo, el Test deTuring se simplifica, plantendolo como un juego en el que una
mquinaintentaconvencerauninterrogadorhumanodequeel1aestambinhumana. Estaver-
sinsimplificadadelTestdeTuringnoseconsiderausualmentecomountestdeinteligenciamuy
til, debido a que es posible, incluso para programas muy simples, engaar al interrogador
humanoduranteunbuenrato,Porejemplo,elprogramaELlZA deJosephWeizenbaumusaalgu-
nostrucosmuysimplesparaello,peroescapazdedesarrollarundilogoqueresultaaparente-
mente realista paraelinterrogador poco avezado, aunque es un dilogo completamentevano
[Weizenbaum, 1%5].ElprogramaJULIA deMauldinestambinunprogramadedilogodeeste
tipo,peromsrecienteysofisticado[Mauldin, 1994]2.
ApartedelTestdeTuring,unacuestinquemerecelapenaintentarresponderesladecules
debenserlahabilidadesrequeridasenunamquinaparaquepodamoscalificarlacomointeli-
gente. Actualmente, existen muchos programas de ordenador capaces de realizar cosas real-
mente prodigiosas, incluyendo laplanificacin ptimade rutas areas paraeconomizar com-
bustible,lasimulacinglobaldecondicionesmeteorolgicas,laplanificacindelusoderecursos
enunafactora, etc. Soninteligentesestosprogramas?Debenserconsideradoscomoobjetode
estudiodelaIA? Habamoscomenzado estecaptulodescribiendomquinasquedifcilmente
podranseretiquetadascomointeligentes.Songradualmentemsymsinteligentesconforme
seincrementasucomplejidad?Personalmente,locreoas,peroexistenindudablementeopinio-
nesparatodoslosgustos.
Aproximaciones a la Inteligencia Artificial
AunaceptandoquelaIAyahasidocapazdeproduciralgunossistemasprcticosmuytiles,la
creenciageneralesqueelobjetivoltimodealcanzarunainteligenciadenivelhumanoestan
muydistante. Siendoestoas, todavahayungrandebatesobreculessonlasmejoresaproxi-
macioneshacialaIA-mejoresenelsentidodesentarlosfundamentoscentralesparaconseguir
lasmetasplanteadasalargoplazo, ascomomejoresenelsentidodeproducirresultadosprcti-
cosacortoplazo-.Enconsecuencia,durantelosltimos40aoshaemergidounciertonme-
rodeparadigmasdiferentes.Cadaunodeellostieneabogadosapasionados,yalgunoshanpro-
ducidoresultadossuficientementeinteresantescomoparanoserdescartadossinms. Quizlo
queserequiereesunacombinacinapropiadadeestasaproximacionesdiferentes.Encualquier
caso,cadainvestigadorcree,amenudo,quelasuyaeslametodologaavanzadaquemereceespe-
cialatencin.Losprincipalesparadigmaspuedenserclasificadosendosgrupos.
Elprimergrupoincluyeloquellamaramoslasaproximacionesbasadasenprocesamientode
smbolos. Sesustentansobrelahiptesisdel sistemafsico desmbolosdeNewell y Simon,y
aunqueestahiptesisnopuedeconsiderarseancomouniversalmenteaceptada,enellasebasa
muchodeloquepodramosllamarIAclsica(loqueelfilsofoJohnHaugelandllamalAal
viejo estilo (GOFAI, o Good-Old-Fashioned-AI). Un miembro destacado de esta familia de
aproximacioneseselquesebasaenlaaplicacindeoperacioneslgicassobrebasesdeconoci-
mientodeclarativo.InspiradooriginalmenteenlosinformesdeJohnMcCarthysobresusistema
consejero [McCarthy, 1958],esteestilodelArepresentaelconocimientosobreunproblema
deldominiomediante sentenciasdeclarativas, a menudobasadas en sentenciasdelalgicade
2 En 1991,HughLoebnerestableciunacompeticin,elPremioLoebner,ofreciendounpremiode 100.000dla-
res al autordel primerprogramadeordenadorcapazdesuperarunTestdeTuringnorestringido.Adems,todoslos aos
seproponencompeticionesanualesconpremiosmspequeosparaelmejorprogramaquesuperealgunaversinres-
tringidadelTestdeTuring.
6
7
r
predicados o sustancialmente equivalentes a ellas. Para deducir consecuencias a partir de este
conocimiento se aplican tcnicas de inferencia lgica. Este mtodo admite numerosas variantes,
incluyendo aquellas cuyo nfasis est en la axiomatizacin formal del dominio en un lenguaje
lgico. Cuando se aplica a problemas reales, este mtodo requiere la representacin de una can-
tidad sustancial de conocimiento del dominio, por lo que se suele hablar de aproximaciones basa-
das en el conocimiento. Se han construido muchos sistemas basados en estos mtodos, y nos refe-
riremos a algunos de ellos ms adelante.
En muchas de las aproximaciones basadas en procesamiento de smbolos, el anlisis de los
comportamientos deseados, o la sntesis de mquinas para conseguirlos, se extienden a travs de
varios niveles. El nivel superior corresponde al nivel del conocimiento [Newell, 1982], en el cual se
especifica el conocimiento necesario para que la mquina alcance sus objetivos. A continuacin vie-
ne el nivel simblico, donde se representa este conocimiento mediante estructuras simblicas,
como, por ejemplo, listas escritas en el lenguaje de programacin L1SP, y se especifican operacio-
nes sobre estas estructuras. Despus estn los niveles inferiores, en los cuales, realmente se imple-
mentan las operaciones de procesamiento de smbolos. Muchas aproximaciones basadas en pro-
cesamiento de smbolos utilizan una metodologa de diseo descendente; se comienza en el nivel
del conocimiento y se procede hacia abajo a travs de los niveles simblico y de implementacin.
El segundo grupo de aproximaciones hacia la lA incluye lo que se denominan aproximacio-
nes subsimblicas. stas siguen usualmente un estilo de diseo ascendente, comenzando en
el nivel ms bajo y procediendo hacia los niveles superiores. En los niveles ms bajos, el con-
cepto de smbolo no es tan apropiado como el concepto de seal. Entre las aproximaciones
subsimblicas, una aproximacin muy prominente es la que algunos han llamado vida artifi-
cial. Los defensores de este estilo [Wilson, 1991 y Brooks, 1990] sealan que la inteligencia
humana se desarroll slo despus de ms de mi] millones de aos de vida sobre la tierra.
Segn ellos, para conseguir mquinas inteligentes tendremos que seguir muchos de estos pasos
evolutivos. Primero, debemos concentramos en la duplicacin de las capacidades de procesa-
miento de seal y control de las que disponen los animales ms simples -los insectos, por ejem-
plo-- y subir por la escalera evolutiva en pasos sucesivos. Esta estrategia no slo conducir a la
obtencin a corto plazo de mquinas tiles, sino que desarrollar el substrato sobre el cual
deben construirse necesariamente los niveles superiores de inteligencia.
Este segundo grupo de aproximaciones tambin pone nfasis en los fundamentos simblicos.
Brooks introdujo ]a hiptesis de los fundamentos fsicos, en contraste con la hiptesis de los sis-
temas fsicos de smbolos [Brooks, 1990]. Segn su hiptesis, se puede obtener un comporta-
miento complejo sin usar modelos centralizados; para ello, bastara con dejar que los diversos
mdulos de comportamiento de un agente interacten independientemente con el entorno. Sin
embargo, Brooks acepta que para conseguir lA de nivel humano puede ser necesaria la integra-
cin de las dos aproximaciones.
Lainteraccin entre una mquina y su entorno conduce a lo que se denomina comporta-
miento emergente. En palabras de una investigadora [Maes, 1990b, p. 1]:
Lafuncionalidad de un agente debe verse como una propiedad emergente de la interaccin
intensiva del sistema con su entorno dinmico. Laespecificacin del comportamiento del
agente aislado no explica la funcionalidad que exhibe cuando el agente est operando. Por el
contrario, su funcionalidad se basa en gran medida en las propiedades del entorno. No slo
hay que tener en cuenta las caractersticas dinmicas del entorno, sino que stas deben ser
explotadas para servir al funcionamiento del sistema.
Lasredes neuronales son un ejemplo bien conocido de mquinas que provienen de la escue-
lasubsimblica. Estos sistemas, inspirados en modelos biolgicos, son interesantes, principal-
Introduccin
mente por su capacidad de aprendizaje. Tambin se han conseguido resultados interesantes
mediante procesos que simulan ciertos aspectos de la evolucin biolgica: cruzamiento, mutacin
y reproduccin de los organismos mejor adaptados. Otras aproximaciones ascendentes, cercanas
a las aproximaciones del tipo vida artificial, se basan en ]a teora del control y en el anlisis de
sistemas dinmicos (vase, por ejemplo, [Beer, 1995, y Port y van Gelder, 1995]).
A medio camino entre las aproximaciones descendentes y ascendentes est la basada en aut-
matas situados [Kaelbling y Rosenschein, 1990, y Rosenschein y Kaelbling, 1995]. Kaelbling y
Rosenschein proponen un lenguaje de programacin para especificar, en un alto nivel de abs-
traccin, el comportamiento deseado en un agente, as como un compilador para crear la circui-
tera necesaria a partir de los programas escritos en este lenguaje.
Breve historia de la lA
Cuando empezaron a desarrollarse los primeros ordenadores durante las dcadas de los aos 40
y 50, algunos investigadores escribieron programas que podan realizar tareas elementales de
razonamiento. Entre los resultados ms prominentes de esta poca podemos citar los primeros
programas de ordenador capaces de jugar al ajedrez [Shannon, 1950, Newell, y Shaw y Simon,
1958], los programas capaces de jugar a las damas [Samuel , 1959, y Samuel, 1967] y los pro-
gramas para demostrar teoremas de geometra plana [Gelemter, 1959]. En 1956, John McCarthy
y Claude Shannon coeditaron un volumen titulado Automata Studies [Shannon y McCarthy,
1956]. La mayora de los artculos del volumen trataban sobre los fundamentos matemticos de
]a teora de autmatas, por lo que McCarthy, decepcionado, decidi acuar eltrmino Inteligen-
cia Artificial y usarlo como ttulo de una conferencia celebrada en Dartmouth en 1956. En esta
conferencia se presentaron algunos trabajos muy relevantes, incluyendo uno de Allen Newell,
Cliff Shaw y Herbert Simon sobre un programa llamado Teorizador Lgico [Newell; Shaw y
Simon, 1957], que poda demostrar teoremas en lgica proposicional. Aunque se propusieron
muchos otros trminos para e] campo, tales como procesamiento de informacin compleja,
inteligencia de mquinas, programacin heurstica o cognologa, slo el nombre de Inteligencia
Artificial ha perdurado. sin duda a causa de la creciente progresin de libros de texto, cursos, con-
gresos y revistas que usaban este trmino.
El primer paso hacia la inteligencia artificial fue dado mucho tiempo atrs por Aristteles
(384-322 a. C.), cuando comenz a explicar y a codificar ciertos estilos de razonamiento deduc-
tivo que l llam silogismos. Algunos de los esfuerzos tempranos para automatizar la inteligen-
cia nos pareceran quijotescos hoy en da. Ramn Llul1 (1235-1316), un mstico y poeta cataln,
construy una mquina de engranajes, llamada Ars Magna, que supuestamente era capaz de res-
ponder a todas las preguntas. Pero hubieron tambin cientficos y matemticos que perseguan la
automatizacin del razonamiento. Martn Gardner [Gardner, 1982, p. 3] atribuye a Gottfried Leib-
niz (1646-1716) el sueo de un lgebra universal mediante la cual todo el conocimiento, inclu-
yendo las verdades morales y metafsicas, pueda ser algn da representado en un nico sistema
deductivo. Leibniz llam a su sistema clculo filosfico o raciocinador; fue, claro est, un sue-
o que no pudo ser realizado con el aparataje tecnolgico de la poca. No comenz a haber un
progreso sustancial hasta que George Boole [Boo]e, 1854] desarroll los fundamentos de la
lgica proposicional. El propsito de Boole, entre otras cosas, era recoger... algunos funda-
mentos probables relativos a la naturaleza y a la constitucin de la mente humana. Hacia e] final
del siglo XIX, Gottlieb Frege propuso un sistema de notacin para el razonamiento mecnico, con
lo que invent mucho de lo que hoy conocemos con el nombre de clculo de predicados [Frege,
1879]. Llam a su lenguaje Begriffsschrift, lo que puede ser traducido como escritura de con-
ceptos.
8 9 Inteligencia artificial. Una nueva sntesis
En 1958, John McCarthy propuso la utilizacin del clculo de predicados como un lenguaje
para representar y usar conocimiento en un sistema al que llam sistema consejero [McCarthy,
1958]. A este sistema, en lugar de programarlo, haba que decirle lo que necesitaba saber para
resolver un problema. Una modesta, pero influyente, implementacin de estas ideas fue aborda-
da por Cordell Green en su sistema QA3 [Green, 1969a]. Como resultado de muchas controver-
sias entre los investigadores de la lA, el clculo de predicados y sus variantes han sobrevivido
como el fundamento bsico para la representacin del conocimiento.
Los lgicos del siglo xx, incluyendo a Kurt Gooel, Stephen KIeene, Emil Post, Alonzo
Church y Alan Thring, formalizaron y clarificaron lo que puede ser hecho y lo que no puede ser
hecho mediante sistemas lgicos y computacionales. Posteriormente, informticos como Stephen
Cook y Richard Karp identificaron las clases de cmputos que, siendo posibles en principio,
requeriran cantidades de tiempo y de memoria completamente impracticables.
Muchos de estos resultados de la lgica y de la informtica se referan a verdades que no
pueden ser deducidas y a clculos que no pueden ser realizados. Seguramente animados por
estos hallazgos negativos, algunos filsofos y cientficos [Lucas, 1961; Penrose, 1989, y Penro-
se, 1994] los interpretaron como confirmaciones de que la inteligencia humana no podra ser nun-
ca mecanizada. Estos pensadores crean que los humanos son, de alguna forma, inmunes a las
limitaciones computacionales inherentes a las mquinas. Sin embargo, la mayora de los lgicos
y de los informticos creen que estos resultados negativos de ningn modo implican que las
mquinas tengan lmites que no sean aplicables tambin a los humanos.
El primer artculo moderno que trataba sobre la posibilidad de mecanizar la inteligencia al
estilo humano fue el de Alan Thring que ya hemos citado anteriormente [Thring, 1950]. Durante
el mismo perodo, Warren McCulloch y Walter Pitts teorizaban sobre las relaciones entre ele-
mentos computacionales simples y neuronas biolgicas [McCulloch y Pitts, 1943]. Demostraron
que es posible calcular cualquier funcin computable mediante redes de puertas lgicas (vase
[Minsky, 1967], para un tratamiento muy legible de los aspectos computacionales de las neu-
ronas de McCulloch-Pitts). Otro trabajo, de Frank Rosenblatt [Rosenblatt, 1962], exploraba el
uso de redes de tipo neuronal, denominadas perceptrones, para el aprendizaje y el reconocimiento
de patrones. Algunas otras corrientes de trabajo, entre ellas la ciberntica [Wiener, 1948], la psi-
cologa cognitiva, la lingstica computacional [Chomsky, 1965] y la teora del control adaptativo
[Widrow y Hoff, 1960], han contribuido tambin a esta matriz intelectual dentro de la cual se ha
desarrollado la lA.
Una gran parte del trabajo inicial en la lA (durante la dcada de los aos 60 y la primera par-
te de la dcada de los 70) se dedicaba a explorar diversas representaciones de problemas, tcni-
cas de bsqueda y heursticas generales que se aplicaban en programas de ordenador capaces de
resolver puzzles sencillos, de jugar contra el usuario o de recuperar informacin. Uno de los pro-
gramas ms influyentes fue el Solucionador General de Problemas (GPS, o General Problem Sol-
ver) de Allen Newell, Cliff Shaw y Herbert Simon [Newell; Shaw, y Simon, 1959, y Newell y
Simon, 1963]. Entre los problemas de muestra resueltos por estos sistemas pioneros se incluan
la integracin simblica [Slagle, 1963], los problemas de lgebra [Bobrow, 1968], los puzzles
analgicos [Evans, 1968] yel control de robots mviles [Nilsson, 1984b]. Muchos de estos
sistemas constituyen el tema central de los artculos reunidos en el histrico volumen Computa
and Thought [Feigenbaum y Feldman, 1963].
Los intentos de escalar estos programas y sus tcnicas para enfrentarlos a aplicaciones de
importancia prctica revelaron que slo valan para resolver problemas de juguete. La cons-
truccin de sistemas ms potentes requera la inclusin de mucho ms conocimiento sobre el
dominio de aplicacin. Los ltimos aos de la dcada de los 70 Ylos primeros de la dcada de los
80 vieron el desarrollo de programas ms realistas, que contenan el conocimiento necesario para
mimetizar el comportamiento de los expertos humanos en tareas tales como el diagnstico, el
Introduccin
diseo y el anlisis. Fueron explorados y desarrollados varios mtodos para la representacin de
conocimiento especfico del problema. El programa al que se atribuye el mrito de ser el prime-
ro que demostr la importancia de recoger grandes cantidades de conocimiento especfico del
dominio fue DENORAL, un sistema para predecir la estructura de molculas orgnicas a partir de
su frmula qumica y de su espectrograma de masas [Feigenbaum; Buchanan, y Lederberg,
1971, y Lindsay et al., 1980]. Despus se desarrollaron otros sistemas expertos, incluyendo sis-
temas para diagnstico mdico [Shortliffe, 1976, y Miller, Pople y Myers, 1982], sistemas para
configurar ordenadores [McDermott, 1982] y sistemas para valorar posibles yacimientos de
minerales [Campbell et al., 1982, y Duda, Gaschnig y Hart, 1979]. Un buen resumen de la his-
toria de la lA a lo largo de este perodo fue escrito por [McCorduck, 1979].
Una de las reas en la que se han realizado progresos sustanciales al escalar el tamao del
problema es el rea de los juegos. El 11 de mayo de 1997, un programa de ordenador de mM,
denominado DEEP BLUE, consigui vencer al entonces campen del mundo de ajedrez, Garry
Kasparov, por 3,5 a 2,5 en un encuentro a seis partidas. Este alto nivel de juego se ha consegui-
do gracias a la sinergia de sofisticados algoritmos de bsqueda, ordenadores de alta velocidad y
hardware especfico para el juego del ajedrez.
La inteligencia humana abarca muchas habilidades, incluyendo la habilidad para percibir y
analizar escenas visuales y la habilidad para entender o generar el lenguaje. stos son temas espe-
cficos que han recibido mucha atencin. Larry Roberts desarroll uno de los primeros programas
de anlisis de escenas [Roberts, 1963]. Este trabajo preliminar fue seguido de una extensa can-
tidad de investigacin en visin artificial ([Nalwa, 1993] es un buen libro de texto general), guia-
da mediante estudios cientficos de los sistemas de visin animal [Letvinn et al., 1959; Hubel,
1988, y Marr, 1982].
Uno de los sistemas pioneros en comprensin del lenguaje natural fue el desarrollado por
Terry Winograd [Winograd, 1972]. Durante la dcada de los aos 70 se llev a cabo un proyecto
coordinado multicentro que desarroll prototipos de sistemas para la comprensin fluida del
habla; el sistema LUNAR [Woods, 1973], desarrollado por William Woods, era capaz de res-
ponder a preguntas orales en ingls sobre las muestras de rocas recogidas por las misiones luna-
res de la NASA.
Aunque actualmente existen diversos sistemas de comprensin del lenguaje natural, su com-
petencia se restringe a reas temticas especficas y a vocabularios especializados. El desarrollo
de sistemas con un alcance ms amplio requerir de nuevos avances en la representacin de gran-
des cantidades de conocimiento general de sentido comn. El proyecto CYC [Guha y Lenat,
1990; Lenat, y Guha 1990, y Lenat, 1995] tiene como uno de sus objetivos la recogida y repre-
sentacin de conocimiento de este tipo.
Aunque el inters en las redes neuronales decay un poco tras el trabajo pionero realizado en
los ltimos aos de la dcada de los 50 por Frank Rosenblatt, resurgi con energa en los aos 80.
Las redes de elementos no lineales con interconexiones de pesos variables se consideran actual-
mente como una clase muy importante de herramientas para el modelado no lineal. Hoy en da
existen diversas aplicaciones importantes de las redes neuronales. El trabajo sobre redes neuro-
nales, junto con el trabajo en temas de vida artificial, ha ayudado a focalizar la investigacin
actual en lA sobre los problemas relacionados con la conexin entre procesos simblicos y los
sensores y efectores de los robots inmersos en un entorno fsico. .
Si proyectamos las tendencias actuales hacia el futuro, es razonable esperar un nuevo nfasis
en el desarrollo de sistemas autnomos integrados, robots y softbots. Los softbots [Etzioni y
Weld, 1994] son agentes so:tr.ware que recorren Internet buscando la informacin que ellos creen
que puede ser de inters J?irra sus usuarios. La constante presin ejercida para mejorar las capa-
cidades de los robots y d los agentes software motivar y guiar la investigacin en inteligencia
artificial durante muchOS aos.
r
8
Introduccin 9 Inteligencia artificial. Una nueva sntesis
diseo y el anlisis. Fueron explorados y desarrollados varios mtodos para la representacin de En 1958, John McCarthy propuso la utilizacin del clculo de predicados como un lenguaje
para representar y usar conocimiento en un sistema al que llam sistema consejero [McCarthy, conocimiento especfico del problema. El programa al que se atribuye el mrito de ser el prime-
1958]. A este sistema, en lugar de programarlo, haba que decirle lo que necesitaba saber para ro que demostr la importancia de recoger grandes cantidades de conocimiento especfico del
resolver un problema. Una modesta, pero influyente, implementacin de estas ideas fue aborda- dominio fue DENDRAL, un sistema para predecir la estructura de molculas orgnicas a partir de
su frmula qumica y de su espectrograma de masas [Feigenbaum; Buchanan, y Lederberg, da por Cordell Green en su sistema 0A3 [Green, 1969a]. Como resultado de muchas controver-
sias entre los investigadores de la lA, el clculo de predicados y sus variantes han sobrevivido 1971, y Lindsay et al., 1980]. Despus se desarrollaron otros sistemas expertos, incluyendo sis-
como el fundamento bsico para la representacin del conocimiento. temas para diagnstico mdico [Shortliffe, 1976, y Miller, Pople y Myers, 1982], sistemas para
configurar ordenadores [McDermott, 1982] y sistemas para valorar posibles yacimientos de Los lgicos del siglo xx, incluyendo a Kurt GOdel, Stephen Kleene, Emil Post, Alonzo
minerales [Campbell et al., 1982, y Duda, Gaschnig y Hart, 1979]. Un buen resumen de la his- Church y Alan Turing, formalizaron y clarificaron lo que puede ser hecho y 10 que no puede ser
toria de la lA a lo largo de este perodo fue escrito por [McCorduck, 1979]. hecho mediante sistemas lgicos y computacionales. Posteriormente, informticos como Stephen
Cook y Richard Karp identificaron las clases de cmputos que, siendo posibles en principio, Una de las reas en la que se han realizado progresos sustanciales al escalar el tamao del
requeriran cantidades de tiempo y de memoria completamente impracticables. problema es el rea de los juegos. El 11 de mayo de 1997, un programa de ordenador de IBM,
Muchos de estos resultados de la lgica y de la informtica se referan a verdades que no denominado DEEP BLUE, consigui vencer al entonces campen del mundo de ajedrez, Garry
pueden ser deducidas y a clculos que no pueden ser realizados. Seguramente animados por Kasparov, por 3,5 a 2,5 en un encuentro a seis partidas. Este alto nivel de juego se ha consegui-
estos hallazgos negativos, algunos filsofos y cientficos [Lucas, 1961; Penrose, 1989, y Penro- do gracias a la sinergia de sofisticados algoritmos de bsqueda, ordenadores de alta velocidad y
se, 1994] los interpretaron como confIrmaciones de que la inteligencia humana no podra ser nun- hardware especfico para el juego del ajedrez.
ca mecanizada. Estos pensadores crean que los humanos son, de alguna forma, inmunes a las La inteligencia humana abarca muchas habilidades, incluyendo la habilidad para percibir y
limitaciones computacionales inherentes a las mquinas. Sin embargo, la mayora de los lgicos analizar escenas visuales y la habilidad para entender o generar el lenguaje. stos son temas espe-
y de los informticos creen que estos resultados negativos de ningn modo implican que las cficos que han recibido mucha atencin. Larry Roberts desarroll uno de los primeros programas
mquinas tengan lmites que no sean aplicables tambin a los humanos. de anlisis de escenas [Roberts, 1963]. Este trabajo preliminar fue seguido de una extensa can-
tidad de investigacin en visin artificial ([Nalwa, 1993] es un buen libro de texto general), guia- El primer artculo moderno que trataba sobre la posibilidad de mecanizar la inteligencia al
estilo humano fue el de Alan Turing que ya hemos citado anterionnente [Turing, 1950]. Durante da mediante estudios cientficos de los sistemas de visin animal [Letvinn el al., 1959; Hubel,
el mismo perodo, Warren McCulloch y Walter Pitts teorizaban sobre las relaciones entre ele- 1988, y Marr, 1982].
mentos computacionales simples y neuronas biolgicas [McCulloch y Pitts, 1943]. Demostraron Uno de los sistemas pioneros en comprensin del lenguaje natural fue el desarrollado por
que es posible calcular cualquier funcin computable mediante redes de puertas lgicas (vase Terry Winograd [Wmograd, 1972]. Durante la dcada de los aos 70 se llev a cabo un proyecto
[Minsky, 1967], para un tratamiento muy legible de los aspectos computacionales de las neu- coordinado multicentro que desarroll prototipos de sistemas para la comprensin fluida del
ronas de McCulloch-Pitts). Otro trabajo, de Frank Rosenblatt [Rosenblatt, 1962], exploraba el habla; el sistema LUNAR [Woods, 19731. desarrollado por William Woods, era capaz de res-
uso de redes de tipo neuronal, denominadas perceptrones, para el aprendizaje y el reconocimiento ponder a preguntas orales en ingls sobre las muestras de rocas recogidas por las misiones luna-
de patrones. Algunas otras corrientes de trabajo, entre ellas la ciberntica [Wiener, 1948], la psi- res de la NASA.
cologa cognitiva, la lingstica computacional [Chomsky, 1965] y la teora del control adaptativo Aunque actualmente existen diversos sistemas de comprensin del lenguaje natural, su com-
[Widrow y Hoff, 1960], han contribuido tambin a esta matriz intelectual dentro de la cual se ha petencia se restringe a reas temticas especficas y a vocabularios especializados. El desarrollo
desarrollado la lA.
de sistemas con un alcance ms amplio requerir de nuevos avances en la representacin de gran-
Una gran parte del trabajo inicial en la lA (durante la dcada de los aos 60 y la primera par- des cantidades de conocimiento general de sentido comn. El proyecto eve [Guha y Lenat,
te de la dcada de los 70) se dedicaba a explorar diversas representaciones de problemas, tcni- 1990; Lenat, y Guha 1990, y Lenat, 1995] tiene como uno de sus objetivos la recogida y repre-
cas de bsqueda y heursticas generales que se aplicaban en programas de ordenador capaces de sentacin de conocimiento de este tipo.
resolver puzzles senci11os, de jugar contra el usuario o de recuperar informacin. Uno de los pro- Aunque el inters en las redes neuronales decay un poco tras el trabajo pionero realizado en
gramas ms influyentes fue el Solucionador General de Problemas (GPS, o General Problem Sol- los ltimos aos de la dcada de los 50 por Frank Rosenblatt, resurgi con energa en los aos 80.
ver) de Allen Newell, Cliff Shaw y Herbert Simon [Newell; Shaw, y Simon, 1959, y Newell y Las redes de elementos no lineales con interconexiones de pesos variables se consideran actual-
Simon, 1963]. Entre los problemas de muestra resueltos por estos sistemas pioneros se incluan mente como una clase muy importante de herramientas para el modelado no lineal. Hoy en da
la integracin simblica [Slagle, 1963], los problemas de lgebra [Bobrow, 1968], los puzzles existen diversas aplicaciones importantes de las redes neuronales. El trabajo sobre redes neuro-
analgicos [Evans, 1968] y el control de robots mviles [Nilsson, 1984b]. Muchos de estos nales, junto con el trabajo en temas de vida artificial, ha ayudado a focalizar la investigacin
sistemas constituyen el tema central de los artculos reunidos en el histrico volumen Computer actual en lA sobre los problemas relacionados con la conexin entre procesos simblicos y los
and Tlwught [Feigenbaum y Feldman, 1963]. sensores y efectores de los robot<; inmersos en un entorno fsico. .
Los intentos de escalar estos programas y sus tcnicas para enfrentarlos a aplicaciones de Si proyectamos las tendencias actuales hacia el futuro, es razonable esperar un nuevo nfasis
importancia prctica revelaron que slo valan para resolver problemas de juguete. La cons- en el desarrollo de sistemas ootnomos integrados, robots y softbots. Los softbots [Etzioni y
truccin de sistemas ms potentes requera la inclusin de mucho ms conocimiento sobre el Weld, 1994] son agentes soft.ware que recorren Internet buscando la informacin que ellos creen
dominio de aplicacin. Los ltimos aos de la dcada de los 70 y los primeros de la dcada de los que puede ser de inters pira sus usuarios. La constante presin ejercida para mejorar las capa-
80 vieron el desarrollo de programas ms realistas, que contenan el conocimiento necesario para cidades de los robots y de los agentes software motivar y guiar la investigacin en inteligencia
mimetizar el comportamiento de los expertos humanos en tareas tales como el diagnstico, el artificial durante muchps aos.
Plan del libro
La investigacin en lA ha conducido al desarrollo de numerosas ideas y tcnicas relevantes diri-
gidas al objetivo de automatizar la inteligencia. En este libro, estas ideas y tcnicas sern descritas
en el contexto de una serie de agentes cada vez ms capaces y complejos. Hay muchos tipos de
agentes y entornos que podramos considerar. Por ejemplo, podemos imaginar robots que traba-
jen en las condiciones de gravedad cero del espacio exterior, en las aguas oscuras de los fondos
ocenicos, en edificios de oficinas o en factoras, o en el mundo simblico de Internet. Pero estos
agentes prcticos del mundo real son a veces demasiado complejos para ilustrar de forma trans-
parente los conceptos de la lA en los que se basa su inteligencia. En su lugar, lo que haremos ser
introducir una serie de agentes de juguete en un entorno ficticio al que llamaremos mundo
espacial cuadriculado. Aunque este mundo simple es fcil de describir, podemos aadirle cier-
ta complejidad para hacerlo suficientemente rico como para que requiera inteligencia en sus
agentes.
El mundo espacial cuadriculado es un espacio tridimensional demarcado por una matriz
bidimensional de celdas a la que llamaremos suelo. Cada celda puede contener objetos que
tienen diversas propiedades, y pueden existir paredes delimitando conjuntos de celdas. Los
agentes estn confinados en el suelo y pueden moverse de celda a celda. Los objetos pueden
estar en el suelo o colocados sobre una pila de otros objetos apilados sobre el suelo. A veces,
usaremos slo el subespacio bidimensional definido por el suelo. En la Figura 1.2 se muestra un
ejemplo tpico de mundo espacial cuadriculado, en el que hay dos robots. Uno de ellos es un
robot bidimensional sencillo, con sensores para percibir si las celdas adyacentes estn o no libres
para moverse a ellas; el otro, ms complejo, dispone de un brazo con el que puede manipular
objetos.
Los lectores ya familiarizados con la bibliografa sobre lA reconocern fcilmente que el
mundo espacial cuadriculado puede ser particularizado a algunos de los muchos mundos uti-
lizados en la investigacin sobre lA, incluyendo el mundo de bloques, el mundo del mosaico
[Pollack y Ringuette, 1990], el mundo de los wumpus [Russell y Norvig, 1955, pp. 153 Y ss.] yel
\
Figura 1.2.
\
Mundo espacial cuadriculado.
Introduccin
mundo de las hormigas [Koza, 1992, pp. 54 Y ss.]. Todos ellos son mundos discretos, en el sen-
tido de que existe un nmero finito de posiciones, de agentes, de objetos y de instantes de tiem-
po. Muchas de las tcnicas de la lA que describiremos en el libro se aplican a mundos discretos
y requeriran un cierto procesamiento subsimblico para operar en mundos continuos.
Comenzaremos estudiando los agentes reactivos, que disponen de varias modalidades
sensoriales para percibir sus mundos y de distintas formas de actuar sobre ellos. Los ms com-
plejos tendrn tambin la capacidad de recordar propiedades y de almacenar modelos internos del
mundo. En todos los casos, las acciones decididas por los agentes reactivos sern funcin del
estado actual y de los estados anteriores de sus mundos -tal como ellos los perciben y los
recuerdan-o Los agentes reactivos pueden disponer de procesos perceptivos y motores muy com-
plejos. Aunque trataremos el tema de la percepcin visual con algn detalle (en el Captulo 6), el
espacio no nos permite incluir temas relativos al control de bajo nivel del movimiento de un
robot.
Muchos sistemas de lA utilizan algn tipo de modelo o representacin de su mundo y de sus
tareas. Usaremos el trmino modelo en su sentido ms amplio, definindolo como cualquier
estructura simblica que se correlacione suficientemente con el mundo real, incluyendo en l al
conjunto de computaciones que proporcionan al agente informacin til sobre el mundo. Esta
informacin puede ser relativa al estado actual del mundo o relativa a posibles estados futuros del
mundo. Conforme vayamos avanzando a lo largo del espectro que abarca desde los agentes ms
simples a los ms complejos, iremos atravesando las fronteras que separan las distintas clases de
sistemas de lA.
Hay un tipo de modelos, a los que llamaremos icnicos, que utilizan estructuras de datos y
algoritmos para simular diferentes aspectos del entorno del agente y diferentes efectos de las
acciones del agente sobre ese entorno. Un ejemplo de representacin icnica es la representacin
del estado del juego en el ajedrez mediante una matriz de celdas de tamao 8 x 8, celdas que pue-
den estar ocupadas por las distintas piezas de ajedrez. Un modelo de ajedrez icnico es com-
pleto en el sentido de que contiene informacin sobre la localizacin de todas las piezas.
El otro tipo de modelo que usaremos es el que llamaremos modelo basado en caractersticas.
Este tipo de modelo utiliza descripciones declarativas del entorno. En el ajedrez, por ejemplo, dos
caractersticas podran ser si se ha hecho ya un enroque y el nmero de veces en las que se ha
dado jaque al rey. Un conjunto de caractersticas descriptivas es casi siempre incompleto -lo
cual es una virtud de las representaciones basadas en caractersticas, ya que las hace tolerantes a
los inevitables huecos que siempre existen en el conocimiento del agente sobre mundos com-
plejos.
El siguiente tipo de agentes que estudiaremos tendr la habilidad de anticipar los efectos de
sus acciones y de seleccionar aquellas que supuestamente le conducirn hacia sus objetivos. Se
puede decir que tales agentes realizan planes. Para algunos investigadores, esta capacidad es cr-
tica para la inteligencia; para ellos, es ah donde comienza la lA. Los agentes que actan en mun-
dos que no pueden ser perfectamente percibidos y modelados tambin necesitarn constatar si sus
acciones tienen o no los efectos que predijeron.
Muchos mundos espaciales cuadriculados tendrn restricciones implcitas que son anlogas
a las propiedades de los mundos reales. Por ejemplo, si un objeto est en una posicin, no puede
estar en otra al mismo tiempo. Los agentes que son capaces de tener en cuenta estas restricciones
sern usualmente ms efectivos. La siguiente serie de agentes que estudiaremos estar formada
por aquellos capaces de razonar; podrn deducir propiedades de sus mundos que estn impl-.
citas en las restricciones.
Finalmente, consideraremos agentes que existen en mundos habitados por otros agentes. Para
comportarse de forma efectiva tendrn que anticipar lo que otros agentes podran hacer e influir
sobre ello. En estos casos, la comunicacin entre agentes es en s misma una accin importante.
12
13
A lo largo del espectro de agentes de complejidad creciente, tambin consideraremos mto-
dos mediante los cuales los agentes pueden aprender sobre su entorno. La capacidad de aprender
es, junto con la capacidad de planificar, uno de los aspectos bsicos de la inteligencia, de acuer-
do con [Russell y Wefald, 1991, p. 8], quienes escribieron:
El aprendizaje es una parte importante de la autonoma. Un sistema es autnomo en la
medida en que su comportamiento est determinado por sus entradas actuales y por sus expe-
riencias pasadas, antes que por sus diseadores. Los agentes normalmente se disean para
una clase de entornos, de tal forma que cada miembro de la clase es consistente con lo que el
diseador conoce sobre lo que el entorno podria tener reservado para el agente. Pero un sis-
tema que opera sobre la base de suposiciones preprogramadas slo operar correctamente
cuando estas hiptesis se cumplan, y, por tanto, no ser muy flexible. Un sistema verdade-
ramen.! autnomo debera ser capaz de operar correctamente en cualquier entorno, siempre
que se le d tiempo suficiente para adaptarse. Para ello, las estructuras de conocimiento inter-
nas del sistema deberan ser construibles, en principio, a partir de su experiencia en el mun-
do. No hay que confundir los sistemas autnomos con sistemas tabula rasa. Un punto
medio razonable consiste en disear sistemas cuyo comportamiento est predeterminado en
gran parte, al menos inicialmente, por el conocimiento del diseador, pero haciendo que estas
suposiciones sean tan explcitas como sea posible y susceptibles de ser cambiadas por el
agente. Este sentido de autonoma parece corresponderse razonablemente bien con nuestra
nocin intuitiva de inteligencia.
Adems del uso del espacio cuadriculado como mundo bsico para ilustrar las tcnicas de IA,
recurso que nos permitir unificar y focalizar nuestro tratamiento, mencionaremos de paso algu-
nas aplicaciones importantes a problemas reales.
Lecturas y consideraciones adicionales
Para una discusin contra el uso del Test de Turing (lo cual, desgraciadamente, puede ser inter-
pretado como un motivo para abandonar la gran meta de la lA de conseguir inteligencia de nivel
humano) vase [Hayes y Ford, 1995]. El Test de Turing tambin desempea un papel importan-
te en la novela Galetea 2.2 [Powers, 1995].
Tanto la aproximacin ascendente en la IA, como la aproximacin descendente, han estado
inspiradas en estudios sobre comportamiento humano y animal. Los partidarios de la aproxima-
cin ascendente tienden a focalizar su atencin sobre el comportamiento (usualmente simple), que
puede ser conseguido mediante el ensamblado de elementos computacionales de tipo neuronal o
de puertas lgicas. Se han creado y utilizado diversos modelos computacionales de comporta-
miento animal, como los estudiados por los etlogos. Muchos de los modelos evolutivos y de los
llamados modelos basados en comportamiento derivan de los modelos animales. Para una dis-
cusin ejemplar sobre el paralelismo entre animales y robots, [vase, Anderson y Donath, 1990,
y Beer, Chiel y Sterling, 1990].
Los investigadores partidarios de la aproximacin ascendente y los neurocientficos han
desarrollado modelos de redes neuronales que pretenden explicar ciertos fenmenos perceptua-
les y motores de los humanos, tales como los estudiados por los psiclogos. Algunos ejemplos
son las redes que aprenden a pronunciar palabras a partir de texto escrito [Sejnowski y Rosen-
berg, 1987]; las redes que reconocen caracteres alfanumricos variables en tamao, orientacin y
posicin [Minnix; McVey, e Iigo, 1991]; y las redes que perciben letras y son sensibles al
contexto [McClelland y Rumelhart, 1981, y McClelland y Rumelhart, 1982].
Introduccin
Cuando los investigadores partidarios de la aproximacin descendente se inspiran en mode-
los animales y humanos, tienden a focalizar su atencin en aquellos aspectos que mejor se
adaptan al modelado mediante operaciones de procesamiento de smbolos. Ello incluye a diver-
sas tareas de resolucin de problemas, del lenguaje y de la memoria, tales como las estudiadas por
la psicologa cognitiva. Dos pioneros en el desarrollo de modelos de resolucin de problemas de
nivel humano son Herbert Simon y Allen Newell (vase [Newell y Simon, 1972, y Newell
1991]. Para unas revisiones del ltimo libro citado y para la posterior respuesta de Newell, va-
se Artificial Intelligence, vol. 59, 1993.) Para ms informacin sobre las relaciones entre las cien-
cias cognitivas y las ciencias de la computacin, vase [Johnson-Laird, 1988].
Naturalmente, siempre podramos adoptar el punto de vista segn el cual la forma en la que
los animales y los humanos alcanzan la inteligencia es completamente irrelevante para el pro-
blema ingenieril del diseo de mquinas inteligentes. De la misma.,forma en que un avin no vue-
la como un pjaro o como un insecto, una mquina inteligente bien diseada, que podra llegar a
ser incluso ms inteligente que cualquier humano, puede diferir sustancialmente de los organis-
mos inteligentes naturales. [Ginsberg, 1996], citando el xito de los mtodos de bsqueda basa-
dos en fuerza bruta (presumiblemente no humanos) en diversos dominios, especula que los
mtodos de pensamiento de las mquinas pueden terminar siendo completamente diferentes a los
de los humanos. Por otra parte, algunos piensan que las arquitecturas de ordenadores (al menos
las actuales) son tan diferentes de los cerebros de los humanos y de los animales que una inteli-
gencia artificial basada en estas arquitecturas tan limitadas jams ser capaz de duplicar el com-
portamiento humano [Dreyfus, 1979; Dreyfus, 1992, y Dreyfus y Dreyfus, 1986].
La influencia de otras disciplinas cientficas en la lA no siempre puede clasificarse como
orientada a la aproximacin descendente o a la ascendente. Por ejemplo, [McFarland y Bosser,
1993], analizan muchos ejemplos de computacin natural que ocurren en los animales, pero sus
ideas estn estrechamente ligadas a la economa y a la teora de la utilidad. De acuerdo con ellos,
un animal es un agente econmico. Especialmente en el Captulo 3 de su libro se concentran en
el papel que desempea la teora de la utilidad en los modelos animales. Michael Wellman, un
investigador en lA, ha desarrollado una aproximacin a la que llama programacin orientada a
mercados [Wellman, 1996], y [Shoham, 1996] tambin presenta un punto de vista relacionado.
El problema de la definicin de lo que entendemos por comportamiento inteligente es otro
tema que tampoco puede encuadrarse claramente en el marco de las aproximaciones descendente
y ascendente. Basta que un comportamiento sea el correcto para que podamos calificarlo
como un comportamiento inteligente, independientemente de cmo sean los clculos subyacen-
tes a ese comportamiento? Existen dos puntos de vista sobre ello, que son ms bien contrapues-
tos. De acuerdo con [McFarland y Bosser, 1993, p. 6], el comportamiento inteligente es el com-
portamiento capaz de alcanzar la respuesta correcta, independientemente de cmo se llegue a la
respuesta. Pero, en opinin de [Russell y Wefald, 1991, p. 1], ... existen restricciones insalvables
sobre las capacidades de razonamiento de cualquier sistema fsico que hacen que sea imposible
garantizar la respuesta correcta en todas las circunstancias. Por tanto, el diseador de un sistema
inteligente debe olvidarse del problema de la obtencin de la respuesta correcta, y concentrarse en
el diseo del sistema correcto ... . Este punto de vista conduce a Russell y Wefald a proponer una
aproximacin basada en la racionalidad acotada. Sostienen que un agente inteligente siempre
debe decidirse entre dos tipos de acciones: la accin sobre el mundo real y la accin computa-
cional orientada a la obtencin de una buena estimacin de cul sera la mejor accin sobre el
mundo real (vase tambin [Russell, 1997]).
Ciertamente, hay que admitir que los problemas computacionales ponen un lmite a aquello
que puede ser conseguido por un sistema inteligente. Se ha trabajado mucho sobre el problema de
las computaciones tratables (esto es, resolubles en tiempo y espacio polinomial) desde el
punto de vista del anlisis de la complejidad computacional [Garey y Johnson, 1979]. Pero el an-
14
15
lisis de la complejidad computacional se dirige usualmente al peor caso (en lugar de al caso
promedio). Es bien sabido que muchas de las computaciones de inters en lA tienen compleji-
dad exponencial en el peor caso. Por tanto, la forma apropiada de responder a aquellos que se pre-
ocupan por la intratabilidad de muchos algoritmos de lA consiste en decir que lo que buscamos
son algoritmos con una buena eficiencia en el caso promedio, y que, en muchas situaciones, tam-
bin son aceptables las soluciones aproximadas y no ptimas.
La especificacin de una progresin de agentes cada vez ms verstiles, en correlacin con
algunos de los pasos de la evolucin de la inteligencia en los animales, no es una perspectiva nue-
va. [Dennet, 1995, pp. 373 Y ss.], propone una secuencia evolutiva de agentes similar a la nues-
tra, y a la que denomina como Darwiniana, Skinneriana, Popperiana y Gregoriana.
Aunque an estamos muy lejos de crear sistemas con una inteligencia general de nivel
humano, es importante preguntarse cules seran las consecuencias en caso de conseguirlo.
Obviamente, la disponibilidad de robots, softbots, sistemas para lenguaje natural y sistemas
expertos poco costosos tendra, de entrada, unos efectos econmicos importantes. El uso de estos
sistemas conducira a un desempleo masivo o, por el contrario, creara ms puestos de trabajo que
los que destruira, como de hecho ya ocurri con otros avances tecnolgicos en el pasado?
Pero, qu pasara si la mayora de los nuevos puestos de trabajo creados pueden ser, a su vez,
cubiertos por mquinas inteligentes? (Para algunas de mis anteriores opiniones sobre este tema,
vase [Nilsson, 1984a].) Joseph Weizenbaum [Weizenbaum, 1976] encuentra preocupante un pro-
blema algo diferente: el peligro de utilizar la lA para tareas y dominios en los que l cree que es
inapropiada, tales como la abogaca, la enseanza y la justicia. Los sistema automticos a veces
crean la ilusin de que son capaces de realizar tareas que realmente no pueden, por lo que existe
el peligro de depositar una confianza prematura en estos sistemas. Pero, en compensacin, exis-
te el riesgo de no utilizar sistemas automticos que realmente pueden realizar ciertas tareas con
menos errores que ningn humano. Para una coleccin de ensayos sobre las diversas reas de
impacto de la lA, vase [Trappl, 1986].
Quiz el impacto ms profundo de la lA radicar en los efectos que podra tener sobre
nuestra comprensin de nosotros mismos. Coprnico y los astrnomos posteriores nos despla-
zaron desde nuestra posicin en el centro del universo hasta un pequeo planeta en una de las
innumerables galaxias. Darwin y los evolucionistas posteriores nos desplazaron desde el centro
de la creacin hasta nuestro lugar actual entre incontables formas de vida basadas en el ADN.
Estos cambios de perspectiva fueron difciles de aceptar para algunos. Qu cambios nos esperan
si somos capaces de construir mquinas tan inteligentes como nosotros?
Cerraremos esta seccin con una breve lista de fuentes generales de informacin sobre la lA.
En los captulos sucesivos iremos aumentando esta lista con referencias relativas a los diferentes
temas que abordaremos. Algunas de las revistas ms importantes en el campo de la lA son Arti-
ficial lntelligence, la revista electrnica Journal ofArtificiallntelligence Research, Computa-
tionallntelligence y Journal ofExperimental and Theoretical Artificiallntelligence. Los princi-
pales congresos son la Conferencia Nacional sobre Inteligencia Artificial (National Conference on
Artificial Intelligence), que es un congreso anual organizado por la Asociacin Americana para la
Inteligencia Artificial (AAAI, American Association for Artificial Intelligence), y la Conferencia
Internacional Conjunta sobre Inteligencia Artificial (IJCAI, International Joint Conference on
Artificial InteIligence), que es bienal. Algunos pases y regiones tambin celebran congresos
cuyas actas se publican -por ejemplo, la Conferencia Europea sobre Inteligencia Artificial
(ECAI, European Conference on Artificial Intelligence)-. La AAAI celebra tambin los Sym-
posia de Primavera (Spring Symposia) y las Reuniones de Trabajo en Otoo (Fall Workshops), en
los que los investigadores comunican y discuten las ideas recientes. La Association for Compu-
ting Machinery (ACM) dispone de un grupo especial de inters en lA (SIGART) que publica un
boletn, y laAAAI publica el boletn Al Magazine.
Introduccin
La revista PC Al publica artculos sobre aplicaciones de las tcnicas de lA -concentrndo-
se en sistemas expertos y sistemas de ayuda a la decisin-o La revista Engineering Applications
of Artificial lntelligence (EAAI) contiene artculos sobre sistemas en tiempo real. En IEEE
Expert se publica una serie de artculos sobre diferentes laboratorios de lA que existen a lo largo
de todo el mundo y que se dedican a la investigacin aplicada y a la transferencia de tecnologa.
Finalmente, se pueden encontrar buenos resmenes de diversos temas de lA en The Ency-
clopedia ofArtificiallntelligence [Shapiro, 1992], en los volmenes de The Handbook ofArtifi-
ciallntelligence [Barr y Feigenbaum, 1981; Barr y Feigenbaum, 1982; Cohen y Feigenbaum,
1982, y Barr, Cohen y Feigenbaum, 1989], yen Exploring Artificiallntelligence [Shrobe, 1988].
Algunos artculos seminales en diversos subcampos de la lA se publican a menudo en volmenes
con ttulos como Readings in X (donde X toma diferentes valores).
1.1. Escriba una definicin de la palabra mquina. Cree que los humanos son mquinas? Al
margen de lo que crea (quiz s, no, puede ser o no completamente), use su defmicin y propor-
cione alguna evidencia sobre las diferentes habilidades de los humanos en apoyo de su creencia.
1.2. Puede citar algunas de las ventajas prcticas que tendra la implementacin de mquinas
pensantes hechas de protenas (en lugar de
1.3. Suponga que es el interrogador en un Test de Turing. Prepare cinco preguntas dirigidas a X
y/o a Y para determinar quin es humano y quin no.
1.4. Cree que el Test de Turing es apropiado para decidir si una mquina no humana puede pen-
sar o no? Escriba un comentario crtico y proponga al menos una alternativa.
1.5. Algunos investigadores piensan que el objetivo de la lA debera ser construir mquinas que
ayuden a la gente en sus tareas intelectuales en lugar de mquinas que hagan esas tareas. De
manera informal, se suele hablar de lA dbil Y de IAfuerte, respectivamente. Cul es su opinin
y por qu?
Sistemas
reactivos
Si te pones a pensar durante un partido, te pierdes la jugada en la que ests inmerso. Para pen-
sar, ya tienes los entrenamientos de la semana. En esos momentos es cuando te tiene que venir la
inspiracin. Cuando ests en el partido, lo nico que puedes hacer es reaccionar a lo que ves.
Albert Lewis, defensa de los Oakland Raiders, citado por Sam Farmer en el San Jose
Mercury News, pgina ID, 30 de agosto de 1996
Agentes de
ulo-respuesta
Percepcin y accin
En este captulo, analizaremos sistemas que no tienen estados internos y que slo reaccionan a los
estmulos generados por los entornos donde operan. Este tipo de sistemas se denominan agentes
de estmulo-respuesta (agentes E-R). Basndonos en este tipo de comportamiento, podemos
construir una gran variedad de robots capaces de responder a los estmulos que reciben sus
sensores. Uno de los primeros ejemplos de este tipo de robot fue la Machina Speculatrix de Grey
Walter -un dispositivo dotado de motores con ruedas, fotoclulas y dos tubos de vaco [Walter,
1953] que se mova hacia una luz de intensidad moderada y evitaba luces brillantes. Sistemas
similares tambin han sido descritos por Braitenberg [Braitenberg, 1984].
Comenzaremos con un ejemplo ilustrativo. Considrese un robot en un espacio bidimensio-
nal cuadriculado, tal como se observa en la Figura 2.1. El mundo de este robot est completa-
mente limitado por una frontera y puede contener a su vez otros objetos inmviles de gran
tamao, como el que se muestra en la figura. No existen pasillos estrechos* (los espacios entre los
objetos y la frontera deben ser de, al menos, dos celdas de longitud) y, por tanto, el diseo de
nuestro robot deber tener en cuenta este hecho.
El robot debe seguir la siguiente pauta de comportamiento: ir a una celda fronteriza, o que
limite con un objeto, y seguir su permetro indefinidamente. Para poder mostrar esta pauta de
comportamiento, el robot debe ser capaz de percibiD> si una determinada celda est libre para ser
ocupada o no, y para ello debe llevar a cabo las acciones primitivas que correspondan.
El robot puede percibir si cada una de las ocho celdas con las que limita estn libres o no. De
esta forma, podemos decir que nuestro sistema (el robot) dispone de ocho entradas sensoriales a
las que asociaremos las variables binarias SI' S2' S3' S4' ss' S6' S7 Y ss' Estas variables tomarn el
valor O siempre que la correspondiente celda (relativa a la posicin del robot, tal como se mues-
* Para la elaboracin de la condicin por la que no pueden existir pasillos estrechos se puede consultar
www.mkp.comlnils/clarified. (N. del T.)
19
El robot percibe si las ocho
celdas que le rodean
estn libres u ocupada.<;
Frontera exterior
Un robot que comience aqu se mover Un robot que comience aqu se mover
en sentido contrario a las agujas del reloj en el sentido de las agujas del reloj a lo largo
alrededor del permetro del objeto de la parte interna de la frontera exterior
Figura 2.1.
Robot en un mundo de tres dimensiones cuadriculado.
tra en la Fig. 2.1) pueda ser ocupada por el robot; en otro caso, las variables tomarn el valor 1.
Si el robot estuviera en la posicin marcada por una X, los valores de las entradas sensoriales
(empezando por SI y siguiendo en el sentido de las agujas del reloj) seran (0,0,0,0,0,0,1,0).
El robot puede moverse a una celda libre adyacente que est en su osma fila o columna. Por
tanto, existen cuatro movimientos posibles:
1. norte mueve el robot una celda hacia arriba.
2. este mueve el robot una celda a la derecha.
3. sur mueve el robot una celda hacia abajo.
4. oeste mueve el robot una celda a la izquierda.
Todas estas acciones producen los efectos arriba indicados, a no ser que el robot intente
m o v ~ r s a una celda que no est libre, en cuyo caso la accin no tendra efecto.
Por tanto, dadas las propiedades de los mundos en los que el robot puede habitar (como, por
ejemplo, el de la Fig. 2.1), concretada la tarea que tiene que desarrollar el robot (seguir los bor-
des) y establecidas sus capacidades sensoriales y motrices, el trabajo del diseador consiste en
especificar una funcin, definida sobre las entradas sensoriales (en el ejemplo, SI' , SR) que selec-
cione la accin apropiada en cada momento para llevar a cabo con xito la tarea que el robot tie-
ne encomendada. Para realizar el diseo, lo habitual sera dividir el clculo de una accin, a par-
tir de las seales sensoriales, en dos fases distintas, como se muestra en la Figura 2.2. En la fase
Agentes de estmulo-respuesta
Significados asignados
por el diseador:
Vector de
caractersticas, X
o,
~ Pared prxima
El robot se encuentra
en una esquina
-------------
Entradas
sensoriales
Procesamiento
perceptual
)01
Funcin para la
seleccin de accin
1
Accin
Figura 2.2.
Componentes de percepcin y accin.
de procesamiento perceptual se genera un vector de caractersticas X =(Xl' X2 X3 , Xg), yen la
fase de clculo de la accin se selecciona una accin teniendo en cuenta dicho vector de carac-
tersticas. Los valores de este vector de caractersticas pueden ser nmeros reales (caractersticas
numricas), o bien categoras (caractersticas categorizadas, es decir, aquellas cuyos valores son
nombres o propiedades; por ejemplo, el valor de la caracterstica color puede ser rojo,
azul o verde). Las caractersticas binarias constituyen un caso especial, ya que pueden ser
consideradas como caractersticas numricas (0,1) o categorizadas (V, o Verdadero, y F, o Falso).
El diseador debe seleccionar las caractersticas a utilizar, de tal forma que stas se correlacionen
con las propiedades del entorno del robot que son relevantes para la seleccin de la accin a
tomar, teniendo en cuenta el estado indicado por dichas caractersticas.
Por supuesto, la divisin entre percepcin y accin es completamente arbitraria. Podramos
desplazar todo el proceso hacia la percepcin (el mundo se percibe como un estado en el que la
accin norte es posible) o hacia la accin (se obtiene la accin norte realizando el clculo direc-
tamente sobre las entradas sensoriales). Normalmente, esta divisin se realiza de manera que las
mismas caractersticas puedan ser usadas en otras tareas que el robot tenga que desarrollar.
Estas tareas pueden tener el mismo vector de caractersticas, pero diferentes funciones para el
clculo de la accin. Si comparamos esto con un programa, el clculo de las caractersticas a
partir de las entradas de los sensores se puede asemejar al uso de las funciones de una librera
-usadas para el clculo de acciones por diferentes funciones- por parte de un programa. La
decisin de cmo dividir estos dos procesos forma parte del arte'de disear estos sistemas -y
aqu no tenemos mucho que decir sobre arte.
Despus de decidir cmo realizar la divisin, hay que resolver dos problemas: (1) la con-
versin de los datos primitivos que vienen de los sensores en un vector de caractersticas, y (2) la
especificacin de la funcin para el clculo de la accin. Estos problemas sern analizados bre-
vemente en el contexto del ejemplo.
22
23 Inteligenciaartificial.Unanuevasntesis
2.1.1. Percepcin
Las entradas sensorialesde nuestro robotestnrepresentadas porlos valores de las variables
sI> ...,S8' Portanto,existen2
8
=256combinacionesposiblesdeestosvalores.Ennuestroentorno,
ciertascombinacionespuedenserdescartadasdebidoalacondicinqueprohibelaexistenciade
pasillosestrechos.Paralatareaqueestamosconsiderando,sepuedendefinircuatrocaractersti-
casbinarias,definidassobrelasvariablessensoriales,quenospuedenayudarparaelclculode
lasacciones.AestascaractersticaslasdenominaremosXI'X
2
' X
3
Y X
4
' Y sudefinicinpuedeser
examinadaenlaFigura2.3. Porejemplo,Xl = 1si,Y slosi,S2 = 10$3= 1.
Enesteejemplo,elprocesamientoperceptualestformadoporunosclculosrelativamente
simples.Sinembargo,enmundosmscomplejosyconrobotsqueposeanunsistemasensorial
mselaboradoyquedesarrollentareasmsdifciles,eldiseodeunprocesamientoperceptual
adecuadopuedeserunatareabastantemscomplicada.Adems,hayquetenerencuentaqueen
muchasdelastareasqueexistenenelmundoreal, elprocesamientoperceptualpuedeproducir
ocasionalmenteinformacinerrnea,incompletaoambiguasobreelentornodelrobot. Estetipo
deerrorespuedellevaraunaseleccininadecuadadelaaccinatomar,aunque,dependiendode
latareaydelentorno,existelaposibilidaddequeestasaccionesmalseleccionadasnoproduzcan
undaoirreparable,siempreycuandostasseanpocofrecuentes. EnelCaptulo6volveremosa
tratarel temadelapercepcin.
2.1.2. Accin
Dadaslascuatrocaractersticasdefinidasenlaseccinanterior,el siguientepasoquedebemos
abordarconsisteenladefinicindeunafuncindedichascaractersticas,quenosproporcionela
accin adecuada para llevar a cabo la tarea de seguimiento de bordes. Primero, nos damos
cuentadequesiningunadela,> caractersticastomaelvalor 1(esdecir,elrobotpercibequetodas
lasceldasquelerodeanestnlibres),entonceselrobotpuedemoverseencualquierdireccinhas-
taqueencuentreunborde. Pordefecto,vamosaasignaraestecasolaaccinnorte. Siempreque
almenosunadelascaractersticastomeelvalor1,latareadeseguimientodebordespuederea-
lizarsecorrectamenteaplicandolassiguientesreglas:
siXI =1Yx
2
=O, moverseal este
six
2
=1Yx
3
O, moversealsur
si x
3
=1Yx
4
O, moversealoeste
siX4 1yXl =O, moverseal norte
XI Xz X
3 X
4
Lacaractersticaindicadaencadadiagramatomarel valor1, si,y slosi,almenosunade
lasceldassombreadasestocupada.
Figura2.3.
Caractersticasusadasporlatareadeseguimientodebordes.
Agentesdeestmulo-respuesta
Dalacasualidaddequelascondicionesbajolascualeselrobotdebetomarestasaccionesson
combinacionesbooleanasdelascaractersticas.Delamismaforma,lascaractersticasson,asu
vez,combinacionesbooleanasdelasentradassensoriales.Yaquealgunossistemasperceptuales
yalgunosdelosmtodosdeseleccindeaccionesmsimportantesimplicanelusodefunciones
booleanas,vamosahacerunparntesisparaexaminarmsdetenidamenteesteconceptoantesde
continuarconelejemplo.
2.1.3. lgebrabooleana
Unafuncin booleana,j(xl'x
2
' ... , x
n
) hacecorrespondera unan-tupladeOy 1un valorOo un
valor1. El lgebrabooleanaeselmedioadecuadoparalarepresentacindeestetipodefuncio-
nes. Ellgebrabooleanautilizalasconectivas, " + y-.Porejemplo,lafunciny aplicadaados
variablesseescribeXl x
2
' aunque,porconvenio,seomitelaconectivaylafunciny seescribe
X
I
X
2
LafuncinX
l
X
2
tomaelvalor1si,y slosi,Xl yx
2
tienenelvalor1:encualquierotrocaso,
tomarelvalorO. La funcino (oinclusiva)dedosvariablesseescribeXI +X
2
Ytomaelvalor1
si algunadelas variablestieneelvalor 1; encualquierotrocaso,tomarelvalorO. Elcomple-
mento o negacin deunavariable,x, seescribe ytomarel valor 1si, y slosi, lavariableX
tieneel valorO; enotrocaso,tomarelvalorO.
Estasdefinicionessepresentandeformamscompactapormediodelassiguientesreglasdel
lgebrabooleana:
1+ 1== 1, 1+ O=1, O+ O=O
1.1=1, 1.O== O, O.O== O
T=0,0=1
Ennuestroejemplo,lacondicinporlaquenuestrorobotdebemoverseal norteestdadapor
laexpresinXI X
2
X
3
X
4
+x
4
xl' Adems,ennuestroejemplolafuncinquecalculalascaracters-
ticas a partirdelassealessensorialeses tambinbooleana. Porejemplo,x
4
= SI + S8' Lasres-
tantescaractersticasyreglasdeaccinsepuedendescribirporfunciones similares.
Algunasveces,losargumentosy valoresdeunafuncinbooleanaseexpresanpormediode
lasconstantesV (Verdadero) y F (Falso) enlugardeutilizarel1yelO, respectivamente.
Lasconectivasy+ sonconmutativas.Deestemodo,X
I
X
2
=X:XI YXI + x
2
x
2
+XI' Tambin
sonasociativas:X(X
2
X
3
) =(XX
l
)x3 yXl + (Xl + x
3
) == (Xl + X
2
) + X
3
Portanto,sepuedeneliminarlos
parntesisy escribirlasexpresionesdelaformaXX:X3 Y XI + x
2
+ x
3
sinningunaambigedad.
Una frmula booleanaqueestcompuestasolamenteporunavariable, porejemploXl' se
denominatomo. Unafuncinqueestcompuestaporunavariableosucomplemento,como,por
ejemploXI , sedenominaliteral.
Elordendelasconectivasy+ nopuedecambiarseenexpresionescomplejas.Ensulugar,
deberemosutilizarlasleyesdeDeMorgan(quepuedenserverificadasaplicandolasdefiniciones
expresadasenprrafosanteriores):
J;fz =; +fz
J;+ll=
LasleyesdeDeMorgantambinpuedenserutilizadasparasimplificarfunciones booleanas.
Porejemplo,xx
2
=(S2 + S3) (S4+ ss) =(Sl + S3)
Otraleyimportanteeslaley distributiva:
fiJ/2 +13) =/ fz+Id3
24
25
2.1.4. Clasesy formasdelasfuncionesbooleanas
Unafuncin booleanapuede serexpresadademuy diversas maneras. Unade lasformas ms
comunesdeexpresarlaconsisteenescribirlaenlaformaAAz"'Ak' dondecadaA esunliteral. Una
funcinescritadeestaformasedenominaconjuncin deliteralesomonomio, ylaconjuncinen
smismaesuntrmino delafuncin.AlgunosejemplosdetrminossonXIX? YX]X
2
X
4
' Eltamao
deuntrmino viene determinadoporel nmerodeliteralesquecontiene.Enlosejemplos,los
tamaosdelostrminosson2y 3,respectivamente.
Sepuededemostrarfcilmentequesepuedenformar3
n
monomiosdistintosconn variables
(Ejercicio2.4).Ellmitesuperiordel nmerodemonomiosdetamaomenoro igual a k viene
dadoporlasiguienteexpresin:
L
k
C(2n, i) O(n
k
),
,:0
donde:
.,
E.
C(i, j) =(i-
eselcoeficientebinomial.
Unaclusula esunaexpresindelaformaA] + Az + ... + A
k
, dondecada1.; esunliteral. Una
frmula escritade esta manera tambin recibe el nombre de disyuncin de literales. Algunos
ejemplosdeclusulasson:x
3
+x
j
+ x
6
Yx] +X
4
Eltamao deunaclusulavienedeterminadopor
elnmerodeliteralesquecontiene. Sepuededemostrarfcilmentequeelnmerodeposibles
clusulasdetamaomenoroigualak vienelimitadoinferiormentepor I.::oC(2n, i) ysuperior-
mentepor3
n
Sifes untrmino,entonces(aplicandolasleyesdeDeMorgan)]esunaclusula,
yviceversa.Portanto,trminosyclusulassondistintasformasdeexpresarlamismafuncin.
UnafuncinbooleanaestenForma Normal Disyuntiva (FND) si sepuedeescribircomo
unadisyuncindetrminos.AlgunosejemplosdeFNDson:f =x]x
2
+ Yf = xx
3
+ X
2
X
3
+
+ TodafuncinbooleanapuedeserescritaenFND.UnaexpresinFNDsedenominaFND
dek-trminossiconsisteenunadisyuncindek trminos.Sedicequepertenecealaclasek-FND
sieltamaodelmayortrminoesk. LosejemplosanterioressonFNDde2-trminosyde3-tr-
minos,respectivamente,aunqueambaspertenezcanalaclase3-FND.
LaformanormaldisyuntivatienesurecprocoenlaForma Normal Conjuntiva (FNC).Sedice
queunafuncinbooleanaestenFNCsipuedeserexpresadacomounaconjuncindeclusulas.Un
ejemplodeFNCesf =(x] + +x
3
+x
4
). Todaslasfuncionesbooleanaspuedenserexpresadas
comoFNC.UnaexpresinFNCsedenominaFNCdek-clusulassiestexpresadacomounacon-
juncindek clusula"ypertenecealaclasek-FNC sieltamaode lamayorclusulaesk. Laexpre-
sindelejemploprevioesunaFNCde2-clusulasypertenecealacla<;e 3-FNC.Cualquierexpresin
FNCsepuedeconvertiraunaexpresinFNDaplicandolasleyesdeDeMorgan,yviceversa.
Representacin e implementacin de las funciones para la seleccin
de acciones
Pararealizarlaseleccindeacciones,debemosconstruirunafuncin,defmidasobreel vectorde
caractersticas,quetengaR valoresdesalidadistintos, suponiendoqueexistenR posiblesaccio-
nesaelegir.Sehaninvestigadovariasformasderepresentareimplementarestetipodefunciones,
delascualesdescribiremos algunasenlassiguientessecciones.
2.2.1. Sistemasdeproduccin
Los sistemas de produccin proporcionan unarepresentacin adecuada paralas funciones de
seleccindeacciones. Unsistemadeproduccinestformadoporunconjuntodereglasdeno-
minadasreglas de produccin, o simplementeproducciones. Cadareglaseescribedelasiguien-
temanera: c -7a, dondeC eslacondicin, ya eslaaccin. Portanto,unsistemadeproduccin
estformadoporunconjuntonovacodeestetipodereglas:
-7al c
l
c
2
-7a
2
c -7a
cm -7am
Lacondicindeunareglapuedesercualquierfuncinbooleanadefinidasobreelvectorde
caractersticasque,comoyasehaindicado,secalculaapartirdelasentradassensoriales.Nor-
malmente,lafuncinesunmonomio(unaconjuncindeliteralesbooleanos).Laseleccindela
accinserealizadelasiguientemanera: secomienzaconlaprimeraregla,ennuestroejemplo
c -7al' sebusca,siguiendoelordenestablecidoenelconjuntodereglas,unadeellasenlaque
laevaluacindesucondicinproporcioneelvalor1,Yseseleccionasupartedeaccin.Lapar-
tedeaccinpuedeserunaaccinprimitiva,unallamadaaotrosistemadeproduccinouncon-
junto de acciones que tienen que ser ejecutadas simultneamente. En la mayor parte de los
casos,laltimaregladelconjuntotienecomocondicinelvalor1,y, portanto, siningunadelas
condicionesdelasreglasanteriorestomaelvalor1, seejecutapordefectolaaccinasociadaa
estaltimaregla.Amedidaquesevanejecutandolasacciones,sevanmodificandolasentradas
sensoriales,ascomolosvaloresdelascaractersticasderivadosapartirdeaquellas.Portanto,las
condicionesdelasreglasdebensercomprobadascontinuamente,detalformaqueunaaccineje-
cutadaencualquierinstantesecorrespondeconlaprimerareglacuyacondicintomaelvalor1
endichoinstante.
Volviendoalatareadeseguimientodebordesdenuestrorobot,y aplicandoellgebraboo-
leana,obtenemosel siguientesistemadeproduccin:
X
4
X -7norte
X
3
X
4
-7oeste
X
2
X
3
-7sur
-7este
1-7norte
Elcomportamientomostradopornuestrorobotal seguirlosbordesesunejemplodeproce-
so sin fin, esdecir, elrobotcontinaejecutandoaccionesdeformaindefinida.Sinembargo,exis-
tenotrastareasquerequierenquelasaccionessloseejecutenhastaquese alcancealgnobje-
tivopredefinido,parandotodaactividadunavezalcanzado. Generalmente,elobjetivoseexpre-
sacomounacondicinbooleanadelascaractersticas.Porejemplo,supongamosqueenvezde
dejaranuestrorobotseguirunbordedeformaindefinida,queremosquesteparecuandoalcan-
ceunaesquinacncava.Supongamosqueexisteunacaractersticaadicionalquetomael valor1
26
27
cuando el robot est en una esquina cncava; entonces el siguiente sistema de produccin lleva-
r al robot hasta una esquina cncava (si sta existe):
c -? nil
1 -? s-b.
En este ejemplo, la accin ni/, representa la accin nula, es decir, una accin que no produce
ningn efecto, y s-b es la tarea de seguimiento de bordes que acabamos de definir.
En los sistemas de produccin dirigidos por objetivos, la condicin de la primera regla de la
lista (es decir, la primera en ser comprobada) define el objetivo general que persigue el sistema.
Siempre que dicha condicin se satisfaga, el sistema no ejecutar accin alguna. Si esta condicin
no se verifica, pero se satisface la condicin de la segunda regla, entonces se ejecutar la accin
correspondiente a la segunda regla, que en la mayor parte de los casos acercar al sistema hacia
el objetivo general. Con el resto de las reglas se procede de igual manera. Este tipo de sistemas de
produccin es la base de un formalismo denominado programas Teleo-Reactivos, o programas
T-R [Nilsson, ]994]. En un programa T-R, cada accin ejecutada correctamente acerca al agente
al cumplimiento de alguna condicin asociada a las regla., que la preceden. Estos sistemas de pro-
duccin son fciles de programar, siempre y cuando el objetivo general del agente est bien defi-
nido (expresado como una condicin booleana de las caractersticas). Los programas T-R tambin
son bastante robustos, ya que todas las acciones conducen inexorablemente al agente hacia el
objetivo general. Los contratiempos que ocasionalmente puedan aparecer, debidos a una per-
cepcin errnea, debidos a acciones ejecutadas incorrectamente o debidos a procesos externos del
entorno, pueden ser recuperados siempre que el sistema de percepcin sea razonablemente preci-
so y las acciones produzcan los efectos deseados l. Adems de estas caractersticas, los programas
T-R pueden contener parmetros que son fijados en el momento que los programas son llamados
y, a su vez, pueden llamar a otros programas T-R, incluso a ellos mismos de forma recursiva.
2.2.2. Redes
Como acabamos de ver, se pueden construir programas que implementen funciones booleanas y
sistemas de produccin de una forma sencilla. Alternativamente, los sistemas de produccin se
pueden implementar directamente por medio de circuitos electrnicos 2. El circuito puede tener
como entradas las propias seales sensoriales. Utilizando circuitos lgicos, una funcin boolea-
na se puede implementar mediante una red de puertas lgicas (ANO, NANO, OR, etc.). Un tipo
muy comn de circuito lo constituyen las redes formadas por elementos con umbralo por algn
otro tipo de elemento que aplique una funcin no lineal sobre una suma ponderada de sus
entradas. Un ejemplo de este tipo de elementos es la Unidad Lgica con Umbral (ULU), que se
muestra en la Figura 2.4. Esta unidad realiza una suma ponderada de las entradas, compara esta
suma con un umbral y, si supera el umbral, produce como salida un 1; en cualquier otro caso,
produce un O.
Las funciones booleanas que pueden ser implementadas mediante una ULU se denominan
funciones linealmente separables (el nombre se debe a que una ULU separa el espacio de los vec-
Los programas T-R son aquellos que operan de forma dirigida hacia los objetivos y que reaccionan ante las situa-
ciones que se les presentan. El prefijo tdeo se deriva de una palabra griega que significa fin o propsito.
2 A menudo, el comportamiento del circuito es simulado por algn programa de simulacin ejecutndose en un
ordenador. Sin embargo, pensar en trminos de circuitos nos ayuda a comprender la dependencia dinmica que existe
entre la accin seleccionada y las entradas sensoriales.

Agentes de estmulo-respuesta
XI
x2
Xi
X.
.
1 siLXw<::e
=l
= O en cualquier otro caso
Figura 2.4.
Suma ponderada
txw
Salida,!
)lo Lf I
Umbral, e
Unidad lgica con umbral.
tores de entrada en dos regiones -la de los vectores que quedan por encima del umbral y la de
aquellos que quedan por debajo--- mediante una superficie lineal denominada hiperplano de n
dimensiones). Muchas funciones booleanas, aunque no todas, son linealmente separables. Por
ejemplo, culquier monomio (o conjuncin de literales) o cualquier clusula (o disyuncin de lite-
rales) es linealmente separable. En la Figura 2.5 se muestra una ULU que representa un mono-
mio. Los pesos de las entradas se colocan junto a las correspondientes lneas de entrada, y el
umbral se coloca dentro del crculo que representa a la ULU. Un ejemplo de funcin no separa-
ble es la funcin o-exclusivo de dos variables lf = X1X 2 + XzX2)
Las funciones que se definieron para que el robot pudiera seguir los bordes se pueden
implementar mediante diferentes ULU. Como ejemplo, en la Figura 2.6 se puede ver la ULU que
implementa la funcinf= X
1
X
2
= (S2 +S3) (S4 +ss) = S2 +S3)Sl ss'

X -1
2 )lo 1,5 XI X2X,

Figura 2.5.
Implementacin de un monomio utilizando una ULU.
S2

XIX,
-2
Ss
Figura 2.6.
Implementacin de la funcin para el seguimiento de bordes.
28
29 Inteligenciaartificial. Unanuevasntesis
En aplicaciones donde slo existan dos acciones posibles, puedeocurrirque con unasola
ULUpodamosimplementarlafuncin de seleccin deacciones, siempre y cuandotengamos
comoentradaunarepresentacincoditIcadadelvectordecaractersticas.Sinembargo,parapro-
blemas ms complejos, seguramente sernecesario una red de ULU. Este tipo de circuito se
denominared neuronal, yaquelasULUpuedenserconsideradascomomodelossimplificadosde
lasneuronasbiolgicas,cuyodisparodependedelasumadeintensidadesrecibidasatravsdelas
sinapsis,pudiendostasamplificaroatenuarlaintensidaddelasentradas.Enelsiguientecaptulo
seanalizarnlasredesneuronalesconmsdetenimiento.
Katz3 sugiriqueconunasimpleestructuradered,enlaquesecombinendeformarepe-
tidainversoresypuertasAND (quepuedenserimplementadasporULU),sepuedeimplementar
cualquierprogramaT-R. UnavariedaddeestetipoderedessepuedeverenlaFigura2.7. Las
o
- - - - - - - - - -
I
-1
.1 a, e, '"
:-- --Y__________J
I
,- - ---- - - ---
,
,
I -1
UnidadCIPA
e2 "<: a2
\
Inhibicin
1- - - - - - - - - .,.. - - -
-1
Accin
Comprobacin "<: .1
-- ----- --1
I
-1
em '" .r a
R
Propagacin
-- _____J
Figura2.7.
UnaredcompuestaporunidadesCIPA.
3 ComunicacinprivadadeEdwardKatzenabr! de 1996.
entradasdeestaredsonlos valoresbinariosdelascondicionese; lassalidasdelaredactivan
alascorrespondientesaccionesaj (Enesteejemplono semuestranlosclculosutilizadospara
obtenerlascaractersticascj ' yaquestaspuedenserexpresadasporunaconjuncindelitera-
les y, portanto, puedenserimplementadasporunaULU.) Unareglapertenecientea un pro-
gramaT-Rsepuedeimplementarpormediodeuncircuitoquetengadosentradasydossalidas
(este tipo de circuitos recibe elnombre deCIPA: Comprobacin, Inhibicin, Propagacin y
Accin). Unadelas ULUdelCIPAcalculalaconjuncindeuna desus entradasconelcom-
plementodelaotraentrada, ylaotraULUcalcularladisyuncindelasentradas. Laentrada
deinhibicintomarel valorOcuandoen ningunade lasreglasprecedenteslacondicinsea
cierta. Laentradadecomprobacintomaelvalor 1cuandolacondicincorrespondienteala
reglarepresentadaseacierta. Si laentradadecomprobacintomael valor 1yladeinhibicin
el valorO, seobtendrun 1enlasalidadeaccin(indicandoquesedebeejecutarlaaccina).
Siamba'ientradastomanelvalor1, aparecerun 1enlasalidadepropagacin(queservirpara
inhibirtodaslasunidadesquelesiguen).Si paraimplementarunCIPAutilizamosunamatrizde
puertasprogramablesoalgunaotraformadinmicadeconstruircircuitos,podemosdecirque
cadavez que sellamaal programaT-Rseconstruyedinmicamenteel circuitoque loimple-
menta.
2.2.3. Laarquitecturadesubsuncin
Diferentesautoreshanpropuestootrosformalismosparalaespecificacindelprocesoqueasocia
lasentradas sensorialesconlas accionescorrespondientes. Entre stos, cabedestacarlaarqui-
tectura de subsuncin, propuesta porRodney Brooks [Brooks, 1986; Brook, 1990, y Connell
1990].Aunquenoexisteunadefinicinprecisadeestaarquitectura,laideageneralconsisteen
hacerqueelcomportamientoglobaldelagentedescansesobreunconjuntodemdulosdecom-
portamiento.Cadaunodeestosmdulosrecibeinformacindirectadelasentradassensoriales.
Sidichasentradassatisfacenunaprecondicin,especficaparacadamdulo, seejecutaunpro-
gramaquetambinesespecficoparacadamdulo.Adems,unmdulodecomportamientopue-
de sersubsumidoenotro.Porejemplo,enlaFigura2.8cadamdulosesubsumeenel mdulo
Seales
sensoriales
Percepein 1-----J04 1-1-----, .. 1 Clculodelaaccin
Atravesarpasllos
1- Clculodelaaccin I
Evitarobstculos
Accin
Percepcin 1-----.1.1 X 1 J>
Movimientopordefecto
Figura2.8.
Mdulosdesubsuncin.
.1
31
30
Inteligenciaartificial. Unanueva
inmediatamenteinferior. Cuandounmduloj sesubsumeenunmduloi, elprogramaquese
cutasi laprecondicindelmduloi se satisface, tieneprioridadsobreelprogramaasoci
mduloj. Brooksdenominaestetipodedistribucinarquitectura horizontal, encontraposicir
conel conceptodearquitectura vertical. Brooks ysus estudiantesdemostraronque de la
raccin entre sistemas reactivos relativamente simples y un entorno complejo podanemergp.l
comportamientossorprendentementecomplejos[Matarlc, 1990;Connell, 1990].Adiferencia
la mayorparte del trabajo desarrollado en el campo de lainteligenciaartificial, las mquiIJaII
deBrooksnodependendecomplejasrepresentacionesdesuentorno,nideprocesosde
mientoaplicados sobredichasrepresentaciones [Brooks 1991a;Brooks 1991b]4. Sin
hayquereconocerquelossistemasE-Rsonbastantelimitados,aunqueseancapacesdemostrat
pautasdecomportamientobastanteinteresantes. (Unanlisisbastantecuriososobreelplantea,
mientodeBrookssepuedeexaminaren[Kirsh, 1991].)
ElusodeagentesE-Restmsextendidoennuestroentornodeloquepodramospensar.
lossistemasqueutilizanestetipodeagentesnosencontramoslos termostatosutilizadospara
controldelatemperatura, lossistemasdecontrolquegestionanlavelocidaddeunautomvil,
laspartesdeun sistemaoperativoquegestionanlasinterrupcionesy, engeneral,todoslos .
masutilizados enplantasdefabricacin automticas. Habitualmente, elestudiode estetipo
sistemasydispositivos no se consideracomopartede laInteligenciaArtificial, perolo
incluido en nuestro enfoque sobre la InteligenciaArtificial ya que nos sirve como punto
partidaennuestrocaminohaciaelanlisisdesistemasmsinteligentes.
En algunas prcticas de asignaturas de lAy robtica, los alumnos empiezanporla
truccindeunrobotdeltipoE-RusandopiezasdeLego(comoejemplo,sepuedever[Re:Sll1\;A."
1993]).AlgunosinvestigadoresenlAqueestudianlas estrategiasdecontrolbasadasenelcom
portamientohanrealizadoexperimentosconrobotsE-Rcapacesdemoverseevitandoobstculos
ysiguiendoparedes [Matarlc, 1990;Connell, 1990].
En el diseo de este tipo de agentes es bastante normal la separacin entre percepcin y
accin, tal ycomohemos hechoennuestroejemplo. Basndonosenel trabajo de Kaelbling y
Rosenschein [KaelblingyRosenschein, 1990],hemos asignado al procesamientoperceptualla
tareadecalcularel vectordecaractersticasapartirdelasseales sensoriales, mientras quela
tareadeseleccindeacciones,basadaenelvectordecaractersticas,lahemosasignadoalafun-
cinparalaseleccindeacciones. KaelblingyRosenscheinconsideranestadivisincomouna
arquitecturadetipovertical, encontraposicinalaarquitecturahorizontalpropuestaporBrooks.
Respectoalacomparacindeestosdostiposdearquitectura, KaelblingyRosenscheinafirman
que [KaelblingyRosenschein, 1990,pp. 36-37]:
LadivisinhorizontalplanteadaporBrooksparalaseparacinentreloscomponentesdeper-
cepcinyaccinconstituyeunaformaprcticade abordareldiseodeunagente...
La divisin horizontal permite al diseador considerar de forma simultnea aquellos
aspectosrelacionadosconlapercepcinylaaccinquesirvendebaseparapresentarpautas
decomportamientoespecficas... Ladivisinverticalesunaalternativaalplanteamientode
4 Podrahabersidoms apropiadointroducirlaarquitecturade subsuncindeBrooksen elCaptulo5, debidoa
queestetipodemquinasposeeunapequeacantidaddeestadosinternos.Sinembargo,hasidoincluidaenestecap-
tulodebidoasu estrecharelacinconlosprogramasT-R.
Agentesde estmulo-respuesta
Brooks, en la que se puedentenerdistintos mdulos encargados de recoger, de diferentes
fuentes, grandescantidadesdeinformacin(esdecir, percepcin)yotrosmdulosencarga-
dos de sacarel mximo partido posible a la informacin, proporcionadaporlos primeros
mdulos,parapoderdesarrollardiferentestareas(esdecir, accin).Larelacininherenteque
existeentrelaextraccindeinformacinylageneracindepautasdecomportamientohace
queelplanteamientoverticalseamsatractivoalahoradeoptimizarelesfuerzodeprogra-
macin.
Enlaactualidad,lossistemasbasadosenelplanteamientohorizontalsepuedenbeneficiarde
la divisin vertical entre percepcin y accin. De esta forma, el vector de caractersticas se
puede dividir en diferentes campos, donde cada campo puede ser procesado por un sistema
perceptualespecficoyevocardistintas acciones ocomportamientos,comoocurreenlaarqui-
tecturadesubsuncin.
Los programasT-R son un tipo de sistemas E-Rque presentan una estrecharelacin con
determinadosmodelosetolgicosdecomportamientoanimal [McFarland, 1987].Enalgunosde
estosmodelos,seconsiguequeunanimalpuedadesarrollarunconjuntopredeterminadode accio-
nes parala consecucindel objetivo prefijadode antemano, haciendoque el resultado de una
determinadaaccinactedeestmuloparalaactivacindelasiguienteaccindelasecuencia.En
unprogramaT-R, lasaccionesylascondicionessonseleccionadasparaqueelprogramasecom-
portedelamismamanera. EltrabajorealizadoporelautorsobrelosprogramasT-Restinspi-
radoenellibroescritoporDeutsch[Deutsch, 1960].
Los animales que buscan ysemuevenhacialos estmulos presentan un tipo de comporta-
mientodenominadotropismo. Porejemplo,los animalesfototrpicos semuevenenbuscadela
luz. Este tipo de animaleseslarazn porlaque Geneserethy Nilsson [Geneserethy Nilsson,
1987]llamanalosagentesanalizadosenestecaptuloagentes tropistas.
AlgunosestudiosexperimentalessimulanloscomportamientosdelosrobotsE-Renvezde
utilizarrobotsreales.Algunasveces, dichassimulacionessoncriticadas, yaque, comoalgunos
autoresafirman,estncondenadasafuncionar [BrooksyMatarlc, 1995,p. 209];peroincluso
de las simulacionesque no funcionan podemosextraerconclusionesque nos puedenayudara
refinarlasestrategiasperceptualesylosprocesosde seleccindeacciones.Adems,enalgunos
casos,lasimulacineslonicorealquepodemosencontrarenel estudio.Porejemplo,enlossis-
temasdeeducacin,entretenimientoyartedramticoasistidosporordenador,lospersonajesani-
madosinteraccionanconsumundovirtualyconelusuarlo[Bates, 1994;Blumberg, 1996]. (El
sistemaALlVE deBlumbergesunclaroejemplodeunsistemaqueutilizalosprincipiosde laeto-
logaparaconstruirpersonajesinteractivos.)
Paraprofundizarms enelestudiode las funciones booleanas, se puedeexaminar[Unger,
1989]. Porltimo, ellectorpuedeexaminar[Rivest, 1987], donde los sistemas de produccin
se considerangeneralizacionesde funciones booleanasy reciben el nombrede tablas de deci-
sin.
2.1. EscribalasiguientefuncinboolenaenformaFND:
f= (x + x
2
) (x
3
+ x
4
)
2.2. DemuestrequeXX
2
X
3
+ XX
2
X
3
=X
2
X
3
.
32 Inteligencia artificial. Una nueva sntesis
2.3. Indique cul de las siguientes funciones booleanas de tres variables puede ser implementa-
da por una unidad con umbral que opere a partir de la suma ponderada de sus entradas. No hace
falta calcular los pesos ni el valor del umbral.
1. x
2. XX
2
X
3
3. x +x
2
+x
3
4. (XX
2
X
3
) + CX;X;X;)
5. 1
2.4. Demuestre que existen exactamente 3
n
monomios de dimensin n y 3
n
clusulas de la mis-
ma dimensin.
2.5. Teniendo en cuenta la definicin de las caractersticas xl' x
2
' de la pgina 22 y las x
3
Yx
4
reglas definidas para la seleccin de acciones, tambin de la pgina 22, demuestre que el esta-
blecimiento de la condicin de no existencia de pasillos estrechos en la cuadrcula bidimensional
implica que no se pueden satisfacer simultneamente dos reglas de accin.
2.6. Disee una red neuronal que tenga como entradas las seales sensoriales SI' S2' , Sg y como
salidas las condiciones necesarias para que una red de unidades CIPA pueda implementar las
reglas de accin definidas en la pgina 22.
~ 7 En este captulo se ha afirmado que las acciones seleccionadas por un programa T-R con-
ducen inexorablemente hacia el objetivo. Es cierta esta afirmacin? Puede citar algunas
situaciones en las que un programa T-R no termine con la satisfaccin de la primera condicin?
desneuronales
Introduccin
A lo largo de este libro analizaremos mecanismos que hacen posible que las mquinas aprendan.
En este captulo, veremos cmo los clculos realizados por los sistemas E-R para la seleccin de
acciones pueden ser aprendidos si se expone el sistema a un conjunto de ejemplos. Estos ejem-
plos consistirn en parejas formadas por un posible valor de las variables de entrada junto con la
accin que se debe tomar para dicho valor. Aunque se podran usar una gran variedad de estruc-
turas computacionales, en este captulo nos centraremos en el uso de redes de ULU con pesos
ajustables. En este caso, el proceso de aprendizaje consistir en la modificacin sucesiva de
dichos pesos hasta que la red responda adecuadamente a las entradas que le son presentadas.
Como se dijo en el captulo anterior, una red de ULU recibe el nombre de red neuronal, debido
a que, de alguna forma, las ULU sirven como modelo de algunas de las propiedades que pre-
sentan las neuronas biolgicas. Sin embargo, en este captulo no especularemos sobre las rela-
ciones que puedan existir entre las redes neuronales y el funcionamiento del cerebro. nicamente
consideraremos a las neuronales estrictamente como meros dispositivos de ingeniera interesantes
y tiles.
El problema de aprendizaje que vamos a tratar en este captulo puede ser formulado en los
siguientes trminos: partimos de un conjunto 3 formado por vectores X de dimensin n cuyas
componentes son Xi' i = 1, ... , n. Estos vectores pueden representar vectores de caractersticas
calculados por el subsistema perceptual de un agente reactivo. Adems, y como ya se dijo en el
captulo anterior, los valores de sus componentes pueden ser valores reales o booleanos. Para cada
X perteneciente a 3 se conoce la accin a que le corresponde. Estas acciones pueden ser obteni-
das observando cmo un instructor, que conozca bien el problema, responde a dicho conjunto de
entradas. Las acciones que se asocian a los vectores del conjunto 3 suelen denominarse etiquetas
o clases del vector, y al conjunto 3, junto con las etiquetas asociadas a sus vectores, se le deno-
mina conjunto de entrenamiento. Por tanto, para resolver el problema de aprendizaje, hay que
encontrar una funcin, f(X), que responda aceptablemente a los elementos del conjunto de
entrenamiento. Normalmente se intentar que las acciones calculadas por la funcinfse corres-
33 ..
34
Inteligenciaartificial.Unanuevasntesis Redesneuronales 35
pondanconlas etiquetasasociadas alos vectoresdeentradaentantos casoscomoseaposible.
Ecuacindelhiperplano
Aestetipodeprocesodeaprendizajeseledenominaaprendizajesupervisado,debidoaquese
XW-8=O
disponedelos vectoresdeentradaydelas etiquetascorrespondientes.
Inclusosiencontrsemosunafuncinquerespondieraapropiadamenteatodoslos vectores
delconjuntodeentrenamiento,podemosestarsegurosdequedichafuncinresponderdefor-
maadecuadaaposiblesvectoresdeentradaquenoforman partedelconjuntodeentrenamiento?
x
XW-8>O
Larespuestaes afirmativa, yaque, ademsdeunagrancantidaddeexperienciaquecorrobora
enestelado
esta afirmacin, existe un marco terico que demuestra (bajo ciertas condiciones) que si el
W Vectorunitarionormal
conjuntodeentrenamientocontieneelementossignificativosdelas distintasclasesenlasque
IWI .1 h i p I ~ o ~
se pueden dividir los posibles vectores de entrada, entonces las restantes entradas que no se
encuentranendichoconjuntoprobablementeproducirnsalidasaproximadamentecorrec-
tas. Paraprofundizar ms en este sentido se puede acudir a las referencias sobre la teoradel
aprendizajeprobabley aproximadamente correcto(PAC) [Kearns yVazirani, 1994; Haussler,
1998, yHaussler, 1990]. Enlaprctica, existenvarios mtodos paraestimarlaprecisindela Origen XW-8<O
funcin aprendidacuandostaes expuestaaentradas similaresalasdelconjuntodeentrena-
en estelado
miento,peroquehastaelmomentonohansidotratadas.Enestecaptulosepresentarnalgunos
deestosmtodos.
Figura3.1.
InterpretacingeomtricadelfuncionamientodeunaULU.
Entrenamientode unaULU
3.2.1. InterpretacingeomtricadelfuncionamientodeunaULU
3.2.2. Ladimensinn+ 1
ComenzaremosporexplicarcmolospesosdeunaULUpuedenserajustadosoentrenadospara
Sehanpropuestodiversosmtodosparaelajustedelospesos.Parasimplificarlaexplicacinde
quelaULUrespondadeformaadecuadaadeterminadosconjuntosdeentrenamiento.Sivamos
dichosmtodos, vamosaadoptarelconveniodequeel valordelumbraleessiempreO. Alcon-
ausarlaULUparaelclculodeacciones, susentradashandesernumricas(paraquesepueda
trariodeloquepuedaparecer,noexisteenelloprdidadegeneralidad,yaqueparaconseguirun
calcularlasumaponderadade las mismas); portanto, si el procesamientoperceptual produce
valorarbitrariodelumbraledistintodeO, bastaaumentarladimensindetodoslos vectoresque
caractersticascategorizadas,stasdebensercodificadas numricamente.Porsupuesto, un sis-
forman parte del proceso en una unidad. A la componente n+ 1de cada vector de entrada
temareactivo que utilice una solaULUparael clculode acciones slo podrdesarrollardos
extendido seledasiempreelvalor 1, ylacomponenten+ 1del vectordepesos(esdecir,w
n
+)
posiblesacciones, unaporcadaposiblesalidadelaULU. Unaredneuronalcompuestadeuna
se igualaal valornegativoquelequeramosdaral umbral,esdecir, ae. Enlosucesivo, se con-
solaULUtambinrecibeelnombredePerceptronoAdaline(delingls,adaptivelinearelement,
siderarnquetodoslos vectoressonconstruidosdelamismaforma. Utilizandoesteconvenio,la
esdecir, elementolinealadaptativo).Estetipode sistemashasidoestudiadoenprofundidadpor
salidadeunaULUser1cuandoX .W ~ O, yserOencualquierotrocaso.
Rosenblatt y Widrow [Rosenbblatt, 1962; Widrow, 1962]. El entrenamiento de una ULU se
realizarajustandolospesosvariableshastaqueseconsiganlassalidasdeseadas.Acontinuacin,
veremosunaexplicacingeomtricadelfuncionamiento de unaULU,quenos ayudaracom- 3.2.3. Mtodosdelgradientedescendente
prenderdeunaformaintuitivalosdistintos mtodosdeentrenamientoquevamosaanalizar.
UnaULUquedadefinidaporlosvaloresdesuspesosysuumbral.Lospesos(w, ..., w, ... , w ) Unaformade abordarel problemadel entrenamientode unaULUde formaquestaresponda
serepresentanpormediodeloquedenominamosvectordepesosW. ElumbraldeunaULUse
n
apropiadamentealosvectoresdelconjuntodeentrenamientoconsisteendefinirunafuncinde
representa porla variable e. Asumiremos que los vectores de entrada X tienen componentes errorquedebeminimizarseajustandoel valordelospesos. Unadelas funciones de errorms
numricas (parapoderrealizarlasumaponderada).LasalidadelaULUser 1siemprequeel usadaseslafuncindeerrorcuadrticoE:
productoescalars=X .W seamayorqueelumbrale,yserOencualquierotrocaso. Comose
puedeverenlaFigura3.1,laULUdividelinealmenteelespacioformadoporlosposibles vec-
E= })d-Y
toresdeentrada.Endosdimensiones,estdivisinsedefinemedianteunarecta,entresdimen-
XEE
siones,porunplano,yenespaciosconmsdetresdimensionesporunhiperplano.Deestafor-
ma,elhiperplanosepararlos vectoresdeentradaparalosqueX.W- e>O, deaquellosparalos
donde!;eslarespuestadelaULUal vectordeentradaXi' di eslarespuestadeseadayel suma-
que X .W - e<O. Obviamente, la ecuacin del hiperplano queda definida por la expresin
torio se extiende a todos los vectores del conjunto de entrenamiento. Dado un conjunto de
X .W - e=O. Laposicindel hiperplano(conrespecto al origen) puede sermodificadaajus- entrenamiento3 determinado, sepuedecomprobarfcilmentequeelvalordeE dependedelos
tandoelumbrale, ysuorientacinajustandolospesos.
valoresquetenganlospesos(ladependenciaapareceatravsdelclculode!;).ElmnimodeE
36 37
se puede encontrar aplicando el mtodo del gradiente descendente. Parapoder aplicar este
mtodo, primeroes necesario calcularelgradientede Een el espaciode lospesos, y luego
desplazarelvectordepesosenelsentidonegativodel gradiente(esdecir, pendienteabajo).
Uno de los problemas con que nos encontramos al calcular el gradiente de E es que el error
dependedetodoslosvectoresdelconjuntodeentrenamientoS.Parasolventaresteproblema,es
preferibleaplicarun nicovectordeentradaalaULU,hacerlosajustescorrespondientesenlos
pesosparaobtenerunarespuestaadecuada,yvolverarepetirelprocesoconelsiguientevectorde
S;esdecir, unprocesoincrementaldeentrenamientosiguiendounadeterminadasecuenciaEde
vectores de entradaetiquetadosconsucorrespondientesalida. Porsupuesto, los resultadosdel
entrenamientoincrementalsolamentesepuedenaproximaralosde lasdenominadasversiones
porlotes,pero,casualmente,laaproximacinesbastanteefectiva.Enestaseccindescribiremos
unaversinincremental.
ParaunnicovectordeentradaX,elerrorcuadrticoquesecometealobtenercomosalida
elvalorf sedefinecomo:
E=(d-f)2
siendod elvalordeseadoenlasalida. Elgradiente deErespectoalospesoses:
dE
:,dE ~ r ~ ~ ""':,dE ,...,':i J
oW Luwl OW, OWn+1
(Elgradientedeunacantidad<1> respectoaunvectorW serepresentaporVw<l>.)
ComoE depende deW atravs delproductoescalars =X .W,aplicandolaregladederi-
vacindelacadena,obtenemos:
dE dE dS
dW dS dW
dS
Entonces,dadoque - =X:
dW
dE
dW
dE
dS
X
Teniendoencuentaque dE
dS
-2(d - f) df ,podemosescribir:
dS
dE
dW -2(d- f) df X
dS
Sinembargo,todavaexisteun problemaparacalcularladerivadadefrespectoas. Dadoque
lasalidaf esunafuncin de umbral,laderivadadef noescontinuamentediferenciablerespecto
as, debidoalapresenciadelafuncin umbral.Lamayorpartedelaspequeasvariacionesque
seproducenenelproductoescalarnoafectanaf,ycuandof cambia,lohacedemaneraabrupta,
pasandodeOa 1, oviceversa.Consideraremosdosformas desolventarestadificultad.Enunade
ellasignoraremoslafuncinumbralyasumiremosquef =s. Enlaotra,remplazaremoslafuncin
umbralporcualquierotrafuncinnolinealqueseaderivable.
Redesneuronales
3.2.4. El procedimiento de Widrow-Hoff
Supongamosqueintentamosajustarlospesosdetalformaquecadavectordelconjuntodeentre-
namiento etiquetado con un 1produzca un producto escalar que sea exactamente igual a 1,
mientrasquelosvectoresetiquetadosconOtenganunproductoescalariguala-l. Enesecaso,y
conf= s, el errorcuadrticosepuedeescribirde laforma: E=(d - f)2 (d - S)2, y, portanto,
teniendoencuentaque ~ 1, elgradientesepuedeobtenermediantelasiguienteexpresin:
dE
dW =-2(d f)X
Simodificamoslospesosalolargodelgradientenegativo,eincluimoselfactor2enunpar-
metro llamadofactor de aprendizaje, c, el nuevo valor del vectorde pesos sepuede calcular
mediantelaexpresin:
W ~ W + c d f)X
Siemprequeladiferencia(d - f) seapositiva, se aadeal vectordepesos unafraccin del
vector de entrada. Este incremento aumentar el producto escalar y disminuir la diferencia
(d - f). En casocontrario,esdecir, siemprequeladiferencia(d - f) seanegativa,restamos del
vectordepesosunaporcindel vectordeentrada, lo queproducirlosefectoscontrariosalos
anteriormentemencionados.Esteprocedimientoseconocecomoelprocedimiento Widrow-Hoff,
oprocedimiento Delta [WidrowyHoff, 1960]l. Porsupuesto,unavezquehayamosencontrado
elconjuntodepesosqueminimizaelerrorcuadrtico(valindonosdelaigualdadf=s), somos
libresdereinsertarlafuncin umbralparaobtenervaloresdef deOo 1.
3.2.5. El procedimiento delta generalizado
Werbos [Werbos, 1974]propusootraformade solventarelproblemadelanoderivabilidaddela
funcin umbral,aunqueotrosautores,como,porejemplo[Rumelhartet al., 1986]propusieronla
mismasolucin de formaindependiente.Lasolucinpropuestapasabaporsustituirlafuncin
umbralporunafuncinderivablellamadasigmoide
2
SedenominaasporquetieneformadeS.
Lafuncin sigmoidemsusadaes f(s) =_1_,dondes eslaentradayf eslasalida.Enla
1+e-
S
Figura3.2sepuedeverunarepresentacingrficadelafuncin sigmoidesuperpuestaalafun-
cinumbral.
Estaseleccinparaestafuncinsigmoideparticularnos daladerivadaparcialdefrespecto
as, quesepuedecalcularfcilmentemediantelaexpresin:
df =
dS
I Si ellectorestfamiliarizadoconelanlisisnumrico,podr reconocerque el procedimientoWidrow-Hoffes un
casoparticulardeunmtodo de relajacin paralaresolucindeecuacioneslineales.
2 [RussellyNorvig, 1995,p.595] atribuyenestaideaaLBryson yHo, 1969].
Redes neuronales
39
Unavezquehemosencontradounaconfiguracindepesosaceptableporelprocedimiento
Deltageneralizado,podemosvolveracambiar,siqueremos,lafuncinsigmoideporlafuncin
umbral.
3.2.6. El procedimiento de correccin del error
Enestemtodonosustituiremoslafuncinumbralporunasigmoide,ysloharemoselajustede
lospesoscuandolaULUrespondaconunerror,esdecir, cuandoladiferencia(d- f)sea 1o-l.
Teniendoencuentaesto,elajustedelos pesosporelmtododecorreccin del error serealiza
mediantelasiguienteexpresin:
W f- W + c(d- f)X
Aligualqueenlosmtodosanteriores, loscambiosenel vectordepesos se realizanenla
-6 -4 -2 2 4 6
direccinenlaquese disminuyeelerror(ydependiendo del valordelfactordeaprendizajec,
Figura3.2.
podranocasionalmentecorregirlo).UnadelasdiferenciasentreestemtodoyeldeWidrow-Hoff
esqueahora, paralacorreccindelerror,tantod comofsloadmitenlosvaloresOo 1,mientras
Lafuncinsigmoideo
queenelmtododeWidrow-Hoff,d podavaler+1o-1,YferaigualalproductoescalarS.
Se puededemostrarque, si existe un vectorde pesos W paraelquetodos los vectores del
Sustituyendoestaexpresinenlaigualdad aE =-2(d- f)afX, obtenemos: conjunto :=: producen una salida correcta, entonces el procedimiento de correccin del error
aw as
encontrardichovectordespusdepresentarunnmerofinitodevectoresalaULUy, adems,
aE
unavezencontradodichovector,stenovolverasermodificado(lademostracinrequiereque
aw=-2(d- f)f(l- f)X
cadavectorpuedaaparecerenlasecuenciadeentrenamiento,L,un nmeroinfinitode veces,
aunqueestgarantizadoqueelprocedimientoencuentraunasolucindespusdeunnmerofini-
delaquesepuedededucirlareglaquedeterminalaformaenlaquecambianlos pesos, regla todeejemplosdeL).Paraconjuntosdevectoresdeentradaquenoseanlinealmenteseparables,
! conocidacomoelprocedimiento delta generalizado: el procedimiento de correccin del error, adems de no finalizar, no podr ser utilizado para
encontrarel mejor vectorde pesosde acuerdoconalgncriteriodefinido sobreelerror. Sin
W f- W + c(d - f)f(1 - f)X embargo,losmtodosdeWidrow-HoffyDeltageneralizadosiempreencontrarnunasolucin
queminimizeelerrorcuadrtico,aunquedichoerrormnimonoseanulo.
SicomparamosestemtodoconeldeWidrow-Hoff, podemosapreciarlas siguientesdife-
EnelCaptulo2mostramosalgunosejemplosdefuncionesquenosonlinealmentesepara-
rencias:
bles. Siretomamoslasreglasde produccinparalasaccionesdelrobotquesigueunafrontera,
vistasenelcaptuloanterior,unadeestas,porejemplo,era:
1. EnelmtododeWidrow-Hoff,losvaloresquesepuedenasignaralasalidaesperada,d,
son1o-1,mientrasqueenelprocedimientodeltageneralizadolasalidaesperadapuede
XX
2
este
tomarlos valores 1oO.
Silaexpresamosenfuncin delasentradassensoriales,tenemosquexx
2
= (S2 +S3)S:;S;. Esta
entrada,esdecir,j,esigualalproductoescalars, mientrasqueenelmtodoDeltagene-
2. En el mtodo de Widrow-Hoff, la salida obtenida una vez aplicados los vectores de
funcineslinealmenteseparabley, portanto,lapodemosimplementarmedianteunaULU(va-
ralizadodichasalidasecorrespondeconlasalidadelafuncin sigmoideo
seFig.2.6).Teniendoencuenta10 descritoenestaseccin,siaplicamoselmtododecorreccin
delerrorsobreunconjunto10 suficientementegrandedevectoresdeentradaetiquetados,encon-
3. Enelmtododeltageneralizado,seintroduceuntrminoadicional,J(1 - f),debidoala
presenciadelafuncin sigmoideo Conlafuncinsigmoide,JpuedevariarentreOy 1. Si
traramosunaconfiguracindepesosquediscriminadeformaadecuadaentrelasentradassen-
fes cero,entoncesf(1-f)tambinvaleO, ysifvale1,J(1-f)estambinO. Eltrmino
sorialesqueharanmoverseelrobothaciaelestey lasqueno. Paraeste propsito, podramos
f(1- f)alcanzasuvalormximo,quees /4'paraf=1/
2
(esdecir,cuandoelargumentode
configurar un conjunto de vectores de entrenamiento como el de la Figura 3.3. Se propone
como ejercicio la aplicacin del mtodo de correccin del error a este conjunto de entrena-
lafuncin sigmoideesO). Lafuncin sigmoidesepuedeconsiderarcomounhiperplano
difuso. Siel vectordeentrada se encuentraalejado de estehiperplano difuso,f(1 - f)
miento, aadindolealgunasentradasetiquetadasadicionales(nohayqueolvidarsedeconside-
tomaunvalorcercanoaO, conloqueelmtododeltageneralizadointroducirpequeos
rar S9 == 1en el vector de entrada, y la componente w
9
en el vector de pesos). Una vez que
cambios,quepuedensernulosendeterminadoscasos,enlospesos,independientemente
encontremosunaconfiguracinestabledelvectordepesos,cmorespondelaULUaentradas
deculsealasalidaesperada.Loscambiossignificativosenlospesostendrnlugarcuan-
paralasquenohasidoentrenada?,cuntosvectoresdeentradasenecesitanenelconjuntode
dolos vectoresdeentradasesitencercadelafronteradifusadefinidaporelhiperplano
entrenamientoparaquelaULUrespondadeformaadecuada?
difuso(esdecir,enlosnicoslugaresenlosquelamodificacindelospesossafectaal
En[Nilsson, 1965] se puedenencontrarantecedentesadicionales,ademsdealgunascitas,
valordef),realizndosedichoscambiosenladireccindecorreccindelerror.
demostracionesyejemplosdelprocedimientodecorreccindelerror.
41
r
40
Redesneuronales
2
X,
-}
f
X
2
Figura3.4.
UnareddeULUquecalculalafuncinde paridadpar.
Enlasseccionessiguientes,describiremosunprocedimientogeneralparaentrenarunared
6
directamulticapa. Elprocedimientoque vamos aanalizarse denomina retropropagacin, yse
basaenelprocedimientodel gradientedescendente.Debidoaquenecesitaremoscalcularlasderi-
vadasparcialesdelafuncindeerrorrespectoalosvectoresdepesos,reemplazaremostodaslas
funcionesumbralporfunciones sigmoides(unavezconcluidoelentrenamiento,podremosvol-
veracolocarensulugarlasfuncionesumbral).
Entrada Vector
Elrobotsemueve
nmero
sensorial
haciaelestexX
Z
1 3.3.2. Notacin
00001100 O
2
11100000 1
3
00]00000 1
EnlaFigura3.5sepuedeapreciarunareddirectagenricadekcapascompuestaporunidadessig-
4 moidales.Todaslasunidadessigmoidales,exceptuandolasdelaltimacapa, sedenominanuni-
5
00000000 O
00001000 O dadesocultas,yaquesussalidasslocontribuyenindirectamentealasalidafinal. Comosepuede
6
k Figura3.3.
X(O)
Conjuntodeentrenamientoparahacerqueelrobotaprendaamoversehaciaeleste.
Redesneuronales
3.3.1. Motivacin
Algunasvecesnospodemosencontrarconconjuntosdeestmulosyrespuestasquenosepueden
aprenderconunasolaULU(esdecir,conjuntosdeentrenamientoquenosonlinealmentesepa-
rables).Enestoscasos,paraconseguirunarespuestacorrecta,esnecesariounareddeULU.La
funcin que se calculamedianteestetipo de redes depende tantodelatopologa delamisma
comodelospesosquetienecadaunadelasULU.Lasredesdealimentacindirecta,osimple-
mente redes directas, no poseen ciclos, es decir, las entradas de una ULU no dependen
directani indirectamente)delasalidadedichaULU(lasredesquenosondirectassedenominan
redesrecurrentes.Analizaremosunejemplodeestetipoderedesenestemismocaptulo).Deci-
mosqueunareddirectaes unareddirectaporcapascuandolasULUsedisponenporcapasen
lasquelasentradasde loselementosdelacapajslodependendelassalidasdeloselementosde
lacapaj- l.Laredde laFigura3.4,quecalculalafuncinf::;:x,x +X;.x; (denominadafuncin
Sigmoidesmi Sigmoidesmi Sigmodcsm(k_1) z
de paridadpar), es una red directa por capas con dos capas (algunos autores consideran la
capadeentradacomounacapaadicionaly, porconsiguiente,diranquelareddelejemplotiene
Figura3.5.
trescapas),
Redde unidades sigmoidalesconkcapas.
42
43
apreciar en la Figura 3.5, nuestra red slo tiene una nica unidad de salida; sin embargo, cuando nos
encontremos en situaciones en las que tengamos ms de dos acciones o clases de entrada, podremos
utilizar varias unidades de salida. En este caso, una vez que obtengamos la salida, es necesario rea-
lizar un paso adicional, consistente en un esquema de decodificacin para transformar los vectores
de salida en sus correspondientes categoras. Para este fin [Brain et al., 1962] utilizaron cdigos
basados en las secuencias de registros de desplazamiento maximales, mientras que [Dietterich y
Bakiri, 1991, Y Dietterich y Bakiri, 1995] se basaron en los cdigos correctores de error.
Utilizaremos la Figura 3.5 para introducir la notacin que vamos a utilizar en los prrafos
siguientes. Consideraremos que las salidas de cada capa de unidades sigmoidales son compo-
nentes de un vector, de la misma forma que las caractersticas se consideran componentes del vec-
tor de entrada. Cada capaj de unidades sigmoidales (1 'Sj < k) tendr como salida el vector XU),
que a su vez ser el vector de entrada de la capa (j + 1). Siguiendo con esta notacin, nos referi-
remos al vector de entrada como X(O), ya la salida de la red (es decir, la salida de la capa k) como
f De la misma forma, W?) ser el vector de pesos de la unidad sigmoidal i de la capa j. Al igual
que en las secciones anteriores, asumiremos la existencia de un peso umbral como ltimo com-
ponente del vector de pesos. Por ltimo, la suma ponderada de la entrada de la unidad sigmoidal
i de la capaj ser sij) Utilizaremos el trmino activacin para referirnos a la entrada de una uni-
dad sigmoidal, y puede ser obtenida mediante la expresin:
s?) =X(j-l) . W?)
El nmero de unidades sigmoidales de la capaj viene dado por m ; por tanto, el vector W?)
tendr como componentes w8) con 1=1, ... , m(j -1) + l.
j
3.3.3. Elmtododelaretropropagacin
Al igual que en los ejemplos anteriores, calcularemos el gradiente del error cuadrtico E =(d _1)2.
En este caso, el vector de pesos sobre el que se calcula el gradiente tiene que estar compuesto por
todos los pesos de la red. Sin embargo, se suelen calcular las derivadas parciales de E respecto a
los vectores de pesos de cada unidad sigmoidal. De esta forma, la derivada parcial de E respecto
al vector de pesos W?) es:
dE def [ dE dE dE j
dW(i) = d (j) , .. , d (j) , , d (j) .
1 w 11 wil Wmj_I+I,1
donde es la componente l-sima del vector W?).
Al igual que en secciones anteriores, podemos utilizar la regla de derivacin de la cadena
para calcular la derivada parcial, ya que la dependencia de E sobre W?) se debe a s?), con lo que
podemos escribir:
dE dE ds(j)
--=----,-
dW(j) ds(j) dW(j)
, , 1
. ... ds(j) . .
De nuevo debIdo a que sU) =X(}-i) . W(j) --'- =XU-l) SustItuyendo obtenemos que.
' , , 'dW(j) , .
,
dE
dW?) =ds(j) X(j-I)
,
Redes neuronales
3.3.4.
Teniendo en cuenta que = d(d = -2(d _ f) d{), obtenemos finalmente:

=-2(d - f) df X(j-l)
dW(j) dS(j)
, ,
La cantidad (d - f) d{) = _1. desempea un papel muy importante en estos clculos.
dS/ 2 dS/
Para simplificar, nos referiremos a ella por 8F). La cantidad W) nos indica la sensibilidad del error
cuadrtico de la salida de la red respecto a los cambios en la entrada de la correspondiente fun-
cin sigmoideo De esta forma, el gradiente de E se puede escribir como:
dE
dW(j) =
,
Puesto que debemos modificar los vectores de pesos en el sentido negativo del gradiente, la
regla que nos indica cmo cambian dichos pesos se puede escribir como:
W(j) W(j) +c(j)8(j)X(j-l)
1 1 1 1
donde c[j) es el factor de aprendizaje para el correspondiente vector de pesos (normalmente, el
factor de aprendizaje es el mismo para todos los vectores de pesos). Como podemos ver, la regla
obtenida es bastante parecida a la que obtuvimos en los procedimientos para entrenar ULU
independientes, es decir, los cambios que se producen en el vector de pesos son proporcionales a
fracciones del vector de entrada.
Clculodelcambiodelospesosenlaltimacapa
En esta seccin nos centraremos en el clculo de las 8[j). Usando las definiciones de la seccin
anterior, tenemos que:
8(j) = (d - f) df
, ds;j)
Para calcular el cambio de los pesos en la ltima unidad sigmoidal, necesitamos calcular 8(k),
que se puede obtener mediante la expresin:
8(k) =(d- f) df
dS(k)
Debido a que f es una funcin sigmoide y S(k) es su entrada, y al igual que en la seccin ante-
rior, tenemos que = f(1- f). Por tanto:
8(k) =(d - f)f(l- f)
45
r
44
3.3.5.

Inteligencia artificial. Una nueva
con lo que el ajuste de los pesos para el nico elemento de la ltima capa por el procedimiento
la retropropagacin se puede escribir como:
W(k) W(k)+c(k)(d- /)f(1- /)X(k-l)
que, como se puede apreciar, es la misma regla que se obtendra aplicando el procedimiento
ta generalizado, si la ltima unidad sigmoidal fuera la nica de la red y si X(k- 1) =X.
Clculo del cambio de los pesos en las capas intermedias
Usando nuestra expresin para el clculo de O, podemos obtener la regla que indica cmo se
nen que modificar los vectores de pesos de la red. Recordemos que:
af
o(j)=(d- /):.(j)
I OSi
Usando otra vez la regla de derivacin de la cadena, y teniendo en cuenta que la salida de la.
red, f,depende desfj)a travs de la suma de las entradas a las unidades sigmoidales de la capa.
j +1, tenemos que:
e)- [ af asi
j
+
1
) af asi
i
+
l
) af
o/ - (d- f) as(J+I) as(il +...+as(J+!) as(j) +...+as(j+l) as(j)
1 1 1 1 mJ+1 1
mj+l alf as(j+l) mj +l , as(J+1)
- "(d f) 1 - " o(]+l) 1
- kt - :'s(j+l) asiD - 1 :'s(j)
1=1 0 1 I 1=1 0 ,
asU+
1
)
Lo nico que nos queda por calcular son las derivadas parciales Para ello, primero
hay que tener en cuenta que: aSi
S
{J+l) - X(j) WU+1)
I - . I
m+l
= +- 1'{J)w(j+1)
2,.Jv vJ
v=1
y, si tenemos en cuenta que los pesos no dependen de s, entonces:
:. (1+1) a["m+11'(i)wU+1)1 m+1
OSI ktV=1 Jv vi 1
aSiD= as(j) =L
, J v=1
a/Y)
as(j)
at(j)
Observemos que -::!-('=O , excepto cuando v=i, en cuyo caso
oSJ)
v
tanto, podemos escribir:
as(i+
1
) (1+!) I'(j)(l- f(j)
_'_1_ .. == W Ji
as(j)

afY) == f}il(1- Iv(i).Por

Redes neuronales
Si introducimos este resultado en la expresin para el clculo de oj),obtenemos que:
mj+l
o(j)== I'(j)(l- I'(J)"o(i+l)W(j+l)
J Ji Ji 1 II
1=1
Como se puede apreciar, la ecuacin anterior es recursiva (resulta interesante resaltar que la
expresin anterior no depende de la funcin de error, que slo afecta explcitamente al clculo de
O(k). Una vez que hemos calculado O?+l) para la capaj +1, podemos utilizar este resultado para
calcular o}J). La base de esta recurrencia es O(k), que pude ser calculada por medio de la expresin:
O(k) =(d- /)f(1 - /)
Usando la expresin que hemos obtenido para el clculo de o, la regla genrica para el
cambio de los pesos se puede escribir de la forma:
Wyl W/') +c/i ) o/J) XU-l)
Aunque pueda parecer compleja, esta expresin tiene una explicacin bastante intuitiva. Por
medio dela cantidad O(k) =(d - /)f(l-/) controlamos la magnitud y el signo de los ajustes que
hay que realizar en los vectores de pesos (la magnitud de los ajustes disminuye a medida quef
se aproxima a loa O, ya que entonces el efecto que producen sobre ftiende a desaparecer).
Como se puede deducir de la expresin recursiva para el clculo de o, el ajuste de los pesos en
una unidad sigmoidal de la capaj es proporcional a los efectos que tiene dicho ajuste sobre la
salida de dicha unidad sigmoidal (el factor fU) (1 - fm). Estos ajustes tambin son proporcio-
nales al promedio del efecto que, sobre la salida final de la red, provocan los cambios en la uni-
dad sigmoidal. Este promediado depende de los pesos que son aplicados a la unidad sigmoidal
de la capa j (si los pesos son pequeos, esta salida contribuir poco en las siguientes etapas de
la red), y a los efectos que los cambios en las salidas de la capa (j+1)tienen sobre la salida
final (y que se obtiene por medio de las 0/i+1). Estos clculos pueden ser fcilmente imple-
mentados ya que slo hara falta propagar los valores Opor todos los pesos en sentido inverso
a los clculos realizados en la red (de ah el nombre de retropropagacin). En [Chauvin y
Rumelhart, 19951, se puede obtener ms informacin sobre el procedimiento de retropropaga-
cin y sus aplicaciones.
Como ejemplo del proceso de retropropagacin, mostraremos cmo se realizara un paso de
este tipo de entrenamiento en la red de la Figura 3.6 (los pesos iniciales mostrados en la figura
son aleatorios). Usaremos la notacin introducida en las secciones anteriores para facilitar el
seguimiento del ejemplo. Nuestra funcin objetivo (aquella que queremos que calcule la red) es
la funcin de paridad par aplicada a dos variables binarias. Las entradas a esta red (incluyendo la
componente umbral) y las etiquetas que les corresponden son:
1. xiO) = = =l,d == O
X
(O) - O x(O) - O x(O) - 1 d - 1
2'1-'2-'3-'-
3. xO
l
= = =1,d=O
X
(O) - 1 x(O) - 1 x(O) - 1 d - O
4? 1-'2-'3-'-
47
46
Redesneuronales
XI
X
2
f
Figura3.6.
Redsobrelaqueseaplicalaretropropagacin.
Elprimervectordeentradaes(1,0,1), queproducelassalidas/(J)== 0,881 Yf}l) == 0,5enla
primeracapa,ylasalidaf=0,665comosalidafinal. Siusamoslaecuacinquededujimospara
elcasobase,obtenemos0(2) == -0,148.Propagandohaciaatrsatravsdelospesosdela segun-
dacapa,obtenemosoP) =-0,047YO ~ I =0,074.Siahorautilizamoslareglaparaajustarlospesos
(conunfactordeaprendizajec== 1),losnuevospesosqueseobtienenson:
Wil) =(1,953,-2,000,-0,047)
Wil) = (1,074,3,000,-0,926)
W(2) =(2,870,-2,074,-1,148)
Hayquetenerencuentaquenoseproduceningnajusteenw ~ ~ ~ yw i ~ ~ yaque ~ O =O(aunque
h.(1) == 0,500,valorquerepresentalamximasensibilidadparaqueseproduzcaelajuste).Losajus-
tesrealizadosenlospesosdelaltimacapatiendenaatenuarlosvalores1;(1) yh.(1), que, asuvez,y
juntoconlosajustesrealizadosenlospesosdelasegundacapa,hacendecrecerfyelerrorquese
cometeconelcorrespondientevectordeentrada.Comoejercicio,proponemoseldesarrollodeun
programa(sepuedeutilizarunahojadeclculo)paracontinuarelprocesodeentrenamiento.
Generalizacin, precisin y sobreajuste
Elejemplodeentrenamientoderedesneuronalesqueacabamosdepresentaresbastanteatpico,
yaquedebidoalabajadimensionalidaddelosvectorespodemosefectuarelentrenamientocon
todoslosposiblesvectoresdeentrada(queslosoncuatro).ComopodemosverenlaFigura3.4,
existe un conjunto de pesos que clasifica de forma correcta todos los posibles vectores. Sin
embargo, en la mayora de las aplicaciones la dimensionalidad de los vectores de entradaes
muchomayor,estandonormalmentealrededorde 100oinclusoms.Sitenemosencuentaque
con 100componentesbinariasexisten2
100
vectoresdeentradaposibles,slopodemosutilizaruna
pequeaporcindetodosestosvectorespararealizarelentrenamiento.Adems,inclusosi lared
llegaaclasificarcorrectamentetodoslosvectoresdeentrada(cosapocoprobable3), nopodramos
3 Elrendimientodeunaredneuronalsiempreestlimitadopor el ruido.Algunascomponentesdelvectordeentra-
dapuedenestarafectadasporelruido, comopuedeserelcasodeaquellos vectoresdeentradaqueseobtienendirec-
tamentedesensoresafectadosporruido,ovectoresmaletiquetados.Elprimertipoderuidosedenomina ruido de atri-
buto, yelsegundo,ruido de clasificacin.
garantizarqueclasifiquedeformacorrectalosposiblesvectores deentradaque noestnenel
conjuntodeentrenamiento.Enestesentido,diremosqueunaredhageneralizado cuandoclasi-
fiquedeformacorrectavectoresquenoestabanenel conjuntodeentrenamiento.Lacapacidadde
generalizacinsepuedemedirporlaprecisin conlaquerealizadichasclasificaciones.Enlos
siguientesprrafosexplicaremoscmoestimarlaprecisindelageneralizacin.
Respectoaesto,nospodramospreguntarenqunosbasamosparaesperarque,despusde
todo,unaredneuronalgeneralice?Estasituacinesmuyparecidaalaqueseproduceenel ajus-
tefuncional. Cuandointentamosajustarunarectaounpolinomiodegradopequeoaundeter-
minadoconjuntodedatos,podemostenerlaseguridaddequehemosdetectadoalgunarelacin
ocultaendichosdatos,sielajusteeslosuficientementebuenoyelconjuntodedatoseslosufi-
cientementegrande. Deestaforma, lafuncinobtenidasepuedeutilizarparaestimar(conuna
fiabilidadrazonable)valorescorrespondientesadatosquenohansidoutilizadosenelprocesode
ajuste.Sielajusteporunarectanoeslosuficientementebueno,podemosprobarconunpolino-
miodesegundogrado, y seguiraumentandoelgradodel polinomiohastaqueobtengamoslos
resultadosesperados.Trminossimilarespuedenusarseenlasredesneuronales. Unaredneuro-
nalimplementaunafuncinnolinealdelosvectoresdeentrada. Sitenemosencuentaqueelpro-
cesodeclasificacinesunafuncin,prximaaalgunadelasposiblesfuncionesquelaredpue-
deimplementar, y suponemosqueel ajusterealizado sobrelosdatos del conjuntodeentrena-
mientoes losuficientementebueno(para unnmerobastantegrandede vectores deentrada),
entoncespodemosafirmarqueesmuyprobablequehayamosencontradounarelacin,enprin-
cipiooculta,entrelasentradasylaclasificacindelasmismas. Enestesupuesto,lageneraliza-
cinparalosvectoresdeentradaquenoformanpartedelconjuntodeentrenamientodeberaser
ptima.
Alahoraderealizarelentrenamientodelaredesimportantequeelnmerodevectoresde
entrenamientoseamayorqueel nmerodegradosdelibertaddelamisma(esdecir,el nmerode
pesosquetienenqueseraprendidos).Elsmildelajustefuncionalnosayudaracomprender
esta afirmacin. Para un conjunto con m puntos, sabemos con toda seguridad que existe un
polinomiodegrado(m-l) queseajustaperfectamenteaesospuntos,esdecir,quepasaportodos
ellos.Pero,aunquesiemprepodremosrealizarestetipodeajuste,independientementedeladis-
posicindelospuntos,nonos servirparaestableceralgntipoderelacinenelconjuntode
puntosutilizado.Enestoscasosdiremosquehemossobreajustado dichosdatos. Si,adems,los
datos se venafectadosporalgntipoderuido(casosenlosqueel ajustea unarectapuedeser
suficiente),elpolinomiodegrado(m-l) sehabraajustadodemaneraexactaalosdatosconrui-
do. Paraevitarestetipodeproblemas,alahoraderealizarunajuste,elnmerodepuntosauti-
lizartienequesersensiblementemayorqueelgradodelpolinomioquevamosautilizar.Y, dado
unconjuntosuficientementegrande,elprincipiodelaNavaja de Occam nosdicequedeentre
todoslosposiblespolinomiosconlosquepodemosrealizarelajuste,eldegradomenorserla
mejor opcin4. En laFigura 3.7 se pueden apreciarde forma grfica estas consideraciones.
Podemosobservarqueelajusteporunpolinomiodesegundogradoessensiblementemejorque
si lorealizamosporunarecta,conlaquenoseproduceunsobreajuste,omejorqueconunpoli-
nomiodegradomayorqueprovoqueunsobreajuste.Estemismoprincipiosepuedeaplicaralas
redesneuronales.
Supongamosunareddirectadedoscapasconn entradas,h unidadesocultasyconunani-
casalida. Estaredtendraproximadamente (sin contarlospesosumbrales) nh + h (n + I)h
pesosvariables. Dadaladimensindelaentrada,el nmerodegradosdelibertadquedadeter-
4 GuillermodeOccam, 1285-1349,fue unfilsofoinglsalqueseleatribuyelafrase: non sunt multiplicanda entia
praeter necesstatem, quesignifica(dasentidadesnodebernmultiplicarseinnecesariamente.
48
49
r-
Inteligenciaartificial.Unanuevasntesis
Redesneuronales
fo anterior,paraevitarelsobreajustedelared,elaumentodel nmerodeunidades ocultas no
debeprovocarqueelfactor(n +l)h seaproximeal nmerodevectoresquecontieneelconjun-
todeentrenamiento.
Funcinlineal Tambinsepuededarelcasodeque,apesardequeobtengamosunporcentajepequeode
(erroralto)
errorparael conjuntodeentrenamiento,lageneralizacinnoseabuena.Existenvariosmtodos
paraestimarculvaaserelporcentajedeerrorparalasentradasquenoestnenelconjuntode
entrenamiento,seleccionadasstassiguiendolamismadistribucinconlaqueseformelcon-
juntodeentrenamiento.Enestadstica,esteerrorsedenominaerror fuera de muestra. Latcni-
camssimpleparaevaluaresteerrorconsisteendividirelconjuntodeentrenamientoendoscon-
juntosdisjuntos. Unodeestosconjuntos10 utilizaremoscomoconjuntodeentrenamiento,yel
otro,quedenominaremosconjunto de validaci6n, serutilizadoparacalcularelerror fuera de
muestra. Paraquelaestimacindelerrorfuerademuestraseasignificativa,elnmerodevec-
toresenambosconjuntosdebesergrande(obviamente,hayquetenercuidado,yaquepodemos
sobrestimardichoerror).Losdiseadoresexperimentadoscolocan213 delosvectoresdisponibles
enelconjuntodeentrenamientoyelrestoenel conjuntodevalidacin.
Otro mtodo bastante utilizadoenlaestimacindelaprecisin delageneralizacinesel
denominadomtododevalidaci6n cruzada. Enestecaso,losvectoresdisponiblesparael proceso
de entrenamiento sedividenenk conjuntosdisjuntos (normalmente 10). Seseleccionaunode
estos conjuntoscomoconjuntode validacin, ylosk - ] restantessecombinanparaformarel
conjuntodeentrenamiento.Esteprocesoserepitehastaquetodoslosconjuntoshansidoselec-
cionados como conjuntos de validacin. Paracada conjunto de validacin se calcula el error
correspondiente de realizar el entrenamiento con el resto de conjuntos), siendo la
mediadeestoserroreslaestimacindelerrorfuerademuestra.Enelcasoespecialdequek =m,
siendom el nmerodevectoresetiquetadosdisponibles,elmtodorecibeelnombredevalida-
ci6n cruzada por descarte de elementos. Losresultadosexperimentaleshandemostradoquecon
minado por el nmero de unidades ocultas. Podramos esperar que el error de clasificacin
10 conjuntos se consiguenbuenas estimacionesdel error (aunque un pocopesimistas). En la
cometidosobreelconjuntodeentrenamientodisminuyeraamedidaqueaumentsemoselnme-
Figura3.9sepuedevercmovaralaestimacindelerrorenelconjuntodevalidacinenfun-
rodeunidadesocultas-hastaquealcanzsemoslacotainferiordelerror(porsupuesto,sielcon-
cindel nmerodeunidadesocultasenunproblemadeclasificacintpico.Sepuedeobservar
junto de entrenamiento es linealmente separable, slo harafalta una unidad ocultapara no
cmoelerrorcometidoenelconjuntodevalidacinempiezaacrecerconelaumentodelnme-
cometererroresenelconjuntodeentrenamiento).EnlaFigura3.8sepuedeverunejemplotpi-
rodeunidadesocultasdebidoalsobreajuste.
codelerrorcometidoenelconjuntodeentrenamiento(expresadoenporcentajes)enfuncindel
Polinomiodegradoalto/
(errornulo)
dedatos
Figura3.7.
Ajustefuncional.
nmerodeunidadesocultas.Sinembargo,yteniendoencuentaloquehemosdichoenelprra-
Porcentajede 45
errorenel
40
conjuntode
35
entrenamiento
30
25
20
15
10
5
O

Porcentaje 45
deerror 40
35
30
25
20
15
10
5
O
Errorenelconjunto
devalidacin

Errorenelconjunto
deentrenamiento
O 1 2 3 4 5 6 7 8 9
O
Nmerodeunidadesocultas
Nmerodeunidadesocultas
Figura3.9.
Figura3.8.
Estimacindelerrordegeneralizacinfrente alnmerodeunidadesocultas(adaptadode[Duda;Hart,y
Elerrorfrentealnmerodeunidadesocultas(adaptadode[Duda;Hart.yStork; 1998]).
Stork, 1998]).
"....
50
Inteligenciaartificial. Unanuevasntesis Redes neuronales 51
Lecturasy consideracionesadicionales
Podemosencontrarunagranvariedaddeproblemasquepuedenresolverseusandoredesneuro-
3.1. Una ULU con vector de pesos W y umbral erepresenta un hiperplano. Encuentre una
nales,comosonelreconocimientodepatrones,elcontrolautomticoyelmodeladodefunciones
expresinparadeterminarladistanciadelorigenalhiperplano. Repitaelejercicio, peroobte-
cerebrales. Como ejemplos, podemos citarsistemas de reconocimiento decaracteres escritos .
niendolaexpresindeladistanciaentreunpuntoarbitrarioXyelhiperplano(vaseFig. 3.1).
(concretamentecdigospostales) [LeCunetal., 1989],reconocimientodelhabla[Waibeletal.
1988],ysistemasqueaprendenapronunciarlaspalabrasdeun texto [Sejnowskiy Rosenberg
3.2. Elsiguienteconjuntodeentrenamientoeslinealmenteseparable:
1987]. Sinembargo, hayquetenerencuentaqueeldiseo y elentrenamientodeeste tipode
redes todavatienealgodeartequerequierebastanteexperienciayungrannmerodeexperi-
Entrada Salida
mentos. Granpartede losresultadosmsprometedores, tantoenelcampodelainvestigacin
100 1
comoeneldelasaplicaciones,sonpresentadosenlaconferenciaanualsobreSistemasdePro-
011 O
cesamiento de Infonnacin Neuronal (NIPS, Neural Information Processing Systems), cuyas
110 1
actassonpublicadasbajoel nombreAvancesenlosSistemasdeProcesamientodeltifonnacin
111 O
Neuronal(AdvancesinNeuralInformationProcessingSystems).
O O 1 O
Comoyahemosdicho,elcomponentebsicodeunaredneuronal,laULU,divideelespacio 101 1
de los vectores de entrada mediante un hiperplano. Si la interseccin de los recubrimientos
convexosdedosconjuntosdeentrenamientoesnula,laseparacinsepuederealizarpormediode Utiliceesteconjuntoparaentrenar(manualmente)unaULU.LaULUautilizartendrcuatro
unhiperplano. Dichohiperplanopuedesercalculadoporlosmtodospresentadosenestecap- entradas,contandolaquerepresentaelumbral.LosvaloresinicialesdelospesossernO. Utili-
tulo, obienpormtodos basadosenlaprogramacinlineal (quepresentacomplejidadpolin- ce el procedimiento de correccin del errorcon incrementos fijos hasta que converja a una
mica)[Karmarkar, 1984].
solucin.Escribaelconjuntodepesosencadapasadadel procedimiento. Dibujeun cuboque
Enestecaptuloslohemostratadoconredesdealimentacindirectaporcapas.Elestudio tengacomovrticeslasentradasdelconjuntodeentrenamientoyelplanocorrespondientealcon-
delcomportamientodelasredesrecurrentesesmuchomscomplejo,aunquesepuedeexponer juntodepesosobtenidosenelentrenamiento.
deunaformamssimplehaciendousodelassimilitudesquetienenestetipoderedesconlafsi-
cadelossistemasdinmicos[Hertz,Krogh,yPalmer, 1991].Elalgoritmoderetropropagacinha 3.3. Tenemosqueclasificarunconjuntode vectoresdeentradadedimensinn conunaULU.
sidogeneralizadoparapoderseraplicadoaredesrecurrentes(estudiorealizadoindependiente- Sinembargo, yporrazonestcnicas,slopodemosusarpesospositivos. Qupodemoshacer
mentepor[pineda, 1987;Almeida, 1987,yRohwery Forrest, 1987]),siempreycuandostas pararealizarestclasificacin?
converjan hacia estados estables. (Una exposicin de este algoritmo se puede encontrar en
[Hertz;Krogh,yPalmer, 1991,pp. 172-176]). 3.4. Disee(noentrene)unareddirectaparaimplementarlafuncin o-exclusivodedosvaria-
Lasredesneuronalesconstituyenunodelosmltiplestiposdeestructurasquesonusadasen
bles.LareddebetenerunacapaocultadeULU,quetienencomoentradaslasvariablesXI yx
2
' Y
elcampodelaprendizajecomputacional.Otradelasestructurasmsusadassonlos rbolesde unaunidaddesalidaquetienecomoentradaslassalidasdeloselementosdelacapaoculta(pero
decisin--quetieneasufavorquelasfuncionesqueimplementan(funcionesbooleanasFND) nolasentradasXl yx
2
).
sonmsfcilesdeentenderquelasqueaparecenenlasredesneuronales.EnlA,RossQuinlanes
consideradocomoelprecursordelosmtodosdeaprendizajeenrbolesdedecisin,conalgo- 3.5. Demuestrequeesposibleimplementarcualquierfuncinbooleanadenentradasconunared
ritmoscomoellD3[Quinlan, 1919]yC4.5[Quinlan, 1993] (tcnicassimilareshansidodesa- neuronalqueslotengaunacapaoculta.
rrolladasdeformaindependienteporestadsticos[Breimanetal., 1984]).
3.6. Considerelasiguienteunidadnolineal:
Alolargodeestelibrosemostrarnalgunasdelas otrastcnicasqueseutilizanenelcampo
delaprendizajecomputacional.Sinembargo,steesunbuenmomentoparaindicaralgunasdelas
fuentesdeinformacinmsimportantesenesterea. LaconferenciamsimportanteeslaCon- X W ~ f ( X )
ferencia Internacional enAprendizaje Computacional (ICML, International Conference on
MachineLearning),cuyostrabajossepublicanenlascorrespondientesactas.Enlasactasdelas
ftX)=OsiX.W<-b
reunionesdetrabajosobreTeoradelAprendizajeComputacional(COLT,ComputationalLear-
ningTheory)sepuedenexaminardistintostrabajosenestecampo.Elanuariomsimportanteen =1siXW>b
este reaesMachine Learning. Libros importantes son [Mitchell, T., 1997; Langley, 1996, y
=(l/2b)(XW+b)deotromodo
WeissyKulikowski, 1991].Paraprofundizarenelcampodelasredesneuronalessepuedeleer
[Fu, 1994;Haykin, 1994,yHertz, KroghyPalmer, 1991]. Unarecopilacindeartculossobre
En vez de la tpica funcin umbral o la funcin sigmoide, tenemos una funcin rampa.
redesneuronalessepuedeencontraren[ShavlikyDietterich,1990],mientrasqueen[Dietterich,
Encuentreunareglaparael ajustedel vectorde pesos W que resultaradeaplicarun mtodo
1990]sepuedeverunarevisinimportantedelostrabajosrealizadosenelcampodelaprendizaje
incrementalacadavectordeentradaparaminimizarelerrorcuadrticoequeseobtieneentrela
computacional.
salidaactualfylasalidadeseadad. Comentelosresultados.
52 Inteligenciaartificial.Unanueva
3.7. Considerelareddelasiguientefigura. LaredtienetresentradasXl X
2
Yx
3
Launidad
moidall tienecomoentradaslasentradasdelared(ademsdelaentradaadicionalx
4
==
unidadsigmoidal2tienelasmismasentradasquelaunidad1ysupropiasalida.PorsupuesUJ
todaslasentradas alasunidadessigmoidales son ponderadascon sus correspondientes
Encuentreunaexpresinparaelprocedimientodeajustedepesos,basndoseenlaaproximacii
incrementaldelaretropropagacin,queminimizeelerrorcuadrticoentrelasalidadelaredy
etiquetasdelosvectoresdeentrenamiento.Debeutilizarnotacinvectorial,esdecir,nohace
tadescenderalniveldelascomponentesXi'
A1 _ ----Unidade .
- I ,"gmo;daIe,
Xl
X
2
7/ X3 ==J f
2
X4=1
3.8. Unaunidad de producto escalar (UPE)calculaelproductoescalardelvectordeentrada
y el vectordepesos W.Notiene umbraly su salidasecorrespondeconlaecuacinmatricial
WX,dondeWesun vectorfilayXunvectorcolumna.Teniendoencuentalareddelasiguien-
tefigura, formada porunidadesUPE,demuestrequedicharedequivaleaunanicaUPE,
candoculseraelvectordepesosparadichaunidadequivalente.
X
X X2 < )( (L ) (L 1--f
X
3
3.9.
1. Encuentreunareglaincrementalparaelcambiodelospesosdeunaunidadsigmoidal,
basndose en el mtodo del gradiente descendente. La funcin errorque tiene que
minimizaresE=Id- fl,donded eslasalidadeseada,!=1/(1 e-S) ys==
XyWvectoresdedimensin(n+
2. Analicelasdiferenciasentrelaregladerivadaenelapartadoanteriorylasreglasque ,
usanelerrorcuadrtico.
3. Qucambioshabraquerealizarenelprocedimientoderetropropagacinmulticapasi
utilizsemosestenuevocriteriodeerror?(Consideresiempreredesdirectas.)
1).
X.W,siendo
Computacin evolutiva
ajustanaesteprincipio.
Sistemas
evolutivos
Lossistemasquehemosestudiadoenelcaptuloanterioradaptaban sucomportamientoauncon-
juntodeejemplosdeentrenamiento.Estetipodeaprendizajeseasemejaalquepodemosencon-
trarenalgunossistemasbiolgicos.Sinembargo,lossistemasbiolgicostambinpuedenapren-
derpormediode laevolucin, procesomedianteelcual lasgeneracionesdescendientessevan
adaptandomejoralentornoquesusprogenitores.Podramosutilizarunprocesosimilaralaevo-
lucinparadesarrollarprogramas?Enestecaptuloexaminaremosunaseriedetcnicasquese
Laevolucinbiolgicaoperadelasiguienteforma: segenerandescendientesaimagendesus
progenitores,pero,conalgunasmodificaciones ymedianteunprocesodeseleccin natural (slo
los mejoradaptados sobreviven),los descendientes supervivientes producena su vezms des-
cendientes.Estosdosaspectosdelaevolucin,lamodificacinpormediodelareproduccinyla
seleccinnatural, sonsuficientesparagenerarindividuosquecadavezdesarrollanmseficien-
tementelasaccionesquecontribuyena suhabilidadreproductora. Lasiguienteanalogaconla
geometranos puedeayudaracomprenderesteproceso. Imaginemosun paisaje matemtico
compuestopormontaas,vallesyterrenos llanosqueestpobladoporunaseriedeindividuos
situadosdeformaaleatoriaenelpaisaje.Laalturaalaquese sitaunindividuoesunamedida
queindicalobienquedesarrollasutareaenrelacinconelrestodelosindividuos. Laprobabi-
lidaddequeunindividuodesaparezcaesinversamenteproporcionalasualtura,mientrasquela
probabilidaddequeunindividuosereproduzcaesproporcionalasualtura.Elprocesoderepro-
duccinconsisteenlacreacindeun nuevoindividuocuyaposicinenel paisajeserdistinta,
aunqueestarrelacionadaconladesus progenitores.Eltipodereproduccinmsinteresantey
eficienteesaquellaenlaque,paragenerarunnuevoindividuo,esnecesariolacooperacindedos
progenitores.Deestaforma, lalocalizacindelnuevodescendientesecalcularenfuncindela
localizacindesusprogenitores.Enlamayorpartedeloscasos,elprocesodeevolucincoloca-
ralnuevodescendienteenalgnlugarentrelosprogenitores,peroexistirunapequeapro-
babilidaddequeelnuevodescendienteseacolocadoenunlugarmsaltoqueeldelospadres.

53
55
8
r
54
Podemosconsideraresteprocesocomounmediodeencontrarlascimasde lasmontaas
paisaje.Cadanuevageneracindeindividuosexaminaelterrenoquelerodea.Aquellos
duosqueseencuentrenenzonasbajasmorirn(tienenunaaltaprobabilidadde desaparecer).
cabodeciertotiempo,encontraremosalgunosindividuossituadosenlascimasdelpaisaje.La
cienciadelprocesodeexploracindependerdecmodediferentesseanlosindividuos
toasusprogenitoresydelaorografadelpaisaje.Algunosdescendientessecolocarna
alturaquesusprogenitores,pero,ocasionalmente,algunospodrncolocarseamsaltura.
Esteprocesodebsquedaevolutivaesaplicadoenelcampodelainformticaados
masconcretos.Laaplicacinmsdirectalaencontramosenlaoptimizacindefunciones,
consisteenlabsquedadelvalormximodeunafuncin,!(x , ..., x,,). Losargumentosdela
1
cin(Xl' oo., X,,) nosindicarnlasituacindeunindividuoconcreto,y elvalordelafuncin
dichos argumentos nosindicarsu altura. John Holland (Holland, 1 975Jpropusounaserie
algoritmos genticos (AG)pararesolverestetipodeproblemas.LosAGestnsuficientemente
descritosennumerososlibrosdetextoyartculos(porejemplo,sepuedenexaminarlas
cias (Goldberg, 1989;Mitchell,M., 1996,YMichalewicz, 1992].
LaotraaplicacinconsisteeneldesarrollodeprogramaspararesolverproblemasconcretnC!
-porejemplo,programa<;paracontrolaragentesreactivos-.Enestecaptulonoscentraremos
estetipodeaplicaciones.Enestasaplicacionessehautilizadodeformasatisfactoriauntipode
denominado sistemas de clasificacin [Holland, 1986J; [Holland, 1975, pp. 171 Yss., 2.
cin].Laprogramacin gentica (PG)esotratcnicaquepermitegenerarprogramasde una
msdirectaqueladelosAG.En lasiguienteseccinilustraremosconunejemploelproceso
Programacin gentica
4.2.1. RepresentacindelosprogramasenPG
Enesteejemplo,utilizaremoslaPGparaconstruirprogramasfuncionalesenformadefunciones
LlSP. Estetipodeprogramassepuedenexpresarmedianterbolesconnodosetiquetados. Los
nodos internos representan funciones, predicados o acciones que requieren uno o ms
mentos. Los nodos hojas representan constantes, acciones o funciones que no necesitan
gumentos. En la Figura4.1 podemos verun ejemplode un programaque evalalaexpresin
Figura4.1.
ProgramarepresentadomedianteunrboL
Sistemasevolutivos
3+ (5 x4)/7representadocomounrbol.Enestecaso,losnodoshojassecorrespondenconlas
constantes3,4,5Y7, Ylosnodosinternosrepresentanlasfunciones+, x yl.
Enestaseccin, mostraremoscmolaPGpuedeserusadaparadesarrollarun programa
quepermitaaunrobotmoversesiguiendolasparedesdeunahabitacin,lamismatareaquese
consideroenelCaptulo2. Supongamosqueelmundodelrobotpuedeserrepresentadoporuna
cuadrculabidimensionalcomoladelaFigura4.2.Nuestroobjetivoes desarrollarunprogra-
maquetengacomoentradaslasentradassensorialesdelrobotycomosalidalaaccincorres-
pondienteadichasentradas.Elrobotsecontrolamediantelaejecucinrepetidadedichopro-
grama,queharqueelrobotsemuevadesdecualquierposicininicialarbitrariaa unacelda
contiguaalapared; apartirdeah, deberseguirlaparedalolargodetodalahabitacin sin
parar.
Entrelasfuncionesprimitivasquevamosausarenelprograma,estnlasfunciones boolea-
nas AND, OR, NOT y1F,Ylas acciones norte,sur,esteyoeste.Lasfunciones booleanas se
definendelasiguienteforma:
1. AND (x, y) Osix =O; sino, y
2. OR(x, 1 si x = 1 si no, y
3. NOT(x) =OsiX 1 sino, 1
4. 1F(x,y, z) =ysix=lsino, 2
LasaccionessedefinencomolohicimosenelCaptulo2:
1. nortedesplazaelrobotunaceldahaciaarriba.
2. estedesplazaelrobotunaceldaaladerecha.
3. surdesplazaelrobotunaceldahaciaabajo.
4. oestedesplazaelrobotunaceldahacialaizquierda.
Comosepuedeapreciar,lasfunciones deaccinproducenunaseriede efectos,apesardeno
tenerargumentos.Elprogramafinalizaconlaejecucindecualquieradeellas,con10quenoes
necesariopropagarningnvaloralosnodospadres.Todaslasfuncionesdeaccinproducenlos
no n ne
o
e
so s se
Figura4.2.
Unrobotenunmundocuadriculado.
56
57
r--
Sistemasevolutivos
efectosarribaindicados,a noserqueelrobotintente traspasarlapared;enestecaso, elnico
efectoquetienelaaccinesladetenninarelprograma.Porsupuesto,laejecucinrepetidadeun
programaquenoproduzcaningnefecto, tampocoproducirefectoalguno.
UsaremoslasmismasentradassensorialesqueutilizamosenelCaptulo2. Sinembargo,
vezdeutilizarlanotacinSI' , S8' nosreferiremosaellasporsusabreviaturas,esdecir, n,
e,se,s,so,yno.EstasentradastomarnelvalorOsiemprequelaceldacorrespondiente
daserocupadaporel robot; encasocontrario, tomarn elvalor l.EnlaFigura4.2sepueden
apreciarlasposicionesdelasceldasrelativasalasituacindelrobot.
EnPG,debemosasegurarnosdequetodaslasexpresionesysubexpresionesusadasenelpro-
gramatenganunvalorparatodoslosposiblesargumentos(anoserquelaevaluacindelaexpre-
sinimpliquelaterminacindelprograma).Porejemplo,siutilizramoslafuncinDivide(x, y).
paraevaluarelcocientexly, deberamosasignarunvalorcuandoy seaigualaO(porejemplo,O).
Deestaforma, nosaseguramosquecualquierrbol quepodamosconstruirrepresentaunpro-
gramaejecutable,siempreycuandolasfuncionesutilizadastenganelnmerodeargumentosade-
cuados.Comoveremosmsadelante,estacondicinesbastanteimportante.
En la Figura4.3 se puede ver un programa cuya ejecucin hace que el robot se mueva
haciaelnortehastaqueencuentrelapared, y, apartirdeesemomento,siguelaparedenelsen-
tidodelasagujasdelreloj.Endichafiguratambinpodemosvercmoel rbol sepuederepre-
sentarmedianteunalista.
(IF (AND (OR (n) (ne (NO'l' (e)
(este)
IF (AND (OR (e) (se (NOT (s)
(sur)
(IF (AND (OR (s) (so (NOT (o)
(oeste)
(norte))))
Figura4.3.
Programaparael seguimientodelasparedes.
4.2.2. El proceso PG
Elprocesodeprogramacingenticacomienzaconunapoblacindeprogramasaleatoriosfor-
madosporlasfunciones,constantesyentradassensorialesqueconsideremosnecesariasparaque
unprogramaseaefectivoeneldominiodeinters.Estosprogramasinicialesconstituyenloque
sedenominageneracin O. EltamaodelapoblacindelageneracinOesunodelosparmetros
deunaejecucindelPG. Ennuestroejemplo,comenzaremosconunapoblacininicialde5.000
programasaleatorios.Estosprogramasinicialesseconstruirnapartirdelasfuncionesprimitivas
AND, OR, NOTe 1F,lasacciones norte,sur,esteyoeste,lasentradassensorialesn,ne,e,se,
s,so,ynoylasconstantesOy 1. Encadageneracinevaluaremostodoslosprogramasquela
compongan, y produciremos unanuevageneracin siempreycuandonoseencuentre unpro-
gramaquefuncionedeformaaceptable.
La evaluacin de un programa consistir en la ejecucin del mismo para determinar lo
bienquedesarrollalafuncin paralaquehasidoconstruido.Ennuestrocaso,ejecutaremosel
programa60vecesycontaremoselnmerodeceldasvisitadascontiguasalapared(unprogra-
maquenuncalleguealaparedproducirunacuentadeO, mientrasqueunprogramaquefun-
cione perfectamente producir una cuenta de 32, que es el nmero de celdas contiguas a la
pared).Esteprocesolorepetiremos 10vecespara10posicionesinicialesdistintasdelrobot,ele-
gidasde formaaleatoria. Lacuentatotal deceldascontiguasalaparedquehansidovisitadas
duranteesas10ejecucioneslautilizaremoscomomedidadelaidoneidad delprograma.Ennues-
trocaso,estamedidadeidoneidadalcanzarcomovalormximo320-alcanzablesloporun
programaqueencadaunadelas 10ejecucionesvisitelas32celdasprximasalapareddespus
de60pasos.
Lageneracin(i +l)-simaserconstruidaapartirdelageneracini-sima,delasiguiente
forma:
1. Copiaremosdirectamenteenlageneracin(i+1) 500programas (un 10por 100) dela
generacini. Estosindividuossernseleccionadosmedianteelprocesodeseleccin por
torneo: delos5.000programasdelageneraciniseseleccionanaleatoriamentesiete(con
reemplazamiento), y copiamos en lageneracin (i +1) el ms idneo (este procedi-
mientoesunodelosmseficientesparalaseleccindeindividuos).Elnmero7yelpor-
centajedeprogramasquesecopianenlasiguientegeneracinsonparmetrosadiciona-
lesdelprocesoPG.
2. Generaremos4.500nuevosprogramashijos(90por100)quepasarnaformarpartedela
generacin(i +1). Cadahijo secreaapartirdeunprogramapadre yunprogramamadre
medianteunprocesodecruzamiento: seseleccionanunprogramapadrey unprograma
madrede lageneracin i mediante laseleccinportorneo (al igualqueenel apartado
anterior).Seseleccionaaleatoriamenteunsubrboldelpadreparareemplazaraunsubr-
boldelamadre, tambinescogidodeformaaleatoria.Elresultadoesunnuevohijo (la
ejecutabilidaddeestenuevodescendienteestgarantizada,yaquetodaslasfuncionesuti-
lizadasenelprogramaestndefinidasparatodoslosvaloresposiblesdelosargumentos).
EnlaFigura4.4sepuedeverunejemplodelaoperacindecruzamiento.Elnodosom-
breadoencadaprogenitorindicaelpuntoelegidopararealizarelcruzamiento.Laido-
neidaddeldescendientepuedesermayoro menorqueladelosprogenitores.Laefecti-
vidaddelprocesodecruzamientoresideenelhechodequeenelhijohemosincorporado
unapartedeunprogramaprincipalyunapartedelassubexpresionesdedosprogenitores
consideradosidneos.
3. Algunasveces,tambinseutilizaunoperador de mutacin enlaconstruccindelosindi-
viduosdelasiguientegeneracin.Sidecidimoshacerusodeesteoperador,sufrecuencia
58
59
Puntos de cruzamento
elegidos aleatoriamente
11""
/--------
Programa hijo Programa madre
4.2.3.
Programa padre
Figura 4.4.
Dos programas progenitores y su hijo.
de utilizacin debe ser escasa (por ejemplo, fijar su tasa de utilizacin en un 1 por 100). El
operador de mutacin selecciona un nico progenitor de la generacin i mediante la
seleccin por torneo. Una vez seleccionado el progenitor, suprimimos un subrbol, selec-
cionado de forma aleatoria, y lo reemplazamos por un nuevo subrbol, generado aleato-
riamente, tal y como se generaban los programas de la generacin O. En el ejemplo que
estamos mostrando no utilizamos este operador.
Como se puede apreciar, debemos determinar el valor de una serie de parmetros bastante
arbitrarios usados para la construccin de la siguiente generacin: el nmero de individuos que se
copian, el nmero de individuos producidos por cruzamiento, el nmero de individuos usados en
la seleccin por torneo y el porcentaje de mutacin. Los valores escogidos para este ejemplo se
basan en las recomendaciones realizadas por expertos en la materia.
Desarrollo de un robot seguidor de paredes
Para construir un robot que siga las paredes, empezaremos el proceso PG con una poblacin ini-
cial de 5.000 programas aleatorios 1 generados segn el procedimiento descrito en la seccin ante-
rior. Muchos de los programas aleatorios de la generacin O no tienen ningn efecto; por ejemplo,
el programa (AND (so) (ne) ) (cuya idoneidad es nula) evala el primer argumento y termina
si el resultado es O; en cualquier otro caso, evaluar el segundo argumento y tambin terminar.
Algunos programas movern el robot en una sola direccin independientemente del valor de sus
El autor agradece a David Andre la preparacin de este ejemplo ilustrativo.
Sistemas evolutivos
parmetros. Por ejemplo, cuando el programa (OR (e) (oes te) ) evale la expresin oeste,
mover el robot hacia el oeste y terminar. Este programa tiene una idoneidad de S (algunas de
sus ejecuciones aleatorias llegan a celdas prximas a la pared). Los 5000 programas de la gene-
racin O pueden ser considerados como el resultado de realizar una bsqueda ciega en el espacio
de los programas constituidos por los elementos elegidos para este problema concreto.
En la Figura 4.5 se puede ver el programa con la idoneidad ms alta de la generacin O (ido-
neidad =92), expresado mediante una estructura de tipo lista, junto a dos de sus ejecuciones.
Como se puede apreciar, el programa es difcil de leer y tiene bastantes operaciones redundantes,
hecho bastante comn en la PG (muchas de estas operaciones pueden ser eliminadas si somete-
mos a los programas a un procesado antes de su ejecucin). Independientemente de dnde se par-
ta, este programa se mueve hacia el este hasta que alcanza una celda pegada a la pared. En ese
J
I
-

r
-
..J
(AND (NOT (NOT (IF (IF (NOT (no
(IF (e) (norte) (este
(IF (oeste) (O) (sur
(OR (IF (no) (ne) (o
(NOT (so)
(NOT (NOT (norte}}})
(IF (OR (NOT (AND (IF (so) (norte) (ne
(AND (sur) (1) } } }
(OR (OR (NOT (s))
(OR (e) (e))
(AND (IF (oeste) (ne) (se
(IF (1) (e)(e)
(OR (NOT (AND (NOT (ne (IF (este) (s) (n
(OR (NOT (IF (no) (este) (s)
(AND (IF (o) (so) (1
(OR (so) (no)
(OR (NOT (IF (OR (n) (o) )
(OR (O) (se
(OR (l)(este
(OR (AND (OR (1) (ne
(AND (no) (este)
(IF (NOT (oeste)
(AND (oeste) (este
(IF (1)(norte)(o)
Figura 4.5.
El individuo ms idneo de la generacin inicial.
60
61
Sistemasevolutivos
momento,semoverhaciaelnortehastaquepuedamoversehaciael esteotravez. Unavezque
llegaalrincnsuperiorderecho,ynopuedamoversenihaciael norteni haciaeleste, se move-
rendireccinoestehastaquequedeatrapadoenelrincnsuperiorizquierdo.
Elmejorprogramadelasegundageneracintieneunaidoneidadde117.EnlaFigura4.6se
puedeverdichoprogramaydosdesusejecuciones.Elprogramaesmspequeoqueelmsid-
neodelageneracininicial,perosequedaparadoenelrincninferiorderecho.
Enlasextageneracin,laeficienciadelprogramahaaumentado,obtenindoseunaidoneidad
de 163.Esteprogramafuncionaperfectamente,perotambinsequedaparadoenelrincninfe-
riorderecho,talycomopodemosapreciarenlaFigura4.7.
r--
-
L--
(NOT (AND (IF (ne)
(IF (se) (sur) (este
(n6rte))
(NOT (NOT (e)
Figura4.6.
Elindividuomsidneodelasegundageneracin.
r-

- .-
(11" (AND (NOT (e
(IF (e) (s) (no)
(OR (IF (1) (e) (sur
(IF (norte) (este) (no)
(IF (OR (AND (O) (norte
(AND (e) (IF (e)
(IF (se) (sur) (este
(norte)) ) )
(AND (e)
(NOT (IF,(s) (so) (e
(OR (OR (AND (no) (este))
)
(no))
Figura4.7.
El individuomsidneodelasextageneracin.
(IF (IF (IF (se) (O) (ne
(OR (se) (este)
(IF (OR (AND (e) (O)
(so) )
(OR (so) (O )
(AND (NOT (AND (s) (se
(se))
(IF (o)
(OR (norte)
(NOT (NOT (s
(oeste))
(NOT (NOT (NOT (AND (NOT (sur
(se)
(o))
(NOT (n))))
Figura4.8.
El individuomsidneodeladcimageneracin.
Finalmente,en lageneracin 1 0,el procesoPGhadesarrolladounprogramaquesiguelas
paredesperfectamente.EnlaFigura4.8sepuedeverdichoprograma,ascomodosejecuciones
delmismoparadosposicionesinicialesdistintas. Comosepuedever,elprogramasemuevehacia
el surhastaqueencuentralapared,ydespuslasigueenel sentidodelasagujasdelreloj.
EnlaFigura4.9semuestraunagrficaenlaqueserepresentalaevolucindelaidoneidad
mximadecadageneracin. Sepuedevercmolaidoneidadvaaumentandodeformaprogresiva
(enlamayorpartede loscasosenpequeascantidades)degeneracinengeneracin.
350
300
250
"O
200
':
e
o 150
"O
.....
100
50
O 2345678910
Nmerodelageneracin
-
o,
T.J
,/
/
V
l'
.....
Figura4.9.
Laidoneidadenfuncindelnmerodegeneracin,
Los algoritmos genticos y la programacin gentica han sido aplicados a una gran variedad de
problemas. Los mtodos utilizados en la PG han conseguido desarrollar agentes reactivos con un
xito equiparable al obtenido aplicando otros mtodos de la lA. Entre ellos, podemos citar los
robots que se desenvuelven en los mundos de bloques, los robots especializados en el segui-
miento del rastro de una hormiga, programas para aparcar marcha atrs un camin con remolque
y programas de control del pndulo invertido. En [Koza, 1992] se pueden analizar stas y otras
demostraciones de la versatilidad de este tipo de tcnicas. La eficacia de estos mtodos se puede
extender aplicando el proceso evolutivo para elaborar subrutinas que pueden ser utilizadas como
funciones primitivas por un programa principal, sujeto tambin a un proceso evolutivo. Esta
caracterstica y sus aplicaciones pueden ser examinadas en [Koza, 1994]. Entre las aplicaciones
ms complejas en las que se han aplicado con xito estas tcnicas se encuentran el diseo de fil-
tros electrnicos, amplificadores y todo tipo de circuitos [Koza et al., 1996]. Tambin se han
desarrollado trabajos preliminares que, haciendo uso de las tcnicas descritas en este captulo,
permiten la construccin de programas que construyan y usen estructuras de memoria, que bus-
quen y empleen estructuras recursivas [Andre, 1995; Teller, 1994, y Brave, 1996].
Artculos de investigacin sobre algoritmos genticos y programacin gentica se pueden
encontrar en las actas de las conferencias sobre programacin gentica, en la revista IEEE Tran-
sactions on Evolutionary Computation, y en las actas de los congresos internacionales sobre algo-
ritmos genticos.
4.1. Especifique las funciones de idoneidad que permitan desarrollar agentes que:
1. Controlen un ascensor.
2. Controlen los semforos de una avenida de una ciudad.
4.2. Encuentre el significado de las palabras genotipo y fenotipo en la teora biolgica de la evo-
lucin. Cmo se interpretaran dichas palabras en el campo de la PG?
4.3. Cmo podramos modificar el proceso de cruzamiento para no ser tan estrictos a la hora de
exigir que la ejecucin de cualquier subrbol devuelva un valor?
4.4. El proceso de cruzamiento en PG selecciona un subrbol aleatorio de cada progenitor.
Comente cules seran los efectos si cambiamos la seleccin aleatoria por:
L La seleccin de los subrboles ms activos durante las evaluaciones de la idoneidad.
2. Los subrboles ms grandes frente a los ms pequeos, y viceversa.
4.5. Cmo podramos adaptar un proceso evolutivo, como PG, para desarrollar:
1. Redes neuronales.
2. Sistemas de produccin.
Describa el proceso detalladamente. En particular, indique cmo se implementara la opera-
cin de cruzamiento. Comente si se permitira la evolucin lamarkiana en el desarrollo de redes
neuronales.
4.6. Indique las razones por las que piense que la mutacin es til en los procesos evolutivos
basados en el cruzamiento. Si cree que no es til, razone su respuesta.
Sistemas
con estados
Representacin del entorno mediante vectores de caractersticas
El vector de caractersticas utilizado por un agente E-R se puede considerar como una represen-
tacin del estado del entorno relevante para la tarea que desarrolla el agente. A partir de este vec-
tor de caractersticas, el agente E-R calcula una accin apropiada para el estado correspondiente.
Como ya hemos dicho, las limitaciones del sistema sensorial de un agente hacen que sea impo-
sible obtener representaciones precisas del estado del entorno por medio de los vectores de
caractersticas -especialmente de los vectores de caractersticas obtenidos de los estmulos
sensoriales inmediatos. Sin embargo, podemos mejorar la precisin si tenemos en cuenta la
historia sensorial previa que el agente ha procesado. Esto es debido a la existencia de aspectos
relevantes del entorno que no pueden percibirse en un instante concreto, pero que pueden haber
sido percibidos con anterioridad. Supongamos que el agente tiene una representacin inicial del
entorno para algn instante de tiempo t =O. (Esta representacin inicial puede ser prestablecida
por el diseador.) Asumiremos que la representacin del estado del entorno en un instante t + 1 es
una funcin de las entradas sensoriales en el instante t + 1, la representacin del estado del entor-
no en el instante de tiempo anterior t y la accin seleccionada en el instante de tiempo t. A este
tipo de sistemas que mantienen la historia de su entorno de la forma que acabamos de definir los
denominaremos sistemas CQ!1f!.stadl!.. Adems de las entradas sensoriales inmediatas, este tipo de
sistemas debe tener una memoria en la que poder almacenar un modelo del entorno.
Este modelo puede tener varias representaciones. La forma ms simple de representacin
consiste en un vector de caractersticas --como el que utilizan los sistemas E-R-. Pero ahora, el
vector de caractersticas XI + 1 depende del vector de caractersticas recordado, XI' La Figura 5.1
ilustra este tipo de sistemas con estados. Debido a que los entornos en los que puede operar un
agente pueden ser arbitrariamente complejos, el vector de caractersticas del agente slo podr
representar el entorno de manera imperfecta. Sin embargo, incluso en estos casos, podemos
disear agentes capaces de fusionar la informacin proveniente de varios estados del entorno.
Para ello, el diseador del agente debe encontrar un vector de caractersticas que ofrezca una
representacin adecuada del entorno -al menos en lo que concierne a la tarea que desarrolla.
63
64
Vectordecaractersticas,X, I O
Entrada
sensorial
X
Funcinparael
I
_
1
perceptual
Procesamiento
clculodelaaccin
a _
t 1
Memoria
(vectoresde
caractersticasy
accionesprevias)
al
Figura5.1.
Unamquinaconestados.
Como ejemplo de sistema con estados, retomaremos el robot descrito en el Captulo 2.
Recordemosqueesterobotmodelabasuentornomedianteunvectorde caractersticas,queera
obtenidodirectamentedeochoentradassensorialesqueinformabanalagentesi lascasillasque
lorodeaban estaban ocupadas o no. Supongamos ahora que nuestro robottiene limitadas sus
capacidades sensoriales,esdecir, ahoraslopuedepercibirelestadodelascasillassituadas al
norte,sur,esteyoeste.Comopodemosapreciar,impedimosquepuedapercibirelestadodelas
cuatrocasillassituadasenlasdiagonales.Portanto,susentradassensorialessernS2' S4' S6 YSg, Y
tomarnelvalor1silascorrespondientesceldasestnocupadas,yOsiestnlibres.Inclusocon
estalimitacin,el robotpuededesarrollarsutarea(elseguimientodelosbordes)sielvectorde
caractersticasnecesarioparadecidirquaccintomarsecalculaapartirdesusentradassenso-
riales,elanteriorvectordecaractersticasylaaccinqueacabadeserejecutada(siempreycuan-
doasumamosquenoexistenpasillosestrechos).
Parahacerqueelclculodelaaccindependadeestaversinlimitadadelvectordecarac-
tersticasutilizaremoslascaractersticasW S' parai =2, 4, 6, 8. Enlugarde lasentradassen-
sorialesqueestnausentes,sustituiremosdichascaractersticas,WI' w
3
' w
5
Yw7' porlossiguien-
tesclculos:w} tomarelvalor 1si,yslosi,enelinstanteanteriorw
2
tenaelvalor 1yelrobot
semovialeste.Delamismaforma, w
3
tomarel valor 1si,yslosi,enelinstanteanteriorw4
tenaelvalor1yelrobotsemovial sur(encualquierotrocaso,w
3
=O). Elrestodelascarac-
tersticaspuedenserevaluadasdelamismaforma.
Con estas caractersticas y el siguiente sistema de produccin podemos implementar la
tareaquepermiteal robotseguirlasparedes(enunmundosinpasillosestrechos):
este W g norte sur
W
2
W
4
W
2
W
5
sur w norte w
7
oeste W
4
W
6 J
oeste este 1 norte w
6
w
g
w
3
Sistemasconestados
Observeque el robotpresentadoenelCaptulo2(que noestabalimitado sensorialmente)
podadesarrollarsufuncinsinmemorizarlasentradas,caractersticasyaccionesprecedentes.Si
todoslos aspectosdel entornoquesonrelevantesparaelagentepuedenserpercibidosenelins-
tanteen quesonnecesarios, no hay motivoalgunoparaalmacenarunmodelodelentornoenla
memoria. Sinembargo,lascapacidadessensorialesestnsiemprelimitadasdealgunaforma, y,
portanto,losagentesquedispongande modelosdelentornoalmacenadosensusmemoriaspue-
dendesarrollartareasquelosagentessinmemoriano podran.
Redes de Elman
Un agentepuedeutilizarun tipoespecialderedneuronalrecurrente(denominadared de Elman
[Elman, 1990]), para aprender cmo calcularun vectorde caractersticas, y laaccincorres-
pondiente,apartirdelasentradassensorialesydeunvectordecaractersticasanterior.Parailus-
trarcmosepodrarealizaresteproceso,utilizaremosnuestrorobot,quesiguelasparedesyque
slopuedepercibirelestadodelascasillassituadasal norte,este,suryoeste.Laredaprendea
almacenarlaspropiedadescorrespondientesadatospercibidosconanterioridad,yquesonrele-
vantes paralatareaque estdesarrollando. EnlaFigura5.2sepuedeveriareddeElman que
vamosautilizar. Dicharedtieneochounidadesocultas,unaporcadaunadelascaractersticas
quenecesitanuestrorobot1. Laentradadelaredestconstituidaporlascuatroentradassenso-
Conexionesrecurrentes
__
Unidades
salida norte
Totalmente
1a 1(retrasadas
unaunidaddetiempo)
conectadas ./ este
sur
conectadas oeste
Totalmente
S2 O 1 conectadas
s. O
s" O
Sg O
Unidadesde
entradasensorial
Figura5.2.
ReddeElman.
I Porsupuesto.enunasituacindeaprendizajetpicanoconoceremoselnmerode unidadesocult,"s (ocapasocul-
tas)necesarias.
--
66
67
rialesquepercibenuestrorobot(S2' S4' S6 YS8)' juntoconlosvaloresdelasochounidadesocultas
correspondientes al paso inmediatamente anterior. Estas unidades adicionales se denominan
unidades contextuales, yaquepennitenquelaredpuedabasarsus acciones encaractersticas
aprendidas de los datos percibidos con anterioridad -esdecir, en el contexto en el que se
encuentra-oComohemosindicadoconanterioridad,existendiferentesfonnasdedisearredes
queposeanmltiplessalidas.Ennuestrocaso,necesitamoscuatrosalidasdiferentes,correspon-
dientes acadaunadelas posiblesacciones norte,este,suryoeste.Comosepuedeverenla
Figura5.2,laredqueestamostratandocumpleesterequisito.Todaslasunidades desalidacal-
culanlaaccinapartirdelmismoconjuntodeunidadesocultas(caractersticas).Entrenaremosla
reddetalfonnaqueslounadelassalidaspresenteelvalor1almismotiempo.Elentrenamiento
sellevaracabopresentandoalaredunasecuenciadeentradassensorialesetiquetadasconsu
correspondienteaccin.Esteconjuntosepuedeobtenerobservandocmoactuariaunexpertoen
elseguimientodeparedes. Unavezentrenadalared, seleccionaremoscomoaccinlaindicada
porlaunidaddesalidaquetengael valor l.AunquelasredesdeElmansonuncasoespecialde
redes neuronales recurrentes (Cap. 3), el proceso de entrenamiento se puede llevar a cabo
medianteel mtododelaretropropagacin, yaquelos pesos delas conexionesde retroalimen-
tacin(delas unidadesocultasalascontextuales)sonfijos, ylasunidadescontextualessetratan
comootroconjuntodeentradas.
Representaciones icnicas
Losvectoresdecaractersticassonslounadelas mltiplesfonnasqueexistenderepresentarel
entomoenel que se desenvuelve un agente. Tambin sepueden emplearotras estructuras de
datos.Porejemplo,nuestrorobotpodrautilizarunamatrizparaalmacenarunmapaenelquese
representenlas casillas queestn libres u ocupadas enel momentoque stas sean percibidas.
Estasdosposibilidadesde representarelmundo,bienmediantecaractersticaso bien mediante
estructurasdedatos,establecenunaprofundadivisindentrodelcampodelaInteligenciaArti-
ficial. Porunlado,tenemosloquedenominamosrepresentacionesdelmundobasadas en carac-
tersticas -unvectordecaractersticasoatributos-oPorotrolado,tenemosloquedenomina-
mosrepresentacionesicnicas -estructurasdedatos,comolos mapas,queenlamayoradelos
casos se pueden considerar como simulaciones de los aspectos relevantes del entorno--.
Aveces,utilizamoseltrminorepresentacionesanalgicas parareferimosalasrepresentaciones
icnicas.Esdifcilestablecerunadistincinclarayprecisaentreambostipos,aunquealolargo
deestelibroiremosestableciendolasdiferenciasprincipales.
Eluso de unarepresentacinicnicano eximeal agente de tenerque calcularlas acciones
correspondientesalatareaquetienequedesarrollaryalestadoactual(omodelado)delentorno.
Losagentesreactivosreaccionanalaestructuradedatosdelamismafonnaquelos agentessin
memoriareaccionanalosestmulossensoriales,yaquecalculanunconjuntodecaractersticasa
partirdelaestructuradedatos.EnlaFigura5.3podemosverunafonnadeorganizarlaestructu-
rainternadeunagentedeestetipo.Lasentradassensorialesseutilizanenprimerainstanciapara
actua1izarlarepresentacinicnica.Unavezactualizadalarepresentacinicnica,serealizanuna
seriedeclculos,parecidosalprocesamientoperceptualquetienelugarenlosagentesE-R,para
extraerlascaractersticasrequeridasporelsubsistemaquecalculalaaccin.Entrelas accionesque
elagentepuedeejecutar,podemosencontraraquellasquemodificanlarepresentacinicnicaylas
que tienen algn efecto sobre el entorno. Las caractersticas derivadas de un modelo icnico
debenrepresentarel entornodeunafonnaadecuadaaltipodeaccionesqueelrobotdebetomar.
Paraquenuestrorobotpuedautilizarunarepresentacinicnicadelacuadrculaenlaquese
desenvuelve,pormediodeunamatrizenlaqueserepresentenlasceldaslibresu ocupadas,es
Sistemasconestados
-
Vectordecaractersticas
1
1
1
Entrada 1
Funcinpara IAccin
Procesamiento
Procesamiento
Figura5.3.
Memoria
(vectoresde
caractersticasy
accionesprevias)
elclculode
perceptual
laaccin
Agentequecalculalascaractersticasapartirdeunarepresentacinicnica.
necesarialapresenciade sensoresquepuedanpercibirelestadodecualquieradelascasillas.Por
ejemplo,considresequenuestrorobottienecomorepresentacinicnicalamostradaenlaFigu-
ra5.4.LasceldaslibresserepresentanporunOenelelementocorrespondientedelamatriz,las
celdas ocupadas porun 1, y las celdascuyoestadoesdesconocido, se representanpor"1"; la
posicindel robot relativaa lasceldasque lorodeanse representaporlaletraR. Elestadodel
entornorepresentadoenlaFigura5.4podraevocarlaaccinoestesielrobotestuvieradiseado
paradirigirsealaparedmsprximay, desdeall,seguirelcontornointeriordelasparedes.Por
supuesto,despusdeemprenderlaaccin,nuestrorobotdebeactualizarlarepresentacinicnica
paracambiarsuposicinytenerencuentalasnuevasentradassensoriales.
Otromecanismoparaelclculodelaaccinutilizaunmodelobasadoenloquesedenomi-
na8!!!!E0 de potencigl -l1ifidal. staes unadelas tcnicas ms usadas paracontrolarrobots
mviles [Latombe, 1991,Cap.7].Enestoscasos,elentornoestrepresentadoporuncampode
potencial bidimensional
2
Elcampodepotencialseobtieesumandolascomponentes atracti-

?
?
?
?
?
?
?
?
?
?
? ?
Figura5.4.
Representacionesicnicasdetipomapa.
2 Si existen muchos grados de libertad acontrolar, ser necesario utilizarcampos de potencial de ms de dos
dimensiones.
68 69
..,..-
las repulsivas. Lacomponente representa la posicin -esdecir, la
posicinalaquetIenequedirigirseelrobot-oLafuncinpiX)=k)d(X)2 esunatpicafuncin
atractiva, donde d(X) es la distancia eucldea entre el punto X y el objetivo. Dicha funcin
tomael valormnimoOenlaposicinobjetivo. Los componentesrepulsivosrepresentanobs-
tculosenelentorno. LafuncinPr(X) =k
2
/d
o
(Xy2es unatpicafunCinrepulsiva,dondedo(X)
represeniidlstanciaeucldeaentreelpuntoXyel puntomscercanodel obstculo.
totalsecalculamediantelasumaP = Pa +p" yelmovimientodelrobotserealiza
atravsdeladireccinsealadaporelgradientedel-campodepotencial-,dichodeotrafor-
ma,deslizndoseporlaspendientesdedichocampo--.El campodepotencialpuedeserprecal-
culadoyalmacenadoenlamemoriadelrobotamodode modelodel mundo,osepuedecalcular
incrementalmenterespectoalaposicindelrobotcuandostenecesitedeterminarelsiguiente
movimiento.EnlaFigura5.5 sepuedeverunejemplodecampode potencial.Laposicindel
robotseindicamediantelaletraR, yelobjetivomediantelaletraG(Fig.5.5a).Lospotenciales
atractivos,repulsivosytotalessemuestranenlasFiguras5.5b,5.5cy5.5d,respectivamente.En
laFigura5.5esepuedenapreciarlascurvasequipotencialescorrespondientesalejemploylatra-
yectoriaqueseguirelrobot. Sinembargo,el mtodopuedeverseafectadoporlaexistenciade
mnimos de potencial que podran atrapwalrobot En [Latombe, 1991], se pueden analizar
algunosmtodosparasolucionaresteproblema.
G
-
R
..
(h) (a)
(d)
(e)
(e)
Figura5.5.
Curvasequipotencalesdeuncampoparticulardepotencial.
-
Sistemasconestados
Sistemas basados en pizarras
A pesar de lo que acabamos de ver, no es obligatorio utilizar representaciones icnicas para
modelarelentorno,aunqueseanlasestructurasdedatosmsutilizadas. Untipoimportantedesis-
temasinteligentessebasaenloquedenominamosarquitectura de pizarra [Hayes-Roth, 1985;Nii,
1986a,yNi, 1986b],queutilizaunaestructuradedatosdenominadapizarra.La pizarraseleeyse
modificaporunosprogramasquesedenominanmdulos de conocimiento (MC). Lossistemas
basadosenpizarraspuedenserconsideradoscomounaextensindelossistemasdeproduccin,
queyahemosdescritoencaptulosanteriores. Cadamdulodeconocimientoestformadoporuna
partede condicinyunapartede accin. Lapartedecondicincalculaelvalorde unacaracte-
rstica,ypuedesercualquiercondicindefinidasobrelosdatosde lapizarraquedevuelvaun l o
unO(o,siseprefiere,verdadero ofalso). Lapartedeaccinpuedeestarconstituidaporcualquier
programaque,o bien modifiquelapizarra,obienlleveacaboalgunaaccinexterna (o ambas
cosasala Cuandodosomsmdulosdeconocimientoobtenganun 1alevaluarsucondi-
cin,unmecanismoparalaresolucin de conflictos decidequmdulodeconocimientodebepro-
ceder. Adems demodificarlapizarra, lasaccionesllevadasacaboporlosmdulosdeconoci-
mientopuedenafectaralentorno.Lapizarratambinpuedesermodificadaporelsubsistemaper-
ceptualqueproceselasentradassensoriales.Amenudo,laspizarrasseorganizanjerrquicamente,
detal formaquecadaniveldejerarquapuedeestarformadoporunaomspizarrassubordinadas.
EnlaFigura5.6sepuedeverunavisinesquematizadadeunsistemabasadoenpizarra.
SesuponequelosMCsonexpertos sobreunaparteopartesdelapizarra.Cuandodetec-
tanalgunacondicinparticularsobresu(s)parte(s)delapizarra,proponenunaseriedecambios
enlamisma,que,si sonrealizados,puedenactivarotrosMC,que,asuvez,puedenprovocarla
activacindeotrosMe.Lossistemasdepizarraestndiseadosparaprocederdeestaforma, y
lapizarrase puedeconsiderarcomolaestructuradedatosquealbergar lasolucina unpro-
blemaparticulary/oloscambiosquehabrquerealizarenelentornodeacuerdoconunobjetivo
determinado. Las arquitecturasdepizarrashan sidoutilizadasenunagran variedadde aplica-
ciones,quevan desdelos sistemas paraelreconocimientodevoz [Ermanet al., 1980]einter-
pretacin de seales [Nii, 1986], hasta sistemas de monitorizacin inteligentes de pacientes
[Hayes-Rothet al., 1992].
Paraponerunejemplo,retomaremoselrobotquesemueveenun mundocuadriculado,pero
estavezelrobotpuedepercibirelestadodelasochocasillasquelorodean. Sinembargo,hayque
Infonnacin
sensorial
MC deentrada

\t /"
Pizarra

/'

Efectos
"

desalida
Figura5.6.
Sistemabasadoenpizarras.
70 71 Inteligencia artiticial. Una nueva sntesis
tener en cuenta que los sensores de nuestro robot pueden dar infonnacin errnea (como la mayo-
ra de los sensores que se utilizan en aplicaciones reales). Adems, vamos a suponer que nuestro
robot puede almacenar una representacin parcial del mundo que le rodea, a modo de mapa,
similar al representado en la Figura 5.4. Debido a errores previos en los sensores, el mapa puede
estar incompleto o ser errneo. Para este ejemplo, disearemos una pizarra que estar fonnada por
la estructura de datos que representa el mapa y la que contiene los datos sensoriales. En la Figu-
ra 5.7 se aprecia el contenido de esta pizarra en un instante concreto de la evolucin del robot.
Para corregir los errores que hay en la pizarra, el robot utiliza dos MC, a los que denomi-
naremos rellenador de huecos y filtro sensorial. El rellenador de huecos examinar la pizarra
para localizar la existencia de pasillos estrechos en el mapa, y (sabiendo que estos no pueden
existir) los rellenar con 1 o los expandir con O adyacentes (se deja al lector que piense sobre
cmo tomar la decisin de rellenar o expandir). Por ejemplo, el rellenador de huecos podra deci-
dir rellenar el pasillo estrecho que se encuentra en la parte superior del mapa de la Figura 5.7.
El filtro sensorial compara los datos sensoriales con los que hay en el mapa e intenta corregir
cualquier discrepancia. Por ejemplo, en la Figura 5.7 se puede ver cmo el filtro sensorial percibe
la seal de que la casilla representada por la entrada S7 est ocupada, pero en el mapa no se sabe
el estado de dicha casilla. Para corregir esta discrepancia, el filtro sensorial decide sustituir la ?
del mapa por un l. De la misma fonna, considerar que, teniendo en cuenta la infonnacin con-
tenida en el mapa, la seal S4 1 es un error; por tanto, no modificar el mapa segn dicha entra-
da. Una vez corregida dicha discrepancia, el rellenador de huecos sustituir la nica? de la pri-
mera columna del mapa por un l.
Dependiendo de la tarea que lleve a cabo el robot, pueden existir otros MC (que reaccionarn al
l'
1\' mapa una vez que ste haya sido corregido) que propongan la ejecucin de una determinada accin.
J
1I

I
If
I
I
t
1 1 ? I 1 1 1 ?
1 O O O O O O O ?
(
de huecos
1 O O O O O O O ?
l O O O O O O O '!
1 O O O O O O O ?
1 O O O O O O O '!
1 O O O O O O O ?
? R O O O O O O '!
? O O O O O O O ?
l '! ? ? ? ? '! ? ?
? ? ? 'l '! ? ? ? '!

Filtro
sensorial
1 O O
'! R 1
1 O O
Pizarra
Figura 5.7.
La pizarra del robot y las Me.
Sistemas con estados
Los sistemas de estados son ms comunes que los agentes E-R, y tambin les podemos aplicar
mucho de lo que hemos dicho al final del Captulo 2 sobre la relacin entre los agentes E-R y los
modelos etolgicos de comportamiento animal. Muchos animales mantienen, como mnimo,
infonnacin parcial sobre las caractersticas de sus mundos externos e internos que no pueden ser
percibidas inmediatamente. Los sistemas de produccin que trabajan con la memoria y con la per-
cepcin tambin han sido utilizados para modelar determinados fenmenos psicolgicos [Newell,
1973] (vase Ejercicio 5.4).
Las redes de Elman son un ejemplo de autmata de estados finitos con capacidad de apren-
dizaje. Este tipo de sistemas tambin ha sido analizado por [Rivest y Schapire, 1993].
Muchos investigadores [Kuipers et al., 1993, y Kuipers y Byun, 1991] han analizado el pro-
blema del aprendizaje de mapas espaciales, que, como ya hemos visto, son un ejemplo de repre-
sentacin icnica. El aprendizaje de este tipo de representacin se complica cuando existe incer-
tidumbre sobre el estado actual y sobre los efectos de las acciones. Este problema ha sido anali-
zado por [Dean; Basye, y Kaelbling, 1993].
[Genesereth y Nilsson, 1987] utilizan el trmino agentes con histresis para aquellos agentes
cuyo comportamiento depende de la historia pasada.
5.1. Un ascensor discreto puede percibir la siguiente infonnacin de su entorno:
1. En qu piso est parado.
2. A qu pisos quieren ir los ocupantes del ascensor.
3. En qu pisos hay personas que quieren entrar en el ascensor, yen qu direccin quieren ir.
4. El estado de la puerta (abierta o cerrada).
Adems, el ascensor es capaz de realizar las siguientes acciones:
l. Subir un piso, a no ser que est en el ltimo piso.
2. Bajar un piso, a no ser que est en la planta baja.
3. Abrir la puerta.
4. Cerrar la puerta.
5. Esperar A segundos (un tiempo fijo suficiente para que bajen todos los ocupantes y
suban los que estn esperando).
Con estos datos, disee un sistema de produccin para controlar el ascensor de fonna efi-
ciente. (No es eficiente, por ejemplo, cambiar el sentido del ascensor cuando ste est subiendo
si todava hay alguien dentro que quiere subir, o hay alguien fuera que quiere entrar en el ascen-
sor para subir.)
5.2. Una honniga artificial vive en un mundo bidimensional cuadriculado y desarrolla un
comportamiento que le permite seguir un rastro de feromonas a lo largo de un conjunto de ca"illas
previamente marcadas (el tamao del rastro es de una casilla). La hormiga ocupa una sola casilla
y puede encarar las casillas que se encuentran arriba, a la derecha, a la izquierda y debajo de la
posicin en la que se encuentra. La hormiga puede llevar a cabo cinco acciones: moverse una cel-
da hacia delante (m), girar a la izquierda pennaneciendo en la misma casilla (1), girar a la derecha
permaneciendo en la misma casilla (r), poner el bit de estado a uno (on), y poner el bit de estado
72
73

a cero (off). La hotmiga puede percibir si la casilla que tiene delante (en el sentido de movimiento)
tiene feromona y si el bit de estado est activado o no (suponga que inicialmente el bit de estado
est a cero). Especifique un sistema de produccin para controlar la hotmiga en el seguinento del
rastro de la feromona. Suponga que inicialmente la hotmiga se encuentra en una casilla en la que
pueda percibir el rastro de la feromona (tenga en cuenta que un sistema de produccin est for-
mado por un conjunto ordenado de reglas de condicin-accin; la accin que se ejecuta es aquella
que se corresponde con la primera condicin satisfecha). Por ltimo, el sistema diseado tiene que
asegurar que la hormiga no gire 180 grados y siga el rastro de la feromona ya recorrido.
5.3. El problema de las Torres de Hanoi con tres discos est formado por tres varillas, a las que
denonnaremos A, B Ye, en las que se pueden colocar tres discos, a los que denominaremos DI'
D2 YD3 (obviamente, los tres discos tienen un agujero en el centro para poder colocarlos en las
varillas). Normalmente, las varillas se colocan en lnea, pero supongamos que las colocamos en
un crculo. Comenzamos con los tres discos en la varilla A y queremos colocarlos en alguna de
las varillas restantes (vase figura). Las reglas del problema son las siguientes: podemos mover
cualquier disco a cualquier varilla, pero slo podemos mover el disco que se encuentra en la par-
te superior, y no podemos colocar un disco sobre otro de menor tamao. El lector debe estar fami-
liarizado con el algoritmo recursivo que resuelve este problema*.
A
D Dz
B e
Afortunadamente, existe otro algoritmo no recursivo para resolver este problema, y que
puede ser enunciado de la siguiente forma: de todos los discos que podamos mover, moveremos
siempre el ms grande, pero no lo moveremos si con eso deshacemos el movinento que acaba-
mos de realizar. Siempre que sea posible, los movimientos impares los haremos en el sentido de
las agujas del reloj (der.), y los pares en sentido contrario (izq.). Cuando no sea posible realizar
los movinentos segn este esquema (porque no sea posible realizar el movimiento elegido
para el disco ms grande sin deshacer el movimiento anterior), moveremos el disco en la otra
direccin y despus retomaremos el esquema que hemos definido.
Vamos a especificar un sistema de produccin para implementar este algoritmo. Para ello,
vamos a suponer que disponemos de seis acciones para mover los discos, que denominaremos
mover(num, dir), donde num puede ser D
1
D
2
o D
s
, Y dir puede ser der. o izq.. Tambin
supondremos que disponemos de una serie de sensores que nos petmiten determinar la falsedad
* Para un algoritmo ms simple, consulte la direccin www.mkp.comlnils/clarified. (N. del T.)
Sistemas con estados
o veracidad de las siguientes condiciones: B
I
, B
2
YB
3
, donde B indica que el disco Di es el disco
ms grande que podemos mover. Adems, tambin tenemos las siguientes condiciones de estado
que pueden ser activadas o desactivadas por el sistema de produccin: der. (que indica que el lti-
mo movimiento se realiz en el sentido de las agujas del reloj) y MI' M
2
YM3' donde Mi indica
que el disco Di fue el ltimo disco movido. Las acciones para modificar las variables de estados
son: conmutar, para cambiar el valor de la variable de estado der. (es decir, cuando ejecutamos
la accin conmutar, la variable der. cambia de O a 1, o de 1 a O), y movido(D
1
), movido(D
2
) y
movido(D
s
), donde movido(D) hace que Mi tome el valor a 1 y Mj a O paraj =t i.
Especifique un sistema de produccin que implemente el algoritmo anteriormente descrito,
utilizando las condiciones sensoriales y de estado y las acciones que han sido descritas en el
prrafo anterior. Recuerde que tambin se deben especificar los valores iniciales para las condi-
ciones de estado. Se puede suponer que las reglas de produccin estn ordenadas y que la
accin que es ejecutada es la que se corresponde con la primera regla cuya condicin se satisfa-
ce. La parte de accin de cada regla puede tener acciones para mover discos o para modificar las
condiciones de estados, y estas acciones pueden ejecutarse simultneamente.
5.4. La avispa hembra del gnero Sphex, deja sus huevos dentro de un grillo que ha paralizado y
llevado a su nido. Las larvas de las avispas salen del grillo y se alimentan de l. De acuerdo con
[Wooldridge, 1968, p. 70], la avispa presenta el siguiente comportamiento:
...La rutina de la avispa consiste en llevar el grillo paralizado a su nido, dejarlo en el umbral,
entrar para ver si todo est correcto, salir, y entonces arrastrar al grillo al interior. Si el grillo
se mueve cuando la avispa est dentro haciendo la inspeccin prelinnar, la avispa, saldr del
volver a colocar el grillo en el umbral, pero no dentro, y repetir el procedimiento de
entrar al nido para ver si todo est correcto. Si el grillo se mueve otra vez nentras la avispa
est dentro del nido, volver a colocar el grillo en el umbral y volver a entrar en el nido para
realizar la comprobacin finaL. En una ocasin, este procedimiento se repiti cuarenta
veces, siempre con el mismo resultado.
Idee caractersticas, acciones y un sistema de produccin que pudiera utilizar la avispa para
comportarse de esta forma.
5.5. Idee una funcin de potencial
artificial (con componentes repulsi-
vos y atractivos) que pueda ser utili-
zada para guiar un robot desde cual-
quier casilla del mundo bidimensio-
nal cuadriculado de la figura, a la
casilla objetivo que est marcada
con un O (suponga que las posibles
acciones que puede ejecutar el robot
son norte, sur, este y oeste). Tienen
las componentes repulsivas y atrac-
tivas algn mnimo local? Si es as,
dnde? Idee una funcin de poten-
cial global que no tenga mnimos
locales y cuyo uso garantice que el
robot sigue el camino ms corto al
objetivo.
Visin
artificial
Introduccin
La mayora de los ejemplos que hemos usado hasta ahora para describir los sistemas E-R y los sis-
temas con estados utilizan entradas sensoriales bastante limitadas, que slo proporcionan infor-
macin acerca de las celdillas cercanas al agente. Sin embargo, existen otras modalidades sen-
soriales que pueden revelar informacin importante sobre el mundo que rodea al agente -sonido,
temperatura, presin, etc.-. Los transductores sensoriales se utilizan en muchos tipos de sistemas
cuya funcin principal es la de reaccionar a los cambios que se produzcan en su entorno.
En el mundo animal, el sentido de la vista puede proporcionar, con una simple ojeada, una
gran cantidad de informacin acerca del entomo. La vsin por computador es el campo de la lA
que estudia los sistemas dotados con la capacidad de ver el entorno que les rodea. Este campo
es muy extenso y abarca desde las tcnicas generales hasta las ms especializadas, cubriendo una
gran gama de aplicaciones, que incluyen el reconocimiento de caracteres, la interpretacin de
fotografas, la identificacin de huellas dactilares yel control de robots.
Aunque la visin es una actividad que aparentemente no supone ningn esfuerzo para los
humanos, para las mquinas supone un problema muy complejo. Las mayores dificultades surgen
cuando los sistemas tienen que operar en condiciones de iluminacin variables y no controladas,
con sombras, o tienen que tratar con objetos complejos y difciles de describir, y con objetos ocul-
tos, como ocurre en las escenas de interiores y en escenas con objetos no rgidos. Algunos de
estos problemas se pueden reducir si tratamos con entornos artificiales como el interior de los edi-
ficios, y, por consiguiente, la visin por computador ha sido aplicada en dichos entornos con un
mayor xito. En este captulo, y por limitaciones de espacio, slo podremos mostrar una muestra
representativa de las principales ideas, centrndonos en la visin de los robots.
El primer paso en la visin por computador es la creacin de una imagen de la escena en una
matriz de dispositivos fotosensibles, como, por ejemplo, las fotoclulas de una cmara de TV (para
la visin estereoscpica, se necesitar formar ms de una imagen; este problema lo analizaremos
ms adelante). La cmara forma la imagen a travs de una lente que produce una proyeccin en
perspectiva de la escena que est dentro del campo visual de la cmara. Las fotoclulas convier-

75
Inteligencia artificial. Una nueva sntesis Visin artificial 77
76
ten la imagen en una matriz de valores de intensidad que depende del tiempo, l(x,y,t), donde x e y
indican la localizacin de la fotoclula en la matriz, y t indica el tiempo en el que la imagen ha
sido formada (cuando tratamos con imgenes en color se forman tres de estas imgenes --una por
cada uno de los colores primarios--, pero a lo largo de este captulo slo trataremos con imgenes
monocromticas, y simplificaremos el problema eliminando la componente temporal, es decir,
supondremos que las imgenes son estticas). Por tanto, los agentes reactivos basados en visin
deben procesar esta matriz para crear una representacin icnica del entorno que les rodea, o un
conjunto de caractersticas a partir de las cuales puedan calcular la accin que deben tomar.
Como podemos apreciar en la Figura 6.1, una proyeccin en perspectiva es una transforma-
cin de muchos a uno. Diferentes escenas pueden producir imgenes idnticas. Adems, y para
complicar an ms el asunto, las imgenes obtenidas tambin pueden contener ruido debido a
niveles bajos de luz ambiental o a otros factores. Debido a ello, no podremos reconstruir la esce-
na mediante una inversin directa de la imagen obtenida. En su lugar, la informacin til para el
agente se extraer de la imagen o imgenes haciendo uso del conocimiento especfico sobre los
objetos que nos podemos encontrar, del conocimiento genrico sobre las propiedades de las
superficies de la escena y del conocimiento sobre cmo se refleja la luz ambiental en dichas
superficies y de cmo sta llega a la cmara.
El tipo de informacin que se extrae de las imgenes depende del propsito y de las tareas del
agente. Para navegar de forma segura por un entorno desordenado, un agente necesitar conocer
la localizacin de los objetos, sus bordes, las puertas y las propiedades de la superficie sobre la
que se define la trayectoria Para manipular objetos necesitar saber la localizacin de los objetos,
tamaos, formas, composicin y texturas. Para otros propsitos, puede ser necesario conocer su
color y ser capaz de reconocerlos como elementos de una determinada clase. Basndonos en
cmo vara esta informacin en un determinado intervalo de tiempo, un agente podra requerir la
capacidad de predecir posibles cambios futuros. La extraccin de esta informacin a partir de una
o ms imgenes es una labor compleja, y, como ya hemos mencionado, slo podremos dar una
visin general de algunas de estas tcnicas.
Conduciendo un automvil
En determinadas aplicaciones donde se utilizan agentes E-R, se pueden usar redes neuronales para
convertir directamente la matriz de intensidades en acciones. ALVI NNI, cuyo objetivo es la con-
duccin de automviles, es un buen ejemplo de este tipo de sistemas [Pomerleau, 1991; Pomer-
Plano de la imagen Lente Objetos
Figura 6.1.
Un ejemplo de cmo distintas escenas pueden producir la misma imagen.
Autonomous Land Vehic1e in a Neural Network (red neuronal para un vehculo autnomo terrestre).
Giro brusco a la izquierda
960 entradas
El centroide, calculado a
de todas las salidas,
indica el ngulo de giro
()--lioo- Seguir recto
O
O

o
O
ocultas conectadas O
a todas las 960 Giro brusco a la derecha
entradas
30 unidades de salida
conectadas a todas las
unidades ocultas
Figura 6.2.
La red ALVINN.
leau, 1993]. Analizaremos este ejemplo antes de tratar de una forma ms general el proceso de
visin en un robot. La entrada a la red est formada por una imagen de televisin de baja resolu-
cin (30 x 32). La cmara de TV est colocada sobre el automvil y est dirigida hacia la carretera
que tiene delante. La imagen se muestrea produciendo un flujo de datos de entrada a la red for-
mado por vectores de 960 componentes. En la Figura 6.2 se puede ver un esquema de esta red.
La red tiene cinco unidades ocultas en su primera capa y 30 unidades de salida en la segun-
da capa, siendo todas ellas unidades sigmoidales. Las unidades de salida estn ordenadas de for-
ma lineal y sirven para controlar el ngulo que debe girar el automvil. Si alguna de las unidades
de la parte superior del vector de salida produce un valor mayor que el resto de las unidades, el
vehculo tiene que girar hacia la izquierda; si alguna de las unidades de la parte inferior del vec-
tor de salida produce un valor alto, el vehculo tiene que girar hacia la derecha. Para dirigir el
vehculo se calcula el centroide de las respuestas de todas las unidades de salida, siendo
dicho valor el ngulo que tiene que girar el vehculo.
El sistema se entrena mediante un rgimen de entrenamiento que se modifica sobre la marcha.
Se pone a un humano a conducir el vehculo, y los ngulos de giro que utiliza se toman como las
etiquetas de las correspondientes entradas. La red se entrena de forma incremental, mediante el
procedimiento de retropropagacin, para que produzca los ngulos de giro correspondientes a
determinados patrones visuales a medida que stos se perciben en tiempo real mientras el vehculo
se mueve. El entrenamiento necesita aproximadamente cinco minutos de tiempo de conduccin.
Sin embargo, este procedimiento tan simple tuvo que ser ampliado para evitar dos problemas
potenciales. Primero, y debido a que el conductor humano generalmente realiza bien el proceso,
no podemos ofrecer a la red ninguna experiencia acerca de posiciones del vehculo alejadas del
centro de la carretera y/u orientaciones del vehculo incorrectas. Adems, para carreteras con tra-
mos largos y rectos, la red necesita bastante tiempo de entrenamiento para producir una serie de
ngulos de giro casi nulos; este tipo de entrenamientos podra prevalecer sobre entrenamientos
previos en carreteras con curvas. Sin embargo, no podramos evitar estos problemas haciendo que
el conductor humano acte ocasionalmente de forma errtica, ya que el sistema podra aprender
a imitar dicho comportamiento errtico.
En vez de utilizar esta ltima solucin, el sistema gira y se desplaza por software para crear
cada una de las 14 nuevas imgenes adicionales en las que el vehculo parece estar en diferentes
78 79 Inteligenciaartificial.Unanuevasntesis
posicionesdentrodelacarretera.Pormediodeunmodelomatemtico,quepermitecalcularel
ngulodegirocorrespondienteacadaunadeestasnuevasimgenesapartirdelngulodegiro
especificadoenlaimagenoriginal,elsistemaconstruye 14nuevosvectoresdeentradaquese
aadenacadaunodelosencontradosduranteunprocesonormaldeentrenamiento.
Despusdediferentesprocesosde entrenamiento,ALVINN hapodidoconducirsatisfacto-
riamentevariosvehculosdepruebasobrecaminospavimentadosnoalineados,pistasnopavi-
mentadas,callesdeunaciudadyautopistas.Enestasltimas,ALVINN halogradoconducir120
kilmetrosconsecutivos,llegandoavelocidadesdehasta100km/h.
Las dos etapas de la visin por computador
AunqueelrendimientodeALVINN esimpresionante,muchasdelastareasquetienenquedesa-
rrollarlos robots requieren elprocesamiento de imgenes de mayorresolucin. Dado que la
mayorpartedelastareasdelosrobotsnecesitanconocimientosobrelos objetosquehayenla
escena, centraremos nuestro anlisis enlas tcnicas orientadas alabsquedade objetos. Pero
antesdecontinuardeberamosresponderalapregunta,quesunobjeto?Enlosentornosarti-
ficiales, talescomoelinteriordeunedificio,losobjetospuedenserpuertas,muebles,otrosagen-
tes,personas,paredes,suelos,etc...Enentornosnaturalesyexteriores,losobjetospuedenserani-
males,plantas,estructurasartificiales, automviles,carreteras,etc... Alossistemasdevisinpor
computadorlesresultamsfcildesenvolverseenentornosartificiales,yaquelamayorpartede
losobjetostiendenatenerbordesysuperficiesregulares.
Existendostcnicasque son tiles alahorade delimitarlas partesdeunaimagenque se
correspondenconlosobjetosdeunaescena. Unadeestastcnicastienecomoobjetivolaloca-
lizacindelosbordesdelaimagen.Unbordeesunapartedelaimagenatravsdelacualla
intensidadlumnica(oalgunaotrapropiedad)cambiademaneraabrupta.La otratcnicaconsiste
ensegmentarlaimagenenregiones.Unaregineslapartedelaimagenenlaqueloscambiosde
intensidadlumnica(odealgunaotrapropiedad)songraduales.Amenudo,aunquenosiempre,
losbordesyloslmitesentrelasregionesdeunaimagensecorrespondencondiscontinuidades
relacionadasconlosobjetosdelaescenaapartirdelaqueseformalaimagen.EnlaFigura6.3
2
Discontinuidadnormal
enlasuperficie
Discontinuidad
deprofundidad
Discontinuidaddebidoala Discontinuidad
reflectividaddelasuperficie deiluminacin
Figura6.3.
Discontinuidadesdeunaescena.
2 Adaptadade[Na1wa, 1993,p.77].
Visinartificial
sepuedenapreciaralgunosejemplosdeestetipodediscontinuidades.Dependiendodelosnive-
les deiluminacin, de las propiedadesdelas superficiesy delngulodelacmara, estasdis-
continuidadespuedenquedarrepresentadasporlosbordesyloslmitesentrelasregionesdela
imagen.Portanto, laextraccindeestetipodecaractersticasesunatareabastanteimportanteen
elcampodelavisinporordenador.
Siguiendo el esquemade laFigura6.4, organizaremosnuestro anlisis delprocesamiento
visualendosfases principales. Enlaprimerafase, alaquedenominaremos procesamientode
imgenes, setratarde transformar laimagen originalen otraque seamsmanejableparala
segundafase, alaquedenominaremosanlisisdeescenas.El procesamientodeimgenescon-
siste en la aplicacin de varias operaciones de filtrado que nos ayudarn a reducir el ruido,
remarcarlosbordesyencontrarregionesdentrodelaimagen.Conelanlisisdeescenas,inten-
taremoscrear,apartirdelaimagenprocesada,unadescripcinicnicaobasadaencaractersti-
casdelaescenaoriginal-proporcionandoalagentelainformacinespecficarequeridaparala
tareaquedesarrolla-oEstadivisindelavisinporcomputadorendosetapasesunasimpli-
ficacin delprocesode visin; los sistemasde visinreales utilizadosenrobots puedenestar
formados porms etapas, pudiendoexistirinteraccinentreellas. Enlas siguientes secciones
discutiremos con ms detalle ambas fases, pero, a continuacin, daremos unaidea general.
ConsidreseelrobotylahabitacindelaFigura6.5. Elrobotpuedevertresbloquesdejuguete
Secentraslo Intentainferirlaspropiedades
enlaimagen delmundooconstruirunmodeloicnico
Figura6.4.
Lasdosetapasdelavisinartificial.

I
Figura6.5.
Robotenunahabitacinconbloquesdejuguete.

---
80 Inteligenciaartificial.Unanuevasntesis Visinartificial 81
etiquetadosconlasletrasA, B YC, unapuertayunrincn.Primero,procesaremoslaimagenpara deradase denominaconvolucin. Sisloqueremosquelaimagenresultanteestcompuestade
eliminarel ruido superfluo, remarcarlos bordes de los objetos yotras discontinuidades. Enla nmeros binarios (es decir, 1 y O), la suma tiene que ser comparada con un valor umbral.
siguientefase, ysabiendoquenuestromundoestformadoporobjetos yformas confronteras
Medianteelpromediado,podremoseliminarpicosaisladosderuido,perotieneelinconvenien-
rectilneas,elanlisisdelaescenapuedeproducirunarepresentacinicnicadelmundovisible
tequetambinreducelanitidezdelaimagenynoshaceperderloscomponentespequeosdela
-similaralos modelosutilizadosenlosgrficosporcomputador-oNormalmente,estemode- misma.
lo icnico se utiliza para actualizar modelos ms manejables del entorno que se encuentran
Laconvolucines unaoperacinmuyutilizadaenelcampodelprocesamientode seales. Se
almacenadosenlamemoriadelagente,paraqueapartirdedichosmodelossepuedancalcularlas
puedeinterpretarcomounaoperacinsobreformas deondaunidimensional(eldesplazamiento
accionescorrespondientesalnuevoestadodelentorno. delaventanaserealizaalolargodeltiempo). Sidesplazamosoconvolucionamosunafuncin
Los modelos icnicosnonecesitanrepresentar, tal ycomolo haranlos modelos grficos, w(t) sobreunaseals(t), obtendramoslasealpromediadas*(t):
todoslosdetalles,aunqueestodependedelatareaqueseestdesarrollando.Ennuestroejemplo,
noesnecesariosaberlalocalizacindelapuertaniladelrincn,yaqueelrobotslotieneque
s(t) =fs(u)w(u - t)du =s(t) *w(t)
manipularlosbloques.Adems,supondremosquelonicoqueesrealmenteimportanteesladis-
posicin de los bloques. Teniendoencuentaestas suposiciones, un modelo icnico apropiado
paranuestrorobotpuedeserlalistaC B A SUELO)), queindicaqueelbloqueCestencimadel Paradenotarlaconvolucinutilizaremoseloperador*.
bloqueB, steestencimadelbloqueA, queestsobreelsuelo. Si secolocaelbloqueCenel En el procesamiento de imgenes, la versin discreta y bidimensional de la convolu-
suelo, unmodeloicnicoapropiadopodraserlalistaC SUELO) (B A SUELO)) (otrarepre- cines:
sentacinvlidapodraserB A SUELO) (CSUELO)), siemprequeasumamosquelaposicin
horizontal relativa entre los bloques no es importante, y que el orden de los bloques que se
encuentranenelnivelmsaltonotienesignificacinrepresentacional). Sitenemosencuentaque I*(x, y) =I(x, y) *W(x, y) =L L I(u,v)W(u-x,v-y)
el ltimo elemento de cada componente de lalistaes el mismo, SUELO, podemos acortarla u=--oo V=--oo
representacinexcluyendodichotrminodelarepresentacin.
Enaquellosrobotsquenoutilicenmodelosicnicos,elanlisisdelaescenapodraconver- donde I(x,y) es lamatriz imagen original y W(u, v) es lafuncin de ponderacin de laconvo-
tirlaimagenprocesadadirectamenteenunconjuntodecaractersticasqueseanapropiadaspara lucin. SupondremosqueI(x,y) = OparaX <Oox n yparay <Ooy m (portanto,laoperacin
latareaparalaquefuerondiseados.Porejemplo,siparanuestrorobotfuese importantedeter- deconvolucinseverafectadaporestosfalsosbordesenloslmitesdelaimagen).
minarsi hay algnbloqueencimadel bloque C, unadescripcinadecuadadel entorno podra Algunasveces, seutilizacomofuncindepromediadoW(x,y) unafuncinquevale 1enun
incluirunacaractersticaalaquepodemosllamarUBRE_e. Estacaractersticatomarelvalor 1 determinadorangorectangularde x e y, yOfuera de dichorango. Elgradode suavizadode la
sielbloqueCnotieneningnbloqueencima, yencualquierotrocasotendrelvalorO(como convolucinquedadefinidoporeltamaodedichorango: cuantoms grandeseadichorectn-
podemosverahora,utilizamosnombresmnemotcnicosenlugardeloshabitualesXi; sinembar- gulo,mayorserelsuavizadoqueapliquemosalaimagen.EnlaFigura6.6sepuedeverelresul-
go, hemos detenerpresentequelos nombresmnemotcnicos slonos ayudananosotros,yno
tienenningnsignificadoparaelrobot).Enestecaso,elanlisisdelaescenaslodeberacalcular
Ventanade
el valorparaesacaractersticaapartirde laimagenprocesada. Comopodemos deducirde los
promediado Suma=6>3
ejemplos, el procesode analizarlaescenaes altamentedependiente de cmoeste diseado el
robotydelatareaquestedesarrolle.
Procesamiento de imgenes
6.4.1. Promediado
Apartirde aqu, asumiremosquelaimagenestrepresentadaporunamatrizdedimensinm xn;
I(x,y), denmeros, alaquedenominaremosmatriz de intensidad de la imagen, yquedivideel
planodelaimagenenceldillasquese denominanpxels. Cadaunodelosnmerosqueforman
lamatrizdeintensidadesrepresentalaintensidaddelaluzenelcorrespondientepuntodelaima-
gen.Medianteelpromediadopodemossuavizardeterminadasirregularidadesquepuedenapa- ./

Suma=2< 3
laimagen.Paracadapxel,centramoslaventanadepromediadoenlycalculamoslasumapro-
recerenlaimagen.Estaoperacinserealizadesplazandounaventana de promediado portoda
Imagenoriginal Imagenpromediada
mediadadetodoslosnmeroscorrespondientesalos pxelsqueestncubiertosporlaventana.
Figura 6.6.
Unavezquehemosrealizadolasumaponderada,suresultadoseutilizaparareemplazarelvalor
delpxelcentral. Estaoperacinde desplazamientode laventanayelclculode lasumapon- Elementosdelprocesodepromediado.
r
82 Inteligenciaartificial.Unanuevasntesis Visinartificial
83
tadodeaplicarlaoperacindepromediadoaunaimagenbinariamedianteunafuncindesua-
vizadorectangularyelusodeunvalorumbral(enlafigura, hemossupuestoquelospxelsnegros
representanvaloresaltos deintensidad, mientrasque los blancos representanvaloresbajos de
intensidad;esteconveniopuedeserinvertido,perohacequeesteejemploseaunpocomssim-
ple). Comosepuedeapreciarenelejemplo,el procesode suavizadotiendea reoforzarlasl-
neasgruesasyaeliminarlaslneasfmas ylosdetallespequeos.
Unafuncincomnmenteutilizadaparasuavizarlasimgeneseslafuncingaussianadedos
dimensiones:
1 _x2+y2
W(x,y) =G(x,y) =--2e 20"2
21t0'
ComopodemosverenlaFigura6.7,lasuperficiedescritaporlafuncingaussianatienefor-
madecampana(parahacermsclaralagrficahemosrotadolosejesdelamisma).Ladesvia-
cinestndardelagaussiana,0', determinalaanchuradelasuperficie,y,comoyamenciona-
mos, elgradodesuavizado. LaintegraldeG(x,y) sobrex ey esiguala 1. EnlaFigura6.8
3
se
puedenvertresversiones suavizadasdelaescenaoriginal,enlaqueaparecenlosbloquesyel
robot,enlascualessehanutilizadodiferentesfactoresdesuavizado(normalmente,lasversiones
discretasdelasoperacionesdesuavizadoyfiltradorealizaninterpolacionesentrelosvaloresdis-
cretosparamejorarelrendimiento).
ComopodemosapreciarenlasecuenciadeimgenesdelaFigura6.8,elgradodeborrosidad
delasimgenesvaaumentando.Unaformadeentenderestefenmenoconsisteenconsiderarque
lafuncindeintensidaddelaimagenI(x,y) representauncampodetemperaturainicialdefinido
sobreunasuperficierectangularconductorade calor.Amedidaquepasaeltiempo,elcalorse
difundeisotrpicamentesobrelasuperficieprovocandoquelastemperaturasaltassemezclencon
6.4.2.
lasbajas. Deacuerdoconestavisin, la secuenciadeimgenesdelaFigura6.8 sepuede ver
comolaevolucindelcampodetemperaturasiniciala lolargodel tiempo. Koenderink[Koen-
Comohemosmencionadoanteriormente, algunas delastcnicas usadasenlavisin porcom-
derink, 1984] hademostradoque laconvolucindeunaimagenconunafuncingaussianade
putadorestnorientadasaladeteccindelosbordesdelaimagen. Unavezdetectadoslosbordes,
desviacinestndar0', esequivalenteaencontrarlasolucindelaecuacindedifusin,paraun
stospuedenusarseparatnmsformarlaimagenenundibujoabasedelneas.Posteriormente,los
tiempoproporcionalaO' yestandolascondicionesinicialesdefinidasporelcampodeintensidad
contornosobtenidosenlaimagentransformadasepuedencompararconlospatronesdecontor-
correspondientealaimageninicial.
noscaractersticosdelosobjetosquepuedenaparecerenlaimagen. Unodelosmtodosquese
utilizanparadetectarcontornosenunaimagenempiezaporunprocesoqueresaltalosbordes.Un
bordeesunreadelaimagenatravsdelacualalgunapropiedad,como,porejemplo,lainten-
w sidad,cambiademaneraabrupta.ComopodemosverenlaFigura6.3,enlamayoradeloscasos
losbordesestnrelacionadosconpropiedadesrelevantesdelosobjetosdelaescena.
Comenzaremos nuestro anlisis considerando imgenes unidimensionales enlas que la
funcindeintensidadI(x,y) varasloalolargodelejex. Despus,generalizaremoslosresulta-
y
dos alcanzados al caso bidimensional. Para resaltar los bordes de intensidad de una imagen
unidimensional,podemosconvolucionarlaconunaventanadivididaverticalmenteendospartes,
......_ ....... x
unanegativayotrapositiva.EnlaFigura6.9sepuedeverunaventanadeestetipo.Lanicares-
triccinquedebemostenerencuentaesquelasumaponderadadelaventanadebesernulapara
laszonasuniformesdelaimagen.
Figura6.7.
SiconvolucionamoslaventanadelaFigura6.9conlaimagenalolargodeladireccindel
Funcingaussianadesuavizado.
ejex, obtendremosunospicosenaquellasposicionesenlasqueelbordeestalineadoenladirec-
ciny. Estaoperacinessimilaralclculodelaprimeraderivadadelafuncindeintensidadde
laimagenrespectoax, dl/dx. Sihubisemoscalculadolasegundaderivada,habramosobtenido
3 El autoragradeceaCharlesRichardslacreacindelasimgenesyprogramacindelasoperacionesdeproce- unosefectosmspronunciados.Enesteltimocaso,obtendramosunabandadevalorespositi-
samientoqueseutilizanenestecaptulo.
vosaunladodelborde,unabandaconvalorceroenelbordey unabandaconvaloresnegativos
(a) Imagenoriginal
(b) Anchuradelgaussiano=2pxeles
(e) Anchuradelgaussiano=4 pxeles
Figura6.8.
Imagensuavizadaporunfiltrogaussiano.
Deteccindebordes
(b) Anchuradelgaussiano= 8pxeles
,...-
2
Intensidadde
1,5
laimagen/(x) 1
0,5

0,8
dVdx 0,6
0,4
0,2
II
0,5
d
2
//dx
2
Visinartificial 85 84 Inteligenciaartificial.Unanuevasntesis
6.4.3. Unoperadorparaelpromediadoyladeteccindebordes
Sisloutilizsemostcnicasparaladeteccindebordes,resaltaramostantolosbordescomolos
Parte negativa
Parte positiva
elementos aleatorios de ruidos que aparezcan en la imagen. Para obtenertcnicas que sean
delaventana
delaventana
menossensiblesalruido,podramoscombinarlasdosoperacionesqueacabamosdever: prime-
rorealizaramosunpromediadoyposteriormenteaplicaramosunatcnicaparaladeteccinde
bordes.Enelcasounidimensionalcontinuo,elsuavizadosepuederealizarmediantelaconvo-
lucinconlafuncingaussiana:
X2
1 - 2,,2
) --e
G(x =-J2iicr
Figura6.9.
Deteccindebordes. dondecr esladesviacinestndaryproporcionaunamedidadelaanchuradelafuncindesua-
vizado.Pormediodelsuavizadoatravsdeunafuncingaussianaobtenemoslafuncinfiltrada:
alotroladodelborde.EnlaFigura6.10sepuedenverestosefectosparauncasounidimensional,
enelquelaintensidadcambiasuavemente (y, portanto, esderivable)a diferenciadelcambio l*(x) =l(x) *G(x) =Jl(u)G(u-x) du
bruscodeintensidadquesemuestraenlaFigura6.9. Porsupuesto,cuantomsabruptoseael
cambioenlaintensidaddelaimagen,msestrechoserelpicoendlldx. Conestatcnica,los Aplicandoadichaimagenunatcnicapararesaltarlosbordes,obtenemos:
bordesdeunaimagenselocalizarnenlasposicionesdonded
2
lldr =O, esdecir,enloscruces
porcerodelasegundaderivadadelaimagen.
-0,5
-1
Figura6.10.
-
d
2
[I*(x)] / dx
2
=d
2
[/(x) *G(x)] / dx
2
=d
2
[J l(u)G(u - x) du] / dx
2
queesequivalenteal(x)*d
2
G(x)/dx
2
, yaquepodemosmodificarelordenenelqueserealizanla
diferenciacinylaconvolucin;esdecir,paracombinarelsuavizadoconladeteccindebordes,
podemos convolucionaruna imagenunidimensional con la segundaderivada deunafuncin
gaussianaenvezdecalcularlasegundaderivadadelaimagenconvolucionada.
Paraimgenesendosdimensiones,necesitamosunaoperacinsimilaraunaderivadasegun-
<(
I I I I daquenospermitadetectarbordesencualquierorientacin.Unoperadorconestepropsitoesla
2 3 4 5 6
laplaciana. Lalaplacianadel(x,y) sedefinecomo:
!\
V
2
l(x,y) =()2I(x,y)/ ax2+a
2
l(x,y)/ ayl
Paracombinarladeteccindebordesconelsuavizadoporgaussianaendosdimensiones,
podemosmodificarelordendeladiferenciacinylaconvolucin(comoelcasounidimensional),
yobtener:
I I 't- I
2 3 4 5 6
l(x,y) *[a
2
G(x,y) / ax2 +a
2
G(x,y) / ay2]
\
La laplacianadelafuncingaussianabidimensionaltienelaformadeunsombreroinvertido,
comopodemosverenlaFigura6.11 (Aligualquehemoshechoanteriormente,hemosvueltoa
trasladarelorigendecoordenadas.)Estetipodefuncinrecibeelnombredefuncin sombrero.
Laanchuradelsombrero determinaelgradodesuavizado.
Paraobtenerunaoperacinquesuavicelaimagenyencuentrelosbordesdeunasolavez,
slotenemosqueconvolucionarlaimagenconlafuncinsombrero.Estaoperacinsedenomi-
nafiltrado laplaciano, ylaimagenqueproducesedenominaimagen laplacianafiltrada. Sehan
realizadoestudiosenlosquesehapodidodemostrarqueelpreprocesamientodeimgenesque
tienelugarenlaretinadelos vertebrados seasemejaalfiltrado laplaciano. Sienunaimagen Derivadasdelaintensidaddeunaimagen.
86
87
lnteligenca artificial. Una nueva sntesis
w
+ y
x
Figura 6.11.
Funcin sombrero utilizada en el filtrado por laplaciana.
laplaciana filtrada nos quedarnos slo con los cruces por cero, obtendremos un dibujo aproximado
de los contornos de la imagen. El proceso completo, es decir, el filtrado laplaciano y la seali-
zacin de los cruces por cero, constituye lo que se denomina operador Marr-Hildreth [Marr y
Hildreth, 1980] (la salida del operador Marr-Hildreth es una de las componentes de lo que Marr
denomina boceto primario). En la Figura 6.12
4
se pueden apreciar los resultados de estas ope-
raciones aplicadas a la escena en la que se encuentra nuestro robot de ejemplo. Como se puede
apreciar, el operador de Marr-Hildreth nos proporciona las bases necesarias para obtener un bos-
quejo inicial de lneas para las partes de la escena formadas por contornos simples. Sin embargo,
el robot que se encuentra enfrente de la puerta, que es un objeto ms complejo, no est bien deli-
mitado.
En la literatura podemos encontrar otras tcnicas para la deteccin de bordes y lneas en im-
genes; algunas de ellas producen mejores resultados que el operador de Marr-Hildreth, que es ms
fcil de explicar. Entre las tcnicas ms importantes podemos destacar el operador de Canny
[Canny, 1986], el operador de Sobel (atribuido a Irwin Sobel por [Pingle, 1969]), el operador de
Hueckel [Hueckel, 1973] y el operador de Nalwa-Binford [Nalwa y Binford, 1986]. De todas for-
mas, hay que tener en cuenta que tanto el operador de Marr-Hildreth como el resto de operadores
slo etiquetan determinados pxeles de la imagen como candidatos a formar parte de un borde o
lnea de la imagen. Una vez detectados los pxeles candidatos a formar parte de los bordes o con-
tornos, los tenemos que ir enlazando para formar lneas u otras curvas simples.
6.4.4. Bsqueda de regiones
El otro mtodo para el procesamiento de imgenes est orientado a la bsqueda de regiones en la
imagen, es decir, reas de la imagen en las que la intensidad u otras propiedades, como, por ejem-
plo, la textura, se comportan de manera uniforme. En este sentido, la bsqueda de regiones es un
proceso anlogo a la deteccin de bordes; las dos tcnicas segmentan la imagen, o por lo menos
eso esperarnos, en las porciones que son relevantes para el anlisis de la escena. Por tanto, nor-
malmente las dos tcnicas se utilizan de forma complementaria, aunque ambas se vean fuerte-
mente afectadas por la presencia de ruido.
4 En el clculo de la imagen de la 6.12, hemos utilizado un cruce por banda en vez de un cruce por cero.
Para mostrar la imae:en. en la imagen se deben detectar las bandas alrededor de cero.
Visin artificial
{
I
..
'1
,
: t
J
1
'1
-'1
. II
'
I
,
1I
I
-, t.- ;
..
\..
.....
i.
---:--:,-,,'" I
...r-
I
..:;;:-:- '\ : I
I I
.:.1 ...i;,.-_' ___-.(
; .-.." ".
I '.:-.'''11',1." I
':L
II '-'1 ------- _:J--O'" - . 1
--
,
,.
--
-:::--""".lj .':'-...... ..: 1',(:
....:.,- ..... Ll,,.
......- .. "--. ....;:=--.:.. . t .
"-..,.-
Figura 6.12.
Filtrado laplaciano yoperador de Marr-Hildreth (anchura de la laplaciana = 1 pxel).
89
Visinartificial
Antesdeseguirconnuestradiscusinhayquedefinirloqueentendemosporreginenuna
imagen.Unareginesunconjuntodepxelesconectadosentresquesatisfacelassiguientespro-
piedades:
1. Unaregineshomognea.Algunosejemplosdepropiedadesdehomogeneidadfrecuen-
tementeusadossonlossiguientes:
a. LadiferenciadeintensidaddelospxelesdeunareginnoesmayorqueunciertoE.
b. Podernosajustarunasuperficiepolinomialdegradok(paraalgnvalordekpequeo
y predeterminado)a los valoresdeintensidad de lareginconunerrormenora un
cierto E.
2. Silas regiones no son adyacentes, las podernos considerarcorno unasolaregin si la
unindelospxelsdeambasregionessatisfacelapropiedaddehomogeneidad.
Generalmente,dadaunaimagen,posiblementeexistamsdeunaparticindedichaimagen
enregiones,aunqueenlamayorpartedeloscasoscadaregincorresponderaunobjetodela
escenaoaunapartesignificativadelmismo.
Aligualqueparaladeteccindebordesylneas,podernosencontrarungrannmerodetc-
nicasparalasegmentacindeimgenesenregiones.Enesteapartadodescribiremosunadeellas,
concretamenteelmtododeladivisinyfusin [Horowitzy Pavlidis, 1976].Unadelasversio-
nesdeestemtodo,bastantefcildedescribir,comienzaconsiderandotodalaimagencornola
nica regin candidata. Para facilitar laexplicacin, consideraremos que laimagen es una
matrizdepxelscuadradadedimensin2
1
x 2
1
Obviamente,estaprimeraregincandidatanose
ajustaraladefinicinderegin,yaqueelconjuntodetodoslospxelsnocumplirlapropiedad
de homogeneidad (exceptuando las imgenes de intensidad uniforme). El mtodo contina
dividiendoencuatropartesigualestodasaquellasregionescandidatasquenosatisfaganlapro-
piedaddehomogeneidad.Estadivisincontinahastaquetodaslasregionescandidatascumplan
lapropiedaddehomogeneidad.EnlaFigura6.13, sepuedeseguiresteprocesode divisinen
una imagen artificial de dimensin 8 x 8, en laque hemos considerado como regin todos
aquellosconjuntosconectadosdepxelscuyadiferenciadeintensidadnoesmayorquelaunidad.
Unavezque yanopodernos hacermsdivisiones, fusionamos todasaquellas regiones adya-
centesenlasquelaunindesuspxelscumplelapropiedaddehomogeneidad.Podernosvariar
elordendelafusinderegionescandidatasyobtenerdeesaformadistintasregionesfinales. De
hecho,algunasdelasposiblesfusiones sepuedenrealizarantesdefinalizarelprocesodedivi-
sin.ParasimplificarelejemplodelaFigura6.13,todaslasfusionessehanrealizadoenellti-
mopaso.
ParaelejemplodelaFigura6.13 hemosutilizadounaimagendebajaresolucin.EnlaFigu-
ra6.14sepuedeapreciarelresultadodelprocesodescritoenelprrafoanterior, aplicadoauna
imagendemayorresolucin.AligualqueenlaFigura6.13,obtenemosmuchasregionespeque-
as y muchas irregularidades enlas fronteras entre regiones. Laparticin obtenidapuede ser
depuradasieliminarnoslasregionesmspequeas(quegeneralmentecorrespondenatransicio-
nes entreregiones msgrandes), siresaltamosloscontornosy sitenernosencuentael conoci-
mientosobrelaformadelosobjetosquepuedenaparecerenlaescena.Cornopodemosobservar,
los gradientesde intensidadenlasparedesdenuestraimagendelejemploproducenmltiples
regionesenlaimagendelaFigura6.14.
Ennuestroanlisissobreelsuavizadopormediodelafuncingaussiana,dijimosqueelpro-
ceso sepuedecompararconladifusinisotrpicadelcalor. Peronay Malik[Peronay Malik,
1990]hanpropuestounprocesodedifusinanisotrpicaparacrearregiones.Elprocesofavorece
el suavizadoenladireccindeloscambiospequeosde intensidadyevitael suavizadoenla
1 1 1 1 2 1
111 1 1 1 1 1 O 1 1 1 1
31 1 4 9 9 8 1 O 3 1 4 9
Divisin
1 8 8 8 4 1 O 1 1 8 8
1 6 6 6 3 1 O 1 1 6 6
1 5 6 6 3 1 O 1 1 5 6
5 6 6 2 1 O 1 1 5 6
1 1 1 O O 1 1 1
Imagenoriginal
1UlVISln
1 1 1 1 1 2
11 111 1 1 1 1 O
31
1
1
4 9 9 8 1 O
8 8 8 4 1 O
6 6 6 3 1 O
5 6 6 3 1 O
5 6 6 2 1 O
1 1 1 O O
Divisin
o(
Fu,n\
1 1 1 1 1 1 1 2
1 1 1 1 1 1 1 O
3 1 4 9 9 8 1 O
1 1 8 8 8 4
1 1 6 6 6 3
1 1 5 6 6 3
1 1 5 6 6 2
1 1 1 1 1
1 1 1 1 1 1 1 2
1 1 1 1 1 1 1 O
3 1 4 9 9 8 1 O
1 1 8 8 8 4 1 O
1 1 6 6 6 3 1 O
1 1 5 6 6 3 1 O
1 1 5 6 6 2 1 O
1 1 1 1 1 1 O O
Regionesfinales
Figura6.13.
Divisiny fusinderegionescandidatas.
direccindeloscambiosgrandesdeintensidad.Comoseindicaen[Nalwa, 1993,p. 96],elresul-
tadoqueseconsigueeslaformacinderegionesdeintensidaduniformequetienenfronterasa
travsdelascualeselgradientedeintensidadesalto.
6.4.5. Otrosatributosdeimagendistintosalaintensidad
Tantoenladeteccinde contornoscomoenlabsquedaderegionessepuedenusarotrosatri-
butosdistintosalahomogeneidaddelaintensidaddelaimagen. Unodeestosatributospuedeser
latexturavisual. Enmuchos objetos, lareflectividadde susuperficie presentavariacionesde
lO"
90 Inteligenciaartificial. Unanuevasntesis Visinartificial 91
radores [Zhu;Wu, yMurnford, 1998] seestnaplicandomtodosqueintentanestimarlas dis-
tribucionesdeprobabilidadparadistintostiposdetexturas. Unavezconocidasdichasdistribu-
ciones,sepuedenutilizarparaclasificarlastexturasoparasegmentarlaimagensegndichastex-
turas.
Apartedelatextura,podemosutilizarotrosatributos.Porejemplo, sipudisemosmedirla
distanciaentrelosobjetosdelaescenay lacmara(medianteunsensorlser),podramosobte-
nerunaimagendedistanciasenlaquecadapixelrepresentaladistanciaentreelpuntodelaima-
gencorrespondiente y la cmara, y localizar en ella cambios bruscos en la distancia. Otras
caractersticasquepuedenserpercibidasocomputadasy utilizadasposteriormenteenelproce-
samientodelaimagensonelmovimientoyelcolor.
Anlisis de escenas
Una vez que la imagen ha sido procesada por algunas de las tcnicas comentadas en los
prrafosanteriores,estaremosendisposicindeextraerdelamismalainformacinnecesaria
sobrelaescena.Estafasedelavisinartificialrecibeelnombredeanlisis de escenas. Debi-
doaqueunamismaimagenpuedecorresponderavariasescenasdistintas,paraelanlisisde
escenassenecesitarnimgenesadicionalesoinformacingeneralsobreeltipodeescenasque
nospodemosencontrar(oambascosas).Analizaremoselusodeimgenesadicionalesmsade-
lante,cuandoabordemoselproblemadelavisinestereoscpica;antescomentaremosvarios
mtodosqueutilizanelconocimientopreviode laescenaparaextraerinformacinsobre la
misma.
Elconocimientoadicionalrequeridopuedesermuygenrico(porejemplo,laspropiedades
Regionesencontradasennuestraescenaejemplomedianteelprocedimientodedivisiny fusin.
Figura 6.14.
reflectantesdelosobjetos)obastanteespecfico(porejemplo,saberdeantemanoqueesproba-
blequeencontremosunosbloquesapiladoscercadeunapuerta).Elconocimientotambinpue-
deserexplcitooimplcito. Porejemplo,unalgoritmo,paraencontrarlneas,puedetenerinclui-
granofino, a lasquedenominamos texturavisual. Podemosencontrarejemplos detexturas dodeformaimplcitaensucdigoconocimientosobrequesunalnea. Entreambosextremos
visualesenelcsped,enunazonadeunaalfombra,enel follajedelosrboles,enlapieldelos existenotrostiposdeinformacinsobrelaescena,como,porejemplo,laposicindelacmara
animales,etc.Estasvariacionesenlareflectividaddelosobjetosprovocanvariacionesdeinten- o delasfuentes deiluminacin,o si se tratadeunaescenaenelinteriordeunedificioo enel
sidadsimilaresenlaintensidaddelaimagen. exterior. Lo que acabamos de describir supone un pequeo ejemplo de la gran variedad de
Losinvestigadoresenvisinartificialhanidentificadounagranvariedaddetexturas,almis- informacinadicionalquepuedeserutilizadaenestafase. Paraunanlisismsdetalladoreco-
mo tiempoquehandesarrollado herramientasparaanalizarlas. Entreestasherramientas,cabe mendamosacudiralabibliografaespecficasobrevisinartificial.
citarlasdenaturalezaestructuralylasdenaturalezaestadstica.Estosmtodossepuedenaplicar Porejemplo,si tuvisemosconocimientosobrelaspropiedadesreflectantesdelas superficies
nosloparaclasificarlasdistintaspartesdelaimagensegneltipodetexturasquepresenten, delosobjetosydelasdistintastonalidadesquepuedepresentarlaintensidaddelaimagen,obten-
sinoquetambinsirvenparasegmentarlaimagenenregionesquepresentenunamismatextura. dramosinformacinsobrelasuavidaddelas superficiesdelosobjetosdelaescena.Concreta-
Losmtodosestructuralesintentanrepresentarlasregionescomosifuesenmosaicoscompuestos mente,podemosutilizarlainformacinsobrecmoestsombreadaunaimagenparacalcularlas
detxels
5
-pequeospatronesformadosporpartesblancasypartesnegras-o(EnLBallardy normalesdelassuperficiesdelosobjetos. Homysuequipo[Hom, 1986]handesarrolladotc-
Brown, 1982,Cap. 6],sepuedehacerunanlisismsdetallado.) nicasquepermiteninferirlaformadelosobjetosapartirdeloscambiosdetonalidadenlasim-
Losmtodosestadsticossebasanenlaideadequeunatexturapuededescribirsemediante genes.Delamismaforma, podemosutilizartxelsparafacilitarelprocesodedeterminacinde
unadistribucindeprobabilidaddelosvaloresdeintensidadpresentesenunaregindelaima- laprofundidadcualitativadelosobjetosylasformasdelosmismos,yaquedichostxelsrepre-
gen.Porejemplo,laimagendeuncampodehierbaenelquelashojasestnorientadasvertical- sentanproyeccionesenperspectivadeelementosdelaescena.
mente generarunadistribucin de probabilidad que presentar unos picos para las regiones Comoyahemosmencionadoanteriormente,avecesnecesitamostenerunmodeloicnicode
estrechasdealtaintensidadqueestnorientadas verticalmente, queestarn separados porlas lasescenasy, aveces,essuficienteconalgunascaractersticasdelaescena.Enlamayorpartede
regionesquepresentanbajaintensidad.EntrabajosrecientesllevadosacaboporZhuycolabo- loscasos,el anlisisdeescenasicnicasselimitaaconstruirunmodelodelaescenaodepartes
delamisma.Elanlisisdeescenasbasadoencaractersticasintentaextraerdelaescenaaquellas
caractersticasquesonrelevantesparalatareaqueseestdesarrollando.Lavisinorientada a
tareas o dirigida por objetivos LBallard, 1991;Aloimonos, 1993]normalmentellevaacaboun
5 Txeles untnninoqueprovienedelaspalabrastextureelemenl: (elementodetextura).Sehautilizadoeltr-
minoanglosajnal estaradmitidoenlacomunidaddevisinartificial.(N. del T.) anlisisbasadoencaractersticas.
92
93
'
Visinartificial
+ +
[J)
6.5.1. Interpretacindelneasycurvasenunaimagen
Paraescenasenlasque sabemosqueexistenobjetos rectilneos (comopuedenserescenas en
interioresdeedificiosoescenasenespacioscuadriculados)unpasoimportanteenelanlisisde
escenaseseldedeterminarlaslneasqueaparecenenlaimagen(queposteriormenteseasocia-
rnaloselementosclavesdelaescena). Paracrearlneasenunaimagensesuelenutilizartc-
nicasqueajustansegmentosalosbordesocontornosdelasregiones. Paraescenasquecontengan
objetoscurvos,sepuedencrearcurvasenlaimagenajustandoseccionesdefunciones cnicas
(elipses,parbolasehiprbolas)aloscontornosdelasregiones[NalwayPauchon, 1987].Este
procesodeajuste,seguidodelaaplicacindetcnicasqueeliminenlaslneaspequeasyfusio-
nenlosextremosdecurvasylneascontiguas,transformanlaimagenenundibujo de lneas, id-
neoparaunaposteriorinterpretacin.
Existenvariasestrategiasparahacercorresponderlaspropiedadesdelaescenaconlosele-
mentosdeundibujodelneas.Esteprocesodeasociacinsedenominainterpretacin deundibu- .
jodelneas.Comoejemplo,analizaremosunadeestasestrategiasdeinterpretacinquesepue-
deaplicaraescenasenlasquesesabequeslopuedenaparecersuperficiesplanas,yqueenun
mismopuntonosepuedenintersectarmsdetressuperficies(estacombinacindesuperficiesse
denominapoliedros con vrtices tridricos). EnlaFigura6.15sepuedeverunaescenaconestas
caractersticas. Como se puede observar, es una escena interior, limitada por las paredes, el
sueloyeltecho,enlaqueapareceuncubosobreelsuelo.Enestetipodeescenas,losplanosslo
sepuedenintersectarde tresformasdistintasparaformarunborde. Untipodeborde, denomi-
nadoborde de oclusin, sepuedeformarcuandounplanoocultapartedeotro(esdecir,cuando
slounodelosplanosestotalmentevisibleenlaescena).Losbordesdeoclusinenlaimagen
delejemploestnmarcadosconunaflecha ~ ) , cuyosentidoindicaqueelplanoocultadoesta
laizquierdadelaflecha. Alternativamente, dosplanos sepuedenintersectardetal forma que
ambosseanvisibles.Enestecaso,podemostenerunborde convexo
6
(etiquetadoconelsmbo-
lo+), si lainterseccines convexa,o,encasocontrario, un borde cncavo (etiquetadoconel
smbolo-).
Supongamosquehemoscapturadounaimagenquerepresentaunadeterminadaescena,yque
dichaimagenhasidotransformadaen su correspondientedibujodelneas-parecidoaldela
Figura6.15-.Podemosetiquetarlaslneasdelaimagendetalmaneraquerepresentendefor-
maprecisalosdistintostiposdebordesqueaparecenenlaescena?Larespuestaaestapregunta
esqueesposiblehacerlobajociertascondiciones.La primeradeestascondicionesesquelaima-
gendebedesertomadadesdeunpunto de vista general, esdecir,unpuntodesdeelcualnoexis-
tandosbordesdelaescenaqueestnalineadosygenerenunsolobordeenlaimagen.Elmto-
doparaeletiquetadodelneassebasaenelhechodequeslosonposiblesciertasunionesentre
laslneasdeunaimagen(apartedelasuposicindequeslovanaaparecerpoliedrosconvr-
ticestridricos).EnlaFigura6.16sepuedenverlosdistintostiposdeetiquetasquepodemosuti-
lizarparanuestrasescenaspolidricas.Evidentemente,existenmuchasmsformasdeetiquetar
lasunionesentrelneas.
Elanlisisdeescenasmedianteeletiquetadodelneasrequieredeunpasoprevioquecon-
siste en marcartodas las uniones de lneas de la imagen con las etiquetas V, W, YoT, de
acuerdoconlaformadelaunin.EnlaFigura6.17sepuedeapreciarelresultadodeesteproceso
paralaimagendeejemplomostradaenlaFigura6.15(comosepuedever,noaparecenuniones
Tenestaimagen).Unaveztenninadoesteproceso,procederemosaetiquetarlaslneasdelaima-
6 Eneltextoeningls,a losbordesconvexostambinselesdenominablades (filodeunaespada),y a losen-
eavosfolds (pliegues).(N. del T.)
Figura6.15.
Escenaenunahabitacin.
genconlas etiquetas+, - o ~ , peroeste procesodebeserrealizadosiguiendo algunosdelos
patronesindicadosenlaFigura6.16.Adems,hayquetenerencuentaquecualquierlneadela
imagen que conecte dos uniones debe tener un etiquetado consistente. Estas restricciones, a
menudo (pero no siempre), fuerzan a que exista slo un posible etiquetado. Si no podemos
encontrarunetiquetadoconsistente,probablementehayamoscometidoalgnerroraltransformar
laimagenenundibujodelneasoqueenlaescenaexistanpoliedrosnotridricos.Elproblema
~ ~ ~
UnionesV
~ ~ ~
UnionesW . +I , - +I . . J ~
~ ~ ~
yy
- ~
UnionesY _ _ +I
UnionesT -r -r t t
Figura6.16.
Etiquetasparalaslneasyuniones(despusde[Huffman, 1971]).
94
95
W W y
y
y y
w
y
V
y
W
y ve Dv
Figura 6.17.
Etiquetado de las uniones de una imagen de acuerdo con su tipo.
de la asignacin de etiquetas a las lneas de una imagen es un ejemplo de 10 que en lA se deno-
mina problema de satisfaccin de restricciones. En otros captulos de este libro analizaremos
algunos de los mtodos existentes para resolver este tipo de problemas, aunque el lector puede
experimentar por su cuenta, intentando conseguir un etiquetado consistente de la Figura 6.17 (por
supuesto, el etiquetado de la imagen que se corresponde con la escena ya etiquetada de la Figu-
ra 6.15 es un etiquetado consistente, pero en este caso hemos estipulado que la escena tenga
dichas etiquetas. Como ejercicio, el lector puede idear una forma automtica para realizar un eti-
quetado consistente).
Las tcnicas de anlisis de escenas que etiquetan uniones y lneas de una imagen formada por
poliedros con vrtices tridricos comenzaron con los trabajos de [Guzmn, 1971; Clowes, 1971]
y fueron extendidos por [Waltz, 1975] y otros autores. En la actualidad, se han realizado algunos
avances que hacen posible la aplicacin de tcnicas similares para el caso de escena,> que con-
tienen superticies que no son planas. En [Nalwa, 1993, Cap. 4] se puede ver una exposicin ms
completa (con referencias a otros trabajos) sobre la interpretacin de dibujos de lneas.
La interpretacin de las lneas y curvas de un dibujo de lneas nos proporciona una gran can-
tidad de informacin til. Por ejemplo, un robot podra predecir que si se dirige hacia un borde
cncavo (o pliegue), eventualmente podra quedar situado en un rincn. De la misma forma, para
que un robot pueda moverse en un entorno con obstculos polidricos, slo tendra que evitar los
bordes convexos. Como hemos visto, a partir de un dibujo de lneas ya interpretado podemos
extraer, tanto las caractersticas que necesitamos como un modelo icnico, siempre y cuando con-
temos con el conocimiento general suficiente sobre el tipo de escenas que estamos tratando.
6.5.2. Visin basada en modelos
El siguiente paso en el incremento de la complejidad del conocimiento requerido en el anlisis de
escenas consiste en el uso de modelos de los objetos que pueden aparecer en la escena. Por ejem-
plo, si supisemos que una escena va a estar formada por elementos utilizados en la construccin
de robots, los modelos geomtricos sobre las formas de dichos elementos nos podran ayudar en
la interpretacin de las imgenes. En los siguientes prrafos haremos un breve anlisis sobre las
W
y
Inteligencia artificial. Una nueva sntesis Visin artificial
~
tcnicas ms utilizadas en la visin basada en modelos (vase [Binford, 1982, Grimson; 1990, y
Shiral, 1987] para un anlisis ms profundo).
De la misma forma que podemos ajustar lneas y curvas a los bordes entre las regiones de una
imagen, las proyecciones en perspectiva de los modelos, y de partes de dichos modelos, se
pueden ajustar a las regiones de la imagen. Por ejemplo, si sabemos que hay un paraleleppedo en
una escena (como, por ejemplo, en la Figura 6.15), podemos intentar ajustar distintas proyec-
ciones de un paraleleppedo patrn a los elementos de la imagen. El paraleleppedo patrn
podra tener una serie de parmetros para especificar su tamao, posicin y orientacin. De esta
forma, estos parmetros se van ajustando hasta que encontremos un conjunto de valores que per-
mitan realizar un buen ajuste a un determinado conjunto de lneas de la imagen.
Algunos investigadores han utilizado lo que se denomina cilindros generalizados [Binford,
1987] como elementos constitutivos para la construccin de modelos. En la Figura 6.18 se puede ver
un cilindro generalizado, y, como puede observarse, tiene nueve parmetros. En la Figu-
ra 6.19 se muestra, de una forma muy burda, cmo se puede reconstruir un cuerpo humano con estos
cilindros. Se puede adaptar el mtodo para trabajar con representaciones jerrquicas, ya que cada
1
1
_b_
a, b, e + 6 parmetros de localizacin
Figura 6.18.
Cilindro generalizado.
ij
-ll
I
I.__J
'
Figura 6.19.
Modelado de una escena utilizando cilindros generalizados.
cilindro del modelo puede ser descompuesto en otros cilindros ms pequeos que se ajustan a la
figura de una forma ms precisa. La representacin de objetos de una escena mediante una jerarqua
de cilindros generalizados es, segn palabras de Nalwa [Nalwa, 1993, p. 293], ms fcil de decir
que de hacer, aunque el mtodo ha sido utilizado en determinadas aplicaciones sobre reconoci-
miento de objetos [Brooks, 1981]. En [Ballard y Brown, 1982, Cap. 9], se puede ver un anlisis ms
detallado sobre la utilizacin de modelos para la representacin de estructuras tridimensionales.
Disponiendo de un conjunto suficiente de elementos de modelado, podemos ajustar dichos
modelos a las regiones de una imagen hasta que obtengamos, o bien una representacin icnica
de toda la escena, o bien suficiente informacin de la escena para extraer de ella el conjunto de
caractersticas necesarias para la tarea que se est desarrollando. Para comprobar la precisin de
los mtodos basados en modelos, se puede comparar la imagen original con una imagen simu-
lada, que se puede obtener del modelo icnico producido en el anlisis de escena. La imagen
simulada puede ser renderizada a partir del modelo utilizando parmetros parecidos a los utili-
zados en el proceso de adquisicin de la imagen (ngulo de la cmara, posicin de la misma, etc-
tera). Para poder realizar este proceso es necesario disponer de buenos modelos para la ilumina-
cin, la reflectancia de las superficies y para todos los aspectos que son necesarios para el proceso
de renderizacin, tal y como es utilizado en el campo de los grficos por computador.
Visin estereoscpica e informacin sobre la profundidad
Si slo nos basamos en el proceso de proyeccin en perspectiva, un objeto grande y alejado de la
cmara puede producir la misma imagen que un objeto parecido pero ms pequeo y cercano.
Esto nos puede dar una idea de lo complejo que resulta estimar las distancias a las que se
encuentran los objetos utilizando una sola imagen. Mediante la visin estereoscpica, podemos
obtener informacin sobre la profundidad de los objetos, que est basada en un proceso de
triangulacin a partir de dos (o ms) imgenes.
Sin embargo, antes de analizar el proceso de visin estereoscpica, indicaremos cmo, bajo
ciertas circunstancias y con un conocimiento previo apropiado, podemos extraer informacin de
profundidad de una sola imagen. Por ejemplo, el anlisis de la textura de una imagen (teniendo en
cuenta las transformaciones en perspectiva de las texturas de la escena) puede indicar que algu-
nos elementos estn ms alejados que otros. Incluso, si tenemos en cuenta ciertas circunstancias,
podemos obtener informacin ms precisa sobre la profundidad de los objetos. Por ejemplo, si
estamos analizando una escena en el interior de una oficina y sabemos que uno de los objetos per-
cibidos est en el suelo, conociendo la altura a la que est la cmara y el ngulo formado por el
centro de la lente y el objeto, podemos calcular de una forma precisa la distancia a la que se
encuentra dicho objeto. En la Figura 6.20 podemos ver un ejemplo de este tipo de clculos
(podemos calcular el ngulo a partir de la distancia focal de la cmara y las dimensiones de la
imagen). Los mismos clculos se pueden utilizar para la distancia a la que se encuentran las puer-
tas, el tamao de los objetos, etc.
La visin estereoscpica tambin se basa en el proceso de triangulacin. La idea es bastante
simple. Consideremos el grfico de la Figura 6.21, en el que aparecen dos lentes cuyos ejes pti-
cos estn separados por una distancia b. En el grfico se puede ver cmo se forman dos imgenes,
correspondientes a una escena formada por un punto situado a una distancia d de la lnea que une
los centros de las lentes. En el mismo grfico se muestra cmo se pueden ca1cular los ngulos que
forman las imgenes con el centro de la lente. A medida que los objetos sean ms pequeos y que
la distancia entre las lentes sea ms grande, se pueden conseguir mediciones ms precisas, aun-
que siempre estaremos limitados por la precisin con que estn hechas las medidas iniciales (dis-
tancia entre las lentes y distancia entre las lentes y el objeto de la escena). El ejemplo que estamos
Visin artificial
Plano de la imagen
Objeto
1
I
h
Suelo
1o(_--- d =hItan a. .1
Figura 6.20.
Clculo de la profundidad a partir de una nica imagen.
Planos de la imagen
Lente
---1-1 ~ a.
Punto
l. . . . . . . ~ ~ - - d )01
1
b
1
p
d= a. + tan p)
Lente
Figura 6.21.
Proceso de triangulacin en la visin estereoscpica.
considerando supone una simplificacin de lo que suele ocurrir en la realidad, ya que los ejes
pticos son paralelos, los planos de las imgenes son coplanares y el punto considerado en la
escena est en el mismo plano en el que se encuentran los ejes pticos. En situaciones reales,
estas condiciones no se cumplen, lo que complica la geometra del proceso aunque la idea bsi-
ca de la triangulacin sea la misma (hay que tener en cuenta que los animales y algunos robots
pueden rotar los ejes pticos de las lentes para apuntar a un determinado punto de la imagen).
98
Sin embargo, el proceso de triangulacin no es la principal complicacin en la visin este-
reoscpica. En aquellas escenas que contengan ms de un punto (obviamente, el caso ms
usual), el primer proceso que hay que realizar es el de encontrar parejas de puntos, donde cada
punto pertenezca a una imagen distinta, que se correspondan con el mismo punto de la escena
(para, de esta forma, poder calcular las distancias). Dicho en otras palabras, una vez que hemos
sido capaces de detectar en una imagen un pxel y su correspondiente punto en la escena, debe-
ramos ser capaces de identificar el pxel correspondiente en la otra escena. Este problema es
conocido como el problema de la correspondencia. El espacio del que disponemos en este libro
no nos permite tratar con la profundidad requerida el problema de la correspondencia; sin
embargo, s podemos hacer unas pocas observaciones.
Primero, teniendo en cuenta la geometra del problema, el problema de encontrar el pxel
correspondiente en la otra imagen se reduce a una bsqueda a lo largo de una dimensin (en vez
de dos). Esta dimensin se denomina lnea epi polar. Esta bsqueda unidimensional se puede rea-
lizar mediante una correlacin cruzada de las dos imgenes de intensidad a lo largo de las lneas
epipolares. Segundo, en muchas aplicaciones, no es necesario encontrar correspondencias entre
pares de puntos individuales de la imagen, ya que podemos buscar correspondencias entre ele-
mentos ms grandes, como, por ejemplo, lneas 7. Mediante el anlisis de escenas de cada una de
las imgenes podemos obtener pistas que nos ayuden a encontrar las correspondencias entre l-
neas. En [Nalwa, 1993, Cap. 71, podemos encontrar una excelente revisin de los mtodos com-
putacionales utilizados para la visin estereoscpica.
El grupo que desarroll ALVINN contina trabajando en otros sistemas de navegacin autnoma,
y alguno de ellos utiliza tcnicas similares a las analizadas en este captulo ([Thorpe et al.,
1992]). En trabajos similares, [Herbert et al., 1992] describen un sistema de navegacin autnoma
en terrenos abiertos y utilizan visin estereoscpica y sensores infrarrojos.
Aunque existen aplicaciones en las que el sistema de visin artificial necesita trabajar con
modelos tridimensionales de la escena, los robots, normalmente, slo requieren la informacin
necesaria para poder desarrollar la tarea que les ha sido encomendada. Como una reaccin a los
primeros trabajos en visin, que estaban orientados al clculo de modelos de la escena completa,
algunos autores se han centrado en el campo de la visin dirigida por objetivos, tarea que consi-
deran ms importante. En [Horswill, 1993], se presenta un interesante ejemplo de un sencillo sis-
tema de visin orientado a tareas. Los sistemas orientados a tareas, normalmente, son suficientes
para conseguir una navegacin robusta en un robot. Otro ejemplo de esta filosofa se puede ver en
[Churchland; Ramachandran, y Sejnowski,
Estudiando los fundamentos psicolgicos y neurofisiolgicos de la visin humana y animal,
podemos aprender mucho acerca del proceso de percepcin visual. [Gibson, 1950; Gibson, 1979] ha
estudiado, entre otros fenmenos, cmo cambia el campo visual cuando aparece un objeto en movi-
miento en sus inmediaciones. [Jules, 1971] descubri que los humanos pueden explotar las discon-
tinuidades en una distribucin aleatoria de puntos para obtener infonnacin de profundidad. [Marr y
Poggio, 1979] han construido un modelo neuronal que simula el proceso de visin estereoscpica.
Distintos experimentos realizados con ranas [Letvinn et al., 1959] han revelado que su sis-
tema visual slo responde a cambios globales en la iluminacin (como los que podra causar la
sombra de un animal grande que se est acercando) o el movimiento de objetos pequeos y oscu-
ros (como, por ejemplo, moscas). En [Hubel y Wiesel, 1968], se describen una serie de experi-
7 O podemos encontrar correspondencias entre los puntos de la imagen en los que las lneas se intersectan.
Visin artificial
mentos realizados con monos que demuestran que ciertas neuronas de la corteza visual se excitan
ante la presencia de segmentos en distintas orientaciones en su campo visual. Otros experimen-
tos realizados con cangrejos han revelado que existen clulas adyacentes de su sistema visual que
se inhiben entre s (inhibicin lateral), produciendo un efecto muy parecido a lo que ms tarde se
ha conocido como el filtrado laplaciano [Reichardt, 1965]. Para profundizar en el campo de la
visin biolgica, se puede acudir a [Marr, 1982; Hubel, 1988].
[Bhanu y Lee, 1994] han utilizado tcnicas genticas para el proceso de segmentacin de
imgenes.
Los congresos ms relevantes en el rea de la visin por computador son: el Congreso Inter-
nacional en Visin por Computador, ICCV (Interoational Conference on Computer Vision), el
Congreso Europeo en Visin Artificial, ECCV (European Conference on Computer Vision) y el
congreso sobre Visin Artificial y Reconocimiento de Patrones, CVPR (Computer Vision and Pat-
tero Recognition). Lapublicacin ms importante es el Intemational Joumal of Computa Vision.
Entre los libros ms relevantes, podemos citar [Nalwa, 1993; Horo, 1986; Ballard y Brown,
1982; Jan, Kasturi y Schunck, 1995, y Faugeras, 1993]. En [Fischler y Firschein, 1987], se pue-
de encontrar una recopilacin de algunos de los artculos ms importantes sobre visin por
computador. El libro [Strat, 19921 est dedicado a escenas de exterior, y una publicacin donde se
trata de forma divulgativa nuestro proceso visual es [Gregory, 1966].
6.1. Se nos propone el diseo de un sistema visual que sirva para detectar pequeos objetos
negros sobre un fondo claro. Podemos suponer que uno de esos objetos es un cuadrado de 5 pxe-
les de ancho. El sistema ser usado para definir una caracterstica booleana que valdr 1 cuando
aparezca un nico objeto de ese tipo en la imagen (representada por una matriz de 100 X 100), Y
valdr Oen cualquier otro caso. Describa cmo se podra disear un sistema de este tipo mediante:
a) Una red neuronal con una capa oculta.
b) Un proceso de convolucin con una funcin de ponderacin especialmente diseada para
este problema.
6.2. Dada la funcin I(x), que representa una imagen unidimensional, y la funcin W(x), que
representa una funcin unidimensional de ponderacin, represente grficamente el resultado de la
convolucin I(x)*W(x).
[(x)
i i i i i I i i i ! i i i i i .. X
W(x)
i I , I I i i i i I .. X
100 101
6.3. La cruz de Roberts es un sencillo operador para la deteccin de bordes que produce una ima-
gen, l*(x, y), a partir de una imagen original I(x, y) segn la siguiente expresin:
l*(x,y) = + + (/(x, y l(x +
donde se toma el valor positivo de la raz cuadrada y indica un desplazamiento de un pxel de
longitud. Se pide utilizar el clculo diferencial para encontrar y adaptar la expresin anterior para
pxeles de tamaos infinitesimales y usar dicha expresin para calcular l*(x, y) cuando l(x, y) se
define de la siguiente forma:
1* (r, 9) 1 para r <9
1* (r,9) =1 para r> 10
l*(r,9) =lO-r para 9 > r< 10
Considere que la imagen completa tiene un radio de 20 pxeles. (Nota: Para facilitar el pro-
ceso, puede ser til expresar la imagen en coordenadas polares). En la figura siguiente se puede
ver de forma esquemtica la imagen utilizada como ejemplo:
l(r, a)
6.4. Etiquete las lneas y los vrtices de la siguiente figura con alguna de las clases comentadas
en la Seccin 6.5.1. Muestre todos los posibles etiquetados consistentes que pudieran existir y d
una interpretacin fsica a los mismos.
Visin artificial
6.5. La siguiente figura representa el tringulo de Penrose, que es una figura imposible muy
conocida.
Es posible encontrar un etiquetado consistente para dicho tringulo? Considere que la
figura est suspendida en un espacio vaco. Sobre la base de a esta figura, analice la relacin que
puede existir entre lo que podramos denominar consistencia local y consistencia global.
...
squedaen
espacIos
deestado
El hombre que no hace planes a largo plazo se encontrar con problemas a la vuelta de la es-
quina.
Confucio
... [la hormiga] saba que se tenan que tomar ciertas medidas, pero no se poda imaginar cmo
hacerlo. Es como si una persona con una taza de t en una mano y un sandwich en la otra qui-
siera encender un cigarrillo con una cerilla. Sin embargo, mientras que a la persona se le ocu-
rrira dejar primero la taza y el sandwich -antes de coger el cigarrillo y la cerilla-, la hormiga
dejara primero el sandwich para coger la cerilla, despus dejara otra vez la cerilla para
coger el cigarrillo, despus dejara el cigarrillo para coger el sandwich, despus dejara la taza
para coger el cigarrillo y, finalmente, dejara el sandwich para coger la cerilla. Es decir, estara
destinada a confiar en la consecucin de una serie de accidentes para lograr su propsito. Sin
embargo, la hormiga es muy paciente y no piensa ... Wart observ la estrategia con cierto asom-
bro, que se convirti en irritacin, y, finalmente, en disgusto. Entonces se pregunt por qu
no haba considerado la situacin con la suficiente antelacin.
T. H. White, El nico y futuro rey. Captulo 13
Agentes que
planifican
Memoria o clculo
Las funciones para la seleccin de acciones de los agentes reactivos (Figs. 2.2, 5.1 Y 5.3) realizan
muy pocos clculos. Esencialmente, estos agentes tienen sus acciones diseadas para que sea as
-bien creadas por el diseador, o mediante aprendizaje, o mediante procesos evolutivos, o por
alguna combinacin de stos-o Las propias funciones para la seleccin de acciones pueden estar
implementadas mediante tablas, reglas de produccin o circuitos de lgica combinacional que
seleccionan las acciones recomendadas para un vector de caractersticas dado. Tales implemen-
taciones tienden hacia el polo espacio en el clsico dilema espacio-tiempo de las ciencias de la
computacin. Estas implementaciones --o compilaciones- del conocimiento del diseador
estn basadas en el espacio de memoria.
!::!llilmquina reactiva realJ!lente competente, capaz de realizar ti.lJ"eas CQWI21j;'>js en entornos
complejos, requerira de grandes m;;,mg!ia. Adems,
el diseador de este tipo de mquina reactiva necesitara anticipar las reacciones apropiadas para
todas las posibles situaciones, lo cual escapa a los lmites humanos. Ello nos lleva a intercambiar
tiempo por espacio y adaptacin en vez de diseo explcito. Como primer paso, vamos a intro-
ducir en la funcin para la seleccin de acciones algunos de los clculos que el diseador habra
tenido que realizar. Estos clculos tomarn tiempo, pero reducirn los requisitos de memoria del
agente y la carga de trabajo del diseador.
Algunos de los clculos que podramos considerar son aquellos que predicen las conse-
cuencias de las posibles acciones aplicadas sobre una situacin dada. Seguramente, un diseador
de mquinas reactivas competente habra tenido que basar su diseo en estas consecuencias anti-
cipadas. El diseador (o, en su caso, el proceso de aprendizaje o evolutivo) todava tendra que
especificar cules son dichos clculos, pero los programas para realizarlos (en el momento en que
se necesitaran) requeriran mucho menos espacio del que lo haran todos sus posibles resultados.
y sera ms fcil para el diseador especificar los clculos a tener en cuenta que todas las posibles
situaciones. Quiz el punto ms importante es que si estos clculos de prediccin de consecuen-
cias pudieran ser aprendidos o desarrollarse de forma automtica, el agente que los utilizara sera
105
capaz de seleccionar las acciones apropiadas, aun en aquellas situaciones que el diseador no
habra sido capaz de prever.
Para predecir las consecuencias de una accin, un agente debe tener un modelo del mundo en
el que habita, as como modelos de los efectos de sus acciones en su modelo del mundo. En este
caso, las acciones actuales no deben realizarse hasta que sus simulaciones hayan mostrado que
stas son seguras y efectivas.
Grafos de estados
Como ejemplo, consideremos un mundo espacial cuadriculado conteniendo tres bloques de
juguete, A, B Ye, todos ellos inicialmente en el suelo. Supongamos que la tarea de nuestro robot
es apilarlos de tal manera que A est sobre B, B sobre e, y e en el suelo. Aun siendo obvio para
nosotros qu acciones deberan realizarse, no es as de obvio para un robot. Supongamos que el
robot fuera capaz de modelar los efectos de cada accin en su entorno. Podra hacerlo mediante
un par de modelos -uno que representara el estado del mundo antes de que la accin se ejecutara
y otro que representara el estado del mundo despus de haberse ejecutado la accin-o Para el
propsito de este ejemplo, supongamos que el robot es capaz de mover cualquier bloque, x, que
no tiene ningn bloque sobre l, a algn lugar y, bien en el suelo o encima de un bloque que no
tiene ningn otro bloque encima. Modelamos estas acciones mediante instancias de un esquema
(o patrn) al que denominamos mover(x, y), en donde x puede ser A, S o e, e y puede ser A, S,
e, o Suelo. Entendemos que ciertas instancias del esquema (por ejemplo, mover(A, A no son
acciones ejecutables. A las instancias del esquema, como, por ejemplo, mover(A, e), las deno-
minaremos operadores. De esta manera, los operadores son modelos de las acciones.
Utilizando un modelo icnico estructurado en listas, en la Figura 7.1 se muestra el modelo de
los efectos de todas aquellas acciones que pueden ejecutarse cuando todos los bloques estn en el
suelo 1, Para mayor claridad, hemos incluido un boceto de cada situacin, Las imgenes son ic-
IAIrmra
A)(B)(C
fIlra
BA)(C BC)(A
'1o .
"e,.
C; S)
filra rmlel I%lrm
AB)(C B)(AC CA)(B A)(CB
Figura 7.1.
Efectos de mover un bloque.
J Para mayor simplicidad, continuamos utilizando una representacin abstracta en la cual las posiciones horizon-
tales de los bloques no son relevantes, y, por tanto, no necesitan ser representadas.
Agentes que planifican
nicas para nosotros, mientras que las listas son icnicas para un agente procesador de listas. Dos
de estos efectos, en concreto, AB) (C) y A) (BC), parecen estar, de algn modo, ms cerca-
nos al objetivo ABC) que los otros efectos. De esta manera, considerando los efectos predichos
de una accin simple, el robot podra preferir las acciones modeladas mediante mover(A, S) y
mover(S, e) que las otras. Y, desde luego, el robot no habra realizado ninguna accin todava.
A menudo, adelantarse un paso en una simulacin puede producir predicciones muy tiles,
pero adelantarse ms pasos, quiz todo el recorrido para completar la tarea, puede ser ms til
an, pues permite encontrar atajos y evitar caminos sin salida. Una estructura til para guardar los
efectos de diversas secuencias alternativas de acciones es un grafo dirigido. El co!'!!!!.to de
..
grafo... 'estn eti.Q.Udados
lesy mediante operadores (comenzaremos utilizando la termino-
loga de de grafos de manera informal; ms adelante en este captulo, presentaremos las
definiciones formales relevantes que utilizaremos de los conceptos de la teora de grafos). Las
representaciones en los nodos pueden ser icnicas o basadas en caractersticas. Sin embargo, aun-
que considersemos ambos tipos, comenzaremos con las representaciones icnicas.
Si el nmero de las diferentes situaciones distinguibles del mundo es suficientemente peque-
o, el grafo que representa a todas las posibles acciones y situaciones puede ser almacenado de
manera explcita. Por ejemplo, el grafo de la Figura 7.2 muestra todas las situaciones y movi-
mientos relevantes para manipular tres bloques. Este tipo de grafo de modelos del mundo y accio-
nes se denomina,,"'I.lJUD;-Se debe tener en cuenta que cada accin es reversible, aunque
para hacer el dibujo menos confuso hemos etiquetado s610 una de cada pareja de movimientos
recprocos entre estados. Es fcil ver a partir del grafo que, si la situacin inicial es la del mode-
lo del mundo A) (B) (C), Ysi la tarea es obtener la situacin descrita por ABC), entonces el
robot debera ejecutar la siguiente secuencia de acciones: {mover(S, e), mover(A, S)}.
Una de las ventajas de representar los mundos posibles en una estructura de grafo es que
cualquiera de los nodos del grafo puede ser utilizado para representar una situacin objetivo
-quiz un objetivo especificado por una entidad externa, como un humano-. Esta flexibilidad
en las tareas contrasta con los agentes de propsito simple que hemos estudiado hasta ahora. Para
encontrar un conjunto de acciones que pennitan la .consecucin de un objetivo determinado, el
uncalino.en el grafo quexaya desde el nodo que represen-
i!lli;iaLdeLrnnndo (el nodamicio) al nodo que representa el estado objetivo especi-
ficado (el nodo objetivo). Las acciones que obtienen el objetivo ser entonces recuperadas
mOOiante Ios-a:rcosdlcain. Por ejemplo, si la tarea de nuestro robot apilador de bloques fue-
se apilar el bloque e sobre B, y ste sobre A, estando A en el suelo, y el estado inicial fuese A
sobre B, y B sobre e, estando e en el suelo, la secuencia de acciones sera {mover(A, Suelo),
mover(S, A), mover(e, Sn. Para el grafo mostrado en la Figura 7.2, es fcil (para nosotros!)
encontrar caminos mediante una inspeccin visual; sin embargo, los agentes computacionales
necesitan utilizar diversos procedimientos de bsqueda en grafos para encontrar los caminos.
los qn camillo h,asta!l objetivo pueden ser
unasecueiiCi:ia:eo:nlilada*y la bsque4a.de dichll secuellcia se denomina .
......1I'fIi.
El proceso de predecir la secuencia de estados del mundo resultante de una secuencia de
acciones se llama proyeccin. Pero, encontrar de esta manera la secuencia de acciones que
alcanza el objetivo se basa en una serie de presunciones. El agente debe ser capaz de representar
todas las situaciones del mundo relevantes mediante nodos en un grafo, y debe disponer de mode-
los cuidadosos y detallados de cmo las acciones enlazan parejas de estados del mundo. Las
acciones deben tener siempre sus efectos modelados -no puede haber equivocaciones en el sis-
tema ejecutor del agente-. El sistema perceptual del agente debe identificar de forma precisa el
108
109

BAC BAC

&,.(ti
, .$'l,
&/0)
(&lO)
AB)(C
rBl!el
B)(AC
"?o

"',-::
'1&
(,&
1!1[CJ

!lrBl
CA)(B

0.\0\

\t>-.'
0,,0

A)(CB

ACB CAB

&,,(C
-s.
0\0\
c;;>S
mover(B, el
A)(BC BA)(C
m m

'-
O>

3
i) o
E E
3
CBA ABC
Figura 7.2.
Ungrafodeestados.
nodoinicio,ynopuedenexistirotrosagentesoprocesosdinmicosquecambienelmundosimul-
tneamente.Sisecumplentodasestaspresunciones,ysieltiempopermitidoparalatareaadmi-
telabsquedadeunestadoobjetivo, sepuedeplanificary ejecutarunasecuenciadeacciones
(comosifueraunclculobalstico)sinnecesidaddeestablecerunlazode realimentacindel
entornomediantesensores.
Aunqueestaspresuncionesnoseencuentranenmuchasaplicacionesdelmundoreal,lapla-
nificacinmediante bsquedaengrafosesunaidealizacinextremadamenteimportantey til.
Puedesergeneralizadaparaacomodarsearequisitosconpresuncionesmenosrestrictivasopuede
ser un componente empotrado de una arquitectura adaptada a dichos requisitos. Volveremos
sobreestetemaenelCaptulo10.Enestecaptulo,comenzaremosnuestrotratamientodelabs-
quedadecaminosengrafos describiendo unprocedimientoparticularmente sencillo, adecuado
cuandoelgrafoenelqueserealizalabsquedapuedeseralmacenadoexplcitamente.Por10gene-
ral,enesecaso,elgrafoesrazonablementepequeo,asquenonosdebemospreocupardemasiado
Agentesqueplanifican
porlaeficienciade los mtodosdebsqueda. En los prximos dos captulos, discutiremos los
mtodosdebsquedaaplicablesagrafosqueson10suficientementegrandescomoparatenerque
serrepresentadosdemodoimplcito.yquedebenserrecorridosdeformaeficiente.
Bsqueda en estados explcitos
Labsquedaengrafosexplcitosrequiereirpropagandomarcadoresalolargodelosnodosdel
grafo. Comenzamosmarcandoelnodo inicio conun0, y despus iremos incrementandoeste
nmero,amedidaquenosextendemosamododeondas,hastaquealcanzamoselnodoobje-
tivo.Entonces,recorremoselcaminoinversodesdeelnodoobjetivohastaelnodoiniciodecre-
mentandolosnmerosdelasecuencia.Lasaccionesa10largodelcamino,desdeelnodoinicio
alnodoobjetivo,sonlasaccionesquepermitiranalcanzarelobjetivo.EstemtodorequiereO(n)
pasos,donden eselnmerodenodosdelgrafo(sihayunnodoobjetivosimple,elprocesopodra
implementarseendireccininversa--comenzandoenelnodoobjetivoyfinalizandoenelnodo
inicio--).Losenterosasignadosalosnodosenesteprocesopuedeninterpretarsecomountipode
funcinpotencialsobrelosnodos, conunmnimoglobalenel nodoinicio. Elcaminoinverso
(desdeelobjetivohastael inicio)vareduciendoel gradientededichafuncin.
Los diferentes pasos en la propagacin de los marcadores del problema de transformar
BAC enABC semuestranenlaFigura7.3. Estemtodosellamabsqueda primero en
anchura, yfuepropuestoporprimeravezpor[Moore, 1959].
Alprocesodemarcarlossucesoresdeunnodolollamamosexpansin. Consisteenmarcar
todoslosnodosvecinosal nodoquenohansidomarcadospreviamente.Unacuestinimportante
conrespectoalaeficienciaesqunodosnoexpandidoslosernenelpasosiguiente?Enlabs-
(a) (b)
(e) (d)
Figura 7.3.
Pasosdelabsqueda.
110
111
quedaprimeroenanchuraexpandimoscualquiernodonoexpandidoetiquetadoconunnmero
nomayorqueotrosnodosnoexpandidos.Esdecir, expandimostodoslosnodosetiquetadoscon
unnmeroiantesdeexpandiraquellosetiquetadosconunnmeroj talquei<jo Otrosmtodos
debsquedautilizanotrotipo decriterioenlaexpansinde un nodo; stossedescribirncon
mayordetallemsadelante.
\Estados basados en caractersticas \
...- .- ..
Erarealmentesencillorepresentarestadosmedianteelusodemodelosicnicosparaetiquetarlos
nodos-podamosvisualizarlosefectosdeunaaccinsobrelosestados-.Sinembargo,tambin
esposibledefinirgrafoscuyosnodosestnetiquetadosporcaractersticas,pero,parahacerlo,nece-
sitamosunaformadedescribircmounaaccinafectaalascaractersticas.Unatcnicaparades-
cribi!.4ichosefectosfue yNilsson, 1971,yFikes;H3rt,
y 1972].Laideabsica unoperadormeWmte"loJII .
nyJalliQl. quehandetenerunY&Qr 1yaqe-
quehandetener.unv.alQI ..Q. aquelaaccinplleda.seraplipMia,

aquellascaractersticasquecambiarnsu valordeOa 1. Los
valoresdelas quenose deformaexplcitaenlaslistasborraryaadirnose
cambian. Estas tres listasdefinen un modlode.
accin:-.AplazaremosladiscusinacerCaderso e osoperadoresSTRIPS enellibromientras
nohayamosintroducidopreviamentetcnicasmspotentesparaeltratamientodecaractersticas.
Tambinpodramos sercapacesdeentrenarunaredneuronalparaaprendera predecirlos
valoresdeunvectordecaractersticasenelinstantet apartirdesusvaloresenelinstantet- 1Y
delaaccinejecutadaenelinstantet - 1[JordanyRumelhart, 1992].Estetipoderedsemues-
traenlaFigura7.4.Aunquehemos vistounaredde slounacapa,tambin sepodranutilizar
capasintermediasdeunidadesocultas.Despusdeunentrenamiento,lareddeprediccinpuede
Caractersticasrecordadas Caractersticaspredichas
delinstantet - 1 enelinstantet
X,-
l-X'
- O -Xz x2
O
Caractersticasactualesenelinstantet
Totalmente O
(utilizadascomoetiquetasdeentrenamiento)
conectadas I
O
Xi - 01 -Xi
O
O
Totalmente
=/
conectadas
Representacincodificadadeuna
accinrealizadaenelinstantet - 1
Figura7.4.
Prediccindeunvectordecaractersticasmedianteunaredneuronal.
serutilizadaparacalcularlos vectoresdecaractersticasresultantes de laaplicacinde varias
acciones.Losvectorescalculadospuedenserutilizadoscomoentradasalaredparapredecirlos
vectoresdospasosposteriores,yassucesivamente.Unprocesosimilar(basadoentcnicasde
clasificacinestadstica)seutilizparaelcontroldeunrobotmvil[Mahadevan, 1992,yCon-
nellyMahadevan, 1993a].A causadeerroresinevitablesenel procesodeprediccin, nosera
adecuadointentarplanificarmsdeunospocospasosutilizandoestemtodo.
Notacin de grafos
Antes de pasar a los siguientes captulos, en los que presentaremos tcnicas para tratar con
espaciosdeestadosgrandes,esaconsejabledefinirpreviamentealgunadelaterminologaacep-
tadaqueseutilizaendiscusionessobregrafosybsquedaengrafos.EnlaFigura7.5mostramos
unosejemplosdegrafoyrbolparailustrarlostrminosquedefiniremos.
Ungrafo secomponedeunconjuntodenodos(nonecesariamentefinito). Ciertosparesde
nodosestnconectadosmediantearcos. Estetipodegrafosedenominagrafo dirigido. Paranues-
trospropsitos,losnodosseetiquetanconmodelosdelosestadosdelmundo,ylosarcosseeti-
quetanconlos nombresdelasacciones. Siunarcoestdirigidodelnodonialnodonj'entonces
sedicequeelnodonj essucesor(ohijo)delnodoni' Yqueelnodoni esantecesor(opadre)del
nodoni" Enlosgrafosquenosinteresan,un nodoslopuedetenerunnmerofinitodesucesores.
Unpardenodospuedensersucesoresunodelotro,yviceversa;enestecaso,reemplazamoslos
dosparesdearcosporunaarista. Losgrafosquecontienensloaristassellamangrafos no diri-
gidos. Enlossiguientesdiagramasdegrafos,losarcostendrnflechasylasaristasno.
Un rbol dirigido (con raz) es un caso especial de grafo dirigido en el cual cada nodo
(excepto uno) tiene slo un padre. El nodo sin padres se denomina nodo raz. Un nodo sin
sucesoressedenominanodo extremo onodo hoja. Decirnosqueelnodoraztieneprofundidad
cero.Laprofundidaddecualquierotronododelrbolsedefinecomolaprofundidaddesupadre
ms l.Unrbol no dirigido (conraz,yaristasenvezdearcos)esungrafonodirigidoenelcual
hayprecisamenteslouncaminoatravsdelasaristasentreun pardenodosdado.
Notacindegrafos
Notacinderboles
Ascendiente
l/Nodol
delnodo3
(y delnodo4)
a--An;oa
d/
/\:7
2 ----- b
,
Padre delnodo4
7
4
1\ /
e __Descendiente delnodo 1
I \
3 (y delnodo4)

c(a),ode alternativac(l,4),eselcostedelarcoa
Nodoextremo (uhoja)
(d,a),odeformaalternativa(2, 1,4),eselcaminodelnodo2alnodo4
Figura7.5.
Notacindegrafosyrboles.
112
113
11"""
Algunos rboles tiles en el anlisis terico tienen la propiedad dequetodos sus nodos,
exceptolosnodoshoja,tienenelmismonmero,b, desucesores.Enestecaso,ab selellamael
factor de ramificacin delrboL
Unasecuenciadenodos(nI'n
2
, , n
k
), enlacualcadani +1essucesordeni' parai == 1,...,k 1,
sedenominacamino delongitud k delnodonI hastaelnodon
k
(demaneraalternativa,podramos
definiruncaminocomolasecuenciadearcosqueconectanlosnodos).Siexisteuncaminodes-
deelnodo ni hastaelnodo n
j
, entonces se dice que el nodo n
j
es accesible desde el nodo ni'
Entonces,elnodon
j
esundescendientedelnodoni' Yelnodoni unascendientedelnodon
j
Amenudo,es convenienteasignarcostespositivosa los arcospararepresentarelcostede

realizarlaaccincorrespondiente.Utilizamoslanotacinc(n, n) (o, algunasv.eces c(a para
denotarelcostedeun arco, a, dirigido del nodo ni al nodosucesornj" Enalgunosdenuestros
siguientesplanteamientos,serimportanteasumirquetodosellossonmayoresquealgnnme-
ro positivo pequeo E seleccionado arbitrariamente. El coste de un camino entre dos nodos,
entonces,serlasumadeloscostesdetodoslosarcosqueconectanlos nodosdelcamino.En
algunosproblemas,querremosencontraruncaminoquetengaunmnimocosteentredosnodos.
Estetipodecaminosedenominarcamino ptimo.
Enlosproblemasmssencillos,desearemosencontraruncamino(quizconmnimocoste)
entreunnododadono, querepresentarelestadoinicial,yotronodong dado,querepresentar
algnotroestado.Lasituacinmascomn,sinembargo,serencontraruncaminoentreunnodo
no ycualquiermiembrodeunconjuntodenodosquerepresentarnestadosquesatisfacenunesta-
doobjetivo. Llamaremosconjunto de objetivos aesteconjunto,ynodo objetivo acadanododel
conjuntodeobjetivos.
Dadoungrafoexplcito,avecespodramosdesearencontraruncaminoaalgnnodo,no, des-
decualquieradelosnodosdelgrafo.Esteconjuntodecaminosfonnaloquesedenominaelrbol
de expansin delgrafo-unrQol conrazno(sehadetenerencuentaquenuestradefinicinde
rbol debesufrirciertoscambiospararepresentarunrboldeexpansin;vaseEjercicio7.2).
Dadoquerepresentamosestadosmedianteelusodegrafos,avecesutilizaremosindistinta-
mentelapalabranodo pararepresentarunnododeungrafo,elestadodelmundoquerepresenta
ylarepresentacindeeseestado(unaestructuradedatoso unconjuntodecaractersticas).De
fonnasimilar,utilizaremos lapalabraarco pararepresentarunarcodeun grafo, laaccinque
representayeloperadorquemodelalaaccin(mediantedescripcionesdeestados).
Paramsinfonnacinsobreaspectoscomputacionalesrelativosagrafosyalgoritmosdegrafos,
vase [Connen; Leiserson, y Rivest, 1990, Cap. VI]. Muchos problemas pueden sertratados
comounatareaconsistenteenencontraruncamino(ocaminos)engrafos,y, deestamanera,los
mtodosdescritosenste.yenloscaptulossiguientes,encuentranaplicacinendiversasreas
msalldelaplanificacinconagentes.
7.1. Unrobotdebeencontrarelcaminomscortoentre unpuntoinicial,s, y unalocalizacin
objetivo, g, enelespacio bidimensional poligonal mostrado seguidamente.Asumimos que el
robotesdetamaoinfinitesimal.Elcaminopuedeseradyacentea(tocando)losobstculos,pero
nopuedeatravesarlosointersectarlos.
s
g
1. Copieeldibujoydibujeelcaminomscortoentres yg.
2. Aunquepuedehaberunnmeroinfinitodepuntosenesteespacio2-D,culeselcon-
juntomnimodepuntosquedebeconsiderarseparaencontrarelcaminomscortoentre
dospuntosarbitrarioss yg?
3. Dado un punto del conjunto mnimo que acaba de definir, describa un mtodo para
generarlossucesoresdeesepuntoensucorrespondientegrafodebsqueda.Culesson
lospuntossucesoresdelpuntosdelafigura?
7.2. rbolesdeexpansin: dadounnodon deungrafodirigido, (j, haciaelcualhaycomomni-
mouncaminodesdecadanodode(j, dunadefinicinprecisadelrboldeexpansindelrbol
(j conrazn. Seguidamente,razonequpodrasignificarelconceptorbol de expansin mnimo.
7.3. ElproblemadelosMisionerosy]osCanbalesesfamosoenlA.Aqutenemosunenun-
ciadodelproblema:
Tresmisionerosytrescanbaleslleganaunro. Hayunboteenunladodelroquepueden
utilizarunao dos personas. Cmousarnelboteparacruzare] ro si no puedehaberun
nmerosuperiordecanbalesquedemisionerosnienelboteni enningnladodelro?
Especifiquelafonnadedescribirlosestados,elestadoinicialyelestadoobjetivo,paraeste
problemaDibujeelgrafoenterodeestadosyetiquetesusnodos(slonecesitarincluiraque]]os
estadosqueseanlegales--esdecir,aquellosestadosenloscualesloscanbalesnosuperena
losmisioneros).
7.4. RefirindonosaljuegodelEjercicio5.3,lasTorresdeHanoi,supongamosquenosabemos
nadaacercadelmtododer/izqparamoverlosdiscos,peronecesitamosencontrarunasolu-
cin. Definamoslosoperadoresquedescribenlasaccionesmedianteelesquemamover(x,y ,z),
dondex puedesercualquieradelos discos D" D
2
o D
3
, ey yzpuedensercualquierparejade
varillasA, BoC. Definalasdescripcionesdelosestadosparaesteproblema,identifiqueelesta-
doinicialyelobjetivoydibujeelespaciodebsquedacompleto,defonnaquecontengatodos
losposiblesestadosdelproblema.Etiquetelosarcosmediantelosoperadoresapropiados(cada
movimientoesreversible,necesitaretiquetarslocadaparejademovimientosreversibles).
Bsqueda

aciegas
Especificacin del espacio de bsqueda
Muchosdelosproblemasdeintersprcticotienenunosespaciosdebsquedatangrandesque
nopuedenserrepresentadosmedianteungrafoexplcito,portanto, serequierenmodificaciones
enlosprocedimientosdebsquedatratadosenelcaptuloanterior.Primero,debemosprestaruna
atencinespecialalaformulacindedichosproblemasparapoderaplicarsobreelloslosmto-
dosdebsqueda.Segundo,necesitamosmtodosquenospermitanrepresentargrandesespacios
debsquedamediantegrafosimplcitos.Tercero,necesitarnosmtodoseficientesdebsquedaen
esosgrafosdegran tamao. Enalgunosproblemasdeplanificacin,como,porejemplo,eldel
apilamientodebloques,noesdifcilconcebirestructurasdedatospararepresentarlosdiferentes
estados del mundo y las acciones que 10 modifican. Normalmente, resulta difcil encontrar
representaciones en forma de grafos de estados que sean manejables. Paraconseguiresto, se
requiere un anlisis detalladodel problema-buscarsimetras, ignorardetalles irrelevantes y
encontrarlasabstracciones apropiadas-oDesgraciadamente,plantearunproblemaparapoder
aplicar sobre l tcnicas de bsquedaes una tarea bastante compleja y se puede considerar
comoun artequetodavarequieredeintervencinhumana.
Ademsdelproblemadelapilamientodebloques,tambinseutilizaamenudoelproblema
deldesplazamientodelaspiezasdeunpuzzleparamostrarcmosepuedenutilizarlastcnicas
debsquedaenespaciosdeestadosparaplanificarsecuenciasdeacciones.Parailustrarlastc-
nicasdebsqueda,queexaminaremosenestecaptuloyenelsiguiente,utilizaremosestetipode
problemas.Unejemplotpicoeselpuzzlede 15piezas,queconsisteenunconjuntode 15piezas
dispuestasenuntablerodecuatroporcuatro,enelquesedejaunacasillaenblancoalaquese
pueden desplazar las piezas colocadas en casillas adyacentes. El objetivo es encontrar una
secuenciademovimientosquetransformeunadisposicininicialdepiezasenunaconfiguracin
determinada.Elpuzzledeochopiezasesunaversinreducidadelproblema,enelqueslosetie-
nenochopiezasenuntablerodetresportres. Supongamosqueelobjetivodelpuzzleesmover
lascasi11as desdeunadisposicininicialarbitrariahastalaconfiguracinobjetivo,taly comose
muestraenlaFigura8.1.
115
116 117
,...
Bsquedaaciegas
Enestecaptuloyenel siguienteexaminaremosdostiposdeprocesosdebsqueda.Elprimer
D
2
tipocorrespondeaprocesosde.bsquedaenlos queno sedisponedeinformacinespecficadel
-- 8 LJ.
765
problemaparaestablecerpreferenciasdentrodelespaciodeestadosenloqueconciernealabs-
Figura8.1. quedadelcaminoalobjetivo.Estetipodeprocesos sedenominanbsquedas a ciegas. Enelotro
tipo, nos encontraremos con procesos de bsqueda que disponen de informacin especfica
Configuracininicialyobjetivoparaelproblemadelpuzzledeochopiezas.
sobreelproblema,conloquesepuedemejorarlaeficienciadelprocesodebsqueda.Estetipo
deprocesossedenominanbsquedas heursticas l.Enestecaptuloanalizaremoselprimertipo,
mientrasquelasbsquedasheursticaslasveremosenelcaptulosiguiente.
Dadoesteproblema,unadescripcinobviaquepenniterepresentarlosdistintosestadoses
unamatrizde tres portres,enlaquecadaceldacontieneunnmerodel 1al8ounsmboloque
------_......"'... ""-,
representelaceldavaca. Elestadoobjetivoes lamatrizrepresentadaenlapartederechadela
Figura 8.1. Para pasar de un estado a otro slo tenemos que desplazar una pieza a lacelda

vaca.Sinembargo,comoyahemosindicado,podemoselegirentrediferentesformasderepre-
sentarelespaciodeestados.Enelproblemadelpuzzledeochopiezas,podramoshaberconsi- LQs procedimientos de .. ..a... .openm aplicarIdQ.. disponibles a los
deradoquetenemos8x4movimientosposibles: desplazarseunacasillahaciaarriba,unahacia nf' eldO/;11!liQ.slel problema(slosabencundoes
abajo,unahacialaizquierda, unahacialaderecha,doscasillashaciaarriba... (porsupuesto, no posibleaplicarunadeterminadaaccin).EJ.DliS .. c:;sJ;:t Msqt(eda pri-
todoslos movimientossonposiblesentodos losestados).Unaformulacinmscompactaslo rtUfro en anchurg,. ungrafodeestadosexplcitomediantelaaplica-
tieneencuentacuatroposiblesmovimientos:moverlacasillalibrehacialaizquierda,haciaarri- cindelosoperadoresdisponiblesalnodoiDicia4de&pusaplicalosoperadoresdisponiblesalos
ba,hacialaderechayhaciaabajo. Elgrafoconlosestadosaccesiblesdesdeelestadoinicialque- nsxlp,inicial,yassucesivamente.C..Q.I].Q.podemosver,esteprocedi-
dadefinidodeformaimplcitaapartirdelestadoinicialydelconjuntodemovimientosposibles. mientodebsquedaactademanerauniformeapartirdelnodoinicial.Tooiendoencuentaqueen
Elconjuntode .. representacindelpuzzlede __. ..a,qa)osnodostodoslosoperadores mseficienteagruparlos
(eneste el grafodeestadospuede serdivididoendos graf.osindepen- enunafunclndenominadafitncin ..sltceson;$. CuandoapliquemosestaJuncinaun
dientes, tales que unaconfiguracin de piezas perteneciente a uno de los grafos nopuedeser .. obterutTemostodoslosnodosqueseproduciranalaplicartodoslosoperadores
alcanzadadesdeningunodelosnodosdelotrografo). adicho .. sucesoressedenominaexpansin delnodo.
ela]:igura8.2sepuedenverlosnodoscreadosporlabsquedaprimeroenanchuraparel
problemadel puzzledeochopiezas.Tambinsepuedenapreciarlos nodos inicial yobjetivoao;;
comoel ordenenelque se hanexpandidolosnodos, indicadoporel nmeroqueestprximoa
cadanodo.Losnodosqueestnsituadosalamismaprofundidadsevanexpandiendosegnunorden
Comohemosvistoenelprrafoanterior,describiendoelestadoinicialylosefectosquelasacciones
",n grf,lfQ.4e esta4s implcitQ
prefijado de antemano; paracadanodo, el ordende aplicacindelosoperadoreses el siguiente:
producensobredichoestado,obtenemosunarepresentacinimplcitadelapartedelgrafodeestados mover la celda vaca a la izquierda, arriba, a la derecha y abajo. Aunque cada movimiento es
quesepuedealcanzarapartirdelestadoinicial.Portanto,yenprincipio,esposibletransformarla reversible,enlaFigura8.2hemosomitidolosarcosquevandelos sucesoresasuspredecesores.El
representacinimplcitadelgrafoenungrafoexplcito.Parahacerlo,slohayquegenerartodoslos caminoqueconformalasolucinestmarcadoporunalneagruesamsoscura. ms"."
nodossucesoresdelnodoinicial(aplicandotodoslosposiblesoperadoresalnodoinicial)y,despus, adelante,la tienela el
volverarealizarlamismaoperacinparacadaunodelosnodossucesores.Paraaquel10sgrafosque nJiiQoofetlV: el Sin.embaIgo,elprincipalincon-
sean demao;;iado grandes para ser representados de forma explcita, el proceso de bsqueda slo venienteJeestemtodoesquerequierelage11e.1'a&!QO.)'. cuyotama-
requieretenerdeformaexplcitalapartedelespaciodeestadosnecesariaparacalcularelcamino
o ;obj"tiYJ:UlleUQspt'ofU!1dg.
haciaelobjetivo.Elprocesoterminacuandosehaencontradouncaminoaceptablealnodoobjetivo. Unavariantede fs la 1959],enlaquese
Formalmente,podemosdecirqueexistentreselementosbsicosenlarepresentacilli.QlJ.l.1.- vanexpandiendolos nodosque'Hinenigualcosteen \fe.. lQ.s..nodos queestnala
citadelgrafodeestados: Siloscostesdetodoslosarcosdelgrafosonidnticos,labsquedadecos-
teuniformeequivaleaunabsquedaprimeroenanchura. labsqueda.de.coste
l... Unadescripcinpara elnodoin.iciaLEsta.descripcinestarformadaporalgu-
cOIpouncasoespecialdebsquedaheurstica,queserdescrita.en
naestructuradedatos.quenospenuitamodelarelestadoinicial.
eLstg,u1entc:!captulo.Estepequeoanlisissobrelabsquedaprimeroenanchuraylabsqueda
2. Lasfunciones.paratransformarlasdescripcionesdelosestados(querepresentanestados
decosteuniformenospuedendarunaideageneralsobrelosmtodosdebsqueda,perohabra
delmundo)enlasdescripcio!lesdelosestados lasfunciones.
queprofundizarmsenlosaspectostcnicosparacubrirloscasosenlosqueelprocesodeexpan-
Nornialmente, aestasfunciones se les En nuestrosejemplos
sinproduzcanodosqueyahansidoanalizadosporelprocesodebsqueda.Dejaremosestean-
sobreagentes, los operadoressomodelosdelosefectosdelasacciones. Cuandoapli-
lisisparaelsiguientecaptulo,unavezquetratemosprocedimientosdebsquedamsgenerales.
camosunoperadoraun nodo,segeneraunodesusnodossucesores.
3. Unacondicin de xito, quepuedeserunafuncinbooleana,queseaplicaalasdescrip-
cionesdelosestados.ounaJista.cpi!lasdescripcionesdeestadosquesecorrespondencon I Lapalabraheur(stica provienedelgriegoheuriskein, quesignificadescubrir. Delamismapalabrasederivala
objetivos. exclamacin Eureka!
118
119
""..
('
19
9
S
1 6 3 ,. 1 6 3
754 754

1 S 6
7 4

lliillJ

7 5 4
16
76
1 4 3
765

15 tItillj
[i] Hl]34 4 ,. 1
765
Nodode tltm1 I ur:tn I 1118141(
inicio
Figura8.2.
Bsquedaprimeroenanchuraparaelpuzzledeochopiezas.
, - 4,
( Bsqueda primero en profundidad o bsqueda con vuelta atrs 1
..
..
Eneste procesodebsquedase.!1!'merasIQ unsucesordel nodoencadapaso (enelprimer
\iD sucesor es'
.. osucesor,yassucesivamente.En
cadanodo setienequedejarunamarcaqueindique,encasodesernecesario,qu _
... ... , -
Bsquedaaciegas
adicionaJes.se,p,uedenutilizary evitarque
el proceso de bsquedacontine este descenso sin detenerse, se establece una profundidad
vezquesealcanceestaprofundidad lmite, labsquedadetieneelprocesode gene-
(evidentemente,estosignificaquesesuponeque almenosexisteunnodo
objetivoantesdedicholmite).Estelmitenospermitedesecharaquellaspartesdelgrafoenlas
qUJLe suponequenoencontraremosnnodoobjetivo]0suficientementecercanoalnodoini-
ciaL
.e' 0'''''''''''''
Parailustraresteejemploutilizaremoselproblemadel puzzledeochopiezasconunapro-
fundidad lmitede 5. Volveremos a utilizarlos operadores'que mueven el espacio enblanco
hacialaizquierda,arriba,aladerechayabajo,yvolveremosaomitirlosarcosquevandesdelos
sucesores a sus predecesores. En laFigura 8.3ase puede ver lageneracin de los primeros
nodos. Elnmeroqueestalaizquierdadecadanodoindicael ordenenquehasidogenerado.
Tambinsepuedenverlosnodosqueno han sidototalmenteexpandidos,indicadosconarcos
quepartendel nodo. Comopodemosverenlafigura, conelnodo 5hemosalcanzadolapro-
fundidadlmitesinhaberalcanzadoel nodoobjetivo,conloquenosvemosobligadosaretornar
a un nodo inmediatamente anteriorque todavaadmitanuevas expansiones. Ennuestrocaso,
volveramosaconsiderarelnodo4 ygenerarunnuevosucesor,elnodo6(Fig. 8.3b).Obvia-
mente,podemosdesecharel nodo5, yaquenogeneraremosmssucesoresa partirdel. Sin
embargo,conelnodo6volvemosaalcanzarlaprofundidadlmite sinllegaral nodoobjetivo,
conloqueotraveztenemosqueretornaraun nodo inmediatamentesuperiorque admitams
expansiones,esdecir, alnodo2, ygenerarun nuevo sucesor, el nodo7-desechandonueva-
menteelnodo3ytodossussucesores,yaquenovolveremosagenerarnuevossucesoresdel-o
Esteretorno al nodo2es un ejemplodevuelta atrs cronolgica. Siguiendoporestecamino,
volveremosaalcanzarlaprofundidadlmite(grafodelaFig. 8.3c)sinalcanzarelnodoobjeti-
vo, conloque habrquegenerarunnuevo nodosucesordel nodo 8, quetampocoesel nodo
objetivo.Portanto,podemosdesecharel nodo8ytodossussucesoresyretornaralnodo7,vol-
viendoagenerarunnuevosucesor.EnlaFigura8.4sepuedeverelgrafoqueresultaalaplicar
esteproceso.
8
Descartadosdespus
degenerarelnodo7
(a) (b) (e)
Figura8.3.
Generacindelosprimerosnodosenlabsquedaprimeroenprofundidad.
120
Bsquedaaciegas 121
A'\
Ae A
e e e A
eA
e e e e
Profundidad Profundidad
lmite= I lmite= 2
Figora8.4.
Figura8.5.
Grafoobtenidounavezquesehaalcanzadoelobjetivoporlabsquedaprimeroenprofundidad.
Etapasdelabsquedapordescensoiterativo.
paralabsquedaprimeroenprqt).mdidadslosenecesita
Paracalcularelnmerototaldenodosexpandidosenelprocesodedescensoiterativo, pri-
narlapartedelrboldebsquedaquecontieneelcaminoqueest .. de
meronecesitamossaberelnmerodenodosexpandidosenunabsquedaprimeroenprofundidad
lastrazasele losflodQJLQ.qe.JlQ h<U1 sid,ototalmenteexpandidos.p()ftanto,elcosteenmemoriade
completahastaelnivelj,quevienedadoporlasiguienteexpresin:
defnona!jnea! lmite. Sinembargo,unadesv1irifiiji:Je:::este.
efnodoobjetivo,nopodemos
b
j
+
1
-1
elJlooojlbje1lYM!JYI!.QQ.a O...tra..desventajll tend:f;--
mosqueexplorarunagranpartedel grafodeestados,inclusoparaencontrarunnodoobjetivo b-l
queestapocaprofundidadyqueseadescendientede unodelos ltimosnodos enserexpan:
dido. o. . Enelpeorcaso,labsquedapordescensoiterativocompletartodaslasbsquedasprimero
enprofundidadvariandolaprofundidadlmiteentre 1 yd. Teniendoencuentaesto, elnmero
totaldenodosexpandidosvendrdadopor:
000 Descenso iterativo
b
j 1
::: + -1
UnatcnicaqueseapmvechadelosrequisitoslinealesdememoriaJklabsqueaa.,primern...en...
j=O b-l
profundidad,yque eseLmscetcal100 al nodQ
(siemprey cuandostepuedaserencontrado), es ,1 descensojteratillo [Korf, 1985;Stickely
Tyson, 1985]. iterativoconsisteen ::: -
)=0
bsquedasprimeroenprofundidad,. lmite,..hastaque
seeucnentreelnodoobjetivo.EnlaFigura8.5 sepuedeapreciarcmooperaeldescensoite.
=_1[b(bd+l-l)-(d+1)]
rativo.
b-l b-l
Sorprendentemente,elnmerodenodosexpandidosporesteprocesonoesmuchomayorque
eneJ.casodelabsquedaprimeroenanchura.Parademostrarestaafirmacin,vamosacalcular
Simplificandolaexpresinanterior,lacotamximaparaelnmerototaldenodosexpandi-
elnmemdenodosexpandidosparaelpeorcaso,considerandounrboldebsquedaconunfac-
dos enundescensoiterativoparaunnodoobjetivodepmfundidaddes:
torderamificacinuniformedebyconelnodoobjetivoms cercanoalarazsituadoaunapro-
fundidad d, siendo, adems, el ltimo generado a esaprofundidad. Conestos datos, unacota
2
b
d
+ - 2b- bd+ d+ 1
N
id
mximaparaelnmerototaldenodosexpandidosporlabsquedaprimeroenanchuraes:
= (b-l)2
1
::: 1+b +b
2
+... +b
d
Teniendoencuentaqueparavaloresgrandesded elcocienteN/N
bf
tiendeab/(b 1),con-
b 1
siderandounfactorderamificacinde 10Yquelosnodosobjetivosseanprofundos,elprocesode
e e
Profundidad
limite= 3
Profundidad
lmite= 4
122 123 Inteligenciaartificial. Unanuevasntesis
descensoiterativosloexpandirun 11 por100msdenodosqueenelcasodeunabsqueda
primeroenanchura.
Otratcnicaqueestrelacionadaconstaeslabsquedaporrecorrido iterativo en anchura,
queresultabastantetil enaquellosproblemasconunnmeroconsiderabledenodosobjetivos.
Unadescripcindeestemtodosepuedeexaminaren[GinsbergyHarvey, 1992,yHarvey, 1994].
La vuelta atrs cronolgica ha sido objeto de varias mejoras entre las que podemos citar la
vuelta atrs dirigida por dependencias [StallmanySussman, 1977],elsalto hacia atrs [Gasch-
nig, 1979Jylavuelta atrs dinmica [Ginsberg, 1993].Enesteltimoartculosepuedeencon-
trarunestudiocomparativodeestosmtodos,enelquequedandemanifiestolasventajasdela
vueltaatrsdinmica.Esteconjuntodemejorasdelesquemaclsicodevueltaatrsesmuyuti-
lizadoenlosproblemasdesatisfaccinderestricciones,quesernanalizadosenelCaptulo 1 L
8.1. Eneldenominadoproblemadelasjarrasdeaguasedisponededosjarras,unade3litros,
alaquellamaremostres, yotrade4litros,alaquellamaremoscuatro. Inicialmente,ambasjarras
estnvacas.Disponemosdeungrifo,G,delcualpodemoscogeraguaparallenarlasjarras,ade-
msdeundesage,D, quepodemosutilizarparavaciar(totaloparcialmente)lasjarras,ysepue-
depasaraguadeunajarraaotra. Nodisponemosdeningndispositivopararealizarmedidas.El
objetivodelproblemaesencontrarunconjuntodeoperacionesqueconsigandejarexactamente
2litrosdeaguaenlajarracuatro. [Existeunasolucin: a) llenarlajarratres conelaguadelgri-
fo; b) llenarlajarracuatro conelaguaquehayenlajarratres; c)volverallenarlajarratres con
elaguadelgrifo; ti) rellenarlajarracuatro conelaguade latres; e) vaciarlajarracuatro, y
1) volver a llenar lajarracuatro con el agua que queda en lajarratres, que es exactamente
2 litros].Sepideque:
L Definaunespaciodeestadospararesolverelproblemamediante unprocedimiento de
bsqueda:
a. Definaladescripcinicnicadelosestadosmedianteunaestructuradedatos.
b. Definalacondicindexitosobredichaestructuradedatos.
c. Definaelconjuntodeoperadoresquesepuedenaplicaracadaestado,dandounaexpli-
cacindetalladadelosefectosdelosmismos.
2. Dibujeungrafocon todos losnodos distintos queestna unadistanciadetres movi-
mientosdelnodoinicial,etiquetecadanodoconelestadoquerepresentaycadaarcocon
eloperadoraplicado.Dibujeelcaminohacialasolucin.
8.2. Listeel ordenenelquesonvisitadoslosnodosdel rbol delafiguraparacadaunadelas
siguientesestrategiasdebsqueda(eligiendosiempreelnodomsalaizquierda):
L Bsquedaprimeroenprofundidad.
2. Descensoiterativo(aumentandoen11aprofundidadlmiteencadaiteracin).
3. Bsquedaprimeroenanchura.
Bsquedaaciegas
13
5
8.3. Consideremosunrbolfinitodeprofundidadd yconunfactorderamificacinb (unrbol
queslotieneelnodoraztieneprofundidadO; unrbolcompuestoporel nodorazysusb suce-
soresdirectostieneprofundidad1,etc.).Supongamosqueelnodoobjetivomenosprofundoest
aunaprofundidadg d.
1. Culeselnmeromnimo denodosgeneradosporlabsqueda primero en profundidad
conunaprofundidadlmited? Yelmximo?
2. Culeselnmeromnimo denodosgeneradosporlabsqueda primero en anchura? Y
elmximo?
3. Culeselnmeromnimo denodosgeneradosporeldescenso iterativo? Yelmximo?
(considereque empezamosconunaprofundidadlmite inicial de 1 y lavamos incre-
mentandounaunidadencadaiteracin).
8.4. Supongamosque mediante la bsqueda primero en anchura se puedan generar 10.000
nodosporsegundoyqueparaalmacenarcadanodosonnecesarios 100bytes. Conestosdatos
culessonlosrequisitosdetiempoy memoriaparaunabsquedaprimeroenanchuraaplicada
aunrboldebsquedadeprofundidadd yunfactorderamificacinde5?Muestrelosresultados
delanlisisenunatabla(sepuedenusarnmerosaproximadoscuandoresultemsfcilexpresar
eltiempoenhoras, das, meses,aos,etc.)
8.5. Supongamos que estamos aplicando un procedimiento de bsqueda sobre un rbol con
factorderamificacin5.Sinembargo,enrealidadnosabemosqueestamostrabajandosobreun
rbol,conloquetenemosquecomprobarcadanuevoestadoparaversihemosalcanzadounesta-
doyaanalizado.Cuntascomprobacionestendremosquehacerenunrboldebsquedadepro-
fundidadd?
Bsqueda
heurstica
Funciones de evaluacin
Losprocesosdebsquedaquevamosa sonparecidosalabsquedapri-
de bsquedade
nodosque, de acuerdo con cierta
haciaelobje-

Laidea.?sicaeslasiguiente:
una funcin deevaluas!2!!
decIdir cul es el mejor noao para (ms adela!lte se comprender porqu
Adop-
__ tomar msprQHiete-
liRamaciRreal definidasobrelasdescr!PciQ.O!.S...de.loestades.
. el llQda n parael qUfU'e obtengaelmenor laselec-
ciEden2dos siguenill.llln patrD dwnido(alo
"""',sideruemos expansin sucesores).
/3. 'SeternrlnarelprOCesocudoelnodoaexpandirseaunnodo
\.,.,. ___ __.___ . ,_u...._"..
Enlamayoradeloscasos,siempreesposibleencontrarunabuenafuncindeevaluacinpara
labsquedaprimeroelmejor. Porejemplo,enelproblemadel puzzledeochopiezaspodemos
usarcomomedidadelo buenoqueesunestadoelnmerodefichasqueestndescolocadas:
=nmerodefichas descolocadas(comparadasconlaconfiguracinobjetivo)
Siusamosestafuncinheursticaenelprocedimientodebsquedaqueacabamosdedefinir,
obtendremosel grafodelaFigura9.1.Elnmerosituadocercadecadanodoindicaelvalordela
funcin heursticaendichonodo.
12S
126
127

7 I 4
4 65

Bsquedaheurstica Inteligenciaartificial.Unanuevasntesis
rm:m
5tTIill

I 4
4 765
Haciaelobjetivo

Haciamsexploracionesintiles
Figura9.1.
Unposibleresultadodeunprocedimientodebsquedaheurstica.
Enesteejemplosepuedeverlanecesidaddeinfluirenelprocesodebsquedaparaforzarla
..
tirnistanoslleve orcaminospocoprometedores).Conestefin, seaa-
deunfactordeR!:,0fundidad ala nClOn ;'oo'l'Oqeanorase'detiiie
doi'ltte'g(ljsunaestlmacl " lQngi,t}.!9..Q[cait- ,. 1 -
CO ,o es h(n) es el aligualqueen
elpITaiOanterior,h(n) eselnmerode fichas descolocadas (comparadasconlaconfiguracin
objetivo)yg(n) eslaprofundidaddelnodon enelgrafodebsqueda,elprocesodebsquedapro-
ducir el grafo de la Figura 9.2 (los nmeros que estn prximos a los nodos equivalen a la
2 1 4
l
3
3+3765

1 4
2+4765
mi
l
I 8 4
3+4765
Figura9.2.
Bsquedaheursticautilizandolafuncin !(n) =g(n) +h(n).
sumag(n) +h(n. Comosepuedever, enestecasolabsquedadelnodoobjetivoesmsdirecta
(exceptuandoelnodomarcadoconuncrculo).
Estosejemplosnos planteandos preguntas importantes. Primera,cmo seleccionamosla
funcindeevaluacinquegueelprocesodebsquedaprimeroelmejor?Segunda,culesson
laspropiedadesdelabsquedaprimeroelmejor?,encuentrasiemprebuenoscaminoshaciael
objetivo?Alfinaldeestecaptulodaremosalgunosconsejossobrelaeleccindelasfuncionesde
evaluacin,yenelCaptulo1 Oanalizaremosalgunosmtodosparaaprenderdefonnaautomtica
funciones de evaluacin. Eneste captuloharemos unapresentacin ms fonnal de distintos
aspectosdelabsquedaprimeroelmejor. Empezaremosnuestroanlisispresentandounalgo-
ritmogenricodebsquedaengrafos,delcuallabsquedaprimeroelmejoresuncasoespecial
(paraunanlisismsprofundosobrelabsquedaheursticasepuedenverlosartculoscitadosy
elexcelentelibroescritoporPearl[Pearl, 1984]).
de bsqueda en f!mfos\
Paraquenuestraexplicacinsobrelosprocedimientosheursticosdebsquedaseamsprecisa,
genrico de bsqueda en grafos que permita que sea el
usuat'.Qquien ()rdeI!delabsqueda(heursticaociega).Llamaremosaestealgoritmo

BUSQUEDA_EN_GRAFOS:
6>. unrbolde TI..-qU.e. sloestfonnadopo.r. elnodoin.icialno. Insertenoen
'- listaWiiiid A.B m ..... .,',
2. Creeuna
3.
vaca, .'"
4. elprimernodode

5. Silileselnodo devue!yJ,
Qtlfi:!ljgpor dI:": 1} anoeRel arcosse
creanenelpaso6).
6. nado'\u1y elcC!njlllltode los.,elementosde
!il{ elrbolTr, creandolosarcas.correspoQdientesentren ycada
unodelosnodo&,de!M.
-.....-.... -"".-,.- " ..... "
7. Reordenelali=. lE.RTOS'y;.le acuerdocQ.n algn.esquema ta
'ifaru['-"""
'ltm,., "
( 8. Vayaal

>-"""."
Podemosusarestealgoritmoparaimplementarlabsquedaprimeroelmejor, primeroen
hara falt.a
colocarlosnuevosliOdos enentrar,pn-
mi'o erfsalirfy-O"feofaenarlos Para .nuevos
nodps deben sercolocados al principIo de la ltsla:Jf1l/ERTOp (polticaLIFO: ultImo en
Enla (tambindenominada heu-
rstica),lalista seti!%ne quereordenardeacuerdoaunafuncindeevaluaCInheu-
rstica. """-fiO"...... -'_UL;... ....""''''__...,''' ......... __
......
128
129
--""'-
.':.::=-:::::----=--"
-9.2.1. Algoritmo A *
VamosaRarticulariz.arel algw:ilm0 BUSQUEDA EN_GRAFOSparaimplementarunalgoritmo
de bsqueda nooosdelalista enorden
.tal ycomosedefiniparaelejemplodelpuzzle'deOcho
piezas.Aestayersin<ielalgQritmoBUSQUEDA_EN_GRAFOSladenominaremog'1l1'gmttmo
veremos ms adelante, podremos definir funciones heursticas que hagan que el
A* secomportecomolabsquedaprimeroenanchurao ladecosteuniforme, Para
definirlafamiliadefunciones1quepodemosusar, necesitamosintroducirunanotacinadicio-
nal:
Seah(n) =elcostereal delcaminodemnimocoste ueuneelnodon yunnodoobjetivo
(para'tmtoslosnOGoso lVOS y parato os ospOSl lescammosentrenY-aoaunode ellos).
Seagen) =elcoste !lnimocosteQue nodQn.
Entc)fl'ces,Jtm- gen) + h(n) representaelcostedelcaminodemnimocost a orel
nodon; entreelrrod.\':! noY. qulllDn tene7eCOORta-qt.te"j{no):;.Jl\nJ"yestacan-
tidad!n<lica.elcoste elnodonoy unnodoobjetivo.
Paracadanodon definiremosdosfunciones: h(n) (elfactorheurstico)serunaestimacinde
h(n), yg(n) (elfactoraeprofdidd)'sretcostedelcaminodemnimocosteparaalcanzarel
nodon,quehastaelmomentQhayaencontradelalgoritmoA'*; De est;!fpIDla. jfocIn heu-
para.elalg(}rltmoA* 'serJ(n);;::gen) + h(n). Esfcilmentetlemostrable
que,si Wlusfpqna iD neo Enla
Figura9.3sepu erunaexplicacingrficadeestasdefiniciones.
Nodoinicial,no (no) = costedelcaminomnimo
(ptimo)alobjetivo

Costedelarco
5
7
2/
6
+ h(n) = costedelcamino
/\
demnimocosteque
pasaporelnodon
= costedelmejorcaminoentreno y n
(= 8cnelejcmplo)
h(n) = costedelcaminoptimoden alobjeto
J, g, hsonestimacionesdcf,g, h, respectivamente
J=g+h
Figura9.3.
Notacinusadaenlabsquedaheurstica.
, ... 4"
Bsquedaheurstica
EnlaFigura9.2sepuedeverelresultadodeaplicarelalgoritmoA* alproblemadel puzzle
deochopiezas.Enestecaso, hemosconsideradoqueelcostede todoslos arcos es elmismoe
igualalaunidad.Sinembargo,existeunapequeacomplicacinquehemospasadoporaltoen
nuestradefinicindelalgoritmoA*: qupasarasinuestrografoimplcitodebsquedanofue-
seunrbol?,esdecir,queexistieramsdeunasecuenciadeaccionesquenoscondujeranal mis-
moestado,partiendosiempredelestadoinicial.Porejemplo,resultaobvioqueelgrafoimplci-
toparael problemadelpuzzledeochopiezasnoesunrbol,yaquelasaccionessonreversibles
--cadasucesordeunnodon tieneasuvezan comosucesor-oComopodemosver, enelrbol
debsquedaparaelpuzzledeochopiezashemosignoradoestetipodearcos. Sinembargo,en
estecaso,estetipodearcosesfcildeignorar, cooos; incluir entresus
sucesores. hechoslohay
que el 6enlos,
6. Expandaelood,Q.n.y nodopadreden (siaparece).
..:r..,:.{:.()mo.. de n aadiendo los arcos

Si, ciclos ms grandes, el paso 6 se tiene que
lasiguientemanera:
6. Expandaelnodon y .fM, ascendientesden, si
en.TrC;0II10 sucesoresden adiendolos
arcoscorrespondientes.
deciclos" necesi.tamosc()!l;lprobarsilaestructurade
datosquerepresenta den a dedatosquerepre-
..silasestructuras.de ,datossoncomplejas.estepasopuedeincrementar
lacomplejidad<ielalgoritmo.
modificacindelpaso6 seevitaqueelprocesodebsquedacaigaenciclosduran-
tesu <f'unnodoobjetivo.Perotodavaexistelaposibilidaddevisitarelmismoestado
atra'\'esdediferentescaminos.Unaformabastantesimpledetrataresteproblemaesignorarlo;es
decir,elalgoritmonocompruebasilosnodosdefMya existenenlaslistasABIERTOS oCERRA-
DOS. Deestaforma,elalgoritmonoserconscientedelaposibilidaddealcanzarelmismonodo
atravsdediferentescaminosyaparecerrepetidoenTr tantasvecescomocaminoshacialdes-
cubraelalgoritmo. Estosnodosestarnrepresentadosporlamismaestructuradedatosen Tr y
sll.1:>rbQles idnticoscolganoodeellos;esdecir,el repetirelmismoesfuerzo
cuandoenrealidadnoesnecesario.Msadelante unaseriedepropie-
dadeS'bastantes A* unnodopor asegurarque
aC:ibroe elclY!liQQ. a.Lnodo.parael.ciaIla.runcil'!.!alcanzaelYl.!lQfmnimo.
Para evitar duplicar el esfuerzo de bsqueda cuandof no cumpla esas propiedades (que
sernenunciadasmsadelante),hayquerealizaralgunasmodificacionesalalgoritmoA*. Dado
quelabsquedapuedealcanzarunmismonodopordiferentescaminos,al algoritmoA* producir
ungrafodebsqueda,alquellantaremosG. Geslaestructuraenlaquesealmacenarnlosnodos
ylosarcosamedidaqueelalgoritmoA* losvayagenerando.ElalgoritmoA* tambinmantiene
unrboldebsqueda,quellamaremosTr, queserunsubgrafodeGenelqueestarnrepresen-
tadosloscaminosdemnimocosteacadaunodelosnodosdel grafoquesehayanencontradohas-
taelmomento,EnlaFigura9.4sepuedeverunejemplodeungrafoconarcosdecosteunitario.
EnlaFigura9.4asepuedeverelresultadodelosprimerospasosdelprocesodebsqueda,Elrbol
debsquedaestindicadoporlosarcosmsoscuros.Losarcosgrisespertenecenal grafode bs-
queda,peronoalrbol.Losarcososcurosrepresentanloscaminosde mnimocostealosnodos
130
131
4.4(.
4R
(a) (b)
Figura9.4.
Grafodebsqueday rboldebsquedaproducidosporunprocedimientodebsqueda.
delgrafodebsqueda.ComosepuedeverenlaFigura9.4a,elprocesodebsquedahaalcanza-
doelnodo4atravsdedoscaminosdiferentes.Losdoscaminosestnrepresentadosenelgrafo,
peroslounodeellosestpresenteenelrbol.Tenemosquemantenerelgrafodebsqueda,ya
que,amedidaqueelprocesodebsquedaavance, sepuedenencontrarcaminosmscortosqoo
puedenutilizaralgunosdelosarcosquepertenezcanalgrafo,peronoalrboL Porejemplo,enla
Figura9.4b,laexpansindelnodo 1hacequeseencuentreuncaminomscortoalnodo2ysus
descendientes(incluidoelnodo4),con10quehayquemodificarelrboldebsqueda.
Paradarunavisinmscompleta,presentaremoslaversindelalgoritmoA* quemantiene
elgrafodebsqueda. Sinembargo,enlamayorpartedeloscasos,novamosanecesitarestaver-
sin,yaque,normalmente,podremosimponerciertascondicionesalafuncin!paragarantizar
quecuandoA* expandaunnodo,yahayaencontradoelcaminodemnimocosteadichonodo.

,:r9creeungrafodebsquedaG,queinicialmenteslocontendrel nodoinicialno' Inserte
noenlalistaABIERTOS.
t;)CreelalistaCERRADOS, inicialmentevaca.
Si la listaABIERTOS estvaca, el algoritmo terminaconfallo, yaque no habremos
encontradoningnnodoobjetivo.
(j ExtraigaelprimernododelalistaABIERTOS einsrteloenlalistaCERRADOS. Aeste
nodolollamaremosn.
elnodon eselnodoobjetivo,elalgoritmoterminaconxito,ylasolucinseobtiene
siguien'doelamiiio desdeelriOdo 1fal nodono' atravsdelospunterosdel
punterosdefinenelrboldebsqueOay"son'creao6senelpaso7).
(])Exe....anda elpod() Yl el <::9njllnto fU con todos sus sucesores, siempre y cuando
n enelgrafoG. IncorporeloselementosdefU como
o n enelgrafoG.
())E;staplezcaun n desdeaquelloselementosdefU quetodava visi-
tadosenelgrafoG (esdecir,quenoestnnienlalistaABIERTOS nienlalistaCERRA-
DOS).Inserte de fU enJalistaAlJlERTOS. Pm:acada.elementodefU queya
estuviera en ABIERTOS o CERRADOS, modifique su puntero para que ste apunte al
Bsquedaheurstica
losmejorescaminosquehastaelmomentosehayanencontradohacia
porn. Pl:!IacadaelementodefU queyaestuvieseenCERRADOS, modi-
fiqQe lQs punterosde susdescendientesenel grafoG,paraque apuntenhaciaatrsalos
ms hasta.. el esosdescendientes.
8. ReordenelalistaABlERTOSsegn elordencrecientedelosvaloresdelafuncin!(los
casosenlosquelosvaloresde]seanigualesseordenansegnelordendecrecientedela
profundidaddelnodo).
9. Vaya 3.
Comosepuedever, enelpaso7seredireccionarnlospunterosdeunnodo,siempreycuan-
doelprocesodebsquedaencuentreuncaminoconmenorcostequeelindicadoporlasituacin
actualdelospunteroshaciadichonodo.Laredireccindelospunterosde losdescendientesde
losnodosqueyaestnen lalista CERRADOS permiteeconomizarlosesfuerzosrealizadosen
posteriorespasosdelprocesodebsqueda,acostadeaumentarexponencialmenteelnmerode
operaciones.Debidoaesto,estapartedelpaso7nosesueleimplementar,yaquealgunosdeestos
punterossernredireccionadosamedidaqueelprocesodebsquedaprogrese.
.'
9.2.2.
.-
earagarantizar elga
b.deben. Para las condiciones se
puedenenunciardelasiguienteforma:
1. Cadanododelgrafotieneunnmerofinito.de.sucesores_(encasodequeloshubiere).
2. Elcostedecada esIDill:Q.LQlH:J1Da.ciertacantid&d.positiva, E.
3. la <;gnjcin: en delgrafo de
bsquedase queh(n)::; h(n)"es decirJa.fun<;i9Jl.h nuncasobrestimar
.Si esto que se
denominau1\estimador optimista.\
Normalmente,esfcil encontrarunafuncinhqueseaminorantedeh. Porejemplo,enlos
problemasdeclculoderutasenungrafocuyosnodosrepresentenciudades,ladistanciaenlnea
rectaentreunaciudadylaciudadobjetivoesunacotainferiordeladistanciaptimaentreesas
mismasciudades.Enelproblemadelpuzzledeochopiezas,elnmerodepiezasdescolocadas
(respectoalaconfiguracinobjetivo)esunacotainferiordelnmerodepasosquehayquerea-
lizarparaalcanzarlaconfiguracinobjetivo.
Si se cumplen estas tres .. eL!gJmo.A* siempre
encontrarel !11. Estaafirmacinpuedeserenun-
ciadamedianteel siguienteteorema(mostraremosunanuevaversindelademostracindeeste
teorema;en[Hart;Nilsson,yRaphael, 1968]puedeverselademostracinoriginal).
Teorema9.1.
Si el grafo y la funcin hcumplen las condiciones anteriores, y comprobada la existencia de al
menos un camino con coste finito entre el nodo inicialllo y un nodo objetivo, podemos garantizar
que el algoritmo A* encontrar el camirw de coste mnimo entre el nodo inicial y un nodo objetivo.
Demostracin: basaremoslademostracindeesteteoremaenelsiguientelema.Unanlisisdeta-
lladodeestelemanospuedeayudaraobtenerunavisinintuitivadeporqupodemosgarantizar
queelalgoritmoA* vaaencontrarelcaminoptimoalasolucin.
132
133
Lema9.1.
En cualquieQ?aso de A* anteriora Sl{lgrmi!:U)cin existe en la lista ABIERIOS un noda n*.IJue
(,;,mple las . ".. ". .
l. ..
2. A* ha un camina lJ'iw.aa ..
3. . .
__ ,"'i
delJf!!'!QLpara demostrarquelasconclusionesdellemasecumplenentodoslos
pasos-de A*, bastacondemostrarque: (1) secumplenalprincipiodelalgoritmo,y (2)sisecum-
plenantesdelaexpansindeunnodo,seseguirncumpliendodespusdedichaexpansin. Este
tipodedemostracinsedenominademostracinporinduccin matemtica.
CasoBase. Al (just,ocuando parala
eX.E!!l"lQIJ),el nodon;;'estenlaJis.taABIERTOS, estenel ptimo ha
un caminopara llegar al.Adems, se. .c.umple =
henO> 5,f(n
o
)' forma,elnodo
.. ,,,,,,,,",,,,,,,, "
Pasodeinduccin. Vamosasuponerquelasconclusionesdel-lemasonvlidasdespusde
laexpansindem nodos y, usandoestasmismasconclusiones, que
tambinsonciertasdespusdelaexpansindeLIJodom +_.1. Paraunameiorcomprensindela
demostracinesconvenienteseguirlaFigura9.5.
d.e !l!J,!QQ.S...est,enla elqueA'*
haoocolltradoun..camino.ptimopartiendo llose plU:alaexpIDlsenel
pasom + 1(Fig. 9.5a),n* seguircumplienil.oJas.mismas.propiedades,conloque de
iducciisecumpleenestecaso.PoreTcntrario,siseseleccionan* paralaexpansin(Fig.9.5b),
.".
o
Caminoptimo Objetivo,n
gl
..
./
Caminoptimo Objetivo,n
gl
/. /.
-. f(ng ) =f(no) -.f(ng!) =f(no)
Objetivo,n
g2
Objetivo,n
g2
\ \

>f(n
o
) l(n,:) > f(no)
(a)A* seleccionani comoelnodom+ 1 (b)A* seleccionaelnodon* comoelnodom + 1
paralaexpansin paralaexpansin
Figura9.5.
Situacinproducidaenelmomentoenqueelnodom+ 1esseleccionadoparalaexpansin.
Bsquedaheurstica
tO<!0s sussucesoresserninsertadosenlalistaABIERTOS, y flp' pertenecer
alcaii:Doptimoalobjetivo(yaquehemossupuestoqueexisteuncaminoptimoquepasaporn*,
y,portanto,tienequecontinuarpoulgunodesussucesores ).Adems,A'* uncami-
no_ptilllQhSt11n
p
' yaquesi existierauncaminomejor,esecaminotambinseramejorcamino
haciael objetiYQ.l9o,!1.JO queentraramosencontradiccinconlahiptesis deque noexiste un
camino mejorhacia el bjetivo que el que A'* haencontrado a travs de n*). De esta forma,
podemosconsiderarquenp esel-BOclen*enelpasom + 1,afaltadedep1estrarquej(n*) f(no)'
Llegadosaestepunto.vamosademostrarahoraquelapropiedadf(n*)5, f(no) secumpleen
losm pasosantesdela labsqueda.Paracualquiernodon* queestenelcami-
no paraelqueA'* haencontradouncaminoptimoparaalcanzarlo,secum-
pleque:
Pordefinicin,
j(n*) g(n*) + h(n*) g(n*) + h(n*),
yaque 5, h(n*) 5, f(n*). Como,tambinpordefinicin,g(n*) + h(n*) =
=f(n*) 5,f(n
o
)' ten<Jremosque: ,-
" ._""..... ,._.
j(n*) 5,f(n*),
y como enelcaminoptimo,setienequef(n*) =f(no), y, portanto:
j(n*) 5,f(n*)
'-",,, ,," ,,,, ,"""""
conloqueellemaquedademostrado.
-Continuandoconlademostracindelteorema,primerodemostraremosqueA'* terminasiel
objetivoesaccesible,ydespusdemostraremosquecuandoterminehabrencontradoelcamino
ptimoalobjetivo.
A* debetenninar.. SupongamosqUt"l notermina.Enesecaso,A* continuarexpandien-
dooodosdelalistaABIERTOS demaeriiinoefinida,y..:.:....:puesto queelgrafodebsque-
datieneunfactorderaD'lfficacirtfihito.-:.tardeotemprano'expandiralgnnodoqueest
ms all de laprofundidad lmite. Si tenemos en cuenta que el coste de cada arco es
mayorqueuncierto E> O, algunosvaloresdelafuncing(y,porconsiguiente,losvalores
delafunci1Jpara terminarnporsermayoresque
f(no), loqueentraen
A'* tenninaencontrandoelcami":ol?timo Segn sededucedel algoritmo, A'* slo
puedeterminarenelpaso3(silalistaAliljfRTOS estvaca)oenelpaso5 (si sealcanza
ullorloobjetivo).Laterminacinen ungrafodebsquedafinito, sloes
posiblesiel grafonotieneningnnodoobjetivo,peroestqno ocurrir,yaque.segn
ptimoaunnodoobjetivo,con
loquedichonodotienequeexistir.PorJ:an1o.slo,110squedalaposibilidaddequeA'* ter-
mineencontrandoelnodoobjetivo.Supongamos casoqueA'* encuentrauncami-
no.no ..!lodo ng2, conf(ngz)>..[(no) sabemos
queexisteun ... .... objetivQug.:;t:n;2-ixmf(ngj)A= f(no)
(vaseFig: .. ..!!l0mentoen.que se alcanceel nodong2 secumplirquef(ngJ
f(n
g2
) > PerojustoantesdequeA'* seleccioneelnodong2 paralaexpansin, y
segnellema,debedeexistirunnodon* enlalistaABIERTOS queestenelcaminopti-
moconj(n*) Portanto,A'* no elpodon
g2
parasuexpansin,yaque
siempreseleccionaelnodoconelmenorvalordef yf(n*) 5,f(no) <f(ngJ.
134 135 Inteligencia artificiaL Una nueva sntesis
De esta forma completamos la demostracin del teorema. Un algoritwQ del 1'888&110S
ptimo al objetivo se denomina admisible. Por tan-
to, si se cumplen las tres condisiones '(Ierteorema, elalgontmo A* es admisibl:"P-Q(.:wensiQn,
nC!.,sobrestime los valores de h es una funcin admisible. En
adfante, cada vez que apliquemos el 31gontino que se cumplen las tres condi-
ciones del teorema.
Si dos versiones del algoritmo A *, YAl, se diferencian slo en que h
l
< para todos los
nodosifoooj"ivo, diremos que mejorinf011Wll1nf"Af-Sobre la base de esta defini-
cin;podemos enunciar el siguiente teorema (en [Hart, Nilsson y Raphael, 1968; Hart, Nilsson y
Raphael, 1972, y Nilsson, 1980] se puede ver una demostracin del mismo).
Teorema 9.2.
Si est mejor infonnado que al tenninar la bsqueda sobre cualquier grafo que posea un
camino desde el nodo no a un nodo objetivo, todo nodo expandido por tambin ser expan-

Se deduce as que expande al menos tantos nodos como y. por tanto, el algoritmo
mejor informado, es ms eficiente (como mnimo, sern igual de eficientes). Por tanto,
debemos buscar una funcin hcuyos valores estn lo ms cerca posible a los valores de h (para
hacer la bsqueda ms eficiente), pero sin sobrepasarlos (por admisibilidad). Por supuesto,
cuando vayamos a medir la eficiencia global del proceso de bsqueda, deberemos tener en
cuenta el coste computacional para calcular h. El algoritmo mejor infonnado ser aquel en el que
h h, pero en la mayora de los casos slo se puede obtener dicha funcin con un coste muy alto,
ya que, para ello, es necesario completar el proceso de bsqueda.
En la Figura 9.6 se pueden ver las relaciones existentes entre los distintos algoritmos de bs-
queda que hemos analizado. Con h== O tenemos la bsqueda de coste unifonne (que se expande
a lo largo de los nodos de igual coste). ConJ(n) :;:;:: g(n) = profundidad(n) tenemos la bsqueda
primero en anchura, que se expande a lo largo de los nodos que estn a la misma profundidad.
Ambos tipos de bsquedas son casos especiales del algoritmo A* (con h O), por lo que, obvia-
mente, tambin son admisibles.
9.2.3. La condicin de consistencia o monotona
Sean n
j
Yni dos nodos tales que n
j
es sucesor de ni' Decimos que h satisface la condicin de con-
sistencia, si para todo par de nodos del grafo de bsqueda se cumple:
h(n) - h(n) :::; c(n
i
, n)
donde c(n, nj) es el coste del arco que va de n a ni" Esta expresin tambin se puede escribir de
las siguientes formas:
h(n) :::; h(n) + c(n, n)
y
h(n
j
) :::; h(n
i
) - c(n, nj)
Bsqueda heurstica

A*
l=g+h
(Bsqueda primero
el mejor)
(Algoritmos de bsqueda
en grafos genricos)
Figura 9.6.
Relacin entre los distintos tipos de algoritmos de bsqueda.
Esta condicin especifica que nuestra estimacin del coste ptimo hasta un objetivo desde el
nodo ni no puede exceder de la suma del coste del arco entre ni Yni y de la estimacin del coste
ptimo desde ni hasta un nodo objetivo. Podra decirse que la condicin de consistencia impone
la condicin, bastante razonable, de que la funcin heurstica sea localmente consistente con el
coste de los arcos 1. En la Figura 9.7 podemos ver la semejanza entre la condicin de consisten-
cia y la desigualdad triangular.
n
h(n)
ni
h(n
i
)
h(n) :::;; c(ni , n) + h(n)
Figura 9.7.
Condicin de consistencia.
1 En [PearJ, 1984, pp. 82-83], se define el concepto de consistencia global de una funcin heurstica y se demues-
tra que es equivalente a la definicin que acabamos de dar de consistencia (local).
136
137
El cumplimientode lacondicin de consistenciatambin implicaque la secuenciade los
valoresdef correspondienteaunasucesindenodosexpandidosporA* esnodecreciente. Es
decir, seanni Yn
j
dosnod,?s talesquen
j
esunsucesordeni' si sesatisfacelacondicindecon-
A
sistencia, se cumplequef(n) ?f(n). Paracomenzarlademostracindeestaafirmacin,reto-
mamoslacondicindeconsistencia:
h(n) ? h(n) c(n
i
,
yleaadimoseltrminog(n
j
) enamboslados:
h(n) +gen} ? h(n) +gen) - c(n
i
, nj)
Pero,g(n) g(n
i
) +c(n
i
, n). (Podemospensarquegen) podrasermenorqueestevalor, ya
quepodramoshaberalcanzadoelnodon
j
poruncaminodemenorcostequeelquepasaporni'
pero,enestecaso,n
j
noserasucesordeni enelrboldebsqueda.)Portanto:
len) ?!(n)
Debidoaesto,avecesnosreferimosalacondicindeconsistencia(sobreh) comocondicin
de monotona (sobrej).
Lacondicinde consistencianos permiteenunciarel siguienteteorema [Hart; Nilsson, y
Raphael, 1968]:
Teorema9.3.
Si se satisface la condicin de consistencia, cada vez que A* expanda un nodo, habr encontrado
un camino ptimo al mismo. Es decir, si A* selecciona un nodo, n, para su expansin y si se
satisface la condicin de consistencia, entonces se tiene que cumplir que gen) =gen).
Demostracin: supongamosqueA * vaaexpandirunnodoabierto,n, ensubsquedadeuncami-
noptimoaunnodoobjetivodeungrafoimplcitoG. Sea =(no, nI' ...,ni' n+ l' ... , n =n
k
) una
secuenciadenodosdeGqueconstituyeuncaminoptimodeno an, yseani elltimonodode
quehasidoexpandidoporA* (Hg.9.8).Dadoqueni eselltimonodocerrado sabemosque
ni + 1 tienequeestarenlalistaABIERTOS, siendounodelosposiblescandidatosparalaexpansin.
Paratodonodo,ni' Ysusucesor,n
i
+l' pertenecientesa (uncaminoptimoan) secumpleque:
g(ni+1) +h(n
i
+) g(n
i
) +c(n
i
, nj+ 1) +h(nj +1)
? g(nj ) +h(n) si sesatisfacelacondicindeconsistencia.
no
Cerrado
) n ltimo
OAbierto
enelcamIllOoptImo
nI;
/
/1+1
CaminoptimoL \ / A* vaaexpandirel
al nodon / nodon, al queposiblemente
n hallegadoporotrocamino
Figura9.8.
GrafoutilizadoenlademostracindeTeorema9.3.
Bsquedaheurstica
Aplicandolapropiedadtransitivaalarelacin?'obtenemos:
g(n) + ? gen;) + paratodoni Yn
j
pertenecientes coni <jo
Concretamente,
gen) +h(n)? g(n
l
+
l
) +h(n+l) =!(n
l
+1)' ya.queA* haencontradouncaminoptimoan+ l'
loqueobligaaqueg(n/ + 1) =g(n + 1)
Pero,teniendoencuentaqueA* vaaexpandirelnodon enlugardelnodon/+ l' sedebecum-
plirque:
len) =gen) +h(n) 1)
yteniendoencuentaque
!(n
l
+\) gen) +h(n)
llegamosalaconclusindeque
gen) gen)
Pero,comoelclculodelafuncing implicaquegen) ? gen) (delocontrariof(n) >f(n
l
+1'
slonosquedalaposibilidad:
g(n) =gen)
conloquehemosdemostradoque,obienn + 1=n, obienyahabramosencontradootrocamino
ptimoalnodon.
Laimportanciadelacondicindeconsistenciaradicaenelhechodeque,sise satisface,A*
nuncatendrqueredireccionarlospunteros(paso7del algoritmo).Deestaforma, seconsigue
quelabsquedaenelgrafoseaequivalentealabsquedaenunrbol.
Sisecumplelacondicindeconsistencia,unaformamsintuitivadedemostrarlaadmisi-
bilidaddeA* eslasiguiente:
1. Lamonotonicidaddelafuncin!hacequeelprocesodebsquedaseexpandaenelsen-
tidodelosvalorescrecientesde!.
2. Portanto, el primernodo objetivo alcanzadoseraquel parael que!alcance su valor
mnimo.
3. Adems, paratodo nodoobj!,tivo, ng' se cumple que!(ng) =g(ng) (nos basamos en el
hecho de que si la funcin'h es consistente, nunca podr ser mayorque la funcin h
[Pearl, 1984,p. 83]).
4. Portanto,elprimernodoseleccionadoseraquelquetengaelvalormnimodeg.
5. ComoconsecuenciadelTeorema9.3,podemosafirmarquesiemprequeunnodoobjeti-
vo, n
g
, seaseleccionadoparalaexpansin,habremosencontradouncaminoptimoal;
esdecir,g(ng) =g(ng)'
6. Portanto,cuandoA* seleccioneelprimernodoobjetivoparalaexpansin,habrencon-
tradouncaminoptimoalmismo.
Existenmuchasfuncionesheursticasquesatisfacenlacondicindeconsistencia.Porejem-
plo, lafuncin heursticaque definamos parael problema del puzzle de ocho piezas (h(n) =
nmerodepiezasdescolocadas)satisfacelacondicindeconsistencia.Enaquelloscasosenlos
quelafuncinheursticanoseaconsistente,perosseaadmisible,podemosirmodificndolade
forma dinmicaduranteel procesodebsquedaparaque cumplalacondicindeconsistencia
(esta idea fue propuesta por 1984]). Para ello, en cada paso del algoritmo A*
---
138
139
debemoscomprobarlosvaloresdehparalossucesoresdelnodon queacabadeserexpandido.
Sialgunosdeestosvaloresdehesmenorqueh(n),menosel costedelarcoquevadenal suce-
sorcorrespondiente,tendramosque ajustarlos valoresdeh(duranteelprocesodebsqueda)
paraqueseaigualah(n),menoselcostedelcorrespondientearco(hayquetenerencuentaquees
posiblequeunnododelalistaCERRADOS,cuyovalordehhayasidoajustadodeestaforma,
tengaqueserreinsertadoenlalistaABIERTOS).Sedejaallectorlademostracindequeestetipo
deajustehacequeelalgoritmoseaadmisible.
9.2.4. DescensoiterativoA *
En el Captulo 8, indicbamos que los requisitos de memoria para labsqueda primero en
anchuracrecandeformaexponencialrespectoalaprofundidaddelobjetivoenelespaciodebs-
queda.Losprocedimientosdebsquedaheursticatambinpresentanesteinconveniente,aunque
graciasalautilizacindebuenasfunciones heursticassepuedereducirelfactorderamificacin.
Paraevitarquelamemoriacrezcadeformaexponencial,seintrodujoelprocedimientodeldes-
censoiterativo,quenospermiteencontrarloscaminosconcostesmnimosconlosrequisitosde
memoriacreciendolinealmenteconlaprofundidaddelobjetivo.El delJ,'VCUI.o. iterativo
A*(DIA*),propuestopor[Korf, 1985],consiguebeneficiossimilaresenlabsquedaheuriSi'iCl;'
qesonmejoradosensuversinparalela[Powley;Ferguson,yKorf, 1993].
Elmtodofunci0lladeunamaneramuyparecidaaldescensoiterativoconvencional,yaquese
basaehlaejecuCi-CI-sucesivasb6squedaspnmeroenpilUwaao:Enla primerabsquedahay,-
que costedecorte,queenprincipioser}(no)=g(1!J + h(no) h(no)'dondenoesel
nodoini:Comoyadeberamossaber.el costedeuncaminoptimoalobjetivD_.puedeJlegaJ;Ji
igualaraestcostedecorte(serigualsisecumplequeh(no) =h(no),peronuncapuedesermenor,
yaque vez establecido elcoste de corte, empezaramos a n9dos
siguiendoelprocedimientoprimeroenprofundidrui,realizandovueltaatrssiemprequeelvalor}
enan-nodo-sueesordun nodoexpandidosobrepasefcostedecorte,Siesta en
profundidadterminaenunnodoobjetivo,habremosencontradoelcaminoconmnimocosteal
objetivo. Sinoseencuentraunnodoobjetivo,estaramosenelcasodequeelcostedelcamllo
ptili.Otienequesermayorqueelcostedecorte.Portanto,incrementaremoselvalordelcostede..,
corteyrepetiremoslabsquedaprimeroenprofundidad.Culeselsiguientevalorparaelcoste
del'caminoptimo?Larespuestaesbastantesimple,yaquedebeserigualalmnimovalorde}en
losnodosvisitados(peroquenofueronexpandidos)enlaanterioriteracin.Adems,elnodocon
elvalormnimo}tienequeestarenelcaminoptimoalobjetivo(sabiendoquenoexisteuncami-
no ptimo conun coste igual al anterior coste de corte). Este valor mnimo de}se utilizar
comoelnuevocostedecorteenlasiguienteiteracin.Intuitivamente,esfcilmentedemostrable
queelDIA* siempreencuentraelcaminoptimoal objetivo.(En[Korf, 1985, 1993],sepuede
examinarlademostracinformaldeestaafirmacin.Enelltimodeestostrabajos, [Korf, 1993],
seanalizanlaslimitacionesdeldescensocuandonosecumplelacondicindemonotonaysepre-
sentaunalgoritmoalternativodenominadobsquedaprimeroelmejorrecursiva.)
DIA* notienequerepetirlasexpansionesdelosnodos(comoenelcasodeldescensoitera-
tivo convencional), pero existen intercambios potenciales involucrados en los requisitos de
memoriareducidaylaeficienciadelabsquedadelprimeroenprofundidad(encomparacincon
labsquedaprimeroenanchura).Pero,obsrvesequesloqueocurreenelcasodequetodoslos
valoresde/ seandiferentesparacadanodoenelespaciodebsqueda----elnmerodeiteraciones
puedeserigualalnmerodenodosquetenganvaloresde/inferioresal delcostedelcaminopti-
mo-.(Existenmodosdemejorarelproblemadedejaraunladolaadmisibilidad.Dejaremosal
lectorquededuzcacmodeberahacerse)
-
Bsquedaheurstica
9.2.5. el-mejorrecursiva'
...
Korf [Korf, 1993] propuso un mtodo de bsqueda, bsquedaprimero elmejorrecursiva
(BPMR)conuncostedememoria elcontrario,
se procesoBPMRcalculalosvaloresde
/,detodossussucesoresyrecalculalosvaloresde/enelpropiony entodossusascendientesen
elibofdebsqueda.'ESufpi'O::esodeft!evaluacinsedenominapropagacininversadelosvalo-
res de}, y funciona de la siguiente manera: el valor de propagacin para un sucesordeun
nodoqueacabadeserexpandidoessimplementeelvalor}dedichosucesor.
gacin,](m),deunnodomdelrboldebsquedaquetienecomosucesoreslosnodosmies:
}(m) min}(m)
mi
donde}(m)eselvalordepropagacindelnodom,.
SiQllOdelossucesoresdelnodon (queacabadeserexpandido) elmenorvalorde
} serelegido expansin, elprocesoconlaexpansin
deesesucesor. Si,porelcontrario,l nodode_lalistaABIERTOSquepresentaelmenorvalorde
}.n', noessucesorde n,elalgoritmoretrocedehastael ascendientecomnan yn',quedenota-
remospork, conelmenorvalordel Seak
n
elnodosucesordek queestenelcaminoan. El
algoritmo BPMR eliminarel subrbol conraz k
n
insertark
n
enlalistaABIERTOS,con un
valorde}igualasuvalordepropagacin,ylabsquedacontinuarpordebajodelnodoABIER-
TOSn',seleccionandoparalaexpansinelnodoconelmenorvalordel
EnlaFigura9.9seexponegrficamentelaideaprincipaldeestealgoritmo.Entodomomen-
to,elrboldebsquedaestarformadoporunnicocaminodenodos,ademsdetodoslosher-
manosdedichosnodos.Portanto,losrequisitosdememoriacrecenlinealmenteconlalongituddel
mejor camino explorado hasta el momento. Todos los nodos extremos pertenecen a la lista
ABIERTOS,ytodoslosnodosdelrboldebsquedatienenasociadosvalorespropagadosde}.
En[Korf, 1996],sehaceunanlisisdeotrosmtodosdebsquedaeficientesrespectoalos
requisitosdememoria.
Nodo _____ s
s
inicio Valorespropagadosde]
17
O
'" 1
11
""

/
16
11
14
15
18
(a)BPMR acabadeexpandirelnodon,
peronohapropagadolosvalores
] desussucesores
Figura9.9.
Bsquedaprimeroelmejorrecursiva.
0
15
o
(b)Sehanpropagadolosvaloresde],se
hadescargadoelsubrboldebajodek
n
ylabsquedacontinadebajodelnodon'
Funciones heursticas y eficiencia del proceso debsqueda
Laseleccindelafuncinheursticaescrucialparadeterminarlaeficienciadel algoritmoA*. El
usodeh== Onosaseguralaadmisibilidaddelmtodo,peronosconducehaciaunabsquedade
costeuniforme,que,porlogeneral,resultaineficiente.Haciendohigualaunacotainferiordeh
lomsaltaposible,seexpandirlamenorcantidaddenodoscompatibleconelmantenimientode
laadmisibilidad.Porejemplo,enelproblemadelpuzzledeochopiezas,lafuncinh(n) = W(n)
(dondeW(n) eselnmerodepiezasdescolocadas)esunacotainferiordeh(n), perononospro-
porcionaunabuenaestimacindeladificultad(entrminosdelnmerodepasosnecesariospara
alcanzarelobjetivo)deunadeterminadaconfiguracindepiezas.Unaestimacinmejoreslafun-
cinh(n) =P(n), dondeP(n) Cada piezaasuposicin
correcta(ignorandolaspiezasqueintervienenenlosmovimientos).
-EnloscomienzosdelalA,[Newell;Shaw, ySimon, 1959,yNewell, 1964] sugirieroneluso
demodelossimplificadosparaconstruirplanesquedirigieranel procesodebsqueda. [Gasch-
nig, 1979]y[pearl, 1984,Cap.4J aplicaronideassimilaresalproblemadelabsquedadebuenas
funcionesheursticas. Porejemplo,podemosrelajarlascondicionesdelproblemadepuzzlede
ochopiezaspermitiendomovimientosdepiezasmenosrestrictivos. Sipermitisemosquelaspie-
zas se movieran directamente (en un solo paso) a su lugar correcto, entonces el nmero de
pasosquehayquedarparaalcanzarel objetivoseraexactamenteelnmerodepiezasdescolo-
cadas,W(n). Unmodelomenossimplificado(yportantomejor)permitemoverlaspiezasauna
celda adyacente aunque sta ya est ocupada porotrapieza. En este modelo, el nmero de
pasoshastaelobjetivoesigualalasumadelasdistanciasdecadapiezaa suposicincorrecta,
P(n). Estosmodelosnosmuestrancmounagentepuedecalculardeformaautomticalasfun-
cionesh, alasquenosotroshemosllegadointuitivamente.Pearlnosdemuestraquepodramos
haber calculado una funcin h sensiblemente mejor que W(n) usando un modelo en el que
pudisemosintercambiarunapiezaconlacasillavacaenunsolomovimiento. Enotromodelo
menossimple,slosepuedemoverunapiezahasta]aceldavacaalolargodeceldasadyacen-
tes--contandocadaposicinalolargodelatrayectoriacomounmovimiento.
Elusodeladistanciaeucldea(enlnearecta)comofuncinhenlosproblemasdenavega-
cinenmapasdecarreterastambinsepuedeexplicarpormediodemodelossimplificados.En
vezdetenerqueviajarporlascarreteras, un viajero, enunmodelosimplificado,podratele-
transportarsedirectamenteentrelasciudadesalolargodelalnearectaquelasune.Dadoque
lassolucionesenlosmodelossimplificadosnuncasonmscostosasquelassolucionesdelpro-
blemaoriginal, lasfunciones h seleccionadas deestaforma son siempre admisibles. Adems,
resultaquetambinsonconsistentes,conloquelosalgoritmosquelasutilizannotienenquevol-
veravisitarnodosexpandidosconanterioridad.
Enlaseleccindeunafuncinhhayquetenerencuentaelesfuerzoqueimplicasuclculo.
Cuantomenossimplificadoestelmodelo,mejorserlafuncin heurstica-aunque,normal-
mente,seamsdifcildecalcular-oElmnimoabsolutodelnmerodeexpansionesdenodosse
consigueconunafuncinheursticaqueseaigualah, peroelclculodedichafuncinrequiere
laresolucincompletadelproblemaoriginal.Portanto,tendremosquellegarauncompromiso
entrelosbeneficiosqueseobtienenconunafuncinhprecisayelcostedesuclculo.
A menudo, se puede mejorar el rendimiento de labsqueda a costa de la admisibilidad
usandoalgunafuncinhquenoseacotainferiordeh; esdecir,puedesermsfcilencontrarun
caminonoptimodeloque seraencontrarel ptimo.Adems, unafuncinhquenoseacota
inferiordeh puedesermsfcildecalcularqueunaqueslosea. Enestoscasos,podemosmejo-
rardosaspectosdelaeficiencia: sepuedereducirelnmerototaldenodosexpandidos(acostade
laadmisibilidad)yelesfuerzocomputacionaldelproceso.
Bsquedaheurstica
Otraposibilidadconsisteenmodificarlos pesosrelativosdegyhenlafuncindeevalua-
cin;esdecir,podemosusarlafuncin] g+ wh, dondewes unnmeropositivo.Valoresgran-
desdew daranmayorimportanciaalacomponenteheurstica,mientrasquelos valorespeque-
osaumentaranelcarcterde exploracinenanchuradelproceso.Laevidenciaexperimental
sugierequelaeficienciadelabsquedasemejoraenmuchasocasionespermitiendoqueelvalor
de w vareinversamentealaprofundidaddelnodoenelrboldeexploracin.Apequeaspro-
fundidades,laexploracinconfiarprincipalmenteenlacomponenteheurstica,mientrasquea
grandes profundidades, laexploracin se harcadavezms en anchura, paraasegurarque se
encontraralgncaminohastaelobjetivo.
Podramospensarqueelrendimientodelprocesodebsquedapuedesermejoradorealizan-
do bsquedas simultneas, partiendo al mismo tiempo del nodo inicial y del nodo objetivo.
Estetipodemejorasestpicodelas bsquedasprimeroenanchura. Cuandounabsquedapri-
meroenanchuraesusadaenambasdirecciones,podemosestarsegurosdequeseencontrarnen
algnpuntoentreelnodoinicialyelobjetivo(Fig.9.1Oa) y, adems,sehanestablecidounaserie
decondicionesdeterminacinquegarantizanquelabsquedaprimeroenanchurabidireccional
encuentraelcaminoptimo[Pohl, 1971].Sinembargo,si intentamosiniciarunabsquedaheu-
rsticaenlosnodosinicialyo,Djetivo, probablementelosdosprocesosdebsquedanoseencuen-
trenparadeterminarel caminoptimo,sobretodosi losprocesosdebsquedatiendenacentrarse
endireccionesinapropiadas(Fig.9.l0b).
Unabuenamedidadelrendimientodelprocesodebsquedaeselfactor de ramificacin efec-
tivo, B, queesunamedidadecmoesdedirectalabsquedadelobjetivo.Supongamosquela

Objetivo
(a)Bsquedaprimeroenanchura
Inicio Objetivo
(b)Bsquedaheurstica
Figura9.10.
Bsquedabidireccional.
Bsquedaheurstica 143
bsquedaencuentrauncaminodelongituddyquegeneraN nodosentotal.Enestecaso,Bser ~
igualalnmerode sucesoresdecadanododelrbolquesatisfacenestastrespropiedades:
~
Cadanodointernodelrboltieneelmismonmero(B)desucesores.
I ~
Todoslosnodoshojasdelrboltienenlamismaprofundidadd.
ElnmerototaldenodosenelrbolesN.
1,8
Portanto,B estrelacionadoconlalongituddelcamino(d) yconelnmerototalde nodos
1)
generados(N) mediantelasexpresiones:
I ~
B+ B2 + ... + B
d
=N B
1,5
(Bd -1)B=N
(B-l)
lA
AunquenopodemosescribirBexplcitamentecomounafuncindedyN, enlaFigura9.11
I ~
sepuedeverunagrficaenlaqueserepresentaBfrenteaNparadistintosvaloresded. Los valo-
resdeB prximosalaunidadsecorrespondenconbsquedasmuydirigidashaciaelobjetivo, I ~
conmuypocaramificacinenotrasdirecciones. Porelcontrario,paravaloresaltosdeB obten-
dremosgrafosdebsquedabastantefrondosos. 1,1
Sitenemosencuentaqueelfactorderamificacinefectivoesrazonablementeindependiente
delalongituddelcamino,lopodemosusarparaestimarelnmerodenodosqueserngenerados I ~
1 10 100 1.000 10.000
porprocesosdebsquedadelongitudesdistintas. Porejemplo,apartirdelaFigura9.11 podemos
N
concluirque si usamos lafuncin de evaluacinj(n)=gen) + W(n), tendremos un valordeB
iguala 1,2paraelproblemadelpuzzledeochopiezasquemostramos enlaFigura9.2. Supon- Figura9.11.
gamosquequeremosestimarcuntosnodossegeneraranusandolamismafuncindeevaluacin
Bfrente aNparadistintosvaloresded.
pararesolveruncasomscomplejodelproblemadelpuzzledeochopiezas,porejemplo, uno
querequiera30movimientosparasuresolucin.DelaFigura9.11 sepuedededucirqueestecaso
podra implicarla generacin de aproximadamente 2.000 nodos, suponiendo que el factor de
tomar(porejemplo,deentrecuatroposiblesopciones)cuandoelobjetivoqueseestbuscando
ramificacinefectivonohayavariado.
est a 15 movimientos de distancia, el algoritmo de bsqueda expandira, aproximadamente,
Resumiendo, hay tresfactores importantesqueinfluyenenlapotenciaheursticadel algo-
4
15
"" 10
9
nodos. Laextensindeestosclculosimpedirasuaplicacinprcticaenloscasosen
ritmoA*:
losqueelagentedebatomarladecisinenfracciones desegundo.LacomplejidadespacialdeA*
esdelmismoordenquesucomplejidadtemporal,yaquetodoslosnodosexpandidostienenque
elcoste(olongitud)delcaminoencontrado;
seralmacenadosenlaestructurarboldebsqueda.
elnmerodenodosexpandidosparaencontrarelcamino,y
Dadoquelamayorpartedelosagentesestnsujetosalimitacionesdetiempoymemoriaen
elesfuerzocomputacionalrequeridoparaelclculodeh.
sus recursos computacionales, resulta imposible encontrar soluciones ptimas para muchas
tareas. Ensu lugar, nos tendremosque conformarconsolucionesnoptimas, peroaceptables
Laeleccinde unafuncin heursticaadecuadanos permiteequilibrarestos factores para
(denominadassoluciones satisfactorias), o con soluciones parciales. En elsiguientecaptulo,
maximizarelrendimientodelprocesodebsqueda.
presentaremosunaseriedemtodosquepuedenserusados poragentesconrecursoslimitados.
Todoslosmtodosdebsquedaanalizadoshastaahora, incluidoslosheursticos,presentan
unacomplejidadtemporalO(n),dondeneselnmerode nodosgenerados (suponiendoquela
funcinheursticapuedaserevaluadaentiempoconstante).Concretamente,labsquedaprime-
roenanchurapresentaunacomplejidaddeO(Bd) sielfactorderamificacinefectivoesB,todos Lecturas yconsideraciones adicionales
losarcostienenelmismocosteytodoslosobjetivosestnaunaprofundidadd. Paralabsque-
da de coste uniforme (es decir, con h == O) y con arcos de distintos costes, la complejidad es Labsquedaheursticaimplicadostiposdeclculos.Primeronosencontramosconlosclculos
O(Bc/c),dondeCeselcostedelasolucinptimayceselcostedelarcodemenorcoste [Korf, enel nivel objeto, quese encargande lageneracinde nodos ylaproduccindel camino. En
1992]. En muchos problemasdeinters prctico,d (o C/c) eslo suficientementegrandecomo segundolugar, tenemoslosclculosenelmetanivel, quesonlosencargadosdedecidirculser
paraquelabsqueda(incluidalaheurstica)desolucionesptimasnoseacomputacionalmente elsiguientenodoaexpandir.Elnivelobjetoserefiereaaccionesfsicasdelmundo, mientrasque
factible. Porejemplo, si utilizamos un procesodebsquedaparadeterminarlamejoraccin a el metanivel se refiere alas acciones computacionalesenelgrafo. Ladistincin entreelnivel
144
145
...
objetoyelmetanivelaparececonbastantefrecuenciaenlA.Estosniveles,hansidoampliamente
discutidosen[RussellyWefald, 1991]ydesempeanunpapelmuyimportanteenlosmtodosde
bsquedaabreviadosquevamosaanalizarenelsiguientecaptulo.
LospuzzlesdedesplazamientodepiezashansidousadospormuchosinvestigadoresdelA
comobancode pruebasparalos mtodosheursticosdebsqueda. Enuno delosprimerosar-
tculosescritospor[DoranyMichie, 1966] yaseuselpuzzlede ochopiezasyseiniciladis-
cusindelusodelasfuncionesdeevaluacinenprocedimientosparalabsquedadecaminosen
ungrafo.
En1990,KorfafmnquemientraselOIA* podaresolverelproblemadelpuzzlede 15 pie-
zas,otrospuzzlesmsgrandes (como,porejemplo,el puzzlede24piezas)resultanintratables
conlasmquinasactuales rKorf, 1990,p. 191].Inclusoconunamquinamspotente(unaesta-
cindetrabajoSunUltraSparc,capazdegenerarmillonesdenodosenunsegundo)yconheu-
rsticas ms potentes (descubiertas automticamente), [Korf y Taylor, 1996] slo pudieron
encontrarsolucionesptimasaejemplosresolublesygeneradosautomticamentedelpuzzlede
24piezas,encuyoclculosetardabadesdedoshorasycuartohastaunmes. [Korf, 1997]usel
OlA* paraencontrarsolucionesptimasalcubodeRubikdedimensiones3x 3x 3.
Aunque los puzzles se han utilizado para mejorar y probar las tcnicas de bsqueda, el
algoritmoA* y los procedimientosde bsquedarelacionados hansido aplicados conxito en
muchosproblemasprcticos.
En[MostowyPrieditis, 1989],sepuedeprofundizarenelclculodefuncionesheursticasa
partirdemtodossimplificados. [Pohl, 1973]realizalgunosexeerimentosbasadosenlamodi-
ficacindelospesosdelacomponenteheursticadelafuncinf.
Unlibroclsicosobre busquedaheursticaes[pearl, 19841. En[Kanal y Kumar, 1988],se
puede examinaruna recoplacin de artculos sobre procedimientos de bsqueda. El primer
artculo deestelibropropone unaunificacindealgunos mtodos de bsquedadesarrollados
independientementeporlosinvestigadoresenlAe investigacinoperativa.
9.1. Elproblemadelascuatroreinasconsisteenintentarcolocarcuatroreinasenuntablerode
ajedrezdedimensin4x4detalformaquenosepuedancapturarentres(esdecir,slopuede
haberunareinaenunafilacualquiera,columnaodiagonaldeltablero).Supongamosquetrata-
mosderesolveresteproblemausandoelsiguienteespacio: etiquetamoselnodo inicial conuna
matrizde4x4 vaca;lafuncin de sucesin creamatricesde4x4nuevasalasqueselesaade
unanuevareinaenunaposicinlegal; el predicado objetivo sesatisfacesi, yslosi,enel table-
rohaycuatroreinaslegalmentecolocadas:
1. Propongaunafuncinheursticaadmisiblebasadaenelnmerodereinasquequedanpara
alcanzarelobjetivo(hayquetenerencuentaquetodoslosnodosobjetivosestnexacta-
menteacuatromovimientosdelnodoinicial).
2. UsedichafuncinheursticaenunabsquedaA* del nodoobjetivo. Dibujeelrbol de
bsquedacontodoslasmatricesgeneradasyetiqutelasconlos valoresdeg yhcorres-
pondientes (si tenemosencuentala simetradel problemaslo hace falta generartres
sucesoresdelnodoinicial).
9.2. Enesteejercicio,sesuponequeyahasidoterminadoelEjercicio7.4sobreel problemadelas
TorresdeHanoi.Basndonosenlasolucindedichoejercicio(sinosehahecho,sedeberesol-
verahora),propongaunafuncinhadmisibleparaesteproblemaquesecomportemejorqueh== o.
Bsquedaheurstica
9.3. ElalgoritmoA* noterminamientrasnoseseleccioneunnodoobjetivoparasuexpansin.
Sinembargo, podramosencontrasuncaminoalobjetivomuchoantesdequeseseleccioneun
nodoobjetivoparasuexpansin.Porqunoseterminaenel momentoenqueseencuentreun
nodoobjetivo?llustrelarespuestaconunejemplo.
9.4. Lacondicindemonotonadeunafuncinheursticaestablecequeh(n) ::;; h(n) + c(n
i
, n)
paratodopardenodossucesores(ni' n
j
), dondec(n
i
, n) eselcostedel arcoentreni Ynj" Hemos
sugeridoquecuandonosesatisfacelacondicindemonotona,estehechose puededescubrir,
conloquepodemosmodificarlafuncinhduranteelprocesodebsquedaparaquelacumpla.
Laideabsicaeslasiguiente: siemprequeseexpandaunnodoni' creandodeestaforma susuce-
sorn
j
podemossumaral valordeh(n) lacantidadquenecesitemosparahacercumplirlacon-
dicindemonotona.Construyaunejemploenel quesemuestrequeinclusoconesteesquemala
expansindeunnodonoimplicaquehayamosencontradoelcaminoconmenorcosteal.
9.5. Demuestrequeunaversinadmisibledel algoritmoA* continasiendoadmisiblesielimi-
namos de la listaABIERTOS todo nodon paraelqueI(n) > F, siendo F unacotasuperiorde
fino), yno elnodoinicial.
9.6. (CortesadeMattGinsberg, DaphneKolleryYoavShoham.)Enesteejercicio,considera-
remoslaeleccinentredosfuncionesheursticasadmisibles,unadelascualesesalmenostan
precisacomolaotra.Msformalmente,paraunobjetivodeterminado,h yh
2
sondosfunciones
heursticasadmisiblestalesqueparacadanodon enelrboldebsquedah(n)::;; h
2
(n).
Comohemosmencionado, el algoritmoA* expandelos nodos deacuerdoasus valoresJ,
pero el orden en el que se expanden los nodos que tienen el mismo valor del puede variar,
dependiendodelaimplementacinde lacoladeprioridad. Paraunadeterminadafuncin heu-
rsticah, diremosqueunaordenacindelosnodosdelrboldebsquedaesA legal, silaexpan-
sindelosnodoseneseordenesconsistenteconlaversindeA* queutilizalafuncinheurs-
ticah.
SeaN elconjuntodenodosexpandidosporlaversindeA* queutilizalafuncinheurstica
h (lamenosprecisa).DemuestrequesiempreexistealgunaordenacinAl legal queexpande
2
slounconjunto(nonecesariamenteestricto)denodosdeN. Esdecir,demuestrequesiemprees
posible queh
2
genereunespaciodebsquedamspequeoqueh (tengaencuentaqueseest
pidiendoqueseencuentrealgunaordenacinquecumplaunasdeterminadaspropiedades. Indi-
queporquengeneralnoesposibledemostrarquedichaspropiedadesnosecumplenparacual-
quierordenacinarbitraria).
Planificacin,
actuacin
y aprendizaje
Ahoraqueyahemosvistodiversastcnicasparaencontrarcaminosengrafos,esel momentode
mostrar cmo estos mtodos pueden ser utilizados por agentes en entornos reales. Primero,
retomaremoslaspresuncionesrealizadasenelCaptulo7,cuandoconsideramoslosmtodosde
planificacin mediante bsqueda en grafos, y propondremos una arquitectura de agente que
admitedichashiptesisidealizadas. Luego,mostraremoscmoalgunos delosmtodosdebs-
quedapuedensermodificadosparareducirlosrequisitosdetiempoyespacio-hacindolosms
tilesenlaarquitecturapropuesta-.Finalmente,mostraremoscmosepuedenaprenderalgunas
funcionesheursticasymodelosdeacciones.

Tal comodijimosenel Captulo7, laeJJi.:(aciadelosmtodosdeplanificacinbasadosenbs-
queda conjunto menudo,estaspresuncionesno
secumplen,debidoaque: -
1. Losprocesosdepercepcinnosiemprepodranobtenerlainformacinnecesariaacerca
delestadodelentorno(bienporpresenciaderuido,obienporhaberimpedimentosenla
medicindepropiedadesimportantes).Cuandodos situacionesdelentornoproducenla
mismaentradasensorial,tenemosloquellamamosficcin perceptual.
2. Las accionespodrannodisponersiempredemodelosdesusefectos(porquelosmodelos
no son losuficientementeprecisoso porqueelsistemaejecutorrealizaocasionalmente
erroresalejecutarlasacciones).
3. Pueden haber otros procesos fsicos, u otros agentes, en el mundo (tal como pueden
existir, porejemplo, en losjuegoscon adversario). Estos procesos podran cambiarel
mundodemaneraqueinterfirieraconlasaccionesdelagente.
4. Lapresenciadeefectosexternoscausaotroproblema: enel tiempoquetranscurreduran-
telaconstruccindeun plan,el mundopuedecambiardetalmaneraqueelplanyanoes
147
148
149
adecuado(aplicable).Esteproblemahacequeseaintilqueunagentepierdademasiado
tiempoplanificando.
5. Podrasucederqueselerequiriesealagenteactuarantesde quepudiesecompletaruna
bsquedadeunestadoobjetivo.
6. Aunqueelagentedispusieradeltiemposuficiente,susrecursosdememoriapodranno
permitirlerealizarlabsquedadeunestadoobjetivo.
Existendos enfoques fundamentales paratratarestos problemas, al mismo tiempo que se
mantienenlascaractersticasmsimportantesdelaplanificacinbasadaenbsqueda.Enuna,se
utilizanmtodosprobabilsticosparaformalizarlaincertidumbreasociadaalapercepcin,alesta-
do del entorno y a los efectos de las acciones. En la otra, intentamos resolver el problema
mediantepresuncionesadicionalesyaproximaciones.
Unmecanismoformal paraafrontarelhechodequeunaaccintieneefectosinciertoscon-
sisteenasumirqueparacadaaccinejecutableenunciertoestado,el estadoresultantesedefine
medianteunadistribucindeprobabilidadesconocida.Elproblemadeencontrarlasaccionesade-
cuadas bajoestas presunciones se llamaproblema de decisin de Markov (PDM) [Puterman,
1994].Paraafrontarelproblemaadicionaldelaspercepcionesimperfectassepuedeproponerun
modeloformalqueasumequeelsistemasensorialdelagenteproveeunadistribucindeproba-
bilidadessobreelconjuntodeestadosenlosqueel agentesepuedeencontrar. Enestecaso,el
problemadeencontrarlasaccionesadecuadassedenominaproblema de decisin de Markov par-
cialmente observable (PDMPO)[Lovejoy, 1991;Monahan, 1982,yCassandra,Kaelbling,yLitt-
man, 1994]. LadiscusinsobrePDMyPDMPOvamsalldelalcancedeestelibro,peromos-
traremostcnicasrelacionadasconelloenelCaptulo20,despusdenuestraexposicinsobrela
inferenciaprobabilstica.
Envezdeseguirconlos mtodos formales basadosenprobabilidades,propondremosuna
arquitectura,denominadaarquitecturadepercepcin/planificacin/actuacin, quellegaaresol-
veralgunos delos problemas mencionados, y estil en muchas aplicaciones. Labasedeesta
arquitecturaconsisteenque,aunqueocasionalmentelasaccionesproduzcanefectosimprevistos,
yel agentenopuedadecidirenquestadodelmundoseencuentra,estasdificultadespuedenser
resueltasdeformaadecuadaasegurndonosdequeelagenterecibeunarealimentacincontinua
desuentornomientrasvaejecutandosuplan.
Unamaneradeasegurarunarealimentacincontinuaconsisteen: planificarunasecuenciade
acciones,ejecutarlaprimeraaccindelasecuencia,medirlasituacinresultanteenelentorno,
recalcularelnodoinicioyrepetirelproceso.Alosagentesqueseleccionanlasaccionesdeesta
formaseles llamaagentes depercepcin/planificacin/actuacin. Sinembargo, paraqueeste
mtodoseaefectivo,eltiempoconsumidoparaca1cularunplandebesermenorqueelpermitido
paracada accin. En la Figura 10.1, mostramos una arquitectura para un agente de percep-
cin/planificacin/actuacin.Enentornosbenignos(aquellosquetoleranpa.<;os fallidos), elerror
enlamedicinylaactuacinpuedenmedirsecomounpromediosobreunasecuenciadesuce-
sivosciclospercibir/planificar/actuar.
Enelciclopercibir/planificar/actuar,larealimentacindesdeelentornopermitesolventarel
problemadelaincertidumbreenlapercepcin,enlaejecuciny enelestadodelentorno. Sin
embargo,paraqueestarealimentacinseaefectiva,debemosasumirque,enpromedio,laper-
cepcinylaactuacinsonprecisas.Enmuchasaplicaciones,estapresuncinesrealista. Despus
detodo,estareadeldiseadordelagenteproveerlasmodalidadessensoriales,perceptualesyde
ejecucin,adecuadasa los requisitos delatareaa realizarporelagente.Amenudo, unagente
puede aumentarsu precisin perceptual comparandolosdatosde mediciones actuales conun
modeloalmacenadodelasituacin(recordemosquevimosunejemplosencillodeestetipodefil-
tradoenelsistemadepizarradelCaptulo5).
Planificacin.actuaciny aprendizaje
Entrada
Objetivo
sensorial
Procesamiento
---"1 perceptual
Estado
actual I I ,
(estadodeseado)
Grafodeestados
Planificacin Accin
Encontrar
(bsquedaengrafos)

primeraaccin
----- -
Figura10.1.
Unaarquitecturaparaunagentedepercepcin/planificacin/actuacin.
)Bs;Ueda f
Acontinuacin, permitirn
elproblemade a
geneiaiptasque'pOdiian. quellP..Jb:I!Lno siempre formasegura,el
es,tad.otijtWG;Laaplicacindeestastcnicaspuedeserincorporadaalciclo"ii"ercibir/planifi-
car/actuaraunqueelplannoseaptimo(nitampococorrecto). Cualitativamente,asumiendoque
laprimeraaccingeneraunatendencia(enpromedio)aacortarladistanciaalobjetivo,sepuede
aceptar que los sucesivos ciclos percibir/planificar/actuar acabarn finalmente alcanzando el
objetivo.
Talcomodijimosenelcaptuloanterior, al relajarelrequisitodeproducirunplanptimo,a
menudosereduceelcostecomputacionalasociadoalabsquedadeunplan. Estareduccinse
puedeobtener prukamosbuscaruncamioocompletohasta obje-
tiv quenonosdiera
tod2e1.. ... mtod.?sunabsquedade..
caso, utilizaramosunafuncinheursticanoadmisible, yenelsegundo,
saldramosde.la 6irsqUdaantesdllegara!'Objetivo-':utilizando,bien funcinheurstica
admisible,obiennoadmisible.Labsquedainterrumpibleantesdelaobtencindelobjetivoes
unejemplodealgoritmoanytime [DeanyBoddy, 1988,yHorvitz, 1987].Losalgoritmosanyti-
me sonaquelloscapacesdeproporcionarunarespuestaencualquierinstantedetiempo;lacalidad
delresultadoaumentaconfonneseincrementaeltiempopermitidoparalaejecucin. Enlaspr-
ximassecciones,detallaremossteyotrosmtodosaproximadosdebsqueda.

10.2.1. B6squeda orientada a subobjetivos
...
Enlabsqueda orientada a subobjetivos, el conocimientoheursticosobreeldominiodelpro-
blemaseiitTIizlrpmaesra:bleterun'co}ut-de subobjetivosenelespaciodebsqueda,atra-
v;deloscualessesperaobtenerlasecuenciatotalhaciaelobjetivoglobal.Porejemplo,enpla-
----.... '.,--.... ... _"
150
151
Estados parciales en
el espacio de bsqueda

Bsquedas locales
Figura 10.2.
Una bsqueda orientada a subobjetivos.
nificacin de rutas por terrenos dificultosos, esta secuencia de subobjetivos se podra corres-
ponder con pasos a travs de las montaas. Supongamos que no es el nodo inicio, ng el nodo obje-
tivo y (nI' n
z
, ... , n
k
) es una secuencia de subobjetivos. Comenzamos una bsqueda heurstica
tomando no como nodo inicio y nI como nodo subobjetivo (y utilizando una funcin heurstica
apropiada para dicho subobjetivo). Cuando la bsqueda encuentra un camino hasta nI' comen-
zamos otro proceso de bsqueda con ni como nodo inicio y n
z
como nuevo nodo subobjetivo, y
as sucesivamente hasta encontrar un camino hasta ng' En la Figura 10.2, mostramos un dibujo
esquemtico de la bsqueda orientada a subobjetivos.
10.2.2. Bsqueda jerrquica
a la bsqueda a subobjetivos, pero conla diferen-
SilPoillIfemos que tenemos
ciertos macro-operadores que gran cantidad de pasos en una bsqueda
implcita sobre el espacio desUbobjetivos. Un subobjetivo inicio (prxImo al nodo Inicio ) unido
a estos demlbobjetivos;al que llamamos super-
grafolte'ifilriiveb, Primero
nivel, hasta que se genera un caminode macro-ope,radores que nos lleva desde ullI!()do subob-
hasta un nodosubobjetvo cercano al nodo objetivo
del veroase. Si los macro-operadores estn realmente definidos como secuencias de operado-
resdelvl base:'y'os macro-opeidores se expanden mediante caminos de operadores del nivel
base, entonces el camino eI'elritanv! conecta al nivel base desde el nodo inicio hasfa'el'nodo
objetivo. Si los macro-operadores no estn definidos mediante ope1jl,dtif'fdelIvel
base, entonces debemos realizarbusquedas eIernivel base para conectar los macro-operadores
generados mediante la bsqueda en el metanivel. Esta ltima opcin se muestra esquemtica-
mente en la Figura 10.3.
Como ejemplo de planificacin jerrquica, consideremos la tarea de un robot consistente en
empujar un bloque a una localizacin dada (objetivo) en un espacio cuadriculado. Esta situacin
Planificacin, actuacin y aprendizaje
Camino metanivel
Bsqueda en el metanivel
Objetivo
\
Bsquedas en el nivel base
Figura 10.3.
U na bsqueda jerrquica.
se muestra en la Figura lOA. El objetivo del robot es empujar el bloque hasta la casilla marcada
con la G. Supondremos que el robot puede percibir las ocho casillas situadas a su alrededor, y
puede determinar si una casilla est ocupada por una barrera o un bloque. Como en el Captulo 2,
presupondremos que el robot puede moverse hacia las casillas que se encuentran en su vertical u
horizontal, tanto si estn libres como si estn ocupadas por un bloque, en cuyo caso el bloque se
traslada hacia delante una casilla (a menos que dicho movimiento sea impedido por alguna
barrera).
B
Ro
Bloque
Figura 10.4.
Tarea consistente en empujar un bloque.
152 Inteligenciaartificial.Unanuevasntesis Planificacin, actuaciny aprendizaje 153
Supongamos que el robot dispone de un modelo icnico de este mundo, representado nohastaelobjetivo,yaque,debidoalaincertidumbre,unabsquedaaunadistancialejanapuede
medianteunamatrizparecidaalamostradaenlaFigura10.4.Entonces,elrobotpodraconstruir serirrelevanteynodarmejorinformacinquelaquenosdaralabsquedaconhorizonte.
primeroun plande metanivel paraaveriguarcules seranlos movimientosdel bloque-asu-
Labsquedaconhorizontesepuedeimplementareficientementemedianteunabsquedapri-
miendoqueel bloquesepudiesemoverdelamismamaneraquelohaceelrobot-oElresulta- meroenprofundidad,desarrolladahastaunaprofundidadd. Elusodeunafuncin montona!
dodelplandemetanivelsemuestramedianteunaflechagrisenlaFigura 10.4. Despus,cada paraevaluarlosnodosnospermiteunagranreduccinenelesfuerzodelabsqueda.Tanpron-
pasodelplandemetaniveldelos movimientosdel bloque se expandeenunplanparcialenel tocomosealcanceelprimernodonienelhorizontedebsqueda,podemosterminarconlabs-
nivel base. Elprimermovimientodel bloque requiere que el robotplanifiqueuncaminohasta
quedadecualquierotronodon quetenga!(n)>!(n
l
). Elnodon, posiblemente,notendrundes-
algunacasillaadyacentealbloqueyenelladoopuestoalaposicindelsiguientepasodelplan
cendienteconunvalorde!menorque!(n
l
), asquenohabrningncandidatodebsquedapor
delmetanivel.Elresultadodedichoplanparcialdelnivelbasesemuestraconunaflechanegra debajodel(bajolapresuncindequelafuncin!esmontona, losvaloresde los diferentes
enlaFigura10.4.Lossiguientespasosdelnivelbasesontrivialeshastaqueelrobotdebecam- nodosalolargodeuncaminoenelrboldebsquedasernmontonamentecrecientes).A!(n
l
)
biardedireccin.Luego,elrobotdebeplanificarunrecorridohastalacasillaopuestaaladirec- selellamavalor de corte alfa, yelprocesodepararlabsquedaparalosnodospordebajodel
cinquetomarel bloque,yassucesivamente.Losplanesdelnivelbaseparaconseguirlos suce-
nodon esunainstanciadelmtodode ramificacin y poda. Msan, siemprequeexistaunnodo
sivoscambiosdedireccindel robottambinsemuestranenlaFigura10.4
1
horizonte,n
2
, queverifique!(n
2
) <!(n
l
), elvaloractualdecortealfapuedesersustituidoporel
En la planificacinjerrquica, cuando existe una probabilidad de que cambie el entorno de!(n
2
), aumentandolacondicindecorte.Deestamanera,losvaloresdecortealfapuedenser
durante la ejecucin del plan, es prudente expandir tan slo los primeros pasos del plan de reducidossiemprequelosnodoshorizontehalladostenganvalores!menoresqueelvalordecor-
metanivel.Alexpandirsloelprimerpasodelplandemetanivel,disponemosdeunconjuntode
tealfaactual. [Korf, 1990] comparalabsquedaconhorizonteconotrosmtodos similaresde
accionesdelnivelbasequepuedenserejecutadas,einmediatamentedespusobtenerunareali-
bsqueda, incluyendo al DIA* y aotras versiones del algoritmo A* con limitacinde tiempo.
mentacinposteriordelentornoparareplanificarelplandemetanivel.
Unmtodoextremodebsquedaconhorizonteutilizaraunlmitedeprofundidadde 1. Los
sucesoresinmediatosdelnodoinicioseranevaluados,yseejecutaralaaccinquellevaalnodo
conel menorvalordej. Estos valores de!sonanlogos alasfunciones potencialesquemen-
10.2.3. Bsqueda con horizonte
cionamosenrelacinconlanavegacindeunrobotenelCaptulo5, y, enefecto.!bienpodra
serunafuncinpotencialparaelproblemadenavegacindeunrobot.
Enalgunosproblemas,escomputacionalmenteinviableencontraruncaminohastaelobjetivo,sea
Formalmente, seaa(n
o
' a) ladescripcindelestadoqueelagenteesperaobtenertrashaber
cualseael mtododebsqueda.Porotraparte,enotrosproblemas,esobligatorioseleccionaruna
aplicadolaaccina sobreelnodono' Aplicareloperadorcorrespondientealaaccina sobreel
accindentrodeunlmitedetiempoprefijado,loquenopermiteencontrartodoelrecorridohas-
nodono producirdichadescripcindeestado.Entonces,nuestraestrategiaparaseleccionaruna
taelobjetivo.Enestoscasos,podrasertilutilizareltotaldeltiempodeclculodisponiblepara
accinenelnodono ser:
encontraruncaminohastaunsubobjetivoqueestdentrodelrecorridoadecuadohaciaelobjetivo.
Estesustitutodelobjetivo,alquellamaremosnodon*, esaquelquetieneelvalormenordef entre
todoslosnodosqueseencuentranenlafronteradelabsquedacuandoelprocesodebeserparado. a = m}nj(a(n
o
' a)) = ~ [c(a) +h(a(n
o
' a))]
Supongamosqueeltiempolmitedisponibleparalabsquedaantesdequedebaseleccionarse
unaaccinnos permiteunabsquedahastaunaprofundidadd; es decir, todos los caminoscon
dondec(a) eselcostedelaaccin. Utilizaremosunafuncin similarastacuandohablemosde
profundidadd omenorhabrnsidorecorridosalalcanzareltiempolmite.Elconjuntodenodos
los mtodosdeaprendizajede!(a(n
o
, a)).
queseencuentranadichaprofundidad,al quedenotaremosconJ-f, sellamarhorizonte. Deesta
manera,nuestroprocesoconsistirenbuscarhastaunaprofundidadd yseleccionarunnodo:
10.2.4. Ciclos
n* =min!(n)
"EH
Entodosestoscasos,enlosquepuedeexistirincertidumbreyendondeunagentesebasaenpla-
comosustitutodelnodoobjetivo.Aestemtodolodenominamosmtododebsqueda con hori- nesaproximados, elusodelciclopercibir/planificar/actuarpuedeproducirciclosrepetitivos de
zonte. [Korf, 1990] estudi esta tcnica y lallam bsquedaminimin 2. Un sistemade percep- comportamiento,estoes, queunagentepuedevolveraunestadodelentornopreviamentevisi-
cin/planificacin/actuacinseleccionaralaprimeraaccindelcaminohastan*, mediraelesta- tado y repetirla accin que realiz con anterioridad. Quedarse atrapado en dichos ciclos, por
doresultanteyrepetiraelprocesodebsqueda.Podemossuponerqueestaprimeraaccinhacia supuesto, significarqueelagentenuncallegaralestadoobjetivo. Korfhapropuestounalgo-
unnodoquepresentaunaevaluacinheursticaptimatieneunabuenaprobabilidaddepertenecer ritmo de ejecucin de planes denominado A* en tiempo real (TRA*) que construye un grafo
alcaminoquenosllevaalobjetivo.Adems,amenudo,unagentenonecesitabuscartodoelcami- explcitodetodoslosestadosvisitadoshastaelmomentoyajustalosvaloresdehdelosnodos,
detalmaneraqueevitatomaraccionesquellevenaestadospreviamentevisitados [Korf, 1990].
I EnlosiniciosdelalA,unartculosobreplanificacin[NilssonyRaphael, 1967] tratabaelproblemade lasimu-
10.2.5. Construccin de procedimientos reactivos
lacindeunrobotconunatareasimilaralamostradaenlaFigura1004.
2 Podramospreguntarnosporqunoutilizarunabsquedaconhorizontedecosteenvez de unabsquedacon
horizontedeprofundidad.Laraznesqueeltiemporequeridogeneralmentedependedelaprofundidadyno delcoste; Talcomocomentbamosal comienzodelCaptulo7, enunamquinareactiva, el diseadorten-
poresohemosseleccionadoelfactordeprofundidad.
drquehabercalculadopreviamentelasaccionesadecuadasparacadaposiblesituacin,decara
Planificacin,actuaciny aprendizaje 155
reactivos. Si unprogramareactivoespecificaunaaccinparacadaposibleestado, aellosele
a alcanzar el objetivo. Pero almacenar las acciones indexadas por estados del entorno puede
denominaplan universal [Schoppers, 1987],oestrategia de actuacin. Acontinuacin,yhastael
requerirgrandescantidadesdememoria.Porotrolado,losagentesreactivosdebenactuar,porlo
finaldelcaptulo,hablaremosdeestrategiasdeactuacinydemtodosdeaprendizajedeestra-
general,msrpidamentequelosagentesplanificadores.Enalgunoscasos,puedeserventajoso
tegiasdeactuacin.Estetipodeestrategiasesimportanteporque,aunquelaaccinseleccionada
compilara priori losplanesqueseutilizanmsamenudoyalmacenarloscomorutinasreactivas
nonosconduzcaalestadosiguienteesperado,lamquinareactivaestarsiemprepreparadapara
quegenerarnen tiempo de ejecucin lasaccionesapropiadas.
reaccionaralanuevasituacin,seacualseaelestadoalquehapasado.
Porejemplo,labsquedaa priori podracalcularunrboldeexpansinconrazenelnodo
objetivodelgrafodeestados,conteniendoloscaminosdetodos(o,comomnimo,demuchos)los
nodos delespaciode estados. Unrbol de expansin puedeserconstruidomediantebsqueda
regresiva (hacia atrs) desde el objetivo. Porejemplo, la Figura 10.5 muestra un rbol de Aprendizaje de funciones heursticas
expansinparaobtenerelobjetivoconsistenteenqueelbloqueA quedecolocadosobreelB, yel
B sobreelC. Elgrafomuestraloscaminoshastaelobjetivodesdetodoslosdemsnodos. Disponerdeunarealimentacincontinuadelentornoesunaformadereducirlaincertidumbrey
Tantolosrbolesdeexpansin,comolosrbolesdeexpansinparcial,sepuedenconvertir compensarlafaltadeconocimientodelagentesobrelosefectosdesusacciones.Pero,adems, se
fcilmente enprogramasT-R (teleo-reactivos),esdecir, enprogramasquesoncompletamente puedeobtenerinformacintildelaexperienciaacumuladadurantelasbsquedasprevias,as
comodelosresultadosdelasaccionespreviasejecutadasenelmundoreal.Vamosahablarde
variastcnicasmediantelascualesunagentepuedeaprenderaplanificaryactuardeformams
eficiente.

BCA
10.3.1. Grafos explcitos
Enloscasosenlosqueunagentenodisponedeunafuncinheursticaparaestimarelcostedel
""'Ov. [B]fel 9;,\)13\0'\
er(e caminohaciael objetivo, aveceses posibleaprenderdichafuncin. Primeroexplicaremosun
\'0.

, .s've, B)(AC CA)(B
procedimientodeaprendizajemuysencilloparaelcasoenelqueesposiblealmacenarunalista '0..0
'0)
ACB explcitadetodoslosposiblesnodos3. CAB
:,..iY
x,0
Primero,asumiremosqueelagentedisponedeunbuenmodelodelosefectosdesusaccio-
""'Ov.
";.0
Cj
9;,\)13\0'\
er(e
1-(9
"',c
, .s'v&,
'0)
AB)(C

BA)(C
1.1"\.1
CBA
Figura10.5.

v(9
o
0'
o.s.
"O
<ii
::s
(J)

'-
(1)
>
o
E

[AJ[B][C]
A)(B)(C
mover (B, e)
B)(AC
iii

Q
>
o
E
3
ABC
'o..e
A)(CB
nes, yque tambinconoceel costecorrespondienteal movimientodesdeunnodoa susnodos
sucesores. ComenzaremoselprocesodeaprendizajeinicializandolafuncinhaOparatodoslos
nodos,traslocualiniciamosunabsquedaA*. Despusdeexpandirelnodonj' generandoelcon-
juntodesucesoresS (n), modificamosh(n) delasiguientemanera:

min [h(n)+c(nj,n
j
)
"jES(n)
dondec(nj, n) eselcostecorrespondienteal movimientodesdeelnodonj alni" Losvaloresdeh
puedenseralmacenadosenunatabladenodos (porqueesunnmerosuficientementepequeo
como para ser manejado sin consumirexcesivos recursos). Asumiremos tambin que, si se
generaunnodoobjetivon
g
, entoncesh(n
g
) =O. Aunquesabemosqueesteprocesodeaprendiza-
jenonosayudaradeformamsrpidadeloqueloharaunabsquedadecosteuniformelapri-
mera vez que buscsemos para encontrar un objetivo, las bsquedas posteriores dirigidas al
mismoobjetivo(posiblementedesdeotrosestadosiniciales)seacelerarnutilizandolafuncin h
aprendida.Despusdemuchasbsquedas,tendremosestimacionescadavezmejoresdelafun-
cinh, que se propagarn gradualmente haciaatrs, desde los nodos objetivo(el algoritmode
aprendizajeLRTA* utilizaestamismareglaparaactualizarh [Korf, 1990]).
Sielagentenodisponedeunmodelodelosefectosdesusacciones,puedeaprenderloalmis-
motiempoqueaprendelafuncinhmedianteunprocesoparecido,aunqueelaprendizajetendr
1 Hablamosde estecasoespecialsimplementeparaintroduciralgunasideasquemsadelante tal
comohemosdicho, muchosproblemasdeintersprcticopresentanespaciosde bsquedademasiado comopara
enumerartodoslos nodos.
Unrboldeexpansinparaelproblemadelapilamientode bloques.
lugar en el mundo actual en vez de en el modelo de estados (Cuidado, este tipo de aprendizaje
puede ser peligroso!) Asumiremos que el agente dispone de los medios para distinguir los esta-
dos que va visitando, y que los puede nombrar y construir con ellos un grafo explcito, o una
tabla, en la que se representan los estados, sus valores estimados y las transiciones generadas por
las acciones. Tambin asumiremos que si el agente desconoce los de sus acciones, se
encargar de obtenerlos. El proceso se inicia con un nico nodo, que\\representa al estado en el
que el agente comienza. El agente selecciona una accin, quiz de forma aleatoria, y pasa a otro
estado. A medida que va visitando estados, los nombra y les asocia un valor hcalculado de la
siguiente manera:
h(n) [h(n
j
) + c(n,n
j
)]
donde n es el nod? sobre el cual se aplica la accin a; n
j
es el nodo resultante; c(n
j
, n) es el cos-
te de la accin, y h(n) es una estimacin del valor de n
j
, que es igual a O si n
j
no ha sido todava
visitado o, en caso contrario, estar ya almacenado en la tabla.
Siempre que el agente deba seleccionar una accin en el nodo n, disponiendo de nodos
sucesores en el grafo, seleccionar la accin segn la estrategia siguiente:
a m!n[h( cr(n,a) +c(n,cr(n,a]
donde cr(n,a) es la descripcin del estado resultante de aplicar la accin a sobre el nodo n.
Este procedimiento de aprendizaje comienza con un recorrido aleatorio, hasta que finalmente
encuentra el nodo objetivo; pero, en los intentos posteriores, propagar hacia atrs mejores
valores de h, obteniendo de esta forma mejores caminos cada vez. Debido a que la accin selec-
cionada en el nodo n es aquella que lleva a un nodo estimado como perteneciente a un camino de
mnimo coste desde n hasta el objetivo, no es necesario evaluar todos los sucesores del nodo n
cuando se actualice h(n). Como el modelo se construye de forma gradual, es posible combinar el
aprendizaje del mundo con el aprendizaje y la planificacin del modelo de estados. Este tipo
de combinacin ha sido explorada por [Sutton, 1990] en su sistema DYNA.
Sin embargo, esta tcnica puede acabar obteniendo caminos no ptimos, debido a que algu-
nos nodos de los caminos ptimos podran no ser nunca visitados. Pero si permitisemos oca-
sioI'almente acciones aleatorias (en vez de las seleccionadas por la estrategia que est siendo
aprendida), el agente podra aprender nuevos caminos a los objetivos (quiz mejores). La selec-
cin 11eatoria de acciones es una tcnica que permite al agente resolver lo que se denomina dile-
ma df la exploracin y la explotacin (exploracin de nuevos caminos y explotacin del cono-
cimiento ya aprendido). En cualquier caso, pueden existir otros mecanismos para asegurar que
todos los nodos sean visitados.
10.3.2. Grafos implcitos
Volvamos al caso en el que es impracticable construir un grafo explcito o una tabla con todos los
nodos y sus transiciones. Al igual que antes, cuando disponemos de un modelo de los efectos de
las acciones (es decir, cuando tenemos operadores que transforman la descripcin de un estado en
la descripcin de un estado sucesor), podemos aplicar un proceso de bsqueda guiado por una
funcin de evaluacin. Por lo general, la funcin puede generar la misma evaluacin para varios
nodos, en cuyo caso la aplicacin de la funcin a la descripcin de un estado es viable, mientras
que almacenar todos los nodos y sus valores explcitamente en una tabla no lo es.
Planificacin, actuacin y aprendizaje
Podemos utilizar mtodos similares a los descritos en el Captulo 3 para aprender funciones
heursticas mientras realizamos el proceso de bsqueda. Primero, nos preguntamos por un con-
junto de subfunciones que pensamos podran ser componentes adecuados de una funcin heu-
rstica. Por ejemplo, en el puzzle de ocho piezas podramos utilizar las funciones W(n) =nme-
ro de piezas en la posicin errnea, y P(n) =suma de las distancias de cada pieza a su posicin
correcta. En general, cualquier funcin que mida cun cerca est una posicin de la posicin
correcta es potencialmente til. Una vez que hemos elegido estas subfunciones, calculamos una
funcin heurstica global dada por la combinacin lineal ponderada de las subfunciones:
h(n) =w] W(n) + w
2
P(n) + ...
Comentaremos dos mtodos para el aprendizaje de los pesos. El primero de ellos consiste en
asignar inicialmente a los pesos los valores que creamos son ms adecuados para dirigir la bs-
queda, hcon dichos pesos; cuando hallemos uI} nodo objetivo n
g
, utilizamos el valor
final de h(n
g
) =para propagar hacia atrs los valores de h para todos los nodos n a lo largo del
camino hacia el objetivo. Utilizando estos valores como ejemplos de entrenamiento, ajustamos
los pesos de forma que se minimice la suma de los errores cuadrticos entre los ejemplos de
entrenamiento y la funcin hcalculada mediante la combinacin ponderada. Este proceso debe
realizarse de forma iterativa sobre muchas bsquedas.
Alternativamente, podramos utilizar un mtodo similar a uno que ya hemos descrito ante-
riormente, basado en ajustar la funcin h en cada expansin de un nodo. Despus de haber
expandido el nodo n para generar los nodos sucesores S (n) ajustaramos los pesos mediante:
h(n) h(n)+ I m,in[h(nj)+c(np n)]-h(n))
o, de otro modo:
h(n) (1 + min [h(n
j
)+ c(n,n)]
nE.5 (ni)
donde < 1 es un factor de aprendizaje que controla cun fielmente se aproxima h(n) al valor
dado por min [h(n) + c(n , n)] . Cuando =0, no se realizan cambios; cuando 1, asigna-
n,E.5(n;)
)+c(ni,n)]. Con valores pequeos de conseguimos
un aprendizaje muy lento, mientras que un valor de cercano a 1 podra generar un aprendizaje
errtico y no convergente.
Este mtodo de aprendizaje es una instancia del aprendizaje basado en diferencias tempora-
les, que fue formalizado por [Sutton, 1988]; el reajuste de los pesos depende solamente de dos
valores de una funcin 4 temporalmente adyacentes. Sutton formul, y demostr en diversas situa-
ciones, varias propiedades del mtodo relacionadas con su convergencia. El punto interesante
acerca del mtodo de las diferencias temporales es que es un mtodo que puede ser aplicado
durante la bsqueda antes de hallar un objetivo (pero los valores de hque estn siendo aprendi-
dos no se convierten en relevantes para el objetivo hasta que ste ha sido encontrado). Este pro-
ceso tambin debe realizarse de forma iterativa sobre varias bsquedas.
4 Sutton menciona a [Samuel, 1959] como el creador de esta idea.
158
159
Tenemos que mencionarque esta tcnica de aprendizaje tambin puede aplicarse an en
situacionesenlas queno disponemosdeunmodelodelos efectosdelasacciones; esdecir, el
aprendizajepuedetenerlugarenelmundoreal, talcomomencionamosanteriormente.Encon-
creto, consistiraen avanzar un paso (quiz uno aleatorio o elegido mediante laestrategiade
actuacinemergente),evaluarlosvaloresdefi antesydespusdelpaso,anotarelcostedelpaso
yreajustarlospesos.
Recompensas en vez de objetivos
Ennuestraexposicinsobreestrategiasdebsquedaenelespaciodeestados,hemosasumidoqueel
agentetenaunatareasimpleacortotrmino,tareaquepodaserdescritamedianteunestadoobje-
tivo.Elobjetivoeraircambiandoelmundohastaquesumodeloicnico(enformadeestructurade
datos)satisfacaunacondicindexito.Enmuchosproblemasdeintersprcticolatareanopuede
serformuladademaneratansimple.Ensulugar,setratadeunatareacontinua.Elusuarioexpresa
susatisfaccinodescontentoconlarealizacindelatareadndolealagente,devezencuando,una
seriederecompensaspositivasynegativas.Latareadelagenteesmaximizarlarecompensatotalque
recibe;elcasoespecial deunasimpletareadeobtencindelobjetivopuedeserimplementadoen
estemarcomedianteunarecompensapositivaalagente(unasolavez)cuandoobtieneelobjetivo,y
negativamentecadavezquetomaunaaccin(medianteelcostetotaldelaaccin).
Enestetipodecontexto,pretendemosdescribirunaestrategiadeactuacinquemaximicela
recompensa. Unproblemacon las tareascontinuasquenotienenterminacinesquelarecom-
pensafuturapodraserinfinita,haciendodifcildecidircmomaximizarla. Unaformadepro-
cederesdescontarlasrecompensasfuturas mediantealgnfactor; esdecir,queelagenteprefie-
rarecompensasen elfuturoinmediatoaaquellasenunfuturolejano. Nuestroenfoque,entonces,
asumequeel agentetomaunaaccin encadapasoeneltiempo(entendemosportomaruna
accin,tantoelhechodeejecutarrealmenteunaaccinenelmundo,comoeldeaplicarunope-
radorenelgrafodebsquedadel modelodelmundo).Cadaaccingeneraruncambioenlades-
cripcindel estado-bienun cambiorealmentepercibidoporel agente, o bienunocalculado
mediantelaaplicacindeunoperadorenelmodelo.
Sean unnododelgrafodeestadosdelagente. Sean unafuncindeestrategiadeactuacin
queal aplicarlaaunnododevuelvecomoresultadolaaccinprescritapordichaestrategiapara
esenodo. Sear(n, a) larecompensarecibidaporelagentecuandotomaunaaccina enni. Sila
accin llevaalnodonj' entonces podramostener r(n,a) = -c(n, n) + p(n), donde p(n) esel
valordealgntipoderecompensaespecialporllegaralnodonj" Algunasestrategiasconducena
descontarrecompensasfuturas mayoresqueotras.Nosotrosbuscamosunaestrategiaptima,n*,
quemaximiceeldescuentodelarecompensafuturaencadanodo.
Dadaunaestrategia,n, podemoscalcularunvalorV"(n) paracadanodon delespaciodeesta-
dos; V"(n) eslarecompensatotalquesedescontarsielagentecomienzaenelnodon yutilizala
estrategian. Supongamosqueestamosenelnodoni' yquetomamoslaaccinprescritapor1t(n),
quenosllevaalnodonj. Podemosverque:
V"(n) r [ni' n(n)] + yV"(n)
dondeO< Y< 1eselfactordedescuentoqueseutilizaparacalcularel valorenel instanteti de
unarecompensaenelinstantet = ti + l' Yn(n) eslaaccinprescritaporlaestrategian enelnodo
ni Paralaestrategiaptiman*, tendremosque:
V"(nJ = max(r [ni' a] +yV", (n))
a
Planificacin,actuacinyaprendizaje
Esdecir,el valorden conlaestrategiaptimaeslarecompensatotalqueelagenterecibeal
tomaresaaccinenn almaximizarlasumadelarecompensainmediatamselvalordesconta-
do(pory) denj (n) esunafuncindelaaccina, quetambinhacequeV"'(n) seaunafuncinde
a). Siconociramos los valoresdelos nodos conunaestrategiaptima(sus valores ptimos),
podramosrescribirlaestrategiaptimadelasiguienteforma, anmsinteresante:
n' (ni) =m;x(r [ni' a] + yV,,' (n})
Elproblemaesque,porlogeneral,noconocemosestosvalores. Peroexisteunprocedimiento
deaprendizaje,llamadoiteracin del valor, que(bajociertascircunstancias)convergerhacialos
valoresptimos.
El procedimientodeiteracindel valor operade lasiguiente manera. Comenzamos asig-
nando,deformaaleatoria,unvalorestimadoVen) acadanodon. Supongamosqueenalgnpaso
delprocesoestamosenelnodoni' Yqueelvalorestimadodelnodoni esVen;). Enestasituacin,
seleccionaremosaquellaaccina quemaximicelasumadelarecompensainmediatamselvalor
estimadodelnodosucesor(asumimosaququetenemosoperadoresquemodelanlosefectosde
lasaccionesyquepueden seraplicadosalosnodosparaproducirnodossucesores).Supongamos
queestaaccina nos conduceal nodonj. Entoncesactualizaremosel valorestimado Ven) del
nodoni talcomosigue:
Ven) (l + +YV(n)]
Losvaloresestimadosdelosnodosrestantescontinuarnsincambios.
PodemosobservarcmoestereajustedeV(n
i
) hacequeVen;) seincremente(enunacantidad
dependientede acercndosea [r(ni' a) +yV(n)]. Estereajustenosayudaahacerde Ven;) un
estimadormejorde V"*(n), enlamedidaenqueVen) seaunbuenestimadordeV"*(n).
El procedimientodelaiteracindelvalorse sueleexplicarparauncasomsgeneralenelque
lasaccionestienenefectosaleatoriosyproducenrecompensasaleatorias-ambascosasdescritas
mediantefuncionesdeprobabilidades.Entonces,teniendoencuentaqueO< < 1, Yquevisitamos
cadanodomuchsimasveces,laiteracindelvalorconvergeralosvaloresptimos-losvalores
esperadosenelcasoprobabilstico(endominiosdeterministassiemprepodemosutilizar 1).
Esteresultadoesalgosorprendente,yaqueestamosexplorandoelespaciodeestadosutilizando
unaestimacin (quiz mala) delaestrategiaptima, al mismo tiempo que estarnos intentando
aprenderlosvaloresdelosnodosbajodichaestrategiaptima.Vaseuntratamientocompletode
laiteracindelvalor, de algunosprocedimientosrelacionados,desus relacionesconlaprogra-
macindinmicaydesuspropiedadesdeconvergencia,en[Barto;Bradtke,ySingh, 1995].
Elaprendizajedeestrategiasdeactuacinencontextosenlosquelasrecompensasdependen
deunasecuenciadeaccionesinmediatassedenominaaprendizaje con refuerzo retardado. Pero,
cuandolasrecompensassonretardadas,sepresentandosproblemas.Elprimeroesquedebemos
confiarenaquellosparesestado-accinmsresponsablesdelarecompensa.Latareaparahacer-
losedenominaproblema de la asignacin de confianza temporal. Laiteracindel valoresuno
delosmtodosdepropagarlaconfianzademaneraquelasaccionesapropiadasseanreforzadas.
El segundoproblemaesqueenlosespaciosdeestadosdemasiadograndescomoparaalmacenar
el grafoenterodebemos agregarestados con valores similares de V. Latareaparahacerlo se
denominaproblema de la asignacin de confianza estructural. Las redes neuronales y otros
mtodosdeaprendizajehansidomuytilespararesolveresteproblema.Unabuenarevisindel
aprendizajeconrefuerzoretardadoseencuentraen [Kaelbling;Littman,yMoore, 1996].
160
161
Nuestrociclopercibir/planificar/actuaresunainstanciadeloqueAgre yChapmanllamanpla-
nificacin intercalada [AgreyChapman,1990].Elloscontrastanlaplanificacinintercaladacon
supropuestadeimprovisacin. Enpalabrassuyas[AgreyChapman, 1990,p. 30]:
Laplanificacinintercaladaylaimprovisacindifierenensuconceptualizacindelconcepto
deduda. Enelcontextodelaplanificacinintercalada,unoasumequeelestadodecosasobe-
deceaun plan.Laduda,porasdecirlo,esunfenmenomarginal.Enelcasodelaimpro-
visacin,unosuponequenoesprobablequeelestadodecosasconcuerdeconelplan;ms
bienalcontrario,unoesperatenerquedecidir, yvolveradecidircontinuamente,quhacer.
Pero,noestareadeldiseadordelagenteasegurarsequeelsistemaperceptualyelsistema
motorestndiseadosdetalmaneraque(teniendoencuentalatareayelentorno)ladudasea
algomarginal?LosplanesenformaderbolesT-R [Nilsson, 1994Jsonlosuficientementerobus-
tos como paraenfrentarsea ladudamarginal. Params informacinacercadelaplanificacin
intercaladaconlaejecucinvase [Stentz, 1995;StentzyHebert, 1995,yNourbakhsh, 1997].
Diversasconsideracionesacercadelabsquedaorientadaasubobjetivossepuedenveren
[Chakrabarti; Ghose, y DeSarkar, 1986]. Paramodelos y anlisis sobre planificacinjerrqui-
cavase [Korf, 1987] y [Bacchus yYang, 1992],respectivamente. [Stefik, 1995, pp. 259-280]
realizaunaexposicinclarasobrelaplanificacinjerrquica.
Enlabsquedaconhorizonte,unodebedecidircules el horizonteaelegir. Estetipode
decisindebebuscaruncompromisoentrelacantidaddeclculoadicionalnecesariayelvalorde
laaccinrecomendadaporelclculorealizado.Estedilemaseveafectadoporelcostederetardar
laactuacin.La comparacindelvalorasociadoaaumentarel clculoyelvalordelaaccininme-
diataesunainstanciadecomputacinenelmetanivel.Estetemasetrataendetalleen[Russelly
Wefald, 1991,Cap.5]. SualgoritmoDTA* implementaalgunasdesusideasenestetema.
[LeeyMahajan, 1988]describenalgunosmtodosparaelaprendizajedefuncionesdeeva-
luacin.Elmtododelaprendizajeconrefuerzoretardadoyelmtododelaprendizajebasadoen
diferenciastemporalesestnntimamenterelacionadosconlaprogramacindinmicaestocsti-
ca; vase [Barto, Bradtke, y Sngh, 1995, y Ross, 1988]. Para ver ejemplos de sistemas de
robots que aprenden estrategias de actuacin basadas en recompensas vase [Mahadevan y
Connell, 1992),yvarioscaptulosde[ConnellyMahadevan, 1993b]. [MooreyAtkeson, 1993]
presentanmtodoseficientesderefuerzobasadoenlamemoriaparacontrolarsistemasfsicos.
[Montagueet al., 19951 presentanunmodelodel comportamientodebsquedadelasabeja<;basa-
do en el aprendizaje por refuerzo, y [Schultz; Dayan, y Montague, 1997] describen cmo los
mecanismosneuronalesenprimatesimplementanlosprocesosdeaprendizajebasadosendife-
renciastemporales.
10.1. (CortesadeMattGinsberg.)La bsquedaorientadaasubobjetivosesunatcnicaenlaque,
envezdebuscaruncaminodirectoalobjetivo,unoidentificaunsubobjetivoqueesunnodo
queesta,msomenos,mediocaminoentreel nodoinicioyelnodoobjetivo.Primerointenta-
mos encontrar un camino aceptable hasta el objetivo que pase a travs de este subobjetivo
(encontrando primero uncaminodel nodo inicio al subobjetivo, y siguiendodespus desde el
subobjetivoal objetivo);sinoseencuentrauncaminoaceptablehastaelsubobjetivo,intentamos
Planificacin,actuacinyaprendizaje
resolverel problemaoriginal.Asumimosque labsquedaslo se puederealizarhaciadelante
--esdecir,avanzandohaciael nodoobjetivo.
l. Supongamosque,paracualquiervalorded, eltiemporequeridoparabuscarenunrbol
confactorderamificacinb Yprofundidadd eskb
d
, queeltiemponecesarioparaidenti-
ficarunsubobjetivoadecuadoesc, yquelaprobabilidaddequeelsubobjetivorealmen-
teseencuentreenelcaminocorrectohastaelobjetivoesp. Definacondicionessobrep y
c, bajolascuales,el tiempopromediorequeridoparaelenfoquedebsquedaorientadaa
subobjetivosseamenorqueelrequeridoporlabsquedaprimeroenanchura.
2. Dunejemplodeunproblemadebsquedaenelquelabsquedaorientadaasubobjeti-
vos obtengaunahorrodetiempo.
10.2. Considere un problemadel mundo de bloques en elcual hayN bloques que se pueden
encontrarenunasituacininicialarbitraria,yquedebenestarenotrasituacinobjetivoarbitra-
ria (aqutambin ignoraremos las posiciones horizontales de los bloques y aquellas que con-
ciernenconsusposicionesverticalesenlaspilas).Supongamosqueutilizamoscomo subobje-
tvoelestadoenelquelosN bloquesestntodosenelsuelo.Discutalasimplicacionesdeeste
enfoqueentrminosdebsqueda,memoria,requisitosdetiempoy longituddelasolucin.
10.3. Explique cmo realizara una bsqueda jerrquica sobre el siguiente grafo. Se desea
obteneruncaminodesdecualquiernododelgrafohastaelnodomarcadocomoObjetivo(aun-
quelabsquedajerrquicanoesnecesariaparaestegrafotan pequeo,esteejercicioleharpen-
saracercadelabsquedajerrquicaengrafosmsgrandesendondeseradeayuda,sinonece-
saria).
Objetivo
10.4. Imagineunagentequeseencuentraconunespaciodeestadosmuygrande.Asumimosque
elgrafodeestadostieneunordendeb
d
nodos,dondeb eselfactorderamificacinpromedio,y
d esladistanciamediaentredosnodoselegidosaleatoriamentedelgrafodeestados.Queremos
comparardosestrategiasdediseoparacrearunagentecapazde llegaraunestadoobjetivoarbi-
trariodesdeunestadoinicialarbitrario. Unaestrategiaseraplanificarun caminoentiempode
ejecucinutilizandoDIA*; esdecir,cuandonosfuesedadounestadoinicialyunestadoobjeti-
vo,elagenteutilizarael DIA* paracalcularuncamino.Laotraestrategiaconsistiraenprecal-
cularyalmacenartodoslosposiblescaminos, paratodoslosestadosobjetivoyestadosinicio.
Compareestasdosestrategiasentrminosdecomplejidadentiempoyenespacio(puedeutilizar
aproximacionesapropiadasparavaloresgrandesded).
162
10.5. Tiene untrabajotemporalenunaciudaddesconocida, yhaquedadocon unamigode la
zonaque lellevarcadamaanaensu vehculohastaunaestacindemetro, estacindesdela
cual,haciendovariostransbordos,podrllegaraltrabajo(elamigo,queesrepartidorenlaciudad,
ledejaendiferentesestacionescadada). Lasestacionesdelmetro(delascualeshayun nmero
finito)estndistribuidasenunacuadrcularectangular.Unadelasestaciones,llammoslaEsta-
cinCentral,eslaquetienequeencontrarparaconseguiriral trabajo. Siemprepuedereconocer
cundohallegadoalaEstacinCentraLEncadaestacinpuedeelegircuatrodirecciones, nor-
te,este,suryoeste.Cadametroeslocalylellevaaunaestacinadyacenteenlacuadrcula,en
dondedebebajarycogerotrometroparacontinuar.Algunasdelasconexionesentreestaciones
adyacentesestnpermanentementefueradeservicio(unainfraestructuradecadente),perosesabe
quetodavaexistealgncaminoenlacuadrculahastalaEstacinCentral.Cadavezquevisite
unaestacin,debepagar1dlar,yrecibe 100dlarescadadaqueapareceeneltrabajo.Nodis-
ponedeningnmapaderutas, ynoconocelaslocalizacionesrelativasdelasestacionesrespec-
toalaEstacinCentraL Utilicelaiteracindelvalorparadesarrollarunaestrategiadeactuacin
parasaberqumetrodebecogerencadaestacin.Laiteracindelvalorpareceunmtodoade-
cuado,yaquesiemprepuedeleerelnombredelaestacinenlaqueseencuentra,losmetrosque
puedecogerylasestacionesalasquevan.
L Describacmotrabajaralaiteracindelvalorenesteproblema.Seranecesariounfac-
tordedescuentotemporal?Porquoporquno?Demuestreque,siajustalosvaloresde
lasestacionesamedidaqueviaja,yquesiutilizaestosvaloresparaseleccionarlostrenes,
acabarenlaEstacinCentralencadaviaje (Consejo: demuestreprimeroque sualgo-
ritmo ajusta los valores de tal manera que nunca cae en caminos sin fin a travs de
algnsubconjuntodeestacionesquenoincluyenalaEstacinCentral).
2. Sisualgoritmode aprendizajenogarantizalageneracindelosvaloresparaqueenalgn
momentoseobtenganviajesptimos(caminosmscortos),expliqueporqunoyquse
deberahacerparagarantizarlaoptimalidad.
10.6. Considereeldiagramadetransicinentreestadosquesemuestraacontinuacin. Haydos
acciones posibles desde el estado inicioA. La accin a, lleva al estado B y se obtiene una
recompensadeO. Laaccinb, llevaalestadoeyproduceunarecompensainmediatade 1.000.
Unavez enelestadoB, sloexiste una accinposible, que produce unarecompensade+1 Y
retornaalestadoB. Unavezenelestadoe, haytambinslounaaccinposible,queproduce
unarecompensade-1 yretornaal estadoC. Qufactordedescuentotemporalsenecesitara
parapreferirlaaccina alab?

Mtodos
alternativos de
queda y otras
aplicaciones
Las tcnicas de bsqueda tambin pueden ser aplicadas a otro tipo de problemas aparte del
problema de la seleccin de acciones por parte de un agente. Concretamente, aplicando los
mtodosdebsqueda,podemosresolverproblemascomoeldelaasignacindevaloresauncon-
juntodevariablesqueestnsujetas a unaseriederestricciones, o losde optimizacindefun-
ciones.Hayquetenerencuentaquesehandesarrolladotcnicasespecficasparaestetipodepro-
blemas, y aunque pueda parecerque no son relevantes en el diseo de agentes, son bastante
importantesenelcampodelalA.Enestecaptulopresentaremosalgunasdeestastcnicas.

.. Problemas de asignacin
,,,._..... ..,, ....
Lacondicinmediantelacualseidentificaun nodoobjetivode ungrafodebsquedasepuede
definirentrminosdeunadeterminadaestructuradedatosodeunadescripcinque sirvapara
etiquetardichoestado,otambinsepuededefinirimplcitamentepormediodecondicionesores-
triccionesdefinidassobredichaestructuradedatos.Encualquiercaso,cuandoel objetivodelpro-
blemaesqueun agenteencuentreunadeterminadasecuenciadeacciones,msimportantequela
estructuradedatosqueidentificaelnodoobjetivoeslasecuenciadeaccionesquenosconducen
al.Alternativamente,cuandoelnodoobjetivonoestespecificadoporunadeterminadaestruc-
turadedatosy sedefinamedianteunaseriedecondicionesorestricciones,elproblemasepue-
dedefiniren trminosdel clculodeunadeterminadaestructuradedatosquesatisfagadichas
condiciones,teniendoencuentaquelasecuenciadeaccionesatravsdelacualllegamosadicho
objetivoenelgrafodeestadosesirrelevante.Aestaclasedeproblemaslosdenominamospro-
blemas de satisfaccin de restricciones. Unelementotpicodeestac1a<;e loconstituyenaquellos
problemasenlosquesetienenqueasignarvaloresaunaseriedevariablessujetasaunconjunto
derestricciones.Estetipodeproblemasrecibeelnombredeproblemas de asignacin, y sernel
objetodelanlisisquevamoshacerenesteapartado.
Pararesolverunproblemadesatisfaccinderestriccionespodemosutilizarlos mtodosde
bsquedasengrafosdeestados.Enestecaso,elnodoobjetivoestardefinidoporunaestructu-
163
165
Mtodosalternativosdebsqueday otrasaplicaciones
Figura11.2.
Unamatrizparaelproblemadelageneracindeuncrucigrama.
representeauncrucigramavlido. Los operadoresdeesteproblemanos deben permitirtrans-
formarunamatrizdeletrasyespaciosenblanco,enotramatrizconlasmismascaractersticas,
perodistintocontenido.Porejemplo,unposibleoperadorpodraaadirunapalabraaunafilao
columnavaca,opodracambiarunaletraporotra.

Pararesolverlosproblemasdeasignacin,podemosutilizarlosmtodosdebsquedaanalizados
enlosdoscaptulosanteriores. El planteamientomsdirectoconsisteenintentarconstruirlaasig-
nacinrequeridapasoapaso-aunquerealmentenoestemosinteresadosenlospasos-oPode-
moscomenzarelproblema(nodoinicial)enunasituacinparalaqueno sehayarealizadonin-
gunaasignacin. Porejemplo,enel problemadelasochoreinas,laestructuradedatoscorres-
pondientealestadoinicialseraunamatrizllenadeceros.Cadaoperadoraadiraunareinaala
matriz,detalformaquelamatrizresultantesatisfagalasrestriccionesentresusreinas. a
unareina..en.<;;ada s.uPQncr..,Snpetdid
a
.de.generalidad,
Ocoloca una enlaprimeracolumna;el
apli<;(ldo alnodQ unareinftenJa Yassucesivamente.
Este planteamiento recibe el nombre de mtodo constructivo, ya que se vaconstruyendo la
so1uC6ndeformaincrement;aI,pasoapas(msadelanteanilizaremosunmtodoalternativo).
EnlaFigura11.3 sepuedenverpartesdelosrbolesdebsquedaquepodransergenerados
aplicandounmtodoconstructivoalproblemadelasochoreinasyaldelageneracindecruci-
gramas(porlegibilidad,hemosrepresentadolalocalizacindeunareinamedianteunaX, envez
de utilizarunamatrizllenadecerosyunos). Enlamismafigurasepuedenapreciarlosopera-
doresaplicadosparagenerarunnodoapartirdeotro.Obviamente,elespaciodeestadosparael
problemadelcrucigramaesenorme;encadanodosepuedenaplicarmilesdeoperadores.
a,reducir
se conj\lntamenteconun mtodo
Constructivo-ya cag-.pas()se lasvariables-oDescribi-
remosestatcaviendocmoseapicaaunaversinreducidadelproblemadelasochoreinas.
Consideremoselproblemadecolocarcuatroreinasenuntablerode4x 4,detalformaquelas
reinasno sepuedancapturarentres. Enesteproblema,alquedenominaremosproblemadelas
cuatroreinas,tenemoscuatrovariablesql' q2' q3 Yq4' querepresentanlascolumnasdel tablero,de
la primera a lacuarta respectivamente, en las que podemos colocar una reina. Cada una de
x
x
x
x
x
x
x
x
Figura11.1.
Unaposiblesolucinal problemadelasochoreinas.
radedatos(oladescripcin delestado)quesatisfagalasrestricciones.Losoperadoresnosper-
mitirnmodificarlaestructuradedatos,y, porltimo,elnodoinicioestardefinidoporalguna
estructuradedatos inicial. Un buenejemplodeproblemadeasignacines elproblema de las
ocho reilUls. Elproblemaconsisteensituarochoreinasenunatablerodeajedrezdetalforma que
cadaunadelascolumnasyfilasestocupadaporunareina,conlarestriccinadicionalde queen
cadafila,columnaodiagonalslopuedehaberunanicareina(esdecir,nopodemoscolocaruna
reinaenunaposicinenlaquepuedasercapturadaporotra).EnlaFigura1].1sepuedeveruna
delasposiblessolucionesal problema.Podemosconsiderarquesteesun problemadeasigna-
cin, ya quelopodemosplantearcomolaasignacindeunaseriedevalorespertenecientesal
conjunto{tila1,fila2,...,fila8},aunconjuntodevariables(posicindelareinaenlacolumna
1, posicindelareinaenlacolumna2, ...,posicindelareinaenlacolumna8).
Siqueremosplantearesteproblemacomounabsquedaenungrafodeestados,unaestruc-
turadedatosquepodemosutilizarseraunamatrizde8x 8enlaquecadaceldapuedecontener
dossmbolos,unoquerepresenteunareina(1)yotroqueindiquequelaceldaestvaca(O). El
estadoobjetivoquedadefinidodeformaimplcitaporlacondicindequeningunareinapuede
ser capturada. Los operadores definirn las distintas formas que existen de modificardichas
matrices. Porejemplo, podramosdefiniroperadores paracolocarunareinaenunamatrizque
todavanoestcompleta,oparamoverunareinade unaceldaaotra.Enlosproblemasdeasig-
nacin,yteniendoencuentaqueelcaminohastaelobjetivocarecedeimportancia,generalmente
tendremosvariasposibilidadesparadecidirculeselestadoinicialyelconjuntodeoperadores
quevamosausar.
Otroejemplodeproblemadeasignacin,queademstieneunespaciodebsquedabastan-
tegrande,eselproblemadelageneracindecrucigramasl. EnlaFigura11.2sepuedeveruna
matriz ejemplo para el problema de la generacin de crucigramas. El problema consiste en
rellenartodaslasceldas blancasdelamatrizconletras,detal formaquetodas lascolumnasy
filas contenganpalabrasquepertenezcana un idiomadeterminado.Aqunoconsideraremosla
otrapartedelproblema,queconsisteenlageneracindelconjuntodepistasqueseledarnala
personaquetienequeresolverelcrucigrama.Paraesteproblema,unaposibledescripcindelos
estadosconsistiraenunamatrizllenadeletrasyespaciosenblanco(juntoconlasceldasenlas
quenosepuedencolocarletras).Elestadoobjetivopuedesercualquiermatrizllenadeletrasque
1 MattGinsbergy susestudianteshananalizadodistintastcnicasdebsquedaenespaciosdeestadosparaelpro-
blemadelageneracindecrucigramas[Gisnberget al. 1990].
166
167
InteligenciaartificiaL Unanuevasntesis

'Xi i i ; i

Figura11.3.
Espaciodeestadosparaunplanteamientoconstructivo.
estasvariablespuedetomarunodeestoscuatrovalores: 1,2,3Y4,quecorrespondenalafilaen
laquecolocamoslareina.As,porejemplo,si lavariableq3 tieneelvalor2,estonosindicaque
unareinahasidocolocadaenlacolumna3ylafila 2.Elproblemadelascuatroreinasestablece
unaseriederestriccionesentrelasvariables;as,porejemplo,si q tieneelvalor1, qz nopuede
tomarlosvalores 1o 2.
. dirigidodeuomjnadQ,g.mfQ,de
restricciones. Cadanododelgraforepresentaaunavariableyesetiquelconelconjuntod
pOSTblS variable. Un arco de restriccin dirigido (i, })':-Conecta un par
de i yj, silosposibles dela
prelv.ttIavariablrepresentadapor iu)dqTEnIaFigura 11.4sepuedeverunejemplo
de'e'sttipodegrafosparalproblemadelascuatroreinas.Enesteproblema,comotodaslas
variables se restringen entre s, todos los nodos del grafo poseen arcos hacia el resto de los
nodos. Qkemos S paracadaunodelos valores
unvalorenlavariablealprinciplOOeI
arco, i, que noviolelas restricciones. Todos los arcosclergraro'Q'irnrfigllra 11.4 Son consis-
carlapfdenodosq yqj (i *'j)yparacadavalordeq, existeunvalordeqj
quenoviolalasrestricciones.
Unavezquehayamosasignadovaloresaunaomsvariables,podemosutilizarelconcep-
todearco-consistenciaparadescartaralgunodelosvalorescorrespondientesaotrasvariables.
Mtodosalternativosdebsquedayotrasaplicaciones
ql
C3,4}

q2
q4
Figura11.4.
Grafoderestriccionesparaelproblemadelascuatroreinas.
A...l....e:l procesodepropagacin..de..xestricdones atravs detodoslosarcosdel
grafo,eliminandolosvaloresdelavariablealfinaldelairii:Qlili-cicwnplenconlas.restriccio-
Intentoderefrzarlaarco-consistenciad.el E:Lprocesoterminacuandoyano
AnlicemoselprocSoaplicndoloalproblemadelas
cuatro reinas. Supongamos queri proceso'de bsqueda primero en profundidad comienza
asignandoelvalor1alavariableq (esdecir,colocamosunareinaenlaprimeracolumna,pri-
merafila). Lapropagacin de restricciones, aplicadaa estarestriccin, puede procederde la
siguientemanera:
1. Siconsideramosprimeroelarco(q2' q), eliminaremoslasasignacionesq2 1Yq2 2,ya
queelnicovalorquequedaenq (elvalorqueacabamosdeasignar)esinconsistentecon
losvalorescitadosdeqz'
2. Siconsideramos seguidamenteelarco (q3' q), eliminaremoslas asignacionesq3 =1Y
q, =3,yaquesoninconsistentesconel valordeq.
3. Tomandoahoraelarco(q4' q), eliminaremoslasasignacionesq4 = 1Yq4 =4,yaquetam-
binsoninconsistentesconelvalordeq.
Despusdeaplicarestosprimerospa'losdelprocesodepropagacinderestricciones,obten-
dramosel grafodelaFigura 11.5. Enlos siguientes pasos, talycomose muestraen lamisma
figura, seeliminantodoslos valoresdelavariableq3' conloquellegamosalaconclusindeque
nohaysolucinposiblealproblemaconlaasignacininicialq = 1. Portanto,yanotenemosque
168 169
q,
q2 q3
q4
O Valores eliminados al hacer consistentes el arco (q2' q3)
Y despus el arco (q3' q2)
O Valor eliminado al hacer consistente el arco (q3'
Figura 11.5.
Grafo de restricciones pam q = 1.
continuar el proceso de bsqueda por debajo del nodo con q =1, con lo que tenemos que reali-
zar una vuelta atrs y crear en su lugar el nodo q =2.
A partir de aqu podemos continuar con el proceso de propagacin de restricciones, asu-
miendo la asignacin q =2; los primeros pasos pueden ser:
1. Considerar el arco (q2' q) y eliminar las asignaciones q2 == 1, q2 2 Yq2 =3.
2. Considerar el arco (%' q) y eliminar las asignaciones q3 == 2 Y q3 =4.
3. Considerar el arco (o. q) y eliminar la asignacin q4 == 2.
Despus de los pasos anteriores, obtendramos el grafo de la Figura 11.6. Si continuamos con
el proceso de propagacin de restricciones, slo dejaramos un valor para cada nodo del grafo,
consiguiendo que todos los arcos sean arco-consistentes. Por tanto, hemos descubierto que exis-
te una solucin. El proceso de propagacin de restricciones ha encontrado por nosotros esta solu-
cin antes de completar el proceso de bsqueda.
Algunas veces, como hemos visto en el ejemplo anterior, el proceso de propagacin elimina
todas las asignaciones para una o ms variables -lo que nos permite deducir que el problema de
bsqueda no ofrece solucin para un determinado conjunto previo de asignaciones-o Otras
veces, nos indica que dado un conjunto previo de asignaciones, slo existe una solucin posible
Mtodos alternativos de bsqueda y otras aplicaciones
q,
q3 q2
q4
O Valor eliminado al hacer consistente el arco (q3'
O Valor eliminado al hacer consistente el arco (q3' q.)
\ Valor eliminado al hacer consistente el arco (q qz)
Figura 11.6.
Grafo de restricciones para ql = 2.
consistente con las restricciones. En estos casos, la propagacin de restricciones permite detener
el proceso de bsqueda. La idea bsica del proceso de propagacin de restricciones ha sido exten-
dida para incluir comprobaciones ms complejas de la consistencia, pero las aplicaciones ms
comunes y eficientes se basan en la comprobacin de la arco-consistencia que acabamos de expli-
car. La propagacin de restricciones ha sido aplicada a una gran variedad de problemas reales,
entre los que podemos citar el etiquetado de lneas en el anlisis de escenas visuales con las eti-
quetas +, o o el problema de la satisfactibilidad proposicional, que veremos en otro captulo
de este libro. En el artculo de [Kumar, 1992], podemos examinar una excelente revisin de mto-
dos, extensiones y aplicaciones de la propagacin de restricciones.
Reparacin heurstica
Existe otra forma de plantear los problemas para que puedan ser resueltos por los mtodos de bs-
queda en grafos. Este nuevo planteamiento recibe el nombre de reparacin
con;lenza con una para
Por.tanID...cl..ooOOjpjcjaJ se..cQrresp.oude,..c.on..uaa-..
estructura de aatosc:tlej)robablemente no satisface las restricciones. Los operadores utilizados
.... ..., ",<."",' , ., ""', -,'"
deben nuevaestructura desolucin
difgen:te.-
Porejemplo,enelproblemadelasochoreinas,podemosempezarcolocandounareinapor
columnayenunafilaarbitraria.Podemosrepararestasolucinerrneacambiandolaposicin
de unadelas reinas, de tal formaque laconfiguracinfinal viole menosrestriccionesquesu
predecesora.Utilizandounaconocidaversindelareparacinheursticadenominada
[Gu,1989;M1one1at.;i992f,-n..9iJi
ejemplo,empezaramosporlaprimera)y etiquetaramoscada 4e.diGh--G1l!.mn-.f.<!n el
nmero.. .. qtiTaatacan. Unavezrealizadoestepequeocm-:'---
puto,movemoslareinadedichacolumnaalaceldaexpuestaal menorm,ffiero.de ataque,.s(es
decir;el mnimonmerodeconflictos). elmismo
nmero,podelllOSregyerelconflictodeformaaleatoria.Realizandoesteproceso,obtenemos
unncidOsucesorque(quz)iepreserltell.naconfiguracinconmenos violaciones. El proceso
continuaraconelrestodelascolumnas. EnlaFigura 11.7 podemosverunapartedelabs-
quedaprimeroenprofundidadparaelproblemade lasochoreinasenelquese hautilizadoel
procesodelos mnimosconflictos. Nuevamente, hemosindicado las posiciones de lasreinas
medianteunaX, mientrasquelosnmerosdelasceldasrepresentanelnmerodereinasqueata-
2 x
o
x2 x
x 1
x 3
2 x
4 x
1 x
'-
Mover
(1,3)a(1,2)

x 2
;

3
x
11 I I I Ix
1I Ix
2 x
x 1
2 x
2 x
1
1
x 3 x
2 x

/
x
cambios
Figura11.7.
Pasosdereparacinparaelproblemadelasochorenas.
Mtodosalternativosdebsquedayotrasaplicaciones
can a la celda. Planteamientos similares, basados enla reparacin heurstica [Minton el al.,
1990],sehanutilizadoenproblemasmuchomsgrandes,como,porejemplo.elproblemadel
millndereinas2.
Paraaplicarlareparacinheursticaalproblemadelageneracindecrucigramas,podemos
elegircomonodoinicialcualquiermatrizcompletamentellenadeletras. Estasolucinerrnea
puede sermodificadareemplazandoalgunasdelasletrasdelamatriz,para,deestaforma(eso
esperamos),acercarelconjuntodeletrasdeunafilahacaalgunapalabravlida. El espaciode
bsquedaparael problemadelageneracindepuzzlesesenormementegrande,yaqueencada
nodosepuedenaplicarmilesdeoperadoresdistintos.
Sinembargo, hay que teneren cuenta que lautilizacindeun mtodo constructivo o un
mtododereparacinparalamanipulacindeestadosyoperadorespuedetenerefectosdram-
ticosenladificultaddelprocesodebsqueda.
Optimizacin de funciones
Existenproblemasenlosque,envezdetenerunobjetivodefinidoexplcitamente,tenemosuna
funcin, v, definida sobre unaestructuradedatos, siendoel objetivodel procesode bsqueda
localizarunaestructuraquemaximice(ominimice)lafuncin. Siconsideramosquelasestruc-
turasdedatossonpuntosenunespacio,lafuncin sepuedevercomounpaisaje definido
sobredichoespacio. Basndonosenestavisin,podemosdecirqueuntipodemtodosdeopti-
mizacinestconstituidoporaquellosmtodosque recorrenel paisajeenbuscadelospuntos
situadosamayoraltura.Sinembargo,conestetipodemtodosnotenemoslagarantaabsoluta
dequevayamosaencontrarelmximoglobal,yaqueenlamayoradeloscasosstenoescono-
cido.
Entre las tcnicas que seutilizan pararecorrerel espacio se encuentranlos mtodos de
ascensi6n de colinas, querecorrenelespaciobuscandosiempreelpuntoadyacenteconmayor
altura3. Normalmente, los mtodos de ascensin de colinas terminan cuandono se encuen-
tran puntos adyacentes situados a mayor altura-esdecir, cuando alcancemos un mximo
local.
Paraimplementarlosmtodosdeascensindecolinas,podemosutilizarlosmtodosdebs-
quedaengrafos.Aligualqueenloscasosanteriores,losnodosrepresentarnestructurasdedatos.
Losoperadoresindicarnlasdistintasformas porlasquepodemostransformarunaestructurade
datosenotraestructuradedatosadyacente.Conestasconsideraciones,elprocesodeascensinde
colinassemoverporunnicocamino(comosiaplicsemosunabsquedaprimeroenprofun-
didadsin vueltaatrs), evaluandolaalturadecadapunto amedidaque avanza, sin descender
nunca(o,mejordicho,casinunca)aunpuntodeinferioraltura.Acontinuacin,mostramosuna
versinsimpledelalgoritmodeascensindecolinas,quepuederesolverelproblemadeencon-
trar un nodo con un valormximo (obviamente, enla mayora de los casos serun mximo
local).
2 AunqueelproblemadelasN reinases un ejemplotilparailustrarlosprocesosdepropagacinderestricciones
yreparacinheurstica,lociertoesqueexisteunalgoritmoquelopuederesolvercon un ordenlinealdecomplejidad
temporal [AbramsonyYung 1989].
3 Si lo que estamos intentando hacer es minimizar la funcin, hablando estrictamente, deberamos llamarlos
mtodos de descenso. Peroutilizaremoseltnninogenricodemtododeascensinparadescribiramboscasos.Esta
distincincarecedeimportancia,yaquesiemprepodremosconvertirunproblemademaximizacinenotrode mini-
mizacin(y viceversa)multiplicandolafuncinaoptimizarpor-l.
ASCENSION_DE_COLlNAS:
l. Seleccionealeatoriamenteunnodo,no' comonodoactual,n.
2. Generelossucesoresden (utilizandolosoperadoresdefinidosparaelproblema)yselec-
cioneelsucesor,n
b
, paraelquelafuncin v, v(n,) =v, tengaelvalormximo(encasode
queexistanmsdeunsucesorconelvalormximo,elijaunoaleatoriamente).
3. Sivi> < ven), termineelprocesoydevuelvan comoelmejornodoencontrado.
4. Encualquierotrocaso,hagan =ni>' Yvayaalpaso2.
Comopodemosver, estealgoritmoesmuyparecidoaunabsquedaprimeroenprofundidad.
Lanicadiferenciaradicaenelhechodequeenlaascensindecolinas se expandeeldescen-
dienteconelmayorvalordelafuncin (siemprey cuando,este valor seamayorqueelde su
ascendiente),y, adems,noseguardainformacinpararealizarlavueltasatrs.Losmovimien-
tosrealizadossonirrevocables.
Comoejemplo,aplicaremoselprocedimientodeascensindecolinas(realmentedeberamos
decirdescenso de colinas en este caso) al problema de colorear las celdas de una matriz de
dimensiones3x 3. Esteproblemacomienzaconunadistribucininicialaleatoriadedoscolores,
rojoyazul,porlasceldasdelamatriz,siendoel objetivodelproblemaencontrarunadistribucin
quetengaelmenornmerodeceldasadyacentesconelmismocolor.Esdecir, tenemosquebus-
carenelespaciodeestadosunnodo, n*, quecumplaquev(n*)::;; ven) paratodonodon, donde
ven) indicael nmerodeparesdeceldasadyacentesquetienenelmismocolor.Losoperadores
quepodemosutilizarpermitirnmodificarelcolordecualquiercelda(derojoaazul,ovicever-
sa). En la Figura 11.8 se puede ver parte del grafo paraeste problema, adems del camino
seguidoporelprocedimientodedescensodecolinas.
Figura11.8.
Resolucindelproblemade losdoscolores.
Mtodosalternativosdebsqueday otrasaplicaciones
Siseseleccionaun movimientoquenomodificaelvalordev, estonosindicarqueestamos
situadosenunameseta delespaciodeestados.Estasmesetaspuedenprovocarqueelprocesode
ascensindecolinasdeambulesinpararporellas,volviendoavisitarnodosqueyahansidocon-
siderados, sin ascender a terrenos ms altos. Podemos limitar este deambular aadiendo un
contadorqueindiqueelnmerodevecesqueserepiteelvalorv. Podemosatenuarel problemade
las mesetas, siduranteelprocesode ascensinevitamosvisitarnodos que,teniendoel mismo
valorque el actual, yahayan sido visitados. Obviamente, esto slo sepuede haceracostade
aumentarlosrequisitosdememoria.
Tambinpuedenaparecerproblemasdebidosalapresenciadecordilleras(o, porelcon-
trario, barrancos)en elespaciodebsqueda.Enestoscasospuedeocurrirqueelprocesode
ascensinnoencuentreunmovimientoquenoslleveaunnododemayoraltura, quespodramos
alcanzarsiseejecutandosmovimientosseguidos.EnlaFigura11.9sepuedeverdeformaesque-
mticaesteproblema.Cualquiermovimientoquehagamosnosharsalirdelacordillera,mien-
tras que condos movimientos seguidos podramos seguirsubiendoporella. Esteproblemase
puede evitaralgunas veces permitiendola combinacindedos o ms movimientos en lo que
podramosllamarmacro-movimientos,opermitiendounabsquedaanticipadalimitada.
Paraevitarquedamosbloqueadosenunmximolocal", podemosaplicarvariasveceselpro-
cedimientode ascensinde colinas (en paraleloo secuencialmente), empezando endistintas
posiciones.Cadaunadeestasbsquedaspodraterminarenunmximodistinto,conloquela
solucinfinalseraelmayordetodosellos.ElmtodoPGpresentadoenelCaptulo4sepuede
considerarcomo unaversinestocsticade laascensinde colinas, en laqueexisten varios
escaladorestrabajandoenparaleloylosmovimientosimplicanlacreacindegeneracionesde
escaladores.Lafuncinaoptimizareslafuncindeidoneidad. LaeficienciadelosmtodosAG
yPGpuedesercomparablealadedistintasversionesdelprocedimientodelaascensindecoli-
nas [JuelsyWattemberg, 1996,yO'ReilIyyOppacher, 1994].
Elprocesodelenfriamiento simulado [Kirkpatrick;Gelatt,yVecchi, 1983] tambinpuede
sertil paratratarconlos mximos(o mnimos)locales. Existendiferentes versionesdeeste
proceso;enunadeellas, sevanseleccionandolos movimientosdeacuerdoconunadistribucin
deprobabilidaddefinidasobreelconjuntodeposiblesmovimientos. Ladistribucindeproba-
bilidadtiendeafavorecerlosmovimientoshacianodossituadosamenoraltura(otravezelpro-
Figura11.9.
Elproblemadelacordillera.
ceso de descenso de colinas). El proceso comienza con una distribucin de probabilidad que
apenas favorece los movimientos hacia los nodos ms bajos. Gradualmente, el proceso va
aumentando su predisposicin a los movimientos hacia nodos ms bajos hasta que, muy avan-
zado el proceso, la probabilidad de seleccionar un movimiento hacia zonas ms bajas es muy
alta. Es decir, al principio del proceso estaremos movindonos de forma aleatoria por el paisa-
je. Sin embargo, a medida que el proceso va avanzando, empezaremos a descender a alguno de
sus valles. Si el valle no es muy profundo, probablemente tampoco ser muy ancho, con lo que
pronto ejecutaremos un movimiento que nos har salir de l. En cambio, es menos probable que
nos salgamos de un valle ms ancho (y probablemente ms profundo), con lo que al final del
proceso (cuando ya no haya movimientos aleatorios), estaremos situados en el punto ms bajo
del paisaje. Este mtodo toma su nombre por la similitud que tiene con el proceso de enfria-
miento que se realiza en el campo de la metalurgia. Este proceso consiste en hacer descender de
forma gradual la temperatura de un determinado material, permitiendo que su estructura crista-
lina alcance un estado de mnima energa. En el enfriamiento simulado, el parmetro que con-
trola la anchura de la distribucin de probabilidad, normalmente, recibe el nombre de tempera-
tura.
11.1. Teniendo en cuenta la imagen mostrada en el Ejercicio 6.4 del Captulo 6. Explique cmo
se podra utilizar un grafo de restricciones y el proceso de propagacin de restricciones para
encontrar un etiquetado consistente para dicha imagen.
11.2. Usando el mtodo de la reparacin heurstica, resuelva el problema del coloreado del
mapa de la siguiente figura, de tal forma que dos regiones adyacentes no tengan el mismo color.
Comience el problema con la distribucin de colores de la figura.
Rojo
11.3. Resuelva el problema de las cuatro reinas utilizando el procedimiento de mnimos con-
flictos. Comience con todas las reinas colocadas en la misma diagonal y, en caso de que existan
conflictos, resulvalos de forma aleatoria (hacer este problema a mano puede resultar bastante
tedioso, pero merece la pena hacerlo al menos una vez).
11.4. Resuelva el Ejercicio 7.3 (el problema del misionero y los canbales) si todava no lo ha
hecho. Sea la funcinf= el nmero total de personas en la orilla del ro que hace de salida, se
puede resolver este problema mediante el mtodo del descenso de coln as aplicado a la funcin}?
Razone la respuesta.
Bsqueda
en problemas
de juegos
Juegos de dos jugadores
Uno de los desafos que nos plantebamos en el Captulo 10 implicaba el desarrollo de mtodos
de planificacin y actuacin para entornos en los que estaban presentes otros agentes. La falta de
conocimiento sobre la forma de actuar del resto de los agentes impide que la arquitectura con la
que implementamos el ciclo de percepcin/planificacin/actuacin pueda desarrollar planes
para un futuro muy lejano, ya que ste es impredecible. Sin embargo, cuando se dispone del
conocimiento necesario, un agente puede construir planes que tengan en cuenta los efectos de las
acciones desarrolladas por otros agentes. Consideremos un caso especial en el que slo existan
dos agentes. Una situacin idealizada en la que los agentes pueden tener en cuenta la accin
tomada por el otro agente, sera aquella en la que las acciones de los agentes estn entrelazadas;
es decir, primero acta un agente, despus el otro, y as sucesivamente.
Por ejemplo, tengamos en cuenta el espacio cuadriculado de la Figura 12.1 en el que exis-
ten dos robots, a los que llamaremos blanco y Cada robot se puede mover a una
celda adyacente que est en su fila o en su columna. Los movimientos se realizan de forma
11
Figura 12.1.
Dos robots en un nudo cuadriculado.
175
176
177 Bsquedaenproblemasdejuegos
""
alternativa (porejemplo, primero semueve el blanco), y cada vez que a un robot le toque
moverse,tienequemoverseaalgunacelda.Supongamosqueelobjetivodelrobotblancoesel
desituarseenlamismaceldaenlaqueestsituadoelrobotnegro,mientrasqueelobjetivodel
robotnegroconsisteenevitarqueestoocurra.Elrobotblancopuededesarrollarplanescons-
truyendounrboldebsquedaenelque,ennivelesaltemativos,setenganencuentalosposi-
blesmovimientosdelrobotnegro. EnlaFigura12.2sepuedeverunapartededichorbol de
bsqueda.
Parapoderseleccionarel mejormovimiento,elrobotblancotienequeanalizarelrbolde
bsqueda y determinar las consecuencias de todos los posibles movimientos -teniendoen
cuentaque el robot negro intentar evitarque el robot blanco consiga su objetiv()--. Existen
situacionesenlasqueesposiblequeunagenteseleccioneun movimientoquelepermitaalcan-
zarsuobjetivo,independientementedelosmovimientosquepuedahacerelotroagente.Aunque
lo mscomnesque, debido a las limitaciones computacionalesy temporales, ningn agente
puedaencontrarunmovimientoquegaranticelaconsecucindesuobjetivo.Enestecaptulopre-
sentaremosmtodosdebsquedalimitadoshorizontalmentequesirvenparaencontraracciones
heursticamenterazonablesenestassituaciones.Encualquiercaso,despusdehaberdecididoel
primermovimiento,elagentelotienequeejecutar,despustienequepercibirloquehahechoel
otroagentey, posteriormente,tienequerepetirelprocesodeplanificacin,talycomosehaceen
unciclodepercepcin/planificacin/actuacin.
El ejemploqueacabamosdeexponeresunejemplodeloquesedenominanjuegos de dos
jugadores, con informacin completa o de suma cero. Supondremosquelosdosagentes,deno-
Posiblesmovimientos
delrobotblanco
Posibles
Figura12.2.
rboldebsquedaparalosmovimientosdelosrobots.
minadosjugadores, vanrealizandomovimientosdeformaalternativahastaquealgunodeellos
gane (y, portanto,elotropierda), ohastaquesellegueaunasituacindeempate. Cadajugador
tieneunmodelocompletoyperfectodelentorno,desusmovimientosylosdesusoponentes,y
delosefectosdelosmismos(aunqueningunodelosjugadorestengaconocimientodeloqueel
otrojugadorvayaa haceren cualquiersituacin). El anlisis de estetipodejuegosnos puede
ayudaracomprenderciertosaspectospropiosdeunasituacinmsgeneralenlaquetengamos
variosagentes-inclusosilosobjetivosdestosnoentranenconflicto.
Aestetipodejuegospertenecenjuegostancomunescomoelajedrez,lasdamasyelgo. En
realidad,sehanescritoprogramasquepermitenalosordenadoresjugaraestosjuegos-enalgu-
noscasos,aniveldecompeticin-oAunqueeljuegodelastresenrayanoesinteresantedes-
deel puntodevistacomputacional, susimplicidad10 hace idneoparailustrarlastcnicasde
bsquedaenjuegos.Algunosjuegos(comoelbackgammon)tienenunacomponentedeazar, lo
queloshacemsdifcilesdeana1izar.
Enmuchosjuegos,unaformabastantenaturaldedescribirelespaciodeestadosconsisteen
utilizarrepresentaciones icnicas-especialmenteenjuegosdetablerocomoel ajedrez-oEn
nuestroejemplodedosrobots enunmundocuadriculadodedimensin8x 8, hemosutilizado
matricesdedimensin8x 8pararepresentarlasdiferentesposicionesdelosrobotsl.Losmovi-
mientos permitidosen el juego se representan medianteoperadores que transforman unades-
cripcin de un estado en otra. El grafo de bsquedadeljuego se define de forma implcita
medianteunnodoinicialylosoperadoresquepuedenserutilizadosporcadaunodelosjuga-
dores.Utilizandolastcnicasanalizadasenloscaptulosanteriores,podemosconstruirlosrbo-
lesdebsqueda,aunqueparalaseleccindemovimientosempleemostcnicasdiferentes.Enlas
siguientesseccionesanalizaremosestastcnicas.
El procedimiento minimax
Deaquenadelante,ennuestroanlisisdelosjuegosdedosjugadores,llamaremosalosmismos
MAX yM/N. Portanto,nuestratareaconsistirenencontrarel mejor movimientoparaMAX.
AsumiremosqueMAX realizael primermovimiento,yque, apartirdeah,losjugadoresvanrea-
lizandomovimientosdeformaalternativa.Portanto,losnodosconprofundidadparcorresponden
a situacionesenlasqueMAX tienequerealizarelsiguientemovimiento;aestosnodoslos lla-
maremosnodosMAX. Porel contrario, los nodos conprofundidadimparse correspondencon
situacionesenlasqueelsiguientemovimientotienequeserrealizadoporM/N; aestosnodoslos
llamaremosnodosM/N (el nodorazdeunrboldebsquedaenjuegostiene profundidadO).
Unacapa de profundidad k enunrboldebsquedaenjuegosestformadaporelconjuntode
nodosqueestnaprofundidad2k y2k +1, Ysirveparaindicarlaprofundidaddelasbsquedas
cuandok representael nmerodeparesdemovimientosalternativos que seexploranantesde
decidirelmovimientoatomar.
Comoyahemosmencionado,unabsquedacompleta(paradeterminardirectamentecmo
ganar,perderoempatar)escomputacionalmenteinabordableenlamayorpartedelosjuegos.
Se haestimadoqueel grafo completo parael juegodel ajedrez tiene aproximadamente 10
40
nodos.Portanto, senecesitaranaproximadamente 10
22
siglosparagenerarelgrafodebsque-
dacompletodeljuegodel ajedrez,aunquesepudieragenerarunsucesorcadaterciodenano-
1 Sinembargo, en estecaso,se puedeelegirunarepresentacinmejor(cuyafonnulacinsedejaallector)basada
enconsiderarsi ladistanciaentrelosrobotses paroimparcuandoeseltumodel robotblanco.Laparidadsetieneque
mantenerdespus de cadapardemovimientos.
segundo 2 (hay que tener en cuenta que se supone que la edad del universo es de aproximada-
mente 10
8
siglos). Adems, las tcnicas de bsqueda heurstica no reducen el factor de ramifi-
cacin efectivo de forma suficiente como para servir de mucha ayuda. Por tanto, debemos de
aceptar el hecho de que, para juegos complejos, es imposible realizar una bsqueda exhaustiva
hasta la terminacin del mismo (excepto, quiz, durante la fase final del juego). En su lugar,
debemos conformarnos con mtodos similares al proceso de bsqueda con horizonte descrito en
el Captulo 10.
Tambin podemos utilizar las bsquedas primero en anchura, primero en profundidad o los
mtodos heursticos, siempre y cuando modifiquemos las condiciones de terminacin. Podemos
especificar distintas condiciones de terminacin basndonos en factores tales como tiempo limi-
tado, espacio de almacenamiento limitado o mxima profundidad de los nodos en el rbol de bs-
queda. Por ejemplo, es prctica comn en el ajedrez no finalizar el proceso de bsqueda hasta que
algunos de los ltimos nodos alcanzados no representen una posicin viva, es decir, una en la
que se presente un cambio de fichas favorable.
Una vez terminado el proceso de bsqueda, debemos extraer del rbol de bsqueda una esti-
macin de cul puede ser el mejor movimiento. Esta estimacin se puede hacer aplicando una
funcin de evaluacin esttica a los nodos hojas. Esta funcin de evaluacin nos meitirel
valor de la posicin representada por el correspondiente nodo hoja. En el anlisis de los' 0-
les de bsqueda en juegos, normalmente, se adopta el convenio de que las posiciones fav ables
a MAX hagan que la funcin de evaluacin tome valores positivos, mientras que las favorables a
MIN hagan que tome valores negativos; los valores prximos a cero se correspondern con
posiciones del juego que no son favorables a ninguno de los jugadores.
Podemos determinar un buen siguiente movimiento inmediato mediante el procedimiento
minimax (por simplicidad, explicaremos este procedimiento y algunos ms basados en l, como
si el grafo de bsqueda fuese realmente un rbol). Supondremos que si MAX tiene que elegir entre
distintos nodos hojas, elegir aquel para el que se obtenga la mxima evaluacin; en conse-
cuencia, el valor que se le tiene que asignar a un nodo MAX padre de nodos hojas MIN es el
mximo de todas las evaluaciones estticas correspondientes a dichos nodos hojas MIN. Por el
contrario, si MIN tuviese que elegir entre distintos nodos hojas MAX, elegir aquel para el que se
obtenga la mnima evaluacin; por tanto, al nodo MIN padre de varios nodos hojas MAX se le
debe asignar el mnimo de todas las evaluaciones estticas correspondientes a dichos nodos
hojas MAX. Una vez que hayamos realizado este proceso con todos los padres de los nodos hojas,
seguiremos propagando hacia atrs los valores de evaluacin, asumiendo que MAX elegir el
nodo sucesor MIN con mayor valor, mientras que MIN elegir el nodo sucesor MAX con menor
valor.
El proceso contina con la propagacin hacia atrs de los valores evaluados, nivel por nivel,
hasta que, finalmente, se asigne un valor a cada uno de los nodos sucesores del nodo inicial. Esta-
mos suponiendo que le toca mover a MAX, por lo que MAX debe elegir como siguiente movi-
miento aquel que se corresponda con el nodo sucesor del nodo inicial con el mximo valor.
La validez de todo este proceso reside en la suposicin de que los valores asignados a los
nodos sucesores del nodo inicial, calculados mediante el proceso de propagacin hacia atrs,
constituyen una medida ms fiable del valor relativo de las posiciones que representan que la que
obtendramos aplicndole directamente una funcin de evaluacin esttica a dichos nodos. Des-
2 Por el contrario, segn estimaciones de Schaffer, el grafo completo para el juego de las damas slo tiene lO"
nodos [Schaffer y Lake, 1996]. Por tanto, el nmero total de nodos del rbol solucin ser la raz cuadrada de dicha can-
tidad, es decir, 10
9
nodos. Esto se debe a que el jugador MAX slo tiene que mostrar en cada capa que uno de los posi-
bles movimientos lleva a la solucin. Gracias a esta estimacin, Schaffer y Lake consideran que en un futuro no muy
lejano se podr desarrollar una mquina perfecta para jugar a las damas.
Bsqueda en problemas de juegos
pus de todo, los valores obtenidos por propagacin son el resultado de una evaluacin de los
nodos que estn situados en zonas ms profundas del rbol de bsqueda; por tanto, dicha eva-
luacin tendr en cuenta las caractersticas propias de las situaciones ms cercanas al final del jue-
go, donde, presumiblemente, sern ms relevantes.
Podemos utilizar el juego de las tres en raya para ilustrar el funcionamiento del procedi-
miento minimax (en el tres en raya, cada jugador coloca alternativamente una ficha en una
matriz de 3 x 3; un jugador utiliza cruces (X) para indicar sus movimientos, mientras que el otro
utiliza crculos (O). El primero que logre completar una fila, columna o diagonal con sus fichas
gana la partida). Supongamos que MAX utiliza cruces para marcar sus movimientos, que MIN uti-
liza los crculos y que el primer movimiento le corresponde a MAX. Utilizando una profundidad
lmite de 2, podemos realizar una bsqueda primero en anchura hasta que hayamos generado
todos los nodos del segundo nivel, y, posteriormente, aplicar la funcin de evaluacin esttica a
las posiciones representadas por dichos nodos. Una posible funcin de evaluacin, e(p), para este
ejemplo puede ser:
Si p no es una posicin ganadora para ningn jugador, entonces:
e(p) =(el nmero de filas, columnas y diagonales completas que todava estn libres
para MAX) - (nmero de filas, columnas y diagonales completas que todava
estn libres para MIN)
Si p es una posicin ganadora para MAX, entonces
e(p) =00 (donde 00 indica un nmero positivo muy grande)
Si p es una posicin ganadora para MIN, entonces
e(p) =-00
As, por ejemplo, si p representa la posicin:
tenemos que e(p) =6 - 4 =2.
Podemos utilizar las simetras del juego para generar las posiciones sucesoras; por tanto, las
siguientes posiciones se consideran idnticas:
*
=M=###
En las primeras fases del juego, el uso de las simetras nos ayudar a mantener un factor de
ramificacin bajo; mientras que en fases avanzadas del juego, el factor de ramificacin se man-
tendr bajo debido a que el nmero de espacios disponibles es pequeo.
En la Figura 12.3 podemos ver el rbol generado por una bsqueda primero en anchura de
profundidad 2. Las evaluaciones estticas se muestran a la derecha de los nodos hojas, mientras
que los valores obtenidos por propagacin se presentan rodeados por un crculo; por tanto,
segn el rbol obtenido, el primer movimiento que tiene que realizar MAX es:
#
180
181
1
CD :#6-4=2
#<#5-4='
*4-6=-2
MovimientodeMAX
Q) @ 6-6.0
# 5-6=-1
Nododeinicio
5-5=0
--W- 5-6=-1
otxt-
# 4-5 -1
ED
5=1
#O 5-5=0
# 6-5 1
Figura12.3.
Primeraetapadebsquedaenlastresenraya.
yaqueeslaposicinconel mayorvalordepropagacin(enestecaso,dalacasualidaddequesi
hubisemoscompletadoelprocesode bsqueda,habramosseleccionadoelmismomovimiento).
Siguiendoconnuestrociclodepercepcin/planificacin/actuacin,supongamosque MAX
realizael movimientoelegidoyqueMIN respondecolocandouncrculoenlaceldaqueestala
derechade laelegidaporMAX (steesunmal movimientoparaMIN, queobviamentenoest
utilizandounabuenaestrategiadebsqueda). Unavezpercibidoel movimientodeMIN, MAX
vuelveaaplicarelprocesodebsquedaprimeroenanchuraapartirde dichaposicin,conuna
profundidadlmitede2,obteniendoelrboldebsquedadelaFigura12.4.Comopodemosver,
existendos posibles buenos movimientos, perosupongamosqueMAX realizael quehemos
indicadoenlafigura. MIN respondeconelnicomovimientoconelqueevitaladerrota,llegando
alaposicin:

Entonces,MAX vuelveaaplicarelprocesodebsquedayobtieneelrboldelaFigura 12.5.
Bsquedaenproblemasdejuegos
CD
Nododeinicio
:#t<c--..

MovimientodeMAX
4- 3= 1
CD
gHx 4 - 2 :: 2 glxlx 43=
Hx
4-2=2
ld rgkl 4-3=1 oH:3 2=1

4 3= 1 52=3
CD
3 3=O JJ-42=2
3-2=1
-Totx
JJ-42=2
5-3=2
3 2= 1
4-2=2
JJ- 3 -

Yo
3 =0
JJ- 4 3=1

itfxt-
JJ- 3 2=1
mo
JJ- 4 -
w
2 =2
Figura12.4.
Segundaetapadebsquedaenlastresenraya.
Algunosdelosnodoshojasdeesterbol(porejemplo,el queestmarcadocon laletraA)
representan victorias paraMIN y, portanto, al evaluarlos, les asignamosel valor-oo. Propa-
gandoestasevaluaciones,podemosverqueelmejormovimientoquepuedehacerMAX esjus-
to aquelqueevitaunaderrotainmediata.UnavezqueMAX hayarealizadodicho movimien-
to, MIN observaque en la siguientejugadaMAX vaa ganar, con10 que, cortsmente, aban-
dona.
El procedimiento alfa-beta
El procedimiento de bsquedaque acabamos dedescribirseparaporcompletoel procesode
generacindenodosdelrbolde bsquedaylaevaluacindelasposiciones. Laevaluacinde
losnodoscomienzaunavezquesehageneradoel rboldebsqueda. Estaseparacinprovoca
quelaestrategiaseguidaseaineficienteenlamayoradelassituaciones.Sinembargo,podemos
conseguir reducciones importantes (que en algunos casos pueden ser de varios rdenes de
magnitud)enelesfuerzorequeridoparalabsqueda(encontrandoun movimientoigualmente
bueno),silaevaluacindelos nodoshojasylapropagacindelosvaloresserealizansimult-
182
ox an 2 1 = 1 lolx
x
oXx 3 1 = 2
1=1

2
e e

1=1 ox 2-1=1
ox
ox

ox ox
x ox x
'ox -00
-00 X
X X

0
e
2=0
gHx

Nodo

de
Movimiento
inicio
gHx -00
deMAX
x
e
o 3 1=2 D ox 3-2
xx x x
ox gH
xx
x x
x x
e x 2-2 o
xx
gHo3-1=2
B gH
0
3 2 = 1
x x
xx
gH 2-1 = 1
xox
A gH -00
oxx
Figura 12.5.
-
ltima etapa de bsqueda en las tres en raya.
neamente con la generacin del rbol. Este proceso es similar a la poda alfa analizada en el
Captulo 10.
Consideremos el rbol de bsqueda de la Figura 12.5, que se corresponde con la ltima fase
del juego de las tres en raya. Supongamos que los nodos hojas se evalan al mismo tiempo que
son generados. Una vez que hayamos generado y evaluado el nodo marcado con la letra A, no hay
necesidad de generar (y evaluar) los nodos B, e y D; es decir, debido a que M/N tiene disponible
A y que no preferir ningn otro movimiento, sabemos que con toda seguridad seleccionar el
movimiento A. Entonces, podemos propagar el valor -00al antecesor de A y continuar el proce-
so de bsqueda, ahorrndonos de esta forma el esfuerzo que hubiera supuesto la generacin y
evaluacin de los nodos B, e y D (si la bsqueda hubiera sido ms profunda, el ahorro de
esfuerzo en la bsqueda habra sido mayor, ya que hubiramos evitado la generacin de los des-
cendientes de B, e y D). Hay que resaltar el hecho de que la no-generacin de los nodos B, e y D
no afecta a la determinacin del mejor movimiento que debe realizar MAX.
En este ejemplo, el ahorro de esfuerzo en la bsqueda se debe al hecho de que el nodo A
representa una posicin victoriosa para MIN. Sin embargo, podemos conseguir ahorros similares
cuando ninguna de las posiciones del rbol de bsqueda represente una victoria para alguno de
los jugadores.
Valor beta =-1
vruorn:,#(B=tt=----C-#5 6=-1
#4 5-1
oda de inicio fi\
\:Y
#5-5 O
A#
#6 5
45 5 O
xtto
4 6 - 5 =1
xioJ-
Figura 12.6.
Parte de la primera etapa de bsqueda en las tres en raya.
Retomemos las primeras fases del juego de las tres en raya (Fig. 12.3). Parte del rbol se ha
repetido en la Figura 12.6. Supongamos que estamos utilizando la bsqueda primero en profun-
didad y siempre que alcancemos un nodo hoja le aplicamos la funcin de evaluacin esttica.
Tambin vamos a suponer que, siempre que se pueda, se propagar el resultado de la evaluacin
al antecesor. Consideremos ahora la situacin en la que la bsqueda primero en profundidad aca-
ba de generar el nodo A y todos sus sucesores, pero en la que todava no se ha generado el nodo
B. En este caso, el nodo A recibe el valor -1por propagacin. Llegados a este punto, sabemos que
el valor que se le asigne al nodo inicial por propagacin est acotado inferiormente por -1;es
decir, el valor que propaguemos hacia el nodo inicial nunca ser menor que -1,aunque s que
puede ser mayor (dependiendo de la evaluacin del resto de los sucesores del nodo inicial). A esta
cota inferior la denominaremos valor alfa para el nodo inicial.
Supongamos ahora que la bsqueda primero en profundidad contina con el nodo B y gene-
ra su primer sucesor, el nodo C. Si aplicamos la funcin de evaluacin esttica al nodo e,obte-
nemos el valor -1.En esta situacin podemos afirmar que el valor que propaguemos al nodo B
est acotado superiormente por -1;es decir, el valor que finalmente se le asigne al nodo B por
propagacin no puede ser mayor que -1,aunque puede ser menor (dependiendo de la evalua-
cin del resto de sucesores del nodo B). A esta cota superior la denominaremos valor beta.
Por tanto, ya que el valor que finalmente se le asigne por propagacin al nodo B no puede
sobrepasar el valor alfa del nodo inicial, el proceso de bsqueda puede abandonar la explo-
racin del resto de nodos sucesores de B, para continuar con el resto de sucesores del nodo ini-
cial. Esto es posible porque tenemos la completa seguridad de que no se preferir el nodo B al
nodoA.
Esta reduccin del esfuerzo empleado en la bsqueda se ha conseguido a costa del almace-
namiento de las cotas de los valores de propagacin, que tienen que ser revisadas a medida que a
los sucesores del nodo se les van asignando valores por propagacin. Sin embargo, hemos de
tener en cuenta que:
Los valores alfa de un nodo MAX nunca pueden disminuir (incluyendo el nodo inicial).
Los valores beta de un nodo MIN nunca pueden aumentar.
184
185
Gracias aestasrestricciones,podemosenunciarlassiguientesreglas,queindicancundoel
procesodebsquedapuedeabandonarlaexploracindedeterminadosnodos:
1. Se puede suspender la exploracin por debajo de cualquier nodo M/N que tenga un
valorbetamenoroigualqueel valoralfadecualquierade susnodosMAX antecesores.El
valor de propagacin definitivo para este nodo M/N se puede hacer igual a su valor
beta.Estevalorpuedequenoseaelmismoqueelqueseobtendramedianteel.procedi-
mientominimaxcompleto,peroconducealaseleccindel mismomovimiento.
2. La exploracin puede suspenderse por debajo de cualquier nodo MAX que tenga un
valoralfamayoroigualqueelvalorbetadecualquieradesusnodosM/N antecesores.El
valordepropagacindefinitivoparaestenodosepuedehacerigualasuvaloralfa.
Duranteelprocesodebsqueda,losvaloresalfaybetasecalculandelasiguientemanera:
Elvaloralfadeun nodoMAX esigual al mayordetodos los valorespropagadosde sus
sucesoresobtenidoshastaelmomento.
El valorbetade un nodoM/N es igualal menorde todos losvalorespropagadosde sus
sucesoresobtenidoshastaelmomento.
Cuandosesuspendeelprocesodebsquedaporlaregla 1,diremosquesehaproducidouna
poda alfa, mientrasque silasuspensinsedebealaregla2, diremosquesehaproducidouna
poda beta. El procesocompletoque vacalculandolos valores alfaybeta,y realizalas podas
cuandoseaposible,sedenominaprocedimiento alfa-beta. Elprocesofinalizacuandotodoslos
sucesores del nodo inicial tengan asignado un valor de propagacin, eligindosecomomejor
movimientoaquelquecorrespondaal nodoquetengaelmayorvalordepropagacin.Coneste
procedimientosiempreencontraremosun movimiento tan buenocomoel quesehubieracon-
seguidoconel procedimientode bsquedaminimax de lamismaprofundidad. Lanicadife-
renciaes queel procedimiento alfa-betaencuentra dichomovimiento con menos esfuerzode
exploracin.
Podemos hacer una descripcin ms concisa del procedimiento alfa-beta por medio del
siguientealgoritmorecursivo.Estaversin,enlaquelosvaloresminimax deunnodon secal-
culande acuerdoconlosvaloresdecortea y ~ , hasidoadaptadade [Pearl, 1984,p. 234].
AB(n;a,~
1. Si n estalaprofundidadlmite, devuelvaAB(n) = evaluacinestticadel nodon; en
cualquierotrocaso,seannI' ...,n., ...,ni> lossucesoresdelnodon (enorden),hagak 'E- 1
y, sin esunnodoMAX, vayaal paso2; si no,vayaal paso2'.
2. Hagaa 'E- max[a,AB(n.;a,~ ] . 2'. Haga 'E- minW, AB(n.;a, ~ ] .
3. Sia;;:: ~ , devuelva~ ; sino,contine. 3'.Si ~ Sa,devuelvaa;sino,contine.
4. Sik =b, devuelvaa.sino,continecon 4'. Sik =b, devuelva~ . si no,continecon
n
k
+!, esdecir, hagak ~ k +1Yvayaal n.+1' es decir, haga k 'E- k +1Yvaya al
paso2. paso2'.
Labsquedaalfa-betacomienzaconlallamadaAB(s,-ex>, +=),dondes eselnodoinicio.A
lolargodetodoelprocesosemantienequea < . Comoveremosms adelante,elordendelos
nodosenelpaso1tiene unagraninfluenciaenlaeficienciadel algoritmo.
EnlaFigura 12.7sepuedeverunejemplodelaaplicacindel procedimientoalfa-betaenla
generacindeunrbol debsquedadeprofundidad6. LosnodosMAX serepresentanmediante
uncuadrado,mientrasquelosnodosM/N serepresentanmedianteun crculo.Losvaloresest-
ticos de los nodos hojas serepresentan al lado de estos. Supongamosquerealizamosunabs-
quedaprimeroenprofundidadmedianteel algoritmoalfa-beta(porconvenio,primeroseexplo-
ran los nodos ms a la izquierda). El subrbol generado por el procedimiento alfa-beta est
indicadoconramasm"oscuras.LosnodosquehansidopodadossehanmarcadoconunaX. En
lafigura, podemosapreciarqueslohansidoevaluados 18delos41 nodoshojas(ellectorpue-
derepetirelejemplodelaFigura12.7paracomprobarsi hacomprendidoelprocedimientoalfa-
beta).
+1
O
-S
+S
~ ~ _+2
+S
+3
-2
+2
oNodosMAX
O
-3
oNodosMIN
+3
+3
-3
+S
O
Figura12.7.
Ejemplodelabsquedaalfa-beta.
186
187
Eficiencia del procedimiento alfa-beta
Para poder llevar a cabo las podas alfa-beta, se debe generar al menos una parte del rbol hasta su
profundidad mxima, ya que los valores alfa y beta estn basados en las evaluaciones estticas de
los nodos hojas. Por tanto, el procedimiento alfa-beta implica en algn momento una bsqueda
primero en profundidad. Adems, hay que tener en cuenta que el nmero de podas que se realizan
durante el proceso de bsqueda depende del grado con el que los primeros valores alfa y beta se
aproximen a los valores propagados definitivos.
Supongamos que tenemos un rbol de profundidad d, y que cada nodo (exceptuando los nodos
hojas) tiene exactamente b sucesores. Por tanto, el rbol tendr exactamente b
d
nodos hojas. Supon-
gamos adems que el orden en el que el procedimiento alfa-beta genera los sucesores de un nodo vie-
ne establecido por sus valores de propagacin reales -es decir, para un nodo M/N primero se gene-
rar el nodo sucesor con el menor valor, mientras que para un nodo MAX se generar primero el
nodo sucesor con el mayor valor-o Por supuesto, estos valores no sern conocidos en el instante de
la generacin de los nodos, por lo que este orden slo puede ser conseguido de forma accidental.
Utilizando esta ordenacin, el procedimiento alfa-beta maximiza el nmero de podas y
minimiza el nmero de nodos hojas generados, N
d
Se puede demostrar [Slagle y Dixon, 1969, y
Knuth y Moore, 1975] que:
para d pares
+b(d-1)12 1 para d impares
Es decir, el nmero de nodos hojas de profundidad d generados por una bsqueda alfa-beta pti-
ma, es aproximadamente el mismo que el que se hubiera generado con una bsqueda de profundidad
d/2 sin utilizar el procedimiento alfa-beta. Por tanto, en lo que se tardara en realizar una bsqueda
completa, sin utilizar el procedimiento alfa-beta, con una profundidad lmite d/2, el procedimiento
alfa-beta (considerando un orden perfecto en la generacin de los nodos sucesores) podra llegar has-
ta una profundidad d. En otras palabras, una bsqueda alfa-beta que siga una ordenacin perfecta en
la generacin de los nodos reduce el factor de ramificacin de b aproximadamente hasta {b.
Por supuesto, es imposible conseguir una ordenacin perfecta en la generacin de los nodos
se pudiera, no necesitaramos realizar el proceso de bsqueda). En el peor caso, el procedi-
miento alfa-beta no provocara podas, con lo que no se modificara el factor de ramificacin efec-
tivo. Pearl demostr que si los nodos son ordenados de forma aleatoria, la bsqueda alfa-beta per-
mite aumentar: 1u>rofundidad en aproximadamente 4/3; es decir, el factor de ramificacin medio
se reduce en b
3
[Pearl, 1982b] (en [Pearl, 1984, Cap. 9], se puede encontrar un anlisis ms
exhaustivo y algunas referencias adicionales). En la prctica, el uso de buenas heursticas para la
ordenacin de los nodos sucesores hace que el procedimiento alfa-beta se aproxime, en la mayo-
ra de los casos, a una reduccin ptima del factor de ramificacin.
La forma ms sencilla de ordenar los nodos sucesores consiste en utilizar la funcin de eva-
luacin esttica. Otra tcnica para ordenar los nodos aparece como un efecto colateral del uso de
una versin del mtodo de descenso iterativo -usada por primera vez en el programa CHESS
4.5 que jugaba al [Slate y Atkin, 1977]-. El programa realizaba, en primer lugar, una
bsqueda con una profundidad lmite de una capa, para despus determinar cul es el mejor
movimiento. Despus, volva a realizar el proceso de bsqueda, pero esta vez con una profundi-
dad lmite de dos capas, y determinaba otra vez el mejor movimiento; este proceso se iba repi-
tiendo aumentando la profundidad lmite (medida en capas) en cada iteracin. Estas bsquedas
repetitivas, que a primera vista puede parecer que no tengan sentido, son necesarias, ya que la
mayora de los programas para juegos estn sujetos a limitaciones tempora1es. De esta forma, y
dependiendo de los recursos disponibles, los procesos de bsquedas para capas ms profundas
pueden ser suspendidos en cualquier momento, con lo que seleccionaremos como mejor movi-
miento el ltimo calculado hasta el momento. El efecto colateral que produce este proceso, y que
pennite una ordenacin eficiente de los nodos, radica en el hecho de que para ordenar los nodos
en la bsqueda con profundidad lmite k + 1 capas, podemos utilizar los resultados obtenidos en
la bsqueda anterior, es decir, aquella en la que se utilizaba una profundidad lmite de k capas.
Otras cuestiones importantes
En la mayora de los juegos, la bsqueda debe finalizar antes de alcanzar posiciones terminales
(horizonte limitado), lo que puede acarrear algunos problemas. Uno de estos problemas es,
como se puede deducir de los anteriores apartados, que el proceso de bsqueda debe acabar en
una posicin en la que MAX (o M/N) pueda efectuar un buen movimiento. Debido a esto, la
mayora de los programas de bsqueda en juegos primero intentan asegurarse de que una deter-
minada posicin es aquiescente antes de terminar la bsqueda en dicha posicin. Decimos que
una posicin es aquiescente si su valor esttico no difiere mucho del valor que se le asignara por
propagacin, una vez analizados uno o dos movimientos por delante.
Incluso considerando la caracterstica de la aquiescencia de una posicin antes de suspender
el proceso de bsqueda en determinadas ramas, pueden existir situaciones en las que la victoria
o la derrota estn situadas ms all del horizonte de bsqueda. En algunos juegos, pueden apa-
recer situaciones que conducen inevitablemente a la victoria de MAX independientemente de los
movimientos que haga M/N, pero en las que M/N puede realizar movimientos evasivos que man-
tengan la aquiescencia y que siten la posicin victoriosa de MAX ms all del horizonte de bs-
queda. A esta problemtica se le denomina efecto horizonte, y es uno de los principales problemas
con que nos encontramos al abordar el diseo de programas para juegos.
Tanto el procedimiento minimax como su extensin alfa-beta asumen que el adversario
siempre va a realizar su mejor movimiento. Sin embargo, existen situaciones en las que esta supo-
sicin no es vlida. Por ejemplo, supongamos que MAX est en una situacin que probablemen-
te le conduzca hacia la derrota -suponiendo que M/N jugar de manera correcta-o En tales
situaciones, puede existir un movimiento que saque a MAX del camino a la derrota, siempre y
cuando M/N cometa un error. Si utilizamos el procedimiento minimax, nunca seleccionaremos
dicho movimiento, ya que (dado que la partida est irremediablemente perdida) la suposicin de
que M/N se va a equivocar supone un riesgo adicionaL La tcnica minimax resulta tambin ina-
decuada cuando uno de los jugadores tiene un modelo de la estrategia del otro jugador. Quiz el
otro jugador no sea realmente un oponente, sino un agente simple.
Juegos de azar
Algunos juegos, como, por ejemplo, el backgammon, incorporan una componente de azar, ya que
los movimientos que se pueden hacer dependen del resultado obtenido al lanzar un dado. En la
Figura 12.8, se muestra esquemticamente un prototipo de rbol para este juego (para hacerlo ms
simple, slo mostramos las seis posibilidades que se obtienen al tirar un dado). Cada vez que
MAX y M/N van a realizar un movimiento, primero tienen que lanzar un dado. En este caso,
podemos imaginar que cada vez que se lance el dado, un jugador ficticio, al que llamaremos
DADO, realiza un movimiento, que, adems, est determinado por el azar. En el caso concreto en
el que se disponga de un solo dado, todos los posibles resultados son equiprobables, aunque la
componente de azar puede estar sujeta a otras distribuciones de probabilidad.
188
189 Inteligenca artifical. Una nueva sntesis
Movimiento del DADO}
TumodeMAX
Movimiento de MAX
3 Movimiento del DADO}
Tumo de M/N
Movimiento de M/N

Movimiento del DADO }
TumodeMAX
Figura 12.8.
rbol de un juego que implica el lanzamiento de un dado.
Al igual que en los procedimientos que acabamos de analizar, en los rboles de bsqueda en
juegos de azar tambin podemos aplicar el proceso de propagacin de valores, teniendo en
cuenta que cuando vayamos a propagar los valores de los nodos que representan un movimiento
de azar, debemos propagar el valor esperado (media) de los valores de sus sucesores, en vez de
un mximo o un mnim0
3
Los nmeros que aparecen junto a los nodos de la Figura 12.8 repre-
sentan unos valores de propagacin supuestos. En el ejemplo hemos propagado el valor mnimo
de 11s nodos sucesores en el caso de un movimiento de M/N; el valor mximo de los sucesores en
el caso de un movimiento de MAX; y el valor esperado de los sucesores para el caso de que sea el
turne de DADO. Este proceso de propagacin modificado se suele llamar expectimax.
Al introducir movimientos que dependen del azar, se aumenta tanto el factor de ramificacin,
que 103 procesos de bsqueda dejan de ser eficientes. En tales casos, es de vital importancia dis-
poner de una buena funcin de evaluacin esttica que haga que el proceso de bsqueda no pro-
fundice demasiado. Si dispusiramos de una funcin de evaluacin esttica lo suficientemente
buena, podramos limitar la poltica de seleccin de movimientos de MAX al anlisis de las posi-
ciones que se encuentran un movimiento ms adelante, y seleccionar el movimiento que maxi-
mice el valor de las evaluaciones estticas de dichas posiciones. En la siguiente seccin, pre-
sentaremos tcnicas para aprender polticas de actuacin y funciones de evaluacin esttica
para juegos que presenten un factor de ramificacin tan alto que hagan imposible aplicar alguno
de los mtodos de bsqueda analizados.
3 Por supuesto. si queremos ser ms conservadores respecto al resultado del movimiento aleatorio, tendramos que
propagar el peor valor para MAX siempre que sea el tumo del DADO.
Aprendizaje de funciones de evaluacin
Algunos juegos (como, por ejemplo, el Go) permiten realizar tantos movimientos en cada tumo
que no resulta factible aplicar alguna tcnica de bsqueda en profundidad en ellos 4. Si no se utili-
zan tcnicas de bsqueda, la seleccin del mejor movimiento se tiene que basar en la evaluacin
esttica de los sucesores del nodo inicial, o en la reaccin a determinadas configuraciones del table-
ro, detectadas mediante tcnicas de reconocimiento de patrones. En este sentido, se ha realizado un
gran esfuerzo para encontrar formas de evaluar y responder reactivamente a determinadas posi-
ciones del Go [Zobrist, 1970; Reitman y Wi1cox, 1979, Y Kierulf, Chen y Nievergelt, 1990].
En algunas ocasiones se pueden aprender funciones de evaluacin esttica mediante redes
neuronales. Esta idea ha sido aplicada a juegos como el backgammon. El programa TD-GAM-
MON [Tesauro, 1992; Tesauro, 1995] aprende a jugar al backgammon mediante el entrena-
miento de una red neuronal directa por capas. En la Figura 12.9 se puede ver la estructura de la
red y la'forma en la que se codifican las entradas y las salidas. Las 198 entradas (que representan
diferentes situaciones del tablero) estn totalmente conectadas a las unidades ocultas, que a su vez
estn totalmente conectadas a las unidades de salida. Tanto las unidades ocultas como las de sali-
da son unidades sigmoidales. Se supone que la red tiene que producir una serie de estimaciones,
denominadas PI' P2' P3 YP4' de la probabilidad de los distintos resultados que se pueden producir
a partir de cualquier posicin del tablero. El valor global de una determinada posicin queda
1 Desenlace estimado:
V=Pl +2P2-P3
Nmero de figuras blancas
en la primera celda
30
Estimacin de las probabilidades:
30
PI = pr (blancas ganan)
po = pr (blancas ganan con doble puntuacin)
2 x 24 celdas
0-"
con doble puntuacin)
------------------+
4 unidades de salida
Nmero de fichas en la
barra, fuera del tablero y a
quin le toca mover
198 entradas
unidades ocultas y las de salida son unidades signoidales
aprendizaje: e =0,1; los pasos iniciales son elegidos aleatoriamente del intervalo (-0,5 y +0,5)
\
Figura 12.9.
La red TD-GAMMON.
4 Un jugador humano de 00 desarrolla la bsqueda sobre zonas aisladas del tablero, estrategia que puede ser
necesaria y factible en programas que jueguen al 00.
190 191 InteligenciaartificiaLUnanuevasntesis
determinado poruna estimacin del resultado final de la partida, que se calcula mediante la
expresinv = PI + 2P2 - P3 - 2P4' La redneuronalseutilizadelasiguienteforma: primero,selan-
zaeldadoy todaslasposiblesconfiguracionesquesepuedenalcanzarconelresultadodeldado
sonevaluadasporlared;despus,seseleccionaelmovimientoquenosllevealasituacinpara
laquesehayaobtenidoelmejorvalorv (sieselturnodelasfichas negras,elmejorvalordeves
elmsalto,mientrasquesiesel turnodelasblancaselmejorvalordev eselDnimo).
Sepuedeconseguirunentrenamientobasadoendiferenciastemporalesutilizandolaredpara
jugarcontrasmismaencadajugada. Cadavezqueserealizaunmovimientosereajustanlos
pesosdelared medianteelmtododeretropropagacinparaquelaestimacindelresultadofinal
delaposicinoriginalseacerquealaestimacincalculadaapartirdelaposicinresultante.Por
simplicidad,explicaremoselmtodocomosiestuvisemosutilizandounaprendizajepurobasa-
doendiferenciastemporales(actualmente,seutilizaunavariantedeestemtodo,perosuanli-
sisvamsalldelalcancedeestelibro).Si VI eslaestimacindelresultadofinalenelinstantede
tiempot (antesdequesehagaelmovimiento),y VI + 1 eslaestimacinen elinstantedetiempo
t + 1(unavezquesehayarealizadoelmovimiento), segnelprocedimientoestndardeapren-
dizajebasadoendiferenciastemporales,lareglaparaelajustedelospesosdelaredes:
.6.WI =c(Vt+l - VI aw
dondeW
I
esel vectorenelqueestnrepresentadostodoslospesosdelaredenelinstantet, y
oV
I
eselgradientedeVI enelespaciodepesos(enunareddirectaporcapas,comolaTD-GAM-
aw
MON,loscambiosdelosvectoresdepesosdecadacapasepuedenexpresardelaformaindicada
enelCaptulo3). Elentrenamientodelaredserealizadetal formaqueen cualquierinstantede
tiempo t, la salidacorrespondienteVI' antes de realizarel movimiento, tienda a la salida VI + I
correspondientealaposicinalcanzadadespusderealizarelmovimiento(comoenunsimple
procesodeiteracin).Utilizandoestetipodeentrenamientosehanrealizadounagrancantidadde
experimentos en los quelaredhajugadocientos demilesdepartidascontrasmisma(enlos
entrenamientosalosquefuesometidalaredsejugabanalrededordeunmillny mediodepar-
tidas).
Laeficaciadeunaredbienentrenadaseacercaalniveldecompeticin.Despusdejugar40
partidasconunaversindelprogramaenlaqueseimplementunmecanismopararealizarbs-
quedasadelantadas,BiIl Robertie(antiguocampenmundialdebackgammon)concluyqueel
programaTD-GAMMON 2.1 jugabaa nivel de maestro-ladiferenciaconlos mejoresjuga-
doresdelmundoseestablecisloenuncentenardepuntos[Tesauro, 1995].
Al igual quelos puzzles, los juegoshan desempeadoun papel muy importanteenel refina-
mientoycomprobacindelastcnicasdelA.Porejemplo,en[RussellyWefald, 1991,Cap.4l,
seproponenyseevalanunaseriedealgoritmosdebsquedaenrbolesdejuegos(MGSS*y
MGSS2)queutilizanmetacomputaciones(hacenusodelosvaloresesperadosdeunabsqueda
continua)parapodarelrboldebsqueda,detalmaneraquesemejoralaeficienciadelabs-
quedaalfa-beta.Elalgoritmo B* propuestoporBerliner[Berliner, 1979] utilizaintervalospara
definirloslmites,tcnicaquetambinpermiteunapodamsefectiva. [Korf, 1979]haextendi-
doel procedimientoalfa-betaparaquepuedaserutilizadoenjuegosdemltiplesjugadores.
Algunostrabajossehancentradoenlautilizacindetcnicasdereconocimientodepatrones,
enlugardeutilizarfunciones deevaluacinnumrica,paradecidirsi unadeterminadaposicin
esmejor opeor que otra. Estastcnicashansidoutilizadasenprogramasquejueganfinalesde
ajedrez[Huberman, 1968,yBratkoyMichie, 1980].
Unodelosprimerostrabajosenprogramasparajuegos,ydemayorxito,sedebeaArthur
Samuel,quiendesarrollmtodosdeaprendizajecomputacionalparajugaralasdamas[Samuel,
1959; Samuel, 1967].ElprogramaquedesarrollSamueljugabaalniveldecompeticin.Elpro-
grama CHINOOK rSchaefferet al., 1992; Schaeffer, 1997] est considerado en laactualidad
como el campen mundial de damas. En 1997, el programa de IBM DEEP BLUE derrot al
actualcampendelmundodeajedrez,GarryKasparov,enunapartidadecompeticin.
[Newborn, 1996]esunlibrosobreelajedrezenlosordenadoresenelqueseanalizaelpero-
dotranscurridoa10 largode1996hastaelenfrentamientodeDEEP BLUE conGarryKasparov.
Paraunarevisindeestelibro,concomentariosadicionalessobreelpapeldelajedrezcomoobje-
todelainvestigacinenlAvase[McCarthy 1997].McCarthyafmnaquelosprogramasquejue-
gan al ajedrez podran funcionar mejor si utilizaran menos tcnicas de bsquedaen favor de
mtodosderazonamientosparecidosalosquedesarrollanlaspersonas.Adems,consideraque
el ajedrezseconvertirotravezenladrosophila delosinvestigadoresenlAquequierancom-
probarnuevastcnicasderazonamientobasadasenconocimiento.
[Michie, 1966] acuel trminoexpectimax y aplicdichatcnicaenunaseriedeexperi-
mentos.
[LeeyMahajan, 1988]hanaplicadomtodosdeaprendizajeporrefuerzoaljuegodelOtelo,
y [Schraudolph;Dayan,y Sejnowski, 1994]hanaplicadotcnicasdeaprendizajebasadoendife-
renciastemporalesaljuegodel Go.
Para una revisin ms detallada sobre los mtodos de bsqueda en juegos vase [Pearl,
1984,Cap.9].
12.1. Porqulosprocedimientosdebsquedaenjuegospartendelaposicininicialenvezde
empezarporlaposicinobjetivoy realizarlabsquedahaciaatrs?
12.2. Enelsiguienterboldebsquedacorrespondienteaunciertojuego,sehanrepresentadolas
evaluacionesestticas(indicadasentreparntesisenlosnodoshojas)quehansidocalculadasdes-
deel puntodevistadel primerjugador.Supongamosqueesel primerjugadorelquetieneque
maximizarlasevaluaciones:
A
P Q R S T U V W X y
(6) (O) (1) (5) (2) (8) (4) (10) (2)
L M N O
(2) (3) (8) (5)
1. Culdeberadeserelprimermovimientoquetienequerealizareljugador?
2. Qunodosnoseranexaminadosporel algoritmoalfa-beta?Sepuedesuponerquelos
nodosdel mismonivel sonevaluadosdeizquierdaaderecha?
12.3. (Cortesa de Matt Ginsberg.) Supongamos que estamos utilizando la poda alfa-beta para
determinar el valor de un determinado movimiento en un juego, y que hemos decidido que un
determinado nodo n y sus hijos pueden ser podados. Si el rbol del juego fuese un grafo y exis-
tiese un camino alternativo al nodo n, estara justificada dicha poda? Demuestre que realmente
se puede podar o ponga un ejemplo en el que la poda no fuera posible.
12.4. La mayor parte de los programas para juegos no almacenan los resultados de las bsquedas
de un movimiento para el siguiente movimiento, ya que normalmente empiezan de cero cada vez
que es el tumo del ordenador. Por qu?
12.5. Comente (en media pgina o menos) cmo modificara la estrategia minimax para que se
pueda utilizar para la seleccin de movimientos en juegos de tres jugadores con informacin com-
pleta (un juego con informacin completa es aquel en el que cada jugador conoce todo sobre cada
posible situacin del juego. El ajedrez es un juego con informacin completa, mientras que el
bridge no lo es). Suponga que los jugadores A, B, y C juegan de forma alternativa, y que el jue-
go termina con una situacin de empate entre todos los jugadores o con la victoria de alguno de
ellos. Adems, el rbol no puede ser explorado hasta el final de la partida, pero la evaluacin est-
tica de las posiciones no terminales puede ser propagada en sentido ascendente por algn proceso
anlogo al presentado para la estrategia minimax.
onamiento
resentacin
nocimiento
El arma ms formidable contra los errores de todo tipo es la razn
Thomas Paine, La Era de la Razn
Por qu sto es as? Cul es la causa de esta forma de ser?
Artemus Ward
El clculo
proporcional
Imponiendo restricciones a los valores de las caractersticas
Hemoshabladodedosmtodosparamodelarelmundodeunagentealgodiferentes:ellenica
yeldescriptivo. Lascaractersticasconvaloresbinariossondescripciones delmundo-loquees
onociertoacercadel-oLasrepresentacionesicnicassonsimulaciones deciertosaspectosdel
mundo.Aunquelassimulacionessonmsdirectas,y amenudomseficientesquelasdescrip-
ciones,lasdescripcionestienenun nmerode ventajasensmismas.Losvaloresdelascaracte-
rsticassonfcilesdecomunicaraotrosagentes, mientrasquelosmodelosicnicosnopueden
descomponersefcilmenteenpiezas i s l d ~ paraunacomunicacinincremental.El clculode
los valoresdelascaractersticasrequiereamenudoprocesosperceptualesmenoselaboradosde
loqueseralaconstruccinomodificacindeunmodeloicnico.Y, enloscasosenlosquelos
valoresdealgunascaractersticasnopuedensermedidosdirectamente,puedenserinferidosalgu-
nasvecesdelosvaloresdeotrascaractersticasutilizandorestriccionesimpuestasporel tipode
mundoenelqueseencuentrael agente.
Esms, hayinformacinacercadelentornodel agentequeesdifcil oimposiblederepre-
sentardeformaicnica.Porejemplo:
Leyesgenerales,talescomotodaslascajasazulespuedensercogidas.
Informacinnegativa,talcomo elbloqueA noestenelsuelo(sindecirdondeestel
bloqueA).
Informacinincierta, talcomo o bienel bloqueA estsobreel bloqueB, oelbloqueA
estsobreelbloquee.
Partede estainformacindifcil de representar puedeserformuladacomoun conjuntode
restriccionessobrelos valoresdelascaractersticas.Estasrestricciones, querepresentancono-
cimientoimportanteacercadelmundoqueelagentehabita, puedenseramenudoutilizadaspara
inferirlosvaloresdeaquellascaractersticasqueno admitenunamedicindirecta.Lainferencia
deinformacinacercadelestado presente del agente(pormediodeclculosbasadosen lasres-
195
196
197
triccionesimpuestassobrelascaractersticas)contrastaconelprocesodeclculodelosestados
futurosresultantesdelasaccionesdelagente(utilizandolos mtodosdebsquedadiscutidosen
laParte11 deestelibro).Alaprimeraactividadlallamaremos razonamiento,y alasegunda
proyeccin.Enlosprximoscaptulos,dejamosaunladoelproblemadelaproyeccinpara
concentramosenelrazonamiento.
Hayvariasaplicacionesenlasqueelrazonamientoacercadelosvaloresdelascaractersticases
necesario.Concerteza,elrazonamientopuedeaumentarlaeficaciadelosagentesenlasdecisiones
sobre las acciones arealizar(inclusoenelcasodeagentesreactivos). Perotambinhaymuchas
otrasaplicaciones.Porejemplo,sehademostradoqueesposiblerepresentarelfuncionamientode
diversossistemasfsicos, incluyendosistemasbiolgicosyelectromecnicos,medianteconjuntos
apropiadosdecaractersticas.Lasleyesfsicas, ascomootrasleyesrelevantesparaelorganismoo
dispositivoarepresentar,puedensercodificadascomorestriccionessobrelascaractersticas.Pro-
cediendoas,elrazonamientopuedeserutilizado,entreotrosobjetivos,paradiagnosticarelmalfun-
cionamientoenestossistemas;porejemplo,lascaractersticasasociadasconlascausaspueden
serinferidasapartirdelascaractersticasasociadasconlossntomas.Esteenfoquegeneralesfun-
damentalparaunaclaseimportantedeaplicacionesenIAllamadasistemasexpertos.
Vamos acomenzarnuestraexposicinsobrelas tcnicasderazonamientoconunejemplo.
Consideremosunrobotqueescapazde levantarun bloque, siesebloquesepuedelevantar(es
decir, nopesademasiado),y si lapotenciade labateradelrobotesadecuada. Siambascondi-
cionessesatisfacen,entoncescuandoelrobotintentelevantarelbloque,stequedarsujeto,yel
robot podr mover el brazo. Podemos representar estas condiciones mediante caractersticas
convaloresbinarios:
Xl (BATERA_OK)
(OBJETO_ELEVABLE) x
2
(ROBOT_SE_MUEVE) x
3
Utilizaremos los nombres mnemotcnicos de estas caractersticas (dadas entre parntesis)
para ayudar a la exposicin. Asumimos que el robot puede averiguar que la caracterstica
BATERA_OKes cierta (mediante la lectura de un indicador) y que el ROBOT_SE_MUEVE
(mediantesensoresdelngulodelasarticulaciones),peronoconoceelvalordelacaracterstica
OBJETO_ELEVABLE. Endichasituacin, puedeocurrirqueseamuyimportantequeelrobot
conozcael valorde OBJETO_ELEVABLEde caraaotras tareas que debarealizar. Apartirde
nuestradescripcin,nosotrossabemosquesilascaractersticasBATERA_OKyOBJETO _ELE-
VABLE tienen ambas el valor 1, ser cierto que ROBOT_SE_MUEVE. De esta manera, si
ROBOT_SE_MUEVEtieneelvalorOcuandoelrobotintentamoverelbloque,entoncesnosotros
sabemos que, o bien BATERA_OK, o bien OBJETO_ELEVABLE (o ambas) deben tener el
valorO. PerosiBATERA_OKseevalaconvalor1, entonces OBJETO_ELEVABLEdebetener
elvalorO. Yaquenosotrospodemosrazonardeestamanera,hagamosqueelrobottambinrazo-
nedelamismaforma. Loquesenecesitaesunlenguajemedianteelcualpuedanserexpresadas
lasrestriccionessobrelascaractersticasylosvaloresdestas;necesitamostambinmecanismos
deinferenciaqueseancapacesderealizarelrazonamientorequerido.Elclculoproposicional,
undescendientedellgebrabooleana,nosofrecelasherramientasnecesarias.
Larestriccindenuestroejemplopodraexpresarseenellenguajedelclculoproposicional
delaformasiguiente:
BATERIA_OK A OBJETO_ELEVABLE ROBOT_SE_MUEVE
dondeA significay, y significaimplica.
Elclculoproporcional
Losmecanismosasociadosconestelenguajepuedenserutilizadosparaderivarconsecuen-
cias a partirde sentenciasexpresadasenellenguaje. Comolos lenguajeslgicos son bastante
importantesenlainteligenciaartificial,debemostratarlosendetalleantesdecomenzarapresentar
agentesmscomplejoseinteligentesbasadosenelusodeestoslenguajes.
Primerointroduciremosalgunasdefiniciones.Unalgicainvolucraa:
Unlenguaje(conunasintaxisqueespecifiqueculessonlasexpresionescorrectasdellen-
guaje).
Unconjuntode reglasde inferenciaparamanipularsentenciasdellenguaje.
Unasemnticaparaasociarloselementosdellenguajeconloselementosdealgndomi-
nio.
Estudiaremosdoslenguajeslgicos:elprimero,yelmssimpledelosdos,eseldenomina-
doclculoproposicional;elsegundo,ymsutilizado,eselllamadoclculodepredicadosdepri-
merorden(CPPO).Muchasde lasideasimportantesdelclculode predicadosdeprimerordense
puedenintroducirdeformams sencillaapartirdelclculoproposicional. Portanto,presenta-
remosprimeroestelenguaje.
Ellenguaje
Describiremosformalmenteloselementosdelclculoproposicional.Porelmomento,esmejorno
intentarasociarsignificadosaloselementosdellenguaje;porahora,debemospensarqueloque
estamoshaciendoesunjuegosinsignificado.Mstarde,hablaremosdelsignificado.stosson
loselementosdellenguaje1.
tomos: los dos tomos V 2 (verdadero) y F (falso) y el conjunto infinito numerable de
aquellascadenasdecaracteresquecomienzanconletramayscula,porejemplo, P, Q, R, ...,
Pl,P2,SOBRE_A_B,etc.
Conectivas: v,A, Y-', llamadaso, y, implicay no,respectivamente. (Msade-
lante,daremos significadoaestasconectivassegnsunombre;porahora, sonsimplemente
smbolossinsignificado.)
Sintaxisdelasfrmulas bienformadas (jbfs), tambinllamadassentencias:
Cualquiertomoesunafbf.
Ejemplos: P, R, P3.
Sirol Yro
2
sonfbfs, tambinloson:
rol v ro
2
(llamadadisyuncin derol Yro
2
)
rol Aro
2
(llamadaconjuncinderol Yro
2
)
rol ro
2
(llamadaimplicacin)
-,ro
l
(llamadanegacinderol)
1 Parafacilitarladistincinentreexpresioneslgicasyotrasexpresionesdellibro,adoptaremoslassiguientescon-
vencionesdenotacin: lasexpresioneslgicasseescribirnen tipografa de mquina de escribir,ylossm-
bolosquelasrepresentan,conletrasgriegasminsculas.
2 Smbolosconstantes.
198
199
Lostomos,solosoconel smbolo-,delantedeellos, sellamanliterales. EnIDI :::> ID , ID es
2 1
denominadoantecedentedelaimplicacin,yID
2
consecuente.
Ejemplosdefufs:
(P/\Q):::>-,P
P:::>-,P
PvP:::>P
(P:::> Q):::> (-,Q:::> -,P)
-,-,P
Nohayotrostiposdefufs.
Ejemplo: P :::> -,-,noesunafuf.
Tngaseencuentaelusodelosseparadoresextra-lingsticos(y )en losejemplosmostra-
dos. stos agrupan fufs en (sub) fufs de acuerdo con definiciones recursivas. Algunos trata-
mientosdelalgicaformalizanlosseparadorescomopartedellenguaje,peroaqulosutilizare-
mosdeformaintuitivacomoelementossueltos.Lasfufspuedenserreconocidasutilizandosus
definicionesrecursivas. Porejemplo, (P/\Q):::> -,Res unafuf. Primero, como P y Q sonfufs,
tambinloes(P/\Q). Y-,Resunafuf, yaqueR loes.Entonces,(P/\Q):::>-,Resunafuf.
Lasreglasdeinferencia
Disponemosdeunnmerodepatronesmediantelos cualespodemosproducirfufs adicionalesa
las yaexistentes. Estos patrones sonlos denominados reglasde inferencia. Unaregladeinfe-
renciatienelaformatpica:'Y puedeserinferidadea.(odea.y 3.Aqutenemosalgunasdelas
reglasdeinferenciamscomunes:
LafufC:2 puedeserinferidaapartirdelasfufsID
1
yIDI :::> ID
2
(estaregladeinferenciasella-
mamodusponens).
LafufIDI /\ID2 puedeserinferidaapartirdelasdostbfsID yID (introduccindelacon-
juncin).
1 2
LafufID2 /\ IDI puedeserinferidaapartirdelafufID
1
/\ ID
2
(conmutatividaddelaconjun-
cin).
LafufID1 puedeserinferidaapartirdelafufID
1
/\ID
2
(eliminacindelaconjuncin).
LatbfIDI v ID: puede serinferida,biende lafufsimpleID
1
, o delafufsimple (intro-
duccindeladisyuncin).
LafufID1 puedeser inferidadelafuf-,(-,ID
1
) (eliminacindelanegacin).
Definicindedemostracin
Lasecuenciadefufs {ID1, ID2, oo., ID.} sedenominademostracin(odeduccin)deIDn apartirde
unconjunto6.defufs si,yslosi,cadaID delasecuenciapertenecea6., obienpuedeserinferida
deunafuf(o varias fufs) que se encuentrepreviamenteen lasecuencia, utilizando unade las
3 Todavano hemosrelacionadolapalabrainferirconelsignificadoquedeberatener; unareglade inferenciaes
simplementeunaformamecnicadecrearnuevasfbfs apartirdeotras.
reglasdeinferencia.SiexisteunademostracindeIDn apartirde6., entoncesdecimosqueIDn es
unteorema delconjuntoA Utilizaremoslasiguientenotacin paraexpresarque IDn puede ser
demostradaapartirde6.:
6. 1- IDn
Tantoelconceptodedemostracin,comoelconceptodeteoremasonrelativosal usodeun
conjunto particularde reglas de inferencia. Si denotamos al conjunto de reglas de inferencia
mediantelaletra'l{,podemosindicarelhechodequew
n
puedeserprobadaapartirde6. utili-
zandolasreglasdeinferenciade'l{ mediantelaexpresin:
6. 1- lt IDn
Ejemplo:dadounconjunto6. defufs: {P,R, P :::> Q}, lasiguientesecuenciaesunademos-
tracindeQ /\ R, dadoelconjuntodereglasdeinferenciapresentadoanteriormente:
{P, P :::> Q, Q, R, Q /\
El conceptodedemostracinpuedeestarbasadoenunasecuenciaoenunordenparcial.Este
ordenparcialpuedeserrepresentadomedianteunaestructuraderbol.Cadanodoenelrbolde
lademostracinesetiquetadomedianteunafufy, o biendebecorresponderaunafufpertene-
cientea6.,o biendebeserinferibleapartirdesuspadresenelrbol,utilizandounadelasreglas
deinferencia. El rbol etiquetadoresultante es unademostracindelaetiquetadel nodoraz.
MostraremosunademostracinsencillaenlaFigura13.1
4
Lasemntica
13.5.1. Interpretaciones
Ahoraes elmomentodehablaracercadelos significados.El papeldelasemnticaesel de
asociarloselementosdeunlenguajelgicoconloselementosdeundominiodediscurso.Tales
p P :::> Q R
Figura13.1.
Unrboldedemostracinsencillo.
4 Sehadetenerencuentaqueun Ibolde demostracintienelasrelacionespadre-sucesorinversasalasdefinidas
enlosIbolesdelCaptulo7;el nodorazseencuentraenlabasedelrbol.
200
asociacionessonaloquenosreferamoscomosignificados.Enlalgicaproposicional,aso-
ciamostomosconproposiciones acercadelmundo(deahelnombredelgicaproposicional).
As,porejemplo,podemosasociareltomoBATERIA_OK conlaproposicinLabateraest
cargada(noestamosobligadosarealizarlaasociacinsugeridaporuntomomnemotcnico;
podramosutilizarcualquierotro). Una asociacin de tomos conproposiciones se denomina
interpretacin. Enunainterpretacindada, laproposicinasociadaauntomosellamadenota-
cin deesetomo.
Bajounainterpretacindada, lostomostienenvalores Verdadero o Falso. Si untomoa;
estasociadoalaproposicinP, entoncesdecimosquea; tieneelvalorVerdadero enelcasode
queP seaciertaenel mundo;delocontrario,tieneelvalorFalso. El tomoespecialV siempre
tieneelvalorVerdadero, yeltomoespecialF siempretieneelvalorFalso. Comotodaslaspro-
posiciones acercadel mundodebenserverdaderaso falsas (unaidealizacinqueestamosdis-
puestosaaceptar), podemosespecificarunainterpretacinasignandovaloresdirectamentealos
tomosdellenguaje-sinrepararenqudenotacadatomoacercadelmundo.
Si el sistemasensorialquelepermitea un agentedeterminarlafalsedadolaverdaddelas
proposicionesacercadel mundoes fiable, entonces,cuandosemidaelvalor1paralacaracte-
rsticaXl' laproposicinacercadelmundocorrespondienteaXl sercierta,yel tomolgicoaso-
ciado,digamos tendrelvalorVerdadero. Porestarazn,envezderepresentarlainforma-
cin medidaporunagentemediante un valorde 1o Oencierta celda de entrada, podemos
representarlamedianteuntomodelalgicaproposicionalenlaestructuradememoriadel agen-
te,estructuraalaquellamaremosbase de conocimiento. Sedaporhechoquelaocurrenciaexpl-
citadeuntomo,comoeselcasode enlabasedeconocimientodeunagentesignificaque
elagenteconsideraquelaproposicinasociadaesciertaenelmundo.Prontoveremoscmoun
agenteutilizalasfbfsdesubasedeconocimiento.
13.5.2. La tabla de verdad proposicional
Dadoslosvaloresdelostomosbajoalgunainterpretacin,podemosutilizarunatabla de verdad
paracalcularelvalordecualquierfbfbajodichainterpretacin. Latablade verdadestablecela
semntica(signif1cado) delasconectivasproposicionales. Sean(01 y (02 dosfbfs, entonceslas
reglasparaconstruirlastablasdeverdadson:
01 A (02) tieneelvalorVerdadero si ambas, (01 y (02' tienenelvalorVerdadero; encual-
quierotrocaso,tieneelvalorFalso.
01 v COz) tieneelvalorVerdadero siuna,oambas,delasfbfs, (01 o(02' tieneelvalorVer-
dadero; encasocontrario,tieneelvalorFalso.
-,(01 tieneel valorVerdadero si (01 tiene el valorFalso; encasocontrario, tieneel valor
Falso.
Lasemnticade:Jsedefineentrminosdev y-,.Concretamente,01 :JCOz) esunaforma
equivalentealternativaa(-,(01 v (02)'
Hablamosdereglasparaconstruirtablasdeverdaddebidoaqueserepresentangeneralmente
enformatabular,talcomosemuestraenlaTabla 13.1.
Podemosutilizarlastablasdeverdadparacalcularelvalordeunafbf,dadoslosvaloresdelos
tomos constituyentesde lafbf. Comoejemplodel uso deuna tabladeverdadparacalcularel
valordeunafbf, supongamosquePtieneelvalorFalso, QelvalorFalso yR elvalorVerdadero.
Enestainterpretacin,culeselvalordeverdadde[(P:JQ):JR] :JP?Trabajandodedentro
haciafuera,primeroobtenemoselvalorVerdadero de p:JQ; entoncesvemoscmo(p:JQ):JR
es Verdadero. Finalmente,comoPesFalso, elvalordelaexpresincompletadebeserFalso.
rol rol rol AWz rol v rol -,ro
l rol:Jrol
Verdadero Verdadero Verdadero Verdadero Falso Verdadero
Verdadero Falso Falso Verdadero Falso Falso
Falso Verdadero Falso Verdadero Verdadero Verdadero
Falso Falso Falso Falso Verdadero Verdadero
Tabla13.1.
Unatabladeverdadproposicional.
Siunagentedescribesu mundoutilizandon caractersticas(quecorrespondenaproposicio-
nes),yestascaractersticasestnrepresentadasenelmodelodelmundodelagentemedianteun
conjuntoden tomos,entonceshay2"diferentesmanerasenqueel mundopuedeestar-tantas
formascomoelagentepuedadistinguir-,porquehay2"manerasenquelosn tomospueden
presentarlosvaloresVerdadero yFalso. Cadaunadelasmanerasenqueelmundopuedeestar
correspondea unainterpretacin. Dados los valoresparalos n tomos (unainterpretacin), el
agentepuedeutilizarlatabladeverdadparaencontrarlosvaloresdeunafbf. Quocurreconel
procesoinverso?Supongamosquedamoslosvaloresdelasfbfs deunconjuntodelasfbfs. De
estosvalores,sepuedeinducirunanicainterpretacin?Estacuestinesimportante ~ r q u e a
menudo,aunagenteleesdadounconjuntoderestriccionessobrelascaractersticas(expresadas
comofbfs quetienenelvalor Verdadero). Puedeunagenteinducirunaasignacindevalores
(unainterpretacin)delostomosdesulenguajeyasdeterminarquproposicionescorrespon-
dientesacercadel mundosonciertasofalsas?Esdecir,lasfrmulasespecificanculdelas2
n
manerasenlasqueelmundopuedeestareslacorrecta?Generalmente,larespuestaesno. Al con-
trario,puedehabermuchasinterpretacionesdistintasquedenacadafbfdelconjuntoelvalorVer-
dadero. Paratratarestetema,esnecesariointroducirlanocindemodelo.
13.5.3. Satisfacibilidad y modelos
Decimosqueunainterpretacinsatisface unafbfsialafbfleesasignadoel valorVerdadero bajo
dichainterpretacin.Unainterpretacinquesatisfaceunafbfesdenominadamodelo dedichafuf.
Unainterpretacinquesatisfacecadaunadelasfbfsdeunconjuntodefbfsesdenominadamode-
lo dedichoconjunto.Trivialmente,podemosdecirsiunainterpretacinsatisfaceonocualquier
tomoporquedichainterpretacinasignaunvaloracadatomo.Podemosutilizarlatabladever-
dadparadecirsiunainterpretacinsatisfaceonounafbfcompuestaportomos.
Ennuestrorobotelevadorde bloques, expresamosunarestriccinsobrelascaractersticas
mediantelasiguientefbf:
BATERIA_OK A OBJETO_ELEVABLE :J ROBOT_SE_MUEVE
SiestafbftieneelvalorVerdadero, segnnuestraidealizacindelmundo,entoncesdebemos
rechazartodasaquellasinterpretacionesenlasqueBATERIA_OK yOBJETO_ELEVABLE ten-
ganelvalorVerdadero yROBOT_S E_MUEVE tengaelvalorFalso. Cadafbfesunarestriccin
quenosdicealgoacercadelamaneraenlaqueelmundoseencuentra,ynospermiteasrecha-
zaralgunosdelosposiblesmodelos(cadamodelocorrespondeaunamaneraenlaqueelmundo
puedeestar). En general, cuantasmasfbfs tengamosparadescribirelmundo, menos modelos
tendremos! Estehechonodeberasorprendemos;cuantomssabemosacercadelmundo,menos
incertidumbretenemosdelestadodelmundo.
Esposiblequeninguna interpretacinsatisfagaunafbf(oconjuntodefbfs). Enestecaso,lafbf
(oelconjuntodefbfs)sedicequeesinconsistente oinsatisfacible. F esunejemplodefbfinsatis-
facible,comotambinloesPA -,P(ningunainterpretacinasignaaestasfbfselvalorVerdadero).
Unejemplodeunconjuntodefbfs insatisfaciblees{pv Q, P v-,Q,-,Pv Q, -,Pv -,Q} (utilizala
tabladeverdadparaconfirmarqueningunainterpretacinasigna Verdadero a todas estasfbfs).
13.5.4. Validez
Sedicequeunafbfes vlida si tieneelvalorVerdadero bajotodas lasinterpretacionesposibles
desustomosconstituyentes(as, unafbfvlidaestvacadesignificado;nonosdicenadanue-
voacercadecmopuedeestarelmundo).Aqutenemosalgunosejemplosdefbfs vlidas.
P::) P (loqueeslomismoque-,Pv P)
T
-,(PA -,P)
QvT
[(P::)Q) ::) PJ ::) P
P::)(Q::)P)
Latabladeverdadparadeterminarlavalidezdeunafbfcrecedeformaexponencialenrela-
cinalnmerodetomosconstituyentes,yaquelafbfdebeserevaluadaparatodaslascombi-
nacionesdelosvaloresdelostomos.
13.5.5. Equivalencia
Sedicequedosfbfs sonequivalentes si,yslosi,susvaloresdeverdadsonidnticosbajotodas
lasinterpretaciones.Denotamoslaequivalenciamedianteelsigno==. Podemosutilizarlastablas
deverdadparacomprobarlassiguientesequivalencias:
LeyesdeDeMorgan:
-,(rol v ro
2
) == -,00
1
A-,ro
2
-,(m1Aro
2
) == -,ro
l
v -,00
2
Leydecontraposicin:
(001 ::) 00
2
) == (-,roz::) --.00
1
)
Sirol Yro
2
sonequivalentes,entonceslasiguientefrmulaesvlida:
(001 ::) ro
2
)A(ro
2
::) rol)
Debidoa estehecho, lanotacin mI 00
2
esutilizadaconfrecuenciacomo abreviacinde
(rol::)ro
2
)A(00
2
::) mI)'
13.5.6. Consecuencia lgica
SiunafbfmtieneelvalorVerdadero bajotodasaquellasinterpretacionesparalascualescadauna
delasfbfsdelconjuntoLl tienenelvalorVerdadero, entoncesdecimosquellUeva lgicamente a
El clculoproporcional
ro, querose sigue lgicamente deLl, oqueroesunaconsecuencia lgica deLl. Utilizamoselsm-
bolo 1= pararepresentarlaconsecuencialgicayescribimosLl 1= ro. Aqutenemosalgunosejem-
plos:
{p} 1= P
{p,P::)Q} 1= Q
F 1= ro (donderopuedesercualquierfbf!)
.PAQI=P
Enlosdosltimosejemplos,hemosabreviadounpocolanotacin,comosehaceamenudo
cuandoLl esunconjuntounitario.
Lanocin de consecuencialgicaes importante enlAporqueprovee un mecanismo muy
robustoparademostrarquesi ciertasproposicionessonciertasenelmundo,entoncesotraspro-
posicionesdeinters(quizunasquenopuedensermedidas)debenserlotambin.Porejemplo,
supongamos que medimos caractersticas que asociamos con las frmulas BATERIA_OK y
-,ROBOT_SE_MUEVE, y querepresentamos parte de nuestro conocimiento acerca del mundo
mediantelafrmulaBATERIA_OKA OBJETO_ELEVABLE::)ROBOT_SE_MUEVE;esdecir,dis-
ponemosdetresfrmulas, dosdelascualesdescribenunasituacinparticulardelmundoylaotra
describeconocimientogeneralacercadeste. Dejamosparaellectorelejercicioconsistenteen
establecersi esconsecuencialgicadeestastresfrmulas utilizandouna
tabladeverdad.Usandoelconceptodeconsecuencialgica,ydadoque--.OBJETO_ELEVABLE
tieneelvalorVerdadero entodaslasinterpretacionesenlascualeslastres frmulastienenvalor
Verdadero, sta, forzosamente, debetenerel valorVerdadero ennuestrainterpretacin(estoes,
aquellaqueestamosasociandoconelmundodelrobot).Portanto,laproposicinqueformapar-
tedenuestra interpretacin, asaber,queelbloquenoeselevable,debesercierta.
Acausadequelaconsecuencialgicaesunaherramientamuypotenteparadeterminarla
verdad o falsedad de proposiciones acerca del mundo, es importante para nosotros estudiar
cmorepresentarinformacinmediantefbfsycmoproducirfbfs, consecuenciadestas,defor-
maeficiente.Siemprepodemoshacerestomedianteelmtododetablasdeverdad,peronecesi-
taremosmtodosmssencillos. Unsustitutoatractivodelaconsecuencialgicaeslainferencia.
Aunquesonconceptosfundamentalmentedistintos,estnrelacionadosmediantelosconceptosde
correccinycompletitud.
Solidez y completitud
Haydosdefinicionesimportantesqueconectanlainferenciaconlaconsecuencialgica(yapode-
mosasociarunsignificadointuitivoalosconceptosteorema ydemostracin):
l. Si,paraunconjuntodefbfsLl yparalafbfro, Ll 1- ro implicaqueLl 1= m, decimosque
elconjuntodereglasdeinferencia9{,esslido.
2. Si,paraun conjuntodefbfs Ll y lafbfm, tenemosque siempreque Ll 1= m, existeuna
demostracindemapartirdeLl utilizandoelconjuntodereglasdeinferencia9{,decimos
que9{escompleto.
Hastaahoranohemosdadoningnconjuntocompletodereglasdeinferenciaparaelclcu-
loproposicional;volveremossobreestacuestinenelprximocaptulo.
Cuandolasreglasde inferenciasonslidasycompletas,podemosdeterminarsiunafbfse
siguelgicamentedeunconjuntodefbfs mediantelabsquedadeunademostracin,envezde
205
El clculoproporcional
juntodevaloresesunainterpretacin.SeanotaelnmerodeclusulasconvalorVerdadero bajo
utilizarlas tablas de verdad. Cuandolas reglas de inferenciason slidas, si encontramos una
dichainterpretacin. Seguidamente,recorremoslalistadetomosycalculamos,paracadauno,
demostracindeO) apartirde~ sabemosqueO) sesiguelgicamentede~ . Cuandolasreglasde
elaumentoenelnmerodeclusulascuyovalorpasaraaserVerdadero si elvalorde esetomo
inferenciasoncompletas,sabemosqueseremoscapacesdeconfirmarsiO)sesiguelgicamente
fuese cambiado. Entonces, cambiamos el valor del tomo que genera el mayor aumento de
de ~ (cuandolohace) utilizandoun procedimientode bsquedaexhaustivaparaencontraruna
clusulas positivas y continuamos elproceso. Desde luego, el mayor aumento podraserOo
demostracin.Lasustitucindetablasdeverdadpormtodosdedemostracinnosdaunagran
negativo,peroSATG realizaelcambioigualmente.Comoelprocedimientopodraacabarvagan-
ventajacomputacional,tantoenelclculoproposicionalcomoeneldepredicados(queestudia-
dode formainterminableenunameseta,sehacequeterminedespusdehaberrealizadoun
remosmsadelante).
nmeropreviamentefijadodecambios. Ycomoel procedimientopodraacabarenunmximo
Determinarsiunafbfsesigueonodeunconjuntodefbfs, osisedemuestraapartirdeuncon-
local(unainterpretacinquesatisficiesealgunas,peronotodas,las clusulas),puedesernece-
juntodefbfs, es,engeneral,unproblemaNP[Cook, 1971].(Estoes,estacomplejidadnopuede
sarioreinicializarloconotrainterpretacinaleatoriaparaencontrarelmximoglobal.Elproce-
demostrarsequeseamenorenelnmerodetomos.)Encualquiercaso,haysituacionesespeciales
dimientoSATG hasidocapazdeencontrarmodelos para2.000variables generadas aleatoria-
quepuedentratarse,porloqueesimportantecomprenderelprocesoderazonamientolgico.
menteenproblemasSAT3, ytambinhasidoutilizadopararesolverelproblemadelasN-Reinas
paratamaosgrandes,partiendodeunacodificacinproposicionldelmismo. Porltimo,algu-
nasvariantes de SATG basadasenbsquedaaleatoria(WALKSAT), han demostrado unagran
El problema de SATP
efectividad[Selman; Kautz,yCohen, 1994,ySelman;Kautz,yCohen, 1996].
Muyamenudo,tendremosqueintentarestablecersitodos losmodelosdeunconjunto tambin
losondealgunafbf0). Sinembargo, de vezencuando,podramosquererencontrarcomomni-
Otras cuestiones importantes
mounmodelo de ~ ; es decir, podramos querermostrarque las fbfs enel conjunto son todas
satisfaciblesbajolamismainterpretacin,loqueeslomismoqueencontrarunmodeloparala
13.8.1. Distincinentreloslenguajes
frmulacompuestaporlaconjuncinde todaslasfbfs de~ .
El problemade encontrarunmodelo paraunafrmulaesconocidoconelnombrede pro-
El clculo proposicional es un lenguaje formal que un agente artificial utiliza para describir
blemadesatisfacibilidad proposicional (SATP). Enelprximocaptulomostraremosquecual-
su mundo. Hayunatendenciaa confundir, tanto loslenguajesinformalesdelasmatemticas,
quierfrmulapuedeserescritacomounaconjuncindedisyuncionesdeliterales.Unadisyun-
comoellenguajenatural(elcualeselqueestamosutilizandoenestelibroparahablaracercadel
cindeliteralesesdenominadaclusula, yunafrmulaexpresadacomounaconjuncindeclu-
clculoproposicional), con el propiolenguajeformal del clculo proposicional. Cuandodeci-
sulassellamaforma normal conjuntiva (FNC).La utilizacindeFNCes suficientepararesolver
mos,porejemplo,que{P,P::J Q} r- Q, utilizamoselsmbolor- . Estesmbolonoesunsmbolo
elproblemaSATP. Muchosproblemasinteresantes,comolasatisfaccinderestricciones,eldise-
dellenguajedelclculoproposicional;esun smbolodenuestrolenguaje utilizadoparahablar
odecircuitos,eldiagnsticodecircuitosylaplanificacin,puedenserresueltoscodificndolos
acercadel clculo proposicional. Comoejemplo, los smbolos metalingsticos r- y 1= nunca
comoproblemasSATPenFNC([Selman;Kautz, yCohen, 19941)5.
debenserconfundidosconelsmbolo::J.
UnprocedimientoexhaustivopararesolverelproblemaSATPconsisteenconsiderarsiste-
mticamentetodaslasposiblesmanerasdeasignarVerdadero yFalso alostomosdelafrmu-
lachequeandocadaasignacinparaversitodaslasclusulastienenelvalorVerdadero bajodicha
13.8.2. Metateoremas
asignacin. Sihayn tomosenlafrmula,hay2
n
asignacionesdiferentes;amedidaquen crece,
elprocedimientoexhaustivosehacecomputacionalmenteintratable. Adems de los teoremas del clculo proposicional (generados mediante patrones de reglas de
Casosespecialesinteresantesde SATPsonelSAT2yelSAT3. El problemadeSATk consiste inferencia),tendremosteoremasacercadelclculoproposicional(llamadosamenudometateo-
en encontrar un modelo para laconjuncin de clusulas, conteniendo la ms larga de stas
remas). Haydosteoremasimportantesacercadelclculoproposicional.
exactamentek literales.LosproblemasSATItienenunacomplejidadpolinomial,mientrasquelos
problemas SAT3 son NP-completos. As, que el problema general de SATPes NP-completo. Teoremadeladeduccin: si {0)1' 0)2' ..., O)n} 1= 0), entonces(001 A 0)2 A ... A O)n) ::J O) es
Pero, aunquetodoslosalgoritmosconocidospararesolverproblemas,comoeselcasodeSATP, vlido;ysi (0)1 A 0)2 A ... A OOn) ::J O) esvlido,entonces{0)1' 0)2' ..., O)n} 1= 0).
toman un tiempo exponencial en el peor caso, muchos problemas de este tipo requieren un Reduccinalabsurdo: sielconjunto~ tieneunmodelo,pero~ U {-,O)} nolotiene(esto
tiempo estimado de tipo polinomial. De hecho, para muchas distribuciones de probabilidad es,nohayningunainterpretacinquesatisfagatodaslasfbfsenelconjuntocombinado),
naturales, elproblemaSATPslorequiere de un tiempo mediopolinomial[Goldberg, 1979, y entonces~ 1= 0).
PurdomyBrown, 1987].
SATG es un procedimiento de bsqueda de tipo noexhaustivo, de ascensin de colina y
13.8.3. Leyesasociativas
voraz[Selman;Levesque,yMitchell, 1992,ySelmanyKautz, 1993].El procedimientoempie-
zaseleccionandounconjuntoaleatoriodevaloresparatodoslostomosdelafrmula. Estecon-
LasconectivasbinariasA yV sonasociativas;esdecir:
~ A ~ A ~ ~ ~ A ~ A ~
5 Cook[Cook, 1988]ha sealadoquelosprogramasparaSATPamenudosontans610 logarftmicamentemslar-
~ v ~ v ~ ~ ~ v ~ v ~
gosquelosprogramasfuenteoriginales.
As,enestasfufs podramoseliminarlosparntesisyescribir:
IDI /\ID
2
/\ID3
IDI V ID
2
V ID3
Laprimerasellamaconjuncin, ylasegundadisyuncin. ElelementoindividualIDi enlapri-
merafufsellamaconjuntor, yenlasegundafuf, disyuntor.
13.8.4. Leyesdistributivas
~ \ ~ v ~ ~ \ ~ v ~ \ ~
~ v ~ \ ~ ~ ~ v ~ \ ~ v ~
No nos dejemos engaar por la aparente simplicidad y obviedad de parte del material pre-
sentado en este captulo,' un aprendizaje o utilizacin inapropiados de estos conceptos causa-
ran graves dificultades 'flUs tarde!
13.1. Demuestre,medianteunatabladeverdad,que-,(P/\Q) ~ (-,Pv -,Q).
13.2. Demuestre,que,si~ esinconsistente(estoes,notieneningnmodelo),entonces~ 1= ro,
siendoID cualquierfuf.
13.3. Cmoutilizaralatabladeverdadparaprobarqueelmodus ponens escorrecto?
13.4. Considerelassiguientessieteclusulas:
-,Av-,Bve
-,AvB
-,Ave
-,Bve
-,BvA
-,evA
-,evB
Elprocedimiento SATG paraencontrarunmodeloque satisfagaunconjuntodeclusulas
algunasvecesacabaenunmximolocal.Demuestrequehayunaasignacindevaloresdeverdad
paraA, BYe,queesunmximolocal(peronoglobal)delnmerodeclusulassatisfaciblespara
dichaasignacin.
13.5. (CortesadeBartSelman.)DemuestrecmoelproblemadelasN-Reinaspuedeserrepre-
sentadomedianteSATP (introduzcauntomo 1 paracadacelda(k, 1) deltablerodeN X N.
Siqk, 1 tieneelvalorVerdadero, seencuentraunareinaendichacelda(k, 1); si tieneelvalorFal-
so, dichaceldaestvaca;definalasrestriccionesdelproblemaentrminosdeestostomos).
Laresolucin
enelclculo
proporcional
Una nueva regla de inferencia: la resolucin
14.1.1. Lasclusulascomofbfs
En el captulo anterior hemos mencionado varias reglas de inferencia, incluida la del modus
ponens. Muchasdeestasreglaspuedensercombinadasenunasola,llamadaregla de la resolu-
cin. La versindelaresolucinqueutilizaremosenestelibroseaplicaauntipoespecialdefufs,
llamadasclusulas, quevamosadefiniracontinuacin.
Primero,recordemosqueunliteral puedeseruntomo(encuyocasoseledenominaliteral
positivo) olanegacindeuntomo(encuyocasoselellamaliteral negativo). Unaclusulaes
unconjuntodeliterales.Elconjunto esunaformaderepresentarladisyuncindetodosloslite-
ralespertenecientesalconjunto.Deestamanera,unac1usulaesuntipoespecialdefuf. Porlo
general,escribiremoslasclusulas enforma de disyuncin, peroenalgunasdefinicionesrela-
cionadasconlaresolucin, ser ms sencilloexpresarlas mediantenotacindeconjuntos. Por
ejemplo,laclusula{p,Q,-,R} (equivalenteaPv Qv -,R)esunafuf. Laclusulavaca{ }(que
aveceslarepresentaremosmedianteNil)esequivalenteaF(cuyovaloresFalso).
14.1.2. Laresolucinaplicadaalasclusulas
La regladeresolucindelclculoproposicionalsepuedeformulardelasiguientemanera: apar-
tir de{A} U ElY{-,A} U E
2
(dondeElyL sonconjuntosdeliterales,yAesuntomo),pode-
mosinferirEl U aloqueseledenominaresolvente delasdosclusulas.EltomoAeselto-
mo resuelto, yalprocesolollamamosresolucin.
Acontinuacinsemuestranalgunosejemplos:
AlresolverRv PY-,PvQ obtenemosRv Q. Lasdosc1usulas resueltassepuedenres-
cribircomolasimplicaciones-,R :::) PYP:::) Q. Laregladeinferencia,denominadasilo-
207
gismo hipottico, aplicadaaestasimplicaciones, obtiene-,R :::) Q, quees equivalenteal
resolventeR v Q. Entonces,el silogismohipotticoesuncasoespecialdelaresolucin.
AlresolverRy-,Rv P obtenemos P. ComolasegundaclusulaesequivalenteaR:::) P,
vemosqueelmodus ponens tambinesuncasoespecialdelaresolucin.
AlresolverP v Qv R v Sy-,P v Q v WsobreP obtenemosQ v R v Sv W. Fijmonosen
quesloapareceunainstanciadeQ enelresolvente-quealfinyalcabo,estdefinido
comounconjunto!
Alresolver P v Q v -,Ry P v Wv -,Qv R sobre Q obtenemos P v -,Rv R v W. Alre-
solverlas sobre R obtenemos P v Q v -,Q v W. Enestecaso, comoambas disyunciones
-,R v R yQv -,QtienenelvalorVerdadero, elvalordecadaunodelosresolventesesVer-
dadero. Enesteejemplo,debemosresolversobreQ osobreR -peronosobreambosto-
mosalmismotiempo--.Esdecir, P v Wnoesunresolventedelasdosclusulas!
AlresolverA, unliteral positivo,con-,A seproducelaclusulavaca. DeAy-,A podemos
inferirF,porque Ay-,A soncontradictorios. Cualquierconjuntodefufs quecontengaAy-,A
es insatisfacible. Porotrolado, unaclusulaque contengaun tomo y su negacin (tal como
Av -,A) tieneelvalorVerdadero independientementedelvalordeA.
14.1.3. Lacorreccindelaresolucin
Laregladela resolucinqueacabamosdepresentaresunaregladeinferenciaslida.Esdecir, si
lasclusulas {A} U :.El Y{ -,A} u :.E
z
tienenambaselvalorVerdadero, suresolvente:.El u:.E
2
tam-
bin lo tiene. Una forma de demostrar este hecho es realizar un razonamiento porcasos.
SabemosqueeltomoApuedetener, obienel valorVerdadero, obienel valorFalso. Si(caso 1)
AtuvieseelvalorVerdadero, entonces-,A deberatenerloFalso, ylaclusula deberatenerel
valorVerdadero, paraquelaclusula{-,A} u:.E
2
tuvieseelvalorVerdadero. Si(caso2)A tuvie-
seelvalorFalso, entonceslaclusula:.E
l
deberatenerelvalorVerdadero, paraquelaclusula
{A} u:.E
l
tuvieseelvalorVerdadero. Alcombinarestosdoscasos,podemosverque,obien:.E
I
o
bien debentenerelvalor Verdadero, ydeaquque:.El u tambinlotenga. Unargumento
similarsepodraobtenerutilizandolatabladeverdad.
Conversin de fofs a conjunciones de clusulas
Cualquierfufdelclculoproposicionalsepuedeconvertiraunaconjuncindeclusulas.Cuando
unafufestescritacomounaconjuncindeclusulassedicequeestenforma normal conjunti-
va (FNC)(yunafufescritacomounadisyuncindeconjuncionesdeliteralessedicequeesten
forma normal disyuntiva (FND.Utilizaremosunejemploparailustrarlospasosdelprocesode
conversindeunafufaFNC.Lafufconlaqueilustraremoselprocesoes :::) Q) v (R :::)
1. Eliminarlasimplicacionesmediantelaformaequivalenteusandov:
v )V (-,R v
2. Reducirelmbitodelossignosdenegacin-,mediantelasleyesdeDeMorganylaeli-
minacindeladoblenegacin-,:
(pA -,Q)v (-,Rv P)
Laresolucinenelclculoproporcional
3. ConvertiraFNCmediantelasleyesasociativaydistributiva.Primero,hacemos:
v -,R v P) A (-,Qv -,R v
loqueequivalea:
(Pv -,R)A (-,Qv -,Rv p)
Unaconjuncindeclusulas(esdecir,laFNCdeunafuf) porlo generalseexpresa
comounconjuntodeclusulas(endondelaconjuncindelasclusulasquedadeforma
implcita);deestamanera,finalmente,escribiramos:
{(Pv -,R), v -,Rv p)}
Elsiguienteprocedimientopodrasertilenelpaso3,paraconvertirfufs(opartesdefufs)
deFNDaFNC.Primero,delasfufsenFNDobtenemosunamatrizenlaqueloselementoshori-
zontalessonlosliteralesdecadaconjuncin;ladisyuncinestimplcitaentreloselementosver-
ticales.Porejemplo,laformaFDN(pA Q A-,R)v (8ARA-,P)v (Q A8 A P)puedeserres-
critaenformadematrizcomosigue:
P Q -,R
8 R -,P
Q 8 P
AhoraseleccionamosunJitera!decadafilayconstruimosunadisyuncinconellos.Ennues-
troejemplo,unaseleccinpodraserP v Rv P.Hacemostodaslasseleccionesposibles.Cada
seleccincorrespondeconunaclusula,yhacemosdelaconjuncindetodasestasclusulasla
FNCdelafuforiginal.Podemossimplificaralgunasdeestasclusulas;porejemplo, P v R v P
sesimplificaporP v R. Podemoseliminaralgunas delasclusulas; porejemplo, P v -,Pv Q
puede sereliminadaporquetrivialmente tiene unvalorVerdadero. Tambinpodemoseliminar
aquellasclusulasquesonsubsumidasporotraclusula(unaclusula11 subsumeaotraclusu-
la12 silosliteralesde11 sonunsubconjuntode losde12)' Porejemplo, P v Rsubsumetantoa
P v R v Q comoaP v R v 8.
Refutacin mediante resolucin
Yahemosvistoquelaresolucinesunaregladeinferenciaslida.Esdecir, queLl t- ,"s 1implica
queLl 1= 1,donde1esunaclusula.Perolaresolucinnoescompleta.Porejemplo,tenemosque
PAR1= P v R, peronopodemosinferirP v Rutilizandolaresolucinsobreel conjuntodeclu-
sulas {p,R} (porquenohaynadapararesolvermediantelaresolucin). Portanto, nopodemos
utilizardirectamentelaresolucinparademostrartodas lasconsecuenciaslgicas.Sinembargo,
podemosutilizarlaresolucinparademostrarquelanegacindeP v R esinconsistenteconel
conjunto{p,R} y, deestamanera,haciendounademostracinmediantecontradiccin,estable-
cerque PAR1= P v R.
Parailustrarelproceso,consideraremoslanegacinde P v R, quees-,PA -,R.Expresada
comounconjuntodeclusulas(enformaconjuntiva),lanegacindeloqueintentamosdemos-
trar es{-,p,-,R}.ParamostrarlainconsistenciadeestasclusulasconPAR,aadimos PyR,
obteniendoelnuevoconjunto -,R, P, R }.Alresolversobrelosmiembros de este ltimo
conjuntoobtenemoslaclusulavaca,queesunacontradiccin,ydeestamanerahemosdemos-
trado,deformaindirecta, P v Rapartirde PAR.
Engeneral,larefutacindeunafufro medianteresolucinoperadelasiguientemanera:
1. Convertir las fufs contenidas en \ a laforma clausal -unconjunto (conjuncin) de
clusulas.
2. Convertirlanegacindelafufquedebeserprobada,ro, alaformaclausa!.
3. Unirlasclusulasresultantesdelospasos1y2enunnicoconjuntor.
4. Deformaiterativa,aplicarlaresolucinalasclusulasdereiraadiendolosresultados
ar,hastaque,obiennohayamsresolventesquepuedanseraadidos,osehayagene-
radolaclusulavaca.
Definiremoslossiguientesresultadossindarunademostracinformal
l
:
Completituddelarefutacinmedianteresolucin: si \ F ro, entonceselprocedimientode
refutacinmedianteresolucingenerarlaclusulavaca. Portanto,podemosdecirquela
resolucinenlgicaproposicionalescompleta en refutacin.
Decidibilidaddel clculoproposicionalparalarefutacinmedianteresolucin: si\esun
conjuntofinito declusulasy\ ro, entonceselprocedimientoderefutacinmediante
resolucinterminasingenerarlaclusulavaca.
El razonamiento que utilizamos en el ejemplo del levantamiento de bloques del ltimo
captulopuedeserimplementadoutilizandolarefutacinmedianteresolucin.Elconjunto\de
fufs ser:
1. BATERIA_OK
2. -,ROBOT_SE_MUEVE
3. BATERIA_OK1\ OBJETO_ELEVABLE:::) ROBOT SE MUEVE
Laformaclausaldelatercerafufser:
4. -,BATERIA_OKv -,OBJETO_ELEVABLEv ROBOT_SE_MUEVE
Lanegacindelafufquedebeserdemostradageneralaclusula:
5. OBJETO_ELEVABLE
Ahora, realizamos unaseriede resoluciones paraproducirlasiguiente secuenciade clu-
sulas:
6. v ROBOT_SE_MUEVE(resolviendo5con4)
7. -,BATERIA_OK(de6y2)
8. Nil(de7y 1)
Tambin podemos representar esta refutacin mediante un rbol de refutacin, como se
muestraenlaFigura14.1.
I Existenmuchasdemostracionesdelacompletituddelarefutacinmedianteresolucinenlgicaproposicional;
vase [GeneserethyNilsson, 1987,p. 87] parauna deellas (lacompletitudenlgicaproposicionaltambinsesigue
lgicamentecomoun casoespecialdelacompletituddelarefutacinmedianteresolucinen16gicadeprimerorden,
quecomentaremosenelCaptulo 16).Ladecidibilidadsesiguedelhechodeques6lohayun nmerofinitode posibles
resolucionessobreunconjuntofinitodeclusulas.
OBJETO_ELEVABLE
,BATERIA_OK v ,OBJETO_ELEVABLE v ROBOT_SE_MUEVE
,BATERIA_OK
BATERIA_OK
Figura14.1.
Un rbolderefutacinmedianteresolucin.
Estrategias de bsqueda en refutacin mediante resolucin
Aunqueelprocedimientoderefutacinmedianteresolucinpuedeserdescritofcilmentecomo
la realizacin de resoluciones hasta que laclusula vaca se genere, est lacuestin, muy
importante, de qu resoluciones se deberanrealizarantes.Adems, podrasucederque no se
necesitaserealizaralgunasresoluciones.Estostemas sonlosquevamosatratarenestaseccin.
14.4.1. Estrategias de ordenacin
Primerodetodo,enquordensedeberanrealizarlas resoluciones?Estacuestinesanlogaa
lascuestionesacercadequnodosedeberaexpandirenlabsquedadeestados.Variasestrate-
gias,denominadasestrategias de ordenacin, hansidopropuestas. Podemosdefinir,porejemplo,
estrategiasdeltipoprimero en anchura ydeltipoprimero en profundidad. Peroantes,hagamos
algunasdefiniciones: llamemosalasclusulasdelconjuntooriginal(incluyendolaformaclausal
delanegacindelafufquedebeserdemostrada)resolventes del nivelO. Unresolventedelnivel
(i +1)escualquierresolventedeunresolventedelniveli ydeunresolventedelnivelj,conj i.
Entonces, una estrategia del tipo primero en anchura es aquella que genera antes todos los
resolventesdelprimernivel;luego,todoslosdelsegundonivel,yassucesivamente.
Unaestrategiadeltipoprimeroenprofundidadgeneraraprimerounresolventedelprimer
nivel, entoncesresolveraesaclusulaconalgunaclusuladelprimernivelodel nivelO,para
generarunresolventedelsegundonivel,yassucesivamente.Fijandounacotadeprofundidad,
sepodraaplicarunaestrategiadebsquedahaciaatrs.Msadelantevolveremosaunaaplica-
cindelaresolucinmediantebsquedadeltipoprimeroenprofundidad.
Unaestrategiamuyconocidaparaordenarparcialmentelasresolucioneseslapreferencia uni-
taria. Enestaestrategia, sedapreferenciaa resolucionesenlasque, comomnimo, unadelas
clusulassecomponedeunsololiteral.Adichaclusulase lellamalaclusula unitaria. Sepue-
de observarque elejemplode laFigura 14.1 no violalaestrategiadepreferencia unitaria (es
decir, nohayningunaresolucincompuestapordosclusulasnounitariasenelrbolderefuta-
cin).
212
14.4.2. Estrategiasderefinamiento
Lasestrategias de refinamiento nodicennadaacercadelordenenelquelasclusulasdebenser
resueltas; simplemente, imponen restricciones para realizar slo algunos tipos de resolucin.
Algunas de estas limitaciones (no todas!) hacen que la refutacin mediante resolucin sea
completa.
Conjunto soporte
Unaclusula12 es unaclusuladescendiente de unaclusula1J' si, y slosi: a) 12 esunresol-
ventede11 yalgunaotraclusula,o b) 12 es unresolventedeunaclusuladescendientede11 y
algunaotraclusula. Si12 esunaclusuladescendientede11' entonces11 esunaclusulaante-
cesora de12' Elconjunto soporte estarformadoporaquellasclusulasqueson,obienclusu-
lasprovenientesdelanegacindel teoremaquedebeserdemostrado,obiendescendientesde
aquellasclusulas.
Laestrategiadel conjuntosoporte slopermiterealizar resoluciones enlasque unade las
clusulasqueestnsiendoresueltaspertenecealconjuntosoporte. Sepuedeobservarquelarefu-
tacinmedianteresolucindelaFigura 14.1 seadscribealaestrategiadelconjuntosoporte.
Laestrategiadelconjuntosoporteescompletaenrefutacin[ChangyLee, 1973,p. IIO]; es
decir,si realizamossloresolucionesbasadasenelconjuntosoportesobreunconjuntodeclu-
sulasinsatisfacible,tardeotempranosegenerarlaclusulavaca.
Resolucin lineal
Laestrategiaderesolucin lineal slopermiteresolucionesenlasque,comomnimo,unadelas
clusulasqueestnsiendoresueltasesunmiembrodelconjuntodeclusulasoriginal(incluyendo
aquellasqueprovienendelanegacindelafufquedebeserdemostrada).Larefutacinmedian-
teresolucindelaFigura 14.1 tambinseadscribealaestrategiaderesolucinlineal.
Laestrategiaderesolucinlinealnoescompletaenrefutacin,talcomosepuedeobservar
considerandoelsiguienteconjuntodeclusulasinconsistentes:
v Q, P v -,P v Q, -,P v
Estasclusulasnotienenningnmodelo,yhayunarefutacinmedianteresolucinparaellas.
Dejamoscomoejerciciolademostracindequenohayningunaresolucinlinealparaestasclu-
sulas,peroshay unarefutacinmedianteresolucinparaellas.
Filtrado de los antecesores
Laestrategiadefiltrado de los antecesores slopermiteaquellasresolucionesenlasque,como
mnimo, un miembro de las clusulas que estn siendo resueltas es, o bien un miembro del
conjuntodeclusulasoriginal,obienunantecesordelaotraclusulaqueestsiendoresuelta.La
estrategiadefiltradodelosantecesoresescompletaenrefutacin [Luckham, 19701.
Clusulas de Horn
ExisteuntipoespecialdeclusulaqueesimportanteenlaLA yenotrosmbitosdelasciencias
delacomputacin.Unaclusula de Rom esunaclusulaquetiene,comomucho, unliteralposi-
tivo.
AlgunosejemplodeclusulasdeHornsonlossiguientes:
P, -,P v Q, -,P v v R, -,P v-,R
LasclusulasdeestetipofueroninvestigadasporprimeravezporellgicoAlfred Horn[Horn,
1951].
ExistentrestiposdeclusulasdeHorn:
Untomosimple-amenudollamadohecho.
Unaimplicacin-amenudollamadaregla- cuyo antecedenteconsisteen unacon-
juncindeliteralespositivosycuyoconsecuenteesun sololiteralpositivo.
Unconjuntodeliteralesnegativos--escritosenformadeimplicacin,conun anteceden-
tecompuestoporunaconjuncindeliteralespositivos,yunconsecuentevaCo--. Estafor-
maseobtiene,porejemplo,cuandounoniegaunafufquedebeserdemostrada,compuesta
porunaconjuncindeliteralespositivos.Adichaclusulasele denominadaobjetivo.
EjemplosdeestostrestiposdeclusulasdeHornson P, P 1\ Q :::::> R, y P 1\ Q:::::>, respectiva-
mente.
UnresultadoimportanteacercadelasclusulasdeHornenlgicaproposicionalesqueexis-
ten algoritmos de deduccin de orden lineal para ellas [Dowling y Gallier, 1984]. Intuitiva-
mente,lacausadelacomplejidadNP-Duradelainferenciaenclusulasquenosonclusulasde
Hornesqueal intentardemostrarunadisyuncindeliteralespositivos,talcomoP v Q, debemos
considerarmltiplescasos-demostrarbien P o Q-.Sinembargo,enlasclusulasdeHornno
haydisyuncionesdeliteralespositivos.
Los sistemasparademostrarobjetivosapartirdereglasyhechosconclusulasdeHornpro-
porcionan,porlogeneral,unaordenacindelainformacinsuministradaal sistemamediantela
escrituradeloshechosylasreglasenunciertoorden,mediantelaescrituradelosliteralesenel
antecedentedecadareglaodel objetivoenotrociertoorden,y, posteriormente,mediantelabs-
quedadelademostracin,basadaen unaestrategiadeltipoprimeroen profundidad,combinada
conestas ordenaciones previas. Estudiaremos este procedimiento con ms detalle despus de
nuestraexposicinsobrelalgicadepredicados.
14.1. DemuestrequeelprocedimientodelamatrizparaconvertirfufsdeFNDaFNCconserva
laequivalencia.
14.2. Cara, yo gano; cruz, t Exprese estos enunciados (msotros enunciadosque
puedanecesitar)enelclculoproposicional,yutilicelaresolucinparademostrarqueyogano
(deformaalternativa,puedecambiarelproblemasiprefiriese: Cara,t ganas;cruz,yopierdo).
14.3. Lassiguientesfufs soninstanciasdeaxiomasque, algunasveces, seutilizanenelclculo
proposicional:
1. Introduccindelaimplicacin: P:::::> (Q :::::>
2. Distribucindelaimplicacin: (P :::::> (Q :::::> R)) :::::> P :::) Q):::::> (P :::::> R))
3. Reduccinalabsurdo: (Q :::::> -,P) :::::> Q :::) p):::::> -,Q)
Utilicelarefutacinmedianteresolucinparademostrarcadaunadeestasfrmulas.
14.4. Considereelsiguienteconjuntodeclusulasinsatisfacible:
pvQ
PY-.Q El clculo
-.PvQ
-.Py-.Q
de predicados
1. Construyaunarefutacinmedianteresolucinconcadaunadeestasestrategias:
a) Resolucinconconjuntosoporte(enlaqueelconjuntosoporteeslaltimaclusulade
lalista).
b) Resolucinmediantefiltradodelosantecesores.
c) Unaestrategiaquevioletantoelconjuntosoportecomoelfiltradodelosantecesores.
2. Demuestrequenoexisteunarefutacinmedianteresolucinlinealparaesteconjuntode
clusulasinsatisfacible.
14.5. Conviertalasiguientefbfdelgicaproposicionalaclusulas:
-.[py -.Q) R) A R)]
Introduccin
Elclculoproposicionalpresentadiversaslimitaciones.Nopodemos,porejemplo,expresarel
hechodeque, cuandomovemoselbloqueB decimosqueeselmismobloquequeelasertadopor
SOBRE_B_C, queexpresaquesteestsobreelbloqueC. Enelclculoproposicionallosto-
mossoncadenasdetextoquenodisponendeunaestructurainterna.Enproposicionessobreblo-
ques,comoSOBRE_A_B ySOBRE_B_C, lasproposicionessontotalmentediferentes,ysinnin-
gunarelacinentreellas.Aunquehemosutilizadonombresmnemotcnicosparaestostomos
(paraayudamosarecordarloqueintentamosexpresarconellos),bienpodamoshaberutiliza-
dootrascadenasdetextoparaconstruirlas,comopodanhabersido P124y Q23,respectiva-
mente.
Unlenguajemuchomstilseraaquelquepudierareferirseaobjetos delmundo(talescomo
losbloques),del mismomodoquelohacemosaproposicionesacercadelmundo.Necesitamosun
lenguajequedispongadenombresparalosobjetosacercadeloscualesqueremosformularlas
proposiciones,ydenombresparalasproposicionesquequeremosformular. Ennuestromundode
bloquesdejuguete(alque,deahoraenadelante,llamaremosmundodebloques)podramos
tenerproposicionestalescomoSOBRE_B_C -.LIBRE_C, donde intentaexpresar
queelbloqueenotienenadaencimadel. Paraexpresarunhechocomoste,paracadaunode
losdiferentesbloquesnecesitaramosdefinirmuchasfrmulas proposicionales. Seramsinte-
resantesipudisemossimplementedecircosascomoSobre(x, y) -. Libre(v).dondex e
y sonvariablesquesepodranreferiracualesquierabloques.
En este captulo presentaremos un lenguaje, llamado clculo de predicados de primer
orden, quegozadeestascaractersticas.Elclculodepredicadosdisponedesmbolos, llamados
constantes de objetos, constantes de relaciones yconstantes de funciones, msotroselementos
queseintroducirnms adelante.Estasentidadesdellenguajeseutilizarn(cuandohablemosde
la semntica) para referimos a los objetos del mundo y a las proposiciones acerca de este
mundo.
215
216
217
El lenguaje y SU sintaxis
Primerovamosaintroducirunaversinrestringidadelclculodepredicados,quemsadelante
ampliaremos.Porahora,vamosaresistirlatentacindeasociarsignificadosalasdiferentescons-
truccionesdellenguaje. Deestamaneraestaremosenlamismaposicinqueladeun programa
de ordenadorque tiene que manipularestasestructuras! Todas lasexpresionesdellenguaje se
escribirnen fuentedemaquinadeescribir(haymuchasotrasconvencionestipogr-
ficas paraelclculodepredicadosenotroslibrosYartculos. Lautilizadaaqunoeslauniver-
sal!).
Componentes
Disponemos de un conjunto infinito de constantes de objetos. stas sern cadenas de
caracteresalfanumricos(amenudomnemotcnicas,queslonosayudananosotros, noal
ordenador). Nuestra norma ser que las constantes de objetos comiencen por una letra
maysculaounnmero.
Ejemplos: Aa, 125, 13B, Q, John, LaTorreEiffe1
Tambin dispondremos de un conjuntoinfinito de constantes de funciones de todas las
aridadesl. stasserncadenasdecaracteresalfanumricos, comenzandosiemprecon
unaletraminsculaeindicandoconunsuperndicelaaridaddelafuncin.
Ejemplos: padreDe
1
, distanciaEntre
2
, producto2
TaJ)1bin disponemosdeunconjuntoinfinitodeconstantes de relaciones detodaslasari-
dades.stasserncadenasdecaracteresalfanumricoscomenzandoporunaletramays-
culay(porahora)conunsuperndicesuaridad(avecesllamaremospredicado aunacons-
tantederelacin).
Ejemplos: B17
3
, Padre
2
, Largo
1
, Libre", Xl1
4
Tambinutilizaremoslasconectivasproposicionalesv,/\," Y=>, ylosdelimitadores(, ),
[, J, yelseparador,.
Trminos
Unaconstantedeobjetoesun trmino.
Unaconstantedefuncin dearidadn, seguidaporn trminosentreparntesis,yseparados
porcomas, es un trmino. A este tipo de trmino se le llama expresin funcional. Al
representardichostnninos,porlogeneral,omitiremoselsuperndicedelaaridadsiempre
quesuvalorse puedadeducirdelcontexto. Podramospensarenlasconstantesdeobjetos
comosistasfuesenconstantesdefuncindearidadO.
Ejemplos:padreDe(John, Bi 11), producto(4, suma( 3, 6) ), Sam.
Lapalabrainventadaaridad provienedelsufijoario queencontramosenlaspalabrasbinario(aridad= 2),ter-
nario(aridad= 3),Yassucesivamente.
El clculodepredicados
}bfs
tomos: unaconstantederelacindearidadn, seguidaden trminosentreparntesis, y
separadosporcomasesuntomo (tambinselellamafrmula atmica). Enunaconstante
derelacindearidadOseomiteel parntesis.Tambinomitiremos,porlogeneral,elsupe-
rndicedelaaridadsiemprequesuvalorsededuzcadelcontexto.
Untomoesunafuf.
Ejemplos: MayorQue(7, 2) , P(A, B, e, D) , Q
Fbfsdepredicados: unaexpresinformadaporfufsdelclculodepredicados-delamis-
mamaneraqueenelclculo proposicionalseformanfufs apartirdeotras- esunafuf,
denominadajbfde predicados.
Ejemplo: [MayorQue(7, 2) /\MenorQue(4, 15)] v,Hermano( Sam) v P
(Tngaseencuentaquelasfufs utilizadasenestosejemplosnotienenporqusignificarnada
enabsoluto.)
Tambinutilizaremoslasextensionesquehicimosenelclculoproposicional(conjunciones
con ms de dos conjuntores, y disyuncionesconms de dosdisyuntores, clusulas, conjuntos
(conjuntivos)declusulas,etc.)comofufsenelclculodepredicados.Porahora,stossonlos
nicostrminosqueconsideraremos. Msadelanteintroduciremosotros(quepermitirntratar
conlasvariables).
lA semntica
15.3.1. Mundos
Ahoradisponemosdeunlenguajequepodemosutilizarparareferirnosalosobjetosdelmundo,
ascomoalasproposiciones.Aqutenemosloquepodemosdecirenestosmomentos:
Elmundopuedetenerunnmeroinfinitodeobjetos, tambinllamadosindividuos. Estos
individuospuedenserconcretos,comoel BloqueA, elSr.Whitney,JulioCesar,ytantos
otros. Perotambinpuedenserentidadesabstractas,comoelnmero7, n, elconjunto de
todos los enteros, y muchos otros. Tambin pueden serentidades ficticias o inventadas
(cuyaexistenciapuedesercuestionadaporalguien),comolabelleza,PapNoel, ununi-
cornio,lahonestidad,ytantosotros.Siestamosdispuestosadarleunnombreydeciralgo
del,podemospensaracercadelobjetocomounindividuorealdelmundo,acercadelcual
queremoshablar.
Funcionessobreindividuos. Podemostenerunnmeroinfinitodefuncionesdetodaslas
aridades queproyectantuplasden individuosenun soloindividuo. Porejemplo,podra
haber una funcin que proyectara una persona en su padre, o una que proyectara los
nmeros10y2enelcociente5.
Relacionesentreindividuos.Losindividuospuedenparticiparenun nmerocualquierade
relaciones.Cadaunadestastendrunaaridad(aunarelacindearidad I se ladenomina
propiedad). Deestamanera,losindividuospodrantenerpropiedadescomopesado,grande,
azul,ymuchasotras,ypodranparticiparenrelacionescomoelmsgrandede,estarentre,y
muchasms.Paraespecificarunarelacinn-aria(dearidadn) deformaextensional, debemos
listardeformaexplcitatodaslastuplasden individuosqueparticipanenesarelacin.
218
219
15.3.2. Interpretaciones
Unainterpretacin deunaexpresindelclculodepredicadosesunaasignacin(oaplicacin)
quealasconstantesdeobjetoslesasignaobjetosdelmundo,alasconstantesdefunciones n-arias
lesasignafuncionesn-arias,yalasconstantesderelacionesn-ariaslesasignarelacionesn-arias.
Estasasignacionessedenominandenotaciones desuscorrespondientesexpresionesdelclculo
depredicados.Alconjuntodeobjetossobreloscualesseestablecenlasasignacionesdelascons-
tantesdeobjetosseledenominadominio delainterpretacin.
Dadaunainterpretacinparaloscomponentesdeunaexpresin,untomotieneelvalorVer-
dadero sloenelcasodequeseasostenible(esdecir,queseacorrectaenelmundo)larelacin
denotadaparaaquellosindividuosdenotadosporsustrminos. Silarelacinnoessostenible,el
tomotieneelvalorFalso.
LosvaloresdeVerdadero yFalso delastbfsnoatmicassedeterminanmediantelasmismas
tablasdeverdadqueseutilizanenelclculoproposicional.
Ejemplo: consideremosotravezelmundodebloques. Esunmundoenelqueexistenenti-
dades,losbloquesA,B,C,yelSuelo
2
. Al final, construiremosunaasignacinqueasignarestos
objetosdelmundoaloselementosdelclculodepredicados. Comonopodemoshacerquelos
propiosobjetosseanlosvaloresdelasasignaciones,imaginaremosqueelmundoesunaestruc-
turamatemtica,que(juntoaotrasmuchascosas)contienealosobjetosmatemticosA, B,C y
Suelo (no se incomode porel enunciado el mundo es unaestructura matemtica. Lo que
realmente seaelmundononosimportaparanuestropropsitodeconsiderarlocomounaestruc-
turamatemtica).
Tambin imaginaremos relaciones entre estos objetos. Porejemplo, podramos tenerlas
relacionesSobreyLibre.Estasrelacionessepuedendefinirextensionalmenteporlastuplasde
losn objetosqueparticipanenella. Porejemplo,supongamosquetenemoslaconfiguracinde
bloquesdelaFigura15.1.Enestemundo,larelacinSobresedaporlospares<B,A>,<A, C>
y<C,Suelo>,ylarelacinLibresedaporelelemento.
Portanto,losindividuosA, B,C,yelSuelo,ylasrelacionesSobreyLibreforman nuestro
mundodebloquesdeesteejemplo. Paradescribirestemundomedianteelclculodepredicados
emplearemoslasconstantesdeobjetoA, B, e,y S,laconstantederelacinbinariaSobre,yla
constantederelacinunariaLibre.Utilizaremossmbolosmnemotcnicosporconveniencia;
probablemente sera mejor de forma pedaggica utilizar las constantes de relacin G0045f
G123f , yotras,paraenfatizarlaideadequelos smbolosqueseutilizanennuestrolen-
guajedeclculodepredicadosnodisponendeningnsignificadoa priori.
Suelo
Figura15.1.
Unaconfiguracindebloques.
2 Avecesutilizaremostextoennegritaparaobjetos,funciones yrelacionesdelmundo-encontrasteconlatipo-
grafademquinadeescribirqueutilizamosenloselementosdelclculodepredicados- paramarcarladis-
tincinentreloselementosdellenguajey losquestosdenotan.
Elclculodepredicados
Clculodepredicados Mundo
A A
B 8
e C
s Suelo
Sobre Sobre={<8,A>,<A,C>,<C,Suelo>}
Libre Libre={<8>}
Tabla15.1.
Unaaplicacinentreelclculodepredicadosyel mundo.
Laasignacinquehemoselegidoparaestasexpresionesdelclculodepredicados,queesuna
deentrelasmuchasinterpretacionesposibles,semuestraenlaTabla15.1.Podemosutilizaresta
asignacinparadeterminarelvalordealgunastbfsdelclculodepredicados:
Sobre(A, B) esFalsa porque<A,B>noseencuentraenlarelacinSobre.
Libre(B) es Verdadera porqueseencuentraenlarelacinLibre.
Sobre(ef S) esVerdadera porque<C,Suelo>seencuentraenlarelacinSobre.
Sobre(ef S) /\ -,Sobre(Af B) es Verdadera porque ambas relaciones son Verda-
deras.
15.3.3. Modelosyotrosconceptosrelacionados
Muchosconceptos semnticos delclculodepredicadostienenlamismadefinicin queenel
clculoproposicional.Vamosarevisarlos:
Unainterpretacinsatisface unatbfsilatbftieneel valorVerdadero bajoesainterpreta-
cin.
Unainterpretacinquesatisfaceunatbfesunmodelo desta.
TodatbfquetieneelvalorVerdadero bajotodaslasinterpretacionesesunatbfvlida.
Todatbfquenotieneningnmodeloesunatbfinconsistente oinsatisfacible.
SiunatbfrotieneelvalorVerdadero bajotodasaquellasinterpretacionesparalasquecada
tbfdelconjuntoAtieneelvalorVerdadero, entoncesrosesiguelgicamente(oesunacon-
secuencialgica)dem(A 1- m).
Dostbfssonequivalentes si,yslosi, susvaloresverdaderossonidnticosbajotodaslas
interpretaciones(esdecir, si,yslosi,cadaunaellassesiguelgicamentedelaotra).
15.3.4. Conocimiento
Lasfrmulas del clculo de predicadossepuedenutilizarpararepresentarel conocimiento
quetieneunagenteacercadelmundo.Al conjuntoAformadoporestetipodefrmulassele
l1ama base de conocimiento del agente, y siunafrmula ro seincluyeenA, podemosdecir
(conciertaimpropiedad) queel agente conoce ro (serams acertadodecirqueelagente
creero).
Vamosaanalizarmsdetenidamentequesloquequeremosdecircuandoafirmamosqueun
conjuntode frmulas expresaunconocimiento acercadel mundo. Porejemplo, lassiguientes
frmulasexpresanelconocimientoacercadeunposiblemundodebloques?
1. Sobre(A, S) ::> Libre(B)
2. Libre(B) "Libre(e)::>Sobre(A, S)
3. Libre(B) v Libre(A)
4. Libre(B)
5. Libre(e)
Utilizandolosnombresmnemotcnicoscomounapista,fcilmentepodemosconstruirinter-
pretacionesdel mundodebloquesquesatisfaganestasfrmulas yqueseanmodelosdeellas.Las
situacionesquetenemosenmentesemuestranenlaFigura15.2.Enlastres situaciones,elmode-
loutilizalamismaasignacindeobjetosaconstantesdeobjetosqueseutilizenlaTabla15.1.
Laasignacinderelacionesenelmundoaconstantesderelacionesson, sinembargo,diferentes
enlostresmodelos.Enelprimero,alaconstantederelacinSobreselehaasignadolarelacin
Sobre= {<B,A>,<A,Suelo>,<C,Suelo>},yalaconstantederelacinLibreselehaasigna-
dolarelacinLibre {<C>,}.Fcilmente,sepodranestablecerlos modeloscorrespon-
dientesalasotrasdossituacionesdelaFigura15.2.
Existenademsotrosmodelosparaestasfrmulasdistintosdelossugeridosporlosnombres
mnemotcnicosdelclculodepredicados.Porejemplo,puedehaberunmodeloenelque Bye
seandiferentesnombresdelclculodepredicadosparaelmismoobjetodelmundo,o sea, B,y
puedehabermodelosenlosqueA, BYe noseanasignadosabloques,sinoanmeros3. Algunos
deestosmodelosalternativospodranserdescartadosmediantelaadicinde nuevas frmulas.
Porejemplo,podramosdescartarlos modelos correspondientes a dos de las situacionesde la
Figura 15.2aadiendolafrmulaLibre(A),asumiendolamismaasignacindeconstantesde
objetosyobjetosdelaTabla 15.1.Comoyadijimoscuandohablamosdelclculoproposicional,
cuantasmsfrmulastengamos,menorserel conjuntodemodelosposibles.As, siqueremos
concretarlossignificadosdeunconjuntodefrmulas,detal maneraqueestasfrmulas consti-
tuyan conocimientoacercadeunmundoenparticular,debemostenerlassuficientesfrmulas
paraquesusmodelosnosloincluyanelmundoquetenemosenmente, sinoqueexcluyanaque-
llosmundosconlosquenoqueremosconfundirlos.
Cuantificacin
Supollgamosquequeremosexpresarquetodoslosobjetosdeldominiotienenunaciertapropie-
dad(oparticipabanenunaciertarelacin). Podramoshacerlo,paraundominiofinito, median-
[AlfBlrcJ
Suelo Suelo Suelo
Figura15.2.
Tressituacionesenelmundode bloques.
3 HayunteoremadeLOwenheimquedicequetodoslosconjuntosconsistentesdelclculodepredicadostienenun
modelocuyodominioeseldelosenteros[Lowenhem, 1915].
Elclculode predicados
te una conjuncin, tal como Libre(Bl) "Libre(B2) " Libre(B3) " Libre(B4),
peroesengorrosomanejarconjuncioneslargas,ynuncapodramosescribirconjuncionesinfini-
tas,aunquepodrannecesitarseendominiosquelofueran.
Supongamos que queremos expresar que al menos un objeto del dominio tiene cierta
propiedad.Paradominiosfinitos, unasentenciadeestetipopodraconstruirsemedianteuna
disyuncin, tal como Libre(Bl) v Libre(B2) v Libre(B3) v Libre(B4). Pero,
aligual queconlaconjuncin,estoplanteaunserioproblemaparadominiosgrandeso infi-
nitos.
Vamos a introducir, adicionalmente alas entidades sintcticas yaintroducidas, dosnuevas
entidadessintcticasquenospermitirnambospropsitos;setrataenconcretodelossmbolos de
variables y lossmbolos de cuantificadores.
1. Disponemosdeunconjuntoinfinitodesmbolos de variables, compuestosporcadenasde
textoquecomienzanporunaletraminsculadelapartefinal delalfabeto,talescomoP,
q, r, s I t, ...I P1, " yassucesivamente(sedistinguirndelasconstan- l'
tesdefuncionesporsuusoenelcontexto).Unsmbolodevariableesuntrmino(enadi-
cinalostrminosdefinidoshastaelmomento).As, (x, BobI el 7) seraunejem-
plodeunaexpresinfuncionalternaria.
2. Tenemoslossmbolosde cuantificadoresVy3.AV seledenominacuantificador uni-
versal, ya3 cuantificador existencial.
3. Siroesunafufy esunsmbolodevariable,entonces,tanto como sonfufs.
A seladenominavariablecuantificada, ysedicequeroestdentrodelmbito delcuan-
tificador.Lasfufsenlaforma donde esunsmbolodevariable,yQesobienV
o bien estarn, muy a menudo(ennuestras aplicaciones), con el smbolovariablee
incrustadocomotrminoenalgnlugardero. Sitodoslossmbolosdevariables,adems
de estncuantificadosenro, entoncesse diceque esunajbfcerrada osentencia
cerrada. Entodasnuestrasaplicaciones,lasfufs serncerradas.
Ejemplos: ("Ix) ::> R(x)], (3x)fP(x)::>(3y)[R(x,y)::> S(f(x)]]
Deberamossercapacesdedemostrar(despusdedescribirla semnticadeloscuantifica-
dores) que (Vx)[(Vy)ro] es equivalente a (Vy)[(Vx)ro]; de esta manera podemos agrupar las
variablescuantificadasuniversalmenteenunasolacadenaalaizquierdadero: ("Ix y)ro. Eneste
tipodefrmulas, aro selallamamatriz. Lomismosepuedehacerparaloscuantificadoresexis-
tenciales. Perolascombinacionesdecuantificadoresuniversalesyexistencialesdebenmantener
suordenrelativo! Noesequivalente(Vx)f(3y)ro]a (3y)[(Vx) ro].
Tambindeberamossercapacesdedemostrar(despusdedescribirlasemntica)quela
variablede un cuantificadoresun tipo de variable muda, y, portanto, podemos renom-
brarlasincambiarelvalordelafuf. As,(Vx)roesequivalentea (Vy)rositodaslasocurren-
ciasdex enro sonreemplazadaspory. Delmismomodoocurreparaloscuantificadoresexis-
tenciales.
Yaquelacuantificacinsobrelossmbolosdevariablesledamuchomayorpoderexpresivo
al clculo de predicados, podemos preguntarnos si se podran, o no, cuantificar tambin los
smbolosdefuncionesyderelaciones. Enlaversindelclculodepredicadosqueestamosuti-
lizando,estetipodecuantificacinnosepermite.Porestemotivo,selellamaclculodepredi-
cadosde primer orden. Enlosclculosdepredicadosdesegundoorden,ydeordenesmayores,se
permitelacuantificacinsobrelossmbolosdefuncin, peroaexpensasdelusodemecanismos
deinferenciamuchomscomplejos.
.,: 222
Inteligenciaartificial.Unanuevasntesis ~
Elclculodepredicados 223
."
\ ~
Semntica de los cuantificadores
15.5.1. Cuantificadores universales
(VS)co(S)tieneel valorVerdadero (bajounaasignacindadadeconstantesdeobjetos,constantesde
funciones yconstantesderelaciones,aobjetos,funcionesyrelaciones)enelcasodequem(S)ten-
gaelvalorVerdaderoparatodaslasasignacionesdelsmbolodevariableSalosobjetosdeldominio.
Ejemplo:supongamosqueutilizamosdosinterpretacionesdeLibrey basadasen
lasconfiguraciones delaFigura 15.2.Culeselvalorde(Vx)[Sobre(x,C) :::J -,Libre(C)]
bajocadaunadeestasinterpretaciones?Enestasinterpretaciones,lavariablex puedeserasig-
nada,bienaA,B,C obienaSuelo.Debemosestudiarcadaunadeestasasignacionesparacada
unadelas interpretaciones.Porejemplo,asignandox aA,si Sobre(x,C):::J -,Libre(C)vaa
tenerelvalorVerdadero, nodeberamosencontrar<A,C>enlarelacinSobre,obien,<C>en
larelacinLibre.Dehecho,encadainterpretacin,<C>estenlarelacinLibre,pero<A, C>
noestenlarelacinSobre;deestamanera,laprimeraasignacin(dex a A)obtieneelvalor
Verdadero. Dejamosallectorelestudiodelasrestantesasignaciones.
15.5.2. Cuantificadores existenciales
(3s)co(s)tieneelvalorVerdadero(bajounaasignacindadaaobjetos,funcionesyrelaciones)en
elcasodequeco(S) tengaelvalorVerdaderopara,comomnimo,unadelasasignacionesdelsm-
bolodevariableSalosobjetosdeldominio.
15.5.3. Equivalencias tiles
Dadala semnticadeloscuantificadores,sepuedendefinirlassiguientesequivalencias,anlogas
a lasleyesdeDeMorgan:
-,(Vs)m(s)== (3S)-,co(S)
-,(3s)m(Vs)== (Vs)-,m(S)
y tambinpodemosdefinirlaqueyahemosmencionadoalhablardelrenombradodevariables:
(Vs)m(s)== (Vl1)co(l1)
15.5.4. Reglas de inferencia
Lasreglasdeinferenciadelclculoproposicional,generalizadasconvenientemente,tambinse
puedenutilizarenelclculodepredicados.stasincluyenelmodusponens,laintroducciny la
eliminacindela1\, laintroduccindelav,laeliminacindela-',ylaresolucin.Generaliza-
remoslaregladelaresolucinenelprximocaptulo.Ademsdelasreglasdelalgicapropo-
sicional,dosreglasadicionalesimportantesson:
Eliminacin deluniversal(EU) [o instanciacinuniversal(1U)]. De(Vs)m(S)podemos
inferirmea),dondeco(S) escualquiertbfconlavariableS, aesunsmbolodeconstante,
y mea)esro<S) conSsustituidaporaentodoslospuntosenlosqueapareceenm.
Ejemplo:de(Vx)P(x, f(x), B)podemosinferirpeA, feA), B).
Introduccin delexistencial(lE) [ogeneralizacinexistencial(GE)]. Demea) podemos
inferir(3S)co(S), dondemea)esunafbfquecontieneelsmbolodeconstantea, y ro<S) es
unaformaenlaqueSreemplazacadaocurrenciadea enm.
Ejemplo:de(Vx)Q(A, g(A),x)podemosinferir(3y)(Vx)Q(y,g(y),x).
EsfcilcomprobarquetantoEUcomolEsonreglasdeinferenciaslidas.
El clculo de predicados como un lenguaje de representacin
del conocimiento
15.6.1. Conceptualizaciones
ElgranproblemaparalalAesquexpresar, nocmoexpresarlo. Elclculodepredicadosno
hacemsqueproveerunlenguajeuniforme medianteelcual sepuedeexpresarconocimiento
acercadelmundo(despusdequelotengamos,obviamente!)y razonarsobrel.Podemosex-
traerconsecuencias de ese conocimiento, representado mediante este lenguaje, explorn-
dolomediantemtodosdededuccinlgicaquesedescribirnenelsiguientecaptulo.
ElprimerpasoenlarepresentacindelconocimientoacercadelmundoesconceptuaUzarlo
entrminosdesusobjetos,funcionesyrelaciones.Laconceptualizacinrequiere,generalmente,
un esfuerzo de inventiva por parte del conceptualizador. A menudo, hay muchas elecciones
acercadequtiposdeobjetospensamosquepodranexistirennuestrosmundos.Somoslibresde
conceptualizarelmundodecualquiermaneraquedeseemos;sinembargo,algunasconceptuali-
zacionessernmstilesqueotras(nonecesariamentemscorrectas).
Elsiguientepasoconsisteencrearexpresionesdelclculodepredicadoscuyossignificados
serefierenalosobjetos,lasfuncionesy lasrelacionesdefinidas.Finalmente,escribimosfbfsque
satisfacenelmundotalcomolohemosconceptualizado.Estasfbfstambinsernsatisfechaspor
otrasinterpretaciones;slonecesitamostenercuidadodequenoseansatisfechasporinterpreta-
cionesquepuedanexcluirnuestraformalizacindelconocimientoacercadelmundo.
Cuandodiseamosagentes quedebenrazonare interactuarconmundosreales(enlugarde
imaginarios), esimportantequelasconceptualzacionesestnbienasentadas. Esdecir,quelos
valoresdeverdadde,comomnimo,algunostomosdelabasedeconocimientotenganqueser
evaluablesatravsdemecanismosdepercepcinconectadosalmundo.Otrostomospuedendefi-
nirseapartirdeestostomosperceptua1esprimitivos,perolaestructuraenteradebeapoyarseen
algntipodepercepcin,paraquelasconclusionesgeneradasporlosmtodoslgicostenganrele-
vanciaenelmundoenelcualelrobotacta.Porelcontrario,lasmatemticas,nonecesitanasen-
tarsedeestamanera,porquelas sentenciasmatemticasnonecesitanreferirse al mundofsico.
LaprimerapropuestaseriadeutilizarelclculodepredicadosenlApararepresentarelcono-
cimientoacercadelmundolahizoJohnMcCarthy,[McCarthy, 1958].En[GuhayLenat, 1990,
yLenaty Guha, 19901,sedescribeungranproyecto(elproyectoCYC)pararepresentarmillones
dehechos de sentidocomnacercadelmundo. Paraunaexposicin mscompletaacercadel
papeldelalgicaenlalA,vase[Nilsson, 1991].UnbuentratamientodelalAbasadaenlgi-
ca,enformadelibrodetexto,seencuentraen[GeneserethyNilsson, 1987].
15.6.2. Ejemplos
Ilustraremosconalgunosejemploselprocesodeconceptualizacindelconocimientoacercade
unmundo. Supongamosqueestamosdiseandounagentequerepartepaquetesenunaoficina.
~
;J1
224 Inteligenciaartificial.Unanuevasntesis Elclculodepredicados 225
l
~ ~
1
'1
Entreotrascosas,elagente necesitardisponerdeunaconstantederelacinquedenotelapro-
piedaddequealgunacosaesunpaquete.ParaelloutilizaremosPaquete(x).Adems,elagen-
tenecesitardisponerdeunaconstantederelacinquedenotequeciertoobjetoseencuentraen
una habitacin. Utilizaremos EnHabi tacion(x, y).Para desarrollar nuestros ejemplos,
necesitaremosunaconstantederelacinquedenotequeciertoobjetoesmspequeoqueotro:
MasPequeo (x, y).Conestasconstantesderelacionespodemosexpresarlassiguientessen-
tenciasacercadelmundodeesterobotenelclculodepredicados:
Todoslospaquetesqueestnenlahabitacin27sonmspequeosquelosqueestnen
lahabitacin28.
(Vx y){[Paquete(x)A Paquete(y)A EnHabitacion(x H27)A EnHabita- I I
ci on(y, H28)]::::l MasPequeo(x,
Cadapaquetedelahabitacin27esmspequeoqueunodelospaquetesdelahabita-
cin29.
Estafrase, talcomoestexpresada,esambigua(unfenmenofrecuente alusarellen-
guajenatural). Podrarepresentarseporcualquieradelasdosfrmulassiguientes(queno
sonequivalentes!):
(3y)(Vx){[Paquete(x)APaquete(y)AEnHabi tac H27)AEnHabi ta- I
, H29)]::::l MasPequeo(x, y)}
(Vx)(3y){[paquete(x)A Paquete(y)AEnHabitacion(x , H27)AEnHabi ta-
I H29)]::::lMasPequeo(x, y)}
Algnconocimientoacercadelmundodenuestrorobotpodrarequerirqueconceptualiza-
ramoslanocindetiempo. Consideremos,porejemplo,lafrase ElpaqueteAllegantesqueel
paqueteB.Unaconceptualizacinrazonableseradisponerdeobjetosquefueranintervalosde
tiempoyderelacionesdeordenentredichosintervalos.Ydeberamosdisponerdeunaformade
indicareltiempodellegadadeunobjeto. UtilizaremosHaL1egado(x, z),dondex denotael
objetoquehallegado,y z elintervalode tiempoduranteelcualhallegado. Deestamanerapode-
mosescribir:
1 z2)[HaLlegado(A, zl)A HaLlegado(B, Al, z2)]
Enel Captulo 18,hablaremosconmsdetalledeunaconceptualizacinparaintervalosde
tiempo.Tambinhayotrosmtodos,algunosdeloscualesinvolucranlgicastemporales,quehan
sidoutilizados paratrataracercadel tiempoenlAy enciencias delacomputacin[Emerson,
1989,yShoham, 1987].
A menudo, lacreacindeconceptualizaciones puedeplantearcuestiones msbienespi-
nosas. Porejemplo,esdifcil decidircmotratarlosdenominadosnombresdematerias,como
leche,enlasentenciaElpaquetedelahabitacin28contieneuncuartodelitrodeleche.
Lalecheesunobjetoquetienelapropiedaddeserblanca?Siesas,quocurrecuandodivi-
dimosuncuartodelitroendosvasos?Seconvierteendosobjetos(ambosblancos),o sigue
siendouno solo? Muchas deestas cuestiones continansiendo temasde investigacinenla
actualidad.
{ I
En este libro, ms adelante, utilizaremos conceptualizaciones que tratan como objetos a
cosastanintangiblescomolas situacionesylasacciones.Tambinintroduciremosextensionesdel
clculodepredicadosquelepermitirnaunagenteconstruirsentenciasacercadelconocimien-
todeotroagente,talescomoElrobotAsabequeelpaqueteBestenlahabitacin28.
Tal como comentamos anteriormente, eluso desentencias lgicas pararepresentarel conoci-
miento,ydeprocedimientosdeinferenciaslgicasparahacerrazonamientos,hasidountemade
controversia en la lA. Vase [McDermott y Doyle, 1980] y otras exposiciones relacionadas
paraejemplosdeloslogrosconseguidosenambostemas.Partedelacontroversiatienequever
conladisparidadexistenteentrelargidasemnticadeloslenguajeslgicos(vase[Tarski, 1935,
1956]ylascaractersticaspropiasdelconocimientodelmundoreal(enoposicinal matemtico),
conunasemnticamuchomsfluidaytremendamentedependientedelcontexto.
LasemnticadeTarskiasociaindividuosconcretosdelmundoconlasconstantesdeobjetos
del lenguaje. Un punto de vista alternativodefiende la necesidad de utilizar representaciones
denominadasrepresentaciones indexado-funcionales. EnpalabrasdeAgreyChapman[Agrey
Chapman, 1990,p.21]:
Mientrasquelasrepresentacionestradicionalespostulanunacorrespondenciaentrelossmbolos
queestnenlamentedelagenteylosobjetosdelmundo,individualizadosobjetivamente,nues-
trateoradescribeunarelacincausalentreelagenteyla'> entidadesdelmundo,detipoinde-
xado y funcional. Por ejemplo, una de las entidades con las que opera Pengi, descrito en
[AgreyChapman, 1987],esla-abeja-que-estoy-cazando. Estaentidadestindividualizadade
formaindexada,yaqueestdefinidaentrminosdesurelacinconelagente(<<Yo). Adems,
estindividualizadadeformafuncional, yaqueestdefinidaentrminosdelatareaqueest
realizandoelagente(<<cazando laabeja).Mientrasqueparalarepresentacintradicionallos
smbolosABEJA-34yABEJA-35siempresereferiranalasdosmismasabejas,ennuestrateo-
ra,la-abeja-que-estoy-cazando podracorresponderadiferentesabejasendiferentesinstantes.
Sinembargo,talcomoveremosenlosprximoscaptulos,los investigadoreshansidocapa-
ces de emplear lenguajes lgicos (con algunas extensiones) para muchas representaciones y
tareasderazonamientoenlalA.
[Enderton, 1972]y[Pospesel, 1976] sondoslibrossobrelgica-elprimeromsmatemtico
y el segundomsinformal-.Paraunrepasobastantelegible,queincluyeprogramasdeorde-
nadormuyilustrativos, vase[BarwiseyEtchemendy, 1993].
15.1. Delassiguientesfrmulascreeunmodelo,cuyodominioseaeldelosenteros:
1. Sobre(A, Suelo)::JLibre(B)
2. Libre(B)A ::::l Sobre(A, Suelo)
3. Libre(B)v Libre(A)
4. Libre(B)
5. Libre(e)
15.2. Muestrequelafuf(3x)Sobre(x, A):J....,Libre(A)tieneelvalorVerdadero encadauna
delasconfiguracionesdelaFigura 15.2.
15.3. Lassiguientesibfstienenunainterpretacinobviaenel mundodebloques:
Sobre(A,
Sobre(B,
Libre(C)
Libre(B)
(\1'x)[Libre(x):J....,(3y)Sobre(y, x)]
Definaotrainterpretacin(objetos,relacionesy unaasignacin)quesatisfagalaconjuncin
deestasibfs.
15.4. Paracadaunadelassiguientesexpresionesdelclculodepredicados,digasipuedeseruna
sentenciasintcticamentelegal(fui),ysi no,porquno.Paracadasentencialegal, digasies vli-
da (necesariamenteverdadera), insatisfacible (necesariamentefalsa), o siescontingente (depen-
dientedecadainterpretacin).Paracadasentenciaqueseacontingente, dunainterpretacinpara
lossmbolosquelahagaverdadera:
1. Gano(LasElecciones, 1\ Gano(LasElecciones, Bushl
2. ....,
3. (\1's) (s, (As 21vAs 57))]
4. (\1' X} (Conjunto(xl :JSubconjunto(x, x) v ....,Subconjunto(x, x) )1
5. (\1' x) [P(x) v Q (x) ] :J....,(3x) [ (x) v Q(x) )]
6. (\1' x) [EsCierto(x) ]
7. (3 xyzl [ (sumar(x, y), sumar(x, y, z))
8. P(Igor) I\Q(Berta) 1\ (\1'x) [....,(P l vQ(x))
9. (...., (3x) l :JNoExistente(x)
15.5. Unrobotconstructordetorresbuscadosbloquesqueestnlibresyponeunodeellossobre
elotro(sielbloquequemueveestsobreotrobloqueo sobreelsuelo).Escribaunaexpresinen
elclculodepredicadosdeprimerordenquesepuedautilizarparadeterminarsiexistentalesblo-
ques.
15.6. Unrobotqueseencuentraenunmundocuadriculadopuedemoversea unaceldasiesta
celdaesunadelasceldasadyacentesy siestlibredeobstculos.Enesecaso,decimosquela
celdaestdisponible. Adems,el mundocuadriculadonotienepasillosestrechos(talcomose
definieronenelCaptulo2).
Creeexpresionesdel clculodepredicadosquesepuedanutilizarparadefinircundouna
celdaestdisponibleyparadescribirlacondicinno-pasllo-estrecho.
Laresolucin
enelclculo
depredicados
Unificacin
Abreviaremoslasfufsconlaforma ..., 0"1 V "-z v ...v Ak)comoAl V"-z v ...v Ak,don-
de Al' 1.. ' , Ak sonliteralesquepodrancontenerocurrenciasdelas variables ... , Es
2
decir, simplementeeliminamosloscuantificadoresyasumimosquehayunacuantificacinuni-
versal para todas las variables A (ms adelante, mostraremos cmo pueden sereliminados
primeroloscuantificadoresexistenciales).Lasibfsexpresadasde estaformaabreviadasede-
nominanclusulas. Algunasvecesescribiremosunaclusulamediantelanotacindeconjuntos
..., A
k
}, asumiendoladisyuncinentreloselementosdelconjunto.
Sidosclusulastienenliteralessimilares,perocomplementarios,podemosresolverlas--de
lamismaformaquelohacamosenelclculoproposicional-oSitenemosunliteral enuna
clusula(donde esunavariable),yunliteralcomplementario....,1..(1') enlaotra,dondel' esalgn
trminoquenocontienea podemos sustituir porl' enlaprimeraclusulayaplicarlareso-
lucindelosliteralescomplementariosparaproducirelresolventedeambasclusulas.
Ejemplo:consideremoslasdos clusulasP(f(y),A) v Q(B, C)y A) v R(x,C)v
Sustituyendox porf(y)enlasegundaclusula,obtenemos....,P(f(y),A)v R(f(y),C)v SeA, B).Aho-
ra,losprimerosliteralesdelasdosclusulassonexactamentecomplementarios,ypodemosaplicar
laresolucinsobreesteliteral, P(f(y),A),paraobtenerelresolvente C)v SeA, B)v Q(B, C).
Elprocesodenominadounificacin eselqueseutilizaparacalcularlasustitucinadecuada.
LaunificacinesunmecanismoextremadamenteimportanteenlalA,pero, parapoderdescri-
birlo,primerovamosahablardelconceptogeneraldesustitucin.
Los trminos deunaexpresinpuedensersmbolos de variables, constantes deobjetoso
expresionesfuncionales; estasltimasconsistenenconstantesdefunciones ytrminos.Unains-
tancia de sustitucin deunaexpresinseobtienesustituyendolasvariablesportrminosendicha
expresin.As, cuatroinstanciasdesustitucindep[x, f(y),B] seran:
p[z,f(w),Bl
P[x,f(A),
P[g(z)I f
prc, f (Al, Bl
227
229
La resolucin en el clculo de predicados
228
A la primera instancia se le denomina variante alfabtica del literal original, porque slo se
han sustituido las variables que aparecen en P[x, f(y), B] por otras variables diferentes. A la lti-
ma de las cuatro instancias se le denomina instancia base, porque ninguno de los trminos con-
tiene variables (trmino base es un trmino que no contiene variables).
Cualquier sustitucin puede ser representada mediante un conjunto ordenado de pares,
s = ... , donde significa que todas las ocurrencias de la variable dentro
del mbito de la sustitucin son sustituidas por el trmino t' Adems, ninguna variable puede ser
reemplazada por un trmino que contenga a esa misma variable. Las sustituciones utilizadas ante-
riormente para obtener las cuatro instancias de p[x, f(y), B] eran:
sI:::; {z/x, w/y}
s2:::; {A/y}
s3:::; {g(z) Ix, A/y}
54 ={C/x, A/y}
Escribiremos (Os para indicar una instancia de sustitucin de una expresin (O utilizando la
sustitucin s. De esta manera, P[z, f(w), B] = P[x, f(y), B]s1. La composicin de dos sustitu-
ciones, sI y s2, se denota mediante s152, y es aquella sustitucin que se obtiene aplicando pri-
mero s2 a los trminos de sI, y aadiendo posteriormente los pares de s2 que no tengan variables
que aparezcan en sI. As:
{g(x, y)/z}{A/x, C D/z} = {g(A, B) /z, A/x,
Se puede ver que, aplicar de forma secuencial s1 y 52 a una expresin (o, es lo mismo que
aplicar s1s2 a (O; es decir, (0051)52 = (O(o5ls2). Tambin se puede ver que la composicin de sus-
tituciones es asociativa; es decir, (51s2)53 = sl(s2053).
Ejemplo: si (O es P(x, y), sI es {f(y)/x}, y s2 es {Aly}, entonces:
{(051)o52:::; [P(f(y), y)]{Aly} = P(f(A), A)
y
(O(sI52) = [p(x, y)]{ f(A)/x, Aly} P(f(A), A)
Las sustituciones, por lo general, no son conmutativas; es decir, generalmente, no sucede que
s152 =s2s l. Por tanto, dependiendo del orden de aplicacin de las sustituciones, se pueden gene-
rar resultados diferentes.
Ejemplo (utilizando (o, sI y 052 del caso anterior):
(O(slo52):::; P(f(A), A)
w(52sl):::; [P(x, y)]{Aly, f(y)/x}:::; P(f(y), A)
Cuando se aplique una sustitucin s a cada miembro de un conjunto de expresiones {(O}'
denotaremos al conjunto de instancias de sustitucin como {(O }s. Diremos que un conjunto de
expresiones {(OJ es unificable si existe una sustitucin s tal que (01.'1 :::; (02S = (035 :::; ... En ese caso,
se dice que s es el unificador de {(O}' ya que, al utilizarlo, simplifica el conjunto de expresiones
en una sola. Por ejemplo, s:::; {Alx, B/y} unifica {P[x, f(y), B], P[x, f(B), Bn, obteniendo {
f(B), Bn. Aunque s= {Alx, B/y} es un unificador del conjunto {P[x, f(y), B], P[x, f(B), B]},de
alguna manera, no es el unificador ms sencillo. Podemos notar cmo para obtener la unificacin
no es necesario tener que sustituir x por A. El unificador ms general (o el ms sencillo) g de
{(Oi}' denominado umg, es aquel que tiene la propiedad de que s s es un unificador de {(Oi} que
obtiene {(OJs, entonces existe una sustitucin stal que {(OJs:::; {(Oag
1
. Ms an, la instancia pro-
ducida por el unificador ms general es nica, excepto para variantes alfabticas.
Existen muchos algoritmos que se pueden utilizar para encontrar el unificador ms general de
un conjunto finito de expresiones unificables, y que informan del fallo en el caso de que el con-
junto no pueda ser unificado. El algoritmo UNIFICAR, que mostraremos aqu, es una adaptacin
del dado por [Chang y Lee, 1973, p. 77]. El algoritmo trabaja sobre un conjunto de expresiones
estructuradas en forma de lista, en las cuales, cada literal y cada trmino estn escritos como una
lista. Por ejemplo, elliteral-,P(x, feA, y se escribe estructurado en forma de lista como (-,P x
(f A y. La expresin -,P es la primera expresin del nivel superior, y (f A v) es la tercera
expresin del nivel superior.
La idea bsica de UNIFICAR es el concepto de conjunto de discrepancias. El conjunto de dis-
crepancias de un conjunto no vaco de expresiones 'W se obtiene localizando el primer smbolo
(contando desde la izquierda) que no es exactamente el mismo en todas las expresiones de 'W, y
extrayendo entonces de cada expresin de 'W la subexpresin que empieza con el smbolo que se
localiza en esa posicin. El conjunto de estas subexpresiones es el conjunto de discrepancias de
'W. Por ejemplo, el conjunto de discrepancias del conjunto de dos listas {(-,P x (f A y, (--,P x
(f z B)} es el conjunto {A, z}. Este conjunto de discrepancias puede pasar a ser un conjunto de
acuerdos mediante la sustitucin Alz.
UNIFICAR(r) (r es un conjunto de expresiones estructuradas en forma de lista):
1. k f- O, r f- r, (Jk f- E (paso de inicializacin; E es la sustitucin vaca).
k
2. Si r es unitario, salir con (Jk (el umg de r). En caso contrario, continuar.
k
3. Dk f- conjunto de discrepancias de r k
4. Si existen los elementos V Y en D
k
, taJes que Vk es una variable que no aparece en el
k
trmino t , continuar. En caso contrario, salir con fallo (r no es unificable).
k
S. (Jk+1 f- (Jk{t/V
k
}, rk+1 f- rk{t/vk } (obsrvese que rk+1 == rk(Jk+I)'
6. k f- k+ 1
7. Ir al paso 2.
[Chang y Lee, 1973, p.79] demostraron que UNIFICAR, o bien encuentra el unificador ms
general de un conjunto de expresiones unificables, o bien devuelve fallo cuando las expresiones
no son unificables. El algoritmo genera el umg como una pareja de expresiones estructuradas en
forma de lista, pero stas pueden convertirse fcilmente a la forma utilizada en lgica de primer
orden. Hay muchos algoritmos que realizan la unificacin, incluyendo uno que trabaja en tiem-
po lineal [paterson y Wegman, 1978].
A modo de ejemplo, listamos las instancias de sustitucin ms generales (aquellas que se
obtienen aplicando el umg) para unos pocos conjuntos de literales. Se podra seguir los pasos del
algoritmo UNIFICAR para cada uno de los conjuntos.
Instancias de sustitucin ms generales
Conjuntos de literales
{p(x), peA)}
P[f(x), x, g(x)]
{P[f(x), y, g(y)], P[f(x), z, g(x)1}
P[f(x, g(A), g(A, y)]
{P[f(x, g(A)), g(A)], P[f(x, z), z]}
En el paso 4, UNIFICAR comprueba si una variable est presente en un trmino que estamos
a punto de sustituir. Dicha sustitucin podra llevamos a un bucle infinito que no est permitido.
Como ejemplo, supongamos que estamos intentando unificar p(x, x) con P(f(z), z). UNIFICAR
primero sustituira x por fez), obteniendo p(f(z), f(z y P(f(z), z). Sin la comprobacin de
ocurrencia, UNIFICAR podra sustituir z por fez) obteniendo P(f(f(z, f(f(z) y P(f(f(z,
f(z, y as indefinidamente.
230
Resolucin en el clculo de predicados
Supongamosque1, y12 sondosclusuJas(representadascomoconjuntosdeliterales). Sihayun
tomo<1> en11 yunliteral--.\jIen12' talesque<1> y\ji tienenununificadormsgeneralj.l, entonces
estasdosclusulastienenunresolventep. Elresolventeseobtieneaplicandolasustitucinj.l ala
uninde1,y12'eliminandolosliteralescomplementarios;esdecir:
p=[(1, - {}) u (12 - {--.\jI})]j.l
Antes de que las clusulas seanresueltas, paraevitar la confusin sobre las variables, las
renombramosencadaclusulademaneraqueningunadeellasaparezcaenlasotrasclusulas.
Porejemplo,supongamosqueestamosresolviendo P(x)v Q(f(x))yR(g(x))v --.Q(f(A.Pri-
mero,rescribimoslasegundaclusulacomoR(g(y v --.Q(f(A, yluegorealizamoslaresolu-
cin, paraobtener peA) v R(g(y. Alproceso de renombrar las variables lo denominamos
estandarizar variables.
Acontinuacin,mostramosalgunosejemplos:
{P(x),Q(x,y)}y{--.P(A), R(B, z)} seresuelvengenerando{Q(A, y),R(B, z)}.
{P(x,x), Q(x), R(x)} y {--.P(A, z),--. Q(B)} se puedenresolver de dos manerasdistintas,
generando {Q(A), R(A), --.Q(B)} Y {P(B,B), R(B),--.P(A, z)},respectivamente.
Aveces,senecesitaotradefinicinalgomsrestrictivadelaresolucinenelclculodepre-
dicados.Porejemplo,consideremoslasdosclusulas{P(u),P(v)} y{--.p(x),-,P(y)}.Estasclu-
sulasdisponendeinstanciasbaseequivalentes,comoson peA) y-,P(A),respectivamente(obte-
nidas mediante la sustitucin Alu, Alv, Alx, Aly). A partir de estas clusulas base podemos
inferirlaclusulavaca,quedeberamossercapacesdeinferirdelasclusulasoriginales,perono
podemoshacerloutilizandolaregladeresolucindadahastaahora.Lareglaeslasiguiente.
Supongamosque11y12 sondos clusulas (denuevorepresentadas medianteconjuntosde
literales).Sihay unsubconjunto1'de1
1
yunsubconjunto1'2de12'talesquelosliteralesde1'
puedenserunificadosconlasnegacionesdelosliteralesde1'2conelunificadormsgeneral,j.l,
entoncesestasdosclusulastienenelresolventep.Elresolventeseobtieneaplicandolasustitu-
cinj.l alauninde11y12' eliminandolossubconjuntoscomplementarios;esdecir,
p= [(11 -Y'2)U (12 1'2)]j.l
Utilizandoestanuevadefinicinde laresolucin,lasdosclusulas{P(u),P(v)}y{-,P(x),
-,P(y)}seresuelvengenerandolaclusulavaca.
Completitud y solidez
Laresolucinenel clculodepredicadosesslida;esdecir, si peselresolventededosclusu-
las<1> y\ji, entonces {, \ji} 1= p. Lademostracindeestehechonoesmuchomsdifcilquela
demostracindelasolidezdelaresolucinenelclculoproposicional.Aligualqueenelclculo
proposicional,lacompletitudesuntemamscomplicado.Nopodemosinferirmedianteresolu-
cin todas las frmulas que se deducen lgicamente de un conjunto dado. Por ejemplo, no
podemosinferirpeA) v P(B) de peA). Enlaresolucindelclculoproposicional,superbamos
estadificultadutilizandolarefutacinmedianteresolucin, yahora,enelclculodepredicados,
podemoshacerlomismo. Sinembargo,paragarantizarlacompletituddelarefutacindebemos
utilizarlaregladeresolucinestrictaqueacabamosdedar.
231
Laresolucinenelclculodepredicados
Conversin de }bIs arbitrarias en clusulas
Al igualqueenel clculoproposicional,cualquierfufsepuedetransformarenunaclusula.Los
pasossonlossiguientes:
1. Eliminarlasimplicaciones(igualqueenelclculoproposicional).
2. Reducirlosmbitosdelasnegaciones(igualqueenelclculoproposicional).
3. Estandarizarvariables.Yaquelasvariablesqueseencuentrandentrodelosmbitosdelos
cuantificadoressonvariablesmudas,stassepuedenrenombrarparaquecadacuanti-
ficadortengasupropiosmbolodevariable.
Ejemplo:(Vx)[-,p(x)v (3x)Q(x)]sepodrarescribircomo:
(Vx)[-'P(x)v (3y)Q(y)]
4. Eliminarloscuantificadoresexistenciales.
Ejemplo:en(Vx)[(3y)Al tura(x,y)],elcuantificadorexistencialestdentrodelmbi-
todelcuantificadoruniversal,deformaquelay queexiste puededependerdelvalorde
lax.Porejemplo,si elsignificadodeseadode(Vx)[(3y)Altura(x,y)]es cadapersona
x, tieneunaalturay, obviamente,laalturadependerdelapersona.Hagamosquedicha
dependenciaserepresenteexplcitamentemedianteunafuncindesconocidah(x);sta
proyectaracadavalordex enlay que existe;lallamaremosfuncin de Skolem l. Al
utilizardichafuncinenlugardelay,podemoseliminarelcuantificadorexistencialres-
cribiendolaexpresincomo(Vx)Altura[x,h(x)].

Lareglageneralparaeliminaruncuantificadorexistencialdeunafufesreemplazar
cadaocurrenciadelavariablecuantificadaexistencialmente(ligadaporelcuantificador
existencial)porunafuncindeSkolem,cuyosargumentosseana q u e l a ~ variablescuan-
tificadas universalmente que estn ligadas por los cuantificadores existenciales cuyos
mbitos incluyen al mbito del cuantificadorexistencial que se est eliminando. Los
I
smbolosdefuncinutilizadosenlasfunciones de Skolemdebensernuevos,enelsen-
tidodequenopuedensersmbolosqueyaexistanenningunadelasfufsqueseutilizan
enlarefutacinmedianteresolucin.
Deestamanera,podemoseliminarel(3z)de:
[(Vw)Q(w)]::::> (Vx){(Vy){(3z)lp(x,y, z)::::> (Vu)R(X,y,u, zm}
paraobtener:
[(Vw)Q(w)]::::>(Vx){(Vy)[P(x,y,g(x,y::::> (Vu)R(X,y,u,g(x,y)]}
ypodemoseliminarel(3w) de:
(Vx){-,p(x)v ((Vy)[--.p(y)v P(f(x,y]A (3w)[Q(x, w) A -,p(w)]}}
paraobtener:
*(Vx){-,p(x)v {(Vy)[--.p(y)v P(f(x,y))]A [Q(x,h(x A -,p(h(x)m}
dondeg(x,y)yh(x)sonfuncionesdeSkolem.
1 LasfuncionesdeSkolemsedenominanasporellgicoThoralfSkolem[Skolem, 1920].
232 233
Sielcuantificadorexistencialqueestsiendoeliminadonoestdentrodelmbitode
uncuantificadoruniversal,utilizamosunafuncindeSkolemsinargumentos,estoes,una
constante.As,(3x)p(x)seconvierteenP(Sk),dondeelsmbolodeconstanteSkseuti-
lizaparareferirseaunaentidadquesabemosqueexiste.Aqutambinesnecesarioque
Skseaunsmbolodeconstantenuevo, yquenoseautilizadoenotrasfrmulaspararefe-
rirsealasentidadesqueconocemos.
Paraeliminartodaslasvariablescuantificadasexistencialmentedeunafbfutilizamos
por separado el procedimiento anterior sobre cadasubfrmula. Laeliminacin de los
cuantificadoresexistencialesdeunconjuntodefbfs generalo quellamamosfonna de
Skolem del conjuntodefrmulas.
j SedebetenerencuentaquelaformadeSkolemdeunafbfnoesequivalente alafbf
original!La frmula(3x)p(x)sesiguelgicamentedesuformadeSkolem pero
no al revs. Comootro ejemplo, nteseque [peA) v P(B)] 1= (3x)p(x), pero [peA) v
P(B)] 1= P(Sk).Loquees cierto,esqueunconjuntodefrmulas 8 es satisfaciblesi, y
slo si, laforma de Skolemde8 loes; o, mucho ms til paralarefutacin mediante
resolucin, 8 es insatisfacible si, y slo si, laforma de Skolemde8 es insatisfacible
[Loveland, 1978,pp.41 Y
5. Convertiraformaprenex.Aestasalturas,yanoquedancuantificadoresexistenciales,y
cadacuantificadoruniversaltienesupropiosmbolodevariable.Ahorapodemostras-
ladartodosloscuantificadoresuniversalesal iniciodelafbf, yhacerqueelmbitode
cadacuantificadorabarquetodalafbf. Entoncessedicequelafbfresultanteestenfor-
maprenex. Unafbfenformaprenex estcompuestadeunacadenadecuantificadores,
denominadaprefijo, seguida de una frmula libre de cuantificadores, denominada
matriz. Laformaprenexdelafrmuladelejemploanteriorquehabamosmarcadocon
un*, sera:
('i7'x)('i7'y){-,P(x) v ([-,P(y)v P(f(x,y]1\ (Q(x,h(x 1\ -,P(h(x)]}}
6. Ponerla matrizenformanormalconjuntiva(FNC).Igualqueenelclculoproposicional,
podemosponercualquiermatrizenformanormalconjuntivaaplicandorepetidamentelas
reglasdistributivas,esdecir,reemplazandoexpresionesdeltipo0)\ v (0)21\ 0)3) por(0)\ v
0)2) 1\ (0)\ v 0)3)'
Alponerlamatrizdelafbfdelejemploanteriorenformanormalconjuntiva,obtene-
mos:
('i7'x)('i7'y){(-,P(x) v -, P(y) v P(f(x, y] 1\ (-,p(x) v
1\ (-,P(x) V
-,P(h(x]}
7. Eliminarlos cuantificadoresuniversales. Comotodaslasvariablesdelasfbfs queutili-
zamosdebenestardentrodelmbitodeuncuantificador,estamos segurosdequetodaslas
variablesquequedanenestepasoestncuantificadasuniversalmente.Ms an, elorden
deloscuantificadoresuniversalesnoimporta,asquepodemoseliminarlasocurrencias
explcitasdeloscuantificadoresuniversalesyasumir,porconvenio,quetodaslasvaria-
blesdelamatrizestncuantificadasuniversalmente.Ahoradisponemosdeunamatrizen
formanormalconjuntiva.
8. Eliminarlossmbolosde1\. Ahorapodemoseliminarlasocurrenciasexplcitasdelossm-
bolosde1\ reemplazandoexpresionesdelaforma(0)1 1\ porelconjuntodefbfs {0)1'
0)2}'Elresultadodelas sustitucionesaplicadasrepetidamenteeslaobtencindeuncon-
juntofinitodefbfs, siendocadaunadeellasunadisyuncindeliterales.Atodafbfquese
componenicamentedeunadisyuncindeliteralesseladenominaclusula.Ennuestro
ejemplo,lafbfsetransformaenelsiguienteconjuntodeclusulas:
-,P(x)v -,p(y)v p[ f(x,y)]
-,p(x)v Q(x, h(x)]
-,P(x)v -,P[h(x)]
9. Renombrarlasvariables.Lossmbolosdevariables sepuedenrenombrarparaqueningn
smbolodevariableaparezcaenmsdeunaclusula. Podemosvercmo('i7'x)[p(x) 1\
esequivalentea [('i7'x)p(x)1\ ('i7'y)Q(y)].Ahora,nuestrasclusulasson:
-,P(xl)v
-,P(x2)v Q[x2,
-,P(x3)v
Losliteralesdeunaclusulapuedencontenervariables,peroseentiendequeestasvariables
estnsiemprecuantificadasuniversalmente.
Utilizacin de la resolucin para demostrar teoremas
Cuandoseutilizalaresolucincomounaregladeinferenciaenunsistemademostradordeteo-
remas,elconjuntodefbfs apartirdelcualqueremosdemostrarunteoremaseconvierteprevia-
menteaclusulas.SepuedeverquesiunafbfO) sesiguelgicamentedeunconjuntodefbfs8,
entoncestambinsesiguelgicamentedelconjuntodeclusulasobtenidoalconvertirlasfbfsde
8 alaformaclausal,yviceversa[DavisyPutman, 1960].Portanto,paranuestros las
clusulassonunaformacompletamentegeneralenlaquepodemosexpresarlasfbfs delclculo
depredicados.
Sepuededemostrarquelarefutacinmedianteresolucinestantocorrectacomocompleta
[Robinson, 1965] (vasetambin[ChangyLee, 1973,p.85]).Entonces,parademostrarunafbf
O) a partirde 8,procedemos del mismo modo comolohacamos enel clculoproposicional.
Negamos0), convertimosestanegacina formaclausalylaaadimosalaformaclausalde8.
Entonces, aplicamos la resolucin hasta que deducimos laclusula vaca. Podemos utilizar
cualquieradelasestrategiasdeordenacinyrefinamientoquevimosenrelacinconlaresolu-
cinenelclculoproposicional.
Comoejemplo,volvamosal robotrepartidorde paquetesdel quehablbamosenel ltimo
captulo. Supongamosqueesterobotsabequetodos lospaquetes delahabitacin27 son ms
pequeosquecualquieradelosdelahabitacin28;esdecir,
1. ('i7'x y){[Paquete(x)A A EnHabitacion(x, H27) A EnHabita-
cion(y H28)]::::> , y)} I
Abreviandolossmbolosdepredicadosparahacernuestrasfrmulasmscompactas,
yconvirtindolasaformaclausal,obtenemos:
2. -,p(x)v -,p(y)v , 27)v -,I(y, 28)v S(x, y)
Supongamosqueelrobotsabequeel paqueteAest,obienenlahabitacin27,obien
enlahabitacin28 (peronosabeencul); yquesabequeelpaqueteBestenlahabita-
cin27 yqueesmspequeoqueelpaqueteA.
234
I(A,27) v I(A,28)
(negacinde lafuf
aserdemostrada)
(A)

v v v S(x,y)
(x) v

Figura16.1.
Unarefutacinmedianteresolucin.
3. P
4. P(B)
5. I(A,27)VI(A,28)
6. I (B, 27)
7...S (B,
Utilizandolarefutacinmedianteresolucin,elrobotpuededemostrarqueelpaqueteAest
enlahabitacin27.EnlaFigura16.1 semuestraunrboldedemostracin.Lanegacindelafuf
quesequieredemostrarestenlapartesuperiorizquierda;lasfufs correspondientesaloqueel
robotsabeexplcitamenteestncolocadasa lolargodelladoderechodelafigura. Tambinse
muestranlassustitucionesutilizadas.
Obtencin de respuestas
Siqueremosutilizarlaresolucinpararesponderapreguntas,utilizandoelconocimientoacerca
deundominio,yrepresentadostemediantefufsdelclculodepredicados,muchasvecestene-
mos que hacer algo ms que simplemente demostrar un teorema. Porejemplo, supongamos
quedebemos demostrarun teoremade laforma Podramosdeseargenerarla que
hemosdemostradoqueexiste. Parahacerlo, debemosseguirlapistadelassustituciones,utili-
zando como mecanismo un literal de respuesta. Aadimos un literal derespuesta
acadaclusuladelanegacindelteoremaquesedebedemostrar,yaplicamoslaresolucin
hastaquesloquedaelliteral de respuesta. Lasvariablesdelliteral Resp sontodasaquellasque
aparecenenlaformaclausaldelanegacindelteoremaquesedeseademostrar. Lostrminos
sustituidosdurantelademostracinenlasvariablesdelliteralResp sernentoncesinstanciasde
variablescuantificadasexistencialmentedelafufquesedeseademostrar.Elprocesodeobtencin
deunarespuestafue inventado por[Green, 1969b]. Ms tarde, fue analizado y extendido por
[Luckham,yNilsson, 1971].Vasetambin[Nilsson, 1980,pp. 175Yss.].
Damosunejemplodecmoseutilizarael1iteralResp enlaFigura16.2,enlaquedemos-
tramoslafuf(3u)I(A,u),quepuedeinterpretarsecomolaformaenlaqueelrobotsepreguntara
EnquhabitacinestA?.
v Resp(u) I(A,27) v I(A,28)
(negacindelafufquese
deseademostrarconelliteral v (x,27) v v S(x,y
de respuesta)
I(A,28) v Resp(27)
v S(x,A) v Resp(27)
v S(x,A) v Resp(27)
v S(B,A) v Resp(27)
S(B,A)
Figura16.2.
Obtencindeunarespuesta.
El predicado de igualdad
Por10general,lasconstantesderelacinqueseutilizanenlasfrmulasdeunabasedeconoci-
mientodenotanunossignificadosintencionados (esdecir,unasrelaciones),peroestasrelaciones
estncircunscritasalconjuntodemodelosdelabasedeconocimiento,ynoporJos smbolospar-
ticularesutilizadosenlasconstantesderelaciones.Losresultadosdelasrefutacionesmediante
resolucinsernconsistentesconlossignificadosprevistos,slosi labasedeconocimientores-
tringedeformaadecuadalasrelacionesdefinidas.
Hayalgunasrelacionesquesuelenutilizarseamenudo,quesonimportantes,yquepodramos
desearutilizarentodaslasbasesdeconocimiento.Unejemploeslarelacindeigualdad,parala
cualpodramosutilizarunaconstantederelacinenformaprefijacomoIgual(A,B),oenfor-
mainfijacomoA=B. Sloporque tengamos lafrmula Igual(A, en unabasedecono-
cimiento, nosignificaquede peA) podamosconcluir P(B), ni tampocoquepodamosresolver
Q(A, B)con..Q(A, B). LabasedeconocimientonotienemaneradesaberqusignificaIgualsin
laayudadefrmulasadicionales.
Hayalgunaspropiedadesbienconocidasdelaigualdadquepuedenexpresarsemediantefr-
mulasquepodramosaadira]abasedeconocimiento.Larelacindeigualdades:
Reflexiva. (\1'x)Igual(x,x)
Simtrica.(\1'x, y)[Igual(x,y)::J Igual(y,x)]
Transitiva.(\1'x, y,z)[Igual(x,y)1\ Igual(y,z)::JIgual(x,
Aunconestosaxiomas,nopodemosdemostrarP(B)apartirde peA)e Igual(A,B). Loque
senecesitaespodersustituirtrminosigualesencualquierexpresin.Parapermitirdichassus-
tituciones,labasedeconocimientonecesitara,deformaadicional,poderlistartodas las susti-
tucionespermitidasdeformaexplcita(paracadaconstantedepredicadoyconstantedefuncin)
-unrequisitoimpracticable.
Hay algunasposiblesalternativasprcticas. Lamsaconsejablesellamaparamodulacin
[WosyRobinson, 1968],[ChangyLee, 1973,pp. 168-170].Laparamodulacinesunareglade
inferenciaespecficaparalaigualdadqueseutilizaencombinacinconlaresolucinenJoscasos
237 Inteligencia artificiaL Una nueva sntesis
en los que la base de conocimiento contiene el predicado de igualdad. La regla se define como
sigue.
Supongamos que Yl y Y2 son dos clusulas (representadas como conjuntos de literales). Si
YI ={A.(t) U y'l} YY2 = {Igual(a, U y'2}' donde t, a y son trminos, y' y Y'2 son clusulas,
y A.(t) es un literal que contiene (posiblemente entre otros trminos) el trmino t, entonces, si t y
a disponen del unificador ms general 0', se puede inferir el paramodulante binario de YI y Y:
2
1t = U y'l O' U Y'2 O'}
donde denota el resultado de reemplazar una ocurrencia simple de tO' en A.cr por (la
propiedad simtrica de la igualdad se trata con una regla pareja que invierte los papeles de a y
En la prctica, la regla no es tan compleja como parece a la vista de su definicin formal.
Como primer ejemplo (esto es matar mosquitos a caonazos!), demostraremos P(B) a partir de
peA) y (A B) (pasamos a utilizar la notacin infija para abreviar). Para una demostracin del
tipo refutacin, debemos deducir la clusula vaca de las clusulas -,P(B), peA) Y(A = B). Si uti-
lizamos la paramodulacin en las dos ltimas clusulas, A.(t) es peA), t es A, a es A, y es B.
Como A (en el papel de t) y A (en el papel de a) se unifican de forma trivial sin necesidad de una
sustitucin, el paramodulante binario es P(B), que es el resultado de reemplazar la ocurrencia de
t (es decir, A) por (es decir, B). Al resolver este paramodulante (P(B con -,P(B) obtenemos la
clusula vaca.
Le dejamos que trabaje con el siguiente ejemplo (tomado de [Chang y Lee, 1973, p. 170]).
El paramodulante binario de:
P(g(f(x) v Q(x)
y
[f(g(B =A] v R(g(C
es
P(g(A v Q(g(B v R(g(C
Con una pequea extensin sobre los tipos de paramodulantes permitidos (ms all de los
binarios), se puede mostrar que la paramodulacin combinada con la refutacin mediante reso-
lucin es completa para bases de conocimiento que contienen el predicado de igualdad.
Para los problemas que no requieren sustituciones de elementos iguales no se necesita la
potencia de la paramodulacin. En muchos casos podemos apaamos con una tcnica llamada
evaluacin de predicados. Si un proceso externo es capaz de devolver un valor de verdad para un
predicado de igualdad, podemos reemplazar ese predicado (tal como ocurre con una frmula) por
el valor T o F apropiados. En la refutacin mediante resolucin, las clusulas que contengan el
literal T se pueden eliminar, y el literal F se puede eliminar de cualquier clusula (siempre se pue-
de resolver asumiendo un T omnipresente).
Consideremos, por ejemplo, el problema (con el que se podra encontrar un robot repartidor)
consistente en demostrar que si un paquete A est en una habitacin, HI, entonces no puede
hallarse en otra habitacin diferente, H2. El robot tendra enunciados en su base de conocimien-
to, tales como:
('{x, u, v) [En(x, u) /\ (u:;t:. v)] :::) -,En(x, v)
En(A,
La resolucin en el clculo de predicados
El robot intentara demostrar -,En(A, H2). Al convertir la primera frmula en forma clausal,
obtenemos:
-,En(x, u) v (u =v) v -,En(x, v)
La estrategia consiste en posponer el tratamiento de los predicados de igualdad hasta que
stos contengan slo trminos base. Al resolver la clusula con la negacin de la fuf que se desea
demostrar, obtenemos:
(H2 v) v -,En(A, v)
Al resolver este resultado con la fuf En(A, H1), obtenemos:
(H2 =
y ahora, podramos imaginar que la base de conocimiento realmente contiene la fuf -,(H2 =
Si la tuviera, podramos utilizarla para generar la clusula vaca, completando la refutacin.
Pero, en un edificio grande con M habitaciones, necesitaramos M(M -1) desigualdades de este
2
tipo. Y si el robot tuviera que realizar cualquier razonamiento que implicara nmeros, podra
necesitar de un conjunto inmanejable de fufs, tales como -,(3742 =4861), Ymuchas otras. En
vez de tener todas estas desigualdades de forma explcita en la base de conocimiento, sera
mejor disponer de una rutina (es decir, un programa) que fuese capaz de evaluar expresiones de
la forma (a para todo a En nuestro ejemplo, el programa devolvera F (o, como valor
equivalente, Ni 1) para la expresin (R2 =R1), Y la refutacin sera completa.
Otras relaciones que se usan comnmente (como, mayor que, menor que, ... ) y funciones
(como, suma, resta, divide, ... ) podran ser evaluadas directamente en vez de ser razonadas
mediante frmulas. La evaluacin de expresiones es entonces una potente herramienta que
aumenta la eficiencia de los sistemas de razonamiento automtico.
Lec/uras y consideraciones adicionales
Hay gente que encuentra que la resolucin es una regla de inferencia poco intuitiva, y prefiere en
su lugar los denominados mtodos de deduccin natural [Prawitz, 1965]. Estos mtodos se
denominan naturales porque la inferencia se realiza sobre las sentencias tal cuales, sin
transformarlas a las formas cannicas. [Bledsoe, 1977] debate algunos de estos mtodos.
Larry Wos y Woody Bledsoe han sido pioneros en la aplicacin de la resolucin, y de otros
mtodos de inferencia, a la tarea de demostrar teoremas matemticos. Este trabajo obtuvo estra-
tegias nuevas de resolucin, tales como el conjunto de soporte [Wos; Carson y Robinson, 1965]
y la preferencia unitaria. Ejemplos de sistemas de demostracin de teoremas potentes (algunos de
los cuales han resuelto problemas abiertos de las matemticas) se pueden encontrar en [Wos y
Winker, 1983; Boyer y Moore, 1979; Stickel, 1988; McCune, 1992; McCune, 1994, y Wos,
1993]. [Wos, et al., 1992] es un libro de texto sobre la demostracin de teoremas mediante
ordenador y sus aplicaciones a la resolucin de problemas.
La demostracin de teoremas tambin ha sido aplicada a la tarea de verificar y sintetizar pro-
gramas de ordenador, dada una serie de especificaciones. [Manna y Waldinger, 1992] es un
tutorial sobre la sntesis automtica de programas. [Manna y Waldinger, 1985, y Manna y Wal-
dinger, 1990] son libros sobre lgica y programacin. [Lowry y McCamey, 1991] es una colec-
cin de artculos sobre sntesis de programas.
238
Laevaluacindepredicadosesunainstanciadeunprocesomsgeneral, denominadoaso-
ciacin semntica, enelcualseasocianestructurasdedatosy programasaelementosdellen-
guajedelclculodepredicados.As,lasestructurasylosprocedimientosasociadossepuedenuti-
lizarparaevaluarexpresionesdellenguajedeunmodoquecorrespondeconsusinterpretaciones
previstasLWeyhrauch, 1980,yMyers, 1994].
LarevistaJournal ofAutomated Reasoning tratatantolateoracomolaaplicacindelastc-
nicasdedemostracindeteoremas.
16.1. Deduzcasilossiguientesparesdeexpresionessonunificablesonoymuestreelunificador
msgeneralparacadaparunificable:
1. P(x,B, B) YpeA, y, z)
2. P(g(f(v,g(u y P(x,x)
3. P(x,f(x y P(y,y)
4. P(y,y,B)Ypez,x,z)
5. 2+3 =x yx =3+3
16.2. Expliqueporqu P(f(x,x),A) noesunificableconP(f(y,f(y,A,A).
16.3. Conviertalassiguientesexpresionesalaformac1ausal:
1. 3x) [P(x) ] v (3x) [Q(x)1):::) (3x) [P(x) v Q(x)
2. ('v'x) [P(x) :::) ('v'y) [(V' z) [Q(x, y)] :::) -,(V' z) [R(y, x) ]1]
3. (V'x) [P(x)1:::) (3x) [(V'z) [Q(x, z)] v (V' z) [R(x, y, z)
4. (V'x) [P(x) :::)Q(x,y)] :::) 3y) [P(y)] A (3 z) [Q(y, z)J)
16.4. Tenemoselsiguienteprrafo:
Tony,MikeyJohnpertenecenalClubAlpino.CadamiembrodelClubAlpinoes,oesquia-
dor, oalpinista,oambascosas.Aningnalpinistalegustaquellueva,yatodoslosesquia-
doreslesgustaquenieve.AMikenolegustaloquelegustaaTony,ylegustaloqueledis-
gustaaTony.ATonylegustaquelluevayquenieve.
Representeestainformacinmediantesentenciasdel clculodepredicados,demaneraque
puedarepresentarlapreguntaQuinesunmiembrodelClubAlpinoqueesalpinistay noes
esquiador?comounaexpresindelclculodepredicados.Utilicelarefutacinmediantereso-
lucinylaobtencinderespuestaspararesponderla.
16.5. Demuestreque(V'x)"-(x) 1- "-(1:), donde1: esuntrminobase.
16.6. Demuestreporrefutacinmedianteresolucinquelafbf(3x)p(x)sesiguelgicamentede
lafbf[P(A1)v P(A2)].Hayalgunarefutacinmedianteresolucinquedemuestrequelaforma
Skolemizadade(3x)p(x),asaber, P(SK),sesiguelgicamentede[P(A1)v P(A2)]?
16.7. Sam,Clydeyscarsonelefantes.Sabemoslossiguienteshechosacercadeellos:
1. Samesrosa.
2. Clydeesgrisylegustascar.
3. scaresrosaogris(peronoambascosas)ylegustaSam.
Utilicelarefutacin medianteresolucinparademostrarqueaunelefantegris legustaun
elefanterosa;esdecir,demuestre(3x,y)[Gris(x)A Rosa(y)A LeGusta(x,y)].
16.8. Paracadaunadelassiguientesfrmulas, demuestreque,obienesvlida,obiendauncon-
traejemplodesuvalidez(Pista:noselanceaprobarlaresolucinenseguida).
1. ([3x)p(x)]:::)Q(A)} :::) ((V'x)[P(x):::)Q(A)]}
2. ([(V'x)P(x)]:::)Q(A)} :::) {(3x)[p(x):::)Q(A)]}
3. (3x)[p(x):::)Q(A)] :::) (V'x)[P(x):::) Q(A)]
16.9. Conviertalasiguientefrmulaenunaquenotenganingncuantificadorexistencialninin-
gunafuncindeSkolem.
(V'x, y){(3z)[Sobre(x, z)A Encima(z,y)]:::) Encima(x,
16.10. Utilicelarefutacinmedianteresolucinsobreunconjuntodeclusulasparademostrar
queexisteunobjetoverde,sabiendoque:
Silosobjetosquesepuedenempujarsonazules,entonceslosquenosepuedenempujar
sonverdes.
Todoslosobjetossonazulesoverdes,peronoambascosas.
Sinohayobjetosquesepuedenempujar,entonceslosquessepuedenempujarsonazu-
les.
Elobjeto01 sepuedeempujar.
Elobjeto02 nosepuedeempujar.
1. Conviertaestosenunciadosenexpresionesdelclculodepredicadosdeprimerorden.
2. Conviertalasexpresionesdelclculodepredicadosobtenidasalaformac1ausa!.
3. Combinelasexpresionesdelaformac1ausal obtenidasconlaformaclausaldelanega-
cindelasentenciaquesedeseademostrar,ymuestrelospasosrealizadosparaobtener
larefutacinmedianteresolucin.
16.11. Lafuncincons(x,y)denotalalistaformadaalinsertarelelementox enlacabezadela
listay.DenotamoslalistavacamedianteNil;lalista (2) mediante cons(2,Nil);lalis-
ta (1,2) mediantecons(1, cons(2, Nil)),Yassucesivamente.LafrmulaUltimo (l,e) sig-
nificaquee eselltimoelementodelalista L Disponemosdelossiguientesaxiomas:
(V'u) [Ultimo(cons(u, Nil), u)1
(V'x, y, z) [ltimo(y,z):::) Ultimo(cons(x, y), z) 1
1. Demuestreconelmtododerefutacinmedianteresolucinelsiguienteteorema:
(3v) [Ultimo(cons(2, cons(l,Nil)), v)]
2. Utilicelaobtencinderespuestasparaencontrarv,elltimoelementodelalista(2, 1).
240
16.12. Elsiguientecircuitolgicotienecuatrocables,el, e2, e3ye4. TieneunapuertaAnd
A yunapuertaNo! N. Lasentradasel ye2puedenestarenestadoon uoff. Silapuerta
A funcionacorrectamente(OK), el cablee3estOfl, si,y slosi, lasentradasel y e2estn
ambason. SilapuertaN funcionacorrectamente(OK), elcablee4eston, si,yslosi,el
cablee3estoff.
el
--[9 0 e3 e4
1. Utiliceexpresiones,talescornoOK(A), ON(Cl)yotras,paradescribirelfuncionamiento
deestecircuito.
2. Usando las frmulas que describen el funcionamiento del circuito, y asumiendo que
todos los componentes estn funcionando correctamente y que las entradas el y e2
estnon,utilicelaresolucinparademostrarquelasalidae4estoff.
3. Finalmente,usandolasfrmulasquedescribenelfuncionamientodelcircuito,dadoque
lasentradas el y e2estn on, y quelasalida e4tambineston, utilice lareso-
lucinparademostrarquelapuertaAnd o lapuertaNot estn funcionando incorrecta-
mente.
temasbasados
nconocimiento
El enfrentamiento con el mundo
Ahoraqueyahemosvistoelusodelalgicaenlarepresentacinyelrazonamiento,yquehemos
mostradosuutilizacinconalgunosejemplossencillos,nospreguntarnoscmosepodraaplicar
a problemas del mundo real. La investigacin en lAse haencontrado con que aplicaciones
cornoeldiagnsticomdico,laconsultadecontribuciones,oeldiseodeequipos(pornombrar
unospocosejemplos),porlogeneral,necesitandeunamplioconocimientoacercadelternaque
tratan.Estenfasisenlaimportanciadelconocimientoenlasaplicacionesdescritasnossugiere
utilizarlafrasesistemas basados en conocimiento, paradescribirlosprogramasquerazonanuti-
lizandograndesbasesdeconocimiento.Losmtodosqueyahemosdescrito,sepodranadaptar
deformasatisfactoriaparalasaplicacionesprcticas?Culessonlascaractersticastericasde
losmtodosderazonamientoqueseranrelevantesaestacuestin?Enestecaptulo,vamosatra-
tarestascuestiones,yahablardealgunosenfoquesquehansidoutilizadossatisfactoriamenteen
aplicacionesrealesquerequierenunrazonamientoprctico.
Haytresgrandescaractersticasdelossistemasderazonamientolgico,enconcreto, lasoli-
dez, la completitud, y ladecidibilidad. Paraestarsegurosdeque una conclusin inferidaes
cierta,necesitarnoslasolidez;paraestarsegurosdequeunainferenciatardeotempranopro-
ducirunaconclusinverdadera, necesitamos lacompletitud, yparaestarseguros de quela
inferenciaesfactible, necesitarnosladecidibilidad.Enloqueserefierealc1culodepredicados,
sabernosquelarefutacinmedianteresolucinesslidaycompleta. Debidoaqueescomple-
ta,sabernosquesiunafbfroesunaconsecuencialgicadeunconjuntodefbfs.:l, podernosuti-
lizarlarefutacin medianteresolucin parademostrarla. Sinembargo, siro no esunaconse-
cuencia lgica de .:l, el procedimiento de refutacin mediante resolucin podra no acabar
nunca(entrarenunbuclesinfin). Portanto,nopodernosutilizarlarefutacinmediantereso-
lucincomounprocedimientodedecisincompleto.Msan,sepuededemostrarquenohay
ningnotromtodoquenosdigasiempresiunafbfronosededucirdeunconjuntodefbfs.:l
cuandonosededucedel. Debidoaestehecho,decirnosqueelclculode predicadosessemi-
241
242
243
InteligenciaartificiaLUnanuevasntesis
decidible, y, portanto, lasemidecidibilidadconvierte al clculodepredicados enalgoinhe-
rentementeintratable.
Peroestasituacinesrealmentemala.Aunenproblemasenlosquelarefutacinmediante
resolucin termina, elprocedimientoes NP-duro, como cualquierotro procedimientode infe-
renciadelclculodepredicadosdeprimerordenqueseaslidoycompleto[Borger, 1989].As,
que, aunquemuchosproblemasderazonamientosepuedenformularcomoproblemasderefu-
tacinmedianteresolucin,el mtodoseconvierteenalgointratableenproblemasdeenverga-
dura. Estehechohallevadoamuchosaperderlaesperanzaenlautilizacindelosmtodoslgi-
cos formales en problemas de razonamiento de gran tamao (vase, porejemplo, [Schwartz,
1987, y McDermott, 1987].A pesardetodo, ya quelos seres humanos realizamos complejos
razonamientospornosotrosmismos,debenexistirformulacionesyheursticasespecialesquenos
permitanrealizarclculostratables.
Losinvestigadoreshananalizadodiversosmtodosparapoderrealizarrazonamientosdefor-
mamseficiente.Primero,podramosrenunciaranuestrainsistenciasobrelasolidezdelasreglas
deinferencia,yutilizarprocedimientosquepodrandemostrardevezencuando(esperamosque
raravez)unfrmulafalsa. Segundo,podramosrenunciaranuestrainsistenciasobrelacomple-
titud,yutilizarprocedimientosquenogarantizaransiempreencontrarunademostracindeuna
frmulaverdadera.Tercero,podramosutilizarunlenguajequefuesemenosexpresivoquelaglo-
balidaddelclculodepredicados; unejemplo,delquehablaremosms adelante,seraunoque
sloutilizaraclusulasdeHom.ElrazonamientoconclusulasdeHormes,porlogeneral,ms
eficiente,yessuficienteparamuchasapUcaciones.
Razonamiento con clusulas de Horn
EnelCaptulo 14,definimoslasclusulasdeHomcomoaquellasquetenanalosumounliteral
positivo. Sihay comomnimounliteral negativo y un literalpositivo atmico, lac1usulade
Homsepuedeescribircomounaimplicacin,enlaqueelantecedenteesunaconjuncindelite-
rales positivos y el consecuente es un literal atmico positivo. Aeste tipo de clusula se la
denominaregla. Puedenohaberliteralesnegativosenlaclusula,encuyocaso,laescribiremos
comounaimplicacincuyoantecedenteestvacoycuyoconsecuenteesunliteralatmicoposi-
tivo, llamndola hecho. Tambin, puede no haber literales positivos en la clusula, en cuyo
caso,laescribimoscomounaimplicacincuyoconsecuenteestvacoycuyoantecedenteesuna
listadeliteralespositivos,llamandoadichacusulaobjetivo. LasclusulasdeHomsonlabase
dellenguajedeprogramacinPROLOG [Colmerauer, 1978;ClocksinyMellish, 1987;Sterling
yShapiro, 1986;Bratko, 1990],enestelenguaje,lasclusulasdeHomfuncionancomolassen-
tenciasdellenguaje,quesepuedenescribirenlossiguientesformatos:
Reglas: Ah :- Ael' ...,Aen
(queesunaformaespecialdeescribirlaimplicacinAel 1\ ... 1\ Aen:: Ah)' dondecadaAl es
unliteralpositivo. ElliteralpositivoAh eslacabeza delaclusula,ylalistaordenadade
losliteralesAc, ...,Aen eselcuerpo.
Hechos: Ah :-
Objetivos::- Ac, ... ,Aen
Losliteralesdelosobjetivosylosdeloscuerposdelareglassonlistasordenadas,elorden
desempeaunpapelmuyimportanteenlaejecucindeunprogramaenPROLOG.
LainferenciaconclusulasenPROLOG sebasaenintentardemostrarunaclusulaobje-
tivomediantelaejecucindeunprograma.Dichapruebaseobtienemedianteoperacionesdetipo
Sistemasbasadosenconocimiento
resolucinsobreloshechos,lasreglasy losobjetivosenPROLOG. Cadaresolucin serealiza
entreunobjetivo,obienunhechoounaregla.
Unobjetivosepuederesolverconunhechomediantelaunificacindelhechoconunode
losliteralesdelobjetivo.Aesteliterallodenominamosliteralresuelto.El resolventequese
obtieneesunnuevoobjetivo,compuestoporlalistadetodaslasinstanciasdesustitucin
del restode literalesdel objetivo original(asaber, aquellos que an no se han resuelto),
escritosenel mismoordenqueenelobjetivooriginal.Las instanciasdesustitucinseobtie-
nenmediantelaaplicacindelumgdelaunificacinentretodosestosotrosliterales.
Un objetivo sepuederesolvercon unareglamediantelaunificacin de lacabezade la
reglaconunodelosliteralesdelobjetivo. El resolventequeseobtieneesunnuevoobje-
tivocompuestoporlaadicindelalistadelasinstanciasdesustitucindetodosloslite-
ralesdelcuerpodelareglaen frente delalistadeinstanciasdesustitucindelrestodelos
literales(losnoresueltos)delobjetivo.
EnlosprogramasenPROLOG sesuelenordenarlasclusulasdelasiguientemanera: lapri-
meraclusulaeslaclusulaobjetivo;luego,lasiguenloshechosy, finalmente,lasreglas.Aleje-
cutarelprograma,elintrpretebuscaresolucionesconelobjetivorecorriendoenordenloslite-
ralesdelobjetivo,examinandocadaclusulapororden,reali2iandolaprimeraresolucinaplica-
ble, y volviendoa empezarconlanueva clusulaobjetivogenerada. Lademostracin deuna
clusulaobjetivotienexitocuandolanuevaclusulaobjetivogeneradamedianteresolucinest
vaca. Esto slo puede suceder cuando una clusula objetivo tiene un literal atmico que se
resuelveconunaclusuladehecho(poreso,colocamosloshechosantesdelasreglas,paraque
el procesotengaxitoloantesposible).Unaclusulaobjetivofracasa(osea,noencuentrauna
demostracin)sielintrpretehaprobadotodaslasresolucionesparaunodelosliteralesdelobje-
tivo y no se ha podido generar ningna clusula objetivo nueva. En este caso, el intrprete
retrocedealaclusulaobjetivopreviaeintentaaplicarotrasposiblesresolucionessobreella.Este
procesoesmuyparecidoalaresolucinlinealsobreclusulasmedianteelprocedimientodebs-
quedaenprofundidadconvueltaatrs,conlaordenacinadicionaldelasresolucionesmedian-
te elordende las clusulasydesus literales. Sielordenenqueseleccionamoslasclusulasa
resolver,yelordendelosliteralesendichasclusulasestnbienelegidos,unabsquedaenpro-
fundidadqueutilicedichoorden,serunaformaeficientedeencontrarunademostracin.El pro-
gramadorenPROLOG especificaelordendelasresolucionesparaunabsquedaenprofundidad
escribiendolasclusulasylosliteralesdecadaclusulaenelordenquedesealabsqueda.
VamosamostrarlainferenciaquerealizaPROLOG medianteunosejemplossencillos.Elpri-
meronoutilizavariables,ynosdaunpuntodevistageneraldelproceso.Recordemoselejemplo
deaplilamientodebloquesqueutilizamosparamostrarelprocesoderazonamientoenelclcu-
lo depredicados.Aqumostramos un programaen PROLOG parademostrar que elbrazo se
moverapartirdeloshechos:elbloquesepuedecogerylabateraestcargada:
1. :- Se_mueve
2. Bateria_Ok:-
3. Objeto_se-puede_coger:-
4. Se_mueve: Bateria_Ok, Objeto_se-puede_coger
Laprimeraresolucinesentrelaclusulaobjetivoylasentencia4,obteniendolanuevaclu-
sulaobjetivo:- Bateria_Ok, Objeto_se-puede_coger.Lanuevaclusulaobjetivose
resuelveconlasentencia2(resolucinsobreelprimerliteraldelanuevaclusulaobjetivo),obte-
niendolanuevaclusulaobjetivo:- Objeto_se-puede_coger,lacualseresuelveconla
244
245
Nosonposiblesms
emparejamientos
(instanciade
regla)5
sentencia3,generandolaclusulaobjetivovaca,yfinalizandoelprogramaconxito. Eneste
caso,lavueltaatrsnohasidonecesaria.
Lademostracinqueacabamos deobtenerse puederepresentarmediante unaestructurade
rbol,talcomolaqueseveenlaFigura17.1.Elconjuntodenodosenlascajasgrisessecorres-
pondeconlassentenciasdelprograma(losobjetivos,lasreglasyloshechos).Estosnodosseeti-
quetanconlosliteralesdelassentenciasdelprograma.Haydostiposdearcos,losarcosdeempa-
rejamiento (los de doble lnea) y los arcos deregla (los de lnea sencilla). Los arcos de regla
conectanlos nodosdelcueIpodeunareglaconelnodocabezadelamismaregla. Losarcosde
emparejamientoconectanlosnodosdelcueIpOdeunaregla(ounnodoobjetivo)conunnodocabe-
zaetiquetadodeigualmanerapertenecienteaotraregla(oconunhecho).Unnodoobjetivo,oun
nododelcuerpodeunaregla,quedademostrado siestconectadomedianteunarcodeempareja-
mientoaunnodohecho,oaunnodocabezaquetienetodos susnodosdelcueIpodemostrados.Uti-
lizamoselsubolo(,-,)uniendotodoslosarcosdereglaenunaregla,paraenfatizarelhechodeque
todoslosnodosdelcueIpodebenserdemostradosparaconseguirqueelnodocabezatambin10
est.ElrboldelaFigura17.1esunainstanciadeloquesedenominarboldedemostracinY/O.
Enestetipoderbol,losnodosdelcueIpOsedenominannodosy,porquetodossedebendemostrar
(sihubiesendistintasresolucionesalternativasaplicables,labsquedaporelrboldedemostracin
podran generar nodos adicionales, denominados nodos O, a travs de los arcos deempareja-
mientoalternativos.PosteriormenteveremosunejemplodeunrbolY/Oenunademostracin).
Comoejemplodelusodevariables1 volvemosalmundodebloques.Supongamosqueque-
remosutilizarelconceptodequeunbloqueestencima deotrobloque.Utilizandoelclculode
predicados,podemosdefinirencima enbaseasobre deformarecursiva,mediantelassiguientes
frmulas:
(Vx,y,z)[Sobre{x,Y):JEncima{x,y)]
(Vx,y){(3z)[Sobre(x,z)1\ Encima{z,y)J:JEncima(x,y)}
(objetivo) 1
OBJETIVO_SE_PUEDE_COGER
(hecho)2 (hecho)3
Figura17.1.
Unrboldedemostraci6nY/O.
I LasconvencionestipogrficasdePROLOGsonalainversaquelasnuestras.EnPROLOG,lasvariablesestnen
maysculas, ylas constantesencadenasdetexto alfanumricas. ParafacilitarlacomparacinconlasfbfsdelCPPO
(ClculodePredicadosdePrimerOrden),nosmantendremosfielesanuestrasconvenciones.
ConestasdefinicionessepuedeutilizarelsiguienteprogramaenPROLOGparademostrarsi
elbloqueA estencimadelbloqueC,cuandoA estsobreB, yB sobreC:
1) :- Encima(Al C)
2) Sobre(A, B)
3) Sobre(B , C)
4) Encima(x, :- Sobre(x, y)
5) Encima(x, y) :- Sobre(x, z), Encima(z, y)
La primera resolucin aplicable al objetivo (con laregla 4) genera el nuevo objetivo
:- Sobre(A,C). Esteobjetivofalla,entoncesretrocedemosalobjetivooriginaleintentamosla
siguiente resolucin aplicable (con laregla 5) para generar un nuevo objetivo alternativo
:- Sobre{A, Encima(z,C).Alresolverelprimerliteraldeesteobjetivo(conelhecho2)se
generaelnuevoobjetivo:- Encima(B,C). Esteobjetivoseresuelveconlaregla4,generando
Sobre(B,C),queseresuelveconelhecho3,generandoelobjetivovaco,finalizandoelpro-
ceso.Lageneracindel objetivo:- Encima(B,C)puedeversecomounallamadarecursivaal
mismoprograma.
ElrbolY/OquerepresentalabsquedarealizadaporelintIpretedePROLOG semuestraen
laFigura17.2.Losnodosdelrbol dedemostracinseindicanmedianteelipsesennegrita,ylos
(objetivo) 1
-
Figura17.2.
UnrbolY/O.
(hecho)3
246
247
nodos que han sido abortados en la bsqueda se indican con elipses sombreadas. Algunos de los
arcos de emparejamiento se etiquetan mediante sustituciones (obtenidas mediante la unificacin
de los nodos del cuerpo y el nodo cabeza), y los nodos en cajas representan las instancias de sus-
titucin de las reglas. Para hacer que el rbol represente una demostracin vlida, las sustituciones
deben ser consistentes. La consistencia requiere que la variable z sea sustituida por el mismo tr-
mino a lo largo de todo el rbol de demostracin. En PROLOG, la consistencia se obtiene
mediante la sustitucin inmediata de las variables por trminos al crear un nuevo objetivo. Fij-
monos en el uso de las distintas variables instanciadas en la regla 4 del rbol de demostracin.
PROLOG es un lenguaje de programacin de propsito general que ha sido muy til en
muchas aplicaciones de la IA, especialmente en el procesamiento del lenguaje natural [Pereira y
Shieber, 1987]. Un libro de texto de [Shoham, 1994] muestra cmo se utiliza PROLOG para
implementar diversas tcnicas de lA. Los lenguajes lgicos relacionados con PROLOG (como
DATALOG) se utilizan para definir relaciones predicativas con las que aumentar las relaciones
explcitas (de tipo extensional) en una base de datos relacional. Consltese [UlIman, 1988, y UU-
man, 1989] para ver un tratamiento a fondo sobre el uso de los mtodos lgicos en las bases de
datos. [Minker, 1997] es un artculo de anlisis bastante legible.
Estos programas elementales en PROLOG muestran cmo se pueden utilizar las clusulas
de Horn en problemas de razonamiento. En PROLOG, el razonamiento se realiza hacia atrs,
comenzando por el objetivo que se ha definido, encadenndose con las reglas, y finalizando con
los hechos. Los sistemas de lA que realizan este tipo de razonamiento regresivo, mediante los
objetivos, las reglas y los hechos, se denominan sistemas de encadenamiento regresivo. Tambin
se puede realizar el encadenamiento progresivo. En este caso, el razonamiento se realiza hacia
delante, comenzando con los hechos, encadenando con las reglas y finalizando con los posibles
objetivos. Los sistemas de encadenamiento progresivo representan las reglas en la forma impli-
cativa estndar, con un antecedente compuesto por literales positivos y un consecuente forma-
do por un literal positivo. Como PROLOG es un sistema basado en encadenamiento regresivo,
hay otros lenguajes, como el OPS5 [Brownston, et al., 1985], que estn basados en encadena-
miento progresivo. Muchos sistemas de razonamiento, prcticos y eficientes, se han escrito en
OPS5.
En los sistemas con encadenamiento progresivo, una regla es aplicable si cada uno de los lite-
rales de su antecedente se puede unificar con un hecho (utilizando sustituciones consistentes). Ya
que los hechos son tomos base, las variables slo aparecen una vez en los pares de expresiones
unificadas. Este tipo restringido de unificacin se suele llamar emparejamiento de patrones. La
aplicacin de la regla (cuyos literales del antecedente se han emparejado con los hechos de forma
consistente) se consigue aadiendo la correspondiente instancia del consecuente de la regla a la
lista de hechos. Cuando se puede aplicar ms de una regla, se utiliza algn tipo de proceso exter-
no de resolucin de conflictos para decidir qu regla se aplicar. Cuando hay un gran nmero de
reglas y hechos, el nmero de unificaciones que se deben realizar se convierte en algo prohibiti-
vo. El OPS5 utiliza un algoritmo denominado RETE, que compila las reglas en una red, que se
utiliza para guiar de forma eficiente los emparejamientos consistentes entre los hechos y las reglas
[Brownston, et al., 1985, y Forgy, 1982].
El proceso de encadenamiento progresivo, basado en que los hechos disparan las reglas para
aadir nuevos hechos, es bastante parecido al proceso que utilizan los sistemas de pizarra de los
que hablamos en el Captulo 5. En un mbito ms especializado, este proceso sirve para modelar
ciertos aspectos del procesamiento cognitivo humano. Los hechos se corresponden con lo que se
denomina memoria de trabajo (o de corto trmino, o activa); y las reglas, con lo que se denomina
memoria de largo trmino (o secundaria, o histrica). En lA, los sistemas ms avanzados basa-
dos en este modelo cognitivo son los que utilizan el formalismo del SOAR [Laird; Newell, y
Rosenbloom, 1987, y Laird y Newell, 1993].
Sistemas basados en conocimento
Mantenimiento de bases de conocimiento dinmicas
El encadenamiento progresivo pone de manifiesto hechos que se deducen de las reglas existentes,
pero que no estn disponibles explcitamente en la base de conocimiento hasta que son inferidas.
Una vez estn disponibles, estos hechos pueden utilizarse para deducir ms hechos, o pueden
invocar las acciones de un agente. Por tanto, el razonamiento dirigido hacia delante se puede ver
como un proceso que va realizando cambios en una base de conocimiento de hechos. Vamos a
desarrollar este enfoque.
Pensemos en una base de conocimiento BC, formada por tomos del clculo proposicional.
A partir de ahora, llamaremos a los tomos premisas en vez de hechos, porque queremos poder
realizar razonamientos del tipo qu pasa si ... . Para ser ms concretos, pensemos en un ejemplo
en el que las premisas son P y Q, y las reglas son P 1\ Q:J R Y P v R:J S. Fijmonos en que las
reglas son implicaciones con un nico literal como consecuente, igual que antes, pero ahora no
nos restringimos a utilizar clusulas de Horn.
Una cadena de razonamiento hacia delante utilizando estas reglas nos permite aadir R y S
a la BC como nuevos tomos. Una forma de pensar en esta BC es como si fuera una hoja de
clculo unidimensional, con una sola fila y varias columnas. Podramos llamarla una BC
basada en tablas. Disponemos de una columna para P, Q, R Y S, Y tenemos una celda en cada
columna para cada uno de los valores de estos tomos. En cada celda de los valores de P y Q,
podemos insertar un 1 (para el valor Verdadero) o un O (para el valor Falso); sin embargo, en las
celdas de valor de R metemos la frmula P 1\ Q, Y en la de S la frmula P v R. Estas frmulas
son los antecedentes de cada una de las reglas. Algunas instancias de tablas se muestran en la
Figura 17.3. La de arriba es la que muestra las frmulas, y las de abajo muestran los valores
deducidos para dos ejemplos (interpretaciones). Igual que en una hoja de clculo, cada celda que
contiene una frmula obtiene su valor, calculado inmediatamente (mediante encadenamiento pro-
gresivo) a partir de los valores de sus componentes. Si el valor de cualquiera de los componen-
tes cambia, el de la frmula cambia de forma automtica.
Podramos extender nuestra BC basada en tablas para que contenga cualquier nmero de pre-
misas y reglas. Este tipo de estructura se puede interpretar como un tipo de base de conocimiento
dinmica. Los procesos de razonamiento se incorporan (utilizando las frmulas) mediante meca-
nismos que son externos a los valores explcitos de las celdas. Las bases de conocimiento imple-
mentadas de esta forma son tiles para diversos objetivos. Alguin (o un agente) podra desear
s
p v
Figura 17.3.
Un sistema de razonamento en forma de tabla.
conocercmocambiaranlosvaloresdediversostomossicambiarandealgunamanerasuspre-
misas.EnlA,estasBCbasadasentablassedenominansistemasdemantenimiento de la razn.
stas,yotrasestructurasdelasqueprontohablaremos,soninstanciasdeloquesedenominansis-
temas de mantenimiento de la verdad (SMV). Lafrmulas quese insertanen lasceldasdelas
reglassellamanjustificaciones (oargumentaciones). Por10general,lasjustificacionesseexpre-
san como disyunciones de conjunciones de tomos (Forma Normal Disyuntiva, o FND). Se
hanideadodiversosprocedimientoseficientes(comoel algoritmoRETE [Forgy, 1982])pararea-
lizarlosclculosdeencadenamientoprogresivoensegundotrmino,yasobtenerlosvaloresde
lasceldas.
Unaampliacininteresante(msalldelashojasdeclculoconvencionales)nospermitira
omitirlosvaloresdeciertaspremisas.Envezdetenerqueetiquetarcadaunacon1o0,podra-
mos no tenerquedarlesvaloresa todas. Si los valores de algunas premisasestuvieranvacos,
entonces los valores de algunas reglas tambin lo estaran. Cuando en una hoja de clculo
encontramosunafrmulaquetienealgncomponenteconunvalorvaco(noasignadoonoliga-
do),sepuedeasumirqueelvalores0,oelsistemapuedeavisaralusuariodequedichovalorno
hasidoasignado.Ensulugar, cuandoenunabasedeconocimientodinmicanosepuedecalcular
elvalordeunafrmula (porquealgunodesuscomponentesnotieneelvalorasignado),laBC
tambintrataelvalorde lafrmula comonoasignado (ignorado), dejando laceldaenblanco.
Mostramos unejemploenlaFigura 17.4;lasfrmulas conR y S sonlasmismasquelasdela
Figura 17.3.FijmonosenqueenuncasoelvalordeSsepuedecalcular,auncuandounode sus
componentesestvaco.
Enel vocabulariodelos SMV, auntomocuyovalornoesni 1ni 0, seledenominaOUT.
UtilizaremosOUT comoelvalordedichostomosenvezdedejarsusceldasvacas.Cuandouna
celdatieneelvalor1o0, sedicequeestIN.Enparticular,ftimonosenquecambiarel valorde
unacelda,llammoslaP,de 1aOUT,esmuydistintoadecirqueP esFalsa. Dichocambionos
dicequelaBCnopuedesabersiPesVerdadera (oFalsa).
DejarquelasceldastenganvaloresOUT nospermiterealizarunageneralizacininteresante
sobrelostiposdereglas.Podemostenerreglascuyosantecedentesafectanatomosquedeben
serOUT, envez de tenerelvalor 1o O. Vamos a ilustrarlocon un ejemplo. Supongamosque
podemosconcluirU si R esCierta, y SesOUT.Lopodemosescribirdealgunaformasimilara
unaimplicacin:
R A S-::>U
InstanciasdeBe
m
FRm
Q
R S
,Lml_l
11:18
Figura17.4.
UnaBeconvaloresnoasignados.
UtilizamoselsuperndicedesignomenosC) si eltomotienequeserOUT (losconsecuen-
tesdelasimplicacionesdelosSMVnuncatienensignossuperndice.Esdecir,cuandosesatis-
faceelantecedente,el consecuentees 1, asquees IN).
LosSMVsepuedenenfocar,nocomosistemasderazonamientodepropsitogeneral(como
losvistosenlosCaptulos 13 al 16),sinocomounsistemademantenimientodebasesdecono-
cimiento,querealizalasactualizacionesautomticascuandolos valoresdeverdaddeciertosto-
moscambian.Elusodelosvalores INyOUTnospermiterealizarciertotipodeinferenciano
monotnica,oretactable,quenoessancionableporlossistemasclsicosderazonamiento. La
inferenciaenlalgicaclsicaesmonotnicaenelsentidoquecuandounafrmulanuevaseaa-
dealabasedeconocimiento,todaslasdeduccionesanterioresaquelafrmulaseinsertarasiguen
siendovlidas.Aadirnuevasfrmulasnuncareduceelconjuntodeteoremasdemostrables,pero
si deducimosuntomo, a saber, $, que depende de otrotomo queesOUT, entonces,cuando
actualizamoselvalordedichotomoa IN,deberamosretractamosde$.Enelejemploqueaca-
bamosdever, si nosencontramosconqueStieneelvalorVerdadero, entoncesdeberamosretrac-
tamosdeU,elcual,nospuedeconduciraotrasretractaciones(odeducciones).
Losciclossobrereglaspresentanalgunosproblemas;unodeelloseslajustificacin mutua.
Cosideremoslasfbs P, P ::> Q, Q::> R, R::> Q. Si Ptieneel valorVerdadero, tambinlotienen Qy
R. Perosi desconocemoselvalorde P,nopodemosdeducirnadaacercadeQ oR. Sinembargo,
enlosclculossobrebasesdeconocimientodinmicas, QyRpodranjustificarseellasmismas.
ObservemoslospasosqueserealizanenlosclculosdelaFigura17.5.Inicialmente, supongamos
Frmulas
Beinicial
PasosdelprocesodeclculocuandoP seconvierteenOUT:
Paso1:actualizarQ, mediantesufrmula
yelvaloranteriordeR
Paso2: actualizarR, dadoslosvalores
anterioresdePyQ
Figura17.5.
Justificacinmutua.
250 251
que P tiene el valor 1, lo que nos lleva a la BC superior de la figura. Si P pasa a ser OUT, el
clculo en la tabla sera tal como se ve, obteniendo Q y R, justificadas por s mismas, sin el sopor-
te de P. Adems, cuando una frmula tiene el valor OUT, los valores de los tomos pueden estar
indeterminados o sobredeterminados. En el primer caso, puede haber ms de una manera en que
los tomos puedan ser IN u OUT; en el segundo caso, podran haber valores no consistentes para
ellos (para ms detalles, consltese [Shoham, 1994, Cap. 5]).
Algunas aplicaciones de los SMV obligan a que sea inconsistente para todos los miembros de
un subconjunto de los tomos ser de tipo IN y tener el valor 1. Estos subconjuntos se denominan
nogoods. Un sistema de mantenimiento de la consistencia (SMC) impone estas restricciones
haciendo que algunos IN se conviertan en OUT. Como la consistencia a menudo se puede man-
tener de diversas maneras, los SMC son no determinsticos.
Continuando con nuestro uso de las tablas, para enmarcar nuestra exposicin sobre las
bases de conocimiento dinmicas hay aplicaciones en las que las tablas se utilizan ms bien con
retropropagacin que con propagacin hacia delante. Es decir, en vez de comenzar con ciertas
premisas y utilizar las frmulas para actualizar los valores de todas las celdas, se comienza con
las celdas de una frmula en concreto, y nos preguntamos por los valores de las premisas, que,
junto a otras frmulas denominadas teora de base, harn Verdadera la frmula en dicha celda. En
estas aplicaciones, los valores de las celdas se toman como frmulas expresadas en la FND, com-
puestas por los tomos premisa. Estas frmulas se denominan etiquetas de las celdas. Las bases
de conocimiento que tienen enlazadas estas etiquetas a los tomos se denominan sistemas de
mantenimiento de la verdad basados en asuncin (SMVA). La etiqueta de cada tomo est
compuesta por varios conjuntos de valores de premisas (asunciones), que, junto a la teora base,
hacen que el tomo tenga el valor Verdadero.
Consideremos, por ejemplo, la tabla superior de la Figura 17.6. Representamos las frmulas
mediante las premisas y obtenemos la tabla inferior, que define las etiquetas del SMVA. Por lo
general, se utiliza la notacin de conjuntos en estas etiquetas. Una conjuncin de tomos se repre-
senta mediante un conjunto, y una disyuncin de conjunciones se representa mediante una lista
con conjuntos mltiples. En la Figura 17.6, por ejemplo, para obtener el valor Verdadero de U, P
debe ser Verdadera (haciendo que V sea Verdadera), o R y Qdeben ser Verdaderas (haciendo que
W sea Verdadera). En el etiquetado mnimo de U no necesitamos incluir el conjunto {p, Q}
(que hace a S Verdadera), ya que la ocurrencia de P en el etiquetado subsume a {p, Q}.
PreIIsas
Reglas
P R OSyUWYV 1 lo 1 1 op,So,v 1:'01 1
Teora base: P ::::> V
Etiquetas del SMVA
P Q R S W U
P Q R {P,Q} {R,Q} {P}
{R,Q}
Figura 17.6.
Transformacin de un SMV a un SMVA.
Sistemas basados en conociIIento
Los SMVA se pueden utilizar para una gran variedad de aplicaciones. Una es el diagnstico.
Por ejemplo, las frmulas de la Figura 17.6 podran modelar el funcionamiento de algn equipo
electrnico. Si observamos que algn componente del equipo, representado por U, no funciona (es
decir, U tiene el valor Falso), podemos utilizar el SMVA para determinar qu P y R /\ Qdeberan
tener el valor Falso, porque de otra manera, U tendra el valor Verdadero. De este modo, podemos
establecer que uno de los componentes, cuyo funcionamiento estara representado por R y Q, res-
pectivamente, debe estar fallando, y que el componente que est representado por P, tambin
debe estar fallando.
Algunas veces, los SMVA tienen caractersticas o restricciones adicionales. Algunas premi-
sas se toman como si siempre tuvieran el valor Verdadero, y, de esta manera, se sacan de las eti-
quetas (es decir, estas premisas forman parte de la teora base). Tambin se podran modificar las
etiquetas por alguna asuncin con la que algn subconjunto de las premisas se contradijera, y, de
este modo, no todas podran tener el valor Verdadero. Para ms detalles acerca de los SMV, los
SMVAy sus aplicaciones, consltese [de Kleer, 1986a; de Kleer, 1986b; de Kleer, 1986c, y For-
bus y de Kleer, 1993].
Sistemas expertos basados en reglas
Una de las aplicaciones de las tcnicas de razonamiento con hechos y reglas en lA con ms xi-
to ha sido la construccin de sistemas expertos que incorporan conocimiento sobre mbitos
especficos del conocimiento humano, tales como la medicina, la ingeniera o los negocios.
Una revisin de muchos sistemas expertos en uso (hacia 1988) se da en [Feigenbaum; McCor-
duck, y Nii, 1988]. Tambin est escrito, un libro de texto que trata de los sistemas expertos en la
ingeniera [Dym y Levitt, 1991]. Estrictamente hablando, cualquier programa que trabaja como
un experto se puede denominar sistema experto. La siguiente definicin se da en [Feigenbaum;
McCorduck, y Nii, 1988].
Los programas de lA que consiguen una capacidad a nivel de experto en la resolucin de pro-
blemas mediante la reproduccin de un cuerpo de conocimiento se denominan sistemas
basados en conocimiento, o sistemas expertos. A menudo, el trmino sistema experto se reser-
va para los programas cuya base de conocimiento contiene el conocimiento de expertos
humanos, para diferenciarlos de los que adquieren el conocimiento de los libros de texto o de
los no expertos. Ms a menudo de lo habitual, los trminos sistema experto y sistema basado
en conocimiento se utilizan de forma sinnima.
En nuestro tratamiento, nos centraremos principalmente en los sistemas basados en reglas.
La estructura bsica de un sistema experto, en el contexto de su uso, se muestra en la Figu-
ra 17.7 (adaptada de [Feigembaum; McCorduck, y Nii, 1988]). Los principales componentes del
sistema son la base de conocimiento y el motor de inferencia. En los trminos de los sistemas de
razonamiento expuestos hasta aqu, la base de conocimiento est compuesta por hechos y reglas
del clculo de predicados acerca del mbito de aplicacin (aunque tambin podra componerse de
conocimiento representado por alguna variante sintctica del clculo de predicados. En el pr-
ximo captulo veremos un ejemplo de este tipo). El motor de inferencia se compone de todos los
procesos que manipulan la base de conocimiento para deducir la informacin pedida por el
usuario; por ejemplo, resolucin, encadenamiento hacia atrs o hacia delante (en algunos casos,
la base de conocimiento y los mecanismos de inferencia pueden estar estrechamente relacionados,
como es el caso de los SMV). La interfaz con el usuario podra basarse en algn tipo de sistema
de procesamiento del lenguaje natural, que permita al usuario interactuar con el sistema con algn
252
253
Experto
Subsistema
de adquisicin
del conocimiento
Base de conocimiento
Hechos, heurstica
Usuario
Ingeniero de conocimiento
Figura 17.7.
Estructura genrica de un sistema experto.
tipo de lenguaje natural acotado (limitado, en vocabulario y sintcticamente), vase Captulo 24.
Las interfaces grficas con mens tambin se utilizan. El subsistema de explicacin analiza la
estructura del razonamiento realizado por el sistema y da una explicacin al usuario (ms adelante
veremos un sencllo ejemplo).
Estos cuatro componentes del sistema son las partes que lo constituyen tal y como se utilizara
en una aplicacin. En la construccin de un sistema experto, el ingeniero de conocimiento (por
lo general, algn cientfico de ciencia de la computacin con dominio en lA) trabaja con un exper-
to (o expertos) sobre el mbito de aplicacin para representar el conocimiento relevante del
experto en alguna forma que pueda ser insertado en la base de conocimiento. Este proceso, a
menudo, se soporta en algn subsistema de adquisicin de conocimiento que, adems de otras
cosas, busca las posibles inconsistencias o informacin incompleta de la base de conocimiento
que se est construyendo, para, posteriormente, ser presentadas al experto para su resolucin.
Por lo general, el proceso de construccin del sistema se repite a lo largo de diversos ciclos.
En cada ciclo, un sistema prototipo se evala por el ingeniero de conocimiento y el experto, para
ver si el sistema realiza el mismo tipo de inferencias que el experto realizara sobre los problemas
tipo que podrian ser planteados por un usuario. Si el sistema responde de forma diferente a como
lo hara el experto, se utiliza el subsistema de explicacin para ayudar al equipo de desarrollo a
decidir qu informacin e inferencias son las causantes de la discrepancia. Puede pasar que el
experto necesite articular cierto tipo de informacin en mayor detalle o dar informacin adicional
para resolver el caso concreto. Este proceso se repite hasta que el equipo de desarrollo se con-
vence de que el sistema trabaja de forma adecuada. El proceso de construccin de sistemas exper-
tos es un proceso que requiere experiencia y juicio. Se han escrito diversos libros sobre el tema;
[Stefik, 1995] es un libro excelente. Nosotros slo intentaremos dar algunas de las ideas funda-
mentales.
Sistemas basados en conocimiento
Los sistemas basados en reglas a menudo estn basados en razonamiento con clusulas de
Rom del clculo proposicional (con algn mecanismo adicional para el tratamiento con incerti-
dumbre). La base de conocimiento se compone de reglas obtenidas de los expertos. Estos siste-
mas han sido aplicados en muchos mbitos. Uno podra imaginar, por ejemplo, un asesor de pres-
tamos de un banco utilizando este tipo de sistemas para ayudarle a decidir si conceder o no un
crdito personal a algn cliente. Un sistema real de aprobacin de crditos tendra que tener en
cuenta muchos factores, muchos ms de los que nos gustarla considerar en un ejemplo pedag-
gico. Pero podemos dar una idea aproximada de cmo este tipo de sistema podra trabajar
mediante la descripcin de alguna versin bastante simplificada. Supongamos que los siguientes
tomos estn pensados para denotar las proposiciones asociadas:
APROBAR (el crdito se aprobara).
GARANTIA (la garanta del crdito es satisfactoria).
PAGOS (el cliente puede pagar los pagos del crdito).
REPUTACION (la reputacin financiera del cliente es buena).
TASACION (la tasacion de la garanta es mayor que el crdito pedido).
VALORACION (el cliente tiene buena valoracin sobre sus cuentas).
ENTRADAS (las entradas del cliente superan sus gastos).
BALANCE (la cuenta del cliente tiene un balance positivo).
Entonces, las siguientes reglas se podrian utilizar para tomar una decisin:
1. GARANTIA A PAGOS A REPUTACION:::J APROBAR
2. TASACION:::J GARANTIA
3. VALORACION:::J REPUTACION
4. ENTRADAS:::J PAGOS
5. BALANCE A REPUTACION :::J APROBAR
Supongamos que el asesor de crditos quiere averiguar si APROBAR sera cierto o no para un
cliente en concreto. Para demostrar APROBAR, el motor de inferencia realiza una bsqueda
sobre un rbol de demostracin Y/O, utilizando el encadenamiento bien hacia atrs, o hacia delan-
te (o ambos). El rbol de prueba Y/O (si existe alguno) tendr el nodo APROBAR como nodo raz,
y los hechos (definidos como ciertos, bien por el usuario o bien listados por alguna base de datos)
como nodos hojas. La raz y las hojas estarn conectadas (por lo general, con nodos intermedios)
mediante las reglas.
En la Figura 17.8, se muestra el rbol de bsqueda de una demostracin de APROBAR uti-
lizando las reglas anteriores con encadenamiento regresivo. El objetivo del usuario, que es
averiguar si APROBAR es cierto o no, se puede hacer probando BALANCE y REPUTACION, o
probando TASACION, PAGOS Y REPUTACION. Estos dos caminos alternativos de la demos-
tracin de APROBAR se representan mediante los dos nodos APROBAR debajo del nodo raz.
Recordemos que estos nodos se denominan nodos O en un rbol Y/O. Un nodo de un rbol Y/O
que tiene hijos de tipo O, puede ser demostrado probando cualquiera de los hijos. Al aplicar las
otras reglas, se obtiene el conjunto de nodos que se muestra. Asumamos que, para los objetivos
del ejemplo, la verdad (o falsedad) de BALANCE, VALORACION, TASACION Y ENTRADAS se
puede obtener mediante la bsqueda en una base de datos, o que el sistema de razonamiento pide
directamente dicha informacin al usuario. Por otro lado, APROBAR, PAGOS, GARANTIA Y
REPUTACIN denotan los conceptos que sop. tiles para los propsitos del razonamiento,
pero aquellos sobre los que ni el usuario, ni una base de datos tienen informacin explcita (si
el usuario realmente tuviera el conocimiento sobre estos conceptos, no necesitarla el sistema
254
255
Figura17.8.
Unrboldebsquedaparaunademostracin.
experto!).Enlossistemasexpertosreales,puedenhabermuchasreglasquesedebenutilizarpara
enlazarlosnodosintermediosconlosnodoshoja.
Laspeticionesdelsistemaalusuario,oaunabasededatossepuedencombinarconunabs-
quedade la demostracin, si lademostracin se realiza conelprimeroenprofundidad. Si por
ejemplo,al iniciodel procesodebsqueda, seencuentraqueelnodoBALANCE no escierto, la
bsquedacontinuaraporlaregla LProcediendoconlasreglas 1,2,3Y4,el procesodebsque-
dafinalmente generaralaspeticionesparaaveriguarlos valoresdeTASACION, ENTRADAS y
VALORACION. Sisepuedeestablecerelvalorverdaderoparaestosnodos(deunabasededatoso
delusuario),entoncesobtenemosunademostracindeAPROBAR. Desdeluego,enlasaplicacio-
nesreales,elrboldedemostracinseintentaconstruirtantoenprofundidadcomoenamplitud.
Lossistemas de consulta intentanrespondera laspeticionesdeun usuario mediantecues-
tiones (alusuariooaunabasededatos) sobrelaverdaddelasproposicionesquestospodran
conocer.Seutilizaelencadenamientoregresivoporlasreglasparaobtenerdichascuestiones.Si
unusuario ofreceinformacin,sepodrautilizarelencadenamientoprogresivo,realizadode
forma ascendente, en un intento deconectar dicha informacin al rbol de demostracin ya
generado.
Podemosutilizarestemismoejemploparadescribircmosepuedeexplicarelrazonamien-
todelsistemaalusuario.Lahabilidaddedarexplicacionesdeunaconclusinesmuyimportan-
teparalaaceptacindelasesoramientodel sistemaexperto. Seutilizaelrbol depruebapara
guiarelprocesodegeneracindelaexplicacin.RefirindonosotravezalejemplodelaFigu-
ra 17.8,esfcil vercmosepodrangenerarlasrespuestasdel sistemaenelsiguientedilogo
(cadatomodelsistemaderazonamientotendraasociadaalgunafraseapropiada):
Usuario:porqucreesqueel creditoseriaaprobado?
Sistema:porquela garantiadel creditoes satisfactoria,el clientepuederealizarlos
pagosytiene buena reputacionfinanciera.
Usuario:porqucreesqueel clientetieneunabuena reputacionfinanciera?
Sistema:porqueelserviciodevaloracindecuentashadichoqueel clientetieneunabue-
na reputacionfinanciera.
Usuario: porqumehaspreguntadosilasentradasdelclientesuperansus gastos?
Sistema:porqueestabaintentandoaveriguarsi el cliente puederealizarsuspagos.
Usuario:porquestabasintentandoaveriguarsi el clientepuederealizarsuspagos?
Sistema:porqueesunodeloscriteriosparaestablecersiseapruebaonoelcredito.
Usuario: porquestsintentandoestablecersise apruebaonoelcredito?
Sistema:porquetmelohaspreguntado.
Enmuchasaplicaciones,elsistemaslotieneaccesoareglasconincertidumbre,yel usuario
tampocoescapazderesponderconcertidumbrealaspreguntas.Porejemplo,lasiguienteregla,
codificadadeformaconvenienteenalgunaformaentendibleporel sistema,seutilizenel sis-
temaMYCIN [Shortliffe, 1976]paraladiagnosisdeinfeccionesbacterianas:
Regla300
Si 1) La infeccionque requiere terapiaes lameningitis, y 2) el
pacientenomuestrasintomasseriosdeinfeccionde , o de i
dodebi!, y 3) los smos nosehanidentificadoenlasmanchas
delcultivo,y 4) eltipodeinfeccionesbacteriana
Entonces: Hayevidenciadequeelorganismo (otroa losvistosenlas
manchaso enlafrotis) quepodraestarcausandolainfeccionseael
staphylococcus-coag-pos (.75); streptococcus-grupo-a (.5).
Deformasimilar,lasiguientereglaseutilizenelsistemaPROSPECTOR [Duda;Gaschnig,
yHart, 1979,yVampbell,et al., 1982]paraelanlisisdeyacimientosmineros:
Si un fallodel sistemadel cienporciende tipopreintruso,
entonceshay (5, 0.7) dequeseaunentornofavorableparayacimien-
todecobreporf ido.
Losnmeros (.75 y .5 enel MYCIN; yel5 y el0.7 enel PROSPECTOR) sonformas de
representarlacertidumbreocertezadeunaregla. Seutilizanparacalcularlacertidumbredelas
conclusiones. OtrastcnicassemejantesalasutilizadasenelMYCINyelPROSPECTORsehan
aplicadoconbuenosresultados. EnelCaptulo 19 introduciremos tcnicasbienestablecidasy
ms sofisticadasparatratarconinformacininicerta.
Aprendizaje de reglas
Dadalaimportanciadelossistemasbasadosenreglas,yelesfuerzohumanoquesenecesitapara
obtenerlasreglasdelosexpertos,esnaturalpreguntarnossobresilasreglasdeunsistemaexper-
tosepuedeno no aprender. Haydos grandes tipos de aprendizaje, el inductivo y eldeductivo.
Ambossepuedenutilizarparaaprenderlasreglas.Porejemplo,elaprendizajemedianteredesneu-
ronalesesdetipoinductivo,porquelasfuncionesqueseaprendensonhiptesisacercadealguna
funcindesconocidaqueestsubyacenteenlosdatos.Sielaprendizajetienexito,lashiptesis,
porlohabitual,suelendarsalidascorrectasapartirdelasentradas,perotambinpodranequivo-
carse.Losmtodosinductivosdeaprendizajedereglascreanreglasnuevasacercadeundominio,
quenoesderivableapartirdelasreglasyaexistentes.Enesteapartadovamosapresentarmtodos
inductivosdeaprendizajedereglasenelclculoproposicionalyeneldepredicados.
-----
256
Elaprendizajedeductivodereglasaumentalaeficienciadeunsistemamedianteladeduccin
dereglasadicionalesapartirdelasreglasyloshechosdeundominio,conocidospreviamente.
Lasconclusionesqueel sistemapuedederivaral utilizarlasnuevas reglas tambin se podran
derivarsinellas;sinembargo,conestasreglasadicionales,elsistemapuederealizarlasderiva-
ciones de forma ms eficiente. En este apartado explicaremos una tcnica de generacin de
reglasadicionalesdenominadageneralizacin basada en explicaciones (GBE).
17.5.1. Aprendizaje de reglas del clculo proposicional
Se han propuesto una gran variedad de mtodos inductivos de aprendizaje de reglas, de los
cualesvamosadescribirunodeellos 2. Primerodescribiremoslaideabsicaaplicadaalalgica
proposicionalconclusulasdeHorn,ydespusmostraremoscmosepuedeutilizarunatcnica
similarenlalgicadepredicados,paraaprenderreglasenformadeclusulasdeHorn.
Paraenmarcarnuestraexposicinutilizaremos,unavezms,elejemplodeaprobaruncrdito
bancario.Supongamosqueenvezdedisponerdeunconjuntodereglasparaesteproblema,dis-
ponemosdeunconjuntodedatos deentrenamiento,consistenteenlos valoresdelosdistintos
atributosparaungrannmerodecasos.ConsideremoslosdatosquesemuestranenlaTabla17.1
(utilizaremosellparaVerdadero, yelOparaFalso) 3. Estatablasepodahabergeneradoapar-
tirdediferentesregistrosdepeticionesdecrditos,juntoalasdecisionesquesetomaronporel
asesordecrditos.LoscasosdelconjuntodeentrenamientoenlosqueelvalordeAPROBARes
1, soncalificadoscomoinstancias (ocasos)positivas; y los queel valores Ocomoinstancias
negativas. Apartirdeesteconjuntodedatosdeaprendizaje,deseamosinducirreglasdeltipo:
Cl
I
A Cl
2
A Cl ::::> APROBAR
n
dondecadaCli esuntomoproposicionalpertenecientealconjunto{TASACION,VALORACION,
ENTRADAS, BALANCE}. Sielantecedentede unareglatieneel valorVerdadero paraunains-
tancia del conjunto de entrenamiento, decimos que la regla cubre dicha instancia. Podemos
cambiarcualquierregla yaexistentehaciendoquecubraun menornmerodeinstancias aa-
TASACION VALORACION ENTRADAS BALANCE
1 O O 1
O O 1 O
1 1 O 1
O 1 1 1
O 1 1 O
1 1 1 O
1 1 1 1
1 O 1 O
1 1 O O
dindoleun tomo asuantecedente. Dichocambiohacequelareglaseamsespecfica. Dos
reglaspuedencubrirmsinstanciasquelasquepuedecubrirunasola.Aadirunareglahaceque
elsistemaqueutilizalasreglasseamsgeneral. Loquebuscaremoseselconjuntodereglasque
cubratodas,yslo,lasinstanciaspositivasdelconjuntodeentrenamiento.
Labsquedadelconjuntodereglaspuedesercomputacionalmentemuycostosa.Describi-
remos un mtodo voraz al que denominaremos divide y vencers 4. Primero, intentamos
encontrarunareglasimplequecubrasloinstanciaspositivas,aunquenocubratodasellas.Rea-
lizamoslabsquedadedichareglacomenzandoconunareglaquecubratodaslasinstancias(las
positivasylasnegativas)y, pocoapoco,lavamoshaciendomsespecficaaadiendoletomos
asu antecedente. Despus,comounasolareglapodanocubrirtodaslasinstanciaspositivas,
vamos aadiendo nuevas reglas (hacindolas tan especficas como se requiera) hasta que el
conjuntodereglascubretodas,yslo,lasinstanciaspositivas.
Asescomoelmtodotrabajaaconnuestroejemplo.Comenzamosconlareglainicial:
T::::>APROBAR
quecubretodaslasinstancias.Ahora,debemosaadiruntomoparahacerquelareglacubraun
nmeromenordeinstanciasnegativas,avanzandodemaneraquesevayancubriendosloins-
tancias positivas. Qu tomo de {TASACION, VALORACION, ENTRADAS, BALANCE} se
aadia? Sehanutilizado diversoscriterios para hacerdicha seleccin, pero para simplificar
nuestroejemploutilizaremosunratiodeclculosencil10sobreelquebasaremosnuestradecisin:
rO. = n ~ / n o
dondenO. eselnmerototaldeinstancias(positivasynegativas)cubiertasporel(nuevo)ante-
cedentede]aregla,trasaadirel tomoCl, yn ~ eselnmerototaldeinstanciaspositivascubier-
tasporel (nuevo)antecedentedelaregla,trasaadireltomoCl.
Seleccionaremoseltomoqueobtengael'valormsgrandederO., Ennuestrocaso,losvalo-
ressern:
rTASACION =3/6=0,5
'VA,QRACION =4/6= 0,667
r ENTRADAS =3/6=0,5
rBALANCE = 3/4=0,75
Apartirdelocual,seleccionaremoseltomoBALANCE,obteniendolanuevaregla:
BALANCE::::>APROBAR
Estareglacubrelasinstanciaspositivas3,4Y7, perotambincubrelainstancianegativa 1,
porlo que latenemos que especializarms. Utilizamos la misma tcnica para seleccionar el
siguientetomo. Paracalcularlosnuevos ratios, debemos tenerencuentaelhechodeque ya
hemosdecididoqueelprimercomponentedelantecedenteesBALANCE:
rTASACrON = 2/3=0,667
rVALORACION =3/3 1,0
'""",,,, nA 2/2=1,0
4 Estemtodofueinventadoy desarrolladoenunconjuntodeprogrd11las basadosenelalgoritmoAQde[Michal-
ski, 1969J.
Caso
1
2
3
4
5
6
7
8
9
APROBAR
O
O
1
1
O
1
1
O
O
Tabla17.1.
Datosdecrditos.
2 Lasreglastambinsepodranextraerapartirderbolesdedecisin(vase[Quinlan, 1993,Cap.5J)oderedes
neuronales(vase[Towelly Shavlik, 1992,y Towell;Shavlik,y Noordweier, 1990]).
3 Enaplicacionesreales,seguroquenecesitaramosmuchosmsdatosdelosquesemuestranenlatabla.
258
AhoratenemosunempateentreVALORAClONyENTRADAS. PodramosseleccionarVALO-
RAClON yaque abarca un nmero mayorde instancias (el lector podraaveriguar las conse-
cuenciasdeseleccionareltomoENTRADAS).
LareglaBALANCE1\ VALORAClON:::>APROBARslocubreinstanciaspositivas,porloque
nonecesitamosaadirmstomosalantecedentedeestaregla.Peroestareglanocubretodaslas
instanciaspositivas.Enconcreto,no secubrelainstanciapositiva6. Portanto,deberemosaadir
algunaotraregla.
Paraaprenderlasiguienteregla,primeroeliminamosdelatablatodaslasinstanciaspositivas
queyahansidocubiertasporlaprimeraregla,obteniendolosdatosdelaTabla17.2.Volvemosa
comenzarel mismoprocesodesdeel principioconelconjuntodedatosreducido, comenzando
otravezconlareglaT :::> APROBAR. Estareglacubrealgunasinstanciasnegativas,asaber,la1,
la2, la5,la8yla9. Paraseleccionarelnuevotomoqueaadiremosalantecedentecalculamos:
rTASACION 1/4=0,25
0/3=0,0
rENTRADAS =1/4 0,25
r BALANCE =0/1 =
Otraveztenemosempate.SupongamosqueseleccionamosarbitrariamenteeltomoTASA-
ClON para obtener la nueva regla TASAClON :::> APROBAR. Esta regla cubre las instancias
negativas 1,8y 9, porloquedeberemos aadirotro nuevotomo al antecedente. Los nuevos
ratiossern:
rVALORACION = 1/2 0,5
rENTRADA =1/2=0,5
=0/1=0,0
Seleccionamosel tomoVALORACION, obteniendolanuevaregla TASACION1\ VALO-
RAClON:::>APROBAR.Estanuevareglacubrelainstancianegativa9. Yhacindolatodavams
especfica(conelmtodoyaconocido),obtenemosalfinallareglaTASACION1\ VALORACION
1\ENTRADAS:::> APROBAR. Estasdosreglas,asaber,BALANCE1\VALORAClON:::>APROBAR
yTASAClON1\VALORAClON1\ENTRADAS:::>APROBAR,cubrentodaslasinstanciaspositivas,
porloqueyahabramosterminadoelprocesodeaprendizaje.
Comoesteproceso paraencontrarlas reglas empleabaunabsqueda voraz, no sera sor-
prendenteelhechodequelasreglasaprendidaspudieransimplificarsealgunasveces.Paracada
reglapodramosaveriguarsistapodradescartarsesingenerarcambiossobrelasdecisionesdel
restodereglasobtenidasapartirdelconjuntodeentranamiento. Sinohayefectos(o sihayuna
pequeaprdidadeprecisincuandolosdatosmuestranruido),lareglasepodraeliminar.De
Caso TASACION VALORACION ENTRADAS BALANCE APROBAR
1 1 O O 1 O
2 O O 1 O O
5 O 1 1 O O
6 1 1 1 O 1
8 1 O 1 O O
9 1 1 O O O
Tabla17.2.
Losdatosreducidos.
formasimilar, podramosaveriguarporcadatomodeunareglasi ste sepodraeliminarcon
efectosmnimos.Enefecto,silosdatosmuestranruido,podramosdesearmodificarelcriteriode
cubrir todas, y slo, las instancias positivas. En su lugar, podramos permitir que cada regla
cubrieraprincipalmenteinstanciaspositivas,permitiendo(talcomodebemoshacercondatos
conruido)acadareglacubrirunpequeonmerodeinstanciasnegativas.Tambinnospodra-
mospermitirqueelconjuntodereglas aprendidasnocubrieraunpequeo subconjuntodeins-
tancias positivas. Estasoperacionesde podaydeaumentodelatoleranciaalruidonos ayu-
daranaminimizarelriesgodesobreajuste.
Podemosformularsucintamenteesteprocesodeaprendizajedereglasenpseudocdigo. Lo
llamaremosalgoritmo genrico divide y vencers (AGDV).Loscomponentesson:
S eselconjuntodeentrenamientooriginal,compuestoporinstanciasdecaractersticascon
valoresbinarios,etiquetadasconelvalordeuntomoy.
n eselconjuntodereglasquesedeseaaprender.
pesunadelasreglas,tienecomoconsecuentey, ycomoantecedenter(unaconjuncin
detomos).
a esuntomoobtenidodeunadelascaractersticasdeS.
GSCA
1. E(l(.t f- S.
2. n conjuntovacodereglas (0).
3. repetir.Elbucleexterno aade reglas hastaque n cubretodas (o muchasde) las ins-
tanciaspositivas.
4. r ~ T
5. p r:::>y.
6. repetir.Elbucleinternoaadetomosarhastaquecubreslo(oprincipalmente)ins-
tanciaspositivas.
7. Seleccionauntomoa paraaadirar. Seutilizaunaseleccin nodeterminsticaque
puedeutilizarsecomopuntoderetroceso.
8. r ~ r I\a.
9. hastaquepcubreslo(oprincipalmente)instanciaspositivasdeSact
10. n n, p.Aadimosunareglanuevaalconjuntodereglas.
11. Sact ~ SacI - (lasinstanciaspositivasdeSact cubiertasporn).
12. hastaquen cubretodas(omuchasde)lasinstanciaspositivasdeS.
Enel ejemplo de crditosbancarios, las reglas aprendidas son consistentes con las reglas
dadasinicialmenteporelexperto enelproblema. Sinembargo, conunconjuntodeentrena-
miento tan pequeoes posibleaprenderreglas idiosincrsicasque podranno coincidircon la
intuicindelexpertoacercadelproblema(porejemplo,sihubieramostenidodiferentesempates,
habramosaprendidodiferentesreglas). La comparacinentrelasreglasaprendidasylasdadas
porelexpertonosrevelaquelasreglasaprendidasnohacenmencinningunaalospredicadosno
medidosonocuestinadosporelexperto(asaber,GARANTIA, PAGOSoREPUTAClON);ystos
noquedanrepresentadosenlosdatos.Lospredicadosintermediossimplificanlarepresentacin
delconocimientoyelrazonamientomediantelaencapsulacindelospredicadosmsprimitivos
quese presentan,porlogeneral, agrupados. El aprendizajedeestospredicadosintermediosesun
problema de investigacin importante. Se han realizado algunos trabajos preliminares en el
temadeinvencindepredicados (vase,porejemplo[MuggletonyBuntine, 1988]).Elapren-
dizajedereglas,amenudo, sepuedeutilizarparaacelerarelprocesodeconstruccindesistemas
expertos,aunsinlaproduccindereglasquerequieranpredicadosintermedios.
260
261
17.5.2. Aprendizajedereglasenlgicadepredicados
Latcnicadeaprendizajequeacabamosdedescribirproducereglas delclculoproposicional.
Aunque muchos sistemas expertos estn basados en la lgica proposicional, se obtiene una
mayorversatilidadconel usode variablescuantificadasuniversalmente. El subcampodepro-
gramacin lgica inductiva (PU)seconcentraenmtodosdeaprendizajeinductivodeclusulas
deHornenCPPO (y, deestemodo, deprogramasenPROLOG). Sehandesarrolladodiversos
mtodosdeaprendizajedeclusulasdeHorn,algunosconciertasrestriccionessobreeltipode
clusulasdeHornquesepuedengenerar. Untratamientocompletosobreestetemaestarams
alldelalcancedeestelibro,peropodemosesbozarbrevementeunatcnicarepresentativadePU
utilizandoelenfoquedivideyvencers.El mtodoquevamosadescribirestbasadoenelsis-
temaFOIL[Quinlan, 1990](consltese[LavracyDieroski,1994]parauntratamientocompleto
y comprensible sobreeltema. [Muggleton, 1992] es una coleccin de artculos sobre PU,y
[MuggletonyDeRaedt, 1994]esunareferenciaestndar).
ParaajustarnuestraexposicinalaliteraturasobrePUutilizaremosunanotacinmscer-
canaa PROLOG,aunqueparaserconsistentesconnuestros conveniossobreCPPO, continua-
remosutiJizandoeltextoenmaysculasparalasconstantes,yenminsculasparalossmbolosde
variable.EnlaPU,nuestroobjetivoesaprenderunprogramalt,queestcompuestoporclu-
sulasdeHornp,siendocadaunadelaformap :- al'...,02,dondecadaal esunafrmulaat-
micaqueseunificaconloshechosatmicosbase.LaideaesqueltseevaluarcomoVerdadero
cuandosus variablesseliguena algnconjuntodevalores quesesabeestenlarelacin que
estamosintentandoaprender,osea,lasinstanciaspositivas2+ delconjuntodeentrenamiento.El
programaseevaluarcomoFalso cuandosusvariablesestnligadasaunconjuntodevaloresque
sesabequenoestenlarelacin;esdecir, lasinstanciasnegativas2-.Aligualqueenelapren-
dizajedereglasenlgicaproposicional,queremosquesecubranlasinstanciaspositivasynolas
negativas.Loshechosatmicosbaseconlosquea sedebeunificarsedicequeformanelcono-
cimiento de base. Asuminosquestosnossondados,biencomoprogramasauxiliaresenPRO-
LOG,quepuedenejecutarseyevaluarse,obienexplcitamenteenformadeunalistadehechos.
Comoejemplo,supongamosqueunrobotrepartidorquenavegaporunedificioencuentra,a
partirdesuexperiencia,queesfcilnavegarentreciertosparesdelocalizaciones,yquenoestan
fcil navegarentreotrospares.EnlaFigura17.9semuestraunmapaparcialdeunedificio.En
esteedificio,laslocalizacionesA, B Yesondistribuidores,ytodaslasrestantessontiendas.
Figura17.9.
Mapadeunapartedeunedificio.
Supongamosqueelrobotharecopiladounconjuntodeentrenamientodeparesdelocaliza-
ciones,2,cadaparetiquetadoconsiesfcilononavegarentreel pardelocalizaciones.Presu-
mimosqueelrobottienealgunainformacinacercadelascaractersticasdeestaslocalizaciones,
yacercadelasrelacionesentreestaslocalizaciones.Especficamente,paracadalocalizacin,se
sabesi esonoundistribuidor,yparacadapardelocalizaciones,siunodelosdosmiembrosdel
paresonounatiendaconectadaaundistribuidor.Estasrelacionessedenotanporlasexpresio-
nes delaforma Distribuidor(x)y Tienda(x,y). Loquequeremoses aprenderunpro-
grama, Faci1(x,y),quecubralasinstanciaspositivasde2,y nolasnegativas. Facil(x,y)
puedeutilizarlassubexpresionesdebaseDistribuidor(x)yTienda(x,y).
Concretandoconnuestroejemplo,supongamosqueelconjuntodeentrenamientoestcom-
puestoporlassiguientesinstanciaspositivasdeFaci 1(2+):
{<A, 8>,<A, C>,<B, C>, <B, A>, <e, A>, <e, B>,
<A, Al>,<A, A2>, <Al,A>, <A2, A>, , <B, B2>,
<BI,B>, <B2, 8>,<e, el>,<e, C2>,<el,C>,<C2,C>}
ylassiguientesinstanciasnegativasdeFaci 1(2-):
{<A,BI>,<A,B2>,<A, el>,<A, e2>,<B,el>,<B,C2>,
<B, Al>, <B, A2>, <c,Al>,<e, A2>, <eBl>, <e, B2>,
<Bl,A>, <B2, A>, <el,A>, <C2,A>, <el,8>,<e2, 8>,
<Al,B>,<A2,B>,<AI,C>,<A2,C>,<BI,C>,<B2,C>}
AsumimosqueelrobotpuedeevaluarDistribuidor(x)yTienda(x,y)concualquier
sustitucindelasvariables.Enconcreto,paratodaslaslocalizacionesquesenombranen2,slo
lassiguientesdanelvalorVerdadero aDistribuidor:
{A,B, e}
Lasrestanteslocalizacionesen21edanelvalorFalso.
Paratodaslaslocalizacionesquesenombranen slolossiguientespares(ordenados)le
danelvalorVerdadero aTienda:
{<Al,A>, <A2, A>, <BI,B>, <B2, B>, <el,C>,<e2, C>}
Losrestantesparesen2 ledanelvalorFalso.
El siguiente programa en PROLOG cubre todas las instancias positivas del conjunto de
entrenamientoydescartalasnegativas:
Faci1(x, y) Distribuidor(x) ,Distribuidor
:- Tienda(x, y)
Tienda(y x) I
Comoen otros problemas de aprendizaje, queremosqueel programa inducidogeneralice
correctamente;esdecir,quesiseencuentraconunosargumentosquenoestabanpresentesenel
conjuntodeentrenamiento(peroparalos cualesdisponemos devaloresparalas relacionesde
base),nosgustaraqueelprogramarealizaraconjeturascorrectas(imaginemos,porejemplo,que
eledificiotieneestructurasrepetidasenotrasplantasyalasquenoestnpresentesenelconjun-
todeentrenamiento).
262 263 InteligenciaartificiaL Unanuevasntesis
ElprocesodeaprendizajequevamosaexplicaresunaversindelalgoritmoAGDV. Comen-
zamosconunprogramaconunasolareglasincuerpo,yvamosaadiendoliteralesalcuerpohas-
taque lareglacubre slo (o principalmente) instancias positivas; entonces, vamos aadiendo
reglasadicionalesconelmismomtodo,hastaqueelprogramacubretodas(omuchasde),yslo
(con pocas excepciones) instancias positivas (las estrategias de relajamiento que estn entre
parntesisse aplicancuandolosdatospresentanruido).
Suelepasarqueelnmerodeliteralesposiblesquepodramosaadiralcuerpodeunaclu-
sulaesilimitado,porloquelossistemasdePLI,enlaprctica,restringenlos1iteralesdediver-
sasmaneras.Porlogeneral,lasadicionespermitidasson:
1. Literalesutilizadosenelconocimientodebase.
2. Literalescuyosargumentossonunsubconjuntodelosdelacabezadelaclusula.
3. Literalesqueintroducenunanuevavariablediferentedelasdelacabezadelaclusula.
4. Unliteralqueigualaunavariabledelacabezadelaclusulaconotravariableoconun
trminodelconocimientodebase(estaposibilidadesequivalenteaformarunaespecia-
lizacinmedianteunasustitucin).
5. Unliteralqueeselmismo(exceptoenlosargumentos)queeldelacabezadelaclusu-
la(estaposibilidadaceptaprogramasrecursivos,queenalgunossistemasnosepermiten,
y quenotrataremosenestelibro).
Ennuestroejemplodelrobotrepartidor,losliteralesquepodramosconsiderarparaaadira
unaclusulason:
Distribuidor(x)
Distribuidor(
Distribuidor(z)
Tienda(x, y)
Tienda(y, x)
Tienda(x, z)
Tienda(z, x)
(x=y)
LossistemasdePLIquesiguenelenfoquedelqueestamoshablando(especializacindelas
clusulasmedianteadicin deunliteral)disponendemtodos bien definidos paracalcularlos
posiblesliteralesaaadiralaclusula.Elternadequliteralaadiresmscomplicado;muchos
sistemasutilizan algn mtododepuntuacinsimilaral quehemos utilizadoenelejemplode
aprendizajedereglasenlgicaproposicional.
Vamos a mostrarcmofunciona la versin LPIdelAGDV utilizandonuestroejemplodel
robotrepartidor. SabiendoqueelpredicadoFacilesunpredicadodedosargumentos,elbucle
internodenuestroalgoritmoinicializalaprimeraclusulaaFacil(x,y) :-.Estaclusulacubre
todaslasinstanciasdeentrenamiento(laspositivasylasnegativas),porloquedebemosaadirun
literalasucuerpo(vaco).Conelpropsitodeilustrarelalgoritmoydejaraparteeltemadecmo
se seleccionauna frmula atmicaparaque seaaadida, supongamos queel algoritmo aade
Distribuidor(x).LassiguientesinstanciaspositivasdeS quedancubiertaspor:
{<A,B>,<A,C>,<B,C>,<8,A>,<C,A>,<C,B>,
<A,Al>,<A,A2>,<8,Bl>,<8,B2>,<C,Cl>,<C,C2>}
Paracalcularestecubrimiento(conjuntodeinstanciascubiertas),interpretamoselprograma
lgicoFacil(x,y): Distribuidor(x)contodoslos paresdelocalizacionesdeS, utili-
zandolaslocalizacionesdadasporlarelacindebaseDistribuidorcomohechosbase.Las
siguientesinstanciasnegativastambinquedancubiertas:
{<A,Bl>,<A,B2>,<A,Cl>,<A,C2>,<C,Al>,<C,A2>,
<C,Bl>,<C,B2>,<8,Al>,<B,A2>,<8,Cl>,<8,C2>}
AS, quedebemosaadirotroliteral.SupongamosqueahoraaadimosDistribuidor(y).
LassiguientesinstanciaspositivasquedancubiertasporFaci y):- Dis
Distribuidor(y):
{<A,B>,<A,C>,<B,C>,<B,A>,<C,A>,<C,B>}
YanoquedaninstanciasnegativasdeS cubiertas,porloquefinalizamoslaprimeraiteracin
delbucleinternoconlaclusulaFacil(x,y):- Distribuidor(x),Distribuidor(y).
Peroelprograma1t, basadosloenestaclusula,nocubrelassiguientesinstanciaspositivas:
{<A,Al>,<A,A2>,<Al,A>,<A2,A>,<8,Bl>,<B, B2>,
<81,B>, <82,8>, Cl>,<C, C2>,<Cl,C>,<C2, C>}
Ahora,las instanciaspositivasqueestabancubiertasporFacil(x,y) :- Distribui-
dor(x),Distribuidor(y)seeliminandeS paragenerarS""I' queseutilizarenlaprxima
iteracindelbucleinterno. Sacl' estcompuestoportodas lasinstanciasnegativasde S mslas
instancias positivasquetodavanoestabancubiertas (las listadasanteriormente). Paraintentar
cubrirlas,elbucleinternocreaotraclusula,inicialmenteasignadaaFacil(x,y) :-.Estaclu-
sulacubretodaslasinstanciasnegativas,porloquedebemosaadirunnuevoliteral. Suponga-
mos queaadimosel literal Tienda(x,y). LaclusulaFacil(x,y):- Tienda(x,y)no
cubrelasinstanciasnegativas, asquefinalizamoslaiteracinactualdelbucleinterno.
Facil(x, y)cubrelassiguientesinstanciaspositivasdeSac,:
{<Al,A>,<A2,A>,<81,B>, <82,B>, <Cl,C>, C>}
Estasinstancias seeliminandeSac/' paralasiguienteiteracindel bucleinterno.Ahora, el
programacontienedosclusulas:
Facil(x,y): Distribuidor(x),Distribuidor(y)
Tienda(x,y)
Esteprogramatodavanoescorrecto,yaquenocubrelassiguientesinstanciaspositivas:
{<A,Al>,<A,A2>,<8,Bl>,<8,B2>,<C,Cl>,<C,C2>}
Despusdelasiguienteiteracindelbucleinterno,quedaaadidalaclusulaFacil(x,y)
x). Ahora,elprogramacubretodas,yslo,lasinstanciaspositivas,porloqueel
procesofinalizaconlaobtencinde:
Facil(x,y): Distribuidor(x),Distribuidor(y)
Tienda(x,y)
Tienda(y,x)
264
Esteprogramasepuedeaplicar(quizconunabuenageneralizacin)aotraslocalizaciones
que no se nombran en S, siempre que podamos evaluar las relaciones Distribuidor y
paraestasotraslocalizaciones.
17.5.3. Generalizacinbasadaenexplicaciones
Ahoravolvemosal aprendizajedeductivoyaunmtodoparaderivarreglasapartirdereglasy
hechosexistentes.Explicaremoselmtodomedianteunejemplodelmundodebloques.Supon-
gamosquenuestroconocimiento generalacercadeestemundocontienelassiguientesreglas:
:::> Pesado(x)
:::> -,obj eto_seJ)uede_empuj ar(x)
y entreloshechosdequedisponemosdeestemundo, tenemos:
Verde(A)
Supongamosquenospreguntamosporlademostracinde eto_seJ)uede_empu-
j Enesteejemploilustrativo, lademostracinestrivial; sinembargo,enlosproblemas
reales,podraserrealmentecomplejo.EnlaFigura17.10mostramoslarefutacinmediantereso-
lucin.
Apartirdelademostracin,podemosconstruirunaexplicacinparalaconclusinobtenida.
Unaexplicacin eselconjuntodehechosquesehanutilizadoenlademostracin.Enestecaso,
la explicacin sobre -,Obj eto_seJ)uede_empuj arCA) es Verde(A). Utilizando dicha
explicacin,podramosconstruirunanuevaregla, asaber:
Verde(A):::> -,Obje arCA)
Conocimientogeneral
..,Verde(A)
Nil
Figura17.10.
UnarefutacinmedianteresolucinutilizadaenlaGBE.
Peroestareglatendraunautilidadlimitada,porquesloseaplicaalbloqueA. Sinembargo,
nosdamoscuentadequelademostracinsepuedegeneralizar-Apodrahabersidocualquier
cosa,ylademostracintodavavaldra-oLageneralizacindelaexplicacinmediantelasus-
titucin de laconstante A porla variable x nos daVerde(x). Siguiendo la estructura de la
demostracin para eto_seJ)uede_empuj arCA), y sin ninguna bsqueda adicional,
vemos que con en lugarde Verde(A) podemos demostrar-,Obj e
de_empuj ar(x). Entonces,elresultadodel proceso,alquellamaremosgeneralizacin basadn
en explicaciones (GBE),eslaregla:
Verde(x):::> eto_seJ)uede_empuj
Estareglasepodrahaberestablecidosolamenteapartirdelasreglasgenerales,porloque,
realmente, nohemosaprendido nadanuevo. Peroel procesodeGBEnoshaguiadohaciaesta
regla,originadadenuestranecesidaddetenerlaestablecidaparauncasoespecfico.Consltese
[Minton,el al., 1989]paraunaexposicinmsafondosobreGBE.
EnlaejecucindelprocesodeGBEasumimosquelareglageneralpodrasertilparaotros
casossimilares;portanto,valelapenaderivarlayguardarla.Desdeluego,muchasreglaspodran
hacerirmsdespacioelprocesoderazonamientodebidoalcrecimientodelfactorderamificacin,
porloquelaGBEsedebeutilizarconcuidado,posiblementemedianteelalmacenamientodela
informacinacercadelautilidaddelasreglasaprendidas.Mintondefinelautilidadsobrelabase
delamediadeahorroobtenidoenel procesodebsquedagraciasalareglaaprendida,acuntose
utilizalareglaaprendidayalcostededecidirsilareglaesonoaplicable[Minton, 1988;Minton,
1990].SusistemaPRODIGY sloguardaaquellasreglasconunautilidadalta.
[LevesqueyBrachman, 1987] discuteneldilemaentrelaexpresividaddelasrepresentaciones
lgicasylatratabilidaddelosmtodosderazonamientolgicos. [Levesque, 1986]ponedemani-
fiestoquelaintratabilidaddelrazonamientosedebealapresenciadedisyuncionesynegaciones
en los lenguajes lgicos. lpropone utilizarunarepresentacin vvidaqueprescindadeestas
estructuras. Las representaciones queslo utilizan clusulasdeHorn(denominadas teoras de
Horn)sontratablessinocontienensmbolosdefuncin. Estasrestriccionessetienenencuenta
enellenguajeDATALOG, queseutilizaparaaumentarlainformacinenbasesdedatos [UlIman,
1989]. [Gogic,el al., 1995]realizacomparacionesdeexpresividad,tratabilidadyconcisinde
diversasversionesdelalgicaproposicionalydesusextensionesnomonotnicas.
[SelmanyKautz, 1991]proponenelusodeteorasaproximadasparaaceleraralgunospro-
cedimientosdeinferencia.EstasteorasdeHornsedividenenteoraconelmximolmiteinferior
(MLI)yenteoraconelmnimolmitesuperior(MLS).Si unafrmulanosesiguelgicamentede
unateoraMLS,nosesiguedelateoraoriginal. Porelotrolado, sisesiguedeunateoraMLI,
tambin se sigue de la teora original. [Kautz; Kearns, y Selman, 1993] proponen el uso de
modeloscaractersticoscomounmtodoviablepararealizarinferenciasenteorasdeHorn.
Enelsiguientecaptulo,hablaremosdelas lgicas tenninolgicas, otraformadeconseguir
latratabilidadmediantelarestriccindellenguajederepresentacin.
Comoalternativapararestringirellenguaje,podramosutilizarmtodosdeinferenciaapro-
ximados,aquellosquepuedennoserslidosni completos.Unejemplopodraserrequerirdeun
muestreoestadsticodelosmodelos[KhardonyRoth, 1998].
La primerapropuestaenutilizarla lgicadeprimerorden (y los mtodos de resolucin)
comounlenguajedeprogramacin(ysu intrprete)erade[Green, 1969a].Independientemente.
[Kowalski, 1974]elaborestaideae inspirlainvencindePROLOG.AlainColmerauerdesa-
rroll y escribi el primerintrprete de PROLOG [Roussel, 1975; Colmerauer, 1973]. Una
implementacinmuyeficienteeslade[Warren;Pereira,yPereira, 1977].Larevistamsimpor-
tantedeartculossobreestetemaesJoumal of Logic Programming.
LasestructurasdegrafosY 10 sonfundamentalesenlosmtodosderesolucindeproblemas
quedividenlosproblemasenconjuntosalternativosdesubproblemas(comoenelrazonamiento
regresivomediantereglas). [Nilsson, 1980,Cap.3] presentaelalgoritmoAO* paralabsqueda
engrafosY/O. Estealgoritmoestbasadoentrabajosanterioresde[Nilsson, 1969,yMartelliy
Montanari, 1973]. [Davis, 1980] describeelusodemetarreglasparacontrolarlabsquedaen
estructuras de rbolesY10 de los sistemas expertos basados enreglas. Consltese tambin
[Smith;Genesereth,yGinsberg, 1986,ySmith, 1989].
LadeterminacindeletiquetadomnimoenlosSMVAesunproblemaNP-completo[Selman
y Levesque, 1990], aunenloscasosenlosqueelconocimientodebaseestformado sloen
clusulasdeHom.Sinembargo, [Kautz;Keams,ySelman, 1993]muestranquelasetiquetasse
puedencalcularenuntiempopolinmico,sielclculosebasaenmodeloscaractersticos.Para
otrostrabajossobreSMV,consltese[Doyle,1979;deKleer, 1986a;deKleer, 1986b;deKleer,
1986c;ForbusydeKleer, 1993,yShoham, 1994].
Paraunarevisinsobreelprocesodeconstruccindesistemasexpertos,vase[Bobrow;Mit-
tal,yStefik, 1986]. [Stefik, 1995]esunlibrodetextoquetratademuchosaspectosdelacons-
truccindesistemasexpertos(tambincontienebastantematerialsobrelA).Esparticularmente
tillabibliografaanotadadeStefik,lacualcontienebrevesprrafosquerecopilanlosartculos
msimportantesenelrea(ApndiceA).
Paraverun ejemplodeunsistemaexpertoqueconfigurasistemasVAX-lln80,deDigital
Equipment Corporation [McDermott, 1982]. [Leonard-Barton, 1987] presenta lahistoria del
desarrolloyelusodelossistemasexpertosenDigitalEquipmentCorporation.Eltrabajoactual
sobreaplicaciones se publicaenProceedings of the Conference on Innovative Applications of
Artificial Intelligence (IAAI). Los artculos sobre sistemas expertos aparecenregularmenteen
IEEE Expert.
Paramsinformacinsobrelainvencindepredicados(conceptos),vase[KautzySelman,
1992]y [MuggletonyBuntine1988].UnejemploimpresionantedelaaplicacindelaPLIesla
prediccindeestructurassecundariasdeproteinasqueserealizaporel sistemaGOLEM [Mug-
gleton; King, y Sternberg, 1992]. Las Proceedings of the InternationalInductive Logic Pro-
gramming Workshops contienenlosartculosmsactualessobreeltema.
LasProceedings of the International Conferences on Knowledge Representation and Rea-
soning (KRR)contienen losartculosquedescribenlas ltimas investigaciones. [Brachmany
Levesque, 1985]esunacoleccindeartculos importantessobrelarepresentacindelconoci-
miento.
17.1. LassiguientespreguntasestnrelacionadasconPROLOG:
1. ExpliqueporquunintrpretedePROLOG quecorraunprogramaenPROLOG nose
puedeutilizarparademostrarlanegacindeuntomo.
2. Algunos sistemas de razonamiento (como PROLOG) concluyen -,<1> cuando fallan en
demostrar<1>. Estetipodenegacinseconocecomonegacin como fallo. Expliquepor
qunopodemos,porlogeneral,concluirlogicamenteelliteral-,Palfallarenlademos-
tracindeP.
17.2. ElintrpretedePROLOG,talcomosehadescritoenestecaptulo,realizaunaresolucin
ordenadaencadapaso. SitodaslassentenciasdeunprogramaenPROLOGseconvirtieranadis-
yuncionesdeliterales,describaunaestrategiadecontrolparalarefutacinmedianteresolucin
querealicelamismaresolucinquehaceelintrpretedePROLOG.
17.3. TomproclamaqueesundescendientedePaulRevere.Culseralaformamsfcil de
verificarlo: mostrandoqueRevereesunascendientedeTom(conbsquedahaciaatrs)omos-
trandoqueTomesundescendientedeRevere(conbsquedahaciadelante)?Porqu?Podran
haberexcepciones?
17.4. EnelcircuitodescritoenelEjercicio 16.12,supongamosqueCl, C2 y C3estn on. Des-
cribacmosepodrautilizarunsistemaSMVAparadiagnosticarlosposiblesfallosdelsistema.
17.5. UnsistemadeaprendizajeinductivoobservaqueencadainstanteQescierto,algunadelas
siguientesfrmulastambinloson:
peA,
P(C,B)
P(D,
Estesistemadeaprendizajedecidecrearlaregla:
(V'x) ::::> Q)
Culeselrazonamientoqueseharealizadoenestageneralizacininductiva?Porquel
sistemanohacreadolaregla(V'x, y)(p(x,y)::::> Q)?
17.6. Unsistemaexpertoseestutilizandoparaestimarsilosclientesquepidenuncrditopre-
sentanonoriesgo,basndoseenunnmerodefactoresquesecombinanparagenerarunapuntua-
cinnumrica.Paraqueunclienteseaevaluadocomodenoriesgo,lapuntuacindebesermayora
unumbralN. LosdiseadoresdelsistemaexpertonodicenculeselvalordeN, perohemosapren-
didoquePeteesevaluadopositivamente,yqueJoetieneunapuntuacinmayorquePete.Podemos
demostrarqueJoetambinseraevaluadopositivamenteutilizandolassiguientesreglas:
(V' x,y,z) [Mas_grande(x,y)A Mas_grande(y,z)::::> Mas_grande(x,
(V' x)[C(x)::::>Mas_grande(puntuacion(x),
(V' x)[Mas_grande(puntuacion(x),N)::::> C(x)]
ylossiguientesdatos:
C(Pete)
Mas_grande(puntuacion(Joe),puntuacion(Pete
Primero,utiliceestosaxiomasyhechosparademostrarqueJoeesevaluadopositivamente,y
despus, utilicesobrelademostracinlas tcnicasdegeneralizacinbasadasenexplicaciones
paradeterminarlaregla:
V' (x,y)([Mas_grande(puntuacion(x),puntuacion(y A C(y)]::::> C(x)}
Representacin
del sentido
"
comun
El mundo del sentido comn
18.1.1. Qu es el conocimiento del sentido comn?
AlolargodeloscaptulosanterioreshemosmostradodiversastcnicasdelA. Parailustrarlas,
hemosutilizadopuzzles,juegosyelmundoespacialcuadriculado,consusmuros,suspuertasy
susbloques.Enelcaptuloanteriorhemosampliadounpoconuestroenfoque,introduciendoel
razonamientoprogresivoyregresivodeunsistemaexpertosencillo,concebidocomounaherra-
mientadeayudaaladecisinparalapeticindeprstamos.Desdeluego,lossistemasexpertos
realesdisponendemuchosmshechosyreglasquelosdelejemploquemostramos,peroaunas,
contienenunconocimientolimitadoacercadeunospocosdominioscircunscritos.
ParaconseguirsistemasdelAenelmbitohumanorealmenteverstiles,senecesitauncono-
cimientomsextenso.Pero,haquedadosuficientementedemostradoqueelconocimientonece-
sario para ello es realmente difcil de conceptualizar formalmente. Quiz resulta paradjico
constatarquecuestionesqueloscientficosdelalAencuentranmuycomplejas,yquedebenser
estudiadasduranteaos, sonmuyfcilesparaniosdediezaosdeedad.Losfsicos son capa-
cesdedescribirdeformadetalladalosfenmenosfsicos mediantelasecuacionesdeondas,la
teoradelarelatividadyotrosmodelosmatemticos,perolosinvestigadoresenlAansecues-
tionanlamejorformaderepresentarhechostan simples(perotan tiles)comoqueunlquido
rellenalaformadeunvasoysederramasistesevuelca. Losmodelostantericosquelosfsi-
cosYlos matemticosinventan,parecenmsapropiadosparaformalizarqueparaconstruirlas
ideas,que,despusdetodo,hanpermitidoalahumanidadfuncionarbastantebien,aunantesde
Aristteles.
Pensemoseneltipodecosasqueunniosabe:
Siunosueltaunobjeto,stesecae(hoyenda,cualquierniotambinpodrasaberquelos
objetosnocaensisesueltanenunsatliteorbital).
Lagentenoexisteantesdehabernacido.
269
270
271
Lospecesvivenenelaguaymuerensiselessacadeella.
Lagentecompraelpanylalecheenunatiendadecomestibles.
Lagentesueledormirdenoche.
Alconocimientodeestetiposelesueledenominarconocimiento de sentido comn. Porlo
general,elconocimientoacercadecualquiertemaseextiendeenvariosniveles,desdeelquetie-
neunapersonadelacalle,hastaaquelquetieneunespecialista.Sinembargo,lasteorascient-
ficas msavanzadasnacenporelao500a. c.,esdecir, conpocomsqueunasfonnulaciones
verbalescuidadosasqueestabanbasadasenlasobservacionescotidianasdelagente.Paraalgu-
nos, latierraeraplanay losobjetoscaanaellaporquesteerasulugarnatural, ylasenfer-
medadesdelaspersonasestabancausadasporunagranvariedaddepintorescasinfluencias.En
aquellos tiempos, cuando el conocimiento eraescaso, se diferenciaba muy poco el sentido
comndelpensamientocientfico.Elconocimientodesentidocomneraeladecuado(yanlo
es)paramuchasdelascosasqueloshombresqueranhacer. Elpensamientocientfico,pocoa
poco,sefueseparandodelsentidocomn,amedidaquelagentebuscabadescripcionesmspre-
cisasdesumundo.
Anhoy enda, muchas de las cosasquenosgustaraque un robothicierapodranestar
basadas en lacienciamedieval, o incluso enlaprehistrica. Pararefugiarse cuando estllo-
viendo,nosenecesitaconocimientoalgunosobresistemasdebajapresin;paranoderramarel
caffueradelatazaalservirlo,oalgirarnosbruscamente,nosenecesitasaberdehidrodinmi-
caavanzada;paraenchufarlabateracuandoestbajadecarga,nosenecesitaconocerlateora
electroqumica;para pagarlasfacturasatiempo,antesdequeseemprendanaccioneslegalescon-
trauno,nosenecesitaconocercomplejasteoraspsicolgicasacercadelcomportamientodelos
proveedores.
Porsupuesto,ellonoquieredecirqueestemosencontradeaplicarconocimientoavanzado,
siemprequestesenecesite.Lossistemasdeprediccindelclimadebensaberacercadelame-
teorologa;lossistemasquecontrolanlosintercambiadoresdecalordelasplantasnuclearesnece-
sitansaberacercadelatennodinmica.Nosreferimosaquemuchastareastanslorequierenel
conocimientodeunniodediezaos,yquedesplegardichoconocimiento(unavezhayamos
descifradocomorepresentarlo!)debesermstratablequeel usodeunconocimientocientfico,
porotrolado,demasiadodetallado.
Los investigadores enlAhanbautizadoal conocimientode sentidocomn comoconoci-
miento ingenuo. Deestamanera, intentamosconstruirteorasacercadeunafsicaingenua,una
economaingenua,unapsicologaingenua,unaestadsticaingenua, unasociologaingenua, y
otras tantas. Aunque hemos contrastado el conocimiento ingenuo con el experto, se debera
puntualizarqueestostrminosserefierendefonnaaproximadaaextremosdeuncontinuo.Dife-
rentestareasrequierendiferentesnivelesdeconocimientoalolargodeestecontinuo.Tomando
lafsica comoejemplo, un robot, paraapilarbloquesenunamesa, slonecesitasaberdepro-
piedadessencillasdelosobjetos.Lafsicadesentidocomndeestetipoderobottendrahechos
talescomoquedosbloquesnopuedenestarenlamismaposicin,oqueunbloquedebesoste-
nersesobrelamesao sobreotrobloque, y tantosotros. Unrobotquepudieragolpearlasbolas
hacialastronerasdeunamesadebillarnecesitarasabermscosas;paradichatarea, unrobot
tendraquesaberacercadelrozamientoderodadura,decolisionesnoelsticas,delaconserva-
cin de lacantidad de movimiento, y de mucho ms. Obviamente, nos podramos imaginar
tareasquegradualmentenecesitarandeunconocimientocadavezmssofisticado,hastaquenos
acercramosalasfronterasdelacienciamoderna.Entonces,cuandodecimosqueestamosinte-
resados en lafonnalizacin del conocimiento de sentido comn, no tenemos en mente una
regindefinidadeformaprecisasobreestecontinuo;msbienpensamosdefonnavagaenuna
reginqueseextiendeapartirdellmite ingenuo deestecontinuo.
Representacindelsentidocomn
18.1.2. Problemas de la representacin del conocimiento de sentido comn
Culessonlasrazonesporlasqueesdifcilfonnularelconocimientodesentidocomn?Pro-
bablemente,unadelasrazonesseasuextensovolumen.Muchoconocimientoexpertosepuede
compartimentardetalmaneraque slounos pocoscientoso milesdehechos seansuficientes
paraconstruirsistemasexpertostiles.Cuntoconocimientoseranecesarioparaqueunsiste-
mafueracapazdepresentarinteligenciageneralanivelhumano?Nadielosabeconseguridad.
Doug Lenat, que lidera valientemente un esfuerzo en construir una enonne base de conoci-
mientodeestetipodehechos,denominadaCYC,piensaqueserannecesariosentreunoy diez
millones[GuhayLenat, 1990;LenatyGuha, 1990,YLenat, 1995].En1990,losresponsablesdel
proyectoCYC dijeron:
Quiz,laverdadmsduraalaqueenfrentarse,delacuallalAhaintentadoescapardurante34
aos, esque, probablemente, no hay unafonna elegante, ni poco costosa, deobteneresta
imnensabasedeconocimiento.Porelcontrario,lomsdifcilde estetrabajoserlanecesaria
insercinmanual(inicialmente,almenos)deasercintrasasercin[GuhayLenat, 1990,p.33].
Unadificultadaadidaesqueelconocimientodesentidocomnnotieneunasfronterasbien
definidasquenospermitanconcentrarnosdeformaindependienteenlaspartesquelocomponen.
Lasconceptualizacionessobreelmundodelsentidocomnrequieren,probablemente,msenti-
dades,funcionesyrelacionesdelasquepodamosincluirenunaconceptualizacinaproximada.
Siesto es as, a medidaque intentramos construirunaconceptualizacin, no sabramos qu
habramosconseguidohastaquecasihubiramosacabado,yconunexcesivoylargotrabajo.
Otro obstculo en lafonnalizacin del conocimientode sentido comn es queel conoci-
mientoacercade algunostemasnoparecequesepuedacapturarfcilmentemediantesentencias
declarativas.Ladescripcindefonnasodeobjetosfsicoscomplejosmediantesentenciasescos-
tosa. Porejemplo,sepuedendescribirconpalabraslasfaccionesdeunapersonademaneraque
otrapersonaquenolahayavistoanteslapuedareconocer?Cmocapturamosenpalabrasla
ideadeunrbol,deunpaisajemontaosoo deunapuestadesoltropical?Sialgonosepuede
describirencastellano,oencualquierotrolenguajenatural,haybuena'lrazonesparacreerqueno
encontraremosunaconceptualizacindeelloquesepuedadescribirmediantelalgica.
Relacionadoconelproblemadecapturarelconocimientoenunasentenciadeclarativa,est
tambinelproblemadequemuchassentenciasquepodramosutilizarparadescribirel mundo
sonsloaproximaciones.En concreto,lassentenciasuniversales(esdecir,aquellasenlaforma
Todox tienelapropiedady) sonraravezvlidas,a menosquesetratemeramentededefini-
ciones.Sehanpropuestovariasmodificacionesdelalgicaclsicaparatratarconelhechodeque
muchoconocimientoesaproximado.Enestecaptulotocaremosunodeestosenfoques,y trata-
remosotro,basadoenlateoradelasprobabilidades,enlosCaptulos 19y20.
Ademsdelosproblemascausadosporlainterdependenciadel conocimiento,nosiemprees
obviocmodebemosconceptualizaralgunostemas.Porejemplo,pensamoseneltiempocomo
enunconjuntodenmerosreales(esdecir,comouncontinuodeinstantes), ocomoenuncon-
juntodeenteroso enformadeintervalosdel ejereal, o dealgunaotracosa?Suponiendoque
deseramosimaginarel pasado comounalnea simple en el tiempo, cmoimaginaramosel
futuro? Aun cuando noquisiramos admitirque hay ms de un futuro, debemos de imaginar
todoslosfuturosalternativos quenuestrasaccionespuedengenerar.Cmoconceptualizamosel
mundo para que una sentencia del tipo Si no hubiese ido a laFacultad de Derecho, no te
habraencontradotengasentido?Qutipode identidadutilizamospararepresentarunainten-
cin deformaquenuestraconceptualizacinpuedamanejarsentenciasdeltipoNodeseaballe-
gartarde?
272
273 Intelgenciaartificial. Unanuevasntesis
18.1.3. La importancia del conocimiento de sentido comn
Dado que construir mquinas con sentido comn es complicado, es realmente importante
hacerlo?NoestnactualmentemuchasdelasaplcacionestilesdelalAbasadasensistemas
expertos,enlosqueelconocimientoesmenosdifcilderepresentar?Haydiversasrespuestasa
estapregunta. Primero, diramos que las mquinas con sentido comn encontraran muchas
aplicacionescomercialesdevalor.Algunoshablaranacercadelautilidaddeunrobotdoms-
tico.Aestamquinaselepodranasignarlastareasdemantenerlacasaordenada,lavarlaropa,
preparary servirlacomida,realzarelmantenimientorutinariodelacasa(talcomoreemplazar
lasbombillas fundidas), lavarlosplatos, y otrasmuchas tareas. Peropensemoseneltipo de
conocimientoquedicho robotdeberatener! El suficienteparasercapazderespondera cues-
tionescomodndedejarlasbombillasfundidas, cmocogerunplatoounvaso, dndecolocar
lascosasquesesacandellavavajillas,cmodecidirsilaaspiradoranecesitavaciarse,cmosaber
cuntotiemposemantienelalechugaenelfrigorfico...,ymuchasms.
Tambinpodemosargumentarqueelconocimientode sentidocomnesloquesenecesita
parahacerquelos sistemasexpertos seanms verstiles. Los sistemasexpertos slo secom-
portancorrectamentedentrode susreastcnicas,rigurosamentecircunscritas.El conocimien-
to general de sentido comn les permitira, como mnimo, reconocercundoel usuario pide
informacinmsalldesureadeaplicacin.Tambinpermitiraalsistemapredecirdeforma
msprecisacundosuconocimientoesrelevanteparalatareaquedebellevaracabo,ycundo
noloes.
Lacorrectaestructuracindel conocimientodesentidocomnpuedesermuyimportante
paraexpandirelconocimientodeunsistemaexperto.Todosestamosfamiliarizadosconeluso
deanalogasy metforasennuestrospropiosrazonamientos.Lasmetforasespacialessonde
lasmsutilizadas. Porejemplo,decimosquelaelectrodinmicacunticaestms all delos
lmites denuestroconocimiento;oquelahumildadestprxima alabondad;oqueelsalario
deMaryestporencima deldeJohn,y muchasotrasfrases del mismotipo. Haymuchasrazo-
nesparasospecharquelasmetforassonmuchomsquesimplementecoincidenciaslings-
ticas.Losfundamentosdemuchasdenuestrasconceptualizacionespodranbasarse,dehecho,
enideasespaciales,odeotrotipo, delsentidocomn.Deestemodo,unsistemaexpertoque
poseyeraunaconceptualizacindesentidocomnsobreelmundo,podraestarperfectamente
equipadoparaexpandirsubase deconocimiento mediantepequeasactualizaciones o revi-
siones.
Finalmente,elconocimientodesentidocomnserequiereindudablementeparaentenderel
lenguajenatural,untemaqueretomaremosenelCaptulo24.
18.1.4. reas de investigacin
Auncuandotodavanodisponemosdesistemasconsentidocomn(conlaposibleexcepcindel
CYC,queestanendesarrollo),losinvestigadoresenlAhanatacadoelproblemadelarepre-
sentacindelconocimientodesentidocomndesdediversosfrentes:
1. Losobjetosylosmateriales.Elmundoestformadoporobjetos.Algunos,comolosblo-
quesdelmundoreticulado, sondiscretos;soncosasslidassobrelasqueesrelativamente
fcil hablar, y, por tanto, es fcil describirlas. Algunos objetos sonjerrquicos, en el
sentidodequeestncompuestosporpartes(otrosobjetos)agrupadasdealgunamanera.
Tambinhaylquidos,gasesyagrupacionestalescomolosmontonesdearena,lossacos
deharinaolasgalaxias.Eltrabajode[Hayes, 1978;Hayes, 1985a,yHayes, 1985b] esun
notableesfuerzoenladescripcindelosmaterialesysuspropiedades(especialmentelos
lquidos).
2. Elespacio.Elmundofsicotieneunaextensinespacial.Losobjetosexistenenelespa-
cioy secolocanenldeformarelativarespectoaotrosobjetos.Deestemodo,porejem-
plo,debemosdisponerdeformasparahablardelascosas,talescomoestdentro, est
encima o est contiguo a otras cosas)). Tambin debemos sercapaces de describir
cungrandessonlascosas,quformastienenymuchasotraspropiedades.Untrabajode
losiniciosdelalAorientadoalaformalizacindediversosconceptosespacialeseselde
[Kautz, 1985].Paraconsultarartculossobrerazonamientoespacialendiversastareasde
robotsvase[Chen, 1990].
3. Laspropiedades fsicas. LossistemasdelAdeberansercapacesde razonaracercade
propiedadesfsicastalescomomasa,temperatura,volumen,presin,nivelderadiacin,
longituddeondaycualquierrelacinquesepresenteentreellas.
4. Losprocesosfsicosy loseventos.Losobjetoscaen,lasbolasselanzan,lahierbacrece,
losvasossellenany sevacan,lasvelassequeman,losobjetoscalientesseenfran.Enla
fsica,muchosdeestosprocesossedescribenmedianteecuacionesdiferenciales;podr-
amosutilizarestasecuacionesenlA.Sinembargo,nosiemprenecesitamossolucionestan
exactas(y costosasdecalcular)comolasdelafsica.Ensulugar,losinvestigadoresenlA
handesarrolladounafisca cualitativa conlasepuedeninferirtendenciasgeneralessinla
necesidadderealizarclculosexactos[WeldydeKleer, 1990].
5. Eltiempo.Losprocesos(incluidoslospropiosprocesosderazonamiento)transcurrenalo
largodeltiempo. Loscientficosencomputaciny losinvestigadoresenlAhandesarro-
lladodiversastcnicasparadescribiryrazonarsobreeltiempo.Laslgicastemporales
especiales[Emerson, 1989],utilizadasenelanlisisdeprogramasdeordenador,presen-
tanciertosaspectosimportantesacercadeltiempo.LagentedelalAhatendidoamane-
jareltiempodedosformas(consltese[Shoham, 1987]paraunadiscusinsobreeluso
delaslgicastemporalesenlA).Laprimera,sebasaenignorarlamencinexplcitadel
tiempomediantelautilizacindesituaciones, quesoncomofotografas)}delmundoen
instantesnoespecificados,yqueseenlazanmediantelasacciones,lascualestransforman
unasituacinenotra.TrataremosesteenfoqueenelCaptulo21. Lasegunda,consisteen
manejardeformaexplcitaeltiempoylosintervalosdetiempoquetranscurrenentrelas
entidades sobrelasquese razona. Enlasiguienteseccinde estecaptulodescribimos
esteenfoquedeformalizacindeltiempocomoejemplodeformalizacindeunconcep-
toqueesnecesarioparael sentidocomn.
El tiempo
Cmopensamos acercadel tiempo? Escomouna lnea real de nmeros que seextiende
haciaun pasadoy haciaunfuturo infinitos?Oescomolosenterosnumerables,comenzando
desdeelOenel bigbangy avanzandoenunidadesdetiempodiscretas?Algunassociedades
primitivaspensabanqueeltiempoeracircularyqueserepetainfinitamenteenciclos.Necesi-
tarnos decidirqu tipo de modelo (metaontologa) vamos a utilizar antes de poder formular
hechostilesacercadeltiempo.
El modelo ms utilizado en lAfue formalizado porJames Allen [Allen, 1983; Allen,
1984] (consltesetambin[Allen, 1991]paraunadiscusinsobrelasmuchasformasderepre-
sentareltiempo).Enestemodelo,eltiempoesalgodinmico,sobreelcuallosprocesosylos
eventostranscurren (enunmundoperfectamenteesttico,enelquenadacambiara,eltiempo
noseranecesario;dehecho,serabastantedifcil formalizarelconceptotiempoendichomun-
274
275
do). Loscontenedoresdeloseventosydelosprocesossedenominanintervalos. Losinter-
valostemporalessoncomolosintervalosdefinidossobrelalneadelosnmerosreales.Eneste
modelo,portanto, losintervalostemporales sonlas entidades sobrelas cuales existen las
cosas.
Paradescribirlosintervalostemporalesnecesitamosdarlesnombres,yparaelloulizaremos
lasconstantesdeobjetodelclculodepredicados,talescomoIl,I2, ... ,paradenotados.
Paradecirquealgneventooproceso,denotadoporE,transcurre(porcompleto)enelintervalo
I,escribiremosOcurre(E,I)(dejamosallectorquepienseacercadecmoseformalizaranlos
conceptosdeeventoyproceso;paranuestrosobjetivosactuales,sonentidadesquesimplemente
existen).
Losintervalostemporalestieneninstantes deinicio yfinal. Losinstantesdetiemposonrepre-
sentados mediante nmeros reales. El inicio de un intervalo se obtiene mediante la funcin
inicio,yelfinalmediantelafuncin fin.Unhechobsicoacercadelosintervalosesque:
(Vx)[inicio(x)S; fin(x)]
(Cuandoel inicioy elfin deunintervalosonel mismo instantede tiempo, el intervalose
colapsaenelcasodegenerado.)
Definimoslasiguienterelacinbsicaentreintervalos:
('Vx,y)[Se_encuentra_con(x,y);:(f in(x) inicio(y)]
(Dosintervalosseencuentran sielinstantefinaldelprimeroeselmismoqueelinstantede
tiempodeiniciodelsegundo.)Podemosdefinirotrasseisrelacionesentrelosintervalos,bienen
trminosde Se_encuentra_con,o bienentrminosdelosinstantesde inicioyfin delos
intervalos. Estas relaciones se denotan por Antes_de, Se_solapa_con, Inicio,Fin,
Durantee Iguales.Tambin tenemos las relaciones inversas: Es_encontrado-por,
Despues_de, Solapado-por,Iniciado-por,Finalizado_con,yContiene_a
(Igualesesconmutativa).Porejemplo:
("i/x,y){Antesde(x,y);: 3(z)[Se_encuentra_con(x,z)A
Se_encuentra_con(z,y)]}
("i/x, y){Antes de(x,y);: [(fin(x)<inicio(y)]}
MostramoslarepresentacingrficadeestasrelacionesenlaFigura18.1,ydejamosallec-
torquecompletelasdefinicionessiguiendolapautautilizadaparaAntes_de.
Las relaciones entreintervalossepuedenutilizarparaexpresaralgunoshechos desentido
comnacercadeltranscursodeloseventosalolargodeltiempo.Porejemplo,paradecirqueel
eventosaliraguadeungrifoestprecedidoporeldeabrirunavlvula,yseguidoporeldecerrar-
la,podramosescribir:
("i/y){Ocurre(Sale,y)
:::) (3x,z)[Ocurre(Abrir_ccw, x)A Ocurre(Abrir_cw, z)A
Se_solapa_con(x,y)A Se_solapa_con(y,zm
Tambinhayalgunos axiomasbsicosque expresanpropiedadescomolatransitividad de
Antes_de.Estemodeloparticulardeltiempohasidoaplicadoaunagranvariedaddeproble-
masderazonamientotemporal.
Se_encuentra_con(x,y) Es_encontrado-por(y,x)
Antes_de(x,y) Despues_de(y,x)
Se_solapa_con(x,y) Solapado-por(y,x)
Inicia(x,y) Iniciado-por(y,x)
f---xl Finaliza(x,y) Finalizado_con(y,x)
y
f---xl Durante(x,y) Contiene_a(y,x)
y
f---xl Iguales(x,y) Iguales(y,xl

Figura18.1.
Relacionesentreintervalos.
Representacin del conocimiento mediante redes
18.3.1. Conocimiento taxonmico
Amenudo,lasentidadesmanejadasenlos dominios de experienciay endominios de sentido
comn se pueden disponer en estructuras jerrquicas que organizan y simplifican el razona-
miento.Porejemplo,laentidadfundamentalenlarepresentacindelsentidocomnutilizadaen
elsistemaCYC sedenotamediantelaconstantedeobjetoCosa.Enel CYChaydiversostiposde
cosas: objetosdelmundo,objetosmatemticos,eventos,procesosy muchosotros.Estosobjetos
sedisponenenunataxonomaojerarquaquecodificaimplcitamenteloshechosenlaformaX
esunP, todoslosPsonQ,todoslosQsonR,etc... (consltese[GuhayLenat, 1990]parauna
discusinsobrerepresentacindelconocimientoenelsistemaCYC). Lasjerarquastaxonmicas
sepuedencodificarbienmedianteredes, obienmedianteestructurasdedatosdenominadasguio-
nes. Primerohablaremosdelarepresentacinmedianteredes,utilizandocomoejemploconoci-
mientorelativoamquinasdeoficina.
Supongamos que queremos representar los siguientes hechos: Snoopy es una impresora
lser, todaslasimpresoraslsersonimpresoras,todas las impresoras son mquinas, y algunas
otraspiezasdeinformacinrelacionadasconstas.Expresadoenformadesentenciasdelclculo
depredicados,tendramos:
Impresora_laser(Snoopy)
("i/x)[Impresora_laser(x):::) Impresora(x)]
("i/x)[Impresora(x):::)Maquina_de_oficina(x)]
276
277
Lospredicados Impresoras_laser,Impresoras,yMaquina_de_oficinarepre-
sentan categoras de una taxonoma. Un tipo de razonamiento importante, que hace uso de
conocimientotaxonmico,eseldelatransitividaddelascategoras. Porejemplo,conloshechos
anteriores,podramosdeducir(Vx)[Impresora_laser(x)::::)Maquina_de_oficina(x)]
yMaquina_de_oficina(Snoopy).
Losmiembrosdeunamismacategorataxonmicapuedentenertodosellosciertaspropie-
dades,talescomoquelafuentedealimentacindetodaslasmquinasdeoficinaesunatomade
corrientedelapared.Estaspropiedadessepuedenexpresarmedianteunafuncinounpredica-
dodeigualdad:
(\fx)[Maquina_de_oficina(x)::::)
[Fuente_de_al imentacion(x)= Toma_de_la""paredJ]
Obsrveseque losmiembrosdelassubcategoras,porlogeneral, heredanlaspropiedades
comunesdesussupercategoras:
(\fx)[Impresora_laser(x)::::)
[Fuente_de_a1imentacion(x) Toma_de_la""pared]]
Estostiposdeinferenciassobrelasentidadesdeunajerarquataxonmicasepuedenmane-
jarmsfcilmente medianteelusodeunarepresentacin grfica, denominadared semntica.
18.3.2. Lasredessemnticas
Lasredessemnticassonestructurasgrficasquecodificanelconocimientotaxonmicosobre
objetosypropiedadesdeestos. Noscentraremosenunaversinmuysencillaqueincorporalos
principalesconceptosdeinters.Existendostiposdenodos:
Nodosetiquetadosconconstantesderelacin, quesecorrespondenacategorastaxon-
micasoapropiedades.
Nodosetiquetadosconconstantesdeobjeto,quesecorrespondenaobjetosdeldominio.
Existentrestiposdearcosquepuedenconectarestosnodosentres:
Arcosdejerarqua(algunasvecesdenominadosarcosIsa).
Arcosdepertenencia(algunasvecesdenominadosarcosdeInstancia).
Arcosdefuncin.
EnlaFigura18.2mostramosunejemplodeestetipoderedenelcualsepuedenidentificar
losdiversostiposdenodosyarcos.
Elrazonamientosobrelaspropiedadesdelosobjetosysobresusrelacionesdepertenencia
esmsfcil yeficienterealizadosobreredes semnticasquerealizado mediantealgn meca-
nismoderesolucinnoguiadoaplicadoalascorrespondientesibfsl. Paradeterminarsiunobje-
to,representadoporel nodoA, esonomiembrodealgnconjunto,representadoporelnodoB,
I Noobstante,esposiblemodificarelprocedimientode unificacinparaquetengaencuentalostiposdevaria-
bles,loque,juntoalaaplicacindeotrasheursticas,permiteobtenersistemasderesolucin quesonesencialmente
igualdeeficientes[Stickel, 1985].
Conveniosparalosarcos:
Subconjunto -
Elemento -
Funcin -
Figura18.2.
Unaredsemntica.
seguimoslos arcoshaciaarribapartiendodesdeA ycomprobamos si encontramoselnodoB.
FijndonosenlaFigura18.2,esfcildeterminar,porejemplo,queR2D2esunamquinadeofi-
cina.Paradeterminarel valordeunapropiedadcualquieradeunobjetorepresentadoporelnodo
A, seguimoslos arcos haciaarribaapartirdeA hastaencontrarunnodoquetengaesamisma
propiedad. Porejemplo, paradeterminarlafuente de alimentacindeSnoopy,seguimos los
arcos desde Snoopyhacia el nodo Maquina_de_oficinaYvemos que larespuesta es
Toma_de....Pared.
18.3.3. Razonamientonomontonoenredessemnticas
Talcomoyahemoscomentado,elrazonamientoenlgicaclsicaesmontono, debidoaquela
adicindeaxiomasaunsistemalgiconoreduceelconjuntodeteoremasquesepuedendemos-
trar. Esdecir, si11' esunsuperconjuntodell,entonces,paracualquierO) paralacualll1- 0), se
verificaqueIII 1- 0). Sinembargo,haymuchosejemplosderazonamientodesentidocomnque
parecensernomontonos.Amenudo,realizamosinferenciaspordefecto,quesonaquellasque
estamosdispuestosaasumirquesonciertas,salvoquetengamosconocimientodelocontrario;
perosinosllegaunnuevoconocimientocontradictorio,entoncesdebemosretractarnosdelainfe-
rencia pordefecto previamente realizada. Se han propuesto muchos sistemas y mecanismos
lgicosparacapturarestefenmenonomontono.Yahemosdescritocmoconsiguenestolos
SMV.Lalgicapordefecto[Reiter, 1980],lalgicaautoepistmica[Moore, 1985a],lalgicano
monotna[McDermottyDoyle, 1980]ylacircunscripcin[McCarthy, 1980;McCarthy, 1986]
sonotrosformalismospropuestos.
-------
278
279 Inteligenciaartificial. Unanuevasfntesis
Conveniosparalosarcos:
Subconjunto _
Elemento _
Funcin _
Figura18.3.
Unaredsemnticaparaelrazonamientopordefecto.
Vamosadescribiraquunmecanismosencillo(aunquenodeltodoadecuado)pararealizar
razonamientonomontono,denominadocancelacin de la herencia. Estemecanismoseentien-
demejormedianteelusodelasredessemnticas.Supongamosquequeremosdecirquelafuen-
tedealimentacinde lasmquinasde unaoficina, pordefecto,esunatomadecorrientedela
pared,peroque, comoexcepcinaestaregla,lafuentedealimentacindeunrobotesunabate-
ra.Podramosexpresaresteconocimientoaadiendootroarcodefuncinalaredsemntica,tal
comosemuestraenlaFigura18.3.
Quizparezcaqueal aplicarel mecanismodeherenciadepropiedadesaestanuevaredlo
queseobtendraesunacontradiccin.Aunquelaherenciadepropiedadesnospermitadeducir(de
formacorrecta)quelafuentedealimentacindelasimpresorasesunatomadelapared,tenemos
representadode formaexplcitaelhechodeque lafuente dealimentacindelosrobotsesuna
batera,locualesunacontradiccin(asumiendoquelasbaterasy lastomasdeparedsoncosas
distintas). Laformadeprotegemosfrenteadichacontradiccinconsisteenutilizarlareddeuna
formadistinta.Consideraremosquelainformacinsobrecategorasmsespecficas(ordenadas
segn los arcos deinstanciaojerrquicos) tiene preferencia sobre la delas categoras menos
especficas. Deestamanera, enelcasodeque queramospreguntamos sobre lafuente de ali-
mentacindelrobotR2D2, primerolocalizamosenlaredelnodoetiquetadocomo y lue-
gonospreguntamos sidichonodotieneelarcodefuncin fuente_alimentacion.Enel
casoafirmativo, aceptamos larespuestadadaporelnodoal queapuntadicho arco; enelcaso
negativo,ascendemosporlosarcosjerrquicoshastaqueencontramoselprimer nodoquetenga
el arco de funcin fuente_alimentacion,y utilizamos el nodo al que apunta este arco
comorespuestacorrecta.Lainformacinasociadaalosnodosenlosnivelesaltosenlajerarqua
taxonmicaesdetipogeneral,esdecir,esinformacinpordefecto;staesunainformacinque
Figura18.4.
Conflictosdeherencia.
puedesercanceladaporinformacinmsespecfica,asociadaalosnodosdenivelesmsbajosen
lajerarqua.
Unexamenmsatentonosrevelalaexistenciadevariosproblemasasociadosconelmeca-
nismodeherenciadepropiedades.Unodelosproblemasmsimportantesesquelaspropiedades
heredadasdediferentesnodospadre(supemodos)puedenentrarenconflicto.Lasubredquese
muestraenla Figura 18.4muestraesteproblema.ElrobotC3POesalmismotiempo unrobot
repartidory delimpieza.Trabajaeneltumodenocheodeda?Enestoscasosconflictivos,no
se puedederivarningunaconclusin.En sistemas nomontonos ms sofisticados queel pro-
puesto,elrazonamientopordefectosepriorizademaneraqueunapropiedadpordefectoadquie-
reprecedenciasobreotraenloscasosdemltipleherencia.
18.3.4. Guiones
El conocimientotaxonmicotambinsepuedecodificarenunaestructuradedatosdenominada
guin. Unguintieneunnombreyunconjuntodeparesatributo-valor.Elnombredelguinse
correspondeconunnododeunaredsemntica;losatributossecorrespondenconlosnombresde
losarcos asociadosaesenodo, y losvaloressecorrespondenconlos nodos alosqueapuntan
dichosarcos. Losparesatributo-valorqueseutilizansesuelendenominarranuras, a losatribu-
tos se lesdenominanombre de la ranura (ocampos)y alos valoresvalor de la ranura. Enla
Figura18.5mostramosunejemplo.Obsrvesequeestemodelotambinnospermiterepresentar
Nombredel guin
Impresoras
subconjunto_de: Maquina_de_oficina
superconjunto_de: (Impresora_laser, Impresora_de_inyeccion)
fuenle_alimentacion: Toma_de-pared
/
Ranura
autor: John_Jones
fecha: 16_Agosto_91

Nombredelaranura Valordelaranura
Figura18.5.
Ungui6n.
280
loque sedenominameta conocimiento, como, porejemplo, lafecha de creaciny el autordel
guin,queconstituyeconocimientoacercadelguin,nodelasimpresoras.
Sin embargo, tanto las redes semnticas como los guiones presentan problemas para la
representacindeciertostiposdeconocimiento.Porejemplo,esbastantedifcil(aunquenoimpo-
sible[Hendrix, 1979])expresardisyunciones(y, portanto,implicaciones),negaciones,y, engene-
ral, conocimientonotaxonmico.Estosproblemasnoshanllevadoasistemashbridos,comoel
sistemaKRYPTON [Brachman;Gilbert,y Levesque, 1985]oelsistemaCLASSIC[Bordiga,et
al., 1989].
Estossistemas utilizan lo quesedenominan lgicas tenninolgicas, utilizandoestructuras
jerrquicasparalarepresentacindeentidades,clasesy propiedades,y expresioneslgicaspara
elotrotipodeinformacin.
Cons1tese [Davis, 1990,yHobbsyMoore, 1985]paraunainformacinmsexhaustivasobrela
representacinylosmtodosderazonamientodesentidocomn.Enloreferenteal sistemaCYC,
seencuentrancincorevisionesde[Lenaty Guha, 1990]enArtificiallntelligence, 61(1):41-104,
1993.
[Sowa, 1991]esunacoleccindeartculossobreredessemnticas.Elmecanismodeheren-
ciadepropiedades, desarrolladoporlos investigadoresenlApararealizarrazonamientosefi-
cientesenredessemnticas,hasidoincorporadocomounacaractersticabsicaenlagestinde
jerarquasde clases de los lenguajes orientados a objetos. Paraconsultarunacomparacinde
diversaslgicasterminolgicasvase[Heinsohn,et al., 1992].
Lacancelacindelaherenciaenredessemnticasesunatcnicaderazonamientonomon-
tono. Ya hemoscitadolos mecanismosms sofisticados de lalgica pordefecto y lacircuns-
cripcin.ConsltesefBrewka; Dix,yKonolige, 1997]paraunarevisinsobreeltema. Otrofor-
malismoderazonamientonomontonoeslaasuncindelmundocerrado(AMC),consistenteen
extenderunabase deconocimientoL\ de frmulas del clculo de predicados, aadindole las
negacionesdetodoslostomosbasequenosepuedendeducirdeL\. Esteprocesoesnomon-
tonoporque si, posteriormente, un tomo a seaade a L\, entonces su negacin aadida -,a
medianteAMCdebeserretractada.Consltese[Ginsberg, 1987]paraunacoleccindeartculos
sobrerazonamientonomontono.
Partedel trabajosobrelarepresentacindelconocimientoseconcentraenlacreacindelen-
guajes y formalismos que permitan compartir lainformacin entre diferentes programas con
conocimientoespecializado.Ejemplosdeestetiposonelfonnato de intercambio de conocimiento
(KIF)[Genesereth,yFikes, 1992]yellenguajeKQML [Finin;Labrou,yMayfield, 1997].Estos
sistemas se basan en establecer conceptualzaciones de conocimiento comunes denominadas
ontologas. [Gruber, 1997]describelosprincipiosenlosquesebasasudiseo.
Larepresentacindelsentidocomnyelrazonamientoanivelhumanoparecequerequieren
mecanismosquesonbastantediferentesalosmecanismosdetipolgicoquesemuestraneneste
libro.LautilizacindeanalogasymetforaspareceserfundamentaL El razonamientoanalgi-
cohasidoestudiadopormuchosinvestigadores enlAy en psicologa, incluyendoa [Gentner
1983J. [Lakoff, 1987,yLakoffyJohnson, 1980]sondoslibrosquetratanelpapeldelaanaloga
enellenguajeyelrazonamientohumanos. Elrazonamientobasadoencasosesotromtodode
razonamientoqueaprovechalasanalogasylassimilaridadesconproblemasresueltosconante-
rioridad [Kolodner, 1993] (conslteseeltomoespecialsobrerazonamientobasadoencasosde
Machine Leaming, 10(3): 1-5, 1993).
Representacindel sentidocomn
18.1. Frecuentemente, sedaporsentadoqueel conocimiento sepuedecodificarmediantefr-
mulas del clculo de predicados para formar una base de conocimiento. Consideremos, por
ejemplo,las siguientesfrmulas, delascuales se afirmaque codificanpartedel conocimiento
acercadelpersonalylaorganizacindelaempresaACME:
Salario(Joe, 20
Ventas)
Jefe_de(Joe,Henry)
(\:Ix, y)[[Departamento(x,Ventas)A y)]::::> 20000)]
Obviamente, cualquierconsideracin sobre lo que significa que estas frmulas codifican
conocimientodeberaaplicarsetambinalcasoenelquetodaslasconstantesmnemotcnicasde
predicado(porejemplo, y las constantesdeobjeto (porejemplo, Henry)secam-
biaranporconstantesconnombresmenossugerentes.Enqusentidosepuededecirquelasfr-
mulas(delcasonomnemotcnico)codificanconocimientoacercadelaempresaACME?
18.2. (CortesadeDaphneKoller.)Consideremoselsiguienteargumento:
WellngtonseenterdelamuertedeNapolen. Portanto,Napolennopudoenterarsedela
muertedeWellington.
El ejercicio consiste en construir una demostracin formal de este argumento usando el
clculodepredicados(Pista: cuandoseconstruyeunarepresentacindel conocimiento,porlo
general,esbuenaideaarrancarconunvocabularioprovisionalyunconjuntodeaxiomasprovi-
sionales,eirmodificndolosamedidaquesevaestableciendoquesloquesenecesitaparala
demostracin).
Listeunconjuntodeconstantesderelacin,constantesdefunciny constantesdeobje-
toquesenecesitanparaunarepresentacinenlgicadeprimerordendel conocimientode
estedominio. Loselementosdeldominioseranpersonas, nmero_de_veces y eventos
(comolamuertedeunapersona)(Pista: porlogeneral,esmsfcil utilizarfuncionesen
aquelloscasosenlosqueestotengasentido.Estoescorrectoprincipalmenteenlasfun-
ciones parciales (porejemplo, uneventopuedetenerunaduracin y unapersonano),
siemprequeseutilicendeformaconsistente).
2. Utiliceestevocabularioparadescribirloshechosbsicos,ascomocualquieraxiomade
sentidocomnquesenecesiteenlaargumentacin.
3. Demuestrelaconclusinapartirdeloshechosdescritosmedianteunademostracinen
lgicaformaL
18.3. SupongamosquetenemosquedemostrarqueunpjarollamadoPiolnseencuentraenel
zoo. Si dispusiramosdeunabasedeconocimiento,nuestroobjetivoseraalgoascomo:
aro(x)A Nombre(x,piol A Se_encuentra_en(x,y)A Zoo(y)
282
283
InteligenciaartificiaL Unanuevasntesis
Supongamosqueconocemos500pjaros,cincocosasquesellamanPioln, 1 OJO paresobje-
to-localizaciny 100zoos.Adems,cadaobjetotieneunanicalocalizacinycadalocalizacin
tieneunos 1.000objetos.
l. Cul sera el orden ptimo de los conjuntos si quisiramos resolver este problema
medianteunademostracinordenadadecadaconjunto (teniendoencuentalas sustitu-
ciones que se realizan en laresolucinde los conjuntos)? (Para un problemadado, el
ordenptimodelosconjuntoseselordenquegeneraelespaciodebsquedamspeque-
o,o,enotraspalabras,elquegeneraelmnimonmerodesolucionesalternativasaeva-
luar.)
2. Unaheurstica muy utilizadaconsiste en ordenarlos conjuntos enrelacin al mnimo
nmero de respuestas obtenidas (a medida que se van generando). Esta heurstica se
denominaheursticaprimero el ms barato. Culseraelordendelosconjuntosmedian-
teestaheurstica?
3. Demuestrequelaheursticaprimero el ms barato esunaheursticaptima, o, encaso
contrario,modifiqueelejemploparacrearuncontraejemplo.
18.4. Construyaunejemploenelque,alaplicarlaasuncindelmundocerrado(AMC)auncon-
juntodefrmulassegenereunainconsistencia.
18.5.
l. Expresemediantefbfsdelclculodepredicadoslainformacindelared semnticaquese
muestraenlafigura. Tengaencuentaquelasfbfs sehandeescribirdetalmaneraque
quededescritade formaexplcitalacancelacinde laherenciaqueestimplcitaenla
jerarquadeherencias.
2. Sepuededemostrarapartirdelasfbfs delclculodepredicadosqueFidotienecuatro
patas?Encasonegativo,quinformacinsenecesitaraaadirparacompletarlademos-
tracin'?
no.-patas
8
es_subconjunto
es_un_elemento_de
18.6. Paralosdosejemplosquesemuestran,elijaelsistemaderepresentacindeconocimiento
msadecuadoycodifiquelassentenciasdelosejemplosendicharepresentacin. Utilicelarepre-
sentacinyunsistemaadecuadoderazonamientopararesponderalapreguntadecadaejemplo.
Expliqueconalgode detallecmollegaelsistemaderazonamientoagenerarlarespuesta,por
ejemplo,utilizandorefutacinmedianteresolucin,sielsistemasebasaenlaresolucin.Utili-
cediagramassi sondeayudaenlasexplicaciones.
1. Porlogeneral,lospjarosvuelan. Lasavestrucessonpjaros.Oliveresunavestruz.Las
avestrucesnovuelan.
P: Olivervuela?
2. Seymorees unelefanteyesamigodeJohn.Todosloselefantes songriseso amigosde
Bert.NingnamigodeBertloesdeJohn.
P: Seymoreesgris?
Razonamiento
con
incertidumbre
A menudo, un agente slo tiene informacin incierta acerca de su tarea y del entorno. Las tcni-
cas que acabamos de describir hasta ahora, tenan ciertas limitaciones a la hora de representar y
razonar con conocimiento incierto. Una sentencia como P v Q nos permite expresar la incerti-
dumbre acerca de cul de los dos tomos es cierto, pero an no hemos hablado de cmo podra-
mos representar cunta certeza tenemos acerca de P, o de Q.
En la lgica clsica, podemos deducir Q a partir de P y P :J Q; es decir, si un agente conoce
P :J Q, Y posteriormente aprende P, entonces puede inferir Q. La pregunta es existen procesos
de inferencia anlogos cuando la informacin es incierta? Se han empleado varios formalismos
para representar y razonar con informacin incierta. Ya hemos hablado de algunos utilizados
por MYCIN y PROSPECTOR. E] formalismo que est ms desarro]]ado (iY alguien podra
decir el ms apropiado!) es el basado en probabilidades. Comenzaremos el captulo con un bre-
ve repaso de los fundamentos de la teora de probabilidades.
Repaso a la teora de probabilidades
19.1.1. Conceptos fundamentales
Asumimos que tenemos un conjunto de variables aleatorias VI' V
2
, ... , V
k
Cuando queremos
hablar acerca del valor de Vi sin decir qu valor es, utilizamos el smbolo Vi' En nuestras aplica-
ciones, las variables aleatorias representan las caractersticas que nos interesan de un dominio.
Los valores de las variables aleatorias pueden ser de diferentes tipos. Si las variables representan
proposiciones, sus valores son Verdadero o Falso (o numricamente, 1 o O); si las variables repre-
sentan medidas fsicas (tales como altura, anchura, velocidad, etc.), los valores son numricos; si
las variables representan categoras (como color, letras del alfabeto, etc.), los valores son cate-
gricos. Por ejemplo, el resultado de lanzar una moneda se podra representar por la variable M,
cuyo valor podra ser uno de los dos valores categricos CA (cara), o CR (cruz). Si estamos
285
286
hablando del resultado de lanzar k veces una moneda, necesitaramos k variables (MI' ... , M ),
k
cada una de las cuales podra tener el valor CA o CR.
Denotamos la probabilidad conjunta de que los valores VI' V
2
, , V
k
sean Vi' V
2
, ... , V
k
res-
pectivamente, con la expresin p(V vi' V
2
= v
2
' ... , = v
k
). A dicha expresin se la denomina V
k
funcin de probabilidad conjunta sobre las variables VI' V
2
, , V
k
Esta funcin proyecta las
variables de p(VI' V2, ..., V
k
) a los nmeros reales en el intervalo entre O y 1. La sustitucin de las
variables de p(VI' V2, , V
k
) por valores concretos nos da la expresin p(v, v
2
' , v
k
), que es una
abreviacin de p(V =Vi' V2 =v
2
' ... , V
k
=v
k
). De este modo, para un lanzamiento medio de mone-
da, podramos tener p(CA) =1/2; Y si lanzamos una moneda cinco veces, podramos tener p(CA,
CR, CR, CA, CR) =1/32, donde p(CA, CR, CR, CA, CR) es la probabilidad conjunta de que el pri-
mer lanzamiento sea cara, el segundo cruz, el tercero cruz, el cuarto cara, y el quinto cruz.
Las funciones de probabilidad deben satisfacer ciertas propiedades; entre ellas, tenemos:
a) O::; p(VI' V
2
, , V
k
) ::; 1
para cualquier asignacin de las variables, y
b) LP(V, lIz, ...,1'.:) =1
que es el sumatorio de todas las asignaciones posibles de las variables. As, en nuestro ejemplo
del lanzamiento de monedas, que p(CA) = 1/2 es consistente con la propiedad (a); y como
p(CA) =1/2, al aplicar la propiedad (b), se restringe el valor de p(CR) a 1/2. No tenemos mucho
que decir acerca de cmo se asignan las probabilidades a los valores de las variables aleatorias.
Igual que en la lgica proposicional, la verdad o falsedad de varias proposiciones, denotadas por
fbfs, se basaba en el juicio subjetivo de los expertos en el dominio de aplicacin (o mediante el
procesamiento perceptual de los datos sensoriales); los valores de las probabilidades de las
variables aleatorias, tambin dependern del juicio del experto o del procesamiento perceptual.
Nuestro principal inters es acerca de cmo realizar los clculos que nos darn las probabilidades
de ciertas variables que nos interesen.
En las aplicaciones que vamos a ver en este captulo, las variables se corresponden con pro-
posiciones acerca del dominio. Estas proposiciones pueden ser ciertas o falsas, por lo que las
variables correspondientes tendran los valores Verdadero o Falso. Podemos no tener certeza acer-
ca del valor de verdad de una o ms de estas proposiciones; esta incertidumbre estar represen-
tada por la probabilidad de los valores de las variables correspondientes. Por tanto, las tcnicas
que vamos a describir en este captulo se pueden interpretar como las alternativas probabilsticas
a los mtodos expuestos en los Captulos 13 y 14 acerca de la representacin y el razonamiento
mediante lgica proposicional (el desarrollo de alternativas probabilsticas a la lgica de primer
orden sigue siendo, hoy en da, una frontera para la investigacin; vase, por ejemplo, [Nilsson,
1986, y Glesner y Koller, 1995]).
Ser de gran ayuda un ejemplo concreto para enmarcar nuestra introduccin sobre los con-
ceptos ms importantes de la teora de las probabilidades. Utilizaremos el mismo ejemplo que uti-
lizamos en nuestra presentacin sobre el razonamiento en el clculo proposicional. Recordemos los
tomos proposicionales Se_mueve y eto_elevable, que se definan
para representar, respectivamente, que la batera estaba cargada, que el brazo del robot se mova
(cuando sujetaba un bloque) y que un bloque se poda levantar. A estos tomos, aadiremos el to-
mo Indicador, que se crea para representar que el indicador que muestra el estado de la batera
nos dice si la batera est completamente cargada. Para hacer nuestros diagramas y frmulas
menos pesados, renombraremos estos tomos con las letras B, S, e I. Ahora supongamos que no
estamos seguros acerca de si estos tomos tienen el valor Verdadero o Falso. Antes de que se pue-
Razonamiento con incertidumbre
da capturar cualquier lectura de los sensores, disponemos de una serie de probabilidades a priori
sobre diversas combinaciones de los valores de las variables; es decir, por ejemplo, podemos pen-
sar que es poco probable que M sea Falso cuando todas las dems variables son Verdadero.
Como tenemos cuatro variables binarias, tenemos 16 probabilidades sobre estas variables,
cada una en la forma p(B =b, S =s, O 0,1= 0, donde b, s, o e i pueden ser Verdadero o Falso.
El diseador del agente debe especificar estos 16 valores, sujetos a las restricciones de que
cada uno est entre O y 1, Y que el sumatorio de todos ellos debe ser 1. Como ejemplo, en la
siguiente tabla listamos algunas de estas probabilidades conjuntas:
(B, S, 0, I) Probabilidad conjunta
Verdadero, Verdadero, Verdadero, Verdadero
Verdadero, Vardadero, Verdadero, Falso
Berdadero, Verdadero, Falso, Verdadero
Verdadero, Verdadero, Falso, Falso
0,5686
0,0299
0,0135
0,0007
(Por supuesto, es muy difcil que el diseador especifique las probabilidades con el grado de
precisin que se muestra en la tabla. Nosotros lo hemos hecho para que estos valores sean con-
sistentes con otras probabilidades, relacionadas con el ejemplo, que utilizaremos ms adelante en
este captulo.)
Cuando conocemos los valores de todas las probabilidades conjuntas del conjunto de varia-
bles aleatorias, podemos calcular lo que denominamos probabilidad marginal de una variable ale-
atoria. Por ejemplo, la probabilidad marginal p(B b) se define como el sumatorio de las 8 pro-
babilidades conjuntas (la mitad de las 16) en las que B b:
p(B =b) =LP(B,S,O,I)
~ b
Al utilizar esta frmula, obtenemos la probabilidad marginal p(B Verdadero) = 0,95, que es
el sumatorio de las 8 probabilidades conjuntas en las que B es Verdadero.
Las probabilidades conjuntas de orden menor, tambin se pueden calcular mediante el
sumatorio de las probabilidades conjuntas correspondientes. Por ejemplo, la probabilidad con-
junta p(B =b, S s) es el sumatorio de las 4 probabilidades conjuntas en las que B =b y S =s.
p(S =b,S =s) LP(B,S,
B=b,s=s
De ello, se sigue que, cuando se conocen las probabilidades conjuntas de orden menor,
podemos utilizar stas para calcular otras probabilidades marginales, u otras probabilidades
conjuntas de orden menor. De este modo, por ejemplo:
p(S =b) =LP(B,S)
B=b
y
p(B =b,S =s) = LP(B,S,O)
ll=b,S=s
Cuando tratamos con variables proposicionales (aquellas que tienen los valores Verdadero o
Falso), a menudo empleamos una notacin abreviada. Por ejemplo, algunas veces, en vez de
288
tener que escribir p(B= Verdadero, 8 = Falso), escribiremos p(B,....,8), asumiendo que las varia-
bles afirmadas han sido instanciadas a Verdadero y las negadas a Falso.Esta notacin slo se uti-
lizar cuando se deduzaca claramente del contexto que denotamos una probabilidad a las ins-
tanciaciones de las variables, ms que una distribucin de probabilidades sobre stas.
As, a partir de la funcin de probabilidad conjunta (en forma de tabla) para un conjunto de
variables aleatorias, en principio, podremos calcular todas las probabilidades marginales y todas
las probabilidades conjuntas de orden menor. Sin embargo, cuando tenemos un gran nmero de
variables aleatorias, la tarea de especificar todas las probabilidades conjuntas, dejando aparte el
clculo de las probabilidades de orden menor, se hace intratable. Afortunadamente, en muchas
aplicaciones, las probabilidades conjuntas satisfacen ciertas condiciones especiales que nos per-
miten la especificacin y la realizacin de los clculos de forma ms viable. Ms adelante des-
cribiremos estas condiciones.
19.1.2. Probabilidades condicionales
Ahora, lo que queremos es poder utilizar la informacin de los valores de algunas variables para
obtener las probabilidades de otras. Por ejemplo, si el robot apilador de bloques percibe que su
brazo no se mueve, podra querer calcular la probabilidad de que (dado ese hecho) la batera est
cargada. Estos clculos se denominan inferenciasprobabilsticas,como analoga a los mtodos de
inferencia lgica. Antes de explicar cmo se pueden realizar las inferencias probabilsticas debe-
mos definir lo que llamamos probabilidadescondicionales.
La funcin de probabilidad condicional de V, dado Vj se denota por p(VIVj). Para cualquier
valor de Vi y Vj, est funcin se define como:
p(VIVj) = p(V,Vj)
p(Vj)
donde p(V Vj) es la probabilidad conjunta de V y Vj, y p(Vj)es la probabilidad marginal de Vj.
A partir de esta expresin, podemos ver que tambin podemos escribir la probabilidad conjunta
sobre la base de la probabilidad condicional:
p(V Vj)::p(VIVj)p(Vj)
Volviendo al ejemplo del robot apilador de bloques, podemos calcular la probabilidad de que
la batera est cargada dado que el brazo del robot no se mueve mediante:
p(B= Verdadero18 Falso)= p(B=Verdadero,8=Falso)
p(8=Falso)
Tanto el numerador como el denominador de esta expresin se pueden calcular a partir de los
sumatorios de las probabilidades conjuntas, tal como ya hemos explicado.
Las probabilidades condicionales son fciles de entender bajo una interpretacin de las pro-
babilidades como frecuencias. En esta interpretacin, por ejemplo, p(8 :: Falso),es la relacin
(ratio) entre el nmero de veces que el brazo no se mueve y el total de veces que se intenta mover
(en algn experimento imaginario lIevado a cabo un nmero infinito de veces). Entonces, la pro-
babilidad de que la batera est cargada, dado que el brazo no se mueve, es el nmero de veces en
que el brazo no se mueve y que la batera est cargada, en relacin al nmero de veces en que el
brazo no se mueve. De este modo, una probabilidad condicional es la versin normalizada de una
probabilidad conjunta.
Los diagramas de Venn 1, como el que se muestra en la Figura 19.1, nos son tiles para ilus-
trar los conceptos de probabilidad conjunta y condicional (para un nmero pequeo de variables).
En este diagrama, mostramos dos elipses que se solapan, una denota las veces que el brazo no se
mueve (8 = Falso), y la otra denota las veces que la batera est cargada =Verdadero). Las
reas de las elipses, indicadas mediante notacin abreviada en la figura, son proporcionales a sus
probabilidades (marginales). El rea exterior a ambas elipses se corresponde con las veces en las
que el brazo se mueve y la batera no est cargada (P(8 Verdadero, B = Falso.
Fijmonos atentamente en las tres regiones disjuntas de las elipses, que son aquellas que se
corresponden con las ocurrencias conjuntas de; el brazo no se mueve y la batera no est cargada;
el brazo no se mueve y la batera est cargada y el brazo se mueve y la batera est cargada. Las
reas de cada una de estas regiones disjuntas son proporcionales a sus probabilidades conjuntas,
tal como se muestra en el diagrama. La forma en que calculamos una probabilidad marginal a
partir de las probabilidades conjuntas se saca fcilmente del diagrama: p(B):: p(B, +p(B,...., 8).
Tambin podemos tener probabilidades condicionales conjuntas de un conjunto de variables
condicionadas por otro conjunto de variables. Por ejemplo (con notacin abreviada):
B 1....,8, O) = - - - ' - ~ : : : . : . . . : . .
p(--,8,0)
Al calcular cualquier probabilidad condicional, las probabilidades conjunta y marginal que
aparecen en el cmputo se pueden calcular a partir de cualquier conjunto completo de probabi-
lidades conjuntas que contenga las variables requeridas, tal como hemos descrito antes.
Tambin podemos expresar una probabilidad conjunta sobre la base de una cadenade pro-
babilidades condicionales. Por ejemplo:
0, r, 8) p(Blo, r, 8)p(0Ir, 8)p(r 18)p(8)
p(,S) p(B)
\ ~
B Verdadero /
p(,S, ,B) p(B,S)
piS,
p{BI,S) p(B"S)/p(,S)
Figura 19.1.
Un diagrama de Venn.
I John Venn fue un lgico [Venn, 1880).
290
291
Lafonnagenricadeestareglaencadenadaes:
k
p(V,v;, ~ ) == IIp(vIv- ... , v)
~
Laexpresinde lareglaencadenadadependedelafonnaenqueescojamoselordende V.
Distintas ordenaciones nosdandistintas expresiones, perotodasellasnos deben darel mismo
resultadoparaelmismoconjuntodevariables.
Como el orden en que estn las variables en una funcin de probabilidad conjuntano es
importante(siemprequerecordemosculescul),podemosescribir:
p(V, "])=p(VI"])p("])== p("]IV)p(V)=p("],Vi)
Fijmonosentoncesenque:
p(V!"]}= p("]IV)p(V)
p("]) .
Estaltimaecuacinesmuyimportante.SellamateoremadeBayes2.
Vamos acomentarunanotacin final. Cuandotenemoslasprobabilidadesconjuntasde un
conjuntodevariables,olasprobabilidadescondicionalesdeunconjuntodevariables,sercon-
venienteutilizarlanotacindeconjuntos.As,algunavecesseutilizarp(1/)comoabreviacin
dep(V,...,Vk),donde1/={VI'...,Vk}Demanerasimilar,podramosutilizarlaabreviacinp(1!,
~ ) , donde~ tambinesunconjuntodevariables. Silasvariables(VI' ...,V) tienenlosvalores
k
vI' ...,vk respectivamente,lodenotaremosconlaexpresin1/=v, donde1/yvsernlistasorde-
nadas.
Inferencia probabilstica
19.2.1. Un mtodo general
Elescenariogenricoparalainferenciaprobabilsticaesaquelenelquetenemosunconjunto1/,
devariablesproposicionales Vi' ...,Vk' enelquenosdan,enfonnadeevidencia,unsubconjun-
todevariablesde1/,alquellamaremos'E, conunosvaloresdefinidos'E =e(VerdaderooFalso).
Enlasaplicacionesdeagentes,lasvariables disponiblestendrn,porlogeneral,unosvalores
detenninadosporlosprocesosperceptuales.Loquedeseamoses,calcularlaprobabilidadcon-
dicionalp(V=Vi I'E=e), esdecir, laprobabilidaddequealgunavariableV tengael valorVi' dada
dichaevidencia.Aesteprocesolollamaremosinferenciaprobabilstica.
ComoV puedetenerlos valoresVerdadero oFalso,existendosrrobabilidadescondiciona-
lesenlasquepodramosestarinteresados, asaber,p(V=Verdadero 'E=e)yp(V=FalsoI'E=
=e).Aunas, slonecesitaremoscalcularunadeellas,yaquep(V=VerdaderoI'E=e)+p(V=
::;: Falso!'E=e)== 1,independientementedel valorde'E. Vamos autilizarunmtododeclculo
2 ElteoremadeBayesseformulporprimeravezporel reverendoThomasBayes[Bayes, 1763].
Razonamientoconincertidumbre
exahustivoparaobtenerp(V= Verdadero!'E == e).Siutilizamosladefinicindeprobabilidad
condicional,tenemos:
p(V== Verdadero!'E == e)== p(V =Verdadero,'E == e)
p('E == e)
p(V== Verdadero, 'E =e) se obtiene utilizando lareglade clculo deprobabilidades de orden
menorapartirdelasdeordensuperior:
p(V == Verdadero,'E == e)= L p(V, .vk )
V=Verdadero,'l>e
dondeV, i= 1, ... ,kdefinenuestroconjuntodevariablesproposicionales.Esdecir,calculamosel
sumatoriode todos los valores delas probabilidadesconjuntasde cadaVi == Verdadero, cuyos
valoresseobtienendelas variables delaevidencia. El clculodep('E=e)sepuederealizarde
fonnasimilar, aunque, tal comosever, nosenecesitacalculardefonnaexplcita.
Comoejemplo,supongamosquetenemoslaprobabilidadesconjuntas:
p(p,Q, R)=0,3
p(P,Q, -,R)=0,2
p(P,-,Q,R)=0,2
p(P,-,Q,-,R)== 0,1
p(-,P,Q, R)== 0,05
p(-,P,Q,-,R)=0,1
p(-.P~ -.Q,R) =0,05
p(-.P,-,Q,-,R)== 0,0
Tenemos-.Rcomoevidenciay queremos calcularp(Q!-,R).Utilizandoel procedimiento
anterior,calculamos:
p(Q!-.R)
== p(Q,-.R)=[p(P,Q,-,R)+'p(-,P,Q,-,R)]
p(-,R) p(-,R)
(0,2+0,1)_ 0,3
p(-,R) p(-.R)
Ahorabien,podemoscalcularlaprobabilidadmarginalp(-,R)directamente,o(loquesesue-
lehacer)calcularp(-,Q!-,R)conel mismomtodo,evitandoelclculodep(-,R),aprovechando
quep(Q!-.R)+p(-,Q!-,R)= 1. Utilizaremosel segundomtodo:
=p(-,Q,-,R)= [p(P,-.Q,-,R)+p(-,P,-,Q,-,R)J
p(Q!-.R)
p(-,R) p(-,R)
(0,1+0,0) 0,1
= --
p(-,R) p(-,R)
Yaquelasumadeestosdosresultadosdebeserigualauno,tenemosquep(Q!-,R)=0,75.
292
Por lo general, la inferencia probabilstica mediante este mtodo es intratable, ya que para
aplicarlo a casos en los que tenemos k variables, necesitamos un lista explcita de las 2k proba-
bilidades conjuntas p(V, V
2
, , V
k
). Para muchos problemas que nos interesan, no podramos
anotar dicha lista aun conocindola (que no suele ser el caso).
En vista a este problema, nos deberamos preguntar cmo razonan las personas con incer-
tidumbre de forma eficiente?. Pearl [Pearl, 1986; Pearl 1988, y Pearl, 1990] conjetur que lo
hacemos formulando nuestro conocimiento sobre un dominio de una forma especial, que sim-
plifica enormemente los clculos de las probabilidades condicionales de ciertas variables, dada la
evidencia, sobre de ellas. Esta forma de representar el conocimiento eficientemente involucra lo
que se denominan independencias condicionales sobre las variables, el tema del que vamos a
hablar seguidamente.
19.2.2. Independencia condicional
Decimos que una variable Ves condicionalmente independiente de un conjunto de variables 'Vi'
dado otro conjunto 'fI, cuando p(VI 'Vi' 'fI) =: p(vl 'fI). Utilizamos la expresin (V, 'Vi I'fI) para
manifestar este hecho. La idea intuitiva es que si tenemos (V, 'Vi I'fI), entonces 'Vi no nos da ms
informacin sobre V de la que ya sabamos con \!j, y en lo que se refiere a V, si conocemos 'fI,
podemos ignorar 'V. En nuestro ejemplo del apilamiento de bloques, parace razonable pensar que
si ya sabemos (mediante cualquier otro medio) que la batera est cargada (B = Verdadero)
entonces, en tanto que estemos interesados acerca de si el brazo se mueve (S), no necesitamos el
conocimiento explcito acerca de 1 (el indicador que carga de la batera), es decir, p(S lB, n;;;:
;;;:p(SIB).
Si una variable Vi es condicionalmente independiente de otra variable \!j, dado un conjunto 'V,
tenemos (por definicin) que p(VI\!j, 'V);;;: p(V;W). A partir de la definicin de la probabilidad
condicional, tenemos que p(V l\!j, 'V )p(\!j W) =p(V, \!j W). Combinando estas dos expersiones,
obtenemos:
p(V, \!j I'V) =: p(VW )p(\!j W)
para el caso en el que (Vi' \!j W). Nos debemos fijar en que V; y \!j aparecen de forma simtrica.
Por tanto, decir que V; es condicionalmente independiente de \!j, dado 'V, es lo mismo que decir
que \!j es condicionalmente independiente de V;, dado 'V. Esto es suficiente para decir que V y \!j
son condicionalmente independientes dado 'V. Este mismo resultado se puede aplicar a cOrUuntos
de variables, a saber, si 'Vi y 'fI son condicionalmente independientes dado 'V (es decir, ('V, 'fI1
'V, entonces p('V, 'fIW) =: p('V W)P('fII'V), Si 'V est vaco (0), simplemente decimos que 'Vi y
'fI son independientes.
Como generalizacion de la independencia entre parejas, decimos que las variables VI' ..., V
k
son mutuamente independientes, dado un c0rUunto 'V, si cada una de las variables es condicio-
nalmente independiente de todas las dems, dado 'V. Como:
k
p(VI' V2' .. " VkW) = TI p(V ... , VI' 'V)
=I
y, como cada V; es condicionalmente independiente de las otras dado 'V, tenemos que:
k
p(V
I
, V
2
' ... , V
k = TI p(V;I'V)
=I
En el caso en que 'V est vaco, tenemos:
p(V, V
2
' ... , V
k
) = p(V)p(V
2
) ... p(V
k
)
y decimos que las variables son incondicionalmente independientes.
Las independencias condicionales se pueden representar adecuadamente con las estructuras
denominadas redes bayesianas (tambin se las denomina redes de creencias). Estas estructuras
son muy tiles en la inferencia probabilstica. Las independencias condicionales representadas
mediante redes bayesianas nos llevan a grandes ahorros en los clculos de la inferencia proba-
bilstica.
Redes bayesianas
Una red bayesiana es un grafo dirigido acclico (GDA) cuyos nodos estn etiquetados con varia-
bles aleatorias. Una red bayesiana estipula que cada nodo Vi del grafo es condicionalmente
independiente de cualquier subconjunto de nodos que no sean descendientes de Vi' dados sus
padres, es decir, JI (V) es cualquier subconjunto del grafo que no es descendiente de Vi' y P (V)
son los padres de V; en el grafo. El grafo slo es una forma de representar que, para todo Vi en el
grafo, (Vi' JI(V)IP(V, es lo mismo que decir que p(Vj JI (V), P(V p(VIP(V).
Sean VI' V
2
... , V
k
los nodos de una red bayesiana. Con la asuncin de independencia condi-
cional que hemos descrito para la red, podemos definir la probabilidad conjunta de todos los
nodos como:
k
p(V
I
, V
2
' ..., V
k
) = TI p(VIP(V
=1
Esta expresin se puede derivar fcilmente aplicando las independencias condicionales a la
expresin de la regla encadenada de la probabilidad conjunta de todas las variables utilizando
cualquier orden de la regla que sea consistente con el orden parcial implcito en la red bayesiana
(un GDA).
Algunas veces, a las redes bayesianas se las denomina redes causales cuando los arcos que
conectan los nodos se pueden interpretar como la representacin de relaciones causales directas.
A menudo, los expertos son capaces de relacionar causas y efectos de una forma que revelan
independencias condicionales inherentes que son representables mediante una red bayesiana. La
estructuracin de redes bayesianas utilizando la nocin intuitiva de causalidad, por lo general,
genera redes para las cuales las asunciones de independencia condicional resultan ser adecuadas.
En las palabras del investigador [Heckerman, 1996, p. 14]: ... para construir una red bayesiana
de un conjunto de variables dibujamos arcos desde las variables (nodos) causa a los nodos efec-
to. En la mayora de los casos, se obtiene una red causal [cuyas implicaciones de independencia
condicional suelen ser precisas].
Vamos a ilustrar la construccin de una red bayesiana mediante nuestro ejemplo del apila-
miento de bloques. Comenzaremos con lo que imaginamos son las primeras causas en este
dominio, a saber, las variables que se corresponden con las proposiciones la batera est carga-
da (B) y el bloque se puede levantar (L). By L son causas de S (<<el brazo se mueve), y B es
una causa de 1 (<<el indicador muestra que la batera est cargada). As, dibujaramos la red
bayesiana de este problema como la que se muestra en la Figura 19.2. Fijmonos en que, sobre
otra.<; cosas, la red explicita que p(SII, B, L) =p(SIB, L). Si hubiese un nodo en la red, llammoslo
294
E (cuyosignificadofuese queelbloqueestelevado), nopodrasucederquep(SIY, B, L, ~ =
p(SIB, L), porque E\ela undescendientede S (queel bloqueestelevadoinfluyea laproba-
bilidaddequeel brazo se mueva. Dequotraformapodraelevarseelbloque?).Laexpresin
delaprobabilidadconjunta detodoslosnodosdelaredsemuestraenlafigura.
VemosqueparaOOer calcularelvalordelasprobabilidadesconjuntasdadasporlaredbaye-
siana necesitamos cooocer las funciones de probabilidad condicional de cadanodo de la red
queestinfluidoporSllS padres,talcomosepuedeobservarenlaFigura19.2.Paralosnodossin
padres, las probabilidades noestncondicionadas porotros nodos, porlo que se les denomi-
naprobabilidades apriori de estas variables (nodos). Portanto, unaespecificacin completa
de las probabilidadede unconjunto de variables aleatorias significateneruna red bayesiana
deestasvariables,jUIIIO alastablasdeprobabilidades condicionales (TPC)decadanododelared.
Lafrmulade lafimcin deprobabilidadconjuntadelaredbayesianadenuestroejemplodel
apilamientodebloques se podracompararconunaparecida(sinindependenciascondicionales),
queseobtendramediante lareglaencadenada:
S,B, L)p(SIB, L)p(BIL)p(L)
Fijmonosen que la frmula de laredbayesianaesmuchomssencilla. Sinlasindepen-
denciascondicionale&especificadas enlaredbayesiana,laespecificacindelaprobabilidadcon-
juntaparalascuatrovariables delejemplorequierenlaespecificacinde16probabilidadescon-
juntasdistintas(enrealidad, slode 15, yaquetodasdebensumar 1).Talcomoseevidenciaen
laFigura 19.2, las alUllCones hechasenlaredbayesiananos permitentenerquecalcularslo
ochoprobabilidades.Cuando haymuchasindependenciascondicionalesentrelasvariablesdel
dominio, laexpresioode laprobabilidadconjuntaque se calculaa partirde lared bayesiana
necesitalaespecificacin demuchas menos probabilidades que la,> quenecesitarasindichas
independencias.Estlreduccinconvierteentratablesmuchosproblemasque,deotromodo,no
loseran.
p(S lB, L) = 0,9
p(S lB, -,L) = 0,05
p( S I -,B, L) = 0,0
Tablas deprobabilidadescondicionales
miadasacadanodoconpadres
p(G,B,S: =p(GIB)p(SIB,L)p(B)p(L)
Figura 19.2.
Unaredbayesiana.
Patrones de inferencia en redes bayesianas
Haytrespatronesimportantesdeinferenciaenlasredesbayesianas.Paraexplicarlos,seguiremos
connuestroejemplo.
Inferenciacausal(odescendente). Supongamosquedeseamoscalcularp(SIO),laproba-
bilidaddequeelbrazosemuevadadoqueelobjetosepuedeelevar. Comoel hechodeque
elobjetoseaelevablees unadelas causasde queelbrazopuedamoverse, decimos que
esteclculoesunejemploderazonamiento causal. AOseledenominaevidencia utiliza-
da enlainferencia,ya Selnodo de consulta. Asescmorealizamoslainferencia: pri-
mero,expandimosp(SIO)(laprobabilidadmarginal)enel sumatoriodedosprobabilidades
conjuntas(porquedebemostenerencuentaalotropadredeS,B):
p(SIO)=peS, BIO) +pes,-,BIO)
Luego,queremosqueSestcondicionado,tantoaesteotropadre,comoaO, asqueuti-
lizamoslaexpresindelareglaencadenadaparaescribir:
=p(SIB, O)p(-,BIO)
Perop(BIO)=p(B)(seobtienedelapropiaestructuradelared;fijmonosenqueB no
tienepadres). E igualmente,p(--,BIO)=p(-,B).
Portanto,p(SIO)=p(SIB,O)p(B)+ p(SI-,B,O)p(--,B). Comotodas estascantidades se
danenlared,podemoscalcularlasyobtener:
=0,855
Lasoperacionesquehemosrealizadoenesteejemplomerecenanotarse,porquepueden
generalizarseaversionesmscomplejasderazonamientocausal(talcomoveremosms
adelante).Lasprincipalesoperacionesson:
a) EscribirlasprobabilidadescondicionalesdelnododeconsultaV, dadalaevidencia,
entrminosdelaprobabilidadconjuntadeV ytodos suspadres(loscualesnosonla
evidencia),dadalaevidencia.
b) Expresarestaprobabilidadconjuntacomolaprobabilidad de V, condicionadapor
todos suspadres.
Inferenciadediagnstico(oascendente).Ahoravamosacalcularp(--,O--'S), laprobabili-
daddequeelbloquenosepuedaelevardadoqueelbrazonosemueve.Aqu,lospapeles
delaconsultaydelaevidenciasonalainversaalosdelltimoejemplo.Comoestamos
utilizandounefecto(osntoma)parainferirunacausa,aestetipoderazonamientolodeno-
minaremosrazonamiento de diagnstico.
I
p(--,Ol-,S) = (teoremadeBayes)
p(-,S)
Ahoracalculamosp(-.S-' O)=0,9525(medianterazonamientocausal),yluegosustitui-
0,9525xO,3 0,28575 De' al od (L'-S) p(-,s IO)p(O)
p(-,()-,S) = =.19u m o,p =-'---.:._-.:..:.....:......:.. mosen I 1----'
p(-.S) p(-,S) p(-.S)
=0,0597xO, 7 = 0,03665
p(-.S) p(-,S)
y comoambasexpresionesdebensumar1,tenemosp(-,O-'S) =0,88632.
Losclculos que hemos realizado eneste sencilloejemplode razonamientode diag-
nsticotambinsepuedengeneralizar. Elpasoprincipaleslautilizacindelteoremade
BayesparaconvertirelproblemaaunoderazonamientocausaL
Inferenciaintercausal (ojustificacin).Sinuestranicaevidenciaesque....,S (el brazono
semueve),podemoscalcularlaprobabilidaddequeelbloquenosepuedaelevar,....,0, tal
comohicimos.Perosi tambintenemos-,B(labateranoestcargada),entonces....,0debe-
ra sermenos cierto (tener menos peso). En este caso, decimos que -,Bjustifica
haciendoa-,0menoscierto. Estetipodeinferenciautilizaunprocesoderazonamiento
causal(odescendente)incrustadoenunprocesodediagnstico(oascendente).
p(-,Ol-,B,-,S) =p(-,S,-,BI....,O)p(-,O) (teoremadeBayes)
p(....,B,-,S)
p(-.S /-,B,-,O)p(-,B/-,O)p(-.O) (def d 1 b bili'dad di' al)
= . e apro a con Clon
p(-,B,-,S)
p(-,S / -,B-,O)p(-,B)p(-.O) d'
:;' (estructuradelare bayeslana)
p(-,B,-,S)
Deestaexpresin,utilizandolasprobabilidadesdelared,yresolviendop(-.B, dela
formahabitual,obtenemosp(-,Ol-,B,-,S)=0,030, queestalcomoesperbamos,mucho
menorquep(-,Ol-,S)(calculadoanteriormente).Otravez, nosdebemosfijarenelusodel
teoremadeBayes,queesunpasobastanteimportantedelajustificacin.
Evidenciaconincertidumbre
Laexpresinp(VI E), dondeVes unnodoconsulta,nonosdalaprobabilidadcorrectacuandola
evidenciaeesincierta.Enlosclculossobrelaredbayesiana,parapoderobtenerlosnodosde
evidencia, debemos tener la certeza sobre laverdad o la falsedad de las proposiciones que
representan.Podemosalcanzaresterequisitosmedianteunadistribucinenlaquetengamoscada
nododeevidencia(losquesoninciertos)conunnodohijo,delcualtengamoscerteza.Entonces,
enel ltimoejemploquehemosvisto(eldejustificacin)podramossuponerqueel robotnotie-
necertezaacercadesisubrazonoseestmoviendo(podratenerunsensorpocofidedigno). En
esecaso,laevidenciasepodraobtenerdeunnodo S ', querepresentaralaproposicinelsen-
sordelbrazodicequeelbrazosehamovido.Podemostenerlacertezaacercadesidichapro-
posicinesciertaofalsadependiendodesulectura.Entonces,laredbayesianaseutilizarapara
calcularp(-,O-'B, -,S'),envezdep(-,O-'B, -,S).Desdeluego,lasrednecesitaralosvaloresde
peS 'IS) ydepes 'I-,S),querepresentaranlafiabilidaddel sensor.
FijmonosenquelareddelaFigura 19.2ya nosdabainformacinacercadequenopode-
mostenercertezasobresilabateraestabaonocargada.ElnodoBtiene unnodohijo l,expre-
sandocmodefiable eraelindicadormediantelasprobabilidadesp(lIB)yp(ll-,B).Dejamosal
lectorelclculodep(-,Ol-,B,-,S')(quiztrasunalecturamsavanzada).
-lo
Aunconlassimplificacionesquenosdalaredbayesiana,elmtodoexhaustivoqueacaba-
mosdeutilizarparael clculodelasdiversasprobabilidadescondicionalesapartirdelaproba-
bilidadconjuntaes,porlogeneral,intratableenredesgrandes.Enelpeorcaso,lacomplejidaddel
algoritmocrecedeformaexponencialenrelacinalnmerodevariablesproposicionales. Por
suerte,existenvariosmtodosabreviadosparaelclculodelasprobabilidadescondicionalesen
redesconformasespeciales.Consideraremosalgunosdeestosmtodosdespusdepresentarotra
consecuenciadelasindependenciascondicionalesenlasredesbayesianas.
Separacin-d
Ocurrequeunaredbayesianatienemsindependenciascondicionalesquelasquesloinvolu-
cranalospadresdeunnodo. Porejemplo,enlaFigura 19.2,p(Sll,B) =p(SIB), esdecir, S es
condicionalmenteindependientede l dadoB(aunqueno nosdanambospadresdeS).Deforma
intuitiva,elconocimientodel (efecto) l puedeinfluirsobreel conocimientodela(causa) B, el
cualinfluyesobreelconocimientodel(otroefecto) S. PerosinosdanlacausaB, nohaynada
quenospuedadecirl acercadeS.Enestecaso,decimosqueBsepara-d(separacindependiente
deladireccin)aSdeI.
Existenotrostiposdeindependenciascondicionalesenlasredesbayesianas.Vamosahablar
deellas,peroconsltese[Pearl, 1988,pp. 117-122]paraverlasdemostraciones.
Dos nodos Vi y V son independientes condicionalmente dado un conjuntode nodos E (es
decir,I(V" V le si V quecumplealgu-
delas tres ..._--
@ V
b
perteneceae, yambosarcossalendeV
b
V
b
perteneceaE, yunarcovahaciaV
b
yelotroarcosaledeL
Ni V
b
niningndescendientesuyopertenecenae, yambosarcosvanhaciaV
b

NodosdelaevidenciaE

Dadoelconjuntodenodosdelaevidencia, V, esindependientede V debidoaquelostrescaminossebloquean
entres. Losnodosquebloqueanson:
a) V. , esunnodoevidencia,y ambosarcossalendeVbI'
b) V
b2
esunnodoevidencia,y unarcovahacialyotrosaledel.
e) V
b3
noesun nododelaevidencia,ni ningunodesusdescendientes,ylosdosarcosvanal.
Figura19.3.
Independenciacondicionalmediantenodosbloqueadores.
Cuandocualquieradeestas tres condiciones secumple,decimosqueelnodoV
b
bloquea el
caminodadolO. Tengamosencuentaquelos caminos(rutas) delos quehablamos soncaminos
indirectos,es decir, caminosqueignoranladireccindelosarcos. Sitodos loscaminosentreVi
y v estnbloqueados,entoncesdecimos queE separa-dVi de v (separacindependientede la
direccin),yconcluimosqueVi y v sonindependientescondicionalmentedadolO. Ejemplosenla
Figura19.2deindependenciacondicionalporcausadelaseparacin-dson:
1(1,OIB); porlaregla1, Bbloqueael(nico)caminoentre 1 y0,dadoB; porlaregla3, 8
tambinbloqueaestecaminodadoB,porque8 noesmiembrodelconjuntodeevidencia.
1(1, O) YI(B, O); porlaregla3, 8 bloqueael(nico) caminoentre 1 y 0,yentreBy 0,
dadoelconjuntodeevidenciavaco(8noes miembrodelconjuntodeevidencia).
Sinembargo,nos debemosfijarenqueB ynosoncondicionalmenteindependientesdado
8,yaque,aunque 8 estenelcaminoentreBy0,los dosarcosdeestecaminovana8,y 8 per-
tenecealconjuntodeevidencia;portanto, 8 nobloqueaelcaminoentreB yO.
Elconceptodeseparacin-dtambinsepuedeaplicaraconjuntosdenodos.Dosconjuntos'Vi
y'V soncondicionalmenteindependientesdadoE, siestnseparados-dporE; esdecir, sicadacami-
no(ruta)nodirigidoentretodoslosnodosde'Vi ytodoslosnodosde'VestnbloqueadosdadolO.
Aunconlautilizacindelaseparacin-d,lainferenciaprobabilsticaenredesbayesianases,
porlogeneral,NP-duro[Cooper, 1990].Sinembargo,sepuedenhaceralgunassimplificaciones
paraunaclasemuyimportantederedes,denominadapolirboles.Unpolirbol esunGDAenel
que, paracadapardenodos, slohayuncaminoalolargodelosarcos encualquierdireccin
(reddeconexinnica). Porejemplo,lareddelaFigura19.2esunpolirbol.Vamos amostrarel
funcionamientodelainferenciaprobabilsticaenpolirbolesconunejemplomsdesarrollado(el
mtodo que vamos a mostrar est basado en un algoritmo propuesto por [Russel y Norvig,
1995,p. 447Yss.]).
Inferencia probabilstica en polirboles
LaredquesemuestraenlaFigura19.4eseltpicoejemplodepolirbol.Loquequeremosescal-
cularlaprobabilidaddeQ apartirdelosotrosnodosenlared. Fijmonosenquealgunosnodos
estnconectadosaQ slomediantesuspadres;entoncesdiremosqueestosnodosestnpor enci-
7\7 P3\7
ps. P 6 ~ _
Q
P8
P12 P14
Figura19.4.
Unpolirboltpico.
ma deQ. Losotrosnodosestnconectadosslomediantesus sucesoresinmediatos(sushijos);
diremosquestosestnpor debajo deQ. Tambinnosdebemosfijarenquenohayningnotro
camino(ruta)exceptolosqueunenunnodoporencimadeQ aunnodopordebajodeQ (sinola
redyanoseraunpolirbol). Estasdefinicionesypropiedadesdeconectividadseaplicanatodos
losnodosdelpolirbol!Tendremostrestiposdeevidencia:
1. Todos los nodos de laevidenciaestnporencimade Q (apoyocausal). Comoejemplo
tpicodeestetipodeevidencia,calcularemosp(Qlp5, P4).
2. Todoslos nodosdelaevidenciaestnpordebajodeQ (apoyoevidencial).Comoejemplo
tpicodeestetipodeevidencia,calcularemosp(QIP12, P13, P14, Pll).
3. HaynodosdelaevidenciaporencimaypordebajodeQ.
19.7.1. Apoyocausal
Vamosacalcularp(QIP5, P4),dondetodoslosnodosdelaevidenciaestnporencimadeQ. El
clculoesuntraceadodelaejecucindeunalgoritmorecursivoascendientequecalculalapro-
babilidaddecadaantecesordeQ, dadalaevidencia,hastaquesealcanzalaevidenciaohastaque
laevidenciaestpordebajodelantecesor.Elalgoritmosecomportadelasiguientemanera:
Primeroinvolucramosalospadres(deQ):
p(Qlp5, P4)= L p(Q, P6,P71p5, P4)
P6,P7
(Lanotacinespecialqueseutilizaparaindexarestesumatorioesparaindicarqueaadimos
cuatroversionesdep(Q, P6, P71p5, P4),laoriginal,unacon-,P6envezdeP6,otracon-,P7en
vezde P7,Ylaltimacon-,P6y-,P7).
Luego,introducimosalospadresdeQ comopartedelaevidenciausandoladefinicindela
independenciacondicional:
p(Q, P6, P71p5, P4)=p(Qlp6, P7, P5, P4)p(P6, P71p5, P4)
Conlasustitucin,obtenemos:
p(QIP5, P4)= L p(QIP6, P7, P5, P4)p(P6, P71p5, P4)
P6,P7
Ahora, como un nodo es condicionalmente independiente de sus antecesores, dados sus
padres:
p(QIP5, P4)= L p(QIP6, P7)p(P6, P71p5, P4)
P6,P7
Entonces,laseparacin-dnospermitefragmentaralospadres:
p(Qlp5, P4)= L p(Qlp6, P7)p(P6Ip5,P4)p(P7Ip5,P4)
P6,P7
Y, finalmente, la separacin-dnos permiteignorarlaevidenciaporencimade unos de los
padresalcalcularlaprobabilidaddelotropadre:
p(QIP5, P4)= L p(Qlp6, P7)p(P6Ip5)p(P7Ip4)
P6,P7
300
301
Es muy importante fijarnos en que los tnninos que se suman son a) las probabilidades del
nodo de consulta, dados los valores de sus padres (cuyas probabilidades se dan en la red
bayesiana), y b) las probabilidades de cada uno de los padres se dan a partir de la evidencia por
encima de ellos (mediante una l1amada recursiva al algoritmo que estamos describiendo).
Estos resultados se siguen de fonna directa por el hecho de que estamos trabajando con un
poli rbol.
Este mismo procedimiento se aplica recursivamente hasta que finalmente se alcanzan los
nodos que tienen un nodo de la evidencia como padre o los que no tienen padres (nodos que ellos
mismos no son evidencia). El primero de los dos casos lo tenemos en el clculo de p(P7Ip4),
donde el nodo de la evidencia P4 es uno de los padres del nodo de consulta P7. En este caso, el
proceso de involucrar a los padres es ms sencillo, ya que uno de los dos padres de P7 ya ha
sido involucrado. Como p(P7, P31P4) = p(p7lp3, P4)p(P31P4), podemos escribir:
p(p7lp4) = Lp(p7lp3, P4)p(P3Ip4) = Lp(p7Ip3, P4)p(P3)
P3 1'3
(El ltimo paso se sigue de I(P3, P4).) Todos los trminos del sumatorio se obtienen de la red
bayesiana, entonces, el procedimiento para el ejemplo finaliza en esta ramificacin.
Al calcular p(P6Ip5), obtenemos:
p(P61p5) = I p(P6Ip1, P2)p(P1Ip5)p(P2)
P1,P2
Aqu debemos calcular P{P1Ip5), y nos fijamos en que el nodo de la evidencia no se encuen-
tra por encima del nodo de consulta, sino por debajo, por lo que no podemos proseguir con
la llamada recursiva, pero debemos utilizar el procedimiento de apoyo evidencial (que an
no hemos descrito). En este ejemplo, simplemente, utilizamos el teorema de Bayes para obte-
ner p(p1Ip5);;;: p(P51 P1)p(P1) . Despus, todas las cantidades que se necesitan para calcular
p(P5)
p(p6Ip5) se dan en la red bayesiana. Podemos juntar todos estos resultados (realizando todos los
sumatorios) para obtener la respuesta final de p(Qlp5, P4).
19.7.2. Apoyo evidenciaJ
Seguidamente, vamos a calcular p(Qlp12, P13, Pll), donde todos los nodos evidencia
estn por debajo de Q. Nuestros clculos, otra vez, van a ser el traceado de la ejecucin de un
algoritmo recursivo. Su funcionamiento es que en el nivel principal utilizamos la regla de bayes
para escribir:
p(P12, P13, P14, P111 Q)p(Q)
p(QIP12,
P14, Pll) p(P12, Pll)
= kp(P12, P13, P14, Plll Q)p(Q)
donde k;;;: 1 es un factor de nonnalizacin que se calcular ms adelante,
p(P12,P13,P14,Pll)
de la misma fonna como lo hicimos en los ejemplos iniciales. Por separacin-d I({p12, P13 },
{P14, Pll}lQ), obtenemos
p(Qlp12, P13, P14, Pll) = kp(P12 f p13IQ)p(P14 t pllIQ)p(Q)
Nos tenemos que fijar en que hemos separado el conjunto {P12, P13, P11} en dos
subconjuntos correspondientes a los dos hijos de Q. Cada uno de los tnninos p(P12, P131Q) Y
p(P14, PllIQ) son un caso del clculo de la probabilidad de un conjunto de nodos de consulta,
dado un nico nodo de la evidencia que est por encima de ellos. Entonces, podemos utilizar un
algoritmo parecido al anterior. Como slo hay un nico nodo de la evidencia, es conveniente uti-
lizar el algoritmo recursivo descendente en vez del ascendente.
Vamos a ilustrar el funcionamiento de la versin descendente en el clculo de p(P12,
P 13IQ). El paso clave es involucrar al nico hijo de Q, P9, que est por encima del conjunto de
nodos de consulta {P12, P13}. Primero, fijmonos en que p(P12, P13, P9IQ) =p(P12,
P13lp9, Q)p(p9IQ), por la definicin de la independencia condicional. Entonces:
p(P12, p1 I p(P12, P13IP9, Q)p(P9IQ)
P9
Ahora, por la separacin-d de I({ P13}, QIP9), tenemos
p(P12, P13IQ):: I p(P12, P13IP9)p(P9IQ)
P9
De los tnninos del sumatorio, p(P9IQ) se calcula involucrando a todos los padres de P9:
p(p9IQ):: I p(P9IP8, Q)p(P8)
P8
p(p9Ip8, Q) se da en la red. El otro trmino, p{P12, P13lp9) es una llamada recursiva al pro-
cedimiento ascendente que calcula la probabilidad del conjunto de nodos de consulta dado un ni-
co nodo de la evidencia, que est por encima de ellos. En este caso, la llamada recursiva finaliza
despus de un paso, ya que los hijos de P9 son los nodos de la evidencia. Como P12 y P13 son
independientes dado P9, tenemos que p(P12, P13Ip9):: p(P12, p9)p(P13lp9). Ambas proba-
bilidades se dan en la red.
Aplicando el procedimiento descendente sobre p(P14, P11IQ), obtenemos:
p(P14, P111Q) = I p(P14, P11lp1 O)p(P1 OIQ)
P10
y entonces:
p(P14, PllIQ) I p(P14, P10),p(Plllp10)p(P10IQ)
1'10
porque J(P14, Plllp10). Slo el tnnino central de la multiplicacin no se da en la red; enton-
ces utilizamos el procedimiento descendente para calcularlo:
p(PllIP10);;;: I p(plllp15, P10)p(P1
P15
Aqu:
p(P15, P10);;;: I p(P15I P10, P1 1)
P11
302 303
0,95
0,90
0,80
p(Q)=0,05
p(V I S) =0,99
p(V!-.S)=O,1
Peroenp(PllIP15,P1O), elnododeconsultapllestporencimadelosnodosdelaevi-
dencia,asqueaplicamosotravezelnivelprincipaldelprocedimiento(medianteelteoremade
Bayes):
p(P15,P10IPll)p(Pll) :::k}J(P15, P1
p(PllIP15,P1 l)p(Pll)
::: p(P15,P10)
donde k
l
1 Yp(p11)sedadirectamenteenlared. Elalgoritmofinalizacon:
p(P15,P10)
5,P10Ipll):::p(P15Ip10,Pll)p(P10IPll):::p(P1 O, P1 O)
porque p10Y P11sonindependientes.
Ahorasepuedenagrupartodoslosresultados,ylossumatorios,ykYk
l
sepuedencalcular,
paraobtenerlarespuestafinal dep(Qlp12,P13, P14,Pll).
La complejidaddelosdosalgoritmos,eldeapoyocausalyeldeapoyoevidencial,eslineal
enrelacinalnmerode nodosenlared(sloconpolirboles).
19.7.3. Apoyoscausalyevidencial
SidisponemosdelaevidenciaporencimaypordebajodeQ, comoen:
p(QI{P5, P4},{ P13,P14,Pll})
separamoslaevidenciaenel subconjuntodeapoyocausalE+, yenel de apoyoevidencial10-, y
utilizamoselteoremadeBayesparaescribir:
p(Qle+,e-) ::: p(e-IQ, e+)p(Qle+)
p(e- 110+)
Comoeshabitual,tratamos 1 comounfactordenormalizacin,yescribimos: k
2
p(e- I e+)
p(Qle+,e-) k1P(e-IQ,e+)p(Qle+)
FijmonosenqueQsepara-dee- dee+, deestamanera:
p(Qle+,e-)== k1P(E-IQ)p(Qle+)
Ya calculamos laprimera probabilidad como parte del procedimiento descendente para
calcularp(Qle-);ylasegundaprobabilidadsecalculdirectamenteconelprocedimientoascen-
dente.
19.7.4. Unejemplonumrico
Vamosademostrarnumricamentelautilidaddeestosmtodosconunpequeoejemplo,apar-
tirdelpoHrbolabstractoquesemuestraenlaFigura 19.5.Loquequeremosescalcularp(QIU).
Como es habitual en el razonamiento de diagnstico, primero utilizamos el teorema de
Bayesparaobtener:
l
p(QIU):::kp(UIQ)p(Q), donde k -
p(U)
=0,01
p(P I R, Q)=
p(PIR,-,Q)=
p(P I-,R, Q)
p(P I-,R, -.Q)= 0,01
p(U!P)=0,7
p(UI-,P)=O,2
Figura19.5.
Unpequeopolirbol.
Elalgoritmodescendentecalculadeformarecursiva:
p(uIQ)::: Lp(ulp)p(PIQ)
p
p(PIQ)== L p(PIR,Q)p(R)
11
p(pIR,Q)p(R)+p(PI-.R,Q)p(-.R)
::: 0,95x0,01 +0,8 x0,99== 0,80
p(-.pIQ)::: 0,20
p(UIQ)::: p(ulp)x0,8+p(ul-.p)x0,2
:::: 0,7x0,8+0,2x0,2::: 0,60
p(QIU):::kx0,6x0,05:::k:::0,03
p(-.Qlu) kp(ul-.Q)p(-.Q)
p(UI-.Q)::: Lp(ulp)p(p!-.Q)
p
p(PI-.Q)::: Lp(pIR,-.Q)p(R)
11
:::= P\.PIK, -.Q)p(R)+p(P!-.R,-.Q)p(-.R)
::: 0,90x0,01 +0,01 x0,99:::0,019
p(-.pl-.Q)::: 0,98
p(UI-.Q):::p(UIP)x0,019+p(u!-.P)x0,98
::: 0,7x0,019+0,2x0,98:::0,21
p(-.Qlu):::kx0,21 x0,95:::kx0,20
Deestamanera,k:::4,35,y, finalmente,
p(QIU) ::: 4,35x0,03::: 0,13
304
Inteligencia artificiaL Una nueva sntesis
Los clculos como los de este ejemplo se pueden organizar para evitar subclculos redun-
dantes. Uno de estos mtodos se basa en utilizar lo que se denomina eliminacin del comparti-
miento [Dechter, 1996].
Cuando la red no es un polirbol, los procedimientos recursivos que acabamos de describir no
finalizan, debido a los mltiples caminos (rutas) que hay entre los nodos. Se han propuesto otras
tcnicas para tratar estas redes ms complejas. Entre ellas est un mtodo de Monte CarIo
(denominado muestreo lgico [Henrion, 1988]). En esta n i ~ las probabilidades marginales de
los nodos padres se utilizan para asignar valores aleatorios (como Verdadero o Falso) a dichos
nodos. Luego, estos valores se utilizan junto con las TPC de sus descendientes para asignar valo-
res aleatorios a dichos descendientes, y as se va recorriendo por la red. Finalmente, cada nodo en
la red dispone de un valor. Este proceso se repite varias veces, y almacenamos todos los valores
asignados a los nodos. En el lmite de un nmero inifinito de intentos, los valores de los nodos
sern consistentes con la probabilidad conjunta de los nodos especificados en la red, y con las
TPC. Despus de un nmero grande de intentos, podemos estimar p(Q, mediante la divisin
del nmero de veces que Q y E han sido asignados a Verdadero entre el nmero de veces que E ha
sido asignado a Verdadero. Est claro que se puede utilizar este mismo mtodo para calcular la
probabilidad conjunta de un conjunto de nodos de consulta dado un conjunto de nodos de la evi-
dencia.
Otro mtodo, denominado de agrupamiento [Lauritzen y Spiegelhalter, 1988], agrupa los
nodos de la red en meganodos, de tal modo que el grafo de los meganodos es un polirbol. Los
posibles valores de los meganodos son todas las combinaciones de los valores de sus nodos com-
ponentes. Entonces, se le puede aplicar el algoritmo del polirbol, pero ahora tenemos varias TPC
por cada meganodo, dadas las probabilidades condicionales de todos los valores de los megano-
dos, condicionadas por todos los valores de los nodos padre (los cuales pueden ser, a su vez,
meganodos ).
Hay varios libros de texto sobre probabilidades que se pueden consultar para suplir nuestro
breve repaso; [Feller, 1968] es uno de ellos.
Algunos investigadores piensan que el razonamiento no monotnico se puede tratar mejor
con los mtodos probabilsticos, vase, por ejemplo, [Goldszmidt; Morris, y Pearl, 1990].
En IA, los trabajos sobre inferencia probabilstica mediante redes bayesianas comenzaron con
[Pearl, 1982a, y Kim y Pearl, 1983], quienes desarrollaron los algoritmos de paso de mensajes
para los rboles y los polirboles. El mtodo que hemos descrito en este captulo sobre polir-
boles est basado en el de [Russell y Norvig, 1995, p. 447 y ss.]. Nuestro tratamiento sobre las
redes bayesianas ha estado acotado a variables con valores discretos. Tambin se ha desarrollado
algn trabajo para variables aleatorias continuas; vase [Shachter y Kenley, 1989]. [Wellman
1990] ha investigado sobre redes cualitativas.
Ya hemos citado el libro sobre inferencia probabilstica de [Pearl, 1984]. [Neapolitan, 1990]
es un libro de texto sobre el uso de los mtodos probabilsticos en sistemas expertos. [Henrion,
1990] es un artculo introductorio sobre la inferencia probabilstica en redes bayesianas. [Jensen,
1996] es un libro de texto sobre redes bayesianas, con el sistema HUGIN. [Neal, 1991], investi-
ga las conexiones entre las redes bayesianas y las redes neuronales. David Heckerman, Michael
Wellman, y Abe Mamdani fueron editores invitados en volumen especial sobre Incertidumbre en
fA de la Communications of the ACM (vol. 38, n.O 3, marzo, 1995).
Las redes bayesianas se han utilizado en muchas aplicaciones de sistemas expertos. Un ejem-
plo tpico es el PATHFINDER, un sistema que asiste a los patlogos en el diagnstico de enfer-
Razonamiento con incertidumbre 30S
medades del sistema linftico [Heckerman, 1991, y Heckerman y Nathwani, 1992]. Otro sistema es
el CPCS-BN para medicina interna [Pradhan et al., 1994], que tiene 448 nodos y 908 arcos, y que
se ha visto evaluado favorablemente por los principales mdicos del mundo en medicina interna.
Existen diversas alternativas a las redes bayesianas en el razonamiento con incertidumbre. El
sistema experto MYCIN para diagnstico mdico y para recomendaciones de tratamiento uti1i-
zaba los factores de certeza [Shortliffe, 1976, y Buchanan y Shortliffe, 1984]. [Duda; Hart, y
Nilsson, 1976] utilizaban ndices de suficiencia y de necesidad en su sistema experto PROS-
PECTOR para la ayuda de exploracin minera.
Otros mtodos estn basados en la lgica difusa y en la teora de la posibilidad [Zadeh,
1975; Zadeh, 1978, y Elkan, 1993], o las funciones de creencia de Dempster-Shafer [Dempster,
1968, y Shafer, 1979]. [Nilsson, 1986], desarrolla una lgica probabilstica y da citas sobre tra-
bajos relacionados con la teora de las probabilidades y las lgicas multivaluadas. Nuestro punto
de vista en la actualidad es que, en muchas aplicaciones de los sistemas expertos, las redes baye-
sianas dominan a estos otros mtodos; sin embargo, esta rea an sigue siendo un tema polmico.
Cuando el comportamiento humano se enfrenta a la incertidumbre, puede ser bastante incon-
sistente [Tversky y Kahneman, 1982], y puede generar modelos poco tiles para la ingeniera.
[Shafer y Pearl, 1990], es una coleccin de artculos sobre el razonamiento con incertidum-
bre. Las actas de las conferencias anuales de Uncertainty in Artificial Intelligence (UAI) contie-
nen las descripciones de las investigaciones actuales. La International Journal ofApproximate
Reasoning, as como otras revistas y conferencias sobre lA, publican artculos importantes.
19.1. Supongamos que unas bolas coloreadas se colocan en tres cajas, el, C2 y e3, del siguien-
te modo:
el e2 e3
Roja 2 4 3
Blanca 3 2 4
Azul 6 3 3
Se seleccciona aleatoriamente una bola de cualquiera de las tres cajas. La bola es roja.
Cules son las probabilidades de que la caja seleccionada sea la el, la C2 o la e3? Razone la
respuesta.
19.2. Considere la red de creencia que se muestra.
1. Derive una expresin para la probabilidad de P => Q.
2. Cundo son iguales p(P => Q) y p(QIP)1
3. Asuma que no se conoce la tabla de probabilidades condicionales de la red. En su lugar,
todo lo que se conoce son los valores de p(P) y de p(P => Q). Qu se puede decir acerca
del valor de p(Q)1
306
19.3. La comisin de admisin de un instituto est intentando determinar la probabilidad de que
un candidato admitido realmente est cualificado. Las probabilidades relevantes se dan en la red
que se muestra abajo. Calcule p(CIA).
p(A) =1/2
C
M R
p(AIM,R)=l
p(A I M,R)=1/2
p(A I,M,R)= 1/2
A
p(AI,M,,R)=O
C=el candidato est cualificado
M=el candidato tiene una buena media acadmica
R=el candidato tiene excelentes recomendaciones
A =el candidato es admitido
p(CIA)=?
19.4. (Cortesa de Judea Pearl, un residente en una zona ssmica.) La red de creencia que se
muestra formaliza la siguiente situacin. Se tiene un nuevo sistema de alarma antirrobo instala-
do en casa. Este sistema es bastante fiable en detectar un allanamiento de morada, pero tambin
se activa a veces al ms pequeo terremoto. Tambin se tienen dos vecinos, John y Mary, que han
prometido llamar al trabajo si oyen la alarma. Las llamadas de John cuando oye la alarma son
absolutamente fiables, pero a veces confunde la alarma con el telfono, e igualmente llama. Por
otro lado, a Mary le gusta la msica ruidosa, y algunas veces se olvida de la alarma.
p(B)=O,OOl p(E)=O,002
Ladrn
p(AIB,E)=0,98
p(A IB,E) =0,95
p(A I,B, E) =0,29
p(A I,B, ,E) =0,001
Llamada_Mary
p(J I A)=0,95
p(J I,A) =0,01
p(M I A)=0,70
p(M I,A) =0,01
Para ejercitar la habilidad de trabajar con probabilidades conjuntas definidas mediante redes
de creencia, calcule la probabilidad conjunta de que no llame ni John ni Mary, y que haya un
terremoto y un allanamiento de morada, es decir, calcule p(-,J,-,M, B, E).
19.5. En una galaxia lejana, muy lejana, el 90 por 100 de los taxis son verdes, y el 10 por 100
azules. Sucede un accidente en el que participa un taxi; se presume que el porcentaje de acci-
dentes de taxis verdes es el mismo que el de azules. Un juzgado analiza el accidente, y un
periodista de un peridico que estuvo en la escena del accidente dice, El taxi era azul. Este
periodista es, por lo general, fiable, de hecho, sus enunciados son correctos en un 80 por 100 de
las veces. De todo esto se saca, que el taxi que particip en el accidente era azul (o verde), y la
probabilidad de que nuestro testigo dijera azul (o verde) es 0,8. Cul es la probabilidad de
que el taxi fuera azul, dada la afirmacin del periodista?
19.6. A Orville, el robot malabarista, se le caen las bolas bastante a menudo cuando su batera
est baja. En tests anteriores, se ha determinado que la probabilidad de que se le caiga una bola
cuando la batera est baja es 0,9. Siempre que la batera no est baja, la probabilidad de que se
le caiga una bola slo es 0,01. La batera se carg no hace mucho, y nuestra mejor conjetura
(antes de ver el ltimo registro malabar de Orville) es que las probabilidades de que la batera est
baja es de 10 contra 1. Un observador, con algn tipo de sistema de visin poco fiable, informa de
que a Orville se le ha caido una bola. La fiabilidad del observador se da por las siguientes pro-
babilidades:
p(el observador dice que a Orville se le ha caido una bola I se le ha caido la bola a Orville) = 0,9
p(el observador dice que a Orville se le ha caido una bola I no se le ha caido la bola a Orvi-
lle) =0,2
Dibuje las red bayesiana y calcule la probabilidad de que la batera est baja dado el informe
del observador.
Aprendizaje
actuacin con
des bayesianas
Aprendizaje de redes de bayesionas
El problema del aprendizaje de una red bayesiana es el de encontrar la red que mejor empareje
(de acuerdo con alguna mtrica) con un conjunto de datos de entrenamiento 8, donde 8 es un
conjunto de instancias (casos) de valores de todas (o corno mnimo algunas) las variables.
Entendernos por encontrar una red encontrar tanto la estructura del GDA corno las tablas de
probabilidades condicionales (TPC) asociadas a cada nodo del GDA.
20.1.1. Una estructura de red conocida
Si ya conocernos la estructura de la red, tan slo tenernos que encontrar las TPC; vamos a des-
cribir este primer caso. A menudo, los expertos humanos pueden proponer la estructura adecua-
da para un dominio de un problema, pero no las TPC, y el aprendizaje de las TPC todava se
necesita en el caso en que tambin debernos aprender la estructura de la red. Para aprender las
TPC hay un caso sencillo y uno complicado. En el caso sencillo, todos los datos se conocen; es
decir, cada miembro del conjunto de entrenamiento 8 dispone de un valor para cada variable
representada en la red. Sin embargo, en los escenarios reales, a menudo se presenta el caso en que
los valores de algunas variables son desconocidos para algunos de los registros de entrena-
miento. Dicha ausencia de datos hace que el aprendizaje de las TPC sea algo costoso.
Datos conocidos
Comenzarnos asumiendo que no tenernos datos desconocidos. Si disponernos de un amplio
nmero de muestras (casos) de entrenamiento, slo debernos calcular el estadstico muestral de
cada nodo y de sus padres. Supongamos que querernos obtener las TPC para algn nodo Vi dados
sus padres P(V). Siguiendo con nuestro planteamiento inicial, denotaremos con Vi el valor de Vi.
Habrn tantas tablas para el nodo Vi corno valores diferentes de Vi (menos uno). En el caso boo-
leano, que asumirnos otra vez, slo hay una TPC para cada nodo. Si Vi tiene k nodos padre,
309
310
entonces hay 2
k
entradas (filas) en la tabla, debido a que cada padre puede tener uno de dos valo-
res posibles. Denotaremos a las variables asociadas a los padres de Vi con el vector Pi'y a los
valores de las variables del vector con Pi' El estadstico muestral p(V
i
= Vi IPi=p) se obtiene a
partir del nmero de casos de:::: que tienen V =Vi' YPi=Pi'dividido entre el nmero de casos que
tienen Pi=Pi'Para aprender las TPC, simplemente utilizamos estos estadsticos muestrales de los
datos reales para todos los nodos de la red.
Un ejemplo nos servir para entender de forma ms clara dicho clculo. Consideremos una
red bayesiana con la misma estructura que la que se muestra en la Figura 19.2, la cual duplicamos
en la Figura 20.1, sin las TPC.Supongamos que tenemos 100 casos de los valores G, M, B YL, tal
como se muestra en la figura (fijmonos en que algunas combinaciones no aparecen, y otras apa-
recen con ms frecuencia que otras). Por ejemplo, para calcular la probabilidad del caso p(B =
Verdadero), simplemente calculamos la fraccin de veces que B tiene el valor Verdadero
sobre todos los casos, y obtenemos p(B Verdadero) =0,94. De forma similar, p(L =Verda-
dero) =0,68. Para los nodos B y L, estas probabilidades son las nicas para sus TPc.
Calculamos las filas de la TPC para el nodo Mde la forma en que vamos a describir: para cal-
cular p(M =Verdadero! B Verdadero, L =Falso) (que escribiremos como p(M IB,-,L)de forma
abreviada), contamos el nmero de veces que Mtiene el valor Verdadero, que B tiene el valor Ver-
dadero y que L tiene el valor Falso, y lo dividimos entre el nmero de veces que B tiene el valor
Verdadero y L el valor Falso. El clculo nos da p(M IB,-.L)=0,03. Luego, realizamos los mis-
mos clculos para el nodo G. El lector podra calcular el conjunto completo de estadsticos
muestrales y compararlos con las TPC que mostramos en la Figura 19.2.
Fijmonos en que algunos de los estadsticos muestrales de nuestro ejemplo estn basados en
muestras pequeas; esto nos podra llevar a una estimacin imprecisa de las probabilidades
subyacentes. Por lo general, el crecimiento exponencial del nmero de parmetros de una TPC
puede reducir la capacidad del conjunto de entrenamiento para generar buenas estimaciones. Se
puede mitigar este problema si muchos parmetros tienen el mismo valor (o uno cercano). Las
tcnicas que utilizan la redundancia para reducir el nmero de parmetros que deben estimarse en
una TPC han sido estudiadas por [Friedman y Goldszmidt, 1996a].
L
GAM
G
Verdadero
M
Verdadero
B
Verdadero
L
Verdadero
N.O de m..<,mncias
54
Verdadero Verdadero Verdadero Falso
Verdadero Falso Verdadero Verdadero 7
Verdadero Falso Verdadero Falso 27
Falso Verdadero Verdadero Verdadero 3
Falso Falso Verdadero Falso 2
Falso Falso Falso Verdadero 4
Falso Falso Falso Falso 2
100
Figura 20.1.
Una red y algunos valores de muestras.
Aprendizaje y actuacin con redes bayesianas
Tambin se puede dar el caso en que, previamente a que las muestras sean observadas, dis-
pongamos de las probabilidades a priori para las entradas de la TPC. La actualizacin bayesiana
de la TPC, dado un conjunto de entrenamiento y las probabilidades a priori, nos da unos pesos
correctos, aunque el procedimiento es algo complejo (vase [Heckerman; Geiger, y Chickering,
1995]). Cuando disponemos de un gran nmero de casos, el efecto de las probabilidades a prio-
ri se ve reducido sensiblemente.
Datos desconocidos
En la obtencin de datos de entrenamiento para un proceso de aprendizaje, con frencuencia, ocu-
rre que hay algunos datos desconocidos. Algunas veces, los datos que se pretenden capturar tie-
nen valores desconcidos que pasan inadvertidos, y otras veces, el hecho de que haya datos des-
conocidos es importante en s mismo. Ahora trataremos elprimer caso. Hay un proceso de clculo
iterativo de los estadsticos muestrales, sencillo y convergente, que se ha visto que es muy efi-
ciente [Lauritzen, 1991]. Daremos la idea principal del mtodo utilizando el ejemplo que aca-
bamos de presentar. Supongamos que en vez de disponer de los datos que se muestran en la Figu-
ra 20.1, tenemos los siguientes datos:
G M B L N.O de instancias
Verdadero Verdadero Verdadero Verdadero 54
Verdadero Verdadero Verdadero Falso
* *
Verdadero Verdadero 7
Verdadero Falso Verdadero Falso 27
Falso Verdadero
*
Verdadero 3
Falso Falso Verdadero Falso 2
Falso Fals Falso Verdadero 4
Falso Falso Falso Falso 2
Cada ocurrencia con un asterisco (*) indica que el valor dela variable asociada a esa posicin
es desconocido para ese grupo de valores de variable. Lapregunta es, cmo tratamos estos valo-
res ausentes en nuestro intento de estimar las TPC de esta red? Consideremos primero las tres
muestras en las que G =Falso, M=Verdadero, L Verdadero, y en que los valores de B son des-
conocidos. Cada una de estas tres muestras podran haber tenido B =Verdadero como B =Falso;
no sabemos cul de los dos, pero, conocemos los valores de G, M YL. As que, aunque no
conozcamos el valor de B, podemos calcular la probabilidad p(B !-.G, M, L), dados los valores de
G, M YL. Esta probabilidad podra calcularse utilizando los mtodos de inferencia probabilstica
que hemos explicado anteriormente, trabajando con la estructura de la red (Fig. 20.1) Ylas TPC
de la red, si tuviesemos dichas TPC (es cierto que todava no las tenemos, pero hablaremos bre-
vemente de este problema). Entonces, con el propsito de calcular los estadsticos muestrales para
estimar las TPC de la red, cada una de estas tres muestras se podra reemplazar por dos muestras
ponderadas, una para B =Verdadero, ponderada conp(B I-.G,M, L), Y la otra para B Falso, pon-
derada conp(-,B I-.G,M, L) =1 - p(B I-,G,M, L) (si nos fijamos en la Figura 20.1, veremos que,
partiendo de la estructura, p(B I M, L) =p(-.B I-.G,M), debido a que B es condicionalmente
independiente de dados Gy
Empleamos el mismo proceso para las muestras en las que B Verdadero, L =Verdadero y
los valores de Gy Mson desconocidos. Cada una de estas muestras se reemplaza por cuatro mues-
tras ponderadas, correspondientes a las combinaciones (G,M);(G, -.M); (-.G,M),Y(-,G,-.M); pon-
deradas respectivamente, por las probabilidades p(G, MlB, L), p(G, -.M IB, L), p(-,G, MIB, L) Y
312
p(-,G,-.M 1 L).TambinaqupodamosutilizarlaestructuradelaredylasTPCparacalcular
estasprobabilidades(unosepuededarcuentadelpeligrodeunaexplosincombinatoriacuando
elnmerodevaloresdesconocidosdecualquiermuestraesgrande).
Ahora,yapodemosutilizarlasmuestrasponderadas(enlasquelosvaloresdesconocidosse
hanrellenadocontodas las alternativasposibles)juntoalrestodelasmuestras(quenotienen
valoresdesconocidos)paracontarlasfrecuenciasapartirdelascualescalcularemoslaestima-
cindelasTPC.Esteprocesoserelmismoquehemosdescritoenelcasoenelquenotenemos
valoresdesconocidos,exceptoqueahora, algunasdelasfrecuenciasnosernnmerosenteros
(debidoalasponderaciones).Sinembargo,talcomoyahemoscomentado,parapodercalcular
lospesosmedianteinferenciaprobabilstica,necesitamoslasTPC,queannotenemos.Paradiri-
girtodoslosesfuerzosalconjuntodeTPCsepuedeutilizarunmtododenominadomaximiza-
cin de la esperanza (ME)[Dempster;Laird,y Rubin, 1977J. Primero,seleccionamosvalores
aleatorioscomoparmetrosdelasTPCparatodalared;luego,utilizamosestosvaloresaleato-
riosparacalcularlospesosquesenecesitan(lasprobabilidadascondicionadasdelosdatosdes-
conocidos dados los valores de los datos observados); posteriormente, utilizamos los pesos
paraestimarnuevasTPC,y, finalmente,vamositerandoelprocesohastaquelasTPCconvergen
(algoqueestagarantizadoqueharn).Enmuchosproblemas,laconvergenciaesrpida.
LaapliacindelmtododeMEesmejordejarloalosprogramasdeordenador,paraquerea-
licenlainferenciaprobabilsticaylascuentasdelasfrecuencias.Ennuestropequeoejemplocon
valoresdesconocidosestorequeriaclculosbastantetediosos.
20.1.2. Aprendizajedelaestructuradelared
Si laestructurade laredsedesconoce, entoncesdebemos intentarencontrarlaestructura, as
comosusTPCasociadas,quemejoremparejeconlosdatosdeentrenamiento.Parapoderhacer-
lo,necesitamosunamtricamediantelacualpuntuar(evaluar)lasredescandidatas,ynecesita-
mosespecificarunprocedimientodebsquedadelasposiblesestructuras.Enestasubseccintra-
taremosambostemas.
La mtrica de calidad
Sepoddanutilizarmuchasmedidasparaevaluarlasredesqueestnencompetencia.Unasebasa
enladescripcin de mnima longitud. Laideaeslasiguiente:supongamosquequisieramostrans-
mitirelconjuntodeentrenamientoS aalguien. Parahacerlo,codificadamoslosvaloresdelas
variablesenunacadenadebits,yenviadamoslosbits. Cuntosbitsnecesitadamos?,esdecir,
culsealalongituddelmensaje?Loscdigosquesoneficientestomanventajadelaspropie-
dadesestadsticasdelosdatosqueseenvan,ysonestaspropiedadesestadsticasloqueestamos
intentandomodelarenlaredbayesiana. Siencontramoslaredbayesianaadecuada,podriamos
utilizaruncdigodeHuffmanparacodificarlosdatosquesevanatransmitir.Partiendodelateo-
adelainformacin[CoveryTbomas, 1991],lamejorcodificacindeunconjuntodedatosS,
distribuidosdeacuerdoaladistribucindeprobabilidadesdadaporunaredbayesiana'l3, necesita
L(S, 'l3) bits:
L(S, 'l3) = logp[S]
dondep[S] eslaprobabilidad(deacuerdoconladistribucindeprobabilidadesdadapor'l3) de
losdatosqueseestnenviando.Dadosunosdatosconcretosde podamosintentarencontrar
lared,lIammosla'l30 queminimiceL(S, 'l3). Antesdedecidirnosporesteenfoque,vamosacal-
cularellogp[S]. SupongamosquetenemoslosdatosS,compuestosporm muestras:VI' .., v '
m
Aprendizajeyactuacinconredesbayesianas
dondecadaVi esunvectorn-dimensionalconlosvaloresdelasn variables,yp[S] eslaproba-
bilidadconjuntadep[vl' ... , Vm]' Siasumimosquecadadatoseobtienedeformaindependientede
acuerdoaladistribucindeprobabilidadesespecificadapor'l3, tenemos:
m
p(S) =I1p(v)
=l
y
m
-logp(S)=-:Llogp(v)
H
dondecada p(v)(laprobabilidadconjuntadequelasvariablestenganlosvaloresespecificados
porv)secalculaapartirdelaredbayesiana'l3. Estosclculos,aunquesontediosos,sepodan
utilizar parapuntuarvarias redes bayesianas de prueba. Cadared, noslo se compone de la
estructuradegrafodelared,sinotambindelasTPC.Sepuedeverque,dadosunaestructurade
redyunconjuntodeentrenamientoS,lasTPCqueminimizanL(S, 'l3) sonjustamenteaquellas
queseobtienendelosestadsticosmuestralescalculadosapartirdeS [FriedmanyGoldszmidt,
1996a).
PerosiseutilizalaL(S, 'l3) solanoesmuybuenamtrica,porquefavoreceaaquellasredes
queseangrandesyconmuchosarcos,ydichaderedestadademasiadoespecializadaparaS,es
decir, sesobreajustara a los datos. El ajuste apropiadoparalamtricase consigue.dndonos
cuentadequeparapodertransmitirS aalguien,utilizandouncdigoeficientebasadoen'l3, tam-
bindebemostransmitirunadescripcinde'l3 paraqueelreceptorseacapazdedecodificarel
mensaje. Deestemodo,debemos aadiruntrminoa L(S,'l3), y eltrminoeslalongituddel
mensajequesenecesitaparatransmitir'l3. Hablandotoscamente,elnmerodebitsquesenece-
sitanparatransmitir'l3 es ~ l o m ,donde 1'l31 eselnmerodeparmetrosde'l3, y logm se
2 2
considerageneralmentecomoelnmerodebitsquesenecesitanpararepresentarcadaparme-
tronumrico.LamtricaajustadaL' (S,'l3) entoncesser:
m
L'(S,'l3) - Ilogp(v)+1'l31
10
g
i=l 2
Ahora, buscamos una red que tenga la longitud de descripcin mnima de codificacin,
tantoparalosdatoscomoparalared. Utilizarambosfactoresnospermitirrealizarlaconcesin
adecuadaparaenviarlosdatosylared.
Como ejemplo, calcularemos L' (S, 'l3) paralaredque se muestraenlaFigura 19.2, para
enviarlosdatosquesemuestranenlaFigura20.1.PrimerocalculamosL(S, 'l3), queeselnme-
rodebitsquesenecesitanparaenviarlosdatosdelaFigura20.1-asumiendoquelosdatosse
obtienendeunadistribucindeprobabilidadesdadaporlaredbayesianadelaFigura19.2-.La
probabilidaddelaprimeraentradadelatabladelaFigura20.1 es:
p(primeraentrada)=p(GIB)p(MIB, L)p(B)p(L)
=0,95 x 0,9x0,95x0,7 0,569
Tomandoelalgoritmonegativo(enbase2),obtenemos:
- logp(primeraentrada)=0,814
Enlosdatoshay54deestasprimerasentradas,asquelacontribucinaL(S, 'lJ) deestas
54entradases54x0,814=43,9.Losdatosdelasotrasentradasdelatablacontribuyencon6,16,
27,9, 52,92, 16,33, 12,32, 24,83 Y12,32, respectivamente. Sumandotodas las contribuciones,
obtenemos:
L(S, 'lJ) =196,68bits
1
Seguidamente,calculamos 1'lJ Ilog 00 ,elnmerodebitsquesenecesitanparaenviarlared
2
delaFigura19.2.Hayochoparmetrosenestared,porloque:
1'lJ Ilog100=4x6,64=26,58bits
2
Y, deestemodo,lamtricaparaestaredes:
L'(S, 'lJ) =196,68+26,58=223,26bits.
Otrasredessepodranevaluardelmismomodo,pero,presumiblemente,ladelaFigura19.2
estaracercadelptimo.
Bsqueda de redes en el espacio
Elconjuntoderedesbayesianases,sinlugaradudas,demasiadograndecomoparaquepensemos
enalgntipodebsquedaexhaustivaparaencontrarlaredqueminimiceL' (S,'lJ). Loquesepue-
de haceres utilizar algunabsqueda conescalamiento de colinao de tipo voraz en elque
comencemosconunaredinicial(talcomounasinarcos,queasumaindependenciaentretodaslas
variables),evaluemosL' (S,'lJ) paradicharedy,luego,realicemospequeoscambiosparaversi
estoscambioshanproducidoundecrementodeL' (S,'lJ). Estospequeoscambiospuedencon-
sistirenaadir,eliminarunarco,oinvertirladireccindeuno.Cadavezquerealizamosuncam-
bioutilizamoslosestadsticosmuestralesderivadosdeS paracalcularlasTPCdelanuevared.
Entonces, seutilizanestasTPCparacalcularelcomponente - L:logp(v
i
) deL'(S, 'lJ). El
nmerodeparmetrosdelanuevaredseutilizaparacalcularelcomponente 1'lJ Ilogm.Estos
2
clculossesimplificanporelhechodequeelclculodelalongituddedescripcinesdescom-
ponibleentrelosclculosdecadaTPCdelared.Cuandolamtricasedescompone,lavaloracin
total es el sumatorio de las mtricas individuales [Friedman y Goldszmidt, 1996a]. De esta
manera,cuandoseaadeunarco,seelimina,oselecambialadireccin,necesitamosslocal-
cularloscambiosdelosestadsticosmuestralesylap(V IP(V)) delosnodosVi afectadosporel
cambio. Lasotrasp(V IP(V)) siguen valiendolo mismo. Sehanutilizado otras mtricas des-
componiblesdelalongituddedescripcinparaevaluarcmodebienencajaunaredconlosdatos
(vase[Heckerman;Geiger,yChickering, 1995]).
Losmtodosdeaprendizajederedesbayesianassehanutilizadoparaaprenderlaestructura
delaredylasTPCenalgunosproblemasnotriviales.Comoejemplo,pensemosenlareddela
Figura 20.2. Se pueden observar tres redes. La primerared codificalas relaciones entre 37
variablesdeunsistemadealarmasutilizadoenlagestindelaventilacindeunaunidaddecui-
dado intensivo(UCI)deunhospital. Estared se utiliz para generarun conjuntode entrena-
mientodevaloresaleatoriosparalas37variables,conuntamaode 10.000casos.Utilizandoeste
conjuntodeentrenamientojuntoalasegundared(laquenotienedependencias),seentrenlater-
315

Laredoriginalgenera
losdatosdeentrenamiento
@
@ @ @ @

8) @ @ @ @ @ @ @
Cason.O XI X
2
X3 X 31
1 3 3 2 ... 4
@ @ @ @ @
2 2 2 2 ... 3
1 3 2 ... 3
@ @ @ (j)

@ @
3
10.000 2 2 2. .. 3
CD
@ G)
Laredindocid,'pnrti,dela'y
"originn!y10,'0<de",,,,,,,,,"en'o
22l 10(3)
Figura20.2.
Unexperimentoenelaprendizajederedes.
cera red mediante mtodos parecidos a los que acabamos de describir (para detalles, vase
[SpirtesyMeek, 1995]).Fijmonosenlasimilaridaddelasestructuras,slounarcosepierde.
Algunasveces,sepuedesimplificarsustancialmentelaestructuradelared,aadiendonodos
alaredquerepresentenvariablescuyosvaloresnoestnenelconjuntodeentrenamientoS.A
estosnodosselesdenominanodos ocultos. Comoejemplosencillo,consideremoslasdosredes
bayesianasquesemuestranenlaFigura20.3.Lareddelaizquierdatienemsparmetrosquela
@ @ @ @
316
317 Inteligencia artificial. U na nueva sntesis
PI P2 P3 PI P2 P3
~ /
. ~ .
QI Q2 Q3 QI Q2 Q3
-
Figura 20.3.
Dos redes, una con nodos ocultos.
de los nodos ocultos H, que est a la derecha; su mtrica de longitud de descripcin ser ms
mala si la de la derecha tambin se encaja bien, o mejor, a los datos (cosa que har si es una
representacin ms ajustada de las relaciones subyacentes entre las variables). Como no podemos
medir la variable oculta, su existencia depende del proceso de bsqueda. Para crearla, la bsqueda
voraz debe aadir a su lista de posibles cambios la adicin del nuevo nodo (vse [Heckerman,
1996]). No hace falta decir que el valor de la variable oculta ser desconocido, y que las pro-
babilidades asociadas a esta variable se deben aducir mediante el mtodo ME que ya hemos des-
crito 1.
Inferencia probabilstica y actuacin
20.2.1. El escenario genrico
Hay muchas aplicaciones de la inferencia probabilstica, y una muy importante es su utilizacin en
sistemas expertos para realizar la seleccin ptima a partir de un conocimiento general aplicado a
unos datos concretos. Un ejemplo es el diagnstico de enfermedades a partir de una serie de sn-
tomas. Vamos a describir cmo un agente, que debe decidir sobre la siguiente accin ms ptima,
puede utilizar la inferencia probabilstica con redes bayesianas a partir de la informacin sensorial
y la mtrica sobre los estados del entorno (nuestra exposicin est basada en [Russell y Norvig,
195'5, Cap. 17] siguiendo un mtodo que se describe en [Dean y Wellman, 1991, Cap. 7]).
El problema que vamos a analizar es una generalizacin del que tratamos en el Captulo 10.
Recordemos que en l describimos un agente que utilizaba el ciclo percibir/planificar/actuar. La
fase de planificacin calculaba, orientada al objetivo, la mejor accin que se deba ejecutar en la
situacin actual (alguna veces slo a un horizonte limitado). La fase de actuacin ejecutaba la pri-
mera accin recomendada por el planificador, y la fase de percepcin intentaba averiguar cul era
la situacin resultante del entorno. En el Captulo 10 generalizamos el concepto de objetivo
mediante una lista de recompensas que se daban (o se tomaban) de ciertos estados del entorno.
Las recompensas inducan un valor para cada estado sobre la base de la recompensa descon-
tada futura, que se obtendra por un agente que actuaba de cara a maximizar su recompensa. Aqu
mantenemos este enfoque generalizado del objetivo, asignando una utilidad a cada estado del
entorno.
1 La creacin de nodos ocultos en las redes bayesianas es sirniliar a la creacin de tomos nuevos en el aprendizaje
de reglas proposicionales, o a la creacin de nuevas constantes de relacin (predicados) en el aprendizaje de programas
lgicos.
Antes, nuestra arquitectura de agentes de percepcin/planificacin/actuacin adoptaba un
conjunto de asunciones algo inconsistentes acerca del entorno, y acerca de la fiabilidad en la per-
cepcin y en la actuacin. Asumamos que el agente poda determinar de forma precisa su esta-
do actual mediante la percepcin, y que poda prever, tambin de forma precisa, los efectos de
todas sus acciones. Entonces, en el caso de que estas asunciones eran injustificadas (yen realidad
lo son), nuestro agente tomaba una accin e inmediatamente utilizaba sus sensores para averiguar
cul era el estado resultante. Defendamos este enfoque diciendo que aunque la accin no tuvie-
ra siempre sus efectos previstos, y que aunque los sensores algunas veces podan dar error,
stos (por media) mantendran al agente informado acerca de su progreso por el espacio de
estados, y entonces la replanificacin podra reorientar al agente hacia su objetivo (o hacia
atrs), si fuera necesario.
Ahora, disponemos de las herramientas que nos permiten tratar de forma algo ms adecuada
la incertidumbre. Podemos adoptar explcitamente una serie de asunciones ms realistas. Por
ejemplo, en vez de conocer en qu estado est el agente, ste slo puede conocer las probabili-
dades en que se presentan los distintos estados. Yen vez de disponer de sensores que le dan infor-
macin exacta acerca del estado del entorno, los sensores pueden, como mucho, agudizar estas
probabilidades. Los efectos slo se conocen en parte: una accin que se toma en un estado
podra llevar a cualquier estado de un conjunto de estados posibles, cada uno con una probabili-
dad asociada. Lo que queremos es que nuestro agente maximice su utilidad esperada mediante la
planificacin y la percepcin. Los clculos que se necesitan para que un agente sea capaz de tra-
tar este problema en un contexto genrico son demasiado costosos, por lo que, otra vez, nos
vemos forzados a aplicar una serie de asunciones y aproximaciones. Seguidamente, vamos a tra-
tar estos temas partiendo de un ejemplo concreto.
20.2.2. Un ejemplo extendido
Como trabajar con las asunciones que hemos hablado incrementa la dificultad de los clculos
computacionales, nuestro ejemplo utilizar un agente y un entorno triviales, de cara a facilitar
nuestras ideas principales. Pensemos en un robot que est en una cuadrcula unidimensional de
cinco celdas, tal como se muestra en la Figura 20.4. El estado del entorno slo requiere la loca-
lizacin del robot; la representamos mediante una variable de estado E que tiene cinco valores
E: -2 -1 o 2
U: 2 o 2
Figura 20.4.
Un robot confinado en cinco celdas.
posibles{-2,-1,0, 1, 2}.CadalocalizacindaunautilidadU alrobot.Laceldacentraltieneuna
utilidadde(ste ylosdemsvalores semuestranenlafigura). Ahorasupongamosquepara
comenzarelprocesoelrobotsabe(deformaprecisa)queseencuentraenlaceldacentralenel
instantet =0,esdecir, Eo O.
La accinquerealizaelrobotenelpasoi sedenotaconelsmboloAi' Elagentepuedeinten-
tarmoversealaceldadelaizquierda(A
i
=Izq),oaladeladerecha(A
i
Der).Encualquie-
radelosdoscasos,elmovimientogeneraelefectoesperadoconunaprobabilidad0,5;nogene-
raefectoalgunoconunaprobabilidad0,25,ygeneraeldesplazamientoopuestoalesperadocon
unaprobabilidad0,25.Deestamanera,despusdeunospocosmovimientos,elrobotslodis-
pondrdeconocimientoprobabilsticoacercadesuposicinactual.
Elrobotpercibesulocalizacinenelpasoi medianteunasealsensorial Peronosotros
asumimosqueelsensornoesdeltodofiable.DadoqueEitieneciertovalor,laprobabilidadde
queSivalgalomismoes0,9, ylaprobabilidaddequetengacualquierotrovalores0,025 (0,1
paraloscuatrovaloresrestantes).
El problema paraeste robot, teniendo en cuenta todas estas desventajas, es realizar los
movimientosquemaximicenelvaloresperadodesuutilidad, con unmmerodepasosdeter-
minado.Lastcnicasdedecisinparaseleccionarlasiguienteaccinsepuedenexplicarmejorsi
simplemente maximizamos la utilidad tan slodel siguiente paso. Supongamos que el robot
intentamoversealaderechaenelinstantet == 0,esdecir, Aa == Der.Elestadodelentornoresul-
tante es El' Paracontinuarel ciclo percibir/planificar/actuar, elrobot mide su posicinaveri-
guandosisupercepcines =1.Qumovimientorealizardespus?Enefecto,despusde
ejecutaresemovimiento,cmocontinuarelagentesu seleccindemovimientosbasndoseen
losdatossensoriales,lasinferenciasquerealizaraacercadesuposicinactualylosefectosde
susacciones?
Sepuede utilizar la inferencia probabilstica con un tipo especial de redes de creencia,
denominadasredes de decisin dinmicas, paraseleccionarlasaccionesmaximizandolautilidad.
EnlaFigura20.5 mostramosunaredparaesteproblema.Estaredpermitiraalrobotrealizarinfe-
rencias deforma iterativaamedidaqueejecutarasusacciones, yquelainformacin sensorial
nuevaestuvieraasudisposicin. UnavezdisponemosdelosvaloresdeEa =O, Aa =RYSI l,
podemosutilizarlainferenciaprobabilsticaparacalcularelvalordelautilidadesperadaU
2
, que
seobtieneprimerocon =Der,yluegoconAl =Izq.Elrobotentoncesseleccionaralaaccin
Ao
E, E,
R
Figura20.5.
Unareddedecisindinmica.
queledieraelvalormsgrande(laseleccindecadaaccinenesteejemplosebasaenprever
nicamenteelsiguientepaso.Previsionesconhorizontesmslejanosrequeriranelclculodelas
utilidadesdelasdistintassecuenciasdeaccionesalternativas). Utilizaremosnodoscondiferentes
formasenlareddedecisindinmicaparaindicarlasdistintasasuncionesqueserealizansobre
cada nodo. Los nodos con forma cuadrada (.) indican las variables cuyo valor todava est
bajoelcompletocontroldelagente.Aestosnodoslosllamaremosnodos de decisin. Enunared
dedecisindinmica,estosnodosseconviertenenlosclsicosnodosdecreencia(convalores
conocidos)unavezqueelagente hatomado su decisin. Losnodosconforma romboidal (+)
indicanlasvariablescuyosvaloressonlasutilidades.Losvaloresesperadosdelasvariablesde
utilidadsonfuncionesdelasprobabilidadesdelosvaloresdelosnodospadre.
Nostenemosquefijarenqueenlaestructuradelared,elentornoesmarkoviano,esdecir, lo
quesepuedesaberacercadelestadodelentornoenelinstantet + 1 (sinpercepcin)estcom-
pletamentedeterminado(deformaprobabilstica)porelestadodelentornoylaaccinejecutada
enelinstantet. Muchosentornosdeagentesepuedenasumircomomarkovianosenestesentido
(o se puedenintroducirvariables adicionales paratransformarlosa estetipodeentorno). Fij-
monostambinenquelaestructuradelaredexpresalaasuncindequeloquesepercibeenel
instantet escondicionalmenteindependientedetodoloquehasucedidoantes,dadoelentornoen
el instantet.
Despusdemoverellmitetemporalun pasohaciadelante,tomandolaaccinplanificadaen
elinstantet == 1(medianteelprocesodemaximizacindelautilidadesperadaU
2
), ydespusde
medir10quesepuedepercibirenS2' acercadelestado elprocesoserepiteporcompletoen
otrociclopercibir/planificar/actuar.Serinstructivollevaracaboalgunosdelosclculos.
Primero, necesitamos calcular las dos utilidades esperadas, dado lo que se conoce en el
instantet =0,yteniendoencuentalasdosposibilidadesparaAl:
Ex[U2IEa =O, Aa =R, SI= 1,Al= R]
y
Ex[UzIEa =O, Aa =R, =1, == L]
Paracalcularestosvaloresnecesitamoscalcularp(E
2
1E
a
=O, Aa =R, Sl=1,Al)paralosdife-
rentes valores de E
2
para cadauno de los valores de El tipo de clculo serepetirenlos
siguientespasos,pero,porbrevedadyconcentracin,10vamosarealizarparaelpasoencuestin.
ComoserealizaelmismotipodeclculoparacadaunodelosvaloresdeAl'sloloharemoscon
=R. Utilizaremoselalgoritmosobrepolirbolesexplicadoenelltimocaptuloparacalcular
p(E
2
1E
o
O, Aa == R, SI=1,Al
Primero,tratamoselnodopadrequeannosehatenidoencuentaparaobtener:
p(E
2
1E
a
=O, Aa =R, Sl=1,Al =R)
=LP(E2IEo=O, Aa =R, =1,Al =R, El)p(E1IEa=O, Aa =R, SI=1, =R)
E,
Estaecuacinse puede simplificar tomando encuenta las independencias condicionales:
p(E21Eo= O, Aa =R, 1,Al= R)
Lp(E
2
1A
l
=R, El)p(ElIE
o
=O, Aa =R, 1)
E,
320
321
Enlaredesdedecisinqueseutilizanparalaseleccindelaaccindelrobot,elprimertr-
mino del sumatorio se llama el modelo de accin del proceso markoviano. Parauna estado
inmediatamente previo y una accin, este modelo nos da las probabilidades de las posibles
situacionesgeneradas. Siguiendoelalgoritmosobrepolirboles,el segundotrminodelsuma-
torioserescribecomounaregladeBayes:
p(E11Eo=O, Aa R, Sl=1)=kp(Sl = 11Ea =O, Aa R, El)p(E1IEa== 0,Aa =R)
dondekesunfactordenormalizacin,elegido(mstarde)parahacerquelasumadelasproba-
bilidadesseaiguala 1.Ahora,aprovechandolasindependenciascondicionales,obtenemos:
p(E11Eo=O, =R, == 1)== kp(Sl =1IEl)P(E1IEo=O, = R)
Elprimertrminodelamultiplicacineselmodelo del sensor. Paracualquiersituacindel
entorno,stenosdalasprobabilidadesdelosdiversosvaloresqueelsensortendr(unsensorque
fuesecompletamentefiableyconinformacinmximaconcentraratodaslasprobabilidadessobre
unnicovalorencadasituacindelentorno).Elsegundotrminoesotravezelmodelodeaccin.
Agrupandolosresultados,obtenemos:
p(E2IE
o
,=0, =R, = 1,Al=R)
=k = R, El)p(Sl=1IEl)P(E1IEo 0,Ao = R)
E,
Paraevaluarestaexpresin(paralosdiversosvaloresdeE
2
) utilizaremoslasasuncionesacer-
cadelasprobabilidadesquehemosdefinidoacercadelosefectosdelasacciones,ydelafiabi-
lidaddelsensor.Parademostrarlo,vamosacalcularp(E
2
=11Eo O, Ao =R, SI= 1,Al=R).Los
clculosnecesitanlassiguientesprobabilidades,quesernlasentradasdelaTPCdelareddela
Figura20.5(debemossumarsobretodoslosvaloresdeEl)'
p(E
2
=11Al= R, = O) =0,5
p(E2 =11Al=R, El 1)=0,25
p(E2 == 11Al R, El== 2)=0,25
p(E2 11
A
l == R, El=-1)Yp(E
2
= 11Al =R, El= sonambas
peS
l
= 11El=-2)== 0,025
pes]= 11El=-1)=0,025
P(Sl == 11El== O) = 0,025
P(Sl== 11El 1)=0,9
P(Sl =11El 2)=0,025
p(El -llEo 0,A
o
==R)=0,25
p(El OlEo =0,Aa == R) 0,25
p(El =11Eo = 0, = R) =0,5
p(El =-21Eo= 0, =R)Yp(E
l
== 21Eo =0, = R) sonambas
Alrealizarelsumatorio,obtenemos:
p(E2 11Eo:::; 0,Ao =R, = 1, =R)
== kx[(0,5 x0,025x0,25)+ (0,25x0,9x0,5)]
== kx0,14375
Realizamoslosclculossimilaresparaobtenerp(E21Eo =0,Aa == R, SI=1,Al=R)delos
otros valores de Como el sumatoriode todos los valores posibles debe ser 1, podemos
resolverloparak. UtilizandoestasprobabilidadesdeE
2
, calculamoselvalordelautilidadespe-
rada U
2
, dadoqueAl:::; Der,yrepetimoselmismoprocesoparacalcularelvaloresperadoU
2
conAl =Izq;finalmente, seleccionamos la accin que nos del valor ms grande (de la
estructuradelproblemapodemossaberqueser == Der,perohemosutilizadoesteejemplo
parailustrarelmtodo).
20.2.3. Generalizacindelejemplo
Unanlisis delaecuacinp(E21Eo == 0, =R, = 1,Al =R) nos permiteextenderla a los
siguientespasoseneltiempo.Estaecuacinestsiendoevaluadaenelinstantet == 1,justocuan-
doSI 1sehamedido,yantesquelaaccinAl=R sehaejecutado(losvaloresobtenidosde
lahistoria).Entonces,podramosescribirp(E
2
l<valores antes de t =1>, SI=1, =R). Defor-
masimilar,laexpresinp(EllE
o
== 0, =R)enelsumatoriosepodrarescribircomop(Ell<valo-
res antes de t =1.Contodosestoscambios,tendramos:
p(E
2
l<valores antes de t:::; 1>Sl=1, A)
k2,.p(E
2
IAl'E1)p(Sl == 1IE
l
)p(E
l
l<valores antes de t == 1
E,
Estaformadeescribirlaecuacinnossugierelasiguientegeneralizacin:
p(Ei+ll<valores antes de t == 1> == Si'A)
== k2,.p(E
i
+
l
IA
i
, Ei)p(S siIEi)p(Eil<valores antes de t == 1
E,
Paratomarlasdecisionesacercadelasaccionesamedidaqueavanzamoseneltiempo,uti-
lizamoslaecuacindelasiguientemaneraparacalcularlaaccinAienelinstantet =i:
1. Apartirdel ltimoinstante(i 1) (ydespusdemedirSi 1:::;Si-1)yatenemoscalculado
p(El<valores antes de t =i paratodoslosvaloresdeEi'
2. Enelinstantet == i,medimosSi= SiYutilizamoselmodelodelsensorparacalcularP(Si
=silE)paratodoslosvaloresde
3. Apartirdel modelode accincalculamosp(Ei+lIA
i
, paratodos los valores de Ei y
deAi
4. Paracada valor de A
i
, y paracada valor particularde El+ l' sumamos el producto
p(Ei+lIA
i
, EJp(Si =siIEi)p(E;I<valores antes de ti detodoslosvaloresdeE
i
,ymul-
tiplicamos porlaconstantekparaobtenerlosvaloresproporcionalesap(Ei+ll<valores
antes de t == i>, =Si' Al)'
5. Repetimoselpasoanteriorparatodoslosvaloresde + 1 Ycalculamoslaconstantekpara
obtenerlosvaloresactualesdep(Ei+11<valores antes t = i>, == Si' A)paracadavalor
deEi+lyde
6. Utilizandoestasprobabilidades,calculamoselvaloresperadoU
i
+ 1 paracadavalordeAi
yseleccionamosaquellaAi quemaximicelautilidadesperada.
7. Ejecutamoslaaccinseleccionadaenelpasoanterior,avanzamosien1,eiteramos.
y staeslaideabsicaalutilizarlasredesdedecisindinmicasenlaseleccindeaccio-
nes. Elmtodoseextiendemsalldelejemploexpuesto.Laformaenquelasaccionesafectan
322
323
al entorno y la forma en la que el entorno afecta a los estmulos sensoriales se modelan bien, por
lo general, mediante una red parecida a la de la Figura 20.5. En vez de disponer de una sola
variable del entorno Ei en cada instante de tiempo, podrlamos disponer de un vector de valores
Ei (Ew ... , Y, de forma similar, en vez de disponer de una sola variable de percepcin
Si' podrlamos tener un vector de valores Si =(Sil' ... , Sim). La red de decisin dinmica se
deberla extender en cada instante de tiempo, para incluir los nodos de todas las variables y todas
sus dependencias, pero la forma de los clculos es la misma que en el ejemplo expuesto. Yaun-
que la estructura de la red puede ser compleja para un instante de tiempo determinado, la
asuncin markoviana simplifica las dependencias entre los diferentes instantes de tiempo.
Prever ms de un paso en el tiempo requiere propagar las probabilidades hasta el punto
donde se tiene que calcular la utilidad esperada. Obviamente, este clculo se convierte rpi-
damente en algo impracticable, pero tambin podrla suceder que no fuera demasiado til, ya
que la distribucin de probabilidad de podrla transformarse en algo muy impreciso. De este
modo, el compromiso que utilizabamos con las asunciones, algo inconsistentes, que hemos
mencionado antes de presentar la extensin probabilstica, sigue siendo una alternativa razo-
nable.
El aprendizaje de redes bayesianas es un tema de investigacin muy activo que saca artculos
nuevos importantes cada ao. [Neal, 1991], describe los mtodos de aprendizaje de redes baye-
sianas mediante redes neuronales. La tcnica que hemos descrito para evaluar las estructuras de
las redes bayesianas propuestas utiliza el concepto de longitud de descripcin mnima [Rissanen,
1984]. [Friedman, 1997], describe una tcnica para el aprendizaje de redes bayesianas cuando
tanto la estructura como los datos son desconocidos. Los trabajos iniciales sobre aprendizaje de
redes bayesianas estn en [Cooper y Herskovitz, 1992].
[Forbes, et al., 1995], proponen un sistema para dirigir un vehculo autnomo mediante redes
de decisin dinmicas.
La evaluacin de las utilidades en situaciones estocsticas constituye el tema principal de la
teora de la decisin. Consltese [Horvitz; Breese, y Henrion, 1988] para un tratamiento del uso
de la teorla de la decisin en la lA. La teorla de los problemas de decisin de Markov (PDM)
[Puterman, 1994], y de los problemas de decisin de Markov en contextos parcialmente obser-
vables (PDMPO) [Cassandra; Kaelbling, y Littman, 1994], ofrecen los fundamentos tericos bsi-
cos para evaluar los efectos de las acciones en situaciones estocsticas.
20.1. Consideremos la red bayesiana con la siguiente estructura:
"
Supongamos que podemos controlar las variables causales P, Q Y R, es decir, podemos
definir experimentos en los que estas variables tengan cualquier combinacin de valores (Ver-
dadero o Falso) que deseemos y, entonces, observar los valores resultantes de S y U. Qu com-
binaciones de estas variables se necesitaran para poder aprender las TPC de S y U? Se pueden
aprender las probabilidades a priori de P, Q YR de estos experimentos?
20.2. Cuente el nmero de parmetros que se necesitan para cada una de las redes de la Figu-
ra 20.3.
20.3. Una red bayesiana tiene la estructura que se muestra en la figura (fjese en que la estructura
implica que cada Xi es condicionalmente independiente de e). Dado un conjunto de entrena-
miento de valores de Xl' y X
3
' cada uno emparejado con un valor de e,muestre cmo se pue-
den utilizar las estadsticas de muestra para calcular y estimar p(Cjxl' X
3
).
x, Xl
20.4. Con las asunciones y los resultados del ejercicio anterior, supongamos que e representa el
nombre de una de dos acciones que se deberlan ejecutar por un robot cuando sus entradas sen-
soriales (valoradas de forma binaria) son las definidas por Xl' y X
3
Supongamos que la
poltica de seleccin de una accin es elegir e=1 si p(e =lXl' x
3
) ~ p(e =2X
1
, X
3
Muestre que dicha poltica se puede implementar mediante una ULU cuyas entradas son xl' X
2
Y
XvInterprete los resultados como un mtodo de entrenamiento de la ULU (en este problema, la
red de creencia no tiene una interpretacin causal, es decir, la accin que se tomara no es con-
secuencia de las entradas sensoriales).
20.5. Un robot vive en una cuadricula de 5 x 5, tal como se muestra en la figura. Los nmeros en
la cuadricula representan valores de temperatura relativa. Supongamos que el robot empieza en
una celda con la temperatura 2. El robot desconoce en cul de las celdas con temperatura = 2 ha
comenzado, pero dispone de un mapa de la cuadricula en el que se indican los valores de las tem-
peraturas de cada celda.
,- - ---
.------
4 5 6
~
7 8
3 4 5 6 7
2 3 4 5 6
1 2 3 4 5
O 1
-
2
~
3
--
4
~
Asumimos que el robot puede medir de forma precisa el valor de la temperatura de la celda
en la que se encuentra. El robot puede ejecutar cuatro acciones, a saber, norte, este, sur y oes-
te, y debe ir seleccionndolas de cara a maximizar su temperatura esperada. Un viento fuerte
sopla del suroeste. En circunstancias normales, cada accin moverla al robot una celda en la
direccinindicada,peroconestevientolasaccionestienenlossiguientesefectossiemprequeel
robotseencuentraenunaceldaconlatemperatura 2.
sur-t notieneefectos
Oeste-t notieneefectos
Norte-t semueveunaceldaalnorteconunaprobabilidad=0,5
Norte-t semuevedosceldasalnorteconunaprobabilidad=0,25
Norte-t semueveunaceldaalesteconunaprobabilidad=0,25
Este-t semuevealesteconunaprobabilidad 0,5
Este-t semuevedosceldasalesteconunaprobabilidad= 0,5
1. Dibuje la red de decisin dinmica correspondiente a un paso de accin. Muestre las
entradasrelevantesdelasTPC.
2. Calculelatemperatura, Ex[T1IA
o
1, esperadaparacadaunadelascuatroacciones.
3. Ahora, supongamosqueel robotnoestsegurode su temperaturaenelinstantet =too
Entonces,mideunasealsensorialSo =2, queleinformaacercade sutemperatura. El
modelodepercepcinde es:
p(So =21T
o
=2)=0,9
p(So =21T
o
=3)=0,3
p(So =21T
o
=i)=Oparatodoslosvaloresdei distintosde2ode 3
Dibujeunareddedecisindinmicaparaesteejemplo.
4. Asumiendoquelosefectosdelasaccionestienenlosmismosefectoscuandolaceldatie-
nelatemperatura=3quecuandolatieneiguala2,culeslatemperaturaesperadaresul-
tantedecadaunadelascuatroaccionesenestecaso?
Mtodosde
lanificacin
osenlgica
Al no poder planificar, se est planificando para fallar
EffieJones
Delibere a menudo -decida una vez
Proverbiolatino
El clculo
de situaciones
Razonamiento acerca de estados y acciones
En el Captulo 7 introdujimos el concepto de espacio de estados, y explicamos que podamos
recorrerlo para generar planes de acciones que permitiesen alcanzar ciertos objetivos. Entonces,
hablbamos de bsquedas sobre espacios de estados icnicos y de bsquedas sobre espacios de
estados basados en caractersticas. Ahora podemos estudiar mucho ms a conciencia los mtodos
de planificacin basados en caractersticas, puesto que ya conocemos lenguajes que nos permiten
describir mejor las caractersticas y las restricciones entre ellas.
Uno de los aspectos ms potentes de la utilizacin del enfoque basado en caractersticas es el
hecho de que podemos prescindir de las propiedades del mundo que son irrelevantes para un pro-
blema dado, y que stas pueden incluso ser desconocidas. Este aspecto es particularmente
importante para describir la condicin objetivo que queremos que el agente alcance mediante sus
acciones. Comenzando con la configuracin que se muestra en la Figura 21.1, podramos desear
que el agente desarrollara un plan para conseguir colocar algn bloque sobre el bloque B (siendo
indiferente cul sea el bloque que coloquemos sobre el bloque B y cul sea la situacin final del
bloque B). Este objetivo se puede representar mediante la frmula (:lx)Sobre(x, B). En general,
podemos representar un objetivo mediante una fuf del clculo de predicados. Por otra parte, pode-
mos representar tambin el estado del mundo mediante frmulas. De esta forma, para determinar
Sobre(B,A)
Sobre(A,C)
JL
Sobre(C,Suelo)
Libre(B)
Libre (Suelo)
Figura 21.1.
Una configuracin de bloques.
327
328 329
sielobjetivosesatisface,bastaintentardemostrarlafbfdelobjetivoapartirdelasfrmulasque
describenelestadodelmundo.
Enestecaptulo,yenelsiguiente,presentaremostcnicasapropiadasparaencontrarunCon-
juntodeaccionesquenospermitaalcanzarelestadodescritomedianteunafbfobjetivo. Utili-
zaremoselaparatoformaldelclculode predicadospararazonardirectamenteacercadelosesta-
dosy las acciones. Comoentodorazonamientobasadoenelclculodepredicados,todavaes
necesarialabsqueda,peroahoralabsquedaserealizasobreunespaciodeexpresioneslgicas,
ynosobreunespaciodemodelosdeestadosdelmundo.Enelcaptulosiguiente,describiremos
unmtodoalternativo,enelquelosoperadoresseutilizanparacambiarlasdescripcionesdelos
estados,ylabsquedaserealizasobreelespaciodelasdescripcionesdelosestados.
Elcdlculo de situaciones [McCarthyyHayes, 1969,yGreen 1969a]esunaformalizacinde
losconceptosdeestados,accionesyefectosdelasaccionessobrelosestados,queestbasadaen
elclculodepredicados.Enesteformalismo, nuestroconocimientoacercadelosestadosylas
accionesserepresentamediantefrmulasdelclculodepredicadosdeprimerorden,ynosper-
miterealizarpreguntasdeltipo: Existealgnestadoquesatisfagaciertaspropiedades(objeti-
vo),y, siesas,cmosepuedetransformar,medianteacciones,elestadoactualeneseestado?La
respuestaaestetipodepreguntasnosproporcionaunplanparaalcanzarelestadodeseado.Aun-
queelclculodesituacionesdesempeunpapelimportanteenlosprimerossistemasdeplani-
ficacindelalA,enlaactualidadhasidosuplantadopormtodosquesediscutirnenelprxi-
mocaptulo. Sinembargo,elformalismosiguesiendoimportanteparaexponeryayudaracla-
rificarlosproblemasconceptualesrelacionadosconlosefectosdelasacciones.
Introduciremos el clculo de situaciones a partirde un ejemplo del mundo de bloques.
SupongamosqueidentificamoselestadoquesemuestraenlaFigura21.1 comoSO. Siutilizamos
el clculodepredicados,podramosdescribirSO mediantelasiguientefrmula:
A) /\Sobre(A,C)/\ Suelo)/\Libre(B)/\...
Parapoderdescribiresteestado,yotrosestados,enelclculodesituaciones,cosificamos 1 los
estados;esdecir,losincluimosennuestraconceptualizacindelmundocomoentidadesconexis-
tenciapropia.Podemostenercualquiernmerodeestados;stossesuelendenotarmediantesm-
bolosdeconstantes(talescomoSO, ...),mediantevariablesomedianteexpresionesfun-
cionales.Cambiaremosnuestrasfbfsatmicasde formaqueincluyanuntrminoquedenoteelesta-
doenelqueseverificaunarelacin.Uncambiosimilarsedeberealizarennuestrainterpretacin
deestasfbfs atmicas -ahora,estasfbfs denotan relaciones sobre estados y son denominadas
fluentes. ExpresamosunenunciadoacercadeloqueesciertoenelestadoSO mediantelafrmula:
Sobre(B,A, SO) /\Sobre(A,C, SO) /\Sobre(C,Suelo,SO) /\Libre(B,SO)
Tambinpodramostenerproposicionesciertasparatodoslosestados,porejemplo,
('Vx,y,s)[Sobre(x,y,s)/\--.(y Suelo):::>--.Libre(y,s)]
y
('Vs)Libre(Suelo,s)
(ElsignificadodeLibre(x,s)esquex estdisponibleparapoderponeralgosobrel.)Con
estos axiomas generales, podemos demostrar varios enunciados acerca de SO; porejemplo,
podemosdemostrar-,Libre(A,SO)y Libre(Suelo,SO).
1 Elverbocosificarsignificaconsideraralgoabstractocomounobjetoconcreto.
El clculodesituaciones
Parapoderrepresentarlasaccionesysusefectosrealizamoslossiguientespasos:
l. Cosificamoslasacciones(esdecir,imaginamosqueunaaccinexistecomounobjeto). En
esta forma, las acciones se puedendenotar mediante smbolosde constantes, mediante
variables,omedianteexpresionesfuncionales. Enlaformulacindelclculodesituacio-
nes,unaaccinseconsideracomounafuncindelasentidadesimplicadasenlaaccin.En
nuestroejemplo,lasaccionessonfuncionesaplicadassobrelosbloques.Porejemplo,con-
sideremoslaaccindemoverunbloquedeunalocalizacinaotra.Utilizamoslaexpresin
mover(B,A, Suelo)paradenotarquemovemoselbloqueB deAalsuelo
2
(pensemosen
unaaccincomoenunobjetodadoporelresultadodelafuncin). Engeneral,podemos
representarlafamiliadelasaccionesmovermedianteelesquemamover(x,y, z),donde
x,y y z sonlasvariables fonnales. La instanciacindeestasvariablesmediantesmbolos
deconstantesdalugaraunaexpresinquedenotalainstanciarealdelaaccin.
2. Elsiguientepasoconsisteenimaginarunaconstantedefuncin, llamadahacer,que
denotaunafuncinqueproyectaaccionesyestadosenestados.Sia denotaunaaccin,y
(J denota un estado, entonces hacer(a, (J) denota una funcin que proyecta el par
accin-estadoenelestadoresultantedeejecutarlaaccina enelestado(J.
3. Seguidamente,expresamoslosefectosdelasaccionesmediantefbfs. Enalgunasformu-
laciones hay dos fbfs para cada par accin-fluente (por ahora, ignoraremos aquellos
pares enlos que la accin no tiene efectos sobre elfluente). Porejemplo, parael par
{Sobre,mover}lasfbfs son
[Sobre(x,y, /\Libre(x,s)/\Libre(z,s)/\(X::F- z)
:::> z,hacer(mover(x,y,z),s))]
y
[Sobre(x,y, /\Libre(x,s)/\Libre(z,s)/\(X::F-
:::> y,hacer(mover(x,y,z),
dondeasumimosquetodaslasvariablesmencionadasestncuantificadasuniversalmen-
te.Alaprimeradeestasfrmulas seladenominaaxioma de efectos positivos. Esteaxio-
madescribecmounaaccinhaceverdaderoaunfluente. El segundoaxiomasedeno-
minaaxioma de efectos negativos, ydescribecmounaaccinhacefalsoaunfluente. En
cadacaso, el antecedente de un axiomade efectos describe las precondiciones que se
debensatisfacerparaaplicarlaaccin; yelconsecuentedescribecmocambiaelfluen-
tetrashaberaplicadolaaccin.
AunquehemosdefinidoLibreentrminosde tambinpodemosescribiraxiomas
deefectosparaelpar mover};desdeluego,stosdebenserconsistentesconladefi-
nicindeaxiomllsdeefectospara{Sobre,mover}.Losnuevosaxiomassern:
[Sobre(x,y,s)/\Libre(x,s)/\Libre(z,s)/\(X::F- z)/\(Y::F-
:::> Libre(y,hacer(mover(x,y, z), s]
y
[Sobre(x,y,s)/\Libre(x,s)/\Libre(z,s)/\(X::F- z)/\(Z::F- Suelo)
:::> --.Libre(z,hacer(mover(x,y, z), s]
2 Obsrveseque,encomparacinconeloperadormoverqueutilizamosconanterioridad,elnuevooperador,para
moverunblooue.incluyelalocalizacininicialdelbloque.
330
Enesteejemplo,losantecedentesestnformados pordospartes.Unaparteexpresalaspre-
condiciones bajolascualeslaaccinsepuedeejecutar,ylaotraparteexpresalacondicinbajo
lacual, si laaccinseejecuta,seobtendrnlosefectosdescritosenelconsecuentedelaxioma. En
elaxiomadeefectospositivos,estasegundapartees(y*' z)(siy z,aunquelaaccinsepue-
de ejecutar, al moverel bloque desde unaposicin determinada a la misma posicin, no se
obtienenlosefectosdescritosenelconsecuente).Enel axiomadeefectosnegativos,estasegun-
dapartees(z*' suelo)(si asumimosqueelsuelosiempreestlibre,nohayningunaaccinque
puedacambiardichoestado).
Parailustrarcmosepuedenutilizarlosaxiomasdeefectos,consideremoslasituacindel
mundodebloquesquesemuestraenlapartesuperiordelaFigura21.2. Estasituacinsatisface
lasprecondicionesdelosaxiomasdeefectos,comosepuedecomprobarutilizandolasustitucin
{B/x,A/y,so/s, Suelo/z}.Portanto,podemosaplicarlaaccindenotadapormover(B,A,
Suelo)einferirlosconsecuentes:
Sobre(B,suelo, hacer(mover(B,A, Suelo),SO,
-.Sobre(B,A, hacer(mover(B,A, Suelo),SO,y
Libre(A,hacer(mover(B,A, Suelo),SO
Cadaunadeestasexpresionestiene hacer(mover(B,A, Suelo),SO comoeltrmino
quedefineelestadosucesor(paraabreviar,podramosdenotaradichoestadosucesorpor En
laFigura21.2mostramoselestadoresultantedespus deaplicarlaaccin,ylasfrmulas que
describendichoestado(ademsdelasfrmulasinferidasapartirdelos axiomasdeefectos,hay
otrasfrmulasquetambinsonciertasenS1;luego,describiremosbrevementecmopuedenser
inferidasestasotrasfrmulas).
Esimportantedarsecuentadequeandespusdeaplicarunaaccin, todaslasfrmulas que
tenamosantesderealizarlainferenciasontodavaciertas! (despusdemoverelbloqueB alsue-
lo, todavaesciertoqueB estabasobreA enel estadoSO; delmismomodo,antes demoverel
bloqueB al suelo,siguesiendociertoelhechodequeB estarenel sueloenelestadoidentifi-
cadoporhacer(mover(B,A, Suelo),SO.Esdecir,lasfrmulasdelclculodesituaciones
sonindependientesdelestadoactual,enelsentidodequesiempre sonciertas(respectoalos
estadosalosqueserefierenlasfrmulas).
Algunas dificultades
21.2.1. Axiomasdemarco
Tal como se ve en la Figura 21.2, no todas la') sentencias que son ciertas acerca del estado
hacer(mover(B, A, Suelo), SO) se pueden inferir mediante los axiomas de efectos. Por
ejemplo,esobvioquealgunoshechosqueeranciertosenelestadoanterioralarealizacindela
accin,talescomoqueeestabaenelsueloyqueB estabalibre,tambinsiguensiendociertos
despus de laejecucin de la accin. Las acciones slo producen efectos locales y dejan
muchosotrosfluentes sincambiar. Parapoderrealizarinferencias acercadeestas constancias
necesitamosdefinirunpardefrmulas, denominadasaxiomas de marco, paracadaaccinycada
fluentequenovaranrespectoalaejecucindeunaaccin.Porejemplo,losaxiomas de marco
paraelpar{mover,Sobre}son:
[Sobre(x,y,s) 1\ (x*'
:::> Sobre(x,y,hacer(mover(u,v, z), s
y
[-,Sobre(x,y,s)1\ [(x*' u)y (y*' z)]:::> -.Sobre(x,y,hacer(mover(u,v,z), s
Elclculodesituaciones
....
Suelo
I
mover(B,A,Suelo)
Sl hacer(mover(B,A,Suelo),so

Suelo
Inferidoapartirdelosaxiomasdeefecto:
Sobre(B,Suelo,hacer(mover(B,A,Suelo),SO
,Sobre(B,A,hacer{mover(B,A,Suelo),SO
Libre(A,hacer(mover(B,A,Suelo),SO
Inferidoapartirdelosaxiomasdemarco:
Sobre(A,C,hacer{mover{B,A,Suelo),SO
Sobre{C,Suelo,hacer(mover(B,A,Suelo),SO
Libre(B,hacer(mover(B,A,Suelo),SO
Verdaderoentodoslosestados:
(Vs)Libre(Suelo,s)
Figura21.2.
Transformacindeunestadoaotromedianteunaaccin.
(Siunbloqueestsobreotrobloqueantesdeejecutarunaaccin,entonceselprimerbloque
siguetodavasobreelsegundobloque,siemprequelaaccinrealizadanohayasidomoverlode
suposicinoriginal;siunbloquenoestsobreotrobloqueantesdeejecutarunaaccin,enton-
ceselprimerbloquesiguesinestarsobreel segundo, siemprequelaaccinrealizadanohaya
sidocolocarlosobresteltimo).
Deformasimilaralos axiomasdeefectos, al primerodelos axiomasdemarcoseledeno-
minaaxioma de marco positivo, yalsegundo,axioma de marco negativo.
Losaxiomasdemarcodelpar{mover,Libre}son:
Libre(u,s) 1\ (u*' z):::> Libre(u,hacer(mover(x,y, z),s)
...,Libre(u,s) 1\ (u*' y):::>-.Libre(u, hacer(mover(x,y, z),s
(Siunbloqueestlibreantesderealizarunaaccin,stesiguelibredespus deejecutarla,
siemprequelaaccinnohayasidocolocarotrobloquesobrel;siunbloquenoestlibreantes
derealizarunaaccin,stesiguesinestarlibredespusderealizarla,siemprequelaaccinrea-
lizadanohayasidoliberarotrobloquequeestuvierasobrel).
Losaxiomasdemarcoseutilizanparademostrarqueunapropiedaddeunestadopermane-
ceciertatraslaejecucindeunaaccin. Porejemplo,enlaFigura21.2sepuedeutilizarunode
losaxiomasdemarcode{mover,Libre}parainferirLibre(B,hacer(mover(B,A, Sue-
lo),SO).Altenerquedisponerdeunpardeaxiomasdemarcoparacadacombinacinde accin
Sobre(B,A,SO)
Sobre(A,C,SO)
Sobre(C,Suelo,SO)
Libre(B,SO)
Libre(Suelo,SO)
SO
y fluente, la formulacin del clculo de situaciones se convierte en algo realmente inmanejable
cuando se aplica a problemas reales.
Diversos autores han estudiado cmo reducir el nmero de los axiomas de marco y cmo
deducirlos de forma automtica de los axiomas de efectos. Aqu no hablaremos de estas tcnicas,
pero stas utilizan la presuncin de que los nicos cambios que se pueden realizar en un fluente
son los que estn especificados explcitamente por los axiomas de efectos (se puede consultar
[Pednault, 1986; Schubert, 1990; Reiter, 1991, y Elkan, 1992]. Aun reduciendo el nmero de
axiomas de marco, utilizarlos para realizar inferencias acerca de qu fluentes no cambian duran-
te la ejecucin de un conjunto de acciones requiere un esfuerzo computacional muy costoso.
Todos estos problemas relacionados con el tratamiento de los fluentes que no se ven afectados por
la ejecucin de una accin constituyen lo que ha dado en denominarse el problema del marco. En
el prximo captulo hablaremos de un enfoque mediante el cual se pueden evitar algunos aspec-
tos del problema del marco.
21.2.2. CuaHficaciones
El antecedente de la frmula que define la transicin causada por una accin, tal como la accin
mover, describe las precondiciones para un caso ms bien idealizado. Supongamos que quere-
mos ser ms precisos, asegurndonos de que el objeto que se desea mover no pesa demasiado;
para ello, deberamos aadir otro conjunto a la precondicin, en concreto ..Demas i ado....:pesa-
do(x, s). Esta actitud precavida se puede llevar a cabo de forma indefinida, llevndonos a aa-
dir cualificaciones tales como: o(x, s), -,Brazo-robot-roto(s),
... , con sus interpretaciones obvias. El problema de tener que especificar todas las cualifica-
ciones importantes constituye lo que ha dado en denominarse el problema de la cualificaci6n. Ha
habido intentos de enfrentarse al problema de la cualificacin mediante el uso del razonamiento
no montono. Se basa en la idea de que los axiomas de efectos permiten realizar conclusiones por
defecto que se podran eliminar si se agregaran nuevas cualificaciones (vase, por ejemplo,
[Dean y Wellman, 1991, pp. 63 y ss]), pero estos intentos no han sido totalmente satisfactorios.
21.2.3. Ramificaciones
Todava existe otro problema. En los dominios complejos, deducimos a menudo sentencias
acerca de los objetos que estn basadas en conocimiento general del dominio. Por ejemplo, un
robot podra deducir que el paquete que est transportando est en una habitacin concreta, si el
robot est en dicha habitacin. As, en lugar de utilizar los axiomas de efectos y de marco para
razonar acerca de la localizacin del paquete, podramos razonar acerca de la localizacin del
robot y utilizar nuestro conocimiento general del dominio para deducir hechos sobre la locali-
zacin del paquete. Por ejemplo, supongamos que en la situacin so disponemos del hecho
En(PA, Hl), donde PA denota algn paquete, y Hl denota alguna habitacin. Despus de que el
robot se mueva a alguna habitacin diferente a Hl (denotada por H2), el robot podra deducir, uti-
lizando los axiomas de efectos, que l se encuentra realmente en la nueva situacin y, adems,
podra inferir que el paquete tambin est en la nueva situacin. Pero, cmo podemos evitar los
axiomas de marco para deducir que el paquete ya no est en la habitacin Hl en la nueva situa-
cin? El problema de seguir la pista a las frmulas derivadas que se generan en los siguientes
estados (es decir, las frmulas que se enlazan causalmente) se conoce como el problema de la
ramificaci6n. Se han propuesto varios mecanismos para el trataruiento del problema de la rami-
ficacin relacionados con procedimientos para el mantenimiento de la verdad.
El clculo de situaciones
Generacin de planes
Olvidemos por un momento los problemas del marco, de la cualificacin y de la raruificacin, y
veamos cmo el clculo de situaciones podra, en principio, utilizarse para planificar una secuen-
cia de acciones, usando mtodos de razonamiento. Para generar un plan que alcance un objetivo
y(s), intentaremos demostrar que (3 s) y(s), y utilizaremos el predicado de respuesta para
extraer el estado s como una funcin de la secuencia de acciones que lo ha generado.
Por ejemplo, supongamos que queremos un plan que, a partir del estado inicial SO que se
muestra en la Figura 21.1, consiga que el bloque B quede sobre el suelo. Para calcular dicho plan
debemos demostrar que (3s) Sobre(B, s). Utilizando la refutacin mediante resolucin,
demostraremos que la negacin del estado objetivo (3s) ..Sobre(B, Suelo, s) es inconsistente
con las frmulas que describen SO y los efectos de la accin mover. Utilizaremos un predicado de
respuesta para capturar las sustituciones realizadas durante la demostracin. Nuestras frmulas
para este problema sern:
-,Sobre(B, Suelo, s) v Resp(s)
Sobre(B, A, SO)
Sobre(A, e, SO)
Sobre(e, Suelo, SO)
Libre(B, SO)
Libre(Suelo, SO)
[Sobre(x, y, s) /\ Libre(x, s) /\ Libre(z, s) /\ (x ;f:. z) ::) Sobre(x, z,
hacer(mover(x, y, sJ
La ltima frmula es el axioma de efectos positivos de {Sobre, que debe con-
vertirse a la forma clausal antes de realizar la refutacin mediante resolucin. A medida que rea-
lizamos la refutacin, vamos dejando aparte el predicado de igualdad (x;f:. z) (que es una forma
de escribir ..(x z, hasta que todas sus variables hayan sido ligadas. Entonces, tal como dijimos
anteriormente, asumimos que disponemos de un conjunto infinito de axiomas del tipo (A =A),
-,(A = B), que utilizaremos en las resoluciones. Dejamos como ejercicio para el lector la com-
probacin de que la refutacin mediante resolucin generara Resp(hacer(mover (B, A,
Suelo), SO.
Si se requiriesen varias acciones para alcanzar el objetivo, las funciones de las acciones que-
daran en la respuesta en forma anidada. Por ejemplo, si el problema consistiese en conseguir que
el bloque A quede sobre el bloque B, partiendo del estado inicial mostrado en la Figura 21.1,
entonces obtendramos la respuesta: Resp(hacer(mover(A, B), hacer(mover(B, A,
Suelo), SO). Pero el esfuerzo necesario para realizar la demostracin de un plan tan sencillo
es demasiado grande, debido a los axiomas de efectos y los axiomas de marco. Muchos intentos
en utilizar el clculo de situaciones para generar planes se han visto frustrados debido al proble-
ma del marco.
El problema de la cualificacin fue formulado por primera vez por [McCarthy, 1977]. Han
habido varios intentos para resolver los problemas del marco y de la cualificacin utilizando
mtodos de razonamiento no montono. [Hanks y McDermott, 1986] descubrieron que las con-
clusionesnomontonaspuedenserambiguasenreferenciaaculessonlosfluentesquecambian
yculeslosquepermanecenigual.LostrabajosposterioresdeLBaker, 1991]y[Shoham, 1988]
ibanenfocadosaresolverestosproblemas(consltese[Kartha, 1994] paraverloscomentarios
sobreelenfoquedeBaker).Existeotroenfoquenomontonosobreel problemadelmarcoquese
basaenutilizaraxiomasdeestadosucesor paralimitarydescribirtodosloscambiosquese
puedengenerarenunfluentemedianteunaaccin [Reiter, 1991]. [Shanahan, 1997]esunlibro
acercadelproblemadelmarco.
Aunquelagranmayoradelosinvestigadoresquetrabajanactualmenteenplanificacincon
agentesutilizaparaellolas alternativasquesedescribenenel prximocaptulo, el clculode
situacionesysulenguajeasociadoGOLOG(aIGOIenLOGica) [Levesqueet al., 1997]sonlas
basesparalainvestigacinen robticaquerealizael GrupodeRobticaCognitivadelaUni-
versidaddeToronto[ScherlyLevesque, 1993].
21.1. ImaginemosunrobotR enunahabitacincondoscajas,el ye2. Enelestadoinicial,el
robotestenlaposicinPR, el enlaposicinPI, ye2enlaposicinP2. Seadmitequelastres
entidades(R, el, y e2) puedanestarenlamismaposicin. Dehecho, queremos que el y e2
estnenlaposicinP3. Elrobotdisponededosacciones,denotadasporir a(x)yempujar(y,
w, z).Laaccinrepresentadaporir a(x)mueveelrobotdesdedondequieraqueesthastala
posicinx,ynonecesitaprecondiciones.Elnicoefectoesqueelrobotestarenlaposicinx
trasejecutarlaaccin. Laaccinrepresentadapor ar(y,w, z)mueveelrobotylacaja
denotadapory alaposicin z.Estaaccinslosepuederealizarsielrobotylacajaestnenla
mismaposicin z.Susefectossonqueelrobotyelobjetoestarnambosenlaposicin z.
1. Expreseelestadoinicialylacondicinobjetivomediantefbfsdelclculodesituaciones.
Pongalafrmuladelestadoinicialylanegacindelafrmulaobjetivoenformaclausal.
2. Expreselasprecondicionesylosefectosdelasdosaccionesmediantefbfsdelclculode
situaciones,yconviertaestasfbfsalaformaclausal.
3. Detalletodos losaxiomasyconvirtalosenformaclausal.
4. Esboceunaestrategiageneralquedescribalospasosqueserequeriranparagenerarun
planquealcanceelobjetivoapartirdelestadoinicial.Noesprecisoconstruirlademos-
tracincompleta,sino,simplemente,expliqueenpalabrascmoprocederamos.
21.2. Imaginemosunahabitacinconunrobot,unamesayunlibro.Haytresposiblesposicio-
nes diferentes en lahabitacin, concretamente el centro, la pared y la entrada. El robot se
encuentraenlaentrada, ellibroestenlamesa, ylamesaestenelcentro. Elrobotsepuede
moverentredosposicionescualesquieradelahabitacin(aunquehayaobjetosendichasposi-
ciones)ypuedeempujarlamesadeunaposicinaotrasi,yslosi, elrobotseencuentraenla
mismaposicinquelamesa.
1. Describaelestadoinicialmedianteelclculodesituaciones.
2. Escribalasfrmulasdelclculodesituacionesquedescribenlosefectosdemovimiento
delrobot.
3. Escribalasfrmulasdelclculodesituacionesquedescribenlosefectosdequeelrobot
empujelamesa.
4. Escribalosaxiomasdemarconecesariosparademostrarquelaslocalizacionesdellibro
ylamesanocambiancuandoelrobotsemueve.
Elclculodesituaciones
5. Escribalosaxiomasdemarconecesariosparamostrarlosefectosenlalocalizacindel
librosielrobotempujalamesa.
6. Expreselasituacinenlaqueellibroestsobrelamesaylamesajuntoalapareddela
. habitacin, hacindoloentrminosdelestadoinicial ydelaejecucinde unaseriede
acciones.
21.3. ConstruyaunaformulacindeljuegodelasTorresdeHanoienelclculodesituaciones
(vaseEjercicio7.4),esdecir:
1. EspecifiquelasfrmulasquedescribenlasituacininicialSO.
2. Proponga una frmula para una ley de movimiento que describa los efectos de un
movimiento.Adems,definacomomnimounpardeaxiomasdemarcoasociadosalos
efectosyalmovimiento.
3. Escribalafrmulaqueespecificaelobjetivo.
21.4. Consideremoselsiguienteproblemadelmundodebloques:haydosbloques,llamados
A yB, Ytreslocalizaciones,llamadasLl, L2, YL3. LafrmulaEn(xI y,s)seinterpretacomo
una situacinenla que elbloquex se encuentraen laposicin y enelestado s. Lafrmula
Vacio(z,s)seinterpretacomounasituacinenlacuallaposicinz estvacaenelestados.
Disponemosdeunanicaaccin:mover(x,y, z),quedenotaelmovimientodelbloquex dela
posiciny alaposicinz. Asumimosquemovertienecomoprecondicinquelaposicinalaque
semueveunbloquedebeestarvaca.
1. Escribalaespecificacindeloperadormoverysusaxiomasdemarco.
2. DescribaunestadoinicialenelqueA estenlaposicinL1 yB enlaposicinL3.
3. DescribaelobjetivoconsistenteenponeraA enlalocalizacinL2 yaB enlalocaliza-
cinL3.
4. Utilicelaresolucinusandoelpredicado paragenerarunasecuenciadeacciones
quealserejecutadasenelestadoinicialdencomoresultadounestadoquesatisfagael
objetivopropuesto.Sepermiteformularpresuncionesacercadelosobjetosquenosean
iguales,como,porejemplo(B"*
Planificacin
Sistemas de planificacin basados en STRIPS
22.1.1. Descripcindeestadosyobjetivos
Existe una forma interesante de tratar el problema del marco que consiste en mezclar nuestro
enfoque de bsqueda en el espacio de estados con el clculo de situaciones. Esta combinacin
requiere pensar que las frmulas del clculo de predicados con las que describimos un conjunto
de estados del mundo son en s mismas un tipo de estado, siguiendo un enfoque parecido al que
utilizamos en el Captulo 7 cuando discutamos sobre el espacio de estados basado en caracte-
rsticas. Por ejemplo, en el mundo de bloques, los estados del mundo en los que el bloque B est
sobre el bloque A, el A sobre el bloque e, yel e sobre el suelo (como en la Fig. 22.1), se des-
criben mediante:
A)
e)
SU<::.LV
Sobre(B,A)
Sobre(A,C)
L
Sobre (c. Suelo)
Libre(B)
Libre (Suelo)
Figura 21.1.
Una descripcin de estado.
337
Estas frmulas describen un conjunto de estados del mundo, yaque son satisfechas por
todosaquellosestadosenlos quelasrelacionesrepresentadasporlas frmulas sonciertas. Si
existieranotrosbloquesysilosbloquestuvieranotraspropiedades,comoelcolor,porejemplo,
el conjuntodeestadosdescritoincluiraa todos aquellosestadosenl.os queestuvieranestos
otros bloques, y enl.os quelos bloques fueran detodos l.os c.ol.ores posibles,y assucesiva-
mente.
Paralaprimerafamiliademt.od.os deplanificacinquesevanadescribirenestecaptulo
pensarem.os en las frmulas que describen un conjunto de estados del mund.o c.om.o enuna
estructuradedatosquese puedemodificarmediantelasaccionesdeunagente. Describirem.os
mtodosparabuscarenelespaciodeestasestructurasdedatosunaquedescribaelconjuntode
estad.osdelmundoquesatisfaganunobjetivodado.Enestabsquedaenelespaciodeestados,las
estructurasdedatoss.onl.osestadosdelprocesodeplanificacin.Paradistinguirentrelosestados
delmundoyl.osestadosdelaplanificacin,generalmentenosreferiremosalossegundoscomo
lasdescripcionesde estados.
Paraevitarciertasdificultadestcnicasquen.o nosconciernenporah.ora, considerarem.osque
las descripcionesdelosestadosprevi.o y p.osterioraunaaccinvienendadas porsendascon-
junciones(oconjuntos)deliteralesbase.Permitiremosunaexcepcinaestarestriccin:unades-
cripcindeestadospuedecontenerunnmeroarbitrari.odefrmulasquesonciertasentodoslos
estad.os,tal c.omo Sobre(x.y)=> (y=Suelo)v -.Libre(y).Adems,restringiremoslosobje-
tivosaconjunci.onesdeliteralesquepuedenestarexistencialmentecuantificad.os. Deahoraen
adelante, lafrmuladeunobjetivo.dadap.or(ni' x
2
, , x
n
) Y(x, x
2
, , x
n
),laescribirem.os
simplemente como y(x, x
2
, , x
n
), dand.o p.or supuesta la cuantificacin existencial sobre
todaslasvariables.Aunqueexistenmuchasf.ormasdeevitarestasrestricciones,haymuch.ospro-
blemasdeplanificacininteresantesque sepuedenprop.onery resolveradmitiendoestasres-
tricciones.
Dadaunafuf.objetivoy, nuestrosmtodosdebsquedaconsistirnenencontrarunasecuen-
ciadeaccionesqueproduzcaunestadodelmundodescritomediantealgunadescripcindeesta-
d.oS.detal maneraqueS ... y. Direm.osent.oncesqueladescripcindelestadosatisfaceelobje-
tivo. Considerando que nuestras fufs de estados y objetivos estn sujetas a las restricciones
anteriores,direm.osqueS ... Ycuandoexistealgunasustitucincr tal queycr esunaconjuncinde
literalesbasetal quecadaunodeellosapareceenS. ParaaveriguarsiS ... yono,intentaremos
unificarelprimerliteraldeyc.on unliteraldeS,aplicarem.oslasustitucinunificadaalrestode
literalesdey, ycontinuarem.oselprocesoc.on cadaunodel.osrestantesdey(esteproces.oesel
mism.oqueseutilizaenelintrpretede PROLOG paraaveriguarsielcuerpodeunaclusulapue-
deunificarseconalgunoshechos).
Labsquedaenelespaci.odedescripcionesdeestadoslapodemosrealizar, bienendireccin
haciadelante,desdeelinici.ohastaelobjetiv.o,obienendireccinhaciaatrs,desdeelobjetivo
hastaelinicio.Algun.osautoresserefierenal.os mtod.osdeplanificacinqueutilizanlabsqueda
haciadelantec.omoplanificacinprogresiva,yalosmtod.osqueutilizanlabsquedahaciaatrs
comoplanificacinregresiva.Comenzaremosconlabsquedahaciaadelante.
22.1.2. Mtodosdebsquedahaciadelante
Pararealizarlabsquedahaciadelantesobreelespaci.odedescripcionesdeestados,necesitare-
mos operadores. stos se c.orresponden conlas acciones y su efect.o c.onsiste en cambiar la
descripcindeestadoprevi.oaunaaccinaladescripcindeestad.oposteri.oralaejecucindela
accin.La bsquedafinalizasatisfact.oriamentecuand.oseencuentraunadescripcindeestadoS,
talqueS ... Yparalafuf.objetivoy. Nuestrosoperadoresestnbasadosenlosdelsistemallama-
Planificacin 339
doSTRIPS [FikesyNilss.on, 1971, yFikes;Hart, yNilsson, 1972].12n
trespartes:
<!) Vn denominam.osprecor:4Jcionesdeloperador. La
pq<;lde ejecutarenunestadodado,sl.o sitodos
delestadoprevioalaaccin.
Unc.onj1!I1.!.B.de basealque listaborrar.
UnconjuntoA deliteralesbasealquedenominamoslistaaadir.
Paragenerarladescripcindelestadoposteri.oralaejecucindeunaaccin,primeroelimi-
namosdeladescripcindelestad.oprevi.oalaaccincualquierliteralqueestenR,yluegoaa-
dimostodoslosliteralesqueestnenA. Tod.os10sJiteralesquenoseexplicitanenR pasana la
descripcindelestado..posterioralaaccin.stapermanenciaimplcitadelos literalesdelades-
cripcindel accinesunapresunCinalaqueseledenominapresuposicinde
STRIPS,.).:, mlQda.. marco.
Los definenmedianteesquelJlasaIOIl qlledenomina-
m.osj:-.elQiStFUes..UnareglaSTRIPS disp.onede'vari3bleslibres,ysonlasinstanciasbasede
estasreglaslasquesec.orrespondenc.on l.os operad.oresreales. UnejemplodeunareglaSTRIPS
c.on lasvariableslibresx, yyz, sera:
mover(x,y, z)
pe: Sobre(x,y)1\ Libre(x)1\ Libre(z)
R: Libre(z),Sobre(x,y)
A:Sobre(x,z), Libre(Suelo)
(Aadim.os la frmula Libre(Suelo)explcitamente en la lista aadir p.orque si z es
Libre(Suelo)seraeliminad.oyquerem.osquesiempreseacierta.)EnlaFigura22.2
semuestraunejemplodeunainstanciabasedeestareglaSTRIPS paralaaccinconsistenteen
moverelbl.oqueBdeA alSuelo.
Obsrveseque laprec.ondicindeunareglaSTRIPS estdefinidaenformadeobjetiv.o, es
decir,enformadeconjuncindeliterales.Noes unacoincidencia,yseraprovechadomsade-
lante.Cuandolaprecondicinseinterpretac.omounafufobjetivo,seasumequelas variableslibres
depeestncuantificadasexistencialmente. UnainstanciadeunareglaSTRIPS sepuedeaplicar
aunadescripcindeestadoS, siexisteunainstanciabasedepe (consideradacom.oun.objetivo)
queessatisfechaporladescripcindelestado. Comodijim.os anteriormente,dichainstanciase
puedeenc.ontrarmediantelaunificacindecadaunodel.osliteralesdepe conunliteraldelades-
cripcindelestado,aplicandolasustitucinunificadaalrestodeliteralesdepc. Lainstanciadel
operadoraplicableseobtieneaplicandolasustitucinresultanteatodosloselementosdelaregla
STRIPS. Lasreglasdebenestarescritasdetalmaneraquealaplicardichasustitucinsiemprese
obtengaunainstanciabasedelaregla;esdecir,nopuedenexistirvariableslibresenRoenAque
noaparezcanenpc. EnlaFigura22.2 semuestralaaplicacindeunoperadorSTRIPS.
Enelmtododebsquedahaciadelantegeneram.osnuevasdescripci.onesdeestadoaplicando
instanciasdelasreglasSTRIPS hastaqueunadescripcindeestad.osatisfacelafufobjetiv.o. En
laFigura22.3 mostram.os partedeungrafodebsquedahaciadelante.Yaquemuch.osdeloslite-
ralesenunadescripcindeestadon.o cambiantraslaaplicacindelos.operad.oresSTRIPS, pode-
mos optimizarlas implementacionesdelas bsquedas haciadelanteguardando solamente l.os
cambios(podramosutilizarunabsquedaA* utilizandoalgunafuncinIi queestimaraelc.oste
de alcanzar un estado objetiv.o y alguna funcin gque reflejara los costes de las acciones).
Obsrveseque,enc.ontrasteconelclculodesituaciones,nohayquedemostrarquelasacciones
dejanalgunasrelacionessincambiar;lapresup.osicinSTRIPS seencargadeell.o.
mover(B,A,Suelo)
...
JL d
Precondiciones:
Sobre(B,A)
Libre(B)
Libre(Suelo)
ListaBorrar
Sobre(B,Suelo)
Sobre(B,A) Libre(A)
ListaAadir
Libre(Suelo) Libre(Suelo)
Sobre(A,C) Sobre(A,C)
Sobre(C,Suelo) Nocambia 1... 1Sobre(C,Suelo)
Libre(B) Libre(B)
Figura22.2.
UnoperadorSTRIPS.
mover(A,e,B)
Sobre(C,Suelo)
Libre(B)
Libre(A)
Sobre(B,Suelo)
Sobre(A,C)
Libre(Suelo)
mover(B,A,Suelo)
Sobre(C,Suelo)
Libre(B)
Sobre{A,C)
Sobre(B,A)
Libre(Suelo)
Figura22.3.
Bsquedahaciadelante.
Planificacin 341
El! aplicaciones reales, en lasquC? lli:'i descripciones de estado y el nmero de reglfts son
gt:!!ndes, labij'squedahacia amenosqueutilicemosalgunaheustiGa..
de conseguirquela
bsqu"'e'l::la1mctliltelhteseamseficienteconsisteenidentificarsubobjetivosenelespaciode
bsquedaydirigirlabsquedahaciaelcaminoquelosunaaladescripcindelestadoobjetivo.
Enelapartadosiguientedescribiremosunmtodoparaidentificaryaprovechardichossubob-
jetivos.

"""\ '1
22. .

Cuandounacondicinobjetivoestcompuestaporunaconjuncindeliterales,talcomoestamos
suponiendo,podemosdirigirlabsquedahaciadelantemediantelaheursticadividey vencers.
Primero,consideramosunconjuntor,luegootro,yassucesivamente.Unadescripcindeestado
enlaqueunodelosconjuntoressesatisfacerepresentaunsubobjetivoenelespaciodebsque-
da.Primerotrabajamoshaciadelantepararesolveresesubobjetivo,aplicandooperadoresquevan
produciendo sucesivas descripciones de estadohasta que se satisfaceel correspondiente con-
juntor;entonces, volvemosabuscarhaciadelanteconsiderandoelsiguientesubobjetivo, yas
sucesivamente.Desdeluego, puedeocurrirqueal intentaralcanzarlos siguientessubobjetivos
anulemoslosprevios.
UnsistemadesarrolladoenlosiniciosdelahistoriadelalA,denominadoResolutorGeneral
de Problemas (General Problem Solver, o GPS) [Newell; Shaw, y Simon, 1959; Newell y
Simon, 1963],explotabalabsquedabasadaensubobjetivos;los operadoresparaalcanzarlos
distintossubobjetivosseseleccionabanmedianteunprocesodenominadoanlisisdemediosy
fines.AplicadaalossistemasdeplanificacinconreglasSTRIPS,estatcnicaconsisteenselec-
cionaruna instanciade unode losconjuntoresdela condicinobjetivo y seleccionaruna ins-
tanciadeunareglaSTRIPSquelosatisfaga.Entoncescreamoscomosubobjetivoslasprecon-
dicionesnecesariasparaaplicardicharegla,yprocedemosrecursivamentecondichossubobje-
tivos. Este procedimiento es la base para un programarecursivo al que llamamos STRIPS.
Acontinuacin, mostramos cmo el programa STRIPS resuelve lafrmula conjuntivade un
objetivoy:
STRIPS(y).ElprocedimientoutilizaunaestructuradedatosglobalS queestcompuestapor
unconjuntodeliteralesbase. Inicialmente,estaestructuradedatosesladescripcindelesta-
doinicial.
1. Repetir. ElcuerpoprincipaldeSTR1PSesunaiteracinqueserepitehastaqueunades-
cripcindeestadosatisfaceelobjetivoy. Eltestdeterminacindelpaso9produceuna
sustitucinO' (posiblementevaca)talquealgunodelosconjuntoresdeyO' (posiblemente
ninguno)aparezcaenS.Sepuedenrealizardiversassustitucionesenlaevaluacin,conlo
queeltestesunposiblepuntoderetroceso.
2. g f- esunelementodeyO' talqueS1= g. Esposibleseleccionarcualquierelemento,por
10 que ste es otro posible punto de retroceso. En trminos del anlisis de medios y
fines,g seinterpretacomounadiferenciaquehayquereducirparaalcanzarelobje-
tivo.
3. f f- es una regla STRIPS cuya listaaadircontiene un literal Iv que se unifica cong
medianteelumgs. Ya quepuedenexistirmuchasreglasquecumplandichacondicin,
steesotroposiblepuntoderetroceso. Decimosquef esunoperadorrelevantepara
reducirladiferenciaencontradaenelpaso2.
4. f f-- fs. staeslainstanciadefobtenidautilizandolasustitucins.Obsrvesequefno
es necesariamente una instancia base; es decir, sus precondiciones puedencontener
variables.
5. p f-- eslafrmuladelasprecondicionesdef(instanciadaconlasustitucins).
6. STRIPS(P) esunallamadarecursivaparagenerarunadescripcindeestadoquesatisfa-
gaal subobjetivo.EstallamadacambiarlaestructuradedatosglobalS.
7. f"f-- esunainstanciabasedefaplicableenS.
8. S f-- eselresultadodeaplicarf"aS.NtesequeS siempreestcompuestaporunacon-
juncindeliteralesbase.
9. HastaqueS 1= 'Y.
Obsrvesequeenelpaso9siempreestamosevaluandoelobjetivoglobal'Y. Sialgunodelos
conjuntores de 'Y es anulado mientras se intenta obtener otro, entonces el primero debe ser
resueltootravezantesdequeelprocesofinalice, oelprocesodeberretrocederparaintentarotro
caminoquenoelimineelprimero.
Aunque nolo hemos mencionadoexplcitamenteennuestra descripcin del algoritmo, la
secuenciadeoperadoresquealcanzanelobjetivo,yqueformanelplan,sepuedeextraerapartir
delatrazadelaejecucindelalgoritmo(encasodexito).Estasecuenciadeoperadorescorres-
ponderalas acciones queel agentepuedeejecutar, bien balsticamente (en aquellassitua-
cionesenlas queesapropiadolanzarelplanparasuejecucinininterrumpida),obienmediante
sucesivosciclospercibir/planificar/actuar.
El siguiente ejemplo muestra cmo trabaja el algoritmo. Supongamos que inicialmente
tenemos la situacin representada en la Figura 22.1, y que intentamos alcanzar el objetivo
Sobre(A,Suelo)A Sobre(B,Suelo)A Sobre(e,B). Eltestdeterminacindelpaso9no
encontrarningnconjuntorenladescripcindelestadoinicialqueseasatisfacible.Supongamos
queSTRIPS seleccionaSobre(A,Suelo)comog. Lainstanciadereglamover(A,x,Suelo)
tieneSobre(A,Suelo)ensulistaaadir;portanto, llamamosrecursivamenteaSTRIPS para
alcanzarlasprecondicionesdelaregla,esdecir, Libre(A)A Libre(Suelo)A Sobre(A,x).
Eltestde terminacindelpaso9enlallamadarecursivaproducelasustitucine/x,conlaque
se satisfacen todas las precondiciones enel estado inicial, excepto Libre(A). Entonces, se
tomaelliteralLibre(A)yseseleccionalainstanciadereglamover(y,A, u)pararesolverdicho
literal.
Pararesolverlas precondiciones de laregla, Libre(y)A Libre(u)A Sobre(y,A), lla-
mamosotravezdeformarecursivaaSTRIPS. Eltestdelpaso9enestasegundallamadarecur-
sivaproducelasustitucin{B/y, Suelo/u},quehacequecadaliteraldelasprecondicionesse
satisfagaenelestadoinicial.As,podemossalirdelallamadarecursivaparaaplicareloperador
mover(B,A, Suelo),quecambiaelestadoiniciala:
Sobre(B,Suelo)
e)
Sobre(e,Suelo)
Libre(A)
Libre(B)
Libre(Suelo)
Ahora volvemos a laprimera llamadarecursiva, en donde volvemos a aplicarel test del
paso9 (Libre(A)A Libre(Suelo)A Sobre(A,x.Estaevaluacinsesatisfaceennuestra
nueva descripcin de estado mediante la sustitucin e/x, y aspodemos salir de laprimera
Planificacin 343
22.1.4.
llamadarecursivaparaaplicareloperadormover(A,eI Suelo)ygenerarunaterceradescrip-
cindeestado:
Sobre(B,Suelo)
Sobre(A, Suelo)
Sobre(e,Suelo)
Libre(A)
Libre(B)
Libre(e)
Libre(Suelo)
Ahorapodemosaplicarotravezeltestdelpaso9delprogramaprincipal.Elnicoconjuntor
del objetivooriginalque no apareceenlanuevadescripcinde estadoes Sobre(e,B). Repi-
tiendoelprogramaprincipal,nosfijamosenquelaprecondicinmover(e, B)sesatis-
face, pudiendoaplicarlaaccinparagenerarladescripcinde estadoquesatisfaceelobjetivo
principal,y, as,finalizarelproceso.
Planesconcondicionesentiempodeejecucin
Sifusemoscapacesderefinarlasdescripcionesdeestadodurantelaejecucindeunplanapli-
candoprocesosperceptuales,podramosgeneralizarligeramentelostiposdefrmulasqueseper-
mitenenlasdescripcionesdeestado.Analicemosquocurrirasipermitisemosdisyuncionesde
literalesenunafrmuladedescripcindeestado.Parasermsespecficos,supongamosquetene-
moslafufSobre(B,A) v Sobre(B,e)enunadescripcindeestado;estafrmulaintentarepre-
sentarqueB estsobreA oqueestsobre e, peroelsistemanosabeculdelosdos hechoses
ciertoenelinstanteenqueelplanseestgenerando.
Laaplicabilidadde algunosoperadoresSTRIPS adichadescripcindeestado,y/olosefectos
deestosoperadores,podrannodependerdeculdelosdoshechos, Sobre(B,A) oSobre(B,e),
sesatisface.Paratalesoperadoresnoesimportantequeaparezcaunadisyuncinenladescripcin
delestado; simplemente,ladisyuncinpasaraaladescripcindelestadoposterioralaaccin.
Porel contrario, ciertos operadores podrantener uno de los dos hechos, Sobre(B,A) o
Sobre(B,e),comounade las precondiciones. Paraejecutarlas acciones correspondientes a
dichos operadores,elsistematendraquedeterminarculde los disyuntores se satisfaceenel
momentoenelquelaaccinseejecuta(esdecir,entiempodeejecucin).Enalgunoscasos,los
procesosperceptualespuedenrealizarestadeterminacin.Siesas,sepodrainsertarenelplan
unacondicinentiempodeejecucin,estoes, unacondicinquesecomprobaraenelinstanteen
queseaplicaradichooperador. Paralaconstruccindelrestodelplan,quedependerdequela
condicin en tiempo de ejecucin se satisfaga o no, el proceso se dividira en tantas ramas
comodisyuntoresaparezcanenlasprecondicionesdeloperador.Cadaramarepresentaraunposi-
blecaminoalternativoformadopordescripcionesdeestadoyoperadores(unahistoria).Ennues-
troejemplo,unaramaasumiraque Sobre(B,A) es(oser)ciertoenelmundocuandodeban
aplicarselasaccionesrestantes,ylaotraasumiraqueeselhechoSobre(B,e) elquees(oser)
ciertoenelmundo.Cadaunadeestasramassedenominacontexto.Durantelaplanificacin,el
sistemapodradesconocerqudescripcin de estadodescribirelestadoreal del mundoen el
momentoenqueelcontextosebifurque,peroesseguroquesucederunodeellos.Portanto,bas-
taconstruirunplanalternativoparacadacontexto.Entiempodeejecucin,cuandoelsistemase
encuentreenlabifurcacindedosomscontextos,losprocesosperceptualesdeberndetermi-
narculdelosdisyuntoresescierto,ylaejecucinserealizaraalolargodelcaminoadecuado.
Enlosproblemascomplejos,puedehabermuchoscontextosramificados.
Algunas veces ocurre, como resultado de una accin previa, que un proceso perceptual es
capaz de determinar qu disyuntor es cierto en el mundo en el instante en que la informacin es
requerida. Sin embargo, ms a menudo, el sistema debe planificar la obtencin de dicha infor-
macin, utilizando para ello operadores correspondientes a acciones informativas. En nuestro
ejemplo, para poder determinar cul de los dos hechos, Sobre(B, A) o Sobre(B, C), es cierto,
el sistema podra tener que ejecutar acciones que puedan leer el rtulo de un bloque. Este tipo de
acciones se pueden representar mediante operadores STRIPS cuyos efectos incluyen una espe-
cificacin formal de lo que debe ser conocido. En este caso, las condiciones en tiempo de eje-
cucin tendran la especificacin formal de lo que debe ser conocido como precondicin.
22.1.5. La anomala de Sussman
Consideremos la aplicacin del procedimiento recursivo STRIPS al problema del mundo de blo-
ques que se muestra en la Figura 22.4. La condicin objetivo es Sobre(A, B) A Sobre(B, C). El
procedimiento STRIPS debe conseguir primero que se satisfaga uno de los conjuntores. Supon-
gamos que elige Sobre(A, B); entonces retira e de A, ponindolo por ejemplo en el Suelo, y
coloca A sobre B; pero para satisfacer el otro conjuntor, Sobre(B, C), hay que anular Sobre(A,
B). Ahora, supongamos que elige primeroSobre(B, C); entonces coloca B sobre e, pero para
alcanzar el otro conjuntor, Sobre(A, B), hay que anular Sobre(B, C), y tendra que volver a
intentar satisfacerlo. Ninguna de las dos opciones consigue un plan con un mnimo nmero de
operadores aplicados. Este problema particular del mundo de bloques fue denominado anomala
de Sussman, debido al autor que lo plante [Sussman, 1975].
La dificultad que encuentra el STRIPS recursivo en este problema es que, en cada instante, el
algoritmo se dirige a uno de los conjuntores mediante una bsqueda del tipo primero en profun-
didad. Si se realizara una bsqueda hacia delante del tipo primero en anchura, el algoritmo
encontrara el plan ms corto, pero, tal como hemos comentado previamente, la bsqueda hacia
delante del tipo primero en anchura es computacionalmente inviable en entornos reales.
Una alternativa consiste en intentar realizar una bsqueda del tipo primero en anchura diri-
gida hacia atrs. Quiz sera computacionalmente ms eficiente que la bsqueda hacia delante, ya
que, por lo general, hay menos conjuntores en la fuf objetivo que literales base en la descripcin
del estado inicial. A continuacin, hablaremos sobre la bsqueda hacia atrs.
22.1.6. Mtodos de bsqueda hacia atrs
Podemos usar las reglas STRIPS para buscar hacia atrs desde un estado objetivo. Para ello,
debemos efectuar una regresin desde la fuf objetivo, utilizando las reglas STRIPS para obtener
fufs de subobjetivos. La regresin de una frmula y mediante una regla STRIPS a es la frmula
ms dbil y', tal que, si y' se satisface en una descripcin del estado previo a la aplicacin de una
instancia de a (y y' satisface las precondiciones de dicha instancia de a), entonces y se satisfar
en una descripcin del estado posterior a la ejecucin de la instancia de a (una frmula <1>1 es ms
C
fBl
Figura 22.4.
La anomala de Sussman.
Planificacin 345
dbil que una frmula <1>2 si <1>2 1= <1>1' De esta manera, por ejemplo, P v Qes ms dbil que P, y P
es ms dbil que PAQ).
Los clculos para la regresin son sencillos si partimos de un objetivo que es una conjuncin
de literales base y realizamos la regresin slo mediante operadores STRIPS (instancias base de
la reglas STRIPS). En este caso, todas las regresiones sern tambin conjunciones de literales
base. Mostramos un ejemplo en la Figura 22.5, en el que utilizamos el proceso de bsqueda hacia
atrs desde la descripcin del objetivo. El problema consiste en alcanzar A sobre B, B sobre e, y
e en el Suelo, desde un estado en el que B est sobre A, A sobre e, y e en el Suelo. Para ello,
retrocedemos desde la condicin objetivo, Sobre(C, Suelo) A Sobre(B, C) A Sobre(A, B),
mediante algn operador que alcance alguno de los conjuntores del objetivo. Retrocedamos
utilizando mover(A, Suelo, B) para generar la fuf subobjetivo. El operador alcanza uno de los
conjuntores, en concreto, Sobre(A, B); de esta manera, Sobre(A, B) ya no es un subobjetivo,
pero cualquier precondicin del operador que no se encuentre en la descripcin del objetivo s
debe ser un subobjetivo. En este caso, stas son: Libre(B), Libre(A) y Sobre(A, Suelo).
Los otros dos conjuntores de la fuf objetivo, Sobre(C, Suelo) y Sobre(B, C), no son ni aa-
didos ni destruidos por el operador; simplemente, pasan a travs del operador al estado subob-
jetivo. Tal como se muestra en la Figura 22.5, otra alternativa en nuestra bsqueda hacia atrs
sera retroceder desde la fuf objetivo utilizando mover(B, Suelo, C). La bsqueda hacia atrs
trabaja hasta que un subobjetivo se satisface en la descripcin de estado actual (quiz mediante
algn procedimiento semejante al A*).
Es interesante observar qu ocurre si realizamos la regresin sobre un conjunto de literales
con un operador que tiene uno de esos literales en su lista borrar. No hay manera de que un ope-
rador pueda satisfacer un literal Asi ese literal es eliminado por el operador! Por tanto, la regre-
sin de cualquier conjuncin que contenga Autilizando un operador que elimine Aes F. Desde
luego, no se necesita continuar la bsqueda hacia atrs desde una descripcin de estado que con-
tenga a F, ya que este estado ser imposible de alcanzar.
Objetivo
Sobre(C,Suelo)
mover(B,Suelo,C)
Sobre(B,C)
Sobre(A,B)
mover(A,Suelo,B)
Sobre(C,Suelo)
Sobre(B,C)
Libre(B)
Libre(A)
Sobre (A,Suelo)
Subojetivo: la regresin de
Sobre(C, Suelo) Sobre(B,C)
utilizando mover (A, Suelo, B)
Sobre(A,B)
Continuar hasta que se genere un subobjetivo
que se satisface en el estado del mundo actual
Figura 22.5.
Regresin de una conjuncin utilizando un operador STRIPS.
346
347
Sobre(B,e)
Libre(B)
Libre(A)
Sobre(A,x)
A menudo, es aconsejable utilizar una regla que no est completamente instanciada para
hacerlaregresindesdeunobjetivo,esdecir,utilizarunareglaquetodavacontengavariables
males. En laFigura 22.5, hemos seleccionado la instancia mover(A, Suelo,B) como una
alternativaparaalcanzarSobre(A,B). PorqudecidimosmoverA retirndolodel Suelo? Est
claroquetenamosquemoverloretirndolodealgnsitio. Pero, porquobligarnosamoverlo
desdeelSuelo? Quizexistaalgnplanmejorquelomuevadesdecualquierotrositio.Unaforma
deretardarestadecisinconsisteendejarprovisionalmenteinespecificadoelparmetrodesde
dondesemueve deloperadormover. Estoesunejemplode loquesellamaplanificaci6n con
mnimo compromiso; dejamoselparmetrodesdedondesemueveinespecificadopararetroce-
derdesde elobjetivo mediante un operador mover(A, x, B) instanciado parcialmente. Enla
Figura22.6mostramoselresultadodeestaregresin.Elresultadoseparecebastantealdeantes,
exceptoenqueahoraunadelasprecondiciones,SObre(A,x),tieneunavariable.Esteliteral,inter-
pretadocomounsubobjetivo,sesatisfarsilounificamosconunliteralbasedeunadescripcinde
estado.Labsquedahaciaatrsatravsdeunespaciodesubobjetivosquecontenganvariablesnos
penniteutilizaroperadoresadicionalesparainstanciarlasvariables,bienconotrasvariables,obien
conconstantes.Unaposibleheursticaconsistiraenretardarlainstanciacinhastaqueloslitera-
lesdelossubobjetivosseunifiquenconlosliteralesdeladescripcindelestadoinicial.
Algunasvecessepuedenutilizardiversosprocesosderazonamientoparadefinir
nes sobre las variables. En el ejemplo que se muestra en laFigura 22.6, la variable x en
Sobre(A,x)nopuedeserigualaA, yaqueelbloquequeestamosmoviendoesA, nitampoco
puedeserigualaBporqueloqueestamoshaciendoesmoverA desdecualquierotrositioqueno
seaB. Tampocopuedesere,perolacausaesmssutil: six fuerae,tendramosSobre(A,e)
como uno de los conjuntores del subobjetivo, pero entonces, el conjuntor SObre(B, e)del
objetivonopodrapasarsealsubobjetivo,porquenopodemosteneralmismotiempolosbloques
A yB sobreelbloquee(obsrvesequelossubobjetivosqueseutilizanenel STRIPSrecursivo
sondiferentesalosquesegeneranmediantelaregresin!).
Objetivo
-
Sobre(e,Suelo)
mover(B,z,e)
Sobre(B,e)
Sobre(A,B)
mover(A,x,B)
Sobre(e,Suelo)
PorquemovemosA desdecualquier
sitioexceptodesdeB
B)
A)
e)
PorqueSobre(B,e) ySobre(A,e)
nopuedenserambosciertos
Figura22.6.
PorqueA nopuedeestar
sobresmismo
RegresindeunaconjuncinutilizandounareglaSTRIPSconunavariable.
Planificacin
ElprocedimientocompletopararealizarlaregresinmediantereglasSTRIPSquenoestn
totalmenteinstanciadasesrealmentecomplejo.Esteprocedimientoseexplicaconmayordetalle
en[Nilsson, 1980,pp. 288yss.]. EnlaFigura22.7 mostramosunpequeoejemplodelabs-
quedaregresiva.Enestecaso,lasvariablesseinstancianaSue1o,debidoaqueelrazonamien-
tosobrelasrestriccionesnosllevaadescartartodaslasalternativasrestantes.Labsquedafina-
lizacuandosegeneraunsubobjetivoquesesatisfaceenladescripcindelestadoinicial.
mosleerentonceslasecuenciadereglasqueenlazaelobjetivoprincipalconelsubobjetivoque
sesatisfaceenelestadoinicial.Apartirdeestasecuenciadereglaspodemosconstruirunplan
Sobre(e,Suelo)
mover z,e)
Sobre(B,C)
Sobre(A,B)
Sobre(C,Suelo)
Sobre(B,C)
Sobre(C,Suelo)
Libre(B)
Libre(B)
Libre(A)
Libre(A)
Sobre(A,x)
...,(y B)
...,(x B)
(y = A)
...,(x A)
-,(y e)
...,(x e)
Sobre(A,x)
Sobre(B,y)
-,(x B)
...,(x Al
...,(x e)
Sustituciones:
Suelo/x, Suelo/y
Sobre(C,Suelo)
Sobre(e,Suelol
Libre(B)
Libre(A)
Sobre(A,Suelol
Sobre(B,Suelo)
mover(B,A,Suelo) (
Esteobjetivosesatisfaceen
ladescripcindelestadoactual
Figura22.7.
Bsquedahaciaatrs.
Libre(B)
Libre(A)
Sobre(A,C)
Sobre(B,Suelo)
paraalcanzarelobjetivo;bastarealizarlasinstanciacionesquesehanidogenerandoenlabs-
queda.Unejemplomscomplejosedaen[Nilsson,1980,pp.292-296].
Aunquelabsquedahaciaatrsmedianteregresinesposiblementemseficientequelabs-
quedahaciadelante,secomplicaaldejarvariablessininstanciar.Enproblemassimplesdelmun-
dodebloques,lasvariablessepuedeninstanciarsindemasiadadificultad,peroelmtodonoes
viable computacionalmente en problemas ms grandes, a menos que utilicemos heursticas
especficasdel dominio.
Enlasbsquedashaciaatrsdeltipoprimeroenanchuranoseimponeningunarestriccin
sobreel ordenenquedebenalcanzarselos diferentesconjuntoresdelobjetivo.Laanomalade
Sussmanesunejemplodeproblemaenelqueesmejorentremezclarlospasosnecesariospara
resolvercadaunodelosconjuntores.Retardarladecisinacercadelordendelospasosenelplan
final es otro ejemplo de la planificacin con mnimo compromiso, y sepuede tratar mejor
medianteunabsquedaenelespaciode planesenvezdeenelespaciodeestados.Enelespa-
ciodeplanes,lospasosdelplanestnordenadosparcialmente.Enlaprximaseccinhablare-
mosdeestaestrategiadeplanificacin,denominadaplanificacin parcialmente ordenada (PPO)
(alosplanescuyospasosestnparcialmenteordenadosselesllamaavecesplanes no lineales).
Espacio de planes y planificacin parcialmente ordenada
EnlaFigura22.8 semuestrandosenfoquesdiferentesparalaconstruccindeplanes.Cuando
buscamos(haciadelante,porejemplo)enunespaciodefrmulas, lasreglasSTRIPS seaplican
Bsquedasobreelespaciodeestados:
Conjuntodefnnulas
Elementodeunplan
Bsqnedasobreel
espaciodeplanes:
Operadoresdetransfonnacin
deplanes
Planincompleto
Planincompleto
Figura22.8.
Bsquedasobreelespaciodeestadosfrenteabsquedasobreelespaciodeplanes.
Planificacin 349
mover(A,x,B)
O 0-0 O
1Aadirun
0-0
O mover{A,x,B)
0-0
1(Re)ordel1
mover(A,x,B)
0-0 0-0 O
mover{A,C,B)
O 0-0 0-0 O
Figura22.9.
Algunosoperadoresdetransformacindeplanes.
aconjuntosdefrmulasparagenerarconjuntosdefrmulas sucesores,ycontinuamosashasta
queunadescripcindeestadosatisfacelafrmulaobjetivo.Cuandohacemoslabsquedaenun
espaciodeplanes,losoperadoresparagenerarlosnodossucesoresnosonreglas STRIPS, sino
operadoresquetransformanplanesincompletos,osininstanciar,enplanesmsarticulados,yas
hastaqueunplanejecutabletransformaladescripcindelestadoinicialenunoquesatisfacela
condicinobjetivo.Enlabsquedasobreelespaciodeplanes,losoperadorespuedenaplicardife-
rentestcnicasparatransformarplanesenotrosplanes;stasincluyen:a) aadirpasosaunplan;
b) reordenarlospasosdeunplan;c)transformarunplanordenadoparcialmenteenunoordena-
dototalmente,yd) transformarunesquemadeplan(convariablessininstanciar)enalgunains-
tancia.EnlaFigura22.9semuestranejemplosdealgunosdeestosoperadores.
Vamosailustrarlosmtodosdebsquedaenelespaciodeplanesaplicndolosalaanomala
deSussman(Fig.22.4).Nuestradescripcinestbasadaenlatcnicadeplanificacinnolineal
sistemtica (PNLS) [McAllester y Rosenblitt, 1991] yenel procedimiento NONLlN [Tate,
1977].LoscomponentesbsicosdeunplansonlasreglasSTRIPS. stasserepresentanmedian-
teestructurasdegrafosquedisponendedostiposdenodos:nodosovalados,queseetiquetancon
nombresdereglas STRIPS, ynodos cuadradosqueseetiquetanconlosliteralesdelasprecon-
dicionesylosefectosdelasreglas.EnlaFigura22.10semuestraestetipodeestructuradegra-
fo. Obsrvesequelascajas,enlapartesuperiordelgrafosonlosefectos,ylasdelaparteinferior
sonlasprecondiciones.
Representamoslafufobjetivoylosliteralesdelestadoinicial medianteunasreglasficticias
denominadasinicioy fin.Lareglafintienecomoprecondicioneselobjetivoprincipal,y
susefectosestnvacos (Nil).Eloperadoriniciotienecomoefectoslosliteralesdelades-
cripcindel estadoinicial, ycomoprecondicionesT. EnlaFigura22.11 mostramosestasdos
reglasparaelproblemadelaanomaladeSussman.
350
351
Efectos I Libre (y) Sobre(x,z)
Operador
Precondiciones ISobre (x, y) Libre(z)
Figura 22.10.
Representacin grfica de una regla STRIPS.
La estructura del plan inicial (antes de aplicar cualquier operador de transformacin de pla-
nes) se compone de las dos reglas y fin sin conexin entre ellas, tal como se muestra en
la Figura 22. t 1. Obviamente, el plan est incompleto (definiremos ms adelante qu queremos
decir con que un plan est completo).
La bsqueda de un plan comienza aplicando uno de los operadores de transformacin de pla-
nes a la estructura del plan inicial. Los planificadores con mnimo compromiso utiUzan diversos
mtodos para la seleccin de estos operadores de transformacin de planes. Un posible mtodo de
transformacin que podemos seleccionar en este paso consiste en extender la estructura del
plan inicial aadiendo una regla para alcanzar alguno de los conjuntores del objetivo. Suponga-
mos que decidimos resolver aadiendo la instancia de regla mover(A, y,
Aadimos esta instancia al grafo del plan inicial. Como hemos decidido aadir esta regla para
resolver Sobre(A, B), enlazamos esta caja de efecto de la regla con la caja de la precondicin de
la regla f in. En la Figura 22.12 se muestra el resultado. Obsrvese que todava no hemos for-
mulado ningn compromiso acerca de cul es el lugar al que movemos A.
L
El objetivo representado
Suelo
fin
como un operador
Sobre(A,B) Sobre(B,C)
Sobre(C,A) Libre (Suelo)
El estado inicial representado
como un operador
~ l
Suelo
LibretC)
Figura 22.11.
Representacin grfica de las reglas inicio y fin.
Planificacin
Sobre{B,CI
Libre(B) Sobre (B,Suelol
Figura 22.12.
La siguiente estructura del plan.
En esta nueva fase existen diversas transformaciones de plan que podemos aplicar. Podra-
mos instanciar y a Suelo y colocar un enlace entre la precondicin Sobre(A, Suelo) del
operador instanciado mover y Sobre(A, que es verdadero en el estado inicial. Tam-
bin podramos colocar un enlace entre los dos Libre(B), o podramos intentar obtener la pre-
condicin de mover(A, y, B). Esta precondicin se podra obtener insertando una
instancia de regla mover(u, A, v) (mover algo (una instancia de u) que est sobre A a cualquier
otro lugar (una instancia de v. Entonces, podramos instanciar u a C y v a Suelo yestable-
cer los enlaces correspondientes a las frmulas del estado inicial. El resultado de este conjunto
de pasos de transformacin del plan se muestra en la Figura 22.13.
En esta fase, vemos que las precondiciones de los dos operadores mover se satisfacen en el
momento en que los operadores son aplicados. Hay una ordenacin implcita en la estructura del
grafo entre los dos operadores mover, de forma que todava est incompleto. Ms adelante, en
nuestra descripcin del proceso de planificacin, nos volveremos a referir a estas dos ocurrencias
de los operadores mover. Debido a esto, los hemos etiquetado como a y b en la Figura 22.13.
Representamos de forma explcita el hecho de que b debe ocurrir antes que a, mediante la nota-
cin b < a, donde < representa antes que. Obsrvese que las dos instancias, Sobre(C, Suelo)
y Libre(Suelo), son producto de los operadores mover, pero no son consumidas por
operadores posteriores. Este hecho no causa ningn perjuicio al resto del plan, ya que no con-
tradicen ninguna condicin que deba ser cierta ms adelante en el plan.
Sobre(B,C)
mover(A,Suelo,B)) a
Sobre (B,Suelol
Figura 22.13.
La siguiente estructura del plan.
Supongamos que decidimos resolver el otro conjuntor del objetivo principal, Sobre(B, C).
Esta condicin puede ser alcanzada mediante la instancia de regla mover(B, z, C), es decir,
moviendo B, de algn lugar, sobre C. Por tanto, podemos aadir este paso a la estructura del plan.
Supongamos que instanciamos z a Suelo y lo conectamos a las condiciones iniciales. En la
Figura 22.14 mostramos la estructura del plan resultante.
Ahora tenemos una estructura de plan con los operadores a, b y e que estn slo parcialmente
ordenados. No hemos tomado ninguna decisin acerca de dnde deben aparecer en la ordenacin
de los pasos del plan. En un plan parcialmente ordenado, necesitamos tener en cuenta los pro-
blemas que se causaran si un operador se ejecutara en el momento incorrecto, eliminando las pre-
condiciones necesarias para otro operador. Estos posibles problemas se representan mediante
Planificacin 353
Sobre{B, Suelo)
Figura 22.14.
La ltima fase del plan.
arcos de amenaza en el grafo de la estructura de1 plan. Consideremos la estructura de grafo de la
Figura 22.15. Las lneas grises con flechas son arcos de amenaza. Los arcos de amenaza.&!.dib:u-
jan los nodos de (valos) al()s la lis-
ta y. b) no del operador. As, en la Figura 22.15, el opera-
dor mover1A.Suelo, B) elimina Libre(B), una precondicin de mover(B, Suelo, C).
En este sentido, moverA, Suelo, B) amenaza a mover(B, C) porque si el primero se
ejecutase, no podramos ejecutar el segundo. Los arcos de amenaza deben resolverse colocando
restricciones en la ordenacin de los operadores. Un plan no est completo hasta que pode-
mos encontrar un conjunto de restricciones de ordenacin consistente, que resuelva todos los
arcos amenaza. En nuestro ejemplo, un conjunto consistente de restricciones de ordenacin
354
Planificacin 355
amenazada
Figura22.15.
Introduccindelosarcosdeamenaza.
sera(e < a, b < e), y, desdeluego,lapropiaestructuradelgrafoimplicalarestriccin(b < a), que
esconsistenteconlasrestriccionesdeordenacin.Deestamanera,nuestraestructuradeplande
laFigura22.15acabaconlaordenacintotal(b < e < a). Elplanestcompletoporquetodoslos
arcosdeamenazasehanresuelto,ytodaslascondicionesrequeridasporlosoperadores(inclu-
yendoeloperador sesatisfacenenelmomentoenquecadaoperadorseejecuta.Entonces,
elplanfinales{mover(C,A, Suelo),mover(B,Suelo,C),mover(A,Suelo,B)}.
Planificacin jerrquica
22.3.1. ABSTRIPS
Ya hemos hablado de los procedimientos de bsquedajerrquicaen elCaptulo 10. Muchos
investigadoreshandesarrolladoplanificadoresjerrquicosbasadosenreglasSTRIPS. Uno,elsis-
temaABSTRIPS [Sacerdoti, 1974],asignaunnmero de nivel crtico (prioridad)acadaconjun-
tordecadaprecondicindeunareglaSTRIPS. Cuantomsfcilseasatisfaceralconjuntor(per-
maneciendolasdemscosasigual)msbajosersunmerodenivelcrtico.EnABSTRIPS, la
planificacinserealizaprocediendoporniveles,utilizandolosnmerosdenivelcrticosparaello:
l. Suponemosquetodaslasprecondicionesconunnivelcrticomenoraunvalorumbralson
ciertas, y desarrollamos un plan basado en estas presuposiciones. En esencia, lo que
hacemosesposponerlaresolucindelosconjuntoresquenotenganunaltonivelcrtico.
2. Reducimosenunaunidadelvalordel umbralde nivelcrticoyutilizamoselplandesa-
rrolladocomoguaparadesarrollarunnuevoplan,quepresuponequelasprecondiciones
convaloresdenivelcrticomenoresqueelumbralsonciertas.
3. Yassucesivamente.
Vamos ailustrarlaideaenquesebasaelABSTRIPS conunejemplo,utilizandoahoraun
robotquedebetrasladarsedeunahabitacinaotra.Definimoslasituacininicial,elobjetivoy
lasreglasquesedebenutilizarenlaFigura22.16.Lareglaira(hl,p,h2)modelalaaccin
consistenteentrasladarel robotdelahabitacinh 1, cruzandolapuertap, alahabitacinh2.
Lareglaabr i r(p)abrelapuertap. Losnmerosdenivelcrticosemuestran,rodeadosporun
crculo, sobrelos literales correspondientes, en las precondiciones de las reglas. En particu-
lar,asumimosqueabrirunapuerta,encomparacinconatravesarla,esundetallerelativamente
sencillo;abrir(p)tendrunnivelcrticode 1.

hl h2
p2
h3
I

Estadoinicial: En(hi)1\ Abierta(pi) 1\ Cerrada(p2)
Objetivo: En(h3)
ReglasSTR1PS:
Ira(hi,p,h2)
o <D o
pe: En(hi)1\ Abierta(p)1\ Conecta(hi,p,h2)
B: En(hi)
A: En(h2)
Abrir(p)
<D
PC: Cerrada(p)
B: Cerrada(p)
A: Abierta(p)
Figura22.16.
UnproblemadeplanificacinenABSTRIPS.
Planificacin 357
Primero construimos un plan abstracto (con nivel crtico 2) utilizando cualquiera de los
mtodosdeplanificacindelosquehemoshablado,suponiendoquetodaslasprecondicionesde
nivel crtico 1 se satisfacen. El plan que resuelve En(h3) en este nivel de abstraccin es
{ira(hl,pI,h2),ira(h2,p2,h3)}.Luego,construimosunplanmsdetalladoparaalcan-
zarlasprecondicionesdelprimeroperadorenelplanabstractoprimero;entoncesaplicamosel
operadoryresolvemoslasprecondicionesdelsegundooperadordelplanabstracto,yassucesi-
vamente. Las precondiciones de estos operadores se pueden tratar como subobjetivos en el
espaciodebsquedadelprocesodeplanificacinabstracta: los subobjetivosencontradosenel
nivel 1. Peroahora,cuandoresolvemosestasprecondiciones,rebajamoselniveldelumbralen 1
paraindicarquetambinresolvemostodaslasprecondicionesdenivelcrtico 1. Elresultadoes
lageneracindel plan {ira(hl,pI, abrir(p2),ira(h2,p2,h3)}. Engeneral,ten-
--------
mover(A,C,B)
O 0--0 O
Articulacin Expansinde
delplan unoperador
O 0--0
O
)10
O
coger(A,Cj soltar(A,B)
Figura22.17.
dremosamenudomsdedosvaloresdenivelcrtico,porloqueelprocesodeplanificacindes-
cenderaatravsdevariosnivelesdeabstraccin. Articulacindeunplan.
ElprocesodedesarrollodelplanqueseutilizaenelABSTRIPS sedenominaprimeroenlon-
gitud;esdecir,desarrollamosunplancompletoencadaniveldeabstraccinantesdedescender
aunniveldemayordetalleparadesarrollarunplancompletoenl.Hayalternativasaldesarro-
lloprimeroenlongitud.Podramos,porejemplo,desarrollarunplancompletoenelnivelsupe-
Aprendizaje de planes
riorparaidentificarunasecuenciadesubobjetivosenelespaciodebsqueda;entoncespodramos
desarrollar laprimeraparte del plan conun plan completo hasta el primer subobjetivo enel Podemosutilizarelmismoprocesode GBEqueaplicbamosenelCaptulo 17 paraaprender
siguienteniveldedetalle,yassucesivamentehastatenerunplancompletoenelnivelmsbajo nuevasreglasenunsistemaderazonamiento, peroahoraparaaprendernuevasreglas STRIPS
alprimersubobjetivodeesenivel.Presumimosqueenelnivelmsbajodedetalle,elprimerope- compuestasporunasecuenciadereglasSTRIPS yaexistentes.Estasreglasaprendidaspueden
radorenelplan secorrespondeconunaaccinquesepuedeejecutarenelestadoinicial. Este entoncesserutilizadasparacrearplanesmscomplejos.Desdeluego,nosenfrentamosal mismo
procesodeplanificacindeltipoprimeroenprofundidadseraadecuadoenaquellassituaciones problemadeutilidadquecomentbamosenaquelcaptulo.Puedequenomerezcalapenaalma-
enlasqueutilizamoselciclopercibir/planificar/actuar.Despusdeejecutarlaprimeraacciny cenarunareglaaprendida, a menos queseutilice a menudoy nosea costosadeutilizar, aho-
percibirelestadoresultante,repetiramoselprocesomediantereplanificacin,quizutilizando rrandoasesfuerzosdeplanificacin.Explicamoslatcnicaparaaprendernuevasreglasmedian-
comoguaalgunodelosnivelesmsabstractosdelplanprevio. teunejemploilustrativo.
LaplanificacinjerrquicaesunainstanciadelatcnicadescritaenelCaptulo9,enlaque Consideremoselproblemadecambiarunaconfiguracindebloques,talcomosemuestraen
seresuelveprimerounaversinsimplificadaorelajadadeunproblema,quesirveparaobtener laFigura22.18.Inicialmente,elbloqueA estsobreelbloqueB, ystesobreelbloqueC. Que-
los valores para una funcin heursticaque se utilizar en laresolucin del plan real. Cada remosquetantoA comoB estnenelsuelo.Unodelosmtodosdeplanificacinqueyahemos
niveldeunprocesodeplanificacinabstractasepuedeentendercomounaversinsimplificada expuestoconsisteencrearel plan {mover(A,B, Suelo),mover(B,e,Suelo)}.Merecela
delnivelinmediatamenteinferior. ([Pearl, 1984,pp. 131-132]mencionalasrelacionesentresu penaguardaresteplan comounanueva reglaSTRIPS? Loserasi nuestroagentetuvieraque
modelosimplificadoyelABSTRIPS). resolveramenudoesteproblemadedesapilamientodebloques.Elplanpodrateneranmsuti-
lidadsisepudierageneralizardetalmaneraquesirvapararetirardosbloquesdeunapilaauna
posicinobjetivo,cualesquieraqueseanlosnombresdelosbloques.Comolaconstruccindel
22.3.2. Combinacindelaplanificacinjerrquicaylaplanificacinparcialmente
plan no dependerade los nombres de los bloques, podrautilizarse un procesodeGBEpara
ordenada generarunplanesquemticoconsmbolosdevariables,enlugardelasconstantesdeobjetosA,
ByC. Perocomoesteplandedospasosdependedequelaposicinobjetivoseaelsuelo,lacons-
Los sistemas de planificacin NOAH, SIPE y O-PLAN [Sacerdoti, 1977; Wilkins, 1988, y tantedeobjetoSuelonopuedegeneralizarse.
CurrieyTate, 1991]combinanlaplanificacinjerrquicaconlaplanificacinenelespaciode Enel procesodegeneralizacindeun planseutilizainformacinacercadelasprecondi-
planes.Ademsdelosoperadoresdelespaciodeplanesquehemosmencionadoya(instanciacin
cionesydelos
devariables,adicindereglasSTRIPS, etc.),estossistemasincluyenoperadoresparaarticular
planesabstractosenotrosplanesdeunniveldejerarquamsbajo.Estasarticulacionessonpare-
cidasalosoperadoresdelespaciodeplanesquesehanconsideradopreviamente.Porejemplo,la
)I fBl
B [CJ [Al )3 reglamoverquehemosutilizadoennuestromundodebloquespodraestarcompuestaporuna
JL
secuenciadereglasmsprimitivas: cogery soltaLEstasreglasdemsbajoniveltendran,
e Objetivo
Estadoinicial
porlogeneral,unasprecondicionesmsdetalladas,10querequeriralainsercindeotrasreglas
debajonivelparahacerqueelplanfueracompletoaesenivel(vaseEg.22.17).Esteproceso
Figura22.18.
continahastaquetodos los operadores (ocomomnimoelprimeroperador) secorresponden
Desapilarnientodedosbloques.
conaccionesprimitivasquepuedanserejecutadasdirectamente.
inicio
Libre(Suelo)
Sobre (A,B)
Libre (A) mover (A,B,Suelo)
Libre (Suelol
Sobre(B,C)
Libre(B)
mover(B,C,Suelo)
Sobre (A, Suelo) I Sobre(B, Suelo) I fin
Figura 22.19.
Una tabla triangular para desapilar bloques.
informacin consiste en una tabla triangular [Fikes; Hart, y Nilsson, 1972]. En la Figura 22.19
mostramos la tabla para el problema del des apilamiento de bloques. Cada columna de la tabla
est encabezada por uno de los operadores del plan, en el orden en que estos ocurren en el plan.
Igual que en la planificacin parcial, es conveniente imaginar los operadores ficticios inicio
y f in. La tabla muestra las precondiciones de cada operador y lo que cada operador consigue.
Las celdas de debajo de cada operador contienen ciertos literales (posiblemente repetidos), que
son los aadidos por el operador. Las celdas a la izquierda de cada operador contienen literales
que son las precondiciones del operador. Clasificamos las celdas en la tabla mediante su posi-
cin de fila i, comenzando con la columna 1, a la izquierda de la tabla. En concreto, la celda
(i, j) (para i j) contiene los literales que son aadidos por el operador i, que son necesarios
como precondiciones del operador j + 1 Y que se mantienen durante la aplicacin de operadores
entre i y j + 1. As, el operador inicio tiene como celda inmediatamente inferior aquella que con-
tiene los literales que estn presentes en la descripcin del estado inicial, y que, o bien son nece-
sarios para los siguientes operadores, o bien satisfacen conjuntores de la condicin objetivo. El
operador fin tiene celdas a su izquierda que contienen literales que satisfacen la condicin
objetivo.
El siguiente paso en el proceso de generalizacin de un plan consiste en reemplazar todas las
constantes de objetos de la tabla triangular por smbolos de variables. Cada ocurrencia de una
constante de objeto es reemplazada por su propio smbolo de variable. Despus, se intenta
encontrar la instancia ms general de plan esquemtico, tal que las precondiciones de todas las
reglas sean satisfechas en el momento en que cada instancia de regla se vaya a aplicar. Las pre-
condiciones de cada regla, comenzando por la primera, son evaluadas, y se realizan las sustitu-
ciones necesarias para satisfacer las precondiciones. En la Figura 22.20 se muestra la tabla
triangular esquemtica para este problema.
Al plan esquemtico generalizado dispuesto en forma de tabla triangular se le denomina
MACROP (de macro operador). Puede utilizarse como una regla STRIPS para crear planes ms
grandes. La conjuncin de los literales de la primera columna da las precondiciones del
MACROP, y los literales de la tercera fila son los literales de la lista aadir (debe realizarse un
anlisis de las listas borrar de las reglas individuales para calcular la lista borrar del macro ope-
Planificacin
inicio
Libre (Suelo)
Sobre(x,y)
Libre(x)
Libre (Suelo)
Sobre(y,z)
mover(x,y,Suelo)
Libre (y)
mover(y,z,Suelc
Sobre (x, Suelo) Sobre (y, Suelo) fin
Figura 22.20.
Un esquema de tabla triangular para desapilar bloques.
rador). En [Fikes; Hart, y Nilsson, 1972] se discute el proceso de generalizacin y la utilizacin
de las tablas triangulares para monitorizar la ejecucin de planes.
Adems del aprendizaje de MACROP, la construccin de planes especficos tambin puede
generar informacin sobre la estrategia de control que podra reducir el esfuerzo de planifica-
ciones futuras. Por ejemplo, en nuestro ltimo problema, para intentar resolver la conjuncin
Sobre(A, Suelo) A Sobre(B, es importante alcanzar primero el conjuntor
Sobre(A, (si intentamos alcanzar primero Sobre(B, Suelo), puede ocurrir que,
para liberar B, el bloque A sea colocado sobre otro bloque, lo que obligara a mover A otra vez
hacia el suelo). El sistema PRODIGY de Minton era capaz de aprender informacin de control de
este tipo utilizando la GBE [Minton, 1988] (vase [Etzioni, 1993] para un enfoque alternativo
basado en la evaluacin parcial).
Otro tipo de aprendizaje til en planificacin consiste en aprender los efectos mismos de las
reglas. Un agente podra tener disponible un gran nmero de acciones, pero podra no conocer los
efectos de estas acciones, o bajo qu condiciones se podran ejecutar. [Shen, 1994; Gil, 1992;
Wang, 1995, y Benson, 1997] han obtenido algunos resultados sobre la dificultad de aprender
modelos de actuacin, lo cual constituye un problema importante. [Benson, 1997] utiliza un pro-
grama teleo-rreactivo (T-R) en el que representa los planes construidos mediante los operadores
aprendidos. Tal como se mencion en el Captulo 2, la representacin T-R da una robustez aa-
dida a la ejecucin de planes.
[Lifschitz, 1986] apuntaba que la descripcin original del procedimiento STRIPS careca de la
precisin y de las restricciones necesarias para evitar formulaciones incorrectas o sin sentido. En
consecuencia, discuta cules eran las restricciones necesarias, en el lenguaje que se utiliza en el
STRIPS, para evitar estos problemas (en la formulacin de STRIPS usada en este libro nos
hemos atenido a estas restricciones). [pednault, 1986; Pednault, 1989] presentaron una versin de
360
STRIPSqueevitabalosproblemasmencionadosporLifschitzyqueeracapazdeformularpla-
nesmultiagenteutilizandoefectoscondicionales. [Bylander, 1994]demostrquelaplanificacin
conoperadoresSTRIPSenlgicaproposicionalesintratableenelcasogeneral(vase[Bylander,
1993]paraelanlisisdelcasopromedio). [Erol;Nau,ySubrahmanian, 1992]presentaronunan-
lisisdelacomplejidaddesistemasdeltipoSTRIPS.
[GuptayNau, 1992] demostraronquelosproblemasdelmundodebloques,enlosquelos
estadosylosobjetivossedescribenmedianteconjuncionesdetomosbaseparaencontrarelplan
ptimo(elmscorto),sonNP-Duros. ([Chapman, 1989] mostrqueunsimplesistemareactivo
puederealizardeformarpidalastareasdeapilamientodebloquessiestequipadoconlospre-
dicadossensorialesadecuados).
Lautilizacin de laregresin a partir de objetivos utilizando reglas STRIPS, que es un
procesonecesarioparalabsquedahaciaatrs,fueintroducidapor[Waldinger, 1975].
[BlumyFurst, 1995] transformabanlosproblemasdeplanificacinbasadaenreglasSTRIPS
aestructurasdenominadasgrafos de planificacin, resolvindolosmediantemtodosdebsqueda
de trayectorias. [Kautz y Selman, 1996, y Kautz; McAllester, y Selman, 1996] propusieron
mtodosparaconvertirgrafos deplanificacinaproblemasdeSATP(SatisfacibilidadProposi-
cional)enlgicaproposicional,resolvindolos medianteel sistemaWAlKSAT. Tambinpro-
pusieronnuevas tcnicas paracodificarde forma directalos problemas de planificacincomo
problemasdeSATP. Vasetambin[Ernst;Millstein,yWeld, 1997];estetrabajoesmuyimpor-
tanteporqueseobtienenmtodosdeplanificacinescalablesqueutilizantcnicaseficientesde
bsquedaestocsticayascensodecolinas.
ElsistemaNOAH,de Sacerdoti [Sacerdoti, 1975; Sacerdoti, 1977],y eIINTERPlAN,de
Tate[Tate, 1977],fueronlosprimerosplanificadoresconordenacinparcial.ElsistemaTWEAK,
deChapman[Chapman, 1987],fue laprimeraformalizacindeunplanificadorconordenacin
parcial,enelqueseintrodujeron muchosconceptosimportantes;Chapmanmostrqueel pro-
blemadeencontrarunplanconordenacinparcialparaalcanzarunaconjuncindecondiciones
objetivoeraNP-Durobajociertasformulaciones.
LaformulacinPNLS,deMcAllesteryRosenblitt,paraunplanificadorconordenacinpar-
cialfue implementadapor[Soderland yWeld, 1991]; estaimplementacinfue seguidaporel
UCPOP[pentherbyyWeld, 1992]. [Ephrati;Pollack,yMilshtein, 1996]utilizaronunabsque-
dadetipoA* paraseleccionaroperadoresenelespaciodeplanes. Unacomparacinentrepla-
nificadores conordenacinparcialy conordenacintotal sedaen[Minton; Bresina, yDrum-
mond, 1994].Paraunrepasoalosmtodosdeplanificacinparcialmenteordenadaydemnimo
compromisovase[Weld, 1994].
[Christensen, 1990; Knoblock, 1990] desarrollaron mtodos para aprenderjerarquas de
operadores.[Tenenberg, 1991]estudilasabstraccionesnecesariasparalosplanificadoresjerr-
quicos. [Erol;Hendler,yNau, 1994] propusieronotrotipodeplanificadorjerrquicoconorde-
nacinparcial.
[DeanyWellman, 1991]esunlibroqueintegra,deformaagradable,laplanificacinenlaIA
ylosmtodosderazonamientotemporalconlateoramodernadel control.Unaaproximacina
estecampointermedio,desdeotradireccin,eseltrabajosobresistemasdeeventosdiscretosde
[RamadgeyWonham,et al., 1989].Paracomentariosadicionalessobrerazonamientotemporal
ysupapelenlaplanificacin,vase[Allen,et al., 1990].[ZwebenyFox, 1994]presentanlaapli-
cacindediversosmtodosdebsquedayplanificacinalproblemadelaasignacindetareas.
[Wilkins,et al., 1995]extiendenlosmtodosdeplanificacinaaplicacionesqueinvolucranincer-
tidumbre.
Muchosdelos artculosimportantessobreplanificacinestnenlacoleccinde [Allen,et
al., 1990].Hayartculos sobreaprendizajeyplanificacinen[Minton, 1993].Unlibrotitulado
Practical Planning describeelsistemaSIPE ysusaplicaciones[Wilkins, 1988].
Planificacin 361
LosartculossobreplanificacinaparecenregularmenteenlasprincipalesrevistasdeIAYen
lasactasdelosprincipalescongresos.Tambinhayunaconferenciainternacionalsobresistemas
deplanificacinenIA(AIPS).Paraunavisindelasltimasaplicacionesdelastcnicasdepla-
nificacinyasignacindetareas, vase[Tate, 1996].
22.1. (Cortesade DaphneKolleryYoav Shoham.) Consideremoselproblemade generarun
planparaunrobotquelimpialacocina.
1. Escriba el conjunto de operadores STRIPS que se pueden utilizar. Paradescribir los
operadoreshayquetenerencuentalas siguientesconsideraciones:
a) Allimpiarlacocinadegasoelfrigorficoseensuciaelsuelo.
b) Lacocinadegasdebeestarlimpiaantesdecubrirlosfogonesconpapeldealuminio.
c) Allimpiarel frigorficosegenerabasurayseensucialaencimera.
ti) Allimpiarlaencimeraoelsueloseensuciaelfregadero.
2. Escribaunadescripcindelestadoinicialdelacocinaenlaqueestnsucioselfrigorfi-
co, lacocinade gas, laencimeray el suelo(el fregadero est limpio y labasurase ha
sacado).Hagatambinunadescripcindelestadoobjetivoenelquetodoestlimpio,no
hayabasuraylosfogoneshayansidocubiertosconpapeldealuminio.
22.2. InventeunareglaSTRIPSparametrizada,mover(x, y), quetienelasprecondicionesylos
efectosdeunmovimientodelhuecodeunpuzzledeochopiezasdesdeunaposicinx aunaposi-
ciny.
22.3. ExpliquecmoresolveraelSTRIPSrecursivolaanomaladeSussman.
22.4. Expliquecmoresolveralabsquedahaciaatrs mediante regresin, basadaen reglas
STRIPS,laanomaladeSussman.
22.5. ConstruyaunaformalizacinSTRIPSdelpuzzledelasTorresdeHanoi(vanselosEjer-
~ i i o s 5.3,7.4Y9.2),esdecir:
l. EspecifiquelareglaSTRIPSquedescribelosefectosdeunmovimiento,yespecifiquela
'" condicinobjetivo.
2. Escriba los axiomas que representan el estado inicial y muestran cmo esta regla se
aplicaparagenerarunodelosestadossucesores(noolvideincluirlasfrmulasqueson
ciertasentodoslosestadosyquesepuedennecesitarparademostrarlasprecondiciones
ylacondicinobjetivo).
22.6. Unrobotmarciano planificaunasalidade sloidaa unamontaadeMartequeesta
20km delcampamentobase(esunrobotdeunsolousoquenonecesitavolveralcampamen-
tobase).Elrobotpuedeviajarexactamente 10kmconunbidndegasolina,peropuedecargar
conotrobidndegasolinapararecargar. ElcampamentobasesellamaB, lamontaaM, yel
puntodeescala(a10km delcampamentobaseydelamontaa)sellamaP. Haytresbidonesde
gasolina,Bl,B2 YB3, enB, yelrobotestinicialmentesingasolina. El robotpuederealizar
cuatroacciones:
1. ira(x,y),dondex esellugarinicial(B,Mo p),ey esel lugardedestino Mo p).El
robotdebetenerunbidndegasolinaensudepsitoparapoderrealizarlaaccin.Conun
bidndegasolinaslopuedeirdeB aP odePaM.
2. Coger(u,x),dondeu eselbidndegasolinaqueestenlaposicinx.Elefectodela
accinesqueelrobotllevaelbidncomocarga.
3. Soltar(u,x),dondeu eselbidndegasolinadepositadoenx.Elrobotdebellevaru
comocargaparapoderejecutarsoltaro
4. Repostar(u,x),dondeu eselbidndegasolinaenlaposicinx queseutilizaparalle-
nareldepsitodelrobot.
(Supongaquenoseconsumegasolinaparaejecutarlasacciones coger,soltary
repostar.)
Utilizamos las siguientes formas del clculo de predicados (con sus significados
obvios):
Roboten(x),dondex esunodeloslugaresB,Mo P.
x),dondex esunodeloslugaresB,Mo P,yr esunodelosbidonesdegaso-
lina(sielbidnestenlaplataformadelrobot,aunqueelrobotestenx,noconsidera-
mosqueelbidnestenx).
Llevar(u)indicaqueelrobotestllevandounbidncomocarga.
Llenoindicaqueelrobothallenadosudepsitoconunbidndegasolina.
Puedeir(x,y)indicaqueelrobotpuedeirdex ay,siemprequetengaeldepsito
lleno.
Queremosplantearesteproblemaparaqueunsolucionadordeproblemastipo STRIPSpue-
dagenerarunplanparapoderllevarelrobotalamontaa:
1. Culesladescripcindelestadoinicialydelacondicinobjetivo?
2. Cules son los operadores y sus representaciones (precondiciones, lista borrar, lista
aadir)quesenecesitanparaesteproblema?Parahacerelproblemaunpocomssenci-
nosenecesitausarpredicadoscomoLugar(x)oBidon(x).
3. CreeunplansolucinqueunsistemaSTRIPSpuedagenerar(avanzandohaciadelante
desdeelestadoinicialalobjetivo).Escribalasolucindelasiguienteforma:
Literalesdelestadoinicial,so
Primeroperador
Literalesdelestadosiguiente,S1
Segundooperador
Etctera,hastaquesesatisfagaelobjetivo
22.7. Inventeunaestructuradedatos icnica (sinutilizarfrmulasdelclculodepredicados)
pararepresentarlosposiblesestadosdelrobotmarcianoylosbidonesdegasolinadelproblema
anterior. Culsenalaestructuradedatosdelestadoinicial?
Paracomprobarqueseentiendecmoconstruiryutilizarlosoperadoresdeesteproblema,
muestre las estructuras de datos producidas por la aplicacin de los operadores repostar
(B1,B) enelnodoinicio.
Planificacin 363
22.8. Supongamosqueelrobotmarcianotienesensoresquesoncapacesdedeterminarlaverdad
olafalsedaddelossiguientespredicados:
Bidonen(P)
Bidonen(B)
tolleno
Cargando
Roboten(p)
Roboten(M)
cuyossignificadossonlosobvios.
Elrobotpuederealizarlassiguientesacciones:
repostarllenaeldepsitodelrobotconunbidn(sihayun bidndegasolinaenlamis-
maposicinqueelrobot).
cogercargaunbidnenlaplataformadelrobot(sihayunbidndegasolinaenlamisma
posicinqueelrobot).
soltardejaunbidnenelsueloenlamismaposicinqueelrobot.
ira(x)llevaalrobot alaposicinx (si tiene el depsito lleno y x estcomo mnimo a
10km).
Disee un sistemade produccin (como los descritos en el Captulo 2) que ejecute las
accionesadecuadasparatodaslascombinacionesdelasentradassensoriales.
22.9. (CortesadeDaphneKolleryYoavShoham.)Utiliceunsistemadeplanificacinparcial-
menteordenada(comoeldescritoenestecaptulo)paraplanificareldesarrolloyellanzarniento
deunproductodesoftware.SupongaquedisponedelossiguientescuatrooperadoresSTRIPSen
estedominio:
Operador Precondiciones Listaaadir Listaborrar
Optimizar TienePrograma Optimizado SinFallos
Depurar TienePrograma SinFallos
Comprar Tieneprograma UsuarioSatisfecho
SinFallos
Empaquetado
Empaquetar Empaquetado
ElproblemadeplanificacinconsisteenalcanzarunestadoenelqueUsuarioSatisfe-
choseaciertoapartirdeunestadoenelqueTienePrograrnaseacierto.Talcomosabemos,
losmtodosdeplanificacinparcialmenteordenadaaadirnlossiguientesoperadoresficticios:
Operador Precondiciones Listaaadir Listaborrar
Inicio T TienePrograma Nil
Fin UsuarioSatisfecho Nil UsuarioSatisfecho
UsuarioSatisfecho
Empaquetado
Figura22.21.
ElplanparcialparaelEjercicio22.9.
SupongamosquecomenzamosconelplanparcialquesemuestraenlaFigura22.21.Elplan
parcialnocontieneotrasrestriccionesdeordenacinquelasqueseimplicandelpropioordenpar-
cialdelospasosdelplan.
1. Culessonlosarcosdeamenazaexistentesenesteplanparcial,silashay?
2. Liste las precondiciones de cada operadordel plan parcial que no son soportadas por
algnenlacecausal.
3. Muestreunposibleplanqueelprocesodeplanificacinparcialmenteordenadapudiera
generar(esdecir,amplelafiguraquesemuestraconoperadoresadicionales ylistelas
restriccionesdeordenacin).Noesnecesariomostrartodoslospasosquesehantomado
paragenerarelplan;bastamostrarelplancompleto).
22.10. DescribacmopodrautilizarseelsistemaABSTRIPS paragenerarunplananytime.
Comentebrevementeporqucabeesperarquelacalidadylafiabilidaddelplanaumentenconel
tiempodedicadoalaplanificacin.
. .
UnlCaCIOn
integracin
La inteligencia humana [se caracteriza por ser] intrnsicamente social -una capacidad que ...
surgi para permitir a los hombres prehistricos negociar los problemas de la vida en grupo y
poder coordinar las diferentes tareas individuales con los miembros de otros grupos.
AtribuidoaMerlynDonaldporCatherineSnowenunareseadeunlibro
enScience, p. 1611,vol.275, 14demarzode 1997
Mltiples
agentes
Interaccin entre agentes
Excepto en nuestro estudio sobre juegos en el Captulo 12, nuestro enfoque no ha ido ms all de
la utilizacin de un agente que reacciona, planifica, razona y aprende en un entorno ms o
menos compatible con sus habilidades y objetivos. Supusimos que los efectos generados por otros
agentes, o procesos, podan mitigarse mediante las reacciones del agente, o ser simplemente igno-
rados. Ahora empezaremos a considerar cmo un agente puede prever las acciones de otros agen-
tes en su propia tarea de planificacin y, por consiguiente, cmo el agente puede influir en las
acciones de otros agentes en beneficio de sus propios objetivos. Para prever lo que otro agente
har, necesitaremos mtodos que permitan al agente modelar a otro agente. Para influir sobre 10
que el otro agente har necesitaremos mtodos para que un agente se pueda comunicar con otro
agente. stos son los temas que trataremos en este captulo y en el siguiente.
Adoptaremos un punto de vista centrado en el agente, de tal forma que identificaremos la
estructura y los objetivos de un agente individual (al que llamaremos nuestro agente) que acta en
un entorno en el cual habitan otros agentes y/o procesos. En contraste con muchas de nuestras
presunciones iniciales, los efectos de las acciones de otros agentes y procesos sobre nuestro agen-
te pueden ser profundos, y pueden ser favorables, neutros o peljudiciales para los objetivos de
nuestro agente. Nuestro tratamiento incluir tambin el caso ms especfico en el que diversos
agentes coordinan sus tareas para alcanzar un objetivo comn, a 10 que nos referiremos como
inteligencia artificial distribuida (IAD).
Antes de lanzamos a los temas principales de ste captulo y del siguiente, comentaremos que
la clase ms sencilla de interaccin entre agentes no necesitara ni de modelos de otros agentes,
ni de una comunicacin explcita entre stos. Nuestro agente, simplemente, podra reaccionar a
los efectos del entorno generados por los dems agentes a medida que ocurriesen y los percibie-
ra; ste sera un tipo de comunicacin implcita, pero no intencionada, entre agentes a travs de
los efectos en el entorno. Por ejemplo, un agente podra cambiar la localizacin de unos bloques
en el entorno de tal manera que nuestro agente podra percibir la nueva situacin y realizar una
accin que no habra ejecutado antes. Este tipo de accin del otro agente genera unos cambios en
367
368
369
el mundo, causados por sus propios objetivos, e indica a nuestro agente que es el momento de
actuar; por ejemplo, podra emitir algn sonido que nuestro agente podra percibir. En relacin al
estado de preocupacin del otro agente, su grito podra ser simplemente una reaccin interna a
una situacin percibida en el entorno, pero este grito, percibido por nuestro agente, podra gene-
rar una reaccin que para un observador externo podra interpretarse como una respuesta a una
comunicacin intencionada, y planificada por el otro agente. El diseador de un grupo de agen-
tes puede distribuir la coordinacin entre los agentes mediante este tipo de indicadores y res-
puestas de tipo reactivo, de la misma forma que el diseador de un sistema distribuido ordena sus
componentes para obtener un comportamiento coordinado.
Al igual que las mquinas reactivas de los Captulos 2 al 6, que eran capaces de tener com-
portamientos sorprendentemente complejos, este tipo de comunicacin implcita es capaz de
soportar interacciones realmente complejas. Algunos de los comportamientos de los animales, tales
como la enseanza, el agrupamiento en manadas y la construccin de nidos, parecen mostrar
este tipo de comportamiento (vase, por ejemplo, [Mataric, 1996; Theraulaz, y Bonabeau, 1995]).
Modelos de otros agentes
23.2.1. Tipos de modelos
Si nuestro agente ha de tener en cuenta la actividad de otros agentes y procesos, necesitar dis-
poner de modelos que pueda usar para prever cmo se comportarn los otros agentes y procesos,
y utilizarlos conforme construye sus propios planes y los ejecuta. Ya que los agentes y los pro-
cesos son fenmenos fsicos, podramos utilizar los lenguajes de la ingeniera y de la fsica
para describir sus formas de operar. El comportamiento de los agentes fsicos, tales como los
robots, se podra describir utilizando modelos en varios niveles de detalle, desde los diagramas
electromecnicos de sus componentes hasta los programas que los controlan. El comportamien-
to de los procesos fsicos se podra describir mediante ecuaciones diferenciales.
El problema del modelado de los procesos fsicos ha constituido un rea de investigacin
importante en la lA, a la que de forma general se le ha denominado fsica ingenua o fsica cua-
litativa [Weld y de Kleer, 1990]. La fsica cualitativa intenta reemplazar los clculos precisos que
se necesitan para resolver las ecuaciones diferenciales que describen diversos fenmenos fsicos
por mtodos de razonamiento aproximado que operan sobre los modelos cualitativos de dichos
procesos dinmicos. No hablaremos aqu de este estilo de modelado; preferimos concentrarnos en
modelos sobre otros agentes de ms alto nivel (de hecho, muchos procesos fsicos se pueden
modelar como si fuesen agentes reactivos, quiz controlados mediante algn programa T-R
Aunque pensemos en los agentes como procesos fsicos que pueden ser modelados como
cualquier otro dispositivo ingenieril, es ms adecuado utilizar tcnicas especializadas para mode-
larlos. El espectro de agentes, con complejidad incremental, que hemos ido viendo en este libro
sugiere una diversidad de mecanismos para modelar a los otros agentes. Nuestro agente podra
suponer, por ejemplo, que otro agente es un programa T-R que evala unas condiciones y selec-
ciona sus acciones. Cualquiera que sea la forma del programa del otro agente, el modelo de nues-
tro agente no necesita ser tan complejo como el objeto modelado, tan slo lo necesario para que
el modelo pueda proporcionar predicciones tiles, de forma razonable, del comportamiento del
otro agente en diferentes situaciones. Nuestro agente tambin podra suponer que el otro agente
Los pueblos primitivos llevaban este punto de vista al extremo, suponiendo que unos agentes intencionados cau-
saban fenmenos fsicos tales como la luz, los huracanes, los eclipses y los terremotos.
Mltiples agentes
construye planes utilizando reglas STRIPS, y que los ejecuta para alcanzar sus objetivos. En cual-
quier caso, a menudo, es til presumir que el otro agente dispone de un modelo interno de su
entorno para seleccionar sus acciones. Al modelo del agente, junto con el mecanismo para utili-
zarlo y seleccionar las acciones, se le denomina estructura cognitiva. A menudo, la estructura cog-
nitiva tambin incluye los objetivos y las intenciones del agente (consideramos que las inten-
ciones son las acciones que el agente ha decidido ejecutar, cuando es apropiado ejecutarlas, segn
un plan previo). Nuestro agente tiene la tarea de modelar las estructuras cognitivas presumibles
de los otros agentes con suficiente detalle y precisin como para razonar con dichas representa-
ciones y prever lo que harn.
La parte de la estructura cognitiva del agente sobre la que nos centraremos es su modelo del
entorno y de las estructuras cognitivas de los otros agentes. Hemos estudiado dos tipos de mode-
los utilizados por los agentes, el icnico y el basado en caractersticas. Recordemos que un
modelo icnico del entorno intenta simular los aspectos relevantes del entorno, mientras que un
modelo basado en caractersticas intenta describir el entorno, quiz mediante frmulas del clculo
de predicados. Al estudiar cmo nuestro agente podra modelar a otro agente nos encontramos
otra vez con el mismo dilema. Realmente, disponemos de cuatro elecciones. Nuestro agente pue-
de utilizar un modelo icnico de la estructura cognitiva de los otros agentes o uno basado en
caractersticas, y se presupone que los otros agentes pueden estar utilizando un modelo icnico o
uno basado en caractersticas. En la Tabla 23.1 se muestran las cuatro posibilidades, junto con el
tipo de estrategia de modelado que cada posibilidad implica. Hablaremos de tres de estas estra-
tegias de modelado en las prximas secciones (resulta que cuando nuestro agente utiliza una estra-
tegia de modelado basada en caractersticas, no es demasiado relevante el hecho de que los
otros agentes utilicen un modelo icnico o basado en caractersticas; cuando nuestro agente utiliza
una estrategia basada en caractersticas, presumir que los otros agentes tambin lo hacen).
23.2.2. Estrategias de simulacin
En el Captulo 12 ya vimos un ejemplo sencillo de un agente que utilizaba un modelo icnico del
modelo (supuestamente) icnico de otro agente. El proceso de clculo de las posiciones en las que
el oponente se colocar cuando sea su tumo de jugada utiliza un modelo icnico de lo que se
supone es el modelo icnico del oponente acerca de los efectos de sus acciones. Los modelos ic-
nicos, a menudo, son tiles, pero sufren una limitacin importante ya mencionada, que es no
poder representar la falta de conocimiento o la incertidumbre. Este problema tambin se extien-
de al enfoque de las bases de datos simuladas, tal como veremos en las siguientes secciones.
23.2.3. Bases de datos simuladas
Para nuestro agente, la forma ms obvia de modelar las frmulas de otro agente (que describen el
mundo visto por el otro agente), podra ser construir una hipottica base de datos de frmulas en
Nuestro agente Otro agente Estrategia de modelado
icnico icnico simulacin
icnico basado en caractersticas base de datos simulada
basado en caractersticas icnico descriptiva
basado en caractersticas basado en caractersticas intencional
Tabla 23.1.
Estrategias de modelado.
370
371
laquesedescribieran,presumiblemente, lasmismasfrmulas quenuestroagentepensaraque
realmentetieneelotroagenteensu modelodelmundo;esdecir, nuestroagente, simplemente,
podra intentar duplicar lo que l creyera que es el modelo del otro agente. Por ejemplo, si
nuestroagentepensaraqueotroagentetienelafrmulaSobre(A,B)ensumodelodelmundo,l
podra tener unabase de datos denominada el otro agente en la que estaralafrmula
Sobre(A,B). Elhechodedisponerdeestafrmulaenlabasededatosquemodelaalotroagen-
tenoexcluyequenuestroagentetengalafrmulaSobre(A,e) ensupropiomodelodelmundo;
adems,nuestroagentepodradesconocercualquiercosaacercadelvocabularioqueutilizaseel
otroagenteparadescribirelmundo.Porejemplo,elotroagentepodrarealmenterepresentarla
mismaproposicinqueelnuestrorepresentaramedianteSobre(A,B)coneltexto $#4(QW,V).
Pero,mientraslosagentesnotenganquecomunicarseenvindoseestasfrmulassintraduccin,
ladiferenciadevocabulariononosconcierne.
Esteenfoqueparticular,podraserviableparaalgunostiposderazonamiento,relativamente
sencillos,acercadelosotrosagentes.Perocaeenlasmismasdeficienciasenlasquelohacanlos
modelos icnicos. Un ejemplo obvio es la dificultad, para nuestro agente, de representar el
hechodequeotroagentetengalafrmulaSobre(A,B)olafrmulaSobre(A,e) ensumode-
lodelmundo.ObsrvesequeponerSobre(A,B) v Sobre(A,e) enlabasededatossimulada
representaraalgorealmentedistinto; enel primercaso,seranuestroagenteelque tendraun
conocimientoincierto;enelsegundo,seraelotroagenteel quetendraunconocimientoincier-
to. Paraquenuestroagentepudierarepresentarsupropiaincertidumbre,tendraquedisponerde
dosbasesdedatosdelosmodelos,unaparacadacaso. Si, adems,hubieramsincertidumbre
adicional, elnmerode basesdedatos de modelosdiferentes tendraquecrecerexponencial-
menterespectoalnmerodeincertidumbres,parapodertratartodaslasposiblescombinaciones.
Paramostrarunproblemarelacionadoconesteenfoque,supongamosquenuestroagenteno
sabe sielotroagente tiene o notiene Sobre(A,B) en su modelo. Simplemente, nopodemos
omitirlafrmulaSObre(A, delabasededatosdelmodelo,porquehacerloimplicaraqueel
otroagentenotieneesafrmulaensumodelo(ypodraserques).Denuevo,elproblemaquese
presentaconsisteenestablecerunadiferenciaentrelafaltadeconocimientodenuestroagentey
ladelotroagente.
23.2.4. Laactitudintencional
Parapoderhacerestasdistinciones, nuestroagente necesitaalgntipode lenguaje (quizuna
variante del clculo de predicados) que sirva para describir el conocimiento y las creencias
quetieneelotroagenteacercadelmundo,envezdesimularlas.Cuandonuestroagentedescribe
elconocimientoylascreenciasdeotroagente,estutilizandoloqueDennettdenominactitud
intencional haciaelotroagente[Dennett, 1971];loshumanostomamosunaactitudintencional
respectoalasmquinasqueutilizamos.Esloqueocurre,porejemplo,cuandodecimoselorde-
nadorsabequeesteaoesbisiesto (vasetambin[McCarthy, 1979a]).
Sehan sugeridotresposibilidadesparaconstruirmodelosdelaactitudintencionaldeotros
agentes. Primero,podramoscosificar lascreenciasdel otroagente (talcomocosificbamoslas
accionesenelclculodesituaciones),[McCarthy, 1979b]propusoesteenfoque.Es decir,podemos
darnombresaestascreenciasyutilizarunaconstantederelacin,denominadaBel,paradenotar
larelacinentreunagentey (unade)suscreencias.Peronecesitaramosconectarestosnombres
(losdelascreenciasdelotroagente)conlascreenciassimilaresdenuestroagente(denotadapor
frmulaslgicas);sehademostradoquedichomecanismodeconexinesproblemtico.
Segundo,nuestroagentepodrasuponerqueelotroagenterealmenterepresentasuscreencias
acercadelmundomediantefrmulasdelclculodepredicadosenlabasededatosquecontiene
Mltiplesagentes
loshechosconlosquedescribeelmundo.Entonces,nuestroagentepodrautilizarunaconstan-
tederelacin queahoradenotalarelacinentreunagenteyeltextoqueexisteenlabasede
datos del otro agente. Por ejemplo, nuestro agente podra utilizar la frmula Bel(Sam,
I Sobre(A, f) paradenotar la proposicin de que un agente llamado Sam tiene el texto
I Sobre(A,B)f (textoquedenotaa lafrmula Sobre(A, B ensubasededatosdeconoci-
mientoacercadelmundo. Esteenfoqueimplicarelacionesentrelosagentesylasfrmulas, porlo
que selehadenominadoenfoquemetalingstico [Perlis, 1985;Perlis, 1988; Konolige, 1982;
KowalskiyKim, 1991,y GeneserethyNilsson, 1987,Cap. 10].
Tercero, podramosutilizarunaversinelaboradadelclculodepredicadosincluyendolo
quesedenominanoperadores modales. Estosoperadoressepuedenutilizarparaconstruirfr-
mulasquedenotenproposicionesacercadequinsabeocreequ,apartirdefrmulasmssen-
cillasquedenotenelconocimientoy lascreenciasensmismos.Enlasiguienteseccinexpli-
caremosestaversinelaboradadelclculodepredicados.
Una lgica modal para representar el conocimiento
Operadoresmodales
YaestamosfamiliarizadosconelusodelasconectivasA yvenlaslgicasproposicionalydepri-
merorden.Podemospensaracercadeestasconectivascomooperadores queconstruyenfrmu-
lasmscomplejasapartirdeunoscomponentesmssimples.Cuandoestosoperadoresgeneran
unafrmulanueva,el valordeverdaddeestafrmuladependedelosvaloresdeverdaddelos
operandosydelaspropiedadesconcretasdeloperador.Ahora,queremosconstruirunafrmula
cuyosignificadoprevistoseaqueunagentedeterminadoconoceunaproposicinconcreta.Los
componentessernuntrminoquedenoteal agente,ylafrmulaquedenotelaproposicinque
elagenteconoce.ParaconseguirestanuevaestructuraintroducimoseloperadormodalK.Por
ejemplo,paradecirqueSam(elnombredeunagente)sabequeelbloqueA estsobreelbloque
B, podemosescribir:
K(Sam,Sobre(A,B
La sentenciaformada porlacombinacin de K conel trmino Samy lafrmula Sobre
(A, B)generaunanuevafrmula,cuyainterpretacinesSamsabequeelbloqueA estsobreel
bloqueB (devezencuando,a lolargodeestecaptulo,utilizaremoslaabreviacinK<x(<P) para
K(ex, 41), dondeex denotaunagente,y41 esunafrmula).
Obsrvese que hemos empezado utilizando sabe en vez de cree. Los filsofos han
argumentadoextensamenteladistincinentreconocimientoy creencia. Unadiferenciaesque
mientrasunagentepuedecreer unaproposicinfalsa,nopuedesaber nadaqueseafalso. Loque
ocurreesquedefiniryutilizarunalgicadelconocimientoesbastantemssencilloquedefinir
yutilizarunalgicadelacreencia.As,que,enestaseccin,noslimitaremosalconocimiento,
tomndolocomounaidealizacintil,quesepuedeajustardediversas manerasparahacerloade-
cuadoaltratamientodelascreencias.
AllenguajequeutilizaeloperadorK seledenominalenguajemodaldeprimerorden.Lasin-
taxisdelasfrmulasenestelenguajeeslasiguiente:
1. Todas las tbfsdelclculodepredicadosde primerordentambinsontbfsdellenguaje
modal.
2. Si41 esunatbfcerradadellenguajemodal(esdecir,quenotienevariableslibressincuan-
tificar),y siex esuntrminobase,entoncesK(ex, 41) esunatbfdellenguajemodal.
23.3.1.
372
3. Comoeshabitual, si$ y'!1 sonfbfs, tambinlosonlasquesepuedenconstruirmediante
lasconectivasproposicionales.
Lossiguientesejemplossonfbfs:
K[Agentel,K(Agente2,Sobre(A,B],queseinterpretacomoelAgentel sabeque
elAgente2sabequeAestsobreB.
K(Agentel,Sobre(A, B v K(Agentel,Sobre(A,e, quese interpretacomoel
Agentel sabequeA estsobreB, osabequeA estsobreC.
K[Agentel,Sobre(A,B) v Sobre(A,e)],queseinterpretacomoelAgente1sabeque
AestsobreBoestsobreC.
K(Agentel,Sobre(A,B v K(Agentel,-.. Sobre(A,B, queseinterpretacomoel
Agente1 sabequeAestsobreB,osabequeA noestsobreB.
-..K(Agentel,Sobre(A,B,queseinterpretacomoelAgente1nosabesiA estsobreB.
Obsrveseque,deacuerdoconnuestrasintaxis,laexpresin(3x)K(Agentel,Sobre(x,
B noesunafbflegal.LafrmulaSObre(x,B) noestcerradarespectoaloperadormodal,ya
quecontieneunavariablelibrequeestcuantificadafueradeloperadormodal.Algunasversio-
nesdelalgicamodalpermitenestacuantificacinexterna}}, peropresentanciertosproblemas
quevanmsalldelalcancedeestelibro.
23.3.2. Axiomas del conocimiento
LosoperadoresA yvtienenunasemnticacomposicional,esdecir,el valordeverdaddeunafr-
mulaqueestconstruidamediantelacomposicindefrmulasconestosoperadoresdependede
losvaloresdeverdaddelasfrmulasquelacomponenydeloperador.LasemnticadeK, sin
embargo,noescomposicional.Porejemplo,elvalordeverdaddeK(Agentel,Sobre(A,B
nopuedeserdeterminadoporlaspropiedadesdeK,ladenotacindelAgentelyelvalorde
verdadde Sobre(A,B). Desde luego, si Sobre(A,B) tuvierael valor F, tambinlotendran
todaslasinstanciasdeK,iSobre(A, B paracualquiervalordea (porqueunagentenopuede
sabernadaqueesfalso). Pero,aunqueSobre(A,B) tengaelvalorVerdadero, ningunainstancia
deKa(Sobre(A, B necesitatenerelvalorVerdadero (porqueelagentedenotadopora podra
noconocerlaproposicindenotadaporSobre(A,B). Deformasimilar,sidosfrmulas, $y'!1,
sonequivalentes,nosecumplenecesariamentequesiKa($)tieneelvalorVerdadero, tambinlo
tengaKa('!1) paracualquiervalordea (elagentedenotadoporapodranosaberqueambasfr-
mulassonequivalentes2). La semnticadelasfrmulas modalesdeberespetarestasrestricciones.
Unasemnticaeleganteparaeltratamientode sentenciasenestelenguajemodalesladelos
mundosposibles(paraunenfoquealternativo, vase[Konolige, 1986]).Aunquenodiscutiremos
profundamenteelconceptodemundosposibles,sepuededecir(deformaaproximada)queunagen-
teconoce (sabe) unaproposicincuandodichaproposicinesciertaentodoslosmundosqueson
posiblesparaelagente.Alainversa,unagentenoconoceunaproposicinsi(paratodoslosmun-
dosqueelagenteconoce)hayalgunosmundosenlosquelaproposicinesciertayotrosenlosque
esfalsa. Dirjasea [Fagin,et al., 1995]paraverunaexposicinatravsdelaslgicasdelconoci-
miento. Noobstante, sinprofundizardemasiadoenlasemnticadeunalgicadelconocimiento,
podemosproponeralgunosaxiomasesquemticosquepermitananuestroagenterazonaracercade
lascreenciasdeotroagente.Estosesquemasutilizarnlosaxiomasquedescribirnlaspropiedades
especialesdelconocimiento,juntoconelmodus ponens, y unanuevaregladeinferencia.
2 SediceentoncesqueeloperadorKesreferencia/mente opaco.
Mltiplesagentes
Algunosesquemasaxiomticosaceptadosson:
[K,i$)A K
a
($:::> '!1)] :::> K
a
('!1) (23.1)
queseinterpretacomo: siunagenteconoce$, ysabeque$ :::> '!1, entonceseseagentetambin
conoce'!1 (porqueasumimosquel puedeutilizarel modus ponens). Esteesquemaaxiomtico
algunasvecesseescribedelaformaequivalente:
K,i$:::>'!1)::J [Ka<$)::J K
a
('!1)] (23.2)
Aesteaxiomaselellamaaxioma distributivo porquepermiteladistribucindeloperadorK
sobrelaimplicacin.
Otroesquemaaxiomticoquepareceadecuado,denominadoaxioma del conocimiento, pos-
tulaqueunagentenopuedeconoceralgoqueesfalso:
K,.($)::J$ (23.3)
El axioma del conocimiento implica que un agente no puede conocercontradicciones:
-..K(a,
Unatercerapropiedaddelconocimientoes lasiguiente: parecerazonableasumirquesi un
agente sabe algunacosa, sabe que lasabe. Estapropiedad se expresa mediante elaxioma de
introspeccin positiva:
K
a
($):::> Ka(Ka($ (23.4)
Enalgunasaxiomatizacionessobreelconocimientotambin se indicaque si un agenteno
sabealgo,entoncessabequenolo sabe;steeselaxioma de introspeccin negativa:
-..K
a
($):::> Ka{-,Ka($ (23.5)
La siguiente propiedad que nos gustaratener en cuentaes aquella en la que un agente
conocetodosestosaxiomas(ytambintodaslasfrmulasvlidas).Podemosexpresarestapro-
piedadaadiendoanuestralgicaunanuevaregladeinferencia. Estaregla, denominadanece-
sidad epistmica, nospermite(esdecir,permiteanuestroagente)inferirK ($) si$ esunafr-
a
mulavlida.Podemosescribirestaregladeinferenciacomo:
De1- $inferirKa{$) (23.6)
Yaqueelmodus ponens eslanicaregladeinferenciaquesenecesitaenlalgicaproposi-
cional,delAxioma23.2ydelaRegladeinferencia23.6podemosconcluirqueunagentecono-
cetodas lasconsecuenciaslgicasdesuconocimiento;esdecir,elagenteeslgicamente omnis-
ciente. Podemosexpresarestehechomediantelasiguienteregladeinferencia:
De$ 1- '!1 YdeK
a
($)inferirKa<'!1) (23.7)
Unaformulacinequivalentesera:
De1- ($::J'!1) inferirK
a
($):::> K
a
('!1) (23.8)
374
Mltiplesagentes 375 Inteligenciaartificial. Unanuevasntesis
Laomnisciencialgicapareceinadecuadaparaunagentereal,elcual,despusdetodo,no Las sentencias (lb), (2a) y (3) se escriben como las tres primeras lneas de la siguiente
puedederivartodas lasconsecuenciasdeloquel podraconocerdeformaexplcita.Siunagen- demostracindeK(A,
te no puede derivar unaproposicin (aunque se siga lgicamente de otras proposiciones que
conozca), sepuededecirrealmentequel conoceesaproposicin? Alguienqueconocelos
1. KA[-,Blanca(A)::)KB(-,Blanca(A]
axiomasdelateoradenmerosconoce todos losteoremasdedichateora?Dependedeloque
(premisa)
queramosdecirconconocer. Porejemplo,podramostenerunpuntodevistaplatnico acercadel 2. KA [K
B
(-,Blanca(A)::)Blanca(B]
conocimiento,enelque,pordefinicin,unagente conocetodaslasconsecuenciasde sucono-
(premisa)
cimiento,aunquenocreaenellasexplcitamente.Aunquelaomnisciencialgicaparezcaunares-
3. KA (-,K
B
(Blanca(B)))
triccin demasiado rgida, es til como aproximacin, para que los agentes puedan realizar (premisa)
algunos razonamientos.
4. (-,Blanca(A)::)Kk..,Blanca(A)))
Delaomnisciencialgica(Regla23.7)podemosderivar:
(1.yAxioma23.3)
5. KB[-,Blanca(A)::)Blanca(B)]
K(a,($ /\ 'JI K(a,$) /\ K(a,'JI)
(23.9) (2. yAxioma23.3)
6. K
B
::)K
B
\J:HcU1Cd\b)
(5. yAxioma23.2)
distribuyesobrelasdisyunciones,porque(tal comoyahemosargumentado)nopuedeocurrirque
EstoquieredecirqueeloperadorK sedistribuyesobrelasconjunciones.Sinembargo,nose
7. -....Blanca(A)::)K
B
(Blanca(B
K(a,($ v'JI::)K(a,$) v K(a,'JI). (resolucinsobrelasformas clausalesde4. y6.)
Yahemosindicadoquenuestroagentepuederepresentarel hechodequeotroagenteconoz- 8. -....K
B
(Blanca(B::)Blanca(A)
caono$. sinlanecesidaddequenuestroagentetengaconocimientoo node$.Paraello,utili- (contraposicinde7.)
zaramoslaexpresinK(a,$) v K(a,-,cj. 9. KA[-,K
B
(Blanca(B ::) Blanca(A)]
(1.-5.,8,Regla23.7)
10. KA(-....K
B
(Blanca(B)))::)KA (Blanca(A
23.3.3. Razonamientoacercadelconocimientodeotrosagentes (9. yAxioma23.2)
11. KA
Nuestroagentepuedellevaracabodemostracionessobresentenciasacercadelconocimientode (modus ponens de3. y 10.)
otrosagentesutilizandoslolosaxiomasdelconocimiento,lanecesidadepistmicaysuspropias
habilidadesderazonamiento(elmodus ponens, laresolucin).Vamosamostraresteprocesocon
Paraderivarlalnea9delademostracin,utilizamoslaRegla23.7,quejustificalaformu-
eldenominadoproblema de los hombres sabios. Supongamosquehaytres sabios,yquesurey lacindequeA creeunaconsecuenciadelademostracin(lnea8) apartirdelaspremisas
lesdiceque,comomnimo,unodeellostieneunamanchablancaenlafrente; realmente,lostres neas4 y5)cuandolcreeendichaspremisas(lneas 1y2).
tienenmanchasblancasensusfrentes.Asumimosquecadahombresabiopuedeverlasfrentesde En la versinde los tres hombres sabios hay otronivel de razonamientoanidado, pero la
losotros,peronolasuya;deestamanera,cadaunosabequelosotrostienenmanchasblancas.
estrategiabsicaeslamisma.Dehecho,podemosresolverelproblemadelos k hombressabios
Hayvariasversionesdeesteproblema,perosupongamosqueelprimerhombresabioledicea
(paracualquierk)asumiendoquecadaprimerhombresabio(k- 1) declaraquenosabesitiene
nuestro agente, Yo no ssi tengo unamanchablanca. Podemos formularesteproblemaen
onounamanchablanca.
nuestralgicadelconocimientoparavercmonuestroagentepuededemostrarqueeltercerhom- DiversascombinacionesdelosAxiomas23.2hastael23.5,juntoalosaxiomasdelalgica
bresabiosabequetieneunamanchablanca.
proposicional, las reglas deinferenciay laRegla23.6, constituyenloquellamaremos lgicas
Mostraremoselprocesoconsiderandoelcasomssencillo,laversindelproblemacondos
modales del conocimiento. Loslgicoshandadonombresespecialesadiversossistemasdelgi-
hombressabios.Le daremosalossabioslosnombresA yB. Lainformacinquenecesitaremos
camodal,dotadosdediferentesesquemasaxiomticos.SiunagenteA disponedelosAxiomas
estcontenidaenlas siguientespresunciones,derivadasdelenunciadodel problema:
23.2al 23.5,tendramoselsistemaS4; si quitamoslosAxiomas23.4y23.5,tendramoselsis-
temaT, ysiquitamoslosAxiomas23.3,23.4Y 23.5,tendramoselsistemaK.
1. A YB sabenquecadaunopuedeverlafrentedel otro.Deestamanera,
la. SiA notieneunamanchablanca,B sabraqueA notieneunamanchablanca,y 23.3.4 Prediccindelasaccionesdeotrosagentes
lb. A sabe ~
ParapredecirloqueotroagenteA 1podrahacer,nuestroagentedebetenerunmodelodeA 1. Si
2. A Y Bsabenque,comomnimo,unodelosdostieneunamanchablanca,ycadaunosabe
Al noesdemasiadocomplejo,unaposibilidades suponerquelas acciones deAl estncontro-
queelotro10 sabe.Enparticular,
ladasporunprogramaT-R(quiznuestroagenteutilizunprocesodeaprendizajeparainducirel
2a. A sabequeBsabequeA oB tienenunamanchablanca.
programaT-Rquerepresenta,deformaaceptable,lasaccionesdelagenteAl). Supongamosque
lascondicionesdeeseprogramason'Y
, parai 1, ...,k. Parapredecirlasaccionesfuturasde

3. Bdicequelnosabesitieneunamanchablanca;portanto,A sabequeB nolosabe. Al, nuestroagentenecesitarsercapazderazonaracercadecmoevaluarA 1estascondiciones.
377
376 Inteligenciaartificial.Unanuevasntesis Mltiplesagentes
Enelsiguientecaptuloveremosque,amenudo,esadecuadoquenuestroagenteadopteunaacti-
tudintencionalrespectoaAl, eintenteestablecerK
A1
(yJparai =1, ...I k.
Lec/uras y consideraciones adicionales
[Shoham, 1993]haincorporadolaideaderazonaracercadelosobjetivosyplanesdelosotros
agentesensuenfoquedealtoniveldesistemasdistribuidos,enelqueutilizaloquesedenomina
programacinorientadaaagentes.
EnLaSociedaddelaMente[Minsky, 1986],elautorproponequeaunquepensamosencada
agentecomounaunidad(aligualquenosotrosmismos),enrealidadstaestconstruidaapartirde
cientos de agentes ms sencillos, actuandoen una heterarqua (para conocer los comentarios
sobreestelibroyunacontestacinpropiadeMinsky,vaseArtificial Intelligence, vol.59,1991).
[Hintikka, 1962]fueelprimeroenproponerunalgicamodaldelconocimiento.Lasemn-
ticade losmundos posiblesfue inventadapor[Kripke, 1963]. [Moore, 1985b] axiomatizpor
enterolasemnticadelosmundosposiblesmediantelalgicadeprimerorden,yutilizestafor-
malizacinparaestudiarlasrelacionesentreelconocimientoylasacciones.Laslgicasdelcono-
cimientose handenominado lgicas epistmicas; tambinhaylgicas de lacreencia(lgicas
doxsticas), delaobligacin(lgicas denticas) yotrasmuchasmodalidades. Losmecanismos
especialesparamanejarlacreencia(comoopuestaal conocimiento)hansidoinvestigados por
[Levesque, 1984b;FaginyHalpern, 1985,yKonolige, 1986]. [CohenyLevesque, 1990]utilizan
lalgicamodalparaestudiarlarelacinentrelaintencinyelcompromiso.
[Moore, 1985a;Moore, 1993]indicaqueunprocesoderazonamientodemetanvelacercadel
propioconocimiento,denominadorazonamiento autoepistmico, esunaformaderazonamiento
nomontono.
En [Bond y Gasser, 1988], se recopilan muchos artculos importantes sobre JAD, y los
informessobrelasltimasinvestigacioneseneltemaserecogenenlasactasdelasconferencias
internacionalessobresistemasmultiagente.Losinformessobrelosavancesenrazonamientoacer-
cadelconocimientoserecogenenlasactasdelWorkshop on Theoretical Aspects ofReasoning
about Knowledge (TARK).
23.1. Demuestreque uno no puedeconocer P y ...,P utilizando instancias de los axiomas del
conocimiento.
23.2. Demuestreelpatrn...,Ka...,(Ka(<j)) :::J <j), conocidocomoelAxioma de Brouwer (utilicela
resolucinylosaxiomasdelconocimiento).
23.3. Supongamosquetenemoslassiguientessentencias:
1. KiKiP)v Ks(Q
(JohnsabequeSamconoceP oqueSamconoceQ)
2. KiKs(P:::JR
(JohnsabequeSamsabequeP:::J R)
3. KJ(Ks{-,R
(JohnsabequeSamsabeque...,R)
DemuestreKJ(Ks(Q
23.4. Enlaspginas372yss. sehandadodiversosesquemasaxiomticossobreelconocimiento.
Analicecadaunodeellosy argumentesiseano noapropiados y bajoqucondiciones, para
razonarsobrelascreencias. Porejemplo,seaadecuadoelsiguienteesquemaaxiomtico?
[Ba(<j) /\Ba(<j):::J '1')]:::J Ba('I')
Propongaotrosaxiomasquecreaseanapropiadosparalascreencias(encontrasteconel
conocimiento).Sepuedendefinirlascreenciassobrelabasedelconocimiento(yviceversa)?
23.5. En la pgina 372 hemos mencionado que una expresin como (3x)K(Agente
Sobre(x,B noeraunafuflegal(correcta).Ahorabien,cmodiramosqueelAgentel sabe
quehayciertoobjetosobreB (sinnuestroconocimientoacercadequobjetoes)?(Obsrveseque
elsignificado de K(Agentel,(3x)Sobre(x, B es queelAgente! sabe quehay un objeto
sobreB, peroquelnosabequobjetoes.)Describalosproblemasqueseplanteanaladmitirla
expresin(3x)K(Agentel,Sobre(x,B comounafuf.
Comunicacin
entreagentes
Actos de habla
Existen dos tipos de mtodos mediante los cuales nuestro agente puede influir, de manera inten-
cionada, en las acciones realizadas por otro agente. Supongamos que nuestro agente sabe cmo
reaccionar el otro agente ante los cambios que percibe en su entorno. Haciendo uso de este cono-
cimiento, nuestro agente podr realizar cambios en el entorno que hagan que el otro agente pre-
sente el comportamiento deseado. Por ejemplo, nuestro agente podra poner un bloque frente a
otro agente del cual sabe que su comportamiento consiste en apilar bloques.
El otro tipo de mtodos se basa en el intento de modificar, por parte de nuestro agente, los
objetivos, el conocimiento (o creencias) y/o los mecanismos de seleccin de acciones del otro
agente. Este efecto se podra conseguir escribiendo directamente en los elementos adecuados de
la estructura cognitiva del agente. Por ejemplo, se podra utilizar este mtodo para que un usua-
rio (nuestro agente) controle a otro agente que permita esta forma de comunicacin. Ms inte-
resante resulta la posibilidad de que nuestro agente se pueda comunicar con otro agente, de tal
forma que pueda provocarle cambios en sus objetivos y/o creencias (cambios que eventual-
mente pueden llevar a que el agente realice las acciones deseadas). El medio de comunicacin uti-
lizado depender del subsistema sensorial y perceptual del otro agente, y puede ser, por ejemplo,
la escritura (con lo que nos basamos en capacidades visuales del otro agente), los sonidos
(basndonos en sus capacidades auditivas), o va radio (basndonos en su capacidad de recepcin
de seales electromagnticas). Diremos que dos agentes han establecido un acto comunicativo
cuando un agente lleva a cabo una serie de acciones que tienen como objetivo modificar la estruc-
tura cognitiva de otro agente.
En la mayora de los casos, los actos comunicativos entre personas implican el lenguaje
hablado (utilizando las ondas acsticas como medio). Debido a esto, los expertos en lingstica
utilizan el trmino acto de habla para referirse a todos los tipos de actos comunicativos. En este
contexto, a la persona o agente que toma la iniciativa de la comunicacin se le denomina
hablante, y a la persona o agente al que va dirigida dicha accin, oyente. Estos trminos se siguen
utilizando aunque no se use el lenguaje hablado. De acuerdo con el filsofo John Searle [Searle,
379
380
381
1969], que fue el primero en desarrollar una teora sobre la que fundamentar este campo, existen
varias categoras de actos de habla: representativos (aquellos que exponen una determinada
proposicin), directivos (aquellos mediante los que se realiza una peticin o se da una orden),
exhortativos (para prometer o amenazar), expresivos (para expresar un agradecimiento o pedir
disculpas) y declaraciones (actos que cambian el estado del mundo, como, por ejemplo, Os
declaro marido y mujer).
Los actos de habla pueden tener distintas manifestaciones fsicas; pueden estar constituidos
por una cadena de signos fsicos (como en el lenguaje de signos), una secuencia de smbolos
(como en un texto), alteraciones acsticas (gritos o habla normal) o destellos luminosos. La mani-
festacin de un acto verbal se denomina sentencia -independientemente de su forma. Segn
Searle, una sentencia debe reflejar el contenido proposicional yel tipo de acto de habla que mani-
fiesta. Por ejemplo, si el medio es un texto escrito en espaol, la sentencia colocar el bloque A
sobre el bloque B refleja su naturaleza, que expresa una peticin, y su contenido proposicional,
Sobre(A, B) (con esta sentencia, el hablante podra tener la intencin de modificar la estructu-
ra de los objetivos del oyente).
Se supone que los actos de habla provocan ciertos efectos sobre el conocimiento del oyente.
Si nuestro agente, Al, se compromete a realizar un acto de habla enunciativo para informar al
oyente, A2, de que una determinada proposicin, <1>, es cierta, entonces A 1 puede suponer que el
efecto que dicho acto de habla va a provocar en A2, es que A2 sepa que A 1 tiene la intencin de
infonnar de <1> a A2. Todava no hemos descrito cmo A2 puede representar el conocimiento sobre
esta intencin, ni cmo A 1 puede representar el conocimiento sobre lo que A2 sabe de dicha
intencin. Los mecanismos para la representacin de objetivos e intenciones requieren conceptos
que escapan del mbito de este libro. Sin embargo, podemos evitar este problema considerando
el efecto que A 1 quiere provocar en A2 con su acto de habla; A 1 quiere que el efecto del acto de
habla sea que A2 crea <1>. El efecto que el hablante intenta provocar en el oyente se denomina efec-
to perlocutivo del acto del habla --en contraposicin con el efecto ilocutivo, que es el efecto que
realmente produce el acto de habla. Por supuesto, la materializacin de un efecto perlocutivo
depende enteramente del oyente, y slo tendr lugar si el oyente es extremadamente crdulo o
cree que puede confiar en el hablante. Volviendo al ejemplo, podemos simplificar nuestra expo-
sicin asumiendo que A 1 presupone que su acto de habla (informar a A2) produce sus efectos per-
locutivos. Supondremos que Al representa el efecto del acto de habla sobre A2 mediante la fr-
mula K(A2, <1.
Cuando las personas utilizan el lenguaje para comunicarse, los efectos perlocutivos (preten-
didos) de una sentencia de un tipo determinado se corresponden en algunos casos con los efectos
de (tro tipo de sentencias. Por ejemplo, con la sentencia {(te has dejado abierta la nevera, el
hablante est pretendiendo que el oyente cierre la nevera. Los actos de habla cuyos efectos per-
locuttvos son distintos de lo que realmente aparentan, se denominan actos de habla indirectos. Un
hablante que hace uso de un acto de habla indirecto presupone que el oyente puede inferir el obje-
tivo de dicho acto a partir del contexto de la situacin, y que utilizar dicho objetivo para decidir
sobre los efectos perlocutivos del acto. De esta forma, la sentencia {(Sabes qu hora es?
es una forma indirecta de preguntar la hora, y no de conocer si el oyente sabe realmente la hora
que es.
24.1.1. Planificacin de los actos de habla
Podemos considerar que los actos de habla no son ms que otro tipo de las posibles acciones que
puede desarrollar un agente. Nuestro agente puede utilizar un sistema de construccin de planes
en el que se incluyan, entre otras acciones, diferentes tipos de actos de habla. Para que esto sea
Comunicacin entre agentes
posible, necesitamos un modelo de los efectos que conllevan dichas acciones. Por ejemplo,
supongamos que la sentencia Decir(a, <1 es un acto de habla representativo con el que nuestro
agente informa al agente a que <1> es cierto. Podemos modelar los efectos de esta accin median-
te la siguiente regla STRIPS:
Decir(a, <1
PC: Cerca_de(a) 1\ <1> 1\ -,K(a,
B: -,K(a, <1
A: K(a,
Mediante la precondicin Cerca_de(a) nos aseguramos que nuestro agente est lo sufi-
cientemente cerca de a como para que la comunicacin sea fiable; imponemos la precondicin <1>
para asegurarnos que nuestro agente realmente cree que <1> es cierto, antes de informar de este
hecho a otro agente; y la precondicin -,K(a, <1 nos asegura que nuestro agente no va a comu-
nicar informacin redundante. Consideraremos que la accin tiene como efecto perlocutivo que
a sepa <1>. Supongamos ahora que nuestro agente est situado en un mundo de bloques en el que
su objetivo es Sobre(B, Suelo), y que est en una situacin en la que Sobre(A, B) 1\
1\ Sobre(B, C) 1\ Sobre(C, Suelo). Adems, nuestro agente sabe que cada vez que el agente
A1 detecte que el bloque B est libre y colocado sobre el bloque C, reaccionar reactivamente y
colocar el bloque B sobre el suelo. Si utilizamos las reglas STRIPS para el mundo de bloques y
la regla anterior que define el acto nuestro agente puede construir el plan {Mover(A, B,
Suelo), Decir(Al, Libre(B) 1\ Sobre(B, C}.
24.1.2. Implementacin de los actos de habla
Como ya hemos mencionado, una sentencia es la implementacin o manifestacin fsica de un
acto de habla, pero ahora debemos discutir cmo un acto comunicativo, como, por ejemplo,
Decir(a, <1, puede transmitirse desde el hablante al oyente en forma de sentencia. Podemos
considerar dos posibilidades: a) una transmisin directa de una forma lgica desde el hablante al
oyente, y b) la transmisin, por parte del hablante, de una cadena de smbolos que el oyente tra-
ducir a su estructura cognitiva (traduccin que puede consistir en una frmula lgica) l.
Si tanto el hablante como el oyente comparten un mismo modelo basado en caractersticas del
mundo y utilizan frmulas lgicas constituidas por los mismos smbolos, entonces el acto de habla
se puede realizar transmitiendo simplemente una frmula lgica (adems de informacin que indi-
que qu tipo de acto de habla estamos transmitiendo). De esta forma, por ejemplo, el acto de habla
Decir(Al, Libre(B) 1\ Sobre(B, C se puede implementar haciendo que nuestro agente
enve a Al la frmula Libre(B) 1\ Sobre(B, C), e indique que trata de enviar un acto de habla
representativo. Hay que tener en cuenta que, si hacemos esto, estamos suponiendo que la frmu-
la Libre(B) 1\ Sobre(B, C) significa exactamente lo mismo para los dos agentes (la expresin
exactamente lo mismo implica que los modelos lgicos de dicha frmula, junto con el resto de
las frmulas en su base de conocimiento, son sustancialmente iguales para ambos agentes). La
suposicin de que los vocabularios para la representacin del conocimiento son idnticos es
demasiado fuerte -inviable en la mayor parte de las aplicaciones reales-, incluso si considera-
mos que los agentes son construidos y programados por la misma persona. Adems, aunque ini-
1 Una cadena de smbolos es slo un ejemplo de objeto transmitido; las personas tambin utilizan diagramas, dibu-
jos y otros tipos de medios para transmitir infoIDIacin a otras personas.
382
383
cialmente los vocabularios para la representacin del conocimiento sean idnticos, la probabilidad
de que cuando aparezca un nuevo objeto le sea asignado el mismo nombre es muy pequea. Tam-
bin puede ocurrir que, si los agentes pudieran construir nuevos predicados a partir de predicados
ms primitivos, resulten predicados equivalentes formados por smbolos diferentes. Debido a que
nuestro agente ha adoptado una determinada postura intencional respecto al otro agente, puede que
el otro agente no codifique su modelo del mundo por medio de frmulas lgicas.
Teniendo en cuenta estas limitaciones nos podemos preguntar: cmo es posible la comuni-
cacin entre agentes? Una de las posibles respuestas pasa por la segunda posibilidad de transmisin
anteriormente comentada, es decir, utilizando un lenguaje de comunicacin comn, prestablecido
de mutuo acuerdo. Por medio de un buen diseo, uso o entrenamiento, un agente puede aprender
cmo modificar las estructuras cognitivas de otros agentes transmitiendo cadenas de smbolos en
ese lenguaje comn. Mediante la adopcin de una determinada postura intencional, nuestro agen-
te puede predecir, por ejemplo, que si transmite al agente Al la cadena de smbolos 2 el bloque B
est sobre el bloque e, y el bloque B est libre, su efecto (perlocutivo) sobre la estructura cog-
nitiva de Al puede describirse en la base de conocimiento de nuestro agente mediante la frmula
K(Al, Sobre(B, C) 1\ Libre(B, independientemente de cmo Al represente realmente dicho
conocimiento. En este ejemplo, nuestro agente realiza el acto de habla Decir(Al, Sobre(B, C) 1\
1\ Libre(B enviando la sentencia el bloque B est sobre el bloque e, y el bloque B est
libre. Posteriormente, el oyente traducir dicha sentencia a la forma en la que internamente repre-
senta su conocimiento. Por supuesto, y dado que somos nosotros los que estamos diseando estos
agentes, podemos elegir cualquier lenguaje para la comunicacin entre agentes. Si nuestros agen-
tes tuviesen que comunicarse con las personas en algn lenguaje que se parezca al castellano,
podramos inventar un nuevo lenguaje parecido al castellano, como en el ejemplo anterior.
Antes de utilizar lenguajes basados en cadenas de smbolos tenemos que resolver dos cues-
tiones importantes: cmo se genera una cadena de smbolos a partir de un acto de habla deter-
minado?, y cmo traducimos la cadena de smbolos en una serie de efectos sobre una estructu-
ra cognitiva concreta? Aunque hemos insistido en el uso de cadenas de smbolos como medio de
comunicacin entre agentes artificiales, la generacin y la comprensin de los lenguajes naturales
-los lenguajes en los que hablan y escriben las personas, como, por ejemplo, el castellano, el
ingls, el francs, etc. - es un problema aparte. Sin embargo, el estudio de la generacin y de la
comprensin de cadenas de smbolos para la comunicacin entre agentes se ha realizado casi
siempre en el contexto de los lenguajes naturales. Por estas razones, el enfoque con el que
vamos a tratar la comunicacin entre agentes mediante cadenas de smbolos se centrar en sen-
tencias parecidas al castellano. El procesamiento, la generacin y la comprensin del lenguaje
natural son tareas extremadamente difciles, y todava no se han conseguido avances significati-
vos en este campo. Indudablemente, como veremos en las siguientes secciones, para alcanzar
capacidades de nivel humano, primero debemos solucionar algunos de los problemas de lA. No
obstante, hoy en da, existen algunas aplicaciones que son factibles. En la siguiente seccin dare-
mos una breve descripcin de algunas de las principales tcnicas utilizadas en los sistemas de
comprensin del lenguaje (en el anlisis que vamos a presentar hemos omitido los aspectos rela-
tivos a la generacin del lenguaje. Si el lector est interesado en este tema, puede examinar
[Appelt, 1985, y Sadek et al., 1996], donde se analiza el uso de las tcnicas de planificacin y
razonamiento para generar sentencias en lenguaje natural; [McKeown y Swartout, 1987] para una
revisin de varias tcnicas, y [McDonald y Bolc, 1988], que es un libro centrado en este tema. En
la actualidad, existen interfaces de ordenador que tienen una capacidad limitada para la genera-
cin de texto y habla).
2 Utilizaremos el tipo de letra univers para los smbolos de las cadenas objeto de la comunicacin.
ComUlcacin entre agentes
Comprensin de las cadenas de smbolos de un lenguaje
En esta seccin trataremos de analizar cmo un oyente puede traducir una cadena de smbolos,
transmitida por un hablante, de la que se supone representa una determinada proposicin, en una
frmula que represente esa misma proposicin. La mayor parte (pero no toda) de la informacin
necesaria en esta transformacin est implcita en las propiedades sintcticas de la cadena. Por
ejemplo, un agente que utilice el castellano para comunicarse, pretender que al transmitir la
cadena el bloque B esta sobre el bloque e, sta se tradujera por Sobre(B, C) y no por
Sobre(C, B). La forma ms conveniente para describir las propiedades sintcticas de las cadenas
consiste en usar una gramtica, que no solo delimita cules son las cadenas permitidas en un len-
guaje, sino que tambin define las estructuras de las sentencias. Los ejemplos de esta seccin uti-
lizan un subconjunto muy simple de la lengua castellana que nos servir de ejemplo de un posi-
ble lenguaje para comunicacin entre agentes, y que supondr un primer paso hacia una intro-
duccin a la tecnologa utilizada en la comprensin del lenguaje natural.
24.2.1. Gramticas con estructura de frase
Una gramtica con estructura de frase define cmo los componentes bsicos de una cadena de
smbolos, los propios smbolos, pueden ser agrupados enfrases, y cmo stas pueden ser agru-
padas en oraciones. La forma mediante la cual una oracin puede ser descompuesta en las frases
que la constituyen, finalizando en los smbolos de la cadena, define lo que denominamos estruc-
tura de la oracin. El conocimiento de la estructura de una oracin es primordial para traducirla
a una frmula lgica. Un lenguaje est constituido por smbolos terminales y smbolos no ter-
minales. El smbolo no terminal de ms alto nivel es la oracin, representada por el smbolo O.
Cada smbolo no terminal puede ser definido por una secuencia de otros smbolos, terminales y/o
no terminales. En una gramtica libre de contexto, la definicin de un smbolo no terminal es
independiente de los smbolos que le rodean en la cadena. Ilustraremos este concepto con una
gramtica libre de contexto simple, pero apropiada para una comunicacin limitada al mundo de
bloques.
Una oracin O se define como una frase sustantiva (FS en adelante) seguida de una frase ver-
bal (FVen adelante). Esta definicin queda reflejada en la siguiente regla:
0<::- FS FV
Tambin podramos permitir que una oracin estuviera compuesta, de forma recursiva. de una
oracin seguida de una conjuncin (Conj) y seguida de otra oracin:
O <::- O Conj O
Podemos escribir estas dos reglas en una forma ms abreviada utilizando laforma Backus-
Naur(BNF):
0<::- FS FVI O Conj O
donde I se lee como o.
El siguiente paso consiste en definir los smbolos no terminales FS, FV y Conj. Algunos de
estos smbolos se pueden definir mediante otros smbolos no terminales, pudiendo continuar estas
384 385
definicioneshastaquealcancemoslossmbolosterminales. Unaconjuncinquedadefinidapor
elsmboloterminalyoelsmboloterminalo:

Unafrase sustantivaquedadefinidaporunsustantivo(S)oporunadjetivo(Adj) seguidode
unsustantivo:

Paranuestromundodebloques,unsustantivoslopuedeserunodelossmbolosterminales
A, B, eysuelo(lossustantivosutilizadosparadesignarlasentidadesquepuedenaparecerenel
mundodebloques).TambinpermitiremoscomosustantivosterminalesbloqueA, bloqueBy
bloquee
3
Estasdefinicionessepuedenresumirenlasiguienteregla:
s AIBI eIbloqueAIbloqueBIbloqueeI suelo
Un adjetivopuededefinirsedelasiguienteforma:
Adj libreI vacioI ocupado
Unafrase verbalsepuederepresentarmediantelaregla:
FV estaAdj I estaFP
Porltimo, unafrasepreposicional(FP) yunapreposicin(Prep) sedefinendelasiguiente
forma:
FP f-Prep FS
Prep f- sobreI encimaI debajo
EnlaTabla24.1 sepuedenver,deformaagrupada,todasestasreglas.Enunsistemadepro-
cesamientodellenguajenatural,los smbolosterminalessecorrespondenconlaspalabrasdellen-
guaje,quesonalmacenadasenunabasededatosdenominadadiccionario.
of- FSFVIOConjO
Conjf- y I O
FSf- SIAdjS
Sf- A IBI eIbloqueAIbloqueBIbloqueeI suelo
Adj f- libreI vacioI ocupado
FVf- estaAdj Iesta FP
FPf- PrepFS
Prepf- sobreI encimaI debajo
Tabla24.1.
Gramticaparaellenguajedecomunicacinenel mundodebloques.
J Tcnicamentehablando.lacombinacindelsustantivobloqueyelsustantivoArecibeelnombredecombina-
cinsustantivo-sustantivo. Simplificaremosnuestroanlisis considerndolascomosmbolosadicionales.
Comunicacinentreagentes
Laestructuradelasoracionespermitidasporlasreglasdeunagramticasepuederepresen-
tarmedianteunrbol. Porejemplo,enlaFigura24.1 sepuedeverlaestructuradelaoracinblo-
queBesta sobrebloquee,y bloqueBestalibre.Paraquelaestructuraseacompleta,todo
nodoquenoseahojatienequeestaretiquetadoconunsmbolonoterminal,quedandodetermi-
nadossusdescendientesporunadelasreglasde lagramtica.Cadanodohojatienequeestareti-
quetadoconunsmboloterminal. Enlafigura, losnodosetiquetadosconsmbolosnoterminales
se representan porcuadrados, mientras que los nodos etiquetados conun smbolo terminal se
representanmedianteuncrculo.
Usando las reglas de la gramtica podemos determinar que las siguientes oraciones son
vlidas4:
bloqueeesta ocupado
Aesta sobree
Besta sobreocupadoe
ocupadoBestasobrelibree
Paradecidirsi unadeterminadacadenade smbolosesvlida,primerohayqueanalizarla.
Este proceso recibe el nombre de anlisis sintctico. Existen distintas tcnicas pararealizar
estetipo de anlisis. Enunanlisis descendente, primero se aplican las reglas delagramtica
(medianteunencadenamientohaciaatrs)al smbolonoterminal0,rescribindoloentrminos
delasfrasesque10componen.Esteprocesocontinahastaqueobtengamosunconjuntodesm-
bloqueBestasobrebloqueeybloqueBestalibre
O
bloqueBestasobrebloquee
O
estasobrebloquee
FV
Figura24.1.
Gramticaparaellenguajedecomunicacinenelmundodebloques.
4 Porsimplcidad,hemosignoradolos aspectosrelacionadosconlasmaysculasylos signosdepuntuacin,aun-
quesepuedeconstmirgramticasquelosincorporen.
386
387 Inteligencia artificiaL Una nueva sntesis
bolos terminales que se corresponda con los que aparecen en la cadena. Se puede apreciar que
este proceso es como si estuvisemos realizando una bsqueda en un espacio de estados forma-
do por rboles Y/O, cuyo objetivo es encontrar un rbol que sirva de solucin (el rbol que se
muestra en la Figura 24.1 es un ejemplo de rbol solucin). En un anlisis ascendente, se van
reemplazando subcadenas de la cadena que est siendo analizada por los smbolos no terminales
correspondientes, y stos se reemplazan a su vez por otros smbolos no terminales (de acuerdo
con las reglas de la gramtica). Este proceso contina hasta que alcancemos el smbolo no ter-
minal O. Por cuestiones de eficiencia, el anlisis de la cadena de smbolos se realiza de izquier-
da a derecha. Como se puede deducir, este ltimo proceso se puede implementar mediante una
bsqueda primero en profundidad con vuelta atrs.
24.2.2. Anlisis semntico
En los prrafos anteriores hemos mencionado que el verdadero objetivo de la transmisin de una
cadena de smbolos es que el oyente la traduzca a una frmula lgica. Hemos afirmado tambin
que la estructura gramatical de una cadena de smbolos nos dice mucho acerca del mensaje que se
le presupone. En esta seccin describiremos un mtodo mediante el cual la traduccin a una fr-
mula lgica se puede plantear como un efecto colateral del proceso de anlisis. Para conseguir
este efecto hay que asociar cada frase de una oracin con los correspondientes componentes de
las frmulas lgicas. Cada regla de una gramtica con estructura de frase indicara cmo se pue-
de construir el componente de la frmula asociado a una determinada frase, a partir de los com-
ponentes de la frmula asociados con las subfrases correspondientes. Por ejemplo, la regla:
P ~ P r e p S
tiene que indicar su asociacin semntica en funcin de las asociaciones semnticas de Prepy FS.
Se pueden especificar las asociaciones semnticas expresando cada smbolo no terminal como
una expresin funcional, en la que la asociacin semntica es el argumento; por ejemplo,
FP(sem).
Una vez finalizado el anlisis, la frmula asociada con el smbolo no terminal Ose conside-
ra el significadode la oracin. Una gramtica que incluya este tipo de asociaciones se denomina
gramticaconestructuradefraseextendida,y el proceso de anlisis incluye, aparte del anlisis
sintctico, lo que se denomina anlisissemntico.
Ilustraremos este proceso extendiendo la gramtica con estructura de frase utilizada como
ejemplo, para despus analizar semnticamente la frase que ya hemos analizado sintcticamente.
Empezaremos asociando frmulas lgicas a cada uno de los smbolos terminales, concretamen-
te a aquellos que en las reglas de la gramtica se clasifican como sustantivos. Intuitivamente,
sabemos que los sustantivos deberan estar asociados a objetos constantes del clculo de predi-
cados. En nuestro ejemplo, podemos realizar la asociacin rescribiendo la regla S ~ A I B I e I
bloque A I bloque B I bloque e I suelo como:
A ~ Sustantivo(E(A
B Sustantivo(E(B
e Sustantivo(E(C
bloque A ~ Sustantivo(Bloque(A
bloque B ~ Sustantivo(Bloque(B
bloque e Sustantivo(Bloque(C
suelo Sustantivo(Base(Suelo
La primera regla indica que el elemento semntico que se tiene que asociar al sustantivo A es
el tomo E(A) (lo que queremos indicar con E(A) es que el objeto identificado con la A es una
entidad). Esta regla establece que si durante el proceso de anlisis aparece el smbolo no terminal
A en la cadena de smbolos, lo podemos rescribir como Sustantivo(E(A (es muy importante
tener en cuenta la tpografa utilizada. El tipo de letra univers se utiliza para los smbolos ter-
minales, el tipo cursivapara los smbolos no terminales de la gramtica y el tipo courier para
las expresiones de clculo de predicado). Como se puede apreciar, las reglas de asociacin han
sido escritas con la flecha apuntando a la derecha (a diferencia de las otras reglas de la gramti-
ca), ya que estas reglas tienen que ser aplicadas hacia delante -reemplazando los smbolos ter-
minales por la frmula de la parte derecha de la regla.
Si realizamos las sustituciones indicadas por algunas de estas reglas de asociacin en nuestra
oracin de ejemplo, obtendremos la siguiente oracin (que est parcialmente analizada):
Sustantivo(Bloque(B esta sobre Sustantivo(Bloque(C y Sustantivo(Bloque(B
esta libre
Siguiendo con esta filosofa, las reglas extendidas para los smbolos no terminales y y o se-
ran:
y ~ Conj(A)
o ~ Conj(v)
y aplicando la regla para la conjuncin y, obtenemos:
Sustantivo(Bloque(B esta sobre Sustantivo(Bloque(C Conj(A) Sustantivo(Blo-
que(B esta libre
Los elementos de una frmula asociados al resto de smbolos no terminales no son tan fci-
les de definir. Los adjetivos libre, vacio y ocupado sirven para indicar una propiedad de algn
objeto, con lo que tienen que introducir tomos en los que aparezcan los objetos constantes y las
relaciones constantes apropiadas. Sin embargo, cuando se vaya a reemplazar un determinado
adjetivo, puede que no se conozca el objeto al que est cualificando. Por ejemplo, la regla para el
adjetivo libre podra ser:
libre ~ Adj(Libre(x
La expresin Libre(x) debe ser considerada como una expresindel clculo de predicados
que necesita ser aplicadasobre algn objeto constante para producir unafrmuladel clculo de
predicados. Para definir este tipo de expresiones funcionales vamos a utilizar el formalismo cono-
cido como expresioneslambda,con lo que una forma mucho ms precisa de definir la regla para
el adjetivo libre es:
libre ~ Adj()..;xLibre(x
Esta regla es un ejemplo de cmo algunas veces el significado de una frase se expresa
como algo que opera sobre el significado de otra frase. Si aplicsemos la expresin funcional a la
constante B, obtendramos:
(M Libre(xB =Libre(B)
388
Si aplicramos ahora la regla que acabamos de definir para el adjetivo libre a nuestra oracin
parcialmente interpretada, obtendramos:
Sustantivo(Bloque(B esta sobre Sustantivo(Bloque(C Conj(A) Sustantivo(Blo-
que(B esta Adj(Ax Libre(x
(las reglas para el resto de los adjetivos se construyen de la misma forma).
Antes de continuar con las reglas para el resto de los smbolos no terminales, vamos a defi-
nir reglas para el smbolo no terminal frase sustantiva. Unafrase sustantiva puede estar consti-
tuida por slo un nombre (sin ningn cambio de semntica):
Sustantivo(q,(cr -t FS(q,(cr
donde q,(cr) es un tomo unario (con cr como variable). Si aplicamos esta regla, obtenemos:
FS(Bloque(B esta sobre FS(Bloque(C Conj(A) FS(Bloque(B esta Adj(AxLi
bre(x
Una frase sustantiva tambin puede estar formada por un adjetivo seguido de una frase sus-
tantiva. Esta regla la podemos ver en la Tabla resumen 24.2.
En nuestra gramtica de ejemplo, slo tenemos un verbo, esta, que siempre aparece junto a
un adjetivo o junto a una frase preposicional. Cuando es usado junto con un adjetivo, podemos
aplicar la regla:
est Adj(Ax q,(x -t FV(Ax q,(x
en este caso, q, es una constante de relacin unaria que indica la propiedad asociada al adjetivo (en
este lenguaje tan simple, el verbo no aade ningn contenido semntico).
Antes de continuar con la otra regla para frases verbales, vamos a mostrar cmo se puede
combinar una frase sustantiva con una frase verbal para producir una oracin:
FS( q,(crFV(Ax \jI(x -t OAx \jI(X) A q,(crcr)
donde \ji puede ser cualquier constante de relacin (que en nuestra gramtica puede corresponder
a cualquier relacin) en la que su variable lambda, x, se ligar cuando apliquemos la expresin
lambda. ste es el primer ejemplo de cmo se pueden combinar las semnticas asociadas a dos
elementos distintos aplicando la expresin lambda de la frase verbal a la constante de objeto de
la frase sustantiva. Esta operacin la podemos realizar antes de comenzar el anlisis, con lo que
podemos simplificar la regla anterior y escribir:
FS(q,(crFV(Ax \jI(x -t O(\jI(cr) A q,(cr
Si aplicamos estas ltimas reglas a nuestro ejemplo, obtenemos sucesivamente:
FS(BloqUi2(B esta sobre FS(Bloque(C Conj(A) FS(Bloque(B FV(AxLibre(x
FS(Bloque(B esta sobre FS(Bloque(C Conj(A) O(Libre(B) A Bloque(B
Para poder tratar las preposiciones y las frases preposicionales, se puede aplicar la siguiente
regla:
sobre -t Prep(>..xy Sobre(x ,y
(como podemos ver, la preposicin sobre introduce un predicado con dos argumentos, y gracias
a la notacin lambda podemos determinar cules son las variables).
Prep(Axy \ji (x, yFS(q,(cr -t FP(Ax (Ay \ji (x, y) A q,(crcr)
expresin que se puede simplificar de la siguiente forma:
Prep(AxY \ji (x, yFS(q,(cr -t FP(Ax \ji (x, cr) A q,(cr
donde \ji puede ser cualquier constante de relacin con dos argumentos asociada a las preposi-
ciones.
La otra regla relacionada con las frases verbales es:
est FP(Ax \ji (x, cr -t FV(Ax \ji (x, cr
(en esta regla, \ji es una constante de relacin binaria con una variable cr y una variable lambda x
que ser ligada despus). Ahora podemos aplicar a nuestro ejemplo est regla, junto con la
regla anterior, para el smbolo no terminal O, obteniendo:
FS(Bloque(B esta Prep(Axy Sobre(x, y FS(Bloque(B Conj(A) O(Libre(B) A
A Bloque(B
FS(Bloque(B esta FP(Ax Sobre(x, C) A (Bloque(C Conj(A) O(Libre(B) A Blo-
que(B
FS(Bloque(B FV(Ax Sobre(x, C A (Bloque(C Conj(A) O(Libre(B) A Bloque(B
O(Bloque(B) A Bloque(C) A Sobre(B, C Conj(A) O(Libre(B) A Bloque(B
La ltima regla que podemos aplicar en nuestro ejemplo es aquella que nos permite unir dos
oraciones mediante una conjuncin:
0(11)Conj(A)0("f2) -t 0(11 A 12)
con lo que, despus de reordenar los trminos y simplificar, obtenemos:
O(Sobre(B, C) A Libre(B) A Bloque(B) A Bloque(C
En la Figura 24.2 podemos ver el rbol resultante del anlisis semntico de nuestra frase
ejemplo. Para una mayor claridad, al lado de cada nodo se muestran las correspondientes fr-
mulas del clculo de predicados (en vez de mostrarlas como argumentos de los smbolos no ter-
minales asociados). En la figura, podemos ver cmo las estructuras semnticas asociadas a cada
subfrase van conformando la estructura semntica de la frase a la que pertenecen. Se dice que las
gramticas extendidas de este tipo tienen semntica composicional. En la Tabla 24.2 se pueden
ver todas las reglas de esta gramtica.
390
391
bloqueBestasobrebloquee,ybloqueBesta libre Sobre(B,e) 1\ Libre(B)
O 1\ Bloque(e)
1\ Bloque(B) 1\ Bloque(B)
b l ~ q u e Besta sobrebloquee Sobre(B,e) bloqueBesta libre Libre(B)
~ O 1\ Bloque(e)
O 1\ Bloque(B)
_ A Bloque(B)
A, x Libre(x)
Bloque(C)
Bloque(C)
Figura24.2.
rbolobtenidocomoresultadodelanlisissemnticodelaoracinejemplo.
24.2.3. Extensindelagramtica
AunquelagramticamostradaenlaTabla24.2puedetraducirenfrmulaslgicasmuchasora-
cionesdelmundodebloques,lahemosconstruidosloparadarunavisingeneraldel procesode
anlisissemntico.Evidentemente,podramoshaberincluidomuchasmsreglassincomplicar
excesivamenteelejemplo. Porejemplo,podramoshaberaadidoreglasparacubrirmsadjeti-
vos(rojo,pesado,...),mspreposiciones(proximoa,entre,...)ymssustantivosparabloques
y agentes adicionales. Elnico verboque hemos utilizado enestelenguaje nodesempeaun
papelmuyimportante.Podramoshaberaadidoelverbosaber,quesepodratraduciraformas
modalesusandolospredicadosK. Latraduccindeotrosverbos,comoelqueapareceenlaora-
cinSammuevebloqueAdesdebloqueBabloquee,nosobligaraadeterminarlaforma
deconceptualizarlosydescribirlosmediantefrmulaslgicas.Siademspermitimoslautiliza-
cindetiemposverbales(como,porejemplo,movo)nos veramosobligadosautilizarforma-
lismoslgicoscapacesderepresentareventostemporales.
Sepodrapermitirelusode artculos, como el y un,yaqueenlamayoradelos casos se
puedentraducirmediantefrmulascuantificadas.Porejemplo,laoracinbloqueAestsobre
un bloquepuedesertraducidapor(3x)Sobre(A,x).Tambinpodramoshaberpermitidola
inclusindelaspalabrascada,todoyalgunenlaconstruccindelasoraciones,peroestaramos
obligadosabuscarmecanismosquenospermitieranresolverlaambigedadinherentealmbito
delacuantificacin.Porejemplo,laoracintodoslosbloquesestan sobre un bloquese
puedetraducircomo(\fx)(3y)Sobre(x,y)ocomo(3y)(\fx)Sobre(x,y).Pararesolvereste
tipo de ambigedades tenemos que acudir a otras fuentes de conocimiento, en busca de un
conocimientoquegeneralmentenoestcontenidoenlaoracin.Msadelanteanalizaremoscier-
tosaspectosrelacionadosconeltratamientodelosdistintostiposdeambigedadesconlosque
nospodemosencontrar.Enunanlisissemntico,normalmente,sepuedeposponerlaresolucin
delasambigedadessi latraduccinsehaceaunlenguajeespecialformadoporformas casi-lgi-
cas [RussellyNorvig, 1995,p. 676enadelante],queescapazdemantenerlasambigedadesen
vezdetenerquetraducirlasdirectamenteafrmulas delalgicadeprimerorden,quenormal-
mentenosonaptaspararepresentarestetipodeambigedades.Latraduccindelasformas casi-
lgicasenfrmulaslgicassehacecuandoenunadeterminadafrasesepuedeacudiralconoci-
mientorequeridopararesolverlasambigedadespresentesenlasdistintasfrases.
Enlamayoradeloscasos,lasgramticaslibresdecontextonosonadecuadasparadefinirora-
cionesenlenguajenatural.Porejemplo,unagramticalibredecontextoconlareglaO~ FSFV
queaceptelaoracinelbloqueAYel bloqueeestansobreelbloqueetambinaceptarala
oracinel bloqueAyel bloqueeestasobreelbloquee,yaquelafraseestasobreelblo-
queeesunaFVvlida. Parapoderforzarlaconcordanciadelasformas singularesypluralesse
tendranqueincluirreglaslibresdelcontextoadicionalesquepermitandefinirfrases sustantivasen
singular(yenplural)yfrasesverbalesensingular(yenplural).Latcnicaquenospermiteexten-
derunagramticaasociandoalasfrasesformas semnticastambinsepuedeutilizarparaincluir
estetipode restricciones sensibles al contexto, como,porejemplo, aquellasrelacionadas conel
nmero(pluralysingular),lapersona(primera,segundaotercera),eltiempoverbal,eltipodever-
A-fSustantivo(E(A
B-fSustantivo(E(B))
e-fSustantivo(E(C
bloqueA-fSustantvo(Bloque(A
bloqueB-fSustantivo(Bloque(B
bloquee-fSustantivo(Bloque(C
suelo-fSustantivo(Suelo(Suelo
y -fConj(/\)
o-fConj(v)
libre-fAdj('A.x Libre(x
yacio-fAdj('A.x Libre(x
ocupado-fAdj('A.x Libre(x
sobre-fPrep(hySobre(x,y
encima-fPrep(hySobre(x,y
debajo-fPrep(hySobre(x,y
estaAdj(Ax$(x -fFV(Ax$(x
estaFP(Ax'I/(x,a -fFV(Ax'I/(x,a
Prep(hy'I/(x,y FS($(o -fFP(Ax'I/(x,a)/$\l(o
Sustantivo($(o -fFS(\l(o
Adj(Ax$(x))FS('I/(o))-fFS($(O) /\'1/(0
FS(\l(oFV(Ax'lf(x -f0('1/(0)/\$(0
O(YI)Conj(/$0(Y2)-fO(YI /\Y2)
Tabla24.2.
Gramticaconestructuradefraseextendida.
392 393
bo (transitivo o no transitivo) y el modo del verbo (subjuntivo, indicativo o imperativo). Por ejem-
plo, para forzar la concordancia de las fonnas singulares y plurales, podemos aadir un argumento
adicional, n (para indicar el nmero), a las frases sustantivas. De esta forma, una posible regla para
fonnar oraciones podra ser O(n) <t- FS(n)FV(n) (por simplicidad, hemos omitido los argumentos
que determinan la semntica). Cuando vayamos a aplicar esta regla, las ligaduras para la variable n,
que pueden ser s (singular) o p (plural), tienen que coincidir. Las ligaduras para el argumento n en
el predicado VP(n) pueden ser determinadas por alguna de las siguientes reglas: estan -? Verbo(p)
o es -? Verbo(s), que se tienen que utilizar en las zonas ms profundas del rbol de anlisis semn-
tico. La ligadura para n en el predicado FS(n) se determinara de la misma fonna. Las gramticas que
utilizan este tipo de reglas se denominan gramticas de unificacin, debido al papel que desempe-
a el proceso de unificacin en el establecimiento de la concordancia entre las distintas variables.
Comunicacin eficiente
Podemos conseguir una mejora sustancial en la eficiencia de la comunicacin si confiamos en que
el oyente vaya a utilizar su propio conocimiento para determinar el significado de una expresin.
A buen entendedor, pocas palabras bastan. Si el hablante intuye que el oyente se puede ima-
ginar lo que se le quiere decir, el hablante puede transmitir menos mensajes y ms cortos. Una de
las principales razones por las que resulta muy difcil para los ordenadores comprender el len-
guaje natural, es que su comprensin requiere de la utilizacin de muchas fuentes de conoci-
miento, incluyendo conocimiento sobre el contexto en el que se desarrolla la comunicacin y
conocimiento general de sentido comn compartido por los dos agentes. En las siguientes sec-
ciones abordaremos brevemente cada uno de estos tpicos.
24.3.1. Utilizacin del contexto
Si el oyente y el hablante comparten un mismo contexto (es decir, ambos conocen la situacin en
la que se emite y recibe una expresin), entonces pueden utilizarlo como fuente de conoci-
miento para determinar el significado de las expresiones. Gracias al contexto, podemos incluir en
el lenguaje pronombres (como el y este) y referencias (como aqui, ahora, yo y tu). Entre la
infonnacin de contexto nos podemos encontrar tanto comunicaciones anteriores como el estado
del entorno. Por ejemplo, supongamos que se transmite la expresin bloque A esta libre y este
~ sobre el bloque B. El oyente procesar la frase este esta sobre el bloque B en un con-
texto en el que ya se ha escuchado y entendido la frase bloque A esta libre. En este contexto,
el oyente puede suponer que ste se refiere a un bloque ya mencionado, el bloque A 5. La utili-
zacin de la palabra ste en nuestra oracin de ejemplo (en vez de repetir las palabras bloque A)
nos permite slo una pequea reduccin en el tamao del mensaje, aunque si sumamos muchas
de estas reducciones, conseguiremos una mejora importante en la eficiencia de la comunicacin.
Por supuesto, para poder conseguir este aumento de la eficiencia, el hablante debe saber que el
oyente puede resolver la referencia (y que realmente lo har).
Si el hablante utiliza la referencia yo, un oyente que est localizado en el mismo contexto
sabe a qu persona (o mquina) hace referencia dicha palabra. Por ejemplo, si el robot Rl afinna
yo se que el bloque A esta sobre el bloque B, un oyente que identifique al robot R1 como el
5 En lingstica, se usa el tnnino anfora para describir las frases (incluidos los pronombres) que se refieren a
cosas que han sido mencionadas anteriormente. En general, determinar el significado de un trmino anafrico es
extremadamente complejo; el ejemplo que hemos puesto corresponde a un caso muy especial y simple.
ste es el bloque B
~ ~
Figura 24.3.
Ejemplo de cmo gracias a la sealizacin podemos establecer el significado de una referencia.
hablante, podra interpretar que dicha oracin tiene el significado K(Rl, Sobre(A, B. En
algunos casos, las referencias como ste se utilizan conjuntamente con acciones de sealizacin.
Por ejemplo, en la Figura 24.3 podemos ver un robot sealando un bloque y diciendo este es el
bloque B. El robot oyente observa que el robot hablante est sealando un bloque e interpreta
que el significado de la oracin es Sobre(A, B). El hablante emite dicha oracin porque quiere
que el oyente sepa que Sobre(A, B) es cierto, y se est dando cuenta de que el oyente no puede
ver la etiqueta del bloque B pero puede ver la etiqueta del bloque A y que dicho bloque est sobre
el bloque que est siendo sealizado. Al igual que antes, hemos conseguido un pequeo ahorro en
el tamao del mensaje que contribuye a mejorar la eficiencia de la comunicacin.
24.3.2. Utilizacin de conocimiento para resolver ambigedades
Si pudisemos disear un lenguaje para la comunicacin entre agentes cuyas sentencias pudieran
ser transmitidas y comprendidas de fonna aislada, sin ningn tipo de ambigedad, nos encon-
traramos ante un lenguaje enormemente grande fonnado por frases demasiado complejas. Las
personas al utilizar el lenguaje natural, en la mayora de los casos, pueden determinar el signifi-
cado de las palabras y frases ambiguas acudiendo a distintas fuentes de informacin. Esta habi-
lidad nos permite hacer un uso ms eficiente del lenguaje, caracterstica que quiz pueda ser
transferida al rea de la comunicacin entre agentes.
En el campo de la lingstica computacional, se han identificado varios tipos de ambige-
dades que pueden aparecer en las expresiones en lenguaje natural. A continuacin, describiremos
estos tipos de ambigedad con ejemplos del mundo de bloques y en situaciones en la que se tie-
nen robots que se comunican entre ellos (y con las personas). (La semntica y el lenguaje que
vamos a utilizar en los ejemplos sern un poco ms complejos que el definido en la Tabla 24.2.)
Ambigedad lxica
La ambigedad lxica hace referencia al hecho de que una misma palabra puede tener varios sig-
nificados. La oracin el robot R 1 ha desaparecido puede significar que el robot Rl no est visi-
ble, o bien que, realmente, ha sido destruido. Para resolver esta ambigedad necesitamos cierto
conocimiento adicional acerca del robot Rl y sobre la situacin en la que se transmite la oracin.
Ambigedad sintctica
Existen oraciones que pueden ser analizadas de distintas formas, es decir, las frases que las cons-
tituyen pueden ser combinadas de varias fonnas distintas. La oracin yo vi a R 1 en la habita-
394
395
cion 37implica,o bienqueelhablanteharealizadounaobservacin,obienqueRIestabaenla
habitacin37(oambas).Eloyentepuederesolverestaambigedadsiemprequeconozcalaloca-
lizacinasociadatantoalhablantecomoaRI (unejemploclsicodeestetipodeambigedades
laoracinvi el Gran Caon volando hacia Nueva York. Enestecaso, sepuededeshacerla
ambigedadutilizandoelsentidocomn,yaquelaspersonaspuedenvolar-enavin-,pero
loscaonesno). Tambinexistencasosenlosquelaambigedadsintcticasedebeaambige-
dadeslxicas;porejemplo,enlaoracinlibre el bloque Ay BYC estn sobre el suelo se
puedeentenderqueunavezqueselibereelbloqueA, losbloquesB yeestarnsobreel suelo,o
queelbloqueA estlibreyelB yeleestnsobreelsuel06
Ambigedad referencial
Lautilizacindepronombresy anforaspuedeprovocarambigedades. Deshacerestetipode
ambigedadesrequieredecomplejosprocesosderazonamiento,tantoporpartedeloyentecomo
del hablante. En laoracin el bloque A esta sobre el bloque By este no esta libre, el
hablanteprobablementeseestarrefiriendoconlapalabraste albloqueA envezdealbloque
B. De estaforma, el hablantepuede asumirqueel oyenteusar su sentidocomnparainferir
-,Libre(B)apartirdelafrase el bloque Aesta sobre el bloque B,conloquededucirque
elpronombreeste enlafrase ste no est libre serefiereal bloqueA (yaquenormalmenteno
setransmiteinformacinredundante).
Ambigedad pragmtica
Elprocesomedianteelcualaplicamosconocimientosobreel contextoyotrasfuentesdecono-
cimientoadicionalesparadeshacerambigedadessedenominaanlisis pragmtico (encontraste
conlosprocesosmediantelosquerealizamoslosanlisissemnticosysintcticos).Sinembargo,
sielconocimientodesentidocomnyelconocimientosobreelcontextoqueposeeeloyenteno
espreciso,inclusounanlisispragmticopuedefallaralresolverlasambigedades.Enlaoracin
R1 esta en la habitacion con R2, el significadodelafrase lahabitacinpuedeserambiguosi
eloyentesabequeR2puedeestar,obienenlahabitacin37,obienenla38,perorealmenteno
sabedndeest.
Procesamiento del lenguaje natural
Elejemploqueacabamosdeutilizarparaun agentequesecomunicaenun mundode bloques
constituye unapequeamuestradeloquerealmente se necesitaraparaque un sistemacom-
prendieralasoracionesemitidas(oescritas)porunapersona.Elcampodelprocesamientodellen-
guajenatural(PLN)esunreamuyextensaenlaqueestninvolucradasdisciplinasdediversa
naturaleza,yquepuedeseraplicadaalatraduccinautomtica,alarecuperacindeinformacin,
alainteraccinhombre-mquinayaldictadoautomtico.Sidispusisemosdeordenadorescon
capacidadeslingsticas, podramosutilizarlos paracomprenderygeneraroraciones en textos
escritosoenconversacionesinteractivas. Pero,elcampodelPLNestanmuylejosdealcanzar
estosobjetivos,aunqueexistenaplicacionescomercialesquepresentan,deformalimitada,algu-
nadeestascapacidades.
6 Enlaversineninglsdel libro, se utilizacomoejemplolafraseclearblockAandBandeareonfloor. En
estecaso,laambigedadestclara,yaquela palabraclearpuedeserutilizadacomoadjetivoycomoverbo.(N. del T.)
ElPLNseencuadradentrodelaclasedeproblemasdenominadoslAduros(anlogaala
clasedeproblemasNPduros).Esdecir,eldesarrollodeunsistemacapazdetratarellenguajeen
lamismaformaenqueloharaunhumano, pasaporlaresolucindelproblemadelalA.El
mayorretoconquenosenfrentaramosseralaresolucindelasambigedadespragmticas,ya
que stas requieren de complejos procesos de razonamiento sobre grandes bases de conoci-
mientode sentidocomn. Porsupuesto, existen otrosretos, comoson laconstruccindedic-
cionarios,gramticasysistemasdeanlisisadecuadosparaelPLN.
Prcticamente,cualquieroracinqueextraigamosdeuntextoounaconversacinpuedeser
usadaparamostrarlosproblemasalosquenostenemosqueenfrentarenelPLN.Veamos,con
un ejemplo, qu necesitara un sistema para la comprensin del lenguaje para analizar una
oracinextradadeunaconversacin(tngaseencuentaqueslotrataremosalgunosdelospro-
blemasquepuedenaparecer).Consideremoslasiguienteconversacinentreunprofesory un
alumno7:
P: Well, 1'11 need to see your printout.
A: I can't unlock the door to the small computer room to get it.
P: Here's the key.
Cmopodraunsistemaartificialanalizarlaoracindelalumno?Enlamayoradesistemas,
elPLNtienelugarenunaseriedepasos.Primero,lasoracionessetraducenalasfrmulaslgi-
cascorrespondientes,deacuerdoaunagramticadefinidaatravsdeunconjuntodereglasde
composicinyundiccionario.Enesteniveldeprocesamientonospodemosencontrar,entreotros,
conlossiguientesproblemas:
Eldiccionariodebecontenerlasracesdelaspalabras,como,porejemplo,lock, juntoasus
distintossignificados.Adems,sedeberanespecificarlasreglasqueindicancmosepue-
denaadirprefijosysufijosalasraces,ycmostosafectanalsignificadodelaraz(an-
lisis moifolgico).
Senecesitanmuchosmselementosalahoradedisearlagramticayelprocesodean-
lisisdelosquehemosconsideradoennuestroejemplodelagramticadelmundodeblo-
ques.Attulodemuestra,obsrvesequeelusodeadverbios,porejemplo, rapidamente,
cambiael significadodelverbo.Deformasimilar,un adjetivo,como,porejemplo,small
(pequeo), puede variarsu significadoenfuncin de lapalabra a laquecualifica. Una
habitacinpequea(small room) puedesermsgrandequeunordenadorgrande(large
computer).
Enelejemplo,lafrasethe small computer room puedesignificarlasalapequeaenla
queestnlosordenadoresolasalaenlaqueestnlosordenadorespequeos. Parapoder
posponerlaresolucindeestaambigedad,elsistematienequesercapazdegenerar,obien
unafrmulalgicaquemantengalaambigedad,obiendosformaslgicasdiferentes.
ElsistemadebesercapazdeencontrarlaentidadalaquehacenreferencialaspalabrasI e
it. Probablemente,lareferenciaI puedeserfcilmenteresueltaporelhablante. Sinembar-
go,enesteniveldeanlisis,lapalabrait puedereferirsealapuerta,lahabitacinoaalgo
(todavanodeterminado)quehasidomencionadoconanterioridad.Aligualqueenel ca,>o
anterior,laresolucindeestaambigedaddeberaserpospuesta.
7 Serespetaelejemplooriginaleningls,yaqueloscomentariosdelautorhacenreferencia aproblemasintrn-
secos alagramticainglesa.(N. del T.)
396
397
Para interpretarla palabracan't,contraccin decannot,serequierequeel sistema sea
capazdeinterpretarlasnegaciones. Enestecasoconcreto,el sistematambindebeteneren
cuentaque canpuedesignificarcapacidadfsicaparahaceralgooque setienepermiso
parahacerlo.
Unavezquesehanobtenidolascorrespondientesfrmulas lgicas,el sistemapuedeinten-
tarresolveralgunas de las ambigedades encontradas consultando el conocimiento que tiene
sobreelentorno. Enestasituacin,podemosdeducirque it debereferirse a algoque yaseha
dichoanteriormente,yaqueespocoprobablequeelhablanteestintentandotogelunapuer-
taounahabitacin.Adems,tambinsepuedeconcluirquecan,probablemente,indiquecapa-
cidadfsicaparahaceralgo,yaqueparaabrirunapuertasenecesitaunallave,queenlamayora
deloscasosnoestdisponible.
Elsistemadebeutilizarconocimientoespecficodelentornoparainterpretarlafrasesmall
computer room.Supongamos que el sistemasabeque todas las salas deordenadorestienen
ordenadorespequeos,yquesolamenteunadeesassalasesunasalapequea,porejemplo,la
sala246. Portanto,lafrasesmallcomputerroomdebehacerreferenciaalasala246.
Paralaltimafasedelanlisisdeestaoracinsenecesitaconocimientoacercadetodalacon-
versacinylacapacidadpararazonarsobrelasintencionesdelhablante.Sabemosqueelprofe-
sorestpidiendoun listado, conloquelapalabraitdebehacerreferenciaa dicholistado. Sin
embargo,elprocesoderazonamientoquenosllevaaestaconclusinesmuchomscomplejoque
estasimpleafirmacin.Lapeticindeunlistadoporpartedelprofesordefmeunobjetivoparael
alumnoysesuponequeelalumnoconstruirunplanparaalcanzardichoobjetivo.Obviamente,
elalumnosedacuentaquenopuedeconstruirdichoplan,yaquenotienelallavequeabrelasala
dondeseencuentrael listado.Elalumnocomunicaestehechoalprofesormedianteunaoracin
enlaqueexplicalaraznporlaquenopuedeconstruirelplan,oracinqueelsistemadebera
interpretar de esta manera. Concretamente, el sistema necesita sabersi dicha oracin es un
intentodenegociaruncambiodelobjetivo(<<no insistamsenqueletraigaellistado,yaqueno
tengolanavedelasalay, probablemente,usted(elprofesor)nolonecesite)o,indirectamente,
seestpidiendolallave(queel alumnosabequetieneelprofesor)para,deestaforma, comple-
tarelplanquelepermitaalcanzarelobjetivo.Estapeticinindirectatambinincluyelaraznpor
laquelallaveesnecesaria-raznporlaqueelestudianteintentarpersuadiral profesorpara
queleproporcionelallave.
Losmtodosquepermitenllevaracaboestetipoderazonamiento,yrepresentarelconoci-
mientonecesario,todavasonobjetodeinvestigacinenelcampodelalA. Comopodemosver,
eldiseoylaconstruccindeunordenadorquecomprendaunaconversacin,delaformaque
hemosexplicadoenelejemplo,esunproblemadelAduro.Elproblemasepuedecomplicartoda-
vamssitenemosencuentaque,probablemente,estasdificultades,inherentesalacomprensin
del lenguaje, pueden combinarseconunprocesodetiporeactivo. Porejemplo,el alumnodel
ejemplopodrahaberdichosimplementekey?,envezdelaoracinqueutiliz,queerams
larga.Aestaoracin,elprofesorpodrahaberrespondidoentregndolelallavecorrespondiente
--comopodemosapreciar,elanlisisrequeridohubierasidomnimo--.Sinembargo,estetipode
respuestaimplicaunprocesodedecisin,porpartedelprofesor,paradecidirqullaveeslaque
tienequeentregar,ynoquedaclarosiestetipodedecisinesel resultadodeunprocesoreacti-
vodependientedelcontexto,orequieredeunprocesoderazonamientomscomplejo.
Elprocesamientodellenguajenatural,incluyendolageneracinycomprensindetextosyel
habla, esuncampoquesesolapaydependedeciertasreasdelalA,peroquehadesarrollado
mtodosytcnicaspropias,delasqueenestecaptuloslohemosrepasadomuysomeramente
unapequeaparte.Aquelloslectoresquequieranprofundizarmsenestareapuedenempezar
con [Russell y Norvig, 1995, Caps. 22 y 23] Y[Allen, 1995; Gras; SparckJones, y Webber,
1986] (tambinesrecomendableleerelnmeroespecialsobre PLNque aparecienlarevista
Artificiallntelligence, vol. 63,nms. 1-2,octubre, 1993).
En[Cohen yPeTault, 1979], sedescribecmosepuedenutilizarlas tcnicasdeplanificacin
propiasdelalAparaplanificaractosdelhabla.Paraqueelactodelhablaprovoquesuefectoper-
locutivo(esdecir,elefectoqueintentaprovocarelhablante),eloyentedebe,enlamayoradelos
casos,intuirelplanqueestsiguiendoelhablantemediantelaobservacindelasaccionesque
esteltimodesarrolla.En[Kautz, 1991],seanalizaesteproblemaysepresentaunateoraformal
paraelreconocimientodeplanes,juntoconsuimplementacin.
Lasbasestericasparaladescripcinyanlisisdellenguajesedebena[Chornsky, 1965].La
formaenlaquehemosabordadolosprocesosdeanlisissemnticoysintcticoestbasadaenlas
gramticasdeclusulasdefinidas[PereirayWarren, 1980].Existenotrosformalismosparatra-
tarlasgramticas,como,porejemplo,lasredesdetransicinaumentadas(RTA) [Woods, 1970].
En [Grosz et al., 1987], se presentaun ejemplodelagramticapara lalenguainglesaimple-
mentadaenelsistemaTEAM delaempresaSR!Intemational.
En[Magerman,1993],sepresentanunaseriedemtodosestadsticosparaelaprendizajede
lasgramticas,yen [Chamiak, 1993]segeneralizaelconceptodegramticaasociandoproba-
bilidadesalasreglas.
En[Grosz;SparckJones,yWebber, 1986]y [WaibelyLee, 1990],sepresentaunaseriede
artCulos importantessobreelprocesamientodellenguajenaturalysobreelreconocimientodel
habla,respectivamente.
Apartedelastcnicasbasadasenlacompresindellenguaje,sepuedenutilizarmtodosde
comparacinbasadosenlasfrecuenciasdeaparicindelaspalabrasdeuntextoparaclasificar-
lodeacuerdoasucontenido[Masand;Linoff,yWaltz, 1992,yStanfillyWaltz, 1986].
24.1. Planteeunasituacinenlaquefuesetil, paraundeterminadoagente,iniciarunactode
hablasabiendoqueelcontenidoproposicionaldelmismoesfalso.
24.2. UtilicelagramticadelaTabla24.2(lagramticaextendida)paraanalizarsemnticamente
lasiguienteoracin:
bloqueBestasobresueloy bloqueBestasobree
24.3. ModifiquelagramticadelaTabla24.2incluyendolapalabranoparaquepuedaserusa-
dajuntoconadjetivos(como,porejemplo, nolibre)ojuntoconpreposiciones(nosobre).
24.4. Comentebrevemente(unoodosprrafos)lasprincipalessimilitudesentrelacomprensin
dellenguajenaturalyelanlisisdeescenas.
24.5. SupongamosqueelrobotA utilizalasemnticayel vocabulariodelaTabla24.2.Comen-
tecmoelrobotA puedecolocarlosbloquesyexpliquelasituacindetal formaqueunsegun-
dorobot,elrobotB, pudierainducirlagramticacorrecta(sepuedeempezarporconsiderarque
elrobotA estapuntandoalbloqueB y, simultneamente,dice B) Qusuposicionestenemos
quehacersobrelascapacidadesdelrobotB?
Arquitecturas
de agentes
A lo largo de este libro hemos presentado el rea de la Inteligencia Artificial desde un enfoque
centrado en el concepto de agente. Tambin hemos resaltado el hecho de que las tecnologas usa-
das para la construccin de agentes inteligentes se pueden utilizar en otro tipo de aplicaciones,
como son la clasificacin y el anlisis de imgenes, los sistemas expertos, la planificacin y la
programacin temporal, y los sistemas para el procesamiento del lenguaje natural, entre otras. A
menudo, hemos asumido que los agentes que estbamos analizando eran robots, pero muchas de
las ideas que hemos expuesto tambin pueden ser aplicadas a agentes no fsicos. En este ltimo
captulo, trataremos de analizar cmo se pueden integrar algunas de las tcnicas de la lA en las
arquitecturas especficas para agentes inteligentes.
Antes de todo, nos debemos preguntar podemos hablar de una arquitectura de agentes
inteligentes de forma general? Al igual que existen millones de especies animales, cada una de
ellas habitando en su propio nicho, podemos esperar que existan muchas especies de agentes
inteligentes --cada uno de ellos desarrollando las tareas para las que ha sido creado-. La
estructura concreta de estas arquitecturas depender de las tareas y del entorno donde stas se
desarrollen. Por ejemplo, algunos agentes tendrn que trabajar en situaciones en las que el tiem-
po es un factor muy importante y las reacciones a un entorno cambiante e impredecible deben ser
rpidas e inequvocas. Sin embargo, otros agentes dispondrn del tiempo y del conocimiento sufi-
cientes para poder predecir los efectos de sus futuras acciones, con lo que se podrn tomar
decisiones ms racionales.
Por supuesto, algunos agentes sern ms complejos e inteligentes que otros. Por tanto, cen-
traremos nuestro anlisis en aquellos agentes que requieren todas las tcnicas analizadas en
este libro: reactividad, estructuras de memoria icnicas o basadas en caractersticas, tcnicas de
bsqueda, razonamiento, planificacin y comunicacin. Podremos encontrar una arquitectura
ideal que dote a un agente de una inteligencia similar a la de los seres humanos? Probablemente
no, ya que incluso los humanos nacen o son de muy diferentes maneras. Algunos piensan
mediante imgenes, otros mediante smbolos o sonidos; algunos son impetuosos, otros son ms
deliberativos; algunos se centran en los detalles, otros en aspectos ms generales; algunos se
adaptan fcilmente a nuevas situaciones, mientras que otros son menos flexibles, etc. Aunque
399
401
Sensoresde
proximidad
ytctiles
Sealessensoriales
deplanes
rdenesparalosmotores
T
"\,."
Inteligenciaartificial. Unanuevasntesis 400
.
~
,
}
nuestramasapensanteseabastanteparecida,probablementenuestrasestructurascognitivasson
bastantediferentes.
Asumiendo que probablementeno existaunanica arquitectura ideal para agentes inteli-
gentes, analizaremosenestecaptuloalgunasarquitecturas quehanservidodereferenciapara
estudiosposteriores,yquecreemossonunclaroexponentedelamplioabanicodeposibilidades
alquenosenfrentamos.Sinembargo,hemosdetenerpresentequesehanpropuestoyutilizado
otrasarquitecturasdiferentes.
Arquitectura de tres niveles
ElrobotShakey[Nilsson, 1984b]esunodelosprimerossistemasintegradosalosquepodemos
considerarcomounagenteinteligente,constituidoporunaseriedeprogramasconsuhardware
correspondiente.EnShakey,seimplementarongran partedelastcnicascomentadasenestelibro
-aunqueenversionesmsprimitivasquelasquehemosanalizadoaqu-oElhardwaredeSha-
keyestabaformadoporunpequeovehculo,cuyotamaoaproximadoeraeldeunpequeofri-
gorfico, alqueseleaadieronunaseriedesensoresdecontacto,unacmaradetelevisinyun
dispositivo de barridoptico-todoello controlado porunordenadormediante un enlace de
radiobidireccional (Fig. 25.1)--. Shakeyeracapazdemoverseenun entornoconstituidopor
varias habitaciones conectadas mediante unaseriede puertas, y enlas que sepodancolocar
variascajasdeformaaleatoria,cajasqueShakeypodacambiardesitio.Entrelosprogramasde
quedisponaShakey,estabanaquellosencargadosdelanlisisdeescenas(quehacanposibleque
Figura25.1.
ElrobotShakey.
Arquitecturasdeagentes
elrobotpudierareconocerescenas,puertasycajas),delaplanificacin(usandoSTAIPS) ylos
quepermitanconvertirlos planesenaccionesdenivelintermedio,o debajonivel, aplicables
sobreelentorno.EnlaFigura25.2sepuedeverdeformaesquemticalaarquitecturadeShakey.
Eldiseode Shakey puede serconsideradocomounodelosprimerosejemplosdeloque
posteriormente se denomin arquitectura de tres niveles. Cada nivel se corresponde con una
forma distintadeconectarlas seales sensorialesconlas acciones motoras. EnlaFigura25.2
hemosmarcadolosdiferentesnivelesdelasiguienteforma: elnivelinferiormedianteflechasgri-
ses,elnivelintermedioconflechas grisesdiscontinuas yelnivelsuperiorconflechas oscuras.
ComopodemosverenlaFigura25.2,elnivelinferiordefineunaconexindirectayrpidaentre
lasentradassensorialesylosefectoresatravsdelaaplicacindeaccionesdebajonivel(ABN).
Losprincipalesmecanismosreflejossegestionanenestenivel-accionescomostop(parar)
cuando los sensores detectan la proximidad de un objeto--. El nivel inferiortambin es el
encargadodelcontroldelosmotoresparaalcanzarunconjuntodepuntosquepermitanladetec-
cindeesquinasdeobjetos.
Enel nivelintermedio,secombinanlasABNenpautasdecomportamientomscomplejas,
cuyaaplicacindependedelasituacindelentorno(talycomoespercibidaymodelada)enel
momentodesuaplicacin.Unejemplodeaccindenivelintermedio(ANI)es gothrudoor
(atravesarpuerta)-rutinaquehacequeShakeyatravieseunadeterminadapuerta-oEstains-
truccin implicalaejecucindelasABN roll- forward(moverse haciadelante) y turn
(girar),ejecucinqueesdirigidaporlosdatosaportadosporlossensoresdecontactoylainfor-
macinproporcionadaporelmodelointerno.EstaoperacinfinalizacuandoShakeyhaatrave-
sadodichapuerta. Lamaneraenlaque ShakeycodificalasANIesmuyparecidaalaquepre-
sentamosenelCaptulo2,cuandoseanalizaronlosprogramasT-R.
IEjecutorI
Figura25.2.
ArquitecturadeShakey.
402
403
El nivel ms alto se corresponde con un planificador STRIPS. En este nivel, el sistema encar-
gado de la ejecucin de los planes recibe como entrada un objetivo, expresado mediante una fbf
del clculo de predicados, y supervisa la elaboracin del plan mediante el procedimiento STRIPS.
El plan generado est constituido por un conjunto de ANI que, junto con sus precondiciones y
efectos, se representa mediante una tabla triangular. La tabla triangular se ejecuta de la misma for-
ma que los programas T-R. Adems, estos planes en forma de tabla son almacenados para su uso
posterior (una vez que hayan sido convenientemente generalizados, tal y como explicamos en el
Captulo 22).
Esta arquitectura de tres niveles ha sido utilizada recientemente en otros sistemas robticos.
En la mayora de los casos, es necesario incluir en el nivel inferior algn mecanismo de servo-
control de las acciones de bajo nivel. Para los niveles intermedio y superior, se han propuesto
diferentes subsistemas de lA, que van desde las arquitecturas de pizarras hasta las redes de cre-
encia bayesianas dinmicas, la lgica difusa o los planificadores de planes parciales. En [ConnelI,
1992], se puede analizar un ejemplo tpico de esta arquitectura.
Evaluacin y seleccin de objetivos
La arquitectura de tres niveles que acabamos de presentar slo es una de las posibles soluciones
al problema de combinar la capacidad de reaccionar rpidamente a los cambios del entorno con
la capacidad de planificar las secuencia de acciones necesarias para alcanzar objetivos complejos.
En la mayora de las arquitecturas de agentes, las acciones reflejas tienen preferencia sobre los
procesos de planificacin. La necesidad de acciones reflejas es un ejemplo del caso general en el
que un agente necesita atender simultneamente a varios objetivos (que en algunos casos pueden
ser contradictorios). En situaciones normales, un agente estar intentando atender a varios obje-
tivos a la vez. Algunos de estos objetivos sern definidos por los propios usuarios (junto con su
prioridad) y algunos se correspondern con acciones predefinidas de antemano e implementadas
directamente en la arquitectura (objetivos de seguridad, mantenimiento automtico, recarga,
etctera). Cada uno de los objetivos activos en un determinado instante tiene asociada una
urgencia que depende de la prioridad intrnseca del objetivo en dicho instante y del coste rela-
tivo necesario para alcanzar dicho objetivo a partir de la situacin actual l. Algunos de los obje-
tivos pueden ser alcanzados aplicando rutinas de bajo nivel o ANI previamente almacenadas,
mientras que otros requerirn un proceso de planificacin. Aunque la urgencia de cada uno de los
objetivos puede cambiar a medida que el agente vaya actuando y se encuentre en nuevas, y en
algunos casos inesperadas, situaciones, la arquitectura tiene que ser capaz de gestionar la eva-
luacin y seleccin de objetivos.
En [Benson y Nilsson, 1995], se propone una arquitectura que integra capacidades reactivas,
de aprendizaje y de planificacin. En la Figura 25.3 se presentan los aspectos de dicha arquitectura
relacionados con la evaluacin y seleccin de objetivos. El Ejecutor recibe los objetivos, junto con
sus prioridades, que permanecern activos hasta que el usuario decida anularlos. El sistema utiliza
una librera de planes en la que se encuentran una serie de ANI, almacenadas como programas
T-R, que sirven para alcanzar objetivos especficos. Si alguno de los objetivos activos puede
ser alcanzado por alguno de los programas T-R de la librera de planes, la ANI correspondiente
queda activada. Aquellos objetivos que no puedan ser alcanzados por ninguno de los programas
T-R almacenados en la librera de planes, son entregados al Planificador para que ste genere un
nuevo programa T-R -bien extendiendo alguno de los existentes, o bien creando uno completa-
La gestin de las prioridades y los costes se puede llevar a cabo mediante un esquema de recompensas parecido
al discutido en el Captulo 10.
Arquitecturas de agentes
Objetivos
Ejecutor
Generalizador

de planes
[:ModelOS ILibrera de planes I
I I
ANI activas
rbitro

[ir"' J
Seales sensoriales rdenes a los motores
Figura 25.3.
Ejemplo de arquitectura que combina la planificacion y la reactividad.
mente nuevo--. Cada vez que el planificador genere un nuevo programa T-R, se activar su ANI
asociada. Los objetivos permanentes, que estn integrados en la arquitectura, pueden lograrse
mediante programas T-R previamente almacenados en la librera de planes, cuyas ANI asociadas
estn siempre activas.
El agente slo ejecutar aquellas acciones que sean invocadas por alguna de las ANI activas.
La seleccin del programa T-R que controlar el funcionamiento del agente en un momento deter-
minado recae en el Selector. La seleccin se realiza de acuerdo con la evaluacin de costes y
beneficios en la que se tiene en cuenta la prioridad del objetivo y una estimacin del coste para
alcanzarlo (para un anlisis ms detallado, vase [Benson y Nilsson, 1995]). Las acciones encar-
gadas del mantenimiento de la seguridad y de evitar situaciones peligrosas tienen asignada la
prioridad ms alta; por tanto, sern seleccionadas en aquellas situaciones que requieran la eje-
cucin de acciones reflejas. El selector y el planificador trabajan concurrentemente, permitiendo
de esta forma que el agente pueda actuar (si es necesario) al mismo tiempo que va construyendo
los planes. Con este tipo de arquitectura, puede ocurrir que aparezcan situaciones en las que se
prefieran objetivos con prioridad baja, debido a que su coste estimado puede ser menor que el de
los objetivos con mayor prioridad
2
Arquitectura de tres mdulos

En la arquitectura de tres mdulos, los niveles superiores utilizan predicados perceptuales ms
abstractos que los utilizados por los niveles inferiores. Mientras que las acciones reflejas son
2 Esta arquitectura tambin es apropiada para aprender nuevas acciones (que pueden se utilizadas por el planifi-
cador). Para una descripcin ms detallada del mdulo de aprendizaje se puede examinar [Benson, 1997J.
404
405
Mdu]ode Mdulo
percepcin deaccin
Sealessensoriales rdenesalosmotores
Figura25.4.
Arquitecturadetres ndulos.
invocadasporlassealessensorialesprimitivas,lacoordinacindelasaccionesdelos niveles
superioresrequiereunprocesamientoperceptualmselaborado. [Albus, 1991]propusolautili-
zacindeunaarquitecturadejerarquaso mdulosparacombinarelprocesamientoperceptual
conlasacciones debajonivel. Elmduloencargadodelprocesamientoperceptualrecogelas
sealessensorialesylasvatransformando,hacindolaspasarpordistintosniveles,haciarepre-
sentacionesmsabstractasyrefinadas.Elmdulodeaccinesel encargadodedefinirsecuen-
cias,cadavezmscomplejas,deaccionesprimitivas.Ambosmdulos,eldepercepcinyelde
accin,sepuedenconectaracualquierniveldelajerarqua.Lasconexionesenlosnivelesms
bajos secorrespondenconlos actosreflejos, mientras quelas conexionesenlosms altos se
correspondenconaccionesmscomplejas,evocadasporpredicadosperceptualesespecializados
endichasacciones.
Paratenerencuentaelhechode quelos agentes necesitanunarepresentacininternadel
entornoquelesrodea,sugerimoslaintroduccindeuntercermduloencargadodegestionarlos
distintosmodelos(Fig.25.4).Elresultadodelapercepcinsensorial,quepermitealagenteobte-
nerunarepresentacindelentorno,sealmacenaenunajerarquademodelos,enlaquecadanivel
contiene lainformacin requerida, tanto porlos procesos de planificacin, como porlos de
evocacindeaccionesquepuedenocurrirendichonivel.Porejemplo,enlosnivelesintermedios
podranexistirmodelosquepermitieranelclculodetrayectorias(como,porejemplo,funciones
depotencialoespaciosdeestadostopolgicos). Sinembargo,enlosnivelesmsaltos,encarga-
dosdelosprocesosderazonamientolgico,delaplanificacinydelacomunicacin,sereque-
rirnrepresentacionesmsdeclarativas,como,porejemplo,aquellasbasadasenlalgicaoenlas
redessemnticas.
Aunquelaarquitecturadetresmdulosqueacabamosdepresentarpuedaresultarintuitiva,
sloes unaaproximacininicialquerequiere un trabajoadicionalparasurefinamiento. Para
poderavanzarmsenestasideasesnecesarioprofundizarenaspectosrelacionadosconlainte-
gracindelas tcnicasdelA(comolasdescritasenestelibro)enlosagentesconcapacidades
perceptualesyefectoras.
Introspeccin y evolucin
Indudablemente,paraquelalApuedaalcanzarunnivelparecidoaldelainteligenciahumana,se
requieren tcnicas perceptuales y repositorios de acciones muchoms avanzadosque losque
'I
1
.
Arquitecturasdeagentes
actualmenteseimplementanenlosrobotsylosagentes.Elproblemamsimportanteconelque
nosenfrentamoseslaadquisicinyrepresentacindelconocimientodesentidocomnquesetie-
nequeimplementarenlosnivelesmsaltosdelmduloencargadodegestionarlosmodelos.La
mayoradelosinvestigadoresenlAestndeacuerdoenque,paraqueunagentepuedadesarro-
llartareasrutinarias,quenospuedenparecerbastantesimplesa loshumanos, primeroesnece-
sariocodificarel conocimientorelacionadoconel sentidocomn. Actualmente, un grupode
investigadoresenlAsehaunidoenel proyectoCYC, queestcentradoenlacodificacindel
conocimientoqueelloscreenqueesnecesario.YaenlosalboresdelalA,muchosinvestigadores
creanqueestetipodeconocimientopodaseradquiridofcilmentemedianteprogramasque
permitanunaprendizajeautomtico,sistemasautoorganizativos,simulacindelprocesoevolu-
tivo,oporalgunatcnicadeestandole.Estaideasiguepresenteenlosinvestigadoresdelpro-
yectoCYC,yaqueconsideranquecuandoelproyectoalcanceundeterminadonivel,elsistema
sercapazdeaprendermsconocimientoporsmismo-leyendotextos,conversandoconlas
personaso siendoenseado--.Enestesentido,hayquetenerencuentaqueloshumanosapren-
denmsconocimientodelquenecesitangraciasalaintrospeccin,partiendodelconocimiento
previamenteadquirido-primerocuandosonnios,demanerainconsciente,ydespus,siguien-
dolasdistintasetapasdePiaget,a partirdelosconceptosy habilidadesadquiridas. Cuandose
conviertenenadultos,elaprendizajeserealizaatravsdelaprctica,lalecturaylacomunica-
cin-.Enestemomento,creemosquelacantidaddeconocimientoquerequiereunagentepara
mostrarunainteligenciaparecidaalahumanaestangrande,quesernecesarioalgnproceso
evolutivoquetodavaestpordescubrir.Probablemente,esteprocesonecesitartcnicaspare-
cidasa algunosdelosprocedimientosparael aprendizajeautomticoque hemosanalizadoen
varioscaptulosdeestelibro.Esteanlisisnosllevaalaconclusindequedebemosencontrarla
maneradequeunagentepuedeaadir,porsmismo,msnivelesalosdistintosmdulos,unavez
quesusdiseadoreshayanesbozadosusnivelesinferiores.
[Whitehead;Karlsson,yTenenberg, 1993]handesarrolladounsistemacapazdeaprendercmo
alcanzarunaseriedeobjetivos,deevaluarlosydeseleccionarloscuandomsdeunoestactivo.
StanRosenscheinsueleutilizarlaexpresinbloques,bloques,todoloquetenemossonblo-
quesparareferirseal hechodelagran cantidaddediagramasdebloquesquehansidoutilizados
paradefinirlasarquitecturasdelosagentes.Apartedelosesquemasarquitectnicospresentados
enestecaptulo,existenotrasaproximaciones,entrelasquepodemoscitar(teniendoencuenta
queprobablementeomitamosalgunaotra): [Lairdet al., 1991;Hayes-Roth,1995;Gat, 1992;Wil-
kins,et al., 1995;Bates,Loyall,yRei11y, 1992,yFirbyy Kahn, 1995].
Eneldiseodetodasestasarquitecturassehaplanteadoelmismointerroganteentomoala
cuestindesiesmejorrefinarlosplanesoaplicardirectamenteelplanquesetieneentremanos
(quepuedeserunplanconstruidoyrefinadoensituacionesenlasqueeltiempoderespuestano
eracrtico,como,porejemplo,enlafasedediseo).Comoyahemosindicadoenvariaspartesde
estelibro,paratomarestetipodedecisionessepuedenutilizararquitecturasdemetanivel(des-
critas,porejemplo,por[RusselyWefald, 1991,Cap.2]).Encualquiercaso,loscompromisosque
debemosadoptarentreloscostescomputacionalesdetiempoyespaciosondetalnaturalezaque
hacenquelamayorpartedelasaccionesquepuededesarrollarunagenteseanreactivas,limitando
laplanificacinyelaprendizajeasituacionesquebordeanloqueelagenteyasaberesolver.
Enestelibrohemosintentadocubrir,enlamedidadeloposible,lamayoradelastcnicasde
lAconocidashastalafecha, yquecreemossernnecesariasparallevarlalAhastaelniveldela
inteligencia humana. Como podemos apreciar, es un conjunto bastante amplio, pero todava
.
406 InteligenciaartificiaLUnanuevasntesis
tienequecrecerms antesde alcanzarnuestroobjetivo. Seguiremosrecogiendoideasdeotras
disciplinas, como,porejemplo, lapsicologa,la neurofisiologa, elcontrolautomtico,elpro-
cesamientodesealesylaeconoma,ademsdel campodelascienciasdelacomputacin,enla
medidaquestavayaprogresando.Elconsejoquedamosaaquelloslectoresquequieranunirse
aestaodiseaesquesean eclcticos,imaginativosyhumildes alahoradeenfrentarse al vaco
existenteentrelasmodestascapacidadesquepresentanlosactualessistemasbasadosenlalAy
laextremadacomplejidaddelainteligenciaanimalyhumana. Sinembargo,nuestrahumildadno
deberaatenuarnuestrosobjetivos,ni minarnuestroatrevimiento.
25.1. Enunodesuslibros,Asimovdefinilassiguientesreglasdeobligadocumplimientopor
losrobots:
1. Un robotno debe producirdao a un serhumano, ni permitirque un serhumano sea
daadopordejadez.
2. Un robot debe obedecer las rdenes dictadas por los seres humanos, excepto en los
casosenquestasentrenencontradiccinconlaprimeraregla.
3. Unrobotdebepreservarsupropiaexistencia,siempreycuandoestareglanoentreencon-
flictoconlasdosreglas anteriores.
Describa las dificultades con las que nos podemos encontrar si decidimos implementar
estasreglas enlos agentes autnomos-tantoagentes fsicos comoagentes software-oQu
capacidadesdelAdebernpresentarestosagentes?
25.2. DiscutasilastcnicasdelA,elmarcoconceptualylateoradelasquedisponemosenla
actualidad,yquehansidopresentadasenestelibro,sonadecuadasparasentarlasbasessobrelas
queconstruirmaquinas alasquerealmentepodamosllamarinteligentesPorqu?Encasode
queconsidereque elestadoactual de lalAnoes suficiente,respondarazonadamenteaunade
estaspreguntas,comomnimo:
1. Esnecesariounaumentosustancialdenuevasteorase ideas?Siesasenqureas?
2. Necesitamossolamenteordenadoresmsgrandesyrpidos(yquizdotadosdemayores
capacidadesdeparalelismo)?
3. La investigacin en lAha seguido caminos inadecuados, y, por tanto, se requieren
caminoscompletamentenuevos?Sies as,haciadndedebendirigirsusesfuerzoslos
investigadoresenlA?
4. ResultaninalcanzableslosobjetivosalargoplazodelalA?
25.3. UnavezqueyahaexaminadogranpartedelasprincipalesideasenelcampodelaIA,est
endisposicindevolveralCaptulo] yrealizarel Ejercicio1.5,comentandolaconvenienciay
lasperspectivasdelalAduraylalAdbil(noexisteunarespuestacorrecta, aunquesepueden
argumentaralgunasbuenasrespuestas).
1. Lagestindelasprioridadesyloscostessepuedellevaracabomedianteunesquemade
recompensasparecidoaldiscutidoenelCaptulo 10.
2. Estaarquitecturatambinesapropiadaparaaprendernuevasacciones(quepuedenseruti-
lizadasporel planificador).Paraunadescripcinmsdetalladadel mdulodeaprendizaje
sepuedeexaminar[Benson, 1997].
Bibliografa
[Abramson, yYung, 1989]Abramson,B.,YYung,M., DivideanConquerunderGlobalConstraints:A
Solution to the N-Queens Problem, Journal of Parallel and Distributed Computing, 6:649-662,
1989.
[Agre,yChapman,1987] AgreP., yChapman,D., Pengi:AnImplementationofaTheoryofActivity,
Proceedings of the Sixth National Conference on Artificial Intelligence (AAAI-87), pp. 268-272,
MenloPark,CA:AAAIPress, 1987.
[Agre,yChapman,1990)AgreP., yChapman,D., WhatArePlansFor?Robotics andAutonomous Sys-
tems, 6:17-34,1990.Tambinen[Maes, 1990a].
[Albus, 1991]Albus,J. S., OutlineforaTheoryofIntelligence,IEEE Systems, Man and Cybernetics,
21(3):473-509,mayo/junio, 1991.
[Allen, 1983]Allen1., MaintainingKnowledgeaboutTemporalIntervals,Communications ofthe ACM,
26(11):832-843, 1983.(ReimpresoporWeld,D.,ydeKleer,J. (eds.),Readings in Qualitative Reaso-
ning about Physical Systems, SanFrancisco:MorganKaufmann, 1990).
[Allen, 1984]Allen,J.,Towardsa GeneralTheoryofActionandTime,Artificiallntelligence, 23:123-
154, 1984.
[Allen, 1991a]AllenJ., TimeandTimeAgain:TheManyWaystoRepresentTime,International Jour-
nal of Intelligent Systems, 6:341-355, 1991.
[Allen, 1991b] Allen J., Temporal Reasoning and Planning, de Allen, J.; Kautz, H.; Pelavin, R., Y
Tenenberg,J.(eds.),Reasoning About Plans, Cap. 1, SanFrancisco:MorganKaufmann, 1991.
[ABen, 1995]Allen,J.,Natural Language Understanding, MenloPark,CA:BenjaminlCummings,1995.
[Allenet al., 1990)ABenJ; Hendler,J., YTate,A. (eds.), Readings in Planning, SanFrancisco:Morgan
Kaufmann, 1990.
[Almeda 1987] Almeida L. B., ALearning Rule for Asynchronous Perceptrons with Feedback in a
CombinatorialEnvironment,deM.CaudillyC.Butler(eds.),IEEE First lnternational Conference on
Neural Networks, SanDiego, 1987,vol. 1, pp.609-618,NewYork: IEEE, 1987.
[Aloimonos, 1993]A10imonos,Y. (ed.),Active Perception, Hillsdale,NJ:LawerenceErlbaumAssociates,
1995.
[Anderson, yDonath, 1990]Anderson,T., y Donath, M., Animal Behavioras a Paradigmfor Develo-
ping RobotAutonomy, Robotics and Autonomous Systems, 6:145-168, 1990. Tambinen [Maes,
1990a].
[Andre, 19951Andre,D.,TheAutomaticPrograrnmingofAgensThatLeamMentalModelsandCreate
407
409
408 Bibliografa
Simple Plans of Action, de Proceedings ofthe Fourteenth Intemational Joint Conference on Artificial
Intelligence (IJCAI-95), pp. 741-747, San Francisco: Morgan Kaufmann, 1995.
[Appelt, 1985] Appelt D., Planning English Referring Expressions, Artificial Intelligence, 26(1): 1-33,
] 985. Tambin en Grosz, B.; Jones, K, y Webber, B. (eds.), Readings in Natural Language Processing,
pp. 501-517, San Francisco: Morgan Kaufrnann, 1986.
[Bacchus, y Yang, 1992] Bacchus, F., y Yang, Q., The Expected Value of Hierarchlcal Prob1em-Solving,
de Proceedings of the Tenth National Conference on Artificial Intelligence (AAAI-92), pp 369-374,
Menlo Park, CA: AAAI Press, 1992.
[Baker, 1991] Baker, A., Nonmonotonic Reasoning in the Framework of Situation Ca1cu1us, Artificial
Intelligence, 49:5-23,1991.
[Ballard, 1991] Ballard D. H., Animate Vision, Artificial Intelligence, 48(1):57-86, 1991.
[Ballard, y Brown, 1982] Ballard, D. R, YBrown, C. M., Computer VlSion, Englewood Cliffs, NJ: Prenti-
ce Hall, 1982.
[Barr, y Feigenbaum, 1981] Barr, A,. y Feigenbaum, E. (eds.), The Handbook ofArtificial Intelligence, Volu-
men 1, Reading MA: Addison-Wesley, 1981, (vanse las dos siguientes entradas [Cohen, y Feigen-
baum, 1982] en los otros tres volmenes).
[Barr, y Feigenbaum, 1982] Barr, A., y Feigenbaum, E. (eds.), The Handbook ofArtificial Intelligence, Volu-
me 2, Reading, MA: Addison-Wesley, 1982.
[Barr; Cohen, y Feigenbaum, 1989] Barr, A.; Cohen P. R, YFeigenbaum, E. (eds.), The Handbook ofArti-
ficiallntelligence, Volume 4, Reading, MA: Addison-Wesley, 1989.
[Barto; Bradtke, y Singh, 1995] Barto, A.; Bradtke, S., y Singh, S., Leaming to Act Using Real-Time
Dynarnic Prograrnming, Artificial Intelligence, 72(1,2): 81-13 8 enero, 1995.
[Barwise, y Etchemendy, 1993] Barwise, l, y Etchemendy, J., The Language of First-Order Logic: Inclu-
ding the Macintosh Program Tarski's World 4.0, Center for the Study of Language and Information
(CSLI), Stanford, California, (3." ed. corregida y aumentada), 1995.
[Bates, 1994] Bates, J., The Role of Emotion in Believab1e Agents, Communications of the ACM,
37(7):122-125,1994.
[Bates; Loyall, y ReilIy, 1992] Bates, J.; Loyall, A. B., YReilly, W. S., Integrating Reactivity, Goals, and
Emotion in a Broad Agen, Technical Report CMU-CS-92-142, Schooll of Computer Science, Car-
negie Mellon University, Pittsburgh, PA, mayo, 1992. (Tambin en Proceedings of the Fourteenth
Annual Conference ofthe Cognitive Science Society, Bloomington, Indiana, julio, 1992.)
[Bayes, 1763] Bayes, T., An Essay Towards Solving a Problem in the Doctrine of Chances, Phil. Trans.,
3:370-418,1763. Reproducido por Derning, W. (ed.), Two Papers by Bayes, New York: Hafner, 1963.
[Beer, 1995] Beer, R, A Dynamical Systems Perspective on Agent-Environment Interaction, Artificial
Intelligence, 72(1-2):173-215,1995.
[Beer; Chiel, y Sterling, 1990] Beer, R; Chie1, H., y Sterling, L., A Biological Perspective on Autonomous
Agent Design, Robotics andAutonomous Systems, 6:169-186,1990. Tambin en [Maes, 1990a].
[Benson, 1997] Benson, S., Leaming Action Models for Reactive Autonomous Agents, Stanford University
Computer Science Departrnent Ph. D. dissertation, Report nm., STAN-CS-TR-97-1589, Stanford, CA
94305,1997.
[Benson, y Nilsson, 1995] Benson, S., y Nilsson, N., Reacting Planning and Leaming in an Autonomous
Agent, de Furukawa, K.; Michie D., y Muggleton, S. (eds.), Machine Intelligence 14, Oxford: The
Clarendon Press, 1995.
[Berliner, 1979] Berliner H., The B* Tree-Search Algorithm: A Best-First Proof Procedure, Artificial1nte-
llgence, 12(1):23-40, ]979.
[Bhanu, y Lee, 1994] Bhanu, B., y Lee, S., Genetic Leaming for Adaptive Image Segmentation, Boston:
K1uwer Academic Publishers, 1994.
[Binford, 1982] Binford, T. O., Survey of Model-Based Image Analysis Systems, The Intemational Jour-
nal of Robotics Research, 1(1): 18-654, 1982.
[Binford, 1987] Binford, T. O., Generalized Cylinder Representation, en Shapiro, S. C. (ed.), Enciclo-
pedia ofArtificial Intelligence, pp. 321-323, New York: John Wiley & Sons, 1987. (Este artculo est
basado en otro de Binford no publicado titulado Visual Perception by Computer.)
[Bledsoe, 1977] Bledsoe, W., Non-Resolution Theorem Proving, Artificial Intelligence, 9(1): 1-35, 1977.
[Blum, y Furst, 1995] Blum, A., y Furst, M., Fast Planning through P1anning Graph Analysis, de Pro-
Bibliografa
ceedings of the Fourteenth Intemational Joint Conference on Artificiallntelligence (lJCAI-95), pp.
1636-1642, San Francisco: Morgan Kaufmann, 1995.
[Blumberg, 1996] Blumberg, B., Old Tricks, New Dogs: Ethology and lnteractive Creatures, Ph. D. Dis-
sertation, MIT Media Lab., Massachusetts Institute of Techonology, 1996.
[Bobrow, 1968] Bobrow, D., Natural Language Input for a Computer Problem Solvings System, de
Minsky, M. (ed.), Semantic Information Processing, pp. 133-215, Cambridge, MA: MIT Press, 1968.
[Bobrow; Mittal, y Stefik, 1986] Bobrow, D.; Mittal, S., y Stefik, M., Expert Systems: Perils and Promi-
se, Communications ofthe ACM, 29(9):880-894, 1986.
[Bond, y Gasser, 1988] Bond, A., y Gasser, L. (eds.), Readings in Distributed Artificiallntelligence, San
Francisco: Morgan Kaufmann, 1988.
[Boole, 18541 Boole, G., An Investigation of the Laws ofThought on Which Are Founded the Mathemati-
cal Theories of Logic and Probabilities, New York: Dover Publications, 1854.
[Borger, 19891 Borger, E., Computability, Complexity, Logic, Amsterdam: North-Holland, 1989.
[Borgida, et al., 1989] Borgida, A.; Brachman, R; McGuinness, D., y Resnick, A., CLASSIC: A Structural
Data Model for Objects, SIGMOD Record, 18(2):58-67, 1989.
[Boyer, y Moore, 1979] Boyer R, y Moore, J., A Computational Logic, New York: Academic Press, 1979.
[Brachman, y Levesque, 1985] Brachman, R, y Levesque, H. (eds.), Readings in Knowledge Representa-
tion, San Francisco: Morgan Kaufmann, 1985.
[Brachman; Gilbert, y Levesque, 1985] Brachman, R., Gilbert, v., y Levesque, H., An Essential Hybrid
Reasoning System: Knowledge and Symbol Level Accounts of KRYPTON, de Proccedings of the
Ninth International Joint Conference on Artificiallntelligence (lJCAl-85), pp. 532-539, San Francis-
co: Morgan Kaufmann, 1985.
[Brain, et al., 1962] Brain, A. E., et al., Graphical Data Proccessing Research Study and Experimental
Investigation, Report nm. 8 (pp. 9-13) Y nm. 9 (pp. 3-10), Contract DA 36-039 SC-78343, SRI
Intemational, Menlo Park, CA, junio, 1962 y septiembre, 1962.
[Braitenberg, 1984] Braitenberg, V., Vehicles: Experiments in Synthetic Psychology, Cambridge, MA:
MIT Press, 1984.
[Bratko, 1990] Bratko, l., PROWG Programming for Artificiallntelligence, 2." ed. Reading, MA: Addison-
Wesley, 1990.
[Bratko, y Michie, 1980] Bratko l., y Michie, D., An Advice Program for a Complex Chess Prograrnrning
Task, Computer Joumal, 23(4):353-359, 1980.
[Brave, 1996] Brave, S., The Evolution of Memory and Mental Models Using Genetic Prograrnrning, en
Koza, J., et al., (eds.), Genetic Programming 1996: Proceedings ofthe First Annual Conference, pp.
261-266, Stanford University,julio, 28-31,1996, Cambridge, MA: MITPress, 1996.
[Breiman, et al., 1984] Breiman, L.; Friedman, l; Olshen, R, YStone, c., Classification and Regression
Trees, Belmont, CA: Wadsworth, 1984.
[Brewka; Dix, y Konolige, 1997] Brewka, G., Dix, J., y Konolige, K., Nonmonotonic Reasonign: An
Overview, CSLI Lectura Notes, nm. 73, Center for the Study of Language and Information, Stanford,
CA: Stanford University, 1997.
[Brooks, 1981] Brooks, R, Symbolic Reasonng among 3-D Models and 2-D Images, Artificallnteli-
gence, 17:285-348,1981.
[Brooks, 1986] Brooks, R. A., A Robust Layered Control System for a Mobile Robot, IEEE Journal of
Robotics andAutomation, RA-2(l):14-23, marzo, 1986.
[Brooks, 1990] Brooks, R, Elephants Don't Play Chess, Robotics and Autonomous Systems, 6:3-15,
1990. Tambin en [Maes, 1990].
[Brooks, 1991a] Brooks, R A., Intelligence without Representation, Artificiallntelligence, 47(113):139-
159, enero, 1991.
[Brooks, 1991b] Brooks, R A., Intelligence without Reason, de Proceedings ofthe Twelfth 1ntemational
Joint Conference on Artificiallntelligence (lJCAI-9l), pp. 569-595), San Francisco: Morgan Kauf-
mann, 1991.
[Brooks, y Matarlc, 1993] Brooks, R, y Mataric, M., Real Robots, Real Learning Problems, de Connell,
J., y Mahadevan, S. (eds.), Robot Leaming, Cap. 8, Boston: Kluwer Academic Publishers, 1993.
[Brownston, et al., 1985] Brownston, L.; Farrel, R.; Kant, E., y Martin, N., Programming Expert Systems in
OPS5, Reading, MA: Addison-Wesley, 1985.
410
Bibliografa
[Bryson,y Ho, 1969]Bryson,A.,y Ho,Y.-C.,AppliedOptimalControl, NewYork: Blaisdell, 1969.
[Buchanan,yShortliffe, 1984]Buchanan,B.,yShortliffe,E. (eds.),Rule-BasedExpertSystems: TheMYCIN
ExperimentsoftheStanfordHeuristicProgrammingProject,Reading,MA:Addison-Wesley, 1984.
[Bylander, 1993]Bylander,T., AnAverageCaseAnalysis ofPlanning,deproceedingsof theEleventh
NationalConferenceonArtificiallntelligence(AAAI-93), pp.480-485,MenloPark,CA:AAAIPress,
1993.
[Bylander, 1994] Bylander, T., The Computational Complexity ofPropositional STRIPS Planning,
Artificiallntelligence,69(1/2):165-204, 1994.
[Campbell, etal., 1982] Campbell,A. N.; Hollister, v.; Duda,R., y Hart, P., Recognition ofa Hidden
MineralDepositbyanArtificiallntelligenceProgram,Science,217(4563):927-929, 1982.
[Canny, 1986]Canny,1, AComputationalApproachtoEdgeDetection,IEEETrans. onPatternAnaly-
sisandMachineIntelligence, PAMI-8(6):679-698,noviembre, 1986.
[Carbonell,etal., 19921Carbonell,J.;BIythe,J.; Etzioni,O.; Gil,Y.; Kahn,D.; Knoblock,C.;Minton,S.;
Prez.A.;ReilIy, S.;Veloso,M., yWang, X., PRODIGY4.0:TheManualandTutorial,Carnegie-
MellonUniversityComputerScienceTech. ReportCMU-CS-92-1560,Pittsburg,PA, 1992.
[Cassandra;Kae1bling, yLittman, 1994]Cassandra,A.;Kaelbling,L, yLitman,M.,ActingOptimallyin
PartiallyObservableStochasticDomains,deProceedingsofthe TwelfthNationalConferenceonArti-
ficiallntelligence(AAAI-94), pp. 1023-1028,MenloPark,CA:AAAIPress, 1994.
[Chakrabarti; Ghose, y DeSarkar, 1986] Chakrabarti, P.; Ghose, S., y DeSarkar, S., Heuristic Search
throughlslands,Artificiallntelligence,29(3):339-347, 1986.
[Chang,yLee, 1973]Chang,c.-L., yLee,R., SymbolicLogicandMechanicalTheoremProving,Boston:
AcademicPress, 1973.
[Chapman, 1987] Chapman, D., Planning for Conjunctive Goals, Artificiallntelligence, 32(3):333-
377, 1987.
[Chapman, 1989]Chapman,D.,PenguinsCanMakeCake,Al Magazine, 10(4):45-50, 1989.
[Charniak, 1993]Charniak,E., StatisticalLanguageLearning,Cambridge,MA:MITPress, 1993.
[Chauvin, yRumelhart, 1995]Chauvin,Y., y Rumelhart,D.,Backpropagation:Architectures, andAppli-
cations,HillsdaIe, NJ:LawrenceErlbaum, 1995.
[Chen, 1990]Chen,S.,(ed.),Advancesin SpatialReasoning,Norwood,NJ:AblexPublishing, 1990.
[Chomsky, 1965]Chomsky,N.,AspectsoftheTheoryofSyntax,Cambridge,MA:MITPress, 1965.
[Christensen, 1990]Christensen,1, AHierarchicalPlannerThatGeneratesltsOwnHierarchies,dePro-
ceedingsoftheEighthNationalConferenceonArtificiallntelligence(AAAI-90)pp. 1004-1009,Men-
loPark,CA:AAAIPress, 1990.
[Churchland;Ramachandran,ySejnowski, 1994]Churchland,P. S.; Ramachandran,V. S.,YSejnowski,T.
J., ACritiqueofPureVision,deKoch,C.,yDavis,J. (eds.), Large-ScaleNeuronalTheoriesofthe
Brain,pp.23-60,Cambrige,MA:MITPress, 1994.
[Clocksin, yMellish, 1987]Clocksin,w., yMellish,c.,Programming in PROLOG(3."ed.),NewYork:
Springer-Verlag, 1987.
[Clowes, 1971]Clowes,M., OnSeeingThings,Artificiallntelligence,2:79-116, 1971.
[Cohen, y Feigenbaum, 1982] CohenP. R., YFeigenbaum, E. (eds.), The HandbookofArtificiallntelli-
gence, Volume 3,Reading,MA:Addison-Wesley, 1982.
[Cohen,yLevesque, 1990] Cohen,P., y Levesque,H., IntentionIsChoicewithCommitment,Artificial
Intelligence,42(2-3):213-361,1990.
[Cohen, y Perrault, 1979] Cohen, P., y Perrault, C. R., Elements ofa Plan-Based Theory ofSpeech
Acts,CognitiveScience,3;177-212,1979.
[Colmerauer, 1973]Colmerauer,A., etal., UnSystemedeCommunicationHomme-MachineenFran-;ais,
ResearchReport,UniversitAix-Marseillen, Grouped'lntelligenceArtificielle,France, 1973.
[Colmerauer, 1978] Commerauer,A., MetamorphosisGrammars,deBolc,L. (ed.),NaturalLanguage
CommunicationwithComputer,Berln: Springer-Verlag. (Esteartculoesunatraduccinalinglsde
uninformetcnicoenfrancsde1975.)
[Connen, 1990]Connell,1 H., AColonyArchitectureAppliedtoRobotNavigation,TechnicalRepon
1151,MITAlLab.,MITCambridge,MA,junio, 1990.
[Connen, 1990]Connell,J.H., SSS:AHybridArchitectureAppliedtoRobotNavigatioll,deProc. 1992
IEEEInternationalCon!onRoboticsandAutomation.pp.2719-2724,1992.
Bibliografa 411
[Connen,y Mahadevan, 1995a]Connell,J.,y Mahadevan,S.,RapidTaskLearningforRealRobots,de
Connell,J., y Mahadevan, S. (eds.),RobotLearning, Cap. 5,Boston: KluwerAcademic Publishers,
1993.
[Connell,yMahadevan, 1993b]Connell,J.,yMahadevan,S.(eds.),RobotLearning,Boston:KluwerAca-
demicPublishers, 1993.
[Cook, 1971] Cook, S., TheComplexityofTheorem-ProvingProcedures, de Proc. ofthe3rdAnnual
ACMSymposium on Theory ofComputing, pp. 151-158, New York: Association for Computing
Machinery, 1971.
[Cook, 1988]Cook,S., ShortPropositionalFormulasRepresentNondeterministicComputations,Infor-
mationProcessingLetters,26(5):269-270, 1988.
[Cooper, 1990]Cooper,G.,ComputationalComplexityofProbabilisticInferenceUsingBayesianBelief
Networks(ResearchNote)>>, Artificiallntelligence,42(213):393-405, 1990.
[Cooper,yHerskovitz, 1992]Cooper,G.,yHerskovitz,E.,ABayesianMethodfortheInductionofPro-
babilisticNetwoksfromData,Machine Learning,9:309-347,1992.
[Cormen;Leiserson,y Rivest, 1990]Cormen,T.;Leiserson,C.,y Rivest,R.,lntroductiontoAlgorithms,
Cambridge,MA,yNewYork: MITPressy McGraw-Hill, 1990.
fCover, y Thomas, 1991] Cover, T., y Thomas, A., Elements ofInformaton Theory, NewYork; John
Wiley& Sons, 1991.
[Currie,yTate, 1991]Currie,K.,yTate,A.,O-PLAN:TheOpenPlanningArchitecture,Artificiallnte-
lligence,52(1):49-86, 1991.
[Davis, 1990]Davis,E.,RepresentationsofCommonsenseKnowkledge, SanFrancisco:MorganKaufmann,
1990.
[Davis,y Putnam, 1960]Davis,M., y Putnam,H., AComputingProcedureforQuantificationTheory,
Journ. Assoc. ofComp.Mach.,7(3):201-215, 1960.
[Davis, 1980] Davis,R., Meta-Rules:ReasonignaboutControl,Artificiallntelligence, 15(3):179-222,
1980.
[de Kleer, 1986a] de Kleer, J., AnAssumption-Based TMS, Artificiallntelligence, 28(2):127-162,
1986.
[deKleer, 1986b]deKleer,J., ExtendingtheATMS,Artificiallntelligence,28(2):163-196, 1986.
[deKleer, 1986c]deKleer,J., ProblemSolvingwiththeATMS,Artificiallntelligence,28(2):197-224,
1986.
[Dean,y Boddy, 1988]Dean,T., yBoddy,M.,AnAnalysisof Time-DependentPlanning,deProceedings
oftheSeventhNationalConferenceonArtificiallntellgence(AAAI-88),pp.49-54,MenloPark,CA:
AAAIPress, 1988.
[Dean,y Wellman, 1991]Dean,R.,yWellman,M.,PlanningandControl, SanFrancisco:MorganKauf-
mann,199l.
[Dean;Basye,y Kaelbling, 1993]Dean,T.; Basye,K.,yKaelbling,L., UncertaintyinGraph-BasedMap
Larning,deConnell,J.,yMahadevan,S. (eds.),RobotLearning,Cap.7.Boston: KluwerAcademic
Publishers, 1993.
[Dechter, 1996]Dechter,R., BucketElimination:AUnifyingFrameworkforProbabilisticlnference,de
Proceedigns ofthe Twelfth Conference on Uncertainty in Al,pp. 211-219, SanFrancisco: Morgan
Kaufmann, 1996.
[Dempster,1968]Dempster,A,P., AGeneralizationofBayesianInference,Journalof theRoyalStatis-
ticalSociety, SeriesB,30:2095-247, 1968.
[Dempster; Laird, y Rubn, 1977] Dempster, A.; Laird, N., y Rubn, D., Maximum Likelihood from
IncompleteDataviatheEMAlgorithm, JournaloftheRoyalStatisticalSociety, SeriesB,39:1-38,
1977.
[Dennett, 1971]Dennett,D.,IntentionalSystems,The Journalof Philosophy,68(4):87-106, 1971.
[Dennett, 1995]Dennett,D.,DarwinsDangerousIdea, NewYork: Simon& Schuster, 1995.
[Deutsch, 1960] Deutsch, J. A., The StructuralBasis ofBehavior, Chicago: TheUniversity ofChicago
Press, 1960.
[Dietterich, 1990]Dietterich,T., MachineLearning,deTraub,J., etal., (eds.),AnnualReviewofCom-
puterScience,4:255-306, 1990.
[Dietterich,yBakiri, 1991]Dietterich,T., yBakiri,G., Error-CorrectingOutputCodes:AGeneralMethod
412 _____________________________________ , lli_& m
forImprovingMulticlassInductiveLearningPrograms, deProceedingsof theNinthNational Con-
ference onArtificial/ntelligence (AAA/-9/),pp. 572-577,MenloPark,CA:AAAIPress, 1991.
[Dietterich,yBakiri, 1995]DietterichT., yBakiri,G., SolvingMulticlassLearningProblemsviaError-
CorrectingOtuputCodes,JoumalofArtificial/ntelligenceResearch,2:263-286, 1995.
[Dijkstra, 1959]Dijkstra,E., ANoteonTwoProblemsinConnectionwithGraphs,NumerischeMathe-
matik,(1):269-271, 1959.
[Doran,yMichie, 1966]Doran,J., yMichie,D., ExperimentswiththeGraphTraverserProgram,Proc.
RoyalSocietyofLondon,vol. 294(seriesA)pp.235-259, 1966.
[Dowling,yGallier, 1984]Dowling,w., yGallier,1., Linear-TimeAlgorithmsforTestingtheSatisfiabi-
lit yofPropositionalHornFormulas,Joumalof LogicProgramming,(3):267-284, 1984.
[Doyle, 1979] Doyle, J., A Truth Maintenance System, Artificial /ntelligence, 12(3):231-272, 1979.
(ReimpresoporWebber, B., y Nilsson, N. (eds.), ReadingsinArtificial/ntelligence, SanFrancisco:
MorganKaufmann, 1981.)
[Dreyfus, 1979]Dreyfus,H., WhatComputers Can'tDo: The LimitsofArtificial/ntelligence, (edicinrevi-
sada),NewYork: HarperandRow, 1979.
[Dreyfus, 1992]Dreyfus,H., WhatComputersStillCan'tDo:ACritiqueofArtificialReason,Cambridge,
MA:MITPress, 1992.
[Dreyfus,yDreyfus, 1986]Dreyfus,H., yFreyfus, S., MindoverMachine The PowerofHuman /ntutition
andExpertiseinthe EraoftheComputer, (withT Athanasiou),Oxford: Blachwell, 1986.
[Duda; Hart, y Nilsson, 1976]Duda, RO.;Hart, P. E., YNilsson,N., SubjectiveBayesianMethodsfor
Rule-BasedInferenceSystems, Proc. AFIPSNat. ComputerConference, vol. 47:1075-1082, 1976.
(ReimpresoporWebber, B., y Nilsson, N. (eds.), ReadingsinArtificial/ntelligence, SanFrancisco:
MorganKaufmann, 1981).
[Duda;Hart,yStork, 1998]DudaRO.;Hart,P. E.,YStork,D., PattemClassification(2."ed.), NewYork:
JohnWiley& Sons, 1998.
[Duda; Gasching, yHart, 1979]Duda,R;Gaschnig,1., yHart,P., ModelDesinginthePROSPECTOR
ConsultantSystemforMineralExploration, deMichie, D. (ed.), ExpertSystems in theMicroelec-
tronic Age, pp. 153-167, Edinburgh: Edinburgh University Press, 1979. (Reimpresin de Webber,
B., yNilsson,N. (eds.),ReadingsinArtificial/ntelligence, pp. 337Yss., SanFrancisco:MorganKauf-
mann, 1981.)
[Dym, y Levitt, 1991] Dym, C., y Levitt, R., Knowledge-Based Systems in Engineering, New York:
McGraw-Hill, 1991.
[Elkan, 1992]Elkan, c., Reasoning aboutAction in First-OrderLogic, de Proc. oftheNihth Biennial
ConfoftheCanadianSocietyforComputationalStudiesof /ntelligence, pp. 221-227,SanFrancisco:
MorganKaufmann, 1992.
[Elkan, 1995] Elkan, C., The Paradoxical Success ofFuzzy Logic, de Proceedings ofthe Eleventh
NationalConferenceonArtificial/ntelligence (AAA/-93), pp.698-703,MenloPark,CA:AAAIPress,
1993.
[Elrr.an, 1990]Elman,1., FildingStructureinTime, CognitiveScience, 14:179-211, 1990.
[Eme'son, 1989]Emerson,E., TemporalandModalLogic,devanLeeuwen,1. (ed.),HandbookofTheo-
raicalComputerScience, pp. 995-1072,Amsterdam:North-Holland, 1989.
[Enderton, 1972]Enderton,H.,AMathematical/ntroductiontoLogic, NewYork:AcademicPress, 1972.
[Ephrati;Pollack,yMilshtein, 1996]Ephrati,E.; Pollack,M.,yMilshtein,M., ACost-DirectedPlanner:
PreliminariyReport,enProceedingsofthe ThirteenthNationalConferenceonArtificial/ntelligence
(AAA/-96), pp. 1194-1201,MenloPark, CA:AAAIPress, 1996.
[Erman,etal., 1980]Erman,L.;Hayes-Roth,E;Lesser,v., yReddy,R,TheHearsay-IlSpeech-Understan-
dingSystem:IntegratingKnowledgetoResolveUncertainty, ComputingSurveys, 12:213-253, 1980.
[Ernst;Millstein,yWeld, 1997]Ernst,M.; Millstein,T, yWeld, D., AutomaticSAT-CompilationofPlan-
ningProblems, de Proceedingsofthe Fifteenth /ntemational Conference onArtificial/ntelligence
(/JCAI-97), pp. 1169-1176,SanFrancisco: MorganKaufmann, 1997.
[Erol;Nau, ySubrahmanian, 1992]ErolK.; Nau, D., ySubrahmanian,v., OntheComplexityofDomain-
IndependentPlanning, de Proceedings ofthe Tenth National Conference on Artificial/ntelligence
(AAA/-92), pp. 381-386,MenloPark, CA:AAAIPress, 1992.
[Erol;Hendler,y Nau, 1994]Erol, K.; Hendler,1., y Nau,D., HTNPlanning: ComplexityandExpressi-
vity, de Proceedings ofthe Twelfth National Conference onArtificial/ntelligence (AAA/-94), pp.
1123-1128,MenloPark,CA:AAAIPress, 1994.
[Etzioni 1993]Etzioni,O., AcquiringSearch-ControlKnowledgeviaStaticAnalysis,Artificial/ntelli-
gence,62(2):255-301, 1993.
[Etzioni,yWeld, 1994]Etzioni,O.,yWeld, D., ASoftbot-BasedInterfacetotheInternet, Communica-
tionsoftheACM,37(7):72-76,julio, 1994.
[Evans, 1968]Evans,T. G., AProgramfortheSolutionofaClassofGeometric-AnalogyIntelligence-Test
Questions,deMinsky,M. (ed.),Semantic/nformationProcessing, pp. 271-353,Cambridge,MA:MIT
Press, 1968.
[Fagin,yHalpern, 1985]Fagin,R,yHalpern,J., Belief,Awareness,andLirnitedReasoning,deProce-
edings ofthe Ninth /ntemational Joint Conference on Artificial /ntelligence (/JCA/-85), pp. 491-
501,SanFrancisco: MorganKaufmann, 1985.
[Fagin, etal., 1995] Fagin, R;Halpern, J.; Moses, Y., y Vardi, M., Reasoning aboutKnowledge, Cam-
bridge,MA: MITPress, 1995.
[Faugeras, 1993]Faugeras,O.,Three-DimensionalComputerVison: AGeometricViewpoint, Cambridge,
MA: MITPress, 1993.
[Feigenbaum, y Feldman, 1963] Feigenbaum, E., y Feldman, J. (eds.), Computers andThought. New
York: McGraw-Hill, 1963.
[Feigenbaum; Buchanan, y Lederberg, 1971] Feigenbaum, E.; Buchanan, B., y Lederberg, J., On
Generality and Problem Solving: A Case Study Using the DENDRAL Program, de Meltzer, B.,
y Michie, D. (eds.), Machine /ntelligence 6, pp. 165-190, Edinburgh: Endinburgh University Press,
1971.
[Feigenbaum; McCorduch, y Nii, 1988] Feigenbaum, E., McCorduch, P., y Nii,. H. P., The Rise ofthe
Expert Company: How Visionary Companies Are Using Artificial/ntelligence to Achieve Higher
ProductivityandProfits, NewYork: TimesBooks, 1988.
[Feller, 1968]Feller,W., An/ntroductionto ProbabilityTheoryandApplications,vol. 1, NewYork: John
Wiley& Sons, 1968.
[Fikes, yNilsson, 1971]Fikes,R,yNilsson, N., STRIPS:ANewApproachtotheApplicationofTheorem
ProvingtoProblemSolving,Artificial/ntelligence, 2(3/4):189-208, 1971.
[Fikes;Hart,yNilsson, 1972]Fikes,R;Hart,P., YNilsson,N., LearningandExecutingGeneralizedRobot
Plans,Artificial/ntelligence, 3(4):251-288,1972.
[Finin;Labrou,yMayfield, 1997]Finin,T, Labrou,Y., yMayfield.1., KQMLasanAgentCommunica-
tionLanguage,deBradshaw,J. (ed.),SofwareAgents,Cambridge,MA: MITPress, 1997.
[Firby, YKahn, 1995]Firby,R J.,YKahn, R,AnArchitectureforVisionandAction,deProceedingsof
the Fourteenth /ntemationalJoint Conference onArtificial/ntelligence (/JCA/-95), pp. 72-79, San
Francisco: MorganKaufmann, 1995.
[Fischler,yFirschein, 1987]Fischler,M.A,YFirschein,O. (eds.),Readingsin ComputerVision: /ssues,
Problems, Principies, andParadigms, SanFrancisco: MorganKaufmann, 1987.
[Fleischmann,etal., 1995]Fleischmann,R,etal., Whole-GenomeRandomSequencingandAssemblyof
HaemophilusinfluenzaeRd, Science, 269:496-512,julio,28, 1995.
[Forbes,etal., 1995]Forbes,J.;Huang,T; Kanazawa, K., yRussell, S., TheBATmobile:TowardsaBaye-
sianAutomaticTaxi, deProceedingsoftheFourteenth/ntemationalJointConference onArtificial
/ntelligence (/JCA/-95),pp. 1878-1885,SanFrancisco:MorganKaufmann, 1995.
[Forbus, y de Kleer, 1993] Forbus, K., y de Kleer, J., Building Problem Solvers, Cambridge, MA: MIT
Press, 1993.
[Forgy, 1982]Forgy,C., RETE:AFastAlgorithmfortheManyPattemIManyObjectPatternMatchPro-
blem,ArtificialIntelligence,19(1):17-37, 1982.
[Frege, 1879]Frege,G., Begriffsschrift,aFormulaLanguageModelleduponThatofArithmetic,forPure
Thought(1879), devanHeijenoort,J. (ed.), From Fregeto G6del:ASource BookinMathematical
Logic, 1879-1931,pp. 1-82,Cambridge,MA: HarvardUniversityPress, 1967.
[Friedman, 1997]Friedman,N., LearningBeliefNetworksinthePresenceofMissingValuesandHidden
Variables, ProceedingsoftheFourteenth/nternationalConferenceonMachineLeaming(/CML'97),
SanFrancisco: MorganKaufmann, 1997.
[Friedman, y Goldszmidt, 1996a] Friedman, N., y Goldszmidt, M., Learning Bayesian Networts with
--'
414
Bibliografa
LocalStructure,deProceedings of the Twelfth Conference on Uncertainty in Artificial Intelligence,
pp.252-262,SanFrancisco:MorganKaufmann, 1996.
[Friedman,yGoldszmidt, 1996b]Friedman,N.,yGoldszmidt,M., BuildingClassifiersUsingBayesian
Networks,Pmceedings ofthe Thirteenth National Conference on Artificial Intelligence (AAAI-96), pp.
1277-1284,MenloPark,CA:AAAIPress, 1996.
[Fu, 1994]Fu,L. M.,Neural Networks in Computer Intelligence, NewYork: McGraw-HiII, 1994.
[Galton, 1987]Galton,A., Temporal Logics and Their Applications, London:AcademicPress, 19897.
[Gardner, 1982]Gardner,M.,Logic Machines and Diagrams (2. a ed.). Chicago:TheUniversityofChica-
goPress, 1982.
[Garey, yJohnson, 1979]Garey,M.,yJohnson,D., Computers and Intractability, NewYork:W. H. Free-
man,1979.
[Gaschnig, 1979] Gaschnig, J., Performance Measurement and Analysis ofCertain Search Algo-
rithms,Carnegie-MellonUniversityComputerScienceTeeh.ReportCMU-CS-79-124,Pittsburg,PA,
1979.
[Gaschnig, 1979]Gaschnig,J.,AProblem-SimilantyApproachto DevisingHeuristics:FirstResutts, de
Proceedings of the Sixth International Joint Conference on Artificial Intelligence (lJCAI-79), pp.
301-307,SanFrancisco: MorganKaufmann, 1979. (ReimpresoporWebber, B.,y Nilsson, N. (eds.),
Readings in Artificial Intellgence, pp. 23-29,SanFrancisco:MorganKaufmann, 1981.)
[Gat, 1992] Gat,E., IntegratingPlanningandReactinginaHeterogeneousAsynchronousArchitecturefor
ControllingReal-WorldMobileRobots,dePmceedings ofthe Tenth National Conference on Artifi-
ciallntelligence (AAAI-92), pp.809-815,MenloPark,CA:AAAIPress, 1992.
[Gelernter, 1959] Gelernter, H., Realizationofa Geometry Theorem-Proving Machine, Proc. Intern.
Con! Inform Proc. UNESCO House, Pars, pp. 273-282, 1959. (Reimpreso porFeigenbaum, y
Feldman,J. (eds.),Computers and Thought, pp. 134-152,NewYork: McGraw-HiIl, 1963.)
[Genesereth,yNilsson, 1987]Genesereth,M.,yNlsson,N.,Logical Foundations ofArtificial Intelligen-
ce, SanFrancisco:MorganKaufmann, 1987.
[Genesereth,yFikes, 1992]Genesereth,M.,yFikes,R. (ed.<.), Knowledge Interchange Format, Version 3.0
Reference Manual, ComputerScienceDepartament,StanfordUniversity,TeehnicalReportLogic-92-1,
junio, 1992.
[Gentner, 1983] Gentner, D., Structure Mapping: ATheoretical Frarnework for Analogy, Cognitive
Science, 7:155-170,1983.
[Gibson, 1950]Gibson,J.l, The Perception ofthe Visual World, Boston:HoughtonMifflin, 1950.
[Gibson, 1979] Gibson,l J., The Ecologcal Approach to Visual Perception, Boston: HoughtonMifflin,
1979.
[Gil, 1992]Gil, Y., Acquiring Domain Knowledge for Plannng by Experimentation, Ph.D. dissertation,
SchoolofComputerScience,Carnegie-MellonUniversity, 1992.
[Ginsberg, 1987] Ginsberg, M. (ed.), Readings in Nonmonotonic Reasoning, San Francisco: Morgan
Kaufmann, 1987.
[Ginsberg, 1993] Ginsberg, M., Dynallc Backtracking, Journal of Artificial Intelligence Research,
1:25-46, 1993.
[Ginsberg, 19961Ginsberg,M.,DoComputersNeedCornmonsense?deProceedings ofthe Fifth Inter-
natonal Conference on Principies of Knowledge Representaton and Reasoning (KR-96), pp. 620-626,
SanFrancisco:MorganKaufmann, 1996.
[Ginsberg,et al., 1990]Ginsberg,M.;Frank,M.,Halpin,M.,yTorranceM., SearchLessonsLearnedfrom
Crossword Puzzles, de Proceedings of the Eighth National Conference on Artificial Intelligence
(AAAI-90), pp. 210-215,MenloPark,CA:AAAIPress, 1990.
[Ginsberg, y Harvey, 1992] Ginsberg, M. y Harvey. W. D., IterativeBroadening,Artificial Intelli-
gence, 55(2)/3):367-383, 1992.
[Glesner, y Koller, 1995] Glesner, S., y Koller, D., Constructing Flexible Dynamic BeliefNetworks
fromFirst-OrderProbabilisticKnowledgeBases,Proceedings ofthe European Conference on Sym-
bolic and Quantitative Approaches to reasoning and Uncertanty (ECSQUARU), Fribourg,Switzer-
land,julio, 1995,deFroidevaux,C., yKohlas,J. (eds.),Lecture Notes in Artificial Intelligence, pp. 217-
226,Berlin: Springer-Verlag, 1995.
[Gogic,et al., 19951 Gogic,G.; Kautz,H.;Papadimitriou,c., ySelman,B.,TheComparativeLinguistics
Bibliografa 415
ofKnowledgeRepresentations,deProceedings ofthe Fourteenth International Jont Conference on
Artificial Intelligence (lJCAI-95), pp. 862-869,SanFranCsco: MorganKaufmann, 1995.
[Goldberg, 1979] Goldberg, A, Onthe Complexity ofthe Satisfiability Problem, CourantComputer
ScienceReport,nm. 16, NewYorkUniversity, NY, 1979.
[Goldberg, 1989] Goldberg, D., Genetic Algorithms in Search, Optimizaton, and Machine Leaming,
Reading,MA:Addison-Wesley, 1989.
[Goldszmidt; Morrris, y Pearl, 1990] Goldszmidt, M., Mortis, y Pearl, J., A Maximum Entropy
ApproachtoNonmonotonicReasoning,deProceedings of the Eighth National Conference on Arti-
ficiallntelligence (AAAI-90), pp.646-652,MenloPark,CA:AAAIPress, 1990.
[Green, 1969a]Green,c., ApplicationofTheoremProvingtoProblemSolving,deProceedings ofthe
Fist International Joint Conference onArtificiallntelligence (lJCAI-69), pp. 741-747,SanFrancisco:
MorganKaufmann, 1969.
[Green, 1969b] Green, c., Theorem-Proving by Resolution as a Basis for Question-Answering Sys-
tems, deMeltzer,B.,yMichie,D. (eds.)Machne Intelligence 4,pp. 183-205,Edinburgh:Edinburgh
UniversityPress, 1969.
[Gregory, 1966]Gregory,R.,Eye and Bran: The Psychology ofSeeing, NewYork: McGraw-Hill, 1966.
[Grimson, 1990] Grimson, W. E. L. Object Recognition by Computer: The Role of Geometric Cons-
traints, Cambridge,MA: MITPress, 1990.
[Grosz; Sparck Jones, y Webber, 1986] Grosz, B., Sparck Jones, K, y Webber, B. (eds.) Readings in
Natural Language Processing, SanFrancisco:MorganKaufmann, 1986.
[Grosz,et al., 1987]Grosz,B.;Appelt,D.;Martin,P., yPereira,F., Team:An ExperimentintheDesingof
TransportableNatural-LanguageInterfaces,Artificial Intelligence, 32(2):173-244, 1987.
[Gruber, 1997].Gruber,T., TowardPrincipiesfortheDesignofOntologiesUsedforKnowledgeSharing,
deGuanno,N., yPoli,R. (eds.),Formal Ontology n Conceptual Analysis and Knowledge Represen-
taton, Amsterdam: K1uwerAcademicPublishers, 1997. (ArtculooriginalpresentadoenelInterna-
tionalWorkshoponFormalOntology,marzo, 1993,StanfordKnowledgeSystemsLaboratoryReport
KSL-93-04.)
[Gu, 1989] Gu, J., ParaUel Algorithms and Architectures for Very Fast Al Search, (tesisdoctoral), Un-
versityofUtah, 1989.
[Guha,yLenat, 1990]Guha,R. V., Y Lenat,D.,Cyc:AMidtermReport,Al Magazine, pp. 33-59,Fall,
1990.
[Gupta,yNau, 1992]Gupta,N.,yNau,D.,OntheComplexityofBlocks-WorldPlanning.Artificallnte-
lligence, 56(2/3):223-254, 1992.
[Guzmn, 1968]Guzman,A.,DecompositionofaVisualSceneintoThree-DimensionalBodies,Proc.
Fall Jont Computer Conference, vo133, pp. 291-304, 1968.
[Hanks,yMcDermontt, 19861 Hanks, S., yMcDermontt,D.,DefaultReasoningNonmonotonicLogics,
and theFrameProblem, deProceedings of the Fifth National Conference on Artificial Intelligence
(AAAI-86), pp. 328-333,MenIoPark,CA:AAAIPress, 1986.(ReimpresoenGinsberg,M. (ed.),Rea-
dings in Nonmonotonic Reasoning, pp. 390-395,SanFrancisco: MorganKaufmann, 1987).
[Harnad, 1990]Hamad,S., TheSymbolGroundingproblem,Physca D, 42(1-3):335-346, 1990.
fHart; Nilsson, y Raphael, 1968] Hart, P.; Nilsson, N., y Raphael, B., AFormal BasisfortheHeuristic
DeterrninationofMinimumCostPaths,IEEE Trans. Syst. Science and Cybemetics, SSC-4(2): 100-
107,1968.
[Hart;Nilsson,yRaphael, 1972]Hart,P.; Nilsson,N.,yRaphael,B.,Correctionto"AFormalBa"isforthe
HeuristicDeterrninationofMinimumCostPaths", SIGART Newsletter, nm. 37,pp. 28-29,diciem-
bre,1972.
[Harvey, 1994] Harvey, W. D., Nonsystematic Backtracking Search, Ph. D. dissertation, Departmentof
ComputerScience,StanfordUniversity,diciembre, 1994.
[Haussler, 1988]Haussler,D.,QuantifyingInductiveBia<: AlLearningAlgorithmsandValiant'sLearning
Framework, Artificial Intelligence, 36:177-221, 1988. (Reimpreso en Shavlik, J., y Dietterich,
T. (eds.),Readings in Machine Learning, pp.96-107,SanFrancisco:MorganKaufmann, 1990.)
[Haussler, 1990] Haussler, D., ProbablyApproximately Correet Leaming. Proceedngs of the Eighth
National Conference on Artificial Intelligence (AAAl-90), pp. 1101-1108, Menlo Park, CA: AAAI
Press, 1990.
~
417
416 Bibliografa
[Hayes, 1987] Hayes, P. J., The Naive Physics Manifesto, de Michie, D. (ed.), Expert Systems in the
Microelectronic AKe, Edinburgh: Edinburgh University Press, 1978.
[Hayes, 1985a] Hayes, P. J. The Second Naive Physics Manifesto, de Hobbs, 1., y Moore, R (eds.) For-
mal Theories ofthe Commonsense World, Cap. 1, pp. 1-36, Norwood, NJ: Ablex, 1985.
[Hayes, 1985b] Hayes, P. J., Naive Physics 1: Ontology for Liquid,>>>, de Hobbs, 1., y Moore, R. (eds,). For-
mal Theories ofthe Commonsense World, Cap. 3, pp. 71-107, Norwood, NJ: Ablex, 1985.
[Hayes, y Ford, 1995] Hayes, P., y Ford, K., Turing Test Considered Harmful, de Proceedings of the
Fourteenth lntemational Joint Conference on Artificallntelligence (lJCAI-95), pp. 972-977, San Fran-
cisco: Morgan Kaufmann, 1995.
[Hayes-Roth, 1985] Hayes-Roth, B., A Blackboard Archtecture for Control, Artificial lntelligence,
26(3):25]-321,1985.
[Hayes-Roth, 1995] Hayes-Roth, B., An Architecture for Adaptive Intelligent Systems, Artificiallnte-
lligence, 72(1/2):329-365, 1995.
fHayes-Roth et al., 1992] Hayes-Roth. B.; Washington, R; Ash, D.; Hewett, R.; Collinot, A.; Vina, A., y
Seiver, A., Guardian: An Intelligent Agent for ICU Monitoring, J. Al in Medicine, 4: 165-185, 1992.
[Haykin, 1994] Haykin, S., Neural Netwoks: A Comprehensive Foundation, New York: Macmillan Colle-
ge Publishng, 1994.
[Herbert, et al., 1997] Herbert, M., et al., Mobility for Unmanned Ground Vehic1es, de Firschein, O., y
Strat, T. (eds.), Reconnaissance, Surveillance. and Target Acquisition for the Unmanned Ground
Vehicle: Providing the Surveillance Eyes foranAutonomous Vehicle, San Francisco: Morgan Kauf-
mann, ]997.
[Heckerman, 1991] Heckerman, D., Probabilistic Similarity Networks, Cambirdge, MA: MIT Press, 1991.
[Heckerman, 1996] Heckerman, D., A Tutorial on Learning with Bayesian Networks, Microsoft Research
Technical Report, MSR-TR-95-06, Redmond, WA, marzo, 1995 (revisado en noviembre de 1996).
[Heckerman, y Nathwani, 1992] Heckerman, D., y Nathawani, B. An Evaluaton of the Diagnostc Accu-
racy of Pathfinder. SIAM Joumal on Computing, 25:56-74, 1992.
[Heckerman; Geiger. y Chickering, 19951 Heckerman, D.; Geiger, D., y Chickering, D., Leaming Baye-
sian Networks: The Combinaton of Knowledge and Statistical Data, Machine Learning, 20:3, 197-
243,1995.
[Heinsohn, et al., 1992] Heinsohn, J.; Kudenko, D.; Nebel, B., y Profitlich, H.-J., An Empirical Analsis
of Terminological Representaton Systems, Proceedings ofthe Tenth National Conference on Artifi-
ciallntelligence (AAAI-92), pp. 767-773, Menlo Park, CA: AAAI Press, 1992.
[Hendrix, 1979] Hendrix, G., Encoding Knowledge in Partitioned Networks, en Find1er, N. (ed.), Asso-
ciative Networts, pp. 51-92, New York: Academic Press, 1979.
[Henrion, 1988] Henrion, M., Propagation of Uncertainty in Bayesian Networks by Probabilistic Logic
Sampling, de Lernmer, J., y Kanal, L. (eds.), Uncertainty in Artificiallntelligence, 2: 149-163, New
York: EIsevier/North-Holland, 1988.
[Henrion, 1990] Henrion, M., An Introduction to AIgorithms for Inference in Belief Nets, de Henrion,
M.; Shachter, R.; Kanal, L., y Lernmer, J. (eds.), Uncertainty in Artificallntelligence, 5, Amsterdam:
North Holland, 1990.
[Hertz; Krogh, y Palmer, 1991] Hertz, 1.; Krogh, A., y Palmer, R, lntroduction to the Theory of Neural
Computation, Reading, MA: Addison-Wesley, 1991.
[Hintikka, 1962] Hintikka, J., Knowledge and Belief, Ithaca. NY: Comell University Press, 1962.
[Hobbs, y Moore, 1985] Hobbs, J., y Moore R, (eds.), Formal Theories ofthe Commonsense World, Nor-
wood, NJ: Ablex, 1985.
[Holland, ]975] Holland, J., Adaptation in Natural and Artificial Systems, Ann Arbor: The University of
Michigan Press, 1975. (2.' ed. impresa en 1992 por MIT Press, Cambridge, MA).
[Holland, 1986] Holland, J. H., Escaping Brittleness: The Possibilites of General-Purpose Leaming
Algorithms Applied to Parallel Rule-Based Systems, de Michalski, R; Carbonell, J., y Mitchell, T.
(ed,>.), Machine LeaminK: Artificiallntelligence Approach, Volume 2, Cap. 20,. San Francisco: Morgan
Kaufmann, 1986.
[Hom, 1951] Hom, A., On Sentences Which Are True of Direct Unions of Algebras, Jour. of Symbolic
LoKic, 16:14-21, 1951.
[Hom, 1986] Hom, B. K. P., Robot Vision, Cambridge, MA: MIT Press, 1986.
Bibliografa
[Horowitz, y Pavlidis, 1976] Horowitz, S., Y Pavlidis, T., Picture Segmentation by a Tree Traversal
Algorithm, Jour. Asso. Comp. Mach, 23(2):368-388, abril, 1976.
[Horswill, 19931 Horswill, l., Polly: Vision-Based Artificial Agent, de Proceedings of the Eleventh
National Conference on Artificiallntelligence (AAAI-93), pp. 824-829, Menlo Park, CA: AAAI Press,
1993.
[Horvitz, 1987] Horvitz, E., Reasoning about Beliefs and Actions under Computational Resource Cons-
traints, de Proc. of the 1987 Workshop on Uncertainty in Artificiallntelligence, pp. 429-444, 1987.
(Tambin en Kanal, L., et al., (ed8.), Uncertainty inArtificiallntelligence 3, pp. 301-324, New York:
Elsevier, 1989.)
[Horvitz; Breese, y Henrion, 1988] Horvitz, E.; Breese, J., y Henrion, M., Decison Theory in Expert Sys-
tems and Artificial Intelligence,lntemational Joumal ofApproximate ReasoninK, 2:247-302, 1988.
[Hube!, 1988] Hubel, D., Eye, Brain, and Vision, New York: W. H. Freeman, 1988.
[Hubel, y Wiesel, 1968] Hubel, D., y Wiesel, T., <<Receptive Fields and Functional Architecture of Monkey
Striate Cortex, Joumal ofPhysioloKY (London), 195(1):215-243, marzo, 1968.
[Huberman, 1968] Huberman, B. 1., AProKam to Play Chess End Games, Stanford University Computer
Science Department Report CS 106, agosto, 19, 1968.
[Hueckel, 1973] Hueckel, M., A Local Visual Operator Which Recognzes Edges and Lines, Joumal of
the Assoc. for Comp. Machinery, 20(4):634-647, octubre, 1973.
[Huffman, 1971] Huffman, D., Impossible Objects as Nonsense Sentences, de Machine lntelligence 6,
Meltzer, B., y Michie, D. (eds.), pp. 295-323, New York: American EIsevier, 1971.
[Jain; Kasturi, y Schunck, 1995] JaiD, R.; Kasturi, R, y Schunck, B., Machine Vision, New York: McGraw-
Hill, 1995.
[Jensen, 1996] Jensen, F., An lntroduction to Bayesian Networks. New York: Springer-VerIag, 1996.
[Johnson-Laird, 1988] Johnson-Laird, P., The Computer and the Mind: An lntroduction 10 Cognitive
Science, Cambridge, MA: Harvard University Press, 1988.
[Jordan, y Rumelhart, 1992] Jordan, M., y Rumelhart, D., Forward Models: Supervised Leaming with a
Distal Teacher, Congnitive Science, 16:307-354, 1992.
[Juels, y Wattenberg, 1996] Juels, A., y Wattenberg, M., Stochastic Hillclimbing as a Baseline Method for
the Evaluation of Genetic AIgorithms, de Neural Information Processing Systems 8, Cambridge, MA,:
MIT Press, 1996.
[Julesz, 1971] Julesz, B., Foundations of Cyclopean Perception, Chicago: The University of Chicago
Press, 1971.
[Kaelbling, y Rosenschein, 1990] Kaelbling, L., y Rosenschein, S., Action and Planning in Embedded
Agents, Robotics and Autonomous Systems, 6:35-48, 1990. Tambin en 1990].
[Kaelbling; Littman, y Moore, 1996] Kaelbling, L. P.; Littman, M. L., Y Moore, A. W. Reinforcement
Leaming: A Survey. Joumal ofArtificiallntelligence Research, 4:237-285, 1986.
[Kanal, y Kumar, 1988] Kanal, L., y Kumar, V. (eds.) Search inArtificiallntelliKence, Berln: Springer-Ver-
lag, 1988.
[Karrnarkar, 1984] Karrnarkar, N., A New Polynomial-Time AIgorithm for Linear Programming, Com-
binatorica, 4(4):373-395, 1984.
LKartha, 1994] Kartha, G. N., Two Counterexamples Related to Baker's Approach to the Frame Problem,
ArtificiallntelliKence, 69(1-2):379-391, 1994.
[Kautz. 1985] Kautz, H., Forma1izing Spatial Concepts and Spatial Language, de Commonsense Summer:
Final Report, Center for the Study of Language and Information (CSU) Technical Report CSU-85-35,
Stanford Unversity, Stanford, CA, 1985.
[Kautz, 1991] Kautz, H., A Formal Theory of Plan Recongnition and Its Implementation, de AlIen, J.;
Kautz; Pelavin, R, y Tenenberg, J. (eds.), Reasoning About Plans, Cap. 2, San Francisco: Morgan
Kaufmann, 1991.
[Kautz, y Selman, 1992] Kautz, H., y Selman, B., Forming Concepts for Fast lnference, de Proceedings
of the Tenth Natonal Conference on Artificiallntelligence (AAAI-92), pp. 787-793, Menlo Park, CA:
AAAI Press, 1992.
[Kautz, y Selman, 1996] Kautz, H., y Selman, B., Pushing the Envelope: Planning, Propositional Logic,
and Stochastic Search. de Procedings ofthe Thirteenth National Conference on Artificiallntelligen-
ce (AAAI-96), pp. 1194-1201, Menlo Park, CA: AAAI Press, 1996.
r
419
418 Bibliografa Bibliografa
"
[Kautz; Kearns, y Selman, 1993] Kautz, H.; Kearns, M., y Selman, B., Reasoning with Characteristic
Models, Proceedings ofthe Eleventh National Conference on Artificiallntelligence (AAAI-93), pp. 34-
39, Menlo Park, CA: AAAI Press, 1993.
[Kautz; McAllester, y Selman, 1996J Kautz, H.; McAllester, D., y Selman, B., Encoding Plans in Propo-
sitional Logic, de Proceedings of the Fifth lnternational Conference on Principies of Knowledge
Representaton and Reasoning (KR-96), pp. 374-384, San Francisco: Morgan Kaufmann, 1996.
[Kearns, y Vazirani, 1994J Kearns, M, y Vazirani, U.,An lntroducction to Computational Learnign Theory,
Cambridge, MA: MIT Press, 1994.
[Khardon, y Roth, 1998] Khardon, R., y Roth, D., Learning to Reasofi. Joumal ofthe ACM, to appear,
1998.
[Kierulf; Chen, y Nievergelt, 1990] Kierulf, A.; Chen, K, y Nievegelt, 1., Smart Game Board and Go
Explorer: A Study in Software and Knowledge Engineering, Comm, of the ACM, 33(2):152-167,
1990.
[Kim, y Pearl, 1983] Kim, 1. y Pearl, J., A Computational Model for Combined Causal and Diagnostic
Reasoning in Inference Systems, de Proceedings ofthe Eighth lntemational Joint Conference on Arti-
ficiallntelligence (!JCA/-83), pp. 190-193, San Francisco: Morgan Kaufmann, 1983.
[Kirkpatrick; Gelatt, y Vecchi, 1983J Kirkpatrick, S.; Gelatt, C., y Vecchi, M., Optimization by Simulated
Annealng, Science, 220:671-680, 1983.
[Kirsh, 1991] Kirsh, D., Today the Earwig, Tomorrow Man? Artificiallntelligence, 47(1-3):161-184,
1991.
[Knuth, y Moore, 1975] Knuth, D. E., YMoore R w., AnAnalysis of Alpha-Beta Pruning, Artificiallnte-
lligence, 6(4),293-326,1975.
[Knoblock, 1990] Knoblock, e. A., Learning Abstraction Hierarcrnes for Problem Solving, de Procee-
dings ofthe Eighth National Conference on Artificiallntelligence (AAAI-90), pp. 923-928, Menlo Park,
CA:AAA Press, 1990.
[Koenderink, 1984] Koenderink, J., The Structure of Images, Biological Cybernetics, 50:363-370,
1984.
[Kolodner, 1993J Kolodner, J., Case-Based Reasoning, San Francisco: Morgan Kaufmann, 1993.
[Konolige, 1982] Konolige K, A First-Order Formalization of Knowledge and Action for a Multi-Agent
Planning System, de Hayes, J.; Michie, D., y Pao, Y. (eds.), Machine lntelligence 10, Chichester,
England: Ellis Horwood, Ltd., 1982.
[Konolige, 1986] Konolige, K., A Deduction Model of Belief, London: Pitman, 1986.
[Korf, 1985] Korf, R, Depth-First Iterative Deepening: An Optimal Admissible Tree Search Argorithm,
Artificiallntelligence, 27:97-109, 1985.
[Korf, 1987] Korf, R., P1anning as Search: A Quantitative Approach, Artificiallntelligence, 33(1 ):65-88,
1987.
[Korf, 1990] Korf, R, Real-Time Heuristic Search. Artificiallntelligence, 42, 1990.
[Korf, 1991] Korf, R, Multi-Player Alpha-Beta Pruning, Artificiallntelligence, 48:99-111, 1991.
[Korf, 1992] Korf, R, Search, de Shapiro, S. (ed.), Encyclopedia ofArtificiallntelligence. (2.
a
ed.), pp.
]460-1467, New York: John Wiley & Sons, 1992.
[Korf, ] 993] Korf, R, Linear-S pace Best-First Search. Artificiallntelligence, 62, 41-78, 1993.
[Korf, 1996] Korf, R., Space-Efficient Search Algorithrns, ACM Computing Surveys, 27(3):337-339,
1996.
[Korf, 1997] Korf, R, Finding Optimal Solutions to Rubik's Cube Using Pattem Databases, de Proce-
edings of the Fourteenth National Conference on Artificial lntellgence (AAAI-97), pp. 700-705,
[Korf, y Taylor, 1996] Korf, R., y Tay10r, L., Finding Optimal Solutions to the Twenty-Four Puzzle, Pro-
ceedings ofthe Thirteenth Natonal Conference on Artificiallntelligence (AAAI-96), pp. 1202-1207,.
(Kowalski, 1974] Kowalski, R, Predicate Logic as a Programming Language, de Proceedings ofthe
IFIP-74 Congress, pp. 569-574, Amsterdam: ElsevierlNorth-Holland, 1974.
(Kowa1ski, y Kim, 1991] Kowalski, R, y Kim, J.-S. A Metalogic Programming Approach to Multi-
Agent Belief, de Lifschitz, V. (ed.), Artificiallntelligence and Mathematical Theory ofComputation:
Papers in Honor ofJohn McCarthy, pp. 231-246, Boston: Academic Press, 1991.
[Koza, 1992] Koza, J., Genetic Programming: On the Programming of Computers by Means of Natural
Selection, Cambridge, MA: MIT Press, 1992.
[Koza, 1994] Koza, J., Genetic Programming ll: Automatic Discovery ofReusable Programs, Cambridge,
MA: MIT Press, 1994.
[Koza, et al., 1996] Koza, J.; Bennett, F. III; Andre, D., y Keane, M., Automated WISIWYG Design of
Both the Topology and Component Va1ues of Analog Electrical Circuits Using Genetic Program-
ming, de Koza, John R.; Goldberg, David E.; Fogel, David B., y Riolo, Rick L. (eds.), Genetic Pro-
gramming 1996: Proceedings ofthe FirstAnnual Conference, Stanford University, julio, 28-31,1996,
Cambridge MA: MIT Press.
[Kripke, 1963] Kripke, S., Semantical Considerations on Modal Logic, Acta Philosophica Fennica,
16:83-94, 1963.
[Kuipers, et al., 1993] Kuipers, B.; Froom, R.; Lee, W-Y., y Pierce, D., The Semantic Hierarchy in
Robot Learning, de Connell, J., y Mahadevan, S. (eds.), Robot Leamng, Cap. 6, Boston: KIuwer Aca-
demic Publishers, 1993.
[Kuipers, y Byun, 1991] Kuipers, B., y Byun, Y-T., A Robot Exploration and Mapping Strategy Based on
a Semantic Hierarchy of Spatial Representations, Robotics andAutonomous Systems, 8:47-63,1991.
[Kumar, y Kanal, 1988] Kumar, V., y Kanal, L., The CDP: A Unifying Formulation for Heuristic Search,
Dynamic Programming, and Branch-and-Bound, de Kanal, L., Y Kumar, V. (eds.), Search in Artificial
lntelligence, Cap. 1, pp. 1-27, Berlin: Springer-Verlag, 1988.
[Kumar, 1992] Kumar, V., Algorithms for Constraint-Satisfaction Prob1ems: A Survey, Artificiallnte-
lligence Magazine, 13(1 ):32-44, primavera de 1992.
[Laird; Newell, y Rosenbloom, 1987] Laird, 1.; Newell, A., y Rosenbloom, P., SOAR: An Architecture for
General Intelligence. Artificiallntelligence, 33(1 ):-64, 1987.
[Laird, et al., 1991] Laird, J.; Yager, E.; Hucka, M., y Tuck, C., Robo-Soar: An Integration of External
Interaction, Planning, and Learning Using SOAR, Robotics and Autonomous Systems, 8:113-129,
1991.
[Lakoff, 1987] Lakoff, G., Women, Fire, and Dangerous Thngs: What Categories Reveal about the Mind,
Chicago: The U niversity of Chicago Press, 1987.
[Lakoff, y Johnson, 1980] Lakoff, G., y Jonhson, M., Metaphors We Live By, Chicago: The University of
Chicago Press, 1980.
[Langley, 1996] Lang1ey, P., Elements of Machine Leaming, San Francisco: Morgan Kaufmann, 1996.
[Latombe, 1991] Latombe, J.-e., Robot Moton Planning, Dordrecht: KIuwer Academic Publishers, ]991.
[Lauritzen, 1991] Lauritzen, S., The EM Algorithm for Graphical Association Models with Missing
Data, Tech. Report TR-91-05, Dept. of Statistics, Aa1borg University, Denmark, 1991.
[Lauritzen, y Spiegelha1ter, 1988] Lauritzen, S., y Spiegelha1ter, D., Local Computations with Probabili-
ties on Graprncal Estructures and Their Application to Expert Systems, Joumal ofthe Royal Statistical
Society, B 50(2):157-224, 1988.
[Lavra, y Dzeroski, 1994] LavraC, N., y Dzeroski, S., lnductive Logic Programming, Chichester, England:
Ellis Horwood, 1994.
[Le Cun, et al., 1989] LeCun, Y.; Boser, B.; Denker, J.; Henderson, D.; Howard, R.; Hubbard, w., y Jackel,
L., Backpropagation Applied to Handwritten Zip Code Recognitioll, Neural Computation, 1(4),
1989.
[Lee, y Mahajan, 1988] Lee, K-F., y Mahajan, S., A Pattern Clasification Approach to Evaluation Func-
tion Learning, Artificiallntelligence, 36(1): 1-26, 1988.
[Lenat, 1995J Lenat, D., CYC: A Large-Scale Investment in Know1edge Infrastructure, Comm. ACM,
38(11):33-38, noviembre, 1995.
[Lenat, y Guha, 1990] Lenat, D., y Guha, R, Building Large Knowledge Bases, Reading, MA: Addison-
Wesley, 1990.
[Leonard-Barton, 1987] Leonard-Barton, D., The Case for Integrative Innovation: An Expert System at
Digital, Sloan Management Review, pp. 7-19, otoo de 1987.
[Letvinn, et al., 1959] Letvinn, J.; Maturana, H.; McCulloch, W., y P i t t ~ W., What the Frog's Eye Tells the
Frog's Brain, Proc.IRE, 47:1940-1951,1959.
[Levesque, 1984a] Levesque, H., Foundations of a Functional Approach to Know1edge Representation,
Artificiallntelligence, 23(2):155-212, 1984.
r
420
Bibliografa Bibliografa 421
[Levesque, 1984b] Levesque, H., A Logic of Implicit and Explicit Belief, deProceedings ofthe F ourth Natio-
nal Conference onArtificiallntelligence (AAAI-84), pp. 198-202, Menlo Park, CA: AAAI Press, 1984.
[Levesque, 1986] Levesque, H., Marking Believers Out of Computers Artificiallntelligence, 30(1 ):81-
108, 1986.
[Levesque, y Brachman, 1987] Levesque, H., y Brachman, R, Expressiveness and Tractability in Know-
ledge Representation and Reasoning, Computatitonallntelligence, 3(2):78-93, 1987.
[Levesque, et al., 1997] Levesque, H.; Reiter, R; Lesprance, Y.; Lin F., y Scherl, R, GOLOG: A Logic
Prograrnming Language for Dynamic Domains, Joumal of Logic Programming, Special Issue on
Reasoning about Action and Change, 31 (1-3):59-83, 1997.
[Lifschitz, 1986] Lifschitz, V., On the Semantics or STRIPS, de Georgeff, M., y Lansky, A.(eds.), Rea-
soning aboutActions and Plans: Proceedings ofthe 1986 Work,shop, Timberline, Oregon, pp. 1-9, San
Francisco: Morgan Kaufmann, 1986. (Tambin, Allen, l;Hendler, l,y Tate, A. (eds.), Readings in
Planning, pp. 523-530, San Francisco: Morgan Kaufmann, 1990.)
[Lindsay, et al., 1980] Lindsay, R; Buchanan, B.; Feigenbaum, E., y Lederberg, J., Applications ofArtifi-
ciallntelligence for Organic Chemistry: The DENDRAL Project, New York: McGraw-HilI, 1980.
[Lovejoy, 1991] Lovejoy, w., A Survey of Algorithmic Methods for Partially Observed Markov Decision
Processes,Annals ofOperations Research, 28(1-4):47-66.1991.
[Loveland, 1978] Loveland D. W., Automated Theorem Proving: A Logical Basis, New York: North-
Holland, 1978.
[Lowenheim, 1915] Lowenheim, L, ber Moglichkeiten im Relativekalkh>, Mathematische Annalen,
76:447-470, 1915. (Traduccin al ingls aparecida en van Heijenoort, l (ed.), From Frege to Godel: A
Source Book in Mathematical Logic, 1879-1931, Cambridge, MA: Harvard University Press, 1967.)
[Lowry, y McCartney, 1991] Lowry, M., y McCartney, R, Automating Software Design, Cambridge, MA:
MIT Press, 1991.
[Lucas, 1961] Lucas, J. R, Minds, Machines, y GOdel, Philosophy, 36:112-127, 1961. (Tambin en
Anderson, A. R (ed.), Minds and Machines, pp. 43-59, Englewood Cliffs, NJ: Prentice Hall, 1964.)
[Luckham, 1970] Luckham, D., Refinement Theorems in Resolution Theory, Proc. IRIA 1968 Symp. on
Automatic Demonstration, Springer-VerIag Lecture Notes in Mathematics, nm. 125, pp. 163-190, 1970.
[Luckham, y Nilsson, 1971] Luckham, D. c.,y Nilsson, N., Extracting Information from Resolution Proof
Trees, Artificiallntelligence, 2(1): 27-54, 1971.
[Maes, 199Oa] Maes, P. (ed.), Designing Autonomous Agents: Theory and Practice from Biology to Engi-
neering and Back, Cambridge, MA: MIT Press, 1990.
[Maes, 1990b] Maes, P., Guest Editorial, Robotics and Autonomous Systems, 6:1-2, 1990. Tambin
[Maes, 1990a].
[Magerman, 1995] Magerman, D., Natural Language Parsing as Statistical Pattem Recognition, Ph. D,
tesis, Department of Computer Science, Stanford University, 1993.
[Mahadevan, 1992] Mahadevan, S., Enhancing Transfer in Reinforcement Leaming by Building Stochastic
Models of Robot Actions, de Proceedings of the Ninth Intemational Workshop on Machine Leaming
(ML92), pp. 290-299, San Francisco: Morgan Kaufmann, 1992.
[Mahadevan, y connen, 1992] Mahadevan, S., y connen, J., Automatic Programming of Behavor-
Based Robots Using Reinforcement Leaming, Artificiallntelligence, 55(1-2):311-365, 1992.
[Manna, y Waldinger, 1985] Manna, Z., y Waldinger, R,The Logical Basis for Computer Programming,
Volume 1: Deductive Reasoning, Reading, MA: Addison-Wesley, 1985.
[Manna, y Waldinger, 1990] Manna, Z, y Waldinger, R, The Logical Basisfor Computer Programming,
Volume 2: Deductive Systems, Reading, MA: Addison-Wesley, 1990.
[Manna, y Waldinger, 1992] Manna, Z., y Waldinger, R, Fundamentals ofDeductve Prograrn Synthesis,
IEEE Transactions on Software Engineering, 18(8):674-704, 1992.
[Marr, 1982] Marr, D., Vision: A Computationallnvestgaton into the Human Representaton and Pro-
cessing ofVisuallnformation, New York: W. H. Freeman, 1982.
[Marr, y Hildreth, 1980] Marr, D., y Hildreth, E., Theory of Edge Detection, Proc. Royal Soco ofLondon,
Series B, vol. 207, pp. 187-217, 1980.
[Marr, y Poggio, 1979] Marr, D., y Poggio, T., A Computational Theory of Human Stereo Vision, Pro-
ceedings ofthe Royal Society London, B; 204:301-328, 1979.
[Martelli, YMontanari, 1973] Martelli, A., y Montanari, U., <<Additive AND/OR Graphs, de Proceedings
of the Third Intemational Joint Conference on Artificiallntelligence (IJCAl-73 j, pp. 1-11, San Fran-
[Masand; Linoff, y Waltz, 1992] Masand, B.; Linoff, G., y Waltz, D., Classifying News Stories Using
Memory Based Reasoning,. de Proceedings ofACMISlGIR, pp. 59-65, 1992.
[Mataric, 1990] Mataric, M., A Distributed Model for Mobile Robot Environment Learning and Naviga-
ton, Technical Report No. AlM-TR-1228, MIT AlLab., MIT, Cambridge, MA, 1990.
[Mataric, 1996] Mataric, M., Designing and Understanding Adaptive Group Behavior, Adaptive Beha-
vior, 4(1):51-80, 1996.
[Mataric 19971 Mataric, M., Studying the Role of Embodiment in Cognition, Cybernetics and Systems,
28(6):457 -470, (Special Issue on Epistemological Aspects of Embodied Al), julio, 1997.
[Mauldin, 1994] Mauldin, M. L., Chatterbots, Tinymuds, and the Turing Test: Entering the Loebner Prize
Competition, de Proceedings of the TWelfth National Conference on Artificiallntelligence (AAAI-94j,
pp. 16-21, Menlo Park, CA: AAAI Press, 1994.
[McAdams, y Shapiro, 1995] McAdams, H., y Shapiro, L., Circuit Simulation of Genetic Networks,
Science, 269:650-656, 4 de agosto, 1995.
[McAllester, y Rosenblitt, 1991] McAllester, D., y Rosenblitt, D., Systematic Nonlinear Planning, de Pro-
ceedings ofthe Ninth National Conference on Artificiallntelligence (AAAI-91j, pp. 634-639, Menlo
Park, CA: AAAI Press, 1991.
[McCarthy, 1958] McCarthy, l, Programs with Cornmon Sense, Mechanisation ofThought Processes,
Proceedings of the Symposium of the National Physics Laboratory, vol. 1, pp. 77-84, London: Her
Majesty's Stationary Office, 1958. (Tambin en Minsky, M. (ed.), Semantic Information Processing, pp.
403-410, Cambridge, MA: MIT Press, 1968, y Brachman, R., y Levesque, H. (eds.), Readings in
Knowledge Representation, pp. 299-307, San Francisco: Morgan Kaufmann, 1985.)
[McCarthy, 1977] McCarthy, l,Epistemological Problems in Artificial de Proceedings of
the Fifih Intemational Joint Conference on Artificiallntelligence (lJCAl-77), pp. 1038-1044, San Fran-
[McCarthy, 1979a] McCarthy, l, Ascribing Mental Qualities to Machines, de Ringle, M. (ed.), Philo-
sophical Perspectives in Artificiallntelligence, pp. 161-195, Atlantc Highlands, NJ : Humanities
Press, 1979.
[McCarthy, 1979b] McCarthy, J., First-Order Theories of Individual Concept<> and Propositions, de
Hayes, l; Michie, D., y Mikulich, L. (eds.), Machine Intelligence 9, pp. 129-147, Chichester, England:
Ellis Horwood, Ltd., 1979.
[McCarthy, 1980] McCarthy, J., Circumscription: A Form of Non-monotoruc Reasorung, Artificiallnte-
lligence, 13(1-2):27-39, 1980.
[McCarthy, 1986] McCarthy, l, Applications of Circumscription to Formalizing Commonsense Know-
ledge, Artificiallntelligence, 28(1):89-116, 1986.
[McCarthy, 1997] McCarthy, J., Al as Sport (a Review of [Newbom, 1996]), Science, 276:1518-1519, 6
de junio, 1997.
[McCarthy, y Hayes, 1969] McCarthy, l,y Hayes, P., Sorne Philosophical Problems from the Standpoint
of Artificiallntelligence, de Meltzer, B., y Michie, D. (eds.), Machine Intelligence 4, Edinburgh: Edin-
burgh University Press, 1969.
[McClelland & Rumelhart 1981] McClelland, l, y Rumelhart, D., An Interactive Activation Model of
Context Effects in Letter Perception, Part 1: An Account of Basic Findings, Psychological Review,
88:375-407, 1981.
[McClelland, y Rumelhart, 1982] McClelland, l,y RumeIhart, D., An Interactve Activation Modelof
Context Effects in Letter Perception, Part 11: The Contextual Enhancement Effect and Sorne Tests and
Extensions ofthe Model, Psychological Review, 89:60-84,1982.
[McCorduck, 1979] McCorduck, P., Machines Who Think, San Francisco: W. H. Freeman, 1979.
[McCulloch, y Pitts, 1943] McCulloch, W., y Pitts, w., A Logical Calculus of the Ideas Irnmanent in Ner-
vous Activity, Bulletin ofMath. Biophysics, 5:115-133, 1943.
[McCune, 1992] McCune, W., Automated Discovery of New Axiomatizations of the Left Group and Right
Group Calcul, Automated Reasoning, 9(1): 1-24, 1992.
[McCune, 1994] McCune, w., OTTER 3.0 Reference Manual and Guide, Technical Report ANL-94/6,
Argonne National Laboratory, Argonne, IL, 1994.
423
422 Bibliografa
[McDermott, 1987]McDermott,D., ACritiqueofPureReasoM, ComputationalIntelligence, 3(3):151-
237,1987.
[McDermott,yDoyle, 1980] McDermott,D.,yDoyle,l, Non-monotonicLogic1,Artificial Intelligen-
ce, 13(1-2):41-72, 1980.
[McDermott, 19821 McDermott,J.,Rl:ARule-BasedConfigurerofComputerSystems,Artificial Inte-
lligence, 19(1):39-88, 1982.
[McDonald,yBolc,1988]McDonald,D.,yBolc,L.,Natural Language Generation Systems. NewYork:
Springer-Verlag,1988.
[McFarland, 1987]McFarland,D.(ed,), The O:xford Companion to Animal Behavior, Oxford:OxfordUn-
versityPress, 1987.
[McFarland,yBosser, 19931 McFarland,D.,yBosser,T., Intelligent Behavior in Animals and Robots, Cam-
bridge,MA: MITPress, 1993.
[McKeown,ySwartout, 1987]McKeown,K.,ySwartout,W., LanguageGeneratonand Explanaton,de
Annual Review of Computer Science, voL 2, PaloAlto, CA:AnnualReviews, 1987.
[Mro, 1984] Mro,L., AHeuristicSearchAlgorithmwithModfiableEstimate,Artificial Intelligence,
23:13-27, 1984.
[Mchalewicz, 19921 Michalewicz,Z.,Genetic Algorithms + Data Structures = Evolution Programs, Ber-
lin:Springer-Verlag, 1992.
[Michalski, 1969]Michalski,R,OntheQuasi-MinimalSolutionoftheGeneralCoveringProblem, Proc.
of the Fifth Intemational Symposium on Informaton Processing (FCIP 69), vol. A3, pp. 125-128,
(SwtchingCircuits),Bled,Yugoslavia, 1969.
[Michie, 1966]Michie,D., Game-PlayingandGame-LearningAutomata,deFox,L. (ed,),Advances in
Programmng and Non-numerical Computation, pp. 183-200,NewYork: Pergamon, 1966.
[Miller;Pople,yMyers, 1982]MiIler,R; Pople,H.,yMyers,J., INTERNIST-l:AnExperimentalCom-
puter-BasedDiagnosticConsultantforGeneralInternalMedicine,New England Joumal of Medici-
ne,307:468-476,1982.
[Minker, 1997]Minker,J.,LogicandDatabases: Past;Present,andFuture,Al Magazine, 18(3):21-47,
1997.
[Minnix; McVey, e igo, 1991] Minnix,J.; McVey, e igo,R,MultistageSelf-Organizing Neural
NetworkwithBiologicallyInspiredPreprocessingFeaturesfor Rotationand ScaleInvariantPattem
Recognition,Proc. ofthe IEEE, pp. 1605-1610, 1991.
[Minsky, 19671 Minsky,M., Computation: Finite and Infinite Machines, EnglewoodCfiffs,NJ: Prentice
Hall, 1967.
[Minsky, 1986] Minsky, M.,Society of Mind, NewYork: Simon&Schuster, 1986.
[Minton, 19881Minton,S.,Leaming Search Control Knowledge: An Explanotion-Based Approach, Boston:
KluwerAcademicPublishers, 1988.
Minton, 19901 Minton, S., Quantitatve Results Concerning the Utility ofExplanaton-Based Lear-
ning,Artificial Intelligence, 42(2-3):363-391, 1990.
[Minton, 1993]Minton, S. (ed.),Machine Leaming Methodsfor Planning, SanFrancisco: MorganKauf-
mann,1993.
[Minton,et al., 19891 Minton,S.;Carbonell,J.; Knoblock,C.;Kuok:ka, D.;Etzioni,O.,yGil,Y., Expla-
nation-BasedLearning:AProblemSolvingPerspective,Artificial Intelligence, 40(1-3):63-118,1989.
[Minton,et al., 19901 Minton,S.;Johnston,M.;,Phillips,A.,yLaird,P., SolvingLarge-ScaleConstraint-
Satisfacton and Scheduling Problems Using a Heuristic RepairMethod, de Proceedings of the
Eighth National Conference on Artificial Intelligence (AAAI-90), pp. 17-24,MenloPark,CA:AAAI
Press,199O.
[Minton,et al., 1992]Minton,S.;Johnston,M.;Phillips,A, yLaird,P., MinmizingConflicts:AHeuris-
tic RepairMethodforConstraintSatsfactionand Scheduling Problems, Artificial Intelligence, 58
(1-3):161-205,1992.
[Minton;Bresina,yDrummond, 19941 Minton,S.;Bresina,l,yDrummond,M., Total-OrderandPartal-
OrderPlanning:AComparativeAnalysis,Joumal ofArtificial Intelligence Research, 2:227-262, 1994.
[Mitchell, M., 1996] Mitchell, M.,An Introduction to Genetic Algorithms, Cambridge, MA: MITPress,
1996.
[Mtchell,T., 19971Mitchell,T.,Machine Leaming, NewYork: McGraw-Hill, 1997.
,
Bibliografa
I
,
t
J
f

t
t
l

1
I
,

\

1.
[Monahan, 19821 Monahan,G., ASurveyofPartiallyObservableMarkovDecisionProcesses: Theory,
Mode1s, andA1gorithms, Management Science, 28:1-16,enero, 1982.
[Montague,et al., 19951 Montague,P.; Dayan,P.; Person,c., ySejnowski,T., BeeForaginginUncertain
EnvironmentsUsingPredictiveHebbianLearning,Nature 377:725-728,1995.
[Moore, 1959]Moore,E.F., TheShortestPaththroughaMaze,deProceedings ofan International Sym-
posium on the Theory ofSwitching, Part ll, pp. 285-292,Cambridge,MA: HarvardUniversityPress,
1959.
[Moore, 1985a] Moore,R,SemanticalConsiderationsonNonmonotonicLogic,Artificial Intelligence,
25(1):75-94, 1985.
[Moore, 1985b1 Moore,R,AFormalTheoryofKnowledgeandAction,deHobbs,J.,yMoore,R (eds.),
Formal Theories ofthe Commonsense World, pp. 319-358,Norwood,NJ: Ablex, 1985.
[Moore, 1993]Moore,R,AutoepistemcLogicRevisited,Artificial Intelligence, 59(1-2):27-30, 1993.
[Moore,yAtkeson, 19931 Moore,A,yAtkeson,C.,PrioritizedSweeping-ReinforcementLearningwith
LessDataandLessTime,Machine Leaming, 13:103-130, 1993.
[Mostow,yPrieditis, 19891 Mostow,J.,yPrieditis,A, DiscoveringAdmissib1eHeuristicsbyAbstracting
andOptimizing: ATransformatona1Approach,deProceedings of the Eleventh Intemational Joint
Conference on Artificial Intelligence (IJCAI-89), pp. 701-707, San Francisco: Morgan Kaufmann,
1989.
[Muggleton, 1992]Mugg1eton,S.,Inductive Logic Programming, NewYork:AcademicPress, 1992.
[Mugg1eton,yBuntine, 19881 Muggleton,S., yBuntine,W., MachineInventionofFirst-OrderPredicates
byInvertingReso1utiofl,deLaird.J. (ed.),deProceedings ofthe Fifth Intemational Conference on
Machine Leaming, pp.339ff,SanFrancisco:MorganKaufmann. 1988.
[Muggleton;King,yStemberg, 19921 Muggleton,S.;King,R, ySternberg,J.,ProteinSecondaryStruc-
turePredictionUsingLogic-BasedMachineLearning,Protein Engineering, 5(7):647-657,1992.
[Muggleton,yDeRaedt, 1994]Mugg1eton, S.,yDeRaedt,L.,InductiveLogicProgramming:Theoryand
Methods,Joumal ofJgic Programming, 19,20:629-679, 1994.
[Myers, 1994] Myers, K., Hybrid Reasoning Using Universal Attachment, Artificial Intelligence,
(67)2:329-375, 1994.
[Nalwa, 1993)Nalwa,V. S.,A Guided Tour of Computer \lision, Reading,MA:Addison-Wesley, 1993.
[Nalwa,yBinford, 1986] Nalwa,V., yBinford,T., OnDetectingEdges,IEEE Trans on Pattern Analy-
sis and Machine Intelligence, PAMI-8(6):699-714,noviembre, 1986.
[Na1wa,yPauchon, 19871 Nalwa,V,yPauchon,E.,Edge1AggregationandEdgeDescription,Compu-
ter \lision, Graphics, and Image Processing, 40:79-94,1987.
[Neal, 19911 Neal, R, ConnectonistLearningofBeliefNetworks, Artificial Intelligence, 56:71-113,
1991
[Neapolitan,19901 Neapolitan,R,Probabilistic Reasoning in Expert Systems: Theory and Algorithms, New
York: JohnWi1ey &Sons, 1990.
[Newborn, 1996]Newborn,M.,Computer Chess Comes ofAge, NewYork: Springer-Verlag, 1996.
[Newell, 19641 Newell,A., ThePossibilityofPlanningLanguagesinMan-ComputerCommunication,de
Communication Processes, ProceedingsofaSymposiumheldinWashington, 1963, NewYork: Per-
gamon, 1964.
Newell, A., Production Systems: Mode1s ofControl Structures, de Chase, W. (ed.),
\lisualInformation Processing, NewYork: AcademicPress, 1973.
[Newell, 19821 Newell,A., TheKnowledgeLeve1:Artificial Intelligence, 18(1):87-127, 1982.
[Newel,19911 Newell,A., Unified Theories ofCognition, Cambridge,MA: HarvardUniversityPress, 1991.
[NeweI1; Shaw, ySimon, 1957] Newell,A., Shaw,J., y Simon,H., EmpiricalExplorationsoftheLogic
TheoryMachine,Proc. West. Joint Computer Conf., vol. 15,pp. 218-239,1957.(ReimpresoporFei-
genbaum, yFeldman,J. (eds.), Computers and Thought, pp. 109-133,NewYork: McGraw-Hill,
1963.)
[Newell;Shaw,ySimon, 19591 Newell,A.,Shaw,J. c., ySimon,H.A.,Chess-PlayingProgramsandthe
ProblemofComplexity, IBM Jout: R & D, 2:320-355, 1958. (Reimpreso en Feigenbaum, E., y
Feldman,J. (eds.), Computers and Thought, pp. 109-133,NewYork: McGraw-Hill, 1963.)
[Newel1; Shaw, ySimon, 19591 Newell,A., Shaw,1 c., ySimon,H.A., ReportonaGeneralProb1em-Sol-
ving ProgramforaComputen>, Computers andAutomation, 8(7):10-16,1959.
...
':..... 424 ::-' /.
Bibliografa 425
Bibliografa
" J "
--------- ,;;:
[Newell,y Simon,1963]Newell,A.,ySimon,H., GPS,AProgramThatSimulatesHumanThought,de
Feigenbaum,E.,yFeldman,J. (eds.), ComputersandThought,pp. 279-293,NewYork: McGraw-Hill,
1963.
[Newell,y Simon, 1972] Newell,A.,ySimon,H.,Human ProblemSolving, EnglewoodCliffs,NJ:Prentice
Hall,1972.
[Newell,y Simon, 1976]Newell,A., y Simon,H. A., ComputerScienceasEmpiricalInquiry: Symbols
andSearch,CommunicationsoftheAssociationforComputingMachinery, 19(3):113-126, 1976.
[Nii, 1986a]Nii,H. P., BlackboardSystems:TheBlackboardModelofProblemSolvingandtheEvolution
ofBlackboardArchitectures: TheAlMagazine, 7(2):38-64,veranode 1986.
[Nii, 1986b]Nii,H. P.,BlackboardSystems(PartTwo): BlackboardApplicationSystems,BlackboardSys-
temsfromaKnowledgeEngineeringPerspective, TheAl Magazine, 7(3):82-106,1986.
[Nilsson, 1965]Nilsson,N.,TheMathematicalFoundationsofLeamingMachines, SanFrancisco:Morgan
Kaufmann, 1990. (ReimpresindeNilsson,N.,LeamingMachines: FoundationsofTrainablePattem-
ClassifyingSystems,NewYork: McGraw-Hill, 1965.)
[Nilsson, 1969J Nilsson, N., Searching Problem-Solving and Game-Playing Trees for Minimal Cost
Solutions, de Morrell, A. (ed.), lnformation Processing 68, vol. 2, pp. 1556-1562, Amsterdam:
North-Holland,I%9.
[Nilsson, 1980]Nilsson,N., PrincipiesofArtificiallntelligence,SanFrancisco:MorganKaufmann, 1980.
[Nilsson, 1984a] Nilsson, N., Artificial Intelligence, Employment, and Income, The AlMagazine,
5(2):5-14,veranode1,?84.
[Nilsson, 1984b] Nilsson,N., ShakeytheRobot,TechnicalNote323,SRIIntemational,MenloPark,CA,
1984.
[Nilsson, 1986]Nilsson,N.,ProbabilisticLogic,Artificiallntelligence,28(1):71-87, 1986.
[Nilsson, 1991]Nilsson,N., LogicandArtificialIntelligence,Artificiallntelligence,47:31-56, 1991.
[Nilsson, 1994JNilsson, N., Teleo-ReactiveProgramsforAgentControl.JoumalofArtificiallntelligence
Research, 1, pp. 139-158,enero, 1994.
[Nilsson,y Raphael, 1967] Nilsson,N., yRaphael,B., PreliminaryDesignofanIntelligentRobot,de
Tou,J. T. (ed.),ComputerandlnformationSciences-ll,pp.235-259,NewYork:AcadernicPress, 1967.
[Norvig, 1992] Norvig, P., Paradigms ofArtificiallntelligenceProgramming: Case Studiesin Common
LlSP,SanFrancisco:MorganKaufmann, 1992.
[Nourbakhsh, 1997]Nourbakhsh,l., lnterleavingPlanningandExecutionforAutonomousRobots,Boston:
KluwerAcadernicPublishers, 1997.
[O'Reilly,yOppacher, 1994JO'Reilly,U.-M.,yOppacher,E,ProgramSearchwitha HierarchicalVaria-
bleLengthRepresentation: GeneticProgramrning,SimulatedAnnealingandHillClimbing,deDavi-
dor,Y.; Schwefel,H.,yManner,R (eds.),LectureNotesin ComputerScience, No. 866,Berln:Sprin-
ger-Verlag, 1994.
[paterson,yWegman, 1978]Paterson,M. yWegman,M.,LinearUnification,Joumalof Computerand
SystemScience, 16:158-167,1978.
[Pearl, 1982a]Pearl,1.,ReverendBayesonInferenceEngines:ADistributedHierarchicalApproach,de
Proceedings ofthe Second National Conference onArtificiallntelligence(AAAI-82), pp. 133-136,
MenloPark,CA:AAAIPress, 1982.
[Pearl, 1982b JPearl,1., ASolutionfortheBranchingFactoroftheAlpha-BetaPruningAlgorithmandits
Optimality: Comm.ACM,25(8):559-564, 1982.
[Pearl, 1984]Pearl,J.,Heuristics: lntelligentSearchStrategiesforComputerProblemSolving, Reading,
MA:Addison-Wesley, 1984.
[Pearl, 1986JPearl,J., Fusion,Propagation,andStructuringin BeliefNetworks,Artificiallntelligence,
29:241-288, 1986.
[Pearl, 1988]Pearl,J.,ProbabilisticReasoninginlntelligentSystems:NetworksofPlausiblelnference,San
Francisco:MorganKaufmann, 1988.
[Pearl, 1990] Pearl, J., Reasoning underUncertainty, AnnualReview ofComputer Science, vol. 4,
1989-1990,pp. 37-72,PaloAlto,CA:AnnualReviews, 1990.
[Pednau1t, 1986J Pednault, FormulatingMultiagent,Dynamic-WorldProblemsintheClassicalPlan-
ningFramework,deGeorgeff,M.,yLansky,A. (eds.),ReasoningaboutActionsandPlans:Procee-
dings ofthe 1986 Workshop, Timberline, Oregon, pp. 47-82, San Francisco: Morgan Kaufmann,
1986. (TambinenAlIen, J.; Hendler,J.,y Tate, A. (eds.), Readings in Planning, pp. 675-710, San
Francisco:MorganKaufmann, 1990.)
[Pednault, 1989] Pednault, E., ADL: Exploringthe MiddleGroundbetweenSTRlPSandthe Situation
Calculus,deBrachman,R; Levesque,H., yReiter, R (eds.),ProceedingsoftheFirstlnternational
Conference on Principies ofKnowledge Representation andReasoning(KR-89), pp. 324-332, San
[Penberthy,yWeld, 1992]Penberthy,J.,yWeld,D., UCPOP:ASound,CompletePartial-OrderPlanner
forADL,deProceedingsoftheThirdlnternationalConferenceonPrincipiesof KnowledgeRepre-
sentationandReasoning(KR-92), pp. 103-113,SanFrancisco: MorganKaufmann, 1992.
[Penrose, 1989] Penrose,R,The Emperor'sNewMind: ConcerningComputers, Minds, andtheLawsof
Physics,Oxford:OxfordUniversityPress, 1989.
[Penrose, 1994J Penrose, R,Shadows ofthe Mind: Searchfor the Missing Science ofConsciousness,
Oxford:OxfordUniversityPress, 1994.
[Pereira, y Shieber, 1987] Pereira, F., y Shieber, S., PROLOG and Natural Language Analysis, CSLI
Lecture Notes, nm. 10, Centerfor the Study ofLanguage and Information, Stanford University,
Stanford,CA, 1987.
[Pereira,yWarren, 1980JPereira,F.,yWarren,D.,DefiniteClauseGrammarsforLanguageAnalysis:A
SurveyoftheFormalismandaComparisonwithAugmentedTransitionNetworks,Artificiallntelli-
gence, 13:231-278,1980.
[Pedis, 1985]Perlis,D.,LanguageswithSelf-Reference,1: Foundations,Artificiallntelligence,25:301-
332, 1985.
[Perlis, 1988JPeds,D.,LanguageswithSelf-Reference,II: Knowledge,Belief,andModality,Artificial
lntelligence,34:179-212,1988.
[Perona,yMalik, 1990JPerona,P., yMalik,J.,Scale-SpaceandEdgeDetectionUsingAnisotropicDif-
fusion, IEEETransactionsonPattemAnalysisandMachinelntelligence,PAMI-12:7:629-639,julio,
1990.
[Pineda, 1987]Pineda,F. J., GeneralizationofBack-PropagationtoRecurrentNeuralNetworks,Physi-
calReviewLetters,59:2229-2232,1987.
[Pingle, 1969J Pingle,K., VisualPerceptionbyaComputer,deAutomaticlnterpretationandClassifi-
cationoflmages,Grasselli,A. (ed,),pp.277-284,NewYork: AcademicPress, 1969.
[Pohl, 1971JPohl,l., Bi-directionalSearch,deMachinelntelligence6,Meltzer,B.,y Michie,D. (eds,),
pp. 127-140,Edinburgh:EdinburghUniversityPress, 1971.
[Pohl, 1973]Pohl,l., TheAvoidanceof(Relative)Catastrophe,HeuristicCompetence,GenuineDynamic
Weighting and Computational Issues in Heuristic Prob1em Solving, de Proceedings ofthe Third
lntemationalJointConferenceonArtificiallntelligence(!JCAI-73), pp. 20-23,SanFrancisco:Morgan
Kaufmann, 1973.
[Pollack,yRinguette, 1990] Pollack,M.E.,Y Ringuette,M., IntroducingtheTiIeworld:Experimentally
Evaluating AgentArchitectures, de Proceedings ofthe Eighth National Conference on Artificial
lntelligence(AAAI-90), pp. 183-189,MenIoPark,CA:AAAIPress, 1990.
[Pomerleau, 1991] Pomerleau,D., RapidlyAdaptingArtificialNeural NetworksforAutonomousNavi-
gation,deLippmann,P., etal., (eds,),Advancesin NeurallnformationProcessingSystems,3,pp.429-
435,SanFrancisco:MorganKaufmann, 1991.
[Pomerleau,1993JPomerleau,D.,NeuralNetworkPerceptionforMobileRobotGuidance,Boston:K1uwer
AcademicPublishers, 1993.
[port,yvanGelder, 1995]Port,R.,y vanGelder,T.,MindasMolon: Explorationsin the DynamicsofCog-
nition,Cambridge,MA:BradfordBookslMITPress, 1995.
[Pospesel,1976]Pospesel,H.,lntroductiontoLogic: PredicateLogic,EnglewoodCIiffs,NJ: PrenticeHall,
1976.
[Powers, 1995JPowers,R,Galatea2.2,NewYork: Farrar;Straus,& Giroux, 1995.
[Powley;Ferguson,yKorf, 1993]Powley,c.; Ferguson,c., yKorf,R, Depth-FirstHeuristicSearchon
aSIMDMachine,Artificiallntelligence,60:199-242, 1993.
[Pradhan,etal., 1994]Pradhan,M.;Provan,G.;Middleton,B.,yHenrion,M., KnowledgeEngineeringfor
LargeBeliefNetworks,deProceedingsof the Tenth Conferenceon UncertaintyinArtificiallntelli-
gence, pp. 484-490,SanFrancisco: MorganKaufmann, 1994.
...&...
426 Bibliografa
[Prawitz, 1965] Prawitz, D., Natural Deduction: A ProofTheoretical Study, Stockholm: Almquist and Wik-
sell, 1965.
[Prieditis, 1993] Prieditis, A, Machine Discovery of Effective Admissible Heuristics: Machine Leaming,
12(1-3): 117-141,1993.
[Purdom, y Brown, 1987] Purdom, P. W., Jr., y Brown, C., Polynornial Average-Time Satisfiability Pro-
blems, Information Science, 41:23-42, 1987.
[Puterman, 1994] Puterman, M., Markov Decision Processes-Discrete Stochastic Dynamic Program-
ming, New York: John Wiley & Sons, 1994.
[Quinlan, 1979] Quinlan, J., Discovering Rules from Large Collections of Examples: A Case Study, de
Michie, D. (ed.), Expert Systems in the Microelectronic Age, Edinburgh: Edinburgh. University Press,
1979.
[Quinlan, 1990] Quinlan, J. R, Learning Logical Definitions from Relations, Machine Leaming,
5(3):239-266, 1990.
[Quinlan, 1993] Quinlan, J. R, C4.5: Programsfor Machine Leaming, San Francisco: Morgan Kaufmann,
1993.
[Ramadge, y Wonham, 1989] Ramadge, P., y Wonham, M., The Control of Discrete Event systems, Proc.
ofthe IEEE, 77(1):81-93,1989.
[Reichardt, 1965] Reichardt, W., On the Theory of Lateral Nervous Inhibition in the Complex Eye of
Limulus, Progress in Brain Research, 17:64-73, 1965
[Reiter, 1980] Reiter, R, A Logic for Default Reasoning, ArtificialIntelligence, 13(1-2):81-132, 1980.
[Reiter, 1991] Reiter, R, The Frame Problem in the Situation Calculus: A Simple solution (Sometimes)
and a Completeness Result for Goal Regression, de Lifschitz, V. (ed.), Artificial Intelligence and Ma-
thematical Theory of Computation: Papers in Honor ofJohn McCarthy, pp. 359-380, New York: Aca-
demic Press, 1991.
[Reitman, y Wilcox, 1979] Reitman, W., y Wilcox, B., The Structure and Performance of the INTERIM.2
Go Program, de Proceedings of the Sixth Intemational Joint Conference on Artificial Intelligence
(lJCA/-79), pp. 711-719, San Francisco: Morgan Kaufmann, 1979.
[Resnick, 1993] Resnick, M., Behavior Construction Kits, Communications of the ACM, 36(7):64-71,
julio, 1993.
[Rich, y Knight, 1991] Rich, E., y Knight, K., Artificial Intelligence (2." ed.), New York: McGraw-Hill,
1991.
[Rissanen, 1984] Rissanen, J., Universal Coding, Information, Prediction, and Estimation, IEEE Tran-
sactions on lnformation Theory, IT-30(4):629-636, 1984.
[Rivest, 1987] Rivest, R, Learning Decision Lists, Machine Leaming, 2, 229-246,1987.
[Rivest, y Schapire, 1993] Rivest, R, y Schapire, R, Inference of Finite Automata U sing Homing Sequen-
ces, Information and Computation, 103(2):299-347, 1993.
[Roberts, 1963] Roberts, L., Machine Perception ofThree-Dimensional Solids, Tech. Report 315, MIT Lin-
coln Laboratory, Ph. D. dissertation, Massachusetts Institute ofTechnology, 1963.
[Robinson, 1965] Robinson, J. A., A Machine-Oriented Logic Based on the Resolution PrincipIe, Jour-
nal ofthe Associationfor Computing Machinery, 12(1):23-41, 1965.
[Rohwer, y Forrest, 1987] Rohwer, R, y Forrest, B., Training Time-Dependence in Neural Networks, de
Caudill, M., y Butler, C. (eds.), IEEE First Intemational Conference on Neural Networks, San Diego,
1987, vol. 11, pp. 701-708, New York: IEEE, 1987.
[Rosenblatt, 1962] Rosenblatt, E, PrincipIes ofNeurodynamics, Washington, DC: Spartan Books, 1962.
[Rosenschein, y Kae1bling, 1995] Rosenschein, S., y Kaelbling, L., A Situated View of Representation and
Control, Artificial Intelligence, 73: 149-173, 1995.
[Rosenbloom; Laird, y Newell, 1993] Rosenbloom, P.; Laird, J., y Newell, A., (eds.), The Soar Papers:
Research on Integrated Intelligence, vols. 1 y 2, Cambridge, MA: MIT Press, 1993.
[Ross, 1988] Ross, S., A First Course in Probability, (3." ed.), London: Macmillan, 1988.
[Roussel, 1975] Roussel, P., PROLOG: Manual de Reference et d'Utilization, Technical Report, Uni-
versit Aix-Marseille 11, Groupe d'Intelligence Artificielle, France, 1975.
[Rumelhart, et al., 1986] Rumelhart, D. E.; Hinton, G. E., YWilliams, R J., Learning Internal Represen-
tations by Error Propagation, de Rumelhart, D. E., YMcClelland, J. L. (eds.), Parallel Distributed
Processing, vol. 1., pp. 318-362, 1986.
1)
;'
l
I
Bibliografa 427
[Russell, 1997] Russell, S., Rationality and Intelligence, Artificial Intelligence, (94)1 :57-77,1997.
[Russell, y Norvig, 1995] Russell, S., y Norvig, P., Artificial Intelligence: A Modem Approach, Englewood
Cliffs, NJ: Prentice Hall, 1995. (La edicin revisada apareci en 1998.)
[Russell, y Wefald, 1991] Russell, S., y Wefald, E., Do the Right Thing, Cambridge, MA: MIT Press, 1991.
[Sacerdoti, 1974] Sacerdoti, E., Planning in a Hierarchy of Abstraction Spaces, Artificial Intelligence,
5(2):115-135, 1974. (Reimpreso por Allen, J.; Hendler, J., y Tate, A. (eds.), Readings in Planning, pp.
98-108, San Francisco: Morgan Kaufmann, 1990.)
[Sacerdoti, 1975] Sacerdoti, E., The Non-linear Nature of Plans, de Proceedings of the Fourth Intema-
tional Joint Conference on Artificial Intelligence (UCAI-75), pp. 206-214, San Francisco: Morgan
Kaufmann, 1975. (Reimpreso por Allen, J., Hendler, J., y Tate, A. (eds.), Readings in Planning, pp.
162-170, San Francisco: Morgan Kaufmann, 1990.)
[Sacerdoti, 1977] Sacerdoti, E., A Structurefor Plans and Behavior, New York: American Elsevier, 1977.
[Sadek, et al., 1996] Sadek, M.; Ferrieux, A.; Cozannet, A.; Bretier, P.; Panaget, E, y Simonin, J., Effec-
tive Human-Computer Cooperative Spoken Dialogue: The AGS Demonstratof, de Proc. ICSLP'96
Intemational Conf on Spoken Language Processing, pp. 546-549, Philadelphia, PA, octubre, 1996.
[Samuel, 1959] Samue1, A. L., Sorne Studies in Machine Learning Using the Game ofCheckers, IBM
Jour. R & D, 3:211-229, 1959. (Reimpreso por Feigenbaum, E., y Feldman, J. (eds.), Computers and
Thought, pp. 71-105, New York: McGraw-Hill, 1963.)
[Samuel, 1967] Samuel, A. L., Sorne Studies in Machine Learning Using the Game of Checkers 11-
Recent Progress, IBM Jour. R & D, 11(6),601-617, 1967.
[Schaeffer, 1997] Schaeffer, J., One Jump Ahead: Challenging Human Supremacy in Checkers, New
York: Springer-Verlag, 1997.
[Schaeffer, et al., 1992] Schaeffer, J.; Culberson, 1.; Tre1oar, N., y Knight, B., A World Championship Cali-
ber Checkers Program, Artificial Intelligence, 53(2-3):273-289, 1992.
[Schaeffer, y Lake, 1996] Schaeffer, J. y Lake, R, Solving the Game of Checkers, de Nowakowski, R J.
(ed.), Games ofNo Chance, pp. 119-133, Cambridge: Cambridge University Press, 1996.
[Scherl, y Levesque, 1993] Scherl, R, y Levesque, H., The Frame Problem and Knowledge Producing
Actions, de Proceedings of the Eleventh National Conference on Artificial Intelligence (AAAI-93), pp.
689-695, Menlo Park, CA: AAAI Press, 1993.
[Schoppers, 1987] Schoppers, M. J., Universal Plans for Reactive Robots in Unpredictable Domains, de
Proceedings ofthe Tenth Intemational Joint Conference onArtificial Intelligence (UCA/-87), pp. 1039-
1046, San Francisco: Morgan Kaufmann, 1987.
[Schraudolph; Dayan, y Sejnowski, 1994] Schraudolph, N.; Dayan, P., y Sejnowski, T., Temporal Diffe-
rence Position Evaluation in the Game of GO, de Cowan, J., et al. (eds.), Advances in Neural Infor-
mation Processing Systems, 6, pp. 817-824, San Francisco: Morgan Kaufmann, 1994.
[Schubert, 1990] Schubert, L., Monotonic Solution of the Frame Problem in the Situation Calculus: An
Efficient Method for Worlds with Fully Specified Actions, de Kyberg, H.; Loui, R, y Carlson, G.
(eds.), Knowledge Representation and Defeasible Reasoning, pp. 23-67, Boston: Kluwer Acadernic
Publishers, 1990.
[Schultz; Dayan, y Montague, 1997] Schultz, w.; Dayan, P., y Montague, P. R., A Neural Substrate for Pre-
diction and Reward: Science, 275:1593-1599, 14 de marzo, 1997.
[Schwartz, 1987] Schwartz, J., The Limits of Artificial Inte1ligence, de the Encyclopedia ofArtificial Inte-
lligence, New York: John Wiley & Sons, 1987.
[Searle, 1969] Searle, J., Speech Acts: An Essay in the Philosophy of Language, Cambridge: Cambridge
University Press, 1969.
[Searle, 1980] Searle, J., Minds, Brains, and Programs, TheBehavioral and Brain Sciences, 3:417-457,
1980 (con comentarios). (Reimpreso por Hofstadter, D. R, YDennett, D. C. (eds.), The Mind's Eye:
Fantasies and Reflections on Self and Soul, pp. 351-373, New York: Basic Books, 1981.)
[Searle, 1992] Searle, J., The Rediscovery of the Mind, Cambridge, MA: MIT Press, 1992.
[Sejnowski, y Rosenberg, 1987] Sejnowski, T., y Rosenberg, C., Paralle1 Networks That Learn to Pro-
nounce English Text, Complex Systems, 1: 145-168, 1987.
[Se1man, y Kautz, 1991] Se1man, B., y Kautz, H., Knowledge Compilation Using HornApproximations,
de Proceedings ofthe Ninth National Conference on Artificial Intelligence (AAAl-91), pp. 904-909,
428 Bibliografa
[Selman,yKautz, 1993] Selman,B.,yKautz,H., AnEmpiricalStudyofGreedyLocalSearchforSatis-
fiability Testing, de Proceedings of the Eleventh National Conference on Artificiallntelligence
(AAAI-93), pp.46-51,MenloPark:, CA:AAAIPress, 1993.
[Selman;Kautz,yCohen, 1994]Selman,B.,Kautz,H.,yCohen,B.,NoiseStrategiesforhnprovingLocal
Search, de Proceedings of the Twelfth National Conference on Artificiallntelligence (AAAI-94),
pp.337-343,Menl0Park:, CA:AAAIPress, 1994.
[Selman; Kautz, yCohen, 1996]Selman,B.,Kautz, H.,yCohen, B.,LocalSearchStrategiesfor Satis-
fiabilityTesting,deDu,D.;Gu,J.,yPardalos,P. (eds.),Satisfiability Problem: Theory andApplica-
tions, voL 35,DimacsSeriesinDiscreteMathernaticsandTheoreticalComputer Providence,
RI: AmericanMathematicalSociety, 1996.
[Selman,yLevesque, 1990)Selman,B.,yLevesque, H., AbductiveandDefaultReasoning:ACompu-
tationalCore,deProceedings ofthe Eighth National Conference on Artificiallntelligence (AAAI-90),
pp. 343-348,MenloPark,CA:AAAIPress, 1990.
[Selman;Levesque,yMitchell,19921 Selman,B.,Levesque,H.,yMitchell,D., ANewMethodforSol-
vingHard SatisfiabilityProblems,deProceedings of the Tenth National Conference on Artificiallnte-
lligence (AAAl-92), pp.440-446,MenloPark,CA:AAAIPress, 1992.
[Shachter, y Kenley, 1989] Shachter, R., y Kenley, c., Gaussian Influence Diagrams, Management
Science, 35:527-550,1989.
[Shafer, 1979] Shafer;G.,A Mathematical Theory ofEvidence, Princeton,NJ: PrincetonUniversityPress,
1979.
[Shafer,yPearl, 1990]Shafer;G.,yPearl,J. (eds.),Readings in Uncertain Reasoning, SanFrancisco: Mor-
ganKaufmann, 1990.
[Shanahan, 1997]Shanahan,M.,Solving the Frame Problem: A Mathematicallnvestigation of the Com-
monsense Law ofInertia, Cambridge,MA:MITPress, 1997.
[Shannon, 1950] Shannon, C., ProgrammingaComputerfor PlayingChess, Phlosophical Magazine
(Series7),voL 41,pp.256-275,1950,
[Shannon, yMcCarthy, 1956]Shannon,c., yMcCarthy,J.(eds.),Automata Studies, Annals of Mathema-
tical Studies, 34,Princeton,NJ: PrincetonUniversityPress, 1956.
[Shapiro, 1992]Shapro,S.,Encyclopedia ofArtificiallntelligence, vols. 1and2(2."ed.),NewYork: John
Wiley& Sons, 1992.
[Shavlik,yDietterich, 1990] Shavlik,J., yDietterich,T. (eds.),Readings in Machine Leaming, SanFran-
cisco: MorganKaufmann, 1990.
[Shen, 19941 Shen,W.-M.,Autonomous Leaming from the Environment, SanFrancisco:W. H. Freeman,
1994.
[Shirai, 1987]Shirai,Y., Three-Dimensional Computa Vision, Berlin: Springer-Verlag, 1987.
I
, [Shoham, 1987]Shoham,Y., TemporalLogicsinAl: SemanticalandOntologicalConsiderations,Arti-
ficialIntelligence, 33(1):89-104,1987.
[Shoham, 1988]Shoham,Y., Reasoning about Change: Time and Causationfrom the Standpoint ofArtifi-
ciallntelligence, Cambridge,MA: MITPress, 1988.
[Shoham, 1993] Shoham,Y., Agent-OrientedProgramming,Artificiallntelligence, 60:51-92,1993.
[Shoham, 1994] Shoham,Y., Al Programming in PROLOG, SanFrancisco:MorganKaufmann, 1994.
[Shoham, 1996]Shoham,Y., TheOpenScientificBordersofAl,and theCaseofEconomics,ACM Com-
puting Surveys, 28(4):l1ff,diciembre, 1996.
[Shortliffe, 1976]Shortliffe,E.H.,Computer-Based Medical Consultations: MYCIN, NewYork: Elsevier,1976.
[Shrobe, 1988)Shrobe,H. (ed.),Exploring Artificiallntelligence: Survey Talksfrom the National Confe-
rence on Artificiallntelligence, SanFrancisco:MorganKaufmann, 1988.
[Skolem, 1920]Skolem,T., Logisch-kombinatorischeUntersuchungenberdieErfllbarkeitoderBeweis-
barkeitMathematischerSatzeNebsteinemTheoremeberdieDichteMengeID>, VuJenskapsselskapets
Skrifter; 1, Matematisk-naturvidenskabelig Klasse, 4, 1920.
[Slate,yAtkin, 1977] Slate,D.,yAtkin,L.,Chess4.5-TheNorthwestemUniversityChessProgram,
deFry,P. (ed.), Chess Skill in Man and Machine, pp. 82-118,NewYork: Springer-Verlag, 1977.
[Slagle, 1963] Slagle,1. R., AHeuristicProgramThatSolvesSymbolicIntegrationProblemsinFreshman
Calculus,JOUT. Assoc. ofComp. Mach., 10:507-520, 1963.TambinenFeigenbaum,E.,yFeldman,
J. (eds.), Computers and Thought, pp. 191-203,NewYork: McGraw-Hill, 1963.
Bibliografa 429
[Slagle,yDixon, 1969]Slagle,1., yDixonJ., ExperimentswithSomeProgramsthatSearchGameTrees,
JOUT. Assoc. Comp. Mach., 16:2:189-207, 1969.
[Smith, 1989] Smith, D. B., Controlling Backward Inference, Artificiallntelligence, 39(2):145-208,
1989.
[Smith;Genesereth,yGinsberg, 1986] Smith,D. B.; Genesereth,M., yGinsberg,M., ControllingRecur-
siveInference:Artificiallntelligence, 30(3):343-389, 1986.
[Soderland,yWeld, 1991]Soderland,S., yWeld, D., EvaluatingNonlinearPlanning,TechnicalReport
TR-91-02-03,UniversityofWashingtonDepartmentofComputerScienceandEngineering,Seattle,
WA,1991.
[Sowa, 1991]Sowa,J.(ed,),Principies ofSemantic Networks, SanFrancisco: MorganKaufmann, 1991.
[Spirtes,yMeek, 1995]Spirtes,P., yMeek,c., LearningBayesianNetworkswithDiscreteVariablesfrom
Data,deProceedings ofFirst Internatlonal Conference on Knowledge Discovery and Data Mining,
SanFrancisco:MorganKaufmann, 1995.
[Stallman,ySussman, 1977] Stallman,R, ySussman,G., ForwardReasoningandDependency-Directed
BacktrackinginaSystemforComputer-AidedCircuitAnalysis,Artificiallntelligence, 9(2):135-196,
1977.
[Stanfill,yWaltz, 1986]Stanfill,c., yWaltz,D., TowardMemory-BasedReasoning, Communications of
the ACM, 29(12):1213-1228,1986.
[Steftk, 1995]Steftk,M.,Introduction to Knowledge Systems, SanFrancisco;MorganKaufmann, 1995.
[Stentz, 1995] Stentz,A., TheFocussedD*AlgorithmforReal-TimeReplanning,deProceedings ofthe
Fourteenth International Joint Conference on Artificiallntelligence (IJCAl-95), pp. 1652-1659;San
[Stentz,yHebert, 1995] Stentz,A., yHebert,M.,ACompleteNavigationSystemforGoalAcquisitionin
UnknownEnvironments,Autonomous Robots, 2(2):127-147,1995.
[Sterling,yShapiro, 1986] Sterling,L., yShapro,E., The Art ofPROLOG, Cambridge,MA: MITPress,
1986.
[Stickel, 1985]StickelM., AutomatedDeductionbyTheoryResolution,Joumal ofAutomated Reaso-
ning, 1(4):333-355, 1985.
[Stickel, 1988] Stickel,M., APROLOGTechnologyTheoremProver: hnplementationby anExtended
PROLOGCompilen>,Joumal ofAutomated Reasoning, 4;353-380, 1988.
[Stickel, yTyson, 1985] Stickel M., yTyson, M., AnAnalysis ofConsecutively BoundedDepth-First
SearchwithApplicationsinAutomatedDeduction,deProceedings ofthe Ninth Intemational Joint
Conference on Artificial Intelligence (/JCAl-85), pp. 1073-1075,SanFrancisco: MorganKaufmann,
1985.
[Strat, 1992]Strat,T.,Natural Object Recognition, Berln: Springer-Verlag, 1992.
[Sussman, 1975] Sussman, G., A Computer Model of Skill Acquisition, Amsterdam: Elsevier/North-
Holland, 1975.
[Sutton, 1988]Sutton,R.,LearningtoPredictbytheMethodsofTemporalDifferences,Machine Lear-
ning, 3:9-44,1988.
[Sutton, 1990)Sutton,R., IntegratedArchitecturesforLearning,Planning,andReactingBasedonAppro-
ximatingDynamicProgramming,deProceedings ofthe Seventh International Conference on Machi-
ne Leaming, pp. 216-224,SanFrancisco: MorganKaufmann, 1990.
[Tarski, 1935) Tarski, A., DieWahrheitsbegriffin den FormalisiertenSprachen, Studia Philosophica,
1:261-405,1935.
[Tarski, 1956]Tarski,A, Logic, Semantics, Metamathematics: Papas from 1923to 1938, Oxford:Oxford
UniversityPress, 1956.
[Tate, 1977]Tate,A., GeneratingProjectNetworks,deProceedings ofthe Fifth International Joint Con-
ference on Artificiallntelligence (/JCAl-77), pp. 888-893,SanFrancisco: MorganKaufmann, 1977.
(ReimpresoporAlIen,1.;Hendler,1.,yTate,A. (eds.),Readings in Planning, pp. 291-296, SanFran-
cisco:MorganKaufmann, 1990.)
[Tate, 1996]Tate,A. (ed.),Advanced Planning Technology, The Technological Achievements ofthe ARPA!
Rome Laboratory Planning Initiative, MenloPark,CA:AAAIPress,mayo, 1996.
[Teller, 1994]TelIer,A., TheEvolutionofMentalModels,deKinnear,K, Jr. (ed.),Advances in Genetic
Programming, Cap.9,Cambridge,MA: MITPress, 1994.
Ir'
430 Bibliografa
-
[Tenenberg, 1991] Tenenberg, 1, Abstraction in Planning, de AlIen, 1; Kautz, H.; Pelavin, R, y Tenen-
bel'g, J. (eds.), Reasoning about PIans, Cap. 4, San Francisco: Morgan Kaufmann, 1991.
[Tesauro, 1992] Tesauro, G., Practical Issues in Temporal Difference Leaming, Machine Learning, 8,
ntns. 3/4:257-277, 1992.
[Tesauro, 1995] Tesauro, G., Temporal-Difference Learning and TD-Gammon, Comm. ACM, 38(3):58-
68, marzo, 1995.
[Theralllaz, y Bonabeau, 1995] Theraulaz, G., y Bonabeau, B., Coordination in Distributed Building,
Science, 269:686-688,4 de agosto de 1995.
[Thorpt!, et al., 1992] Thorpe, c.; Hebert, M.; Kanade, T., y Shafer, S., The New Generation system for the
C:tv(U Navlab, de Masaki, I. (ed.), Vision-Based Vehicle Guidance, pp. 30-82, Berlin: Springer-Verlag,
1992.
[Towell, y Shavlik, 1992] TowelI, G., y Shavlik, 1, Interpretation of Artificial Neural Networks: Mapping
Knowledge-Based Neural Networks into Rules, de Moody, J.; Hanson, S., y Lippmann, R (eds.),
Ad\Jances in Neural Informaton Processing Systems, 4, pp. 977-984, San Francisco: Morgan Kauf-
mann, 1992.
Shavlik, y Noordweier, 1990] Towell, G.; Shavlik, 1, y Noordweier, M., Refinement of Appro-
Xl!llate Domain Theories by Knowledge-Based Artificial Neural Networks, en Proceedings of the
E1lthth National Conference on Artificial Intelligence (AAAI-90), pp. 861-866, Menlo Park, CA:
AAAI Press, 1990.
[Tracy, y Bouthoom, 1997] Tracy, K., y Bouthoom, P., Object-OrentedArtificial Intelligence Using C++.
Ne\v York: Computer Science Press, 1997.
[Trappl, 1986] Trappl, R, Impacts ofArtificial Intelligence: Scientific, Technological, Military, Economic,
Soeetal, Cultural, and Political, New York: North-Holland, 1986.
[Turing, 1950] Turing, A. M., Computing Machinery and Intelligence, Mind, 59:433-460, 1950. (Reim-
preso por Feigenbaum, E., y Feldman, J. (eds.), Computers and Thought, pp. 11-35, New York:
MCGraw-HilI, 1963.)
[Tversk.y, y Kahneman, 1982] Tversky, A, y Kalmeman, D., Causal Schemata in Judgements under
de Kahneman, D., Slovic, P., y Tversky, A. (eds.), Judgements under Uncertainty:
Hettristics and Biases, Cambridge: Cambridge University Press, 1982.
[Ullmatt, 1988] UlIman, J. D., PrincipIes ofDa/abase and Knowledge-Base Systems, vol. 1: Classical Data-
ba&e Systems, New York: Computer Science Press, 1988.
[Ullmatt, 1989] Ullman, 1 D., PrincipIes ofDatabase and Knowledge-Base Systems, vol. II: The New Tech-
nol()gies, New York: Computer Science Press, 1989.
[Unger, 1989] Unger, S., The Essence ofLogic Crcuils, Englewood Cliffs, NJ: Prentce Hall, 1989.
[Venn: 1880] Venn, J., On the Diagrammatic and Mechanical Representation of Propositions and Reaso-
.mngs, Phil. Mag., pp. 123ff, 1880.
[Wrubel, y Lee, 1990] WaibeI, A., y Lee, K.-F. (eds.), Readings in Speech Recogniton, San Francisco: Mor-
gBl\ Kaufmann, 1990.
et al., 1988] Waibel, A; Hanazawa, T.; Hinton, G.; Shikano, K., y Lang, K., Phoneme Recogni-
tlO1): Neural Netwod::s versus Hidden Markov Models, de Proc. ofthe International Conf on Acous-
tics:, Speech and Signal Processing, New York, 1988.
[Waldil\ger, 1975] Waldinger, R, Achieving Several Goals Simultaneously, de Elcock, B., y Michie, D.
(eds .), Machine Intelligence 8, pp. 94-138, Chichester, England: EIlis Horwood. 1975.
[Walter, 1953] Walter, Go., The Living Brain, New York: Norton and Company, 1951
[Waltz, 1975] Waltz, D., Understanding Une Drawings of Scenes with Shadows, de Winston, P. (ed.),
Psychology ofComputer Vision, pp. 19-91, New York: McGraw-Hill, 1975.
[Wang, 1995] Wang, X., Leaming by Observation and Practice: An Incremental Approach for Plruming
Acquisition, de Proceedngs ofthe Twelfth Interna/onal Conference on Machine Learnng,
pp. 549-557, San Francisco: Morgan Kaufmann, 1995.
[Warrel\; Pereira, y Pereira, 1977] Warren, D.; Pereira, L., y Pereira, F., PROLOG: The Language and Its
. Imt>lementation Compared with LISP, SIGPIAN Notices, 12(8):109-115, 1977.
[Welss, y Kulikowski, 1991] Weiss, S., y Kulikowski, e, Computer Systems That Learn, San Francisco:
Mo.rgan Kaufmann. 1991.
[Weizel\baum, 1965] Weizenbaum, J., ELIZA -AComputer Program for the Study of Natural Language
Bibliografa 431
Communication between Man and Machine, Communcations of the Association for Computing
Machinery, 9(1):36-45.1965.
[Weizenbaum, 1976] Weizenbaum, J., Computer Power and Human Reason: From Judgment to Calcula-
ton, New York: W. H. Freeman, 1976.
[Weld, 1994] Weld, D., An lntroduction to Least Commitment Planning: Al Magazine, 15(4):27-61,
1994.
[Weld, y de Kleer, 1990] Weld, D., y de Kleer, J., Readings in Qualitative Reasoning about Physical Sys-
tems, San Francisco: Morgan Kaufmann, 1990.
[Wellman, 1990] WelIman, M., Fundamental Concepts of Qualitative Probabilistic Networks, Artificial
Intelligence,44:257-303, 1990.
[Wellman, 1996] WelIman, M., Market-Oriented Programming: Some Early Lessons, in Clearwater, S.
(ed,), Market-Based Control -A Paradigm for Distributed Resource Allocation, Singapore: World
Scientfic, 1996.
[Werbos, 1974] Werbos, P., Beyond Regression: New Tools for Prediction and Analysis in the Behavioral
Sciences, Ph. D. Thesis, Harvard University, 1974.
[Weyhrauch, 1980] Weyhrauch, R, Prolegomena to a Theory of Mechanized Fonnal Reasoning, Artifi-
cialIntelligence, 13(1-2):133-170, 1980.
[Whitehead; Karlsson, y Tenenberg, 1993] Whitehead, S.; Karlsson, J., y Tenenberg, J., Leaming Multiple
Goal Behavior via Task Decomposition and Dynamic Policy Merging, de Connell, J., y Mahadevan,
S. (eds.), Robot Learning, Cap. 3, Boston: Kluwer Academic Publishers, 1993.
[Widrow, y Hoff, 1960] Widrow, B., y Hoff, M. B., Adaptve Switching Circuits, 1960 IRE WESCON
Convention Record, pp. 96-104, New York, 1960.
[Widrow, 1962] Widrow, B., Generalization and Infonnaton Storage in Networks of Adaline "Neu-
rons", de Yovitz, M.; Jacobi, G., y Goldstein, G. (eds,), Self-Organizing Systems. 1962, pp. 435-461,
Washington, DC: Spartan Books, 1962.
[Wiener, 1948] Wiener, N., Cybernetics: Control and Communication in the Animal and in the Machne,
New York: John Wiley & Sons, 1948.
[Wilkins, 1988] Wilkins, D. B., Practical Planning: Extending the Classcal Al Planning Paradigm, San
Francisco: Morgan Kaufmann, 1988.
[Wilkins, et al., 1995] Wilkins, D. E.; Myers, K.; Lowrance, 1, y Wesley, L., Planning and Reacting in
Uncertain and Dynamic Domains: Journal of Experimental and Theoretical Artificial Intelligence.
7(1):197-227,1995.
[Wilson, 1991] Wilson, S., The Animat Path to Ab, de Meyer, J. A, YWilson, S. (eds.), FromAnmals to
Animats; Proceedings of the First International Conference on the Simulaton ofAdaptve Behavior,
Cambridge, MA: MlT PresslBradford Books, 1991 .
[Winograd, 1972] Winograd, T., Understanding Natural Language, New York: Academic Press, 1972.
[Winograd, y Flores, 1986] Winograd, T., y Flores, F., Understanding Computers and Cognition: A New
Foundaton for Design, Norwood, NJ: Ablex, 1986. (Cuatro revisiones aparecidas en Artificial Inte-
lligence, 31(2):213-261,1987.)
[Wooldridge, 1968] Wooldridge, D., Mechanical Man: The Physical Basis of Intelligent Life, New York:
McGraw-Hill, 1968.
[Woods, 1970] Woods, W., Transition Network Grammars for Natural Language Analysis, Communi-
catons ofthe Associationfor Computing Machinery, 13(10):591-606, 1970.
[Woods, 1973] Woods, W., Progress in Natural Language Understanding: An Applicaton to Lunar Geo-
logy, deAFIPS Conf Proc., vol. 42, pp. 441-450,1973.
[Wos, 1993] Wos, L., Automated Reasoning Answers Open Questions, Notices ofthe AMS, 5(1):15-26,
enero, 1993.
[Wos; Carson, y Robinson, 1965] Wos, L.; Carson, D.; y Robinson, G., Efficiency and Completeness of
the Set-of-Support Strategy in Theorem Proving, Journal of the Association for Computing Machi-
nery, 12:536-541, 1965 .
[Wos, y Robinson, 1968] Wos, L., y Robinson, G., Paramodulation and Set of Support, de Proc. of the
IRIA Symposium onAutomatic Demonstration, pp. 276-310, Berln: Springer-Verlag, 1968.
[Wos, y Winker, 1983] Wos, L., y Winker, S., Open Questions Solved with the Assistance of AURA, de
Bledsoe, W., y Loveland, D. (eds.), Automated Theorem Proving: After 25 Years: Proceedings ofthe
432 Bibliografa
Special Session ofthe 89th Annual Meeting ofthe American Mathematieal Society, pp.71-88,Denver,
Colorado:AmericanMathematicalSociety, 1983.
[Wos, et al., 1992]Wos, L.;Overbeek,R.; Lusk,E.,yBoyle,J.,Automated Reasoning: lntroduetion and
Applications, (2."ed.),NewYork: McGraw-Hill, 1992.
[Zadeh, 1975] Zadeh,L.,FuzzyLogicandApproximateReasoning,Synthese 30,pp.407-428,1975.
[Zadeh, 1978]Zadeh,L., FuzzySetsasaBasisforaTheoryofPossibility,Fuzz:y Sets and Systems, 1 :3-
28,1978.
[Zhu;Wu,yMumford, 1998] Zhu,S. c.;Wu,Y., yMumford,D.,FRAME:Fi1ters,RandomFields,and
Maximum Entropy Towards a Unified Theory for Texture Modeling, lnt'l Joumal of Computer
Vision.
[Zobrist, 1970]Zobrist,A.,Feature Extraetion and Representaton for Pattem Reeognition and the Game
ofGo, Ph.D.Dissertation,UniversityofWisconsin, 1970.
[Zweben,yFox, 1994]Zweben,M.,y Fox,M. (eds.),lntelligent Scheduling, SanFrancisco:MorganKauf-
mann,I994.
'}.. (tomo,literal), 207
S- (casosnegativosdelconjuntodeentrenanento),
260
S+ (casospositivosdelconjuntodeentrenanento),
260
A Yv (conectivasbinarias),205
A (conjuncin), 198
r y (conjuntodetbfs), 198
9t: (conjuntodereglasdeinferencia),203
1= (consecuencialgica),203,219
.3 (cuantificadorexistencial),221
\1 (cuantificadoruniversal),221
1- (deriva), 199
v (disyuncin), 197,206
== (equivalencia),202
:::) (implicacin), 197
A (introduccindelaconjuncin), 198
...., (negacin), 197
K (operadormodal),371
1- Y1= (smbolosmetalingsticos),205
A*
admisibilidadde, 131-134
descensoiterativo(OlA*), 138
,
Indice
entiemporeal(TRA *),153
noinformado, 134
Abramson,B., 171,407
abstracciones(paraplanificadoresjerrquicos),360
ABSTRIPS,355-356
accin(es)
debajonivel(ABN),401
denivelintermedio(ANl),401,402
efectoslocalesde, 330
operadorescorrespondientesa, 338
ypercepcin, 19-24
actasdecongresosdelApublicadas, 14
actitudintencional,370-371
activacin(entradasigmoide),42
acto(s)
comunicativo,379
dehabla,379-380
implementacindelos,381-382
indirecto,380
planificacinde,380
tiposde, 380
representativo,380
Adaline(elementolinealadaptativo),34
admisibilidaddeA*, 131-134
agente(s), 10
basedeconocimiento,200,219
433
434 ndice
agente(s), 10(Cont.)
comunicacinentre,367,379-397
conconocimientoacercadelmundo,220,223-224
conhistresis,71
conobjetivosyplanes, 11
deestmulo-respuesta(E-R), 19-32
dejuguete,10
evolucinincrementaldelos, 10, 13
lgicamenteomnisciente,373
modelaraotro,367
mltiples,367-377
percibir/planificar/actuar, 148-149
preverlasaccionesdeotros,375
quededucenyrazonan, 11
queinteractan,367-368
queplanifican, 105-113,325-364
querazonan, 11
reactivos, 11
recompensaspositivasynegativasparaun, 158-159
tropistas, 31
Agre,P., 160,225,396
agrupamiento(denodosderedesbayesianas),304
AlMagazine, 14
ajustefuncional,48
Albus,James, 1,404,407
alcancedelobjetivoensistemasdeproduccin,26
lgebrabooleana,23
algoritmoadmisible, 134
algoritmo(s)
A*,128-139
eficienciadel, 142
AGDV,259,262
Anytime, 149
AO*,266
deanlisisascendente(gramticas),385-386
debsqueda
relacinentrelos, 135
sobregrafos, 127-139
descendentes(engramticas),385
genricodivideyvencers(AGDV),259
genticos(AG),54
RETE, 246,248
UNIFICAR,229
AlIen,James,273,360,396,407
Almeida,L.B.,50,407
Aloimonos,Y., 91,407
ambigedad(es)
lxicas,393-394
referencial, 394
sintctica,394
utilizacindel conocimientopararesolver, 393-
394
anfora, 392
anlisis
decomplejidad
del STRIPS,360
deescenas,78-80,91-96
interpretacindelneasycurvas,92-94
poretiquetadodelneas,92
puntodevistageneral,92
visinbasadaenmodelos,94-96
demediosyfines, 341
morfolgico,395
semntico,386-390
sintctico(engramticas),385
analogas(enelrazonamientohumano),280
Anderson,T., 12,407
Andre,David,58,62,407,419
anomaladeSussman,344
antecedentedeunaimplicacin, 198
antecesor
deunnodo(engrafos), 111
deunaclusula,212
apoyocausalyevidencial(polirboles),299-302
Appelt,D.,382,408,415
aprendizaje
computacional,33
conrefuerzoretardado, 159
defuncionesdeevaluacin, 155-158, 189-190
defuncionesheursticas, 155-158
deinformacindecontrol,359
delaestructuradeunaredbayesiana,312-316
demapas,71
deplanes,357-359
deredesneuronales, 33-52
dereglas,256-265
delgicadepredicados,260-264
enclculodepredicados,256-259
enlgicadeprimerorden,260-264
deductivodereglas,255,264-265
ndice 435
aprendizaje(Cont.)
delmodeloa actuacin,359
diferidoeneltiempo, 157
enredesbayesianas,309-316
factorde, 37
inductivodereglas,255
losdostiposprincipalesde, 255
procesodesupervisado,34
supervisado,34
aproximacin(es)
alalAbasadasenelprocesamientosimblico,5
dereparacin, 169
subsimblicasalalA,6
rbol
deanlisissemntico,390
dedecisin,50
dedemostracin, 199,254
deexpansin, 112, 154
mnimo, 113
dejugadas
capadeprofundidadk de, 177
evaluarel, 178
paraunjuegodecompeticin, 188
dirigido, 111
nodirigido(grafo), 111
Y/O,244,253,266
arco(s), 111, 112,244,276
deamenaza
enelgrafodeestructura,353
resuelto,354
deemparejamiento,244
dereglas,244
derestriccin, 166
aridad,216
arista(grafos), 111
Aristteles,7
arquitectura(s)
deagente, 148,399-406
depizarra,69
depercepcin/planificacin/actuacin, 148
desubsuncin,29-30
detresmdulos,403-404
detresniveles,400-402
horizontal,29
ArsMagna,7
ASCENSION DE COLINAS, 172-174
Ash,D.,416
AsociacinAmericanaparalalA(AAAI), 14
asociacinsemntica,238
asuncin
delmundocerrado(AMC),280
markoviana,322
Atkeson,e., 160,423
Atkin,L., 186,428
tomos
(frmulasatmicas),217
VerdaderooFalso,200-201
atributosdelaimagen,90
autmatassituados,7
autonoma, 12
axioma(s)
deconocimiento,372-374
deefectopositivo, 329
deefectosnegativos, 329
deestadosucesor, 334
deintrospeccinpositiva, 373
demarco,330-332
negativo,331
positivo,331
distributivo,373
Bacchus,F., 160,408
Backgammon, 187, 189-190
Backus-Naur,forma(BNF),383
bacteriaHaemophilusinfluenzae,2
BacterigrafoE6,2
Baker,A., 334,408
Bakiri,G.,42,411
Ballard,D.H., 90,91,96,99,408
Barr,A., 15,408
Barto,A., 160,408
Barwise,J.,225,408
basedeconocimiento(BC),200,219,247-248
basesdeconocimientodinmicas,247-251
basesdedatossimuladas,369-370
Basye,K., 71,411
Bates,J., 31,405,408
436 ndice
Bayes,Rev. Thomas,290,408
Beer,R,7,12,408
Begriffsschrift,7
Bennett,F.,nI,419
Benson,S.,359,402,403,408
Berliner,H., 190,408
Bhanu,B.,99,408
Binford,T., 86,95,408,423
Bledsoe,VVoody,237,408
Blum,A, 360,408
Blumberg,B.,31,409
Blythe,J.,410
bocetoprimario,86
conceptosfundamentales, 285-288
repaso,285-290
Bobrow,D.,8,266,409
Boddy,M., 149,411
Bole,L.,382,422
Bonabeau,E., 368,430
Bond,A., 376,409
Boole,George,7,409
borde
cncavo(enanlisisdeescenas),92
convexo(enanlisisdeescenas),92
(imagen),83
bordesenlaimagen,78
Borger,E.,242,409
Borgida,A.,280,409
borrarlista, 110, 339
Boser,B.,419
Bosser,T., 113,422
Bouthoorn,P.,430
Boyer,R,237,409
Boyle,J.,432
BPMR,139
Brachman,R,265,266,280,409,420
Bradtke,S.,160,408
Brain,A. E.,42,409
Braitenberg,V., 19,409
Bratko,l,191,242,409
Brave,S., 62,409
Breese,J., 322,417
Breiman,L.,50,409
Bresina,J.,360,422
Bretier,P., 427
Brewka,G.,280,409

Brown,C.M.,90,96,99,204,408
Brownston,L.,246,409
Bryson,A., 37,410
Buchanan,B.,9, 305,408,420
Buntine,VV., 259,266,423
bsqueda
aciegas,115-123
aproximada, 149-155
ascensindecolinas, 172-174
B*, 190
bidireccional, 141
condescensoiterativo, 120-121
convueltaatrs, 118-120
decosteuniforme, 119,135, 142
deregiones(enelprocesamientodeimgenes),86-
89
delprimeroelmejor(heurstica), 125-145
delprimeroelmejor(recursiva), 139-140
enelespacioderedes(bayesianas),315-316
enelmetanivel, 150
enespaciosdeestadosexplcitos, 109-110
enproblemasdejuegos,175-191
heurstica,125-145
bidireccional, 141
nomenclatura,129
jerrquica,150-152
limitadahorizontalmente, 152-153
mtodosalternativos, 163-174
orientadaasubobjetivos, 149,159
primeroenanchura, 109, 117-118
bidireccional, 141
estrategias(enresolucin),211
recursivaprimeroelmejor, 138-139
sobreelespaciodeestadosfrenteabsquedasobre
elespaciodeplanes,348
Bylander,T., 360,410
Byun,Y-T.,71,419
C4.5,50
cabezadeunaclusula,242
ndice 437
cadena(s)
deprobabilidadescondicionales,289-290
deunlenguaje, 383-392
desmbolos(enlacomunicacin),381
clculo(s)
depredicados,8,215-226
completitudysolidez,230
deprimerorden(CPPO), 197,215,221
lenguajey sintaxis,216-217
pararepresentarelconocimientoquetieneun
agente,220-221,223-225
reglasdeinferencia,222
resolucinenel,227-240
semntica,217-220,222-223
yelmundo,219
deprofundidadapartirdeunaimagen,97
desituaciones,327-335
cualificaciones,332
dificultades,330-332
generacindeplanes,333
problemadelmarco,331
ramificaciones,332
enelmetanivel, 143
enel nivelobjeto, 143
filosfico, 7
proposicional, 195-206
aprendizajedereglas,256-259
contramemoria, 105-106
definicindedemostracin, 198
definiciones, 197
distincinentreloslenguajes,205
lenguaje, 197-198
leyesasociativas,205
metateoremas,205
reglasdeinferencia, 198
resolucinenel,207-214
semntica, 199-203
solidezycompletitud,203-204
camino
delongitudk (engrafos), 112
nodirigido,297
ptimo(entrelosnodosdeungrafo), 111
Campbell,A.N., 9,410
campodepotencialartificial,67
cancelacindelaherencia,278
Canny,J.,410
capadeprofundidadk enunrboldejuegos, 177
caractersticascategorizadas,21,285
Carbonell,J.,410,422
Carson,D.,237,431
Cassandra,A., 148,322,410
causasysntomas,196
Chakrabarti,P., 160,410
Chang,C-L.,212,229,233,235,410
Chapman,D., 160,225,360,407,410
ChamiakE., 397,410
Chauvin,Y.,410
Chen,K., 189,418
Chen,S., 273,410
CHESS,4.5, 186
Clrickering,D.,311,314,416
Chiel,H., 12,408
CHINOOK,191
Chomsky,N., 8, 397,410
Christensen,J., 360,410
Church,Alonzo,8
Churchland,P. S., 98,410
ciclo(s)
depercepcin/planificacin/actuacin,147-149
enlabsqueda, 153
cilindrosgeneralizados,96-97
clusula(s)
-k, expresinFNC,24
antecesoresde,212
cabezaycuerpodeuna,242
comodisyuncionesdeliterales,204,207
comotbfs,207
conjuntodeliterales,207
conversinarbitrariaatbfs, 208-209,231-233
deunhecho,242
deunobjetivo,242
descendientesde,212
enfuncionesbooleanas,24
reglas,hechosyobjetivos,242
resolucinaplicadaa, 207-208,230
resolventededos,207,227, 230
subsumirotrasclusulas,209
unitatia,211
Clocksin,vv., 242,410
Clowes,M.,94,410
438 ndice
Cohen,B.,204,205,428
Cohen,Paul, 15,408,410
Cohen,Phil, 376,397,410
CoUinot,A, 416
Colmerauer,Alain,242, 266,410
combinacinsustantivo-sustantivo,384
complementodeunavariable,23
completitud(clculodepredicados),230
completitud(clculoproposicional),203-204
componentesdeactuacinypercepcin,21
comportamiento
deagrupamientoenmanadas,368
emergente,6
comprensindellenguaje,383-397
comprobacindeocurrencia,229
computacin( es)
evolutiva,53-54
tratables, 13,242,265
comunicacin,367,379-397
eintegracin,365-406
efectiva,392-393
eficiente,392-393
utilizacindelcontextoenla,392-393
conceptualizaciones,223
asentadas, 223
creacinde,224
delconocimiento,223-225
condicin( es)
deconsistencia,134-138
dexito,26, 116, 332,338
demonotona, 134-138
denoexistenciadepasillosestrechos, 19,226
entiempodeejecucin,343-344
conduciendounautomvil, 76-78
conectivas(clculoproposicional), 197
conferenciasobreSistemasdeProcesamientode
InfonnacinNeuronal(NIPS),50
Confucio, 103
conjuncin
(A), 197,205
(Conj.),383
declusulas,24,208-209,232
deliterales(enfuncionesbooleanas),24
conjunto
dediscrepancias,229
deentrenamiento,33,40,48, 256,260
deexpresiones,unificables,228
defbfs, 198,219
inconsistenteoinsatisfacible,202,219
modelode, 201,219
deliteralesnegativos(objetivo),213
dereglasdeinferencia,203
inconsistentedefbfs, 202
objetivo, 112
conjuntor,206
conmutatividaddeA, 198
Connell,J.,29,30, 111, 160,402,410,420
conocimiento
conceptualizacindeuna,223-225
debaseenPLI,260
enclculodepredicados,219-220,223-225
desentidocomn
reasdeinvestigacinenel,272
espacial,273
importanciadel,272
objetosymateriales,272
problemasenlarepresentacindel,271
procesosfsicos yeventos,273
propiedadesfsicas,273
quesel,269-270
representacindel, 269-283
temporal,273
ingenuo,270
pararesolverambigedades,393-394
representacinmedianteredessemnticasdeuna,
275-280
taxonmico,275-276
contracreencia,220,371,376
consistenciaglobalenfuncionesheursticas, 135
consecuencialgica,202
(1-),203,219
consecuentedeunaimplicacin, 198
constantes
defuncin,215
deobjetos,215
derelacin,215,235
construccindeprocedimientosreactivos, 153-155
contexto
enlacomunicacin,392
enlaplanificacin,343
ndice 439
convencionesnotacionales(fuentes)enestelibro,
197,218,244
convolucin,81
Cook,Stephen,8, 204,411
Cooper,G.,322,411
Copmico, 14
Cormen,T., 112,411
correccin
enelclculoproposicional,204,230-231
enlaresolucinconclculodepredicados,230
cosas,tiposde, 275
cosificacindecreencias,370
cosificar
lasacciones,329
lascreencias,370
losestados,328
coste
deunarco(grafos), 111
mnimoentredosnodos(grafos), 112
Cover,T., 312,411
Cozannet,A, 427
creenciascontraconocimiento,219,371,376
cronologa,7
cruce
debanda, 86
porcero, 84, 85-86
cruzdeRoberts, 100
cruzamiento,57
cuantificacin,220-221
cuantificador
existencial(3),221,222
universal(\1'), 221,222
cubodeRubik, 144
cuerpodeunaclusula,242
Culberson,J.,427
Currie,K., 411
curvasequipotenciales,68
Darwin,14
OATALOG,246,265
datosdesconocidos,311
Davis,E.,233,266,280,411
Davis,M.,411
Davis,R.,411
D a y a n ~ 160, 191,423,427,428
deKleer,J.,251,266,273,368,411,413,431
DeRaedt,L.,260,423
Dean,T., 71, 149,316,352, 360,411
Dechter,R.,304,411
declaraciones(actodehabla),379
deduccinodemostracin, 198
OEEP BLUE,9, 191
definicindecomportamientointeligente, 13
DeltageneralizadocontraWidrow-Hoff,38
demostracin
rboldebsquedapara,254
deunaclusulaobjetivo,242
deteoremasutilizandolaresolucin,209,233-234
odeduccin, 198
porrefutacin,210
Dempster,A, 305,312,411
Dempster-Shafer,reglasde,305
OENORAL,9
Denker,J.,419
Dennett,D., 14,370,411
denotacin(clculodepredicados),218
derivadasdelaintensidaddeunaimagen,84
DeSarkar,S., 160,410
descendiente
deunnodo(grafos), 111-112
deunaclusula,212
descensoiterativoA* (OIA*), 138
descripcin(es)
deestado, 116,337-338
deestadosyobjetivos,337-338
demnimalongitud,312-313,322
delentorno, 11,369
delobjetivo,337-338
deteccindebordes(enelprocesamientodeimagen),
83-86
Deutsch,J.A, 31,411
OIA*, 138
dibujodelneas,92
diccionario,384
Dietterich,T.,42,50,411,428
difusin
ansiotrpica,88
440
ndice
difusin(Cont.)
decalorisotrpica,82,88
Dijkstra,E., 117,412
dilemasentreexpresividady tratabilidad,265
directivos(actodehabla),379
discontinuidadesenunaescena,78-79
diseoascendente,6
diseodescendente,6
disyuctor, 206
disyuncin
(v), 198,206
deliterales(enfuncionesbooleanas),24
detrminos(enfunciones booleanas),24
divideyvencers, 257
divisinyfusin, 88-89
Dix,J.,409
Dixon,J., 186
dominiodeunainterpretacin,218
Donald,Merlyn,365
Donath,M., 12,407
Doran,J., 144,412
Dowling,W., 213,412
Doyle,J.,225,266,277,412,422
Dreyfus,H., 13,412
Dreyfus,S., 13,412
Drurnmond,M.,360,422
Duda,R.,9,48,49,255,305,410,412
Dym,c., 251,412
DYNA,156
Dzeroski,S., 260,419
efecto(s)
horizonte, 187
ilocutivo(actodehabla),380
localesdelasacciones,330
perlocucionarios,380
eficienciadelosmtodosdebsqueda
delprocedimientoalfa-beta, 186-187
lasfuncionesheursticas,yde, 140-143
ejemplodelanzamientodemoneda, 213, 285
ejemplodepeticindecrditos,256
ejemplodeunsistemadealarmadeterremotos,306
elementos
deungrafodeespaciodeestados(implcito),
116-117
deungrafodeestadosimplcito, 116-117
eliminacindelcompartimento(eninferencia
probabilstica),304
Elkan,c., 305,332,412
Elman,J.,65,412
Elman,redesde,65-66
Emerson,E.,224-273,412
emparejamientodepatrones,246
encadenamiento
haciadelante(progresivo),246
regresivo,246
encamacin,2,3
Enciclopedia01Artificial/ntelligence, 15
Enderton,H., 413
enfoque
centradoenelagente,367
general(enanlisisdeescenas),92
metalingstico,371
EngineeringApplcations01Artificial/ntelligence
(EAAI),15
enfriamientosimulado, 173
enlacesISA,276
entidades
individualizadasfuncionalmente, 225
individulizadasporindexacin,225
entornomarkoviano,319
Ephrati,E.,360,412
equivalenciastiles,206,222
Erman,L., 412
Emst,M.,360,412
errorfuerademuestra,49
espacio(s)
deestados, 107,327
basadosencaractersticas, 110-111
bsquedaen, 103-192
enlosprocesosdebsqueda, 103-192
enmtodosconstructivos, 166
enmodelosconstructivos, 166
especificacinde, 115-116
explcitos,bsquedaen, 109-11O
implcito, 116
depesos,36
ndice 441
espacio(s}(Cont.)
deplanes,348-354
espectimax, 188, 191
esquema(s), 106,279,329,339
axiomticosenlgicamodal, 372-373
estados
cosificacinde,328
futuros(delagente), 196
transformacindeunestadoaotromedianteuna
accin, 331
estandarizacindevariables, 230
estimadoroptimista, 131
estrategia(s)
deactuacin, 155,158
debsqueda,enlaresolucinporrefutacin,211-
212
defiltradodelosantecesores,212
deordenacin(enestrategiasderesolucin), 211
depreferenciaunitaria,211
derefinamiento(enresolucin), 212
deresolucinlineal,212
delconjuntosoporte,212
del primeroenprofundidad,211
estructura(s)
cognitiva,369
delared(bayesianas),aprendizajede,312-316
deunafrase(enlasgramticas),383,386
Etchemendy,J., 225
etiquetas
delasceldas(enSMV),250
delneas,92
(oclases)devectores, 33
evaluacin
anticipadaenunrboldejuegos, 178-179
depredicados,236
yseleccindeobjetivos,402-403,405
Evans,T. G., 8,413
evidencia
eninferencia,295
conincertidumbre, 296-297
evolucin,53
biolgica,53
introspectiva,405
exhortacin(actodehabla), 380
expansindeunnodo, 109, 117
explicacin(hechosutilizadosenunademostracin),
264
ExploringArtificial/ntelligence, 15
experimentoparaelaprendizajeenredes(bayesianas),
315
expresin(es), 380
FNDdek trminos, 24
funcionales(enclculodepredicados),216
lambda,387
expresivos(actodehabla),380
factor
dedescuento(1), 159
deramificacin(rboles), 112
deramificacinefectivo, 141
factoresdecerteza, 305
Fagin,R., 372,376,413
Famer,Sam, 17
Farrell,R.,409
fase
declculodelaaccin,21
deprocesamientoperceptual,21
Faugueras,O.,99,413
fbfs, 187,217,221
cerrada,221
clusulascomo,207,227
dentrodelmbitodeuncuantificador,221
(enclculodepredicados),217,226
(enclculoproposicional), 198
enformaprenex,232
enformadeSkolem,232
equivalentes,202,219, 222
inconsistente,202,219
insatisfacible(vase tambininconsistente,fbf),
202,219,226
interpretacinquesatisface,201,219
modelodeunconjuntode,201
modelode, 201, 219
objetivo, 345
proposicionales,217
validez, 202, 219
Feigenbaum,E., 8,9, 15,251,408,410,413,420
442
ndice
Feldman,J., 8,413
Feller,W., 304,413
Ferguson,e.,425
Ferrieux,A.,427
ficcinperceptual, 147
Fikes,R., 110,280,339,358,359,413
filtradolaplaciano,85-87
filtro sensorial,70
Finin,T., 280,413
Firby,R.l, 405,413
Firschein,O.,99,413
FischIer,M.A.,99,413
fsica
cualitativa,273,368
ingenua,270,368
Fleischmann,R, 2,413
Flores,F.,2,431
fluentes, 328
Forbes,J.,322,413
Forbus,K., 251,266,413
Ford,K., 12,416
Forgy,e.,246,248,413
forma(s)
casilgicas, 391
detabla(comoenelrazonamientoenlosSMVy
SMVA),247-251
normal
conjuntiva(FNC),24,204,208,232
disyuntiva(FND),24,208
prenexdeunafbb, 232
Skolem
deunconjuntodefrmulas, 232
deunafbf, 232
formatoparaelintercambiodeconocimientoK 1 F,
280
frmulasbienformadas (fbfs), 197,217,221
Forrest,B.,50,426
Fox,M., 360,432
Frank,M.,414
frase(s)
(engramticas),383
sustantiva(FS),384,388
Frege,Gottlieb,7, 413
Friedman,J., 409
Friedman,N.,310,313,314, 413,414
Froom,R, 419
Fu,L.M.,414
funcin(es)
booleanas
clasesyformasde,24
comocircuitoselectrnicos,26
deerror,35
deevaluacin, 125-127,178
aprendizajede, 155-158, 189-190
descubrimientode, 140
esttica, 178
deparidadpar,40
deprobabilidadconjunta,286
deseleccindelaaccin,24-30
deSkolem,231
desuavizado,82
desuavizadogaussiano,82
desucesin, 117, 144
g, 141
h, 140
heurstica(s)
admisible, 145
aprendizajede, 155-158, 189-190
consistenciaglobalde, 135
descubrimientode, 140
yeficienciaenlabsqueda 140-143
linealmenteseparables,26
sigmoide,37-38
sombrerodeunfiltrolaplaciano,85-86
fundamentossimblicos,6
Furst,M.,408
futurosalternativos,271
Gallier,J.,213,412
Galton,A.,414
Gardner,Martin,7,414
Garey,M., 13,414
Gaschnig,J., 9, 122, 140,255,412,414
Gasser,L,376,409
Gat,E.,405,414
Geiger,D.,311,314,416
Gelatt,e.,173,418
ndice 443
Gelernter,H.,7,414
generacindellenguaje,382
generalizacin
basadaenlaexplicacin(GBE),256,260-265
deunared.46-49
esunaredneuronal,46
existencial,223
Genesereth,M.,31,71,210,223,266,280,371,414,
429
Gentner,D.,280,414
Ghose,S., 160,410
Gibson,J. J.,98
Gil,Y., 359,414,422
Gilbert,V., 280,409
Ginsberg,Matt,12,122, 145, 160, 164, 192,266,414,
429
Glesner,S.,286,414
GMel,Kurt,8
Gogic,G.,265,414
Goldberg,A.,204,466
Goldberg,D.,54,466
Goldszrnidt, M., 304,310,313,314,413,414, 415
GOLOG(alGOlenLOGica),334
grafo(s), 111
deespaciodeestados, 106-109
derestricciones, 166-167, 168-169
dirigido, 111
acclico(GDA),293
explcitos, 155-156
implcitos, 156-158
nodirigido, 111
yrbolesdebsqueda, 130
gramtica(s)
BUSQUEDA_EN_GRAFOS, 127-139
conestructuradefrase, 383-386
extendida,386,392
declusulasdefinidas,397
extensindeuna, 390-392
libresdecontexto,383
paralacomunicacinenelmundodebloques,384
Green,eordell,8,234,265,328,415
Gregory,R,99,415
Grimson,W. E.L.,95,415
Grosz,B.,397,415
Gruber,T., 280,415
Gu,J.,415
Guha,R.,9, 223,271,275,280,415,419
Gupta,N.,360,415
Guzmn,A.,94,415
hablanteyoyente,379
haemophilusInfluenzae,bacteria,2
Halpern,J., 376,413
Halpin,M.,415
Hanazawa,l.,430
HandbookofArtificialIntelligence, The, 15
Hanks,S., 333,415
Hamad,S.,2,415
110, 131, 134, 136,255,305,339,
358,359,410,412,413,415
Harvey,W. D.,414,415
Haugleland,John,5
Haussler,D.,34,515,
Hayes,P., 12,272,328,4]6,421
Hayes-Roth,B.,69,405-4]6
Hayes-Roth,E.,413
Haykin,S.,50,416
Herbert,M.,98, 160,416,429,430
hecho(tomo),213
Heckerman,David,293,304,311,316,4]6
Heinsohn,J., 280,416
Henderson,D.,419
Hendler,J., 360,407,4]2
Hendrix,G.,280,416
Henrion,M.,304,322,416,417,425
herencia
cancelacindela,278
depropiedades,278
ensubcategoras,276
Herskovitz,E., 322,411
Hertz,J.,50,416
heurstica
demnimosconflictos, 170
deprimeroelmsbarato,282
divideyvencers,341
Hewett,R,416
Hexmoor,Henry, 1
444
ndice
hijo(deunnodoenungrafo), 111
Hidreth,E.,86,420
Hintikka,J.,376,416
Hinton,G.,426,430
hiperplano, 27-34
difuso, 38
hiptesis
delosfundamentosfsicos, 6
delsistemafsicodesmbolos,3, 6
hitoriadelaIA,7-9
Ho,y-c., 37,410
Hobbs,J.,280,416
Hoff,M.E.,8,431
Holland,John,54,416
Hollister,v.,410
horizonte(bsqueda), 153
Horn,Alfred,91,99,212,416
Horn,B. K. P., 416
Horn,clusulasde,212-213,242-246
mtodosdeaprendizaje,260
teorasconmximolmiteinferior(MLI),265
teorasconmnimolmitesuperior(MLS), 265
tiposde, 213
Horn,teorasde,265
Horowitz,S.,88,417
Horswill,l.,98,417
Horvitz,E., 149,322,417
Howard,R, 419
Huang,T.,420
Hubbard,W.,419
Hubel,D.,9,98,99, tI7
Huberman,B.J., 191,417
Hucka,M.,419
Hueckel,M.,86,417
Hueckel,operador,86
Huffman,D.,93,417
lA
al viejoestilo,5
clsica,5
dbil,14,406
fuerte, 15,406
103,50
idoneidad
comofuncindelnmerodegeneracin,61
deunprograma,57
imagendedistancias,91
implicacin(es)
(::J), 197
sociales, 14
independencia
condicional,292-293
acausadelaseparacin-d,297
mediantenodosbloqueadores,297
incondicional,293
ndices
denecesidad,305
desuficiencia,305
individuomsidneodeunageneracin,54,61
individuos(enclculodepredicados),217
funciones sobre, 217
relacionesentre,217
induccinmatemtica, 132
inferencia
causal(desdendente),295
dediagnstico(ascendente),295
monotnica,249,277
nomonotnica249,277,309
probabilstica,288,290,293
enpolirboles,298-304
independenciacondicional,292-293
mtodogeneral,290-292
yactuacin, 316-322
informacin
deprofundidad(imagen),96-98
difcilderepresentar, 195
incierta,285-307
ingenierodelconocimiento,252
inhibicinlateral,99
instancia
base,228
desustitucindeunaexplicacin,228
negativas,256
positivas,256
instanciacinuniversal(vase tambin eliminacin
universal),222
instantes,274
"
p
t
i'.
,
ndice 445
inteligencia
enmquinas,7
humana, 1, 13,399,405-406
inteligenciaartificial(lA)
brevehistoriadela,7-9
conferenciasyrevistasimportantessobre, 14
definicinde, 1
enfoquesenla,5-7
libosdeactaspublicadossobre,95
dbilcontrafuerte, 15
distribuida(IAD),367,376
quesla, 1-5
intencin,271,369,379-380
InternationalConferenceonMachineLeaming
(ICML),50
InternationalJointConferencesonAl(!JCAI), 15
INTERPLAN,360
interpretacin
dedibujos,92
dominiodeuna,218
enelclculodepredicados,218-219
enelclculoproposicional, 199
esperada,203,219
frecuenciasdelasprobabilidades,288
geomtricadelfuncionamientodeunaULU,34
quesatisfaceunafuf,219
intervalosdetiempo,274
descripcinde,274
queseencuentran,274
invencindepredicados,259,316
investigacin
ascendente,12
descendente, 12
igo,R,12,422
Jackel,L.,419
Jani,R.,99,417
Jensen,F., 304,417
jerarquastaxonmicas,275-276
Johnson,D., 13,414
Johnson,M., 280,419
Johnson-Laird,P., 13,417
Jones,Effie,325
Jordan,M., 110,417
journals,Al, 14,
juegoGo,189
juegos,9, 175-192
decompeticin, 177, 187-188
dedosjugadores, 175-177
coninformacincompletaodesumacero, 176
Jules,A., 173,417
Julesz,B.,98,417
justificacin(es),248
mutua(s),249
Kaelbling,L.,7,30,71,148,159,322,410,411,417,
426
Kahn,D.,405,410
Kahn,R, 413
Kahneman,D.,305,430
Kanade,T., 430
Kanal,L., 144,417,419
Kanazawa,K.,413
Kant,E.,409
Karlsson,J.,405,431
Karmarkar,N., 50,417
Karp,Richard,8
Kartha,G.N., 334,417
Kasparov,Garry,9, 191
Kasturi,R, 99,417
Katz,Edward,28
Kautz,H.,204,265,266,273,360, 397,415,417,427
Keane,M.,419
Keams,M.,34,265,266,418
Kenley,C.,304,428
Khardon,R,265,418
Kierulf,A.,189,418
KIF,280
Kim,J-S., 304,371,418
King,R, 266,423
Kirkpatrick,S., 173,418
Kish,D.,30,418
KIeene,Stephen,8
Knight,B.,427
446
ndice
Knight, K., 426
Knoblock,C.,360,410,418,422
Knuth, D. E., 186,418
Koenderink,J.,82,418
Koller,Daphne, 145,281,285,286,361,363,414
Kolodner,J.,280,418
Konolige,K.,280,371,372,376,409,418
Korf,R., 120, 138, 139, 142, 144, 152, 153, 155, 160,
190,418,425
Kowalski,R,371,418
Koza,J., 11,62,419
Kripke, S.,376,419
Krogh,A., 50,416
KRYPTON, 280
Kudenko,D.,416
Kuipers,B.,71,419
Kulikowski,C.,50,430
Kurnar,V., 144,169,417,419
Kuokka,D.,422
Labrou,Y., 280,413
Laird,J.,246,405,419,426
Laird,N.,312,411
Laird,P.,422
Lake,R,178,427
Lakoff,G.,2,280,419
Lang,K.,430
Langley,P., 50,419
1aplaciana,85
Latombe,J-C.,68,419
Lauritzen,S.,304,311,419
Lavrac,N.,260,419
LeCun,50,419
Lederberg,J.,9,413,420
Lee,K-F., 160, 191,397,419,430
Lee,R., 212,229,233,235,410
Lee,S.,99,408
Lee,W-Y., 419
Leibniz,Gottfried,7
Leiserson,C., 112,411
Lenat,Doug,9,223,271,275,415,419
lenguaje
ysintaxis(enelclculodepredicados),216-217
(enelclculodepredicados), 197-198,205
natural,382
Leonard-Barton,D.,266,419
Lesprance,Y., 420
Lesser,v.,412
Letvinn,9,98,419
Levesque,H.,204,265,266,280,334,376,409,410,
419,427,428
Levitt,R,251,412
Lewis,Albert, 17
ley(es)
asociativas(clculoproposicional),205
decontraposicin,202
deDeMorgan,23-24,202,222
distributivas,23,206
Lifschitz,v.,360,420
lmitedeprofundidad, 119
Lin,E.,420
Lindsay,R,9,420
lneaepipolar,98
Linoff,G.,397,421
lista(s)
aadir, 339
deprecondiciones, 110
literal(es),24, 198,207
derespuesta,234
negativos,207,213
positivo,207
Littman,M., 148, 159,322,410,417
Llull,Ramn,7
Loebner,competicindelpremiode,5
Loebner,Hugh,5
lgica(s)
clsica,monotnica,249,276
definicin, 197
dentica,376
doxsticas,376
mtodosdeplanificacinbasadosenla,325-364
epistmicas,370
modalpararepresentarelconocimiento,371-376
nomonotnica,277
pordefecto,277
probabilstica,304
temporales,224,273
ndice 447
lgica(s)(Cont.)
terminolgicas,265,280
lgica/razonamientoautoepistmico,277,376
Lovejoy,W., 148,420
Loveland,D.,232,420
LOwenheim,L.,220,420
Lowrance,J.,431
Lowry,M.,237,420
Loyal1,A. B.,405,408
Lucas,J. R,8,420
Luckham,D.,234,420
Lusk,E.,432
Machinaexpeculatrx, 19
MachineLearning,Anuario,50
MACROP(macro-operador),358
Maes,P., 6,420
Magerman,D.,397,420
Mahadevan,S., 111, 160,411,420
Mahajan,S., 191,419
Malik,J.,88,425
Mamdani,Abe, 304
Manna,Z.,237,420
mantenimientodebasesdeconocimientodinmicas,
247-251
mquinas
biolgicasycomputacionales,2
pensantes,2
;1
I
1
Marr,D.,9,86,98,99,420
I Martelli,A.,266,420
Martin,N.,409
Martin,P., 415
mejorinformado(enA*), 134
Masand,B.,397,42]
Matarie,M.,2,30,31,368,409,421
matriz
deintensidadesdeunaimagen, 80
deuncrucigrama, 165
deunafbf, 221,232
Maturana,H.,419
Mauldin,M.L.,5,421
I maximizacindelaexpectacin(ME),312

1
Mayfield,J.,280,413
McAdams,H.,3,421
McAllester, D.,349,360,418,421
7,8,191,223,277,328,333,370,
421,428
McCartney,237,420
McClelland,J., 12,421
McCorduck,P., 9,251,413,421
McCullock,Warren,8,419,421
McCune,W., 237,421
McDermott,D.,242,277,333,415,422
McDermott,J., 9,266,422
McDonald,D.,382,422
McFar1and, D., 13,31,422
McGuinnes,D.,409
McKeown,K., 382,422
Mc"ey,E., 12,422
Meek,C.,315,429
meganodos,304
Mellish,C.,242,410
memoria
acortoplazo,(memoriaactiva,memoriadetrabajo),
246
alargoycortoplazo,246
detrabajo(acortoplazo),246
deunsistemaconestados,63
frenteacomputacin, 105-106
Mr6,L., 137,422
meseta(enunespaciodebsqueda), 173,205
metforasespaciales,272
metaconocimiento,280
metateoremas(clculoproposicional),205
mtodo(s)
(algoritmos)voraces,257,314
ascensindecolinas, 171
constructivos, 165-169
debsqueda
basadosenlafuerzabruta, 13
haciadelante,338-341
dededuccinnatural, 237
degradientedescendente,35-36, 171
deplanificacinconbsquedaregresiva,344,348
derelajacinpararesolverecuacioneslineales,37
descendentes, 171
estadsticos(engramticas),397
448 ndice
mtricadecalidad,312-314
Michalewicz,Z.,54,422
Michalski,R.,422
Michie,D., 144, 191,409,412,422
Middleton,B.,425
Miller,R,9, 422
Millstein,360,412
Milshtein,M.,360,412
Minker,J.,246,422
Minnix,J., 12,422
Minsky,M.,8,376,422
Minton,S., 170,171,265,359,362,410,422
Mitchell,D.,204,428
Mitchell,M., 54,422
Mitchell,T., 50,422
Mittal,S.,266,409
modelado
deestretegias,369
deprocesosfsicos, 368
modelo(s)
basadoencaractersticas, 11
basadoenelcomportamiento, 12
deactuacinenunprocesodeMarkov,320
deotrosagentes,368-371
deunafufounconjuntodefufs, 201,219
delsensor,320
definicinde, (enestelibro), 11
icnicoscontramodelosbasadosencaractersticas,
66,369
psicolgicos, 12,71,280
tiposde,368-369
modificaciones
delatoleranciaalruido, 259
delospesosenelprocesamientodeunaredneuronal
porcapas,43-44
mdulo(s)
decomportamiento,29
deconocimiento,(MC),69
subsumido,29
modus ponens, 198,208
Monahan,G.,148,423
monomio,24,27
Montague,P., 160,423,428
Montanari,U.,266,420
Moore,A., 159, 160,417,423
Moore,E.F., 109,423
Moore,J.,237,409
Moore,R C.,277,280,376,416,423
Moore,R W., 186,418
Morris,P., 415
Moses,Y., 413
Mostow,J., 144,423
muestrasponderadas(enredesbayesianas),311
muestreolgico(redesbayesianas),304
Muggleton,S.,259,266,423
mltiplesagentes, 367-377
Mumford,D.,91,432
mundo(s)
debloques, 10, 106,218
del sentidocomn,269-273
(enelclculodepredicados),217-218
posibles,372
Myers,J., 9,422
Myers, K., 238,423,431
Nalwa,V. S.,9,89,92,94,96,99,423
Nathwani,B.,305,416
Nau,D.,360,412,415
Neal,R.,304,322,423
Neapolitan,R,304,423
Nebel,B.,416
necesidadepistmica, 373
negacin
(-,),197
comofallo,266
deintrospeccinnegativa,373
deunavariablebooleana,23
neuronasdeMcCullock-Pitts,8
Newbom,M., 191,423
Newell,Allen, 3,6,7,8,13,71,140,246,341,419,
423,426
Nievergelt,J., 189,418
Nii,H. P., 69,251,413,424
Nilsson,N., 8,14,31,39,71,110,131,134,136,
160,210,223,234,266,286,305,339,358,
359,371,400,402,403,408,412,413,415,420,
424
r
)
t
I
f
ndice 449
nivel
deconocimiento,6
simblico,6
noterminales(gramticas),383
nodo(s)
bloqueadores,298
deconsulta,295
dedecisin,319
deevidencia(polirboles),298,296,298
deinicio, 107, 116
demostrado,244
explicados, 112
hojas(grafos), 111
0,244,253
objetivo, 107, 112
ocultos,316
ordenacinde(enlabsquedaalfa-beta), 186
raz(grafo), 111-112
tiposde(enredessemnticas),276
Y, 244
negoods,250
NONLlN,349
Noordweier,M.,256,430
Norvig,P., 10,37,298,304,316,391,396,424,427
notacin
derboles, 111
degrafos, 111-112
ennegritaenestelibro,218
lambda,389
Nourbakhsh,l., 160,424
nmerosdenivelcrtico,354
objetivos, 158-159,316
objetos,215,217
obtencinderespuestas,234-235
Occam,Guillermode,47
oclusin,bordede,92
Olshen,R,409
ontologas,280
operacionesdepoda,259
operador(es), 116
deCanny, 86
deMarr-Hildreth, 86-87
demutacin,57
deSobel,86
detransformacindeplanes,349
(instanciasdelesquema), 106
modal(K),371-372
Naiwa-Binford,86
quesecorrespondenaacciones,338
Oppacher,F., 173,424
OPSS,246
optimizacindefunciones,54, 171-174
ordenptimodelosconjuntos,282
ordenacindelosnodossucesores(enlabsqueda
alfa-beta), 186
O'Reilly,U-M., 173,424
Overbeek,R,432
padres
(deunnododeungrafo), 111
(enunaredbayesiana),293,298,300
Paine,Thomas, 193
Palmer,R., 50,416
Panaget,F., 427
Papadimitriou,414
paramodulacin,236
paramodulantebinario,236
parte
condicindeunaregladeproduccin,25
deaccindeunaregladeproduccin,25
particin(subconjuntosdisjuntos),49
pasillosestrechos, 19,64,226
pasosdereparacinparaelproblemadelasocho
reinas, 170
Paterson,M.,229,424
PATHFINDER, 304
patronesdeinferencia,295-296
Pauchon, 92,423
Pavlidis,T., 88,417
Pearl,Judea, 135, 140, 144, 186, 191,304,306,415,
418,424,428
Pednault, 332,359,425
Penberthy,J.,360,425
"1
.4

451
450 ndice
Penrose,8,425
pensamiento,2,4
percepcin,22
yaccin,22-23
componentes,21
perceptrones,8,34
Pereira,E.,246,266,397,415,425,430
Pereira,L.,266,430
Prez,A.,410
Perlis,D., 371,425
Perona,P., 88,425
PerrauIt,C., 397,410
Person,c.,423
pesoumbral,34
Phillips,A.,422
Pierce,D.,419
Pineda,F. J.,50,425
Pitts,Walter, 8,419,421
pixel,80
planees)
articulacindeun, 356
aprendizajede, 357-359
concondicionesentiempodeejecucin,343-344
deestelibro, 10-12
universal, 155
planificacin,337
agentesqueplanifican, 105-113
basadaenbsquedasobregrafos, 109
combinadaconcapacidadesreactivas,403
conmnimocompromiso,346,348
deactosdehabla,380
engrafosdeespaciodeestados, 107
grafos, 360
intercalada, 160
dejuegosdecompeticin, 178, 190
parajugaral ajedrez,9, 177, 191
funcionales, 54
jerrquica, 150-152, 160,354-357
Ydeordenparcial,356
mtodos(deplanificacin)basadosenlalgica,
nolinealsistemtica(PNLS),349
parcialmenteordenada(PPO), 348-354,356
progresiva,338
regresiva, 338
planosnolineales, 348
Podabeta, 184
Poggio,T.,98,420
PohI,l., 144,425
polirboles,298-304
poliedrosconvrticestridricos,92,94
Pollack,M., 360,412,425
Pomerleau,D.,76,425
Pople,R,9,422
Port,K. Z., 425
posicinaquiescente(enprogramasdebsquedaen
juegos), 187
Pospesel,H., 225,425
Post,Emil,8
Powers,R., 12,425
Powley,C.,425
Pradhan,M.,305,425
Prawitz,D.,237,426
precisindegeneralizacin,47,49
precondiciones,329,339
predecir
lasconsecuenciasdeunaaccin, 105-106
un vector de caractersticas mediante una red
neuronal, 110
predicado( s)
(constantesderelaciones),216
deigualdad,235-237
objetivo, 144
prediccindelasaccionesdeotrosagentes, 375
prefijo(enunaformaprenexdeunafuf), 232
Prieditis,A., 144,423,426
principalescongresosdelA,14
principiodelaNavajadeOccam,47
probabilidad( es)
a priori, 294
condicionales,288-290
conjuntas,285-288,290-291,294
marginal,287
problema(s)
deasignacin, 163-165
deasignacindeconfianza, 159
dedecisindeMarkov(PDM), 148,322
parcialmenteobservable(PDMPO), 164,322
delaasignacindeconfianza
estructural, 159
f
ndice
problema(s)(Cont.)
temporal, 159
delaavispa,73
delacuantificacin, 332
delahormigaartificial,71
delaramificacin,332
delasTorresdeHanoi,72, 113,335,361
delascordilleras, 173
delascuatroreinas, 144, 167, 174
delasjarrasdeagua, 122
delasochoreinas, 164, 170
delasN-reinas, 171,205,206
delascorrespondenciaenvisinestereoscpica,98
delosdoscolores, 172
deloshombressabios,374-375
delosjuguetes,8-9
delosMisionerosylosCanbales, 113, 174
desatisfaccinderestricciones,93, 164
desatisfacibilidadproposicional(SATP),204
delascensor,71
delmarco, 332
del millndereinas, 171
delmundoreal,241-242
deSATPconFNC,204
kSAT,204
NP-duro,298,360
SAT2,204
SAT3,204-205
SATP, 204-205
simplificados, 140
procedimiento
alfa-beta, 181, 186
decorreccindelerror, 39
deWidrow-Hoff,37
Deltageneralizado, 37-39
minimax, 177
procesamiento
deimagen,80-90
bsquedaderegiones,86-89
deteccindebordes, 83-84
promediado,80-82
deinformacincompleja,7
deseales,4
dellenguajenatural(PLN), 394-397
subsimblico.4
1- .
1
proceso(s)
debsquedaevolutiva,54
decorreccindelerrorconincrementosfijos, 51
degeneracindeplanesprimeroenlongitud, 356
degeneralizacindeunplan,357
dePG(programacingentica),57-58
deplanificacinconelprimeroenprofundidad,356
deramificacinypoda, 153
deseleccinportorneo,57
desuavizado,82
heursticos, 117
markoviano, 320
sinfin, 25
Profitlich,H-J.,416
profundidaddelnodoraz(grafos), 111
programa(s)
expresadoenformaderbol,54
ELlZA,5
hijo,57
idoneidaddeun, 57
JULlA,5
madre,57
padre,57
representacinde,(enPG),54
teleo-reactivos(T-R),26,359,401,402
T-R,26,359,401,402
programacin
dinmica, 160
gentica(PG),54-61
heurstica,7
lineal,50
lgicainductiva(PU),260
orientadaaagentes, 375-376
PROLOG,242-246,266,338
promediado
combinacindedeteccindebordescon,85
enprocesamientodeimagen,80-82
propagacin
demarcadoresenunabsquedaenungrafo,
108-109
derestricciones, 105
(minimax), 178
propiedades
deunafuncindeprobabilidad,286
enelclculodepredicados,217

325-364
452
ndice
propiedades(Cont.)
herenciade, 278
proposiciones,200,215
Provan,G.,426
proyeccin, 107, 196
enperspectiva,76
proyectoCYC,9,223,271,272,275,280,405
psicologacognitiva, 8, 13
puntodevistaPlatnicoacercadelconocimiento,374
puertasADN, 28
Purdom, P. W., Jr., 204,426
Puterman,M.,148,322,426
Putnam,H.,233,411
puzzle
de ocho piezas, 115-116, 117-118, 125, 128, 131, 142,
157,165,361
dequincepiezas, 115
deveinticuatropiezas, 144
0A3,8
Quinlan,Ross,50,256,260
raciocinador,7
racionalidadlimitada, 13
Ramachandran,V. S.,98,411
Ramadge,P., 360,426
ranuras
denombre, 279
devalores,279
Raphael,B., 131, 134, 136, 137,415,424
razonamiento, 196
acercadeestadosyacciones, 327-330
acercadelconocimientodeotrosagentes,374-375
basadoencasos,280
causal,295
conincertidumbre,285-307
dediagnstico,295
nomonotnicoenredessemnticas,276-277
porcasos,208
regresivo,246
razonaracercadelconocimientodeotrosagentes,374-
375
reactividadcombinadaconplanificacin,402
recompensasenvezdeobjetivos, 158-159
reconocimiento
decaracteres,50,75
delhabla,. 50,396
deplanes,396
recorridoiterativoenanchura, 121
red(es)
ALVINN,76
bayesianas,293-294
aprendizajede, 309-316
aprendizajedelaestructuradelared, 312-316
aprendizajeyactuacinmediante,309-324
bsquedaenelespacioderedes,314
cualitativas,304
datosconocidosen,309-311
datosdesconocidosen,311-312
decisindinmica,318-319,
descripcindelalongitudde, 312
estructuradelaredconocida(aprendizajedelas
TCP),309-312
mtricaen,31 2-314
patronesdeinferenciaen,295-296
causales,293
dealimentacindirecta,40
decreencia,293
dekcapasdeunidadessigmoides,41
depuertaslgicas,8
detransicinaumentada(RTA),397
deULU,27,41
deunidadesCIPA, 28
directaporcapas,42
neuronal(es),6,9,28,33-52,65,76, 110,304,322
TD-GAMON, 189-190
recurrentes,40,50,65
semnticas,276-279
paraelrazonamientopordefecto,278
razonamientonomonotnico,enel,277-279
Reddy,R,412
reduccinal 205
reflectividaddelasuperficie,91
refutacinmedianteresolucin, 209-211,233-234
ndice 453
refutacinmedianteresolucin,(Cont.)
rbolde,211
completituddela, 209,230
estrategiasdebsqueda,211-212
estrategiasdeordenacinenla,211
estrategiasderefinamiento,212
utilizadaenlaGBE,265
regin(es)(partes)
deunaimagen,78,88-89
homognea(imagen),88
regla(s)
deimplicacin,213
deinferencia
enelclculodepredicados,222
enelclculoproposicional, 198
delacadena
Delta,37
enclculos,36,42
enfuncionesdeprobabilidadconjunta,289
deproduccin,25
enlaresolucin,207-208,230
especficascontragenerales,257
generalescontraespecficas,257
regresin, 344
1
deunaconjuncin,345-346
Reichardt,W., 99,426
Reilly,W. S., 405,408,410
I
Reiter, R,277,332,334,419,426
Reitrnan,W., 189,426
relacionesn-arias,217
especificadasextensionalmente,217

rellenadordehuecos,70
reparacinheurstica, 169-171
representacin(es)
analgicas,66
basadaencaractersticas,66
delasfuncionesdeseleccindeaccin,24-30
delentorno,63-65
mediantevectoresdecaractersticas,63-65
delsentidocomn,269-283
icnicas, 11,66-68
deltipomapa,67
indexadasfuncionalmente, 225
reproduccin,53
Resnick,A., 409
I
Resnick,M., 30,426
resolucin
aplicadaalasclusulas,207-208
completaenrefutacin,209-211
correccinde,208
deconflictos,69, 246
enelclculodepredicados,227-240
enelclculoproposicional,207-214
unanuevaregladeinferencia,208
utilizadaenlademostracindeteoremas,233-234
resolvente(s)
dedosclusulas,207,227
denivelO,211
restricciones
devaloresdecaractersticas, 195-197
sobrelosvaloresdelascaractersticas, 195-197
resultadosparaelpeorcaso, 14
retropropagacin,
mecanismode,41
redentrenadamediantela, 45
revistaPCAl, 15
Rich,E., 426
Richards,Charles,82
Ringuette, M., 10,425
Rissanen,J., 322,426
Rivest,R.,31,71,112,411,426
Robertie,Bill, 190
Roberts,Larry,9,426
Robinson,G.,235,237,431
Robinson,J.A., 426
robot(s)
conseguimientodepermetro, 19,54-61
domstico,272
enunmundocuadriculado, 10, 19-21,55
30
marciano,361-362
quesiguelasparedes,54-61
Shakey,400-402
Rohwer,R,50,426
Rosenberg,c., 12, 50,427
Rosenblatt,Frank,8,34,426
Rosenblitt,D.,349,360,420
Rosenbloom,P., 246,419,426
Rosenschein,Stan,7,30,405,417,426
Ross,S., 160,426
1
..oiIIIIIII
454
ndice
Roth,D.,417
Roussel,P., 266,426
RTA,397
booleanos,24
delclculodepredicados,217
delclculoproposicional, 196
denotacinde, 200
valoresdeverdadofalsedadde,200
Rubin,D.,312,411
ruido
deatributo,46
declasificacin,46
rendimientolimitadoporel,46
Rumelhart,D., 12,37,45,110,410,417,421,426
Russell,S., 10, 12, 13,37,160,190,298,304,316,
391,396,405,413,427
Sacerdoti,E.,354,356,360,427
Sadek,M.,382,427
saltohaciaatrs, 122
Samuel,Arthur,7, 157, 191,427
SATG,204
satisfacibilidad
delasinterpretaciones,202
deunatbf,202,219
Schaeffer,Jonathan, 178, 191,427
Schapire,K,71,426
Scherl,R,334,420,427
Schoppers,M.J., 155,427
Schraudolph,N., 191,427
Schubert,L.,332,427
Schultz,W., 160,427
Schunck,B.,99,417
Schwartz,J.,242,427
sederiva(1-), 199
Searle,John,3,379,427
Seiver,A.,416
Sejnowski,T., 12,50,98,191,410,423,427
seleccin
deobjetivo,402-403,405-406
natural,53
Selman,Bart,204,206,265,266,360,414,417,427
semntica
composicional,372,389
deloscuantificadores,222-223
deTarski,225
(enelclculodepredicados),217,222
(enelclculoproposicional), 197, 199-203
semidecibilidad,242
sentencias(tbfs),vasetbf
sealizacin(acompaandoalasreferencias),393
separacin-d,297-298
Shachter,R,304,428
Shafer,G.,305,428
Shafer,S.,430
Shanahan,M.,334,428
Shannon,elaude,7,428
Shapiro,E.,242,429
Shapiro,L.,3,421
Shapiro,S.,418,428
Shavlik,J.,50,256,428,430
Shaw,J.c., 7,8,140,341,423
Shen,W-M.,359,428
Shieber, S.,246,425
Shikano,K, 430
Shirai,Y., 95,428
Shoham, o a ~ 13, 145,224,246,250,266,273,334,
361,362,376,428
Shortliffe,E.,9,255,305,410,428
Shrobe,R, 15,428
SIGART,14
significado(s),(semntica), 199,217,222
deunacadena,386-387
deunaoracin,387
silogismo(s),7
hipottico(regladeinferencia),208
smbolos
decuantificadores,220
metalingsticos(1- Y 1= ), 205
terminales(engramticas),383
Simon,Herbert,3,5, 7, 8, 13,341,423,424
Simonin,J., 427
simulacin, 11
delentorno(modeloicnico), 11,66,368-369
Singh,S., 160,408
sntomasycausas, 196
sistema(s)
ndice 455
sistema(s)(Cont.)
ALlVE,31
ALVINN,76-77,98
autnomos, 12
basadosenconocimiento,6,241-268
CLASSIC,280
conestados,63-74
consejero,5,8
declasificacin,54
deconsulta,254
demantenimiento
delaconsistencia(SMC),250
delarazn,248
delaverdad(SMV),248,266
basadosenlaasuncin(SMVA)
depizarra,69
deproduccin,25-26,69,71
dinmico,6, 50
evolutivos,53-62
experto(s),9, 196,251,259,304
basadosenreglas,251-255
estructuragenrica,252
MYCIN, 255,285,305
PROSPECTOR,255, 285,305
GOLEM,266
HUGIN,304
280
LUNAR,9
NOAH,356,360
O-PLAN,356
PLI,260,262
PRODIGY,265,359
reactivos, 17-101
SIPE,356,360
tabularasa, 12
TEAM,397
TWEAK,36O
Skolem,Thoralf,231,428
Slagle,J., 8, 186,428,429
Slate,D., 186,428
slot,parejadeatributo-valor,279
Smith,D.E., 266,429
Snow,eatherine,365
Sobel,Irwin,86
sobreajustededatos,47
evitar,49
reduccindelriesgode(enAGDV),259
Soderland,S.,360,429
softbots,9
solucionessatisfactorias, 144
Solucionador(Resolutor)GeneraldeProblemas
(GPS), 8,341
sombreadodeimagen,91
Sowa,J.,280,429
SparckJones,K,397,415
Spirtes,R,315,429
Splegelhalter,D.,304,419
Stallman,R,122,429
Stanfill,e.,397,429
Stefik,M., 160,252,266,409,429
Stentz,A., 160,429
Sterling,L., 12,242,408,429
Stemberg,J., 266
Stickel,M., 120,237,276,429
Stone,c., 409
Stork,D.,48,50,412
Strat,T.,99,429
STRIPS, 110,337-348
operador, 110,339
planes con condicionantes en tiempo de ejecucin,
343-344
planificador(enShakey),400
precondiciones, 110,339
presuposicin,339
recursivo,341-343
regla, 339,348,381
sistemasdeplanificacin,337-348
suavizado
delaimagen,82-84
medianteunfiltrogaussiano,83-85
subconjuntodelcastellano,382
subcategorasyherencia,276
subobjetivonico(enlabsquedajerrquica),
150
Subrahmanian,v., 360,412
subsuncindeunaclusula,209
sucesor
(deunnododeungrafo), 111
(hijo),299
supercategorasyherencia,276
1
....
456
ndice
Sussman,G., 122,344,429
sustitucin(es),229
Sutton,R, 156, 157,429
Swartout,W, 382,422
tabla(s)
dedecisin,31
deprobabilidadescondicionales(TPC),294
aprendizajedelas,309
deverdad
proposicional,200-201
reglasparaconstruirla,200
triangulares, 358,402
Tarski,A., 225,429
Tate,A., 349,356,360,361,407,411,429
taxonomas,275-276
Taylor,L., 144,418
Teller,A., 62,429
Tenenberg,J., 360,405,430,431
teorema(s)
deBayes,290
delademostracin(clculoproposicional),205
demostracinde,210,233-234
(enlgica), 199
teora(s)
aproximadas,265
baseenSMVA,250
teoradelautilidadenmodelosdeanimales, 13
deAprendizajeComputacional,50
deladecisin, 322
delaposibilidad,305
delautilidadenmodelosdeanimales, 13
deprobabilidades
delaprendizajeprobableyaproximadamente
correcto(PAC),34
TeorizadorLgico,7
trmino(s}
base,228
(enlasfuncionesbooleanas),24
(enelclculodepredicados),216
Tesauro,G., 189,430
TestdeThring,2,4-5, 12
texels,90
texturadelaimagen,90
Theraulaz,G.,368,430
Thomas,A.,312,411
Thorpe,C.,98,430
tiempo,224,273
polinomialestimado(enproblemasSATP),
204
tipografademquinadeescribir(enestelibro),
197,218
Torrance,M.,414
torredemodelos,404
Towell,G.,430
Tracy, K.,430
transformacin( es)
deplanes,351
deunestadoaotromedianteunaaccin,331
Trappl,R,14,430
Treloar,N.,427
tresenraya, 179
tresleyesdelarobticadeAsimov,las,406
triangulacinenlavisinestereoscpica,96-98
tropismos,31
Tuck,C.,419
Turing,Alan,2,4,5,8
Tversky,A., 305,430
1Yson,M., 120,429
UCPOP,360
ULU,26-28,34-40
Unman,J. D.,246,265,430
umg, unificadormsgeneral,228
unidad(es)
CIPA,28-29
contextualdeunaredneuronal,66
deproductoescalar(UPE), 52
lgicasconumbral(ULU),26-28,34-40
ocultas,41
sigmoidales,redconk-capasde,41
Unger, S., 31,430
unificacin,227-229
gramticasde,392
I
l
l
1
i
~
i}
t
l
,1
~ }
1
ndice 457
unificadordeunconjuntodeexpresiones,229
utilidaddelasreglasaprendidas,265
utilizacindelaregresin,344,348
validacincruzada,49
pordescartedeelementos,49
valorees)
beta(nodo), 183
decortealfa, 153, 183-184
de],125, 139
depropagacin, 139
vanGelder,7,425
Vardi,M.,413
variable(s)
aleatoria,285
booleana,23
condicionalmenteindependiente,292-293
cuantificada,222
estandarizadas,230
muda,221
variable,smbolode,221
variantealfabtica,23
Vazirani,U., 34,418
Vecchi, M., 173,418
vectordecaractersticas,63-65
vectoresextendidos,35
Veloso, M.,410
Venn,John,289,430
ventanadepromediado,80
vidaartificial,6,9, 12-13
Vina,A.,416
virus(BacterifagoE6),2
visin
artificial,75-101
basadaenmodelos,94-96
dirigidaporobjetivos(oportareas),91,98
anlisisdeunacadena(engramticas),
385
pragmtica,394
estereoscpica,96-98
porordenador,75-101
vueltaatrs
arquitecturavertical,30
conjuntodevalidacin,49
cronolgica, 118
diagramasdeVenn,289
dinmica, 122
dirigidapordependencias, 122
etapasdelprocesamientovisual,79
etiquetasdelosvectores(oclasesde), 33
fufvlida,202,219,226
frase verbal(FV),383,388
iteracindelvalor, 159
representacinvivida,265
texturavisual,90-91
Waibel,A.,50,397,430
Waldinger,R,237,360,420,430
WALKSAT,205,360
Walter,Grey, 19,430
Waltz,D.,94,397,421,429,430
Wang,X.,359,410,430
Ward,Artemus, 193
Warren,D.,397,425,430
Washington,R,416
Wattenber,M., 173,417
Webber,B.,397,415
Wefald,E., 12, 13, 160, 190,405,427
Wegman,M.,229,424
Weiss,S., 50,430
Weizenbaum,Joseph, 14,430
Weld,D.,9,273,360,368,412,425,429,431
Wellman,Michael, 13,304,316,332,360,411,
431
Werbos,P., 37,431
Wesley,L.,431
Weyhrauch,R,238,431
White,T. H., 103
Whitehead,S., 405,431
Widrow,B.,8,34,431
Widrow-HoffcontraDeltageneralizado,38
Wiener,N.,8,431
Wiesel,N.,98,417
Wilcox,B., 189,426

1'11
458 ndice
i
Wilkins,D.E., 356,360,361,405,431
Williams,R.J.,426
Wilson,S.,6,431
Winker,S.,237,431
Winograd,T., 2, 9,431
Wonham,M.,360,426
Woods,W.,9,397,431
Wooldridge,D.,431
Wos,Larry,235,237,431
Wu,Y., 91,432
.,
Yager,E.,419
Yang,Q., 160,408
Yung,M.,171,407
Zadeh,L.,305,432
Zhu,S.C.,90,432
Zobrist, 189,432
Zweben,M.,360,432

Inteligencia Artificial Una Nueva Sintesis Nils J. Nilsson

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Inteligencia Artificial Una Nueva Sintesis Nils J. Nilsson

Enviado por

Direitos autorais:

Formatos disponíveis

--

MADRIDBUENOSAIRES CARACAS GUATEMALA USBOA MXICO

Amenudo,es convenienteasignarcostespositivosa los arcospararepresentarelcostede

ld rgkl 4-3=1 oH:3 2=1

, parai 1, ...,k. Parapredecirlasaccionesfuturasde

Arquitectura de tres mdulos

Você também pode gostar