Você está na página 1de 3

PROPAGACION DE EVIDENCIA

Los metodos de propagacion simbolica conducen a soluciones que se expresan como funciones de los parametros. Por ello, las respuestas a cuestiones generales pueden darse en forma simbolica en funcion de los parametros, y las respuestas a preguntas especficas pueden obtenerse sin mas que sustituir los valores de los parametros en la solucion simbolica, sin necesidad de rehacer la propagacion. Por otra parte, la propagacion simbolica permite estudiar con escaso esfuerzo computacional la sensibilidad de los resultados a cambios en los valores de los parametros. La propagacion simbolica es especialmente util en los casos siguientes: 1. Cuando no se dispone de la especificacion numerica del modelo probabil stico. 2. Cuando los especialistas solo son capaces de especificar intervalos de los parametros en vez de valores concretos. En este caso, los metodos de propagacion simbolica pueden utilizarse para obtener cotas inferiores y superiores de las probabilidades para todos los valores posibles de los parametros en los intervalos dados. 3. Cuando se requiere un analisis de sensibilidad. Una de las cuestiones que surge normalmente en este contexto es, como son de sensibles los resultados a cambios en los parametros y a los valores evidenciales? Los algoritmos de propagacion simbolica han sido introducidos recientemente en la literatura. Por ejemplo, Castillo, Gutierrez y Hadi (1995c, 1995d) realizan la propagacion simbolica adaptando algunos de los metodos numericos de propagacion descritos en el Captulo 8 a este tipo de propagaci on. Estos metodos realizan los calculos simbolicos necesarios utilizando paquetes de calculo con posibilidades simbolicas (tales como Mathematica y Maple). Otro metodo con capacidades de calculo simbolico es el algoritmo de inferencia probabilstica simbolica (SPI) (Shachter, DAmbrosio y DelFabero (1990) y Li y DAmbrosio (1994)). Este metodo es orientado a un objetivo y analiza solo los calculos que se requieren para responder a la pregunta en estudio. Con este metodo, los resultados se obtienen posponiendo la evaluacion de las expresiones y manteniendolas en forma simbolica. Sin embargo, los dos metodos anteriores tienen el mismo problema: necesitan utilizar programas especiales, o un esfuerzo computacional extra, para poder tratar las expresiones simbolicas. Por otra parte, el calculo y la simplificacion de expresiones simbolicas es una tarea computacionalmente cara, y a veces progresivamente ineficiente cuando se trata con grandes redes o grandes conjuntos de parametros simbolicos. Recientemente, Castillo, Gutierrez y Hadi (1996c) han introducido una solucion a la propagacion simbolica que utiliza ventajosamente la estructura simbolica polinomial de las probabilidades de los nodos (vease la Seccion 7.5.1) para evitar los calculos simbolicos. La principal idea del metodo consiste en obtener las expresiones simbolicas mediante un algoritmo numerico que calcula los coeficientes de los polinomios correspondientes. Entonces, todos los calculos se hacen de forma numerica, evitando la manipulacion de expresiones simbolicas costosas. En la Seccion 10.2 se introduce la notacion y el marco de trabajo de los metodos simbolicos. La Seccion 10.3 discute la generacion automatica de codigo simbolico. La estructura algebraica de las probabilidades se analiza en la Seccion 10.4. La Seccion 10.5 muestra como se pueden utilizar los metodos de propagacion simbolica de evidencia para obtener las expresiones simbolicas de las probabilidades de ocurrencia de los nodos. La Seccion 10.6 presenta una mejora del metodo anterior para el caso de tareas orientadas a un objetivo. La Seccion 10.7 trata del problema de la evidencia aleatoria

simbolica. La Seccion 10.8 muestra como hacer un estudio de sensibilidad mediante los metodos simbolicos. Finalmente, la Seccion 10.9analiza el problema de la propagacion simbolica de la evidencia en redes Bayesianas normales.

10.2 Notacion y Conceptos Preliminares


En el Captulo 6 se ha visto que la funcion de probabilidad conjunta asociada a las redes probabilsticas de Markov descomponibles y Bayesianas puede darse mediante una factorizacion como producto de probabilidades condicionales p(x1, . . . , xn) =
n

_i=1 p(xi|i). (10.1) En el caso de redes Bayesianas, los conjuntos condicionantes son los padres del nodo, i, i = 1, . . . , n. En el caso de redes de Markov descomponibles, estos conjuntos se obtienen aplicando la regla de la cadena a la factorizacion obtenida a partir de la cadena de conglomerados (vease el Captulo 6). Por tanto, aunque algunos de los metodos introducidos en este captulo pueden ser facilmente extendidos para tratar una representacion potencial de la funcion de probabilidad conjunta, por simplicidad, pero sin perdida de generalidad, se utiliza el conjunto de probabilidades condicionales en (10.1) como representacion parametrica basica de la funcion de probabilidad conjunta. Sea X = {X1, . . . , Xn} un conjunto de n variables discretas, cada una de las cuales puede tomar valores en el conjunto {0, 1, . . . , ri}, y sea B = (D,P) una red Bayesiana definida sobre X, donde el grafo dirigido acclico D determina la estructura del conjunto de probabilidades condicionales, y P = {p(x1|1), . . . , p(xn|n)} es el conjunto de probabilidades condicionales que se necesitan para especificar la funcion de probabilidad conjunta. Algunas de las probabilidades condicionales en (10.1) pueden darse en forma numerica y otras en forma simbolica, es decir, p(xi|i) pueden ser familias parametricas o probabilidades totalmente especificadas numericamente. Definicion 10.1 Nodo Simbolico. Cuando p(xi|i) es una familia param etrica simbolica (es decir, depende de al menos un parametro en forma simbolica), el nodo Xi se denomina un nodo simbolico, y se utiliza i para denotar sus correspondientes parametros simbolicos. Como se ha visto en la Seccion 7.5.1, cuando p(xi|i) es una familia param etrica, es decir, cuando Xi es un nodo simbolico, una eleccion conveniente de los parametros es la siguiente ij = p(Xi = j|i = ), j {0, . . . , ri}, (10.2) donde es cualquier posible realizacion de los padres, i, de Xi. Por ello, el primer subndice de ij se refiere al numero del nodo, el segundo subndice se refiere al estado del nodo, y los restantes subndices se refieren a las realizaciones de sus padres. Puesto que _ri j=0 ij = 1, para todo i y , no todos los parametros son libres, es decir, uno cualquiera de ellos puede ser escrito como la unidad menos la suma del resto. Por ejemplo, el primer parametro puede escribirse como i0 = 1
ri

_j=1 ij. (10.3) Para simplificar la notacion en los casos en los que la variable Xi no tiene padres, se utiliza ij para denotar pi(Xi = j), j {0, . . . , ri}. Se ilustra esta notacion usando el ejemplo siguiente.

Ejemplo 10.1 Nodos simbolicos. Considerese una red Bayesiana discreta consistente en las variables X = {X1, . . . , X8} cuyo correspondiente grafo dirigido acclico se muestra en la Figura 10.1. La estructura del grafo implica que la probabilidad conjunta del conjunto de nodos puede escribirse en la forma (10.1), como p(x) = p(x1)p(x2|x1)p(x3|x1)p(x4|x2, x3)p(x5|x3)p(x6|x4)p(x7|x4)p(x8|x5). (10.4) Por simplicidad, y sin perdida de generalidad, supongase que todos los nodos representan variables binarias con valores en el conjunto {0, 1}. Esto y la estructura de la distribucion de probabilidad en (10.4) implica que la funcion de probabilidad conjunta de las ocho variables depende de 34 parametros = {ij}. Notese, sin embargo, que solamente 17 de ellos son libres (puesto que las probabilidades en cada una de las probabilidades condicionales deben sumar la unidad). Estos 17 parametros se dan en la Tabla 10.1.
FIGURA 10.1. Un grafo dirigido acclico.