Você está na página 1de 83

Índice general

1. Modelos de redes 1
1.1. Algoritmos de optimización en redes . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1. Introducción y conceptos básicos . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2. Árbol de expansión mı́nima . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.3. Algoritmo de flujo máximo . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.4. Algoritmo de Dijkstra (ruta más corta) . . . . . . . . . . . . . . . . . . 23
1.1.5. Algoritmo de Floyd (ruta más corta) . . . . . . . . . . . . . . . . . . . . 29
1.2. Redes y algoritmos para la administración de proyectos . . . . . . . . . . . . . 33
1.2.1. Construcción de la red . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.2.2. Algoritmo de la ruta crı́tica (CPM) . . . . . . . . . . . . . . . . . . . . . 36
1.2.3. Diagramas de Gantt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.2.4. Análisis de la ruta crı́tica con PERT . . . . . . . . . . . . . . . . . . . . 43
1.2.5. Optimización en la reducción de la duración del proyecto . . . . . . . . 46

2. Teorı́a de decisiones 51
2.1. Teorı́a de juegos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.1.1. Formulación de juegos de dos personas y suma cero . . . . . . . . . . . . 51
2.1.2. Estrategia dominada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.1.3. Criterio minimax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.1.4. Juegos con estrategia mixta . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2. Análisis de decisiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.2.1. Toma de decisiones sin experimentación . . . . . . . . . . . . . . . . . . 65
2.2.2. Toma de decisiones con experimentación . . . . . . . . . . . . . . . . . . 69
2.2.3. Árboles de decisión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.3. Cadenas de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.3.1. Procesos estocásticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.3.2. Procesos de estados discreto . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.3.3. Cadenas de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.3.4. Ecuaciones de Chapman-Kolmogorov . . . . . . . . . . . . . . . . . . . . 81
2.3.5. Propiedades a largo plazo de las cadenas de Markov . . . . . . . . . . . 81

Bibliografı́a 83

i
ÍNDICE GENERAL

ii
Capı́tulo 1

Modelos de redes

1.1. Algoritmos de optimización en redes


1.1.1. Introducción y conceptos básicos
En la vida diaria se presentan diversas situaciones que requieren de una solución que
minimice el uso de algún material, o que determine la ruta más corta entre un origen y
uno o más destinos, o que proporcione la capacidad máxima de alguna sustancia que se
necesita transportar a través de una red. Las situaciones antes mencionadas son problemas
de optimización y pueden resolverse utilizando modelos de programación lineal, sin embargo,
algunas de estas situaciones contemplan demasiadas variables y se necesita de mucho tiempo
para hallar una solución. Los algoritmos de optimización de redes son computacionalmente
más sencillos y por lo tanto son capaces de resolver modelos que involucren una gran cantidad
de variables.
A continuación se presentan algunos ejemplos de aplicación a los modelos de redes [3].

1. Diseño de una red de oleoductos para gas natural a una determinada distancia de la costa
para conectar los cabezales de los pozoz en el Golfo de México a un punto de distribución
costero con el objetivo de minimizar el costo de construcción de los oleoductos.

2. Determinación de la ruta más corta entre dos ciudades en una red existente de carreteras.

3. Determinación de la capacidad máxima (en toneladas por año) de una red de oleoductos
para lodos de carbón que unen minas de carbón en Wyoming con plantas eléctricas en
Houston (los oleoductos para lodos transportan carbón al bombear agua a través de
tuberı́as especialmente diseñadas).

4. Determinación del cronograma (fechas de inicio y terminación) para las actividades de


un proyecto de construcción.

Una gráfica o red, se define mediante dos conjuntos, uno de nodos o vértices y otro de
lı́neas o arcos que unen vértices. Los arcos se definen mencionando el par de nodos que une,
asimismo los arcos pueden tener un peso o flujo (una cantidad que indique lo que se necesita
para realizar la transición de un nodo a otro) y una dirección. Si el flujo a través de un arco

1
1. MODELOS DE REDES

Figura 1.1: Red de nodos y arcos.

Figura 1.2: Red dirigida de nodos y arcos.

se permite sólo en una dirección se dice que es un arco dirigido. La dirección se indica con
una flecha en la lı́nea que representa el arco. Cuando se etiqueta un arco se pone primero de
dónde viene y luego hacia a dónde va.
Una red que tiene arcos dirigidos, se llama red dirigida.
Una trayectoria entre dos nodos es una sucesión de arcos distintos que conectan estos dos
nodos. Una trayectoria dirigida del nodo i al nodo j, es una sucesión de arcos cuya dirección
es hacia el nodo j.
En la red que se muestra en la Fig. 1.1, se pueden identificar 12 trayectorias diferentes que
conectan el nodo O y el nodo T . Una de dichas trayectorias es O −A−B −E −D −T . En la red
dirigida de la Fig. 1.2, una trayectoria dirigida del nodo A al nodo E es A → B → C → E, sin
embargo no hay una trayectoria dirigida del nodo E al nodo A. A continuación, se presentan
las definiciones de ciclo, red conexa y árbol.

Definición 1.1 (Ciclo) Un ciclo es una trayectoria que comienza y termina en el mismo

2
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

nodo. En una red dirigida, un ciclo puede ser dirigido o no según la trayectoria en cuestión.

Definición 1.2 (Red conexa) Se dice que dos nodos están conectados si la red contiene al
menos una trayectoria no dirigida entre ellos. Una red conexa es una red en la que cada par
de nodos está conectado.

Definición 1.3 Un árbol es una red conexa para algún subconjunto de nodos que no contiene
ciclos. Un árbol de expansión es una red conexa que contiene a los n nodos y no contiene
ciclos. Todo árbol de expansión tiene n − 1 arcos.

1.1.2. Árbol de expansión mı́nima


El algoritmo para hallar el árbol de expansión mı́nima de una red se utiliza cuando surge
la necesidad de que todos los nodos de la red esten conectados a un costo mı́nimo.
Algunas de las situaciones en las que se presenta son: pavimentación de carreteras que
unen poblaciones, proporcionar servicio de televisión por cable a una ciudad, diseño de una
red de lı́neas de transmisión de energı́a eléctrica de alto voltaje, entre otras.

Algoritmo del problema del árbol de expansión mı́nima [2]


1. Se selecciona, de manera arbitraria, cualquier nodo y se conecta, es decir, se agrega una
ligadura a un nodo distinto más cercano.

2. Se identifica el nodo no conectado más cercano a un nodo conectado y se conectan estos


dos nodos, esto es, se agrega una ligadura entre ellos. Este paso se repite hasta que todos
los nodos se encuentren conectados.

3. Rompiendo empates: los empates del nodo más cercano distinto (paso 1) o del nodo
conectado más cercano (paso 2), se pueden romper en forma arbitraria, pero el algoritmo
debe llegar a una solución óptima. No obstante, estos empates son señal de que pueden
existir (pero no necesariamente) soluciones óptimas múltiples.

Ejemplo 1.1 (Tomado de Hillier [2]) La administración de Seervada Park debe determi-
nar los caminos bajo los cuales se deben tender las lı́neas telefónicas para conectar todas las
estaciones con una longitud total mı́nima de cable.

Solución. En la siguiente figura, se resumen los nodos y las distancias entre las diferentes
estaciones de la reserva de Seervada Park. Cada lı́nea representa una ligadura potencial.

3
1. MODELOS DE REDES

Como lo indica el algoritmo, se inicia seleccionando de manera arbitraria un nodo, sea O.


Observe que el nodo seleccionado se conecta con los nodos A, B y C con longitudes 2, 5 y 4
respectivamente. Se conecta el nodo O con el nodo A, debido a que es la longitud más corta.
En la siguiente figura se muestra como empieza a formarse el árbol de expansión al conectar
los primeros dos nodos.

Se observa que de los nodos conectados (O y A), las conexiones con los nodos no conectados
son (A, D) con longitud de 7, (A, B) con longitud de 2, (O, B) con longitud de 5 y (O, C) con
longitud de 4. La longitud más corta es la (A, B) con longitud de 2, por lo que el nodo B es
el siguiente en conectarse. En la siguiente figura se muestran los tres nodos conectados que
están construyendo el árbol de mı́nima expansión.

El nodo no conectado más cercano a los nodos O, A, o B es el nodo C (conectando con


B) con una longitud de 1. Se conecta el nodo C con el nodo B.

El nodo no conectado más cercano a los nodos O, A, B o C, es el nodo E (conectando


con B) con una longitud de 3. Se conecta el nodo E con el nodo B.

4
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

El nodo no conectado más cercano a los nodos O, A, B, C o E es el nodo D (conectando


con E) con una longitud de 1. Se conecta el nodo D con el nodo E.

El único nodo no conectado es el nodo T y el nodo más cercano es el nodo D con una
longitud de 5. Se conecta el nodo T con el nodo D. Al encontrarse todos los nodos conecta-
dos, se ha encontrado el árbol de expansión mı́nima que resuelve el problema de cablear las
estaciones de Seervada Park con una cantidad mı́nima de cable de 14 km. A continuación se
muestran todos los nodos conectados y como queda finalmente el árbol de expansión mı́nima.

Ejemplo 1.2 La maderera Wirehouse talará árboles en ocho zonas de la misma área. Pero
antes debe desarrollar un sistema de caminos de tierra para tener acceso a cualquier zona
desde cualquier otra. La distancia (en kilómetros) entre cada par de zonas es:

5
1. MODELOS DE REDES

Solución. En este ejemplo se presenta la red en forma matricial, donde las filas y columnas
son los nodos de la red y las entradas de la matriz representan los pesos de los arcos de un nodo
a otro. El objetivo es conocer los caminos que se deben construir de tal forma que se minimice
el número de kilómetros construidos y que cada par de zonas se encuentren conectadas. Se
utilizará la aplicación Mı́nima Expansión ?? para obtener el resultado de este problema.
La aplicación Mı́nima Expansión trabaja con cantidades enteras por lo que el primer paso
es escalar los valores proporcionados en el ejemplo para obtener valores enteros (multiplicando
por 10) y posteriormente introducirlos en la aplicación como se muestra en la siguiente figura:

A continuación se hace click en el botón ejecutar y se obtienen los resultados del algoritmo
de árbol de expansión mı́nima. En la Iteración 1, la única zona conectada es la 1, y se puede
conectar con cualquiera de las otras zonas. Se conecta con la zona 5 que es con la que tiene
la distancia mı́nima (valor 11).

En la Iteración 2, se encuentran conectadas las zonas 1 y 5, y la distancia mı́nima a las


zonas no conectadas es de 11 de la zona 5 a la zona 4.

6
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

En la Iteración 3, se encuentran conectadas las zonas 1, 5 y 4, y la distancia mı́nima a las


zonas no conectadas es de 13 de la zona 5 a la zona 8.

En la Iteración 4, se encuentran conectadas las zonas 1, 5, 4 y 8, y la distancia mı́nima a


las zonas no conectadas es de 8 de la zona 8 a la zona 7.

En la Iteración 5, se encuentran conectadas las zonas 1, 5, 4, 8 y 7, y la distancia mı́nima


a las zonas no conectadas es de 10 de la zona 7 a la zona 6.

7
1. MODELOS DE REDES

En la Iteración 6, se encuentran conectadas las zonas 1, 5, 4, 8, 7 y 6, y la distancia mı́nima


a las zonas no conectadas es de 16 de la zona 8 a la zona 3.

En la Iteración 7, se encuentran conectadas las zonas 1, 5, 4, 8, 7, 6 y 3, y la distancia


mı́nima a las zonas no conectadas es de 14 de la zona 3 a la zona 2.

Finalmente quedan todos los nodos conectados como se indica en la siguiente figura y se
concluye que la maderera Wirehouse necesitará construir 8.3km de caminos. Los caminos a
construir son entre las siguiente zonas: (1,5), (5,4), (5,8), (8,7), (7,6), (8,3) y (3,2).

8
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

1.1.3. Algoritmo de flujo máximo


En una empresa, los empleados necesitan que el flujo de datos a través de la red aumente,
debido a que ahora realizan videollamadas con otras empresas para cerrar tratos de negocios,
capacitan a su personal utilizando video tutoriales almacenados en la nube, permiten que
sus empleados trabajen en un ambiente confortable al escuchar música utilizando un servicio
como el que proporciona Spotify. Para resolver el problema anterior, es necesario determinar
la cantidad máxima de datos que fluyen a través de la red empresarial. Este tipo de problema
se conoce como problema de flujo máximo
En términos generales, el problema de flujo máximo se puede describir de la siguiente
manera [2].

1. Todo flujo a través de una red conexa dirigida se origina en un nodo, llamado origen,
y termina en otro nodo llamado destino.

2. Los nodos restantes son nodos de trasbordo.

3. Se permite el flujo a través de un arco sólo en la dirección indicada por la flecha, donde
la cantidad máxima de flujo está dada por la capacidad del arco. En el origen, todos los
arcos señalan hacia afuera. En el destino, todos señalan hacia el nodo.

4. El objetivo es maximizar la cantidad total de flujo del origen al destino. Esta cantidad
se mide en cualquiera de las dos maneras equivalentes, esto es, la cantidad que sale del
origen o la que entra al destino.

En otras palabras, este algoritmo se basa en encontrar rutas que permitan llevar un flujo
positivo desde el nodo origen hasta un nodo destino; a éstas se les llama rutas de avance.
Cada ruta destina al flujo total de la red, una parte o toda la capacidad de cada arco por el
que pasa la ruta. Finalmente, la suma de las capacidades de cada una de las rutas encontradas,
constituyen el flujo máximo de la red.
Considere una red de oleoductos que transporta petróleo crudo desde pozos hasta refi-
nerı́as. Se instalan estaciones intermedias de reforzamiento y bombeo a distancias apropiadas
para mover el crudo en la red. Cada segmento de tuberı́a tiene una velocidad de descarga
finita (o capacidad) de flujo de crudo. Un segmento de tuberı́a puede ser unidireccional o

9
1. MODELOS DE REDES

bidireccional, según su diseño [3]. En la Fig. 1.3, se muestra una red que conecta pozos pe-
troleros con las refinerı́as utilizando estaciones de redistribución intermedias. En esta red, las
flechas indican la dirección del flujo y los arcos que no tienen flecha son bidireccionales.

7
1 4

3 6 8 Destino
Origen

2 5
9

Estaciones de
Pozos Refinerías
redistribución

Figura 1.3: Red que conecta pozos petroleros y refineı́as por medio de estaciones de redistribución.

La solución del problema propuesto requiere agregar un solo origen y un solo destino,
utilizando arcos de capacidad infinita unidireccionales, como se muestra en la Fig. 1.3.
Para el arco (i, j), la notación (C ij , C ji )
proporciona las capacidades de flujo iniciales
en las dos direcciones i → j y j → i. Para eli-
minar la ambigüedad, colocamos a C ij junto
al nodo i y a C ji junto al nodo j, como se
muestra en la Fig. 1.4.
El objetivo de este algoritmo es encontrar
todas las rutas de avance, es decir, rutas que
lleven cierto flujo del origen al destino, con
el fin de obtener la capacidad máxima de la Figura 1.4: Flujos de arcos Cij de i → j y Cji de j → i.
red sumando las capacidades de cada ruta de
avance encontrada.
En primera instancia, es necesario identificar las capacidades de diseño para cada nodo en
la red inicial. Para un arco (i, j) su capacidad de diseño bidireccional es (C ij , C ji ). Debido a
que no siempre se utiliza la capacidad máxima en cada arco para llevar un flujo, las capacidades
residuales se actualizan en cada arco. Se utiliza la notación (cij , cji ) para representar las
capacidades residuales de cada arco (i, j).
En la construcción de una ruta de avance se etiquetan los nodos. Para un nodo j que
recibe flujo del nodo i, anexamos la etiqueta [aj , i] donde aj es el flujo del nodo i al nodo j.
A continuación se describen los pasos del algoritmo de flujo máximo.

Paso 1. a) Para todos los arcos, iguale la capacidad residual a la capacidad de diseño, esto es
(cij , cji ) = (C ij , C ji ).
b) Hacer a1 = ∞ y etiquetar el nodo origen con [∞, −].
c) Designe i = 1, y continúe con el paso 2. El nodo i representa al nodo actual.

10
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

Paso 2. a) Determine Si el conjunto de nodos no etiquetados j al que se puede llegar direc-


tamente desde i por medio de arcos con capacidades residuales positivas (es decir
cij > 0 para todas las j ∈ Si ).
b) Si Si 6= ∅, continúe con el paso 3. De lo contrario, una ruta parcial termina en el
nodo i. Continúe con el paso 4

Paso 3. a) Determine k ∈ Si de modo que

cik = máx {cij }


j∈Si

b) Designe ak = cik y etiquete el nodo k con [ak , i].


c) Si k = n, se ha etiquetado al nodo destino, y se ha encontrado una ruta de avance,
continúe con el paso 5. De lo contrario, designe i = k, y vaya al paso 2.

Paso 4. (Retroceso).

a) Si i = 1 (el conjunto S1 = ∅), no es posible avanzar; continúe al paso 6. De lo


contrario: Defina r, el nodo (en la ruta parcial) que se etiquetó inmediatamente
antes del nodo actual i, y elimine i del conjunto de nodos adyacentes al nodo r, es
decir, haga Sr = Sr − {i}.
b) Designe i = r, y regrese al paso 2.

Paso 5. (Determinación de las capacidades residuales).

a) Defina los nodos de la ruta de avance p−ésima del nodo 1 al nodo n como Np =
(1, k1 , k2 , · · · , n). Entonces el flujo máximo a lo largo de la ruta Np , representado
por la mı́nima de todas las capacidades residuales a lo largo de la ruta Np , y se
calcula como
fp = mín {a1 , ak1 , ak2 , · · · , an }

b) Actualizar las capacidades residuales de la ruta Np reduciendo en fp la capacidad


en la dirección del flujo e incrementando en fp en la dirección inversa, es decir,
para los nodos i y j en la ruta, la capacidad residual actual (cij , cji ) cambia a:
1) (cij − fp , cji + fp ) si el flujo es de i a j
2) (cij + fp , cji − fp ) si el flujo es de j a i
c) Se eliminan las etiquetas de los nodos y se restauran todos los nodos eliminados en
el paso 4.
d ) Haga i = 1 y regrese al paso 2.

Paso 6. a) Como fueron determinadas m rutas de avance, el flujo máximo en la red está
determinado por la suma de los flujos de cada ruta de avance fp , es decir:

F = f1 + f2 + · · · + fm

11
1. MODELOS DE REDES

b) Finalmente se calculan los flujos óptimos en cada arco, los cuales indican la cantidad
de flujo que realmente fluye a través de cada arco y la dirección en la que fluye. Los
flujos óptimos se calculan utilizando las capacidades de diseño (C ij , C ji ) (iniciales)
y las capacidades residuales(cij , cji ) finales del arco (i, j).
El flujo óptimo para el arco (i, j) se determina calculando

(α, β) = (C ij − cij , C ji − cji )

Si α < 0, el flujo óptimo es α en dirección i → j. Por otra parte si β > 0,


el flujo óptimo es β en dirección de j → i. Es imposible que α y β sean
positivos al mismo tiempo.

Ejemplo 1.3 Determine el flujo máximo y los flujos óptimos para la red que se muestra en
la Fig. 1.5.

0 4 20
5

10 0

1 30 0 5

20
0

10
30 0
0 20
2 40 3
0

Figura 1.5: Red de flujo.

Solución.

Iteración 1. Iguale las capacidades residuales iniciales (cij , cji ) a las capacidades de diseño (C ij , C ji ).

0 4 20

[ ,-]
10 0 [20,3]

1 30 0 5
20
0

10
30 0
0 20
2 40
3
0
[30,1]

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.

12
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

Paso 2. S1 = {2, 3, 4} (6= ∅).


Paso 3. k = 3, porque c13 = máx {c12 , c13 , c14 } = máx {20, 30, 10}. Establezca a3 = c13 =
30 y etiquete el nodo 3 con [30, 1]. Establezca i = 3 y repita el paso 2.
Paso 2. S3 = {4, 5}
Paso 3. k = 5, y a5 = c35 = máx {10, 20}. Etiquete el nodo 5 con [20, 3]. Establezca i = 5.
Como i = 5, se ha encontrado una ruta de avance. Continúe con el paso 5.
Paso 5. La ruta de avance se determina a partir de las etiquetas iniciando en el nodo 5
y regresando al nodo 1; es decir, (5) → [20, 3] → (3) → [30, 1] → (1). De este
modo, N1 = [1, 3, 5] y f1 = mín {a1 , a3 , a5 } = {∞, 30, 20} = 20. Las capacidades
residuales a lo largo de la ruta N1 son:

(c13 , c31 ) = (30 − 20, 0 + 20) = (10, 20)


(c35 , c53 ) = (20 − 20, 0 + 20) = (0, 20)

Iteración 2 .
[10,3]
0 4 20

[ ,-]
10 0
[20,4]
1 10 0 5
20
20

10
30 20
0 0
2 40
3
0
[20,1] [40,2]

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.


Paso 2. S1 = {2, 3, 4}.
Paso 3. k = 2, y a2 = c12 = máx {20, 10, 10}. Etiquete el nodo 2 con [20, 1]. Establezca
i = 2 y repita el paso 2.
Paso 2. S2 = {3, 5}.
Paso 3. k = 3, y a3 = c23 = 40. Etiquete el nodo 3 con [40, 2]. Establezca i = 3 y repita el
paso 2.
Paso 2. S3 = {4}.
Paso 3. k = 4, y a4 = c34 = 10. Etiquete el nodo 4 con [10, 3]. Establezca i = 4 y repita el
paso 2.
Paso 2. S4 = {5}. (Debido a que los nodos 1 y 3 ya están etiquetados, no se incluyen en
S4 ).

13
1. MODELOS DE REDES

Paso 3. k = 5, y a5 = c45 = 20. Etiquete el nodo 5 con [20, 4]. Se ha encontrado una ruta
de avance. Continúe con el paso 5.
Paso 5. N2 = [1, 2, 3, 4, 5] y f2 = mín {∞, 20, 40, 10, 20} = 10. Las capacidades residuales a
lo largo de la ruta N2 son:
(c12 , c21 ) = (20 − 10, 0 + 10) = (10, 10)
(c23 , c32 ) = (40 − 10, 0 + 10) = (30, 10)
(c34 , c43 ) = (10 − 10, 5 + 10) = (0, 15)
(c45 , c54 ) = (20 − 10, 0 + 10) = (10, 10)
Iteración 3 .

0 4 10

15

[ ,-]
10 10
[30,2]
1 10 0 5
10
20

0
30 20
10 0
2 30
3
10
[10,1] [30,2]

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.


Paso 2. S1 = {2, 3, 4}.
Paso 3. k = 2 y a2 = c12 = máx {10, 10, 10} y etiquete el nodo 2 con [10, 1]. Establezca
i = 2 y repita el paso 2.
Paso 2. S2 = {3, 5}.
Paso 3. k = 3 y a3 = c23 = 30 y etiquete el nodo 3 con [30, 2]. Establezca i = 3 y repita el
paso 2.
Paso 2. S3 = ∅. Vaya al paso 4.
Paso 4. Retroceso. La etiqueta [30, 2] en el nodo 3, proporciona el nodo inmediatamente
anterior r = 2. Elimine el nodo 3 tachándolo para no considerarlo en esta iteración.
Establezca i = r = 2, y repita el paso 2.
Paso 2. S2 = {5}.
Paso 3. k = 5, y a5 = c25 = 30. Etiquete el nodo 5 con [30, 2]. Se ha encontrado una ruta
de avance. Continúe con el paso 5.
Paso 5. N3 = [1, 2, 5] y f3 = mín {∞, 10, 30} = 10. Las capacidades residuales a lo largo de
la ruta N3 son:
(c12 , c21 ) = (10 − 10, 10 + 10) = (0, 20)
(c25 , c52 ) = (30 − 10, 0 + 10) = (20, 10)

14
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

Iteración 4 .

0 4 10

15

[ ,-] 10 10
[20,2]
1 10 10 5

0
20

0
20 20
20 0
2 30
3
10
[10,3] [10,1]

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.

Paso 2. S1 = {3, 4}.

Paso 3. k = 3, y a3 = c13 = 10. Etiquete el nodo 3 con [10, 1]. Establezca i = 3 y repita el
paso 2.

Paso 2. S3 = {2}.

Paso 3. k = 2, y a2 = c32 = 10. Etiquete el nodo 2 con [10, 3]. Establezca i = 2 y repita el
paso 2.

Paso 2. S2 = {5}.

Paso 3. k = 5, y a5 = c25 = 20. Etiquete el nodo 5 con [20, 2]. Se ha encontrado una ruta
de avance. Continúe con el paso 5.

Paso 5. N4 = [1, 3, 2, 5] y f4 = mín {∞, 10, 10, 20} = 10. Las capacidades residuales a lo
largo de la ruta N4 son:

(c13 , c31 ) = (10 − 10, 20 + 10) = (0, 30)


(c32 , c23 ) = (10 − 10, 30 + 10) = (0, 40)
(c25 , c52 ) = (20 − 10, 10 + 10) = (10, 20)

Iteración 5 .

15
1. MODELOS DE REDES

[10,1]
0 4 10

15

[ ,-]
10 10
[10,4]
1 0 20 5

0
20

0
10 30
20 0
2 40
3
0 [15,4]

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.

Paso 2. S1 = {4}.

Paso 3. k = 4 y a4 = c14 = 10 y etiquete el nodo 4 con [10, 1]. Establezca i = 4 y repita el


paso 2.

Paso 2. S4 = {3, 5}.

Paso 3. k = 3 y a3 = c43 = 15 y etiquete el nodo 3 con [15, 4]. Establezca i = 3 y repita el


paso 2.

Paso 2. S3 = ∅. Vaya al paso 4.

Paso 4. Retroceso. La etiqueta [15, 4] en el nodo 3, proporciona el nodo inmediatamente


anterior r = 4. Elimine el nodo 3 tachándolo para no considerarlo en esta iteración.
Establezca i = r = 4, y repita el paso 2.

Paso 2. S4 = {5}.

Paso 3. k = 5, y a5 = c45 = 10. Etiquete el nodo 5 con [10, 4]. Se ha encontrado una ruta
de avance. Continúe con el paso 5.

Paso 5. N5 = [1, 4, 5] y f5 = mín {∞, 10, 10} = 10. Las capacidades residuales a lo largo de
la ruta N5 son:

(c14 , c41 ) = (10 − 10, 0 + 10) = (0, 10)


(c45 , c54 ) = (10 − 10, 10 + 10) = (0, 20)

Iteración 6 .

16
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

10 4 0

15

0 20

1 0 20 5

0
20

0
10 30
20 0
2 40
3
0

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.

Paso 2. S1 = ∅). Como no se puede ir a otro nodo desde el origen, no es posible encontrar
otra ruta de avance. Continúe con el paso 6.

Paso 6. El flujo máximo en la red es F = f1 + f2 + f3 + f4 + f5 = 20 + 10 + 10 + 10 + 10 = 60


unidades. El flujo óptimo en los arcos individuales se calcula restando las cacidades
residuales en la red de la iteración 6 (cij , cji ) de las capacidades residuales de la red
inicial o capacidades de diseño (C ij , C ji ), como se muestra en la siguiente tabla.
Arco (C ij , C ji ) − (cij , cji )6 Cantidad de flujo Dirección
(1, 2) (20, 0) − (0, 20) = (20, −20) 20 1→2
(1, 3) (30, 0) − (0, 30) = (30, −30) 30 1→3
(1, 4) (10, 0) − (0, 10) = (10, −10) 10 1→4
(2, 3) (40, 0) − (40, 0) = (0, 0) 0 −
(2, 5) (30, 0) − (10, 20) = (20, −20) 20 2→5
(3, 4) (10, 5) − (0, 15) = (10, −10) 10 3→4
(3, 5) (20, 0) − (0, 20) = (20, −20) 20 3→5
(4, 3) (5, 10) − (15, 0) = (−10, 10) 10 3→4
(4, 5) (20, 0) − (0, 20) = (20, −20) 20 4→5

Ejemplo 1.4 (Flujo de aerolı́nea máximo) Las aerolı́neas Fly-by-Night deben determni-
nar cuántos vuelos de conexión diarios se pueden concretar entre Juneau, Alaska y Dallas,
Texas. Los vuelos de conexión deben deternerse en Seattle y después parar en Los Ángeles o
Denver. Debido al espacio de aterrizaje limitado, Fly-by-Night está limitado a hacer el número
de vuelos diarios entre los pares de ciudades que se muestran en la siguiente tabla. Establezca
un problema de flujo cuya solución le permita saber a la aerolı́nea cómo maximizar el número
de vuelos de conexión diarios de Juneau a Dallas. (Tomado de Winston [5])

17
1. MODELOS DE REDES

Ciudades Número máximo de vuelos diarios


Juneau-Seattle 3
Seattle-L.A. 2
Seattle-Denver 3
L.A.-Dallas 1
Denver-Dallas 2

Solución. El objetivo es conocer el número máximo de vuelos diarios que se pueden realizar
entre las ciudades de Juneau y Dallas. El primer paso para conocer este número, es construir
una red que represente el problema. Esta red se puede representar gráficamente como se
muestra en la Fig. 1.6, o bien en forma matricial. Posteriormente se utiliza la aplicación Flujo
Máximo referencia a descarga, para obtener los resultados del algoritmo, mismos que se
muestran en la Fig. 1.7.

Los Ángeles

2 1

3 3 2
1 2 3 5

Juneau Seattle Denver Dallas

Figura 1.6: Red que representa los Figura 1.7: Solución al problema de la aerolı́nea Fly-by-Night.
viajes entre Juneau y Dallas.
De acuerdo a los resultados del algoritmo se concluye que se pueden realizar un máximo de
3 vuelos diarios entre Juneau y Dallas (Flujo Máximo), de los cuales, 1 vuelo sigue la ruta
Juneau-Seattle-L.A.-Dallas(Flujo óptimo en los arcos (1,3),(2,4),(4,5) con 3,1,1 respectiva-
mente) y 2 vuelos siguen la ruta Juneau-Seattle-Denver-Dallas (Flujos óptimos en los arcos
(1,2),(2,3),(3,5) con 3,2,2 respectivamente).

Ejemplo 1.5 En fecha reciente se reservó el área de SEERVADA PARK para paseos y campa-
mentos. No se permite la entrada de automóviles, pero existe un sistema de caminos angostos
y sinuosos para tranvı́as y para “jeeps” conducidos por los guardabosques. En la Fig. 1.8 se
muestra este sistema de caminos, (sin las curvas) en donde O es la entrada al parque; las
otras letras representan la localización de las casetas de los guardabosques y otras instalacio-
nes de servicio. El parque contiene un mirador a un hermoso paisaje en la estación T. Algunos
tranvı́as transportan a los visitantes desde la entrada a la estación T y viceversa. Durante la
temporada pico, hay más personas que quieren tomar un tranvı́a a la estación T que aquellas
a las que se les puede dar servicio. Para evitar la perturbación indebida de la ecologı́a y de la
vida silvestre de la región, se ha impuesto un racionamiento estricto al número de viajes al
dı́a que pueden hacer los tranvı́as en cada camino. De esta forma, durante la temporada pico,
se pueden seguir varias rutas, sin tomar en cuenta la distancia, para aumentar el número de
viajes de tranvı́a diarios. La pregunta es cómo planear las rutas de los distintos viajes, de
manera que se maximice el número total de viajes que se pueden hacer al dı́a, sin violar los
lı́mites impuestos sobre cada camino. Tomado de Hillier [2]

Solución. El objetivo es conocer el número máximo de viajes diarios que se pueden realizar
entre la entrada al parque y el mirador. El primer paso para conocer este número representar

18
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

A 3
1
5
T
7 4 9
O B D
4 5

1
6
C E
4

Figura 1.8: Red que conecta pozos petroleros y refineı́as por medio de estaciones de redistribución.

la red de estaciones del parque en forma matricial. Posteriormente se utiliza la aplicación


Flujo Máximo referencia a descarga. A continuacin se muestran las iteraciones realizadas
por el algoritmo y los resultados obtenidos al final.
En la Fig. 1.9, se muestra como se obtuvo la primera ruta de avance, obteniendo un flujo
f1 = 5. En la Fig. 1.10 se muestran las capacidades residuales actualizadas a través de la ruta
de avance de la iteración.

Figura 1.9: Ruta de avance obtenida en la iteración 1. Figura 1.10: Actualización de las capacidades resi-
duales.

Figura 1.11: Ruta de avance obtenida en la iteración 2. Figura 1.12: Actualización de las capacidades resi-
duales.

Figura 1.13: Ruta de avance obtenida en la iteración 3. Figura 1.14: Actualización de las capacidades resi-
duales.

19
1. MODELOS DE REDES

Figura 1.15: Ruta de avance obtenida en la iteración 4. Figura 1.16: Actualización de las capacidades resi-
duales.

Figura 1.17: Ruta de avance obtenida en la iteración 5. Figura 1.18: Actualización de las capacidades resi-
duales.
Se observa en las figuras 1.11, 1.13, 1.15 y 1.17, las diferentes rutas de avance obtenidas
con sus flujos correspondientes f2 = 3, f3 = 4, f4 = 1 y f5 = 1. En las figuras 1.12, 1.14, 1.16
y 1.18, se muestra como se actualizan las capacidades residuales en cada iteración. Finalmente
en la Fig. 1.19, se puede observar que el conjunto de nodos alcanzables desde el origen (nodo 1)
es vacı́o, el cual es el indicador de que no es posible encontrar más rutas de avance y finalizan
las iteraciones del algoritmo dando lugar al cálculo del flujo máximo y los flujos óptimos.

Figura 1.19: Iteración 6, no se encontró ruta de avance.

En la Fig. 1.20, se muestran los resultados obtenidos al utilizar la aplicación Flujo Máxi-
mo observando que el máximo de viajes diarios al mirador de Seervada Park es de 14 y la
distribución de viajes a través de las estaciones se observa en los flujos óptimos. Los 14 viajes
diarios, salen del origen y se distribuyen en 4 a la estación A, 6 a la B y 4 a la C y de ahı́ a

20
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

las otras estaciones y finalmente al mirador.

Figura 1.20: Solución al problema de los viajes al mirador en Seervada Park..

Ejercicios
Ejercicio 1.1 Tres refinerı́as envı́an un producto de gasolina a dos terminales de distribución
a través de una red de oleoductos. Cualquier demanda que no puede ser satisfecha por medio
de la red se adquiere de otras fuentes. Tres estaciones de bombeo le dan servicio a la red, como
se muestra en la siguiente figura.

1 7
20 10
4
20 10 50
10
2 50 6

20 30 20
5
15 30
3 8

Estaciones de
Refinerías Terminales
bombeo

El producto fluye en la red en la dirección indicada por las flechas. La capacidad de cada
segmento de ducto (mostrada directamente en los arcos) está en millones de barriles por dı́a.
Determine lo siguiente:

a) La producción diaria en cada refinerı́a que iguala la capacidad máxima de la red.

b) La demanda diaria en cada terminal que iguala la capacidad máxima de la red.

21
1. MODELOS DE REDES

c) La capacidad diaria en cada bomba que iguala la capacidad máxima de la red.

d) Suponga que la capacidad diaria máxima de la bomba 6 en la red está limitada a 50 mi-
llones de barriles por dı́a. Remodele la red para incluir esta restricción. Luego determine
la capacidad máxima de la red.

Ejercicio 1.2 Se transporta alimento para gallinas por medio de camiones desde tres silos
hasta cuatro granjas. Algunos de los silos no pueden mandar los envı́os directamente a al-
gunas de las granjas. Las capacidades de las demás rutas están limitadas por la cantidad de
camiones disponibles y el número de viajes realizados diariamente. La siguiente tabla muestra
las cantidades diarias de abasto en silos y la demanda en las granjas (en miles de pesos). Las
entradas en las celdas de la tabla especifican las capacidades diarias de las rutas asociadas.

Granja
1 2 3 4
1 30 5 0 40 20
Silo 2 0 5 5 90 20
3 100 40 30 40 200
200 10 60 20

a) Determine el programa que satisface la demanda máxima.

b) ¿Satisfará el programa propuesto toda la demanda de las granjas?

c) Suponga que se permite el transbordo entre los silos 1 y 2 y los silos 2 y 3. Suponga
además que se permite el transbordo entre las granjas 1 y 2, 2 y 3 y 3 y 4. Las capacidad
diaria (en dos direcciones) máxima en las rutas de transbordo propuestas es de 50 (mil)
pesos. ¿Cuál es el efecto del transbordo en las demandas no satisfechas en las granjas?

Ejercicio 1.3 Un padre tiene cinco hijos (adolescentes) y cinco tareas domésticas que en-
comendarles. La experiencia pasada ha demostrado que obligar a un hijo a que realice una
tarea es contraproducente. Con esto en mente, el padre le pide a sus hijos que enumeren sus
preferencias entre las cinco tareas, como lo muestra la siguiente tabla:

Hijo Tarea preferida


Rif 3, 4 o 5
Mai 1
Ben 1o2
Kim 1, 2 o 5
Ken 2

El objetivo del padre ahora es terminar la mayor parte posible de tareas, al tiempo que respeta
las preferencias de los hijos, teniendo en cuenta que:

a) Cada hijo puede realizar sólo 1 tarea.

b) Cada hijo puede realizar más de 1 tarea.

22
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

Ejercicio 1.4 Cuatro fábricas producen cuatro tipos de juguetes. La siguiente tabla da una
lista de los juguetes que cada fábrica puede producir.

Fábrica Combinación de producciones de juguetes


1 1, 2, 3
2 2, 3
3 1, 4
4 3, 4

Todos los juguetes requieren de alguna manera la misma mano de obra y material por unidad.
Las capacidades diarias de las cuatro fábricas son de 250, 180, 300 y 100 juguetes, respec-
tivamente. Las demandas diarias de los cuatro juguetes son 200, 150, 350 y 100 unidades,
respectivamente. Determine los programas de producción de las fábrica que más satisfarán las
demandas de los cuatro juguetes.

Ejercicio 1.5 El consejo acádemico de la Universidad de Arkansas está buscando represen-


tantes entre seis estudiantes que estén afiliados a sociedades honorı́ficas. La representación
ante el consejo académico incluye tres áreas: matemáticas, arte e ingenierı́a. Cuando mu-
cho dos estudiantes de cada área pueden estar en el consejo. La siguiente tabla muestra la
membresı́a de los seis estudiantes en las cuatro sociedades honorı́ficas:

Sociedad Estudiantes afiliados


1 1, 2, 3
2 1, 3, 5
3 3, 4, 5
4 1, 2, 4, 6

Los estudiantes calificados en las áreas de matemáticas, arte e ingenierı́a se muestran en la


siguiente tabla:

Área Estudiantes calificados


Matemáticas 1, 2, 4
Arte 3, 4
Ingenierı́a 4, 5, 6

Un estudiante capacitado en más de un área debe ser asignado exclusivamente a sólo un área.
¿Pueden estar representadas las cuatro sociedades honorı́ficas en el consejo?

Ejercicio 1.6 Cinco camiones entregan siete tipos de paquetes. Hay tres paquetes de cada
tipo, y las capacidades de los cinco camiones son 6, 4, 5, 4 y 3 paquetes, respectivamente.
Prepare un problema de problema de flujo máximo que se pueda usar para determinar si
pueden cargarse los paquetes de modo que ningún camión lleve dos paquetes del mismo tipo.

1.1.4. Algoritmo de Dijkstra (ruta más corta)


Este algoritmo tiene como objetivo encontrar la ruta más corta de un origen establecido a
cualquiera de los destinos posibles en la red. A diferencia del algoritmo de expansión mı́nima

23
1. MODELOS DE REDES

no es necesario que cada par de nodos se encuentre conectado, además que con este algoritmo
no se busca el diseño de una red, sino encontrar el camino óptimo (con menor distancia,
tiempo o costo) que nos lleve de un origen a cualquier destino en la red.
Algoritmo de Dijkstra [3]. Sea ui la distancia más corta del nodo identificado como
origen (puede ser cualquier nodo de la red) al nodo i, y defina dij (≥ 0) como la longitud del
arco (i, j). El algoritmo define la etiqueta para un nodo j que sigue inmediatamente como:

[uj , i] = [ui + dij , i] , dij ≥ 0

La etiqueta para el nodo de inicio es [0, −], que indica que el nodo no tiene predecesor.
Las etiquetas de nodo en el algoritmo de dijkstra son de dos tipos: temporales y permanentes.
Una etiqueta temporal en un nodo se modifica si puede hallarse una ruta más corta al nodo.
De lo contrario, el estado temporal cambia a permanente.

Paso 0. Etiquete el nodo de origen con la etiqueta permanente [0, −]. Establezca i = 1.

Paso general i: a) Calcule las etiquetas temporales [ui + dij , i] para cada nodo j con dij > 0, siempre
que j no esté etiquetado permanentemente. Si el nodo j ya tiene una etiqueta
temporal existente [uj , k] hasto otro nodo k y si ui + dij < uj , reemplace [uj , k] con
[ui + dij , i].
b) Si todos los nodos etiquetados tienen etiquetas permanentes deténgase. De lo con-
trario, seleccione la etiqueta [ur , s] que tenga la distancia más corta (= ur ) entre
toras las etiquetas temporales. En caso de empate se anexa la otra etiqueta al nodo
para de esta forma poder obtener todas las posibles rutas más cortas. Establezca
i = r y repita el paso i.

Ejemplo 1.6 (Tomado de [3]) La red de la Fig. 1.21 proporciona las rutas permisibles y sus
longitudes en millas entre la ciudad 1 (nodo 1) y las otras ciudades (nodos 2 a 5). Determine
las rutas más cortas entre la ciudad 1 y cada una de las cuatro ciudades restantes.

2
15
4
100

20

50
10

1 30 3 60 5

Figura 1.21: Red de ciudades para ejemplo del algoritmo de Dijkstra.

Solución. El algoritmo de Dijkstra encuentra las rutas más cortas entre un nodo origen a
cualquier otro nodo de una red, por lo que es el que utilizaremos para encontrar las rutas
más cortas de la ciudad 1 a las otras ciudades. A continuación, se describen las iteraciones
del algoritmo. En las figuras se usa un superı́ndice en las etiquetas de los nodos para indicar
la iteración en la que la etiqueta cambió a estado permanente.

24
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

Iteración 0. Asigne la etiqueta permanente [0, −] al nodo inicial (nodo 1).

2
15

100
4 Nodo Estado Iteración Etiqueta

20
1 P 0 [0, −]

50
10
1 30 3 60 5

[0,-]

Iteración 1 . El nodo actual es el nodo que cambió su estado a permanente en la iteración an-
terior (nodo 1). Se observa que desde el nodo actual, se puede llegar a los nodos 2
y 3, por lo que se procede a etiquetarlos (debido a que no tienen ninguna etiqueta).
[100,1]

2
15
Nodo Estado It. Etiqueta
4 1 P 0 [0, −]
100

20

2 T [0 + 100, 1] = [100, 1]
50
10

1 30 3 60 5 3 T [0 + 30, 1] = [30, 1]
0
[0,-] [30,1]

Después de etiquetar se observa que se tienen dos etiquetas temporales, la del nodo 2
con una distancia de 100 y la del nodo 3 con una distancia de 30. Se cambia el estado
del nodo 3 a permanente ya que cuenta con la distancia mı́nima (u3 = 30).

Iteración 2 . Se observa que desde el nodo 3 (actual), se puede llegar a los nodos 4 y 5, por lo que
se procede a etiquetarlos.

[100,1]
Nodo Estado It. Etiqueta
2
15
[40,3] 1 P 0 [0, −]
4 2 T [100, 1]
100

20

[90,3] 3 P 1 [30, 1]
50
10

1 30 3 60 5 4 T [30 + 10, 3] = [40, 3]


[0,-]
0
[30,1]
1 5 T [30 + 60, 3] = [90, 3]

Se cambia el estado a permanente de la etiqueta [40, 3] correspondiente al nodo 4 (u4 =


40).

Iteración 3 . Desde el nodo 4 se puede llegar a los nodos 2 y 5, por lo que se procede a revisar sus
etiquetas con el objetivo saber si las conservan, se anexa alguna etiqueta con la misma
distancia pero de diferente nodo o se reemplaza la etiqueta por una de menor distancia.

25
1. MODELOS DE REDES

[100,1][55,4] Nodo
EtiquetaEstado It.
2 [40,3]
2 [0, −]
1 P 0
15
4
2
[40 T
+ 15, 4] = [55, 4]
100 3
1 [30, 1] P

20
[90,4]
[90,3]

50
10
4
2 [40, 3] P
1 30 3 60 5
[90, 3]
[0,-]
0
[30,1] 5
1 T
[40 + 50, 4] = [90, 4]
Se cambia el estado a permanente de la etiqueta [55, 4] correspondiente al nodo 2 (u2 =
55).

Iteración 4 . Desde el nodo 2, no es posible llegar a nodos sin etiquetas o con etiquetas temporales.

3
[55,4] Nodo
Etiqueta Estado It.
2 [40,3]
2 [0, −]
1 P 0
15
4
[55,24] P 3
3
[30, 1] P 1
100

20

[90,4]
[90,3]
50
10

4
[40, 3] P 2
1 30 3 60 5
[90, 3]
[0,-]
0
[30,1] 5
1 T
[90, 4]
La única etiqueta temporal es la correspondiente al nodo 5. Se cambia el estado a
permanente de la etiqueta correspondiente al nodo 5. (u5 = 90).
Ahora que todos los nodos tienen estado permante, termina el algoritmo y la red queda como
se muestra a continuación.
3
[55,4]
Nodo Estado It. Etiqueta
2 2

15
[40,3]
1 P 0 [0, −]
4
[90,4]
2 P 3 [55, 4]
4
100

20

[90,3] 3 P 1 [30, 1]
4
50
10

1 30 3 60 5 4 P 2 [40, 3]
0
[0,-] [30,1]
1 5 P 4 [90, 3] [90, 4]
La ruta más corta entre el nodo 1 y cualquier otro nodo de la red se determina partiendo del
nodo destino deseado y retrocediendo hasta el nodo de inicio utilizando la información en las
etiquetas permanentes [3]. Por ejemplo, la siguiente secuencia determina la ruta más corta del
nodo 1 al nodo 2:

(2) → [55, 4] → (4) → [40, 3] → (3) → [30, 1] → (1)


Por lo tanto, la ruta deseada es 1 → 3 → 4 → 2 con una distancia de 55 millas.
Ejemplo 1.7 (Reemplazo de equipo. Tomado de [5]) Acabo de comprar (en el tiempo
0) un automóvil nuevo por $12000. El costo de mantener un automóvil durante un año de-
pende de su edad al comienzo del año, como se da en la tabla 1.1. Para evitar costos de
mantenimiento altos con un automóvil más antiguo, podrı́a entregar a cuenta mi automóvil y
comprar uno nuevo. El precio que recibo por dejar a cuenta mi automóvil, depende de la edad
del automóvil al momento del intercambio (véase la tabla 1.2). Para simplificar los cálculos,
suponga que en cualquier instante el costo de un automóvil nuevo son $12000. El objetivo es

26
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

minimizar el costo neto (costos de compra + costos de mantenimiento - dinero recibido por
intercambio) en que se incurre en los cinco años siguientes. Formule este problema como uno
de ruta más corta.

Edad del Costos de Edad del


Precio del in-
automóvil mantenimiento automóvil
tercambio
(años) anual (años)
0 2000 1 7000
1 4000 2 6000
2 5000 3 2000
3 9000 4 1000
4 12000 5 0
Tabla 1.1: Costos de mantenimiento del automóvil. Tabla 1.2: Precios de intercambio del automóvil.

Solución. Este problema de reemplazo de equipo se modela como sigue: La red tendrá seis
nodos. Cada nodo representa el comienzo del año correspondiente, en otras palabras, el nodo i
es el comienzo del año i. Para i < j, un arco (i, j) corresponde a comprar un automóvil nuevo
al comienzo del año i y conservarlo hasta el comienzo del año j. La longitud del arco (i, j)
(llámela cij ) es el costo neto total en que se incurre por tener y operar un automóvil desde el
comienzo del año i al comienzo del año j si se compra un automóvil nuevo al comienzo del
año i y este automóvil se intercambia por uno nuevo al comienzo del año j. Ası́,

cij = costo de mantenimiento en que se incurrió durante los añosi, i + 1, . . . , j − 1


+ costo de comprar automóvil al comienzo del añoi
− valor de intercambio recibido al comienzo del añoj

Al aplicar esta fórmula a la información del problema, se obtiene (los costos están en miles)

c12 = 2 + 12 − 7 = 7 c26 = 2 + 4 + 5 + 9 + 12 − 1 = 31
c13 = 2 + 4 + 5 + 12 − 6 = 12 c34 = 2 + 12 − 7 = 7
c14 = 2 + 4 + 5 + 12 − 2 = 21 c35 = 2 + 4 + 12 − 6 = 12
c15 = 2 + 4 + 5 + 9 + 12 − 1 = 31 c36 = 2 + 4 + 5 + 12 − 2 = 21
c16 = 2 + 4 + 5 + 9 + 12 + 12 − 0 = 44 c45 = 2 + 12 − 7 = 7
c23 = 2 + 12 − 7 = 7 c46 = 2 + 4 + 12 − 6 = 12
c24 = 2 + 4 + 12 − 6 = 12 c56 = 2 + 12 − 7 = 7
c25 = 2 + 4 + 5 + 12 − 2 = 21
Ahora se ve que la longitud de cualquier trayectoria del nodo 1 al nodo 6 es el costo neto en
que se incurrió durante los siguientes cinco años correspondientes a una estrategia particular
de intercambio. Ası́, la longitud de la trayectoria más corta del nodo 1 al nodo 6 en la Fig.
1.22 es el costo neto mı́nimo en que se incurre al operar un automóvil los siguientes cinco
años.
Se utiliza la aplicación Algoritmo de Dijkstra referencia a descarga, para obtener la
ruta más corta en este problema. Se captura la red en forma matricial como se muestra en la
siguiente Fig. 1.23, las iteraciones en las figuras 1.24, 1.25, 1.26, 1.27 y 1.28.

27
1. MODELOS DE REDES

44

31
31
21
21

12 12

1 7 2 7 3 7 4 7 5 7 6

12 12

21

Figura 1.22: Red del problema de reemplazo de equipo

Figura 1.23: Representación matricial de la red de reemplazo de equipo

Figura 1.25: Iteración 2


Figura 1.24: Iteración 1

Figura 1.27: Iteración 4


Figura 1.26: Iteración 3

Figura 1.28: Iteración 5

28
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

En la Fig. 1.29, se muestra la tabla de los nodos de la red con las etiquetas permanentes,
de las cuales se pueden obtener las distancias del nodo inicial al nodo destino y las rutas.
También se muestran todas las posibles rutas desde el nodo inicial hasta todos los otros nodos
de la red.

Figura 1.29: Resultados del algoritmo de Dijkstra

1.1.5. Algoritmo de Floyd (ruta más corta)

Este algoritmo te permite conocer la distancia más cor-


ta entre un par cualesquiera de nodos en una red, a diferen- k

cia del algoritmo de Dijkstra que solamente te proporciona


j
la distancia más corta entre un nodo origen y los nodos
i
restantes de la red. Para este algoritmo, es necesario repre-
sentar la red como una matriz (llamada matriz de distan- Figura 1.30: Operación triple de Floyd
cias) de n × n, donde n es el número de nodos. La entrada
(i, j) de la matriz proporciona la distancia dij del nodo i al nodo j, la cual es finita si i está
vinculado directamente a j, e infinita en caso contrario.
La idea general del algoritmo de Floyd es verificar si es más corto llegar de un nodo i a
un nodo j pasando por un nodo intermedio k, que ir directamente de i a j (ver Fig. 1.30). De
otra forma, es más corto llegar de i a j pasando por k si

dik + dkj < dij

En este caso se reemplaza la ruta directa i → j con la ruta indirecta i → k → j. A esta


comparación e intercambio se le llama operación triple y se aplica como se describe en los
siguientes pasos [3].

Paso 0. Defina la matriz de la distancia de inicio D0 y la matriz de secuencia de nodos S0


(matriz en la que se almacenan las rutas directas e indirectas entre cada par de nodos).

29
1. MODELOS DE REDES

Establezca k = 1.
1 2 ... j ... n 1 2 ... j ... n
1 − d12 . . . d1j . . . d1n 1 − 2 ... j ... n
2 d21 − . . . d2j . . . d2n 2 1 − ... j ... n
. .. .. .. .. .. .. . . . .. .. .. ..
D0 = .. . . . . . . S0 = .. .. .. . . . .
i di1 di2 . . . dij . . . din i 1 2 ... j ... n
.. .. .. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . . . . .
n dn1 dn2 . . . dnj ... − n 1 2 ... j ... −

Paso general k: Defina la fila k y la columna k como fila pivote y columna pivote. Aplique la operación
triple a cada elemento dij en Dk−1 , para todas las i y j diferentes de k. Si la condición

dik + dkj < dij , (i 6= k, j 6= k y i 6= j)

se satisface, realice los siguientes cambios:

a) Cree Dk reemplazando dij en Dk−1 con dik + dkj


b) Cree Sk reemplazando sij con k. Establezca k = k + 1. Si k = n + 1 deténgase: de
lo contrario repita el paso k.

Al finalizar las n iteraciones del algoritmo, es posible determinar la ruta más corta entre los
nodos i y j a partir de las matrices Dn y Sn aplicando las siguientes reglas:

1. dij a partir de Dn determina la distancia de la ruta más corta entre los nodos i y j.

2. A partir de Sn , determine el nodo intermedio k = sij que da en resultado la ruta


i → k → j. Si sik = k y skj = j, deténgase; todos los nodos intermedios de la ruta
han sido encontrados. De lo contrario, encuentre todos los nodos intermedios de la ruta
repitiendo este procedimiento cada vez que se encuentre un nodo intermedio k.

Ejemplo 1.8 Para la red de la Fig. 1.31, halle las rutas más cortas entre cada par de nodos.
Las distancias (en millas) se dan en los arcos. El arco (3, 5) es direccional, es decir, no se
permite el tráfico del nodo 5 al nodo 3. Todos los demás arcos permiten el tráfico en dos
direcciones.

2 5 4
3

1 10 3 15 5

Figura 1.31: Red para el ejemplo del algoritmo de Floyd

30
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES

Solución. Utilizando la aplicación AlgoritmoFloyd referencia a descarga, se resuelve este


problema y se observan los cambios que se dan a través de las iteraciones del algoritmo. Al
final se mostrará como obtener la ruta más corta entre un par de nodos y su distancia.

Iteración 0. Se representa la red con las matrices D0 y S0 .

Iteración 1. Establezca k = 1. La fila y columnas pivote, son la fila y columna 1 de la matriz y se


muestran sombreadas en color verde en la matriz D0 . Las celdas d23 y d32 son las únicas
que la operación triple puede mejorar. Por lo tanto, D1 y S1 se obtienen a partir de D0
y S0 aplicando las siguientes acciones:

1. Reemplace d23 con d21 + d13 = 3 + 10 = 13 y establezca s23 = 1.


2. Reemplace d32 con d31 + d12 = 10 + 3 = 13 y establezca s32 = 1.

Estos cambios se muestran en negritas en las matrices D1 y S1 .

Iteración 2. Establezca k = 2 y ahora la fila y columna pivote son la fila y columna 2 en la matriz
D1 . La operación triple se aplica a las celdas sombreadas en azul que no pertenecen a
la fila y columna pivote.

Iteración 3. Establezca k = 3, como se muestra por la fila y la columna sombreadas en D2 . Las


nuevas matrices son D3 y S3

31
1. MODELOS DE REDES

Iteración 4. Establezca k = 4, como se muestra por la fila y la columna sombreadas en D3 . Las


nuevas matrices son D4 y S4

Iteración 5. Establezca k = 5, como se muestra por la fila y la columna sombreadas en D4 .No son
posibles más mejoras en esta iteración.D5 = D4 y S5 = S4

Ahora se utilizan las matrices D5 y S5 para determinar las distancias y obtener la ruta más
corta entre cada par de nodos de la red. La distancia más corta del nodo 1 al nodo 5 es
d15 = 12millas. Para determinar la ruta asociada, se verifica si la ruta es directa (la ruta
es directa si s15 = 5), como s15 = 4, del nodo 1 al nodo 5 se pasa primero por el nodo 4,
quedando
1→4→5
Ahora sigue verificar si las rutas 14 y 45 son directas. s14 = 2 6= 4 por lo que la ruta de 1 a 4
pasa por el nodo 2 por lo que la ruta queda como sigue:

1→2→4→5

Ahora como s12 = 2, s24 y s45 = 5 son rutas directas, la ruta más corta se define como:

1→2→4→5

Ejercicio 1.7 Seis niños, Joe, Kay, Jim, Bob, Rae y Kim juegan una variante del juego
infantil de las escondidas. Sólo algunos de los niños conocen el escondite de un niño. Luego
un niño hace pareja con otro con el objetivo de encontrar el escondite del compañero. Esto
puede lograrse mediante una cadena de otros niños que finalmente permitirá descubrir el
escondite del niño designado. Por ejemplo, suponga que Joe tiene que encontrar a Kim y que
Joe sabe dónde está escondido Jim, quien a su vez sabe dónde está escondido Kim. Por lo
tanto, Joe puede encontrar a Kim si halla primero a Jim, quien a su vez conducirá a Joe al
escondite de Kim. La siguiente lista proporciona los paraderos de los niños:
Joe conoce los escondites de Bob y Kim.

Kay conoce los escondites de Bob, Jim y Rae

32
1.2. REDES Y ALGORITMOS PARA LA ADMINISTRACIÓN DE PROYECTOS

Jim y Bob conocen sólo el escondite de Kay

Rae conoce el escondite de Kim

Kim conoce los escondites de Joe y Bob

Idee un plan para que cada ninõ encuentre a todos los demás ninõs utilizando el número
mı́nimo de contactos. ¿Cuál es el número máximo de contactos?

1.2. Redes y algoritmos para la administración de proyectos


La administración de proyectos es un trabajo que requiere monitorear y controlar el de-
sarrollo de muchas actividades, algunas que se realizan en paralelo, por lo cual es necesario
utilizar herramientas que nos apoyen a lograr este objetivo. La técnica de revisión y eva-
luación de programas (PERT por sus siglas en inglés) y el método de la ruta crı́tica (CPM
por sus siglas en inglés) son dos técnicas de investigación de operaciones que mantienen una
estrecha relación y son adecuadas para apoyar al administrador de proyectos. Entre los tipos
de proyectos que han sido administrados utilizando PERT y CPM se pueden mencionar los
siguientes[2]:

1. Construcción de una planta industrial.

2. Investigación y desarrollo de un nuevo producto.

3. Proyectos de exploración espacial de la NASA.

4. Producciones de cine.

5. Construcción de un barco.

6. Reubicación de una importante instalación en una empresa.

7. Mantenimiento de un reactor nuclear

8. Instalación y administración de un sistema de información.

9. Realizar una campaña publicitaria.

PERT fue desarrollado a finales de los años cincuenta (1958) por la Marina de los Estados
Unidos de América en cooperación con la firma asesora en administración Booz, Allen y
Hamilton para su uso en el programa de ingenierı́a y desarrollo del misil Polaris. Por otra
parte, CPM fue desarrollado en 1957 por J.E. Kelly de Remington Rand y M.R. Walker de
Dupont para ayudar en la construcción y mantenimiento de las plantas quı́micas de duPont.
Estas dos técnicas difieren en que CPM asume duraciones de actividad determinı́sticas
(supone que se sabe con certeza la duración de cada actividad) y PERT supone duracio-
nes probabilı́sticas proporcionando tres estimaciones de duración para cada actividad. Sin
embargo, ambas siguen estos seis pasos[1]:

1. Definir el proyecto y preparar la estructura de desglose del trabajo.

33
1. MODELOS DE REDES

2. Desarrollar las relaciones entre las actividades. Decidir qué actividad debe preceder y
cuál debe seguir a otras.

3. Dibujar la red que conecta todas las actividades.

4. Asignar estimaciones de tiempo y/o costo a cada actividad.

5. Calcular el tiempo de la ruta más larga a través de la red. Ésta se denomina la ruta
crı́tica.

6. Usar la red como ayuda para planear, programar, supervisar y controlar el proyecto.

Finalmente, ambas técnicas son importantes porque facilitan la respuesta a preguntas


como las siguientes:

1. ¿Cuándo concluirá el proyecto?

2. ¿Cuáles son las actividades o tareas crı́ticas del proyecto –es decir, qué actividades
retrasarán todo el proyecto si se demoran?

3. ¿Cuáles son las actividades no crı́ticas –aquellas que pueden retrasarse sin detener la
conclusión de todo el proyecto?

4. ¿Cuál es la probabilidad de terminar el proyecto en una fecha especı́fica?

5. Para una fecha en particular, ¿el proyecto está a tiempo, retrasado o adelantado con
respecto al programa?

6. Para una fecha dada, ¿el dinero es igual, menor o mayor que la cantidad presupuestada?

7. ¿Se dispone de suficientes recursos para terminar el proyecto a tiempo?

8. Si el proyecto debe terminar en menor tiempo, ¿cuál es la mejor manera de lograr esta
meta al menor costo?

En la siguiente sección se analizará como construir la red de un proyecto dadas las activi-
dades y precedencias de cada actividad, utilizando la técnica de actividad en nodo.

1.2.1. Construcción de la red


Para poder aplicar las técnicas de administración de proyectos PERT/CPM es necesario
representar el proyecto en forma de red (un conjunto de nodos y arcos que unen dichos
nodos). El primer paso para construir dicha red consiste en dividir el proyecto en actividades
significativas de acuerdo con la estructura de desglose del trabajo. La información necesaria
en cada activdad para describir el proyecto es la siguiente:

1. Relaciones de Precedencia: Identifique los predecesores inmediatos para cada actividad.

2. Duración de la actividad: Estime la duración de cada actividad.

34
1.2. REDES Y ALGORITMOS PARA LA ADMINISTRACIÓN DE PROYECTOS

Existen dos formas de construir la red de un proyecto:Colocando las actividades en los


arcos (AEA) y colocando las actividades en los nodos (AEN). En las redes AEA se utilizan los
nodos para separar las actividades y los arcos consumen tiempo y recursos. En las redes AEN
los nodos representan las actividades y los arcos indican la precedencia de cada actividad. Las
versiones originales de PERT y CPM usaron redes AEA, sin embargo, las redes de proyectos
con AEN poseen algunas ventajas importantes sobre las redes de proyectos con AEA.

Las redes de proyectos AEN son mucho más sencillas de construir que las que tienen
AEA.

Las redes de proyectos AEN son más sencillas de entender para los usuarios inexpertos,
incluyendo algunos gerentes.

Las redes de proyectos AEN son más fáciles de revisar que las AEA cuando ocurren
cambios en el proyecto.

Ejemplo 1.9 (Tomado de [1]) La empresa Milwaukee Paper Manufacturing, Inc., ubicada
cerca del centro de la ciuidad de Milwaukee, ha tratado de evitar durante mucho tiempo el gasto
de instalar en su planta equipo para el control de la contaminación del aire. Recientemente,
la Oficina para la Protección del Medio Ambiente de Estados Unidos (EPA) le ha dado 16
semanas para que instale un complejo sistema para filtrar el aire. Milwaukee Paper recibió
la advertencia de que tendrá que cerrar su fábrica a menos que instale el dispositivo en el
periodo especificado. Joni Steinber, administradora de la planta, quiere asegurarse de que la
instalación del sistema de filtrado avance sin complicaciones y termine a tiempo.

Solución. Milwaukee Paper ha identificado las ocho actividades que deben realizarse para
terminar el proyecto. Cuando el proyecto comience, se pueden realizar dos actividades en
forma simultánea: construir los componentes internos para el dispositivo (actividad A) y hacer
las modificaciones necesarias en pisos y techos (actividad B). La construcción de la pila de
recolección (actividad C) puede comenzar cuando los componentes internos estén instalados.
El vaciado del piso de concreto y la instalación del marco (actividad D) pueden comenzar
tan pronto como los componentes internos estén completos y los techos y pisos hayan sido
modificados. Después de construir la pila de recolección, pueden comenzar dos actividades
más: la construcción del horno de alta temperatura (actividad E) y la instalación del sistema
de control de contaminacón (actividad F). El dispositivo para el aire contaminado puede
instalarse (actividad G) después de vaciar el piso de concreto, instalar el marco y construir el
horno de alta temperatura. Por último, una vez instalado el sistema de control y el dispositivo
para el aire contaminado, se puede inspeccionar y probar el sistema (actividad H).
Sin embargo, presentar las actividades y relaciones de esta forma puede resultar confuso,
por lo tanto, es conveniente registrar todas las actividades en una tabla, como se muestra en
la tabla 1.3.
La red AEN que representa la tabla 1.3 queda como sigue:

35
1. MODELOS DE REDES

Actividad Descripción Precedentes


inmediatos
A Construir componentes internos –
B Modificar pisos y techos –
C Construir pila de recolección A
D Vaciar concreto e instalar marco A, B
E Constuir horno de alta temperatura C
F Instalar sistema de control de contaminación C
G Instalar dispositivo para aire contaminado D, E
H Inspeccionar y probar F, G
Tabla 1.3: Actividades para el proyecto de Milwaukee Paper

F
A C

Inicio E H Fin

B D G

1.2.2. Algoritmo de la ruta crı́tica (CPM)


En una red AEN existen varias rutas que van del inicio al final de proyecto. La ruta que
determina la duración del proyecto es la de mayor duración. A esta ruta se le llama ruta
crı́tica y las actividades que se encuentran en ella son actividades crı́ticas. El algoritmo que
determina la(s) ruta(s) crı́tica(s) en un proyecto también determinan en que momento debe
de iniciar y finalizar cada actividad, y si alguna actividad pudiera retrasarse sin afectar la
duración del proyecto.
Para calcular la ruta crı́tica calculamos dos tiempos distintos de inicio y terminación para
cada actividad. Dichos tiempos se definen de la manera siguiente:

Inicio más próximo (IP ) =el tiempo más cercano en que puede empezar
una actividad, suponiendo que todas las activi-
dades precedentes han sido completadas.
Finalización más próxima (F P ) =el tiempo más cercano en que una actividad
puede terminar.
Inicio más lejano (IL) =tiempo más lejano en que una actividad puede
comenzar sin retrasar el tiempo de terminación
de todo el proyecto.
Finalización más lejana (F L) =tiempo más lejano en que una actividad puede
terminar sin retrasar el tiempo de terminación
de todo el proyecto.

36
1.2. REDES Y ALGORITMOS PARA LA ADMINISTRACIÓN DE PROYECTOS

Para determinar el programa de tiempos para cada actividad se usa un proceso de dos
pasadas, el cual consiste en una pasada hacia adelante y una pasada hacia atrás. Los tiempos
más próximos para iniciar y terminar (IP y F P ) se determinan durante la pasada hacia
adelante. Los tiempos más lejanos para iniciar y terminar (IL y F L) se determinan durante
la pasada hacia atrás.

Pasada hacia adelante


Comienza con las actividades que inician el proyecto. Para cada actividad se calculan los
tiempos de inicio y finalización más próximos (IP y F P ). Regla del tiempo de inicio
más próximo: Antes de iniciar una actividad, todos sus precedentes inmediatos deben haber
terminado.

Si una actividad tiene sólo un precedente inmediato, su IP es igual al F P de su prece-


dente.

Si una actividad tiene múltiples precedentes inmediatos, su IP es el máximo de todos


los valores de F P de sus precedentes. Es decir,

IP = máx {F P de todos los precedentes inmediatos}

Regla del tiempo de finalización más próximo: El tiempo de finalización más próximo
(F P ) de una actividad se define como sigue:

F P = IP + duración de la actividad

Pasada hacia atrás


Empieza con las actividades que finalizan el proyecto. Para cada actividad, primero deter-
minamos su valor de F L, seguido por su valor de IL. En este proceso se usan las siguientes
dos reglas. Regla del tiempo de finalización más lejano:

Si una actividad tiene un solo sucesor (dicho de otra forma, es precedente inmediato de
una sola actividad), su F L es igual al IL de su único sucesor.

Si una actividad tiene múltiples sucesores (o bien, es precedente inmediato de múltiples


actividades), su F L es el mı́nimo de todos los valores IL de sus sucesores. Es decir,

F L = mı́n {ILde todos los sucesores de la actividad}

Regla del tiempo de inicio más lejano: De manera similar al cálculo de F P , el tiempo
IL se calcula como sigue:

IL = F L − duración de la actividad

Una vez se calcularon los tiempos más próximos y más lejanos de cada actividad, es
momento de calcular la holgura e identificar la ruta crı́tica.

37
1. MODELOS DE REDES

Cálculo de la holgura de cada actividad


Después de calcular los tiempos más próximos y más lejanos, es sencillo calcular la holgura
de cadad actividad. La holgura es la cantidad de tiempo que una actividad se puede demorar
si afectar la duración total del proyecto. La holgura se calcula como sigue:

H = IL − IP o bien, H = T L − T P

Las actividades con holgura(H) igual a cero se llaman actividades crı́ticas y por lo tanto
son las que forman la ruta crı́tica del proyecto. Estas actividades deben de monitorearse
cuidadosamente debido a que un retraso en ellas retrasa todo el proyecto. La ruta crı́tica es
una trayectoria continua a través de la red del proyecto que:

Empieza en la primera actividad del proyecto.

Termina en la última actividad del proyecto.

Incluye sólo actividades crı́ticas.

Finalmente es importante mencionar que puede existir más de una ruta crı́tica en nuestro
proyecto.

Ejemplo 1.10 (Tomado de [2]) La compañı́a de construcción “El muro” ha ganado una
licitación por $5.4 millones para construir un nueva planta para una empresa importante a
nivel nacional. La empresa necesita que la planta inicie operaciones dentro de un aõ. Sin
embargo, el contrato incluye las siguientes cláusulas:

Una penalización de $300, 000 si “El muro” no ha terminado la construcción para la


fecha de entrega en la semana 47, después de inciado el proyecto.

Para proporcionar un incentivo por terminar antes, un bono de $150, 000 se pagará a
“El muro” si la planta se termina en 40 semanas.

“El muro” asignó al proyecto a su mejor administrador, David Rojas, para asegurarse que
se mantenga de acuerdo a lo planeado. Él tiene como objetivo mantener el proyecto dentro
de agenda, y posiblemente terminarlo antes. Sin embargo, piensa que no es factible terminar
en 40 semanas sin incurrir en costos excesivos, por lo que ha decidido enfocarse en el plan
inicial de 47 semanas.
El Sr. Rojas necesitará organizar diversos equipos para realizar las diversas actividades
de construcción a tiempos diferentes. La tabla 1.4 muestra su lista de actividades. La ter-
cera columna proporciona información adicional importante para coordinar la agenda de los
equipos.
Utilice el algoritmo de la ruta crı́tica para hallar, los tiempos más próximos y más lejanos
de cada actividad, la holgura y la ruta crı́tica.

Solución. De acuerdo al algoritmo de la ruta crı́tica (CPM), es necesario conocer los prede-
cesores y los sucesores de cada actividad. Para facilitar esta tarea, se construye la red de este
proyecto quedando como sigue.

38
1.2. REDES Y ALGORITMOS PARA LA ADMINISTRACIÓN DE PROYECTOS

Actividad Descripción Predecesores Duracióin


inmediatos estimada
A Excavar – 2 semanas
B Hacer los cimientos A 4 semanas
C Levantar las paredes B 10 semanas
D Colar el techo C 6 semanas
E Instalar la plomerı́a exterior C 4 semanas
F Instalar la plomerı́a interior E 5 semanas
G Colocar el recubrimiento exterior D 7 semanas
H Aplicar la pintura exterior E, G 9 semanas
I Hacer la instalación eléctrica C 7 semanas
J Instalar la tablaroca F, I 8 semanas
K Colocar el piso J 4 semanas
L Aplicar la pintura interior J 5 semanas
M Instalar los accesorios externos H 2 semanas
N Instalar los accesorios internos K, L 6 semanas
Tabla 1.4: Lista de actividades del proyecto para el “El muro”

Inicio 0

A 2

B 4

10
C
D 6 I 7
E 4

G 7 F 5

H 9 J 8

K 4 L 5
M 2

N 6

Fin 0

39
1. MODELOS DE REDES

En la red de la figura anterior se observa un número a un costado de cada actividad, este


número es la duración de la actividad. Se iniciar la pasada hacia adelante para obtener los
tiempos de inicio y finalización más próximos, mismos que se registrarán a un costado del
nodo con la notación T P (IP, F P ). Los T P de los nodos A, B, C, D, E, G y H son:

NodoA : IP = 0; F P = 0 + 2 = 2
NodoB : IP = 2; F P = 2 + 4 = 6
NodoC : IP = 6; F P = 6 + 10 = 16
NodoD : IP = 16; F P = 16 + 6 = 22
NodoE : IP = 16; F P = 16 + 4 = 20
NodoG : IP = 22; F P = 22 + 7 = 29
NodoH : IP = máx 29, 20; F P = 29 + 9 = 38

Inicio 0 TP(0,0)

A 2 TP(0,2)

B 4 TP(2,6)

10 TP(6,16)
C
D 6 TP(16,22) I 7 TP(16,23)
E 4 TP(16,20)

G 7 TP(22,29) TP(20,25) F 5

H 9 TP(29,38) TP(25,33) J 8

TP(33,37) K 4 TP(33,38) L 5
TP(38,40) M 2

N 6 TP(38,44)

Fin 0 TP(44,44)

Figura 1.32: Tiempos más próximos para todas las actividades.

En la Fig. 1.32 se muestran los tiempos más próximos de todas las actividades. Ahora,

40
1.2. REDES Y ALGORITMOS PARA LA ADMINISTRACIÓN DE PROYECTOS

continuaremos con la pasada hacia atrás. Los tiempos más lejanos (T L) de los nodos N , K,
L y J son:

NodoN : F L = 44; IL = 44 − 6 = 38
NodoK : F L = 38; F P = 38 − 4 = 34
NodoL : F L = 38; F P = 38 − 5 = 33
NodoJ : F L = mı́n 34, 33; F P = 33 − 8 = 25

Inicio 0 TP(0,0)
TF(0,0)

TP(0,2)
A 2 TF(0,2)

B 4 TP(2,6)
TF(2,6)

10 TP(6,16)
TF(6,16)
C
TP(16,23)
D I 7TF(18,25)
6 TP(16,22) TP(16,20)
TF(20,26)
E 4 TF(16,20)

TP(20,25)
7 TP(22,29)
F 5 TF(20,25)
G TF(26,33)

TP(25,33) 8
H 9 TP(29,38)
TF(33,42) TF(25,33) J
TP(33,38)
TF(33,38)
TP(33,37)
TP(38,40) TF(34,38) K 4 L 5
TF(42,44) M 2

N 6TP(38,44)
TF(38,44)

Fin 0 TP(44,44)
TF(44,44)

Figura 1.33: Tiempos más lejanos y más próximos para todas las actividades.

En la Fig. 1.33 se muestran los tiempos más próximos y más lejanos de todas las activi-
dades. Para terminar se calcula la holgura de cada actividad y se obtiene la ruta crı́tica del
proyecto. En la Fig. se muestran las holguras y las actividades crı́ticas:

41
1. MODELOS DE REDES

Figura 1.34: Tiempos más lejanos y más próximos para todas las actividades.

La ruta crı́tica del proyecto es:

A→B→C→E→F →J →L→N

con una duración de 44 semanas.


Antes de analizar la variabilidad que pudiera existir en la duración de las actividades
de nuestro proyecto, se revisará como representar gráficamente el mismo en un diagrama de
Gant.

1.2.3. Diagramas de Gantt


La gráfica de Gantt fue desarrollada por Henry L. Gantt en 1918 y sigue siendo una he-
rramienta popular en la administración de proyectos debido a que es un medio de bajo costo
con el que los gerentes se aseguran de que: se planeen todas las actividades, se tome en cuen-
ta el orden de desempeño, se registren las estimaciones de tiempo para cada actividad y se
desarrolle el tiempo global del proyecto.

Figura 1.35: Gráfica de Gantt del ejemplo 1.10

En una gráfica de Gantt, el eje horizontal representa el tiempo de desarrollo del proyecto
y en el eje vertical se ubican todas las actividades del proyecto. Para construirla, se dibujan

42
1.2. REDES Y ALGORITMOS PARA LA ADMINISTRACIÓN DE PROYECTOS

barras horizontales para cada actividad del proyecto. Es necesario conocer el momento en
el que inicia cada actividad y su duración. CPM nos proporciona la información necesaria
para poder construir una gráfica de Gantt. En la Fig. 1.35 se muestra la gráfica de Gantt
correspondiente al Ejemplo 1.10. En la gráfica se puede observar en rojo las actividades
crı́ticas y en azul las actividades no crı́ticas de acuerdo a los tiempos más próximos obtenidos
con CPM. En un azul más claro con un entramado diagonal se muestran las actividades no
crı́ticas de acuerdo a los tiempos más lejanos. Las holguras se pueden observar de donde
termina la actividad no crı́tica en su tiempo de finalización más próximo hasta donde termina
la actividad en su tiempo de finalización más lejano.

Otra de las ventajas de utilizar gráficas de Gantt radica en que es muy sencillo visualizar
las actividades que se desarrollan en paralelo, ası́ como determinar el porcentaje de avance
de cada actividad en determinado momento del proyecto. En la Fig. 1.35, se observa que el
proyecto se encuentra en la semana 6; a esta semana el avance es del 100 % para las actividades
Excavar (A) y Hacer los cimientos (B). Para calcular el porcentaje de avance de cada actividad
puede hacer uso Excel.

1.2.4. Análisis de la ruta crı́tica con PERT

Hasta ahora, la duración de las actividades se ha establecido como un tiempo determinı́sti-


co, es decir, el tiempo es fijo y no contempla variación alguna. Sin embargo, si quisieramos
responder a la pregunta:¿Cuál es la variabilidad potencial en la fecha esperada de termina-
ción del proyecto? es necesario considerar los tiempos de las actividades como una variable
aleatoria con una distribución de probabilidad. El análisis PERT considera este problema.

En el análisis PERT empleamos una distribución de probabilidad con base en tres estima-
ciones de tiempo para cada actividad, de la manera siguiente:

Tiempo optimista (o) =tiempo que tomará una actividad si todo sa-
le como se planeó. Al estimar este valor, debe
haber sólo una pequeña probabilidad (digamos,
1/100) de que el tiempo de la actividad sea me-
nor que o.
Tiempo pesimista (p) =tiempo que tomaraá una actividad suponiendo
condiciones muy desfavorables. Al estimar este
valor, también debe haber sólo una pequeña pro-
babilidad de que el tiempo de la actividad sea
mayor que p.
Tiempo más factible (m) =La estimación más realista del tiempo reque-
rido para terminar la actividad.

43
1. MODELOS DE REDES

Figura 1.36: Distribución de probabilidad beeta con tres estimaciones de tiempo

La distribución de probabilidad que se utiliza en PERT para la duración de las actividades


es la beta (como se muestra en la Fig. 1.36), debido a su naturaleza sesgada se considera que
la mayor probabilidad se encuentra entre el tiempo optimista y el más factible, ya que los
administradores enfocarán todo su esfuerzo en terminar en esos tiempos. en esta distribución
la media (µ) y la varianza (σ 2 ) se determinan como sigue:

 2
p−o
σ2 =
6

o + 4m + p
µ=
6
El hecho de que los tiempos sean variables aleatorias implica que el tiempo de terminación
del proyecto es también una variable aleatoria. Esto quiere decir que aunque se esperarı́a que
un proyecto termine en un determinado número de semanas, no hay garantı́a de que será
terminado en ese tiempo. En general, serı́a útil conocer la probabilidad de que el proyecto sea
terminado dentro de un tiempo especı́fico.
Ahora, para hallar la probabilidad de que el proyecto termine en determinado tiempo o
menos, se tienen que cumplir los siguientes supuestos:

1. Sea T el tiempo total de duración del proyecto.

2. Sea t la duración deseada del proyecto, entonces P (T ≤ t) se calcula con facilidad si:

a) Los tiempos de las actividades son variables aleatorias independientes.


b) La variable aleatoria T tiene una distribución aproximadamente normal. Esta
hipótesis se apoya en el teorema del lı́mite central que establece que la suma de va-
riables aleatorias independientes tiene una distribución aproximadamente normal.

Los parámetros de la distribución de la variable aleatoria T son su media µp y su varianza


σp2 . Retomando los supuestos anteriores, la suma de las medias de cada actividad (al igual
que la suma de las varianzas) en la ruta crı́tica, nos permiten obtener los parámetros de la
distribución normal de la variable T (tiempo de duración del proyecto). Una vez se obtienen

44
1.2. REDES Y ALGORITMOS PARA LA ADMINISTRACIÓN DE PROYECTOS

los parámetros, la probabilidad se puede calcular utilizando la tabla de probabilidad de la


distribución estándar normal (en este caso se tendrı́a que convertir T en una variable aleatoria
T −µ
estándar normal, Z, usando Z = σ p ) o bien, la función DISTR.NORM de Excel.

Ejemplo 1.11 Retomando el ejemplo 1.10, en el que se incurrirá en una penalización de


$300000 si no se logra entregar en 47 semanas, se quisiera conocer la probabilidad de termi-
nar en esas 47 semanas o antes. Para realizar el análisis se proporcionan las tres estimaciones
de duración de cada actividad en la siguiente tabla.

Actividad o m p
A 1 2 3
B 2 3.5 8
C 6 9 18
D 4 5.5 10
E 1 4.5 5
F 4 4 10
G 5 6.5 11
H 5 8 17
I 3 7.5 9
J 3 9 9
K 4 4 4
L 1 5.5 7
M 1 2 3
N 5 5.5 9

Solución. Primero, calcule la µ y σ 2 para cada actividad. Para determinar las actividades
que se encuentran en el camino crı́tico medio, es necesario utilizar las duraciones medias de
las actividades en CPM. Una vez que se obtuvieron, se suman las medias y las varianzas de
las actividades en el camino crı́tico medio para obterner los parámetros de la distribución de
la duración del proyecto T . En la siguiente figura, se muestran los resultados de los cálculos
mencionados y la probabilidad de terminar el proyecto en 47 semanas con un 84.13 %, lo que
nos indica que realizando un adecuado seguimiento a las actividades el Sr. Rojas no debe
incurrir en la penalización.

45
1. MODELOS DE REDES

1.2.5. Optimización en la reducción de la duración del proyecto

En la administración de proyectos con frecuencia se presentan situaciones que provocan


que el proyecto se atrase o bien que adelanten la fecha de entrega. En cualquier situación, es
necesario acelerar algunas o todas las actividades restantes para terminar el proyecto en la
fecha deseada. Al proceso mediante el cual se acorta la duración del proyecto al menor costo
se le denomina optimización en la reducción de la duración del proyecto.
El primer concepto para este enfoque es el de aceleración. Acelerar una actividad se
refiere a tomar medidas que requieran inversión de recursos para reducir la duración de una
actividad por debajo de su duración normal. Estas medidas, podrı́an incluir pagarle tiempo
extra a los trabajadores, contratar personal temporal extra, adquirir equipo especializado,
etc. Acelerar el proyecto se refiere a acelerar un número de actividades con el objetivo de
reducir la duración del proyecto por debajo de su duración normal.
El método de CPM para la optimización en la reducción de la duración del proyecto tiene
como objetivo acelerar las actividades necesarias al menor costo para alcanzar la reducción
deseada.
La información necesaria para saber cuánto acelerar una actividad esta dada por la gráfica
de tiempo-costo. Observe que en la Fig. XX, se muestran un punto normal y un punto acele-
rado. Estos representan la duración y costo normales y la duración y costos acelerados para
la actividad respectivamente. CPM asume que estos tiempos y costos pueden predecirse con
confianza sin incertidumbre significativa.
Utilizando este enfoque, el Sr. Rojas de la constructora “El muro” y su equipo de supervi-
sores obtuvieron el costo y los tiempos para acelerar cada una de las actividades del proyecto.
Por ejemplo, la actividad J (Instalar la tablaroca) se puede acelerar de 8 a 6 semanas y los
costos quedaron como sigue:

46
1.2. REDES Y ALGORITMOS PARA LA ADMINISTRACIÓN DE PROYECTOS

Tiempo normal = 8 semanas


Costo normal = $430000
Tiempo acelerado = 6 semanas
Costo acelerado = $490000
Reducción máxima de tiempo = 8 − 6 = 2 semanas
Costo acelerado por periodo ahorrado = $490000−$430000
2 = $30000

Costo
Reducción
acelerado
máxima de
Tiempo Costo por periodo
tiempo
Actividad Normal Acelerado Normal Acelerado ahorrado
A 2 semanas 1 semana $180000 $280000 1 semana $100000
B 4 semanas 2 semanas $320000 $420000 2 semanas $50000
C 10 semanas 7 semanas $620000 $860000 3 semanas $80000
D 6 semanas 4 semanas $260000 $340000 2 semanas $40000
E 4 semanas 3 semanas $410000 $570000 1 semana $160000
F 5 semanas 3 semanas $180000 $260000 2 semanas $40000
G 7 semanas 4 semanas $900000 $1020000 3 semanas $40000
H 9 semanas 6 semanas $200000 $380000 3 semanas $60000
I 7 semanas 5 semanas $210000 $270000 2 semanas $30000
J 8 semanas 6 semanas $430000 $490000 2 semanas $30000
K 4 semanas 3 semanas $1600000 $200000 1 semana $40000
L 5 semanas 3 semanas $2500000 $350000 2 semanas $50000
M 2 semanas 1 semana $100000 $200000 1 semana $100000
N 6 semanas 3 semanas $330000 $510000 3 semanas $60000
Tabla 1.5: Costos y tiempos normales y acelerados del proyecto para el “El muro”

Ahora que el Sr. Rojas ha calculado los costos y tiempos normales y acelerados para cada
actividad (ver Tabla 1.5), necesita resolver saber cuál es la forma menos costosa de terminar
el proyecto en 40 semanas, es decir que actividades acelarar y cuánto tiempo se deben de
acelerar de tal forma que el costo sea el menor. Para lograrlo se plantea este problema de
optimización como un problema de programación lineal.
La función objetivo de este modelo representa el costo total del proyecto acelerando acti-
vidades para llegar a una duración deseada. Las restricciones de inicio de cada actividad, las
restricciones de aceleracón máxima de cada actividad y la restricción de la duración máxima
del proyecto. A continuación, se definen las función objetivo, las variables y restricciones en
el modelo.
Las variables que representan la reducción en la duración de cada actividad
xj = reducción en la duración de la actividad j.
donde valores de j son cada una de las actividades del proyecto. La función objetivo queda
definida como: X
Z= cj xj
j

47
1. MODELOS DE REDES

donde cj representa el costo de ahorrar un periodo en la actividad j.


yF IN = duración total del proyecto
Las variables que representan el inicio de cada actividad.
yj = tiempo de inicio de la actividad j
En esta variable los valores posibles de j representan a todas las actividades excepto a las que
inician el proyecto.
La restricción de duración del proyecto se escribe como
yF IN ≤ T
donde T es la duración máxima del proyecto.
El tiempo de inicio de una actividad debe ser mayor o igual al tiempo de finalización de
sus predecesores inmediatos. El tiempo de finalización se calcula sumándole la duración de la
actividad al tiempo de inicio y restándole el tiempo de aceleración. Suponga que la actividad
i precede a la j, la restricción quedarı́a como sigue:
yj ≥ yi + t i − x i
donde xi es la aceleración de la actividad i y ti es la duración de la actividad i. Finalmente
las restricciones de reducción máxima de cada actividad.
xj ≤ rj
donde rj es el valor máximo en el que se puede reducir la actividad j.
En el proyecto de la constructora “El muro”, el modelo de programación lineal queda como
sigue:
MinimizarZ = 100000xA + 50000xB + · · · + 60000xN
Sujeto a las siguientes restricciones:
1. Restricciones de máxima aceleración de la actividad:
xA ≤ 1, xB ≤ 2, . . . , xN ≤ 3

2. Restricciones de no negatividad:
xA ≥ 0, xB ≥ 0, . . . , xN ≥ 0
yB ≥ 0, yC ≥ 0, . . . , yN ≥ 0, yF IN ≥ 0
3. Restricciones de tiempo de inicio de cada actividad:

Un predecesor inmediato Dos predecesores inmediatos


yB ≥ 0 + 2 − xA yH ≥ yG + 7 − xG
yC ≥ yB + 4 − xB yH ≥ yE + 4 − xE
..
yD ≥ yC + 10 − xC .
..
. yF IN ≥ yM + 2 − x M
yM ≥ yH yF IN ≥ yN + 6 − x N

48
1.2. REDES Y ALGORITMOS PARA LA ADMINISTRACIÓN DE PROYECTOS

4. Restricción de la duración máxima del proyecto:

yF IN ≥ 40

Figura 1.37: Parámetros para el solver en Excel

Figura 1.38: Restricciones para el solver en Excel

Se utiliza el complemento de Solver en Excel para resolver la pregunta que se planteó el


Sr. Rojas, acerca de si vale la pena invertir para terminar el proyecto en 40 semanas y de esta
forma acceder al bono de $150000. En la Fig. 1.37 y la Fig. 1.38, se muestran los parámetros
y las restricciones que se ingresan al solver de Excel.

En la Fig. 1.37, se muestran la función objetivo que corresponde a la celda que contiene la
suma total de los costos más el costo en el que se incurre por acelerar el proyecto; las celdas
a modificar son los rangos con los nombres StartTime (corresponde al tiempo de inicio de
cada actividad), TimeReduction (corresponde al número de periodos en los que se reduce la
actividad) y ProjectFinishTime (corresponde a el tiempo en el que finaliza el proyecto).

En la Fig. 1.38, se muestra como se agregan las restricciones al solver. Las restricciones
de inicio se ingresan utilizando los nombres de las celdas correspondientes a los tiempos de
inicio (columna Tiempo inicial en la Fig. 1.39) y el tiempo de finalización de cada actividad
tomando en cuenta la reducción de la actividad (columna Tiempo Final en la Fig. 1.39).
Las restricciones de reducción máxima de cada actividad se puede introducir al solver co-
mo una ya que se usan rangos para evaluar todas las actividades (la restricción utilizada es
TimeReduction<=MaxTimeReduction). Finalmente, la restricción de duración máxima del
proyecto se muestra como ProjectFinisTime >= MaxTime. Todos los nombres de celdas y
rangos se pueden verificar en la plantilla de Excel Plantilla CPM Tiempo-costo.xlsx.

49
1. MODELOS DE REDES

Figura 1.39: Resultados proporcionados por el solver en Excel

El Sr. Rojas obtuvo los resultados del análisis de optimización en la reducción de la


duración del proyecto y se observa en la Fig. 1.39 que se necesitan invertir $240, 000 en las
actividades B, D y J, todas acelerada 2 semanas. Debido a que el bono por terminar el proyecto
en 40 semanas es de $150000, el Sr. Rojas decide mantener el plan y enfocarse en terminar el
proyecto en 44 semanas y no llegar a la fecha lı́mite de 47 semanas.

50
Capı́tulo 2

Teorı́a de decisiones

2.1. Teorı́a de juegos


En diversas áreas profesionales se presentan situaciones de competencia en las cuales dos
o más adversarios tienen que tomar decisiones simultáneas que afectan con un determinado
pago el resultado de la competencia. Ejemplos de éstas situaciones son los combates militares,
campañas polı́ticas, competencias deportivas y campañas de publicidad. La teorı́a de juegos
es útil para tomar decisiones en casos donde dos o más personas que deciden se enfrentan a
un conflicto de intereses.
En esta unidad se estudiarán los juegos entre dos personas y suma cero, llamados de
esta forma porque sólo participan dos jugadores y un jugador gana lo que el otro pierde. A
contniuación, se muestran los componentes de los juegos de dos personas y suma cero y los
diferentes enfoques para resolver este tipo de juegos.

2.1.1. Formulación de juegos de dos personas y suma cero


Con el fin de mostrar las caracterı́sticas básicas de un modelo de juegos de dos personas
de suma cero, considere el juego llamado pares y nones. Éste consiste nada más en que los
jugadores muestran al mismo tiempo uno o dos dedos. Si el número total de dedos mostrados
suma un número par, el jugador que apuesta a pares (por ejemplo el jugador 1) gana la apuesta
(digamos 1 peso) al jugador que elige nones (jugador 2) [2]. En caso contrario, el jugador 2
le gana un peso al jugador 1. Entonces, cada jugador tiene dos opciones para jugar: mostrar
uno o dos dedos. El pago en pesos que resulta para el jugador 1 se muestra en la tabla 2.1. En
la teorı́a de juegos las opciones que tienen los jugadores para elegir se llamana estrategias y
la forma de como se obtienen las recompensas para el jugador 1 se presenta en una tabla que
es llamada matriz de pagos.

Jugador 2
Estrategia 1 2
1 1 −1
Jugador 1
2 −1 1
Tabla 2.1: Matriz de pagos del juego de pares y nones

51
2. TEORÍA DE DECISIONES

Los elementos de un juego de dos personas de suma cero son:

1. Las estrategias del jugador 1.

2. Las estrategias del jugador 2.

3. La matriz de pagos.

El juego inicia cuando ambos jugadores eligen sus estrategias de forma simultánea. Antes
de iniciar el juego, cada jugador conoce las estrategias de que dispone, las que tiene su oponente
y la matriz de pagos. Una jugada consiste en que los dos jugadores elijan al mismo tiempo una
estrategia sin saber cuál es la elección de su oponente. Existen juegos que se pueden realizar
en múltiples ocasiones y algunos sólo se pueden jugar una vez.
Una estrategia es una regla predeterminada que especifica por completo cómo se intenta
responder a cada circunstancia posible en cada etapa del juego. La matriz de pagos muestra
la ganancia (positiva o negativa) del jugador 1, que resultarı́a con cada combinación de estra-
tegias de los dos jugadores. La ganancia establecida en la matriz de pagos no necesariamente
es dinero, también se puede ver reflejada como número de votos, fichas, ventas obtenidas o
una determinada probabilidad de obtener algo.
Un objetivo primordial en la teorı́a de juegos es desarrollar criterios racionales para selec-
cionar una estrategia, los cuales implican dos supuestos importantes:

1. Ambos jugadores son racionales, es decir, ambos poseen la inteligencia para decidir cual
es su mejor opción.

2. Ambos jugadores eligen sus estrategias sólo para promover su propio bienestar (sin
compasión para el oponente).

2.1.2. Estrategia dominada


Una de las técnicas empleadas en teorı́a de juegos para determinar la estrategia que debe
de elegir cada jugador es la denomidada estrategia dominada. Esta técnica consiste en
elminar las estrategias inferiores hasta que quede sólo quede una que se pueda elegir.
Una estrategia es dominada por segunda estrategia si esta última es siempre al menos tan
buena (y algunas veces mejor) como la primera, sin que importe lo que haga el oponente. Una
estrategia dominada se puede eliminar de inmediato de la matriz de pagos para consideracio-
nes posteriores. Es importante observar que no existe un orden para eliminar las estrategias
dominadas y que no es necesario alternar entre jugadores.
Desde el punto de vista del jugador 1, una estrategia domina a otra si los pagos de la
estrategia en cuestión para cada estrategia elegida por el jugador 2, son mayores o iguales que
los correspondientes a la estrategia dominada. Con respecto al Jugador 2, se debe verificar que
los pagos sean menores o iguales. Lo anterior es debido a que el jugador 1 busca maximizar
sus ganancias y el jugador 2 minimizar sus pérdidas, por lo que números más grandes son
mejores para el jugador 1 y más pequeños son mejores para el jugador 2.

Ejemplo 2.1 Dos polı́ticos contienden entre sı́ por un lugar en la Cámara de Diputados Fe-
derales de México por el distrito IX del estado de Yucatán. En este momento elaboran sus

52
2.1. TEORÍA DE JUEGOS

planes de campaña para los dos últimos dı́as antes de las elecciones; se espera que dichos dı́as
sean cruciales debido a que están muy próximos al dı́a de la votación. Por esta circunstancia,
ambos quieren emplearlos para hacer campaña en dos ciudades importantes: Motul y Progreso.
Para evitar pérdidas de tiempo, planean viajar en la noche y pasar un dı́a completo en cada
ciudad o dos dı́as en sólo una de ellas. Como deben de hacer los arreglos necesarios por ade-
lantado, ninguno de los dos conocerá lo que su oponente tiene planaeado hacer hasta después
de concretar sus propios planes. Cada polı́tico tiene un jefe de campaña en cada ciudad para
asesorarlo sobre el efecto que tendrán (en términos de votos ganados o perdidos) las combi-
naciones posibles de los dı́as dedicados a cada ciudad por ellos o sus oponentes. Por tanto,
quieren emplear esta información para elegir su mejor estrategia para estos dos dı́as. En la
tabla 2.2 se muestran los votos (en miles) ganados o perdidos para el polı́tico 1.

Polı́tico 2
Estrategia 1 2 3
1 1 2 4
Polı́tico 1 2 1 0 5
3 0 1 −1
Tabla 2.2: Matriz de pagos del problema de la campaña polı́tica para estrategias dominadas

Solución. Para formular este problema como un juego de dos personas y suma cero, se
identifican sus elementos principales: jugadores, estrategias y matriz de pagos. Los jugadores
son: Polı́tico 1 y Polı́tico 2. Las estrategias son:
1. Estrategia 1: pasar un dı́a en cada ciudad
2. Estrategia 2: pasar dos dı́as en Motul
3. Estrategia 3: pasar dos dı́as en Progreso
La matriz de pagos se muestra en la tabla 2.2. En principio, no se observan estrategias
dominadas del jugador 2; sin embargo, para el jugador 1 la estrategia 3 está dominada por la
estrategia 1 (o bien, la estrategia 1 domina a la 3) ya que tiene pagos más altos (1 > 0, 2 > 1,
4 > −1), independientemente de lo que haga el jugador 2. Despúes de eliminar la estrategia
dominada (3), se obtiene la matriz de pagos reducida:
1 2 3
1 1 2 4
2 1 0 5
Ahora, después de que fue eliminada una estrategia del jugador 1, el jugador 2 se da cuenta
que el jugador 1 sólo dispones de dos estrategias y observa que su estrategia 3 está dominada
tanto por la estrategia 1 como por la 2. Esto es, con respecto a la matriz de pagos reducida
con anterioridad para la estrategia 1: 1 < 4, 1 < 5; para la estrategia 2:2 < 4, 0 < 5. Al
eliminar la estrategia dominada se obtiene
1 2
1 1 2
2 1 0

53
2. TEORÍA DE DECISIONES

Ahora, se observa que la estrategia 2 del jugador 1 se encuentra dominada por la estrategia
1, puesto que 2 > 0 en la columna 2 y 1 = 1 para la coulumna 1. Al eliminar la estrategia
dominada obtenemos la siguiente matriz de pagos reducida

1 2
1 1 2

Finalmente el jugador 2 observa que su estrategia 2 se encuentra dominada por la estrategia


1, debido a que 1 < 2. Al eliminar esta última estrategia, ambos jugadores se quedan con sólo
una estrategia. En consecuencia, la solución de este problema es que ambos polı́ticos deben
de elegir la estrategia 1, es decir, ambos deben de pasar un dı́a en cada ciudad
Antes de continuar con la siguiente sección, se definen dos conceptos: valor del juego y
juego justo. El valor del juego es el pago que recibe el jugador 1 cuando ambos jugadores
operan de manera óptima y un se dice de un juego justo cuando el el valor de dicho juego
es 0.
Es importante aclarar que en muy raras ocasiones la matriz de pagos se reduce de tal
forma hasta obtener una única estrategia para ambos jugadores, sin embargo, es muy útil
para reducir la matriz de pagos y posteriormente aplicar otro método para resolver el juego.

2.1.3. Criterio minimax


Otro criterio para resolver juegos de suma cero con dos jugadores, es el criterio minimax.
Retomando el ejemplo de los polı́ticos (ver Ej. 2.1), supongamos que la matriz de pagos para
la campaña polı́tica es

Polı́tico 2
Estrategia 1 2 3
1 −3 −2 6
Polı́tico 1 2 2 0 2
3 5 −2 −4
Tabla 2.3: Matriz de pagos del problema de la campaña polı́tica para criterio minimax

En la Tabla 2.4, observe que en este caso el juego no tiene estrategias dominadas, por
lo que no es obvio que deben hacer los jugadores. ¿Qué deberı́an hacer los jugadores en este
caso?
Supongamos que el polı́tico 1 desea aplicar la estrategia 1 (pasar un dı́a en cada ciudad),
1 2 3
1 −3 −2 6 ← Se puede ganar 6. Ganancia máxima

Se puede perder 3. Pérdida máxima

En este caso el polı́tico 2, optarı́a por usar la estrategia 1, ya que evitarı́a hacer pagos al
polı́tico 1. Utilizando esta combinación de estrategias, el polı́tico 2 tratará de minimizar la
pérdida máxima y el polı́tico 1 tratará de maximizar las ganancias mı́nimas. Este método es
conocido como criterio minimax.

54
2.1. TEORÍA DE JUEGOS

El criterio minimax es un criterio estándar para elegir una estrategia. Este criterio sostiene
que sabe seleccionar la mejor estrategia, aun cuando esta elección se anuncie al oponente antes
de que éste elija su propia estrategia de respuesta. El jugador 1 debe elegir aquella estrategia
cuyo pago mı́nimo sea el mayor, mientras que el jugador 2 debe elegir la estrategia cuyo pago
máximo a su oponente sea el menor.
En términos de la matriz de pagos correspondiente a la Tabla 2.4, se procede de la siguiente
manera:

Jugador 1. debe seleccionar el pago mı́nimo de cada una de sus estrategias (el mı́nimo de cada fila).
A continuación, selecciona el valor máximo de esos pagos. Esta es la estrategia que debe
utilizar.

Jugador 2. debe seleccionar el máximo de cada uno de los pagos a realizar al jugador 1 (el máximo de
cada columna). A continuación, debe seleccionar el mı́nimo de esos pagos. Esta columna
con el valor mı́nimo de los valores máximos elegidos previamente será la estrategia a
seleccionar.

Polı́tico 2
Estrategia 1 2 3
1 −3 −2 6 −3
Polı́tico 1 2 2 0 2 0 ← Maximin
3 5 −2 −4 −4
5 0 6

Minimax
Tabla 2.4: Solución utilizando el criterio minimax

Bajo este criterio, se dice que el jugador 1 aplica la estrategia maximin y que el jugador 2
aplica la estrategia minimax. Si el valor minimax y maximin coinciden, entonces la solución
es estable y el valor maximin/minimax se llama punto silla o punto de equilibrio. Ningún
jugador tiene motivos para considerar un cambio de estrategia, ya que ninguno quedará en
ventaja aun conociendo la elección de su oponente. Por tanto, cada jugador debe emplear su
respectiva estrategia maximin y minimax.
Finalmente observe que, el juego es justo, ya que valor del juego (valor en donde se
intersectan el valor maximin y el valor minimax) es cero. En otro caso el juego no serı́a justo
ya que alguno de los jugadores obtiene ganancias y el otro pérdidas.

2.1.4. Juegos con estrategia mixta


Cuando un juego no tiene punto silla (como se observa en la Tabla 2.5), es decir, el valor
minimax es diferente al valor maximin, se aconseja asignar una distribución de probabilidad
sobre su conjunto de estrategias.

55
2. TEORÍA DE DECISIONES

Polı́tico 2
Estrategia 1 2 3
1 0 −2 2 −2 ← Maximin
Polı́tico 1 2 5 4 −3 −3
3 2 3 −4 −4
5 4 2

Minimax
Tabla 2.5: Solución sin punto silla (inestable) del ejemplo de los polı́ticos

Esto es que cada una de las estrategias se eligirá con una determinada probabilidad, a
diferencia de los juegos con punto silla donde cada jugador elige una única estrategia como
su mejor opción. Matemáticamente este consejo se expresa como,

xi = probabilidad de que el jugador 1 use la estrategia i(i = 1, 2, . . . , m)


yj = probabilidad de que el jugador 2 use la estrategia j(j = 1, 2, . . . , n)

donde m y n son el número de estrategias disponibles para cada jugador, respectivamente.


De esta manera, el jugador 1 definirá su estrategia al encontrar los valores de x1 , x2 , . . . , xm de
tal forma que obtenga su ganancia máxima. Como estos valores son probabilidades, tendrı́an
que ser no negativos y sumar 1. De igual manera, el plan de juego del jugador 2 (su estrategia)
se describe al encontrar los valores correspondientes a y1 , y2 , . . . , yn . Los planes de juego,
(x1 , x2 , . . . , xm ) y (y1 , y2 , . . . , yn ) se les conoce como estrategias mixtas y las estrategias
obtenidas cuando un juego es estable (tiene punto silla) se llaman estrategias puras.
Ambos jugadores pudieran elegir los valores para sus estrategias utilizando diversos cri-
terios, por ejemplo al azar. Sin embargo, de esta forma no se garantiza obtener los mejores
resultados para ambos jugadores. Una medida de desempeño muy útil para evaluar las estra-
tegias mixtas es el pago esperado. Al aplicar la definición de valor esperado de la teorı́a de
probabilidad, el pago esperado para el jugador 1 (P EJ1) queda como sigue:
m X
X n
P EJ1 = pij xi yj (2.1)
i=1 j=1

donde pij es el pago si el jugador 1 usa la estrategia i y el jugador 2 usa la estrategia j.


Esta medida de desempeño no revela nada sobre riesgos inherentes al juego, pero indica a qué
cantidad tenderı́a el pago promedio si el juego se efectuara muchas veces.
Con esta medida, la teorı́a de juegos puede el concepto del criterio minimax a juegos que
no tienen punto silla y que, por lo tanto, necesitan estrategias mixtas. En la teorı́a de juegos,
cuando el enfoque es en el jugador 1, se aplica el criterio maximin, el cual busca maximizar
las ganancias mı́nimas obtenidas; para el jugador 2 se aplica el criterio minimax, el cual busca
minimizar las pérdidas máximas obtenidas. Con respecto a las estrategias mixtas lo que busca
el criterio maximin(minimax) es maximizar(minimizar) el pago esperado mı́nimo(máximo),
obteniendo de esta manera el valor óptimo del pago esperado para el jugador 1 (jugador 2)
llamado el valor maximin(minimax) v(v).

56
2.1. TEORÍA DE JUEGOS

Teorema 2.1 (Teorema minimax [2]) Si se permiten estrategias mixtas, el par de estra-
tegias que es óptimo de acuerdo con el criterio minimax proporciona una solución estable con
v = v = v (el valor del juego), de manera que ninguno de los dos jugadores puede mejorar si
cambia de manera unilateral su estrategia.

A continuación se mostrará cómo cada jugador encuentra su estrategia mixta óptima. Se


dispone de varios métodos. Uno es un procedimiento gráfico que se puede usar siempre que
uno de los jugadores tenga sólo dos estrategias puras (no dominadas); este enfoque se describe
en la siguiente sección. Cuando se trata de juegos con un mayor número de estrategias en
ambos jugadores, el método que más se emplea consiste en transformar el problema en uno
de programación lineal que se pueda resolver por el método sı́mplex en una computadora, por
ejemplo, utilizando el solver de Excel.

Método gráfico
Este método se utiliza para resolver juegos de suma cero con estrategias mixtas. El requisito
para poder utilizarlo es que uno de los dos jugadores tenga únicamente dos estrategias, puede
ser el jugador 1 o el jugador 2, y el otro jugador deberı́a tener más de dos estrategias. Se
puede llegar a esta situación eliminando las estrategias dominadas en la matriz de pagos.
Considere el caso en el que el jugador 1 es el que se queda con dos estrategias, entonces
sus estrategias mixtas son (x1 , x2 ) y x2 = 1 − x1 . Ahora, resulta sencillo hacer la gráfica del
pago esperado como una función de x1 , para cada una de las estrategias de su oponente.
Para ilustrar este procedimiento, considere los valores de la matriz de pagos que se mues-
tran en la Tabla 2.5. Observe que la tercera estrategia pura del jugador 1 está dominada por
la segunda, por lo que la matriz de pagos se puede reducir a la forma dada en la Tabla 2.6

Polı́tico 2
Probabilidad y1 y2 y3
Estrategia
Probabilidad Pura 1 2 3
x1 1 0 −2 2
Polı́tico 1
1 − x1 2 5 4 −3
Tabla 2.6: Matriz de pagos reducida del jugador 1 del problema de los polı́ticos

El pago esperado para el jugador 1 (tomando los datos en la Tabla 2.6), de acuerdo a la
ecuación 2.1 queda como sigue:

2 X
X 3
P EJ1 = pij xi yj
i=1 j=1

= 0x1 y1 + (−2)x1 y2 + 2x1 y3 + 5x2 y1 + 4x2 y2 − 3x2 y3


= 0x1 y1 + (−2)x1 y2 + 2x1 y3 + 5(1 − x1 )y1 + 4(1 − x1 )y2 − 3(1 − x1 )y3
= (5 − 5x1 )y1 + (4 − 6x1 )y2 + (−3 + 5x1 )y3 (2.2)

57
2. TEORÍA DE DECISIONES

Una vez se tiene el pago esperado para el jugador 1 (P EJ1), se procede a calcular el pago
esperado de cada alternativa del jugador 2. El pago esperado del jugador 1 para la alternativa
1 del jugador 2 (P EJ1y1 ) se obtiene cuando y1 = 1, y2 = 0, y3 = 0, sustituyendo en la ecuación
2.1.4 nos queda

P EJ1y1 = (5 − 5x1 )(1) + (4 − 6x1 )(0) + (−3 + 5x1 )(0)


= 5 − 5x1

Resolviendo para las otras dos alternativas del jugador 2, los pagos esperados quedan como
se muestra en la Tabla 2.7.

(y1 , y2 , y3 ) Pago esperado


(1, 0, 0) 0x1 + 5(1 − x1 ) = 5 − 5x1
(0, 1, 0) −2x1 + 4(1 − x1 ) = 4 − 6x1
(0, 0, 1) 2x1 − 3(1 − x1 ) = −3 + 5x1
Tabla 2.7: Pago esperado del jugador 1 para cada alternativa del jugador 2

A continuación se grafican las rectas del pago esperado que acabamos de obtener como se
muestra en la Fig. 2.1. Observe que como los valores en el je x son probabilidades, las rectas
se grafican en el dominio [0, 1].

Figura 2.1: Procedimiento gráfico para la solución de los juegos.

Debido a que el jugador 1 tiene como objetivo maximizar sus ganancias mı́nimas, debe
ubicar un punto en la gráfica donde se logre este objetivo, punto maximin. Este punto, es
el más alto de la región mı́nima delimitada en la Fig. 2.1. Esta regı́n se forma con los puntos
que se encuetran más abajo en la gráfica delimitando una región mı́nima(vea también Fig.
2.2). En el caso de que el método gráfico sea enfocado en el jugador 2, se busca el punto más

58
2.1. TEORÍA DE JUEGOS

bajo de la región máxima, punto minimax, como se muestra en la Fig. 2.3

Figura 2.2: Punto maximin en la región mı́nima de la gráfi- Figura 2.3: Punto minimax en la región máxima de la
ca. gráfica.

El jugador 1 quiere maximizar el pago esperado mı́nimo, en consecuencia, debe elegir


el valor máximo de x1 entre las intersecciones ubicadas en la región mı́nima, es decir, la
intersección entre las rectas −3 + 5x1 y 4 − 6x1 , de donde se obtiene el valor maximin (que
por el teorema minimax) es el valor del juego y pago esperado para el jugador 1. Igualando
las rectas que se intersectan en el punto maximin tenemos

−3 + 5x1 = 4 − 6x1
5x1 + 6x1 = 4 + 3
7
x1 =
11
4 7 4
Entonces x2 = 1 − x1 = 11 y de esta forma ( 11 , 11 ) es la estrategia mixta óptima del jugador
1, lo que indica que el jugador 1 deberá elegir la estrategia 1 con una probalidad de 0.6364 y
la estrategia x2 con una probabilidad de 0.3636. Una vez se obtuvo el valor de x1 , es posible
obtener el valor del juego (que es el valor maximin) con el punto maximin sustituyendo en
cualquiera de las rectas que intersectan al punto maximin.
 
7 2
v = v = −3 + 5 =
11 11
Para encontrar la estrategia mixta óptima para el jugador 2 el razonamiento es el siguiente.
De acuerdo con la definición del valor minimax v y el teorema minimax, el pago esperado que
se obtiene con la estrategia (y1 , y2 , y3 ) tendrá que satisfacer la condición
2
y1 (5 − 5x1 ) + y2 (4 − 6x1 ) + y3 (−3 + 5x1 ) ≤ vv =
11
para todos los valores x1 (0 ≤ x1 ≤ 1). Cuando el jugador 1 juega de manera óptima (cuando
7
x1 = 11 ), la desigualdad anterior, se convierte en una igualdad por el teorema minimax, de
manera que
20 2 2 2
y1 + y2 + y3 = v = (2.3)
11 11 11 11
Por lo tanto, y1 = 0, puesto que un valor de y1 > 0 vioları́a la ecución 2.1.4; es decir, en la
7
gráfica, el pago esperado en el punto x1 = 11 estarı́a por el punto maximin. En general, a

59
2. TEORÍA DE DECISIONES

cualquier recta que no pasa por el punto maximin(o minimax si se enfoca en el jugador 2) se
le debe de asignar un peso de cero para evitar que el pago esperado tenga un valor máyor que
éste. Por esta razón, el pago esperado del jugador 1 queda como sigue

2
y2 (4 − 6x1 ) + y3 (−3 + 5x1 ) =
11
Entonce, para obtener los valores de y2 y y3 se seleccionan dos valores para x1 (0 ≤ x1 ≤ 1),
con el objetivo de obtener un sistema de dos ecuaciones con dos incógnitas. Sean estos valores
x1 = 0 y x1 = 1 (por practicidad se seleccionan estos valores). Ası́

2
4y2 − 3y3 =
11
2
−2y2 + 2y 3 =
11
5 6
Resolviendo el sistema de ecuaciones, se obtiene que y2 = 11 y y3 = 11 . Por lo tanto, la
5 6
estrategia mixta óptima del jugador 2 es (y1 , y2 , y3 ) = (0, 11 , 11 ).

Programación lineal
Cualquier juego de estrategias mixtas se puede resolver en forma muy sencilla si se lo
transforma en un problema de programación lineal. Como se verá, esta transformación requiere
apenas un poco más que la aplicación del teorema minimax y el uso de la definición del valor
maximin v y valor minimax v.
Primero considere cómo se encuentra la estrategia mixta del jugador 1. Como se indicó en
la sección 14.3,
m X
X n
PAgo esperado para el jugador 1 = pij xi yj
i=1 j=1

y la estrategia (x1 , x2 , . . . , xm ) es óptima si


m X
X n
pij xi yj ≥ v = v
i=1 j=1

para todas las estrategias del oponente (y1 , y2 , . . . , yn ). Entonces, esta desigualdad se debe
cumplir, por ejemplo, para cada una de las estrategias puras del jugador 2, es decir, para cada
una de las estrategias (y1 , y2 , . . . , yn ) donde yj = 1 y el resto es igual a 0. Al sustituir estos
valores en la desigualdad se obtiene
m
X
pij xi ≥ v para j = 1, 2, . . . n,
i=1

de manera que la desigualdad implica este conjunto de n desigualdades. Aún más, este
conjunto de n desigualdades implica la desigualdad original (escrita de otra forma)

60
2.1. TEORÍA DE JUEGOS

n m n
!
X X X
yj pij xi ≥ yj v = v,
j=1 i=1 j=1
porque
n
X
yj = 1
j=1
.
Como la implicación va en ambas direcciones, se concluye que imponer este conjunto de
n desigualdades lineales es equivalente a requerir que la desigualdad original se cimpla para
todas las estrategias (y1 , y2 , . . . , yn ). Pero estas n desigualdades son restricciones válidas en
programación lineal, como son las restricciones adicionales

x1 + x2 + · · · + xm = 1
xi ≥ 0, para i = 1.2, . . . , m

que se necesitan para asegurar que las xi sean probabilidades. Por esta razón, cualquier
solución (x1 , x2 , . . . , xm ) que satisfaga este conjunto completo de restricciones de programación
lineal es la estrategia mixta óptima deseada.
En consecuencia, el problema de encontrar una estrategia mixta óptima se ha reducido a
encontrar una solución factible para un problema de programación lineal, lo que se puede hacer
según se describió en el capı́tulo 4. Las dos dificultades que quedan por resolver son que: 1) se
desconoce v, y 2) el problema de programación lineal no tiene función objetivo. Por fortuna,
ambos obstáculos se pueden salvar al mismo tiempo si se sustituye la constante desconocida v
por la variable xm+1 y después se maximiza xm+1 , de manera que en forma automática xm+1
será igual a v (por definición) en la solución óptima del problema de programación lineal.

2.1.4.1. La formulación de la programación lineal


Para resumir, el jugador 1 encontrará su estrategia mixta óptima al emplear el método
sı́mplex para resolver el problema de programación lineal:
Maximizar xm+1 ,
sujeta a

p11 x1 + p21 x2 + · · · + pm1 xm − xm+1 ≥ 0


p12 x1 + p22 x2 + · · · + pm2 xm − xm+1 ≥ 0
..
.
p1n x1 + p2n x2 + · · · + pmn xm − xm+1 ≥ 0
x1 + x2 + · · · + xm = 1

xi ≥ 0, para i = 1, 2, . . . , m

61
2. TEORÍA DE DECISIONES

.
Observe que xm+1 no está restringida a ser no negativa, mientras que el método sı́mplex
sólo puede aplicar una vez que todas las variables tienen la restricción de no negatividad. Este
asunto puede resolverse con facilidad como se verá en seguida.
Ahora considere al jugador 2. Éste puede encontrar su estrategia óptima mixta si reescribe
la matriz de pagos como los pagos a sı́ mismo en lugar de al jugador 1 y procediendo exac-
tamente como se acaba de describir. Sin embargo, resulta ilustrativo resumir su formulación
en términos de la matriz de pagos original. So se sigue un procedimiento análogo al decrito,
el jugador 2 concluirá que su estrategia mixta óptima está dada por la solución óptima del
problema de programación lineal:
Minimizar yn+1 ,
sujeta a

p11 y1 + p12 y2 + · · · + p1n yn − yn+1 ≤ 0


p21 y1 + p22 y2 + · · · + p2n yn − yn+1 ≤ 0
..
.
pm1 y1 + pm2 y2 + · · · + pmn yn − yn+1 ≤ 0
y1 + y2 + · · · + yn = 1

yj ≥ 0, para j = 1, 2, . . . , n
.
Es sencillo demostrar que este problema de programación lineal y el dado para el jugador 1
son duales uno del otro en el sentido descrito en las secciones 6.1 y 6.4. Este hecho tiene varias
implicaciones importantes. Una es que se pueden encontrar las estrategias mixtas óptimas para
los dos jugadores mediante la resolución de sólo uno de los problemas de programación lineal
puesto que la solución óptima dual es un producto complementario automático de los cálculos
del método sı́mplex para encontrar la solución óptima primal. Una segunda implicación es
que esto trae consigo toda la teorı́a de la dualidad para fundamentar en ella la interpretación
y el análisis de los juegos.
Una implicación relacionada es que proporciona una prueba muy sencilla del teorema
minimax. Sean x∗m+1 y yn+1 ∗ los valores de xm+1 y yn+1 en la solución óptima de los respectivos
problemas de programación lineal. Se sabe, por la propiedad de dualidad fuerte que se presentó
en la sección 6.1, que −x∗m+1 = −yn+1
∗ , de manera que x∗ ∗
m+1 = yn+1 . Sin embargo, es evidente
que la definición de v y v que v = x∗m+1 y que v = yn+1 ∗ , lo que conduce a la conclusión de

que v = v, como lo establece el teorema minimax.


Queda un cabo suelto por atar, esto es, cómo proceder si xm+1 y yn+1 no están restringidas
en signo en sus formulaciones de programación lineal. Si es evidente que v ≥ 0 para que los
valores óptimos de xm+1 y yn+1 sean no negativos, entonces no hay peligro si se introducen
las restricciones de no negatividad sobre estas variables con el propósito de aplicar el método
sı́mplex. No obstante, si v < 0, entonces debe hacerse un ajuste. Una posibilidad es emplear

62
2.1. TEORÍA DE JUEGOS

el enfoque descrito en la sección 4.6 en el que se sustituye una variable no restringida por
la diferencia de dos variables no negativas. Otra posibilidad es invertir a los jugadores 1 y
2 para que la matriz de pagos se reescriba como el pago al jugador 2 original, lo que harı́a
que el valor correspondiente de v fuera positivo. Un tercer procedimiento, y el que más se
usa en la práctica, es agregar una constante fija grande a todos los elementos de la matriz de
pagos para que el nuevo valor del juego sea positivo. (Por ejemplo, bastarı́a con igualar esta
constante al valor absoluto del elemento más negativo.) Como la misma constante se agrega
a todos los elementos, este ajuste no puede alterar de ninguna manera las estrategias mixtas
óptimas, por lo cual ahora se pueden obtener en forma normal. El valor indicado del juego se
aumentará en la cantidad constante, pero se puede reajustar después de obtener la solución.

2.1.4.2. Aplicación a la variación 3 del problema de las campañas polı́ticas


Para ilustrar este enfoque de programación lineal, considere de nuevo la variación 3 del
problema de la campaña polı́tica después de eliminar la estrategia dominada 3 del jugador 1
(vea la tabla 14.6). Como existen algunos elementos negativos en la matriz de pagos reducida,
no es evidente si el valor del juego v es no negativo (ocurre que sı́ lo es). Por el momento,
suponga que v ≥ 0 y proceda sin hacer ninguno de los ajustes mencionados.
Para escribir el modelo de programación lineal del jugador 1 de este ejemplo, observe que
pij en el modelo general es el elemento del renglón i y la columna j de la tabla 14.6, para
i = 1, 2 y j = 1, 2, 3. El modelo que se obtiene es
Maximizar x3 ,
sujeta a

5x2 − x3 ≥ 0
−2x1 + 4x2 − x3 ≥ 0
2x1 − 3x2 − x3 ≥ 0
x1 + x2 = 1

x1 ≥ 0, x2 ≥ 0
.
La aplicación del método sı́mplez a este problema de programación lineal (después de
agregar la restricción x3 ≥ 0) da x∗1 = 11 7
, x∗2 = 11
4
, x∗3 = 11
2
como solución óptima. En
consecuencia, la estrategia mixta óptima del jugador 1 de acuerdo al criterio minimax es
(x1 , x2 ) = ( 11 , 11 ) y el valor del juego es v = x∗3 = 11
7 4 2
. El método sı́mplez también produce
la solución óptima del dual (que se proporciona en seguida) de este problema, ésta es, y1∗ =
0, y2∗ = 115
, y3∗ = 116
, y4∗ = 11
2
, con lo que la estrategia mixta óptima del jugador 2 es (y1 , y2 , y3 ) =
5 6
(0, 11 , 11 ).
El dual del problema anterior es el modelo de programación lineal del jugador 2 (el que
tiene las variables y1 , y2 , . . . , yn , yn+1 ) que se mostró antes en esta misma sección. Al sustituir
los valores de pij , dados en la tabla 14.6, este modelo es

63
2. TEORÍA DE DECISIONES

Minimizar y4 ,
sujeta a

−2y2 + 2y3 − y4 ≤ 0
5y1 + 4y5 − 3y3 − y4 ≤ 0
y1 + y2 + y3 = 1

y1 ≥ 0, y2 ≥ 0, y3 ≥ 0
.
Si se aplica el método sı́mplex directamente a este modelo (después de agregar la restricción
y4 ≥ 0), se obtiene la solución óptima y1∗ = 0, y2∗ = 11 5
, y3∗ = 11
6
, y4∗ = 11
2
(al igual que la
∗ 7 ∗ 4 ∗ 2
solución óptima dual, x1 = 11 , x2 = 11 , x3 = 11 ). En consecuencia, la estrategia mixta óptima
5 6
del jugador 2 es (y1 , y2 , y3 ) = (0, 11 , 11 ) y de nuevo se puede ver que el valor del juego es
2
v = y4 = 11 .
Como ya se habı́a determinado la estrategia mixta óptima del jugador 2 cuando se re-
solvió el primer modelo, no fue necesario resolver el segundo. En general, siempre se pueden
encontrar las estrategias mixtas óptimas de ambos jugadores con sólo elegir uno de los mo-
delos (cualquiera) y usar el método sı́mplex para obtener una solución óptima y una solución
óptima dual.
Cuando se aplicó el método sı́mplex a estos dos modelos de programación lineal, se agregó
una restricción de no negatividad que suponı́a que v ≥ 0. Si este supuesto se violara, ninguno
de los dos modelos tendrı́a soluciones factibles, y el método śimplex se detendrı́a con rapidez
con este mensaje. Para evitar este riesgo se pudo haber agregado una constante positiva,
como 3 (el valor absoluto del elemento más negativo), a todos los elementos de la tabla 14.6.
Esto habrı́a aumentado en 3 todos los coeficientes de x1 , x2 , y1 , y2 y y3 en las restricciones de
desigualdad de los dos modelos.

2.2. Análisis de decisiones


El capı́tulo anterior se estudió la teorı́a de juegos para tomar decisiones. En este tipo de
escenario es necesario cierto grado de certidumbre, que en este caso, es saber que tu oponente
eleigirá la acción que más le beneficie. En este capı́tulo se analizará el escenario cuando existe
incertidumbre, esto es, nuestro oponente ahora es la naturaleza, por lo que no tenemos la
certeza de cómo reaccionará a nuestras decisiones. Afortunadamente, es posible estimar con
suficiente exactitud el comportamiento de los sucesos inciertos, por lo que es posible utilizar
modelos como los que se exploran en este capı́tulo.
A continuación se describen algunos ejemplos de situaciones con mayor incertidumbre en
las cuales es necesario tomar decisiones.

1. Un fabricante introduce un nuevo producto al mercado. ¿Cuál será la probable reacción


de los consumidores? ¿Cuánto debe producir? ¿Debe probar el producto en una región

64
2.2. ANÁLISIS DE DECISIONES

pequeña antes de decidir la distribución integral? ¿Cuánta publicidad necesita para


lanzar el producto con éxito?

2. Una empresa financiera invierte en certificados. ¿Cuáles son los mejores prospectos de
certificados de sectores del mercado e individuales? ¿Cómo afectan estos factores las
decisiones de la inversión?

3. Un contratista del gobierno se presenta a una licitación. ¿Cuáles serán los costos reales
del proyecto? ¿Qué otras compañı́as se han presentado? ¿Cuál es su presupuesto proba-
ble?

4. Una empresa agrı́cola selecciona la mezcla de cosechas y ganado para la próxima tem-
porada. ¿Cuáles serán las condiciones climáticas?¿Hacia dónde van los precios? ¿Cuáles
serán los costos?

5. Una compañı́a decide perforar en cierta región. ¿Cuán probable es que haya petróleo
en ella? ¿Cuánto? ¿Cuán profundo tendrá que perforar? ¿Deben los geólogos investigar
más el sitio antes de perforar?

El análisis de decisiones se diseño para estudiar los tipos de decisiones que se deben tomar
en un ambiente de gran incertidumbre. Cuando es necesario tomar una decisión, surge una
pregunta importante acerca del tiempo o la información que tenemos actualmente para tomar
la decisión. Es mejor decidir ahora o después de tener los resultados de algún estudio adicional
(con cierto costo) con el objetivo de reducir la incertidumbre. A estos estudios o pruebas que
se realizan para reducir la incertidumbre se le conoce como experimentación. En consecuencia,
el análisis de decisiones divide la toma de decisiones en los casos sin experimentación y con
experimentación
Se comenzará con el caso más sencillo, el cual es la toma de decisiones sin experimentación.

2.2.1. Toma de decisiones sin experimentación


El proceso para tomar una decisión se compone de un conjunto de alternativas factibles
que indican las distintas formas de proceder en el problema en cuestión, los estados de la
naturaleza, los pagos correspondientes y la frecuencia con la que ocurren los estados de la
naturaleza. Los estados de la naturaleza, ocurren de manera aleatoria, de tal forma que no se
sabe con certeza cuál es el estado que ocurrirá. Cada combinación de una opción (alternativa
de decisión) y un estado de la naturaleza se le atribuye un pago resultante, y es un elemento
de la tabla de pagos. La tabla de pagos se crea con las alternativas de decisión (en las filas),
los estados de la naturaleza (en las columnas) y sus elementos son los pagos resultantes de
elegir una alternativa y que ocurra un determinado estado de la naturaleza.
Es común que la información acerca de la frecuencia con que ocurren los estados de la
naturaleza se pueda traducir en una distribución de probabilidad, si se piensa que el estado
de la naturaleza es una variable aleatoria, en cuyo caso esta distribución se conoce como
distribución a priori . Las probabilidades de los respectivos estados de la naturaleza se
llaman probabilidades a priori .
En esta sección, se determinan tres criterios en la toma de decisiones sin experimentación:
criterio del pago máximo, criterio de la máxima posibilidad y la regla de decisión de Bayes.

65
2. TEORÍA DE DECISIONES

Criterio del pago máximo: Para cada opción posible, encuentre el pago mı́nimo sobre
todos los posibles estados de la naturaleza. Después, encuentre el máximo de estos pagos
mı́nimos. Elija la opción cuyo pago mı́nimo es el máximo. Este criterio es el mismo que se
utilizó en la sección 2.1 (Teorı́a de Juegos), criterio minimax.

Criterio de la máxima posibilidad: Identifique el estado más probable de la naturaleza


(aquel que tiene la probabilidad a priori más grande). Para este estado de la naturaleza,
encuentre la opción con el máximo pago. Elija esta alternativa de decisión.

Regla de decisión de Bayes: Se utilizan las estimaciones de las probabilidades de los


respectivos estados de la naturaleza para calcular el valor esperado de cada opción posible.
Se elige la opción con el máximo pago esperado. La teorı́a de la probabilidad define el valor
esperado E(X) (formalmente conocido como esperanza matemática) de la siguiente forma
X
E(X) = xi p(xi )

para todos los valores de i, donde xi es el pago correspondiente al estado de la naturaleza i


de la alternativa X y p(xi ) es la probabilidad de que ocurra el estado de la naturaleza i.

Ejemplo 2.2 La compañı́a petrolera PEMEX es dueña de unos terrenos en los que puede
haber petróleo. Un geólogo consultor ha informado a la administración que piensa que existe
una posibilidad de 1 entre 4 de encontrar petróleo.
Debido a esta posibilidad, otra compañı́a petrolera ha ofrecido comprar las tierras en
$900, 000. Sin embargo, PEMEX considera conservarlas para perforar ella misma. El cos-
tro de la perforación es de $1 millón de pesos. Si se encuentra petróleo, el ingreso esperado
será de $8 millones de pesos; ası́ la ganancia esperada para PEMEX será de $7 millones
de pesos. Se incurrirá en una pérdida de un millón de pesos (el costo de barrenar) si no se
encuentra petróleo.

Solución. De acuerdo con los criterios de pago máximo, máxima posibilidad y la regla de
decisión de Bayes, las alternativas a elegir quedan como sigue. Las cantidades representadas
en las tablas están en decenas de millar, es decir, se deben de multiplicar por 10000 para
obtener la cantidad real.
Criterio del pago máximo: Este criterio, indica que se debe de elegir la acción de vender
el terreno, ya que es la máxima de las ganancias mı́nimas de cada alternativa. A continuación
se muestra el criterio en la siguiente tabla.

Estado de la naturaleza
Alternativa Petróleo Seco Mı́nimo
1. Perforar en busca de petróleo 700 −100 −100
2. Vender terreno 90 90 90 ← Valor máximo
Probabilidad a priori 0.25 0.75

Criterio de la máxima posibilidad: Se selecciona primero el estado con mayor proba-


bilidad, el cual se refiere a que no se encuentra petróleo con un 0.75 de probabilidad. Ahora

66
2.2. ANÁLISIS DE DECISIONES

evaluando los pagos para cada alternativa en ese estado de la naturaleza, se selecciona la
alternativa con el pago máximo, como se muestra en la siguiente tabla.

Estado de la naturaleza
Alternativa Petróleo Seco
1. Perforar en busca de petróleo 700 −100 −100
2. Vender terreno 90 90 90 ← Valor máximo en esta
columna

Probabilidad a priori 0.25 0.75



Máximo

Regla de decisión de Bayes: Se calcula el pago esperado para cada alternativa, y se


elige la alternativa con mayor pago esperado.

E(Perforar) = 0.25(700) + 0.75(−100)


= 100
E(Vender) = 0.25(90) + 0.75(90)
= 90

Como 100 es mayor, se elige la alternativa de perforar en busca de petróleo, la cuál es


diferente a las elecciones de los otros criterios de decisión.

La gran ventaja de la regla de decisión de Bayes es que incorpora toda la información


disponible (todos los pagos y probabilidades), en contraste con el criterio de pago máximo
que sólo toma en cuenta los pagos y el criterio de máxima posibilidad que sólo toma en
cuenta los pagos del estado de la naturaleza más probable. Sin embargo, estas decisiones
están basadas en la probabilidad, la cual es inexacta y en muchas ocasiones obtenida a partir
de la experiencia, por lo que serı́a útil realizar un análisis de sensibilidad.

Análisis de sensibilidad con la regla de decisión de Bayes


Se realiza un análisis de sensibilidad para conocer el efecto que tendrı́an datos incorrectos
en el modelo matemático que se esta resolviendo. En este caso, las probabilidades son los
datos más cuestionables en este modelo.
Como solamente se tienen dos estados de la naturaleza, es posible evaluar graficamente
lo que sucede cuando varı́an las probabilidades a priori, esto es, si una aumenta, la otra
disminuye. La administración de PEMEX cree que la posibilidad ideal de encontrar petróleo
en el área debe de estar entre 15 % y 35 %. En otras palabras, es posible que la probabilidad a
priori verdadera de encontrar petróleo oscile entre 0.15 y 0.35, de manera que encontrar que
el terreno esté seco tandrá probabilidad a priori entre 0.85 y 0.65.
Sea
p = probabilidad a priori de encontrar petróleo

el pago esperado de perforar para cualquier valor de p es

67
2. TEORÍA DE DECISIONES

E(Perforar) = 700p − 100(1 − p)


= 800p − 100

Este pago esperado de ambas alternativas se muestran como dos rectas en la Fig. 2.4. El
pago esperado de perforar es la recta con pendiente positiva y el pago esperado de vender es
la recta horizontal (debido a que tiene un valor de 90 para ambos estados de la naturaleza).
También se pueden observar cuatro puntos en la Fig. 2.4, los cuales muestran el pago esperado
para las dos alternativas de decisión cuando p = 0.15 o p = 0.35. Cuando p = 0.15 la decisión
se inclina a vender el terreno, ya que se obtiene un pago esperado de 90 contra un pago
esperado de 20 para la alternativa de perforar. Por el contrario, cuando p = 0.35 la decisión
es perforar por un amplio margen (pago esperado de 180 contra sólo 90 de vender). Entonces,
la decisión es muy sensible a la probabilidad a priori de encontrar petróleo.

Figura 2.4: Cambio del pago esperado para cada acción cuando cambia la probabilidad a priori.

En la Fig. 2.4, se observa un punto en el que ambas rectas se intersectan. Este punto es el
punto de cruce y es el que determina el cambio de decisión entre ambas alternativas. Para
encontrar este punto se establece

E(P erf orar) = E(V ender)


800p − 100 = 90
190
p= = 0.2375
800

Ası́, cuando la probabilidad a priori de encontrar petróleo sea mayor a 0.2375 se debe de
perforar y cuando sea menor se debe de vender.

68
2.2. ANÁLISIS DE DECISIONES

2.2.2. Toma de decisiones con experimentación


Una persona que toma decisiones, necesita tener información precisa y confiable para po-
der tomar una decisión que no se vea afectada por la falta de confiabilidad de la información.
Por lo anterior, con frecuencia se realizan pruebas adicionales (experimentación) para mejorar
las estimaciones preliminares de los respectivos estados de la naturaleza dadas por las proba-
bilidades a priori. Estas estimaciones mejoradas se llaman probabilidades a posteriori . A
continuación se retoma el contexto establecido en el ejemplo 2.2 y se le agregan datos para la
experimentación.

Probablidades a posteriori
Para el cálculo de las probabilidades a posteriori, se utiliza el teorema de Bayes y el
teorema de la probabilidad total. Ahora para las variables aleatorias A y B, donde A representa
los resultados obtenidos por la experimentación y B representa los estados de la naturaleza
(probabilidades a priori. Ahora, en términos generales, sea

n =número posible de estados de la naturaleza


P (B = bi ) =probabilidad a priori de que el estado de la naturaleza sea el i,
para i = 1, 2, · · · , n
P (A = aj ) =probabilidad de obtener el resultado j, para j = 1, 2, · · · , m
P (B = bi | A = aj ) =probabilidad a posteriori del estado de la naturaleza i
dado el resultado j de la experimentación, para i = 1, 2, · · · , n
y j = 1, 2, · · · , m
P (A = aj | B = bi ) =probabilidad condicional (obtenida por datos históricos
del resultado de la experimentación j dado el estado de la naturaleza i
de la experimentación, para i = 1, 2, · · · , n y j = 1, 2, · · · , m
P (A, B) =probabilidad conjunta de A y B

Teorema 2.2 (Regla de Bayes [4]) Si los eventos B1 , B2 , · · · , Bk constituyen una parti-
ción del espacio muestral S donde P (Bi ) 6= 0 para i = 1, 2, · · · , k, entonces para cualquier
evento A en S tal que P (A) 6= 0,

P (B = br , A) P (B = br , A)
P (B = br | A) = = k , para r = 1, 2, · · · , k
P (A) X
P (B = bi , A)
i=1

En el teorema 2.2.2, se observa que para obtener las probabilidades a posteriori, es ne-
cesario calcular la distribución de probablidad conjunta de A, B y la probabilidad de A (los
resultados de la experimentación). Los datos que se conocen son las probabilidades a priori
(B) y las probabilidades condicionales P (A|B). Para calcular la probabilidad conjunta, se
utiliza el teorema 2.2.2 y las probabilidades a priori de la siguiente manera.

P (A = ai , B = bj ) = P (A = ai |B = bj )P (B = bj )

69
2. TEORÍA DE DECISIONES

para i = 1, 2, · · · , n, j = 1, 2, · · · , m; esto es, que se tiene que calcular para todas los posibles
valores de las variables aleatorias A y B.
Posteriormente, se calcula la distribución de probabilidad de los resultados de la experi-
mentación o probabilidades incondicionales, P (A), de la siguiente forma
m
X
P (A = ai ) = P (A = ai , B = bj ) (2.4)
j=1

= P (A = ai , B = b1 ) + P (A = ai , B = b2 ) + · · · + P (A = ai , B = bm ) (2.5)
Finalmente se puede utilizar el teorema 2.2.2 para calcular las probabilidades a posteriori,
utilizando la probabilidades incondicionales y la distribución de probabilidad conjunta. A
continuación se muestra un ejemplo en el que se aplican estos resultados.

Ejemplo 2.3 En el ejemplo 2.2 se tienen dos estados de la naturaleza: que el terreno se
encuentre seco o con petróleo, y las estimaciones preliminares de la probabilidad a priori de
cada estado. Ahora se tiene acceso a realizar una exploración sismológica del terreno para
obtener una mejor estimación de la probabilidad de que haya petróleo. El costo de este estudio
es de $300 mil pesos.
Una exploración sismológica obtiene sondeos sı́smicos que indican si la estructura geológica
es favorable para la presencia de petróleo. Los resultados de la exploración sismológica se
dividen en las siguientes categorı́as:

SSD: sondeos sı́smicos desfavorables; es poco probable encontrar petróleo.


SSF: sondeos sı́smicos favorables; es bastante probable encontrar petróleo.

Con base en la experiencia, si hay petróleo, la probabilidad de sondeos sı́smicos favorables


es:
P (SSF |petroleo) =0.6
P (SSD|petroleo) =1 − 0.6 = 0.4
De la misma forma, cuando el terreno se encuentra seco, la probabilidad de sondeos sı́smicos
favorables es:
P (SSF |seco) = 0.2
P (SSD|seco) = 1 − 0.2 = 0.8
Determine las probabilidades incondicionales de los resultados de la exploración sismológica,
las probabilidades a posteriori de los estados de la naturaleza y aplique la regla de decisión de
Bayes para determinar la polı́tica óptima

Solución. Sea A la probablidad de obtener sondeos sı́smicos, entonces la variable aleatoria


toma los siguientes valores A = {SSF, SSD}. En el ejemplo 2.2 se proporcionan los valores de
los estados de la naturaleza B = {petroleo, seco}, y las probabilidades a priori de los mismos,
P (petroleo) = 0.25 y P (seco) = 0.75. A continuación, se muestran los valores de las probabi-
lidades condicionales de obtener un determinado resultado de la exploración sismológica una
vez que se conoce el estado de la naturaleza.

70
2.2. ANÁLISIS DE DECISIONES

P (SSF |petroleo) = 0.6 P (SSF |seco) = 0.2


P (SSD|petroleo) = 0.4 P (SSD|seco) = 0.8

Con los datos anteriores, obtenemos la distribución de probabilidad conjunta,

P (A = SSF, B = petroleo) = P (SSF, petroleo)


= P (SSF |petroleo)P (petroleo)
= (0.6)(0.25) = 0.15
P (SSF, seco) = P (SSF |seco)P (seco)
= (0.2)(0.75) = 0.15
P (SSD, petroleo) = P (SSD|petroleo)P (petroleo)
= (0.4)(0.25) = 0.1
P (SSD, seco) = P (SSD|seco)P (seco)
= (0.8)(0.75) = 0.6

Para comprobar los resultados, verificamos que la suma de todas las probabilidades ante-
riores es 1, esto es sumar la probablidad conjunta para todos los valores de A y B.

2 X
X 2
P (A = ai , B = bj ) =P (SSF, petroleo) + P (SSF, seco)
i=1 j=i

+ P (SSD, petroleo) + P (SSD, seco)


=0.15 + 0.15 + 0.1 + 0.6
=1

A continuación obtenemos los valores de las probabilidades incondicionales utilizando la ecua-


ción 2.5.

P (A = SSF ) = P (SSF, petroleo) + P (SSF, seco)


= 0.15 + 0.15 = 0.30
P (SSD) = P (SSD, petroleo) + P (SSD, seco)
= 0.10 + 0.60 = 0.70

71
2. TEORÍA DE DECISIONES

Finalmente, las probabilidades a posteriori de los estados de la naturaleza quedan como sigue

P (SSF, petroleo)
P (petroleo|SSF ) =
P (SSF )
0.15
= = 0.50
0.3
P (SSF, seco)
P (seco|SSF ) =
P (SSF )
0.15
= = 0.50
0.3
P (SSD, petroleo)
P (petroleo|SSD) =
P (SSD)
0.10
= = 0.1429
0.70
P (SSD, seco)
P (seco|SSD) =
P (SSD)
0.60
= = 0.8571
0.70

Por lo que la probabilidad de encontrar petróleo una vez que se conoce el resultado del estudio
sismológico es 0.5 cuando el sondeo es favorable y 0.1429 cuando el sondeo es desfavorable.
Asimismo, la probabilidad de que el terreno se encuentre seco es 0.5 y 0.8571, cuando el sondeo
es favorable y desfavorable respectivamente.
De acuerdo a los pagos establecidos para la combinación de cada alternativa y estado de
la naturaleza, y las probabilidades a posteriori obtenidas anteriormente, se calcula el pago
esperado para cada alternativa dependiendo del resultado del estudio realizado. A este pago
esperado se resta el costo del estudio.

E(perf orar|SSF ) = P (petroleo|SSF )P ago(perf orar, petroleo) + P (seco|SSF )P ago(perf orar, seco)
= 0.5(7000000) + 0.5(−1000000) − 300000 = 2700000
E(vender|SSF ) = P (petroleo|SSF )P ago(vender, petroleo) + P (seco|SSF )P ago(vender, seco)
= 0.5(900000) + 0.5(900000) − 300000 = 600000
E(perf orar|SSD) = P (petroleo|SSD)P ago(perf orar, petroleo) + P (seco|SSD)P ago(perf orar, seco)
= 0.1429(7000000) + 0.8571(−1000000) − 300000 = -156800
E(vender|SSD) = P (petroleo|SSD)P ago(vender, petroleo) + P (seco|SSD)P ago(vender, seco)
= 0.1429(900000) + 0.8571(900000) − 300000 = 600000

Como el objetivo es maximizar el pago. Se evalúa la polı́tica óptima para cada resultado
del estudio. Entonces, cuando se obtienen sondeos sı́smicos favorables (SSF ), la alternativa
es perforar obteniendo un pago esperado de $2, 700, 000. Cuando se obtienen sondeos sı́smicos
desfavorables (SSD), la alternativa es vender con un pago esperado de $600, 000.

72
2.2. ANÁLISIS DE DECISIONES

En la siguiente sección se estudiará como obtener una cantidad que representa el valor
recomendable para la experimentación, con el fin de conocer si es factible pagar por la expe-
rimentación.

El valor de la experimentación
Antes de realizar cualquier experimento, debe determinarse su valor potencial. Se pre-
sentan aquı́ dos métodos complementarios para evaluar su valor potencial. Estos métodos se
llaman Valor Esperado de la Inforamación Perfecta (V EIP ) y Valor Esperado de la Experi-
mentación (V EE). A continuación, se describe el primero.

Valor esperado de la información perfecta


En este método se supone que la experimentación elimina toda la incertidumbre (algo poco
realista) acerca de cual es el verdadero estado de la naturaleza y después realiza un cálculo
sobre la mejora en el pago esperado, ignorando el costo de la experimentación. El VEIP
establece una cota superior para el valor potencial del experimento, por lo que si el costo del
experimento se encuentra por debajo del VEIP, definitivamente debe llevarse a cabo.
Suponga ahora que el experimento puede identificar de manera definitiva cuál es el verda-
dero estado de la naturaleza y proporcionar con esto información ”perfecta. Cualquiera que
sea el estado de la naturaleza identificado, se eligirá la acción con el máximo pago para ese
estado. Al no saber en realidad, el estado que se identificará, se pondera el pago máximo para
cada estado de la naturaleza con la probabilidad a priori.
El V EIP se calcula como sigue:
V EIP = P EIP − P EsE
donde P EIP es el pago esperado con información perfecta y P EsE es el pago esperado sin
el costo de la experimentación. En la tabla 2.5 se muestra como queda el calculo para el pago
esperado con información perfecta.

Estado de la naturaleza
Alternativa Petróleo Seco
1. Perforar en busca de petróleo 700 −100
2. Vender terreno 90 90
Pago máximo 700 90
Probabilidad a priori 0.25 0.75
P EIP = 0.25(700) + 0.75(90) = 242.5
Figura 2.5: Pago esperado con información perfecta para el problema de PEMEX

Anteriormente se obtuvo el pago esperado sin experimentación, utilizando la refal de de-


cisión de Bayes, con un valor de 100. Por lo tanto,

V EIP = 242.5 − 100 = 142.5


Como $1, 425, 000 excede por mucho a $300000, el costo del sondeo sı́smico, puede valer
la pena proceder con la experimentación. Para confirmar este hecho, se estudiará un segundo
método de evaluación del beneficio potencial de la experimentación.

73
2. TEORÍA DE DECISIONES

Valor esperado de la experimentación


Este cálculo requiere mayor trabajo, debido a que incorpora las probabilidades a posteriori
para obtenerlo. Primero debe obtenerse el pago esperado con experimentación (P EcE) y
sustraerle el pago esperado sin experimentación (P EsE), obteniendo el valor esperado de la
experimentación (V EE).

V EE = P EcE − P EsE (2.6)


]
El cálculo del P EcE requiere realizar lo siguiente:

1. Obtener todas las probabilidades a posteriori.

2. La polı́tica óptima con experimentación.

3. El pago esperado correspondiente a la polı́tica óptima, excluyendo el costo de la experi-


mentación.

4. Ponderar cada pago esperado con la probabilidad del resultado de la experimentación


correspondiente.

n
X
P EcE = P (A = aj )E(AOpt|A = aj )
j=1

donde AOpt es la alternativa óptima para el valor correspondiente de aj (resultado de la


experimentación).
Retomando la información obtenida en el ejemplo 2.3, obtengamos el V EE. De acuerdo al
ejemplo de la compañı́a PEMEX, el pago esperado excluyendo el costo de la experimentación,
para la polı́tica óptima de los resultados se tiene que:

P (SSF ) = 0.3
P (SSD) = 0.7
E(perf orar|SSF ) = 300
E(vender|SSD) = 90

Por lo que,

P EcE = P (SSF )E(perf orar|SSF ) + P (SSD)E(vender|SSD)


= 0.3(300) + 0.7(90) = 153

En este momento se puede calcular el valor esperado de la experimentación. Utilizando la


ecuación 2.6 se tiene que:
V EE = 153 − 100 = 53
Como $530, 000 excede el costo de $300, 000 correspondiente al estudio sismológico, la expe-
rimentación debe de realizarse.

74
2.2. ANÁLISIS DE DECISIONES

2.2.3. Árboles de decisión


Un árbol de decisión es un modelo gráfico, que nos proporciona un medio para tomar una
serie de decisiones, que nos pueden llevar por diferentes caminos debido a la incertidumbre
de los resultados que pueden producir cada decisión tomada. En esta sección se estudiarán
los elementos de un árbol de decisión, la forma de organizar los cálculos estudiados en las
secciones anteriores y la forma de realizar el análisis del árbol que nos indique como se deben
de tomar las decisiones y encontrar una polı́tica óptima.
Heizer [1], propone el siguiente procedimiento para formar un árbol de decisión:

1. Asegúrese de que todas las alternativas y los estados de la naturaleza posibles estén
incluidos en el árbol.

2. Los pagos se introducen al inicio de la rama apropiada y en los nodos hoja (los que
están al final del árbol), se introduce el pago de esa ruta.

3. Las probabilidades se colocan en las ramas de los nodos probabilı́sticos encerradas entre
paréntesis.

4. El objetivo es determinar el pago esperado de cada curso de acción. Lo logramos co-


menzando al final del árbol (el lado derecho) y trabajando hacia el inicio del árbol (la
izquierda), calculando los pagos esperados de cada nodo y “podando” las alternativas
que no son tan buenas como otras que salen del mismo nodo.

Los árboles de decisión están compuestos por dos elementos básicos, nodos y ramas. Los
nodos son los puntos de ramificación del árbol y los arcos que unen dos nodos son las ramas.

Los nodos se clasifican en: nodo de decisión y nodo pro-


babilı́stico. Un nodo de decisión indica que en ese punto del
proceso debe de tomarse una decisión. Un nodo probabilı́stico
indica que en ese punto ocurre un evento aleatorio. En la Fig.
2.6, se puede observar que un nodo de decisión se representa
por un cuadrado y el probabilı́stico por un cı́rculo. Además se Figura 2.6: Tipos de nodos en un
árbol de decisión.
utiliza una letra para identificar al nodo en el árbol, con el ob-
jetivo de que al realizar el análisis se pueda saber a que nodo
corresponden los cálculos realizados.
No existe un método para la construcción de la estructura de un árbol de decisión (el
orden en el que se toman las decisiones, se esperan por resultados y se toman otras decisiones),
sin embargo, por lo general cuando existe experimentación en nuestro problema deberı́a ser
la primera decisión a considerar y dependiendo de los resultados seguirı́an las decisiones
subsecuentes.
Lo que sigue después de que se construye la estrucura del árbol es colocar los pagos
correspondientes de cada decisión y al final de la ruta, el pago correspondiente a esa ruta.
Posteriormente se colocan las probabilidades correspondientes (a priori, de la experimentación
y a posteriori) en cada una de sus ramas y se procede a realizar el análisis del árbol de decisión.

75
2. TEORÍA DE DECISIONES

Realización del análisis

Una vez construido el árbol de decisión con todos sus elementos, se puede analizar el
problema con el siguiente procedimiento:

Procedimiento 2.1 1. Inicie en el lado derecho del árbol de decisión y muévase a la


izquierda una columna a la vez. En cada columna, realice el paso 2 o el 3 según si los
nodos en esa columna son de probabilidad o de decisión.

2. Para cada nodo de probablidad, calcule su pago esperado. Para ello, debe de multiplicar
el pago esperado de cada rama por la probabilidad de esa rama y después sumar todos
los productos obtenidos. Coloque esta cantidad arriba del nodo.

3. En cada nodo de decisión, compare los pagos esperados de sus ramas y seleccione la
alternativa cuya rama tenga el mayor pago esperado. Las alternativas no seleccionadas
se “podan” con una doble raya como barrera.

Ejemplo 2.4 Construya el árbol de decisión del problema de PEMEX (Ej. 2.2 y Ej. 2.3).
Coloque los pagos y las probabilidades donde corresponde en el árbol, realice el análisis del
árbol y determine la polı́tica óptima.

Solución. Lo primero es construir la estructura del árbol, considerando que primero se debe
decidir si realizar o no el sondeo sı́smico, para posteriormente decidir, dependiendo del resul-
tado del sondeo, si perforar o vender el terreno. Observe que en la Fig. 2.7, la primera decisión
a considerar es si hacer o no el sondeo sı́smico. Si se decide hacer el sondeo, dependiendo del
resultado, se decide si se perfora o se vende, al igual que si no se decide hacer el sondeo.

Figura 2.7: Estructura del árbol para el problema de PEMEX

76
2.2. ANÁLISIS DE DECISIONES

Ahora, se colocan los pagos correspondientes en cada rama, y al final de la ruta, la suma
de estos pagos. También se colocan las probabilidades a priori (cuando no se realiza la expe-
rimentación), de los resultados de la experimentación (encerradas en óvalos en la Fig. 2.8) y
las probabilidades a posteriori (encerradas en rectángulos en la Fig. 2.8).

Figura 2.8: Probabilidades de la experimentación y a posteriori

Se realiza el análisis del árbol calculando el pago esperado de cada nodo como se describe
en el procedimiento 2.1. Primero, se calculan los pagos de los nodos g y h.

Nodo g: P E(g) = 0.1429(6700000) + 0.8571(−1300000) = −156800

Nodo h: P E(h) = 0.5(6700000) + 0.5(−1300000) = 2700000

Estos pagos esperados se colocan en abajo a la izquierda del nodo, como se muestra en
la Fig. 2.9. A continuación se hace un movimiento una columna a la izquierda, que consiste
en los nodos d, e y f. El pago esperado de un nodo de decisión se obtiene como el mayor de
los pagos esperados de los nodos inmediatos (si la alternativa no tiene un nodo inmediato, se
toma el pago esperado al final de la rama). Por lo tanto, los pagos esperados de los nodos d,
e y f quedan como sigue.

Nodo d: Como P E(vender) > P E(perf orar), es decir 600000 > −156800, entonces el P E(d) =
600000. Se elige la alternativa de vender.

Nodo e: Como P E(perf orar) > P E(vender), es decir 2700000 > 600000, entonces el P E(e) =
2700000. Se elige la alternativa de perforar.

Nodo f: P E(f ) = 0.25(7000000) + 0.75(−1000000) = 1000000

La alternativa seleccionada en un nodo de decisión se muestra con un grosor de lı́nea mayor


y la(s) alternativa(s) rechazadas se indica(n) con la inserción de una doble raya. Después el
proceso se mueve una columna más a la izquierda para calcular los pagos esperados de los
nodos b y c, quedando como sigue:

77
2. TEORÍA DE DECISIONES

Nodo b: P E(b) = 0.7(600000) + 0.3(2700000) = 1230000


Nodo c: Como P E(perf orar) > P E(vender), es decir 1000000 > 900000, entonces el P E(c) =
1000000. Se elige la alternativa de perforar.
Por último, el proceso se mueve al nodo de la izquierda a, un nodo de decisión. Con la
aplicación del paso 3 del procedimiento se obtiene
Nodo a: Como P E(Con sondeo sı́smico) > P E(Sin sondeo sı́smico), es decir 1230000 > 1000000,
entonces el P E(a) = 1230000. Se elige la alternativa de realizar el sondeo sı́smico.
Al seguir las trayectorias abiertas de izquierda a derecha en la Fig. 2.9 se llega a la siguiente
polı́tica óptima.
Polı́tica óptima: Realizar el sondeo sı́smico. Si el resultado es desfavorable (SSD), vender
el terreno. Si el resultado es favorable (SSF), perforar en busca de petróleo. El pago esperado
(que incluye los costos del sondeo) es de 123000.

TreePlan Student License 0.1429 For Education Only


Petróleo
$6,700,000.00
Perforar $8,000,000.00 $6,700,000.00
g
-$1,000,000.00 -$156,800.00 0.8571
0.7 Seco
SSD -$1,300,000.00
d $0.00 -$1,300,000.00
$0.00 $600,000.00

Vender
$600,000.00
$900,000.00 $600,000.00
Con sondeo sísmico
b 0.5
-$300,000.00 $1,230,000.00 Petróleo
$6,700,000.00
Perforar $8,000,000.00 $6,700,000.00
h
-$1,000,000.00 $2,700,000.00 0.5
0.3 Seco
SSF -$1,300,000.00
e $0.00 -$1,300,000.00
$0.00 $2,700,000.00

a Vender
$1,230,000.00 $600,000.00
$900,000.00 $600,000.00

0.25
Petróleo
$7,000,000.00
Perforar $8,000,000.00 $7,000,000.00
f
-$1,000,000.00 $1,000,000.00 0.75
Seco
Sin sondeo sísmico -$1,000,000.00
c $0.00 -$1,000,000.00
$0.00 $1,000,000.00

Vender
$900,000.00
$900,000.00 $900,000.00

Figura 2.9: Árbol de decisión final del problema de PEMEX

2.3. Cadenas de Markov


El análisis de Markov tuvo su origen en los estudios de Andrei A. Markov (1856 - 1922)
sobre la secuencia de los experimentos conectados en cadena, y en los intentos de describir

78
2.3. CADENAS DE MARKOV

matemáticamente los fenómonos fı́sicos conocidos como movimiento browniano. La primera


construccción matemática correcta de un proceso de Markov con trayectorias continuas se
debe a N. Winier en 1923. La teorı́a general de los procesos de Markov se desarrollaron en las
décadas de 1930 y 1940 por A. N. Kolmagoron, W. Feller, W. Doeblin, P. Levy, J. L. Doob
y otros.
El análisis de Markov es una forma de analizar el moviemiento actual de alguna variable,
a fin de pronosticar el movimiento futuro de la misma. Ese método ha comenzado a usarse
como instrumento de investigación de mercadotecnia, para investigar el comportamiento y
lealtad de los clientes.

2.3.1. Procesos estocásticos


Considere un sistema que puede caracterizarse por estar en cualquiera de un conjunto de
estados previamente especificado. Suponga que el sistema evoluciona o cambia de un estado
a otro a lo largo del tiempo de acuerdo con cierta ley de movimiento, sea Xt el estado del
sistema al tiempo t. Si se considera que la forma del sistema es provocado por algún mecanismo
azaroso, entonces X(t) = Xt es una variable aleatoria para cada valor del ı́ndice t. Esta
colección de variables aleatorias es la definición de un porceso estocástico y sirve como modelo
para representar la evolución aleatoria de un sistema a lo largo del tiempo.

Definición 2.1 Un proceso estocástico es una colección de variables aleatorias {Xt | t ∈ T }


parametrizado por un conjunto T , llamado espacio parametral, en donde las variables toman
valores en un conjunto S llamado espacio de estados.

Para cada instate t tendremos una variable aleatoria distinta representada por Xt , con
lo que un proceso estocástico puede interpretarse como una sucesión de variables aleatorias
cuyas caracterı́sticas pueden variar a lo largo del tiempo.
Si observamos unos valores de t tendrı́amos una imagen similar a la siguiente:

en la imagen se representa que para cada t la función de densidad correspondiente a Xt .


Aunque se presentan funciones de densidad diferentes para cada t, un proceso estocástico
no tiene porque presentar diferencias en la función de denisad de probabilidad a lo largo del
tiempo.
A los posibles valores que puede tomar una variable aleatoria se le denomina estados, por
lo que puede tener un espacio de estados discreto o es espacio de estados continuos.

79
2. TEORÍA DE DECISIONES

Dependiendo de como sea el conjunto de sunı́ndices T y el tipo de variables aleatorias


dado por Xt se puede establecer la siguiente clasificación de los procesos estocásticos.

t discreta t continua
X discreta Proceso de estado discreto y tiem- Proceso de estado discreto y tiem-
po discreto (Cadena) (Unidades po continuo (proceso de saltos pu-
producidas mensualmente de un ros)(Unidades producidas al tiem-
producto) po t)
X continua Proceso de estado continuo y tiem- Proceso de estados continuo y
po discreto (Toneladas de produc- tiempo continuo (Proceso conti-
ción diaria de un producto) nuo)(Velocidad de un vehı́culo al
instante t)

2.3.2. Procesos de estados discreto


En el caso de procesos estocásticos con espacios de estados discretos, una sucesión de va-
riables que indique el valor del proceso en instantes sucesivas suele representase de la siguiente
manera:

{X0 = x0 , X1 = x1 , . . . , Xn−1 = xn−1 , Xn = xn }


en la que cada varaible Xi , i = 0, . . . .n tiene una distribución de probabilidad que, en general,
es distinta de las otras variables aunque podrı́a tener caracterı́sticas comunes.

2.3.3. Cadenas de Markov


Cadenas de Markov

2.3.4. Ecuaciones de Chapman-Kolmogorov


Las potencias

2.3.5. Propiedades a largo plazo de las cadenas de Markov


las

80
Bibliografı́a

[1] J. Heizer and B. Render. Principios de Administración de Operaciones. Pearson, 7a


edition, 2009.

[2] F. Hillier. Introduction To Operations Research. McGraw-Hill Education (India) Pvt


Limited, 2012.

[3] H. A. Taha. Operations Research: An Introduction (8th Edition). Prentice-Hall, Inc.,


Upper Saddle River, NJ, USA, 2006.

[4] R. Walpole, R. Myers, and S. Myers. Probabilidad y estadı́stica para ingenieros. Pearson:
Educación. Pearson Educación, 1999.

[5] W. Winston. Investigación de operaciones: aplicaciones y algoritmos. Thomson, 2005.

81

Você também pode gostar