Você está na página 1de 21

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL

DEPARTAMENTO DE ECOMOMIA

Texto Didático n°06

TOMADA DE DECISÕES SOB


CONDIÇÕES DE CERTEZA,
RISCO E INCERTEZA

Junho 1995

Arthur Thompson Jr.


TOMADA DE DECISÕES SOB CONDIÇÕES DE CERTEZA, RISCO E INCERTEZA1

O processo de tomada de decisão constitui a parte central de qualquer tipo de atividade


econômica. Problemas de escolha são comuns em todas as fases da economia - que quantidade de tais
produtos produzir, que preço cobrar, o que comprar, de quem comprar, etc. É apropriado, portanto, levar em
consideração o conjunto de conhecimentos denominado teoria da decisão para que se aprenda mais a respeito
do processo de tomada de decisão e das condições sob as quais as decisões são tomadas. Nesse capítulo,
vamos apresentar uma seleção de tópicos - chave da teoria da decisão que estão diretamente ligados ao
comportamento do consumidor e dos negócios. Mostraremos como e porquê a estrutura da teoria da decisão
permite o desenvolvimento de conceitos e a explicação de padrões de comportamento que têm sido
desprezados por muito tempo no tratamento convencional da microeconomia. Este capítulo tem por objetivo
proporcionar ao leitor a capacidade de sentir a incerteza que confronta os administradores de firmas de
negócios e a deferência em relação às dificuldades que ele encontra ao tentar melhorar a qualidade de suas
decisões.
Apesar de nos determos no processo decisório dentro de um contexto de uma firma, os
conceitos e princípios fundamentais apresentados são igualmente aplicáveis à tomada de decisão por parte de
consumidores, instituições filantrópicas, órgãos governamentais, ou qualquer outra organização. A tomada de
decisão não é, de forma alguma, restrita a empresas. Todo comportamento envolve, consciente ou
inconscientemente, a seleção de determinadas atitudes escolhidas dentre as muitas que se encontram à
disposição do indivíduo e sobre as quais ele exerce influência e autoridade.

A NATUREZA DOS PROBLEMAS DECISÓRIOS

Um problema decisório só existe quando o responsável pela tomada de decisão pode escolher entre dois ou
mais planos de ação alternativos. Quando há somente um plano de ação, não pode haver problema decisório.
Além do mais, para que o problema decisório seja significativo, as ações alternativas devem ser distintas e
separadas, não só no sentido em que representam escolhas diferentes, mas também no sentido em que
implicam diferentes resultados; senão, a escolha de alternativas pode representar muito pouco para a tomada
de decisão.
Se as alternativas são avaliadas racionalmente, alguns meios devem ser concebidos para que se possa
classificar a desejabilidade relativa dos resultados esperados de acordo com as preferências do tomador de
decisão. Geralmente esse aspecto é D mais difícil dos problemas decisórios. Há muitos critérios, alguns
objetivos e outros subjetivos. Quando as escolhas envolvem variáveis quantificáveis como custo, vendas,
níveis de produção, ou lucros, a seleção de uma medida classificatória não é tão onerosa. Nesse caso, um
padrão classificatório cardinal, pelo qual valores numéricos são atribuídos aos resultados, é usualmente
factível, e a decisão depende da identificação do plano de ação que possui o valor numérico mais favorável.
Suponha, por exemplo, que o tomador de decisão tenha que escolher uma máquina (de um total de três) para
comprar. Como as máquinas têm o mesmo preço e mesma expectativa de duração, pode-se muito bem basear
a decisão da compra na economia do custo operacional. Se os custos operacionais estimados da máquina A
são de $150 por semana, da máquina B, $175, e da máquina C, $135, então, obviamente, a máquina C deve
ser escolhida. Poderíamos dizer, também, que preferimos a máquina C à sua concorrente mais forte, a A,
devido à quantia de $15 por semana de expectativa de duração e uso. Portanto, uma classificação cardinal
permite uma ordenação de alternativas baseadas em valores numéricos, e o tomador de decisão pode
facilmente detectar a quantia pela qual uma alternativa é preferível à outra.
Em outros casos, não hà medidas disponíveis para avaliar objetivamente os resultados de planos
de ação distintos. Então, uma classificação ordinal, que usa critérios subjetivos, deve ser empregada. Suponha
que o problema decisório envolva a seleção de uma combinação de cores a ser usada nas caixas do sabão em
pó Sparkles. As combinações disponíveis são: a) laranja e branco; b) azul e verde; c) vermelho e amarelo. O
tomador de decisão pode chegar a uma classificação dessas três combinações de cor utilizando algum padrão
subjetivo de preferência, mas ele teria dificuldade para explicar quanto, em termos quantitativos, ele preferiu
uma combinação de cores à outra. Num padrão de preferência ordinal, portanto, só é possível organizar as
alternativas em ordem de preferência; não existem meios de comparar a quantia pela qual uma alternativa é
superior a outra.

1
Esta tradução foi feita por Edson Mello e revisada por Ana Tereza de Lima. Também trabalharam para que essa versão fosse possível
Márcia Saraiva Cidade e Clàudia Pano Silveira.
Se as classificações cardinais ou ordinais são usadas, é crucial que o padrão de preferência do
tomador de decisão satisfaça a condição de transitividade. As preferências de um tomador de decisão são
transitivas quando ele prefere A a B nos pares (A,B) e B a C nos pares (B,C), e então prefere A a C nos pares
(A,C). Sobre essa base se fundamenta toda a teoria da decisão; sem que essa condição seja cumprida, pouco
pode ser dito a respeito do processo de tomada de decisões.

OS CONCEITOS DE CERTEZA, RISCO E INCERTEZA

O produto das decisões modernas de negócios é uma função da quantidade de informações de


que os administradores dispõem sobre planos de ação e os possíveis resultados que podem decorrer deles. A
informação de um tomador de decisão pode variar numa linha que vai do conhecimento perfeito até a
ignorância completa. Por conveniência analítica, pode-se afirmar que essa linha é formada de três panes
dis tintas:
1) certeza; 2) fisco; e 3) incerteza.
1. A certeza é um estado de conhecimento em que o tomador de decisão tem informações completas sobre o
problema decisório com o qual se defronta. Cada alternativa à sua disposição é conhecida, bem como o
resultado específico de cada uma delas. Prevalece, então, o conhecimento perfeito.
2. risco é um estado de conhecimento onde o tomador de decisão está consciente dos planos de ação, mas
não tem certeza a respeito dos seus possíveis resultados. A característica distintiva do fisco é que a
probabilidade de cada resultado é conhecida ou pode ser estimada. Há dois tipos de fisco:
?? . O risco objetivo existe quando a probabilidade & que um determinado resultado aconteça possa ser
computada objetivamente, seja a partir de dados históricos ou a priori.
?? . O risco subjetivo existe quando a probabilidade & que um determinado resultado aconteça é
estimada de modo subjetivo, talvez por uma "forte" intuição baseada na experiência e familiaridade
com a situação - em outras palavras, o tomador & decisão acredita piamente que tem um "insight"
especial a respeito da probabilidade de cada resultado.
3. A incerteza é um estado de conhecimento onde o tomador de decisão não está consciente a respeito da
totalidade dos planos & ação. Além disso, ele não é capaz de formular (objetiva ou subjetivamente)
probabilidades confiáveis sobre os resultados de cada plano de ação. A informação é incompleta demais
para permitir que ele identifique cada alternativa e faça estimativas acerca dos resultados prováveis sobre
os quais se possa colocar um alto grau de confiabilidade. Dados históricos podem ser raros ou
inexistentes, as experiências diante de algumas situações podem ser poucas, ou a estrutura das variáveis
pode não ser suficientemente estável a ponto de permitir a previsão ou estimativa das probabilidades.

Fig. 2-1 A linha do conhecimento

Portanto, a incerteza descreve uma situação em que não há base substancial para que se espere
um resultado em detrimento de outro, dentro do universo de resultados possíveis.

A partir do que foi descrito, a incerteza pode ser definida como um caso especial de risco em
que as probabilidades de resultados potenciais são ou 1 ou 0. Por outro lado, pode-se dizer que o fisco é uma
"incerteza mensurável". A fig. 2-1 fornece uma ilustração bastante útil dos estados de conhecimento e a
relação destes com os conceitos de certeza, risco e incerteza. Nas extremidades da linha de conhecimento
mostrada na fig. 2-1 estão os estados de conhecimento completo e de ignorância completa. O estado de
conhecimento completo coincide exatamente com o que foi definido como certeza. A partir do momento que
o conhecimento completo ou a certeza não estão presentes num problema decisório, deve existir algum grau
de incerteza. Quando o grau de incerteza é pequeno, de forma a permitir que as probabilidades dos possíveis
resultados possam ser conhecidas ou estimadas com estreita margem de erro, o estado de conhecimento é
chamado de risco objetivo. Quando o grau de incerteza é um pouco maior, e as probabilidades dos resultados
são menos precisas, implicando um grau de subjetividade mais alto, o estado de conhecimento é denominado
de fisco subjetivo. O fisco objetivo está, portanto, mais próximo da certeza do que o fisco subjetivo, conforme
o indicado na fig. 2-1. À esquerda do fisco subjetivo há uma larga faixa de incerteza, que aumenta à medida
que caminha para a esquerda, rumo à ignorância total.
Depois de apresentar os conceitos de certeza; risco e incerteza, vamos examinar alguns
problemas decisórios que ilustrem esses três estados de conhecimento.

PROBLEMAS DECISÓRIOS ENVOLVENDO A CERTEZA

A tomada de decisão sob certeza - um fenômeno que só se encontra raramente - compreende


um número surpreendente de problemas práticos. Nos negócios e na economia, há muitas situações em que se
conhece as alternativas e o problema é otimizar alguns índices como lucro, vendas e custos - maximizando,
por exemplo, os lucros nos níveis de preço e a produção de um dado conhecimento da demanda e funções do
custo, e determinando a taxa de produção que minimiza os custos por unidade. Muitos problemas de
programação linear lidam com como alocar melhor os recursos escassos (como mão-de-obra, materiais e
equipamentos) frente a um conjunto de pressões conhecidas. Portanto, a tomada de decisão sob condições de
certeza descreve problemas onde a decisão requer que se determine o curso ideal ou ótimo de ação, dado um
conjunto conhecido de circunstâncias e informações.

PROBLEMAS DECISÓRIOS ENVOLVENDO RISCO

O fisco é um estado de conhecimento em que cada alternativa possui um conjunto de resultados


e cada resultado ocorre com uma probabilidade bem definida. Duas abordagens podem ser usadas ao se
determinar a probabilidade de um resultado: 1) a dedução lógica ou o raciocínio a priori e 2) a medição
empírica ou o método a posteriori.
No método a priori, a probabilidade de um evento é deduzida das características inerentes do
mesmo. Portanto não é necessário jogar cara ou coroa com uma moeda para descobrir que a seqüência de
vezes que o resultado será cara ou coroa será de aproximadamente 1/2. Nem é preciso tirar uma carta de um
baralho de 52 cartas muitas vezes para concluir que a probabilidade de tirar um às de espada (ou qualquer
outra carta) é de 1/52.
Num método a posteriori, a confiabilidade para a obtenção da medida de probabilidade é
colocada nos resultados de experiências anteriores. Esse procedimento presume que os desempenhos passados
são típicos e tendem a continuar no futuro; tal procedimento requer, também, que o número de experiências
anteriores seja grande o suficiente para mostrar padrões estáveis e mudanças que possam ser previstas com
acuidade. As companhias de seguro, por exemplo, dependem fortemente da medição empírica das
probabilidades de mortes, danos causados por incêndios, doenças, acidentes e assim por diante, pois é em
cima dessas probabilidades que são tomadas decisões a respeito do valor dos prêmios. Apesar de não poderem
prever se, durante um determinado ano, um indivíduo morrerá ou uma casa será danificada por catástrofes
naturais, as seguradoras podem prever, com pequena margem de erro, quantas pessoas morrerão, sofrerão
acidentes ou serão hospitalizadas, ou quantas casas terão danos causados por fogo durante aquele ano.
Unidades econômicas únicas não experenciam esse tipo de evento com freqüência suficiente para prever esse
tipo de perda para si próprias. Então, elas planejam evitar esse risco objetivo passando o fardo desse risco
para companhias de seguro que, por sua vez, fazem uma análise cuidadosa das probabilidades e as usam para
estabelecer uma taxa razoável para assumir os prejuízos potenciais. Em alguns casos, uma companhia decidirá
fazer um seguro contra o fisco objetivo porque a incidência de um evento dentro da firma é suficiente para
permitir que haja uma previsão com estreita margem de erro. Bancos e companhias que fazem empréstimos
esperam uma certa porcentagem de "calotes" no crédito que dão; restaurantes presumem que parte da comida
não vendida se estragará; firmas manufatureiras sabem que haverá um prejuízo "normal" na produção devido
a faltas de empregados. Tipicamente, os custos do "auto-seguro" são planejados para tratar as perdas
esperadas como um custo normal de se fazer negócios.
A discussão acima pertence primariamente ao fisco objetivo, uma vez que as probabilidades são
calculadas pelo raciocínio dedutivo ou pela medição empírica. Pouca subjetividade é envolvida.
Analiticamente, a tomada de decisão sob fisco subjetivo é semelhante à tomada de decisão sob incerteza;
então, os dois tipos serão tratados conjuntamente nas seções seguintes, relativas à incerteza.

PROBLEMAS DECISÓRIOS ENVOLVENDO INCERTEZA

A incerteza e o fisco subjetivo caracterizam o ambiente no qual a maioria das decisões são
tomadas. Se o futuro fosse inteiramente previsível, as decisões nos negócios seriam relativamente triviais; a
administração só precisaria planejar os eventos à sua frente e executar esses planos. O risco objetivo constitui
apenas uma pequena parcela do processo de tomada de decisão e pode ser prontamente resolvido pelo "auto-
segro" ou pela compra de apólices de seguro. A vasta maioria das decisões é tomada num estado de
conhecimento incompleto, onde a gama de alternativas é identificada com imperfeição, os resultados
associados às alternativas percebidas não são bem conhecidos, e as probabilidades dos resultados são, na
melhor das hipóteses, determinadas subjetivamente.
Muitas situações de incerteza e fisco subjetivo surgem porque as decisões de negócios são
tomadas em situações únicas - investimentos numa nova fábrica, adoção de uma nova estratégia de marketing,
seleção de um novo órgão financiador - onde a informação é necessariamente incompleta e o futuro incerto. A
administração não tem condições de prever com exatidão os resultados de suas decisões devido a fatos
desconhecidos como (1) mudanças na tecnologia, (2) modificações dos gostos e preferências do consumidor,
(3) entrada numa nova competição, (4) incertezas políticas relativas a uma nova legislação, continuidade de
tarifas e quotas de importação, e contratos do governo, (5) impactos de controles federais fiscais e monetários,
(6) mudanças nas taxas de produtividade, e (7) flutuações nos preços de matéria-prima, salários,
disponibilidade de mão-de-obra, etc - todos eles fora do controle d a firma.
Os responsáveis pela tomada de decisões devem tentar lidar com a incerteza, uma vez que ela
não pode ser incorporada no custo estrutural da firma como um risco objetivo. Portanto, o processo de tomada
de decisões quando o nível de conhecimento está abaixo do fisco objetivo é muito relevante. Como pode o
responsável pelas decisões chegar a decisões racionais em tal ambiente? Que critérios ele pode utilizar para
guiar sua escolha de um plano de ação? Existe uma variedade de maneiras de lidar com o conhecimento
imperfeito, conforme veremos a seguir.

A MATRIZ DE PAGAMENTO

A teoria da(s) decisão(ões) emprega um dispositivo conhecido como matriz de pagamento para
tabular as informações-chave que o responsável pela tomada de decisões tem à sua disposição. Essa matriz
consiste de um conjunto de números dispostos em linhas e colunas. As linhas representam os planos de ação
("estratégias" ) disponíveis para seleção pelo tomador de decisões, enquanto as colunas representam diferentes
conjuntos de condições conjunturais (de ambiente) ou "estados de natureza" sobre os quais o tomador de
decisões não tem controle. Então, as colunas de matriz refletem o fato de que o resultado de um determinado
plano e ação é parcialmente determinado por forças além do alcance do tomador de decisões. Para cada plano
de ação e estado de natureza há um resultado único ou, falando-se em termos de números, um "pagamento".
Esses pagamentos constituem os números nas células da matriz.
A vantagem de usar uma matriz de pagamento, advém da maneira eficiente como ela enfoca as
variáveis de decisões importantes e reduz o problema decisório a dimensões administráveis. A fig. 2-2
descreve um problema decisório envolvendo três planos de ação e quatro estados de natureza. Nessa matriz,
os S são estratégias alternativas (ou planos de ação); os N são estados de natureza; e os números são os
pagamentos esperados (objetiva ou subjetivamente medidos) em dólares. Para dar um significado completo à
matriz, as três estratégias poderiam representar diferentes quantias de dinheiro a serem gastas num novo
produto, e os estados de natureza seriam diferentes níveis de aceitação dos consumidores destes produtos, c os
pagamentos denotariam os lucros semanais obtidos com a venda do novo produto. Se o tomador de decisões
escolher a estratégia SI e o estado de natureza N3 for realmente encontrado, então o resultado é um
pagamento de $64 por semana. Se fosse escolhida a estratégia S3, e o estado de natureza correspondente fosse
Nl. o resultado seria um pagamento semanal de $22.
N1 N2 N3 N4
S1 $16 $28 $64 $32
S2 $70 $42 $12 $9
S3 $22 $52 $25 $58

Legenda: N- estados de natureza:


S - estratégias alternativas

Fig. 2-2: Um exemplo de uma matriz de pagamento

Repare que a forma da matriz de pagamento permite o reconhecimento e a identificação


imediata dos estados de conhecimento que prevalecem - certeza, risco objetivo, risco subjetivo e incerteza.
Quando o estado de conhecimento característico de um problema decisório é o da certeza, há apenas um
estado de natureza passível de ocorrer com a probabilidade de 1. Nesses casos, a matriz terá apenas uma
coluna e o problema decisório se restringirá à decisão da estratégia que oferecer o pagamento mais favorável.
Quando houver mais do que um estado de natureza possível e as probabilidades de cada um deles puder ser
objetivamente mensurada, trata-se de um problema decisório sob risco objetivo. Se pudermos atribuir uma
probabilidade subjetivamente determinada a cada um dos estados de natureza possíveis, trata-se de um
problema decisório sob condições de risco subjetivo. Caso não for possível atribuir possibilidades aos estados
de natureza, o problema é de tomada de decisão sob incerteza.

ALGUMAS REGRAS DECISÓRIAS PROPOSTAS

Veja a matriz abaixo, onde as três estratégias mostram várias políticas de preços sendo
estudadas para adoção numa firma. Os três estados de natureza representam reações de firmas rivais, níveis de
demanda de consumo, políticas e atitudes governamentais, etc., tudo combinado em diferentes níveis para
representar as circunstâncias conjunturais contrastantes com as quais a firma poderia se deparar. Os
pagamentos em dólar representam as estimativas de lucro ou prejuízo diário da firma. A análise da matriz não
revela uma escolha clara da es tratégia; portanto, o problema decisório, definitivamente, existe.

N1 N2 N3
S1 $45 $6 $30
S2 $66 -$21 $90
S3 -$12 $120 $24

Legenda: N- estados de natureza;


S - estratégias alternativas

Fig. 2-3: Selecionando a "melhor" alternativa

Inúmeros critérios têm sido propostos como possíveis orientações para a escolha de uma
estratégia num ambiente de informação limitada. Entre esses estão: (1) o critério maxi-mínimo, (2) o critério
maxi-máximo, (3) o critério de arrependimento mini-máximo, (4) o critério de probabilidade máxima, e (5) o
critério de valor estimado.

CRITÉRIO MAXI-MÍNIMO

De acordo com a regra decisória maxi-mínima, a melhor estratégia é aquela que tem o maior
pagamento mínimo. Em outras palavras; para cada estratégia o tomador de decisões determina o pagamento
mínimo (menos favorável) e escolhe a estratégia que contém o melhor dos pagamentos mínimos. Então, na
matriz da figura 2-3, o pagamento mínimo de S1 é um lucro de $6; o pagamento mínimo de S2 é -$22; e o de
S3 é -$12. O máximo dos pagamentos mínimos é $6, portanto, o critério maxi-mínimo deste caso exigiria a
seleção da estratégia S1.
O critério maxi -mínimo pode ser igualmente bem empregado em problemas decisórios que
procuram minimizar o valor do pagamento em vez de maximizá -lo. Por exemplo, para achar uma estratégia
otimizada do ponto de vista do custo, os valores máximos do custo associados com cada estratégia deveriam
ser identificados e a estratégia selecionada deveria ser a que contém o valor máximo mais baixo. Nesse caso,
o critério maxi-mínimo é, na verdade, um critério mini-máximo, pois em vez de selecionar o maior dos
valores mínimos, nós baseamos nossa escolha na estratégia que contém o menor dos valores máximos.
O critério maxi -mínimo é uma regra decisória "pessimista", uma vez que o responsável pela
tomada de decisões tenta se proteger do pior estado de natureza, selecionando a alternativa com pagamento
mínimo mais elevado. Ele faz uma barreira contra pagamentos baixos, procurando somente o melhor dos
piores resultados. Claramente, essa é uma regra decisória muito conservadora, pois, ao fazer sua escolha, o
remador de decisões desconsidera totalmente os valores dos outros pagamentos. A falta de sabedoria desse
procedimento de escolha é facilmente demonstrável pela matriz da figura 2-4 (que foi feita de maneira a fazer
o critério maxi-mínimo parecer ruim). Aqui, o critério maxi-mínimo pede a seleção da estratégia S1 porque o
menor pagamento ($5) é maior que o maior pagamento ($4) de S2. Um conservador racional poderia preferir
S2, uma vez de S2 oferece uma barreira atraente contra a possibilidade de que nem Nl nem N3 ocorram. Se
Nl ocorrer, a escolha de S2 sobre SI envolve um prejuízo de apenas SI ; se N3 ocorrer, a escolha de S2
acarreta um prejuízo de apenas $5; mas se N2 ocorrer, há um ganho potencial de $80 na seleção de S2 sobre
SI- Muitos tomadores de decisão conservadores estariam dispostos a aceitar as chances de pequenos prejuízos
em troca do prospecto de uma oportunidade de ganho tão grande.

N1 N2 N3
S1 $5 $10 $100
S2 $4 $90 $95

Legenda: N- estados de natureza;


S - estratégias alternativas
Fig. 2-4: Matriz ilustrando a fraqueza do critério maxi-mínimo

Uma segunda falha, um tanto óbvia, da regra maxi -mínima é sua impossibilidade de considerar
a probabilidade de ocorrência dos respectivos estados de natureza. O conhecimento de tais probabilidades
pode ser um fator crítico. Volte à matriz da figura 2-4. Se é sabido que a probabilidade de ocorrência de Nl é
0, 10 (1 em 10), a probabilidade de N2 é 0.60 (6 em 10), e a de N3 é 0.30 (3 em 10) então é muito pouco
racional basear a decisão toda no fato de que o menor pagamento de SI ($5) é maior que o menor pagamento
de 52 ($4), quando ambos os valores estão associados a um estado natureza (Nl) que não é muito provável de
ocorrer. Portanto, o uso cego da regra de maxi -mínima pode, às vezes, causar o que poderia ser considerado
uma escolha irracional de alternativas.
Apesar de sua falha em levar em conta todos os valores de pagamento, e de sua falta de
provisão para incorporar as probabilidades dos estados de natureza, o critério maxi-mínimo não pode ser
totalmente descartado. Há muito a ser falado a respeito da cuidadosa precaução contra conseqüências
adversas. Quando o responsável pela tomada de decisão sente ou tem razões para acreditar que o pior pode
acontecer, a regra maxi -mínima é bastante atraente - particularmente quando as circunstâncias financeiras da
firma são sérias a ponto de sua sobrevivência ser ameaçada em caso de prejuízos significativos (ou mesmo
prejuízos insignificantes). Portanto a estratégia maxi -mínima é especialmente atraente quando o tomador de
decisões se depara com um agressivo concorrente (como uma firma rival) cujos interesses estão em conflitos
diretos com os seus.

CRITÉRIO MAXI-MÁXIMO

Enquanto a regra maxi-mínima é orientada pelo pessimismo c conservadorismo, o critério


maxi-máximo é direcionado ao otimismo e à habilidade de se aventurar. Esse critério pede que o responsável
pela tomada de decisão eleja a estratégia que oferece o maior pagamento possível. Na matriz da figura 2-3, o
tomador de decisões nota que S1 tem um pagamento máximo de $45; S2 de $90; S3 de $120. Uma vez que
$120 é o máximo dos pagamentos máximos, a estratégia S3 deveria ser a escolhida.
Tal regra decisória é bem adequada ao temp eramento de um otimista incurável ou um
impulsivo apostador, ávido por recuperar suas perdas a curto prazo. Este critério está sujeito às mesmas falhas
da regra maxi-mínima: 1) ignora todos os valores da matriz que não sejam os mais elevados, sem pesar
quaisquer perigos que possam caracterizar a estratégia com o mais elevado dos valores máximos; 2) pode
sugerir que o tomador de decisões abandone todas as vantagens presentes em outras estratégias por um ganho
insignificante, no caso de acontecer o resultado mais favorável de todos; e 3) esse critério não considera a
probabilidade de ocorrência dos possíveis estados de natureza. Mais uma vez, essas falhas estão bem visíveis
na matriz mostrada na figura 2-4. Nela, a estratégia maxi-máxima é SI, pois seu maior pagamento ($100)
supera o pagamento máximo de $95 oferecido em S2. Mas suponha, então, que as perspectivas para a
ocorrência real do estado de natureza N3 sejam escassas; nesse caso, os pagamentos para Nl e N2 assumem
uma maior importância. Uma comparação entre os pagamentos para SI e S2 sob os estados de natureza Nl e
N2 indicam uma preferência por S2 em vez de SI. Portanto os valores dos pagamentos oferecidos por S2,
tomados conjuntamente com as probabilidades dos estados de natureza, podem muito bem toma-la (S2) mais
atraente do que SI (a escolha maxi-máxima), pelo menos para alguns tomadores de decisão.

CRITÉRIO DE ARREPENDIMENTO

Essa regra decisória tem o propósito de proteger o tomador de decisão contra o arrependimento
excessivo em relação a uma decisão mal tomada. Com esse intuito, o critério de arrependimento mini-máximo
sustenta que a melhor estratégia é aquela que contém o menor dos arrependimentos máximos. O
arrependimento é medido pela diferença entre o pagamento obtido e o pagamento que poderia ter sido obtido
se o tomador de decisão tivesse tido um conhecimento prévio do estado de natureza. Como todos os
pagamentos para cada estado de natureza tendem a ser menos que satisfatórios, o tomador de decisão irá
arrepender-se se esses pagamentos (a exceção do mais favorável) se materializarem. Consequentemente há
um único arrependimento associado a cada resultado, e isso pode ser tabulado numa matriz denominada
matriz de arrependimento.
Suponha que elaboremos uma matriz de arrependimento a partir da matriz de pagamento da
figura 2-3. Se a estratégia Sl for escolhida e o estado de natureza Nl ocorrer, o pagamento será de $45.
Contudo, se o tomador de decisão tivesse sabido que Nl ocorreria, ele teria selecionado S2 e recebido $66;
então ele tem um arrependimento de -$21 por ter escolhido Sl, pois o pagamento escolhido ($45) é de $21 a
menos do que ele poderia ter recebido ($66) se soubesse que o estado de natureza seda Nl. O valor -$21 é
colocado na linha 1 da coluna da coluna 1 da matriz de arrependimento mostrada na figura 2-5. Para continuar
o cálculo, suponha que S2 fosse selecionada quando Nl ocorreu. Nesse caso não hà arrependimento, pois o
pagamento de $66 é o maior a ser obtido sob Nl; um zero é escrito na linha 2 da coluna 1 da matriz. Se 53
tivesse sido escolhida quando Nl ocorreu, o pagamento seria -$12; então, o arrependimento seda de -$78. O
resto da matriz de arrependimento pode ser obtida da mesma maneira, conforme o leitor pode verificar.
Repare que a matriz de arrependimento contém somente números negativos a zero em cada coluna, sendo que
cada um desses zeros corresponde ao elemento da matriz de pagamento que contém o maior pagamento para
cada estado de natureza.

N1 N2 N3
S1 -$21 -$114 -$60
S2 0 -$141 0
S3 -$78 0 -$66

Legenda: N estados de natureza;


S - estratégias alternativas

Fig. 2-5: Matriz de arrependimento

O tomador de decisão pode, agora, aplicar uma regra mini-máxima à informação da matriz de
arrependimento. O valor máximo de arrependimento para cada estratégia é identificado e a estratégia
escolhida é aquela que contém o menor dos valores máximos. Na figura 2-5, os valores máximos de
arrependimento são: -$l14 para SI, -$141 para S2 e -$78 para S3. A estratégia 53 constitui então, o plano de
ação recomendado pelo critério de arrependimento mini-máximo, pois está associada ao melhor dos piores
arrependimentos (-$78).
Assim como a regra maxi-mínima, o critério de arrependimento máximo utiliza somente uma
pequena parcela da informação dos pagamentos. Apenas o maior valor de arrependimento de uma estratégia é
considerado; valores baixos e intermediários de arrependimento são desconsiderados. Se, por exemplo, a
estratégia um tem um valor máximo de arrependimento que é levemente melhor do que o valor máximo de
arrependimento da estratégia dois, o critério de arrependimento mini-máximo escolherá a estratégia um,
mesmo que todos os outros pagamentos na estratégia dois sejam muito mais favoráveis que os da estratégia
um. É desnecessário observar que essa característica pode ser vista de modo desfavorável por muitos
tomadores de decisão. Em segundo lugar, as probabilidades dos estados de natureza, caso sejam conhecidas
ou bem estimadas, são completamente desconsideradas no processo decisório, o que configura um
procedimento questionável. Por fim, não fica claro se a diferença entre dois pagamentos é, necessariamente,
uma medida exata do arrependimento do tomador de decisões, quando ele obtém o menor dos dois -
especialmente quando o arrependimento é composto da diferença entre um grande lucro e um pequeno lucro.
O prejuízo pode significar falência e, por conseguinte, um arrependimento mais do que proporcional à
diferença em dólares. Mesmo assim, a medida do arrependimento, conquanto rudimentar e um tanto
arbitrária, pode não ser uma medida totalmente irracional do arrependimento do tomador de decisão ao ter
escolhido a pior estratégia.
Apesar de suas falhas inerentes, o critério de arrependimento mini-máximo não deixa de ter o
seu mérito. Para pessoas cuja reação é de profunda preocupação e talvez até de depressão mental ao descobrir
que tomaram decisões não ideais, o conceito de arrependimento é, sem dúvida, válido. Tentar minimizar o
arrependimento máximo, nesses casos, pode, muito bem, proporcionar a esses tomadores de decisão uma
maior paz de espírito.

CRITÉRIO DA PROBABILIDADE MÁXIMA

Esta regra decisória visa superar uma das falhas verificadas nos critérios anteriores: a tendência
de ignorar as probabilidades dos estados de natureza. O critério de probabilidade máxi ma requer que sejam
atribuídas probabilidades aos estados de natureza. Isso pode ser feito objetiva ou subjetivamente. O
responsável pelas decisões escolhe o plano de ação para o estado de natureza mais provável de ocorrer.
Voltando à matriz da figura 2-3, suponha que as probabilidades de Nl, N2 e N3 sejam, respectivamente, 0. 10,
0.60 e 0.30. Como o estado de natureza N2 é o mais provável, a estratégia S3 deveria ser escolhida, pois $120
é o pagamento mais favorável associado a N2.
Apesar de o critério de probabilidade máxima levar as probabilidades em consideração, ele
ainda envolve um processo decisório que ignora informações potencialmente importantes na matriz de
pagamento. As conseqüências de todos os estados de natureza, exceto aquele que apresenta a maior
probabilidade, são desconsideradas. Esse é um aspecto grave nas situações em que a maior probabilidade é
um valor baixo, pois pode haver fortes chances de não se encontrar o estado de natureza mais favorável.
Suponha, por exemplo, que existam seis estados de natureza; um tem a probabilidade de 0.25 e os outros têm
probabilidade de 0.15 cada. Somente os pagamentos associados ao primeiro estado de natureza seriam
considerados, mesmo que sua chance de ocorrer fosse de apenas uma em quatro. Os pagamentos associados
aos outros cinco estados de natureza assumem grande relevância, pois há a probabilidade de três em quatro
que uma delas se materialize; mesmo assim, ela são ignoradas pelo critério da probabilidade máxima. Um
problema similar surgiria com dois estados de natureza, um com uma probabilidade de 0.51 e outro com uma
probabilidade de 0.49. Para propósitos práticos, os dois estados são igualmente prováveis, mas pela regra de
probabilidade máxima, somente o primeiro estado de natureza seria considerado, enquanto o segundo seria
completamente ignorado. O critério da probabilidade máxima tem seu maior apelo no fato de que o estado de
natureza mais provável tem uma probabilidade de ocorrência relativamente alta, por volta de 0.80 ou mais;
então, basear uma decisão num único estado de natureza faz mais sentido.

CRITÉRIO DO VALOR ESTIMADO

Essa regra decisória sustenta que a melhor estratégia é aquela que tem o maior pagamento. O
pagamento esperado de uma estratégia é calculado multiplicando-se o pagamento relacionado a um estado de
natureza, e somando os produtos resultantes de todos os estados de natureza. As probabilidades dos estados de
natureza podem ser encontrados de duas maneiras. Se o tomador de decisão não dispõe de informação
nenhuma sobre a freqüência relativa com que os estados de natureza possam ocorrer, esse critério leva-o a
atribuir probabilidades iguais. Esse procedimento é feito de acordo com o postulado estatístico chamado, às
vezes, de regra de Bayes (ou Lei da distribuição igual da ignorância), que diz que os diferentes estados de
natureza devem ser considerados igualmente prováveis, a menos que haja informação em contrário. Por outro
lado, quando houver conhecimento disponível, as probabilidades subjetivas (ou, em raros casos, objetivas)
podem ser atribuídas aos possíveis estados de natureza. De fato, esse procedimento é preferível - contanto que
a incerteza não seja muito grande – porque permite que o tomador de decisão utilize a informação que ele por
ventura tenha acerca dos estados de n atureza e porque não é muito provável que as probabilidades dos estados
de natureza sejam realmente iguais, como sugere o postulado das probabilidades iguais.
Suponha que nós determinemos uma estratégia ideal de acordo com o critério do valor estimado
para a matriz a figura 2-3, presumindo que não exista conhecimento a respeito das possíveis "zebras" dos
estados de natureza. Seguindo a regra de Bayes, os três estados de natureza são considerados igualmente
prováveis, apresentando uma probabilidade de 1/3 para cada estado. O valor estimado da estratégia SI,
simbolizado por E(S1), é calculado da seguinte forma:

E(Sl) = (1/3) ($45) + (1/3) ($6) + (1/3) ($30) = $27

Os valores ou pagamentos estimados de S2 e S3 podem ser computados da mesma maneira:

E(S2) = (1/3) ($66) + (1/3) (-S21) + (1/3) ($90) = $45

E(S3) = (1/3) (-$12) + (1/3) ($120) + (1/3) ($24) = $44

O critério de valor estimado considera S2 a melhor estratégia, pois seu pagamento é maior do
que o de SI ou S3. O que significa isso? O pagamento estimado pode ser visto como o pagamento médio que
poderia ser realizado durante um número indefinidamente grande de tentativas (ou decisões, neste caso) em
que as probabilidades e pagamentos permanecem imutáveis. O pagamento esperado de S2 ($45) é o resultado
médio a longo prazo; durante um terço do tempo um pagamento de $66 é obtido, noutro terço do tempo há um
prejuízo de $21, e em outro terço acontece um ganho de $90 – a média destes é $45, ou seja, o valor estimado.
Como a média de pagamento a longo prazo de S2 é mais elevada do que a de SI ou S3, há um apelo
fortemente emocional para a escolha de S2.
Para um exemplo do critério do valor estimado onde as probabilidades não são iguais, considere
a matriz da figura 2-4. Suponha que o tomador de decisões tenha razões para acreditar que as probabilidades
de Nl, N2 e N3 são, respectivamente, de o.30, 0.50 e 0.20. O pagamento esperado de SI é $26.50 e de S2 é
$65.20; S2, portanto, é a melhor estratégia, de acordo com o critério do valor estimado.
O critério do valor estimado evita as críticas levantadas nas quatro regras decisórias anteriores.
Esse critério leva todos os pagamentos possíveis em consideração faz uso de qualquer conhecimento a
respeito das freqüências relativas com as quais os estados de natureza possam ocorrer. Todavia, o critério do
valor estimado não deixa de ter suas falhas. Primeiramente, não é provável que as condições sob as quais a
maioria das decisões são tomadas se repitam durante um longo período de tempo. Quando as estratégias, os
estados de natureza, suas probabilidades e os pagamentos estão sujeitos a mudanças, o conceito de um
pagamento médio a longo prazo obtido de valores "temporários" não constitui necessariamente uma base
válida para decisões. Em segundo lugar, durante um pequeno ínterim, e especialmente durante um período de
uma ou duas decisões, o pagamento obtido pode ter uma média consideravelmente diferente do valor ou
pagamento esperado (a longo prazo). Em terceiro lugar, a abordagem do valor estimado não permite que o
tomador de decisão baseie sua escolha na habilidade ou inabilidade de absorver quaisquer perdas que possam
estar relacionadas à melhor estratégia. Por fim, essa abordagem não sugere como os tomadores de decisão
podem incorporar suas atitudes em relação ao risco e à incerteza num processo seletivo. Ainda assim, o
critério do valor estimado é bem adequado aos tomadores de decisão que preferem "apostar na sorte" a seu
favor. É uma boa aposta, pois, a longo prazo, as decisões feitas de acordo com o critério do valor estimado
tenderão a apresentar uma média a favor do tomador de decisão.

CONCLUSÕES SOBRE OS CRITÉRIOS DECISÓRIOS

Apesar de outras regras decisórias terem sido propostas, nossa pesquisa de cinco é suficiente
para apontar várias conclusões interessantes e dignas de nota. Cada regra apresentou presunções de que o
responsável pela tomada de decisões tenta otimizar sua escolha de alternativas, apesar da frustração da
incerteza e do conhecimento imperfeito. Contudo, não está bem claro que escolha, exatamente, é essa. A
estratégia "ótima" (ideal) para a matriz da figura 2-3 variou conforme a regra decisória aplicada, como se vê
abaixo:

critério maxi-mínimo : S1
critério maxi-máximo : S3
critério do arrependimento mini-máximo : S3
critério da probabilidade máxima : S3
critério do valor estimado : S2

É evidente, então, que a busca por decisões "ótimas" em um ambiente de incerteza ou


conhecimento imperfeito não produz uma escolha única de alternativas. O que é "ótimo" depende do tipo de
personalidade do tomador de decisões, seus objetivos, suas circunstâncias e, obviamente, da regra decisória
que ele seleciona. Além disso, pode- se objetar contra cada uma dessas regras decisórias.
Contudo, a matriz de pagamento e as regras decisórias são bastante úteis na tomada de decisões,
pois seu uso habilita o tomador de decisões a: 1) identificar planos de ação alternativos disponíveis, 2)
contemplar as várias forças ambientais que possam ser encontradas, 3) fazer julgamentos referentes aos
prováveis pagamentos ou resultado associados a cada estratégia, 4) estabelecer os objetivos a serem
alcançados via decisão, 5 avaliar racionalmente as alternativas à luz de seus pagamentos e objetivos
desejados. Não pode haver muita dúvida de que, em média, decisões de alta qualidade seriam tomadas ao se
seguir tais procedimentos na seleção de uma estratégia alternativa. Dificilmente existe um modo mais
econômico de organizar os dados e informações relevantes a um problema, decisório do que o oferecido pelo
conceito de matriz de pagamento. Essa matriz ajuda, trabalhar um problema decisório ao facilitar a
compreensão da evolução racional e lógica; das alternativas.

A TOMADA DE DECISÃO SOB CONFLITO

Outra abordagem do processo decisório sob condições de conhecimento imperfeito diz respeito
a situações onde o tomador de decisões é confrontado com um opositor agressivo (uma firma rival) cujos
interesses entram em confronto direto com o seus. Nesse caso, os estados de natureza são, na verdade, os
planos de ação do sei concorrente, e se presume que o estado de natureza que realmente vai ocorrer é o
calculado pelo seu opositor para prejudica-lo ao máximo. Situações desse tipo surgem n seleção de estratégias
de propagandas, na decisão do orçamento, na seleção de um loca para novas instalações, na decisão de novas
características a serem incorporadas em novos modelos de produtos, na escolha de políticas de preços, e na
negociação entre diretorias e sindicatos. Esses tipos de problemas decisórios podem ser descritos como
tomada de decisão sob conflito, e o método de sua análise constitui o tema da teoria dos jogos.
A abordagem básica da teoria dos jogos é a de que uma firma determina; primeiro a "melhor"
contra -estratégia de seu concorrente em relação à sua própria; "melhor" estratégia para, então, formular
medidas defensivas apropriadas que derrotem ; contra-estratégia do concorrente. Na realidade, a teoria dos
jogos se assemelha muito ; uma guerra, onde generais de forças opostas organizam suas tropas e procuram
manobrar e descobrir as táticas um do outro. Cada general tenta adivinhar qual vai ser a melhor jogada de seu
inimigo, e traça uma contra-estratégia para suplanta-la. Como o rival está seguindo a mesma linha de
pensamento, contra-contra-estratégias devem se subseqüentemente formuladas. E, assim, hà uma sucessão
infinita de invenção de e stratégias para superar e antecipar os passos do inimigo.
Na pane restante de nosso capítulo, vamos nos ocupar de duas situações simples da teoria dos
jogos: 1) os jogos da soma zero (entre duas pessoas); 2) os jogos da soma não constante (entre duas pessoas).
As ideias básicas da teoria dos jogos podem se apreendidas destes dois casos; além disso, a matemática se
toma difícil muito rapidamente, mesmo em resposta a pequenas extensões do ambiente dos jogos.

O JOGO DA SOMA ZERO

O jogo da soma zero envolve um esforço competitivo intenso entre dois jogadores; cada
jogador ganha às custas do outro, o que faz com que seus interesses sejam diametralmente opostos. Esse jogo
é chamado de soma zero porque, não importa o que seja feito pelos jogadores, a quantia que um jogador
ganha é igual àquela que seu oponente perde, de modo que o ganho total de ambos os jogadores é,
necessariamente zero. Não há, portanto, vantagem na colaboração.
Imagine que haja um esforço competitivo entre duas firmas, A e B, sobre a parte do mercado
reservada a um produto que ambas produzem. Suponha que a firma A esteja tentando decidir entre três
estratégias de preço: A1, A2 e A3. Digamos que a firma B esteja considerando quatro alternativas envolvendo
várias combinações de promoção de produtos e técnicas de propaganda B1, B2, B3 e B4.
A matriz de pagamento na figura 2-6 descreve os pagamentos da cota do mercado da firma A.
Observe que não há necessidade de fazer uma matriz de pagamento separada para a firma B, pois é claro que,
se a firma A capta 40% do mercado, a parcela (ou pagamento) da firma B será de 60%. Devemos pensar que
tanto A quanto B têm a informação da matriz de pagamento e que cada firma tem que escolher uma estratégia
sem saber da estratégia escolhida pela outra.

B1 B2 B3 B4
A1 20 80 15 70
A2 40 35 30 35
A3 60 65 25 10

Legenda: A - Estratégias da firma A


B - Estratégias da firma B
Fig. 2-6: Matriz de pagamento da firma A

Sob essas circunstâncias, qual das três estratégias a firma A deveria empregar para captar a
maior parcela do mercado? Uma possibilidade é que a firma A tome a precaução de imaginar que o pior possa
ocorrer. Como a firma B está "para pegar" a firma A, é razoável que A procure uma estratégia que forneça o
máximo de segurança contra a adversidade. Isto requer a adoção de uma estratégia maxi-minima, pois esta
permite que A se proteja de receber menos do que a mínima parcela do mercado que poderia obter; em outras
palavras, uma estratégia maxi-mínima para A maximizaria seu nível de segurança. a estratégia maxi-minima
da firma A é A2, pois esta tem uma garantia mínima de 30% do mercado, enquanto Ai tem um pagamento
mínimo de 15% e A3 um pagamento mínimo de 10%. ,
Pelas mesmas razões, a firma B pode decidir empregar uma estratégia similar. Contudo, para a
firma B os piores pagamentos na matriz são os valores mais altos, e não os menores. Isso ocorre porque a
parcela do mercado de B é calculada subtraindo-se a parcela do mercado de A de 100; então, quanto maior for
o valor do pagamento da firma A, menor será o da firma B, e assim por diante. Ao olhar para a figura 2-6, sob
o ponto de vista da firma B, o pior que pode acontecer se 81 for escolhida é a firma A pegar a estratégia A3 e
obter 60% do mercado, deixando apenas 40% para a firma B. Similarmente, se a firma B eleger B2, o pior
nível de pagamento será 80%; se escolher 83, o pior nível de pagamento será 30%; se eleger B4, o pior será
70%. Claramente, o melhor dos piores resultados para a firma B é 30%, mis este é o menor dos maiores
pagamentos da firma A, A melhor estratégia da firma B, portanto, é B3, porque minimiza o máximo
pagamento da firma A. Conseqüentemente, B3 é uma estratégia mini-máxima (e não maxi-mínima).
Na figura 2-6, podemos observar que o pagamento mais baixo da firma A, ao escolher A2 (30%
do mercado) é exatamente o mesmo que o pagamento mais elevado que A poderia receber se B escolhesse 83
(30% do mercado). Há uma intersecção da estratégia maxi -mínima da firma A com a estratégia mini-máxima
da firma B no mesmo elemento na matriz: A2B3. Quando um elemento numa matriz de pagamento for, ao
mesmo tempo, o melhor dos piores resultados para um jogador e o pior dos melhores resultados para o outro
jogador, há um indicativo de um ponto de equilíbrio na matriz. O ponto de equilíbrio é também "o valor do
jogo", porque ele é o resultado que pode ser racionalmente previsto de ocorrer, contanto que os jogadores
sejam racionais. No nosso exemplo, poderíamos esperar que o resultado das decisões seria a firma A obter
30% do mercado e a firma B obter 70% do mercado. (Nem todas as matrizes de pagamento têm pontos de
equilíbrio, conforme veremos mais adiante).
É importante perceber os vários atributos das situações de soma zero onde um jogador emprega
uma estratégia maxi-minima e o outro emprega uma estratégia mini- máxima. Em primeiro lugar, se a matriz
de pagamento tem um ponto de equilíbrio, a estratégia mais vantajosa para uma firma é a maxi-mínima
quando a outra firma emprega uma estratégia mini -máxima. A combinação das estratégias maxi-minima -
mini-máxima dá a ambas as firmas (ou jogadores) a segurança ou proteção máxima contra as jogadas dos
adversários. A escolha da firma A de uma estratégia maxi -mínima efetivamente impede que a firma B reduza
a parcela de A no mercado abaixo de 30%. Nenhuma outra estratégia oferece a A a segurança e proteção
contra adversidades como a estratégia A2. Além do mais, quando A seleciona A2, qualquer escolha de
estratégias para B que não seja B3 (a estratégia mini-máxima) permitirá que A abocanhe mais que 30% do
mercado. Da mesma forma, a escolha da firma B de uma estratégia mini-máxima oferece a B a oportunidade
de segurar a parcela de A no mercado num nível que impeça A de aumentar além daquilo. Quando B
minimaximiza, qualquer estratégia diferente de uma estratégia maxi-mínima para A permite que a firma B
aumente sua parcela no mercado. Desse modo, uma estratégia mini-máxima para a firma B é a melhor defesa
contra a melhor estratégia da firma A.
Para ilustrar ainda mais o grau de segurança inerente à combinação maxi- mínima - mini-
máxima, suponha que a firma A tivesse escolhido A3 em vez de sua estratégia maxi-mínima A2, esperando,
talvez, que B cometesse um erro de cálculo ao escolher Bl ou B2, e, conseqüentemente, dando a A a
oportunidade de obter 60 a 65 por cento do mercado em vez dos 30% garantidos por A2. A melhor resposta
da firma B diante da seleção de A3 seria adotar a estratégia B4, confinando A a 10% do mercado e
abocanhando 90% para si mesma. Nesse caso, a firma A deixa seus flancos desprotegidos contra uma reação
de B quando escolhe uma estratégia que não seja a maxi-mínima. Desse modo, pode-se concluir que, quando
uma das firmas se desvia de sua estratégia "ótima" (ideal), não é provável que ela aumente seu valor de
pagamento, e pode sofrer desnecessariamente.
Em segundo lugar, podemos observar que o valor correspondente a um ponto de equilíbrio é, ao
mesmo tempo, o menor valor na sua linha e o maior valor na sua coluna. Ou, como a disposição das
estratégias dos jogadores nas linhas e colunas é completamente arbitrária, as posições dos jogadores na matriz
poderiam ser invertidas e o valor correspondente ao equilíbrio seda o maior em sua linha e o menor em sua
coluna. Basicamente, então, o pagamento-equilíbrio é o maior valor em uma direção (linha ou coluna) e o
menor valor em outra (coluna ou linha). Na figura 2-6, o valor de equilíbrio (30) é o menor pagamento em
sua linha e o maior em sua coluna.
Por fim, uma estratégia maxí-mínima pode ser uma contra -estratégia ruim frente a uma
estratégia não mini-máxima. Suponha, por exemplo, que a firma B não esteja informada sobre os princípios
da teoria dos jogos, ou esteja sendo mal administrada por gerentes poucos sábios, ou esteja disposta a correr
riscos, ou por várias outras razões, não esteja inclinada a escolher uma estratégia mini-máxima. Digamos que
a firma B escolha B4. Se a firma A persistir na estratégia maxi-minima A2, ela sacrificará um possível
pagamento de 70% do mercado que poderia ser obtido escolhendo AI. Ou digamos que ela selecione B2.
Aqui, a firma A pode aumentar sua parcela no mercado de 35% para 80% ao mudar de A2 para AI. Podemos
afirmar, então, como principio geral, que uma estratégia maxi-mínima só produz os melhores resultados
quando o concorrente coopera ao escolher uma estratégia mini-máxima. Poderíamos dizer, também, que uma
estratégia mini-máxima garante a obtenção de resultados satisfatórios somente quando o concorrente
seleciona uma estratégia maxi-mínima.

ESTRATÉGIAS MISTAS

Nem todas as matrizes de pagamento possuem ponto de equilíbrio. Considere a ma triz das
firmas A e B mostrada na figura 2-7. Nesse caso, a estratégia maxi-mínima da firma A é A2 e a estratégia
mini-máxima da firma B é B3. Mesmo assim, o ponto de equilíbrio não é configurado. Por quê? Porque o
pagamento mais baixo da firma A ao escolher A2 (35%) não coincide com o maior pagamento que A pode
receber se a firma B escolher B3 (50%). Além disso, se a firma A escolher A2 e a firma B pegar B3, a firma a
não obtém somente o pagamento mínimo de 35% do mercado, mas abocanha 50% do mercado. E, o que é
mais importante, caso a firma A selecione A2, a melhor escolha da firma B definitivamente não será a
estratégia mini-máxima B3. Será muito melhor que a firma B escolha B2 ou B4 e segure a parcela do
mercado da firma A em 35%. Se a firma B adorar B4, a firma A preferirá AI, e não A2. Mas se a finita A
selecionar AI, a firma B preferirá BI a B4. Se a firma B escolher BI, a firma A achará mais vantajoso pegar
A3. Mas se A selecionar A3, a firma preferirá B4 a BI. Se a firma B escolher B4, a firma selecionará AI. E
assim vai; o círculo está completo. Não há uma estratégia "melhor" para nenhuma das firmas. Nessa matriz,
cada uma das firmas sempre tem uma melhor contra-estratégia a cada vez que a estratégia de seu oponente é
conhecida. Além do mais, a fiaria A pode melhorar sua cota no mercado ao se desviar da estratégia maxi-
mínima, seja qual for a estratégia adotada pela firma B. Similarmente, perceber-se-á que a fiaria B achará
vantajoso evitar uma escolha mini-máxima, não importa que estratégia a firma A decida empregar.
B1 B2 B3 B4
A1 20 80 25 70
A2 40 35 50 35
A3 60 65 25 10

Legenda: A - Estratégias da fiaria A


B - Estratégias da fiaria B

Fig. 2-7: Matriz de pagamento da fiaria A

Imediatamente, surge a questão quanto à estratégia a ser escolhida pela fiaria A agora que
sabemos que sua estratégia maxi-mínima não é uma boa escolha. Suponha que tentemos descobrir primeiro se
algumas das estratégias da figura 2-7 são melhores do que outras; desse modo, podemos conseguir reduzir o
número de e stratégias a serem consideradas na escolha final.
Uma estratégia pode ser considerada inferior (ou dominada) quando outras estratégias são
sempre preferíveis a ela, independentemente da estratégia escolhida pelo oponente. A fig. 2-7 indica que, do
ponto de vista da firma B, a estratégia 83 é inferior; ou seja, a fiaria B preferiria qualquer uma das estratégias
restantes, sem levar em conta se a fiaria A vai escolher AI, A2 ou A3. Caso a fiaria A escolha A2, a melhor
escolha de B será B2 ou B4, pois ambas têm o mesmo pagamento. E se A escolher A3, a melhor escolha de B
será 84. Portanto, não importa qual das três estratégias de A seja selecionada, a fiaria B nunca escolherá sua
estratégia mini-máxima (B3), porque outras escolhas proporcionam a B urna maior parcela do mercado. É
nesse sentido que afanamos que B3 é inferior a (ou dominada por) outras estratégias à disposição da firma B.
Uma análise mais extensiva da estratégia B3 e seus pagamentos é, portanto, desnecessária, pois a fiaria B
jamais a selecionaria, e a matriz pode ser reduzida ao que é mostrado na figura 2-8.

B1 B2 B4
A1 20 80 70
A2 40 35 35
A3 60 65 10

Legenda: A - Estratégias da fiaria A


B - Estratégias da fiaria B

Fig. 2-8: Matriz de pagamento da firma A (forma reduzida)

A análise dos pagamentos para as estratégias remanescentes, conforme a figura 2-8, mostra que
A2 é uma escolha inferior. Se a firma B selecionar Bl, a melhor escolha da firma A será A3; se a firma B
adotar B2, a melhor escolha da firma A será A1 ; e se a firma B selecionar B4, a melhor escolha de A será,
novamente, AI. A estratégia A2 não é, então, selecionada, não importa qual estratégia B escolhe.
Conseqüentemente, podemos eliminar A2 da nossa análise, reduzindo as estratégias relevantes às apontadas
na figura 2-9.

B1 B2 B4
A1 20 80 70
A3 60 65 10

Legenda: A - Estratégias da firma A


B - Estratégias da firma B
Fig. 2-9: Matriz de pagamento da firma A (forma reduzida)

A observação dos pagamentos da figura 2-9 indica que a firma B não selecionaria,
racionalmente, a estratégia B2. Se A escolher Ai, a firma B selecionará Bl, ao passo que, se A escolher A3, a
firma B adorará B4. Então, podemos concluir que B2 é inferior a (ou dominado por) Bl e B4, e que a
estratégia B2 pode, agora, ser ignorada.
Ficamos, agora, com a matriz da figura 2-10. A análise das estratégias restantes de A (Ai e A3)
e B (Bl e B4) não revela inferioridade (ou dominação). Nesse ponto, o estudante deveria notar que a matriz da
figura 2-10 não possui ponto de equilíbrio. Portanto, não há uma melhor estratégia que qualquer uma das
firmas deveria selecionar. Qual das duas estratégias que A selecionar dependerá de sua previsão a respeito da
escolha de B (Bl ou 84)? Se A acredita que B escolherá Bl, é vantajoso para A selecionar A3; mas se A espera
que B adote 84, é melhor escolher A1. Similarmente, a melhor escolha de B depende do julgamento a respeito
da decisão de A. Se B espera que A escolherá A1, B selecionará Bl; mas se B acredita que A pegará A3, B
adorará B4.

B1 B4
A1 20 70
A3 60 10

Legenda: A - Estratégias da firma A


B - Estratégias da firma B

Fig. 2-10: Matriz de pagamento da firma A (forma reduzida final)

O problema decisório, tanto para A quanto para B, é tal que nenhuma das duas firmas deveria
seguir uma estratégia pura, e sim adotar uma política de estratégias mistas. Nosso objetivo, agora, é gerar uma
mistura das duas estratégias remanescentes de cada firma, mistura essa que melhorará a posição de ambas as
panes no que range às duas estratégias puras disponíveis.
Examine primeiro o caso da firma A. Nós concluímos que será vantajoso que a firma A escolha
AI numa pane do tempo (quando B selecionar B4), e A4 no tempo restante (quando B escolher Bl). O
problema decisório da firma A, portanto, é com que freqüência escolher AI, e com que freqüência selecionar
A3. O principio oferecido pela teoria dos jogos para essas ocasiões postula que cada jogador deveria alternar
suas estratégias relevantes de modo que seus pagamentos esperados para cada estratég ia sejam iguais, não
importa que estratégia seu oponente escolha.
Usando esse princípio, as freqüências ideais (ótimas) com que a firma A deveria selecionar AI e
A3 podem ser calcularias da maneira abaixo. Seja:
p = proporção do tempo que a firma seleciona a estratégia AI, e
(1-p) = proporção do tempo que a firma A seleciona a estratégia A3.
Pela tabela 2-1, podemos ver que, se a firma B adorar a estratégia Bl, a porção estimada de
mercado de A será de :
20 (p) + 60 (1-p) .
Da mesma forma, se a firma B selecionar a estratégia B4, a estimativa da parcela de mercado de
A será de:
70 (p) + 10 (1-p) .

Se a firma B selecionar B1 Se a firma B selecionar B4


Quando a firma A selecionar a A firma A obterá 20% do A firma A obterá 70% do mercado
estratégia A1 durante o tempo p mercado durante o tempo p durante o tempo p
Quando a firma A selecionar a A firma A obterá 60% do A firma A obterá 10% do mercado
estratégia A3 durante o tempo (1-p) mercado durante o tempo ( 1-p) durante o tempo (1-p)
Parcela estimada do mercado da 20p + 60(1-p) quando a firma B 70p + 10(1-p) quando a firma B
firma A selecionar a estratégia B1 selecionar a estratégia B4

Tabela 2-1: Estimativa da parcela de mercado da firma A


Já que dissemos que o princípio guia é o de que as parcelas estimadas do mercado da firma A
deveriam ser iguais, independentemente do que a firma B faça, então podemos igualar a parcela estimada do
mercado de A quando B selecionar Bl com a parcela estimada do mercado de A quando B adorar B4, e
resolver a equação resultante para os valores de p e (1-p). Ao proceder desse modo, a firma A se coloca numa
posição de indiferença em relação à estratégia escolhida pela firma B, pois A maximiza sua parcela de
mercado independentemente da escolha de estratégias de B. Portanto:
20p + 60(1-p) = 70p + 10(1-p),
20p + 60 - 60p = 70p + 10 - 10p
-40p + 60 = 60p + 10,
-100p = -50,
p = -50 / -100,
p = 0,5 ou 50 por cento,
1-p = 0,5 ou 50 por cento.
Portanto, a firma A deveria alternar AI e A3 de maneira a pegar AI durante 50% do tempo e A3
durante 50% do tempo.
Seguindo o mesmo raciocínio, podemos determinar como a firma B deveria dividir sua escolha
entre Bl e B4. Seja:
q = proporção do tempo durante o qual a firma seleciona B1, e
(1-q) = proporção do tempo durante o qual a firma seleciona 84.
Pela tabela 2-2, podemos ver que, se a firma A selecionar AI, a firma B pode esperar que a
parcela estimada de A do mercado seja de :
20q + 70(1-q).
Do mesmo modo, se a firma A selecionar A3, a firma B pode esperar que a parcela de A no
mercado seja de :
60q + 10(1-q).
Equacionando, como antes, os dois pagamentos estimados de parcelas do mercado, obtém-se:
20q + 70(1-q) = 60q + 10(1-q),
20q + 70 - 70q = 60q + 10 - 10q,
70 - 50q = 50q + 10,
-100q = -60,
q = -60 / -100,
q = 0,60 ou 60 por cento,
1-q = 0,40 ou 40 por cento.
Conseqüentemente, a firma B pode otimizar sua própria parcela do mercado ao selecionar a
estratégia Bl durante 60% do tempo e a estratégia 84 durante 40% do tempo.

Quando a firma B adotar Quando a firma B adotar Habilidade da firma B de


a estratégia B1 durante o a estratégia B4 durante o segurar a parcela do
tempo q tempo (1-q) mercado de A
Se a firma A selecionar a A firma A obterá 20% do A firma obterá 70% do 20q + 70(1-q) quando a
estratégia A1 mercado durante o tempo mercado durante o tempo firma A seleciona a
q. (q-1). estratégia A1.

Se a firma A selecionar a A firma obterá 60% do A firma A obterá 10% do 60q + 10(1-q) quando a
estratégia A3 mercado durante o tempo mercado durante o tempo firma A selecionar a
q. (1-q). estratégia A3.

Tabela 2-2: Habilidade da firma B em influenciar a parcela do mercado da firma A

Naturalmente quando afirmamos que cada jogador deveria alternar suas estratégias em alguma
proporção, pode haver a chance de que seja empregado algum dispositivo que produza as proporções
desejadas sem nenhum padrão discemivel. Por exemplo, a firma B poderia colocar 10 caras numa caixa, 6
delas marcadas por "Bl" e 4 delas marcadas por "B4". Uma cara seria pescada a esmo para determinar a
escolha de estratégia da firma B cada vez que uma decisão precisasse ser tomada. Esse procedimento
impediria que a firma A previsse as decisões de B cada vez, pois a seleção de estratégias de B seriam feitas
completamente a esmo. A firma A poderia facilmente criar um padrão de escolha ao atirar uma moeda para
cima, escolhendo AI se fosse cara e A3 se fosse coroa. Não é preciso sequer afirmar que, se uma firma é
incompetente o suficiente para adorar uma escolha de estratégia tola, então a outra firma deveria rapidamente
interromper seu padrão de estratégia mista, procurar as falhas na seleção de estratégias de sua rival e agir de
acordo. Portanto, somente quando ambas as firmas empregam estratégias mistas a esmo e sem um padrão
discernivel é que as que nós determinamos representam a melhor divisão possível de tempo entre os planos de
ação existentes.
Agora que já calculamos os padrões de estratégias mista para as firmas A e B, podemos prever
a média da parcela do mercado que cada firma pode esperar alcançar a longo prazo. Nossa matriz reduzida,
incluindo as estratégias ótimas para cada uma das firmas, está representada abaixo:

(6/10) (4/10)
B1 B4
(1/2) A1 20 70
(1/2) A3 60 10

Legenda: A - Estratégias da firma A


B - Estratégias da firma B

Observando os pagamentos do ponto de vista da firma A, podemos raciocinar da seguinte maneira:


1. Durante os 6/10 do tempo em que a firma B adota a estratégia Bl, a parcela de mercado da
firma A é de 20% durante 1/2 do tempo e de 60% durante 1/2 do tempo.
2. Durante os 4/10 do tempo em que a firma B adota a estratégia 84, a parcela de mercado da
firma A é de 70% durante 1/2 do tempo e 10% durante 1/2 do tempo.

Portanto, a estimativa total da parcela de mercado da firma A no tempo será a soma do que
acontece durante 6/10 do tempo (afirmação 1 da página anterior) com o que acontece durante os 4/10 do
tempo restante (afirmação 2 da página anterior), ou:

AFIRMAÇÃO 1 + AFIRMAÇÃO 2
6/10 [ 20 (1/2) + 60 (1/2) ] + 4/ 10 [ 70 (1/2) + 10 (1/2) ]
= 6/10 [ 10 + 30 ] + 4/ 10 [ 35 + 5 ]
= 40 % do mercado

Isso nos mostra que, se a firma A selecionar suas estratégias "otimamente", ela poderá ganhar,
em média, 40% do mercado para o seu produto. Podemos afirmar também que, se a estimativa a longo prazo
da parcela do mercado da firma A for de 40%, então, a estimativa para a longo prazo da parcela do mercado
da firma B será de 60%. Isso não significa, é claro, que cada vez que uma decisão for tomada, a firma A
obterá 40% e a firma B 60%, mas significa, isso sim, que a média da parcela do mercado de A e a média da
parcela do mercado de B se aproximarão, respectivamente, dos 40% e dos 60% no decorrer de muitas
decisões tomadas sob as mesmas condições.
Será que esses pagamentos estimados representam uma melhoria sobre o que cada firma
poderia esperar se escolhesse sua estratégia maxi-mínima (ou mini-máxima)? A resposta é um inequívoco
sim. Voltando à figura 2- 10, se a firma A decidisse usar sua estratégia maxi-mínima, a firma B poderia
segurar A numa cota de 35% do mercado ao escolher B2 ou B4. Obviamente, do ponto de vista da firma A,
este é um patamar inferior à parcela de 40% que poderia ser alcançada ao se adorar a abordagem da estratégia
mista. Similarmente, se a firma B adorasse sua estratégia mini-máxima (B3), a firma A, ao selecionar A2,
poderia obter 50% do mercado e deixar a firma B com apenas 50%. Uma vez que a firma B poderia vir a
obter uma média de parcela de mercado de 60% com as estratégias mistas, não é racional esperar que B se
satisfaça com os 50% da parcela do mercado assegurados pela escolha da estratégia mini-máxima.
Essa matriz "dois a dois" é a ilustração mais simples do uso otimizado das estratégias mistas na
teoria dos jogos. Obviamente, a maioria dos problemas decisórios no mundo real são caracterizados por mais
do que dois planos de ação relevantes e envolvem mais do que dois participantes ativos. Contudo, na teoria
dos jogos que foram apresentados podem ser prontamente estendidos para resolver problemas de dimensões
maiores, contando que as dificuldades de obter as informações para a matriz de pagamento possa ser
superada. Infelizmente, o problema da informação aumenta geometricamente à medida que a matriz vai
ficando maior; os custos de obter e processar a informação necessária para um jogo de muitas pessoas se
tomam rapidamente devastadores. Essa característica limita seriamente a aplicabilidade da teoria dos jogos.
Raramente as computações de otimizações apresentam um problema sério depois que a informação foi obtida;
os computadores podem ser programados para desempenhá-las, apesar da complexidade matemática
envolvida. O importante, aqui, é que os princípios ilustrados na matriz "dois a dois" sejam igualmente
aplicáveis em jogos maiores. Independentemente do número de jogadores e estratégias, cada tomador de
decisão procura descobrir se uma estratégia pura é o ideal; em caso negativo, ele procura encontrar uma
mistura de estratégias "ótima". Basicamente, segue - se o mesmo raciocínio na identificação da(s) melhor(es)
escolha(s) de alternativas, tanto em grandes problemas decisórios envolvendo conflito, quanto em pequenos
problemas decisórios envolvendo conflito; só muda o grau de complexidade.

JOGOS DE SOMA NÃO CONSTANTE

Os tipos de conflito de problemas decisórios examinados até o momento têm sido da variedade
soma zero ou soma constante, e tem soluções claras, desde que os tomadores de decisão sejam racionais. Na
prática, contudo, a maioria de situações de conflito na economia e nos negócios envolve problemas decisórios
onde os pagamentos dos participantes não chega a um valor constante para todos os resultados do jogo. Há
dois tipos de jogos de soma não-constante: 1) não-cooperativos, onde não há colaboração ou comunicação
entre os jogadores antes da escolha das estratégias; 2) cooperativas, onde existe a oportunidade de
comunicação ou colaboração antes da seleção de estratégias.
Problemas decisórios não-cooperativos.
Um dos mais famosos exemplos de um jogo não-cooperativo é o "dilema do prisioneiro", onde
dois suspeitos ficam sob custódia e são interrogados separadamente. Devido à falta de provas contra eles,
cada um deles acredita que pode ser libertado ou, na pior das hipóteses, receber uma pena leve, se nenhum
dos prisioneiros falar. Contudo, ambos são informados pelo promotor de que, se um confessar e outro não,
aquele que não confessar receberá uma pena bastante pesada, enquanto o que houver confessado receberá um
tratamento indulgente por fornecer provas ao Estado. Aí está o dilema: será que cada prisioneiro deveria
confiar na força de caráter do outro e não confessar, ou então, cada um dos prisioneiros, não dispondo de
nenhuma segurança a respeito do que o outro fará, deveria proteger somente a si mesmo e confessar?
É interessante assinalar que um dilema análogo a esse freqüentemente se apresenta em situações
econômicas e de negócios. Observe o caso de duas firmas A e B, que produzem marcas correspondentes de
um produto e se defrontam com a decisão de iniciar ou não uma campanha de propaganda televisiva. Cada
uma delas tem duas opções de ação: anunciar ou não anunciar. Seus pagamentos respectivos, expressos em
termos de mudança em dólar nos seus níveis de lucro, estão indicados na figura 2-11.

Matriz de pagamento da firma A

B – Anunciar B – Não Anunciar


A – Anunciar -$100.000 $700.000
A – Não Anunciar -$500.000 $30.00

Legenda: A - Estratégias da firma A


B - Estratégias da firma B

Matriz de pagamento da firma B

B - Anunciar B – Não Anunciar


A – Anunciar -$80.000 -$600.000
A – Não Anunciar $900.000 $50.000

Fig. 2-11: Matrizes de Pagamentos das firmas A e B

Os pagamentos nas matrizes da figura 2-11 indicam, por exemplo, que, se a firma A e a fiaria B
não anunciarem, A terá um ganho de lucro de $700.000, ao passo que B terá uma perda de lucros de
$600.000. Se as duas firmas decidirem anunciar, os lucros da firma A caem em $100.000 e os lucros da fiaria
B caem em $80.000.
A análise da matriz de pagamento da firma B revela que a estratégia de B de anunciar
predomina sobre a estratégia de B não anunciar, pois os pagamentos relacionados são mais palatáveis. Se a
firma A anunciar, a firma B também anunciará, pois prefere um pagamento de -$80.000 a um de -$600.000.
Se A não anunciar, B preferirá, de novo, anunciar, pois terá um ganho de lucro de $900.000 comparado a um
ganho de apenas $50.000 se não anunciasse. Portanto, inicialmente a firma B está racionalmente motivada a
adorar a estratégia do anúncio. Exatamente a mesma análise vale para a firma A, que também adorará a
estratégia de anunciar pelas mesmas razões que a firma B. O resultado, portanto, será de $100.000 de queda
nos lucros para a firma A e $80.000 de queda nos lucros para a firma B. Se A e B não tivessem sido tão
racionais, elas poderiam ter percebido a sabedoria de não anunciar, obtendo, assim, ganhos de lucro de
$30.000 e $50.000, respectivamente.
É claro me a escolha de ambas as firmas de anunciar advém do fato de que elas não podiam
comunicar suas intenções ou cooperar. Isso também se aplica primariamente ao processo decisório único,
onde não ocorre o aprendizado das firmas. Se a mesma decisão tivesse que ser tomada várias vezes, talvez A e
B pudessem aprender com suas experiências infelizes, mesmo sem se comunicar, e, numa próxima vez,
decidir não anunciar. Mas, até que uma firma possa confiar que a outra não vá "blefar", nenhuma pode
abandonar sua estratégia de anunciar. Situações análogas incluem fabricantes de detergentes, ciganos,
refrigerantes, pneus, e mercadorias similares onde a competição entre as marcas é intensa. Nesses casos, cada
fabricante é levado a anunciar simplesmente para se precaver contra a erosão de sua parcela no mercado; não
se pode confiar que todos os fabricantes de um produto não anunciem, mesmo que alguns deixem de anunciar
como um sinal de tentativa para os outros. A razão é que aqueles que não pararem de anunciar colherão lucros
atraindo consumidores dos que pararam de anunciar (presumindo-se, é claro, que a propaganda realmente
influencia a demanda de consumo de uma maneira positiva). Conseqüentemente, as pressões competitivas
podem forçar empresas a atividades de propagandas que elas, em outra situação, rejeitariam como não-
lucrativas.
Não é difícil encontrar outros exemplos reais do "dilema do prisioneiro". Muitos
estabelecimentos de comércio permanecem abertos aos domingos, apesar de seus proprietários desejarem,
talvez, uma folga, por medo de perderem clientes para as lojas rivais. Os líderes de sindicatos pressionam para
aumentos salariais que podem ser excessivos e inflacionários a fim de melhorar sua imagem com a categoria,
mesmo que o verdadeiro ganho na renda do trabalhador seja menor do que poderia ter sido obtido se todos os
líderes de sindicato tivessem "cooperado" e procurado aumentos salariais atrelados aos aumentos de
produtividade. Os próprios consumidores, às vezes, pagam um preço que consideram abusivo por um produto
por temer não encontra-lo por um preço mais baixo algum tempo depois; enquanto, coletivamente, se
esperassem para comprar o produto mais tarde, os consumidores poderiam comprá-lo a preço de liquidação.
Jogos cooperativos.
Nos jogos cooperativos, geralmente se postula que os jogadores serão racionais o suficiente
para perceber e aplicar mutuamente estratégias vantajosas. Na prática isso nem sempre ocorre, devido aos
problemas encontrados para se chegar a uma divisão mutuamente aceitável dos pagamentos coletivos. De
fato, a maioria das análises de jogos cooperativos focaliza a criação de mecanismos justos ou razoáveis para a
divisão dos pagamentos entre os jogadores colaboradores.
Suponha que examinemos brevemente um jogo cooperativo de soma não- constante. Duas
firmas , cada uma com fábrica localizada à beira de um rio, estão preocupadas em reduzir o nível de poluição
do rio no qual cada uma despeja poluentes. Nenhuma das firmas polui as águas do rio separadamente acima
dos níveis aceitáveis, mas quando os dejetos das duas são somados, a taxa de poluição excede os limites
socialmente aceitáveis. Digamos que as autoridades deram às duas firmas um ultimato conjunto para reduzir o
nível de poluição a níveis aceitáveis ou pagar uma multa de $1.000.000 cada. Cada firma tem duas
estratégias: comprar equipamento de controle da poluição ou não comprá-lo. Seus custos estimados em dólar
estão indicados nas matrizes da figura 2-12.

Matriz de pagamento da firma A

B – Comprar B – Não Comprar


A – Comprar -$650.000 -$650.000
A – Não Comprar 0 -$1.000.000

Legenda: A - Estratégias da firma A


B - Estratégias da firma B

Matriz de pagamento da firma B

B - Comprar B – Não Comprar


A – Comprar -$650.000 0
A – Não Comprar -$650.000 -$1.000.000

Fig. 2-12: Jogo cooperativo de soma não-constante

A comunicação e a cooperação entre as duas companhias é, obviamente, adequada (e não viola


as regras anti-truste). Não faz sentido, nesse caso, que as duas firmas comprem equipamento anti-poluente. A
solução mais racional e barata é que uma firma instale aparelhos de tratamento de dejetos. Mas qual delas?
Aqui está a questão a ser negociada e barganhada. As firmas deveriam dividir os custos em partes iguais ou de
acordo com a quantidade de poluição que cada uma gera? Qual será o impacto sobre o resultado das
habilidades dos negociadores de persuadir, manobrar ou convencer a firma a fazer o que é mais do que sua
parcela "justa"? Obviamente, o resultado real é um bocado imprevisível e indeterminado.
Em vez de nos infiltrarmos nos intrincados meandros da barganha, suponhamos que
simplesmente apresentemos algumas das considerações centrais dos jogos cooperativos que moldam o
resultado final. primeiramente num jogo cooperativo entre muitas pessoas existe a possibilidade de que vários
jogadores façam um conluio contra os restantes; no jargão da teoria dos jogos esse tipo de combinação é
denominado coalizão. Muitas vezes, a formação de coalizões é atrativa porque oferece aos seus membros a
oportunidade de explorar com sucesso os jogadores restantes. Em segundo lugar, freqüentemente ocorre que a
maximização do bem-estar do grupo exige um sacrifício para um de seus membros. A fim de induzir a pane
prejudicada a cooperar, um pagamento lateral ("propina") pode ser feito para compensa-la por seu sacrifício.
Para que a coalizão permaneça viável, cada membro deve receber um pagamento igual ou maior do que a
quantia que ele pode obter sozinho.
Em terceiro lugar, pode-se observar que a pior coisa que pode acontecer com uma coalizão é os
jogadores remanescentes se combinarem contra ela, numa outra super contra -coalizão. Quando isso ocorre, e
o pagamento total de todos os jogadores é fixado no seu valor máximo possível, o problema decisório se
transforma num jogo de soma zero entre duas pessoas (na realidade, duas coalizões) que pode ser descrito
pelos métodos apresentados anteriormente.
Por fim, o resultado real dos jogos cooperativos entre duas ou mais pessoas depende largamente
dos traços pessoais, sociais, institucionais e ambientais envolvidos na situação. Até que esses traços sejam
conhecidos e assimilados pelo jogo, a previsão das estratégias ideais ou resultados finais é um exercício de
adivinhação através de bola de cristal.

RESUMO E CONCLUSÕES

Nesse capítulo, os processos de tomada de decisão foram examinados no contexto da certeza,


fisco e incerteza. O enfoque principal da análise foram os métodos e as técnicas para a tomada de decisões
sob os mais variados estados de conhecimento imperfeito. As questões pertinentes a metas e objetivos foram
relegadas a um papel secundário (as metas e objetivos serão examinados com mais cuidado nos próximos
capítulos). A ênfase da teoria das decisões sobre a metodologia é que a toma mais flexível e adaptável a uma
variedade de abordagens.
A tomada de decisões sob condições de certeza é muito mais simples do que em situações de
risco objetivo, fisco subjetivo e incerteza, pois a presença de informação adequada permite uma seleção fácil
das alternativas. No momento em que o tomador de decisões tem informações menos que perfeitas sobre as
quais basear sua escolha de alternativas, os princípios da teoria das decisões o incitam a trazer qualquer tipo
de informação de que ele disponha para se debruçar sobre o problema decisório. Apesar de completamente
consciente de que a informação que ele tem pode estar errada ou, incompleta, o tomador de decisões racional
não tem nenhuma chance, a não ser tentar superar a falta de informação, usando, para isso, o melhor
conhecimento ou informação possíveis para tomar a decisão.
A marca dos problemas decisórios sob condições de conhecimento imperfeito é que os
resultados das estratégias são desconhecidos. Apesar de várias regras decisórias estarem disponíveis para
auxiliar o tomador de decisões na seleção de estratégias, não fica nem um pouco claro se existe uma escolha
ótima de estratégias para todas e quaisquer circunstâncias. O conceito de ótimo (ideal) varia com a formação e
personalidade do tomador de decisões, seus objetivos, suas circunstâncias, e o procedimento decisório que ele
adotar.
Na tomada de decisão sob conflito, a gama da seleção de estratégias se alarga, incluindo o
comportamento de dois ou mais tomadores de decisão. Nas situações de negócios, firmas concorrentes estão
vitalmente preocupadas, não apenas com suas próprias estratégias, mas também com as estratégias de seus
rivais. Deparadas com o conhecimento imperfeito e concorrentes agressivos, cada firma procura determinar se
uma estratégia pura é ideal e, se não for, procura alcançar a mistura ótima de estratégias.
A teoria dos jogos oferece uma estrutura promissora para o exame de ambientes conflituosos e
para o desenvolvimento de critérios para o comportamento racional. Os princípios norteadores postulados
pela teoria dos jogos na seleção de estratégias fornecem uma orientação iluminadora de grande valor no
estudo dos empreendimentos e comportamentos nos negócios. Acima de tudo, uma preocupação principal da
administração de empresas é observar diariamente os passos dos concorrentes e as tendências de
consumidores em potencial e, então, planejar estratégias e ajustes que dêem conta das contingências
emergentes. A administração, especialmente, nos níveis superiores, gasta grande parte de seu tempo
planejando maneiras de minimizar ou eliminar completamente as incertezas ou influências do mercado. E, ao
encarar a mudança secular e tecnológica, administradores progressistas são forçados a conceber planos de
ação novos e ambiciosos para empregar no futuro. Pode-se dizer que uma das principais funções do
gerenciamento é formular estratégias para o ajuste e a reação aos elementos ambientais de fisco e incerteza. A
direção bem sucedida de uma empresa, grande ou pequena, resume-se a tentar contornar as vicissitudes e
administrar as probabilidades em beneficio da empresa. Mas, como vimos, isso é mais fácil falar do que fazer.
O caminho ao longo da qual as decisões ótimas são encontradas é bastante difícil de se encontrar. Se você
entender porque, a missão desse capitulo estará cumprida.

Você também pode gostar