Você está na página 1de 201

Mtodos Quantitativos

Cesaltina Pires
Outubro 2003

ii

ndice geral
I

Mtodos de Deciso e Optimizao

1 Introduo
1.1 Mtodos quantitativos e processo de tomada de deciso . . . . . . . . . . .

3
3

1.2 Reviso de Probabilidades . . . . . . .


1.2.1 Conceitos Bsicos . . . . . . .
1.2.2 Teorema de Bayes . . . . . . .
1.2.3 Distribuies de Probabilidades
1.3 Distribuies Discretas . . . . . . . . .
1.3.1 Bernoulli . . . . . . . . . . . .
1.3.2 Binomial . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

5
6
8
10
12
12
12

1.3.3 Hipergeomtrica .
1.3.4 Multinominal . . .
1.3.5 Geomtrica . . . .
1.3.6 Binomial Negativa
1.3.7 Uniforme discreta
1.3.8 Poisson . . . . . .
1.4 Distribuies Contnuas .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

13
13
14
14
14
14
15

1.4.1
1.4.2
1.4.3

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

Uniforme (Rectangular) . . . . . . . . . . . . . . . . . . . . . . . . . 15
Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2 Programao Linear
2.1 Resoluo Grca . . . . . . . . .
2.1.1 Pontos extremos e soluo
2.1.2 Casos especiais . . . . . .
2.1.3 Anlise de sensibilidades .

. . . . .
ptima
. . . . .
. . . . .

2.2 Resoluo com Excel . . . . . . . . . .


2.3 Aplicaes . . . . . . . . . . . . . . . .
2.3.1 Seleco do mix de publicidade
2.3.2 Marketing Research . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

17
17
21
22
23

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

25
26
26
28

Mtodos Quantitativos

2.3.3

Seleco da carteira de activos . . . . . . . . . . . . . . . . . . . . . 29

2.3.4

Planeamento da produo . . . . . . . . . . . . . . . . . . . . . . . . 30

3 Teoria de Deciso

33

3.1 Critrios de deciso sem probabilidades . . . . . . . . . . . . . . . . . . . . 35


3.1.1

Critrio Optimista . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.1.2

Critrio Pessimista . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.1.3

Critrio de Minimax Regret . . . . . . . . . . . . . . . . . . . . . . . 37

3.1.4

Critrio de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.2 Maximizar o valor monetrio esperado (Expected monetary value) . . . . . 38


3.2.1

Maximizar o valor monetrio esperado . . . . . . . . . . . . . . . . . 38

3.2.2

Anlise de sensibilidades . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.2.3

Valor esperado de informao perfeita . . . . . . . . . . . . . . . . . 40

3.2.4

Valor esperado de informao imperfeita . . . . . . . . . . . . . . . . 42

3.3 Maximizar a utilidade esperada . . . . . . . . . . . . . . . . . . . . . . . . . 44


3.3.1

Teoria da Utilidade Esperada . . . . . . . . . . . . . . . . . . . . . . 44

3.3.2

Atitudes em Relao ao Risco e U(W ) . . . . . . . . . . . . . . . . . 45

3.3.3

Maximizar a Utilidade Esperada . . . . . . . . . . . . . . . . . . . . 46

3.3.4

Anlise de Sensibilidades . . . . . . . . . . . . . . . . . . . . . . . . 47

4 Teoria de Jogos

49

4.1 O que a teoria de jogos? . . . . . . . . . . . . . . . . . . . . . . . . . . 49


4.2 Modelizao da interaco estratgica . . . . . . . . . . . . . . . . . . . . . 50
4.2.1

Forma normal e forma extensiva . . . . . . . . . . . . . . . . . . . . 50

4.2.2

Informao completa/incompelta versus informao perfeita/imperfeita 57

4.3 Jogos estticos com informao completa . . . . . . . . . . . . . . . . . . . 57


4.3.1

Eliminao de estratgias estritamente dominadas . . . . . . . . . . 58

4.3.2

Problemas com a eliminao iterada de estratgias dominadas . . . . 60

4.3.3

Equilbrio de Nash em estratgias puras . . . . . . . . . . . . . . . . 61

4.4 Jogos dinmicos com informao completa . . . . . . . . . . . . . . . . . . . 66


4.4.1

Jogos de informao perfeita e Backward Induction . . . . . . . . 66

4.4.2

Jogos de informao imperfeita e equilbrio perfeito . . . . . . . . . . 70

4.4.3

Comentrios sobre backward induction e equilbrio perfeito . . . . . 72

ndice geral

5 Planeamento e controlo de projectos


5.1 Objectivos e tipos de deciso na gesto de projectos
5.1.1 Objectivos . . . . . . . . . . . . . . . . . . . .
5.1.2 Tipos de deciso . . . . . . . . . . . . . . . .
5.2 Representao do projecto . . . . . . . . . . . . . . .
5.2.1 Identicao das actividades . . . . . . . . .
5.2.2 Previso da durao e recursos necessrios . .
5.3 Mtodos de programao e controlo . . . . . . . . .
5.3.1 Diagrama de Gantt . . . . . . . . . . . . . . .
5.3.2 Mtodo do caminho crtico CPM . . . . . .
5.3.3 Tcnica de elaborao e controlo de projectos
5.3.4 Tradeo custo durao . . . . . . . . . . . .

II

.
.
.
.
.
.
.
.
.

. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
PERT
. . . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

Mtodos Estatsticos

101

6 Representao grca de dados


6.1 Variveis discretas e contnuas . . . . . .
6.2 Distribuies de frequncia ou empricas
6.2.1 Variveis discretas . . . . . . . .
6.2.2 Variveis contnuas . . . . . . . .
6.3 Representao grca . . . . . . . . . .
6.3.1 Variveis discretas . . . . . . . .
6.3.2 Variveis contnuas . . . . . . . .
7 Medidas de localizao e disperso
7.1 Medidas de localizao . . . . . . . . .
7.1.1 Mdia . . . . . . . . . . . . . .
7.1.2 Mediana . . . . . . . . . . . . .
7.1.3 Moda . . . . . . . . . . . . . .
7.2 Medidas de disperso . . . . . . . . . .
7.2.1 Desvio padro e varincia . . .
7.2.2 Desviomdio . . . . . . . . . .
7.2.3 Extremos-quartos e mediana .
7.2.4 Medidas de disperso relativas
7.2.5 ndice de concentrao e curvas

.
.
.
.
.
.
.
.
.
.
.

75
75
75
76
76
76
79
79
80
83
92
98

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
de Lorenz

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

103
. 103
. 104
. 104
. 105
. 107
. 107
. 108

.
.
.
.
.
.
.
.
.
.

109
. 109
. 109
. 111
. 112
. 113
. 113
. 115
. 115
. 115
. 116

Mtodos Quantitativos

7.3 Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117


8 Algumas distribuies
8.1 Distribuio normal . . . . . . . .
8.2 A normal estandartizada . . . . . .
8.2.1 Como testar a normalidade
8.3 Distribuio do X 2 . . . . . . . . .
8.4 A distribuio t . . . . . . . . . . .
8.5 A distribuio F . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

119
. 119
. 121
. 123
. 124
. 125
. 126

9 Amostragem e estimao
127
9.1 Populao e amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
9.2 Distribuio por amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . 128
9.2.1 Distribuio da mdia da amostra . . . . . . . . . . . . . . . . . . . 130
9.2.2 Distribuio da diferena entre duas mdias . . . . . . . . . . . . . . 131
9.2.3 Distribuio da proporo . . . . . . . . . . . . . . . . . . . . . . . . 132
2
9.2.4 Distribuio de (n1)S
. . . . . . . . . . . . . . . . . . . . . . . . . 132
2
9.3 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
9.3.1 Propriedades desejveis dos estimadores . . . . . . . . . . . . . . . . 133
9.3.2 Como encontrar estimadores? . . . . . . . . . . . . . . . . . . . . . . 138
9.3.3 Estimao pontual versus estimao por intervalos . . . . . . . . . . 140
9.4 Intervalos de conana para a mdia . . . . . . . . . . . . . . . . . . . . . . 143
9.4.1 Varincia conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
9.4.2 Varincia desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . 144
9.5 Intervalos de conana para diferena de mdias . . . . . . . . . . . . . . . 145
9.5.1 Varincias conhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . 145
9.5.2 Varincias desconhecidas amostra grande . . . . . . . . . . . . . . 145
9.6 Intervalos de conana para propores . . . . . . . . . . . . . . . . . . . . 146
9.7 Intervalos de conana para varincia . . . . . . . . . . . . . . . . . . . . . 147
9.7.1 Intervalo para varincia de populao normal . . . . . . . . . . . . . 147
9.7.2 Intervalo para rcio de varincias de populaes normais independentes148
9.8 Escolha da dimenso da amostra . . . . . . . . . . . . . . . . . . . . . . . . 149
10 Teste de hipteses
151
10.1 Conceitos bsicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
10.2 Ensaio de hipteses sobre a mdia . . . . . . . . . . . . . . . . . . . . . . . 156

ndice geral

10.3
10.4
10.5

10.6

10.2.1 Populao normal, varincia conhecida . . . . . . . . . . . . . . .


10.2.2 Populao normal, varincia desconhecida . . . . . . . . . . . . .
Ensaio sobre a varincia de uma populao normal . . . . . . . . . . . .
Ensaio sobre propores . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ensaio sobre igualdade de mdias . . . . . . . . . . . . . . . . . . . . . .
10.5.1 Varincia conhecida com populaes normais ou amostra grande
10.5.2 Amostras pequenas . . . . . . . . . . . . . . . . . . . . . . . . . .
Ensaio sobre a igualdade da varincia de duas populaes normais . . .

11 Regresso e correlao simples


11.1 Diagrama de disperso e correlao . . . . . . . . . . .
11.1.1 Teste de correlao de Spearman . . . . . . . .
11.2 Regresso linear simples . . . . . . . . . . . . . . . . .
11.2.1 Mtodo dos mnimos quadrados . . . . . . . . .
11.2.2 Poder explicativo da regresso . . . . . . . . .
11.2.3 Hipteses do OLS e teorema de Gauss-Markov
11.3 Testes de hipteses e intervalos de conana . . . . . .
11.4 Previso . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5 Outras formas funcionais . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

12 Regresso mltipla
12.1 Modelo de regresso mltipla . . . . . . . . . . . . . . . . . . . . . . .
12.1.1 Modelo em notao matricial . . . . . . . . . . . . . . . . . . .
12.2 Mtodo dos mnimos quadrados . . . . . . . . . . . . . . . . . . . . . .
12.3 Hipteses do modelo e teorema de Gauss-Markov . . . . . . . . . . . .
12.4 O poder explicativo da regresso . . . . . . . . . . . . . . . . . . . . .
12.5 Intervalos de conana e teste de hipteses de parmetros individuais
12.6 Teste de hipteses sobre conjuntos de parmetros . . . . . . . . . . . .
12.6.1 Teste de aderncia global do modelo . . . . . . . . . . . . . . .
12.6.2 Teste de um subconjunto de coecientes de regresso . . . . . .
12.6.3 Teste de uma combinao linear de parmetros . . . . . . . . .
12.6.4 Teste de vrias combinaes lineares de parmetros . . . . . . .
12.7 Previso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

156
158
160
161
162
162
163
164

.
.
.
.
.
.
.
.
.

165
. 165
. 168
. 169
. 171
. 173
. 174
. 175
. 177
. 179

.
.
.
.
.
.
.
.
.
.
.
.

181
. 181
. 182
. 182
. 184
. 185
. 187
. 189
. 189
. 191
. 191
. 193
. 193

Mtodos Quantitativos

Parte I

Mtodos de Deciso e Optimizao

Captulo 1

Introduo

Esta disciplina estuda o papel dos mtodos quantitativos no processo de tomada de


deciso. Nela so estudados vrios mtodos quantitativos, explicando como que
eles funcionam e como que eles podem ser usados pelo decisor. A cadeira d enfse
mais aplicao dos mtodos do que lgica matemtica dos mesmos.
A pergunta que deve nortear o nosso estudo : como que vrios mtodos nos
podem ajudar a tomar melhores decises?
O uso de mtodos quantitativos iniciou-se durante a segunda guerra mundial, onde
equipas de cientistas de vrias reas foram formados para resover problema estratgicos e tcticos defrontados pelos militares. Aps a guerra muitas destas equipas
continuaram a fazer investigao na rea de mtodos quantitativos (com outras aplicaes claro). A evoluo dos computadores possibilitou a aplicao dos mtodos
desenvolvidos a problema reais.
Os mtodos quantitativos so especialmente teis em problemas grandes e complexos, onde seria difcil, mesmo para um gestor com esperincia, usar s a intuio
para o resolver. tambm importante em problemas novos onde a experincia
no pode ajudar na deciso.

1.1

Mtodos quantitativos e processo de tomada de deciso

O processo de resoluo de problemas envolve vrios passos:


Identicao e denio do problema
Determinao do conjunto de alternativas

Mtodos Quantitativos

Determinao do critrio ou do conjunto de critrios a usar na avaliao das


alternativas
Avaliao das alternativas
Escolha da alternativa (deciso)
Implementao
Avaliao dos resultados
O processo de tomada de deciso envolve os 5 primeiros pontos mencionados anteriormente. Os trs primeiros aspectos tm a ver com a estruturao do problema, os
dois seguintes com a anlise do problema. na anlise do problema que o uso de
mtodos quantitativos essencial.
) Mas a fase de estruturao do problema absolutamente essencial porque se o
problema no for bem denido, por muito complicada que seja a anlise matemtica
feita de pouco servir.
) Os resultados da anlise quantitativa podem ser importantes para o decisor, mas
natural que a deciso nal tambm dependa de aspectos qualitativos levados em
conta pelo decisor.
Na anlise quantitativa do problema o primeiro passo contruir um modelo matemtico que represente o problema. Um modelo uma representao simplicada da
realidade. Na formalizao matemtica do problema importante identicar:
Qual o objectivo a expresso matemtica que descreve o objectivo a funo
objectivo.
) ex: maximizar lucro, minimizar custos.
As variveis de deciso quais so as variveis sobre as quais o agente tem controle. Para alm das variveis de deciso pode haver outras variveis (parmetros) que no esto sob o controle do decisor mas que inuenciam o problema.
) ex. de variveis de deciso: quantidade a produzir.
As restries do problema normalmente as variveis de deciso no podem
tomar valores arbitrrios, h restries que tm que ser levadas em conta.
) ex: restries de capacidade, restries oramentais, restries de no-negatividade.

Captulo 1

Introduo

Modelos determinsticos versus modelos estocsticos quando os vrios parmetros


que inuenciam o modelo so conhecidos com certeza o modelo determnistico.
Quando os valores daquelas variveis no conhecido apriori, o modelo estocstico.

1.2

Reviso de Probabilidades

Muitas decises de gesto so tomadas num contexto de incerteza no sabemos


exactamente o que vai acontecer no futuro, e o payo associado s decises que
tomamos depende daquilo que acontecer.
Quando no se sabe exactamente o que ir acontecer importante analisar qual o
grau de incerteza associado a cada possvel acontecimento.
) noo de probabilidade de um dado acontecimento assim essencial.
A probabilidade um nmero entre 0 e 1 que descreve a verosimilhana de um dado
acontecimento (se eu disser que h 50% probabilidade de chover amanh, estou a
dizer que considero igualmente provvel amanh chover ou no).

0 P (A) 1
) Um acontecimento de probabilidade igual a zero indica que no se espera que ele
venha a acontecer. Um acontecimento com probabilidade 1 indica que se espera que
ele acontea quase de certeza.
) Se considerarmos uma experincia com vrios resultados possveis (ex: lanar
um dado ou uma moeda) a soma das probabilidades dada a cada um dos possveis
resultados igual a 1.
) O primeiro passo na anlise denir claramente quais os possveis resultados da
experincia. No lanamento da moeda S = fcaras,coroasg. No lanamento do dado
S = f1; 2; 3; 4; 5; 6g.
) Se tivermos S = fA1; A2; ; Akg, sabemos que 0 P(Aj) 1 e que P(A1) +
P(A2) + P(Ak ) = 1.
Mtodos de estimao de probabilidade
Mtodo objectivo

Mtodos Quantitativos

) abordagem clssica no lanamento do dado, por exemplo, a probabilidade


de sair 1 16 . Usa a hiptese de que os possveis resultados so igualmente
provveis. Esta abordagem a usada muito na anlise de problemas de jogos
(cartas, dados,..)
) frequncia relativa baseada na repetio da experincia um nmero elevado de vezes e no clculo da percentagem de vezes que cada um dos possveis
resultados foi observado. Ex: uma empresa est a lanar um novo produto e
quer estimar a probabilidade de um consumidor comprar o bem. Pode fazer um
teste de mercado a um certo nmero de pessoas e usar a frequncia observada
de compras para estimar essa probabilidade.
nmero de vezes que o resultado foi observado
:
nmero de vezes que a experincia foi feita
Mtodo subjectivo muitas vezes no possvel realizar experincias para estimar probabilidades. Nestes casos, s o mtodo subjectivo pode ser usado )
so opinies sobre o grau de crena num dado acontecimento.

1.2.1

Conceitos Bsicos

Noo de acontecimento um acontecimento um conjunto de resultados. Por


exemplo, no lanamento do dado podemos denir o acontecimento sair um nmero
par. Este acontecimento o conjunto:
A = f2; 4; 6g :
Qual a probabilidade do acontecimento A? :
P(f2g) + P(f4g) + P(f6g) =

1 1 1
1
+ + = :
6 6 6
2

) Complemento do acontecimento A o conjunto de todos resultados que no


esto contidos no conjunto A.
) repare-se que como a reunio de A e Ac nos d todos os resultados possveis temos
P(A) + P (Ac ) = 1; o que implica
P(Ac) = 1 P (A):
) P(sair 1 no lanamento do dado) =
= 56 .

1
6

) P(no sair 1 no lanamento do dado)

Captulo 1

Introduo

Probabilidade da Unio. O acontecimento A[B, reunio de A com B, o conjunto de


elementos que pertencem a A, a B ou a ambos. O acontecimento A \ B, interseco
de A e B, o conjunto de elementos que pertencem simultaneamente a A e a B.
P(A [ B) = P(A) + P (B) P(A \ B):
) intuio: P(A) a probabilidade de se vericar um resultado em A e P (B) a
probabilidade de se vericar um resultado em B. Ao somarmos P(A) + P(B) estamos a somar duas vezes a probabilidade da ocorrncia de resultados que pertencem
simultaneamente a A e B (A \ B). Por isso, temos que subtrair P(A \ B).
Acontecimentos mutuamente exclusivos os acontecimentos dizem-se mutuamente
exclusivos se s um deles puder acontecer. Por outras palavras, dizer que dois
acontecimentos so mutuamete exclusivos equivalente a dizer que a sua interseco
um conjunto vazio. Isto implica que, se A e B so mutuamente exclusivos ento:
P(A [ B) = P(A) + P(B).
Acontecimentos independentes Acontecimentos podem estar ou no estar relacionados. H acontecimentos que so independentes, isto , o facto de um deles
se vericar nada nos diz sobre a probabilidade do outro acontecimento se vericar
(ex: seja A = Benca ganha o campeonato e B = amanh chove em vora).
Por outro lado, h acontecimentos que so dependentes, o facto de sabermos que
um deles se vericou importante no clculo da probabilidade do outro acontecer.
) Note-se que acontecimentos mutuamente exclusivos no so independentes!!
Probabilidade Condicional suponha-se que inicialmente se estimou que a probabilidade do acontecimento A P(A). Entretanto obtivemos a informao adicional
de que o acontecimento B se vericou. Se A e B estiverem relacionados, o facto de
sabermos que B aconteceu deve levar-nos a reestimar a probabilidade de A acontecer.
Ou seja queremos calcular a probabilidade de A, dado que B se vericou:
P(AjB) =

P (A \ B)
) probabilidade condicional de A dado B.
P(B)

) quando dois acontecimentos so independentes o facto de B acontecer no nos diz


nada sobre a probabilidade de A acontecer. Mas isso signica que P(AjB) = P (A).

Mtodos Quantitativos

) da denio de probabilidade condicional obtemos


P(A \ B) = P(AjB) P(B):
) se A e B forem independentes P (A \ B) = P (A) P(B):
Tabela de contigncia, Probabilidades conjuntas e probabilidade marginal
Masc.
Femin.
Total

Gesto
21
14
35

Engenh.
16
4
20

Artes e L.
145
175
320

Medicina
2
13
15

Outros
6
4
10

Total
190
210
400

Usando as frequncias relativas para calcular as probabilidades conjuntas e marginais:


Gesto
Masc.
Femin.
Total

21
400 = :0525
14
400 = :035
35
400 = :0875

Engenh.

Artes e L.

Medicina

Outros

16
400
4
400
20
400

145
400 = :3625
175
400 = :4375
320
400 = :8

2
400 = :005
13
400 = :0325
15
400 = :0375

6
400 = :015
4
400 = :01
10
400 = :025

= :04
= :01
= :05

Total
190
400
210
400

= :475
= :525
1

) qual P(GestojMasc)?
P(GestojMasc) =

P(Gesto e Masc) :0525


=
= :11053
P(Masc.)
:475

) repare-se que a probabilidade global de se escolher gesto 0:0875.

1.2.2

Teorema de Bayes

Este um resultado fundamental que nos indica como rever as nossas crenas
apriori com a chegada de nova informao. Suponha-se que um indivduo estimou
a probabilidade apriori do acontecimento A. Posteriormente o indivduo obteve
a informao adicional de que B aconteceu. A questo , qual a probabilidade
aposteriori de A acontecer?
P(AjB) =

P(A \ B) P(BjA)P(A)
=
:
P(B)
P (B)

Sejam E1; E2 ; ; Ek acontecimentos mutuamente exclusivos e exaustivos (S = E1 [


E2 [ [Ek) e seja A um outro acontecimento. Queremos encontrar a probabilidade

Captulo 1

Introduo

de Ei dado A.
P(Ei \ A)
P(Ei \ A)
=
P(A)
P(E1 \ A) + P (E2 \ A) + + P(Ek \ A)
P(AjEi)P(Ei)
=
P(AjE1)P(E1) + P (AjE2)P(E2) + + P (AjEk )P (Ek )

P(EijA) =

Exemplo 1: Uma editora manda material publicitrio sobre um livro de texto de


Marketing para 70% dos professores desta disciplina. Verica-se que 40% dos professores que recebem a publicidade compram o livro. Em contrapartida, dos professores que no recebem publicidade s 10% que compram o livro de texto. Qual
a probabilidade de um professor que compra o livro tenha recebido publicidade.
Soluo: Sejam A professor compra o livro, E1 professor recebeu publicidade,
E2 = E 1 professor no recebeu publicidade, temos os seguintes dados:
P(E1) = 0:7; P(E2 ) = 0:3
P(AjE1) = 0:4 e P(AjE2 ) = 0:1:
Queremos saber
P (E1 \ A)
P (AjE1)P(E1)
=
P(E1 \ A) + P(E2 \ A) P(AjE1)P(E1 ) + P (AjE2)P(E2)
0:4 0:7
=
= 0:9032
0:4 0:7 + 0:1 0:3

P(E1jA) =

Exemplo 2 : Uma empresa tem 3 fornecedores de uma dada pea (fornecedores A, B


e C). Registos passados permitem concluir que a proporo de peas que so boas
e que so defeituosas a seguinte:
Boa
Defeito

A
.27
.02

B
.30
.05

C
.33
.03

Perguntas:
Se uma pea for escolhida aleatoriamente no conjunto de todas as peas, qual
a probabilidade que seja defeituosa?
P(Def) = P (Def \ A) + P(Def \ B) + P (Def \ C)
= :02 + :05 + :03 = :1
Logo, a probabilidade de uma pea ser defeituosa 10%.

10

Mtodos Quantitativos

Qual a probabilidade que seja do fornecedor B?


P(B) = P(B \ boa) + P (B \ def) = 0:3 + :05 = 0:35
Qual a probabilidade de uma pea do fornecedor B ser defeituosa?

P (DefjB) =

1.2.3

P(B \ def) 0:05


=
= :1428
P (B)
0:35

Distribuies de Probabilidades

Variveis Aleatrias - No estudo de probabilidades consideram-se fenmenos para os


quais no possvel prever com certeza qual vai ser o resultado (que so aleatrios).
Varivel aleatria uma varivel que pode tomar certos valores numricos dependendo de qual o resultado da experincia aleatria.
) Se a varivel aleatria X s pode tomar valores num conjunto discreto ! varivel
aleatria discreta.
) Se a varivel aleatria pode tomar valores num intervalo ! varivel aleatria
contnua.
) Muitas vezes estamos interessados em saber com que frequncia a varivel aleatria
toma um certo valor, ou um certoconjunto de valores ! isto leva-nos ao conceito de
funo densidade de probabilidade.
Funo de probabilidades de uma varivel aleatria discreta X a funo que a
cada valor da varivel aleatria faz corresponder a probabilidade da sua ocorrncia
f (x) = PX (x) = P(X = x).
! ex: no caso do dado P (X = 1), P(X = 2); .
Propriedades:
i) f (x) 0
P
ii) x2R f (x) = 1, onde R o conjunto de valores que x pode tomar.
P
iii) P(x 2 A) = x2A f (x) onde A R:

Funo cumulativa de probabilidades: para cada valor de x diz-nos qual a probabilidade de a varivel aleatria no exceder x. Isto , F (x) = P(X x).

Captulo 1

11

Introduo

! construir FX para o exemplo dos dados.


Propriedades:
i) 0 F(x) 1

ii) F(x) uma funo no decrescente de x.


iii) F(z) = 0 se z menor que qualquer x 2 R e F (y) = 1 se y maior ou igual que
o maior elemento de R.
Valor Esperado e Varincia
Valor esperado e varincia so duas caractersticas que nos dizem muito sobre a distribuio de uma varivel aleatria. O valor esperado o valor mdio da varivel aleatria,
onde a mdia uma mdia ponderada pelas probabilidades de cada resultado.
Valor Esperado da v.a. X:
E(X) =

xf (x)

x2R

quando este somatrio existe (este comentrio aplica-se em todas as outras denies).
Ex: Qual o valor esperado da v.a. lanamento do dado?
1
1
1
1
1 + 2 + + 6 = (1 + 2 + 3 + 4 + 5 + 6) = 3; 5
6
6
6
6
Propriedades do Valor Esperado
Se c uma constante, E(c) = c. Porqu?
E [cX] = cE [X].

R cf (x)

=c

R f (x)

= c.

E [X + c] = E [X] + c
Varincia - o valor esperado do quadrado dos desvios em relao a .

X
2 = E (X )2 =
(x )2f (x)
x2R

Propriedades da Varincia


2 = E X 2 2. Porqu? E (X )2 = E X 2 2X + 2 = E X 2

2E [X] + 2 = E X 2 2
Se X v.a. com X e 2X e Y = aX + b ento Y = aX + b e 2X = a2 2X .

12

Mtodos Quantitativos

1.3
1.3.1

Distribuies Discretas
Bernoulli

Suponhamos que um certo fenmeno aleatrio tem s dois resultados possveis:


Sucesso ! X = 1 e Insucesso ! X = 0. A funo de probabilidades
inteiramente descrita pela probabilidade de obter X = 1.
(
p
se x = 1
f (x)
1 p se x = 0
Qual a mdia de uma v.a. Bernolli?
= 0 (1 p) + 1 p = p
Qual a varincia de uma v.a. Bernolli?

1.3.2

2 = E(X 2) 2 = 02 (1 p) + 12 p p 2 = p p2 = p(1 p)

Binomial

uma generalizao da distribuio anterior. A ideia que a experincia aleatria anterior


repetida vrias vezes. Seja p - probabilidade de sucesso em cada experincia e n
nmero de repeties independentes. Agora o nmero de sucessos nas n tentativas pode
estar entre 0 e n. A funo de probabilidades binomial descreve qual a probabilidade de
obter x sucessos nas n tentativas.
Para perceber qual a probabilidade de obter exactamente x sucessos, note-se:

px(1 p)nx a probabilidade de obter uma sequncia com x sucessos.


h (nx) =

n!
x!(nx)!

maneiras de obter em n experincias x sucessos.

Logo f(x) = PX(x) =

n!
x!(nx)!

px(1 p)nx para x = 0; 1; ; n.

) os parmetros que denem a binomial so n e p, por isso costume usar a


notao b(n; p) para designar uma funo de probabilidades binomial em que
a probabilidade de sucesso em cada experincia p e o nmero de vezes que a
experincia repetida n.
Qual a mdia de uma v.a. Binomial b(n; p) ?

Captulo 1

13

Introduo

= np
Porqu? X = X 1 + X2 + + Xn (soma de n Bernolli independentes). Valor esperado
da soma soma dos valores esperados.
Qual a varincia de uma v.a. Binomial?
2 = E(X 2) 2 = np(1 p)

1.3.3

Hipergeomtrica

A binomial supe independncia entre as n repeties ) ou que h reposio ou ento a


populao to grande que repr ou no no interessa. Se a populao for pequena e no
houver reposio a distribuio adequada a hipergeomtrica.
H um grupo de N objectos entre os quais h S sucessos. A funo densidade de
probabilidade do nmero de sucessos em n experincias
S NS
x

nx

(N
n)

Qual a mdia de uma v.a. Hipergeomtrica?

= np
Porqu? X = X 1 + X2 + + Xn (soma de n Bernolli independentes). Valor esperado
da soma soma dos valores esperados.
Qual a varincia de uma v.a. Hipergeomtrica?
2 =

1.3.4

Nn
np(1 p)
N 1

Multinominal

Se em vez de haver s dois resultados possveis em cada experincia houver k resultados


possveis, sendo p1, p 2, , p k as respectivas probabilidades podemos perguntar-nos qual
a probabilidade de nas n experincias obter n1 vezes o primeiro resultado, n2 vezes o
segundo resultado e por a adiante.

14

Mtodos Quantitativos

1.3.5

Geomtrica

Queremos saber probabilidade do primeiro sucesso ocorrer na x-sima tentativa


f (x) = (1 p)x1p

onde x = 1; 2;

Mdia e Varincia
=

1.3.6

1
p

e 2 =

1 p
p2

Binomial Negativa

Qual a probabilidade do r-simo sucesso acontecer na tentativa x? X- tentativa em que


acontece o r-simo sucesso


xr r1
xr r
f (x) = p x1
p
= x1
p
r1 (1 p)
r1 (1 p)
Mdia e Varincia

1.3.7

r
p

e 2 = r

1 p
p2

Uniforme discreta

Diz-se que X tem distribuio uniforme nos inteiros 1; 2; ; m se f (x) =


Mdia e Varincia
=

1.3.8

m+1
2

2 =

1
m

m2 1
12

Poisson

Se para pequenos intervalos de tempo a probabilidade de ocorrncia de exactamento um


acontecimento for proporcional ao intervalo de tempo (dt), se a probabilidade de duas
ocorrncias no mesmo intervalo de tempo for neglincencivel quando comparada com a
probabilidade de uma ocorrncia, se o nmero de ocorrncias em dois intervalos distintos
forem independentes a distribuio Poisson
f(x) =

e x
x!

x = 0; 1; 2;

Mdia e Varincia
= e

2 =

Captulo 1

1.4

15

Introduo

Distribuies Contnuas

Se o conjunto de valores que a v.a. pode tomar for um intervalo ou unio de intervalos
a varivel aleatria contnua. Neste caso a probabilidade de observar um valor em
particular zero. Mas faz sentido calcular
Z b
P(a < x < b) =
f(x)dx
a

A funo densidade de probabilidades da v.a. contnua X uma funo integrvel f (x)


que satisfaz
i) f (x) 0; x 2 R
R
ii) R f (x)dx = 1

iii) A probabilidade de um acontecimento A P(X 2 A) =


A funo distribuio
F(x) = P(X x) =

A f (x)dx

f (x)dx

) P (a < x < b) = F (b) F(a)


Mdia e Varincia

E(X) =

1.4.1

xf(x)dx e =

(x )2f (x)dx

Uniforme (Rectangular)

Um ponto escolhido de forma justa no interval [a; b].


f (x) =
Mdia e Varincia

E(X) =

1
;
b a

a xb

a +b
(b a)2
e 2 =
2
12

16

Mtodos Quantitativos

1.4.2

Exponencial

Est relacionada com a Poisson. X- mede o tempo decorrido entre duas ocorrncias sucessivas = tempo de espera at primeira ocorrncia. A funo densidade de probabilidades

1 x
f (x) = e

1.4.3

0 x<1

Normal

a distribuio mais importante em estatstica. Funo densidade em forma de sino (uma


concentrao mais elevada de valores em torno da mdia, e pouca densidade nos valores
muito afastados da mdia).
A funo densidade de probabilidades
(x)2
1
f(x) = p
e 22
22

com 1 < x < 1

Mdia e Varincia
E(X ) = e

Var(X) = 2

Notao X N (; 2 )
Se X N(; 2) e Z =

ento Z N(0; 1)

Captulo 2

Programao Linear

A programao linear estuda a resoluo de um certo tipo de problemas de optimizao. Na formalizao matemtica de qualquer problema de optimizao importante
identicar:
Qual o objectivo a expresso matemtica que descreve o objectivo a funo
objectivo.
) ex: maximizar lucro, minimizar custos.

As variveis de deciso quais so as variveis sobre as quais o agente tem controle. Para alm das variveis de deciso pode haver outras variveis (parmetros) que no esto sob o controle do decisor mas que inuenciam o problema.
) ex. de variveis de deciso: quantidade a produzir.
As restries do problema normalmente as variveis de deciso no podem
tomar valores arbitrrios, h restries que tm que ser levadas em conta.
) ex: restries de capacidade, restries oramentais, restries de no-negatividade.
Em problemas de programao linear a funo objectivo e as restries do problema
so funes lineares.

2.1

Resoluo Grca

Para ilustrar a resoluo grca vamos considerar o seguinte problema:


Oblix anda a gastar muito dinheiro com a sua alimentao! Por isso, resolveu
conversar com Nutrix, o nutricionista. Nutrix explicou a Oblix que, para se
manter saudvel, ele deve ingerir diariamente doses mnimas de protenas e vitaminas. Oblix consome dois bens: carne e hortalia. A quantidade de protenas e

18

Mtodos Quantitativos

vitaminas em cada quilo de carne e hortalia, bem como a dose mnima diria destes
nutrientes so apresentadas no quadro que se segue:

Protenas
Vitaminas

Carne
(kg)
8
2

Hortal.
(kg)
4
6

Dose mn.
diria
40
45

O preo da carne 10 u.m. e o preo da hortalia de 4 u.m. Designe por x1 e x2


as quantidades consumidas de carne e de hortalia, respectivamente. O problema
de Oblix escolher a dieta que minimiza a despesa com a alimentao, mas que
satisfaz as recomendaes de Nutrix.
Quais so as variveis de deciso do Obelix?

) So quanto consumir de carne, x1, e quanto consumir de hortalia, x2.

Qual a funo objectivo do Obelix?

O Obelix pretende minimizar a despesa com a alimentao. Como o preo da carne


10 a despesa em carne 10x1 (preo vezes quantidade consumida de carne). De
forma semelhante, como o preo da hortalia 4 a despesa em hortalia 4x2. Por
conseguinte a despesa total com alimentao :
D(x1; x2) = 10x1 + 4x2

Quais so as restries que o Obelix tem que satisfazer?


A restrio do consumo mnimo de protenas o consumo de protenas tem de
ser maior ou igual que 40.
Ou seja:
8x1
|{z}

protenas ingeridas pelo consumo de carne

4x2
|{z}

protenas ingeridas pelo consumo de hortalia

A restrio do consumo mnimo de vitaminas o consumo de vitaminas tem


de ser maior ou igual a 45:
2x1 + 6x2 45

40

Captulo 2

19

Programao Linear

x2

conjunto de
oportunidades

x1

Figura 2.1: Conjunto de oportunidades do Obelix.

O consumo de carne e de hortalia no pode ser negativo. Ou seja:


x1 0; x2 0
) estas restries chamam-se restries de no-negatividade.
Com base no que acabamos de ver, o problema do Obelix pode formalizar-se da
seguinte forma:
min 10x1 + 4x2

x1;x2

sujeito a:
8x1 + 4x2 40;
2x1 + 6x2 45;

x1 0; e x2 0:

Vamos comear por representar gracamente o conjunto de oportunidades ou regio


admissvel deste problema. O que o conjunto de oportunidades? o conjunto
de valores das variveis de deciso que satisfazem todas as restries do problema.
So os valores das variveis de deciso que admissveis. O decisor pode escolher
qualquer ponto no conjunto de oportunidades, mas no pode escolher pontos que
no pertenam a este conjunto, pois isso violaria alguma das restries do problema.
Na Figura 2.1 est representado o conjunto de oportunidades do problema do Obelix.

20

Mtodos Quantitativos

O decisor pode escolher qualquer ponto no conjunto de oportunidades. Que ponto


que deve escolher? Aquele que for melhor em termos do objectivo do decisor. No caso
do Obelix, o que ele deve fazer encontrar o ponto do conjunto de oportunidades
onde a despesa com a alimentao tem um valor mais baixo. Como fazer isso?
A ideia representar no grco anterior as curvas de nvel da funo objectivo. Uma
curva de nvel o conjunto de pontos para o qual a funo toma um dado valor. No
nosso problema uma curva de nvel da funo despesa d-nos as vrias combinaes
de (x1; x2 ) que correspondem a um dado nvel de despesa. Por exemplo, o conjunto
de pontos em que a despesa igual a 20 dado pela recta:
10x1 + 4x2 = 20
O conjunto de pontos onde a despesa 50 dado por:
10x1 + 4x2 = 50
E por a adiante,...
Repare-se que as curvas de nvel da funo despesa so rectas, todas paralelas. E o
nvel de despesa est a aumentar medida que as rectas se afastam da origem (
medida que nos deslocamos na direco nordeste). Podamos chamar a estas rectas:
rectas de isodespesa.
) Em qualquer problema de programao linear, como a funo linear, as curvas
de nvel so sempre rectas.
Como o objectivo minimizar a despesa, o Obelix quer escolher o ponto do conjunto
de oportunidades que est na recta isodespesa mais baixa possvel. Esse ponto, a
soluo do problema. Na Figura 11.1 esto representadas as rectas de isodespesa e
o ponto ptimo do problema do Obelix.
) O Obelix no deve consumir nada de carne, x1 = 0 e deve consumir x2 = 10.
Na soluo encontrada h algumas restries que so activas e outras que o no
so. Uma restrio activa no ponto ptimo se for satisfeita em igualdade. No
problema do Obelix a restrio das protenas activa, ou seja o consumo de protenas
exactamente 40 unidades. A restrio de no negatividade x1 0 tambm
activa. Em contrapartida, no ptimo o Obelix consome mais vitaminas do que a
dose mnima, logo a restrio das vitaminas no activa.

Captulo 2

21

Programao Linear

x2
ponto
ptimo
conjunto de
oportunidades

rectas de
isodespesa

x1

Figura 2.2: Ponto ptimo do problema do Obelix.

) podemos calcular a varivel surplus de vitaminas qual o montante consumido


para alm da dose mnima.

2.1.1

Pontos extremos e soluo ptima

Vamos usar a resoluo grca para ilustrar uma propriedade muito importante
da soluo dos problemas de programao linear: a soluo ocorre sempre num
dos vrtices ou cantos da regio admissvel. Em programao linear esses
vrtices so chamados pontos extremos da regio admissvel. Os pontos extremos
correspondem a pontos de interseco de restries do problema.
) No problema do Obelix os pontos extremos so: (0; 10), ( 32 ; 7) e ( 45
2 ; 0).
Para ilustrar a ideia mencionada vamos vericar qual seria a soluo se os preos da
hortalia ou da carne se alterassem de forma a fazer mudar a inclinao das rectas
de isodespesa.
Suponhamos que p 1 = 6 e p2 = 6, o que implica que a funo despesa agora
D = 6x1 + 6x2
) neste caso o ptimo ocorre no ponto extremo ( 32 ; 7). A Figura 2.3 ilustra
este caso.
Se p 1 = 2 e p2 = 8 a funo despesa D = 2x1 + 8x2
) neste caso o ptimo ocorre no ponto extremo ( 45
2 ; 0):

22

Mtodos Quantitativos

x2

x1

Figura 2.3: Ponto ptimo para p 1 = p 2 = 6.

Generalizar os exemplos, relacionando os declives das rectas de isodespesa com


os declives das restries. Seja m o declive da recta de isodespesa. Note-se que
m = pp12 . Ento:
Se m 2 (isodespesa muito inclinada) o ponto optimizante (0; 10):
Se 2 m 13 o ponto optimizante ( 32 ; 7)
Se m 13 o ponto optimizante ( 45
2 ; 0):

2.1.2

Casos especiais

Vrios pontos optimizantes Se o declive da curva de nvel da funo objectivo coincidir com o declive duma das restries h uma innidade de pontos que optimizam
a funo objectivo.
Problema impossvel isto corresponde a uma situao em que no existe nenhum
ponto que satisfaa simultaneamente todas as restries do problema. Por outras
palavras, o conjunto de oportunidades um conjunto vazio. Vejamos um exemplo
para ilustrar este caso. Uma empresa produz dois produtos, e usa trs materias
como inputs na produo desses produtos. A tabela seguinte apresenta os materiais
necessrios para produzir uma unidade de cada produto:
Material 1
Produto 1
Produto 2
Quant. Disponvel

2
5
1
2

20

Material 2
0

Material 3

1
5

3
5
3
10

21

Captulo 2

Programao Linear

23

A gesto da empresa diz ao gestor da produo que tem que produzir no mnimo 30
unidades do produto 1 e 15 unidades do produto 2.
Este problema tem 5 restries: 3 referem-se ao montante disponvel de cada material
e duas aos valores mnimos da produo. Seja x1 a quantidade produzida do produto
1 e x2 a quantidade produzida do produto 2. As restries so:
8
2
1
>
>
5 x1 + 2 x 2 20
>
>
<
1x 5
5 2
3
3
> 5 x1 + 10
x2 21
>
>
>
: x 30 e x 15
1
2

Se representarmos estas restries chegamos concluso que a regio admissvel


um conjunto vazio.
) podemos informar a gesto que ter que adquir mais matrias primas se quiser
produzir os montantes desejados de x1 e x2.
A soluo ilimitada Num problema de maximizao isso signicaria que era
possvel tornar o valor da funo objectivo to grande quanto ns quisermos, num
problema de minimizao seria possvel tornar o valor da funo objectivo to pequeno quanto desejarmos.
) Isto acontece se o conjunto de oportunidades no for limitado.
) Em problemas reais se isto acontecer deve ser porque o problema no foi bem
formulado (talvez nos tenhamos esquecido de alguma restrio.

2.1.3

Anlise de sensibilidades

A anlise de sensibilidades o estudo de como variaes nos parmetros do problema


de programao linear afectam a soluo ptima:
Se variarmos os coecientes da funo objectivo como isso afecta a soluo
ptima? No problema do Obelix isto equivalente a perguntar: como varia a
soluo se os preos da carne e da hortalia se alterarem?
Se variarmos o lado direito das restries como que isso afecta o ptimo?
) a anlise de sensibilidades importante porque em problemas reais natural
haver modicaes: preos variam ao longo do tempo, a procura varia,...

24

Mtodos Quantitativos

) a anlise de sensibilidade permite identicar quais so os coecientes relativamente


aos quais a soluo mais sensvel (esses parmetros vo ter que ser estimados com
muito mais preciso).
Alterao nos coecientes da funo objectivo Ns j zemos um pouco de anlise
de sensibilidades no problemaAl do Obelix. J vimos como que a soluo se alterava
se os preos da carne e hortalia fossem outros. Vamos agora fazer isso de forma
um pouco mais estruturada. Vamos manter um dos coecientes da funo objectivo
constante e fazer variar o outro coeciente.
Uma pergunta interessante : quanto que podemos variar o coeciente, sem
que haja alterao no ponto ptimo? A resposta a esta pergunta indica-nos o
intervalo de optimalidade do coeciente.
No exemplo do Obelix, consideremos p1 = 10 e vejamos qual o intervalo de
optimalidade para p 2.
) desde que p2 2 (0; 5] a soluo no se altera.

O intervalo de optimalidade s pode ser utilizado quando apenas um dos coecientes varia. Se os dois coecientes da funo objectivo variarem simultaneamente para vericarmos o que acontece soluo mptima basta vermos o que
acontece ao declive das curvas de nvel da funo objectivo. No exemplo do
Obelix:
p1x1 + p2x2 = D , x2 =

D
p1

p1

p2
|{z}

x1

declive da recta de isodespesa

Ou seja, temos que olhar para o rcio pp12 .

Alteraes no lado lado direito da restrio Para exemplicar admita-se que o


Nutrix diz ao Obelix que um novo estudo cientco defende que a dose mnima
diria de protinas 50. Qual a alterao no valor ptimo da funo objectivo que
da resulta? A Figura 2.4 mostra como que o conjunto de oportunidades e o ponto
ptimo se alteram se a dose mnima de protenas for 50 em vez de 40.
) repare-se que o conjunto de oportunidades se tornou mais pequeno. Como o
decisor tem menos opes, bvio que a sua situao nunca pode melhorar.
) o novo ponto ptimo (x1; x2) = (0; 12:5) e a despesa mnima 50. A despesa
aumentou 10.

Captulo 2

25

Programao Linear

x2

conjunto de
oportunidades

x1

Figura 2.4: Alterao do conjunto de oportunidades e do ponto ptimo se o valor mnimo de


protenas for 50.

A variao no valor ptimo da funo objectivo quando o lado direito de uma restrio aumenta de uma unidade chama-se o preo sombra ou preo dual. O preo
sombra indica-nos o valor que implicitamente o decisor d a ter mais uma unidade
daquele recurso.
) temos que ter cuidado ao usar o preo dual no caso de variaes grandes no lado
direito da restrio. Com variaes grandes pode haver alterao do ponto extremo
ptimo, e as restries que so activas mudam.
) uma restrio que no activa tem um preo dual nulo.

2.2

Resoluo com Excel

Para resolver um problema de programao linear com o excel temos que escolher no
menu Tools, e de seguida escolher Solver. O spreadsheet deve estar bem organizado
para facilitar o uso do solver. Uma boa ideia :
Na coluna A por a funo objectivo: Por exemplo, na cela A4 escrever 10
$C$4 + 4 $C$5
Na coluna B por nome das variveis
Deixar a coluna C com as celas livres. Ser a que o excel colocor os valores
ptimos das variveis de deciso. Para alm disso, essas celas so mencionadas

26

Mtodos Quantitativos

tanto na funo objectivo como nas restries. No nosso exemplo as celas


deixadas para esse efeito so $C$4 e $C$5.
Na coluna D colocar o lado esquerdo das restries. No exemplo do Obelix
teramos quatro linhas:
8 $C$4 + 4 $C$5
2 $C$4 + 6 $C$5
$C$4
$C$4
Na coluna E colocar o lado direito das restries. No nosso exemplo:
40
45
0
0
Depois da informao organizada chama-se o solver e identicam-se os parmetros
que so pedidos:
Set target Cell dizer em que cela que est a funo objectivo $A$4
By Changing cell dizer em que celas que devem ser colocados os valores das
variveis de deciso $C$4 e $C$5:
Subject to the constraints: escrever as restries.
$D$4 < = $E$4
$D$5 < = $E$5
$D$6 > = $E$6
$D$7 > = $E$7
Pode selecionar-se report para ter informao mais detalhada sobre a soluo.

2.3
2.3.1

Aplicaes
Seleco do mix de publicidade

Admita que o director de marketing de um condomnio de luxo recentemente


construdo. O seu problema escolher a forma de publicitar o produto em questo,
sabendo que dispe de um determindo oramento.

Captulo 2

27

Programao Linear

Suponha que os meios publicitrios sua disposio so: anncios na TV, jornal
dirio, revista semanal e anncios no rdio. Na tabela seguinte so apresentados os
custos de cada tipo de anncio, a audincia atingida por cada anncio e o nmero
mximo de anncios por semana.
Anncios na TV
Jornal Dirio
Revista Semanal
Rdio

Audincia
5000
8500
10000
2500

Custo por anncio


800
925
1000
380

Nomximo de anncios
12
5
1
20

Admita que o oramento para despesas semanais em publicidade 8000 contos. Para
alm disso, um contrato com a rdio obriga-o a colocar no mnimo 5 anncios por
semana. Para alm disso, a gesto no permite que o montante gasto em revistas e
jornais ultrapasse 4000 contos.
O seu maximizar a nmero de consumidores potenciais que cam a conhecer o
produto.
Designemos por x1 o node anncios de TV, x2 o nmero de anncios no jornal, x3
node anncios na revista semanal e x4 o no de anncios na rdio. O problema anterior
formaliza-se da seguinte maneira:
max

x1 ;x2 ;x3 ;x4

s.a.

8
>
>
>
>
>
>
>
>
>
>
>
<
>
>
>
>
>
>
>
>
>
>
>
:

5000x1 + 8500x2 + 10000x3 + 2500x4

x1 12
x2 5
x3 1
x4 20
800x1 + 925x2 + 1000x3 + 380x4 8000
925x2 + 1000x3 4000
x1 0; x2 0; x3 0 e x4 5

A soluo deste problema x1 = 0; x2 =

120
37 ; x 3

= 1 e x4 =

Vamos vericar quais as restries que so activas:

200
19 .

28

Mtodos Quantitativos

0 < 12 no activa
< 5 no activa
1 = 1 activa
200 < 20 no activa
19
200
800 0 + 925 120
37 + 1000 + 380 19 = 8000 activa
925 120
37 + 1000 = 4000 activa
x1 0; x2 0; x3 0 e x4 5 no so activas
120
37

2.3.2

Marketing Research

Market Survey, Lda uma empresa especializada em estudos de mercado. Um cliente


da Market Survey (MS ), est interessado em conhecer a reaco dos consumidor
a um produto recentemente comercializado. O cliente quer que a MS realize 1000
entrevistas de porta a porta, a agregados familiares com e sem crianas. No contrato
assinado com o cliente a MS comprometeu-se a satisfazer os seguintes requesitos:
Pelo menos 400 agregados familiares tm que ter crianas.
Pelo menos 400 agregados familares no tm crianas
O nototal de entrevistas durante a noite tem que ser pelo menos to elevado
como o nmero de entrevistas durante o dia.
Pelo menos 40% das entrevistas a agregados com crianas deve ser feita durante
a noite.
Pelo menos 60% das entrevistas a agregados sem crianas deve ser feita durante
a noite.
Como as entrevistas a agregados com crianas demoram mais tempo e os entrevistadores que trabalham noite tem um salrio mais elevado, os custos dependem do
tipo de agregado e de quando feita a entrevista. A tabela de custos a seguinte:
Com crianas
Sem crianas

Dia

Noite

20
18

25
20

Qual o plano de entrevistas que satisfaz o contrato da MS com custo mnimo?


As variveis de deciso do problema da MS so:

Captulo 2

C1
C2
S1
S2

29

Programao Linear

n ode entrevistas
n ode entrevistas
n ode entrevistas
n ode entrevistas

durante
durante
durante
durante

o
a
o
a

dia a agregados com crianas


noite a agregados com crianas
dia a agregados sem crianas
noite a agregados sem crianas

O problema da MS pode formalizar-se como se segue:


min 20C1 + 25C2 + 18S1 + 20S2
sujeito a:
C1 + C2 + S1 + S2 = 1000
C1 + C2 400
S1 + S2 400
C2 + S2 C1 + S1

C2 0:4(C1 + C2 )
S2 0:6(S1 + S2 )

S1 0; C1 0; S2 0 e C2 0
O ponto minimizante : C1 = 240, C2 = 160, S1 = 240 e S2 = 360:
Podemos ainda vericar que a primeira e segunda restries so activas, a terceira e
a quarta no so activas, a quinta e a sexta restries so tambm activas:
240 + 160 + 240 + 360 = 1000
240 + 160 400
240 + 360 400 ) +200 entrevistas do que mnimo exigido a agregados sem crianas
160 + 360 240 + 240 ) +40 entrevistas de noite que mnimo exigido
160 = 0:4(240 + 160)
360 = 0:6(240 + 360)

2.3.3

Seleco da carteira de activos

Os gestores de fundos de investimento, bancos, companhias de seguros, tm que


frequentemente escolher como investir um dado montante num determinado conjunto
de activos. O objectivo normalmente maximizar o a rentabilidade esperada da
carteira ou minimizar o risco da carteira. As restries podem ter a ver com risco
mximo permitido, tipo de investimentos que so permitidos, restries legais,...

30

Mtodos Quantitativos

Suponhamos que a empresa Diana Seguros tem neste momento 200 mil euros para
investir e est a considerar comprar aces de 4 empresas diferente. O preo por
aco, a rentabilidade mdia anual e a medida do risco de cada aco a indicada
na tabela seguinte:
Preo por aco
Taxa de rentabilidade
Medida de risco

A
100
0:12
0:10

B
50
0:08
0:07

C
80
0:06
0:05

D
40
0:10
0:08

Admita que a Diana Seguros pretende obter uma rentabilidade mdia superior ou
igual a 9% e que no pode investir mais de 50% em nenhuma das aces.
Qual a carteira de activos que minimiza o risco sujeita s restries de rentabilidade
mdia e de diversicao?
Designando por A, B, C e D o node aces adquiridos de cada uma das empresas, o
problema da Diana Seguros pode formalizar-se:
min 0:1A + 0:07B + 0:05C + 0:08D
sujeito a:
100A + 50B + 80C + 40D = 200000
0:12A + 0:08B + 0:06C + 0:10D 0:09

100A 100000
50B 100000
80C 100000

40D 100000

A 0; B 0; C 0 e D 0

O mnimo ocorre no pontoA = 1000, B = 0, C = 1250, D = 0:

2.3.4

Planeamento da produo

Uma das aplicaes mais importantes de programao linear no planeamento da


produo durante vrios perodos. O gestor da produo tem que determinar quanto
produzir de cada produto, em cada perodo, de forma a minimizar os custso, levando em conta as restries da procura, as restries de capacidade, as restries da
quantidade de trabalho, e o espao disponvel para stocks.

Captulo 2

31

Programao Linear

Consideremos o problema da empresa Eletrnix que produz duas componentes electrnicas para um fabricante de avies. O cliente da Eletrnix informa a empresa das
quantidades necessrias das duas componentes no trimestre seguinte. Admita que a
encomenda recebida pela Eletrnix para o primeiro trimestre do ano :
Componente
402B
505A

Janeiro
2000
1000

Fevereiro
1500
2000

Maro
5000
3000

Designemos por xim a quantidade produzida da componente i no ms m (com m =


1; 2; 3). O indice i = 1 refere-se componente 402B, o ndice i = 2 refere-se
componente 505A.
Os custos da Eletrnix incluem os custos de produo e os custos de stocks. Admitase que o custo de produo de uma unidade da componente 402B 20 e o custo de
produo de uma unidade da componente 505A 10.
O custo de armazenagem por ms 0:5 para a componente 402B e 0.25 para a
componente 505A. Para simplicar admita-se que o stock mdio igual ao stock no
nal do perodo. Designemso por sim o stock da componente i no nal do ms m.
O stock no nicio do ms de Janeiro de 500 unidades da componente 402B e 200
unidades da componente 505A e a Eletronix deseja ter um stock mnimo no nal de
Maro de 250 para ambas as componentes.
Para alm disso, a Eletronix defronta restries de capacidade, trabalho e espao
de armazenagem. O node horas mquina disponvel por ms 500, o node horas de
trabalho disponvel por ms 400 e o espao disponvel 500 metros quadrados.A
tabela seguinte apresenta a quantidade necessria de cada um destes inputs para
uma unidade de cada produto:
Componente
402B

Mquina (horas/un)
0:1

Trabalho (horas/un)
0:05

Espao (m2/un)
0:02

505A

0:08

0:07

0:05

O problema anterior pode formalizar-se da seguinte forma:


min 20(x11 + x12 + x13 ) + 10 (x21 + x22 + x23) + 0:5(s11 + s12 + s13) + 0:25 (s21 + s22 + s23)

32

Mtodos Quantitativos

sujeito s restries da procura


(
(
(

500 + x11 s11 = 2000


200 + x21 s21 = 1000
s11 + x12 s12 = 1500
s21 + x22 s22 = 2000
s12 + x13 s13 = 5000
s22 + x23 s23 = 3000

sujeito s restries dos stocks no nal de Maro


(
s13 250
s23 250
sujeito s restries de capacidade:
8
>
< 0:1x11 + 0:08x21 500
0:1x12 + 0:08x22 500
>
:
0:1x13 + 0:08x23 500
8
>
< 0:05x11 + 0:07x21 400
0:05x12 + 0:07x22 400
>
:
0:05x13 + 0:07x23 400
8
>
< 0:02s11 + 0:05s21 500
0:02s12 + 0:05s22 500
>
:
0:02s13 + 0:05s23 500

e, nalmente as restries de no negatividade das 12 variveis de deciso.

Captulo 3

Teoria de Deciso

O processo de tomada de deciso tem vrias etapas:


Identicao do problema
Identicao das vrias alternativas
Identicao dos possveis estados da natureza (o que que pode acontecer no
futuro que inuencie os payos obtidos).
Determinao dos payos obtidos com cada uma das alternativas, nos vrios
estados da natureza.
Escolha de um critrio de deciso
Aplicao do critrio para escolher a melhor alternativa
Exemplo: Quero decidir se devo ou no construir uma fbrica para produzir um
determinado produto. As alternativas que tenho podem ser: construir uma fbrica
grande, construir uma fbrica pequena ou no construir. Os resultados que vou
obter dependem do estado do mercado no futuro: o mercado pode ser favorvel ou
no. Os payos que obtenho com cada uma das alternativas nos diferentes estados
da natureza podem ser descritos por uma matriz:
Fbrica grande
Fbrica pequena
No construir

Favorvel
1000
500
0

No Favorvel
500
100
0

) Esta matriz chama-se matriz de payos.


Uma representao alternativa do problema anterior usar uma rvore de deciso.
Uma rvore de deciso uma representao grca do problema, que mostra a

34

Mtodos Quantitativos

sequncia lgica ao longo do tempo. No problema anterior, a rvore de deciso


comea por representar a escolha da fbrica e, aps essa deciso ter sido feita, um
dos estados da natureza ocorrer.
Uma rvore de deciso constituda por ns e ramos. Os ns so pontos de
interseco, os ramos so os arcos que ligam os ns. H dois tipos de ns nas rvores
de deciso
Ns de deciso que representam pontos onde o decisor tem que escolher entre
vrias alternativas. So representados por um quadrado.
Ns de incerteza que apresentam os possveis estados da natureza, um dos
quais ocorrer. So representados por um crculo.
Deciso em contexto de certeza se o decisor sabe com exactido as consequncias
de cada uma das alternativas a deciso feita em contexto de certeza. No exemplo
anterior, se eu tiver a certeza absoluta que o mercado vai ser favorvel, eu sei que
uma fbrica grande ter um payo mais elevado do que qualquer das alternativas.
Neste caso a deciso bastante fcil.
Outro exemplo: se tiver 1000 contos para investir durante um ano e quiser decidir
entre duas aplicaes sem risco: uma um depsito a prazo com uma taxa de 5%, a
outra uma obrigao do estado com 8% de taxa, estou a decidir em contexto de
certeza porque sei exactamente quanto vou receber daqui a uma ano com ambos os
investimentos.
Deciso em contexto com risco neste caso h vrias possibilidades, h vrios estados
da natureza, mas o decisor conhece com exactido a probabilidade de ocorrncia de
cada um dos estados da natureza. As probabilidades so probabilidades objectivas
(ex: lanamento do dado).
Deciso em contexto de incerteza as probabilidades de cada um dos estados da
natureza no so conhecidas.
) Se o decisor conseguir atribuir probabilidades a cada um dos estados da natureza
(probabilidade subjectiva) pode aplicar critrios de deciso semelhantes ao caso de
deciso com risco
) Mas, h evidncia que sugere que risco e incerteza no so equivalentes para o
decisor. O paradoxo de Ellesberg mostra que a maioria das pessoas prefere a situao
de risco.

Captulo 3

3.1

35

Teoria de Deciso

Critrios de deciso sem probabilidades

Nesta seco vamos estudar critrios de deciso que no requerem o uso de probabilidades. Isto pode ser relevante nos casos em que o decisor tem diculdade em
atribuir probabilidades aos vrios estados da natureza.

3.1.1

Critrio Optimista

O critrio optimista avalia cada alternativa considerando o melhor resultado que


poder ocorrer se aquela alternativa for escolhida. A alternativa recomendada no
critrio optimista aquela que apresenta o melhor payo.
No nosso exemplo, se a alternativa escolhida for construir uma fbrica grande, o
melhor resultado que pode ocorrer 1000. Se a alternativa escolhida for construir
uma fbrica pequena, o melhor resultado que pode acontecer 500. Se a alternativa
escolhioda for no construir a fbrica o melhor dos payos 0. Na tabela seguinte
est indicado a bold o resultado mais favorvel para cada uma das alternativas. A
alternativa que apresenta o melhor (dos melhores) payo construir uma fbrica
grande.
Fbrica grande
Fbrica pequena
No construir

Favorvel
1000
500
0

No Favorvel
500
100
0

O critrio optimista muitas vezes designado por critrio maxmax (se o problema
for de mximo) ou minmin (se o problema for de mnimo). A razo para esta nomenclatura prende-se com o processo de encontrar a alternativa ptima. Num problema
de maximizao, por exemplo, a ideia encontrar primeiro o valor mximo em cada
linha da matriz de payos (o melhor resultado possvel para cada alternativa) e,
depois, encontrar o valor mximo entre os valores mximos encontrados para cada
linha (escolher a alternativa com o maior valor mximo).
Designando por Vij o payo que corresponde linha i e coluna j, se o problema
for de mximo o que fazemos :

max max Vij


i

36

Mtodos Quantitativos

A hiptese implcita neste critrio que a incerteza se resolve sempre a favor do


decisor. O estado da natureza que ocorre o mais favorvel tendo em conta a
alternativa escolhida.
Outro exemplo: Uma empresa est a decidir se deve produzir internamente uma
pea, ou se deve compr-la. O lucros obtidos dependem claramente da procura do
produto nal, como se verica na matriz de payos:
Fabricar a pea
Comprar a pea

Baixa
30
20

Mdia
30
40

Alta
100
70

Aplicando o critrio optimista, a deciso fabricar a pea.

3.1.2

Critrio Pessimista

O critrio pessimista avalia cada alternativa considerando o pior resultado que pode
ocorrer se aquela alternativa for escolhida. A alternativa escolhida aquela que tiver
o melhor dos piores resultados.
No nosso exemplo, se a alternativa escolhida for construir uma fbrica grande, o pior
resultado possvel 500. Se a alternativa escolida for construir uma fbrica pequena
o pior resultado possvel 100. Se a alternativa escolhida for no construir fbrica
o pior resultado possvel 0. A alternativa que tem o melhor dos piores resultados
no construir a fbrica.
Fbrica grande
Fbrica pequena
No construir

Favorvel
1000
500
0

No Favorvel
500
100
0

) repare-se que a alternativa escolhida diferente da escolhida com o critrio optimista. O estado da natureza que ocorre sempre o pior possvel, tendo em conta a
alternativa escolhida.
O critrio pessimista muitas vezes designado por maxmin (em problemas de maximizao), ou minmax (em problemas de minimizao). Num problema de maximizao a ideia encontrar primeiro o valor mnimo em cada linha (o pior resultado para
cada alternativa), e depois encontrar o valor mximo entre os mnimos encontrados

Captulo 3

37

Teoria de Deciso

para cada linha. Por outras palavras, o que fazemos :

max min Vij :


i

A hiptese implcita neste critrio que a incerteza se resolve sempre contra o decisor.
Aplicando o critrio pessista ao nosso segundo exemplo obtemos:
Fabricar a pea
Comprar a pea

Baixa
30
20

Mdia
30
40

Alta
100
70

Como max(30; 20) = 20 concluimos que a melhor alternativa comprar a pea.


) tambm neste caso a alternativa escolhida diferente da escolhida com o critrio
optimista.

3.1.3

Critrio de Minimax Regret

A ideia base deste critrio que o decisor quer minimizar a sensao de arrependimento ex-post, isto , depois de conhecer o estado da natureza que ocorreu. Para
aplicar o critrio temos primeiro que calcular a matriz de perdas.
A perda a diferena entre o melhor payo para um dado estado da natureza e o
payo obtido com a alternativa em causa quanto estou arrependido por no ter
escolhida a melhor alternativa. Podemos construir a matriz de perdas a partir da
matriz de payos:
Fbrica grande
Fbrica pequena
No construir

Favorvel

No Favorvel

1000 1000 = 0
1000 500 = 500
1000 0 = 1000

0 (500) = 500
0 (100) = 100
0

Cada alternativa avaliada pela perda mxima que pode ocorrer se alternativa for
escolhida. O critrio recomenda escolher a alternativa com a menor das perdas
mximas.
Neste exemplo, o critrio do minmax regret recomenda escolher a contruo de uma
fbrica grande ou pequena (ambos tm um regret mximo de 500).
Designemos por Vj o valor da melhor alternativa quando ocorre o estado da natureza
sj. A matriz das perdas dada por Vj Vij . Se usarmos o critrio do minmax regret

38

Mtodos Quantitativos

o que fazemos :

min max Vj Vij :


i

Aplicando este critrio ao nosso segundo exemplo obtemos:


Fabricar a pea
Comprar a pea

Baixa

Mdia

50
0

10
0

Alta
0
30

) a alternativa escolhida comprar a pea.

3.1.4

Critrio de Laplace

Este critrio admite que todos os estados da natureza so igualmente provveis. Por
isso, cada alternativa avaliada considerando o payo mdio que lhe est associado.
A alternativa escolhida aquela que tiver maior payo mdio. Aplicando este critrio
ao nosso primeiro exemplo obtemos:
Fbrica grande
Fbrica pequena
No construir

Favorvel
1000
500
0

No Favorvel
500
100
0

Payo Mdio
1000500 = 250
2
500100
2

= 200

) a alternativa com maior payo mdio construir uma fbrica grande.

3.2

Maximizar o valor monetrio esperado (Expected monetary value)

3.2.1

Maximizar o valor monetrio esperado

O valor esperado de uma alternativa diz-nos quanto que obtemos em mdia se


escolhermos aquela alternativa. No exemplo da construo de uma fbrica, vamos
supor que eu estou convencida que a probabilidade de o mercado ser favorvel 34 .
Qual o valor monetrio esperado de cada uma das alternativas?
Fbrica grande
Fbrica pequena
No construir

EMV
1000 34 + (500) 14 = 625
500 34 + (100) 14 = 350
0 34 + 0 14 = 0

Captulo 3

39

Teoria de Deciso

) a alternativa com maior valor monetrio esperado construir uma fbrica grande.
Minimizar o valor esperado da perda (opportunity loss ou regret)
A perda a diferena entre o melhor payo para um dado estado da natureza e o
payo obtido com a alternativa em causa quanto estou arrependido por no ter
escolhida a melhor alternativa. Podemos construir a matriz de perdas a partir da
matriz de payos:
Fbrica grande
Fbrica pequena
No construir

Favorvel

No Favorvel

Val. Esper. Perda

1000 1000 = 0
1000 500 = 500
1000 0 = 1000

0 (500) = 500
0 (100) = 100
0

3
4
3
4
3
4

0 + 14 500 = 125
500 + 14 100 = 400
1000 + 14 0 = 750

) A alternativa com a menor perda esperada construir uma fbrica grande.

importante notar que o critrio de maximizao do valor esperado equivalente


ao critrio de minimizao da perda esperada. Podemos mostrar isto formalmente.
O critrio de maximizao do valor esperado corresponde a:
max
i

N
X

p(sj)Vij

j=1

O critrio de minimizao do valor esperado da perda corresponde a:


2
3
N
N
N
X
X
X
min
p(sj )(Vj Vij ) = min 4
p(sj )Vj
p(sj)Vij 5
i

j=1

N
X
j=1

j =1

j=1

p(sj)Vj max
i

N
X

p(sj )Vij

j=1

como o primeiro termo no parnteses recto no depende de i, escolher i de forma a


P
PN
minimizar a diferena entre N
j=1 p(sj )Vj e
j=1 p(sj)Vij equivalente a escolher i
PN
de forma a maximizar j=1 p(sj )Vij .

3.2.2

Anlise de sensibilidades

Se o decisor no estiver completamente conante nas estimativas da probabilidade


de ocorrncia de cada um dos estados da natureza conveniente estudar como
a deciso se alteraria se as probabilidades fossem diferentes. Por outras palavras,
devemos fazer uma anlise de sensibilidades.

40

Mtodos Quantitativos

3.2.3

Valor esperado de informao perfeita

Vamos agora ver um conceito muito importante: valor esperado de informao perfeita. Suponhamos que existe uma empresa de analista de mercado que consegue
prever com exactido qual vai ser o estado do mercado. Essa empresa pede 100 para
fornecer essa informao. Eu devo ou no comprar a informao?
Se eu comprar a informao, depois da obter vou saber exactamente qual o estado
da natureza e, por isso, quando estou a decidir sobre a construo da fbrica j estou
a decidir em contexto de certeza. Podem acontecer duas coisas:
Se o estudo disser que o mercado favorvel a deciso ptima construir a
fbrica grande, o que me dar um payo de 1000.
Se o estudo disser que o mercado no favorvel a deciso ptima no construir a fbrica, o que me dar um payo de 0.
Como antes do estudo ser feito eu no sei o que ele vai dizer, s sei que apriori
a probabilidade de o mercado ser favorvel 34 , ex-ante eu s posso calcular
qual o valor monetrio esperado se eu comprar a informao:
3
1
1000 + 0 = 750
4
4
Qual o mximo que eu estou disposta a pagar pela informao perfeita?
a diferena entre o EMV com informao perfeita e o EMV sem informao
perfeita. Ou seja:
EV PI = EMV com IP EMV = 750 625 = 125
Como o valor esperado da informao perfeita superior ao seu custo (125 >
100) eu devo comprar a informao.
Tambm podemos resolver o problema anterior usando uma rvore de deciso. A
Figura 3.1 apresenta a rvore de deciso do problema.
Para resolver o problema devemos resolver do m da rvore para o princpio. Ou
seja, devemos usar backward induction. Assim temos que comear por determinar:
Qual a deciso ptima sobre a fbrica a construir se o estudo for favorvel?
) A deciso ptima construir uma fbrica grande, porque se o estudo for
favorvel sabemos que o mercado vai ser favorvel (porque o estudo perfeito)
) payo 900.

Captulo 3

41

Teoria de Deciso
G
EF

[900]

3/4

NC
G

[650]

E
1/4

[-100]

ENF

P
NC

900
400
-100
-600
-200
-100

[650]

[625]

G
NE

[625]

1/4
[350]

3/4
1/4

NC

[0]

1000

3/4

-500
500

-100

3/4

1/4

Figura 3.1: rvore de deciso quando o estudo d informao perfeita.

Qual a deciso ptima sobre a fbrica a construir se o estudo no for favorvel?


) Neste caso a deciso ptima no construir ) payo 100.

Isto implica que o valor monetrio esperado se zermos o estudo


3
1
900 + (100) = 650:
4
4
Por outro lado, se no zermos o estudo, a decisa ptima construir a fbrica
grande e o valor monetrio esperado correspondente 625.
Agora estamos prontos para recuar na rvore e ver qual a melhor deciso: fazer
ou no fazer o estudo. Como o valor monetrio esperado quando se faz o estudo
superior, conclumos que a deciso ptima fazer o estudo.
A intuio por detrs do princpio de backward induction que para podermos decidir
agora entre fazer o estudo ou no, teremos que antecipar quais vo ser as escolhas
que vamos fazer no futuro para cada uma das possveis circunstncias que venham
a ocorrer. S sabendo quais vo ser as decises ptimas no futuro que podemos
decidir agora o melhor caminho a seguir. por isso, que comeamos por resolver os
problemas de deciso nais, e vamos recuando na rvore para determinar as decises
ptimas agora.

42

Mtodos Quantitativos

importante realar a vantagem de usar rvores de deciso quando os problemas


de deciso so sequenciais, isto quando h uma srie de decises que tm que ser
tomadas. De facto as rvores de deciso permitem-nos especicar exactamente qual
a sequncia em que as decises so tomadas e os pontos onde a incerteza resolvida.

3.2.4

Valor esperado de informao imperfeita

Na seco anterior admitimos que a empresa analista de mercado consegue prever


com exactido o estado do mercado. Esta hiptese no realista. Na maior parte
dos casos haver erros de previso. Por outras palavras, a informao no perfeita.
Apesar disso, pode valer a pena obter a informao. Qual o valor esperado de
informao imperfeita?
Admitamos que com base nos registos histricos da empresa analista de mercado
se pode concluir que, no passado, quando a empresa previu que o mercado seria
favorvel, em 80% o mercado foi de facto favorvel, mas em 20% dos casos a previso
da empresa foi errada. Em contrapartida quando a empresa previu que o mercado
no seria favorvel, a sua previso foi correcta em 60% dos casos. O custo do estudo
10 unidades monetrias.
Comecemos por representar numa rvore de deciso o problema. Repare-se que
o problema que estamos a analisar envolve uma sequncia de decises. Nestas
condies, as rvores de deciso so o instrumento adequado para representar o
problema, porque possibilitam representar a sequncia lgica das decises.
Aplicando o princpio de backward induction devemos comear por determinar a
deciso ptima se o estudo for favorvel e se o estudo no for favorvel. Reparese que, no caso de fazermos o estudo, as probabilidades do mercado ser ou no
favorvel, so as probabilidades condicionadas, dado que o estudo foi favorvel ou
no foi favorvel:
P(FjEF) = 0:8, P (N FjEF) = 0:2 e P (F jEN F) = 0:4, P (N FjENF) = 0:6.
Fazendo isto vericamos que, se o estudo for favorvel a deciso ptima construir a
fbrica (payo esperado 690), enquanto que se o estudo no for favorvel a deciso
ptima construir a fbrica pequena (payo esperado 130).

Captulo 3

43

Teoria de Deciso

0.8

[690]

G
EF

[690]

0.2
0.8

[370]

0.875

0.2

NC

0.8

[-10]

0.2
[620]

990

-510
490

-1 10
-10

-10

E
0.4

[90]

G
0.125

[130]

0.6
0.4

[130]

ENF

0.6

NC

0.4

[-10]

0.6

[625]

[625]

G
NE

[625]

3/4
1/4

[350]

3/4
1/4

NC

[0]

3/4
1/4

990

-510
490

-110
-10

-10

1000

-500
500

-100
0

Figura 3.2: rvore de deciso quando o estudo fornece informao imperfeita.

44

Mtodos Quantitativos

Depois, podemos calcular o valor monetrio esperado se o estudo for feito. Mas
para isso necessitamos de saber qual a probabilidade do estudo ser favorvel ( a
probabilidade do estudo no ser favorvel 1 menos a probabilidade de ser favorvel).
Para calcular essa probabilidade podemos usar o facto de:
P (F) = P (F jEF )P (EF) + P(FjENF )P (ENF)
0:75 = 0:8P(EF) + 0:4(1 P(EF )) , P(EF ) = 0:875
Desta forma, o valor monetrio esperado quando o estudo feito :
0:875 690 + 0:125 130 = 620
Estamos prontos para recuar na rvore e ver se devemos ou no fazer o estudo.
Como o valor monetrio esperdao se o estudo for feito inferior ao valor monetrio
esperado se o estudo no for feito, a deciso ptima no fazer o estudo.

3.3

Maximizar a utilidade esperada

3.3.1

Teoria da Utilidade Esperada

Uma pergunta: Quem prefere receber 100 euros de certeza ou jogar um jogo em
que com 50% de probabilidade recebe 200 euros e com 50% de probabilidade no
recebe nada?
) Note-se que o valor esperado do rendimento o mesmo nos dois casos:
0:5 200 + 0:5 0 = 100
) No entanto, a maioria das pessoas prefere receber 100 euros com certeza. Porqu?
A maioria das pessoas aversa em relao ao risco. Entre duas alternativas com o
mesmo valor esperado prefere a que tem menor risco.
) Isto est relacionado com as preferncias, e com a forma como o agente valoriza
os resultados bons relativamente aos resultados maus.
Suponhamos que a satisfao do indviduo para os trs nveis de riqueza : U (200) =
80, U(100) = 50, U (0) = 0. Se o agente escolher receber 100 de certeza a sua
utilidade U(100) = 50. Qual a sua utilidade se escolher o jogo? Tendo em conta

Captulo 3

45

Teoria de Deciso

que ao decidir o agente no sabe se W = 200 ou W = 0 vai ocorrer natural que ele
calcule o valor esperado da utilidade:
1
1
1
1
U(200) + U(0) = 80 + 0 = 40
2
2
2
2
) A alternativa com maior valor esperado da utilidade receber 100 euros com
certeza.

3.3.2

Atitudes em Relao ao Risco e U (W )

Admitindo no saciedade, o agente prefere sempre ter mais do que menos. Isso
signica que a funo de utilidade depende positivamente da riqueza. Ou ainda,
U(W ) uma funo crescente (se for diferencivel a primeira derivada positiva).
A atitude em relao ao risco est relacionada com a curvatura da funo de utilidade.
Se o agente averso em relao ao risco, ento a funo de utilidade concva,
ou seja U 00 (W) < 0.
Se o agente neutro em relao ao risco a funo de utilidade linear, U 00 (W) =
0.
Se o agente amante do risco a funo de utilidade convexa, U 00 (W) > 0.
Para ver isto considere-se um jogo em que com probabilidade 12 recebe-se 2, com
probabilidade 12 recebe-se 0 e a pessoa tem que pagar 1 para jogar. Este jogo um
jogo justo, isto , o seu valor esperado zero.
1
1
2 + 0 1 = 0
2
2
Uma pessoa aversa ao risco prefere no jogar. Mas isso signica que
U(1) >

1
1
U(2) + U(0) , 2U(1) > U (2) + U (0) , U(1) U(0) > U (2) U (1)
2
2

ou seja, a utilidade marginal decrescente a utilidade aumenta mais quando


a riqueza aumenta de 0 para 1, do que quando a riqueza aumenta de 1 para 2.

46

Mtodos Quantitativos

Uma pessoa neutra em relao ao risco indiferente. Mas isso signica que
U(1) =

1
1
U(2) + U(0) , 2U(1) = U (2) + U (0) , U(1) U(0) = U (2) U (1)
2
2

ou seja, a utilidade marginal constante.


Uma pessoa amante do risco prefere jogar. Mas isso signica que
U(1) <

1
1
U(2) + U(0) , 2U(1) < U (2) + U (0) , U(1) U(0) < U (2) U (1)
2
2

ou seja, a utilidade marginal crescente.


Representao grca de uma funo de utilidade de um indivduo averso ao risco.

3.3.3

Maximizar a Utilidade Esperada

A partir do momento em que a funo de utilidade do decisor conhecida fcil


calcular quais so os valores da utilidade que correspondem a cada um dos valores
monetrios na matriz de payos. Sendo assim, possvel construir uma nova matriz
de payos onde os payos esto expressos em termos de utilidade em vez de estarem
em termos monetrios.
Um mtodo para calcular as utilidades associadas a cada valor monetrio consiste
em atribuir valores de utilidade ao pior e ao melhor payo (esses valores podem ser
quaisquer desde que a utilidade do maior valor monetrio seja superior utilidade
do pior valor monetrio). No nosso exemplo, podamos escolher:
U(500) = 0 e U(1000) = 10
Para calcular U (500), tenho que responder pergunta: tendo que escolher entre
receber 500 de certeza ou receber 1000 com probabilidade p e receber 500 com
probabilidade 1 p, qual o valor de p que faz com que eu seja indiferente entre as
duas alternativas. Vamos supor que a minha resposta p = 0:8. Ento o que eu
estou a dizer que:
U (500) = 0:8U(1000) + 0:2U (500) = 0:8 10 = 8

Captulo 3

47

Teoria de Deciso

Fazendo isto para todos os valores monetrios co com os payos expressos em


termos de utilidade.
Fbrica grande
Fbrica pequena

Favorvel
10
8

No Favorvel
0
4:2

No construir

EU (W )
3
1
4 10 + 4 0 = 7:5
3 8 + 1 4:2 = 7:05
4
4
3
4

5 + 14 5 = 5

) A deciso que maximiza o valor esperado da utilidade construir uma fbrica


grande.
Repare-se que o critrio de maximizao do valor esperado monetrio equivalente
ao critrio de maximizao da utilidade esperada se o decisor for neutro em relao
ao risco. Mas se o decisor no for neutro em relao ao risco prefervel usar o
critrio de maximizao da utilidade esperada, porque este incorpora a atitude do
decisor em relao ao risco.

3.3.4

Anlise de Sensibilidades

Se o decisor no estiver completamente conante nas estimativas da probabilidade


de ocorrncia de cada um dos estados da natureza conveniente estudar como
a deciso se alteraria se as probabilidades fossem diferentes. Por outras palavras,
devemos fazer uma anlise de sensibilidades. Este tipo de anlise pode ser feita quer
o critrio de deciso seja maximizar o valor monetrio esperado, quer seja maximizar
a utilidade esperada.
Consideremos o nosso exemplo, com a matriz de utilidades e designemos por p a
probabilidade do estado da natureza ser favorvel:

Fbrica grande
Fbrica pequena

Favorvel
10
8

No Favorvel
0
4:2

No construir
p

EU (W )
10p + (1 p)0 = 10p
8p + 4:2(1 p) = 4:2 + 3:8p
5

1 p

Na Figura 3.3 est representado gracamente o valor esperado da utilidade para


cada alternativa como funo de p. A gura mostra que para valores baixos de p
ptimo no construir, para valores intermdios de p ptimo construir uma fbrica

48

Mtodos Quantitativos

pequena, e para valores elevados de p ptimo construir a fbrica grande.Usando


10
8
6
4
2

0.2

0.4

0.6

0.8

Figura 3.3: Anlise de sensibilidades.

as expresses da utilidade esperada para cada uma das alternativas, possvel determinar os intervalos de p para os quais cada alternativa prefervel. Por exemplo,
para que seja ptimo no construir temos de ter:
5 4:2 + 3:8p e 5 10p
Estas duas condies so verdadeiras p :21053, logo para p 2 [0; :21053] ptimo
no construir. De forma semelhante, para ser ptimo construir a fbrica pequena
tm de ser satisfeitas as duas condies seguintes:
4:2 + 3:8p 5 e 4:2 + 3:8p 10p
o que equivalente a:
p :21053 e p :67742:
Finalmente, para p :67742 ptimo construir a fbrica grande.
Os clculos anteriores mostram que se o decisor estiver conante que a probabilidade
de o mercado ser favorvel superior a 0.68, ento a deciso de construir a fbrica
grande uma boa deciso.

Captulo 4

Teoria de Jogos

4.1

O que a teoria de jogos?

o estudo de problemas de deciso com vrios agentes. Quando existe interaco


entre vrios agentes, normalmente tambm existe interdependncia estratgica. Na
teoria de deciso que acabamos de estudar a utilidade do decisor s depende das
suas decises e do estado da natureza que ocorrer. Em contrapartida, nas situaes em que h vrios agentes e existe interdependncia estratgica, o payo de
cada agente depende no s das suas aces, mas depende tambm das decises dos
outros agentes. Por conseguinte, cada agente ao fazer a sua escolha deve levar em
considerao aquilo que espera que outros vo fazer.
H dois ramos distintos da teoria de jogos: teoria de jogos cooperativos e teoria de
jogos no cooperativos. Qual a distino entre estes ramos?
Teoria de jogos cooperativos : a unidade de anlise so coligaes (coligaes so
conjuntos de indivduos), que se admite serem capazes de atingir determinados
resultados.
Grande parte da teoria de jogos cooperativa baseada num conjunto de axiomas, dos quais se derivam resultados.
) A questo que se levanta qual o conjunto de axiomas correcto?

Teoria de jogos no cooperativos: cada jogador escolhe a sua estratgia tendo


em conta os seus prprios interesses, cada um escolhe aquilo que pensa ser o
melhor para si prprio.
) Note-se que o melhor para um jogador pode ser cooperar. Ou seja, a
cooperao pode ocorrer no contexto de jogos no cooperativos. Mas s ocorre
se isso for do interesse de cada jogador em particular.

50

Mtodos Quantitativos

Um pouco de histria
A expresso teoria de jogos foi usada pela primeira vez por Von-Newman e
Morgenstern (1944). Eles analisaram jogos de soma-zero. Um jogo de somazero um jogo em que aquilo que um jogador ganha igual aquilo que o outro
perde.
Apesar disso, ideias que so ideias de teoria de jogos foram usadas muito antes.
Alguns exemplos:
1700s Jean Jacques Rosseau

Cournot (1838), Bertrand (1883) e Edgeworth (1925) ) modelos de oligoplio.

Em 1950 Nash deniu um conceito de equilbrio que hoje conhecido como


equilbrio de Nash. Este conceito pode ser aplicado tanto a jogos de soma-zero
como a jogos que o no so.
Nos anos 60 h vrios contributos importantes para a teoria de jogos

Schelling: No seu livro Strategy of conict apresenta ideias informais


sobre pontos focais (focal points) e sobre o valor do compromisso (commitment value).
Selten (1965): Introduz um conceito de equilbrio fundamental em jogos
dinmicos, o equilbrio perfeito em todos os subjogos (subgame perfection).
Harsanyi (1967) - analisa jogos de informao incompleta e dene o equilbrio Bayesiano.
Os anos 70 so uma decda em que surjem muitas aplicaes da teoria de jogos,
sobretudo em reas como a Economia Industrial.
Nos anos 80 as aplicaes continuam a multiplicar-se. Para alm disso, surgem
conceitos de equilbrio para jogos dinmicos com informao incompleta. Em
1982 Kreps, Milgrom, Roberts and Wilson apresentam o conceito de equilbrio
sequencial.
Na ltima dcada os avanos tem ocorrido sobretudo na teoria da aprendizagem
e evoluo.

4.2
4.2.1

Modelizao da interaco estratgica


Forma normal e forma extensiva

Exemplo de um jogo em forma normal:

Captulo 4

U
D

51

Teoria de Jogos

L
1; 2
3; 6

R
3; 4
7; 8

) os jogadores 1 e 2 jogam simultaneamente (a deciso no tem que ocorrer no


mesmo momento do tempo, o que importante que quando um jogador decide ele
no saiba qual a deciso do outro, o que importa a simultaneadade do ponto de
vista estratgico).
) as estratgias possveis do jogador 1 so U e D. As estratgias do jogador 2 so
L e R.
) Na matriz so apresentados os payos. A leitura a fazer a seguinte: se o jogador
1 escolher U e o jogador 2 escolher L o payo do jogador 1 1 e o payo do jogador
2 2.
) A matriz acima frequentemente designada por bi-matriz.
Examplo de um jogo em forma extensiva (representao em rvore - veja a Figura
4.1
1

1
2

l
3,4

r
5,6

Figura 4.1: Exemplo de um jogo em forma extensiva.

Forma normal ou estratgica


Quem so os jogadores?
i 2 f1; 2; ; ng
Quais so as estratgias puras que cada jogador pode jogar?

52

Mtodos Quantitativos

si 2 Si (si uma estratgia em particular do jogador i, Si o conjunto de


estratgias possveis do jogador i).
s = (s1; s2; ; sn ) o vector de estratgias, uma para cada jogador. Diz-nos
o que que cada jogador faz.
s 2 S = S1 S2 Sn
Muitas vezes utiliza-se a notao (si; si ), si a estratgia do jogador i, si
indica-nos as estratgias escolhidas pelos outros jogadores.
Quais so as funes payo?
Para cada jogador temos que indicar a sua funo payo.

ui : S ! <:
Qual o payo do jogador i para cada vector de estratgias. ui (s1 ; s2; ; sn) indicanos o payo do jogador i quando o jogador 1 escolhe s1, o jogador 2 escolhe s2, ,
e o jogador n escolhe sn .
Resumindo, um jogo na forma normal descrito por:
= fN; S1; S2; ; Sn; u1; u2 ; ; ung
Exemplos:
Dilema do prisioneiro

U
D

L
1; 1
0; 5

R
5; 0
4; 4

Guerra dos Sexos


Futebol
Balet

Futebol
1; 2
0; 0

Balet
0; 0
2; 1

Captulo 4

53

Teoria de Jogos

Forma extensiva
Quais so os elementos da representao na forma extensiva
Quem so os jogadores?
Quem que est a decidir?
O que que cada jogador pode fazer quando ele a mover-se?
O que que os jogadores sabem quando decidem?
Quais so os payos no nal?
) quem que est a decidir, o que pode fazer, o que sabe, so equivalentes questo
de quais so as estratgias de cada jogador, na representao em forma normal.
Noo de estratgia

Uma estratgia um plano completo de aco que especica qual a aco que o
jogador escolheria em todas as contigncias em que o jogador venha a ter que jogar.
) uma estratgia algo que se pode dar ao nosso advogado e ir para casa descansar
(o advogado pode executar as instrues e nunca ter dvidas sobre o que deve
fazer, porque a estratgica indica o que fazer em qualquer circunstncia que venha
a ocorrer).

Exemplo 1: Figura 4.2


1

L
2

2
1

2
2

1
2

3
3

Figura 4.2: Exemplo 1 para ilustrar a noo de estratgia.

O jogador 2 quando decide sabe o que que o jogador 1 fez ) o jogo sequencial:
o jogador 1 decide primeiro entre L e R e, depois de observar a escolha do jogador
1, o jogador decide entre l e r.

54

Mtodos Quantitativos

Quais so as estratgias possveis do jogador 2? (pensar que o jogador 2 tem que


denir o seu plano de aco antes de saber o que o jogador 1 vai fazer):
jogar l se o jogador 1 escolher L, jogar l se o jogador 1 escolher R ) (l; l)
jogar l se o jogador 1 escolher L, jogar r se o jogador 1 escolher R ) (l; r)
jogar r se o jogador 1 escolher L, jogar l se o jogador 1 escolher R ) (r; l)
jogar r se o jogador 1 escolher L, jogar r se o jogador 1 escolher R ) (r; r)
Exemplo 2: Figura 4.3
1

3,4

1
2,1

1,1

2,0

Figura 4.3: Exemplo 2 para ilustrar a noo de estratgia

Neste jogo as estratgias do jogador 1 so: RA, RB, LA, LB. Como explicar LA e
LB?
verdade que se o jogador 1 escolher L a escolha entre A e B nunca se coloca. Mas
quando falarmos da soluo do jogo veremos que a deciso do jogador entre L e R
depende daquilo que ele pensa que o jogador 2 vai fazer, e , por sua vez, aquilo que
o jogador 2 vai fazer depende daquilo que ele pensa que o jogador 1 faria se tivesse
que escolher entre A e B. por isso que o jogador 1 vai mesmo ter que pensar no
que faria se tivesse que decidir entre A e B.
) A noo de estratgia em teoria de jogos mais do que um plano completo de
aco, porque tem especicar o que jogador faria mesmo em contigncias que nunca
ocorreriam se o jogador implementasse a sua estratgia.

Captulo 4

55

Teoria de Jogos

Conjunto de informao

Um conjunto de informao representa aquilo que um jogador no sabe.


Consideremos o jogo representado na Figura 4.4. Neste jogo, o jogador 2 quando
joga no sabe o que o jogador 1 fez. Ou seja, o jogador 2 no sabe em qual n que
est. Os dois ns pertencem ao mesmo conjunto de informao.
1

F
2

1
2

0
0

0
0

2
1

Figura 4.4: O jogador 2 tem um conjunto de informao com 2 ns.

Denio: Um conjunto de informao do jogador i um conjunto de ns de deciso


na representao extensiva do jogo tais que:
1. O jogador i quem decide em todos os ns desse conjunto.
2. O jogador i no sabe qual em qual dos ns que est.
) uma implicao importante do segundo requisito da denio que todos ns
do conjunto de informao tm que ter o mesmo conjunto de aces possveis.
Caso contrrio, o jogador poderia identicar em que n que est olhando para
o conjunto de opes disponvel.
Forma normal e forma extensiva
Passar da forma normal para a forma extensiva
Consideremos o seguinte jogo na forma normal:
L
R

l
1,5
3,7

r
2,5
4,8

A forma extensiva deste jogo apresentada na Figura 4.5.

56

Mtodos Quantitativos

L
2

1,5

2,6

3,7

4,8

Figura 4.5: Representao em rvore do jogo.

Passar da forma extensiva para a forma normal


Consideremos o jogo na forma extensiva da Figura 4.6:
1

L
2

1,2

3,4

5,6

7,8

Figura 4.6: Jogo sequencial.

A forma normal deste jogo :

L
R

(l; l)
1,2
5,6

(l; r)
1,2
7,8

(r; l)
3,4
5,6

(r; r)
3,4
7,8

) importante salientar que a forma extensiva reecte melhor a estrutura da informao e melhor para atribuir crenas a cada um dos ns de um conjunto de
informao.

Captulo 4

4.2.2

Teoria de Jogos

57

Informao completa/incompelta versus informao perfeita/imperfeita

Jogo com informao perfeita


Um jogo de informao perfeita se cada jogador quando tem que decidir sabe o
que aconteceu at aquele ponto (sabe a histria do jogo). Por outras palavras, um
jogo de informao perfeita se todos os conjuntos de informao tiverem s um n.
Jogo com informao completa
Num jogo com informao completa, o espao de estratgias e a funo payo de
cada jogador so do conhecimento comum. Ser do conhecimento comum signica que
todos os jogadores as conhecem, todos sabem que todos as conhecem, todos sabem
que todos sabem que todos as conhecem,....

4.3

Jogos estticos com informao completa

Agora que j sabemos como representar jogos podemos estudar como encontrar a
soluo do jogo. Vamos admitir que os jogadores decidem as suas estratgias
independentemente e que S nito.
Na nossa anlise no vamos considerar estratgias mistas. Mas importante referir
que os conceitos apresentados se generalizam quando se admite que os jogadores
podem escolher estratgias mistas.
S para terem uma ideia do que uma estratgia mista consideremos o jogo da
guerra dos sexos:

Futebol
Ballet

Futebol
1; 2
0; 0

Ballet
0; 0
2; 1

) (1=2; 1=2) ir ao futebol com probabilidade 12 , ir ao ballet com probabilidade


uma estratgia mista.

1
2

) (0; 1) ir ao futebol com probabilidade 0, ir ao ballet com probabilidade 1 ,


estratgia pura ir ao ballet. Logo, as estratgias puras podem ser vistas como
casos particulares das estratgias mistas, em que toda a probabilidade atribuda a
uma estratgia pura.

58

Mtodos Quantitativos

4.3.1

Eliminao de estratgias estritamente dominadas

Consideremos o jogo do dilema do prisioneiro


no confessar
confessar

confessar
1; 1
0; 5

no confessar
5; 0
4; 4

) A estratgia no confessar uma estratgia dominada. Se o jogador 2 confessar,


o jogador 1 ca melhor se confessar (obtm 0 em vez de 1). Se o jogador 2 no
confessar, o jogador 1 tambm ca melhor se confessar (obtm 4 em vez de 5).
Por conseguinte, independentemente daquilo que o jogador 2 faa, o jogador 1 ca
melhor se confessar. Logo, a estratgia no confessar dominada pela estratgia
confessar.
) se admitirmos que os jogadores so ambos racionais, ambos vo escolher confessar, porque essa estratgia domina estritamente no confessar. A soluo do jogo
ento (confessar, confessar) e os payos obtidos so (4; 4).
Denio formal de estratgia estritamente dominada
A estratgia pura si estritamente dominada para o jogador i se existir s0i 2 Si tal
que ui (s0i ; si) > ui(si; si) para todo si 2 Si . Neste caso dizemos que a estratgia
s0i domina estritamente a estratgia si:
) Uma estratgia estritamente dominante se dominar estritamente todas as outras
estratgias do jogador.
) Se a expresso anterior for satisfeita s para diz-se que a estratgia si is dominada no sentido fraco.
Vejamos um exemplo para ilustrar a noo de estratgia dominada no sentido fraco.
Consideremos o seguinte jogo:

U
M
D

L
5; 1
6; 0
6; 4

R
4; 0
3; 1
4; 4

) A estratgias U e M so dominadas no sentido fraco pela estratgia D.

Captulo 4

59

Teoria de Jogos

) Note-se que uma estratgia dominada no sentido fraco no pode ser eliminada s
com base na ideia de racionalidade. Por exemplo, jogar M uma estratgia ptima
se o jogador 1 tiver a certeza que o jogador 2 escolhe L.
) Contudo, se o jogador 1 atribuir uma pequena probabilidade ao jogador 2 jogar
R, ele nunca deveria escolher M (esta ideia conhecida na literatura como trembling
hand).
Eliminao iterada de estratgias estritamente dominadas
) jogadores racionais no jogam estratgias estritamente dominadas
) do conhecimento comum que os jogadores so racionais
Exemplo:
U
D

L
1; 0
0; 3

M
1; 2
0; 1

R
0; 1
2; 0

) o jogador 2 no joga R porque R estritamente dominada por M.

) Como sabe que o jogador 2 racional, o jogador 1 sabe que o jogador 2 nunca
jogar R. Mas ento o jogador 1 nunca querer jogar D, porque uma vez elimada R
a estratgia D estritamente dominada por U .
) O jogador 2 sabe que o jogador 1 sabe que ele racional. Ou seja, o jogador 2
sabe que 1 sabe que ele nunca jogaria R. Para alm disso, o jogador 2 sabe que 1
tambm racional e, por conseguinte, nunca jogar D. Mas ento o jogador 2 nunca
jogar L.
) Neste jogo, o nico vector de estratgias que sobrevive eliminao iterada de
estratgias estritamente dominadas o vector (U; M).
Outro exemplo:
U
M
D

L
4,3
2,1
3,0

M
5,1
8,4
9,6

R
6,2
3,6
2,8

U
M
D

L
4,3
2,1
3,0

R
6,2
3,6
2,8

) M estritamente dominada por R (2; 6; 8) > (1; 4; 6)

L
4,3

R
6,2

60

Mtodos Quantitativos

) Uma vez eliminada a estratgia M do jogador 2, M e D so estritamente dominadas por U para o jogador 1.
) (U; L) a soluo do jogo usando IDDS.
Um resultado muito importante que o conjunto de estratgias que sobrevive a
eliminao iterada de estratgias estritamente dominadas no depende da ordem em
que as estratgias so eliminadas.
No faz sentido usar eliminao iterada de estratgias fracamente dominadas, porqu?
A eliminao de estratgias fracamente dominadas justicada quando um jogador
d probabilidade positiva a todas as estratgias dos seus oponentes. Mas, isto contradiz a lgica da eliminao iterada, que baseada na ideia que estratgias dominadas no so esperadas ocorrer.

4.3.2

Problemas com a eliminao iterada de estratgias dominadas

A hiptese de h conhecimento comum que os jogadores so racionais muito forte.


Com efeito, basta existir uma pequena dvida sobre a racionalidade de um outro
jogador para eventualmente se obter resultados muito diferentes. O jogo seguinte
ilustra esta ideia.

U
D

L
8; 10
7; 6

R
100; 0
6; 5

(U; L) o nico par de estratgias que sobrevive eliminao iterada de estratgias estritamente dominadas.
Contudo, se o jogador 1 no tiver a certeza que o jogador 2 racional e atribui
alguma probabilidade ao jogador 2 jogar R, ele pode car melhor se jogar D.
Neste jogo, porque os payo so muito extremos, o resultado muito sensvel
a pequenas incertezas no comportamento (mesmo que a probabilidade de 2 ser
irracional seja s 1%, o suciente para o jogador 1 preferir D).
Quanto mais elevado for o nmero de iteraces, menos credvel a soluo porque
necessitamos de um nmero maior de rounds do tipo eu sei que t sabes que eu
sei.... A hiptese de que a racionalidade do conhecimento comum signica que
mesmo que haja um nmero innito de rounds no h problema.

Captulo 4

61

Teoria de Jogos

Na maior parte dos casos o uso da eliminao iterada de estratgias estritamente


dominadas no fornece uma soluo nica. Muitas vezes, no existem sequer estratgias estritamente dominadas o que signica que, de acordo com este critrio,
tudo pode acontecer.

4.3.3

Equilbrio de Nash em estratgias puras

Equilbrio de Nash em Estratgias Puras


O vector (s1; s2; ; sn) um equilbrio em estratgias puras se para todos os jogadores se vericar:
ui(si ; si) ui(si; si ) 8si 2 Si
Por outras palavras, si a soluo do problema
max ui(si; si )
si 2Si

Ou seja, se admitirmos que outros jogadores escolhem si , a estratgia ptima do


jogador i si .
) Se ui(si ; si ) > ui(si; si ) o equilbrio de Nash diz-se estrito.

) O EN tal que as conjecturas acerca da forma como o jogo vai ser jogado so
internamente consistentes. Isto , se todos os jogadores prevm que um determinado
equilbrio de Nash vai ocorrer, ento nenhum dos jogadores tem incentivo a desviarse e jogar de forma diferente.
) Para vericar se um determinado vector de estratgias EN basta vericar se
ningum, unilateralmente, tem interesse em desviar-se.
) O EN tem implcitas duas ideias: crenas so mutuamente correctas e as estratgias de cada jogador so ptimas dadas as crenas.
Como vericar se um dado vector de estratgias EN?
U
D

L
2; 3
1; 2

R
1; 2
2; 4

) ser que (U; L) um EN? Se o jogador 2 jogar L, o jogador 1 quer jogar U. Ele
no quer desviar-se porque se jogar U obtm 2, enquanto que se jogar D obtm 1.

62

Mtodos Quantitativos

De forma semelhante, se o jogador 1 jogar U, o jogador 2 tambm no quer desviarse, porque recebe um payo de 3 se jogar L, e s recebe 2 se jogar R.
Por conseguinte, (U; L) EN.
Como encontrar os equilbrios de Nash?

Para encontrar o(s) equilbrio(s) de Nash de um jogo o que se faz deduzir as funes
melhor resposta (s vezes designadas por funes de reaco) e, depois, encontrar
o(s) vectore(s) de estratgias para os quais todos os jogadores esto em simultneo
nas suas funes de reaco.
O que a funo melhor resposta do jogador i?
A funo melhor resposta diz-nos, para cada vector de estratgias dos outros
jogadores, qual a estratgia ptima do jogador i. A estratgia ptima do
jogador i depende do vector de estratgias dos outros jogadores. BR i(si ).
Para encontrar a funo melhor resposta temos que resolver o problema:
max ui (si ; si)
si

A denio de equilbrio de Nash requere que a estratgia de cada jogador tem


que ser uma melhor resposta estratgia de equilbrio dos outros jogadores.
Por outras palavras, no EN todos os jogadores tm que estar na sua funo
melhor resposta. O(s) equilbrio(s) de Nash so os pontos onde as funes
melhor resposta se intersectam.
Exemplos: nos dois jogos em baixo

U
D

L
2; 3
1; 2

R
1; 2
2;4

U
D

L
0;3
1; 2

R
2; 2
2;4

No primeiro jogo h dois EN em estratgias puras (U; L) e (D; R). No segundo


jogo h um equilbrio de Nash (D; R).
Modelo de Cournot
Duas empresas produzem um produto homogneo (temos um duoplio). As
empresas decidem em simultneo quanto produzir. O preo de mercado dado
pela funo:
p = a q1 q2

Captulo 4

63

Teoria de Jogos

Para simplicar admita-se que as empresas tm custos marginais constantes e


iguais a c.
A funo melhor resposta da empresa i, pode deduzir-se resolvendo:
max i(qi ; qj ) = [a qi qj c] qi
qi

As condies de primeira ordem deste problema so:


@i
= a 2qi qj c = 0 , qi =
@qi

a qj c
2 }
| {z

funo melhor resposta

O equilbrio de Nash :
(

qi =
qj =

aqj c
2
aqi c
2

ac
qi = qj =
3

Mais exemplos para ilustrar vrias ideias


O equilbrio de Nash pode no ser um ptimo de Pareto.
No confessar
Confessar

No confessar
1; 1
0; 5

Confessar
5; 0
4; 4

) fcil vericar que (Confessar, Confessar) o nico EN deste jogo.


) Mas (4; 4) pior para ambos os jogadores que (1; 1).

) Um resultado em que no possvel aumentar a utilidade de um indivduo sem que nenhum outro indviduo piore designa-se por ptimo de Pareto.
Claramente, (4; 4) no um ptimo de Pareto.
) Como vimos atrs, este jogo pode ser resolvido usando eliminao de estratgias estritamente dominadas. O resultado obtido com esse procedimento
exactamente o mesmo que usando o conceito de equilbrio de Nash. Este
facto no um mero acaso. Sempre que s exista um resultado que sobrevive a
eliminao iterada de estratgias estritamente dominadas, ento esse tambm
o nico equilbrio de Nash do jogo.
H jogos com vrios equilbrios de Nash ) pode ser difcil prever qual vai ser
o resultado do jogo.

64

Mtodos Quantitativos

Futebol
Balet

Futebol
1;2
0; 0

Balet
0; 0
2;1

) Neste jogo h dois equilbrios de Nash em estratgias puras (F; F) e (B; B)


(h tambm um EN em estratgias mistas).
) problema da coordenao
) pontos focais
Futebol
Balet

Futebol
2;2
0; 0

Balet
0; 0
4;4

) Este jogo tambm tem dois EN em estratgias puras. Mas aqui o problema
de coordenao pode ser mais fcil. Os payos com o equilbrio (B; B) dominam
no sentido de Pareto os payos do equilbrio (F; F ). Neste caso, (B; B) um
equilbrio mais natural do que (F; F ).
) jogar na aula um jogo em que 2 jogadores fazem pedidos entre 0 e 100
euros. Se a soma dos dois montantes igual 100, os 100 euros so repartidos de
acordo com os pedidos. Se no os dois montantes no somarem 100 os jogadores
recebem ambos zero. O ponto focal 50.
Pode no existir equilbrio em estratgias puras
Jogo das moedas
H
T

H
1; 1
1;1

T
1;1
1; 1

Jogo de inspeco
preguiar
trabalhar

Inspecionar
0;h
w g; v w h

No inspecionar
w; w
w g;v w

com g < w e w > h. Neste jogo h um equilbrio em estratgias mistas em que


com alguma probabilidade o inspector inspecciona e com alguma probabilidade
o trabalhador trabalha.

Captulo 4

Teoria de Jogos

65

Discusso sobre o Equilbrio de Nash


Porque que nos devemos ralar com EN? Porque que havemos de esperar que as conjecturas que cada jogador tem sobre a forma como o jogo vai ser jogado so correctas? De
seguida apresentamos algumas justicaes que so normalmente apontadas (nem todas
elas so igualmente vlidas!)
Equilbrio de Nash deduzido por instrospeco os jogadores usam o conhecimento
que tm sobre os payos de cada jogador, o conhecimento de que os jogadores so
racionais e de que payos e racionalidade sa do conhecimento comum, para fazerem
previses sobre a forma como o jogo vai ser jogado.
) Este argumento incorrecto porque racionalidade e conhecimento comum da
racionalidade no chegam para garantir que as previses so correctas. Por exemplo,
no jogo da batalha dos sexos, se usarmos s argumentos de racionalidade, qualquer
vector de estratgias pode acontecer.
Se existir uma previso nica sobre o resultado do jogo ela tem que ser EN
A ideia que se, por alguma razo, os jogadores pensam e partilham a opinio de
que h uma maneira bvia de jogar o jogo, ento essa maneira de jogar tem que ser
um equilbrio de Nash. Isto verdade porque se no fosse um EN, algum jogador
preferia desviar-se.
) O argumento no funciona bem se houver vrios EN
) A questo que se levanta porque que h uma maneira bvia de jogar o jogo?.
Algumas razes para a existncia de forma bvia de jogar so dadas de seguida.
Se os jogadores puderem comunicar antes do jogo, mesmo que os acordos que estabelecem no sejam mandatrios, e os jogadores concordarem jogar um determinado
vector de estratgias. Os jogadores s vo ter interesse em cumprir os acordos estabelecidos se estes forem EN.
Os jogadores extrapolam os resultados de jogos similares jogados no passado para o
jogo em questo.
) O EN pode ser visto como o steady state de um processo de aprendizagem.
) problemas: i) os processos de ajustamento nem sempre convergem ii) por vezes
os processos de ajustamneto no descrevem bem o comportamento dos jogadores iii)

66

Mtodos Quantitativos

em muitos processos de ajustamento ignorada a forma como os outros jogadores


reagiro no futuro.
Teoria evolucionria tem as suas origens na biologia (Maynard, Smith e Price)
) a ideia que os animais so geneticamente programados para jogarem diferentes
estratgias. Os genes das estratgias com maior sucesso tem um grau de reproduo mais elevado ) % da populao a jogar a estratgias com sucesso aumenta.
Eventualmente h um steady state deste processo.
) A teoria evolucionria tem tambm sido utilizada para estudar jogos com vrios
equilbrios e a questo de qual deles mais provvel ocorrer.

4.4

Jogos dinmicos com informao completa

A maioria dos exemplos de gesto e economia envolve os jogadores a tomarem decises ao longo do tempo. Por exemplo, as empresas tomam hoje decises de investimento que afectam a sua competitividade no futuro. Uma negociao entre a
empresa e os trabalhadores pode envolver uma srie de ofertas e contra ofertas.
Isto signica que muitos jogos so dinmicos.
O conceito central em jogos dinmicos equilbrio perfeito em todos os subjogos. A
ideia principal por detrs deste conceito o princpio da racionalidade sequencial:
os jogadores devem jogar de forma ptima seja qual for o ponto do jogo em que se
encontrem..

4.4.1

Jogos de informao perfeita e Backward Induction

conveniente relembrar que um jogo de informao perfeita um jogo em que


quando um jogador chamado a tomar uma deciso ele sabe o que aconteceu antes
no jogo. Em termos formais: todos os conjuntos de informao tm s um n.
Consideremos o jogo representado na gura 4.7.
A forma estratgica do jogo :

L
R

l
1;2
2;1

r
1;2
0; 0

Captulo 4

67

Teoria de Jogos

1,2

l
2,1

0,0

Figura 4.7: Jogo de informao perfeita.

) Este jogo tem 2 EN em estratgias puras: (L; r) e (R; l).


Podemos vericar que (L; r) de facto EN. O jogador 1, se o jogador 2 jogar r no
quer desviar (com EN obtm 1, se desviar obtm 0). O jogador 2 tambm no quer
desviar (recebe 2 quer desvie ou no).
) Mas (L; r) no um equilbrio razovel. Porqu? Este equilbrio baseado na
ameaa do jogador 2 jogar r se o jogador 1 jogar R. Mas esta ameaa no
credvel. De facto, se o jogador 1 jogar R, no do interesse do jogador 2 jogar r.
Se o jogador 1 jogar R, o jogador 2 vai preferir jogar l.
) Concluso: alguns dos equilbrios de Nash num jogo dinmico no so razoveis.
Devemos eliminar os EN que so baseados em ameaas no credveis.
) um aspecto central em jogos dinmicos a credibilidade.
Um exemplo econmico das mesmas ideias
A empresa E (o entrante potencial) est a decidir se deve ou no entrar num mercado
onde existe actualmente uma nica empresa instalada, a empresa I. Se a empresa
E decidir entrar, a empresa I pode acomodar a entrada da empresa E, ou pode
lutar desencadeando uma guerra de preos. O jogo est representado na Figura
4.8.A forma normal do jogo :

No entrar
Entrar

Lutar se E entrar

Acomodar se E entrar

0;2
3; 1

0;2
2;1

68

Mtodos Quantitativos

Figura 4.8: Forma extensiva do jogo de predaco

O jogo tem dois EN em estratgias pura (No entrar, lutar se E entrar) e (Entrar,
acomodar se E entrar). No entanto o primeiro deste EN no razovel. Porqu?
Porque se a empresa E entrar a empresa I no quereria implementar a sua ameaa
de lutar. Lutar se E entrar no uma ameaa credvel, porque se E entrar
melhor para empresa instalada acomodar.
) O princpio da racionalidade sequencial que diz que a estratgia de cada jogador
deve especicar decises ptimas seja qual for o ponto da rvore elimina o EN(No
entrar, lutar se E entrar).
Se usarmos backward induction obtemos resultados razoveis. Backward induction
signica resolver o jogo do m para o princpio. Comeamos por estudar qual a
deciso ptima do ltimo jogador a jogar, em cada um dos ns em que ele tem que
decidir. Repare-se que ao fazer isto estamos a resolver um problema de deciso individual. Assim que tivermos encontrado a aco ptima do ltimo jogador, recuamos
na rvore para os ns em que o jogador anterior se move e voltamos a encontrar
a aco ptima para este jogador, e recuamos novamente na rvore. O processo
continua at chegarmos ao incio do jogo.
) A ideia implicta na induo retrospectiva a de que o o primeiro jogador a jogar,
antes de tomar a sua deciso, antecipa a forma como os outros jogadores vo decidir
mais tarde, tendo em conta que eles so racionais e escolhero de forma ptima. Num
certo sentido, para resolver o seu problema o primeiro jogador tem que resolver o
problema dos jogadores seguintes.
Vamos aplicar backward induction nos dois exemplos acima

Captulo 4

69

Teoria de Jogos

) No primeiro exemplo, a deciso ptima do jogador 2 l. Sabendo que o jogador


2 escolher l se tiver a oportunidade de jogar, o jogador 1 escolhe R. Ou seja, (R; l)
a soluo nica do jogo quando se utiliza backward induction.
) No exemplo da predaco, a aco ptima da empresa instalada se E entrar
acomodar. Mas ento a empresa entrante, sabendo que a empresa instalada acomoda
se ela entrar, decide entrar.
Dois exemplos econmicos
O jogo de Stackelberg
O jogo de Stackelberg semelhante ao jogo de Cournot, excepto na questo do timing
das decises. No jogo de Stackelberg, a empresa decide primeiro quanto produzir. A
empresa 2, depois de observar a escolha da empresa 1 decide quanto quer produzir.
Qual a soluo do jogo usando backward induction?
A empresa 2 escolhe q2 de forma ptima, seja qual for o q1 escolhido pela
empresa 1:
max (a q1 q2)q2 cq2
q2

Resolvendo obtemos
a c q1
2
) Note-se que isto dene a estratgia ptima da empresa 2, diz-nos queal o
valor ptimo de q2 para cada valor de q1 que possa ocorrer.
q2 =

A empresa 1, sabendo que a empresa 2 vai reagir de acordo com q2 =


escolhe q1 de forma a maximizar o seu lucro:

a c q1
max a q1
q1 cq1
q1
2

acq1
2

As condies de primeira ordem deste problema so:

@1
a c q1 q1
a c
= a q1
c = 0 , q1 =
@q1
2
2
2
Logo o resultado do jogo, usando backward induction q1 =
) A empresa 1 (a lder) produz mais que no jogo simultneo

ac
2

) A empresa 2 (a seguidora) produz menos que no jogo simultneo.

e q2 =

ac
4 .

70

Mtodos Quantitativos

O problema do Principal-Agent
Consideremos uma relao bilateral em que uma parte contrata outra parte para
executar uma determinada aco. O contratante o principal, o contratado o
agente.
Exemplo: uma contrata um gestor. O lucro da empresa, ; uma varivel estocstica que depende do nvel de esforo do gestor, e. O dono da empresa observa o lucro
obtido mas no observa o nvel de esforo realizado pelo gestor. A empresa oferece
um contrato ao gestor, w() que especica o salrio que este recebe como funo do
lucro obtido (o esquema de incentivos).
Isto um jogo dinmico de informao perfeita: no primeiro estgio do jogo a
empresa oferece w(), depois de observar w() o gestor decide se aceita ou no o
contrato. Se aceitar o contrato, o gestor decide depois o nvel de esforo. De seguida,
a natureza escolhe o estado da natureza (o valor de ).
O jogo pode ser resolvido usando backward induction.

4.4.2

Jogos de informao imperfeita e equilbrio perfeito

Consideremos o jogo representado na Figura 4.9. Neste jogo a empresa 1 no primeiro


estgio do jogo decide quanto investir. O investimento da empresa 1 afecta os seus
custos marginais (quanto mais investir, mais baixos vo ser os custos marginais). No
segundo estgio do jogo a empresa 1 e a empresa 2 concorrem em preos.
1

I
2

p2
1

p1

p1

Figura 4.9: O jogo do investimento.

A ideia do equilbrio perfeito aplicar a ideia de backward induction a jogos com


informao imperfeita. Em vez de comearmos nos ltimos ns de deciso do jogo,

Captulo 4

71

Teoria de Jogos

comeamos a resolver o jogo nos ltimos conjuntos de informao que tenham s um


n, resolvendo o subjogo que comea nesse n.
O que um subjogo? Um subjogo uma pea do jogo que pode ser analisada
independentemente. Um subjogo tem de satisfazer:
Comea num n que pertence a um conjunto de informao s com um n.
Inclu todos os ns que se se seguem a esse n.
Inclu to os payos nos ns terminais que se seguem a esse n.
No corta nenhum conjunto de informao.
Denio de equilbrio perfeito em todos os subjogos um equilbrio de Nash um
equilbrio perfeito em todos os subjogos, se as estratgias dos jogadores implicarem
equilibrios de Nash em todos os subjogos.
1

L
3

Figura 4.10: Jogo sem subjogos para alm do prprio jogo..

Exemplo: Consideremos outra vez o jogo da predao, mas com uma variante: se a
empresa E entrar temos um jogo simultneo entre as duas empresas, em que cada
uma delas pode lutar ou acomodar. A Figura 4.11 apresenta este jogo em
forma extensiva:A forma normal do jogo :

No entrar, acomodar se entrar


No entrar, lutar se entrar
Entrar, acomodar se entrar
Entrar, lutar se entrar

Acomodar se E entrar

Lutar se E entrar

0;2
0;2
2;1
1; 2

0;2
0;2
2; 1
3;1

72

Mtodos Quantitativos

-2,-1

1,-2

Figura 4.11: Forma extensiva do jogo de predaco.

Este jogo tem trs EN em estratgias puras, mas dois deles no so razoveis. Vamos
encontrar o equilbrio perfeito deste jogo. Comecemos por resolver o jogo simultneo
do segundo estgio do jogo. A forma normal deste subjogo :
Acomodar
Acomodar
Lutar

2;1
1; 2

Lutar

2; 1
3;1

O nico eN deste subjogo (acomodar, acomodar). Logo um equilbrio perfeito em todos os subjogos deve especicar que no segundo estgio do jogo a estratgia de continuao
das empresas acomodar.
Recuando na rvore vericamos que a empresa E obtm 0 se no entrar e obtm 2 se
entrar. Por conseguinte, o nico equilbrio perfeito consiste na empresa E entrar e ambas
empresas acomodarem no segundo estgio do jogo.

4.4.3

Comentrios sobre backward induction e equilbrio perfeito

Considermos o jogo representado na Figura 4.12.

Backward Induction funciona por instrospeco. Mas, quais as hipteses sobre o que
os jogadores sabem acerca dos outros?
O jogador 3 joga R porque racional. O jogador 2 conhece os payos do jogador 3
e sabe que ele racional, logo sabe que ele vai jogar R. Por conseguinte, o jogador

Captulo 4

73

Teoria de Jogos

2,2,2

R
3

1,1,1

4,4,4

0,0,0

Figura 4.12: BI e as hipteses sobre conhecimento

2 joga R. O jogador 1 conhece os payos dos jogadores 2 e 3 e sabe que eles so


racionais, sabe que o jogador sabe que 3 racional e conhece os seus payos. Por
isso, o jogador 1 sabe que 2 sabe que o jogador 3 joga R e logo joga R. Sabendo que
2 joga R o jogador 1 decide jogar R.
) Quanto maior a cadeia, mais hiptese ns necessitamos sobre conhecimento.
) Se houver uma pequena probabilidade de algum dos jogadores futuros se desviar,
pode ser melhor jogar L. A soluo no robusta a pequenos erros.
Quando um jogador joga mais que uma vez pode no ser muito razovel usar BI.
Consideremos o jogo representado na Figura 4.13.
1

D1
(1,0)

A1

D2

(0,1)

A2

D3

(3,0)

A3

D4

(2,4)

A4

A5

(5,5)

D5

(6,3)

Figura 4.13: BI e a interpretao de desvios.

) A soluo BI deste jogo que em todos os conjuntos de informao que um


jogador chamado a decidir, ele deve escolher D. Ser que isto razovel?

74

Mtodos Quantitativos

) Imaginemos que o jogador 1 escolhe A, o que que o jogador 2 deve fazer? BI


diz que o jogador deve escolher D, mas BI tambm diz que o jogador 1 devia ter
escolhido D.
) Como que o jogador 2 deve interpretar o desvio do jogador 1? O que que
o jogador 2 deve assumir sobre o comportamneto futuro do jogador 1?
Ser que o desvio foi um acidente? Ou foi de propsito? A BI no d resposta
a estas perguntas. A BI no uma teoria completa porque no d probabilidade
positiva a todas as trajectrias possveis de jogo.
) Se admitirmos que h alguma probabilidade dos jogadores se enganarem (trembles) e assumirmos que os enganos em conjuntos d einformao diferentes so independentes, o argumento de BI justicvel, independentemente do nmero de
desvios observados no passado.
) Mas o engano pode no ser a melhor explicao para um desvio. Talvez o jogador
1 tenha jogado A1 para sinalizar que jogar A3 se tiver oportunidade de voltar a
jogar (argumento de forward induction)...
Quando o jogo de informao imperfeita o equilbrio perfeito requere que os jogadores antecipem todos os mesmos equilbrios em todos os subjogos futuros, quer
estejam ou no na trajectria de equilbrio. Isto extremamente exigente.

Captulo 5

Planeamento e controlo de projectos

Quando estudmos os vrios sistemas de produo vimos que a produo por projecto se
utiliza na produo de um nico produto/servio. A produo por projecto aplica-se a uma
basta gama de produtos manufacturados e servios. A construo de edcios, a construo
de navios e avies so feitas por projecto. Servios como lmes, projectos de investigao e
desenvolvimento, ensinar uma disciplina so feitos por projectos. Para alm disso, muitas
das actividades das empresas tambm so organizados como projectos. Actividades como a
concepo de produtos novos, a automatizao da produo, a implementao de sistemas
de gesto da qualidade so organizadas como projectos. Por esta razo, o planeamento, a
programao e o controlo de projectos so essencias em qualquer organizao.

5.1
5.1.1

Objectivos e tipos de deciso na gesto de projectos


Objectivos

Normalmente h trs objectivos num projecto: minimizar custo, completar o projecto no


tempo desejado, e produzir um produto/servio com as caractersticas desejadas.
O custo do projecto a soma de todos os custos directos e indirectos associados com
o projecto, incluindo custos de trabalho, materiais e servios. Normalmente feito um
oramento para o projecto e uma das funes do gestor do projecto controlar os custos
do projecto.
O segundo objectivo na gesto de projectos concluir o projecto no tempo previsto.
Uma das funes do gestor do projecto controlar os tempos de execuo de forma a
assegurar que o projecto concludo na data prevista.
Por ltimo, a gesto do projecto deve garantir que o produto/servio que est a ser
produzido possu as caractersticas desejadas.
Muitas vezes existem trade-os entre os vrios objectivos. Por exemplo, se o projecto

76

Mtodos Quantitativos

est atrasado possvel acelerar a execuo do projecto se usarmos horas extraordinrias.


Contudo, isso implica um aumento nos custos. Por conseguinte existe um tradeo entre
custo-tempo. Um outro exemplo, se queremos aumentar a qualidade do produto, isso
pode ser possvel com custos e tempo adicionais.

5.1.2

Tipos de deciso

A gesto de projectos envolve vrios tipos de deciso: decises de planeamento, programao e controlo. As decises de planeamento ocorrem no nicio do projecto e estabelecem
os objectivos principais do projecto, os recursos necessrios, a forma de organizao, as
pessoas que vo ser responsveis pelo projecto.
A fase de programao especica de maneira mais detalhada o plano do projecto. Nesta
fase comea por se elaborar uma lista detalhada das actividades necessrias para completar
o projecto, e a sequncia em que essas actividades tm de ser realizadas indicada. Com
esta informao constro-se o calendrio do projecto. Um outro elemento importante
oramento do projecto, sendo normalmente indicados o calendrio dos custos. Por ltimo,
o programa deve especicar a forma como o pessoal do projecto afectado a cada uma
das actividades do projecto.
medida que o projecto vai sendo executado importante vericar se a implementao
est de acordo com o planeado, tanto em termos de custo, como de tempo, como de
qualidade. Quando existe uma discrepncia entre o resultado vericado e o plano devem
tomar-se medidas no sentido de corrigir os problemas identicados. Estas medidas podem
incluir a reviso do programa, mudanas na afectao de pessoal, realocao de fundos.

5.2
5.2.1

Representao do projecto
Identicao das actividades

O primeiro passo na programao de um projecto a identicao das actividades necessrias


para completar o projecto e das ligaes existentes entre as vrias actividades. Muitas
vezes, existem relaes de precedncia entre certas actividades (a actividade B s pode
iniciar-se depois da actividade A estar concluda). Estas relaes de precedncia podem
existir por razes de cracter tcnico, legal, etc.
Para alm das relaes de precedncia, as actividades tambm podem estar interrelacionadas de outras formas. Por exemplo, se duas actividades utilizarem o mesmo
recurso escasso, pode ser impossvel realizar as duas actividades em simultneo.

Captulo 5

Planeamento e Controlo de Projectos

77

O passo seguinte representar as vrias actividades e as suas inter-ligaes de forma


a auxiliar-nos na programao do projecto. H duas formas de representao que so
bastante utilizadas: grco de Gantt e rede de actividades.

Grco de Gantt
O grco de Gantt um grco de barras onde cada coluna corresponde a uma unidade
de tempo e cada linha a uma actividade a realizar. Para cada actividade denida uma
barra horizontal, correspondendo o seu comprimento durao da tarefa. A posio de
cada barra no grco vai depender das ligaes entre as vrias actividades.
A ideia comear por representar as actividades que no tm nenhuma actividade
precedente. De seguida, representam-se as actividades que tm como actividades precedentes as actividades j representadas, e por a diante...
Para alm das actividades, no grco de Gantt tambm se podem representar acontecimentos (para indicar o m de uma etapa importante, por exemplo). Os acontecimentos
correspondem a um momento do tempo, enquanto as actividadades so tarefas com uma
determinada durao.
Exemplo 5.1 Um determinado projecto envolve 5 tarefas: A; B; C; D e E. A tarefa A
demora 1 dia, a tarefa B dura 4 dias, a tarefa C dura 2 dias, a tarefa D dura 1 dia e a
tarefa E dura 3 dias. Para alm disso, as tarefas B e C s podem ser realizadas depois
de A, a tarefa D depois de C e a tarefa E depois de B e D. O grco de Gantt deste
projecto est representado na Figura 5.1.

Figura 5.1: Grco de Gantt do Exemplo 5.1.

78

Mtodos Quantitativos

Rede de actividades
Na representao em rede, cada uma das actividades representada por um arco orientado.
Para alm dos arcos, uma rede tambm possui ns, que representam acontecimentos. Um
n corresponde nalizao das actividades que nele convergem, o que implica que se
pode dar incio s actividades que dele emergem. Na Figura 5.2 est representado a rede
de actividades do Exemplo 5.1. A rede indica claramente a sequncia das actividades: B e
C s podem iniciar-se depois de A estar concluda, D s pode iniciar-se depois de C estar
concluda. B e D tem de estar concludas antes de E se iniciar.
O comprimento dos arcos orientados no depende da durao da tarefa. Na representao em rede, a durao de cada actividadde est indicada entre parentses.

Figura 5.2: Rede de actividades do pro jecto do Exemplo 5.1.

Nvel de pormenor
Uma questo interessante qual o nvel de pormenor que se deve considerar na decomposio do projecto em actividades? claro que se nos limitarmos a indicar somente as
macro-actividades obteremos uma rede relativamente simples e de fcil anlise, mas que
pode no ser a mais adequada para efeitos de planeamento e controlo do projecto. Em
contrapartida, se quisermos ir ao nvel das actividades elementares, a descrio do projecto
ser mais completa, mas a rede ser tambm complexa, o que dicultar a sua anlise.
O nvel de pormenor depender do efeito para o qual a rede vai ser usada. Se a descrio
do projecto for dirigida ao cliente ou aos gestores de nvel superior da empresa, bastar uma
descrio ao nvel das macro-actividades. Mas para o responsvel da execuo do projecto
importante ter uma descrio pormenorizada que o ajude a orientar e controlar a execuo
do projecto. Uma ideia interessante elaborar uma hierarquia de redes para o mesmo
projecto. Ou seja, construir vrias redes em que o grau de pormenor vai aumentando.
No nvel superior da hierarquia o projecto decomposto apenas nos grandes processos ou
macro-actividades, mas nos nveis seguintes essas actividades vo sendo progressivamente
decompostas.

Captulo 5

Planeamento e Controlo de Projectos

79

Um aspecto que importante que, seja qual for o nvel de pormenor a que a rede
construda, deve manter-se o mesmo nvel de detalhe em todas as actividades. Por exemplo,
no faria sentido estar a descrever a construo de uma casa, a um nvel muito geral
(fundaes, estrutura do primeiro andar, estrutura da cobertura,...) e simultneamente
incluir uma actividade como a montagem de uma porta ou de uma janela.

5.2.2

Previso da durao e recursos necessrios

A qualidade do planeamento do projecto depende imenso do realismo das estimativas sobre


a durao de cada actividade e dos recursos necessrios para a realizar. Se as estimativas
forem demasiado optimistas, o resultado a xao de prazos para a concluso do projecto e estimativas de custos totais que so completamente irrealistas. Se as estimativas
forem demasiado pessimistas, o calendrio ser pouco exigente e as estimativas de custos
demasiado elevadas.
A previso em gesto de projectos bastante dicultada pelo facto de cada projecto ser
nico, o que diculta a utilizao mecnica de dados sobre casos anteriores. Contudo, a
informao e experincia obtida em projectos semelhantes no passado a melhor base para
fundamentar as estimativas para o projecto em anlise (por exemplo, quando a Expo 98
foi organizada, muitas das estimativas foram feitas por paralelismo com o que aconteceu
na organizao dos jogos olmpicos em Barcelona). O problema de previso menos
grave quando a quantidade de projectos similares elevada. Por exemplo, um construtor
de vivendas ao m de algum tempo ter uma ideia bastante precisa de qual o tempo
necessrio para completar cada actividades. Embora cada vivenda seja um projecto nico,
o facto de o construtor possuir experincia com muitos projectos similares ajuda a uma
previso bastante mais precisa do que a que possvel em projectos menos comuns.
importante realar que as estimativas da durao e recursos necessrios no so
independentes. Se utilizarmos mais recursos possvel normalmente encurtar a durao
das actividades.

5.3

Mtodos de programao e controlo

A programao do projecto comea pela denio clara do projecto, identicando as actividades que o constituem, as interdependncias entre elas, o tempo de durao e os recursos
necessrios para a sua execuo. O passo seguinte proceder a anlises que permitam
denir o programa de realizao do projecto. H vrios mtodos que tm sido utilizados

80

Mtodos Quantitativos

para este efeito. A escolha entre eles depender do problema concreto em anlise, da sua
maior ou menor complexidade, dos objectivos que se pretendem atingir e das restries a
levar em considerao.
Vamos comear por estudar uma tcnica relativamente simples: o diagrama de Gantt.
Esta tcnica fcil de usar e compreender, e prefeitamente adequada para projectos
relativamente simples, mas tem grandes limitaes quando a complexidade aumenta.
Em contrapartida, os mtodos baseados em redes de actividades tm capacidade para
resolver problemas de planeamento mais complexos. Estudaremos dois mtodos: o mtodo
do caminho critco (na terminologia inglesa Critical Path Method ou CPM ) e a tcnica de
elaborao e controlo de projectos (em ingls Program Evaluation and Review Technique
ou PERT ). Estes dois mtodos diferem no tratamento da incerteza da durao das tarefas.
No CPM admite-se que a durao das tarefas determnista, no PERT a durao de cada
actividade estocstica.
Em todos os mtodos teremos a preocupao de falar da sua utilizao para efeitos de
planeamento, mas tambm da sua utilizao na monitorizao do projecto.

5.3.1

Diagrama de Gantt

O grco de Gantt pode ser utilizado no planeamento e controlo de projectos. Retomemos


o Exemplo 5.1, e o diagrama de Gantt correspondente.
H vrias concluses que se podem retirar da anlise do grco. Por um lado, a
durao mnima do projecto so 8 dias. Vemos tambm que as actividades B e C s
esto planeadas para comear depois de A estar concluda e que B e C podem ocorrer em
simultneo. A actividade D comea depois de C acabar e a actividade E depois de B e
D estarem concludas.
Para alm disso, o diagrama de Gantt permite visualizar a existncia de folgas em
determinadas actividades. Uma folga corresponde ao tempo de atraso que pode ocorrer
naquela actividade sem que isso leve a um aumento da durao global do projecto. Na
Figura 5.3 podemos vericar que a actividade D tem uma folga de 1 dia.
Observando o grco vericamos que a sequncia de actividades que determinam a
durao do projecto so A, B e E. Se houver atrasos nalguma destas actividades a
durao do projecto ser maior. Por conseguinte, o gestor do projecto deve dar uma
ateno especial a estas tarefas na fase de controlo.
Na representao que zemos, cada actividade iniciada o mais cedo possvel, tendo
em conta as relaes de precedncia entre as actividades. Este tipo de planeamento

Captulo 5

Planeamento e Controlo de Projectos

81

Figura 5.3: Grco de Gantt e indenticao de folgas.

designado por escalonamento das datas mais cedo. Este no o nico mtodo de escalonamento possvel. Uma alternativa iniciar as actividades o mais tarde possvel, tendo em
conta que o projecto deve estar concludo numa determinada data. A Figura 5.4 ilustra,
para o exemplo anterior, o escalonamento das datas mais tarde, admitindo que o projecto
tem de estar concludo ao m de 8 dias. Neste caso, comeamos por representar as actividades que no tm nenhuma actividade subsequente o mais tarde possvel (a tarefa E,
no nosso exemplo). De seguida, representamos o mais tarde possvel as actividades que
so imediatamente precedentes das actividades j representadas (as actividades D e B no
exemplo), e assim sucessivamente at estarem representadas todas actividades, incluindo
as que no tm tarefas precedentes.

Figura 5.4: Escalonamento das datas mais tarde.

O diagrama de Gantt pode ser utilizado no controlo do projecto medida que este vai
sendo implementado. A ideia indicar no diagrama o progresso em cada um das actividades sombreando uma fraco da barra representativa de cada actividade. Imaginemos,

82

Mtodos Quantitativos

por exemplo, que no m do terceiro dia de implementao do projecto, a actividade A


estava concluda, 1/2 da actividade C esto concludos e 3=4 da actividade B esto concludos. A Figura 5.5 ilustra o progresso na execuo do projecto no nal do terceiro
dia. Como 3=4 da actividade B esto concludos, 3=4 da barra da actividade B aparece a
sombreado. De forma semelhante, 1=2 da barra da actividade C aparece a sombreado.

Figura 5.5: Diagrama de Gantt e controlo do pro jecto.

Com base nesta representao podemos concluir que a actividade B est adiantada
um dia em relao ao planeado e que, em contrapartida, a actividade C est atrasada
um dia em relao ao planeado. Repare-se que isto no pe ainda em causa a concluso
do projecto em 8 dias, mas agora as actividades crticas so C, D e E.
Este pequeno exemplo ilustra o facto de os diagramas de Gantt no serem apenas
instrumentos de planeamento esttico, mas deverem ser tambm utilizadas na fase de
execuo do projecto. Esta utilizao dinmica dos diagramas de Gantt permite observar
a evoluo de cada uma das actividades, identicar eventuais problemas, e tomar medidas
para corrigir esses problemas.
Em projectos simples os diagramas de Gantt so muito utilizados porque so fceis de
usar e de compreender. Mas em projectos complexos os diagramas de Gantt so inadequados porque no ilustram de forma clara as relaes entre as vrias actividades. Para
projectos complexos dcil construir os diagramas de Gantt na fase de planeamento e
ainda mais dcil proceder a alteraes caso haja mudanas no planeamento. Para esses
casos, os mtodos baseados em redes de actividades so claramente superiores.

Captulo 5

5.3.2

83

Planeamento e Controlo de Projectos

Mtodo do caminho crtico CPM

O mtodo do caminho crtico (CPM Critical Path Method) foi inicialmente concebido
para o planeamento de projectos com objectivo de minimizar o tempo de realizao do
projecto. Contudo, possvel incorporar na anlise o planeamento dos recursos necessrios
e de estudar os trade-os existentes entre custo e tempo de realizao. Vamos comear por
estudar o problema de programao temporal e, mais tarde, estender a anlise gesto
dos recursos.
Elaborao da rede de actividades
Para ilustrar a aplicao do mtodo do caminho crtico vamos considerar um exemplo
simples. Uma equipa de engenheiros responsvel por pr a funcionar uma linha de
produo para manufacturar um novo produto numa determinada empresa. As mquinas
j chegaram dos fornecedores, e a fbrica j foi redesenhada de forma a que a linha de
produo possa ser montada. Pretende-se que a fbrica esteja pronta a produzir no espao
de um ms. A equipa deste projecto identicou as vrias actividades envolvidas, as relaes
de precedncia entre as actividades e ainda os tempos de durao de cada actividade. A
tabela seguinte apresenta a informao relevante.

Actividade

Cdigo

Durao da
actividade

Cdigo actividades
imediatamente
precedentes

Organizar equipa de implantao das mquinas

Organizar equipa de modicao das instalaes

Reunir com o pessoal da produo

Concepo das tarefas do pessoal

Colocar as mquinas no lugar

Ligar as mquinas

Modicar o tap ete de transporte

Treinar p essoal

D,E

Pintar e limpar

F,G

Produzir uma srie piloto do produto

H,I

Na Figura 5.6 est representada a rede de actividades do projecto de montagem da


linha de produo.
O traado da rede comea pela representao da actividade A, que a nica que

84

Mtodos Quantitativos

Figura 5.6: Rede de actividades na montagem da linha de produo.

no tem nenhuma actividade precedente. De seguida, marcam-se as actividades que s


tm como actividade precedente a actividade A, j representada. Ou seja, marcam-se
as actividades B e C. No passo seguinte, j podemos representar as actividades que s
tenham como actividades precedentes aquelas que j esto representadas (A, B ou C).
Por conseguinte, podemos j representar as actividades D, E e G. E o processo continua
at estarem representadas todas as actividades.

Na elaborao da rede muito til construir um quadro auxiliar onde se indicam todas
as actividades e as respectivas actividades precedentes. medida que as actividades vo
sendo representadas na rede, os seus cdigos vo sendo riscados na lista de precedncias.
As actividades que se podem iniciar-se a cada passo so aquelas para os quais a lista de
precedncia j tem os cdigos todos riscados (o que signica que as actividades precedentes
j esto todas representadas). A tabela seguinte apresenta esta ideia depois de A, B e
C j estarem marcadas. fcil vericar que, no passo seguinte, D, E e G podem ser
representadas na rede e os respectivos cdigos riscados nas listas de precedncias.

Captulo 5

Planeamento e Controlo de Projectos

Cdigo

85

Cdigo das actividades


imediatamente precedentes

D,E

F,G

H,I

Um aspecto curioso na rede do projecto de montagem da linha de produo a existncia de uma actividade marcada a tracejado, unindo os ns 6 a 5. Esta actividade no
demora tempo, nem consome recursos, uma actividade ctcia. O facto de se introduzir
esta actividade ctcia prende-se com a necessidade de a rede representar de forma correcta as interdependncias entre as actividades. Se no tivessemos includo a actividade que
liga os ns 6 a 5, no estaramos a levar em considerao o facto de H s se poder iniciar
depois de E estar concluda. Repare-se que tambm no poderamos fazer coincidir os ns
5 e 6, porque se o zessemos estaramos a impr que F s pudesse ser iniciada depois de
D, o que viola as relaes de precedncia identicadas.
normal no traado inicial da rede introduzir mais actividades ctcias que as efectivamente necessrias. Mas, desde que a estrutura lgica da rede esteja correcta, isso no
levanta grandes problemas. A nica desvantagem que torna a rede mais complexa do que
seria necessrio, o que pode tornar a anlise mais morosa, mas permite chegar s mesmas
concluses da anlise da rede simplicada. Por conseguinte, depois de se ter produzido
uma representao inicial da rede de actividades, boa ideia vericar se ou no possvel
simplicar o traado da rede.
Identicao das actividades crticas
Vamos comear por identicar para cada n da rede qual o seu tempo mais cedo de
ocorrncia, isto , qual tempo mnimo que ter de decorrer desde o incio do projecto
at que todas as actividades que convergem naquele n estejam concludas. Por exemplo,
o tempo mais cedo do n 2 de 5 dias (para se atingir o n dois necessrio efectuar a

86

Mtodos Quantitativos

actividade A que demora 5 dias). Depois de j ter executado a actividade A, para se atingir
o n 3 necessrio efectuar a actividade B, o que demora mais 7 dias. Por conseguinte,
o tempo mnimo necessrio para atingir o n 3 de 5 + 7 = 12 dias. Se designarmos por
TMCi o tempo mais cedo do n i e por di;j a durao da actividade que liga os ns i e j,
teramos neste exemplo:
TMC3 = TMC2 + d2;3 = TMC2 + dB = 5 + 7 = 12.
De forma semelhante, o tempo mais cedo do n 4 :
T MC4 = TMC2 + d2;4 = T MC2 + dC = 5 + 4 = 9.
E por sua vez o TMC6 = 9 + 9 = 18.
A ocorrncia de alguns ns est dependente da concluso de mais do que uma actividade. Por exemplo, a ocorrncia do n 5 est condicionada pela concluso da actividade
D e da actividade ctcia. Para esses ns o tempo mais cedo determinado pela ltima
actividade a ser concluda, no conjunto de actividades que convergem naquele n. O tempo
mais cedo de concluso da actividade D 12+3 = 15 dias. Mas a concluso da actividade
ctcia no pode ocorrer antes de 18 dias e, por conseguinte, o tempo mnimo necessrioa
para atingir o n 5 so 18 dias. Ou seja:
TMC5 = max [T MC3 + 3; TMC6 + 0] = max [15; 18] = 18:
Este exemplo pode ser generalizado. Se o n j tem como ns precedentes (isto ns
ligados directamente ao n j por arcos orientados) vrios ns i, ento o tempo mais cedo
do n j dado por:
T MCj = max [TMCi + di;j ] :
i

Aplicando esta regra aos restantes ns da rede de actividades obtemos:


T MC7 = max [TMC4 + dG ; T MC6 + dF ] = max [9 + 6; 18 + 5] = 23
T MC8 = max [TMC5 + dH ; T MC7 + dI ] = max [18 + 3; 23 + 5] = 28
T MC9 = T MC8 + dJ = 28 + 4 = 32
O n 9 correponde ao m do projecto. Por conseguinte, a durao mnima do projecto
de 32 dias.
Para alm do tempo mais cedo de ocorrncia, tambm importante conhecer o tempo
mximo que pode decorrer at ocorrncia do n para que o projecto possa estar concludo

Captulo 5

Planeamento e Controlo de Projectos

87

nos 32 dias, isto , qual o tempo mais tarde de ocorrncia do n. Designemos por TMTj o
tempo mais tarde de ocorrncia do n j. Para o n 9, que ltimo n da rede e corresponde
concluso do projecto, o tempo mais tarde de ocorrncia 32 dias, se quisermos garantir
que o projecto est concludo ao m de 32 dias. Como determinar o tempo mais tarde de
ocorrncia dos outros ns da rede? Vamos ter de proceder recursivamente do m para o
incio da rede.
Ns sabemos que depois de o n 8 ter ocorrido ainda falta realizar a actividade I para
concluir o projecto. Como esta actividade tem uma durao de 4 dias, isso implica que
para que a durao total do projecto seja de 32 dias, o tempo mais tarde de ocorrncia do
n 8 de 28 dias, ou seja:
T MT8 = TMT9 d8;9 = TMT9 dI = 32 4 = 28:
De forma semelhante, o tempo mais tarde de ocorrncia dos ns 5 e 7 dado por:
T MT5 = TMT8 d5;8 = TMT8 dH = 28 3 = 25:
T MT7 = TMT8 d7;8 = TMT8 dI = 28 5 = 23:
At aqui os ns analisados s tinham um n subsequente. Mas o n 6 tem dois ns
subsequentes: o n 7 e o n 5. Por conseguinte, na determinao do tempo mais tarde de
ocorrncia do n 6 teremos de levar em conta os tempos mais tarde de ocorrncia desses
ns, no podendo a ocorrncia do n 6 por em causa nenhum desses tempos mais tarde.
Atendendo a que T MT5 = 25, e que a actividade que liga os ns 5 e 6 ctcia e logo
de durao nula, o n 6 no pode ocorrer mais tarde que ao m de 25 dias. Mas, temos
tambm que levar em conta o facto de T MT7 = 23, e como a durao da actividade F
de 5 dias, isso implica que o tempo mais tarde de incio da actividade F de 18 dias.
Esta condio a mais restritiva e, por conseguinte, o tempo mais tarde de ocorrncia do
n 6 de 18 dias. Em termos formais:
TMT6 = min [TMT5 d6;5; TMT7 d6;7] = min [25 0; 23 5] = 18:
Este exemplo do clculo do tempo mais tarde do n 6, pode generalizar-se para qualquer
n i, que precede um conjunto de ns, identicados pelo ndice j. O tempo mais tarde de
ocorrncia do n i dado por:
TMTi = min [TMTj di;j ] :
j

88

Mtodos Quantitativos

Aplicando esta regra aos restantes ns da rvore obtemos:


TMT4 = min [T MT6 dE; TMT7 dG ] = min [18 9; 23 6] = 9:
TMT3 = TMT5 dD = 25 3 = 22

TMT2 = min [T MT3 dB ; T MT4 dC ] = min [22 7; 9 4] = 5:


TMT1 = TMT2 dA = 5 5 = 0:
A Figura 5.7 apresenta os resultados obtidos, representando-se junto de cada n os seus
tempos mais cedo ( esquerda) e mais tarde ( direita).

Figura 5.7: Tempos mais cedo e tempos mais tarde de ocorrncia.

A anlise dos tempos mais cedo e mais tarde para cada n da rede permite-nos identicar duas situaes: para alguns ns o tempo mais cedo e o tempo mais tarde no
coincidem, para outros ns aquelas datas coincidem. Consideremos o n 5, por exemplo.
O facto de TMC5 = 18, indica-nos que so necessrios 18 dias para concluir todas as
actividades que antecedem o n 5, no sendo por isso possvel iniciar a actividade H antes
desta data. Por outro lado, o facto de TMT5 = 25 indica-nos que para no por em causa
a concluso do projecto em 32 dias a actividade H no pode ser iniciada mais tarde que
ao m de 25 dias, implicando que todas as actividades que precedem a actividade H tero
de estar concludas at aquela data. Para o n 5 existe alguma exibilidade, o seu tempo
de ocorrncia pode variar entre 18 e 25, sem que isso viole as condies do problema.

Captulo 5

Planeamento e Controlo de Projectos

89

Em contrapartida , h ns (1,2,4,6,7,8 e 9) para os quais o tempo mais cedo e o tempo


mais tarde de ocorrncia coincidem. Isto signica que a data de ocorrncia do n est
xada, no havendo qualquer exibilidade ( uma data obrigatria de ocorrncia). Por
um lado no possvel concluir as actividades que convergem no n antes daquela data,
pelo outro se essas actividades no estiverem concludas naquela data isso pe em causa a
durao total do projecto. Este tipo de ns so designados por ns crticos, uma vez que
qualquer alterao nas suas datas de ocorrncias tem repercursses na durao total do
projecto.
Para alm da identicao dos ns crticos importante identicar as actividades crticas. As actividades crticas so aquelas para os quais alteraes na sua durao implicam
modicaes na durao global do projecto. No fundo, so estas actividades que determinam a durao global do projecto. muito importante identicar as actividades crticas,
porque na fase de implementao do projecto e o gestor deve prestar especial ateno
execuo dessas actividades, uma vez que qualquer atraso nessas tarefas conduzir a
atrasos na concluso do projecto.
Como identicar as actividades crticas? As actividades crticas so actividades que
unem dois ns crticos e cuja durao igual diferena entre os tempos de ocorrncia dos
dois ns que unem. Estas actividades so aquelas que foram determinantes no clculo
dos tempo mais cedo e dos tempo mais tarde de ocorrncia.
No nosso exemplo as actividades crticas so A, C, E, F, I e J. Este conjunto de
actividades dene o caminho crtico. Repare-se que no basta uma actividade unir ns
crticos para ela ser uma actividade crtica. Por exemplo, a actividade G une os ns crticos
4 e 7 mas no uma actividade crtica. A diferena entre as datas de ocorrncia dos ns 7
e 4 de 14 dias (239 = 14) o que excede a durao da actividade G, ou seja a actividade
G tem uma folga de 14 6 = 8 dias.
O caminho crtico corresponde sequncia de actividades que determinam a durao
total do projecto. Isto sugere uma forma alternativa de identicar o caminho crtico. Se
identicarmos todas as possveis sequncias de actividades desde o incio at ao m do
projecto, isto , todos os caminhos que ligam o n inicial ao nal, e determinarmos
a durao total de cada um desses caminhos, o caminho crtico aquele que tem maior
durao. No exemplo acima os possveis caminhos so: (A; B; D; H; J ) com uma durao
de 22 dias, (A; C; E; H; J ) com durao total de 25 dias, (A; C; G; I; J) com uma durao
de 24 dias e (A; C; F; I; J) com uma durao de 32 dias. Por conseguinte, o ca,inho critico
(A; C; F; I; J ).

90

Mtodos Quantitativos

Determinao das folgas


Na seco anterior calculmos os tempos mais cedo e mais tarde de ocorrncia de um n.
Contudo, til conhecer tambm a calenderizao das actividades, quais so os tempo
mais cedo e mais tarde de incio e de concluso de uma actividade? Repare-se que h
quatro datas importantes: tempo mais cedo de incio, tempo mais tarde de incio, tempo
mais cedo de concluso, tempo mais tarde de concluso.
Para usarmos uma notao semelhante anterior, designaremos por T MCIi;j o tempo
mais cedo de incio da actividade que liga os ns i a j e por T MT Ii;j o tempo mais tarde
de incio da mesma actividade. Para alm disso, designaremos por TMCFi;j tempo mais
cedo de concluso da actividade que liga os ns i e j e por T MT Fi;j o respectivo tempo
mais tarde de concluso. Como que estas datas podem ser determinadas?
Como bvio o tempo mais cedo de incio de uma actividade igual ao tempo mais
cedo de ocorrncia do n da qual a actividade emerge, uma vez que a actividade s pode
ser iniciada depois de todas as actividades que convergen naquele n terem sido nalizadas.
Por conseguinte:
T MCIi;j = TMCi :
Por outro lado, o tempo mais cedo de concluso da actividade que liga os ns i e j igual
ao seu tempo mais cedo de incio mais a sua durao:
TMCFi;j = T MCIi;j + di;j
De forma semelhante, o tempo mais tarde de concluso da actividade que liga os ns i e
j o tempo mais tarde de ocorrncia do n j:
TMTFi;j = TMTj:
O tempo mais tarde de incio da actividade que liga os ns i e j: o tempo mais tarde de
concluso menos a durao da actividade, ou seja:
TMTIi;j = TMT Fi;j di;j:
Na Figura 5.8 esto representadas estas quatro datas para cada uma das actividades:
no primeiro parnteses recto esto as datas mais cedo de incio e concluso, no segundo
parnteses as datas mais tarde de incio e concluso da actividade. Para aquelas actividades em que os dois intervalos coincidem apenas um intervalo apresentado. Essas so

Captulo 5

Planeamento e Controlo de Projectos

91

Figura 5.8: Tempo mais cedo e mais tarde de incio e de concluso de cada actividade.

as actividades crticas que no tm qualquer exibilidade nos seus tempos de incio ou


concluso.
Para as actividades que no esto no caminho crtico, tambm designadas por actividades folgadas, existe alguma exibilidade nos tempos de incio e concluso. H vrios
tipos de folgas que podem ser calculadas para essas actividades.
A folga total o montante de tempo que a durao de uma actividade pode aumentar
sem causar atrasos na durao total do projecto. A folga total da actividade que liga os
ns i e j dada por:
FTi;j = T MT Ii;j TMCIi;j = (TMTj di;j) TMCi = T MTj TMCi di;j :
Repare-se que se uma actividade utilizar toda a sua folga total, para que o projecto
no sofra atrasos, isso impe restries nas actividades antecedentes que tero que estar
concludas no tempo mais cedo de ocorrncia do n i, e nas actividades sucessoras que no
podero iniciar-se antes de TMTj . O facto de a utilizao da folga total impr restries
s actividades antecessoras e sucessoras, leva-nos a pensar num outro tipo de folga: a folga
livre.
A folga livre direita o aumento que pode ocorrer na durao de uma actividade
sem que isso condicione em nada o incio das actividades sucessoras. Em termos formais
a folga livre direita da actividade que liga os ns i e j dada por:
F LDi;j = TMCj T MCi di;j:

92

Mtodos Quantitativos

De forma semelhante, podemos denir a folga livre esquerda como o aumento que
pode ocorrer na durao da tarefa sem que isso condicione as datas de concluso das
actividades antecessoras, e dada por:
FLEi;j = T MTj TMTi di;j :
Por ltimo, podemos denir a folga independente como o aumento que pode ocorrer
na durao da actividade sem que isso condicione em nada nem as datas de incio das
actividades sucessoras, nem as datas de concluso das actividades antecessoras. A folga
independente calculada admitindo que as actividades antecessoras so concludas no
tempo mais tarde e que as actividades sucessoras se iniciam no seu tempo mais cedo, ou
seja:
F Ii;j = T MCj T MTi di;j :
importante realar que a folga independente pode ter valores negativos. Um valor
negativo da folga independente signica que seria necessrio uma reduo na durao da
actividade para em simultneo poder iniciar as actividades sucessoras no seu tempo mais
cedo e poder concluir as actividades antecessoras no seu tempo mais tarde. Ou seja,
impossvel satisfazer em simultneo aquelas duas condies a no ser que se reduza a
durao da actividade.
Os quatro tipos de folgas esto relacionados. fcil mostrar que:
F LDi;j + F LEi;j = FTi;j + FIi;j :
O quadro seguinte apresenta os quatro tipo de folgas para as actividades no crticas no
exemplo do projecto de montagem da linha de produo.

5.3.3

Actividade

FT

FI

FLD

FLE

10

10

10

-7

Tcnica de elaborao e controlo de projectos PERT

O PERT foi desenvolvido em meados da dcada de 1950, tendo sido utilizado na programao do projecto de construo do submarino Polaris (diz-se que a sua utilizao

Captulo 5

Planeamento e Controlo de Projectos

93

possibilitou que o projecto fosse concludo 2 anos antes do que seria possvel caso no
tivesse sido utilizado).
No mtodo do caminho crtico admite-se que a durao de uma actividade determnistica, isto , no h qualquer incerteza relativamente ao seu valor. Mas na realidade
h sempre alguma incerteza sobre a durao de uma actividade. O PERT (Program Evaluation and Review Technique) um mtodo de programao e controlo de projectos que
leva em considerao a incerteza associada durao de cada actividade. No PERT a
durao de uma actividade considerada uma varivel aleatria. Tal como o mtodo
do caminho crtico, o PERT usa a representao em rede. Contudo, no PERT a rede
estocstica e permite uma anlise probabilstica da durao global do projecto.
Na sua verso original, o PERT exige trs estimativas da durao de cada actividade:
uma estimativa optimista dop (condies muito favorveis), uma estimativa pessimista dpe
(condies adversas), e a estimativa mais provvel dmp (condies normais). Para alm
disso, o PERT admite que a durao da actividade segue uma distribuio beta. Nestas
condies, a durao mdia dada por:
dop + 4dmp + dpe
:
6
Por sua vez, a disperso dos valores da durao em relao ao seu valor mdio, medida
pela varincia, dada por:
E [d] = =

(dpe dop)2
:
36
A varincia da durao uma medida do grau de incerteza associado durao.
A razo para a escolha da distribuio beta prende-se com a sua exibilidade, podendo
ter assimetria positiva ou negativa, consoante os valores das estimativas dop, dmp e dpe .
de salientar que em termos conceptuais no h razo para no se optar por outras
distribuies. Alis, se no passado tiverem sido realizados muitos projectos semelhantes
ao projecto em causa, a informao sobre a durao de cada actividade nos projectos
passados pode ser utilizada para testar qual a distribuio que melhor se ajusta aquelas
observaes. O problema que para projectos que tenham poucos projectos similares no
possvel testar se a distribuio terica admitida se ajusta ou no aos dados (porque
estes no existem!).
Se a durao de cada actividade estocstica, a durao total do projecto tambm
estocstica. Qual a funa de distribuio da durao global do projecto?
Vamos comear por analisar um caso simples: todas as actividades do projecto so
realizadas em sequncia: primeiro feita a actividade 1, depois a 2, depois a 3, , at
2 =

94

Mtodos Quantitativos

actividade n. Neste caso, a durao total do projecto igual soma das duraes das
suas actividades:
dT = d1 + d2 + + dn;
em que cada uma das duraes, di ; uma varivel aleatria. Como a mdia da soma de
variveis aleatrias igual soma das mdias das variveis aleatrias, a durao mdia
do projecto dada por:
T = 1 + 2 + + n :
Para alm disso, se admitirmos que as duraes das vrias actividades so independentes,
a varincia da durao total do projecto igual soma das varincias da durao das
vrias actividades:
2T = 21 + 22 + + 2n :
claro que o conhecimento do valor esperado e da varincia da durao total do
projecto so importantes, mas no chegam para identicar a funo de distribuio de dT .
No PERT admite-se que dT segue uma distribuio normal. Esta hiptese justicada se o
nmero de actividades for elevado. De facto, pelo teorema do limite central a distribuio
da soma de variveis aleatrias tende para uma distribuio normal, se o nmero de
parcelas for sucientemente elevado.
O caso anterior pouco realista. Na maior parte dos projectos h vrias sequncias de
actividades, que podem ser realizadas em paralelo. H vrios caminhos que necessrio
percorrer para que o projecto seja realizado e a durao do projecto determinada pela
sequncia que demorar mais tempo a realizar. Como calcular a distribuio da durao
nestas circunstncias?
Em termos tericos a anlise extremamente complexa, porque as duraes dos vrios
caminhos no so independentes (muitos caminhos tm troos que so comuns). Por essa
razo, comum simplicar a anlise admitindo que a durao do projecto denida pela
durao do caminho crtico considerando as duraes mdias de cada actividade. A anlise
probabilstica do tempo de durao total do projecto feita assumindo que a durao
total segue uma distribuio normal, em que a mdia igual durao total esperada do
caminho crtico e a varincia igual soma das varincias da durao das actividades no
caminho crtico.
Mais frente veremos que basear a anlise estatstica do projecto exclusivamente nas
propriedades do caminho crtico considerando as duraes mdias pode ser pouco realista,

Captulo 5

95

Planeamento e Controlo de Projectos

sobretudo naqueles casos em que existem caminhos subcrticos com duraes esperadas
prximas da durao esperada do caminho crtico e com varincia relativamente elevadas.
Antes disso, vamos ver uma pequeno exemplo de aplicao do mtodo PERT.
A tabela seguinte apresenta as actividades necessrias para completar um dado projecto, as respectivas relaes de precedncia e ainda trs estimativas da durao de cada
uma das actividades. Para alm disso, a tabela tambm j apresenta a mdia e a varincia
da durao cada actividade.

Actividade

Actividades
precedentes

dop

dmp

dpe

12

14

16

14.00

0.44

6.83

0.25

14

19

30

20.00

7.11

12

8.00

1.78

3.00

0.11

C,E

20

22

26

22.33

1.00

10

15

20

15.00

2.78

Considerando a hiptese simplicadora do PERT podemos traar a rede considerando


as duraes mdias de cada actividade. De seguida, podemos encontrar os tempos mais
cedo e os tempos mais tarde de ocorrncia de cada n, tal como zemos no mtodo CPM, e
identicar o caminho crtico associado s duraes mdias. Na Figura 5.9 est representada
a rede de actividades deste projecto.

Figura 5.9: Rede de actividades do pro jecto com duraes mdias.

96

Mtodos Quantitativos

O caminho crtico constitudo pelas actividades A; C e F , sendo a sua durao esperada igual a 56.33 dias. De acordo com as hipteses simplicadoras do PERT, a durao
mdia do projecto dada por:
T

= A + C + F =
= 14 + 20 + 22:33 = 56:33

e a varincia na durao do projecto dada por:


2T

= 2A + 2C + 2F =
= 0:44 + 7:11 + 1:00 = 8:55:

E admitindo que a durao total segue uma distribuio normal (contudo, neste exemplo difcil justicar esta hiptese, porqu?) podemos agora fazer anlises de carcter
probabilstico. Por exemplo, qual a probabilidade de o projecto demorar mais de 60
dias? E qual a probabilidade de demorar menos de 50 dias.
Note-se que como dT segue uma distribuio normal com mdia T e varincia 2T a
d
varivel z = TT T segue uma normal estandartizada:
dT N(T ; 2T ) ) z =

dT T
N(0; 1):
T

Por conseguinte:

a T
P(dT > a) = P z >
;
T
o que nos permite recorrer tabela da normal para responder s perguntas feitas anteriormente.
A probabilidade de o projecto demorar mais de 60 dias igual a:

60 56:33
P(dT > 60) = P z > p
= P (z > 1:2551) = 0:1047
8:55
ou seja, aproximadamente 10,5%. E a probabilidade do projecto demorar menos de 50
dias:

50 56:33
P(dT < 50) = P z < p
= P(z < 2:1648) = 0:0152;
8:55
ou seja, apenas 1.52%.

Captulo 5

Planeamento e Controlo de Projectos

97

Repare-se que, neste caso, os caminhos subcrticas tm duraes mdias muito inferiores do caminho crtico, sendo pouco provvel que algum deles venha a ser o caminho
com durao mais longa. Mas isto nem sempre acontece! O problema que sendo a
durao estocstica, pode haver vrios caminhos que, com alguma probabilidade, so os
caminhos de durao mais longa.
Para ilustrar esta ideia suponhamos que as estimativas da durao da actividade E em
vez de serem as apresentadas na tabela, eram: dop = 16, dmp = 18 e dpe = 25, o que implica
E = 18:83 e 2E = 2:25. Considerando a durao mdia de cada actividade o caminho
crtico continua a ser (A; C; F ). Contudo bastante provvel que o caminho crtico venha
a ser (B; D; E; F ). De facto, se compararmos estes dois caminhos nos troos que no so
comuns (do n 1 ao n 5), vericamos que as suas duraes mdias so extremamente
prximas:
A + C = 14 + 20 = 34

B + D + E = 6:83 + 8 + 18:83 = 33:66:

Para alm disso a varincia do primeiro caminho 7.55 e a do segundo 4.28. Nestas
condies ambos os caminhos tm alguma probabilidade de virem a ser o caminho mais
longo. Para vermos isto basta pensarmos que possvel, por exemplo, a durao do
primeiro caminho ser inferior a 34 e, simultaneamente, a durao do segundo caminho ser
superior a 34. Admitindo, como at aqui que a distribuio da durao total tem uma
distribuio normal, a probabilidade de isto acontecer (como os estes dois caminhos no
tm troos comuns natural admitir que as suas duraes so independentes, facto que
usado nos clculos que se seguem):
P [(dA + dC 34) ^ (dB + dC + dE > 34)] = P [dA + dC 34] P [dB + dC + dE > 34]

34 33:66
p
= 0:5 P z >
4:28
= 0:5 0:4347 = 0:21735:
Este exemplo mostra que fazer a anlise probabilstica s com base no caminho crtico para as duraes mdias pode ser enganador. Quando a durao das actividades
aleatria, cada actividade tem uma determinada probabilidade de estar no caminho crtico, algumas delas podem ter uma probabilidade prxima de 1, outras prximas de 0. Para
alm disso, o caminho crtico tambm aleatrio.
Uma forma de estimar de forma mais precisa a distribuio da durao total do projecto
e de determinar qual a probabilidade de cada uma das actividades pertencer ao caminho
crtico consiste em fazer um nmero elevado de simulaes da rede de actividades. Em cada

98

Mtodos Quantitativos

passo da simulao, so escolhidas aleatoriamente as duraes de cada actividade (tendo


em conta a funo de distribuio da durao de cada actividade), o que permite deteminar
o caminho crtico e a durao do projecto para aqueles valores das duraes. Repetindo
muitas vezes este processo, obter-se- a distribuio de probabilidades da durao total
do projecto e poder-se- determinar qual a frequncia com que cada actividade faz parte
do caminho crtico.

5.3.4

Tradeo custo durao

At aqui admitimos que a minimizao da durao do projecto era o objectivo a atingir.


Contudo, como j referimos anteriormente, h outros objectivos importantes e existem
relaes entre os vrios objectivos. Nesta seco vamos explorar o tradeo entre custos e
durao.
Se afectarmos mais recursos a uma determinada actividade , geralmente, possvel
concluir a actividade mais depressa. Por conseguinte, possvel reduzir a durao se aumentarmos os custos. A relao entre durao e custos pode ser representada gracamente
atravs de uma curva decrescente(maior durao, menores custos). Para alm de decrescente natural que a curva seja convexa, isto signica que redues adicionais na durao
s so possveis custa de custos adicionais cada vez maiores (veja a Figura 5.10).

Figura 5.10: Relao entre custo e durao.

Para se conhecer a relao entre custo e durao para um projecto concreto, o que se
costuma fazer calcular os custos associados durao normal, e os custos associados
a outras duraes escolhidas. Por exemplo, calculam-se os custos associados a uma durao de 80 dias, de 75 dias e de 85 dias. Ficamos assim com trs pontos no espao da

Captulo 5

99

Planeamento e Controlo de Projectos

durao custo. Admitindo que entre estas duraes a relao linear, obtemos assim uma
aproximao curva de custos.
Vejamos um pequeno exemplo para ilustrar o trade-o entre custo e durao. Consideremos o projecto da Figura 5.11, onde esto indicadas as duraes normais de cada
actividade. A durao total do projecto de 8 dias.

Figura 5.11: Rede do projecto com durao normal.

Suponha-se que se pretende reduzir a durao do projecto para 7 dias com um custo
adicional mnimo. Na tabela seguinte esto indicadas as duraes e custos alternativos
para cada actividade.
durao

custo

durao

custo com

normal

normal

reduzida

dur. reduz.

20

0.5

40

75

85

45

60

15

0.5

30

60

80

Actividade

O primeiro aspecto que necessrio ter em ateno que se quisermos reduzir a


durao do projecto teremos de reduzir a durao de alguma(s) da(s) actividade(s) crticas.
Reduzir a durao das actividades folgadas aumentaria os custos e no teria qualquer efeito
na durao total do projecto.
As actividadades crticas deste projecto so A, B e E, para qual delas que devemos
reduzir a durao? Devemos escolher aquela cujo custo marginal de reduo seja mais
baixo. Para a actividade A uma reduo de 1/2 dia fez aumentar os custos de 20 unidades
monetrias. Para a actividade B o custo marginal de reduo de 10 unidades monetrias
(uma reduo de 1 dia aumenta os custos em 10). Para a actividade E o custo marginal

100

Mtodos Quantitativos

de 20 unidades monetrias. Como a actividade B a que tem menor custo marginal,


devemos reduzir a durao desta actividade para completar o projecto em 7 dias, sendo o
acrscimo nos custos de apenas 10 unidades monetrias.
Repare-se que, com as novas duraes, as actividades C e D passam tambm a estar
no caminho crtico, facto que deve ser levado em conta se pretendermos reduzir ainda mais
a durao do projecto. Imaginemos que era possvel reduzir a durao da actividade B
para 2 dias, sendo o custo adicional de 15 unidades. Se pretendermos reduzir em mais
uma dia a durao do projecto, h vrias formas de o conseguir:
Reduzir 1 dia a durao da actividade E, o custo adicional 20.
Reduzir 1 dia a durao da actividade C e 1 dia a durao da actividade B (
necessrio reduzir em simultneo estas actividades porque caso contrrio a durao
total do projecto no seria reduzida). O custo desta alternativa (15 + 15 = 30).
Reduzir 0.5 dia a durao da actividade A, 0.5 dia a durao da actividade D e 1
dia a durao da actividade B. O custo adicional desta alternativa 50.
Para reduzir a durao do projecto de 7 para 6 dias a melhor alternativa reduzir a
durao da actividade E, sendo o custo marginal de 15 unidades monetrias. Repare-se
que esta reduo teve um custo marginal superior reduo de 8 para 7 dias de durao.
Um aspecto que importante mencionar que, por vezes, pode ser possvel diminuir a
durao do projecto sem aumentar os custos. Se alguns dos recursos afectos s actividades
folgadas passarem a ser utilizados nas actividades crticas pode ser possvel acelerar a
realizao destas tarefas sem aumentar os custos totais ( claro que isto signicava que os
custos no estavam a ser minimizados na situao de partida!).

Parte II

Mtodos Estatsticos

101

Captulo 6

Representao grca de dados

6.1

Variveis discretas e contnuas

Populao designa um conjunto de todos os elementos com alguma caracterstica


comum e com interesse para o estudo concreto que se est a fazer. Por vezes,
distingue-se entre populao objectivo e populao inquirida. A
populao objectivo inclui a totalidade dos elementos que esto sobre estudo. Se no
for possvel construir uma amostra da populao objectivo e esta for selecionada a
partir de uma outra populao essa a populao inquirida. ) designamos por N
o nmero de elementos da populao.
A amostra um subconjunto nito da populao ) designamos por n o nmero de
elementos da amostra.
importante notar que mesmo que uma dada caracterstica seja qualitativa, h
formas de represent-la quantitativamente. Por exemplo, se estivermos interessados
no sexo de um indivduo podemos decidir representar por 0 se o sexo for masculino
e por 1 se for feminino.
Vamos supor que temos uma coleco de elementos, ou amostra. E vamos supor que
conhecemos o valor de um conjunto de caractersticas para cada um dos elementos
da coleco. Cada caracterstica pode ser representada por uma varivel. Exemplo:
Observ.
1

Rendimento
500

Idade
45

Sexo
0

Anos de escol.
20

2
3
4
5

300
450
150
150

30
35
25
32

1
0
0
1

15
20
15
10

104

Mtodos Quantitativos

) cada linha representa um caso (uma observao)


) cada coluna representa uma varivel
As variveis podem ser de dois tipos: discretas ou contnuas.
Uma varivel discreta se s puder tomar um no nito de valores ou uma innidade numervel de valores.
) exemplos: node divises por unidade de alojamento,
Uma vrivel contnua se puder tomar qualquer valor dentro dum intervalo
de nmeros reais
) exemplos: tempo de vida de uma mquina, despesa do agregado familiar.

6.2
6.2.1

Distribuies de frequncia ou empricas


Variveis discretas

Um exemplo: Num inqurito aos oramentos familiares (1989-90), numa amostra


de 9640 unidades de observao obtiveram-se os seguintes dados sobre o nmero de
indviduos por agregado domstico:
Node indivduos
1
2
3
4

Frequncia Absoluta
1138
2748
2304
2082

Frequncia Relativa
0,118
0,285
0,239
0,216

5
6
Total

848
520
9640

0,088
0,054
1

O nmero de vezes que um acontecimento ou fenmeno observado na amostra


desina-se por frequncia absoluta.
Consideremos uma varivel discreta que pode tomar um de k valores diferentes (1,
2 , , k). Seja n o nmero todas de observaes na amostra e designemos por n1
o nmero de observaes que registaram o valor 1, por n2 o nmero de observaes

Captulo 6

Representao grca de dados

105

com o valor 2 , e por a adiante. As frequncias absolutas so exactamente n1,


n2, . Note-se que
n1 + n2 + + nk = n
O nmero de vezes em que um acontecimento observado em relao ao nmero
total de dados desina-se por frequncia relativa.
n
fi = i
n
Repare-se que:
n1 + n2 + + nk = n ) f1 + f2 + + fk = 1
Uma outra noo importante a de funo cumulativa das frequncias relativas.
F(x) indica-nos a frequncia relativa de observaes com um valor igual ou inferior
a x. Deste modo, se considerarmos uma varivel discreta que pode tomar um de k
valores diferentes (1, 2, , k ), obtemos:
8
>
0
se x < 1
>
>
>
>
>
f1
se 1 x < 2
>
>
>
>
>
f + f2 se 2 x < 3
>
< .1
..
F (x) =
>
>
>
>
f1 + f2 + + fi se i x < i+1
>
>
>
..
>
>
>
.
>
>
:
1
se x k

6.2.2

Variveis contnuas

Neste caso o processo para construir o quadro de frequncias um pouco mais


moroso. H dois passos essenciais:
denio das classes de valores intervalos de classe. Os intervalos devem ser
disjuntos, Ij \ Ik = ;. E a sua unio deve conter todos os valores possveis que
a varivel pode tomar.
Para denir os intervalos, basta denir os limites inferior e superior do intervalo. Uma possibilidade considerar intervalos abertos esquerda e fechados
direita:
xi 2 Ij , lj1 < xi lj

106

Mtodos Quantitativos

) a diferena l j l j1 a amplitude da classe j.

) normal considerar classes com amplitude constante. Mas, pode haver casos
em que esse procedimento no adequado.
contagem dos valores pertencentes a cada classe
) note-se que ao agruparmos em classes h sempre perda de informao, porque
deixamos de observar a variabilidade dentro de cada classe.
Exemplo de uma situao em que no prtico considerar classes de igual amplitude.
O quadro a seguir apresenta dados das exploraoes agrcolas de Trs os Montes,
relativamente superfcie agrcola utilizvel:
Classes (ha)
0 < s < 0; 5
0; 5 s < 1; 5
1; 5 s < 2; 5
2; 5 s < 5
5 s < 10
10 s < 20
20 s < 50
50 s < 100
s 100
Total

Frequncias Absolutas
4391
8557
17104
22900
14684
8694
3467
497
163
80457

Frequncias Relativas
0; 0546
0; 1064
0; 2126
0; 2846
0; 1825
0; 1080
0; 0431
0; 0062
0; 0020
1

) Neste exemplo, por causa da frequncia de exploraes agrcolas de pequena


dimenso conveniente denir vrias classes entre 0 e 10 hectares, para se ver com
maior detalhe a distribuio. Mas, j no teria interesse estar a distinguir, por
exemplo, entre exploraes com 100 ou com 102 hectares.
) Deve evitar-se o uso de classes abertas, como a ltima classe neste exemplo, onde
no claramente denido o limite superior. Isto pode levantar problemas em certos
clculos (como mdias).
Um outro exemplo com dados classicados peso de 500 cigarros SG ltro (em
miligramas)

Captulo 6

Representao grca de dados

Peso
760-780
780-800
800-820

Freq. Absol.
4
43
118

Freq. Relativa
0,008
0,086
0,236

820-840
840-860
860-880
880-890

168
117
39
11

0,336
0,234
0,078
0,022

107

Quando se passa dos dados originais para uma tabela de frequncias h sempre perda
de informao, uma vez que deixamos de considerar a variabilidade dentro de cada
classe.
Tal como zemos para as variveis discretas, tambm podemos denir a funo
cumulativa das frequncias relativas. F(x) indica-nos qual a frequncia relativa de
valores iguais ou inferiores a x. A funo F (x) tem as seguintes propriedades:
0 F (x) 1 com 1 < x < +1
F(x) uma funo no decrescente
F(1) = 0, F(+1) = 1

6.3

Representao grca

6.3.1

Variveis discretas

A distribuio de frequncias pode ser representada gracamente usando o diagrama


de barras. No eixo das abscissas representam-se os vrios valores que a varivel pode
tomar. Depois traam-se barras cuja altura igual frequncia.
) fazer o diagrama de barras no exemplo do nmero de indivduos do agregado
familiar.
Funo cumulativa

108

Mtodos Quantitativos

Node indivduos
1
2
3
4
5
6
Total

Freq.Absoluta
1138
2748
2304

Freq. Relativa
0; 118
0; 285
0; 239

Freq. Acumulada
0; 118
0; 403
0; 642

2082
848
520
9640

0; 216
0; 088
0; 054
1

0; 858
0; 946
1

) reparar que temos uma funo em escada, que varia entre 0 e 1, e que no
decrescente.

6.3.2

Variveis contnuas

A representao grca de distribuies de frequncia de variveis contnuas feita


pelo histograma. Um histograma uma coleco de rectngulos adjacentes, cuja base
um intervalo de classe e a altura a frequncia relativa ou absoluta dividida pela
amplitude da classe. Desta forma a rea do rectngulo igual frequncia relativa
ou absoluta.
Aj = hj

fj
n
= fj ou Aj = hj j = nj
hj
hj

) Quando as classes tem todas igual amplitude normal fazer a altura do rectngulo
igual frequncia relativa ou absoluta.
) Se aumentarmos indenidamente o nmero de classes, tendendo a amplitude das
classes para zero, o histograma tende para uma curva contnua. A essa curva chamase curva de frequncias e representao grca da funo de frequncias.
Uma representao alternativa feita pelo polgono de frequncias que resulta de se
unirem por segmentos de recta os pontos mdios dos lados superiores dos rectngulos
A funo cumulativa de frequncias relativas tambm pode ser representada gracamente o polgono integral.

Captulo 7

Medidas de localizao e disperso

7.1

Medidas de localizao

7.1.1

Mdia

A mdia muitas vezes usada como valor representativo de uma amostra. A mdia
o centro da distribuio. comum falar-se em rendimento mdio, mdia das
idades, nota mdia,...
A mdia de uma amostra constituda pelos n valores x1; x2; ; xn dene-se pela
expresso:
x=

x1 + x2 + + xn
n

Se s dispusermos dos dados classicados, podemos calcular a mdia usando a


hiptese de que os valores de cada classe so todos iguais ao ponto mdio da classe.
Designemos por x0j o ponto mdio da classe j ( igual ao limite inferior da classe +
metade da amplitude da classe). A mdia dada por
x=

n1x01 + n2x02 + + nk x0k


n

) isto uma mdia ponderada, cada valor ponderado pela frequncia com que
ocorre.
Propriedades da mdia designemos por m(x1; x2; ; xn ) a funo mdia
Se adicionarmos um constante k a cada um dos valores da amostra, a mdia
tambm aumenta k.
m(x1 + k; x2 + k; ; xn + k) = m(x1 ; x2 ; ; xn) + k

110

Mtodos Quantitativos

Se multiplicarmos cada um dos valores por k, a mdia tambm ser multiplicada


por k
m(kx1; kx2; ; kxn ) = km(x1; x2; ; xn )
A mdia da soma de duas variveis igual soma das mdias
m(x1 + y1 ; x2 + y2; ; xn + yn ) = m(x1; x2; ; xn ) + m(y1; y2; ; yn)
) pode generalizar-se para mais variveis

Se as n observaes de uma amostra estiverem repartidas por k subamostras


podemos calcular a mdia como funo das mdias da subamostras:
x=

n1x1 + n2x2 + + nk xk
n

A mdia dos desvios em relao mdia zero:


m(x1 x; x2 x; ; xn x)
A mdia o centro de gravidade da distribuio. Se considerarmos os desvios positivos em relao mdia, e os desvios negativos em relao mdia, eles compensamse exactamente. Mas, importante notar que duas distribuies que tenham a mesma
mdia podem ser muito diferentes.
) importante estudar tambm a disperso dos valores em torno da mdia
) Se eu comer um frango e t comeres zero, em mdia comemos meio frango
A mdia tem a vantagem de incluir no seu clculo todos os valores da amostra. Mas
por essa razo sensvel existncia de valores extremos na amostra.
) os valores aberrantes costumam designar-se por outliers.
Mdia geomtrica
A mdia geomtrica adequada quando estamos interessados em calcular mdias de
variveis que tm um efeito multiplicativo, como taxas de crescimento ou taxas de
juro quando se admite capitalizao.
Suponha-se que se conhecem as taxas de crescimento anuais do PIB entre 1990 e
1995

Captulo 7

111

Medidas de localizao e disperso

Taxa
%

1991
2

1992
3

1993
1

1994
4

1995
5

) o PIB de 1995 pode ser calculado uma vez conhecido o PIB de 1990 fazendo:
P IB1995 = P IB1990 (1 + 0; 02)(1 + 0; 03)(1 + 0; 01)(1 + 0; 04)(1 + 0; 05)
= 1; 1587P IB1990
) A questo : qual a taxa de crescimento anual mdia? Qual a taxa tal que
se o PIB crescer todos os anos aquela taxa obtemos o mesmo crescimento que o
vericado?
P IB1990 (1 + g)5 = 1; 1587PIB1990 , (1 + g)5 = 1; 1587 , g =

p
5
1:1587 1

) a taxa de crescimento mdia foi de 0.02989.


No caso geral, se designarmos por gi a taxa de crescimento do ano i, temos:
"

n
Y
g=
(1 + gi)

7.1.2

i=1

#1

v
un
Y
u
n
1 = t
(1 + gi) 1
i=1

Mediana

A mediana o centro posicional. Em termos aproximados, a mediana o valor que


tem 50% de observaes com valores mais baixos e 50% das observaes com valores
mais elevados.
Para se calcular a mediana tem que se ordenar as observaes, da mais pequena para
a maior:
x1 x2 xn
Designando a mediana por M, temos que:
M = xk+1
se n = 2k + 1
xk + xk+1
M =
se n = 2k
2

112

Mtodos Quantitativos

No caso de dados classicados pode calcular-se a mediana usando a funo cumulativa. De facto, o valor da funo cumulativa igual a 12 se o argumento for a
mediana.
1
F(M) = freq. relativa de valores inferiores ou iguais a M = .
2
Exemplo do clculo da mediana com valores classicados
Peso
760-780
780-800
800-820

Freq. abs. acum.


4
47
165

Freq. Relativa
0,008
0,086
0,236

Freq. rel. acumul.


0,008
0,094
0,330

820-840
840-860
860-880
880-890

333
450
489
500

0,336
0,234
0,078
0,022

0,666
0,900
0,978
1

) vericamos imediatamente que a mediana se situa na classe 820-840. Fazendo


interpolao linear (a ideia que os valores se distribuem uniformemente na classe)
obtemos:
M 820
0:5 0:333
=
, M = 830:03
840 820
0:666 0:333
A mediana menos sensvel do que a mdia a valores aberrantes.
A mediana uma estatstica de ordem. Existem muitas outras estatsticas de ordem:
O valor mximo e o valor mnimo.
Os quartis O primeiro quartil valor tal que tal que 25% dos observaes tm
um valor inferior aquele valor, o segundo quartil a mediana, o terceiro quartil
o valor com 75% das observaes com valores mais baixos.
Os decis,...

7.1.3

Moda

A moda o valor mais frequente.

) em amostras pequenas a moda no faz muito sentido porque natural no haver


repeties.

Captulo 7

Medidas de localizao e disperso

113

) em amostras grandes pode ser uma medida com algum interesse.


) podemos ter mais que uma moda
No caso de dados classicados fcil identicar a classe modal, ou seja a classe com
maior frequncia.

7.2

Medidas de disperso

Como j referimos, para se caracterizar uma dada distribuio importante no s


conhecer a mdia, mas tambm a disperso dos valores em torno da mdia. A Figura
7.1 ilustra a ideia da disperso em relao mdia de um conjunto de observaes.
Nesta seco vamos falar de medidas de disperso.

7.2.1

Desvio padro e varincia

Qual o comportamento do conjunto de desvios em relao mdia? Quando h


pouca disperso os desvios so globalmente pequenos, se houver muita disperso os
desvios so globalmente grandes. Como medir a disperso?

Figura 7.1: Mdia e disperso em torno da mdia.

No podemos limitar-nos a somar os desvios em relao mdia, porqu?


) porque a soma dos desvios em relao mdia zero (os desvios positivos e
negativos compensam-se).
Por isso temos que considerar uma medida que no leve em conta o sinal dos desvios,
s leve em conta a sua magnitude.

114

Mtodos Quantitativos

) uma forma de fazer isto considerar o quadrado dos desvios (ao elevar ao quadrado
obtemos sempre nmero positivo)
) outra forma de fazer isto considerar o valor absoluto dos desvios.
A varincia a mdia dos desvios quadrados em relao mdia:
P
(xi x)2
2
s =
n
Se os dados forem classicados:

s =

nj (x0j x)2
n

O desvio padro a raiz quadrada da varincia:


rP
(xi x)2
s=
n

No caso de amostras pequenas devem calcular-se a varincia e desvio-padro corrigidos. A frmula idntica excepto que se divide por n 1:
P
(xi x)2
2
s =
n1
Propriedades da varincia
s2 =

x2i
n

x2

P 2
P
2
2
x

2xx
+
x
(x

x)
i
i
i
s2 =
=
=
n P
P 2n
P
xi
2x xi nx2
x2i
=

+
=
x2
n
n
n
n
Se as n observaes de uma amostra estiverem repartidas em k subamostras,
as varincias das subamostras esto relacionadas pela expresso seguinte:
nj
k X
k
k
X
X
X
ns =
(xji x)2 =
nj s2j +
nj (xj x)2
2

j =1 i=1

j=1

j=1

onde xji designa o i-simo elemento da subamostra j.

) A interpretao desta expresso que a variao total no conjunto de todas


as subamostras igual soma das variaes dentro de cada subamostra mais a
variao entre subamostras.
Exemplo de clculo da varincia

Captulo 7

7.2.2

115

Medidas de localizao e disperso

Desviomdio

O desvio mdio a mdia dos valores absolutos dos desvios em relao mdia:
Pn
jxi xj
d = i=1
n
Tanto o desvio padro como o desvio mdio so medidas sensveis existncia de
outliers.

7.2.3

Extremos-quartos e mediana

As estatsticas de ordem podem tambm ser utilizadas para avaliar a disperso. Uma
medida possvel a diferena entre os extremos (valor mximovalor mnimo). Mas
a diferena entre os extremos no uma medida resistente. prefervel usar a
disperso quartal que a diferena entre o terceiro e o primeiro quartil. Representa
a amplitude do intervalo onde se situam as observaes centrais (50%).

7.2.4

Medidas de disperso relativas

O desvio padro, o desvio mdio e disperso quartal so todas medidas de disperso


que so expressas na mesma unidade que a varivel est a ser expressa. Se a unidade
de medida for alterada, o valor da medida de disperso tambm vir alterado (exemplo dos cigarros - mudar de miligramas para quilos). Estas medidas de disperso
so designadas por medidas de disperso absoluta.
Por vezes, conveniente dispor de medidas de disperso que sejam independentes
das unidades de medida. Um caso em que isso acontece quando se pretendem
fazer comparaes entre distribuies. Vamos por isso estudar medidas de disperso
relativa.
A medida de disperso mais usada o coeciente de disperso:
s
x
por vezes apresentado em %, multiplicando por 100 o coeciente de disperso.
Nessa forma designado por coeciente de variao.
Uma outra medida de disperso relativa dada pelo rcio da disperso quartal e da
mediana.

116

Mtodos Quantitativos

7.2.5

ndice de concentrao e curvas de Lorenz

Nalguns fenmenos econmicos h interesse em estudar o grau de concentrao de


uma dada varivel pelos vrios elementos. Por exemplo, se conhecermos a riqueza
total de um pas podemos estar interessados na forma como essa riqueza est distribuda pelos cidados desse pas. Pode acontecer que a riqueza esteja igualmente
distribuda por todos os indivduos, mas tambm pode acontecer que uma fraco
substancial da riqueza esteja nas mos de uma pequena fraco de indviduos.
Consideremos o exemplo das exploraes agrcolas. Uma primeira ideia da concentrao pode ser obtida comparando o andamento das frequncias acumuladas com a
rea acumulada em percentagem da rea total.
Classes (ha)
0 < s < 0; 5
0; 5 s < 1; 5
1; 5 s < 2; 5
2; 5 s < 5
5 s < 10
10 s < 20
20 s < 50
50 s < 100
s 100
Total

Freq. Abs.
4391
8557
17104
22900
14684
8694
3467
497
163
80457

rea Total
2646
10295
38366
108352
136584
150401
124220
41484
33930
6462781

Fre. rel acum.

rea acum.

0; 054575
0; 160930
0; 373516
0; 658140
0; 840647
0; 840647
0; 9487505
0; 991796
1
1

0; 0040904
0; 020023
0; 079388
0; 247043
0; 458383
0; 691101
0; 883310
0; 947499
1
1

) interpretao: 5,5% das exploraes agrcolas possuem 0,4% da superfcie agrcola,


16,1% das exploraes agrcolas possuem 2% da superfcie agrcola,...
Consideremos uma distribuio de frequncias com k classes. Seja tj o total do
atributo correspondente aos nj elementos da classe j. Se denirmos:
Pi
Pi
j=1 nj
j=1 t j
p i = Pk
e q i = Pk
j=1 nj
j=1 t j

ou seja, pi representa a proporo de elementos com um valor do atributo inferior


ou igual ao limite superior da classe i. A varivel qi representa a proporo da
totalidade do atributo que possuda pelos mesmos elementos.
) Note-se que pi qi , variando ambos entre 0 e 1.

Captulo 7

Medidas de localizao e disperso

117

) fazendo (p0 ; q0) = (0; 0) e unindo por segmentos de recta os pontos (p i; qi ) obtemos
uma linha poligonal, que quando se consideram um nmero innito de pontos tende
para curva de Lorenz.
) se a distribuio for equitativa, temos que pi = qi e a curva de Lorenz a diagonal
do quadrado unitrio.
) quanto mais afastada estiver a curva de Lorenz da diagonal, maior a concentrao, maior a desigualdade na distribuio do atributo.
O ndice de concentrao de Gini baseado na ideia de que quanto maior for a rea
entre a curva de Lorenz e a diagonal, maior a concentrao. O ndice dado por:
Pk1
(pi qi)
G = i=1
Pk1
i=1 pi
) G = 0 se houver igual repartio

) G = 1 quando existe concentrao mxima, isto quando qi = 0 para todas as


classes excepto a ltima.
) 0 G 1 e cresce com a concentrao.

7.3

Assimetria

A ideia da simetria tem a ver com a forma como os valores se distribuem em torno
do centro, se se distribuem de forma simtrica ou no.
Nas distribuies simtricas a mdia, a mediana e a moda coincidem. Nas distribuies assimtricas a mdia puxada para o lado mais longo da distribuio.
) se a distribuio assimtrica positiva temos mdia > mediana > moda.
) se a distribuio assimtrica negativa temos mdia < mediana <moda.
) o grau de assimetria de Pearson baseado nesta ideia
g=

x mod
:
s

Uma outra medida de assimetria, proposta por Bowley baseada na ideia que em
distribuies simtricas os quartis esto a igual distncia da mediana, ou seja:
(Fu M) (M Fl ) = 0

118

Mtodos Quantitativos

O grau de assimetria de Bowley denido por:


g0 =

(Fu M) (M Fl )
(Fu M) + (M Fl )

) se a distribuio assimtrica positiva (Fu M) > (M Fl ) logo g 0 > 0.

Captulo 8

Algumas distribuies

8.1

Distribuio normal

A distribuio normal extremamente importante em estatstica por vrias razes:


Vrios fenmenos parecem seguir uma distribuio normal, ou podem ser aproximadamente descritos por uma distribuio normal.
A distribuio normal pode ser usada para aproximar vrias distribuies discretas.
a distribuio base em inferncia estatstica.
A funo densidade de probabilidades normal tem vrias caractersticas interessantes:

Figura 8.1: Funo densidade da normal estandartizada.

Tem uma forma de sino e simtrica.


As medidas de localizao central (mdia, moda e mediana) so todas iguais.

120

Mtodos Quantitativos

O intervalo inter-quantis est contido em 23 ; + 23 , onde a mdia e


o desvio padro.
A varivel aleatria (v.a. contnua) pode tomar qualquer valor entre 1 e
+1.
) notar que a maior parte da probabilidade est concentrada em torno da
mdia.
Recordar que como a v.a. contnua a probabilidade de um valor particular de x
ocorrer zero. Contudo, possvel calcular a probabilidade de x estar entre a e b.
Z b
P (a < x < b) =
f (x)dx
a

) em termos geomtricos isto igual rea abaixo de f(x) entre a e b.


) como P (1 < x < +1) = 1 a rea abaixo da funo densidade tem de ser igual
R1
a 1. Ou seja, 1
f (x)dx = 1

Em aplicaes prticas natural que as propriedades da normal no sejam exactamente vericadas: possvel que no haja perfeita simetria, possvel que a varivel
aleatria no varie num intervalo innito. Na prtica natural que a v.a. tome
valores que se situam no intervalo [ 3; + 3]
A funo densidade de probabilidade da distribuio normal dada por:
(x)2
1
f (x) = p
e 22 ,
2

com 1 < x < 1

onde e ' 2:71828, ' 3:14159; o valor esperado da varivel aleatria x e o


desvio-padro.
) se uma v.a. segue uma distribuio normal, ela completamente caracterizada
por e , so os nicos dois parmetros da distribuio.
) em termos de notao diz-se que x N(; ) (l-se: x segue uma distribuio
normal com mdia e desvio-padro ).
) mostrar duas distribuies normais com o mesmo desvio-padro mas mdia diferentes
) mostrar duas distribuies normais com a mesma mdia mas desvios-padres
diferentes.

Captulo 8

121

Algumas distribuies

) note-se que seria bastante trabalhoso ter que usar a expresso anterior para calcular a probabilidade de x tomar um valor num certo intervalo. Felizmente no
nessrio fazermos essas contas, como veremos j de seguida.

8.2

A normal estandartizada

A distribuio normal estandartizada a normal no caso em que = 0 e = 1. Se


z N(0; 1) a funo densidade :
1
z2
f (z) = p e 2
2
H vrias tabelas para a normal estandartizada. Na maioria dos casos, essas tabelas
indicam-nos a P(z a):
) mostrar os diferentes tipos de tabelas
) Qual P(0:5 z 1:2)?
) Qual P(0:2 z 0:5)?
) Qual P(0:5 z 0:5)?
) Qual P(0:5 z 0:5)?
Se tivermos uma varivel aleatria x com uma distribuio normal com mdia e
desvio padro possvel estandartizar essa varivel. Para tal, basta denirmos
uma nova varivel z que resulta de transformarmos a varivel x de acordo com:
z=

Intuio: ao retirarmos a cada um dos valores da varivel aleatria x, vamos obter


uma v.a. com mdia zero (o que estamos a fazer a deslocar a distribuio de
forma a car centrada em 0. De forma semelhante, ao dividirmos pelo desvio padro
estamos a alterar a disperso em torno da mdia de forma a que z = 1.
Formalmente:
E [z] = E

x
1
= 4E [x] 5 = 0

| {z }
0

122

Mtodos Quantitativos

e
2z

"
#
2

(x

)
= E (z E(z))2 = E(z2) = E
2
i 2
1 h
2
=
E
(x

)
= 2 =1
2

) A estandartizao pode ser vista como um reescalar da varivel original, sendo


a nova unidade de medida o desvio padro.
) o valor da varivel z indica-nos quantos desvios padres que estamos afastados
da mdia. Por exemplo, se a varivel x N(15; 2) o valor x = 19 corresponde:
z=

19 15
=2
2

Ou seja, x = 19 est dois desvios padres acima da mdia, 19 = +2 = 15 +2 2.


Qual a vantagem de estandartizarmos a vriavel com distribuio N(; )? a
vantagem que depois de estandartizada podemos usar as tabelas da normal estandartizada para calcular probabilidades.
) Para qualquer distribuio normal, a probabilidade da varivel aleatria distar
da mdia menos que um desvio-padro 68.26%.
) A probabilidade da v.a. distar da mdia menos de dois desvios padres 95.44%
) A probabilidade da v.a. distar da mdia menos de trs desvios padres 99.73%.
Exemplo: as notas numa cadeira de Estatstica seguem uma distribuio aproximadamente normal com mdia 13 e desvio pado 2.
Qual percentagem de alunos que passa na cadeira (isto , nota superior ou
igual a 9.5)?
Qual a probabilidade de um aluno escolhido aleatoriamente ter mais de 17?
Qual a percentagem de alunos com notas entre 11 e 15?
Tambm se pode usar a tabela da normal para encontrar os valores da v.a. que
correspondem a uma dada probabilidade. No exemplo anterior, podiamos querer
calcular qual o intervalo inter-quartis da varivel aleatria. Entre que notas que
se situam 50% de notas centrais.

Captulo 8

123

Algumas distribuies

) na normal estandartizada o valor k tal que:


P(z k) = 0:25 , k = 0:675
Mas como:
z=

x
, x = + z

temos que o valor do terceiro quartil da v.a. x :


x = 13 + 2 0:675 = 14:35
e o valor do primeiro quartil :
x = 13 2 0:675 = 11:65:

8.2.1

Como testar a normalidade

Uma boa ideia comparar a distribuio emprica e as suas propriedades com a


distribuio normal:
Construir histograma e polgono de frequncias da varivel que se est a analisar
e comparar com a funo densidade de uma v.a. normal.
Calcular medidas descritivas e comparar as suas propriedades com a de uma
distribuio normal
) calcular mdia, mediana, moda, midrange e vericar se estas medidas tem
valores prximos uns dos outros.
) Calcular o intervalo de variao da varivel aleatria e ver se ele aproximadamente igual a 6 vezes o desvio-padro da varivel.
) vericar se o intervalo inter-quartis aproximadamente igual a 1.33 vezes o
desvio padro.
Testar como que as observae se distribuem:
) ver se aproximadamente
desvio-padro.

2
3

das observaes distam da mdia menos de 1

) ver se aproximadamente 95% das observaes distam da mdia menos de 2


desvios-padres.

124

Mtodos Quantitativos

H testes formais da normalidade, que eventualmente referiremos quando falarmos


de testes de hipteses. Estes testes so baseados em medidas de simetria e de achatamento. A simetria medida usando:
Pn (xi x)3
i=1

s3
Esta medida designa-se por skewness em ingls.Se a distribuio da varivel em
estudo for simtrica esta medida ser igual a zero. Se a varivel apresentar assimetria
positiva o que acontece que teremos desvios positivos com valores elevados, e
desvios negativos com valores menos elevados. Como ao elevarmos ao cubo o sinal
dos desvios se vai manter, o que acontece ao elevarmos ao cubo, que a soma dos
desvios positivos vai dominar a soma dos desvios negativos ao cubo, obtendo-se
um valor positivo para a medida de assimetria.
Como a normal no a nica distribuio simtrica, para vericarmos o ajustamento
normal temos de analisar tambm o achatamento da distribuio. O achatamento
est relacionado com o peso das abas. O achatamento, ou kurtosis, da distribuio
dado por:
Pn (xi x)4
i=1

s4

Para uma varivel normal o achatamento igual a 3.

O teste de Bowman-Shelton baseado na proximidade da skewness a 0 e na proximidade da kurtosis a 3.

8.3

Distribuio do X 2

Se Z uma v.a. com distribuio N(0; 1), ento Z 2 uma v.a. com distribuio quiquadrado com 1 grau de liberdade:
Z 2 X 2(1):
Um resultado importante que a soma de variveis aleatrias independentes com distribuio qui-quadrado tambm segue uma distribuio qui-quadrado, em que os graus de
liberdade so iguais soma dos graus de liberdade.
Em termos mais formais: Sejam X1; X2; ; Xk variveis aleatrias X 2 (r1); X 2(r2 ); ; X 2 (rk ),
respectivamente. Se X1 ; X2; ; Xk forem independentes e Y = X1 + X2 + + Xk ento
Y X 2(r1 + r2 + + rk ):

Captulo 8

125

Algumas distribuies

Uma consequncia do resultado anterior que se Z1 ; Z2; ; Zr forem variveis aleatrias


N (0; 1) e mutuamente independentes, ento W = Z12 + Z22 + + Zr2 tem distribuio
X 2(r).

Figura 8.2: Funo densidade da qui-quadrado com 8 graus de liberdade.

de realar que uma varivel aleatria com distribuio qui-quadrado, s pode tomar
valores maiores ou iguais a zero. Para alm disso, a distribuio qui-quadrado depende
apenas dos graus de liberdade. Quanto mais elevado for o nmero de graus de liberdade,
menos assimtrica a distribuio.

8.4

A distribuio t

A distribuio t muito importante em Estatstica e Econometria porque a distribuio


da mdia na amostra quando a varincia da populao no conhecida.
Se Z uma v.a. com distribuio N(0; 1), U uma v.a. X 2(r) e Z e U so independentes, ento
Z
T=p
U=r

tem uma distribuio tstudent com r graus de liberdade.


Observaes:
Tal como a normal estandartizada, a distribuio t simtrica em torno do zero e
tem forma de sino.
Tem mais rea nas abas e menos rea no centro que a normal. A intuio que na t
no se conhece o desvio-padro da populao, usando-se o desvio padro da amostra

126

Mtodos Quantitativos

para o estimar. Essa incerteza sobre o valor de faz com a t seja mais varivel do
que z.
Converge para N (0; 1) quando o nmero de graus de liberdade aumenta. Mostrar
grco comparando para diferentes valores de n.
f.d.p. funo s dos graus de liberdade. Mostrar tabela.
Exemplo 8.1 Seja T uma varivel com distribuio t com 7 graus de liberdade ento:
P(t 1:415) = 0:9

8.5

A distribuio F

Se U e V so variveis aleatrias independentes com distribuio qui-quadrado com r1 e


r2 graus de liberdade, respectivamente, ento
F =

U
r1
V
r2

tem uma distribuio F com r1 e r2 graus de liberdade. A Figura 8.3 apresenta a funo
distribuio F com (10; 6) graus de liberadade.

Figura 8.3: A funo densidade F com (10; 6) graus de liberdade.

Observaes:
f.d.p. funo s de r1 e r2. Mostrar tabela.
Mostrar grcos da F

Captulo 9

Amostragem e estimao

9.1

Populao e amostra

Uma parte importante da estatstica relaciona-se com o problema da fazer inferncias


acerca da populao relevante com base na informao de um subconjunto dessa populao,
com base numa amostra.
Exemplo 9.1 Queremos conhecer a distribuio etria em Portugal mas no temos dinheiro para fazer um census populao toda. Colhemos informao sobre uma amostra
da populao e tentamos inferir o que se passa na populao.
Exemplo 9.2 Sondagens eleitorais.
Porqu amostras?
Obter informao sobre toda a populao ) custos + elevados (custos)
mais rpido obter informao sobre amostra (tempo).
Amostra permite aumentar a qualidade da informao obtida (preciso)
Como escolher a amostra?
A amostra tem que ser representativa da populao ) princpio da aleatoriedade
Amostra aleatria simples: amostra de dimenso n de uma populao de N
objectos, todas as amostras possveis de n objectos tm igual probabilidade de
serem escolhidas.
exemplo de por N objectos num chapu e tirar grupo de n objectos

128

Mtodos Quantitativos

tabelas de nmeros aleatrios.

Outros procedimentos: amostra estraticada.


Passos de uma sondagem:
Qual a informao que se quer obter
Qual a populao relevante
Como escolher a amostra
Como que a informao obtida
Como que a informao na amostra pode ser usada para fazer inferncias
Que concluses podem ser retiradas sobre a populao

9.2

Distribuio por amostragem

Normalmente estamos interessados em fazer inferncias sobre certas caractersticas da


populao como a mdia e a varincia. A ideia fazer essas inferncias usando a informao
na amostra (calculando, por exemplo, a mdia e a varincia na amostra, X e S2 ). Mas
devemos estar conscientes que, se amostra fosse diferente a mdia e varincia na amostra
tambm seriam diferentes. Por outras palavras, devemos olhar para X e S 2 como variveis
aleatrias (o seu valor depende da amostra recolhida).
A questo seguinte : qual a funo densidade de probabilidades destas estatsticas ?
Qual a sua distribuio por amostragem? importante salientar que o conhecimento
da distribuio por amostragem que nos permite fazer inferncias sobre a populao.
Comecemos por denir o conceito de estatstica. O que uma estatstica? Uma
estatstica uma funo da informao da amostra, isto , posso calcular o valor da
estatstica uma vez conhecidas as observaes da amostra. Por exemplo:
Pn

Pn
i=1 Xi
2
i=1 Xi X
X=
e S =
n
n1
so estatsticas.
Em termos de notao usaremos sempre letras maisclas para designar as estatsticas
e letras minsculas para nos referirmos a valores particulares dessas estatsticas. Por
exemplo, X e S2 designam as variveis aleatrias mdia na amostra e desvio-padro na
amostra, enquanto que x e s2 se referem a valores que essas variveis aleatrias tomam
para uma amostra em particular.

Captulo 9

129

Amostragem e estimao

O que distribuio por amostragem de uma estatstica? a distribuio de probabilidades dos valores que essa estatstica poderia tomar para todas as amostras de tamanho
n que possvel escolher da populao.
Exemplo 9.3 Seis empregados, varivel de interesse anos de experincia
2 4

8 ) = 5:5

Suponha-se que escolhemos aleatoriamente um grupo de 5 trabalhadores. Qual a distribuio de X? Admitindo que a amostragem feita sem reposio, h seis amostras
possveis com 5 elementos
Amostra Media
4; 6; 6; 7; 8
2; 6; 6; 7; 8
2; 4; 6; 7; 8
2; 4; 6; 7; 8
2; 4; 6; 6; 8
2; 4; 6; 6; 7

na Amostra
6:2
5:8
5:4
5:4
5:2
5:0

Qual e a funo densidade de probabilidades de X?


Exemplo 9.4 Suponhamos que a populao so 4 amigos. A varivel a idade deles:
x1 = 18; x2 = 20; x3 = 22; x3 = 24. Qual a distribuio por amostragem da mdia, se a
dimenso da amostra for n = 2?
Estas contas assumem que no h reposio (uma vez escolhido um elemento da populao, ele no pode pode voltar a sair naquela amostra)
Samples
x

x1; x2
19

x 1; x 3
20

x1 ; x4
21

x2; x3
21

x 2; x 4
22

x3 ; x4
23

Mais uma vez vemos que X uma varivel aleatria.


Porque que estamos interessados na distribuio da estatstica? Quando fazemos
inferncia temos s uma amostra com n elementos. Podemos olhar para esta amostra
como uma das amostras possveis no conjunto de todas as amostras de dimenso n retiradas
da populao em questo. Para a amostra que dispomos podemos calcular a estatstica
em que estamos interessados. Depois, levando em conta o nosso conhecimento sobre a
distribuio por amostragem da estatstica, podemos fazer inferncias sobre a populao.
Isto so as ideias bsicas de inferncia estatstica.

130

9.2.1

Mtodos Quantitativos

Distribuio da mdia da amostra

Suponhamos que a populao tem mdia e varincia 2. O que podemos dizer sobre a
distribuio amostral de X?
A mdia da distribuio amostral de X igual mdia da populao:
E(X ) =
A varincia da distribuio amostral de X igual a:
2X =

2
n

Estas propriedades resultam das propriedades do valor esperado e da varincia e da


denio de uma amostra aleatria. Um aspecto curioso que a varincia da mdia na
amostra decresce com a dimenso da amostra. Isto signica que, medida que dimenso
na amostra aumenta a mdia na amostra um estimador cada vez mais preciso da mdia
na populao.
As propriedades anteriores so interessantes, mas no nos indicam qual a distribuo
por amostragem de X. Ser que podemos dizer alguma coisa sobre a funo densidade de
X?
Se a varivel que estamos a estudar tiver uma distribuio normal na populao, ento
a distribuio da mdia da amostra segue tambm uma distribuio normal (veja a Figura
9.1):
X N(;

2
):
n

E se no conhecermos a distribuio na populao da varivel, ou se a distribuio na


populao no for normal, que podemos dizer sobre a funo densidade de X?
Um resultado muito importante em estatstica diz-nos que, qualquer varivel aleatria
X, com mdia e varincia 2 , seja qual for a sua distribuio, se a dimenso da amostra
for elevada, ento X tem aproximadamente uma distribuio normal com mdia e desvio
2
padro n . Este resultado o famoso Teorema do Limite Central.
Os resultados anteriores so baseados na hiptese de que a amostragem feita com
reposio. Contudo, na prtica, a maioria dos estudos so feitos sem reposio. Nestas
condies, se a populao for nita e a dimenso da amostra no for pequena em relao

Captulo 9

Amostragem e estimao

131

Figura 9.1: Distribuio de X para duas amostras de dimenso diferente (n2 > n1 ).

dimenso da populao, no clculo do desvio padro da distribuio da mdia amostral


deve usar-se uma factor de correo para populaes nitas:
r
2 N n

N n
2
X =
, X = p
n N1
n N 1
onde N a dimenso da populao e n a dimenso da amostra.
Normalmente, se n < 0:05N (a dimenso da amostra inferior a 5% da dimenso da
populao) no se usa o factor de correo.
Repare-se que o factor de correo sempre inferior a 1. Logo, o desvio padro
corrigido da mdia na amostra inferior. Isto est de acordo com a intuio porque
estamos a considerar casos em que a amostra uma fraco relativamente elevada da
populao.

9.2.2

Distribuio da diferena entre duas mdias

Vamos supor que estamos interessados em estimar a diferena na mdia de uma determinada varivel para duas populaes diferentes (por exemplo: homens versus mulheres,
portugueses versus americanos,...).
Seja n1 a dimenso da amostra retirada da primeira populao e n2 a dimenso da
amostra retirada da segunda populao. Sejam 1 e 2 as mdias em cada uma das
populaes e 21, 22 as respectivas varincias. A distribuio amostral da diferena das
mdias tem as seguintes propriedades:
E(X 1 X 2) = 1 2
var(X 1 X 2) =

21
n1

+ n22

132

Mtodos Quantitativos

Tal como no caso da mdia, se as populaes tiverem distribuio normal a distribuio


por amostragem da diferena de mdias tambm normal. Para alm disso, independentemente da distribuio das populaes, se n1 e n2 forem elevados ento a distribuio por
amostragem da diferena de mdias aproximadamente normal.

9.2.3

Distribuio da proporo

Suponhamos que estamos interessados em estimar a fraco da populao que possui


uma determinada caracterstica (fuma ou no, tem olhos azuis ou no, usa a internet
ou no, vota num dado candidato ou no...). Note-se que este tipo de varivel pode ser
representado por 0 ou 1. A populao tem uma distribuio Bernoulli.
Vamos admitir que a proporo da populao com a caracterstica em causa p. Se
recolhermos uma amostra com dimenso n e calcularmos a proporo da amostra com a
b com as seguintes propriedades:
caracterstica obtemos a estatstica P,
h i
E Pb = p
h i
var Pb =

9.2.4

p(1p)
n

Distribuio de

(n1)S2
2

Se X1 ; X2 ; ; Xn forem as observaes de uma amostra


aleatria de dimenso n retirada
Pn
2
(X X) 2
(n1)S
de uma populao normal N(; 2) ento 2 = i=1 2i
X 2 (n 1)
Notar que o nmero de graus de liberdade n 1. Isto bastante intuitivo, ao
estimarmos X perdemos um grau de liberdade:

9.3

Estimao

Nesta seco vamos abordar a questo de fazer inferncias sobre a populao quando
temos informao para uma amostra dessa populao. Muitas das vezes a distribuio da
populao depende s de alguns parmetros (por exemplo: se soubermos que a distribuio
normal basta saber mdia e varincia) ou ento ns estamos interessados s em certos
parmetros. A questo : ser que podemos inferir algo sobre o valor desses parmetros
de interesse com base na informao da amostra? O nosso objectivo arranjar uma forma
de estimar o valor do parmetro.

Captulo 9

133

Amostragem e estimao

Um estimador de um parmetro da populao uma varivel aleatria que depende


da informao da amostra, e que usada para estimar o valor de . O valor do estimador
para uma amostra especca
chama-se estimativa.
P
xi
Exemplo: X = n um estimador, x
= 5 uma estimativa.

9.3.1

Propriedades desejveis dos estimadores

Mas qual o critrio para escolher estimadores? Se b


um estimador de , que propriedades
b
que deve ter para ser um bom estimador?
No enviesamento
Consistncia
Ecincia
Erro quadrado mdio minmo
No enviesamento
Um estimador b
diz-se no enviesado se a mdia desse estimador for igual ao valor do
parmetro que queremos estimar, ou seja
E(b) =

O que que esta propriedade nos diz? preciso no esquecer que b uma varivel
aleatria. O valor de b
depende de qual a amostra que recolhida. O que a propriedade
nos diz que se ns repetssemos o processo de amostragem muitas vezes a mdia das
estimativas obtidas igual ao valor do parmetro na populao. A Figura 9.2 ilustra
gracamente o que signica um estimador ser no enviesado.
Vejamos alguns exemplos:
X um estimador no enviesado de
" n
#
" n
#
n
X Xi
X
1
1X
1
E(X ) = E
= E
Xi =
E(X i) = [n] =
n
n
n i=1
n
i=1
i=1
S 2 um estimador no enviesado de 2
" n
#
" n
#
" n
#
X (Xi X)2
X
X
2
1
1
2
2
E(S ) = E
=
E
(Xi X) =
E
Xi + X
n

1
n

1
n

1
i=1
i=1
i=1

134

Mtodos Quantitativos

b
Figura 9.2: (a) b
um estimador no enviesado de . (b) b
um estimador enviesado de :

o que equivalente a

mas isto

" n
#
X

1
=
E
(Xi )2 + ( X )2 2(Xi )(X )
n1
i=1
" n
#
n
X
X
1
E
(Xi )2 + n( X)2 2(X )
(X i )
n1
i=1
i=1

ou seja
" n
#
X

1
1 2
2
2
E
(Xi ) n( X) =
n n2=n = 2
n1
n 1
i=1

Neste exemplo dividimos a soma dos desvios ao quadrado por n 1. n 1 so os


graus de liberdade na estimao da varincia (perdemos um grau de liberdade ao
estimar x).
Consistncia
Esta propriedade refere-se ao comportamento do estimador medida que a dimenso da
amostra se aproxima de innito. Em termos intuitivos desejvel que medida que a
amostra se torna maior o estimador esteja cada vez mais prximo do parmetro. Consistncia signica que quando o tamanho da amostra muito elevado a distribuio da
estatstica ca muito muito concentrada em torno do parmetro da populao.
A Figura 9.3 ilustra gracamente a ideia da consistncia. A gura apresenta a funo
densidade para trs amostras de dimenso diferente (n3 > n2 > n1). Quanto maior a

Captulo 9

135

Amostragem e estimao

Figura 9.3: Funo densidade do estimador b


para amostras com dimenso n3 > n2 > n1 .

amostra mais concentrada a funo densidade em torno do valor do parmetro.Em


termos um pouco mais formais: seja b
n o estimador quando a amostra de dimenso n
e seja " um qualquer nmero positivo (to pequeno quanto ns quizermos), o estimador
diz-se consistente se
h
i
lim P (bn ) < " ! 1:
n!1

Ou seja, se o estimador for consistente, quando n tende para innito o estimador converge
(em probabilidade) para o verdadeiro valor do parmetro. Ou ainda, possvel aproximar, tanto quanto desejarmos, o estimador do verdadeiro valor do parmetro desde que a
amostra seja sucientemente grande.
Um estimador pode ser enviesado mas ser consistente. Este facto ilustrado na Figura
9.4, onde esto representadas as funes densidade do estimador com amostras de dimenso diferentes (n3 > n2 > n1 ). O estimador b
um estimador enviesado de (isto
particularmente visvel para amostras de pequena dimenso). Contudo, medida que a
dimenso da amostra aumenta a funo densidade concentra-se cada vez mais em torno
do valor do parmetro. Repare-se que medida que n se torna maior o enviesamento do
estimador ca cada vez mais pequeno e tende para zero quando n tende para innito.
Exemplo 9.5 o estimador

Pn

i=1 (x i

um estimador enviesado de

x)2

mas, no entanto, consistente.

Em contrapartida, um estimador pode ser no enviesado e no ser consistente. Isto


acontece se a a varincia do estimador no tender para zero quando n tender para innito.

136

Ecincia

Mtodos Quantitativos

Figura 9.4: b um estimador enviesado mas consistente.

Podem existir muitos estimadores no enviesados. Como escolher entre eles? natural
escolher o estimador cuja f.d.p. est mais concentrada em relao ao valor do parmetro da
populao. Ou seja aquele que tem menor disperso em torno da mdia. Se ns tivermos
dois estimadores no enviesados de , b
1 e b
2 ; baseados em amostras de igual dimenso,
b
ento dizemos que o estimador 1 mais eciente se
Var(b
1 ) < Var(b
2 )

e a ecncia relativa de um estimador em relao ao outro


ecincia relativa =

Var(b
2 )
Var(b
1 )

Na Figura 9.5 esto representadas as funes densidade de dois estimadores no enb


viesados do parmetro . O estimador b
mais eciente que o estimador b. importante
sublinhar que a ecincia uma propriedade relativa (estamos a comparar estimadores).
No entanto a comparao feita s entre estimadores que so no enviesados.
Exemplo 9.6 A mdia e a mediana so ambos estimadores no enviesados de quando
a distribuio normal. No entanto a mdia tem menor varincia
ecincia relativa =

1:572=n
= 1:57:
2=n

Captulo 9

Amostragem e estimao

137

b
Figura 9.5: O estimador b
mais eciente que o estimador b.

Erro quadrado mdio mnimo

Embora a propriedade de no enviesamento seja desejvel pode acontecer que nenhum dos
estimadores no enviesados seja muito preciso, pode acontecer que todos eles tenham uma
varincia elevada em torno de . possvel que haja estimadores desse parmetro que
tenham algum enviesamento mas que tenham menor varincia. Nestes casos no bvio
que o estimador no enviesado seja o mais apropriado. Esta ideia apresentada na Figura
9.6 onde esto representadas as funes densidade de dois estimadores de . O estimador
b
um estimador enviesado de , mas tem um varincia relativamente pequena. Em
b
contrapartida, o estimador b
um estimador no enviesado de , mas tem um varincia
relativamente elevada. Qual dos dois estimadores melhor?

b
Figura 9.6: O estimador b
tem um erro quadrado mdio inferior ao estimador b.

Um critrio que partida parece bastante lgico para decidir nestes casos escolher
o estimador que em mdia tem um menor erro quadrado (porqu quadrado?). O erro

138

Mtodos Quantitativos

quadrado mdio de um estimador b


dado por
h
i
EQM(b
) = E (b )2
Pode mostrar-se que:

EQM(b) = Var(b
) + Env2

Isto resulta de

2
2
2

b
b
b
b
b
b
b
b
b
E E() + E()
= E E() + E() + 2 E() E()
Isto sugere que se queremos minimizar EQM pode ser prefervel um estimador enviesado,
desde que a varincia desse estimador seja mais pequena e que mais que compense pelo
enviesamento (veja a Figura 9.6).
interessante notar que, se estivermos a considerar s estimadores no enviesados a
minimizao de EQM corresponde minimizao da varincia. Logo obteremos o estimador mais eciente.

9.3.2

Como encontrar estimadores?

At aqui enunciamos algumas propriedades desejveis de um estimador. Mas, h tantas


funes que possvel construir com base em X1; X2 ; ; X n! Como encontrar possveis
estimadores? H muitos mtodos: mtodo dos momentos, mtodo da mxima verosimilhana, mtodo dos mnimos quadrados.
Mtodo dos momentos
Se existirem k parmetros que tm que ser estimados, o mtodo dos momentos, consiste
em igualar os primeiros k momentos da amostra aos primeiros k momentos da populao.
Os k momentos da populao dependem dos k parmetros a estimar. Obtemos assim um
sistema com k equaes e k incgnitas e resolvendo o sistema encontramos os estimadores
dos k parmetros.
Exemplo 9.7 Consideremos uma v.a. X com distribuio N(; 2). Neste caso
E(X) =

e E(X 2) = 2 + 2

Captulo 9

139

Amostragem e estimao

Dada uma amostra de dimenso n os dois primeiros momentos na amostra so dados por:
n

m1 =

1X
xi
n
i=1

m2 =

1X 2
xi
n
i=1

igualando os momentos da amostra aos momentos na populao obtemos


( P
n
1
i=1 x i =
n
P
n
1
2
2
2
i=1 x i = +
n

e a soluo deste sistema em relao a e 2 d-nos os estimadores do mtodo dos


momentos:
(
P
= 1n ni=1 xi = x
P
2 = 1n ni=1 x2i x2
Mtodo da mxima verosimilhana

Seja X1; X2; ; Xn uma amostra aleatria retirada de uma distribuio com funo densidade de probabilidade f (x; 1 ; 2 ; ; k) em que 1; 2; ; k so parmetros desconhecidos, com ( 1; 2; ; k ) 2 - (espao dos parmetros - conjunto de valares que os
parmetros podem tomar).
A funo densidade de probabilidade da amostra aleatria
L( 1; 2; ; k ) = f(x1 ; 1 ; 2 ; ; k )f (x2; 1; 2; ; k ) f (xk ; 1; 2; ; n)
quando interpretada como funo dos parmetros chamada a funo de verosimilhana.
Repare-se que a f.d.p. da amostra aleatria depende dos valores dos parmetros. Dada
uma amostra em particular aquilo que se pergunta : quais so os valores de 1 ; 2 ; ; k
que com maior probabilidade geraram esta amostra. Ou seja, queremos encontrar os
valores dos parmetros que maximizam o valor da f.d.p. da amostra.
Suponhamos que as funes u1(x1; x2; ; xn ); ; uk(x1 ; x2 ; ; xn) maximizam o
valor da funo de verosimilhana. Ento os estimadores de mxima verosimilhana so
8
>
>
>
>
<
>
>
>
>
:

b1 = u1(x1 ; x2 ; ; xn)
b2 = u2(x1 ; x2 ; ; xn)
..
.
b
k = uk (x1; x2; ; xn )

140

Mtodos Quantitativos

Exemplo 9.8 Seja X1 ; X2 ; ; Xn uma amostra aleatria retirada de uma distribuio


exponencial com f.d.p.
1 x
f (x; ) = e ; 0 < x < 1; 2 - = f : 0 < < 1g

Recorde-se que o valor esperado desta varivel e a varincia 2. A funo de


verosimilhana

P
1 x1
1 x2
1 xn
1 i xi

L() =
e
e

e
= ne

Se tomarmos o logaritmo desta funo, como o logaritmo uma funo crescente a soluo
do problema de maximizao ser a mesma (e como isto envolve produtos, logaritmo ajuda
porque camos com somas)
Pn
xi
ln L() = n ln i=1

Para encontrarmos o mximo derivamos e igualamos a zero


Pn
Pn
n
X
d ln L()
n
xi
xi
i=1
= +
= 0 , n +
xi = 0 , = i=1
2
d

i=1
logo o estimador de mxima verosimilhana de a mdia na amostra.

9.3.3

Estimao pontual versus estimao por intervalos

Quando escolhemos uma amostra e calculamos o valor do estimador para essa amostra
obtemos uma estimativa. Uma estimativa simplesmente um dos muitos valores que o
estimador poderia tomar. Contudo, as nossas inferncias sobre o parmetro da populao
so baseadas nessa estimativa. Por exemplo, s observaes x1; x2; ; xn corresponde
a estimativa x. Se usarmos x como estimativa de estamos a fazer estimao pontual
(obtemos um certo valor que supostamente um bom palpite do valor de ). Mas, qual o
nosso grau de conana nessa estimativa? Por exemplo: se na sondagem sobre as eleies
presidenciais se obteve que 54% dos individuos da amostra pretende votar no partido A,
qual o grau de conana de que a verdadeira percentagem de votos esteja entre 51% e
57%? Este tipo de perguntas leva-nos a pensar em estimao por intervalos.
Um estimador por intervalos de um parmetro da populao uma regra para determinar um intervalo que com certa probabilidade contm o parmetro da populao em
que estamos interessados. Naturalmente, h um trade-o entre o grau de conana e o

Captulo 9

141

Amostragem e estimao

tamanho do intervalo. Quanto maior for o grau de conana (quanto mais certos ns
quisermos estar de que o verdadeiro valor do parmetro est no intervalo) maior ter de
ser o intervalo (menos precisa ser a nossa estimativa).
Para construirmos intervalos de conana devemos relembrar-nos (mais uma vez) que o
estimador uma varivel aleatria. A preciso do estimador depende da sua distribuio )
para construir intervalos de conana precisamos de conhecer a distribuio ) importncia
da distribuio por amostragem.
Vamos ver isto usando um exemplo. Consideremos uma populao normal em que
a mdia da populao desconhecida, mas 2 conhecido e que queremos estimar .
Consideremos o estimador X, sabemos que X tem distribuio N(; 2=n), ou ainda que
Z=

X
p N (0; 1)
= n

usando a tabela para a normal estandartizada, dada a probabilidade 1 possvel


encontrar o valor critco z=2 tal que

X
P z=2 p z=2 = 1
= n
claro que o valor critco z=2 depende de . Por exemplo: se 1 = 0:95, ento
z0:025 = 1:96, se 1 = 0:90, ento z0:05 = 1:645. Na Figura 9.7 est representada a
funo densidade da normal estandartizada e indicados os valores critcos necessrios para
os trs nveis de conana mais usados na prtica: 90%, 95% e 99%. Note-se que quanto
mais elevado for o nvel de conana desejado maior o valor critco.

Figura 9.7: Distribuio normal para determinar valor de z =2 necessrio para um nvel de
conana de (a) 90%, (b) 95% e (c) 99%.

142

Mtodos Quantitativos

Mas, isto equivalente a:

p
p
P X z=2 = n X + z=2 = n = 1

ou por palavras, a probabilidade que o intervalo aleatrio

X z=2 p
; X + z=2 p
n
n

contenha 1 . Outra forma de dizer, que se repetirmos a amostragem muitas


vezes e construirmos o intervalo de conana para cada amostra em 100(1)% dos casos
o intervalo contm o verdadeiro valor do parmetro. Este intervalo um intervalo de
conana de 100(1 )% de .
A interpretao do conceito de intervalo de conana ilustrada na Figura 9.8. Nesta
gura esto representados os intervalos de conana da mdia na populao, , para dez
amostras diferentes mas com igual dimenso. Como a mdia obtida em cada uma das
amostras diferente, os intervalos de conana vo tambm ser diferentes para as vrias
amostras. No exemplo da Figura 9.8, o intervalo de conana para uma das amostras no
contm . Como o nvel de conana 90%, se o processo de amostragem fosse repetido
um nmero muito elevado de vezes, 90% dos intervalos conteriam o verdadeiro valor do
parmetro da populao e 10% dos intervalos no incluiriam
.
h
i
Alguns comentrios sobre o intervalo de conana X z=2 pn ; X + z=2 pn :
1 chama-se o coeciente de conncia.

p
O intervalo de conana centrado em x e obtm-se subtraindo e somando z=2= n.
A amplitude do intervalo depende de n, de e de :
Quanto maior for a variabilidade na populao, , maior a amplitude do
intervalo ) menos precisa a estimativa.
p
Quanto maior for n, menor = n e logo menor a amplitude do intervalo
correspondente a um dado nvel de conana ) mais precisa a estimativa.

Quanto maior for o nvel de conana, 1 ; maior o valor de z=2 e logo


maior a amplitude do intervalo. Isto lgico, se quizermos estar mais certos de
que o intervalo contm teremos que, para uma mesma dimenso da amostra,
aumentar a amplitude do intervalo. Maior grau de conana ) menos preciso
na estimativa.
Ideia do trade-o.

Captulo 9

Amostragem e estimao

143

Figura 9.8: Intervalos de conana de 90% para a mdia na populao, considerando dez
amostras diferentes.

9.4
9.4.1

Intervalos de conana para a mdia


Varincia conhecida

Quando estudamos distribuies por amostragem vimos que h dois casos em que utilizar
a normal como distribuio de X apropriado:
Se a populao for normal N(; 2) ) x N (; 2 =n)
Se a populao tem mdia e varincia 2, independentemente da sua distribuio,
quando a amostra grande a distribuio de X aproximadamente normal pelo
teorema do limite central.
Nestes casos se conhecermos 2 possvel construr intervalos de conana para ,
com base na estimativa da mdia na amostra. Isto precisamente aquilo que zemos
anteriormente quando introduzimos o conceito de intervalo de conana.
Resumindo: se tivermos uma amostra de dimenso n de uma populao com mdia e
varincia 2 , se 2 for conhecido e x for a mdia observada na amostra, ento o intervalo

144

Mtodos Quantitativos

de 100(1 )% de conana dado por

x z=2 p
; x + z=2 p
n
n
Exemplo 9.9 Seja x a durao de uma lmpada de 60-watts comercializada por um
certo produtor. A experincia passada permite concluir que a distribuio da durao
de lmpadas normal com varincia 1269. Numa amostra aleatria de 27 lmpadas de
60-watts vericou-se que a durao mdia foi de 1478 horas. Construa um intervalo com
um nvel de conana de 95% para a durao mdia das lmpadas de 60-watts daquele
produtor.
O intervalo :

36
36
1478 1:96 p
; 1478 + 1:96 p
= [1464:42; 1491; 58]
27
27

9.4.2

Varincia desconhecida

Na maior parte dos casos a varincia da populao to desconhecida quanto a mdia. Se


a varincia for desconhecida teremos que estimar a varincia da populao se quizermos
construir intervalos de conana para a mdia.
Se a distribuio da populao for normal, pode mostrar-se que
X
p t(n 1)
S= n
X
p uma t com n 1 graus de liberdade. Se n for grande a t e a
ou seja a distribuio S=
n
normal so praticamente idnticas e pode construir-se o intervalo usando a normal. Mas,
se t for pequeno (n < 30) deve usar-se a distribuio t.
Sabendo isto fcil construir o intervalo de conana.

X
P t =2 (n 1) p t=2(n 1) = 1
S= n

depois de manipulaes semelhantes s feitas acima obtemos

p
p
P X t=2 S= n X + t=2 S= n = 1
Logo intervalo aleatrio:

S
S
X t=2(n 1) p
; X + t=2 (n 1) p
n
n

Captulo 9

Amostragem e estimao

145

contm o verdadeiro valor do parmetro com probabilidade 1 .


O intervalo de conana para uma amostra concreta de dimenso n, com mdia x e
desvio-padro s :

s
s
x t=2(n 1) p
; x + t=2 (n 1) p
:
n
n
Exemplo 9.10 Uma amostra aleatria de seis automveis com o mesmo modelo e ano foi
recolhida e o seu consumo mdio de gasolina registado: 6.0, 6.2, 5.9, 6.1, 6.2, 6.3. Construa
um intervalo de conana a um nvel de conana de 90% para o consumo mdio deste
modelo de automveis.
A mdia na amostra 6.12, o desvio padro na amostra 0.177, o valor de t5;0:5 = 2:015,
logo o intervalo de conana

0:177
0:177
6:12 2:015 p
; 6:12 + 2:015 p
= [5:9744; 6:2656]
6
6

9.5

Intervalos de conana para diferena de mdias

Muitas vezes estamos interessados em comparar as mdias de duas populaes. Por exemplo, um produtor tem dois fornecedores diferentes e quer testar se h ou no diferena
na qualidade do produto fornecido por ambos os produtores.

9.5.1

Varincias conhecidas

Se as populaes de onde as amostras so retiradas forem independentes e tiverem distribuio normal, a diferena entre as mdias tem tambm distribuio normal, com mdia
x y e varincia 2x=nx + 2y =ny. Isto implica que:

q
q

P (X Y ) z=2 2x=nx + 2y =ny x y (X Y ) + z=2 2x=nx + 2y =ny = 1 :

9.5.2

Varincias desconhecidas amostra grande

Se as varincias no forem conhecidas temos que estim-las com base nas amostras. Se
as amostras forem grandes a distribuio normal ser uma boa aproximao para a distribuio de (x y). Isto signica que

q
2
2
(x y) z=2 sx=nx + sx=ny
um intervalo de 100(1 )% de conana de x y .

146

Mtodos Quantitativos

Exemplo 9.11 Num estudo sobre as consequncias do tabaco no trabalho recolheram-se


duas amostras aleatrias independentes de fumadores e no fumadores. Nos 96 fumadores
o absentismo mdio por ms foi de 2.15 horas, com o desvio padro na amostra igual a
2.09. Nos 206 empregados no fumadores o absentismo mdio foi de 1.69 horas por ms
com um desvio padro de 1.91 horas por ms. Construa um intervalo de conana de 99%
para a diferena das mdias das duas populaes.
Soluo: Os resultados nas amostras so os seguintes:
x = 2:15
y = 1:69

nx = 96
ny = 206

sx = 2:09
sy = 1:91

Como as amostras so grandes podemos utilizar a distribuio normal. O valor de z=2 =


z0:005 = 2:575. O intervalo de conana
r

(2:15 1:69) 2:575

(2:09)2 (1:91)2
+
96
206

ou seja
:19 x y 1:11
como o valor zero est includo neste intervalo a evidncia na amostra contra a hiptese
de que as duas mdias so iguais no muito forte.

9.6

Intervalos de conana para propores

Queremos estimar qual a proporo da populao que tem um certo atributo. Um


estimador que pode ser utilizado para este efeito a proporo na amostra com aquele
atributo. A questo que se coloca : qual a distribuio desse estimador?
Se a amostra for grande a distribuio do estimador aproximadamente normal. Seja
b a fraco de elementos da amostra com o atributo em
n a dimenso da amostra e seja P
causa. Para n grande
q

Pb p

b P)=n
b
P(1

tem uma distribuio aproximadamente N(0; 1).

Captulo 9

147

Amostragem e estimao

Logo, o intervalo

"

pb z=2

pb(1 pb)
; pb + z=2
n

pb(1 pb)
n

um intervalo de 100(1 )% nvel de conana de p.

Exemplo 9.12 Numa certa campanha eleitoral um dos candidatos manda realizar uma
sondagem (aleatria) entre a populao com capacidade de voto. Os resultados foram
que em 351 eleitores 194 dizem favorecer o candidato. O candidato deve ou no sentir-se
conante que vai ganhar?
Soluo: A proporo de eleitores na amostra favorecendo o candidato pb = 194
351 =
0:553. Se construirmos um intervalo de conana de 95% obtemos
r
0:553 0:447
0:553 1:96
, [:501; 0:605]
351
como este intervalo est todo acima de 50% o candidato pode sentir-se relativamente
conante de que ganha. Mas, repare-se que se o nvel de conana for maior a amplitude
do intervalo ser maior e logo a possibilidade de ter menos de 50% dos votos existe.

9.7
9.7.1

Intervalos de conana para varincia


Intervalo para varincia de populao normal

Nesta seco vamos estudar intervalos de conncia para a varincia de uma populao
normal. Naturalmente este intervalo baseado na varincia da amostra
S2 =

n
X
(X i X)2
i=1

n1

onde usamos o facto de (n 1)S2 =2 ser X 2(n 1) para denirmos os intervalos de


2
conana. Se designarmos por Xn1;=2
o valor b tal que a probabilidade de a v.a. com
distribuio qui-quadrado com n 1 graus de liberdade ser maior ou igual que b igual a
=2, ento temos

(n 1)S 2
2
2
P Xn1;1=2
Xn1;=2 = 1 ,
2
"
#
(n 1)S 2
(n 1)S2
2
P
2
= 1
2
Xn1;=2
Xn1;=2

148

Mtodos Quantitativos

Exemplo 9.13 Um produtor est preocupado com a variabilidade nos nveis de impureza
contidos na matria-prima recebida de um fornecedor. Uma amostra aleatria de 15
encomendas mostrou um desvio padro de 2.36% no nvel de concentrao de impurezas.
Assuma que a populao normal. Encontre um intervalo de conana de 95% para a
varincia na populao.
2
2
O valor de X14;0:975
= 5:629 e X14;0:025
= 26:12 e 14(2:36)2 = 77:974 logo

77:974
77:974
2
, 2:99 2 13:85
26:12
5:629

9.7.2

Intervalo para rcio de varincias de populaes normais independentes

Se estivermos interessados em comparar a varincia de duas populaes normais indepen2


dentes podemos faz-lo construindo um intervalo de de conana para X2 .
Y

2 = 2 e (n 1)S 2 = 2 tm ambas distribuio qui-quadrado, com


Como (nx 1)SX
y
X
Y
Y
nx 1 e ny 1 graus de liberdade, respectivamente, se tomarmos o rcio delas divido pelos
respectivos graus de liberdade obtemos uma varivel aleatria com distribuio Fnx1;ny 1.
Ou seja
(nx 1)S2X
(nx 1) 2X
(ny 1)S2Y
(ny 1) 2Y

S2X
2X
SY2
2Y

=F

tem distribuio Fnx1;ny 1.


Exemplo 9.14 Sejam X e Y a quantidade (em miligramas) de nicotina em cigarros com
ltro e sem ltro, respectivamente. Assuma que as distribuies de X e Y so normais
N(X ; 2X ) e N(Y ; 2Y ). Considere as duas amostras aleatrias independentes: uma
amostra de 9 elementos de X
0:9 1:1 0:1 0:7 0:3 0:9 0:8 1:0 0:4
e uma amostra de 11 elementos de Y
1:5 0:9 1:6 0:5 1:4 1:9 1:0 1:2 1:3 1:6 2:1
encontre um intervalo de conana de 95% para

2X
.
2Y

Captulo 9

9.8

149

Amostragem e estimao

Escolha da dimenso da amostra

Quo grande deve ser a amostra para estimar um parmetro com um certo nvel de preciso? A resposta a esta pergunta depende da variabilidade na populao. Por exemplo, se
quizermos estimar a mdia da populao e soubermos que a varincia na populao nula
basta n = 1 para estimar com exactido a mdia da populao. Mas, se a varincia na
populao for elevada e desejarmos estimar com bastante preciso a amostra necessria
ser elevada.
A dimenso da amostra depende tambm do nvel de preciso com que queremos
estimar o parmetro. Se quizermos obter uma estimativa mais precisa (isto , com menor
amplitude do intervalo de conana) teremos que ter uma amostra mais elevada.
Se a varincia da amostra for conhecida fcil calcular qual a dimenso da amostra
que nos garante uma dada amplitude do intervalo de conana. De facto, ns sabemos
que

x z=2 p
; x + z=2 p
n
n
o intervalo de 100 (1 ) % nvel conana da mdia da populao. Este intervalo est
centrado na mdia observada na amostra e expande-se z=2 pn para cada um dos lados.
Suponha-se que queremos garantir que

z=2 p L
n
Isso implica que
n

=2 2
L

Como seria de esperar, quanto menor for a amplitude do intervalo que desejamos maior
ter que ser n (maior preciso ) maior n). Para alm disso, quanto maior for a varincia
na populao, maior ter que ser n.
Um outro caso com interesse o da propores. Vimos atrs que o intervalo de conana para a proporo centrado na proporo na amostra e extende-se
r
pb(1 pb)
z=2
n
para cada lado. O problema aqui que no possvel saber a amplitude do intervalo
sem primeiro estimar a proporo na amostra. Contudo, possvel escolher n de forma

150

Mtodos Quantitativos

a garantir que a amplitude no ultrapassa um certo valor. Basta notar que o valor mais
elevado que pb(1 pb) pode tomar 0:25. Logo, se escolhermos
n

2
0; 25 z=2

L2

temos a certeza que o intervalo se estende para cada lado num valor no superior a L.

Captulo 10

Teste de hipteses

10.1

Conceitos bsicos

No captulo anterior vimos como a informao na amostra pode ser usada para estimar
parmetros da distribuio da populao. Neste captulo vamos estudar como que a informao na amostra pode ser utilizada para testar a validade de conjecturas, ou hipteses,
que tenhamos formado sobre a populao.
Por exemplo, sou um produtor de um certo produto e gostaria de assegurar que menos
de 2% dos produtos produzidos so defeituosos. Podemos testar se neste momento a
quantidade de produtos defeituosos inferior ou igual a 2% fazendo uma vericao a
uma amostra aleatria de produtos e decidir depois com base nos resultados obtidos nessa
amostra. Outro exemplo, testar se o salrio o mesmo para mulheres e homens com
mesma qualicao e experincia.
Resumindo, temos uma certa hiptese sobre a populao, conclui-se sobre o mrito ou
no da hiptese usando informao na amostra.
Seja o parmetro de interesse (as ideias podem ser generalizadas para um vector
de parmetros) e suponhamos que temos uma certa hiptese formada sobre o valor do
parmetro, hiptese essa que continuaremos a admitir a no ser que haja forte evidncia de
que a hiptese falsa. A esta hiptese, que designaremos por H 0; chama-se em estatstica
a hiptese nula.
Se a hiptese nula no for verdadeira ento alguma hiptese alternativa ter de o ser.
Ao efectuarmos um teste de hiptese formulamos sempre qual a hiptese alternativa em
relao qual a hiptese nula est a ser testada. A hiptese alternativa designada por
H 1.
Tanto a hiptese nula como a alternativa podem ser simples ou compsitas. Uma
hiptese simples se especicar um valor nico para o parmetro, compsita se especicar
um conjunto de valores.

152

Mtodos Quantitativos

Uma outra distino com interesse entre testes unilaterais e bilaterais. Por exemplo,
o teste de H0 : = 0 contra H1 : 6= 0 um teste bilateral porque a hiptese
alternativa considera valores do parmetro inferiores e superiores aos valores do parmetro
se a hiptese nula for verdadeira. Isto , a hiptese alternativa considera valores esquerda
e direita de 0 .
Depois de especicadas as hipteses nula e alternativa e de termos recolhida uma
amostra temos que decidir se devemos ou no rejeitar a hiptese nula com base na informao da amostra. Temos que ter algum critrio para decidir. Consideremos o exemplo
de testar se h ou no discriminao nos salrios. O parmetro de interesse a diferena
entre mdia de salrios das mulheres e homens. Podemos formular H 0 : H M = 0
e H1 : H M 6= 0. Em termos intuitivos se obtivermos uma diferena das mdias
na amostra muito elevada natural que rejeitemos a hiptese nula, se obtivermos uma
diferena pequena talvez no haja evidncia para a hiptese de no discriminao ser
rejeitada. Mais frente, veremos que o critrio de deciso tem uma base estatstica: no
s a diferena das mdias na amostra que importante, tambm temos de levar em
considerao a variabilidade do estimador X H X M .
Antes de avanarmos, h um pormenor de linguagem que gostaria de discutir. Qual
a expresso mais correcta aceitar a hiptese nula ou no rejeitar hiptese nula?
No rejeitar a hiptese nula est mais de acordo com o estatuto de H0 como hiptese
mantida.
Como a nossa deciso baseada s numa amostra, no possvel conhecermos o valor
do parmetro na populao, logo no possvel ter a certeza se H0 falsa ou verdadeira.
Nestas circunstncias, pode acontecer que a deciso tomada sobre a rejeio ou no da
hiptese nula seja errada. H dois tipos de erros que podem ocorrer: um rejeitarmos a
hiptese nula quando ela verdadeira, este chamado erro do tipo I. O outro erro que
podemos cometer no rejeitar a hiptese nula quando ela falsa, este chamado erro
do tipo II. Resumindo em tabela:

No Rejeitar
Rejeitar

H0 Verdadeira
Deciso correcta
1
Erro do tipo I

nvel de signicncia

H0 Falsa
Erro tipo II

Deciso Correcta
1
potncia do teste

Captulo 10

Teste de hipteses

153

A Figura 10.1 ilustra gracamente a regio de no rejeio e de rejeio para um teste


bilateral. A zona em que H0 rejeitada tambm chamada regio crtica. Nesta gura
est representada a funo densidade de probabilidade do estimador se a hiptese nula
for verdadeira. A hiptese nula rejeitada se a estimativa na amostra divergir muito
do valor do parmetro sendo H0 verdadeira. O erro do tipo I, a probabilidade de a
hiptese nula ser rejeitada quando ela verdadeira. Por outras palavras, o erro do tipo
I a probabilidade do valor do estimador cair na regio critca, quando H0 verdadeiro.
Na Figura 10.1 o erro do tipo I dado pela rea a cinzento.

Figura 10.1: Regio critca e regio de no rejeio num teste bilateral.

A Figura 10.2 ilustra os conceitos de erro do tipo II e da potncia do teste. Na parte


superior da Figura determinada a regio crtica para um teste unilateral com um nvel
de signicncia . Se a hiptese alternativa for verdadeira, a distribuio por amostragem
da estatstica a apresentada na parte inferior da gura. Logo, a probabilidade de no
rejeitar H0 quando esta hiptese falsa dada pela rea a cinzento. Ou seja, o erro do
tipo II dado por . A potncia do teste, ou seja, a probabilidade de rejeitar a hiptese
nula quando ela falsa, a rea em branco abaixo da funo densidade.
A Figura 10.2 pode ser usada para mostrar que existe um tradeo entre e . Se
queremos baixar isso implica que aumenta. De facto, um menor implica uma
regio critca mais pequena (o valor crtico dimimui no exemplo do grco). Mas isso
faz aumentar a probabilidade de se cometer um erro do tipo II, faz aumentar . Tendo
em conta este trade-o, uma questo interessante : como escolher o valor de ? O
valor ptimo de depende dos custos associados aos dois tipos de erros. Se o custo de
cometermos um erro do tipo I for muito elevado relativamente ao custo do erro do tipo II,
prefervel optar por um valor de muito pequeno.

154

Mtodos Quantitativos

Figura 10.2: Erro do tipo I I e potncia do teste.

Na discusso anterior sobre o trade-o entre e admitimos que a dimenso da


amostra xa. Contudo, importante realar que, se aumentarmos a dimenso da
amostra, possvel diminuir simultaneamente e .
A potncia do teste a probabilidade de rejeitar a hiptese nula quando a hiptese
alternativa verdadeira. A potncia do teste depende da valor do parmetro na hiptese
alternativa. A funo que relaciona o valor do parmetro com a potncia do teste chama-se
funo potncia. Uma funo potncia bem comportada assume valores mais baixos para
valores do parmetro prximos da H0 e aumenta medida de que verdadeiro valor do
parmetro se afasta mais do valor de H0.
Exemplo 10.1 Eu tenho uma hiptese que a de que a proporo de pessoas que prefere
o Sporting ao Benca maior ou igual a 1/2. H0 12 e H1 < 12 . Vamos imaginar que eu
pergunto a 20 pessoas, escolhidas aleatoriamente qual dos clubes preferem. O critrio de
deciso o seguinte: se o nmero de pessoas que dizem preferir o Sporting for inferior ou
igual a 6 rejeito a hiptese nula.
Soluo: Assumindo que p a proporo de pessoas que prefere o Sporting, ento
o nmero de pessoas que prefere o Sportingn, Y , numa amostra de 20 pessoas segue a

Captulo 10

155

Teste de hipteses

distribuio binomial b(20; p) Calculemos:


1. Probabilidade do erro do tipo I nvel de signicncia:

X
6
20
1
20y
= P Y 6; p =
=
(1=2)y = 0:0577
y (1=2)
2
y=0
2. Probabilidade do Erro do tipo II - depende qual dos valores da alternativa que
consideramos. Se escolhermos p = 14 o valor de :

X
20
20
1
y
20y
= P 7 Y 20; p =
=
= 0:2142
y (1=4) (3=4)
4
y=7

enquanto que se p =

1
10

o valor de :

X
20
20
1
y
20y
= P 7 Y 20; p =
=
= 0:0024
y (1=10) (9=10)
10
y=7
3. Funo Potncia - o que queremos aqui 1 para os diferentes valores de p que
constituem a hiptese alternativa
K(p) = 1 (p) =

6
X
20
y

y=0

p y(1 p)20y

K(1=2) = = 0:0577, K(1=4) = 0:7858; K(1=10) = 0:9976. Verica-se que quanto mais
baixo for o valor de p relativamente hiptese nula p = 12 , maior a potncia do
teste.
Um outro conceito muito importante o de valor de probabilidade do teste ou valor p.
O valor p a probabilidade de obter um valor da estatstica to ou mais extremo do que
o resultado obtido, se H0 for verdadeiro. Na determinao do valor de p importante ter
em conta se o teste unilateral ou bilateral. A Figura 10.3 ilustra o conceito de valor p
num teste bilateral da hiptese H0 : = 0 contra a alternativa H1 : 6= 0 . O valor da
mdia na amostra foi de x. A probabilidade da mdia na amostra ser superior ou igual a
x ou inferior ou igual a x, quando a mdia na populao 0 igual a p. O valor p a
rea a cinzento na gura. A Figura 10.4 ilustra o conceito de valor no teste unilateral de
H 0 : = 0 contra a alternativa H1 : > 0.

156

Mtodos Quantitativos

Figura 10.3: O valor p num teste bilateral.

Figura 10.4: O valor p num teste unilateral.

O valor p pode ser usado no teste de hipteses. De facto, se o valor p for inferior ao
nvel de signicncia ento devemos rejeitar a hiptese nula. Caso contrrio, se o valor
p for superior ao nvel de signicncia pretendido, no se deve rejeitar a hiptese nula.
Alis, frequente denir o valor p como o valor mnimo do nvel de signicncia para o
qual H0 rejeitado tendo em conta o valor da estatstica. Por exemplo, se o valor p
0.005 isso signica que a hiptese nula rejeitada mesmo para que o nvel de signicncia
seja 0:5%.

10.2

Ensaio de hipteses sobre a mdia

10.2.1

Populao normal, varincia conhecida

Na maior parte dos casos a hiptese nula simples. Queremos testar:


H0 : = 0

Captulo 10

157

Teste de hipteses

contra uma das trs alternativas


i) H 1 : 6= 0
ii) H1 : < 0
iii) H 1 : > 0
Se retirarmos uma amostra aleatria da populao e calcularmos a mdia na amostra,
podemos usar essa mdia para testar a hiptese. Se a mdia na amostra divergir pouco de
0 podemos considerar a evidncia em favor de H0, se a mdia na amostra divergir muito
de 0 podemos considerar isso evidncia contra a H0. O divergir muito ou pouco deve ser
avaliado em termos do desvio padro da mdia na amostra (da variabilidade de X ).
Estamos fartos de saber que, se a populao for normal ou se n for grande:
X
p N (0; 1):
= n
Se a hiptese nula for verdadeira, isso implica que
Z=

X 0
p N(0; 1)
= n

Esta informao suciente para podermos determinar a regio crtica, para um dado
nvel de signicncia, . A regio critca, em cada um dos casos, :
1. H1 : 6= 0

Queremos escolher a regio critca de forma a que a probabilidade de rejeitar a


hiptese nula quando ela verdadeira . Como na alternativa o valor do parmetro
pode estar acima ou abaixo de 0 isto equivale a escolher o valor z=2 tal que

P Z z=2 ou Z z=2 = . Ou seja, a regio critca dada pelos valores


de Z abaixo de z=2 e pelos valores de Z acima de z=2.
Dada uma amostra em particular a regra de deciso : rejeitar H0 se

x
p0
= n

< z=2
p
ou se
> z=2. Isto equivalente a rejeitar H0 se x < 0 z=2= n ou se
p
x > 0 + z=2 = n. Na Figura10.5 est representada a regio critca para um nvel
de signicncia de 5%.
x
p0
= n

2. H1 : < 0
Queremos escolher a regio critca de forma a que a probabilidade de rejeitar a
hiptese nula quando ela verdadeira . Como na alternativa o valor do parmetro
est abaixo de 0 isto equivale a escolher o valor z tal que P ( Z z ) = . Neste
p
p0 < z , ou equivalentemente, se x < 0 z = n.
caso H0 rejeitado se x
= n

158

Mtodos Quantitativos

Figura 10.5: Regio critca num teste bilateral de H0 : = 0 , com = 5%:

3. H1 : < 0
Queremos escolher a regio critca de forma a que a probabilidade de rejeitar a
hiptese nula quando ela verdadeira . Como na alternativa o valor do parmetro
est abaixo de 0 isto equivale a escolher o valor z tal que P ( Z z ) = . Neste
p
x0
p > z , ou equivalentemente, se x > 0 + z = n.
teste H0 rejeitado se =
n
Exemplo 10.2 Um produtor de detergentes argumenta que a mdia do peso das caixas
do seu detergente 500 gramas. Sabe-se que a distribuio do peso normal, com desvio
padro igual 12.5 gramas. Numa amostra aleatria de 20 caixas o peso mdio foi de 485
gramas. Teste o argumento do produtor contra a alternativa que o peso inferior a 500
gramas, para um nvel de signicncia de 5%.
Soluo: O valor critco z tal que P ( Z z ) = 0:05 1:645. Por conseguinte a
hiptese nula deve ser rejeitada se Z < 1:645. Para a amostra recolhida o valor de z :
z=

485 500
p = 5:37:
12:5= 20

Logo, a hiptese nula rejeitada.

10.2.2

Populao normal, varincia desconhecida

Se a varincia no for conhecida teremos que estim-la usando a amostra. Neste caso
sabemos que se a hiptese nula for verdadeira,
T =

X 0
p tn1
S= n

Captulo 10

159

Teste de hipteses

isto sugere que T seja uma estatstica apropriada para usar no teste de H0 : = 0 contra
a alternativa H1 : 6= 0. Com = 0 sabemos que

P T t =2;n1 ou T t=2;n1 =

Dada uma amostra especca de dimenso n com mdia x e desvio padro s a regra de
deciso : rejeitar H0 : = 0 se e s se
x
p 0 t=2;n1 ou
s2=n

x
p 0 t=2;n1
s2=n

Se a alternativa fosse H1 : < 0 ou H1 : > 0 fcil por paralelo com o que zemos
atrs construir o teste com nvel de signicncia .
Exemplo 10.3 Uma empresa produtora de papel tomou vrias medidas para reduzir a
descarga de poluentes num rio vizinho. Os responsveis da empresa acreditam ter reduzido
o contedo de poluentes nas descargas de uma mdia anterior = 500 (avaliando a
poluio na gua em ppm). Para testar se a mdia baixou a empresa pensa fazer leituras
do nvel de poluio da gua em 25 dias consequtivos. Tratando estes 25 valores como
uma amostra aleatria, construir um teste com = 0:01. Suponha que depois de feitas as
leituras se obteve x = 308:8 e s = 115:15.
O teste mais apropriado H0 : = 500 contra a alternativa H 0 : < 500. Neste caso
o teste s de um dos lados da hiptese nula. A hiptese nula deve ser rejeitada se e s se
t=

x 0
p t0:01;24 = 2:492
s= 25

Para a amostra recolhida o valor da estatstica t


t=

308:8 500
p = 8:3
115:15= 25

logo a hiptese nula rejeitada e aceitamos a hiptese de que < 500.


A resposta anterior no nos diz se o decrscimo na poluio tanto quanto o desejvel.
Talvez seja interessante construir o intervalo de 99% nvel conana para :
308:8 2:797

115:5
) [244:2; 373:4]
5

160

Mtodos Quantitativos

Observaes:
Se a amostra for grande e a varincia desconhecida a distribuio normal apropriada
quer a populao tenha distribuio normal ou no.
Se a hiptese nula fosse do tipo H0 : 0 contra a alternativa H0 : > 0 o
teste o mesmo que se H0 : = 0 contra a alternativa H0 : > 0. Qual a
intuio? Se a mdia da populao for exactamente 0 a probabilidade de rejeitar
a hiptese nula com o teste proposto . Mas, se a mdia da populao for inferior
a 0 a probabilidade de a estatstica cair na regio crtica ainda menor. Ou seja,
a probabilidade do erro do tipo 1 no mximo .

10.3

Ensaio sobre a varincia de uma populao normal

Tal como seria de esperar estes ensaios so baseados na varincia da amostra s2 . A base
para o teste o facto da varivel aleatria
2
Xn1
=

(n 1)S 2
2

ter distribuio qui-quadrado com n 1 graus de liberdade.


Imaginemos que queremos testar a hiptese de que a varincia na populao igual
a um certo valor, H0 : 2 = 20. Se a varincia da populao for de facto 20 ento
a estatstica (n 1)S 2=20 tem uma distribuio qui-quadrado. Dada uma amostra em
particular com varincia s2, se o valor de s2 for muito diferente de 20 rejeitamos a hiptese
nula. Por exemplo, no caso do teste bilateral com nvel de signicncia a regra de deciso
: rejeitar a hiptese nula se e s se:
(n 1)s2
2
> Xn1;=2
20

ou

(n 1)s2
2
< Xn1;1=2
20

) Questo: Como seria se a alternativa fosse H1 : 2 > 20? E se H0 : 2 < 20?


Exemplo 10.4 Um professor de psicologia argumenta que a varincia nos testes de inteligncia (I.Q.) para estudantes universitrios de 100. Para testar este argumento
resolveu construir-se uma amostra com 30 estudantes que foram submitidos ao teste de
inteligncia. Nesta amostra s2 = 147:82. Faa o ensaio da hiptese H0 : 2 = 100 contra
a alternativa H1 : 2 6= 100, para = 0:05:

Captulo 10

161

Teste de hipteses

2
2
Na tabela da Qui-quadrado podemos vericar que X29;0:025
= 45:72 e que X29;0:975
=
16:05. O valor da estatstica na amostra

(30 1) 147:82
= 42:86
100
Logo com base nesta amostra no possvel rejeitar a hiptese nula de que 2 = 100.
Se construirmos o intervalo de conana (95%) para a varincia obtinhamos
(30 1) 147:82
(30 1) 147:82
2
) [93:76; 267]
45:72
16:05
ou seja o intervalo de conana contm 100, o que consistente com o resultado do teste.

10.4

Ensaio sobre propores

Muitas vezes estamos interessados em testar hipteses sobre a proporo de elementos


da populao que possuem uma certa caracterstica. O teste baseado na proporo
de elementos na amostra que possui a caracterstica e no facto de sabermos que, para n
elevado, a varivel aleatria
Pb p
p(1 p)=n

Z=p

ter uma distribuio que se aproxima da N(0; 1).


Seja H0 : p = p0 a hiptese nula. Se a proporo na populao for de facto p 0 sabemos
que
Pb p0
p0(1 p0 )=n

Z=p

tem distribuio normal. Se a hiptese nula estiver a ser testada contra a alternativa
H 0 : p 6= p0 e o nvel de signicncia desejado for , a regra de deciso : rejeitar a
hiptese nula se
jb
p p0 j
> z=2
p0(1 p0 )=n

Exemplo 10.5 Numa amostra de 802 compradores, 378 foram capazes de dizer qual era o
preo do produto que tinham acabado de colocar no carrinho de compras. Faa um ensaio
da hiptese de que pelo menos 50% dos compradores so capazes de dizer correctamente

162

Mtodos Quantitativos

o preo contra a alternativa de que aquela proporo na populao inferior a 50% com
um nvel de signicncia de 10%. Encontre tambm o valor-p deste teste.
Soluo: Queremos testar H0 : p 0:5 contra a alternativa H1 : p < 0:5. A regra de
deciso rejeitar a hiptese nula se
pb p0
< z = 1:28
p0(1 p0)=n

Mas o valor da estatstica na amostra

pb p0
:471 :5
z=p
=p
= 1:64
p 0(1 p0)=n
:5 :5=802

logo a hiptese nula rejeitada.


O valor p do teste a probabilidade de Z ter um valor inferior ou igual ao valor de
z = 1:64 obtido na amostra, ou seja, P(Z < 1:64) = P (Z > 1:64) = 0:0505: Ou seja, a
hiptese nula rejeitada desde que o nvel de signicncia do teste seja superior a 5.05%.

10.5

Ensaio sobre igualdade de mdias

10.5.1

Varincia conhecida com populaes normais ou amostra grande

Se tivermos uma amostra de dimenso nx de uma populao com distribuio normal


N(X ; 2X ) e uma amostra de dimenso ny de uma populao com distribuio normal
N(Y ; 2Y ) sabemos que a varivel aleatria
Z=

(X Y ) (X Y )
r
2X
2Y
nx + ny

tem distribuio N(0; 1). Se as varincias das duas populaes forem conhecidas podem
fazer-se ensaios de hipteses baseados neste resultado. Mesmo que as varincias no
sejam conhecidas desde que as amostras sejam grandes possvel substituir a varincia
na populao pela varincia na amostra e continuar a usar a distribuio normal (pelo
teorema do limite central) e isto verdade mesmo que a populao no seja normal.
Seja H0 : X Y = d0 a hiptese nula que queremos testar contra H1 : X Y 6= d0
ento a regra de deciso : rejeitar H0 se
j(x y) d0 j
r
> z=2
2X
2Y
nx + ny

Captulo 10

163

Teste de hipteses

Nos testes para os casos das alternativas H1 : X Y < d0 e H1 : X Y > d0 basta


retirar o mdulo do numerador e a estatstica tem que ser menor que z no primeiro
caso e maior que z no segundo caso.
Exemplo 10.6 Num inqurito administrao pblica pediu-se aos funcionrios inquiridos para classicarem numa escala de 1 (discorda completamente) a 5 (concorda plenamente) a armao As mulheres na administrao pblica so afectadas ao mesmo tipo
de tarefas que os homens. Numa amostra de 186 funcionrios masculinos a resposta mdia foi 4.059 e o desvio padro 0.839. E numa amostra independente de 172 funcionrias
pblicas a resposta mdia foi 3.680 e o desvio padro 0.966. Teste a hiptese de que
a percepo mdia sobre o tratamento das mulheres na funo pblica a mesma para
funcionrios e funcionrias pblicas contra a alternativa de que os funcionrios tm uma
mdia mais elevada.
Soluo: Designando por X a mdia para os funcionrios e Y a mdia para as
funcionrias, queremos testar H0 : X Y = 0 contra H0 : X Y > 0. A regra de
deciso : rejeitar a hiptese nula se
x y
q
> z
s2y
s2x
+
nx
ny
para as amostras recolhidas o valor da estatstica
4:095 3:680
q
= 3:95
(:839) 2
(:966)2
+
186
172

Mesmo escolhendo um nvel de signicncia muito baixo a hiptese nula rejeitada. Por
exemplo, para = 0:0001 (ou seja :01%) o valor de z = 3:75 o que signica que a hiptese
nula deve ser rejeitada mesmo a este nvel de signicncia.

10.5.2

Amostras pequenas

Se as amostras forem pequenas e se for razovel admitir que a varincia das duas populaes a mesma podemos usar o facto de a varivel aleatria
T =

(X Y ) (X Y )
q
y
S nnxx+n
ny

ter distribuio t com (nx + ny 2) graus de liberdade, e onde S 2


S2 =

2 + (n 1)S 2
(nx 1)SX
y
Y
nx + ny 2

164

Mtodos Quantitativos

10.6

Ensaio sobre a igualdade da varincia de duas populaes normais

Tomemos duas variveis aleatrias independentes com distribuio normal N(X ; 2X ) e


N(Y ; 2Y ). Queremos testar a hiptese H0 : 2X = 2Y (o que equivalente a H0 :
2X
= 1). Para testar esta hiptese podemos construir amostras aleatrias independentes
2Y
de X e Y , calcular a varincia em cada uma das amostras. Acontece que, se a hiptese
nula for verdadeira, o rcio das varincias nas amostras tem uma distribuio F com
(nx 1); (ny 1) graus de liberdade.
F=

(nx 1)S2X
(nx 1) 2X
(ny 1)SY2
(ny 1) 2Y

S2X
2X
SY2
2Y

) para H0 ) F =

2
SX
S2Y

Os valores extremos da regio critca dependem do tipo de teste que desejamos efectuar
(se hiptese alternativa tem que estar s para um dos lados da nula ou se o teste bilateral).
Exemplo 10.7 Um biologista que estuda aranhas est convencido que, numa certa espcie de aranhas, as fmeas so mais compridas que o macho e que o comprimento nas
fmeas varia mais do que o comprimento nos machos. Assumindo que o comprimento
uma varivel aleatria normal e que o comprimentos das fmeas, X , e machos, Y , so indepentes teste a hiptese de que a varincia no comprimento das fmeas igual varincia
no comprimento dos machos contra a alternativa de que a varincia no comprimento das
fmeas maior com base em amostras de 30 fmeas e 30 machos para um nvel de signicncia = 0:01. Os resultados nas amostras foram os seguintes: x = 8:153; s2x = 1:410;
y = 5:917; s2y = 0:4399.
Soluo: Queremos testar H0 :
F

2X
2Y

= 1 contra a alternativa H1 :

2X
2Y

s2x
1:410
=
= 3:2053 > F0:01 (29; 29) = 2:42
2
sy
0:4399
Logo a hipotese nula e rejeitada. A evidncia suporta o biologista.

> 1. A estatistica

Captulo 11

Regresso e correlao simples

Neste e nos prximos captulos estamos interessados em problemas involvendo duas ou


mais variveis. Vamos discutir duas tcnicas de anlise: correlao e regresso.
A anlise de correlao usada para medir o grau de associao entre variveis quantitativas. Em contrapartida, a anlise de regresso usada para prever o valor da varivel
dependente ou explicada, tendo em conta o valor de uma ou vrias variveis independentes
ou explicativas. Neste captulo concentramos a nossa ateno em modelos de regresso
linear simples, onde s h uma varivel explicativa e onde se admite a existncia de uma
relao linear entre a varivel explicativa e a varivel explicada. Mais tarde exploraremos
o caso em que h vrias variveis explicativas - regresso mltipla.

11.1

Diagrama de disperso e correlao

At aqui zemos anlise de dados de uma varivel. Mas pode acontecer estarmos interessados em analisar duas ou mais variveis numa determinada amostra. Nestas circunstncias,
para alm do estudo individual de cada uma das variveis, podemos ter interesse em estudar eventuais relaes entre as variveis.
A relao a que nos estamos a referir uma relao estatstica. Por exemplo, consideremos a relao entre a idade do marido e a idade da mulher. Embora no exista uma
relao exacta entre a idade do marido e da mulher, em termos mdios quanto mais velho
o marido, mais velha a mulher. As variveis idade do marido e idade da mulher
so positivamente correlacionadas.
O ponto de partida para se estudar a relao entre duas variveis termos uma coleco
de observaes das duas variveis:
(x1 ; y1) ; (x2 ; y2 ) ; ; (xn ; yn ) :
| {z }
| {z }
| {z }

1a observao 2 a observao

na observao

166

Mtodos Quantitativos

Se representarmos gracamente os n pontos no plano (num dos eixos temos a varivel x,


no outro a varivel y podemos car com uma primeira ideia sobre a forma coma as duas
variveis se relacionam. Essa representao chamada diagrama de disperso.
Exemplo 11.1 Considere a seguinte amostra de 10 casais:
Casal 1
Casal 2
Casal 3
Casal 4

Idade marido
32
25
50
45

Idade mulher
30
27
30
40

Casal 5
Casal 6
Casal 7
Casal 8

20
35
60
42

20
32
55
34

Casal 9
Casal 10

27
30

28
28

Construa o respectivo diagrama de disperso.


Se, no diagrama de disperso, o conjunto de pontos da amostra estiverem mais ou
menos agrupados ao longo de uma linha recta, isso sugere que as duas variveis aleatrias
esto linearmente relacionadas.
Se conhecermos a distribuio conjunta das duas variveis e quisermos medir a associao entre as duas variveis de uma forma nmerica podemos calcular a covarincia entre
xey

Cov(x; y) = E (x x)(y y )

o problema da covarincia que o seu valor sensvel s unidades de medida de X e Y


e, nesse sentido, no mede bem o grau de associao linear das duas variveis. Mas, se
dividirmos a covarincia pelo desvio padro de X e desvio padro de Y obtemos uma
medida que no depende das unidades - o coeciente de correlao
= Corr(x; y) =

Cov(x; y)
xy

O coeciente de correlao toma valores entre -1 e +1. Se = 1 signica que h uma


associao linear perfeita entre as variveis x e y e que essas v.a. so positivamente

Captulo 11

167

Regresso e correlao simples

relacionadas. Se = 1 as variveis so negativamente relacionadas sendo a relao


linear entre elas perfeita. Se = 0 no h relao linear entre as variveis (elas podem,
contudo, ser relacionadas de outras formas). As Figuras 11.1, 11.2 e 11.3 ilustram vrios
casos.

Figura 11.1: Correlao linear positiva: (a) = 1 e (b) < 1.

Figura 11.2: Correlao linear negativa: (a) = 1 e (b) > 1.

Na prtica aquilo de que dispomos uma amostra. O coeciente de correlao na


amostra pode ser estimado usando
Pn
(x x)(y y)
r = pPn i=1 i Pn i
2
2
i=1 (yi y)
i=1(xi x)

que uma estimador pontual. possvel mostrar que, se a distribuio conjunta das
variveis x e y for normal bivariada, o estimador
r

(1

r2)=(n

2)

tn2:

168

Mtodos Quantitativos

Figura 11.3: Correlao linear nula.

Podemos usar este facto para testar a hiptese nula H0 : = 0.


importante sublinhar que a existncia de correlao entre duas variveis por si s
nada nos diz sobre a existncia de uma relao causal entre as variveis. Ou seja, um valor
elevado de r no signica que x seja causa de y ou que y seja causa de x. As variveis x
e y podem ser linearmente correlacionadas por muitas razes:
Pode existir uma relao causal unilateral: a produo de trigo afectada pela
pluviosidade.
Pode existir interdependncia: o o que se passa no exemplo da idade do marido e
da idade da mulher.
Pode existir uma dependncia indirecta quando as variveis esto associadas pelo
facto de estarem sujeitas inuncia de uma causa comum. Exemplo: a forte correlao entre o nmero anual de casos de insolao e a produo de trigo explicada
pelo facto de veres quentes originarem simultaneamente muitos casos de insolaes
e boas produes de trigo.
Um outro aspecto importante que o facto de duas variveis no serem linearmente
correlacionadas nada nos diz sobre a existncia de outro tipo de relao. As duas variveis
podem estar relacionadas de forma no-linear. Normalmente, a observao do diagrama
de disperso muito til para identicar o tipo de relao que existe entre as variveis (se
existir).

11.1.1

Teste de correlao de Spearman

O coeciente de correlao da seco anterior muito sensvel existncia de outliers.


Para alm disso, a validade dos teste baseados naquele estimador depende da hiptese

Captulo 11

Regresso e correlao simples

169

da normalidade. possvel obter medidas de correlao menos sensveis presena de


outliers e que so vlidos seja qual for a funo distribuio da populao.
O teste de correlao de ordem de Spearman um teste no paramtrico. A ideia
base muito simples: comeam por ordenar-se de forma ascente as observaes de x e as
observaes de y. Para cada observao (xi ; y i) camos assim a conhecer a ordem de xi e
a ordem de yi. A partir daqui podemos calcular o coeciente de correlao entre as ordem
dos xi e a ordem dos yi .

11.2

Regresso linear simples

A ideia essencial nesta seco a de estudar a dependncia entre duas variveis aleatrias,
X e Y . Se a v.a X toma um certo valor, qual o valor que esperamos que Y tome (o
valor de X inuencia o valor de Y ).
Podemos interpretar isto no contexto da distribuio conjunta das variveis X e
Y . Aquilo em que estamos interessados na distribuio condicionada de Y dado X,
E [Y jX = x]. Em particular, a pergunta feita anteriormente refere-se ao valor esperado
de Y dado X (o valor esperado da distribuio condicionada). Exemplo, X = tempo de
estudo, Y = nota.
O objectivo da regresso modelar a relao referida. partida o valor esperado de Y
dado X pode assumir qualquer forma funcional (linear, exponencial, log-linear,...). Mas,
muitas vezes razovel admitir que esta relao linear no intervalo relevante
E [Y jX = x] = 0 + 1x
onde o parmetro 0 a interseco na origem e 0 o declive da recta.
Se a dependncia linear entre X e Y no for perfeita o valor de Y divergir do seu
valor esperado condicionado. Por outras palavras o modelo da populao que estamos a
admitir :
yi = 0 + 1 xi + "i
onde "i tem mdia zero. Uma interpretao do termo "i que ele incorpora a inuncia
de uma variedade de pequenos factores independentes que inuenciam Y , para alm de
X.
Um aspecto muito importante na relao anterior a interpretao de 1. O parmetro
1 mede a sensibilidade da varivel Y a variaes em X. Se X aumentar de 1 unidade o
valor de Y aumenta 1 unidades.

170

Mtodos Quantitativos

Por sua vez, o parmetro 0 indica-nos qual o valor esperado da varivel Y quando
X = 0. Contudo, de realar que embora esta interpretao esteja correcta do ponto de
vista matemtico ela pode no fazer sentido em termos econmicos. Em termos econmicos
pode no fazer sentido o caso em que X = 0. Para alm disso, a hiptese de que a relao
entre Y e X linear pode vericar-se para um certo intervalo de valores de X, mas no
se vericar para valores de X muito afastados daquele intervalo, e em particular no ser
vlida na vizinhana do ponto X = 0.
A Figura 11.4 ilustra o modelo da populao que estamos a admitir. O valor da varivel
dependente, yi , pode divergir do seu valor esperado tendo em conta xi. Essa diferena o
termo residual "i.

Figura 11.4: Recta de regresso de y sobre x.

O modelo de regresso da populao muito interessante. Contudo, na prtica, nunca o poderemos determinar de forma completamente precisa. Na prtica, aquilo que
fazemos usar uma amostra para estimar o modelo anterior. A questo que se coloca a seguir : como estimar este modelo com base na informao de uma amostra
(x1; y1 ); (x2; y2); ; (xn ; y n)?. Teremos que estimar os parmetros 0 e 1 , para isso
podemos utilizar o mtodo dos mnimos quadrados. Se soubermos qual a distribuio
conjunta de "i (normalmente assume-se normal multivariada) podemos tambm utilizar o
mtodo da mxima verosimilhana.
Exemplo 11.2 Funo consumo keynesiana
Na seu livro General theory (1936) Keynes defende que o Consumo depende do rendimento. Ou seja, se designarmos por C o consumo e por Y o rendimento, temos que
C = f (Y ). Para alm disso, Keynes sugere que quando o rendimento aumenta o consumo
tambm aumenta, mas menos que o rendimento. Por outras palavras, a derivada dC
dY

Captulo 11

171

Regresso e correlao simples

positiva mas inferior a 1 ( dC


dY a propenso marginal ao consumo). A formulao mais
usada da funo consumo keynesiana :
C = + Y;
onde, de acordo com a teoria, 0 < < 1.
claro que o modelo econmico C = + Y uma abstraco da realidade. Seria
irrealista pensar que existe uma relao exacta entre consumo e rendimento. O modelo
estatstico leva isto em considerao ao introduzirmos um termo residual no observvel.
Admitindo que esse termo entra de forma aditiva na relao anterior o modelo estatstico
ser:
C = + Y + "
O termo " uma varivel aleatria no observvel que combina o efeito de todos os outros
factores que inuenciam o consumo e que leva em conta o facto de a relao na realidade
no ser exacta.

11.2.1

Mtodo dos mnimos quadrados

Designemos por b 0 e b1 os estimadores de 0 e 1. A diferena entre o valor observado da


varivel explicada e o valor previsto pela recta de regresso para a observao i, ou seja,
o erro cometido na observao i :
ei =

yi
|{z}

valor observado

A soma dos quadrados dos resduos


SS =

n
X

e2i =

i=1

n
X
i=1

(b0 + b1xi):
| {z }

valor previsto

(y i (b0 + b1xi))2 :

Os estimadores de 0 e 1 so os valores de b0 e b1 que minimizam a soma dos quadrados


dos erros. Ou seja:
min
b0;b1

n
X
i=1

(y i (b 0 + b1xi))2 :

As condies de primeira ordem deste problema so:


(
Pn
@SS
@b0 = 2 Pi=1 (yi (b0 + b1xi )) = 0
n
@SS = 2
@b1
i=1 (yi (b0 + b1xi )) (xi) = 0:

172

Mtodos Quantitativos

Estas equaes so frequentemente designadas por equaes normais. Resolvendo o sistema obtemos:
(

b 0 = yP b1x
b1 =

n
i=1
P n(xi x)(yi y)
2
i=1(xi x)

Pn
i=1 xi yi nx y
P
n
2
2
i=1 xi nx

cov(x;y)
var(x)

A primeira equao permite-nos concluir que a recta de regresso passa no ponto mdio,
(x; y). Isto um facto muito til, porque facilita imenso o clculo de b0 uma vez conhecido
o valor de b 1. Para alm disso, a segunda equao diz-nos que valor de b1 dado pela
covarincia na amostra entre x e y dividida pela varincia de x, o que se pode tambm
exprimir usando o coeciente de correlao, ou seja:
b1 =

cov(x; y)
sy
= :
var(x)
sx

Exemplo 11.3 Uma empresa de fast-food est interessada em estudar a inuncia das
despesas de publicidade nas vendas. Na tabela seguinte esto indicadas as variaes percentuais, relativamente ao ano anterior, nas despesas de publicidade e nas vendas nas 8
regies do pas onde a empresa opera:
Variao % nas
despesas publicidade (xi )
Variao % nas
vendas (y i)

14

10

24

7.2

10.3

9.1

10.2

4.1

7.6

3.5

Estime a recta de regresso yi = 0 + 1 xi + ". Talvez seja interessante efectuarmos


os clculos para este exemplo.

Soma

xi
0
4
14
10
9
8
6
1
52

yi
24
7.2
10.3
9.1
10.2
4.1
7.6
3.5
54.4

xiyi
0
28:8
144.2
91
91.8
32.8
45.6
3.5
437.7

x2i
0
16
196
100
81
64
36
1
494

Captulo 11

173

Regresso e correlao simples

Logo
54:4
437:7 8 52
8 8 = 0:19027
494 52
= 6:8 0:19027 6:5 = 5:5632:

b1 =
b0

Exemplo 11.4 Estimao da funo consumo keynesiana com dados dos Estados-Unidos
para perodo (1950-1985). Os resultados so:
b = 11:374 + 0:898 Y
C
(9:629)

(0:006)

onde os valores entre parenteses so os desvios-padres dos estimadores. Repare-se que


a propenso marginal a consumir 0.898 e, logo, positiva mas inferior a 1, como a
teoria prev. Se o rendimento aumentar de 1 unidade monetria as despesas de consumo
aumentam 0.898 unidades monetrias.

11.2.2

Poder explicativo da regresso

A regresso pode ser vista como uma tentativa de explicar o comportamento da v.a. Y
usando informao sobre a v.a. X. Qual a capacidade do modelo para explicar as
variaes ocorridas na amostra na varivel Y ? Se Y tem uma certa variabilidade na
amostra que proporo dessa variabilidade pode ser explicada atravs da dependncia
linear de Y sobre X?
Podemos decompor a variabilidade total de Y em duas componentes: a variabilidade
explicada pela regresso e a variabilidade residual (veja a Figura 11.5). Designemos por
ybi o valor previsto da varivel y de acordo com a regresso, ou seja, ybi = b0 + b 1xi . Tendo
em conta os valores da amostra a regresso estimada pode escrever-se:
yi = b0 + b1 xi + ei , yi = ybi + ei:

Mas ento podemos exprimir o desvio de yi em relao mdia y da seguinte forma:


yi y = b
yi + ei y = (b
yi y) + ei :

Por palavras, a distncia de yi mdia y tem duas componentes: a componente explicada


e a componente residual.Mas ento
n
n
n
n
X
X
X
X
(yi y)2 =
(b
yi y)2 +
e2i +
2(b
yi y)ei
i=1

i=1

i=1

i=1

174

Mtodos Quantitativos

Figura 11.5: Componente explicada, ybi y; e componente no explicada, y i ybi , da diferena de


y i em relao a y.

mas o ltimo termo igual a zero (usando equaes normais), logo


n
n
X
X
(yi y)2 =
(b
yi y)2 +

|i=1 {z

variao total

Ao rcio

|i=1 {z

variao explicada

n
X

e2i

|i=1
{z }

varia o residual

Pn
(b
yi y)2
R = Pi=1
n
2
i=1(yi y)
2

d-se o nome de coeciente de determinao. R2 diz-nos qual a proporo da varincia


total da varivel dependente que explicada pelo modelo linear. claro que 0 R2 1,
e quanto maior for R2 maior o poder explicativo da regresso.
Exemplo 11.5 No exemplo da publicidade calcular o valor previsto das vendas, os resduos em cada um das observaes, a vario explicada e no explicada.

11.2.3

Hipteses do OLS e teorema de Gauss-Markov

Se certas condies forem satisfeitas, os estimadores obtidos usando o mtodo dos mnimos
quadrados (ordinary least squares OLS) possuem propriedades bastante desejveis. Nestas seco vamos enunciar as hipteses tradicionais do modelo de regresso linear simples
e enunciar uma consequncia dessas hipteses: o teorema de Gauss-Markov.

Captulo 11

175

Regresso e correlao simples

Consideremos o modelo da populao:


yi = 0 + 1 xi + "i
As hiptese seguintes so normalmente feitas:
1. As observaes xi ou so nmeros xos (xados, por exemplo, por um experimentador), ou so realizaes de variveis aleatrias Xi , que so independentes do termo
residual "i :
cov [Xi; "i ] = E [Xi ; "i ] = 0:
2. Os termos residuais "i so variveis aleatrias com mdia 0:
E ["i] = 0,

i = 1; 2; ; n

3. As variveis aleatrias "i tm todas a mesma varincia:



var ["i ] = E "2i = 2" i = 1; 2; ; n

4. As variveis aleatrias "i no esto correlacionadas umas com as outras:


cov ["i ; "j ] = E ["i ; "j ] = 0, para todo i 6= j:
Se estas condies forem vericadas, e dispusermos de uma amostra com n observaes,
(x1 ; y1 ), (x2; y2 ), ,(xn ; yn ) os estimadores dos mnimos quadrados, b 0 e b 1, so os estimadores que tm varincia mnima na classe de estimadores lineares e no enviesados.
Este o teorema de Gauss-Markov. Por esta razo, diz-se que os estimadores dos mnimos
quadrados so BLUE (best linear unbiased estimators).
Por outras palavras, os estimadores dos mnimos quadrados so os mais ecientes na
classe de estimadores lineares, assumindo que se vericam as hipteses acima mencionadas.

11.3

Testes de hipteses e intervalos de conana

Os estimadores dos mnimos quadrados so estimadores pontuais que so no enviesados


e tm varincia mnima nas hipteses do modelo. Contudo, muitas vezes estamos interessados em construir intervalos de conana para 0 e , ou testar hipteses sobre estes
parmetros da populao. Nestes casos, preciso conhecer a distribuio dos estimadores.

176

Mtodos Quantitativos

fcil mostrar que b 0 e b1 so estimadores no enviesados. Por exemplo,


Pn

Pn

(xi x)(yi y)
(xi x)( 1(xi x) + "i)
i=1
i=1
Pn
Pn
E(b 1) = E
=E
2
2
i=1(xi x)
i=1 (x i x)
Pn
i=1 E [(xi x)"i ] =
= 1 + P
n
1
2
i=1(xi x)
Usando as propriedades sobre a varincia tambm possvel mostrar que
2"
2
i=1(xi x)

var(b) = Pn

Isto no resolve ainda o problema porque 2" desconhecido. Mas, 2" pode ser estimado
usando como estimador a varincia dos resduos na amostra
Pn 2
e
2
s = i=1 i
n2
onde a diviso por n 2 resulta do facto de dois parmetros terem sido estimados e logo
haver a perda de dois graus de liberdade. A s chama-se o desvio-padro da estimativa.
A distribuio de b0 e a distribuio de b1 dependem da dimenso da amostra e da
funo de distribuio dos erros. Se a amostra for grande, a distribuio de bj aproximase da normal seja qual for a distribuio dos erros (isto uma consequncia do teorema
do limite central). Se a amostra for pequena e os erros forem normais a distribuio de
bj j
sbj

j = 0; 1

uma t com (n 2) graus de liberdade.


Conhecendo a distribuio do estimador bj podemos construir intervalos de conana
para o parmetro j , ou fazer testes de hipteses.
Se os resduos tiverem uma distribuio normal e as hipteses do OLS forem satisfeitas,
um intervalo de conana de 100(1 )% para j dado por:
bj sbj t n2;=2 < < bj + sbj t n2;=2
onde t n2;=2 o valor critco tal que a probabilidade de uma varivel aleatria t n2 seja
superior a esse valor 2 .
De forma semelhante, se os resduos tiverem distribuio normal, podemos fazer testes
b
de hipteses usando o facto de js b j ser uma t com (n 2) graus de liberdade. Para
j

Captulo 11

177

Regresso e correlao simples

um nvel de signicncia ; para testar a hiptese nula H0 : j = 0j contra a alternativa


H 1 : j 6= 0j , a regra de deciso rejeitar a hiptese nula se
bj 0j
< tn2;=2
sbj

ou se

bj 0j
> tn2;=2 :
sbj

Podemos tambm estar interessados em testes unilaterais. por exemplo, se quisermos


testar H0 : j = 0j contra a alternativa H1 : > 0j , a regra de deciso rejeitar a
hiptese nula se
bj 0j
> tn2; :
sbj
Um caso de interesse particular quando o valor de 01 = 0. Neste caso, se a hiptese
nula for verdadeira o modelo de regresso da populao :
Yi = 0 + "i
Isto signica que, seja qual for o valor da varivel independente, a varivel dependente
uma varivel aleatria de mdia e varincia 2" . Por outras palavras, a varivel explicada
no depende (linearmente) da varivel explicativa.
Se a hiptese nula H0 : 1 = 0 for rejeitada dizemos que a varivel X estatisticamente
signicativa. Caso contrrio, se no for possvel rejeitar a hiptese nula dizemos que X
no estatisticamente signicativa.
Muitos softwares de estatstica indicam o valor da estatstica t para o teste da hiptese
nula H0 : 1 = 0 contra a alternativa H1 : 1 6= 0; e normal na apresentao dos
resultados de estudos empricos indicar aquele valor.

11.4

Previso

Podemos utilizar o modelo de regresso para prever o valor da varivel explicada, tendo em conta um determinado valor da varivel explicativa. Suponhamos que a varivel
independente igual a xn+1 e que a relao linear estimada continua a ser vericada,
ento:
Yn+1 = 0 + 1 xn+1 + "n+1
e
E [Yn+1jxn+1] = 0 + 1xn+1:

178

Mtodos Quantitativos

claro que 0 e 1 no so conhecidos e tambm no sabemos qual vai ser o valor de "n+1.
natural substituir os parmetros 0 e 1 pelas estimativas b0 e b1 . Por conseguinte, uma
estimativa pontual de Yn+1 :
bn+1 = b 0 + b1xn+1.
Y

Embora a estimativa pontual seja interessante, em muitos casos estamos interessados em


saber qual o grau de incerteza associado previso. Nessas condies devemos construir
intervalos de conana para a varivel a prever. Como sempre isso requere o conhecimento
da distribuio da varivel aleatria. Em particular, o intervalo de conana depender
da varincia de Yn+1 . Em termos intuitivos, h vrias fontes de variabilidade. Por um
lado, a varivel aleatria "n+1 tem uma certa varincia, que pode ser estimada usando
o desvio-padro da estimativa. Por outro lado, os estimadores dos mnimos quadrados
tambm tm uma determinada varincia.
Se estivermos interessados em construir um intervalo de conana com um nvel de
conana de 100(1 )% para Yn+1 ele dados por:
s

1
(xn+1 x)2
b
Yn+1 tn2;=2
1 + + Pn
s2e
2
n
(x

x)
i
i=1
Tambm se podem construir intervalos de conana para E [Yn+1jxn+1], a ideia
estimar o valor mdio de Yn+1 tendo em conta que o valor da varivel independente
xn+1 . A varincia deste valor esperado condicionado menor que a varincia de Yn+1
porque aqui a varincia de "n+1 no includa. Neste caso, o intervalo de conana dado
por:
s

2
1
(x

x)
n+1
2
Ybn+1 tn2;=2
+ Pn
2 se
n
(x

x)
i=1 i

interessante analisar como que os diferentes factores afectam o intervalo de conana. Por um lado, quanto maior for n menor a varincia dos estimadores b0 e b1 e,
logo, menor a amplitude do intervalo de conana.
Para alm disso, quanto menor for s2e , menor a amplitude do intervalo de conana.
Isto bastante intuitivo porque s2e o estimador de 2" , e claro que quanto menor a
variabilidade dos resduos, menor ser a variabilidade do valor observado de Y em relao
ao seu valor esperado.
P
Um aspecto interessante a inuncia do termo ni=1(xi x)2. Repare-se que isto
um mltiplo da varincia da varivel explicativa. Quanto maior for a variabilidade na

Captulo 11

179

Regresso e correlao simples

varivel explicativa, maior a preciso dos estimadores dos mnimos quadrados (ou seja,
menor a sua varincia). Mas isso reduz a amplitude do intervalo de conana.
Por ltimo, quanto mais xn+1 estiver afastado da mdia x, maior a amplitude do
intervalo de conana. Ou seja, a preciso com que conseguimos estimar Yn+1 decresce
medida que xn+1 toma valores mais afastados da mdia.

11.5

Outras formas funcionais

At aqui assumimos que a relao entre a varivel explicativa e a varivel explicada era
linear. Mas, possvel que o modelo terico de que partimos, ou dados usados, ou ambos,
sugiram que a relao no linear. curioso que o modelo de regresso linear que
acabamos de estudar se pode aplicar a muitas outras formas funcionais. De facto, em
muitos casos possvel, usando transformaes das variveis originais, continuar a ter um
modelo que linear nos parmetros. Nestes casos, podemos usar o modelo de regresso
linear simples. Vejamos exemplos destas ideias
Exemplo 11.6 Consideremos a seguinte relao entre y e x:
1
yi = 0 + 1( ) + "i
xi
Esta forma funcional no linear na varivel explicativa. Contudo, o modelo linear nos
parmetros 0 e 1 e, por conseguinte, podemos usar o OLS para o estimar. A nica coisa
que temos que fazer comear por calcular x1i para todas as observaes e, depois, basta
regredir yi sobre a nova varivel x1i :
claro que, se a forma funcional for a descrita e estivermos interessados em calcular
quanto que varia a varivel explicada quando a varivel explicativa aumenta de 1 unidade,
a resposta no to imediata como no modelo linear nas variveis. Mas para responder
basta calcular a derivada de y relativamente a x:
dy i

= 21 :
dxi
xi
Exemplo 11.7 Suponhamos que a relao entre y e x descrita por:

yi = xi 1 exp ("i )
Apesar deste modelo ser no linear, podemos transform-lo num modelo linear. Para isso
basta calcular o logaritmo de ambos os membros :
ln yi = ln + 1 ln xi + "i

180

Mtodos Quantitativos

Este modelo frequentemente designado por log-linear (existe uma relao linear entre o
logaritmo das variveis). Para estimar o modelo comeamos por calcular os logaritmos das
variveis explicada e explicativa para todas as observaes e depois fazemos uma regresso
linear entre ln y e ln x.
O parmetro 1 neste modelo tem uma interpretao muito curiosa: a elastecidade
de y relativamente a x. Ou seja, se x aumentar de 1% a varivel explicada aumenta 1%.
fcil mostrar este resultado derivando ambos os lados em ordem a xi :
d(ln yi ) dyi
d(ln xi)
1 dyi
1
= 1
,
= 1
dyi dxi
dxi
yi dxi
xi

dyi xi
= 1 .
dxi yi

Captulo 12

Regresso mltipla

12.1

Modelo de regresso mltipla

No modelo de regresso simples o comportamento de uma nica varivel independente


foi usado para explicar o comportamento da varivel dependente. Contudo, em muitos
modelos econmicos a varivel dependente inuenciada por vrias variveis independentes. Por exemplo, a quantidade produzida normalmente uma funo da quantidade
utilizada de vrios inputs. Outro exemplo, os custos de produo dependem da quantidade
produzida, mas dependem tambm dos preos dos factores produtivos.
Quando passamos de um modelo econmico com vrias variveis explicativas para um
modelo estatstico linear, obtemos o modelo de regresso mltipla. Tal como no captulo
anterior a ideia calcular o valor esperado da varivel independente condicionado no valor
das variveis explicativas. Se admitirmos que h k variveis explicativas o modelo de
regresso da mltipla na populao :
Yi = 0 + 1x1i + 2x2i + + k xki + "i;
onde o ndice i diz respeito observao i.
A interpretao dos parmetros 0, 1; 2 ; ; e k semelhante dos parmetros no
modelo de regresso linear simples.
O parmetro 0 indica-nos o valor esperado da varivel explicada quando as variveis
explicativas so todas iguais a zero (x1 = 0, x2 = 0, , xk = 0). Embora esta interpretao seja teoricamente correcta, em certos contextos pode no fazer sentido a situao
em que todas as variveis so iguais a zero. Para alm disso, quando os valores na amostra
das variveis explicativas so bastante diferentes de zero, pode ser irrealista assumir que
o modelo linear vlido na vizinhana do ponto nulo. Ou seja, a regresso linear pode
ajustar-se bem na vizinhana dos pontos da amostra, mas pode ser inadequado admitir
que o mesmo tipo de relao se observa em regies afastadas.

182

Mtodos Quantitativos

O parmetro 1 indica-nos a variao esperada na varivel explicada quando x1 aumenta de uma unidade, assumindo que todas as outras variveis se mantm constantes. Por
outras palavras, 1 mede a sensibilidade da varivel explicada relativamente a variaes
em x1 .
De forma semelhante, o parmetro i indica-nos a variao esperada na varivel explicada quando xi aumenta de 1 unidade, assumindo que todas as outras variveis se
mantm constantes. Os parmetros i so frequentemente designados por coecientes de
regresso parciais, porque fornecem uma medida da inuncia de cada uma das variveis
independentes na varivel explicativa.

12.1.1

Modelo em notao matricial

Para trabalhar com o modelo de regresso linear mltipla facilita bastante utilizar notao
matricial. Tendo em conta o conjunto de n observaes, o modelo de regresso descrito
por:
8
>
y1 = 0 + 1x11 + 2 x21 + + k xk1 + "1
>
>
>
< y2 = 0 + 1x12 + 2 x22 + + k xk2 + "2
..
>
>
.
>
>
:
yn = 0 + 1x1n + 2 x2n + + kxkn + "1
Em termos matriciais estas equaes podem escrever-se da seguinte forma:
2
3 2
32
3 2
3
y1
1 x11 x21 xk1
0
"1
6
7 6
76
7 6
7
6 y2 7 6 1 x12 x22 xk2 76 1 7 6 "2 7
6 . 7=6 . .
7
6
7
6
7
..
..
6 . 7 6. .
76 .. 7 + 6 .. 7
4 . 5 4. .
.
.
54 . 5 4 . 5
yn
| {z }
Y

Ou seja:

1 x1n x2n
{z

xkn

k
}| {z }

"n
| {z }
"

Y = X + ":

12.2

Mtodo dos mnimos quadrados

O princpio dos mnimos quadrados aplicado na estimao do modelo de regresso mltipla


em tudo idntico ao que vimos na regresso simples: tendo em conta a amostra quer

Captulo 12

183

Regresso Mltipla

escolher-se os valores dos estimadores de forma a minimizar a soma dos quadrados da


diferenas entre os valores observados e os valores previstos da varivel explicada.
Admitamos que temos uma amostra de n observaes com os valores das k variveis
explicativas e da varivel explicada. Ou seja:
(x11; x21 ; ; xk1; y1)
(x12; x22 ; ; xk2; y2)
..
.
(x1n ; x2n ; ; xkn; yn )
Dadas estas n observaes o problema encontrar estimadores dos parmetros 0, 1,
2 , , k . O mtodo dos mnimos quadrados considera os estimadores b0, b 1, b2 , , b k
que minimizam a soma dos quadrados dos resduos:
2
32
n
X6
7
min SS = min
4yi (b0 + b1x1i + b 2x2i + + bk xki )5 :
|
{z
}
b0 ;b1; ;bk
b0 ;b1; ;bk
i=1

yi
b

No ponto ptimo deste problema de optimizao livre as derivadas parciais de SS em


relao a b0 , b 1, b2, , b k tm de ser todas iguais a zero. Para encontrar a soluo tem
de resolver-se um sistema de k + 1 equaes. As contas no so l muito simpticas, mas
felizmente h softwares que as fazem rapidamente. Contudo, usando notao matricial, a
frmula dos estimadores OLS muito idntica obtida no modelo de regresso simples.
De facto, designando por b o vector de estimadores dos mnimos quadrados, ou seja,
b = (b0; b1; ; bk ), pode mostrar-se que:
b = (X0 X)1X0 Y:
Exemplo 12.1 Considere o seguinte modelo explicativo do aumento de peso durante o
primeiro ano dos caloiros:
yi = 0 + 1x1i + 2x2i + 3x3i + "i
onde y aumento de peso durante o primeiro ano na Universidade, x1 nmero mdio
de refeies por semana, x2 nmero mdio de horas de exerccio fsico por semana e x3
nmero mdio de cervejas consumidas por semana. Este modelo foi estimado usando
uma amostra de 30 alunos da Universidade de vora. As estimativas obtidas na amostra
foram:
b0 = 7:35, b 1 = 0:653; b2 = 1:345 e b3 = :613:

184

Mtodos Quantitativos

Ser que neste modelo possvel dar uma interpretao adequada estimativa b0 ?
Interprete as estimativas dos restantes coecientes e verique se o sinal desses coecientes
aquele que esperaria obter apriori tendo em conta o modelo terico considerado.

12.3

Hipteses do modelo e teorema de Gauss-Markov

Tal como no modelo de regresso simples, se certas condies forem satisfeitas, os estimadores dos mnimos quadrados tem propriedades muito desejveis.
Consideremos o modelo da populao:
Yi = 0 + 1x1i + 2 x2i + + k xki + "i
e admitamos que temos conjunto de dados com n observaes. As hipteses seguintes so
normalmente feitas:
1. As observaes x1i, x2i, , xki ou so nmeros xos (xados, por exemplo, por um
experimentador), ou so realizaes de variveis aleatrias X1i , X2;i, , Xk;i que
so independentes do termo residual.
2. Os termos residuais "i so variveis aleatrias com mdia 0:
E ["i] = 0,

i = 1; 2; ; n

3. As variveis aleatrias "i tm todas a mesma varincia:



var ["i ] = E "2i = 2" i = 1; 2; ; n

4. As variveis aleatrias "i no esto correlacionadas umas com as outras:


cov ["i"j ] = E ["i "j ] = 0, para todo i 6= j:
5. No possvel encontrar um conjunto de nmeros, c0, c1 , ; ck tais que
c0 + c1x1i + c 2x2i + + ck xki = 0, para todo i = 1; 2; ; n:
Outra forma de dizer isto que nenhuma das variveis explicativas se pode exprimir
como combinao linear das outras variveis explicativas.

Captulo 12

185

Regresso Mltipla

Se estas condies forem vericadas, e dispusermos de uma amostra com n observaes,


(x11; x21; ; xk1 ; y1 ), (x12 ; x22; ; xk2; y 2), , (x1n; x2n; ; xkn ; y n) os estimador dos
mnimos quadrados, b 0, b1, b 2, ; bk so os estimadores que tm varincia mnima na
classe de estimadores lineares e no enviesados. Este o teorema de Gauss-Markov.
Por esta razo, diz-se que os estimadores dos mnimos quadrados so BLUE (best linear
unbiased estimators).
Para alm das hipteses mencionadas, comum admitir que os resduos, "i; seguem
uma distribuo normal. Esta hiptese particularmente importante se quisermos fazer
teste de hipteses ou construir intervalos de conana e a amostra no for muito grande
relativamente ao nmero de parmetros a estimar. Para amostras de dimenso elevada, a
hiptese da normalidade menos importante por causa do teorema do limite central.

12.4

O poder explicativo da regresso

Qual a capacidade do modelo de regresso mltipla para explicar as variaes ocorridas na


amostra na varivel Y ? Se Y tem uma certa variabilidade na amostra que proporo dessa
variabilidade pode ser explicada atravs da dependncia linear entre a varivel dependente
e as variveis explicativas?
Tal como no caso da regresso simples, podemos decompor a variabilidade total de Y
em duas componentes: a variabilidade explicada pela regresso e a variabilidade residual.
Designemos por ybi o valor previsto da varivel y de acordo com a regresso, ou seja,
ybi = b0 + b1x1i + b 2x2i + + bk xki . Tendo em conta os valores da amostra a regresso
estimada pode escrever-se:
yi = b 0 + b1x1i + b 2x2i + + bk xki + ei , yi = b
yi + ei :

Mas ento podemos exprimir o desvio de yi em relao mdia y da seguinte forma:


yi y = b
yi + ei y = (b
yi y) + ei :

Por palavras, a distncia de yi mdia y tem duas componentes: a componente explicada


e a componente residual.Mas ento
n
X
(yi y)2
i=1

{z

variao total SST

n
X
(b
yi y)2
i=1

{z

variao explicada SSR

n
X

e2i

i=1

| {z }

variao residual SSE

n
X
2
(b
yi y)ei

| i=1 {z

=0 pelas equaes normais

186

Mtodos Quantitativos

Ao rcio

Pn
(b
yi y)2
SSR
SSE
R = Pi=1
=
=1
n
2
(y

y)
SST
SST
i=1 i
2

d-se o nome de coeciente de determinao. R2 diz-nos qual a proporo da varincia


total da varivel dependente que explicada pelo modelo de regresso mltipla. claro
que 0 R2 1, e quanto maior for R2 maior o poder explicativo da regresso.
Se as hipteses do modelo enunciadas na seco 12.3 forem vericadas, um estimador
no enviesado de 2" dado por:
Pn 2
2
i=1 ei
se =
:
nk1

Intituitivamente, o facto de se dividir por n k 1 = n (k + 1) tem a ver com o facto


de termos estimado k +1 parmetros da populao ( 0; 1 ; 2; ; k ) e, por conseguinte,
quando estimamos 2" com base nas n observaes da amostra j perdemos k + 1 graus
de liberdade. Note-se que, para podermos estimar s2e o nmero de observaes tem necessariamente que ser superior ao nmero de parmetros a estimar, n > k + 1. Um exemplo
trivial disto era imaginar estimarmos uma regresso simples s com duas observaes.
Como dois pontos denem de forma nica a recta, nesse caso ei = 0 para ambas as observaes, ou seja, no h qualquer grau de liberdade nos erros na amostra e, logo, os erros
na amostra no podem ser usados para estimar 2" .
Embora o coeciente de determinao seja um indicador da capacidade das variveis
explicativas explicarem o comportamento da varivel explicada, importante mencionar
que ele tem algumas limitaes. Se o nmero de observaes no for grande relativamente
ao nmero de parmetros a estimar, pode obter-se um R2 elevado pelo simples facto de
haver poucos graus de liberdade na estimao, mesmo que na realidade a relao entre Y
e as variveis explicativas seja fraca. O problema que o coeciente de determinao no
leva em conta os graus de liberdade!
Uma outra limitao, tambm relacionada com a questo dos graus de liberdade tem
a ver com o que acontece quando aumentamos o nmero de variveis explicativas. Se
aumentar o nmero de variveis explicativas o R2 aumenta. Contudo, ao aumentarmos o
nmero de variveis explicativas o nmero de graus de liberdade diminui. Uma medida
que leva em considerao esta perda de graus de liberdade o coeciente de determinao
2
ajustado, R , denido da seguinte forma:
2

R = 1

SSE=(n k 1)
:
SST =(n 1)

Captulo 12

187

Regresso Mltipla

Por ltimo, importante mencionar que a decomposio da variao total em variao


explicada e variao residual no vlida se o modelo no incluir o termo constante, 0.
Consequentemente, neste caso prefervel no usar o R2.
Exemplo 12.2 Considere a regresso estimada do exemplo 12.1. Suponha que a soma
dos quadrados dos resduos e a soma dos quadrados explicada foi:
SSE = 45:9 e SSR = 79:2
Determine e interprete o coeciente de determinao. Encontre o coeciente de determinao ajustado. Encontre um estimador no enviesado da varincia dos resduos.

12.5

Intervalos de conana e teste de hipteses de parmetros individuais

Consideremos o modelo da populao:


Yi = 0 + 1x1i + 2x2i + + k xki + "i , Y = X + "
e admita-se que se vericam as hipteses do OLS apresentadas na seco 12.3. Admita-se
ainda que os erros tm uma distribuio normal multivariada, "i N (0; 2" ), ou em termos
matriciais:
" N(0;2 I):
Se designarmos por b = (b0; b1; ; bk ), o vector de estimadores dos mnimos quadrados, sabemos que:
b = (X0 X)1X0 Y:
Estes estimadores so no enviesados e, nas hipteses enunciadas seguem uma distribuio
normal multivariada:
b N(;2 (X0 X)1)
onde 2 (X0 X)1 deve ser interpretada como a matrix das varincias e covarincias dos estimadores. Na diagonal principal da matriz temos a varincia de cada um dos estimadores,
fora da diagonal principal teremos a covarincia entre os vrios estimadores.

188

Mtodos Quantitativos

Na prtica, como no conhecemos o valor da varincia dos resduos na populao, 2,


teremos que usar um estimador daquele parmetro. J vimos atrs que
Pn 2
e0 e
2
i=1 ei
se =
, s2e =
nk1
n k 1
um estimador no enviesado de 2 .
Por conseguinte, podemos usar o seguinte estimador da matriz das varincias e covarincias de b:
c^o v(b) =s2e (X0 X)1:
Designemos por b0 , b1 , , bk os estimadores dos mnimos quadrados e por sb0 , sb1 , sb2 ,
, sbk os respectivos desvios padres. Nestas circunstncias, a varivel aleatria:
bj j
sbj
segue uma distribuio t-student com n k 1 graus de liberdade.
b
Usando o facto de js b j T(nk1) podemos construir intervalos de conana para o
j
parmetro j , ou fazer testes de hipteses sobre esse parmetro da forma habitual.
Por exemplo, para testar a hiptese nula H 0 : j = 0j contra a alternativa j 6= 0j
para um nvel de signicncia , a regra de deciso :
Rejeitar H0 se

bj j
< t(nk1);=2
sbj

ou se

bj j
> t(nk1);=2 ,
sbj

onde t (nk1);=2 o valor crtico tal que P(T(nk1) > t(nk1);=2 ) = 2 :


Um teste que muito utilizado H0 : j = 0. Repare-se que se a hiptese nula fosse
verdadeira isso signicaria que a varivel xj no inuencia a varivel dependente. Se o
b
valor da estatstica sbj for muito diferente de zero, a hiptese nula ser rejeitada. Por
j
outras palavras, os dados da amostra parecem sugerir que xj importante para explicar
o comportamento da varivel dependente. Quando isto acontece, tambm se diz que a
varivel xj estatisticamente signicativa.
b
importante salientar que o valor da estatstica s bj depende do valor da estimativa
j
bj , mas depende tambm do desvio padro do estimador dos mnimos quadrados, sbj . Se
o estimador for muito preciso (isto , se sbj for muito pequeno) natural que se rejeite a
hiptese nula H0 : j = 0 mesmo que bj tenha um valor prximo de zero.

Captulo 12

189

Regresso Mltipla

Exemplo 12.3 Uma cadeia de hamburguers est a decidir quanto dinheiro deve gastar
em publicidade e se deve ou no dar descontos especiais durante a prxima semana. Para
estudar o efeito destas variveis nas receitas da empresa partiu-se do seguinte modelo
econmico:
R = 0 + 1p + 2 d
onde R representa as receitas durante a semana, p o preo praticado durante a semana e
d as despesas de publicidade durante a semana (as receitas e as despesas so medidas em
milhares de euros e o preo medido em euros). O modelo estatstico associado :
Ri = 0 + 1p i + 2di + "i;
sendo satisfeitas todas as hipteses do teorema de Gauss-Markov e ainda a hiptese de
que os resduos seguem uma distribuio normal multivariada. Este modelo foi estimado usando as observaes das 52 semanas do ano anterior, tendo-se obtido os seguintes
resultados:
b = 104:785 6:6419p + 2:9843d
R
(6:482)

(3:191)

(0:167)

R2 = 0:862

onde os termos entre parnteses so os desvios padres dos estimadores.


Interprete os resultados obtidos. Teste as hipteses (i) H0 : 1 = 0 (H1 : 1 < 0) e (ii)
H 0 : 2 = 0 (H 1 : 2 > 0) para = 5%:

12.6

Teste de hipteses sobre conjuntos de parmetros

Na seco anterior vimos como que podemos realizar teste de hipteses sobre parmetros
individuais. Contudo, pode acontecer que estejamos interessados em testar a hiptese de
que, em simultneo, os parmetros tomam determinados valores.

12.6.1

Teste de aderncia global do modelo

Um caso particular de teste simultneo o teste da hiptese nula de que os coecientes


de regresso associados a cada uma das variveis explicativas so todos iguais a zero, ou
seja:
H0 : 1 = 2 = = k = 0:

190

Mtodos Quantitativos

Se a hiptese nula fosse verdadeira o modelo da populao seria:


Y i = 0 + "i ;
o que signicaria que, tomadas como um grupo, as variveis explicativas no ajudam a
explicar o comportamento da varivel explicada. Por conseguinte, este teste pode ser visto
como um teste aderncia global do modelo que estamos a estimar.
A regra de deciso neste teste baseada na relao entre a variao explicada pela
regresso e a variao residual. Quanto maior for a variao explicada pela regresso
relativamente variao residual, maior a evidncia contra a hiptese nula. Mais concretamente a regra de deciso baseada na estatstica:
F =

SSR
k
SSE
nk1

ou seja, so levados em conta os graus de liberdade associados a cada uma das somas dos
desvios ao quadrado.
Um resultado importante para podermos efectuar o teste o facto de F seguir uma
distribuio F com k graus de liberdade no numerador e n k 1 graus de liberdade no
denominador.
Usando a tabela da F(k;nk1) possvel calcular o valor critco para um nvel de
signicncia . Se o valor da estatstica F for superior a esse valor critco a hiptese nula
rejeitada.
interessante notar que a estatstica F pode ser calculada a partir do coeciente de
determinao:
F=

SSR
k
SSE
nk1

SSR n k 1
SSR
n k 1
R2 n k 1
=
=
:
SSE
k
SST SSR
k
1 R2
k

Tal com R2 a estatstica F um indicador da aderncia global do modelo. Mas a estatstica


F tem a vantagem de nos possibilitar testar a aderncia global em termos estatsticos.
Exemplo 12.4 Considere o modelo estimado no exemplo 12.3 das receitas da cadeia de
hamburguers. Suponha que nesse modelo se obteve SSR = 11776:18, SSE = 1805:17 e
SST = 13581:35. Note-se que esta informao fornecida pela maioria dos softwares de
estatstica, sendo apresentada numa tabela designada por Anlise de Varincia. Calcule o
valor da estatstica F e teste a hiptese nula de que 1 = 2 = 0, para = 5%.

Captulo 12

12.6.2

191

Regresso Mltipla

Teste de um subconjunto de coecientes de regresso

Suponhamos que o modelo que estamos a estimar tem k variveis explicativas e que estamos interessados em testar se k1 (k1 < k) daquelas variveis so ou no, em conjunto,
signicativas.
A hiptese nula que queremos testar :
H0 : 1 = 2 = = k1 = 0:
Se a hiptese nula for verdadeira o modelo da regresso :
Yi = 0 + k1 +1xk1 +1;i + k1 +2xk1 +2;i + + k xk;i + "i;
ou seja s inclu as restante k k1 variveis explicativas e o termo constante. importante
notar que, se estimarmos este modelo, os estimadores obtidos para os k+1k1 coecientes
sero diferentes dos estimadores obtidos quando se incluem na regresso todas as variveis
explicativas. Designemos por SSE a soma dos quadrados dos resduos da regresso que
inclu s as ltimas k k1 variveis explicativas e por SSE a soma dos quadrados dos
resduos da regresso que inclu todas as variveis explicativas.
A ideia do teste, que se a hiptese nula verdadeira SSE e SSE devem divergir
pouco (mas SSE ser sempre inferior ou igual a SSE ). Em concreto, a regra de deciso
baseada na estatstica:
F=

(SSE SSE)
k1
SSE
nk1

Fk1 ;nk1:

Se designarmos por F(k1 ;nk1); o valor critco para um nvel de signicncia , a


hiptese nula rejeitada se:
(SSE SSE)
k1
SSE
nk1

12.6.3

> F(k1;nk1);

Teste de uma combinao linear de parmetros

Por vezes til testar se os coecientes de regresso satisfazem uma determinada restrio
linear. Suponhamos que a hiptese nula a seguinte:
H 0 : c0 0 + c1 1 + + ck k = r , H0 : c0 = r

192

Mtodos Quantitativos

Em geral, alguns dos coecientes ci sero iguais a zero. Tendo em conta a amostra, a
estimativa de c0 c0b :
c0 b = c 0b0 + c 1b1 + + ck bk = b
r

Se c0b estiver prximo de r, a evidncia consistente com a hiptese nula. O teste


estatstico baseado na estatstica
c0br
c0 br
p
r h
=
i
var(c0 b)
c0 s2e (X0X)1 c
que segue uma distribuio T de student com n k 1 graus de liberdade.
Exemplo 12.5 Consideremos a seguinte funo de produo:
Y = AK L
onde Y o output produzido, K a quantidade de capital utilizada e L a quantidade de
trabalho utilizada. A soma + indica-nos se a funo de produo apresenta rendimentos
constantes escala ( + = 1), crescentes escala ( + > 1) ou decrescentes escala
( + < 1).
Suponhamos que o modelo estatstico associado :
Yi = Y = AKi Lie"i
Este modelo pode ser transformado num modelo linear nos parmetros tomando o logaritmo de ambos os termos:
ln Yi = |{z}
ln A + ln K + ln L + "i :

Para testar se a tecnologia apresenta rendimentos constantes escala podemos fazer o


teste da hiptese nula:
2

h
i
6 7
H0 : + = 1 ,
0 1 1 4 5 = 1:

Captulo 12

12.6.4

193

Regresso Mltipla

Teste de vrias combinaes lineares de parmetros

Podemos generalizar os resultados da seco anterior para o caso em que estamos interessados em testar simultaneamente j restries lineares sobre os parmetros. Ou seja a
hiptese nula :
H 0 : C = r
onde C uma matriz de dimenso j (k +1), em que cada linha se refere a uma restrio.
O teste vai ser baseado na diferena Cb r (repare-se que isto corresponde a um vector
de variveis aleatrias). O teste baseado na estatstica F :
h
i1
(Cb r)0 s2e C(X0 X)1C
(Cb r)
F=
j
que segue uma F com j graus de liberdade no numerador e n k 1 graus de liberdade
no denominador.

12.7

Previso

Uma aplicao importante do modelo de regresso mltipla a previso do valor da


varivel dependente, tendo em conta que as variveis explicativas tomam determinados.
Suponhamos que os valores das k variveis explicativas so iguais a x1;n+1 , x2;n+1 , ,
xk;n+1 e que o modelo de regresso mltipla continua a vericar-se, ou seja:
Yn+1 = 0 + 1 x1;n+1 + 2 x2;n+1 + + k x2;n+1 + "n+1, onde E ("n+1) = 0:
Se usarmos os estimadores dos mnimos quadrados dos coecientes da regresso, obtemos
a seguinte estimativa pontual de Yn+1:
Ybn+1 = b0 + b1 x1;n+1 + b2x2;n+1 + + bk xk;n+1 = x0n+1b

Tendo em conta o teorema de Gauss-Markov, sabemos que este o previsor mais eciente
de Yn+1 na classe de estimadores lineares e no enviesados.
Se, em vez de um estimador pontual, estivermos interessados em obter intervalos de
conana para a varivel dependente, necessitamos de estimar a varincia do erro de
previso:
h
i
h
i
var Ybn+1 Yn+1 = 2 1 + x0n+1(X0X)1 xn+1 :
Substituindo 2 pelo estimador s2e camos com estimador da varincia do erro de previso,
e a partir daqui podemos construir intervalos de conana para Ybn+1 .