Você está na página 1de 328

B

Fundamentos da Probabilidade

ste apndice trata dos conceitos-chave de probabilidade bsica. Os Apndices B e C so essen-

E cialmente de recapitulao; eles no pretendem substituir um curso sobre probabilidade ou esta-


tstica. Porm, todos os conceitos sobre probabilidade e estatstica que usamos neste livro so
discutidos nesses apndices.
A probabilidade por si s de interesse dos estudiosos de negcios, economia e outras cincias
sociais. Por exemplo, considere o problema de uma empresa area que esteja tentando decidir quantas
reservas aceitar para um vo com 100 lugares disponveis. Se menos de 100 pessoas quiserem fazer
reservas, ento todas devero ser aceitas. Mas e se mais de 100 pessoas solicitarem reserva? Uma solu-
o segura seria aceitar no mximo 100 reservas. Porm, como algumas pessoas fazem reservas e no
comparecem para o embarque, existe alguma probabilidade de que o avio no lote mesmo que sejam
feitas 100 reservas. Isso resultar em perda de receita para a empresa area. Uma estratgia diferente
seria aceitar mais de 100 reservas e esperar que algumas pessoas no compaream para embarque, e
assim o nmero final de passageiros seria o mais prximo possvel de 100. Essa deciso corre o risco
de a companhia area ter de compensar as pessoas que no puderam embarcar devido venda de um
nmero de assentos maior que o da capacidade do avio.
Uma questo natural nesse contexto : podemos decidir sobre o nmero timo (ou o melhor) de
reservas que a companhia area deveria fazer? Esse no um problema trivial. Contudo, levando-se
em considerao certas informaes (sobre os custos da empresa area e a freqncia das pessoas dei-
xarem de comparecer para o embarque), podemos usar probabilidade bsica para chegar a uma soluo.

B.1 VARIVEIS ALEATRIAS E SUA DISTRIBUIES DE PROBABILIDADE


Suponha que joguemos para o alto uma moeda dez vezes e contemos o nmero de vezes em que d
cara. Esse um exemplo de um experimento. De forma geral, um experimento qualquer procedi-
mento que possa, pelo menos em teoria, ser repetido indefinidamente, e tem um conjunto de resulta-
dos bem definido. Poderamos, em princpio, continuar tirando cara ou coroa repetidamente. Antes de
atirarmos a moeda, sabemos que o nmero de caras que aparecer ser um inteiro entre 0 e 10, e, por-
tanto, os resultados do experimento so bem definidos.
Uma varivel aleatria aquela que assume valores numricos e tem um resultado que deter-
minado por um experimento. No exemplo da moeda, o nmero de caras que aparecer em dez lances
de uma moeda um exemplo de uma varivel aleatria. Antes de atirarmos a moeda dez vezes, no
sabemos quantas vezes vai dar cara. Ao lanarmos a moeda dez vezes e contarmos o nmero de vezes
que deu cara, obteremos o resultado da varivel aleatria para essa particular verificao do experimen-
to. Outra verificao poder produzir um resultado diferente.

21
22 Introduo Econometria Editora Thomson

No exemplo das reservas da empresa area mencionado anteriormente, o nmero de pessoas que
comparece para o embarque uma varivel aleatria: antes de qualquer vo, no sabemos quantas pes-
soas comparecero para embarque.
Para analisar os dados coletados em economia e nas cincias sociais, importante ter-se um conhe-
cimento bsico das variveis aleatrias e de suas propriedades. Seguindo as convenes tradicionais de
probabilidade e estatstica, ao longo dos Apndices B e C, representaremos as variveis aleatrias com
letras maisculas, em geral W, X, Y e Z; os resultados particulares das variveis aleatrias so repre-
sentados pelas minsculas correspondentes, w, x, y e z. Por exemplo, no experimento da moeda, seja X
o nmero de vezes que apareceu cara em dez lances da moeda. Nesse caso, X no est associado com
qualquer valor em particular, mas sabemos que X assumir um valor do conjunto {0, 1, 2, ..., 10}. Um
resultado particular seria, digamos, x  6.
Indicamos colees grandes de variveis aleatrias pelo uso de subscritos. Por exemplo, se
registrarmos a renda do ano passado de 20 famlias escolhidas aleatoriamente nos Estados Unidos,
poderemos representar essas variveis aleatrias por X1, X2, ..., X20; os resultados particulares seriam
representados por x1, x2, ..., x20.
Como afirmado na definio, as variveis aleatrias sempre so estabelecidas para assumir valo-
res numricos, mesmo quando descrevem eventos qualitativos. Por exemplo, considere jogar uma
nica moeda, na qual os dois resultados so cara e coroa. Podemos definir uma varivel aleatria da
seguinte forma: X  1 se der cara, e X  0 se der coroa.
Uma varivel aleatria que somente pode assumir os valores zero e um chamada varivel alea-
tria de Bernoulli (ou binria). Em probabilidade bsica, tradio chamar o evento X  1 de suces-
so e o evento X  0 de fracasso. A nomenclatura sucesso-fracasso pode no corresponder nossa
noo de sucesso e fracasso em determinadas aplicaes, mas uma terminologia til que adotaremos.

Variveis Aleatrias Discretas


Uma varivel aleatria discreta a que somente assume um nmero finito ou infinito enumervel de
valores. A noo de infinito enumervel significa que, embora um nmero infinito de valores possa
ser assumido por uma varivel aleatria, esses valores podem ser postos em uma correspondncia um-
a-um com os nmeros inteiros positivos. Como a distino entre infinito enumervel e infinito no-
enumervel um pouco sutil, nos concentraremos nas variveis aleatrias discretas que assumem
somente um nmero finito de valores. Larsen e Marx (1986, Captulo 3) apresentam uma abordagem
detalhada sobre o assunto.
Uma varivel aleatria de Bernoulli o exemplo mais simples de uma varivel aleatria discreta.
A nica coisa que precisamos para descrever completamente o comportamento de uma varivel alea-
tria de Bernoulli a probabilidade que ela assume no valor um. No exemplo da moeda, se ela for
justa, ento, P(X  1)  1/2 (l-se como a probabilidade de que X seja igual a um de 0,5). Como
a soma das probabilidades deve ser igual unidade, P(X  0)  1/2.
Os cientistas sociais esto interessados em mais do que cara ou coroa, e, portanto, devemos con-
siderar situaes mais gerais. Novamente, considere o exemplo em que a empresa area tem de deci-
dir quantas reservas aceitar para um vo com 100 lugares disponveis. Esse problema pode ser anali-
sado no contexto de diversas variveis aleatrias de Bernoulli da seguinte maneira: para um passageiro
selecionado aleatoriamente, defina uma varivel aleatria de Bernoulli como X  1 se a pessoa apare-
cer para embarque, e X  0 se no aparecer.
No h nenhuma razo para pensar que a probabilidade de qualquer passageiro em particular com-
parecer para embarque ser 1/2; em princpio, a probabilidade pode ser qualquer nmero entre zero e
um. Chame esse nmero , de forma que
Wooldridge Apndice B Fundamentos da Probabilidade 23

P(X  1)   (B.1)

P(X  0)  1  . (B.2)

Por exemplo, se   0,75, existir 75% de probabilidade de que um passageiro aparea para o embar-
que aps ter feito a reserva e 25% de probabilidade de que o passageiro no aparea. Intuitivamente, o
valor de  fundamental para determinar a estratgia da companhia area quanto aceitao de reser-
vas. Os mtodos para estimar , considerando os dados histricos de reservas das companhias areas,
so tpicos de estatstica matemtica, que veremos no Apndice C.
De forma mais geral, qualquer varivel aleatria discreta completamente descrita listando seus
possveis valores e a probabilidade associada que ela assume para cada valor. Se X assumir os k poss-
veis valores {x1, ..., xk}, as probabilidades p1, p2, ..., pk sero definidas por

pj  P(X  xj), j  1, 2, ..., k, (B.3)

onde cada pj estar entre zero e um e

p1  p2  ...  pk  1. (B.4)

A equao (B.3) lida como: A probabilidade de X assumir o valor xj igual a pj.


As equaes (B.1) e (B.2) mostram que as probabilidades de sucesso e fracasso de uma varivel
aleatria de Bernoulli so determinadas inteiramente pelo valor de . Como as variveis aleatrias de
Bernoulli so to freqentes, temos uma notao especial para elas: X  Bernoulli() lida como X
tem uma distribuio de Bernoulli com probabilidade de sucesso igual a .
A funo densidade de probabilidade (fdp) de X resume as informaes relativas aos possveis
resultados de X e as probabilidades correspondentes:

f(xj)  pj, j  1, 2, ..., k, (B.5)

com f(x)  0 de qualquer x no igual a xj para algum j. Em outras palavras, para qualquer nmero real
x, f(x) ser a probabilidade que a varivel aleatria X assumir para o valor particular de x. Quando lida-
mos com mais de uma varivel aleatria, algumas vezes til subscrever a fdp em questo: fX a fdp
de X, fY a fdp de Y, e assim por diante.
Dada a fdp de qualquer varivel aleatria discreta, simples calcular a probabilidade de qualquer
evento envolvendo aquela varivel aleatria. Por exemplo, suponha que X seja o nmero de pontos fei-
tos por um jogador de basquetebol a cada dois lances livres, de forma que X pode assumir os trs valo-
res {0,1,2}. Assuma que a fdp de X seja dada por

f(0)  0,20, f(1)  0,44, e f(2)  0,36.

A soma das trs probabilidades igual a um, como deveria ser. Usando essa fdp, podemos calcu-
lar a probabilidade de que o jogador converta pelo menos um lance livre: P(X  1)  P(X  1)  P(X
 2)  0,44  0,36  0,80. A fdp de X mostrada na Figura B.1.
24 Introduo Econometria Editora Thomson

Figura B.1
A fdp do nmero de lances livres convertidos a cada duas tentativas.

f(x)

0,44

0,36

0,20

0 1 2 x

Variveis Aleatrias Contnuas


Uma varivel X ser uma varivel aleatria contnua se assumir qualquer valor real com probabili-
dade zero. Essa definio um tanto quanto contra-intuitiva, j que em qualquer aplicao acabaremos
observando algum resultado para uma varivel aleatria. A idia que uma varivel aleatria contnua
X pode assumir tantos valores possveis que no podemos enumer-los ou compar-los com os intei-
ros positivos, de modo que a consistncia lgica garante que X pode assumir cada valor com probabi-
lidade zero. Embora as medidas sejam sempre discretas na prtica, as variveis aleatrias que assumem
numerosos valores so melhor tratadas como contnuas. Por exemplo, a medida mais refinada do preo
de um bem em termos de centavos. Podemos nos imaginar relacionando todos os possveis valores de
preos ordenadamente (mesmo que a lista possa continuar indefinidamente), o que tecnicamente faz
com que preo seja uma varivel aleatria discreta. Porm, existem tantos valores possveis de preos
que o uso da mecnica das variveis aleatrias discretas no vivel.
Podemos definir uma funo densidade de probabilidade para variveis aleatrias contnuas, e,
como acontece com as variveis aleatrias discretas, a fdp fornecer informaes sobre os provveis
resultados da varivel aleatria. Porm, como tambm no faz sentido discutir a probabilidade de que
uma varivel aleatria contnua assuma um valor em particular, usamos a fdp de uma varivel aleat-
ria contnua somente para computar eventos envolvendo uma diversidade de valores. Por exemplo, se
a e b forem constantes onde a  b, a probabilidade de X estar entre os nmeros a e b, P(a  X  b),
ser a rea sob a fdp entre os pontos a e b, como mostrado na Figura B.2. Se voc estiver familiariza-
do com clculo diferencial, voc reconhecer isso como a integral da funo f entre os pontos a e b. A
rea total sob a fdp deve sempre ser igual a um.
Wooldridge Apndice B Fundamentos da Probabilidade 25

Figura B.2
A probabilidade que X esteja entre os pontos a e b.

f(x)

a b x

Ao computar probabilidades para variveis aleatrias contnuas, mais fcil trabalhar com a fun-
o de distribuio cumulativa (fdc). Se X for qualquer varivel aleatria, ento, sua fdc ser defini-
da por qualquer numero x real pela equao

F(x)  P(X  x). (B.6)

Para variveis aleatrias discretas, (B.6) ser obtida somando a fdp para todos os valores xj tais que
xj  x. Para uma varivel aleatria contnua, F(x) ser a rea sob a fdp, f, esquerda do ponto x. Como
F(x) simplesmente uma probabilidade, ela estar sempre entre 0 e 1. Alm disso, se x1  x2, ento,
P(X  x1)  P(X  x2), isto , F(x1)  F(x2). Isso significa que uma fdc uma funo crescente (ou
pelo menos no-decrescente) de x.
Duas propriedades importantes das fdcs que so teis no clculo de probabilidades so as seguintes:

Para qualquer nmero c, P(X  c)  1  F(c). (B.7)

Para quaisquer nmeros a  b, P(a  X  b)  F(b)  F(a). (B.8)


26 Introduo Econometria Editora Thomson

Em nosso estudo da econometria, usaremos as fdcs para calcular probabilidades somente de variveis
aleatrias contnuas, caso em que no importa se as desigualdades nas especificaes probabilsticas
so estritas ou no. Ou seja, para uma varivel aleatria contnua X,

P(X  c)  P(X  c) (B.9)

P(a  X  b)  P(a  X  b)  P(a  X  b)  P(a  X  b). (B.10)

Combinadas com (B.7) e (B.8), as equaes (B.9) e (B.10) expandem bastante os clculos de probabi-
lidade que podem ser feitos com o uso de fdcs contnuas.
As funes de distribuies cumulativas foram tabuladas para todas as distribuies contnuas
importantes em probabilidade e estatstica. A mais conhecida delas a distribuio normal, da qual tra-
taremos com algumas distribuies relacionadas na Seo B.5

B.2 DISTRIBUIES CONJUNTAS, DISTRIBUIES CONDICIONAIS E


INDEPENDNCIA
Em economia, geralmente estamos interessados na ocorrncia de eventos que envolvem mais de uma
varivel aleatria. No exemplo das reservas da companhia area anteriormente referido, esta pode estar
interessada na probabilidade de que uma pessoa que faz uma reserva comparea para embarque e que
seja uma pessoa que viaje a negcios; esse um exemplo de uma probabilidade conjunta. Ou a empresa
area pode estar interessada na seguinte probabilidade condicional: condicional pessoa ser uma pes-
soa que viaje a negcios, qual a probabilidade de que ela comparea para embarque? Nas prximas
duas subsees, formalizaremos a noo de distribuies conjunta e condicional e a importante noo
de independncia das variveis aleatrias.

Distribuies Conjuntas e Independncia


Sejam X e Y variveis aleatrias discretas. Ento, (X,Y) tm uma distribuio conjunta, que total-
mente definida pela funo densidade de probabilidade conjunta de (X,Y):

fX,Y (x,y)  P(X  x,Y  y), (B.11)

onde o lado direito a probabilidade de que X  x e Y  y. Quando X e Y so contnuas, uma fdp con-
junta tambm pode ser definida, mas no trataremos de tais detalhes, pois fdps conjuntas de variveis
aleatrias contnuas no so explicitamente usadas neste livro.
Em um caso, fcil obter a fdp conjunta se forem dadas as fdps de X e Y. Em particular, as vari-
veis aleatrias X e Y so independentes se, e somente se,

fX,Y (x,y)  fX(x)fy(y) (B.12)


Wooldridge Apndice B Fundamentos da Probabilidade 27

para todos os x e y, quando fX for a fdp de X e fY for a fdp de Y. No contexto de mais de uma varivel
aleatria, as fdps fX e fY so freqentemente chamadas funes de densidade de probabilidade margi-
nal para distingui-las da fdp conjunta fX,Y. Essa definio de independncia vlida para variveis alea-
trias discretas e contnuas.
Para entendermos o significado de (B.12) mais fcil lidar com o caso discreto. Se X e Y forem
discretas, ento, (B.12) ser a mesma coisa que

P(X  x,Y  y)  P(X  x)P(Y  y); (B.13)

em outras palavras, a probabilidade de que X  x e Y  y o produto das duas probabilidades P(X  x)


e P(Y  y). Uma implicao de (B.13) que as probabilidades conjuntas so razoavelmente fceis de
serem calculadas, j que elas apenas exigem o conhecimento de P(X  x) e P(Y  y).
Se as variveis aleatrias no forem independentes, ento, elas so dependentes.

EXEMPLO B.1
(Arremessos de Lances Livres)
Considere um jogador de basquetebol fazendo dois lances livres. Seja X uma varivel aleatria de Bernoulli
igual a um se ele converter o primeiro arremesso, e zero, caso contrrio. Seja Y uma varivel aleatria de
Bernoulli igual a um se ele converter o segundo arremesso. Suponha que ele seja um jogador que converte
80% dos arremessos, de forma que P(X  1)  P(Y  1)  0,8. Qual a probabilidade de o jogador con-
verter os dois arremessos?
Se X e Y forem independentes, podemos facilmente responder a essa pergunta: P(X  1, Y  1) 
P(X  1)( P(Y  1)  (0,8)(0,8)  0,64. Portanto, existe 64% de probabilidade de converter ambos os lan-
ces livres. Se a probabilidade de converter o segundo arremesso depender de o primeiro arremesso ter sido
convertido isto , X e Y no so independentes ento, esse clculo simples no ser vlido.

A independncia de variveis aleatrias um conceito muito importante. Na prxima subseo,


mostraremos que, se X e Y forem independentes, conhecer resultado de X no altera as probabilidades
dos possveis resultados de Y, e vice-versa. Um fato til sobre a questo da independncia que se X
e Y forem independentes e definirmos novas variveis aleatrias g(X) e h(Y) para quaisquer funes g
e h, ento, essas novas variveis aleatrias tambm sero independentes.
No h necessidade de parar em duas variveis aleatrias. Se X1, X2, ..., Xn forem variveis alea-
trias discretas, ento, suas fdps conjuntas sero f(x1, x2, ..., xn)  P(X1  x1, X2  x2, ..., Xn  xn). As
variveis aleatrias X1, X2, ..., Xn sero variveis aleatrias independentes se, e somente se, suas fdps
conjuntas forem o produto das fdps individuais para quaisquer (x1, x2, ..., xn). Essa definio de inde-
pendncia tambm vlida para variveis aleatrias contnuas.
A noo de independncia desempenha um papel importante na obteno de algumas distribuies
clssicas em probabilidade e estatstica. Anteriormente, definimos uma varivel aleatria de Bernoulli
como uma varivel aleatria zero-um indicando se ocorre algum evento ou no. Freqentemente, esta-
mos interessados no nmero de sucessos em uma seqncia de ensaios de Bernoulli independentes.
Um exemplo padro de ensaios de Bernoulli independentes jogar repetidamente uma moeda.
Como o resultado de qualquer lance particular no tem nada a ver com os resultados dos outros lan-
ces, a independncia uma hiptese apropriada.
28 Introduo Econometria Editora Thomson

A independncia muitas vezes uma aproximao razovel em situaes mais complicadas. No


exemplo das reservas da companhia area, suponha que a companhia aceite n reservas para determinado
vo. De cada i  1, 2, ..., n, seja Y a varivel aleatria de Bernoulli indicando se o passageiro i apare-
ce para embarque: Yi  1 se o passageiro i aparecer para embarque, e Yi  0, caso contrrio. Definindo
 novamente como a probabilidade de sucesso (usando as reservas), cada Yi ter uma distribuio de
Bernoulli (). Como uma aproximao, podemos assumir que os Yi so independentes entre si, embora
isso no seja exatamente verdadeiro na realidade: algumas pessoas viajam em grupo, o que significa
que se uma pessoa comparecer ou no para embarque no verdadeiramente independente de se as
outras pessoas comparecero ou no. Porm, modelar esse tipo de dependncia complexo, de modo
que podemos querer usar a independncia como uma aproximao.
A varivel de interesse principal o nmero total de passageiros que comparecem para embarque
das n reservas; chamemos essa varivel de X. Como cada Yi ser igual unidade quando uma pessoa
comparece para embarque, podemos escrever X  Yi  Y2  ...  Yn. Agora, assumindo que cada Yi
tem probabilidade de sucesso e que os Yi so independentes, possvel mostrar que X tem uma dis-
tribuio binomial. Isto , a funo densidade de probabilidade de X

f(x)  nxu (1  u)
x nx
, x  0, 1, 2, ..., n, (B.14)

onde nx  x!(nn! x)!, e para qualquer inteiro n, n! (l-se fatorial de n) definido como n!  n 
(n  1) (n  2)...1. Por conveno, 0!  1. Quando uma varivel aleatria X tem a fdp dada em (B.14),
escrevemos X  Binomial(n,). A equao (B.14) pode ser usada para calcular P(X  x) para qualquer
valor de x de 0 a n.
Se o vo tiver 100 lugares disponveis, a empresa area estar interessada em P(X  100).
Suponha, inicialmente, que n  120, de modo que a companhia area aceitar 120 reservas, e que a
probabilidade de que cada pessoa comparea para embarque seja   0,85. Ento, P(X  100)  P(X
 101)  P(X  102)  ...  P(X  120), e cada uma das probabilidades na soma poder ser encon-
trada pela equao (B.14) com n  120,   0,85 e o valor apropriado de x (101 a 120). Esse um
clculo difcil de ser feito manualmente, mas muitos programas estatsticos possuem comandos para
computar esse tipo de probabilidade. Nesse caso, a probabilidade de que mais de 100 pessoas compa-
recero para embarque cerca de 0,659, o que provavelmente um risco de excesso de reservas maior
do que a companhia area deseja tolerar. Se, em vez disso, o nmero de reservas for 110, a probabili-
dade de que mais de 100 pessoas comparecero para embarque ser de apenas 0,024.

Distribuies Condicionais
Em econometria, geralmente estamos interessados em como uma varivel aleatria, vamos cham-la
Y, est relacionada com uma ou mais das outras variveis. Por enquanto, suponha que haja somente
uma varivel em cujos efeitos estamos interessados, vamos cham-la X. O mximo que podemos saber
sobre como X afeta Y est contido na distribuio condicional da Y, dado X. Essa informao resu-
mida pela funo de densidade de probabilidade condicional, definida por

fY | X(y | x)  fX,Y(x,y)/fX(x) (B.15)


Wooldridge Apndice B Fundamentos da Probabilidade 29

para todos os valores de x de tal forma que fX(x)  0. A interpretao de (B.15) mais fcil de ser vista
quando X e Y so discretas. Ento,

fY | X(y | x)  P(Y  y|X  x), (B.16)

onde o lado direito lido como a probabilidade de Y  y em decorrncia de X  x. Quando Y


contnuo, fY | X(y | x) no interpretada diretamente como uma probabilidade, pelas razes explica-
das anteriormente, mas as probabilidades condicionais so encontradas computando reas sob a fdp
condicional.
Uma caracterstica importante das distribuies condicionais que, se X e Y forem variveis alea-
trias independentes, o conhecimento dos valores assumidos por X no nos diz nada sobre a probabi-
lidade de que Y assuma diversos valores (e vice-versa). Isto , fY | X(y|x)  fY(y) e fX | Y(x|y)  fX(x).

EXEMPLO B.2
(Arremessos de Lances Livres)
Considere novamente o exemplo dos lances livres no basquetebol, quando dois lances livres devem ser ten-
tados. Assuma que a densidade condicional seja

fY | X(1|1)  0,85, fY | X(0|1)  0,15


fY | X(1|0)  0,70, fY | X(0|0)  0,30.

Isso significa que a probabilidade de o jogador converter o segundo lance depende de o primeiro lance ter
sido convertido: se o primeiro lance foi convertido, a probabilidade de converter o segundo lance de 0,85;
se o primeiro lance foi perdido, a probabilidade de converter o segundo lance de 0,70. Isso implica que X
e Y no so independentes; eles so dependentes.
Ainda podemos computar P(X  1, Y  1) desde que conheamos P(X  1). Assuma que a probabi-
lidade de converter o primeiro lance livre seja 0,8, isto , P(X  1)  0,8. Ento, de (B.15), teremos

P(X  1,Y  1)  P(Y  1|X  1)P(X  1)  (0,85)(0,8)  0,68.

B.3 CARACTERSTICAS DAS DISTRIBUIES DE PROBABILIDADE


Para muitos propsitos, estaremos interessados em somente alguns poucos aspectos das distribuies
das variveis aleatrias. As caractersticas de interesse podem ser classificadas em trs categorias:
medidas de tendncia central, medidas de variabilidade ou intervalo e medidas de associao entre duas
variveis aleatrias. Trataremos desta ltima na Seo B.4.

Uma Medida de Tendncia Central: O Valor Esperado


O valor esperado um dos mais importantes conceitos da probabilidade que encontraremos em nosso
estudo da econometria. Se X for uma varivel aleatria, o valor esperado (ou esperana) de X, represen-
tado por E(X) e algumas vezes por X, ou simplesmente , uma mdia ponderada de todos os possveis
30 Introduo Econometria Editora Thomson

valores de X. Os pesos so determinados pela funo de densidade de probabilidade. Algumas vezes,


o valor esperado chamado mdia populacional, especialmente quando queremos enfatizar que X
representa alguma varivel em uma populao.
A definio precisa do valor esperado mais simples no caso em que X uma varivel aleatria
discreta assumindo um nmero finito de valores, digamos, {x1, ..., xk). Seja f(x) a funo de densidade
de probabilidade de X. O valor esperado de X ser a mdia ponderada

k
E(X)  x1 f(x1)  x2 f(x2)  ...  xk f(xk)  x
j1
j f(xj) (B.17)

Essa expresso facilmente calculada dados os valores da fdp de cada possvel resultado de X.

EXEMPLO B.3
(Calculando um Valor Esperado)
Suponha que X assuma os valores 1, 0 e 2 com probabilidades 1/8, 1/2 e 3/8, respectivamente. Ento,

E(X)  (1)  (1/8)  0  (1/2)  2  (3/8)  5/8.

Esse exemplo ilustra uma coisa curiosa sobre os valores esperados: o valor esperado de X pode
ser um nmero que no sequer um possvel resultado de X. Sabemos que X assume os valores 1, 0
e 2, ainda que seu valor esperado seja 5/8. Isso torna o valor esperado deficiente para resumir a ten-
dncia central de certas variveis aleatrias discretas, mas clculos como o que acabamos de mostrar
podem ser teis, como veremos mais tarde.
Se X for uma varivel aleatria contnua, ento, E(X) ser definido como uma integral:

 x f(x)dx,

E(X)  (B.18)


que assumimos como bem definida. Isso ainda pode ser interpretado como uma mdia ponderada. Para
as distribuies contnuas mais comuns, E(X) um nmero que um possvel resultado de X. Neste
livro, no precisaremos calcular valores esperados usando integrao, embora utilizemos de alguns
resultados bem conhecidos de probabilidade de valores esperados de variveis aleatrias especiais.
Dada uma varivel aleatria X e uma funo g(), podemos criar uma nova varivel aleatria g(X).
Por exemplo, se X for uma varivel aleatria, ento, X2 e log(X) (se X  0) tambm sero variveis
aleatrias. O valor esperado de g(X) ser, de novo, simplesmente uma mdia ponderada:

k
E[g(X)]  
j1
g(xj)fX (xj) (B.19)

ou, para uma varivel aleatria contnua,


Wooldridge Apndice B Fundamentos da Probabilidade 31

 g(x) f (x)dx.

E[g(X)]  X (B.20)


EXEMPLO B.4

(Valor Esperado de X2)


Para a varivel aleatria no Exemplo B.3, seja g(X)  X2. Ento,

E(X2)  (1)2(1/8)  (0)2(1/2)  (2)2(3/8)  13/8.

No Exemplo B.3, calculamos E(X)  5/8, de forma que [E(X)]2  25/64. Isso mostra que E(X2)
no o mesmo que [E(X)]2. De fato, para uma funo no-linear g(X), E[g(X)]  g[E(X)] (exceto em
casos muito especiais).
Se X e Y forem variveis aleatrias, ento, g(X,Y) ser uma varivel aleatria para qualquer fun-
o g, e assim poderemos definir sua esperana. Quando X e Y so ambas discretas, assumindo os valo-
res {x1, x2, ..., xk} e {y1, y2, ..., ym}, respectivamente, o valor esperado ser
k m
E[g(X, Y)]    g(xh,yj) fX,Y(xh,yj),
h1 j1

onde fX,Y ser a fdp conjunta de (X,Y). A definio mais complicada para variveis aleatrias cont-
nuas, pois envolve integrao; no precisamos dela aqui. A extenso para mais de duas variveis alea-
trias fcil de ser feita.

Propriedades dos Valores Esperados


Em econometria, no nos preocupamos muito em calcular os valores esperados de diversas distribui-
es; os clculos principais j foram feitos muitas vezes, e em grande parte os aceitaremos sem ques-
tionar. Teremos que manipular alguns valores esperados usando umas poucas regras simples. Elas so
to importantes que as rotulamos:

PROPRIEDADE E.1
Para qualquer constante c, E(c)  c.

PROPRIEDADE E.2
Para quaisquer constantes a e b, E(aX  b)  aE(X)  b.

Uma implicao til de E.2 que, se   E(X), e definirmos uma nova varivel aleatria como Y 
X  , ento, E(Y)  0; em E.2, considere a  1 e b   .
Como um exemplo da propriedade E.2, seja X a temperatura medida em graus Celsius, ao meio dia
de determinado dia, em determinada localidade; suponha que a temperatura esperada seja E(X)  25.
Se Y for a temperatura medida em graus Fahrenheit, ento, Y  32  (9/5)X. Pela propriedade E.2, a
temperatura esperada em Fahrenheit ser E(Y)  32  (9/5)E(X)  32  (9/5)25  77.
De forma geral, fcil calcular o valor esperado de uma funo linear de diversas variveis
aleatrias.
32 Introduo Econometria Editora Thomson

PROPRIEDADE E.3
Se {a1, a2, ..., an} forem constantes e {X1, X2, ..., Xn} forem variveis aleatrias, ento,

E(a1X1  a2X2  ...  anXn)  a1E(X1)  a2E(X2)  ...  anE(Xn).

Ou, usando a notao de somatrios,

n n
E(  aiXi)   aiE(Xi).
i1 i1
(B.21)

Como um caso especial dessa equao, temos (com cada a1  1)

n n
E(  Xi)   E(Xi),
i1 i1
(B.22)

de forma que o valor esperado da soma ser a soma dos valores esperados. Essa propriedade usada
com freqncia para derivaes em estatstica matemtica.

EXEMPLO B.5
(Encontrando a Receita Esperada)
Sejam X1, X2 e X3 os nmeros de pizzas pequenas, mdias e grandes, respectivamente, vendidas durante o dia
em uma pizzaria. Elas so variveis aleatrias com valores esperados E(X1)  25, E(X2)  57 e E(X3)  40.
Os preos das pizzas pequena, mdia e grande so 5,50, 7,60 e 9,15 (em dlares). Portanto, a receita espe-
rada das vendas de pizzas em determinado dia ser

E(5,50 X1  7,60 X2  9,15 X3)  5,50 E(X1)  7,60 E(X2)  9,15 E(X3)
 5,50(25) 7,60(57)  9,15(40)  936,70,

isto , 936,70 dlares. A receita efetiva de qualquer dia particular geralmente ser diferente desse valor, mas
essa a receita esperada.

Tambm podemos usar a Propriedade E.3 para mostrar que se X  Binomial(n,), ento, E(X) 
n. Ou seja, o nmero esperado de sucessos em n ensaios de Bernoulli simplesmente o nmero de
ensaios vezes a probabilidade de sucesso de qualquer ensaio particular. Isso ser facilmente observado
escrevendo X como X  Y1  Y2  ... Yn, onde cada Yi  Bernoulli(). Ento,

n n
E(X)   E(Yi)     n.
i1 i1

Podemos aplicar esse resultado no exemplo das reservas da companhia area, quando ela aceita
n  120 reservas, e a probabilidade de comparecimento para embarque   0,85. O nmero esperado
de pessoas comparecendo para embarque 120(0,85)  102. Portanto, se h 100 lugares disponveis,
Wooldridge Apndice B Fundamentos da Probabilidade 33

o nmero esperado de pessoas que comparecero para embarque grande demais; isso ter alguma
influncia na concluso de ser uma boa idia a companhia aceitar 120 reservas.
Na realidade, o que a companhia area poderia fazer seria definir uma funo do lucro que con-
siderasse a receita ganha por lugar vendido e o custo por passageiro que seja impedido de embarcar.
Essa funo do lucro ser aleatria, pois o nmero efetivo de pessoas que comparecero para embar-
que aleatrio. Seja r a receita lquida correspondente a cada passageiro. (Para simplificar, voc pode
pensar nisso como sendo o preo da passagem). Seja i a indenizao devida a cada passageiro que no
puder embarcar. Nem r nem i so aleatrios; eles so assumidos como conhecidos pela companhia
area. Seja Y o lucro do vo. Ento, com 100 lugares disponveis,

Y  rX se X  100
 100r  i(X  100) se X  100.

A primeira equao mostra o lucro se no mais que 100 pessoas comparecerem para embarque; a segun-
da equao o lucro se mais de 100 pessoas comparecerem para embarque. (Nesse ltimo caso, a recei-
ta lquida da venda de passagens 100r, pois foram vendidos todos os 100 lugares, e, ento, i(X  100)
o custo de aceitar mais de 100 reservas). Usando o fato de que X tem uma distribuio Binomial
(n,0,85), onde n o nmero de reservas feitas, os lucros esperados, E(Y) podero ser encontrados como
uma funo de n (e r e i). Calcular E(Y) diretamente seria muito difcil, mas poder ser encontrado rapi-
damente usando-se um computador. Uma vez os valores de r e i tenham sido dados, o valor de n que
maximiza os lucros esperados poder ser encontrado pesquisando-se diferentes valores de n.

Outra Medida de Tendncia Central: A Mediana


O valor esperado somente uma possibilidade para definir a tendncia central de uma varivel aleat-
ria. Outra medida de tendncia central a mediana. Uma definio geral de mediana complicada
demais para nosso propsito. Se X for uma varivel contnua, ento, a mediana de X, digamos m, ser
um valor tal que metade da rea de uma fdp est esquerda de m, e a outra metade est direita de m.
Quando X for uma varivel discreta e assumir um nmero mpar finito de valores, a mediada ser
obtida ordenando-se os possveis valores de X e ento selecionando-se o valor que estiver no centro.
Por exemplo, se X assumir os valores {4,0,2,8,10,13,17}, ento, o valor mediano de X ser 8. Se X
assumir um nmero par de valores, existiro, na realidade, dois valores medianos; algumas vezes cal-
cula-se a mdia desses nmeros para obter um nico valor mediano. Assim, se X assumir os valores
{5,3,9,17}, os valores medianos sero 3 e 9; se calcularmos a mdia desses nmeros obteremos uma
mediana igual a 6.
Em geral, a mediana, algumas vezes indicada por Med(X), e o valor esperado E(X), so diferen-
tes. Nenhum melhor que o outro como uma medida de tendncia central; ambos so maneiras vli-
das de indicar o centro da distribuio de X. Em um caso especial, a mediana e o valor esperado (ou
mdia) so os mesmos. Se X tiver uma distribuio simtrica em torno do valor , ento,  ser tanto
o valor esperado como a mediana. Matematicamente, a condio ser f(  x)  f(  x) para todo x.
Esse caso est ilustrado na Figura B.3.

Medidas de Variabilidade: Varincia e Desvio-Padro


Embora a tendncia central de uma varivel aleatria seja valiosa, ela no nos diz tudo que queremos
saber sobre a distribuio de uma varivel aleatria. A Figura B.4 mostra as fdp de duas variveis alea-
trias com a mesma mdia. Claramente, a distribuio de X mais concentrada em relao sua mdia
que a distribuio de Y. Gostaramos de ter uma maneira simples de resumir isso.
34 Introduo Econometria Editora Thomson

Figura B.3
Uma distribuio de probabilidade simtrica.

f(x)

Varincia
Para uma varivel aleatria X, seja   E(X). H vrias maneiras de medir o quanto X est distante de
seu valor esperado, mas a mais simples de trabalhar algebricamente a diferena elevada ao quadrado,
(X  )2. (A elevao ao quadrado serve para eliminar o sinal da medida da distncia; o valor positi-
vo resultante corresponde nossa noo intuitiva de distncia.) Essa distncia em si uma varivel
aleatria, j que ela pode mudar a cada resultado de X. Da mesma forma que precisamos de um nme-
ro para resumir a tendncia central de X, precisamos de um nmero que nos informe o quanto X est
distante de , em mdia. Um desses nmeros a varincia, que nos informa a distncia esperada de
X at sua mdia:

Var(X)  E(X  )2]. (B.23)

A varincia algumas vezes representada por 2x, ou simplesmente 2, quando o contexto claro. De
(B.3), deduz-se que a varincia sempre no-negativa.
Como um instrumento computacional, interessante observar que
Wooldridge Apndice B Fundamentos da Probabilidade 35

Figura B.4
Variveis aleatrias com a mesma mdia, mas com distribuies diferentes.

fdp

fX

fY


X,Y

2  E(X2  2X  2)  E(X2)  22  2  E(X2)  2. (B.24)

Usando (B.23) ou (B.24), no precisamos fazer a distino entre variveis aleatrias discretas e cont-
nuas: a definio de varincia a mesma em qualquer dos casos. Na maioria da vezes, primeiro calcu-
lamos E(X), depois E(X2), e, ento, usamos a frmula de (B.4). Por exemplo, se X  Bernoulli(),
ento, E(X)  , e como X2  X, E(X2)  . Deduz-se da equao (B.24) que Var(X)  E(X2) 2 
  2  (1  ).
So apresentadas a seguir duas importantes propriedades da varincia.

PROPRIEDADE VAR.1
Var(X)  0 se, e somente se, houver uma constante c, de tal forma que P(X  c)  1, em cujo caso,
E(X)  c.

Essa primeira propriedade diz que a varincia de qualquer constante zero, e se uma varivel aleat-
ria tiver varincia zero, ento, ela ser essencialmente constante.

PROPRIEDADE VAR.2
Para quaisquer constantes a e b, Var(aX  b)  a2Var(X).
36 Introduo Econometria Editora Thomson

Isso significa que a adio de uma constante a uma varivel aleatria no altera a varincia, mas a mul-
tiplicao de uma varivel aleatria por uma constante aumenta a varincia por um fator igual ao qua-
drado daquela constante. Por exemplo, se X representar a temperatura em graus Celsius e Y  32 
(9/5)X for a temperatura em graus Fahrenheit, ento, Var(Y)  (9/5)2Var(X)  (81/25)Var(X).

Desvio-Padro
O desvio-padro de uma varivel aleatria, representado por dp(X), simplesmente a raiz quadrada
positiva da varincia: dp(X)  Var(X). O desvio-padro algumas vezes representado por x, ou
simplesmente , quando a varivel aleatria entendida. Duas propriedades do desvio-padro resul-
tam das propriedades VAR.1 e VAR.2.

PROPRIEDADE DP.1
Para qualquer constante c, dp(c)  0.

PROPRIEDADE DP.2
Para quaisquer constantes a e b,

dp(aX  b)  |a|dp(X).

Em particular, se a  0, ento, dp(aX)  a  dp(X).

Essa ltima propriedade faz com que seja mais natural trabalhar com o desvio-padro do que com
a varincia. Por exemplo, suponha que X seja uma varivel aleatria medida em milhares de dlares, diga-
mos renda. Se definirmos Y  1.000X, ento, Y ser a renda medida em dlares. Suponha que E(X)  20
e dp(X)  6. Ento, E(Y)  1,000E(X)  20.000 e dp(Y)  1.000dp(X)  6.000, de forma que o valor
esperado e o desvio-padro crescem pelo mesmo fator, 1.000. Se tivssemos trabalhado com a varincia,
teramos Var(Y)  (1.000)2Var(X), de forma que a varincia de Y um milho de vezes maior que a
varincia de X.

Padronizando uma Varivel Aleatria


Como uma aplicao das propriedades da varincia e do desvio-padro e um tpico de interesse pr-
tico por si mesmo suponha que, dada uma varivel aleatria X, definamos uma nova varivel alea-
tria subtraindo sua mdia  e dividindo o resultado por seu desvio-padro :

Xm
Z s , (B.25)

que podemos escrever como Z  aX  b, onde a (1/) e b (/). Ento, de acordo com a pro-
priedade E.2,

E(Z)  aE(X)  b  (/)  (/)  0.

Da propriedade Var.2,
Wooldridge Apndice B Fundamentos da Probabilidade 37

Var(Z)  a2Var(X)  (2/2)  1.

Portanto, a varivel aleatria Z tem uma mdia zero e uma varincia (e portanto um desvio-padro)
igual a um. Esse procedimento algumas vezes referido como padronizao da varivel aleatria X, e
Z chamado uma varivel aleatria padronizada. (Em cursos introdutrios de estatstica, ele algu-
mas vezes chamado de transformao-z de X). importante lembrar que o desvio-padro, no a
varincia, aparece no denominador de (B.25). Como veremos, essa transformao freqentemente
utilizada na inferncia estatstica.
Como um exemplo especfico, suponha que E(X)  2 e Var(X)  9. Ento, Z  (X  2)/3 ter um
valor esperado igual a zero e varincia igual a um.

B.4 CARACTERSTICAS DAS DISTRIBUIES CONJUNTAS E


CONDICIONAIS

Medidas de Associao: Covarincia e Correlao


Embora a fdp conjunta de duas variveis aleatrias descreva completamente a relao entre elas,
til ter medidas resumidas de como, em mdia, duas variveis aleatrias variam entre si. Como acon-
tece com o valor esperado e a varincia, isso semelhante ao usar um nico nmero para resumir
alguma coisa de uma distribuio inteira, que, nesse caso, uma distribuio conjunta de duas vari-
veis aleatrias.

Covarincia
Seja X  E(X), e Y  E(Y), e considere a varivel aleatria (X  X)(Y  Y). Agora, se X e Y esti-
veram acima de suas respectivas mdias, ento, (X  X)(Y  Y)  0. Isso tambm ser verdadeiro
se X  X e Y  Y. Por outro lado, se X  X e Y  Y, ou vice-versa, ento, (X  X)(Y  Y)  0.
Como, ento, esse produto poder nos dar qualquer informao sobre a relao entre X e Y?
A covarincia entre duas variveis aleatrias X e Y, algumas vezes chamada a covarincia popu-
lacional para enfatizar que ela se refere relao entre duas variveis descrevendo uma populao,
definida como o valor esperado do produto (X  X)(Y  Y):

Cov(X,Y)  E[X  X)(Y  Y)], (B.26)

que algumas vezes representado por XY. Se XY  0, ento, em mdia, quando X estiver acima de
sua mdia, Y tambm estar acima de sua mdia. Se XY  0, ento, em mdia, quando X estiver acima
de sua mdia, Y estar abaixo de sua mdia.
Algumas expresses teis para calcular Cov(X,Y) so as seguintes:

Cov(X,Y)  E[X  X)(Y  Y)]  E[(X  X)Y]


(B.27)
 E[X(Y  Y)]  E(XY)  XY.

Decorre de (B.27) que, se E(X)  0 ou E(Y)  0, ento, Cov(X,Y)  E(X,Y).


38 Introduo Econometria Editora Thomson

A covarincia mede o grau de dependncia linear entre duas variveis aleatrias. Uma covarin-
cia positiva indica que duas variveis aleatrias se movem na mesma direo, enquanto uma covarincia
negativa indica que elas se movem em direes opostas. Interpretar a magnitude de uma cova-
rincia pode ser um pouco difcil, como veremos brevemente.
Como a covarincia uma medida de como duas variveis aleatrias esto relacionadas, natu-
ral perguntar como a covarincia est relacionada noo de independncia. Isso dado pela seguin-
te propriedade.

PROPRIEDADE COV.1
Se X e Y forem independentes, ento, Cov(X,Y)  0.
Essa propriedade decorre da equao (B.27) e do fato de que E(XY)  E(X)E(Y) quando X e Y so
independentes. importante lembrar que a inversa de COV.1 no verdadeira: covarincia zero entre
X e Y no implica que X e Y sejam independentes. De fato, existem variveis aleatrias X de tal forma
que, se Y  X2, Cov(X,Y)  0. [Qualquer varivel aleatria com E(X)  0 e E(X3)  0 tem essa pro-
priedade]. Se Y  X2, ento, X e Y sero claramente no-independentes: conhecendo X conheceremos
Y. Parece bastante estranho que X e X2 possam ter covarincia zero, e isso revela um ponto fraco da
covarincia como uma medida geral de associao entre duas variveis aleatrias. A covarincia til
em contextos em que as relaes so pelo menos aproximadamente lineares.
A segunda mais importante propriedade da covarincia envolve covarincias entre funes lineares.

PROPRIEDADE COV.2
Para quaisquer constantes a1, b1 , a2 e b2,

Cov(a1X  b1,a2Y  b2)  a1a2Cov(X,Y). (B.28)

Uma implicao importante de COV.2 que a covarincia entre duas variveis aleatrias pode ser alte-
rada simplesmente pela multiplicao de uma ou de ambas as variveis aleatrias por uma constante.
Isso importante em economia, pois variveis monetrias, taxas de inflao etc. podem ser definidas
com diferentes unidades de medida sem que seja alterado seu significado.
Finalmente, til saber que o valor absoluto da covarincia entre quaisquer duas variveis alea-
trias est limitado pelo produto de seus desvios-padro; isso conhecido como a desigualdade de
Cauchy-Schwartz.

PROPRIEDADE COV.3
|Cov(X,Y)|  dp(X)dp(Y).

Coeficiente de Correlao
Suponha que queremos conhecer a relao entre o grau de educao e os rendimentos anuais da popu-
lao que trabalha. Poderamos chamar de X a educao e de Y os rendimentos, computando a seguir
sua covarincia. Entretanto, a resposta que obteremos depender de como escolheremos medir a edu-
cao e os rendimentos. A propriedade COV.2 implica que a covarincia entre educao e rendimen-
tos depender de se os rendimentos so medidos em dlares ou milhares de dlares, ou se a educao
medida em meses ou anos. bastante claro que a maneira como mediremos essas variveis no ter
influncia no quanto elas esto fortemente relacionadas. Mas a covarincia entre elas efetivamente
depende das unidades de medida.
Wooldridge Apndice B Fundamentos da Probabilidade 39

O fato de a covarincia depender das unidades de medida uma deficincia que compensada
pelo coeficiente de correlao entre X e Y:

Cov(X,Y) s
Corr(X,Y)   s XY ; (B.29)
dp(X)dp(Y) XsY

o coeficiente de correlao entre X e Y algumas vezes representado por XY (e algumas vezes cha-
mado de correlao populacional).
Como X e Y so positivos, Cov(X,Y) e Corr(X,Y) sempre tm o mesmo sinal, e Corr(X,Y)  0
se, e somente se, Cov(X,Y)  0. Algumas das propriedades da covarincia so transferidas para a cor-
relao. Se X e Y forem independentes, ento, Corr(X,Y)  0, mas correlao zero no implica inde-
pendncia. (Como a covarincia, o coeficiente de correlao tambm uma medida de dependncia
linear). Porm, a magnitude do coeficiente de correlao mais fcil de interpretar do que o tamanho
da covarincia, devido seguinte propriedade.

PROPRIEDADE CORR.1
1  Corr(X,Y)  1.

Se Corr(X,Y)  0 ou, equivalentemente, Cov(X,Y)  0, no haver relao linear entre X e Y, e X


e Y so chamadas de variveis no-correlacionadas; caso contrrio, X e Y sero correlacionadas.
Corr(X,Y)  1 indica uma relao linear positiva perfeita, o que significa que podemos escrever Y  a
 bX para alguma constante a e alguma constante b  0. Corr(X,Y)  1 indica uma relao linear
negativa perfeita, de forma que Y  a  bX para alguma constante b  0. Os casos extremos de cor-
relao positiva ou negativa igual unidade raramente ocorre. Valores de RHOXY prximos de 1 ou 1
indicam fortes relaes lineares.
Como mencionado antes, a correlao entre X e Y no varia em relao s unidades de medida de
X ou Y. Isso especificado de forma mais geral como segue.

PROPRIEDADE CORR.2
Para as constantes a1, b1, a2 e b2, com a1a2  0,

Corr(a1X  b1,a2Y  b2)  Corr(X,Y).

Se a1a2  0, ento,

Corr(a1X  b1,a2Y  b2)  Corr(X,Y).

Como um exemplo, suponha que a correlao entre rendimentos e educao da populao que traba-
lha seja 0,15. Essa medida no depende de se os rendimentos esto medidos em dlares, milhares de
dlares, ou qualquer outra unidade; ela tambm no depende de se a educao est medida em anos,
trimestres, meses etc.

Varincia da Soma de Variveis Aleatrias


Agora que j definimos covarincia e correlao, podemos completar nossa relao das principais pro-
priedades da varincia.
40 Introduo Econometria Editora Thomson

PROPRIEDADE VAR.3
Para as constante a e b,

Var(aX  bY)  a2Var(X)  b2Var(Y)  2abCov(X,Y).

Segue imediatamente que, se X e Y forem no-correlacionadas de forma que Cov(X,Y)  0 , ento,

Var(X  Y)  Var(X)  Var(Y) (B.30)

Var(X  Y)  Var(X)  Var(Y). (B.31)

Neste ltimo caso, observe como a varincia da diferena a soma, no a diferena, das varincias.
Como um exemplo de (B.30), seja X os lucros ganhos por um restaurante durante uma noite de
sexta-feira e Y os lucros ganhos na noite do sbado seguinte. Ento, Z  X  Y ser os lucros das duas
noites. Suponha que X e Y tenham, cada uma, um valor esperado de 300 dlares e um desvio-padro
de 15 dlares (de forma que a varincia ser 255). O lucro esperado das duas noites ser E(Z)  E(Y)
 2(300)  600 dlares. Se X e Y forem independentes e, portanto, no-correlacionadas, a varincia
do lucro total ser a soma das varincias: Var(Z)  Var(X)  Var(Y)  2  (225)  450. Portanto, o des-
vio-padro do lucro total ser 450 ou aproximadamente 21,21 dlares.
As expresses (B.30) e (B.31) estendem-se para mais de duas variveis aleatrias. Para especifi-
car essa extenso, precisamos de uma definio. As variveis aleatrias X e Y sero variveis aleat-
rias no-correlacionadas duas a duas se cada varivel no conjunto for no-correlacionada com cada
outra varivel do conjunto. Isto , Cov(Xi,Xj)  0 para todo i  j.

PROPRIEDADE VAR.4
Se {X1, ..., Xn) forem variveis aleatrias no-correlacionadas duas a duas e {ai: i  1, ..., n} forem
constantes, ento,

Var(a1X1  ...  anXn)  a12Var(X1)  ...  an2Var(Xn).

Em notao de somatrios, podemos escrever

n n
Var(  aiXi)   ai2Var(Xi).
i1 i1
(B.32)

Um caso especial da Propriedade VAR.4 ocorre quando consideramos ai  1 para todos os i.


Ento, para variveis aleatrias no-correlacionadas duas a duas, a varincia da soma ser a soma das
varincias:

n n
Var(  Xi)   Var(Xi).
i1 i1
(B.33)
Wooldridge Apndice B Fundamentos da Probabilidade 41

Como variveis aleatrias independentes so no-correlacionadas (veja a propriedade COV.1), a


varincia de uma soma de variveis aleatrias independentes a soma das varincias. n

Se as variveis Xi no forem no-correlacionadas duas a duas, ento, a expresso Var( aiXi) ser
muito mais complicada; precisaremos adicionar no lado direito de (B.32) os termosi1
2aiajCov(xi,xj) para todo i  j.
Podemos usar (B.33) para derivarmos a varincia de uma varivel aleatria binomial. Definimos
X  Binomial(n,) e escrevemos X  Y1,  ...  Yn, onde Yi so variveis aleatrias independentes de
Bernoulli(). Ento, de (B.33), Var(X)  Var(Y1)  ...  Var(Yn)  n(1  ).
No exemplo das reservas da companhia area com n  120 e   0,85, a varincia do nmero de
passageiros que comparecem para embarque seria 120(0,85)(0,15)  15,3, e, assim, o desvio-padro
seria aproximadamente 3,9.

Esperana Condicional
A covarincia e a correlao medem a relao linear entre duas variveis aleatrias e as tratam sime-
tricamente. Muitas vezes, em cincias sociais, gostaramos de explicar uma varivel, chamada Y, em
termos de outra varivel, digamos X. Alm disso, se Y for relacionada com X de uma maneira no
linear, gostaramos de ser informados sobre isso. Chamemos Y de varivel explicada e X de varivel
explicativa. Por exemplo, Y poderia ser o salrio por hora e X poderia ser o nmero de anos de educa-
o formal.
J introduzimos a noo de funo de densidade de probabilidade condicional de Y, dado X.
Assim, poderamos querer ver como a distribuio dos salrios alterada pelo nvel de educao.
Porm, em geral, queremos ter uma maneira simples de resumir essa distribuio. Um nico nmero
no ser suficiente, visto que a distribuio de Y, dado X  x, geralmente depende do valor de x. No
entanto, podemos resumir a relao entre Y e X verificando a esperana condicional de Y, dado X,
algumas vezes chamada mdia condicional. A idia a seguinte: suponha que saibamos que X assu-
miu um valor particular, digamos x. Ento, poderemos calcular o valor esperado de Y em decorrncia
de conhecermos esse resultado de X. Representamos esse valor esperado por E(Y|X  x), ou algumas
vezes E(Y|x) como forma abreviada. De forma geral, quando x muda, E(Y|x) tambm muda.
Quando Y for uma varivel aleatria discreta assumindo valores {y1, ..., yn}, ento,

m
E(Y|x)   yj fY | X (yj |x).
j 1

Quando Y for contnua, E(Y | x) ser definida pela integrao de yfY | X(y | x) sobre todos os valores pos-
sveis de y. Assim como no caso da esperana incondicional, a esperana condicional uma mdia
ponderada de possveis valores de Y, mas agora os pesos refletem o fato de que X assumiu um valor
especfico. Assim, E(Y|x) apenas alguma funo de x, que nos diz como o valor esperado de Y varia
com x.
Como um exemplo, seja (X,Y) a populao de todas as pessoas que trabalham, na qual X anos
de educao, e Y o salrio por hora. Ento, E(Y|X  12) ser o salrio mdio por hora de todas as
pessoas da populao com 12 anos de educao (em termos gerais, correspondente educao de ensi-
no mdio). E(Y|X  16) ser o salrio mdio por hora de todas as pessoas com 16 anos de educao.
O grfico de valores esperados com vrios nveis de educao fornece informaes importantes sobre
como os salrios e a educao esto relacionados. Veja a Figura B.5, para uma ilustrao.
42 Introduo Econometria Editora Thomson

Figura B.5
O valor esperado do salrio por hora considerando vrios nveis de educao.

E (SALRIO | EDUC)

4 8 12 16 20 EDUC

Em princpio, o valor esperado do salrio por hora pode ser encontrado a cada nvel de educao,
e essas esperanas podem ser resumidas em uma tabela. Como a educao pode variar amplamente e
pode at mesmo ser medida em fraes de um ano , essa uma maneira excessivamente trabalhosa
de se mostrar a relao entre o salrio mdio e o grau de educao. Em econometria, geralmente espe-
cificamos funes simples que capturam essa relao. Como um exemplo, suponha que o valor espe-
rado de SALRIO, dado EDUC, seja a funo linear

E(SALRIO |EDUC)  1,05  0,45 EDUC.

Se essa relao for vlida na populao das pessoas que trabalham, o salrio mdio das pessoas
com 8 anos de educao ser 1,05  0,45(8)  4,65, ou 4,65 dlares. O salrio mdio das pessoas com
16 anos de educao ser 8,25 dlares. O coeficiente de EDUC implica que cada ano de educao
aumenta o salrio por hora esperado em 0,45, ou 45 centavos de dlar.
As esperanas condicionais tambm podem ser funes no-lineares. Por exemplo, suponha que
E(Y|x)  10/x, onde X uma varivel aleatria que sempre ser maior que zero. Essa funo est tra-
ada na Figura B.6. Isso poderia representar uma funo de demanda, na qual Y seria a quantidade
demandada e X seria o preo. Se Y e X forem relacionadas nesta forma, uma anlise de associao
linear, tal como uma anlise de correlao, seria incompleta.
Wooldridge Apndice B Fundamentos da Probabilidade 43

Figura B.6
Grfico de E(Y | x)  10/x.

E(Y|x) 10

E(Y|x)  10x

1 5 10
x

Propriedades da Esperana Condicional


Vrias propriedades bsicas das esperanas condicionais so teis para derivaes em anlise econo-
mtrica.

PROPRIEDADE EC.1
E[c(X)|X]  c(X), para qualquer funo c(X).
Essa primeira propriedade significa que funes de X comportam-se como constantes quando cal-
culamos a esperana condicional de X. Por exemplo, E(X2 |X)  X2. Intuitivamente, isso simplesmen-
te significa que, se conhecermos X, tambm conheceremos X2.

PROPRIEDADE EC.2
Para as funes a(X) e b(X),

E[a(X)Y  b(X)|X]  a(X)E(Y|X)  b(X).

Por exemplo, podemos calcular com facilidade a esperana condicional de uma funo tal como XY 
2X2: E(XY  2X2 |X) XE(Y|X)  2X2.
A prxima propriedade interliga as noes de independncia e esperanas condicionais.

PROPRIEDADE EC.3
Se X e Y forem independentes, ento, E(Y|X)  E(Y).
Essa propriedade significa que, se X e Y forem independentes, ento, o valor esperado de Y, dado X,
no depender de X, caso em que E(Y|X) sempre ser igual ao valor esperado (incondicional) de Y. No
exemplo do salrio e educao, se salrio fosse independente de educao, ento, os salrios mdios
44 Introduo Econometria Editora Thomson

das pessoas com educao de ensino mdio e com cursos superiores seriam os mesmos. Como quase cer-
tamente esse resultado seria falso, no podemos assumir que salrio e educao sejam independentes.
Um caso especial da propriedade EC.3 o seguinte: se U e X forem independentes e E(U)  0,
ento, E(U|X)  0.
Tambm existem propriedades da esperana condicional que tm a ver com o fato de E(Y|X) ser
uma funo de X, digamos E(Y|X)  (X). Como X uma varivel aleatria, (X) tambm ser uma
varivel aleatria. Alm disso, (X) tem uma distribuio de probabilidade e, portanto, um valor espe-
rado. De forma geral, o valor esperado de (X) pode ser muito difcil de ser calculado de forma dire-
ta. A lei das expectativas iteradas diz que o valor esperado de (X) simplesmente igual ao valor
esperado de Y. Escrevemos isso da seguinte maneira.

PROPRIEDADE EC.4
E[E(Y|X)]  E(Y).
Essa propriedade de difcil compreenso primeira vista. Ela significa que, se primeiro obtiver-
mos E(Y|X) como uma funo de X e considerarmos seu valor esperado (em relao distribuio de
X, claro), ento, acabaremos obtendo E(Y). Isso no to bvio, mas pode ser derivado utilizando a
definio dos valores esperados.
Suponha que Y  SALRIO e X  EDUC, onde SALRIO est medido em horas e EDUC em
anos. Suponha que o valor esperado de SALRIO, dado EDUC, seja E(SALRIO |EDUC)  4  0,60
EDUC. Alm disso, E(EDUC)  11,5. Ento, a lei das expectativas iteradas sugere que E(SALRIO)
 E(4  0,60 EDUC)  4  0,60 E(EDUC)  4  0,60(11,5)  10,90, ou 10,90 dlares por hora.
A prxima propriedade especifica uma verso mais geral da lei das expectativas iteradas.

PROPRIEDADE EC.4
E(Y|X)  E[E(Y|X,Z)|X].

Em outras palavras, podemos encontrar E(Y|X) em duas etapas. Primeiro, encontramos E(Y|X,Z) para
qualquer outra varivel aleatria Z. Em seguida, encontramos o valor esperado de E(Y|X,Z), condicio-
nal em X.

PROPRIEDADE EC.5
Se E(Y|X)  E(Y), ento, Cov(X,Y)  0 [como tambm Corr(X,Y)  0]. De fato, qualquer funo de
X no-correlacionada com Y.

Essa propriedade significa que, se o conhecimento de X no altera o valor esperado de Y, ento, X e Y


devem ser no-correlacionadas, o que implica que, se X e Y forem correlacionadas, ento, E(Y|X) deve
depender de X. A inversa da propriedade EC.5 no verdadeira: se X e Y forem no-correlacionadas,
E(Y|X) poder ainda depender de X. Por exemplo, suponha que Y  X2. Ento, E(Y|X)  X2, que cla-
ramente uma funo de X. Porm, como mencionado em nossa discusso sobre covarincia e corre-
lao, possvel que X e X2 sejam no-correlacionadas. A esperana condicional captura a relao no
linear entre X e Y que uma anlise de correlao deixaria passar despercebida.
As propriedades EC.4 e EC.5 tm duas implicaes importantes: se U e X forem variveis aleat-
rias, de forma que E(U|X)  0, ento, E(U)  0, e U e X sero no-correlacionadas.
Wooldridge Apndice B Fundamentos da Probabilidade 45

PROPRIEDADE EC.6
Se E(Y2)  e E[g(X)2]  para alguma funo g, ento, E{[Y  (X)]2 |X}  E{[Y  g(X)]2 |X} e
E{[Y  (X)]2}  E{[Y  g(X)]2}.

A propriedade EC.6 muito til em contextos de previso ou de projees. A primeira desigualdade


diz que, se medirmos a inexatido da previso como o erro quadrtico de previso esperado, condicio-
nal em X, ento, a mdia condicional ser melhor que qualquer outra funo de X para prever Y. A
mdia condicional tambm minimiza o erro quadrtico de previso esperado incondicional.

Varincia Condicional
Dadas as variveis aleatrias X e Y, a varincia de Y, condicional em X  x, ser simplesmente a varin-
cia associada distribuio condicional de Y, dado X  x: E{[Y  E(Y|x)]2|x}. A frmula

Var(Y|X  x)  E(Y2 |x)  [E(Y|x)]2

freqentemente til para os clculos. Somente ocasionalmente teremos que calcular uma varincia
condicional. Entretanto, teremos que fazer hipteses a respeito e manipular as varincias condicionais
para certos tpicos na anlise de regresso.
Como um exemplo, defina Y  POUPANA e X  RENDA (ambas medidas em termos anuais,
para a populao de todas as famlias). Suponha que Var(POUPANA|RENDA)  400  0,25
RENDA. Isso diz que, conforme aumente a renda, a varincia dos nveis de poupana tambm aumen-
ta. importante verificar que a relao entre as varincias de POUPANA e RENDA totalmente sepa-
rada da relao entre os valores esperados de POUPANA e RENDA.
Estabelecemos, portanto, uma propriedade importante da varincia condicional.

PROPRIEDADE VC.1
Se X e Y forem independentes, ento, Var(Y|X)  Var(Y).

Essa propriedade bastante clara, pois a distribuio de Y, dado X, no depende de X, e Var(Y|X)


apenas uma caracterstica dessa distribuio.

B.5 A DISTRIBUIO NORMAL E OUTRAS DISTRIBUIES A ELA


RELACIONADAS

A Distribuio Normal
A distribuio normal e as derivadas dela so as distribuies mais amplamente usadas em estatstica
e econometria. Assumir que variveis aleatrias definidas para populaes so normalmente distribu-
das simplifica os clculos de probabilidade. Alm disso, nos valeremos pesadamente da distribuio
normal e de outras a ela relacionadas para conduzir inferncia em estatstica e econometria mesmo
quando a populao bsica no for necessariamente normal. Precisamos adiar os detalhes, mas tenha
certeza de que essas distribuies iro surgir muitas vezes ao longo deste livro.
Uma varivel aleatria normal uma varivel aleatria contnua que pode assumir qualquer valor.
Sua funo de densidade de probabilidade tem a forma familiar de um sino traada na Figura B.7.
Matematicamente, a fdp de X pode ser escrita como
46 Introduo Econometria Editora Thomson

f(x)  1 exp[(x  )2/22],   x  , (B.34)


s2p

onde   E(X) e 2  Var(X). Dizemos que X tem uma distribuio normal com valor esperado  e
varincia 2, escrita como X  Normal(, 2). Como a distribuio normal simtrica em relao a
,  tambm a mediana de X. A distribuio normal algumas vezes chamada de distribuio de
Gauss em homenagem ao famoso estatstico C. F. Gauss.
Algumas variveis aleatrias parecem seguir em linhas gerais uma distribuio normal. As altu-
ras e pesos do ser humano, resultados de provas e ndices de desemprego municipais possuem fdps com
aproximadamente a forma na Figura B.7. Outras distribuies, como as da renda, no parecem seguir
a funo de probabilidade normal. Na maioria dos pases, a renda no simetricamente distribuda em
torno de qualquer valor; a distribuio inclinada em direo extremidade superior. Em alguns casos,
uma varivel pode ser transformada para atingir a normalidade. Uma transformao popular o log
natural, que faz sentido para variveis aleatrias positivas. Se X for uma varivel aleatria positiva, tal
como a renda, e Y  log(X) tiver uma distribuio normal, ento, dizemos que X tem uma distribuio
lognormal. possvel constatar que a distribuio lognormal se ajusta bastante bem distribuio de
renda de muitos pases. Outras variveis, como preos de mercadorias, parecem ser bem descritas
quando utilizada a distribuio lognormal.

Figura B.7
A forma geral de uma funo de densidade de probabilidade normal.

fx para uma
varivel aleatria normal

A Distribuio Normal Padro


Um caso especial da distribuio normal ocorre quando a mdia for zero e a varincia (e, portanto, o
desvio-padro) for a unidade. Se uma varivel aleatria Z tiver uma distribuio Normal(0,1), dizemos
que ela tem um distribuio normal padro. A fdp de uma varivel aleatria normal padro repre-
sentada por PHI(z); de (B.34), com   0 e 2  1, ela dada por
Wooldridge Apndice B Fundamentos da Probabilidade 47

(z)  1 exp(z2/2),   z  . (B.35)


2p

A funo de distribuio cumulativa normal padro representada por (z) e obtida como a rea
sob , esquerda de z; veja a Figura B.8. Lembre-se de que (z)  P(Z  z); como Z contnua, (z)
 P(Z  z) tambm contnua.

Figura B.8
A funo de distribuio cumulativa normal padro.

0,5

0
3 0 3 z

No existe frmula simples que possa ser usada para obter os valores de (z) [pois (z) a inte-
gral da funo em (B.35), e essa integral no tem forma nica]. No entanto, os valores de (z) so
facilmente tabulados; eles esto dados para z entre 3,1 e 3,1 na Tabela G.1 no Apndice G. Para z 
3,1, (z) ser menor que 0,001, e para z  3,1, (z) ser maior que 0,999. A maioria dos programas
estatsticos e economtricos inclui comandos simples para computar valores da fdc normal padro, e
assim podemos freqentemente evitar totalmente as tabelas impressas para obter as probabilidades para
qualquer valor de z.
Usando fatos bsicos da probabilidade e, em particular, as propriedades (B.7) e (B.8) em rela-
o s fdcs , podemos usar a fdc normal padro para calcular a probabilidade de qualquer evento
envolvendo uma varivel aleatria normal padro. As frmulas mais importantes so

P(Z  z)  1  (z), (B.36)

P(Z  z)  P(Z  z) (B.37)

P(a  Z  b)  (b)  (a). (B.38)


48 Introduo Econometria Editora Thomson

Como Z uma varivel aleatria contnua, todas as trs frmulas so vlidas, sejam ou no restritas as
desigualdades. Citamos alguns exemplos: P(Z  0,44)  1  0,67  0,33, P(Z  0,92)  P(Z 
0,92)  1  0,821  0,179, e P(1  Z  0,5)  0,692  0,159  0,533.
Outra expresso til que, para qualquer c  0,

P(|Z|  c)  P(Z  c)  P(Z  c)


(B.39)
 2  P(Z  c)  2[1  (c)].

Assim, a probabilidade de que o valor absoluto de Z seja maior que alguma constante c positiva ser
simplesmente duas vezes a probabilidade P(Z  c); isso reflete a simetria da distribuio normal
padro.
Na maioria das aplicaes, iniciamos com uma varivel aleatria normalmente distribuda, X 
Normal(, 2), onde  diferente de zero e 2  1. Qualquer varivel aleatria normal pode ser trans-
formada em uma normal padro usando a seguinte propriedade.

PROPRIEDADE NORMAL.1
Se X  Normal(, 2), ento, (X  )/  Normal(0,1).

A propriedade Normal.1 mostra como transformar qualquer varivel aleatria normal em uma normal
padro. Assim, suponha que X  Normal(3,4), e que gostaramos de calcular P(X  1). As etapas sem-
pre envolvem a normalizao de X para uma normal padro:

P(X  1)  P(X  3  1  3)  P X 2 3  1


 P(Z  1)  (1)  0,159.

EXEMPLO B.6
(Probabilidades para uma Varivel Aleatria Normal)
Primeiro, vamos calcular P(2  X  6) quando X  Normal(4,9) (usar  ou  irrelevante, pois X uma
varivel aleatria contnua). Agora

3 
P(2  X  6)  P 2  4  X  4 
3
64
3 
 P(2/3  Z  2/3)

 (0,67)  (0,67)  0,749  0,251  0,498.

Agora, vamos calcular P(| X |  2):

P(|X|  2)  P(X  2)  P(X  2)


 P[(X  4)/3  (2  4)/3]  P[(X  4)/3  (2  4)/3]
 1  (2/3)  (2)
 1  0,251  0,023  0,772.
Wooldridge Apndice B Fundamentos da Probabilidade 49

Propriedades Adicionais da Distribuio Normal


Terminamos esta subseo reunindo vrios outros fatos sobre as distribuies normais que usaremos
mais tarde.

PROPRIEDADE NORMAL.2
Se X  Normal(, 2), ento, aX  b  Normal(a  b, a22).

Assim, se X  Normal(1,9), ento, Y  2X  3 ser distribuda como normal com mdia 2E(X)
 3  5 e varincia 229  36; dp(Y)  2dp(X)  2  3  6.
Anteriormente, explicamos como, em geral, correlao zero e independncia no so a mesma
coisa. No caso de variveis aleatrias normalmente distribudas, possvel constatar que a correlao
zero suficiente para a independncia.

PROPRIEDADE NORMAL.3
Se X e Y forem conjunta e normalmente distribudas, ento, elas sero independentes se, e somente se,
Cov(X,Y)  0.

PROPRIEDADE NORMAL.4
Qualquer combinao linear de variveis aleatrias independentes e identicamente normalmente dis-
tribudas tem uma distribuio normal.

Por exemplo, sejam Xi, para i  1, 2 e 3, variveis aleatrias independentes distribudas como
Normal(, 2). Defina W  X1  2X2  3X3. Ento, W ser normalmente distribuda; precisamos sim-
plesmente encontrar sua mdia e sua varincia. Agora,

E(W)  E(X1)  2E(X2)  3E(X3)    2  3  0.

Alm disso,
Var(W)  Var(X1)  4Var(X2)  9Var(X3)  142.

A propriedade Normal.4 tambm conclui que a mdia das variveis aleatrias independentes nor-
malmente distribudas tem uma distribuio normal. Se Y1, Y2, ...,Yn forem variveis aleatrias inde-
pendentes e cada uma for distribuda como Normal(, 2), ento,


Y  Normal(,2/n). (B.40)

Esse resultado crtico para a inferncia com respeito mdia em uma populao normal.

A Distribuio Qui-Quadrado
A distribuio qui-quadrado obtida diretamente das variveis aleatrias independentes normais
padres. Sejam Zi, i  1,2,...,n variveis aleatrias independentes, cada uma distribuda como normal
padro. Defina uma nova varivel aleatria como a soma dos quadrados de Zi:

n
X  Zi2.
i1
(B.41)
50 Introduo Econometria Editora Thomson

Ento, X ter o que conhecido como distribuio qui-quadrado com n graus de liberdade (ou gl
abreviadamente). Escrevemos isso como X  2n. Os gl em uma distribuio qui-quadrado correspon-
dem ao nmero de termos na soma em (B.41). O conceito de graus de liberdade desempenhar um
papel importante em nossas anlises estatsticas e economtricas.
A fdp de uma distribuio qui-quadrado com diversos graus de liberdade mostrada na Figura
B.9; no precisaremos da frmula dessa fdp e, portanto, no a reproduzimos aqui. Pela equao (B.41),
fica claro que uma varivel aleatria qui-quadrada sempre no-negativa, e que, diferentemente da dis-
tribuio normal, a distribuio qui-quadrado no simtrica em torno de qualquer ponto. possvel
mostrar que, se X  2n, o valor esperado de X ser n [o nmero de termos em (B.41)], e a varincia
de X ser 2n.

Figura B.9
A distribuio qui-quadrado com vrios graus de liberdade.

f (x)

gl  2

gl  4

gl  8

A Distribuio t
A distribuio t o burro de carga na estatstica clssica e nas anlises de regresso mltipla. Obtemos
uma distribuio t a partir de uma varivel aleatria normal padro e de uma varivel aleatria qui-
quadrada.
Suponhamos que Z tenha uma distribuio normal padro e que X tenha uma distribuio qui-qua-
drado com n graus de liberdade. Adicionalmente, suponhamos que Z e X sejam independentes. Ento,
a varivel aleatria
Wooldridge Apndice B Fundamentos da Probabilidade 51

Z
T (B.42)
X/n

ter uma distribuio t com n graus de liberdade. Vamos representar isso como T  tn. A distribuio
t obtm seus graus de liberdade da varivel aleatria qui-quadrada no denominador de (B.42).
A fdp da distribuio t tem uma forma semelhante da distribuio normal padro, exceto pelo
fato de que ela mais espalhada e, portanto, tem mais rea nos extremos. O valor esperado de uma
varivel aleatria com distribuio t zero (no sentido exato, o valor esperado somente existir para n
 1), e a varincia ser n/(n  2) para n  2. (No existe varincia de n  2 devido distribuio ser
to espalhada.) A fdp da distribuio t est traada na Figura B.10 para vrios graus de liberdade.
Conforme os graus de liberdade vo ficando maiores, a distribuio t se aproxima da distribuio nor-
mal padro.

Figura B.10
A distribuio t com vrios graus de liberdade.

gl  24
gl  2

gl  1

3 0 3

A Distribuio F
Outra distribuio importante na estatstica e na econometria a distribuio F. Em particular, a dis-
tribuio F ser usada para testar hipteses no contexto de anlise de regresso mltipla.
Para definir uma varivel aleatria F, sejam X1  2k1 e X2  2k2 e X1 e X2 sejam independentes.
Ento, a varivel aleatria

(X1/k1)
F (B.43)
(X2/k2)
52 Introduo Econometria Editora Thomson

ter uma distribuio F com (k1, k2) graus de liberdade. Representamos isso como F  Fk1,k2. A fdp
da distribuio F com diferentes graus de liberdade mostrada na Figura B.11.

Figura B.11
A distribuio Fk1,k2 para vrios graus de liberdade, k1 e k2.

f (x)
gl  2,08

gl  6,08

gl  6,20

0 x

A ordem dos graus de liberdade em Fk1,k2 crtica. O inteiro k1 chamado de numerador dos
graus de liberdade, por ele estar associado varivel qui-quadrada no numerador. Da mesma forma, o
inteiro k2 chamado de denominador dos graus de liberdade, por ele estar associado varivel qui-
quadrada no denominador. Isso pode ser um pouco complicado, pois (B.43) tambm pode ser escrita
como (X1k2)/(X2k1), de forma que k1 aparece no denominador. Apenas lembre-se de que o numerador
gl o inteiro associado varivel qui-quadrada no numerador de (B.43); de forma semelhante, uma
associao vlida para o denominador gl.

RESUMO

Neste apndice, revisamos os conceitos de probabilidade que so necessrios em econometria. A maio-


ria desses conceitos deve ser familiar a voc de seus cursos introdutrios de probabilidade e estatstica.
Alguns dos tpicos mais avanados, como as caractersticas das esperanas condicionais, no precisam
ser dominados agora haver tempo para tal quando esses conceitos surgirem, no contexto da anlise
de regresso na Parte 1.
Em um curso introdutrio de estatstica, o foco est no clculo de mdias, varincias, covarin-
cias, e assim por diante, para distribuies particulares. Na Parte 1, no precisaremos de tais clculos:
Wooldridge Apndice B Fundamentos da Probabilidade 53

na maioria das vezes, recorremos s propriedades das esperanas, das varincias etc., que explicamos
neste apndice.

PROBLEMAS

B.1 Suponha que um aluno do ensino mdio est se preparando para prestar o exame vestibular.
Explique por que a nota do vestibular dele adequadamente vista como uma varivel aleatria.
B.2 Defina X como uma varivel aleatria distribuda como Normal(5,4). Encontre as probabilida-
des dos seguintes eventos
(i) P(X  6)
(ii) P(X  4)
(iii) P(|X  5|  1)
B.3 Muito se fala sobre o fato de que certos fundos mtuos tm desempenho superior ao do merca-
do ano aps ano (isto , o retorno por manter quotas nos fundos mtuos maior que o retorno de
possuir um portflio como o da S&P 500). Em termos concretos, considere um perodo de dez anos
e que a populao de fundos mtuos seja os 4.170 reportados no The Wall Street Journal de 1o de
janeiro de 1995. Ao dizermos que o desempenho relativo ao mercado aleatrio, queremos dizer que
cada fundo tem uma possibilidade 50-50 de ter desempenho superior ao do mercado em qualquer
ano e que o desempenho independente de ano para ano.
(i) Se o desempenho relativo ao mercado for realmente aleatrio, qual ser a probabilidade
de que qualquer fundo particular tenha um desempenho superior ao do mercado em todos
os dez anos?
(ii) Encontre a probabilidade de que pelo menos um fundo dos 4.170 tenha um desempenho
superior ao do mercado em todos os dez anos. Qual sua concluso sobre sua resposta?
(iii) Se voc possuir um programa estatstico que calcule probabilidades binomiais, encontre a
probabilidade de que pelo menos cinco fundos tenham desempenho superior ao do mer-
cado em todos os dez anos.
B.4 Para um municpio selecionado aleatoriamente nos Estados Unidos, seja X a proporo de adul-
tos com mais de 65 anos que estejam empregados, ou a taxa de emprego das pessoas mais velhas.
Ento, X estar restrita a um valor entre zero e um. Suponha que a funo de distribuio cumulati-
va de X seja dada por F(x)  3x2  2x3 para 0  x  1. Encontre a probabilidade de que a taxa de
emprego das pessoas mais velhas seja de pelo menos 0,6 (60%).
B.5 Um pouco antes da seleo dos jurados para o julgamento por assassinato de O. J. Simpson
em 1995, uma pesquisa de opinio constatou que 20% da populao adulta acreditava que Simpson era
inocente (aps a maioria das provas fsicas do caso ter se tornada pblica). Ignore o fato de que esses
20% sejam uma estimativa baseada em uma subamostra da populao; a ttulo ilustrativo, considere
esse nmero como a porcentagem verdadeira das pessoas que achavam que Simpson era inocente,
antes da seleo dos jurados. Assuma que os 12 jurados tenham sido selecionados aleatria e inde-
pendentemente da populao (embora isso no tenha sido verdade).
(i) Encontre a probabilidade de que no jri havia pelo menos um membro que acreditava na
inocncia de Simpson antes da seleo dos jurados. [Sugesto: Defina a varivel aleatria
54 Introduo Econometria Editora Thomson

X Binomial(12;0,20) como o nmero de jurados que acreditavam na inocncia de


Simpson.]
(ii) Encontre a probabilidade de que no jri havia pelo menos dois membros que acreditavam
na inocncia de Simpson. [Sugesto: P(X  2)  1  P(X  1), e P(X  1)  P(X  0)
 P(X  1).]
B.6 (Exige clculo integral.) Seja X a sentena prisional, em anos, das pessoas condenadas por roubo
de veculos em determinado estado dos Estados Unidos. Suponha que a fdp de X seja dada por

f(x)  (1/9)x2, 0  x  3.

Use integrao para encontrar a sentena prisional esperada.


B.7 Se um jogador de basquetebol converte 74% dos lances livres que faz, ento, em mdia, quan-
tos ele converter em um jogo com oito lances livres?
B.8 Suponha que um aluno de uma universidade esteja fazendo trs cursos, em determinado semes-
tre: um curso de dois crditos, um curso de trs crditos e um curso de quatro crditos. A nota espe-
rada no curso de dois crditos 3,5, enquanto a nota esperada nos cursos de trs e quatro crditos
3,0. Qual ser a nota mdia global esperada no semestre? (Lembre-se de que cada curso pondera-
do pela sua participao no nmero total de unidades de crditos.)
B.9 Seja X o salrio anual dos professores universitrios nos Estados Unidos, medido em milhares
de dlares. Suponha que a mdia salarial seja 52,3 com um desvio-padro de 14,6. Encontre a mdia
e o desvio-padro quando o salrio medido em dlares.
B.10 Suponha que, em uma grande universidade, a nota mdia de graduao, nmgrad, e a nota do
exame vestibular, sat, estejam relacionadas pela esperana condicional E(nmgrad|sat)  0,70 
0,002 sat.
(i) Encontre a nmgrad esperada quando sat  800. Encontre E(nmgrad|sat  1.400).
Comente sobre a diferena.
(ii) Se a sat mdia da universidade for 1.100, qual ser a nmgrad mdia? (Sugesto: use a pro-
priedade EC.4.)