Escolar Documentos
Profissional Documentos
Cultura Documentos
ANPEC - 2006 - Caderno Estatistica
ANPEC - 2006 - Caderno Estatistica
ProAnpec
CURSO PREPARATÓRIO PARA O EXAME NACIONAL ANPEC
Alexandre Sartoris
Andreza Palma
São Paulo
2005
Probabilidade
(ANPEC 2005, 15) As lâmpadas coloridas produzidas por uma fábrica são 50%
vermelhas, 30% azuis e 20% verdes. Em uma amostra de 5 lâmpadas, extraídas ao
acaso, encontre a probabilidade de duas serem vermelhas, duas serem verdes e uma ser
azul. Multiplique o resultado por 100.
Solução:
Temos:
P5
P(2VM, 2V, 1A) = ×0,50×0,50×0,20×0,20×0,30
P2 × P2 × P1
5!
P(2VM, 2V, 1A) = ×0,003
2!×2!×1!
Solução:
O exercício pede a probabilidade da peça ter sido produzida pela máquina A
dado que essa peça é defeituosa (P(máquina A|defeituosa)). Portanto:
P(máquina A e defeituosa )
P(máquina A|defeituosa) =
P(defeituosa )
0,50 × 0,03
P(máquina A|defeituosa) =
0,50 × 0,03 + 0,30 × 0,04 + 0,20 × 0,05
0,015
P(máquina A|defeituosa) = ≅ 0,40
0,015 + 0,012 + 0,01
Multiplicando o resultado por 100, como pede o exercício, chegaremos ao valor de 40.
Nota: Observe que para a resolução desse exercício, utilizamos o teorema de Bayes, já
que a P(máquina|defeituosa) é dada por:
P(máquina A) × P(defeituo sa | máquina A)
P(máquina A) × P(defeituo sa | máquina A) + P ( máquinaB ) × P(defeituo sa | máquina B) + P ( máquinaC ) × P(defeituo sa | máquina C)
P( Bi ) P( A | Bi )
= P ( Bi | A) = k
∑ P( B
j =1
j ) P( A | B j )
FALSA
FALSA
(3) Se B1, B2 ,........., Bk representam uma partição de um espaço amostral S, então para
P( Bi ) P( A | Bi )
A ⊂ S tem-se que P ( Bi | A) = k , i = 1, 2 ,........ k .
j =1
∑ P( B j ) P( A | B j )
Resposta:
A afirmativa acima refere-se exatamente ao Teorema de Bayes (veja Questão ANPEC
2003, 12).
VERDADEIRA
Resposta:
Os eventos A e B apenas serão independentes se P(A|B) = P(A), ou seja, se a
probabilidade condicional for igual à probabilidade incondicional (o fato que B ocorreu
não muda em nada a probabilidade de A ocorrer)
FALSA
(1) Sabendo-se que alguém optou por procurar emprego, a probabilidade de ser homem
é 64%.
Resposta:
Podemos rapidamente obter essa probabilidade:
16
P(ser homem|optou procurar emprego) = = 0,64 = 64%
25
Porém, para os que preferirem um caminho mais longo:
16
P(ser homem e procurar emprego) 52
P(ser homem|optou procurar emprego) = = =
P(procurar emprego) 25
52
16
= 0,64 = 64%
25
VERDADEIRA
(4)Entre os formandos que pretendem continuar estudando, 1/3 é mulher que pretende
fazer mestrado em economia.
Resposta:
Temos 27 formandos que pretendem continuar estudando. Desses, 9 são mulheres
que pretendem fazer mestrado em economia. E sabemos que 1/3 de 27 é igual a 9
1
× 27 = 9 . Portanto, entre os formandos que pretendem continuar estudando,
3
realmente 1/3 é mulher que pretende fazer mestrado em economia.
VERDADEIRA
(1) Para dois eventos quaisquer A e B, Prob (A) = Prob (A∩Bc) + Prob (A∩B), em
que Bc é o complemento de B.
Resposta:
A probabilidade de A ocorrer corresponde à região cinza do diagrama de Venn
abaixo:
Portanto, temos que:
P(A) = P(A ∩ Bc) +P(A ∩ B)
VERDADEIRA
(2) Sejam dois eventos A e B, em que Prob (A) = 1/2 e Prob (B) = 1/3. Se A e B são
eventos mutuamente exclusivos, então Prob (B∩Ac) é igual a 1/6.
Resposta:
1
Se os dois eventos são mutuamente exclusivos, então Prob (B∩Ac) = P(B) = como
3
mostra o diagrama de Venn abaixo:
FALSA
(3) Sejam os eventos A, B e C, tais que Prob (A∩B∩C) = Prob(A). Prob(B). Prob(C).
Pode-se então afirmar que estes eventos são independentes.
Resposta:
Vejamos, através do seguinte exemplo, que essa implicação não é válida.
Nota: Exemplo retirado de Sartoris (2003, p. 15-16)
P(A∩B) ≠ P(A)×P(B)
P(B∩C) ≠ P(B)×P(C)
P(A∩C) ≠ P(A)×P(C)
(ANPEC 1999, 15) Com relação à Teoria das Probabilidade podemos afirmar que:
(0) Sendo A e B dois eventos independentes e se P(A) = 0,5 e P(B) = 0,4, então P(A∪B)
= 0,5.
Resposta:
Se A e B são independentes, então:
P(A∪B) = P(A) + P(B) - P(A)× P(B)
P(A ∪ B) = 0,5 + 0,4 - 0,2
P(A ∪ B) = 0,7
FALSA
(1) Sendo A e B dois eventos mutuamente exclusivos e se P(A) = 0,5 e P(B) = 0,4, então
P(A∪B) = 0,5.
Resposta:
Se A e B são mutuamente exclusivos, eles não podem ocorrer juntos e, portanto,
P(A ∩ B) =0. Dessa forma:
FALSA
VERDADEIRA
(3) Um projeto para ser transformado em lei deve ser aprovado pela Câmara dos
Deputados e pelo Senado. A probabilidade de ser aprovado pela Câmara dos
Deputados é de 40%. Caso seja aprovado pela Câmara, a probabilidade de ser
aprovado no Senado é 80%. Logo, a probabilidade desse projeto ser transformado
em lei é de 32%.
Resposta:
P(projeto ser transformado em lei) = 0,4× 0,80
P(projeto ser transformado em lei) = 0,32 = 32%
VERDADEIRA
(4) Num processo eletivo 55% dos votantes são homens. Sabe-se que dentre os homens
40% preferem o candidato A, 50% o candidato B e os 10% restantes votam nos
demais candidatos. Dentre as mulheres 60% preferem A, 25% preferem B e o restante
os demais candidatos. Se um voto escolhido ao acaso for para o candidato A, a
probabilidade deste voto ser de uma mulher é de 55,1%.
Resposta:
(ANPEC 1998, 02) Considere um espaço amostral com a terna (Ω,Γ,P), onde Ω ≠ ∅ é
o conjunto Universo, Γ é o conjunto dos possíveis eventos e, P , é uma medida de
probabilidade. Assim, pode-se afirmar que :
Agora, calculemos P( A ∩ B )
P( A ∩ B ) = 1 - P(A ∪ B)
3
P( A ∩ B )= 1 -
4
1
P( A ∩ B ) =
4
VERDADEIRA
(3) Se A e B são dois eventos quaisquer de Γ , então se P(A|B) > P(A) tem-se que
P(B|A) > P(B).
Resposta:
Temos que:
P( A ∩ B)
P(A|B) = > P(A)
P( B)
Então:
P( A ∩ B)
> P(A)
P( B)
P ( A ∩ B) > P(A)P(B)
P( A ∩ B)
> P(B)
P( A)
P( B ∩ A)
E como P(B|A) = , temos que:
P( A)
P(B|A) > P(B)
VERDADEIRA
(2) Se a empresa escolhida ao acaso for do grupo II, a probabilidade do retorno sobre o
capital próprio estar acima da média é 50%.
Resposta:
Podemos rapidamente obter essa probabilidade:
10
P(retorno abaixo da média|grupo II) = = 0,5 = 50%
20
E, como sempre existe um caminho mais longo para quem preferir:
10
P(retorno abaixo da média e grupo II) 150
P(retorno abaixo da média|grupo II) = = =
P(grupo II) 20
150
0,5
VERDADEIRA
60 30
P(empresa grupo I e empresa grupo III) = × ≅ 0,08 = 8%
150 149
VERDADEIRA
FALSA
Esperança, medidas de dispersão e independência de variáveis
aleatórias
(ANPEC 2005, 02) O retorno RC de uma carteira de investimentos com duas ações A
e B e um papel de renda fixa F é dado por RC = a1 R A + a2 RB + a3 RF , em que a1, a2 e a3
são constantes. RA e RB são variáveis aleatórias normalmente distribuídas com média
zero, variância 1 e covariância 0,5 e RF é uma constante igual a 0,1. Julgue as
afirmativas:
(0) A média do retorno da carteira será igual a zero se, e somente se, a correlação entre
os retornos das ações A e B for nula.
Resposta:
E( RC ) = E( a1 R A + a 2 RB + a3 RF )
E( RC ) = E( a1 R A ) + E( a 2 RB ) + E( a3 RF )
E( RC ) = a1 E( R A ) + a 2 E( RB ) + a3 RF
E( RC ) =0,1 a3
Portanto, a média de RC será igual a zero apenas se a3 = 0, o que não tem nada a ver
com a correlação entre o s retornos.
FALSA
Resposta:
E( RC ) =0,1 a3
FALSA
(2) Se a covariância entre o retorno das ações A e B for 0,5, a variância do retorno da
carteira será Var ( RC ) = a12 + a 22 + a1 a 2 .
Resposta:
var( RC ) = var( a1 R A + a 2 RB + a3 RF )
var( RC ) = var( a1 R A + a 2 RB )
var( RC ) = a12 + a 22 + a1 a 2
VERDADEIRA
(3) O retorno RC é uma variável aleatória normalmente distribuída com média 0,1a3 .
Resposta:
Como já calculamos no item (0), a média de RC é dada realmente por 0,1 a3 . E como
RC é a soma de duas variáveis aleatórias normalmente distribuídas (RA e RB), ela
própria será também normalmente distribuída.
VERDADEIRA
Resposta:
cov( R A , RB )
ρR A , RB
=
var(R A ) var(RB )
0,5
ρR A , RB
= = 0,5
1
FALSA
(ANPEC 2004, 3) Sobre coeficiente de correlação, covariância e independência de
variáveis aleatórias, são corretas as afirmativas:
(0)Seja ρ ( x, y ) o coeficiente de correlação entre as variáveis x e y. Se ab>0, então
ρ (ax,by ) = ρ ( x, y ) ; e se ab<0, ρ (ax, by ) = − ρ ( x, y ) .
Resposta
O coeficiente de correlação entre x e y é dado por:
cov( x, y )
ρ(x,y) =
var( x) var( y )
E o coeficiente de correlação entre ax e by será:
cov(ax, by )
ρ(ax,by) =
var(ax) var(by )
E pelas propriedades da variância e da covariância:
ab cov( x, y )
ρ(ax,by) =
a b 2 var( x) var( y )
2
ab cov( x, y )
ρ(ax,by) =
ab var( x) var( y )
Portanto, se ab>1, teremos ρ(ax, by) = ρ(x,y). E se ab<1, teremos ρ(ax, by) = -ρ(x,y).
VERDADEIRA
Ou seja:
VERDADEIRA
(2)Sejam A e B dois eventos independentes, com probabilidades positivas, associados a
um experimento aleatório ε. Se as variáveis aleatórias x e y são definidas como: x =
1, se ocorrer A e x = 0, em caso contrário; e y = 1, se ocorrer B e y = 0, em caso
contrário, então ρ ( x, y ) ≠ 0.
Resposta:
Aqui devemos calcular o coeficiente de correlação entre as variáveis. E para isso
precisamos da covariância entre elas. Lembrando que:
Temos que:
1 se A ocorrer 1 se B ocorrer
x= e y=
0 caso contrário 0 caso contrário
Calculemos a esperança de x e y:
E(x) = 1 × P(A) + 0 × P( A ) = P(A)
E(y) = 1 × P(B) + 0 × P( B ) = P(B)
E o produto de x e y será:
1, se A e B ocorrerem
xy =
0, caso contrário
Dessa forma:
E(xy) = 1 × P( A ∩ B) + 0 × P( A ∩ B) = P( A ∩ B)
FALSA
(3)Em relação ao quesito anterior, pode-se afirmar ainda que a covariância entre x e y é
diferente de zero.
Resposta:
Como vimos no item anterior, a covariância entre x e y é igual a zero.
FALSA
Porém, o fato da cov(x,y) ser igual a zero não implica que as variáveis sejam
independentes (lembrando que a recíproca é verdadeira). Para um exemplo de que
cov(x,y) = 0 não implica independência das variáveis, veja questão ANPEC 1998, 10,
itens 0 e 1, em distribuição de probabilidade conjunta.
FALSA
(ANPEC 2004, 04) Um importador adquiriu vários artigos ao preço médio de US$
15.00 com um desvio-padrão de US$ 1.00. Sabendo-se que a taxa de câmbio é de R$
3,00 por dólar, é correto afirmar:
(0)Convertendo-se o valor das compras para reais, o preço médio dos produtos
adquiridos será de R$ 45,00.
Resposta:
Se a taxa de câmbio é de R$3,00, temos que o valor médio das compras em reais será:
E(R$3,00 × preço) = R$3,00 × E(preço) = R$3,00 × US$15,00 = R$45,00
VERDADEIRA
VERDADEIRA
Se for adicionada uma margem de lucro fixa de R$10,00, o novo preço médio será:
FALSA
(3) Se a margem de lucro for de 20% sobre o preço em reais, o novo preço médio será
R$ 54,00 e o novo desvio-padrão será R$ 3,60.
Resposta:
Acrescentando-se uma margem de lucro de 20% sobre o preço em reais, temos que o
preço médio será dado por:
E(preço + 0,20preço) = E(preço) + 0,20E(preço) = 45 + 9 = R$54,00
E o desvio-padrão:
dp(preço + 0,20preço) = dp(1,20preço) = |1,20|dp(preço) = |1,20| × 3,00 = R$3,60
VERDADEIRA
(4) O coeficiente de variação calculado em reais, devido à taxa de câmbio, será 3 vezes
maior do que aquele calculado utilizando-se os valores em dólar.
Resposta:
O coeficiente de variação (desvio-padrão dividido pela média) não é afetado por
mudanças nas unidades de medida. Portanto, não faz diferença se calcularmos os
valores em reais ou em dólares; o coeficiente de variação continuará sendo o mesmo.
FALSA
1
Lembre-se que o fato de adicionar uma constante não irá alterar a variabilidade da variável; apenas irá
deslocar os seus valores para a direita (no caso de adição) ou para a esquerda (no caso de subtração).
(ANPEC 2003, 09) Sendo Y e X duas variáveis aleatórias, é correto afirmar que:
Portanto, se ρ (coeficiente de correlação entre x e y) for igual a zero (o que implica que
a covariância também será zero), a expressão acima se reduzirá a:
2
y − µy
2
1 1 x − µx
f(x,y) = exp − +
2πσ xσ y 2 σx σ y
(1) Supondo-se que os retornos dos dois ativos referidos no quesito anterior sejam
independentes e que suas variâncias sejam iguais a 10 e 20, respectivamente, então a
variância da carteira será igual a 8,8.
Resposta:
A variância da carteira será dada por:
var(carteira) = var(0,4 A + 0,6B)
Se os retornos dos ativos são independentes, então a variância de sua soma é igual à
soma das variâncias:
var(carteira) = var(0,4 A) + var(0,6 B)
var(carteira) = 0,42 var(A) + 0,62 var(B)
var(carteira) = 0,16 × 10 + 0,36 × 20
var(carteira) = 1,60 + 7,20
var(carteira) = 8,8
VERDADEIRA
onde β = (1-α).
cov(A,B) = ρ × var(A)
Portanto, para que o risco da carteira seja eliminado, basta que (α2 +β2 + 2αβρ) <1.
Vejamos se o coeficiente de correlação entre os ativos precisa ser negativo para que isso
ocorra. Suponha que ρ = 0. A variância da carteira será dada então por:
var(carteira) = (α2 +β2) var(A)
2 1 2 1
var(carteira) = var A + var B + 2 cov A, B
3 3 3 3
4 1 4
var(carteira) = var(A) + var(B) + cov(A,B)
9 9 9
4 1 4
var(carteira) = 2var(B) + var(B) + cov(A,B)
9 9 9
8 1 4
var(carteira) = var(B) + var(B) + cov(A,B)
9 9 9
4
var(carteira) = var(B) + cov(A,B) (I)
9
Para que o risco da carteira fosse eliminado, a expressão entre parênteses teria que ser
igual a zero, o que, obviamente, não se verifica. Portanto, se a variância de A é duas
vezes a variância de B e se investirmos duas vezes mais em A, o risco da carteira não
será eliminado.
FALSA
(4) Se existir uma correlação negativa perfeita entre os retornos dos ativos A e B,
haverá uma particular composição desses ativos que eliminará completamente o
risco da carteira.
Resposta:
Como a variância da carteira é dada por:
Para eliminar o risco da carteira, temos que a expressão entre colchetes acima deve ser
nula. Portanto:
9α2 - 6α + 1 = 0
1
Resolvendo essa equação do 2º grau, encontremos o valor de para α. Portanto, se
3
houver uma correlação negativa perfeita entre os ativos, e a var(A) = 4var(B), a seguinte
composição eliminará completamente o risco da carteira:
1 2
Carteira = A+ B
3 3
VERDADEIRA
(ANPEC 1999, 14) Com relação as definições de Coeficiente de Correlação e de
Esperança Matemática, pode-se afirmar que :
(0) Se X e Y são duas variáveis aleatórias de forma que Y=aX+b, onde a e b são
constantes, então o coeficiente de correlação entre X e Y é igual a 1 se a < 0 e igual a -1
se a > 0.
Resposta:
O coeficiente de correlação entre X e Y será dado por:
cov( X , Y )
ρ X ,Y =
var( X ) var(Y )
Como Y = aX+b:
cov(X, aX + b) a cov(X, X) a var( X ) a
ρ X ,Y = = = =
var(X)var(aX + b) var(X)a var(X)
2
a var( X ) a
Portanto, se a < 0, o coeficiente de correlação entre X e Y será igual a -1 e se a > 0, será
igual a 1.
FALSA
cov(W , Z )
ρWZ =
var(W ) var(Z )
cov(aX + b, cY + d)
ρWZ =
var(aX + b)var(cY + d)
cov(aX , cY ) ac cov( X , Y ) ac
ρWZ = = = ρ XY
var(aX ) var(cY ) ac var( X ) var(Y ) ac
VERDADEIRA
Porém, o fato da covariância ser igual a zero, não implica que as variáveis sejam
independentes (a não ser que elas, por exemplo, sejam normalmente distribuídas).
Para um exemplo de que covariância igual a zero não implica independência entre as
variáveis, veja Questão ANPEC 1998, 10, itens (0) e (1).
FALSA
VERDADEIRA
E sabemos que:
1, se A e B ocorrem
XY =
0, caso contrário
Dessa forma:
E(XY) - E(X)E(Y) = 0
E(XY) = E(X)E(Y)
E, sabendo que E(X) = P(A), E(Y) = P(Y) e E(XY) = P(A ∩ B), temos:
P(A ∩ B) = P(A).P(B)
(1) No caso de dois conjuntos de n1 e n2 valores, onde s12 e s22 são, respectivamente,
suas variâncias e x1 e x 2 suas médias, a variância combinada , s 2 , destes dois
(n1 − 1) s12 + (n2 − 1) s22
conjuntos quando, x = x1 = x 2 , é igual a s =
2
.
n1 + n2 − 2
Resposta
A variância será dada por uma média ponderada pelos graus de liberdade nas duas
amostras:
(n − 1) s12 + (n2 − 1) s 22 (n1 − 1) s12 + (n2 − 1) s 22
s2 = 1 =
(n1 − 1) + (n2 − 1) n1 + n2 − 2
VERDADEIRA
(2) Quando dois conjuntos de valores são expressos em unidades de medidas diferentes,
é mais justificável o uso do desvio padrão (dispersão absoluta) do que o coeficiente
de variação de Pearson, para efeito de comparação.
Resposta
O coeficiente de variação de Pearson é dado por:
desvio padrão
ζ=
média
Portanto, será um número adimensional, isto é, não tem unidades, já que a média e o
desvio padrão são medidos na mesma unidade. Portanto, ele será preferível ao desvio
padrão para compararmos valores expressos em unidades de medidas diferentes.
FALSA
(3) Quando uma distribuição de frequência apresenta M 0 (Moda) > M e (Mediana) >
x (Média aritmética) , ela diz-se assimétrica à direita e, assimétrica à esquerda, em
caso contrário.
Resposta
O caso em que M 0 (Moda) < M e (Mediana) < x (Média aritmética) está mostrado
abaixo:
FALSA
Distribuição de probabilidade discreta
(ANPEC 2003, 04) Com relação à variáveis aleatórias discretas é correto afirmar que:
(0) se X1, ..., Xn são variáveis aleatórias identicamente distribuídas com distribuição
n
Bernoulli com parâmetro p, então Z = ∑ X i terá uma distribuição Poisson quando
i =1
n for grande;
Resposta:
A variável Z, que é uma variável com distribuição binomial (já que é a soma de n
experimentos de Bernouilli), apenas terá distribuição de Poisson quando n for grande
( n → ∞ ) e p for pequeno ( p → 0 ), de forma que n × p (que é o parâmetro da
distribuição de Poisson) permaneça constante.
FALSA
(1) uma variável aleatória com distribuição binomial representa o número de sucessos
em n experimentos de Bernoulli;
Resposta:
A distribuição binomial é a generalização da distribuição de Bernouilli. Na distribuição
de Bernouilli temos dois eventos mutuamente exclusivos (sucesso e fracasso) e apenas
um experimento. Na binomial, também temos apenas dois eventos mutuamente
exclusivos, mas o número de experimentos pode ser maior que um. É como se
realizássemos n vezes um experimento de Bernouilli. Chamando de X um experimento
n
FALSA
(3) a distribuição Qui-quadrado possui média igual a n e variância igual a 4n, em que n
é o número de graus de liberdade;
Resposta:
Seja Z uma variável normal padronizada:
x−µ
Z= ~N(0,1)
σ
n
Então, ∑Z i =1
2
i
~ χ n2 , ou seja, a soma de n variáveis normais padronizadas ao quadrado,
segue uma distribuição Qui-quadrado com n graus de liberdade. A esperança da
distribuição Qui-quadrado será dada então por:
n
E( χ n2 ) = E ∑Z i =1
2
i
E( χ n2 ) = ∑ E (Z )
i =1
i
2
var( χ n2 ) = var ∑Z
i =1
2
i
var( χ n2 ) = ∑ var(Z )
i =1
2
i
∑ {E(Z [ ]}
n
2
var( χ n2 ) = i
4
) − E( Z i2 )
i =1
Como já tínhamos visto antes, E( Z i2 ) = var (Z i ) = 1:
∑ [E(Z ]
n
var( χ n2 ) = i
4
) − 12
i =1
var( χ n ) = 2n
2
(4) a distribuição binomial pode ser aproximada pela distribuição de Poisson para
valores grandes de n (tamanho da amostra) e pequenos de p (probabilidade de
sucesso).
Resposta:
É exatamente nesse caso que a distribuição binomial pode ser aproximada pela
distribuição de Poisson (veja item (0) desta questão).
VERDADEIRA
1
E como a probabilidade de acertar o alvo é de , a probabilidade de não acertá-lo é de
4
3
. Na tabela abaixo, calculamos essas probabilidades para os valores de n até que
4
2
P(pelo menos uma vez) seja maior que ( ≅ 0,67):
3
N P(acertar nenhuma) P(pelo menos 1 vez)
1 3 1
4 4
2 3 3 9 7
× =
4 4 16 16
3 3 3 3 27 37
× × = ( ≅ 0,58)
4 4 4 64 64
4 3 3 3 3 81 175
× × × = ( ≅ 0,68)
4 4 4 4 256 256
Portanto, ele deve atirar 4 vezes para que a probabilidade de acertar pelo menos uma
2
vez no alvo seja maior que .
3
(1) Uma variável aleatória Y, definida como o número de repetições necessárias para a
primeira ocorrência de A, tem distribuição Geométrica, desde que as repetições
sejam independentes e que P(A) = p e P(AC ) = 1-p.
Resposta:
A distribuição geométrica se refere à probabilidade de A ocorrer exatamente na k-ésima
repetição. Portanto, se a variável aleatória Y é o número de repetições necessárias para a
primeira ocorrência de A, ela terá distribuição geométrica, cuja função de distribuição é
dada por:
P(x = k) = (1-p)k-1p
VERDADEIRA
(2) Pode-se utilizar a distribuição Binomial para, por exemplo, calcular a probabilidade
de se encontrar k peças defeituosas em um lote de n peças selecionadas ao acaso,
sem reposição.
Resposta:
Nesse caso, deve-se utilizar a distribuição hipergeométrica, já que não há reposição das
peças.
FALSA
(3) Se uma variável aleatória segue uma distribuição Hipergeométrica, sua distribuição
será próxima da Binomial se o tamanho da população for grande em relação ao
tamanho da amostra extraída .
Resposta:
A distribuição hipergeométrica difere da binomial pelo fato da amostra ser finita e os
elementos serem retirados sem reposição. Quando o tamanho da população for grande
em relação ao tamanho da amostra, não fará diferença se retiramos os elementos com ou
sem reposição e, portanto, a distribuição hipergeométrica será próxima da distribuição
binomial. Veja também questão ANPEC 2003, 4, item 2.
VERDADEIRA
Dessa forma, na distribuição de Poisson, a média é igual à variância, que são iguais ao
parâmetro da distribuição, α.
VERDADEIRA
(ANPEC 2002, 14) Uma companhia de seguros tem 400 segurados de certo tipo. O
prêmio do seguro é R$ 1.000,00 por ano. Caso ocorra um sinistro a seguradora
indenizará R$ 8.000,00 a cada acidentado. Sabe-se que a probabilidade de ocorrência
de sinistro, é 0,1 por ano. Os custos fixos da seguradora são de R$ 8.000,00 por ano.
Qual a probabilidade da seguradora ter prejuízo em um certo ano? (Ignore o fator de
correção para continuidade, multiplique sua resposta por 100 e transcreva a parte inteira
do número encontrado).
Solução:
A receita total dessa companhia é dada por:
R = 400 × 1000 = 400.000
Chamando de x o número de sinistros ocorridos por ano, temos que os seus custos totais
são:
C = 8.000x + 8.000
Portanto, para que a empresa tenha prejuízo, o número de sinistros ocorridos por ano (x)
deve ser maior que 49. Então, devemos encontrar P(x>49). Note que a variável x tem
distribuição binomial e, dessa forma, temos que:
FALSA
Note que a expressão acima é "quase" uma progressão geométrica, exceto pelos
números 1, 2, 3, … . Como veremos abaixo, a expressão acima é a soma de progressões
geométricas:
p + 2p(1-p)+3p(1-p)2+4p(1-p)3+ …
E a soma dos termos de uma progressão geométrica infinita, com valor inicial dado por
a e razão dada por q é:
a
S=
1− q
VERDADEIRA
VERDADEIRA
Distribuição de probabilidade contínua
(ANPEC 2004, 05) Uma variável aleatória contínua x tem a sua função densidade de
probabilidade dada pelo gráfico:
K1
1 K2
base × altura 1K 1
=
2 2
E a do retângulo:
VERDADEIRA
K 1 x , 0 ≤ x <1
(2) A função densidade de probabilidade de x será f ( x) = K1 , 1≤ x ≤ K 2
0, fora desses intervalos.
Resposta:
É exatamente essa a f.d.p. de x. Observando o gráfico, podemos ver claramente que se x
estiver entre 0 e 1, o valor de f(x) será K1x. Se x estiver entre 1 e K2, o valor da f(x) será
igual à constante K1 (já que f(x) é uma linha horizontal nesse intervalo). E fora desses
intervalos, a f(x) é igual a zero. Observe que os sinais de desigualdade ≤ ou < são
equivalentes nesse caso, já que a distribuição é contínua.
VERDADEIRA
K1 x 2 / 2, 0 ≤ x <1
(3) A função de distribuição acumulada de x será F ( x) = K1 x, 1≤ x < K 2
1, x ≥ K 2
Resposta:
Sabemos que:
x
F(x) = ∫ f (t )dt
−∞
x2
F(x) = ∫ K 1 xdx = K 1 +C
2
Como F(0) = 0, substituindo temos:
F(0) = C =0
F(x) = ∫ K dx = K x + C
1 1
Substituindo na segunda:
K
F(1) = K 1 + C = 1
2
K1
C= – K1
2
K
C=– 1
2
K 1 x, 0 ≤ x < 1
f ( x) =
0, fora desse intervalo
2 + K1
K2 =
2K1
Portanto:
1
Para aqueles que não tivessem resolvido o item (1) dessa questão (ou para os que não tivessem absoluta
1
E(x) = ∫ xf ( x)dx
0
1
E(x) = ∫ 2 x 2 dx
0
1
x3
E(x) = 2
3 0
1
E(x) = 2×
3
2
E(x) =
3
FALSA
(ANPEC 2003, 03) O custo X de produção de certo bem é uma variável aleatória com
função densidade de probabilidade
kx 2 1 ≤ x ≤ 4
f ( x) =
0 caso contrário
∫ f ( x)dx
1
=1
∫ kx dx =1
2
1
4
k ∫ x 2 dx = 1
1
4
x3
k =1
3 1
4 3 13
k − =1
3 3
21k = 1
1
k=
21
FALSA
E(x) = ∫ xf ( x)dx
1
4
E(x) = ∫ xkx dx
2
1
4
E(x) = k ∫ x 3 dx
1
4
x4
E(x) = k
4 1
4 4 14
E(x) = k −
4 4
1 255
E(x) = ×
21 4
E(x) ≅ 3,036
FALSA
2
1 x3
P(x < 2) =
21 3 1
1 2 3 13
P(x < 2) = −
21 3 3
1 7
P(x < 2) = ×
21 3
1
P(x < 2) =
9
VERDADEIRA
E(x2) = ∫x f ( x)dx
2
1
4
1 2
E(x2) = ∫x x dx
2
1 21
1 4 4
21 ∫1
E(x2) = x dx
1 4 5 15
E(x2) = −
21 5 5
1 1023
E(x2) = ×
21 5
341
E(x2) = ≅ 9,743
35
FALSA
1 4 3 33
P(x > 3) = −
21 3 3
1 37
P(x > 3) = ×
21 3
37
P(x > 3) =
63
FALSA
Porém, para os que gostam de cálculo, podemos mostrar facilmente que a f.d.p. de X
atingirá seu máximo quando x for igual a µ. Para isso, basta derivarmos a função
densidade de probabilidade de X e igualar a zero, para encontrar seu ponto de máximo:
( x − µ )2
1 −
2σ 2
f(x) = e
2πσ 2
df ( x)
=
1
× e
−
1 ( x − µ )2
2 σ2 1
× − ×2
(x − µ )
dx 2πσ 2
2 σ2
df ( x)
=−
( x − µ)
×
1
×e
−
1
2
( x − µ )2
σ2
dx σ 2
2πσ 2
E temos que:
df ( x)
= 0 ⇔ (x-µ) = 0
dx
(x-µ) = 0
x=µ
VERDADEIRA
(1) Se X tem distribuição Uniforme no intervalo [0, α ], α >0, então, α tem que ser
igual a 4/3 para que P(X > 1) = 1/3.
Resposta:
Sabemos que a f.d.p. de uma variável uniformemente distribuída é dada por f(x) =
1 1
, que, nesse caso, equivale a (já que a = 0). Portanto, a P(X > 1) será dada por:
α −a α
α
1
P(X > 1) = ∫ dx
1 α
1
E para que P(X > 1) seja igual a , temos que:
3
α
1 1
∫ α dx
1
=
3
α
1 1
x =
α 1 3
1 1 1
α− 1 =
α α 3
1 1
1− =
α 3
1 1
=1-
α 3
1 2
=
α 3
3
α =
2
3 1
Portanto, α deve ser igual a para que P(X>1) seja igual a .
2 3
FALSA
FALSA
Nota: observe que o fato do sinal de desigualdade ser ≥ ( ≤ ) ou > (<) não tem
importância, já que se trata de uma distribuição de probabilidade contínua.
VERDADEIRA
(4) A variável aleatória Z tem distribuição Lognormal se e somente se exp (Z) tiver
distribuição Normal.
Resposta:
A variável Z terá distribuição log-Normal se e somente se ln(Z) tiver distribuição
normal.
FALSA
xo
∫
x0
f ( x)dx =
x0
= ∫ f (x ) − ∫ f (x ) = 0
0 x
FALSA
d
(4) A função densidade de probabilidade de X é calculada por f(x) = F (x) em que,
dx
F(x) é a função de distribuição acumulada.
Resposta:
Como já foi dito no item anterior, a função densidade de probabilidade f(x) é a derivada
da distribuição acumulada (e, portanto, a função de distribuição acumulada é a integral
da f.d.p.). Porém, a função f(x) já foi definida no enunciado. Sendo assim, ela pode
conter pontos em que há descontinuidade em F(x). Como sabemos, se F(x) não é
contínua para um ponto x0, sua derivada não existirá neste ponto. Mas nada impede que
a função f(x) seja definida, a priori, contendo estes pontos, o que não alteraria o cálculo
das probabilidades através dela (já que a inclusão ou não de um único ponto em uma
f.d.p. contínua é irrelevante para o cálculo das probabilidades).
FALSA
(ANPEC 2001, 14) Seja X uma variável aleatória contínua, com função densidade de
1
probabilidade dada por f ( x) = , 1 ≤ X ≤ 3 . Determine o valor da mediana dessa
2
distribuição.
Solução:
Sabemos que a mediana divide a distribuição ao meio. Chamando a mediana de m,
temos que:
3
1 m
1
P(x>m) = ∫m 2 dx = 0,5 e P(x<m) = ∫ 2 dx = 0,5
1
Tomando a segunda das expressões acima (mas poderia ser a primeira também), temos:
m
1
∫ 2 dx = 0,5
1
m
1
x = 0,5
2 1
1 1
m− = 0,5
2 2
1 1 1
m= +
2 2 2
1
m= =2
1
2
Portanto, a mediana dessa distribuição é igual a 2 .
∫ f ( x)dx = 1
0
∫ cx dx = 1
2
c ∫ x 2 dx = 1
0
2
x3
c =1
3 0
23 03
c − =1
3 3
8
c =1
3
3
c=
8
Agora podemos calcular P (0 ≤ x ≤ 1) :
1
P (0 ≤ x ≤ 1) = ∫ f ( x)dx
0
1
3
P (0 ≤ x ≤ 1) = ∫ 8 x dx
2
31 2
8 ∫0
P (0 ≤ x ≤ 1) = x dx
1
3 x3
P (0 ≤ x ≤ 1) =
8 3 0
3 13 0 3
P (0 ≤ x ≤ 1) = −
8 3 3
1
P (0 ≤ x ≤ 1) = = 0,125
8
Arrendondando o resultado e multiplicando por 100, chegaremos ao valor de 13 .
(ANPEC 1999, 11) Podemos afirmar que:
VERDADEIRA
(1) A distribuição “t” é sempre simétrica com média zero e à medida que o tamanho da
amostra aumenta, a distribuição “t” aproxima-se da distribuição normal padrão.
Resposta:
A distribuição t de Student é simétrica e possui sempre média zero e variância igual a
n
(n é o número de graus de liberdade). Quando n é pequeno, o formato da
n−2
distribuição t é o de uma "normal" achatada, e conforme o tamanho da amostra
aumenta, a distribuição t se torna cada vez mais simétrica, ou seja, aproxima-se da
distribuição normal padronizada.
VERDADEIRA
(2) A distribuição “F” é uma razão entre duas variáveis aleatórias “t” independentes,
cada uma delas dividida pelo respectivo número de graus de liberdade.
Resposta:
A distribuição F é uma razão entre duas variáveis aleatórias χ2 (qui-quadrado)
independentes, cada uma delas dividida pelo respectivo número de graus de liberdade:
χ2 /k
F = k2 ~Fk,n
χn / n
FALSA
(3) A distribuição normal apresenta dois pontos de inflexão na sua função de densidade
de probabilidade f(x) nos pontos x = µ - 2.σ e x = µ + 2.σ, onde µ é a média e σ
o desvio padrão.
Resposta:
Sabemos que os pontos de inflexão de uma função ocorrem onde a derivada segunda é
igual a zero. Na questão ANPEC 2002, 08, item(0), já calculamos a derivada primeira
da f.d.p. normal:
df ( x)
=-
( x − µ) 1 −
e σ
1 ( x − µ )2
2 2
dx σ 2
2πσ 2
Portanto, sua derivada segunda será dada por:
x−µ 1 x−µ
2 2
d 2 f ( x) 1 1 −
1 x−µ
−
1 x−µ
=- e 2 σ
− e 2 σ
2
dx 2 2πσ 2
σ 2
σ 2
2 σ2
d 2 f ( x)
=-
1 1
e
−
1 x−µ
2 σ
2
−
(x − µ ) 2
e
−
1 x−µ
2 σ
2
dx 2
2πσ 2 σ 2
σ 4
1 (x − µ )
2 2
d 2 f ( x) 1 −
1 x−µ
= e2 σ −
dx 2
2πσ 2
σ2 σ4
E temos que:
1 (x − µ )
2
d 2 f ( x)
= 0⇔ − =0
dx 2 σ2 σ4
1 (x − µ)2
− =0
σ 2
σ 4
σ − (x − µ)
2 2
=0
σ 4
σ − (x − µ) = 0
2 2
(x − µ) = σ 2 2
(x − µ) = ± σ 2 2
x-µ = ± σ
x = µ ±σ
FALSA
∫ f ( x)dx
0
=1
b
∫ kdx
0
=1
[kx] =1 b
a
kb − ka =1
k (b − a ) = 1
1
k=
b−a
FALSA
(ANPEC 1998, 05) Verifique quais das afirmações abaixo são verdadeiras e quais são
falsas.
Z
(0) A variável aleatória “t” é definida como , onde Z tem distribuição
χ 2
n −1
(n − 1)
normal-padrão e χ é uma distribuição qui-quadrado com (n - 1) graus de liberdade.
2
Resposta:
O quociente entre uma variável normal padronizada e uma variável χ2 dividida pelo seu
respectivo grau de liberdade (que nesse caso é igual a n-1) é uma variável aleatória t.
VERDADEIRA
(3) A estatística “F” pode ser utilizada para verificar a igualdade de duas variâncias
provenientes de duas populações quaisquer.
Resposta:
A estatística "F" pode ser utilizada para verificar a igualdade de duas variâncias
provenientes de duas populações normalmente distribuídas.
FALSA
(ANPEC 1998, 08) Seja X uma variável aleatória com função densidade f(x).
Portanto, a probabilidade de x ser menor que 1 certamente será maior que 1/2.
FALSA
∫
−∞
f ( x)dx = 1 e ∫ g ( x)dx =1
−∞
E para que βf(x) + (1-β)g(x) também seja uma f.d.p. deve-se verificar que:
∞
∫ βf ( x) + (1 − β ) g ( x)dx = 1
−∞
∞ ∞
∫ βf ( x)dx + ∫ (1 − β ) g ( x)dx = 1
−∞ −∞
∞ ∞
β ∫ f ( x)dx + (1 − β ) ∫ g ( x)dx = 1
−∞ −∞
∞ ∞
β + (1-β) = 1
β+1-β=1
1=1
Portanto, βf(x) + (1-β)g(x) é também uma função densidade de probabilidade da
variável x.
VERDADEIRA
E assim sucessivamente.
∑ P( x = k ) = c + c(1 − β) + c(1 − β) 2
+ c(1 − β) 3 + … = 1
O que é a soma dos termos de uma progressão geométrica infinita, com razão (q)
igual a (1-β). E sabemos que essa soma é dada por:
a
S=
1− q
VERDADEIRA
(3) Se a variável aleatória X segue uma distribuição exponencial, então P(x >(s+t) | x >
s) = P(x > t), para quaisquer s, t > 0.
Resposta:
A probabilidade condicional é dada por:
P[ x > ( s + t ) e x > s] P[ x > ( s + t )] e −α ( s + t )
P(x >(s+t) | x > s) = = = −αs = e −αt = P(x > t),
P( x > s) P( x > s) e
já que a probabilidade de x ser maior que s é dada por:
∞
P(x>s) = ∫ αe −αx
s
∞
e −αx
P(x>s) = α −
α s
e − αs
P(x>s) = α = e −αs
α
E, analogamente, a probabilidade de x ser maior que (s+t) é:
P(x>s+t) = e −α ( s + t )
A propriedade que P(x >(s+t) | x > s) = P(x > t) nos permite afirmar que a distribuição
exponencial "não possui memória".
VERDADEIRA
Distribuição de probabilidade conjunta
A) Contínuas
Calcule a P(Y<X). Multiplique o resultado por 48 e transcreva este produto para a folha
de resposta.
Solução:
A probabilidade de Y ser menor que X será dada por:
1 X
xy
P(Y<X) = ∫∫x + dydx
2
0 0 3
X
1
xy 2
P(Y<X) = ∫ x y+ dx
2
0 6 0
1
x3
P(Y<X) = ∫x + dx
3
0 6
1
x4 x4
P(Y<X) = +
4 24 0
1 1
P(Y<X) = +
4 24
7
P(Y<X) =
24
Multiplicando o resultado por 48 como pede o exercício, chegaremos ao valor de 14:
7
× 48 = 7 × 2 =14
24
(ANPEC 2003, 14) Considere o vetor aleatório X = (X1, X2, X3) com distribuição de
probabilidade
6 x1 x 22 x3 0 ≤ x1 ≤ 1, 0 ≤ x 2 ≤ 1, 0 ≤ x3 ≤ 2
f X ( x1 , x 2 , x3 ) =
0 caso contrário
Encontre a probabilidade de 0 ≤ x1 ≤ 0,5 .
(Multiplique o resultado por 100).
Solução:
O exercício pede a probabilidade de x1 estar entre 0 e 0,5. Portanto, antes de
mais nada, precisamos encontrar a função densidade de probabilidade marginal de x1
(que chamaremos de g(x)). Isso é feito integrando em x2 e x3:
2 1
g(x) = ∫ ∫ 6 x x x dx dx
2
1 2 3 2 3
0 0
2 1
g(x) = 6 x1 ∫ ∫ x 22 x3 dx 2 dx 3
0 0
1
x3 2
g(x) = 6 x1 ∫ x3 2 dx 3
0 3 0
1 2
g(x) = 6 x1 ∫ x3 dx3
0 3
2
1
g(x) = 6 x1 ∫ x3 dx3
0 3
2
1 x32
g(x) = 6 x1
3 2 0
g(x) = 2 x1
( 2) 2
2
g(x) = 2x1
0,5
P(0 ≤ x1 ≤ 0,5) = ∫ 2 x dx
0
1 1
0,5
x12
P(0 ≤ x1 ≤ 0,5) = 2
2 0
0,5 2 0 2
P(0 ≤ x1 ≤ 0,5) = 2 −
2 2
P(0 ≤ x1 ≤ 0,5) = 0,25
∫ ∫ ∫ 6 x x x dx dx dx .
2
1 2 3 2 3 1
0 0 0
(ANPEC 2002, 13) Suponha que a função densidade de probabilidade conjunta da
variável aleatória bidimensional (X,Y) seja uniformemente distribuída na região de
domínio,
f ( x, y ) = k x ( x − y ) 0 ≤ x ≤ 2, 0 ≤ y ≤ 2
Encontre E(X). Multiplique a resposta por 10 e transcreva somente a parte inteira do
número encontrado.
Solução:
∫ ∫ f ( x, y)dxdy = 1
0 0
2 2
∫ ∫ kx( x − y)dxdy = 1
0 0
2 2
k ∫ ∫ x 2 − xydxdy = 1
0 0
2
2
x3 x2
k∫ − y dy = 1
0 3 2 0
2
8 4
k ∫ − ydy = 1
0 3 2
2
8 y2
k y−2 =1
3 2 0
2
8 22
k 2−2 =1
3 2 0
16
− 4 k =1
3
4
k=1
3
3
k=
4
E(X) = ∫ ∫ xf ( x, y)dxdy
0 0
2 2
3
E(X) = ∫ ∫ x 4 x( x − y)dxdy
0 0
322 3
4 ∫0 ∫0
E(X) = x − x 2 ydxdy
2
32 x4 x3
E(X) = ∫ − y dy
40 4 3 0
32 24 23
E(X) = ∫ − y dy
40 4 3
32 8
E(X) = ∫
40
4 − ydy
3
2
3 8 y2
E(X) = 4y −
4 3 2 0
3 16
E(X) = 8−
4 3
E(X) = 6 - 4
E(X) = 2
f ( x, y ) = k x ( x − y ) 0 ≤ y ≤ x ≤ 2
Neste caso, a média será diferente de 2 (menor!). Para encontrá-la, faremos o mesmo
procedimento anterior, respeitados os novos limites de integração. Antes de calcular
E(x), teremos que encontrar o valor da constante k:
2 2
∫ ∫ f ( x, y)dxdy = 1
0 y
2 2
∫ ∫ kx( x − y)dxdy = 1
0 y
2 2
k ∫ ∫ ( x 2 − xy )dxdy = 1
0 y
2
2
x3 x2
k∫ − y dy = 1
0 3 2 y
2
8 y 3
y3
k∫ − − 2y + dy = 1
0 3 3 2
2
8 y3
k∫ + − 2 y dy = 1
0 3 6
2
8 y4
k y+ − y2 = 1
3 24 0
16 16
k + − 4 =1
3 24
128 + 16 − 96
k =1
24
2k = 1
1
k=
2
E(X) = ∫ ∫ xf ( x, y)dxdy
0 y
2 2
1
E(X) = ∫ ∫ x 2 x( x − y)dxdy
0 y
122 3
E(X) = ∫ ∫
20 y
x − x 2 ydxdy
2
1 2 x4 x3
E(X) = ∫ − y dy
20 4 3 y
12 y4 8 y4
2 ∫0
E(X) = 4 − − y + dy
4 3 3
12 8 y4
E(X) = ∫ 4 − y + dy
20 3 12
2
1 4y2 y5
E(X) = 4y − +
2 3 60 0
1 16 32
E(X) = 8− +
2 3 60
1 16 8
E(X) = 8− +
2 3 15
1 120 − 80 + 8
E(X) =
2 15
1 48
E(X) =
2 15
E(X) = 1,6
Multiplicando o resultado por 10, como pede o exercício, chegaríamos ao valor de 16.
B) Discreta
Y
X 1 3 5
2 0,1 0,2 0,3
4 0,2 0,1 0,1
Resposta:
Y 1 3 5 P(X)
X
2 0,1 0,2 0,3 0,6
4 0,2 0,1 0,1 0,4
P(Y) 0,3 0,3 0,4 1
Resposta:
Calculemos E(Y):
E(Y) = 1 × 0,3 + 3 × 0,3 + 5 × 0,4
E(Y) = 3,20
E E(Y2):
E(Y2) = 12 × 0,3 + 32 × 0,3 + 52 × 0,4
E(Y2) = 0,3 + 2,70 +10
E(Y2) = 13
VERDADEIRA
Resposta:
Sabemos que a covariância entre X e Y é igual à média dos produtos menos o
produto das médias:
cov(X,Y) = E(XY) - E(X)E(Y)
VERDADEIRA
Resposta:
Depois de termos resolvido o item (2) dessa questão, esse aqui fica muito fácil. Como
vimos, a covariância entre X e Y é negativa e, portanto, o coeficiente de correlação
também será negativo, ou seja, não poderá ser igual a 0,344 (que é um valor positivo).
Para os que desejarem calcular ρ XY , o seu valor é de aproximadamente -0,344 (cuidado,
pois, em módulo, o valor estaria correto):
cov( X , Y ) − 0,56
ρ XY = = ≅ -0,344
var( X ) var(Y ) 0,96 × 2,76
FALSA
FALSA
X
-1 0 1
-1 1/8 1/8 1/8
Y 0 1/8 0 1/8
1 1/8 1/8 1/8
Resposta:
Para calcularmos o coeficiente de correlação, devemos primeiro calcular a
covariância, que é dada por:
cov(X,Y) = E(XY) - E(X)E(Y)
Calculemos então E(X) e E(Y):
3 2 3
E(X) = -1 × +0 × +1 × = 0
8 8 8
Nota: sabendo-se que E(X) = 0, o cálculo da E(Y) torna-se desnecessário para essa
questão, já que 0 × E(Y) = 0. Mas, em todo caso:
3 2 3
E(Y) = -1 × +0 × + 1 × = 0
8 8 8
E para calcular E(XY), precisamos das probabilidades de XY:
2
P(XY = -1) =
8
4
P(XY = 0) =
8
2
P(XY = 1) =
8
Dessa forma:
2 4 2
E(XY) = -1 × + 0× + 1× = 0
8 8 8
Portanto:
cov(X,Y) = 0 - 0 = 0
E, se a covariância é zero, sabemos que o coeficiente de correlação também será igual a
zero:
cov(X, Y) 0
ρ xy = = =0
var(X)var(Y) var(X)var(Y)
VERDADEIRA
Lembrando que o produto bd, no denominador, deve estar em módulo, já que o desvio
padrão nunca é um número negativo.
FALSA
FALSA
Teorema de Tchebichev, Lei dos Grandes Números e
Teorema do Limite Central
(0) Uma variável aleatória X tem média zero e variância 36. Então, pela desigualdade
de Tchebychev, P (| X |≥ 10) ≤ 0,36 .
Resposta:
Pela desigualdade de Tchebichev, temos que:
var( X )
P( X − µ ≥ ε ) ≤
ε 2
VERDADEIRA
(1) Pela Lei dos Grandes Números a distribuição da média amostral de n variáveis
aleatórias independentes, para n suficientemente grande, é aproximadamente
Normal.
Resposta:
A Lei dos Grandes Números diz que a média amostral converge para a média
populacional quando a amostra é suficientemente grande, ou seja, que a média amostral
é um estimador consistente da média populacional. A afirmação feita neste item refere-
se ao Teorema do Limite Central.
FALSA
O que é equivalente a dizer que o valor estimado do parâmetro está próximo de seu
valor verdadeiro, com uma probabilidade muito elevada, quando n é grande. Dessa
forma, o limite da probabilidade (plim) do valor da estimativa do parâmetro ( θˆ ) menos
o seu valor verdadeiro ( θ ) ser maior que um número ε > 0 muito pequeno, tende a zero
quando n tende ao infinito:
[ ]
plim θˆ − θ > ε = 0
Ou, então:
[ ]
plim θˆ − θ < ε = 1
Dessa forma, dizer que um parâmetro é consistente, significa dizer que ele converge, em
probabilidade, para o seu valor verdadeiro.
VERDADEIRA
(3) A Lei dos Grandes Números está relacionada com o conceito de convergência em
probabilidade, enquanto que o Teorema Central do Limite está relacionado com
convergência em distribuição.
Resposta:
x p
→ y (x converge em probabilidade para y)
z d
→ w (z converge em distribuição para w)
E, como a Lei dos Grandes Números diz que à medida que o tamanho da amostra
aumenta, a média amostral converge para a média populacional, ela está relacionada ao
conceito de convergência em probabilidade:
x p
→ µx
O Teorema do Limite Central diz que à medida que o tamanho da amostra aumenta, a
distribuição da média amostral aproxima-se da distribuição normal. Portanto, está
relacionado ao conceito de convergência em distribuição:
x d
→ N ( µ x , σ 2 n)
VERDADEIRA
FALSA
(ANPEC 2004, 12) Suponha que x1 , x 2 ,........, x32 sejam 32 variáveis aleatórias
independentes, cada uma delas tendo distribuição de Poisson com λ = 8. Empregando o
teorema do limite central, estime a probabilidade de que a média amostral seja x ≤ 9 .
Use a tabela da distribuição Normal Padrão anexa. Multiplique o resultado por 100 e
transcreva a parte inteira.
Solução:
Pelo Teorema do Limite Central, sabemos que a média amostral, para amostras
suficientemente grandes, segue uma distribuição normal com média µ e variância igual
σ 2
P( x − µ ≤∈ ) ≥ 1 -
n ∈2
Que é uma das formulações da lei dos grandes números (MEYER, 1983, p. 287).
Nesse caso, a média amostral deve diferir da média populacional por menos de 0,1:
σ 2
P( x − µ ≤ 0,1 ) ≥ 1 -
n0,12
E como queremos estar 95% seguros, temos que:
σ 2
1- = 0,95
n0,12
Como a variância é igual a10:
10
1- = 0,95
0,01n
10
= 1 -0,95
0,01n
10
= 0,05
0,01n
0,0005 n = 10
10
n=
0,0005
n = 20.000
Dividindo o resultado por 1.000, chegaremos ao valor de 20.
(ANPEC 2003, 11) O número de clientes – Y – que passa diariamente pelo caixa de
um supermercado foi observado durante certo período. Constatou-se que o valor médio
de Y é de 20 clientes, com desvio padrão igual a 2. Encontre o limite mínimo para a
probabilidade de que o número de clientes amanhã se situe entre 16 e 24. (Pista: Utilize
o teorema de Tchebycheff). Multiplique o resultado por 100.
Solução:
Sabemos pelo teorema de Tchebichev que se conhecermos a média e o desvio
padrão de uma variável aleatória, poderemos estabelecer um limite para a sua
distribuição de probabilidade. O limite mínimo será dado por (SARTORIS, 2003,
p.115-116):
1
P(|x-µ| < kσ) ≥ 1 -
k2
Como o valor médio de Y é 20 e seu desvio padrão é 2, temos:
16 < Y < 24
20 – 4 < Y < 20 + 4
20 – 2×2 < Y < 20 + 2×2
µ – 2σ < Y < µ + 2σ
Então, a probabilidade de Y estar entre 16 e 24 é igual a probabilidade de Y estar 2
desvios-padrão acima ou abaixo da média e, portanto:
1
P(|x-µ| < 2σ) ≥ 1 - = 1 - 0,25 = 0,75
22
Multiplicando o resultado por 100, como pede o exercício, chegaremos ao resultado de
75.
(ANPEC 2002, 06) Indique se as seguintes considerações sobre a Lei dos Grandes
Números, Desigualdade de Tchebycheff e teorema do Limite Central são verdadeiras
(V) ou falsas (F).
P(|X-µ| ≥ ε) = 0
P(|X-µ| ≤ ε) = 1
Ou seja, a probabilidade de |X-µ| ser maior que um número ε (que pode ser um
número bem pequeno) é zero. E a probabilidade de |X-µ| ser menor que esse número é
1. Dessa forma, se a variância for nula, toda a distribuição estará concentrada em único
ponto, ou seja, na sua própria média. Portanto, quanto mais próxima de zero for a
variância de uma variável aleatória, mais a sua distribuição estará concentrada próxima
de sua média.
VERDADEIRA
(1) O teorema do Limite Central afirma que, para uma amostra grande o suficiente, a
distribuição de uma amostra aleatória de uma população Qui-quadrado se aproxima
da Normal.
Resposta:
O teorema do Limite Central afirma que para uma amostra grande o suficiente, a
distribuição da média amostral dessa população será normalmente distruibuída,
qualquer que seja a distribuição de probabilidade da população, ou seja, não se
restringe apenas a populações que tenham distribuição Qui-quadrado.
FALSA
lim
n→∞
P(| θˆ − θ |>∈) = 0 ou lim
n→∞
P(| θˆ − θ |<∈) = 1
E a lei dos grandes números nos diz que à medida que a amostra aumenta, a média
amostral converge para a média populacional. Aliás, uma das formulações da Lei dos
Grandes Números é dada por:
σ 2
P( x − µ ≤∈ ) ≥ 1 -
n ∈2
nA 1 1 P × (1 − P)
Var(fA) = σ2 = var = 2 var(nA) = 2 × n × P × (1-P) =
n n n n
Aplicando a desigualdade de Tchebichev à variável aleatória fA, temos:
P(1 − P)
P(|fA - P| ≥ ε) ≤ 1 - n
ε2
P(1 − P )
P(|fA - P| ≥ ε) ≤ 1 -
nε 2
É claro que o leitor não precisaria ter feito toda essa conta para concluir que a afirmativa
é falsa. Bastaria notar que o sinal de desigualdade está trocado.
FALSA
(ANPEC 2002, 15) Quantas vezes ter-se-á de jogar uma moeda equilibrada de forma a
se ter pelo menos 95% de certeza de que a freqüência relativa do resultado “cara” fique
a menos de 0,01 da probabilidade teórica ½, ou seja, de maneira que a amplitude do
intervalo de confiança da probabilidade teórica seja 0,02? (Utilize o teorema de
Tchebycheff. Divida a resposta por 1.000 e transcreva a parte inteira do número
encontrado).
Solução:
Pelo teorema de Tchebichev, temos que (veja questão ANPEC 2002, 06, item 3):
p(1 − p)
P[|fA - p| < ∈ ] > 1-
n ∈2
p(1 − p)
Portanto, para ∈=0,01 queremos encontrar n de modo que 1- seja igual a 95%:
n ∈2
0,5(1 − 0,5)
P[|fA - 0,5|< 0,01] >1-
n 0,012
Assim:
0,5(1 − 0,5)
1– =0,95
n 0,012
0,5(1 − 0,5)
= 1 – 0,95
n 0,012
0,25
= 0,05
0,0001n
0,000005 n = 0,25
0,25
n=
0,000005
25 × 10 −2
n=
5 × 10 − 6
n = 5× 104
n = 50.000
(ANPEC 2001, 13) Sabe-se que certa característica de uma população tem distribuição
Qui-quadrado com 18 graus de liberdade. Tendo sido extraída uma amostra de 25
elementos desta população, estime a probabilidade de que a média amostral X esteja no
intervalo 15 ≤ X ≤ 21. Use a tabela da distribuição Normal em anexo. Resposta em
percentagem, aproximando para o inteiro superior mais próximo.
Solução:
Sabemos que a distribuição Qui-quadrado tem média n e variância igual a 2n, onde n =
graus de liberdade. Portanto:
E(X) = µ = n = 18
var(X) = σ2 = 2n = 36
Pelo Teorema do limite Central sabemos que a média amostral segue uma
σ2
distribuição normal, com média µ e variância . Então, podemos utilizar a
n
distribuição normal para calcular a probabilidade pedida. Padronizando os valores para
podermos consultar a tabela, temos que:
x−µ 15 − 18 5
z1 = = = 3× = -2,5
σ 6 6
n 5
x−µ 21 − 18 5
z2 = = = 3× = 2,5
σ 6 6
n 5
(ANPEC 2001, 15) Seja uma variável aleatória X com média E(X) = 0 e variância σ x
2
= 25. Qual o limite de probabilidade para que [X – E(X)] > 10? Resposta em
percentagem.
Solução:
Da desigualdade de Tchebichev sabemos que:
1
P(|X-µ| > ∈ ) < 2 E(X-µ)2
∈
1
P[|X-E(X)| > 10] < σ X2
10 2
(0) A Lei Fraca dos Grandes Números diz que: dada uma variável aleatória com
distribuição arbitrária e média e variância finitas, a média amostral obtida a partir
de uma amostra aleatória de tamanho n terá distribuição Normal.
Resposta:
O enunciado acima diz respeito ao Teorema do Limite Central (com a ressalva que é
válido apenas para n suficientemente grande). A Lei Fraca dos Grandes números diz que
a média amostral converge em probabilidade para a média populacional à medida que o
tamanho da amostra aumenta, ou seja, diz que a média amostral é um estimador
consistente da média populacional.
FALSA
(1) Se X1, X2, ..., Xn são variáveis aleatórias independentes, com distribuição
Poisson(θ), θ > 0, então, para n "grande", é válida a seguinte aproximação:
___ __
√n ( X - θ) / θ ~ N(0,1), em que X é a média amostral.
Resposta:
Sabemos que na distribuição de Poisson a média é igual à variância. E, pelo
Teorema do Limite Central, sabemos que para n "grande", a média amostral segue a
θ θ
distribuição normal com média θ e variância dada por (e desvio padrão ). E para
n n
que a média siga uma distribuição normal padronizada, temos que subtrair a média e
dividir pelo desvio padrão. Portanto:
X −θ
~ N(0,1).
θ
n
FALSA
(2) Se X1, X2, ..., Xn são variáveis aleatórias independentes, com distribuição
Normal(µ,σ2), σ2 > 0, então, para qualquer tamanho de n,
___ __
√n ( X - µ) / σ ~ Normal(0,1), em que X é a média amostral.
Resposta:
VERDADEIRA
var( X )
P(|X-µ| ≤ ε) ≥ 1 -
ε2
P(|X-µ| ≤ ε) =1
(1) Seja X uma variável aleatória com média µ e variância σ2. Quando se considera o
evento complementar, uma das formas da desigualdade de Tchebycheff é igual a
1
P{ X − µ > kσ } ≥ 1 − 2 , onde k é um número real.
k
Resposta:
Sabemos que a desigualdade de Tchebichev pode ser escrita como (veja demonstração
em Sartoris (2003, p. 115-116)):
1
P(|X-µ| ≥ kσ)<
k2
Portanto, o evento complementar será dado por:
1
P(|X-µ| < kσ) ≥ 1 - 2
k
FALSA
(2) Se a população tem distribuição Normal, então a distribuição das médias amostrais
também será Normal, independente do tamanho da amostra.
Resposta:
Se a população for normalmente distribuída, então sua média amostral também será
normalmente distribuída, qualquer que seja o tamanho da amostra.
VERDADEIRA
(3) Se X tem distribuição desconhecida com média 500 e variância 2.500, para uma
amostra aleatória de tamanho 100 podemos afirmar que a média da amostra tem
distribuição aproximadamente normal com média 500 e variância 25.
Resposta:
Pelo Teorema do Limite Central sabemos que para amostras suficientemente
grandes, a média amostral segue uma distribuição normal com média µ e variância
σ 2 n . Portanto, nesse caso, temos que a média amostral terá aproximadamente uma
distribuição normal com média dada por:
E( X ) = 500
e variância dada por:
2.500
var( X ) = = 25.
100
VERDADEIRA
Estimação
∫ xβe
− βx
E(x) = dx
0
∞
E(x) = β ∫ xe βx dx
0
Utilizando o método de integração por partes (faça f (x) = x e g'(x) = e − βx )1, obtemos:
∞
− xe − βx − e − βx
E(x) = β −∫ dx
β β
0
∞
− xe − βx e − βx
E(x) = β −
β β2 0
1
E(x) =
β
1
Lembre-se que: ∫ f ( x) g ' ( x)dx = f ( x) g ( x) − ∫ g ( x) f ' ( x)dx
E, como sabemos, a média amostral é um estimador não-tendencioso da média
populacional, já que a média da média amostral é a própria média populacional:
∑X i
E( X ) = E i =1
1
E( X ) = E( X 1 + X 2 + … X n )
n
1
E( X ) = [E( X 1 ) + E( X 2 ) + … E( X n )]
n
1 1 1 1
E( X ) = + +…
n β β β
1 1
E( X ) = n
n β
1
E( X ) =
β
∫x
2
E(x ) = 2
f ( x)dx
0
∞
E(x2) = β ∫ x 2 e − βx dx
0
− x 2 e − βx 2 − xe − βx − e − βx
E(x ) = β
2
+ −∫ dx
β β β β 0
∞
− x 2 e − βx 2 − xe − βx e − βx
E(x2) = β + −
β β β β 2
0
∞
− x 2 e − βx 2 xe − βx 2e − βx
E(x ) =β
2
− −
β β 2
β 3
0
2β
E(x2) =
β 3
2
E(x2) =
β 2
Var( X ) =
n
1
Var( X ) =
nβ 2
f(xmínimo) = (nβ) e
− ( nβ ) x mínimo
1 1
Como a média de x é dada por e a variância é igual a , temos que a esperança
β β 2
1 1
e a variância
de mínimo( X 1 , X 2 ,........, X n ) será, por analogia, (faça os cálculos,
nβ (nβ )2
e confira!). Calculemos então o viés da estatística mínimo da amostra:
FALSA
1 n 2 n −1 2
(1) O valor esperado da estatística ∑ ( xi − x ) é igual a ( )σ , em que σ 2 é a
n i =1 n
variância da população. Então, um estimador não-tendencioso de σ 2 será
1 n 2
∑ ( xi − x ) .
n − 1 i =1
Resposta:
1 n 2
Sabemos que a estatística ∑ ( xi − x ) é realmente um estimador viesado de σ , já
2
n i =1
n −1 2
que seu valor esperado é dado por: σ , que é diferente de σ 2 . Um estimador não
n
1 n
2
tendencioso da variância é ∑ ( xi − x ) .
n − 1 i =1
1 n 2
Mas, em todo o caso, calculemos o valor esperado da estatística ∑ ( xi − x ) , ou
n i =1
seja, do estimador da variância populacional (é claro que no dia da prova você não precisa
fazer isso, desde que se lembre desse resultado!):
1 n
E( σ̂ 2 ) = E ∑
n i =1
(xi − x ) 2
1 n
E( σ̂ 2 ) = E[ ∑ (xi − x ) 2 ]
n i =1
n n
1
E( σ̂ 2 ) = E[ ∑ ( xi - µ)2 + 2(µ - x ) ∑ ( xi - µ) + n(µ - x )2]
n i =1 i =1
n
E como ∑ ( xi) = n x , temos que:
i =1
n
1
E( σ̂ 2 ) = E[ ∑ ( xi - µ)2 + 2n(µ - x )( x - µ) + n(µ - x )2]
n i =1
Ou:
n
1
E( σ̂ 2 ) = E[ ∑ ( xi - µ)2 – 2n(µ - x )(µ - x ) + n(µ - x )2]
n i =1
n
1
E( σ̂ 2 ) = E[ ∑ ( xi - µ)2 – 2n(µ - x )2 + n(µ - x )2]
n i =1
n
1
E( σ̂ 2 ) = E[ ∑ ( xi - µ)2 – n(µ - x )2]
n i =1
n
1
E( σ̂ 2 ) = {E[ ∑ ( xi - µ)2] – nE( x -µ)2}
n i =1
1 n
E( σ̂ 2 ) = [ ∑ E(xi - µ)2 – nE( x -µ)2]
n i =1
E sabemos que:
Dessa forma:
1 σ2
E( σ̂ 2 ) = [nσ2 - n ]
n n
1
E( σ̂ 2 ) = [nσ2 - σ2]
n
1 2
E( σ̂ 2 ) = σ (n-1)
n
n -1 2
E( σ̂ 2 ) = σ ≠ σ2
n
Portanto, σ̂ 2 é um estimador tendencioso de σ2. O estimador não tendencioso será
dado por:
1 n 2
s2 = ∑ ( xi − x )
n − 1 i =1
Já que:
1 n 1 n
1
E ∑
n − 1 i =1
( xi − x ) 2 =
n −1
E ∑ (x
i =1
i
− x)2 =
n −1
(n-1) σ2 = σ2
VERDADEIRA
(2) Suponha que a variável aleatória x seja uniformemente distribuída no intervalo [0, β],
em que β é um parâmetro desconhecido. O estimador de máxima verossimilhança de β
será β̂ =mínimo[ x1, x 2 ,........, x n ].
Resposta:
Se a variável é uniformemente distribuída no intervalo [0, β], sabemos que a sua
função densidade de probabilidade é dada por:
1 1
f ( x) = =
β −0 β
E β, obviamente, é o valor máximo que x pode assumir. Sendo assim, o estimador
de máxima verossimilhança de β, ou seja, aquele que dá a maior chance da amostra
pertencer de fato à uma população com distribuição uniforme, é, sem dúvida, β̂ =
máximo[x1, x2, … , xn].
FALSA
(3) Se dois intervalos de confiança que estão sendo comparados apresentam o mesmo
coeficiente de confiança, então se deve preferir aquele que apresenta a maior amplitude.
Resposta:
Dados dois intervalos com o mesmo coeficiente de confiança, o mais preciso será
aquele que apresentar menor amplitude (ou seja, que tiver menor margem de erro); dessa
forma, este deverá ser preferível.
FALSA
FALSA
(ANPEC 2003, 02) Sejam: X1, X2, ..., Xn variáveis aleatórias independentes e
n n
normalmente distribuídas com média µ e variância σ2; X = n −1 ∑ X i ; e Z = ∑ Yi 2 , em
i =1 i =1
E( X ) = E(n −1 ∑ X i )
i =1
E( X ) = n E ( X 1 + X 2 + … + X n )
−1
E( X ) = n −1 [E( X 1 ) + E( X 2 ) + … + E( X n )]
E( X ) = n −1 ( µ + µ + … µ )
E( X ) = n −1 nµ
E( X ) = µ
Cabe notar que nesse caso, como as variáveis são normalmente distribuídas, além de
ser não tendencioso, X é um estimador eficiente de µ.
FALSA
VERDADEIRA
i =1
Resposta:
(3) nX é uma variável aleatória normalmente distribuída com média nµ e variância σ2;
Resposta:
A média de nX será dada por:
E( nX ) = nE( X ) = nµ
FALSA
Yi
(4) a variável aleatória Wi = possui distribuição F com n1 e n2 graus de liberdade, em
Z
n
que n1 = 1 e n2 = 2n.
Resposta:
Note que a variável Wi é o quociente entre uma variável normal padronizada (Yi) e
uma variável que é a raiz quadrada da soma de n variáveis normais padronizadas ao
quadrado (ou seja, uma variável χ2) dividida por n. Portanto, Wi possui distribuição t de
Student com n graus de liberdade. O quociente entre duas variáveis aleatórias χ2
distribuídas independentemente e divididas por seus respectivos graus de liberdade, é que
segue uma distribuição F:
χ /k
2
F= k
~F
χ /n
2 k ,n
n
Cabe notar que, o quadrado de uma variável aleatória t de Student com n graus de
liberdade terá uma distribuição F com 1 e n graus de liberdade:
t n2 ~F1,n
Portanto, Wi 2 seguirá a distribuição F com 1 e n graus de liberdade.
FALSA
(ANPEC 2002, 04) Seja X uma variável aleatória com distribuição de probabilidade que
dependa do parâmetro desconhecido θ, tal que E(X) = θ. Seja também x1, x2, ..., xn uma
amostra aleatória de X.
nE
∂θ
- apresentam a propriedade de invariância, ou seja, se θˆ é um estimador de θ e g(θ) uma
função qualquer de θ, então g( θˆ ) será o estimador de g(θ);
- podem ser viesadas.
Portanto, para amostras suficientemente grandes, o estimador de máxima
verossimilhança de θ seguirá realmente a distribuição normal.
VERDADEIRA
n n
Resposta:
O estimador será não viesado se seu valor acertar, na média, o valor verdadeiro do
parâmetro, ou seja:
n
∑
E( θˆ ) = E( c x ) = θ
i =1
i i
E( θˆ ) = E( c x )∑i =1
i i
Se ∑c
i =1
i
=1, teremos que:
E( θˆ ) = θ
Nesse caso então, o estimador será realmente não-viesado.
Vejamos em que condições o estimador terá variância mínima. Para isso, primeiro
calculemos a variância de θˆ :
n
var( θˆ ) = var( c x )∑
i =1
i i
Portanto, para que θˆ tenha variância mínima, devemos minimizar var( θˆ ), sujeito a
n
restrição que ∑c
i =1
i
(= nci) seja igual a 1:
minimizar ( nc i2 )σ2
s.a. nci -1 = 0
∂L
= (nci -1) = 0
∂λ
∂L
= 2σ2nci - λ n = 0
∂c
Portanto, θˆ terá variância mínima entre os estimadores lineares não viesados quando ci =
1
.
n
VERDADEIRA
1 n
(2) Se θˆ = ∑ x i é um estimador não viciado de θ, então θˆ 2 também será um estimador
n i =1
não viciado de θ2 .
Resposta :
Já sabemos que θ̂ (estimador da média amostral) é um estimador não viesado da
média populacional, θ. Vejamos se θˆ 2 também será um estimador não viesado de θ2.
Sabemos que:
Ou seja, a variância é dada pela média dos quadrados menos o quadrado da média.
Rearranjando a expressão acima, temos que:
E( θˆ 2 ) = + θ2 ≠ θ2
n
Dessa forma, apesar de θ̂ ser um estimador não viesado de θ, θ̂ 2 é um estimador
viesado de θ2 (note, porém, que é assintoticamente não tendencioso).
Cabe notar que, em geral, se tivermos um estimador não tendencioso e desejarmos
obter uma estimativa para uma função g(.) qualquer desse estimador, se empregarmos
g( θˆ ), este poderá ser um estimador viesado de g(θ). Uma exceção ocorre quando g (.) for
uma função linear de θ (veja Questão ANPEC 1999, 06, item 1).
FALSA
FALSA
(4) Se θ̂1 e θˆ 2 são dois estimadores do parâmetro θ em que E ( θ̂ 1 ) = θ1 e E ( θ̂ 2 ) ≠ θ2
mas Var ( θ̂ 2 ) < Var ( θ̂ 1 ), então o estimador θ̂ 2 deve ser preferível a θ̂ 1 .
Resposta:
Quando comparamos dois estimadores não-viesados, devemos sim preferir aquele
que tiver menor variância. Porém, quando comparamos dois estimadores quaisquer, como
é o caso (já que θˆ 2 é um estimador viesado de θ), devemos preferir aquele que apresentar
menor erro quadrático médio, que é dado por:
Portanto, nesse caso, não dá para saber qual estimador é preferível, já que não temos
nenhuma informação sobre o valor do viés de θˆ 2 .
FALSA
(ANPEC 2001, 03) Uma amostra de tamanho n foi selecionada de uma população de m
elementos. Pode-se afirmar que :
FALSA
VERDADEIRA
σ2 1
(2) Se a população for finita, a variância da distribuição amostral de X é (1 − )
n n
porque as observações da amostra são independentes.
Resposta:
Evidentemente, se a população é finita, o tamanho da população (N) deveria
importar, o que não acontece na fórmula apresentada no enunciado. O fator de correção é
N −n σ2 N −n
dado por e, portanto, var( X ) = × , é a variância da média amostral
N −1 n N −1
quando a população é finita e a amostragem é feita sem reposição, já que nesse caso à
medida que forem sendo retirados elementos dessa amostra, a variância dos que restarem
será diferente. Se a população for infinita ou se for finita e a amostragem for feita com
reposição, esse "problema" não ocorrerá.
FALSA
(3) Se X for uma variável aleatória qualquer a distribuição de X será normal com média
µ e variância σ n − 1 .
2
Resposta:
Pelo Teorema do Limite Central, sabemos que a distribuição da média amostral, X ,
σ 2
será normal, com média µ e variância dada por , qualquer que seja a distribuição da
n
população, desde que a amostra seja aleatória e suficientemente grande.
FALSA
FALSA
(ANPEC 2000, 04) Seja X1, X2 , ..., Xn uma amostra aleatória da densidade
n
∑(X i
− µ)2
T= i =1
n
Como nesse caso, a média é igual a zero, temos que:
n
∑X
2
i
T = i =1
VERDADEIRA
∑X 2
i
E(T) = E i =1
1 n
E(T) = E ∑ X i2
n i =1
1
E(T) = E ( X 12 + X 22 + … + X n2 )
n
Note que E( X i2 ) é a própria variância populacional, θ, já que:
FALSA
n
(2) A variável aleatória Z = ∑ X i2 / θ tem distribuição qui-quadrado com n graus de
i =1
liberdade.
Resposta:
VERDADEIRA
(3) E ( X 12 X 23 ) = θ2.
Resposta:
Note que a expressão acima é a esperança do produto entre uma variável ao quadrado e
uma variável ao cubo. Portanto, o valor da esperança não poderá ser um quadrado de θ, que
é a variância.
FALSA
Para que T seja um estimador eficiente, ele deve ter a menor variância que qualquer
outro estimador não viesado.Se a média fosse desconhecida, um estimador não viesado para
a variância teria que Ter n – 1 no denominador (e não n), embora este último tenha
variância menor. Mas, como nesse caso, T é não viesado, e de fato, tem a menor variância,
é um estimador eficiente de θ.
VERDADEIRA
(ANPEC 2000, 07) Seja Y uma variável aleatória contínua com distribuição de
probabilidade f(y;θ), em que θ = (θ1,θ2 ,...,θp). Considere uma amostra aleatória de Y, com
tamanho n. Com relação à função de verossimilhança L(θ), é correto afirmar que:
n
(0) l(θ)= ln L(θ) = ∑ log f ( y i ;θ ) , em que ln é o logaritmo natural.
i =1
Resposta:
A função de verossimilhança é uma função dos parâmetros e é dada por:
L(θ;yi) = f(y1;θ) × f(y2;θ) × … × f(yn;θ)
VERDADEIRA
FALSA
FALSA
(3) Sendo Tn o estimador de máxima verossimilhança do parâmetro escalar θ1, segue-se
que Tn apresenta a seguinte propriedade:
lim n→∞ Pr(|T −θ |≥ε ) = 0 , ∀ ε > 0.
n 1
Resposta:
Essa é a propriedade de consistência, já que a expressão acima nada mais significa
que, à medida que o tamanho da amostra cresce, o valor estimado convergirá para o
valor verdadeiro. E como sabemos, os estimadores de máxima verossimilhança são
consistentes (confira as propriedades dos estimadores de máxima verossimilhança na
questão ANPEC 2002, 4, item 0)
VERDADEIRA
FALSA
VERDADEIRA
(1) Sob o critério do erro quadrado médio, para pequenas amostras, não há supremacia de um
estimador sobre o outro.
Resposta:
O erro quadrático médio é dado por:
EQM = var( θˆ ) + [viés( θˆ )]2
Calculemos, então, o EQM dos estimadores p̂ e ~ p . Para isso, primeiro calculamos o viés (se
houver) e a variância destes estimadores. Para o estimador p̂ temos que:
Y
E( p̂ ) = E
n
1
E( p̂ ) = E(Y)
n
Como a média de uma variável que tem a distribuição binomial é dada por n × p, temos que:
1
E( p̂ ) = × n × p
n
E( p̂ ) = p
Y
Var( p̂ ) = var
n
1
Var( p̂ ) = var(Y)
n2
E como a variância de uma variável que tem a distribuição binomial é dada por np(1-p):
1
Var( p̂ ) = 2 np(1-p)
n
p(1 − p)
Var( p̂ ) =
n
Como p̂ é um estimador não viesado, seu erro quadrático médio será igual à sua variância:
p(1 − p)
EQM( p̂ ) =
n
Y +1
Var( ~
p ) = var
n +1
1
Var( ~
p ) = var (Y + 1)
n +1
np(1 − p )
Var( ~
p)=
(n + 1)2
O erro quadrático médio de ~
p será dado então por:
EQM( ~
p ) = var( ~
p ) + [viés( ~
p )]2
np(1 − p )
2
1− p
EQM( ~
p)= +
(n + 1) 2
n +1
np(1 − p ) + (1 − p )
2
EQM( ~
p)=
(n + 1)2
EQM( ~
p)=
(1 − p )[np + (1 − p )]
(n + 1)2
Temos então que:
EQM ( pˆ ) n 2 + 2n + 1 n 2 + 2n + 1
= 2 = >1
EQM ( ~
p) n −n+n n2
Ou ainda, se p = 0:
EQM ( pˆ )
=0<1
EQM ( ~
p)
Sendo assim, há, sim, supremacia de um estimador sobre o outro para pequenas amostras.
FALSA
(2) O viés do estimador ~p é dado por [(1 − p ) (1 + n )] .
Resposta:
O viés de ~ p será dado por:
viés( p ) = E( ~
~ p)-p
np + 1
viés( ~
p)= -p
n +1
np + 1 − (n + 1) p
viés( ~
p)=
n +1
np + 1 − np − p
viés( ~
p)=
n +1
1− p
viés( ~
p)=
n +1
VERDADEIRA
(ANPEC 1999, 06) Com base na teoria da estimação, pode-se fazer as seguintes
afirmações :
(0) De acordo com o critério de eficiência, medido pela comparação entre as variâncias dos
estimadores, a média amostral X é preferível a primeira observação X 1 como
estimador da média populacional, supondo-se que σ 2 seja a variância da população.
Resposta:
E( X ) = µ
E(X1) = µ
Já a variância:
σ 2
Var( X ) =
n
2
Var(X1) = σ
Portanto, pelo critério de eficiência relativa, temos que a média amostral é preferível à
primeira observação, já que sua variância será menor que a variância de X1 para todo n > 1.
VERDADEIRA
(1) Seja θˆ um estimador não-viciado de θ . Se g( θˆ ) é uma função do parâmetro θ , então
E[g( θˆ )] ≠ g[E( θˆ )] com a igualdade ocorrendo somente quando g( θ ) for uma função
linear.
Resposta:
Na questão ANPEC 2002, 04, item (2), mostramos que, em geral, E[g( θˆ )] ≠ g[E( θˆ )].
Mostraremos agora, que E[g( θˆ )] = g[E( θˆ )] quando g( θ ) for uma função linear.
Considere a seguinte função linear de θ:
g(θ) = a + bθ.
VERDADEIRA
1
(2) A função densidade de probabilidade da variável aleatória x é dada por f ( x) = para
α
0 ≤ x ≤ α e 0 para outros valores. Assim sendo, considerando-se uma amostra aleatória
de tamanho n , x1 , x2 , x3 ⋅ ⋅ ⋅ ⋅, xn , o estimador de Máxima Verossimilhança de α será
igual ao Mínimo de x1 , x2 , x3 ⋅ ⋅ ⋅ ⋅, xn .
Resposta:
1
Se a f.d.p. de x é dada por f(x) = , sabemos que x é uniformemente distribuída e
α
que o parâmetro α é o valor máximo que x pode assumir. Portanto, o estimador de máxima
verossimilhança para α, ou seja, aquele que dá a maior chance dessa amostra pertencer de
fato a uma população cuja f.d.p é dada por f(x), é, sem dúvida, igual ao máximo de x1,
x2,x3, … ., xn.
FALSA
n
∑ (x
n
∑ (x i
− x) 2
i − x)2
(3) Dado que as variâncias das estatísticas S 1 = i =1
2 i =1
e S2 = são,
n −1 n
n
∑ (x i − x)2
2σ 4 2σ 4 n − 1 2 S2 = i =1
respectivamente , iguais a e ( ) , então n é mais
n −1 n −1 n
n
∑ (x
i =1
i − x)2
preciso do que S =
2
n embora seja uma estatística viciada.
Resposta:
Como é evidente, esta questão foi anulada pelo fato de aparecerem as mesmas estatísticas
na comparação entre elas. Se a segunda parte do enunciado fosse: "(...) então S2 é mais preciso
que S 12 , embora seja uma estatística viciada", a afirmativa seria verdadeira. Vejamos:
Sabemos que S 12 é uma estatística viesada da variância populacional, enquanto S1 não é
(veja questão 08/2004, item 1).Calculemos, então, as suas variâncias.
2σ 4
var( S 12 ) =
n −1
2σ 4
2
2 n −1
var(S ) = ×
n −1 n
ANULADA
(2) Seja X uma variável aleatória normalmente distribuída com média µ e variância σ2.
Sejam x1 e x2 duas observações de uma amostra aleatória de tamanho 2. Podemos
3x + 2 x 2
afirmar que µ~ = 1 é um estimador tendencioso de µ.
5
Resposta:
Um estimador é não tendencioso quando seu valor médio é igual a seu valor verdadeiro, ou
seja, E( µ~ ) = µ. Vejamos se isso é válido para o estimador µ~ :
3 x1 + 2 x 2
E( µ~ ) = E
5
3 x1 2 x2
E( µ~ ) = E +E
5 5
3 2
E( µ~ ) = E(x1) + E(x2)
5 5
3 2
E( µ~ ) = µ + µ
5 5
E( µ~ ) = µ
Portanto, µ~ é um estimador não-tendencioso de µ.
VERDADEIRA
lim
n→∞
[
P θˆ − θ ≤ ε = 1 ]
Dessa forma, as afirmações são realmente equivalentes.
VERDADEIRA
(1) Se x é uma variável aleatória com E(X) = µ e variância σ 2 , então a média amostral, X ,
será um estimador consistente da média populacional µ .
Resposta:
Sabemos que um estimador consistente é aquele que converge para o valor
verdadeiro do parâmetro à medida que o tamanho da amostra aumenta, ou seja, seu viés
(caso seja um estimador viesado) e sua variância vão desaparecendo. Sabemos que a média
amostral é um estimador não viesado da média populacional. Vejamos então o que acontece
com a variância à medida que o tamanho da amostra aumenta:
σ
lim n →∞ var( X ) = lim n →∞
2
=0
n
Portanto, a média amostral é um estimador consistente da média populacional.
VERDADEIRA
n
∑ (x
i =1
i − x)2
(2) A estatística, S 2 = , baseada em uma amostra aleatória x 1 , x 2 ,x 3 ,....,x n
n
é um estimador não tendencioso da variância populacional.
Resposta:
n
∑ (x i
− x)2
O estimador não tendencioso da variância é dado por i =1
(veja questãoANPEC
n −1
2004, 08, item 1).
FALSA
n
∑ (x
i =1
i − x)2
(3) A estatística, S 2 = , baseada em uma amostra aleatória x 1 , x 2 ,x 3 ,....,x n
n
é um estimador inconsistente da variância populacional.
Resposta:
Vimos que o estimador não viesado da variância populacional é dado por
n
∑ (x i
− x)2
i =1
. Mas, apesar de ser viesado, S2 é um estimador consistente da variância
n −1
populacional, já que à medida que o tamanho da amostra aumenta, não faz diferença dividir
por n ou por n – 1.
FALSA
Intervalo de confiança e testes de hipóteses
O que é equivalente a:
H0: o estoque provém da empresa A
H1: o estoque provém da empresa B
x−µ
=z
σ
n
170 − 169
=1
10
100
z=1
Resposta:
A probabilidade disso ocorrer é dada pela região cinza da figura abaixo, já que se os
valores amostrais estiverem nessa região, a hipótese nula, que é falsa, será aceita:
Calculemos então a área da região cinza da figura acima:
170 − 171
=1
10
100
FALSA
(2) A regra de decisão, ao nível de significância de 5%, será: se a duração média for
maior que 170,64 horas, as lâmpadas foram fabricadas pela empresa B; do
contrário, pela empresa A.
Resposta:
x − 169
= 1,64
10
100
x − µ = 1,64
R.A. = ]- ∞ , 170,64]
Então, se a duração média ( x ) for maior que 170,64, a hipótese nula deverá ser
rejeitada, ou seja, conclui-se que as lâmpadas foram fabricadas pela empresa B.
VERDADEIRA
(3) A probabilidade do erro do Tipo II, para o nível de significância de 5%, é 0,70.
170,64 − 171
= 0,36
10
100
FALSA
(4) Para este teste de hipótese, a função poder do teste é crescente com a média µ, da
distribuição sob a hipótese nula.
Resposta:
A potência (ou poder) de um teste é a probabilidade de rejeitar a hipótese nula
quando realmente ela é falsa. Sendo assim, dado que de fato µ não é µ0, ou seja, µ é
maior que µ0, o teste torna-se mais poderoso quanto mais distante o valor verdadeiro
da média µ for do valor hipotético µ0. Portanto, quanto maior for a média verdadeira µ,
maior será o poder do teste (pois será mais provável que rejeitemos a hipótese nula, que
sabemos ser falsa). Nesse caso, a função potência do teste é crescente com a média µ .
Considere o gráfico a seguir onde a região hachurada corresponde ao nível de
significância do teste e a região cinzenta, à probabilidade de cometer o erro do tipo II, já
que se os valores amostrais estiverem nessa região, a hipótese nula, que sabemos ser
falsa, será aceita. À medida que µ aumenta, a região cinza da figura aumenta e,
conseqüentemente, o poder do teste diminui. Dessa forma, a função potência do teste é
crescente com a média µ.
VERDADEIRA
FALSA
Resposta:
X −µ
= tc
s
n
s
X − µ = tc
n
s s
X + tc , X − tc
n n
Resposta:
σ σ
X +z ,X −z
n n
VERDADEIRA
(3) Num teste de hipótese: H 0 : µ = µ0 contra H a : µ ≠ µ0 , se o intervalo de confiança
estimado para a média µ não contiver o valor de µ 0 , então deve-se aceitar a
hipótese de que µ = µ0 .
Resposta:
Se o intervalo de confiança para a média não contiver o valor que está sendo testado,
então a hipótese nula deverá ser rejeitada. Note que o intervalo de confiança construído
corresponde à região de aceitação do teste (área mais escura da figura abaixo). Assim,
se µ 0 não estiver neste intervalo, a hipótese nula deverá ser rejeitada.
FALSA
FALSA
(ANPEC 2004, 2) Sejam X1, X2, ..., Xn variáveis aleatórias independentes e
normalmente distribuídas com média µ e variância σ2. Em relação ao teste de hipótese
da média H 0 : µ = µ0 contra H a : µ < µ 0 , são corretas as afirmativas:
(0) Se o p-valor do teste for menor que o nível de significância, α, a hipótese H 0 deve
ser rejeitada.
Resposta:
Suponha que o nível de significância escolhido (α) seja de 5%, como mostra o
gráfico abaixo. A região mais escura corresponde à região de aceitação do teste (RA),
isto é, à região em que não podemos rejeitar a hipótese nula, enquanto a região mais
clara, à de rejeição (RR) ou região crítica, isto é, à região na qual a hipótese nula deve
ser rejeitada.
Dessa forma, se o p-valor do teste, que é o nível de significância mais baixo com
o qual podemos rejeitar a hipótese nula, estiver na região de aceitação, não poderemos
rejeitar a hipótese nula. Mas se o valor-p estiver na região de rejeição, a hipótese nula
deverá ser rejeitada.
Suponha, por exemplo, que encontremos um p-valor de 3% para esse teste, que
corresponde à região hachurada do gráfico seguinte. Como o p-valor pertence à região
de rejeição do teste, devemos rejeitar a hipótese nula.
α = 5% → zt = –1,645
valor-p = 3% → zc = –1,88
Mas, se encontrarmos um valor-p de 30% para esse teste, como mostra o gráfico
a seguir, a hipótese nula não poderá ser rejeitada, já que estaremos na região de
aceitação do teste.
α = 5% → zt = –1,645
valor-p = 30% → zc = –0,52
Portanto:
Se valor-p > α → H0 não pode ser rejeitada.
Se valor-p ≤ α → H0 deve ser rejeitada.
O que é análogo a:
Se o valor calculado da estatística < valor tabelado → H0 não pode ser rejeitada
Se o valor calculado da estatística > valor tabelado → H0 deve ser rejeitada
VERDADEIRA
FALSA
(3)A função-potência para este teste de hipótese será uma função decrescente da
média µ .
Resposta:
A potência (ou poder) de um teste é a probabilidade de rejeitar a hipótese nula
quando realmente ela é falsa. Sendo assim, dado que de fato µ não é µ0, ou seja, µ é
menor que µ0, o teste torna-se mais poderoso quanto mais distante o valor verdadeiro
da média µ for do valor hipotético µ0. Portanto, quanto maior for a média verdadeira,
menor será o poder do teste (pois será mais provável que aceitemos a hipótese nula, que
sabemos ser falsa). Para que fique mais claro, considere a seguinte figura:
Sabemos que o valor verdadeiro é µ. Mas o valor que está sendo testado é µ0,
que é maior que µ. O nível de significância do teste está representado pela região
hachurada do gráfico acima. Porém, se os valores amostrais estiverem na área cinzenta,
a hipótese nula, que sabemos ser falsa, será aceita. Dessa forma, essa região representa a
probabilidade de cometermos o erro do tipo II. Note que quanto maior for a média
verdadeira, µ, maior será a probabilidade de cometer o erro do tipo II, já que maior será
a probabilidade de aceitarmos a hipótese nula que µ = µ0 (desloque a distribuição com a
verdadeira média para a direita e verifique). E como o poder do teste é a probabilidade
de não cometer o erro do tipo II, quanto maior for este último, menor será o poder do
teste:
VERDADEIRA
(ANPEC 2004, 6) Seja X uma variável aleatória normalmente distribuída com média µ
e variância conhecida σ2 =1, da qual se obtém a amostra aleatória X1, X2, ..., Xn (com n
observações). É correto afirmar que:
(0) A média amostral é uma variável aleatória normalmente distribuída com média µ e
variância 1/n.
Resposta:
Como a população é normalmente distribuída, a média amostral seguirá uma
σ 2
distribuição normal com média µ e variância dada por , qualquer que seja o tamanho
n
1
da amostra. E como σ2 = 1, temos que a variância será .
n
VERDADEIRA
Resposta:
O valor-p de um teste representa a probabilidade exata de cometer o erro do tipo
I, ou seja, de rejeitar a hipótese nula quando ela é verdadeira. É o nível de significância
mais baixo com o qual podemos rejeitar a hipótese nula. Portanto, ele não representa a
probabilidade de aceitação da hipótese nula. Ele representa a probabilidade de estarmos
errados rejeitando a hipótese nula.
ANULADA
VERDADEIRA
FALSA
VERDADEIRA
FALSA
(ANPEC 2002, 05) Indique se as seguintes considerações sobre a teoria dos testes de
hipótese são verdadeiras (V) ou falsas (F).
(0) O erro do tipo II é definido como a probabilidade de não se rejeitar uma hipótese
nula quando esta for falsa e o erro do tipo I é definido como a probabilidade de se
rejeitar a hipótese nula quando esta for verdadeira.
Resposta:
Note que o erro do tipo II e o erro do tipo I não são probabilidades de nada. O
erro do tipo II consiste em não rejeitar a hipótese nula quando esta for falsa e o erro do
tipo I consiste em rejeitar a hipótese nula quando esta for verdadeira.
ANULADA
(2) Num teste de hipótese bi-caudal, o valor-p (ou valor de probabilidade) é igual a duas
vezes a probabilidade da região extrema delimitada pelo valor calculado da
estatística do teste.
Resposta:
Note que a afirmação acima é válida apenas para distribuições simétricas. Caso a
distribuição seja assimétrica, como a Qui-quadrado ou a F, devemos calcular a
probabilidade das duas regiões extremas delimitadas pelo valor calculado da estatística
do teste, já que essas duas regiões não serão iguais.
FALSA
(3) Não se pode realizar um teste de hipótese para a variância populacional pois a
estatística do teste, que segue uma distribuição Qui-quadrado com n -1 graus de
liberdade (n é tamanho da amostra), não é simétrica.
Resposta:
É possível sim realizar testes de hipóteses para a variância populacional; aliás
isso é muito feito em economia. O fato de ser ou não simétrica não impede a realização
de um teste de hipóteses. A diferença é que teremos valores diferentes para as caudas
direita e esquerda.
O gráfico abaixo mostra a distribuição χ2 com 5 graus de liberdade. Se
desejarmos realizar um teste bicaudal para a variância, teremos que encontrar os valores
críticos tanto da cauda esquerda quanto da direita, já que esses valores não são iguais
para distribuições assimétricas.
FALSA
(4) No teste de hipótese para a média (H0: µ = 0 contra Ha: µ ≠ 0), ao nível de
significância α, se o intervalo de confiança com 1-α de probabilidade não contiver
µ = 0, não se poderá rejeitar H0.
Resposta:
Supondo que o nível de significância do teste seja α, se o intervalo de confiança
de 1-α não contiver µ = 0, a hipótese nula deverá ser rejeitada (já que o valor que está
sendo testado não pertence à região de aceitação). Nesse caso, não há evidência
suficiente de que µ seja realmente igual a zero.
Considere o gráfico abaixo. Se o valor que está sendo testado estiver na região
mais escura, que é a região de aceitação, então H0 não pode ser rejeitada. Se estiver na
região mais clara, que é a região de rejeição, então H0 deve ser rejeitada.
FALSA
FALSA
(2) O mais baixo nível de significância ao qual a hipótese nula pode ser rejeitada é
3x10 −3 .
Resposta:
Como já vimos, o valor-p é o nível de significância exato do teste, ou seja, o
nível mais baixo ao qual podemos rejeitar a hipótese nula; e nesse caso, é de fato igual a
3× 10-3.
VERDADEIRA
VERDADEIRA
FALSA
variância dada por , desde que a amostra seja aleatória e suficientemente grande.
n
Portanto, podemos utilizar a distribuição normal padronizada para estimarmos o
intervalo de confiança da média populacional, qualquer que seja a distribuição da
população, desde que tenhamos uma amostra suficientemente grande.
FALSA
(2) Para aumentar a precisão de uma estimativa por intervalo, o pesquisador deve
aumentar o intervalo de confiança de 95% para 99%, por exemplo.
Resposta:
Para aumentar a precisão de uma estimativa por intervalo, o pesquisador deve
aumentar o tamanho da amostra. Aliás, aumentar o intervalo de confiança de 95% para
99% irá diminuir a precisão da estimativa por intervalo, já que os valores críticos para
níveis de confiança maiores também serão maiores e, sendo assim, a margem de erro
será maior.
FALSA
VERDADEIRA
(4) Sendo x = 14 a média de uma amostra aleatória de 36 elementos extraída de uma
população normal cujo desvio padrão é σ = 2, o intervalo de confiança da média
populacional, a 95%, será 14 ± 0,55. Use a tabela da distribuição Normal em
anexo.
Resposta:
Como queremos um intervalo com 95% de confiança, temos que consultar a
tabela da distribuição normal para área igual a 0,475, cujo valor é de 1,96.
Portanto, o intervalo com 95% de confiança para a média populacional será dado
por:
IC95% = [14 ± 0,65]
FALSA
(ANPEC 2001, 07) Sobre testes de hipóteses, pode-se afirmar que:
(0) O erro do tipo I consiste em rejeitar a hipótese nula quando ela é verdadeira.
Resposta:
Como já vimos anteriormente, esta é realmente a definição do erro do tipo I
("condenar um inocente").
VERDADEIRA
FALSA
VERDADEIRA
(3) A opção pelo teste unilateral ou bilateral decorre da expectativa teórica sobre o
parâmetro que estiver sendo testado.
Resposta:
Se tivermos alguma idéia sobre a direção em que o valor verdadeiro difere do
valor que está sendo testado, utilizamos o teste unilateral. Caso contrário, utilizamos o
teste bilateral.
VERDADEIRA
(4) Um intervalo de confiança de 100(1-α)% também pode ser utilizado para o teste de
significância de um parâmetro populacional, caso o teste seja bilateral.
Resposta:
Se construirmos um intervalo de confiança para a média podemos utilizá-lo
para testar hipóteses. Nesse caso, o intervalo de confiança é chamado de região de
aceitação do teste, e a hipótese nula será aceita se o valor testado estiver dentro dessa
região e será rejeitada caso contrário. Note que, se o intervalo de confiança ou o teste de
hipótese for para a proporção, isto não é exatamente válido, já que as variâncias em
cada caso serão diferentes.
VERDADEIRA
(ANPEC 2000, 05) Dadas as seguintes afirmativas sobre testes de hipóteses, é correto
dizer que:
(0) A probabilidade do erro tipo I é calculada utilizando-se a estatística de teste, para
cujo cálculo presume-se que a hipótese nula é falsa.
Resposta:
A probabilidade (máxima) do erro tipo I é definida a priori pelo pesquisador, ou
seja, ela não precisa ser calculada. O que podemos calcular utilizando a estatística do
teste, é o valor-p, ou seja, a probabilidade exata de cometer o erro do tipo I (rejeitar a
hipótese nula quando ela é verdadeira).
FALSA
VERDADEIRA
(3) A aceitação de determinada hipótese nula implica que esta hipótese seja verdadeira.
Resposta:
A aceitação de determinada hipótese nula não implica que esta hipótese seja
realmente verdadeira. O que podemos dizer é que, dada a informação disponível, não é
possível contestar tal hipótese.
FALSA
(4) O poder de um teste é a probabilidade de se rejeitar a hipótese nula quando esta for
falsa.
Resposta:
O poder de um teste é a probabilidade de não cometer o erro do tipo II, ou seja,
rejeitar a hipótese nula quando realmente ela é falsa.
VERDADEIRA
(ANPEC 2000, 09) Uma urna contém bolas azuis e bolas verdes. Para testar a hipótese
de que a proporção de bolas azuis é igual a proporção de bolas verdes, obteve-se uma
amostra de 64 bolas, com reposição, anotando-se as cores das bolas retiradas e
adotando-se a seguinte regra: aceitar a hipótese de que a urna possui iguais proporções
de bolas azuis e verdes se forem retiradas entre 28 e 36 (inclusive os extremos) bolas de
uma mesma cor; rejeitá-la caso contrário. Calcule a probabilidade de se cometer um erro
do tipo I. (Multiplique o resultado por 100 e arredonde).
Solução:
H0: p = 0,5
H1: p ≠ 0,5
E o desvio-padrão:
0,25 0,5
dp ( pˆ ) = = = 0,0625
64 8
R.A.[0,4375;0,5625]
Já que:
28 36
= 0,4375 e = 0,5625
64 64
E a margem de erro, dessa forma, é igual a 0,0625 (0,5 + 0,0625 = 0,5625 e 0,5 - 0,0625
= 0,4375). Isso significa que:
0,0625 = z × 0,0625
0,0625
z= =1
0,0625
(ANPEC 1999, 07) O candidato X a governador de certo estado afirma que detém mais
de 45% das intenções de voto do eleitorado na próxima eleição. Para verificar a
veracidade da informação, o candidato Y mandou realizar um levantamento estatístico
utilizando, para tanto, uma amostra aleatória de 625 eleitores. O resultado do
levantamento foi o seguinte:
(0) A afirmação do candidato X é verdadeira com base num teste de hipóteses, para um
nível de significância de 5%.
Resposta:
As hipóteses nesse caso são:
H0: p = 0,45
H1: p < 0,45
p̂ − 0,45
= 1,645
0,02
p̂ − 0,45 = 1,645 × 0,02
p̂ − 0,45 ≅ 0,033
255
E como o valor que foi encontrado na amostra (0,408 = ) não pertence à região de
625
aceitação, podemos rejeitar a hipótese nula a 5% de significância, isto é, a afirmação do
candidato X não é verdadeira.
FALSA
(1) Com uma confiança de 90%, o intervalo de confiança para a verdadeira proporção
de intenções de voto para o candidato Y é (39%; 46%), arredondando para números
inteiros as percentagens encontradas.
Resposta:
Com 90% de confiança temos que z = 1,645:
265
p̂ = = 0,424
625
E o desvio-padrão:
Dessa forma:
p̂ − p
= 1,645
dp(p̂)
0,424 − p
= 1,645
0,02
0,424 − p = 1,645 × 0,02
0,424 − p = 0,0329
VERDADEIRA
(2) Com a mesma confiança de 90%, o intervalo estimado para a verdadeira proporção
de intenções de voto para o candidato X é (38%; 44%), arredondando para números
inteiros as percentagens encontradas.
Resposta:
E o desvio-padrão:
dp( pˆ ) = 0,00039 ≅ 0,0004 = 0,02
Como o intervalo é novamente com 90% de confiança, temos que o valor crítico é
de 1,645. Portanto:
p̂ − p
= 1,645
dp(p̂)
0,41 − p
= 1,645
0,02
0,41 − p = 1,645 × 0,02
0,41 − p = 0,0329
VERDADEIRA
(3) A afirmação de que o candidato Y detém mais de 42% das intenções de voto é
verdadeira, com base num teste de hipóteses com nível de significância de 1%.
Resposta:
Nesse caso, as hipóteses são:
H0: p = 0,42
H1: p > 0,42
E o desvio-padrão:
dp( pˆ ) = 0,00039 ≅ 0,02
Portanto:
p̂ − p
= 2,33
dp(p̂)
p̂ − 0,42
= 2,33
0,02
p̂ - 0,42 = 2,33 × 0,02
p̂ - 0,42 = 0,0466
R.A. = ]- ∞ ; 47%]
Como a proporção encontrada na amostra (42,4%) pertence à R.A., não podemos
rejeitar a hipótese nula, ou seja, a afirmação não pode ser contestada a 1% de
significância.
FALSA
Portanto:
x−µ
= 1,96
σ
n
n = 96,04
Dessa forma, o tamanho da amostra necessário para estimarmos µ com uma
margem de erro de R$5,00 é de 96.
(ANPEC 1999, 10) Com relação a teoria de Teste de Hipóteses, pode-se afirmar que :
FALSA
(1) Um teste de hipótese é dito o mais poderoso se tem o maior poder do que qualquer
outro teste, ainda que os níveis de significâncias sejam diferentes.
Resposta:
Dado um nível de significância, um teste é dito o mais poderoso se tiver o
maior poder que qualquer outro. Não se pode comparar o poder de dois testes que
possuam níveis de significâncias (ou tamanhos) diferentes, já que, dado o tamanho da
amostra, quando aumentamos o nível de significância, diminuímos a probabilidade de
cometer o erro do tipo II (β) e, portanto, aumentamos o poder do teste ( que é dado por
1–β).
FALSA
VERDADEIRA
(3) A estatística t-Student é utilizada nos testes de hipóteses para a média populacional
quando a variância dos elementos da população, σ 2 ,não é conhecida.
Resposta:
Quando a variância não é conhecida, ou seja, quando ela tem que ser estimada, e
a amostra é pequena, a distribuição t de Student é a utilizada nos testes para a média
populacional. Note, porém, que quando a amostra for grande, não fará diferença utilizar
a distribuição normal ou a t, já que esta última se aproxima da normal padronizada à
medida que o tamanho da amostra aumenta.
VERDADEIRA
(ANPEC 1998, 09) Uma máquina está sendo examinada com o objetivo de substituir a
máquina antiga de certa indústria. Segundo o fabricante da nova máquina, a proporção
(P) de peças defeituosas produzida é de 3% ou menos. Uma amostra de 2.000 peças foi
examinada e foram encontradas 74 peças defeituosas.
H0: P = 0,03
HA: P > 0,03
FALSA
Pˆ − P
= 1,645
dp ( Pˆ )
Pˆ − 0,03
= 1,645
0,0038
Pˆ − 0,03 = 0,006251
Pˆ − P
= 1,96
dp ( Pˆ )
0,037 − P
= 1,96
0,0042
0,037 − P = 1,96× 0,0042
0,037 − P ≅ 0,008232
VERDADEIRA
(3) Admitindo que a verdadeira proporção de peças defeituosas seja 3%, seria
necessário uma amostra de 3.000 peças para que o erro máximo admissível entre a
proporção estimada e a verdadeira não excedesse a 1%, com probabilidade de 95%.
Resposta:
Para 95% de confiança, temos que:
Pˆ − 0,03
= 1,645
dp( Pˆ )
0,0291
Portanto, a margem de erro será dada 1,645× . E como ela não pode exceder
n
1%, temos que:
0,0291
1,645× = 0,01
n
0,0291 0,01
=
n 1,645
0,0291
≅ 0,00608
n
Elevando ao quadrado:
0,0291
= 0,000037
n
0,0291
n= = 786,49
0,000037
Portanto, seria necessária uma amostra com 787 peças para que o erro máximo fosse de
1%.
FALSA
Yi = β 0 + β1 X 1i + β 2 X 2i + ei
σ2
var( βˆ j ) = n
∑x
i =1
2
ij ×(1 − R 2j )
2 2
onde R é o R de uma regressão entre xj e todas as outras variáveis independentes do
j
modelo original (incluindo o intercepto). Se R 2j for alto, isso significa que xj está
altamente correlacionada com uma ou mais variáveis incluídas no modelo original. E
quanto mais alto for R 2j , mantendo σ 2 e a variância de xj constantes, maior será a
variância do parâmetro estimado, e menor será a sua estatística t. Sendo assim, tende-se
realmente a aceitar a hipótese nula de que β j = 0, já que a estatística t é subestimada.
VERDADEIRA
∑ rˆ ji yi
βˆ j = i =1
n
∑ rˆ
i =1
2
ji
Vejamos:
Analogamente:
x 2i = φ1 x1i + r2i
x 2i = xˆ 2i + rˆ2i
As condições de 1ª. ordem do método dos mínimos quadrados ordinários são dadas por:
∂SQR
(
= 2 x1i y i − βˆ1 x1i − βˆ 2 x 2i = 0 )
∂β̂ 1
∂SQR
(
= 2 x 2i y i − βˆ1 x1i − βˆ 2 x 2i = 0 )
∂β̂ 2
Substituindo, temos:
(
2( xˆ1i + rˆ1i ) y i − βˆ1 x1i − βˆ 2 x 2i = 0 ) ( )
2( xˆ 2i + rˆ2i ) y i − βˆ1 x1i − βˆ 2 x 2i = 0
(
rˆ1i y i − βˆ1 x1i = 0 ) (
rˆ2i y i − βˆ 2 x 2i = 0 )
n n
∑ rˆ 1i yi ∑ rˆ 2i yi
β̂1 = i =1
n
βˆ 2 = i =1
n
∑ rˆ
i =1
2
1i ∑ rˆ
i =1
2
2i
Já que:
n
x̂ ji não é correlacionado com ei ( ∑ xˆ ji ei = 0 );
i =1
n
r̂ ji é não correlacionado com x ki ( ∑ rˆji x ki ), com j ≠ k;
i =1
∑x
i =1
rˆ =
ji ji
i =1
ji
i =1
Substituindo agora yi em β̂ 1 :
n
∑ rˆ (β xi1 1 1i + β 2 x 2 i + ei )
β̂1 = i =1
n
∑ rˆ
i =1
2
i1
n n n
β1 ∑ rˆi1 x1i + β 2 ∑ rˆi1 x 2i + ∑ rˆi1ei
β̂1 = i =1
n
i =1 i =1
∑ rˆi =1
2
i1
n n
β1 ∑ rˆ12i ∑ rˆ e 1i i
β̂1 = n
i =1
+ i =1
n
∑ rˆ
i =1
2
i1 ∑ rˆi =1
2
1i
∑ rˆ e 1i i
β̂1 = β1 + i =1
n
∑ rˆ
i =1
2
1i
∑ rˆ e 1i i
var( β̂ 1 ) = var β1 + i =1
n
∑ rˆ
i =1
2
1i
∑ rˆ e 1i i
var( β̂ 1 ) = var i =1
n
∑ rˆ
i =1
2
1i
∑ rˆ 2
1i
var( β̂ 1 ) = i =1
2
var(ei )
n
∑ rˆ
i =1
2
1i
σ2
var( β̂ 1 ) = n
∑ rˆ
i =1
2
1i
n
Sabemos que ∑ rˆ
i =1
2
1i é a soma dos quadrados dos resíduos (SQR) da regressão de x1 em
x 2 . Dessa forma:
SQR = SQT – SQE
SQE
SQR = SQT 1 −
SQT
SQR = SQT 1 − R12 ( )
(
SQR = x12i 1 − R12 )
Onde R12 é o coeficiente de determinação da regressão de x1 em x 2 . Assim:
σ2
var( β̂ 1 ) =
∑ x (1 − R )
n
2 2
1i 1
i =1
Generalizando:
σ2
var( βˆ j ) = n
∑x i =1
2
ij (1 − R 2j )
VERDADEIRA
(2) Se os erros são heterocedásticos, ainda assim os testes usuais t e F podem, sem
prejuízo algum, ser empregados para se testar a significância dos parâmetros do
modelo, caso estes sejam estimados por Mínimos Quadrados Ordinários.
Resposta:
A hipótese de homocedasticidade (variância constante dos erros) é necessária para que
os estimadores de MQO sejam eficientes e para que os testes de hipóteses tenham
validade. Assim, se os erros forem heterocedásticos, os testes t e F não serão válidos,
independentemente do tamanho da amostra.
FALSA
Yi * = Yi + ε i
onde ε i corresponde ao erro de mensuração da variável dependente.
Yi * = β 0 + β1 X 1i + β 2 X 2i + ei + ε i
Yi * = β 0 + β1 X 1i + β 2 X 2i + (ei + ε i )
Yi * = β 0 + β1 X 1i + β 2 X 2i + µ i
O novo termo de erro µ i é composto do erro da equação (ei) mais o erro de medida da
variável Yi ( ε i ). Dessa forma, a variância de µ i será dada por:
var( µ i ) = var(ei) + var( µ i )
var( µ i ) = σ e2 + σ µ2
Que é maior que a variância do erro da regressão sem o erro de medida. E como vimos
no item anterior, a variância do estimador do coeficiente de inclinação j é dada por:
σ2
Var( βˆ j ) = n
∑x
i =1
2
ij ×(1 − R 2j )
Portanto, quanto maior a variância dos erros, maior será a variância dos coeficientes de
inclinação. E, como erros de medida na variável dependente aumentam a variância dos
erros, aumentam também as variâncias dos estimadores de mínimos quadrados
ordinários dos coeficientes de inclinação, β̂ 1 e βˆ 2 .
FALSA
Vejamos:
Yi = β 0 + β1 X 1i + β 2 X 2i + ei
Yi = β 0 + β1 X 1i + µ i
em que:
µ i = ei + β 2 X 2 i
Para sabermos se os estimadores desse modelo são não viesados, precisamos calcular as
respectivas esperanças.
βˆ0 = Y − βˆ1 X 1
E o de β 1 :
∑x 1i yi
β̂1 = i =1
n
∑x
i =1
2
1i
Calculemos primeiro E( β̂ 1 ):
∑x 1i yi
E( β̂ 1 ) = E i =1
n
∑x
i =1
2
1i
n
E ∑x
i =1
1i yi
E( β̂ 1 ) = n
∑x
i =1
2
1i
n
Calculemos então E ∑x
i =1
1i yi :
∑ x1i yi = E ∑ (X 1i − X )(Yi − Y ) = E ∑ Yi (X 1i − X 1 ) − Y ∑ (X 1i − X 1 )
n n n n
E
i =1 i =1 i =1 i =1
∑ (X − X 1 ) = 0:
n
Como 1i
i =1
∑ Y (X − X1 )
n n
E ∑ x1i yi = E
i =1 i =1
i 1i
∑ Yi (X 1i − X 1 ) = E ∑ (X − X 1 )(β 0 + β 1 X 1i + β 2 X 2i + ei )
n n
E 1i
i =1 i =1
E β 0 ∑ (X 1i − X 1 ) + β 1 ∑ (X 1i − X 1 )X 1i + β 2 ∑ (X 1i − X 1 )X 2i + ∑ (X 1i − X 1 ) ei
n n n n
i =1 i =1 i =1 i =1
E β 1 ∑ ( X 1i − X 1 )X 1i + β 2 ∑ ( X 1i − X 1 )X 2i + ∑ ( X 1i − X 1 ) ei
n n n
i =1 i =1 i =1
∑ (X − X 1 )X 1i .
n
Analisemos agora o primeiro somatório da expressão acima: 1i
i =1
∑ (X − X 1 )(X 1i − X 1 + X 1 ) = ∑ (X − X 1 ) + X 1 ∑ (X 1i − X ) = ∑ (X 1i − X 1 )
n n n n
2 2
1i 1i
i =1 i =1 i =1 i =1
Analogamente (verifique!):
∑ (X − X 1 )X 2i = ∑ (X − X 1 )(X 2i − X 2 )
n n
1i 1i
i =1 i =1
y i = E β 1 ∑ ( X 1i − X 1 ) + β 2 ∑ (X 1i − X 1 )(X 2i − X 2 ) + ∑ ( X 1i − X 1 ) ei
n n n n
∑x
2
E 1i
i =1 i =1 i =1 i =1
Como X1 e X2 são não correlacionados com o termo de erro ei e a média dos erros é
igual a zero, temos:
E β 1 ∑ ( X 1i − X 1 ) + β 2 ∑ (X 1i − X 1 )(X 2i − X 2 )
n n
2
i =1 i =1
E, portanto:
E β1 ∑ (X 1i − X 1 ) + β 2 ∑ (X 1i − X 1 )(X 2i − X 2 )
n n
2
i =1 i =1
E( β̂ 1 ) = n
∑x
i =1
2
1i
∑x 1i x 2i
E( β̂ 1 ) = β 1 + β 2 i =1
n
∑x i =1
2
1i
Como Y = β 0 + β1 X 1 + β 2 X 2 :
∑x 1i x 2i
E( βˆ0 ) = β 0 + β1 X 1 + β 2 X 2 - X 1 β1 + β 2 i =1
n
∑x i =1
2
1i
∑x 1i x 2i
E( βˆ0 ) = β 0 + β 2 X 2 − X 1 i =1
n
∑x i =1
2
1i
Portanto, para que βˆ0 seja não viesado, isto é, para que E( βˆ0 ) = β 0 , deve-se verificar
n
∑x 1i x 2i
que X2 − X 1
i =1
n
= 0. A não existência de correlação entre as variáveis X2 e X3
∑x
i =1
2
1i
não garante que o estimador do intercepto seja não viesado. Além disso, deve-se
verificar que X 2 seja igual a zero.
FALSA
(ANPEC 2005, 11) É dada a seguinte função de produção para determinada indústria:
ln(Yi ) = β 0 + β 1 ln( Li ) + β 2 ln( K i ) + u i ,
em que Y é o valor adicionado por firma (em reais), L é o trabalho empregado, K é o
valor do capital (em reais) e u é o termo aleatório. Uma amostra aleatória de 27
observações leva às seguintes estimativas:
R 2 = 0,76
São corretas as afirmativas:
(0) Se Y passasse a ser medido em mil reais, somente o valor estimado do intercepto da
regressão seria alterado.
Resposta:
onde α = β 0 − ln(1000).
VERDADEIRA
A forma R2 do teste F é dada por (veja questão ANPEC 2002, 10, item (3)):
R 2 /(k − 1) 0,76 1
F= = = 76
(1 − R ) /(n − k ) 0,24 24
2
Consultando a tabela da distribuição F com 1 grau de liberdade no numerador e 24 no
denominador, encontramos que: F1,24 = 4,26. Como o valor calculado é maior que o
valor tabelado, rejeitamos a hipótese nula a 5% de significância, ou seja, a regressão é
válida, o que significa que os coeficientes do capital e trabalho são conjuntamente
diferentes de zero.
FALSA
0,3856 − β 2
~t24
0,0854
β 2 = [0,3856 ± t 24 × 0,0854]
FALSA
(3) Os valores estimados permitem concluir que, para aquela indústria, a produtividade
marginal do trabalho é menor que a produtividade média do mesmo fator.
Resposta:
∂Y
PMgL = = γ × 0,6022 × L−i 0,3978 × K i0,3856
∂L
E a produtividade média do trabalho:
VERDADEIRA
(4) Qualquer outra forma funcional que leve a um R2 maior que 0,76 será preferível à
utilizada.
Resposta:
O R2 não pode ser utilizado para comparar modelos com diferentes variáveis
dependentes. Por exemplo, se estimássemos um modelo linear para Y, o R2 nos daria a
informação de quanto da variação de Y é explicada pela variação nas variáveis
explicativas. Já no modelo log-log, o R2 nos diz quanto da variação em lnY é explicada
pela variação nas variáveis explicativas.
FALSA
∑x y i i
β̂1 = i =1
n
∑x
i =1
2
i
onde:
xi = (Xi – X )
yi = (Yi – Y )
Dessa forma:
n
∑x y * * ∑w x w y2 i 1 i
βˆ * = = i =1
∑x
1 *2 n
∑ (w x )
2
2 i
i =1
n
w1 ∑ xi y i
βˆ1* = i =1
n
w2 ∑ xi2
i =1
w1
βˆ1* = β̂1
w2
βˆ0 = Y − β̂1 X
Dessa forma:
βˆ0* = Y * − βˆ1* X *
w1 ˆ
βˆ0* = w1Y − β 1 w2 X
w2
βˆ0* = w1Y − w1 β̂1 X
βˆ0* = w1 (Y − βˆ1 X )
βˆ0* = w1 β̂ 0
FALSA
SQR
∑ ei2
σ̂ 2 = = i =1
n−2 n−2
Dessa forma:
n
∑e *2
i
σ̂ *2 = i =1
n−2
∑ (w e ) 1 i
2
σ̂ *2 = i =1
n−2
n
w12 ∑ ei2
σ̂ *2 = i =1
n−2
σ̂ *2 = w12σ̂ 2
VERDADEIRA
(2) As variâncias dos estimadores dos parâmetros do primeiro modelo são maiores do
que as variâncias dos estimadores do segundo modelo.
Resposta:
A variância de β̂ 1 (coeficiente de inclinação) é dada por:
σˆ 2
Var( β̂ 1 ) = n
∑ xi2 i =1
E de βˆ1* :
ˆ σˆ *2
Var( β )=
*
1 n
∑x
i =1
*2
i
∑ (w x )
2
2 1
i =1
2
w1
Var( βˆ )=
*
1 var(βˆ1 )
w2
∑X i
2
Var( βˆ0 ) = σ̂ 2 i =1
n
n∑ xi2
i =1
E a variância de βˆ0* :
n
∑X *2
i
Var( βˆ0* ) = σ̂ *2 i =1
n
n∑ xi*2
i =1
Substituindo:
n
∑ (w 2 Xi )
2
i =1
var( βˆ0 )<var( βˆ0* ) var( βˆ0 )<var( βˆ0* ) var( βˆ0 )<var( βˆ0* )
w1>1
var( β̂ ) <var( βˆ * )
1 1 var( β̂ ) >var( βˆ * )
1 1 var( β̂ ) =var( βˆ * )
1 1
var( βˆ0 )>var( βˆ0* ) var( βˆ0 )>var( βˆ0* ) var( βˆ0 )>var( βˆ0* )
w1<1
var( β̂ ) <var( βˆ * )
1 1 var( β̂ ) >var( βˆ * )
1 1 var( β̂ ) =var( βˆ * )
1 1
Assim, as variâncias dos estimadores dos parâmetros do primeiro modelo apenas serão
maiores do que as do segundo se w1 < 1 e w1 < w2.
FALSA
SQR
∑e 2
i
R2 = 1 − = 1− i =1
n
SQT
∑y
i =1
2
E do segundo:
n n
∑ (w1ei )2 ∑e 2
i
R*2 = 1 − i =1
n
=1 − i =1
n
= R2
∑ (w y ) ∑y
2 2
1
i =1 i =1
VERDADEIRA
Resposta:
VERDADEIRA
(ANPEC 2005, 14) Considere o seguinte modelo para a população: Y = 2 + 4X – 5Z +
u, em que u é o termo aleatório e E (u | X , Z ) = E (u ) = 0 . A partir de uma amostra de n
indivíduos, estimaram-se os parâmetros deste modelo, tendo, todavia, sido omitida a
variável Z. Ou seja, o modelo estimado foi: Yˆi = θˆ 0 + θˆ 1 X i . Suponha ainda que, para
amostra em questão, tenham sido obtidos os seguintes resultados:
n
∑ (Z i − Z )( X i − X )
1 n 1 n
i =1
n
= 0,7 , em que X = ∑ i
n i =1
X e Z = ∑ Zi .
n i =1
∑(X
i =1
i − X )2
( )
Calcule E θˆ1 | X . Multiplique o resultado por 10.
Solução:
∑x y i i
E( θˆ1 ) = E i =1
n
∑x
i =1
2
i
Yˆi = 2 + 4 X i − 5Z i
−
Y = 2 + 4 X − 5Z
y i = 4 xi − 5 z i
∑ x (4 xi i − 5zi )
E( θˆ1 ) = E i =1
n
∑x
i =1
2
i
∑ 4x 2
i − 5 z i xi
E( θˆ1 ) = E i =1
n
∑x i =1
2
i
n n
∑ xi2 ∑z x i i
E( θˆ1 ) = E 4 i =1
n
−5 i =1
n
∑x
i =1
2
i ∑x
i =1
2
i
∑ (Z − Z )(X i − X )
n
i
E( θˆ1 ) = E 4 − 5 i =1
∑ (X − X)
n
2
i
i =1
∑ (Z i − Z )( X i − X )
Como i =1
n
= 0,7 , temos:
∑(X
i =1
i − X) 2
E( θˆ1 ) = E (4 − 5 × 0,7 )
E( θˆ1 ) = 4 – 3,5
E( θˆ1 ) = 0,5
FALSA
(ANPEC 2004, 14) Um pesquisador estimou uma regressão múltipla com 5 variáveis
independentes e n = 56, mas na pressa, não imprimiu os resultados e anotou apenas o
valor do R2 = 0,90, o coeficiente de determinação. Este pesquisador precisa verificar se
a regressão é significante. Ajude-o, calculando o valor da estatística do teste a ser
empregado.
Solução:
Para verificarmos se a regressão é significante, precisamos calcular a estatística F. E
como nos foi fornecido o R2 dessa regressão, deveremos utilizar a forma R2 da
estatística F, que é dada por (veja questão ANPEC 2002, 10, item (3)):
R 2 /(k − 1) 0,90 / 5
F= = = 90
(1 − R ) /(n − k ) 0,10 / 50
2
Portanto, o valor da estatística do teste a ser empregado é de 90. E com esse valor,
podemos concluir que a regressão é estatisticamente significante.
(ANPEC 2003, 06) Considere o modelo de regressão linear múltipla para dados
seccionais
y i = β 0 + β 1 x1i + β 2 x 2 i + + β k x ki + u i , i = 1,… , n.
(1) a hipótese que Var (u i | x1i , x 2 i ,…, x ki ) = σ 2 , i = 1,…, n , não é necessária para que
os estimadores de mínimos quadrados sejam consistentes;
Resposta:
A hipótese de que a variância seja constante (homocedasticidade) é necessária para
que os estimadores sejam eficientes e para fazer inferência estatística com o modelo de
regressão (mesmo assintoticamente). A consistência dos estimadores de MQO necessita
apenas das hipóteses de que os erros têm média zero e que nenhuma das variáveis
explicativas tenha correlação com o termo de erro.
VERDADEIRA
FALSA
(ANPEC 2003, 7) O método dos mínimos quadrados ordinários foi empregado para
estimar o modelo de regressão abaixo, cujo objetivo é explicar as variações de renda
entre 526 indivíduos:
log(renda) = 0,417− 0,297 sexo + 0,080 educ + 0,029 exper − 0,00058 exper 2 + u,
( 0 , 099 ) ( 0 , 036 ) ( 0 , 007 ) ( 0 , 005 ) ( 0 , 00010 )
R = 0,441, n = 526,
2
em que sexo é uma variável dicotômica (valor 1, se for homem e 0, caso contrário),
educ é o número de anos de escolaridade, exper é experiência profissional, também
medida em anos. Os números entre parênteses são os erros-padrão das estimativas
( sbi i = 0,.,..
,1 .,4) . Com base nos resultados acima, é correto afirmar:
βˆ − 0,297
t= = = −8,25
sβ 0,036
Com 521 graus de liberdade (n - k = 526 - 5), podemos, sem dúvida, rejeitar a hipótese
nula de que o coeficiente é igual a zero e, portanto, a diferença de renda entre homens e
mulheres é sim estatisticamente significante.
FALSA
FALSA
(3) a significância conjunta das variáveis educ e exper não pode ser medida por meio da
estatística t. Para isto, o teste F deve ser utilizado;
Resposta:
O teste t é adequado para testar significâncias individuais. Se quisermos realizar um
teste de significância conjunta, o teste F é que deve ser utilizado, já que ele leva em
consideração o fato que os estimadores de mínimos quadrados podem ser
correlacionados. Por isso, o teste F para significância conjunta das variáveis educ e
exper pode levar a resultados diferentes do teste t para significância individual de cada
uma dessas variáveis.
VERDADEIRA
(4)o modelo é incapaz de captar diferenças nos retornos da educação entre homens e
mulheres.
Resposta:
Note que o modelo inclui uma variável dummy de intercepto para sexo, que capta
diferenças na renda entre homens e mulheres (o intercepto da reta de regressão será
diferente entre os sexos). Para que o modelo fosse capaz de captar diferenças nos
retornos da educação entre homens e mulheres, precisaríamos de uma variável dummy
de inclinação, ou seja, uma variável binária multiplicando a variável educação deveria
ser incluída no modelo:
log(renda) = α + β1sexo + β2 educ + β3 exper + β4 exper2 + β5sexo × educ + ε
Sendo assim, o retorno da educação seria dado por:
β̂ educ + β̂ sexo × educ
2 5
Se o indivíduo for homem, o retorno será β̂ 2 + β̂ 5 educ, e se for mulher será β̂ 2 educ.
Dessa forma, conseguiremos captar diferenças nos retornos da educação entre homens e
mulheres.
VERDADEIRA
(ANPEC 2002, 9) Pode-se afirmar sobre o modelo de regressão linear clássico yt= β1
+ β2 xt + ut
(0) A reta de regressão passa pelas médias amostrais de y e x, mesmo que o modelo não
tenha intercepto.
Resposta:
O estimador de mínimos quadrados ordinários para o intercepto é dado por:
β̂ 1 = y t − β̂ 2 xt
Portanto, temos a garantia de que a reta de regressão passa pelas médias amostrais de y
e x apenas se o intercepto estiver incluído no modelo. A estimação do modelo por MQO
sem o termo constante não possui essa propriedade.
FALSA
(1) Na presença de heterocedasticidade, o estimador de MQO é viesado e não se pode
confiar nos procedimentos de testes usuais (F e t), já que o estimador além de
viesado, é ineficiente.
Resposta:
A presença de heterocedasticidade no modelo não causa viés no estimador de
MQO. Os estimadores de MQO apenas serão viesados se forem violadas as hipóteses
que os erros têm média zero e/ou que não há correlação entre as variáveis explicativas e
o erro. Como a hipótese de homocedasticidade é necessária para a demonstração do
teorema de Gauss-Markov, se for violada, os estimadores de MQO serão sim
ineficientes. Além disso, como o estimador da variância será viesado na presença de
heterocedasticidade, não poderemos confiar nos testes de hipóteses usuais (t e F),
mesmo assintoticamente.
FALSA
(3) Quanto maior for a variação da variável explicativa, maior será a precisão com que
o coeficiente angular pode ser estimado.
Resposta:
Suponhamos o caso extremo em que não haja variação da variável explicativa, ou
seja, ela assume apenas um valor. Nesse caso, não conseguiremos explicar a variação da
variável dependente através dessa variável explicativa (já que essa não varia). Aliás,
será mesmo impossível estimar o modelo. O diagrama de dispersão entre X e Y será
uma linha horizontal, como mostra o gráfico abaixo.
Y8
7
6
5
4
3
2
1
0 X
0 1 2 3 4
Para que possamos explicar a variação de Y, a variável explicativa deve variar (!), e
quanto maior for a sua variação, com mais precisão poderemos estimar o coeficiente
angular.
VERDADEIRA
(4) Se R2 (coeficiente de determinação) for zero, então a melhor previsão para um valor
de y é sua média amostral.
Resposta:
Se o R2 é igual a zero, então a SQE = 0, ou seja, ∑ ŷ 2
= βˆ 2 ∑ x 2 = 0. Portanto, β̂ 2 =0.
β̂ = y
1
E:
y = β̂ 1 + 0x2 = β̂ 1 = y
Sendo assim, se R2 for igual a zero, a melhor previsão para y será a sua própria média
amostral.
VERDADEIRA
(ANPEC 2002, 10) É correto afirmar a respeito do modelo de regressão linear clássico
multivariado: Y = Xγ + ε , com n observações e k > 2 variáveis explicativas, incluindo-
se o intercepto.
(0) Os coeficientes de inclinação não se alteram quando se modificam as unidades de
medida de Y e X multiplicando-os por uma constante, por exemplo, transformando-
se seus valores de reais para dólares.
Resposta:
Quando alteramos as unidades de medida tanto da variável dependente quanto da (s)
independente(s), as estimativas de seus coeficientes de inclinação não se alteram; o
intercepto porém deverá ser multiplicado por essa constante, assim como os resíduos.
Por exemplo, suponha que multipliquemos Y e X por c:
Note que, nesse caso, os parâmetros estimados não serão alterados (se dividirmos
todos por c, retornaremos ao modelo original).
VERDADEIRA
(1) Se o modelo for estimado com apenas k-1 variáveis explicativas (mas mantendo o
intercepto), os coeficientes estimados poderão ser viesados e inconsistentes.
Resposta:
Se a variável retirada for relevante (e for correlacionada com alguma outra variável
explicativa), teremos o problema de omissão de variável relevante, o que causa viés e
inconsistência nos estimadores de mínimos quadrados ordinários. Veja também questão
ANPEC 2004, 11, itens 3 e 4).
VERDADEIRA
(3) Para testar a hipótese conjunta de que γ 2 = γ 3 = ... = γ k = 0 , pode-se utilizar o teste
R 2 (k − 1)
Fα ; ( k −1), ( n − k ) = , em que R2 é o coeficiente de determinação do
[(1 − R )(n − k )]
2
modelo.
Resposta:
Podemos sim utilizar o teste F para testar essa hipótese. Mas vejamos se essa "forma
R2" da estatística F está correta.
SQR
R2 = 1 -
SQT
(ANPEC 2001, 9) A partir de uma amostra de n elementos, foi estimada uma regressão
linear simples, pelo método de mínimos quadrados, obtendo-se os resultados:
Yˆt = αˆ + βˆ1 X t αˆ ≠ 0
R 12 = K1
A seguir, a mesma regressão foi estimada sabendo-se que a reta de regressão da
população passa pela origem das coordenadas (termo constante = 0), obtendo-se os
resultados:
Yˆt = βˆ 2 X t
R 22 = K 2
Pode-se afirmar que:
(0) β̂ 1 = β̂ 2
Resposta:
O estimador de mínimos quadrados do coeficiente de inclinação de uma regressão com
intercepto é dado por:
n
∑(X t
− X )(Yt − Y )
β̂ =
1
t =1
n
∑ (Y
t =1
t
− Y )2
∑ XY
β̂ =
2
t =1
n
∑Y
t =1
2
FALSA
Resposta:
Se realmente a reta de regressão passa pela origem, então a equação sem o intercepto
fornecerá uma estimativa mais precisa do coeficiente angular e, portanto, o seu desvio-
padrão será menor. Note, porém, que se o intercepto não estiver realmente ausente do
modelo, as estimativas obtidas serão viesadas.
VERDADEIRA
∑Y 2
E o R2 da primeira regressão é:
K1 = R =2 βˆ ∑(X − X )
2
1
2
∑ (Y − Y )
2
K2
=
∑Y 2
βˆ ∑ ( X − X )
2
K1 2
1
∑ (Y − Y )
2
A divisão será maior que 1 apenas se o numerador for maior que 1. Sabemos que
∑ X 2 ≥ ∑ ( X − X ) 2 . Isso poderia nos levar a concluir que a afirmativa está correta.
Porém, note que os valores de β̂ das duas regressões não são iguais, e não podemos
saber qual é maior. Portanto, nada se pode afirmar sobre a razão entre essas duas
medidas.
FALSA
(4) A soma dos resíduos de mínimos quadrados de ambas equações estimadas é zero.
Resposta:
Consideremos primeiro o modelo com intercepto:
Yt = α + β 1 X t + ε t
minimizar ∑ εˆ 2 = minimizar ∑ (Y − αˆ − βˆ X )
2
Note que o termo entre parênteses são os próprios resíduos da regressão. Utilizando (I),
temos que:
-2 ∑ εˆ = 0
Dessa forma:
∑ εˆ = 0
Portanto, quando o intercepto estiver incluído no modelo, a soma dos resíduos será igual
a zero.
Vejamos agora o que acontece quando o intercepto não está incluído no modelo:
Yt = β 2 X t + µ t
A condição de primeira ordem é dada por:
dµˆ
= - 2 ∑ (Y − βˆ 2 X ) X = 0
dβˆ 2
-2 ∑ ( µˆ X ) = 0
∑ (µˆ X ) = 0
Portanto, quando o intercepto não está incluído no modelo, a soma dos resíduos não
será igual a zero.
FALSA
FALSA
VERDADEIRA
∑x y i i
β̂ =
2
i =1
n
∑xi =1
2
i
xi
Fazendo c = n
, temos que (assumindo que xi seja fixo e que, portanto, possamos
∑x
i =1
2
i
β̂ =
2 ∑c y
i =1
i i
VERDADEIRA
(ANPEC 2000, 06) Seja o modelo de regressão linear clássico com duas variáveis
explicativas X2 e X3: Yi= β1 + β2 X2i + β3 X3i + ui . É correto afirmar que:
Resposta:
Quando a correlação entre X2 e X3 for igual a zero, o estimador de MQO de uma
regressão múltipla será igual ao estimador da regressão simples. Vejamos:
Temos o seguinte modelo (o subscrito "i" foi omitido por simplicidade).
Y = β1 + β2X2 + β3X3 + ε
O método dos MQO consiste em minimizar a soma dos quadrados dos resíduos:
minimizar ∑ ε 2 = ∑ (y − β x 2 − β 3 x3 )
2
2
∂∑ ε 2
∂β̂ 3
=- ∑ 2x (y − β 3 2
x 2 − β 3 x3 ) = 0
= - ∑ x3 y + βˆ 2 ∑ x 2 x3 + βˆ 3 ∑ x32 = 0
= βˆ 2 ∑ x 2 x3 + βˆ 3 ∑ x32 = ∑ x3 y (II)
βˆ ∑ x x + βˆ ∑ x
2 2 3 3
2
3
= ∑x y 3
3
2
2
2
2 2 3 3
2
2
β̂ =
∑ x y∑ x x − ∑ x y∑ x
2 2 3 3
2
2
3
(∑ x x ) − ∑ x ∑ x 2 3
2
2
3 x
x
β̂ =
∑ x y − βˆ ∑ x x
2 3 2 3
∑x
2 2
2
Substituindo β̂ 3 , temos:
β̂ =
∑ x y − ∑ x y∑ x x − ∑ x y∑ x × ∑ x x
2 2 2 3 3
2
2 2 3
2
∑x (∑ x x ) − ∑ x ∑ x
2
2 ∑x 2 3
2
2
2 2
3
2
2
∑ x y + − ∑ x y (∑ x x ) + ∑ x y ∑ x ∑ x x
2
2
β̂
∑ x [(∑ x x ) − ∑ x ∑ x ]
2 2 2 3 3 2 2 3
=
∑x
2 2 2
2 2 2
2 2 2 3 2 3
∑ x y (∑ x x ) + ∑ x y ∑ x ∑ x − ∑ x y (∑ x x ) + ∑ x y ∑ x ∑ x x
2 2
2 2 2
β̂
∑ x [(∑ x x ) − ∑ x ∑ x ]
2 2 3 2 2 3 2 2 3 3 2 2 3
2
= 2
2
2 2
2 2 3 2 3
β̂ =
∑ x y∑ x + ∑ x y∑ x x
2
2
3 3 2 3
2
(∑ x x ) − ∑ x ∑ x 2 3
2
2
2
2
3
β̂ =
∑x ∑x ∑x
2
2
2
2
2
3
∑x ∑x
2 2 2
1−
2 3
∑x ∑x x
x
2
3
β̂ =
∑ x y∑ x − ∑ x y∑ x x
2
2
3 3 2 3
∑ x ∑ x (1 − ρˆ )
2 2 2 2
2 3 23
Se ρ̂ 23 (coeficiente de correlação entre X2 e X3) = 0 a expressão acima torna-se:
∑ x y∑ x − ∑ x y∑ x x = ∑ x y − x y ∑ x x
2
β̂ = ∑
2 3 3 2 3 2 2 3
∑x ∑x ∑x ∑x ∑x
2 2 2 2 3 2 2
2 3 2 2 3
Analisemos a expressão
∑ x x . Elevando o numerador ao quadrado, temos que:
2 3
∑x ∑x 2
2
2
3
(∑ x x ) [∑ ( X − X )( X − X )] = cov( X , X ) = ρ̂
2 2 2
2 3 2 2 3 3
= 2 3 2
∑ x ∑ x ∑(X − X ) ∑(X − X )
2 2 2 2 23
2 3 2var( X ) var( X )
2 3 3 2 3
Portanto, β̂ 2 será:
∑ x y = ∑ ( X − X )(Y − Y )
2 2 2
= estimador do coeficiente de inclinação de uma
∑x ∑(X − X )
2
2 2 2
2
regressão simples.
VERDADEIRA
(1) Mesmo que a correlação entre X2 e X3 seja igual à unidade, pode-se estimar β2 +
cβ3, em que c é uma constante conhecida.
Resposta:
Quando a correlação entre as variáveis X2 e X3 for igual a 1, temos o problema de
multicolinearidade perfeita e o modelo não poderá ser estimado (veja a expressão
para β̂ 2 no item anterior).
Porém, façamos X3 = cX2. Nesse caso, o modelo torna-se:
Yi = β1 + β2X2i + β3(cX2) + ui
Yi = β1 + (β2 + cβ3)X2i + ui
Note que o "problema" foi eliminado. Agora temos uma regressão que pode ser
estimada, já que não há nenhuma variável explicativa perfeitamente correlacionada
com outra.
VERDADEIRA
(2) A eficiência relativa dos estimadores de MQO, dentro da classe dos estimadores
lineares não viesados, garantida pelo Teorema de Gauss Markov, necessita da
hipótese de normalidade do erro (ui ).
Resposta:
A hipótese de normalidade do erro não é necessária para que se garanta a eficiência
dos estimadores de MQO dentro da classe dos estimadores lineares. Como já
sabemos, essa hipótese é necessária para que se garanta a eficiência dos estimadores
de MQO dentro da classe de todos os estimadores, não apenas os lineares e também
para que se possa realizar testes de hipóteses com o modelo de regressão (em
amostras finitas).
FALSA
(ANPEC 2000, 10) O seguinte modelo de regressão foi estimado utilizando-se dados
trimestrais entre 1979 e 1998, inclusive:
^
Yi = 2.20 + 0.104 X2i
A soma total explicada foi 100,5. Quando esta equação foi re-estimada, adicionando-se
três “dummies” sazonais, a soma total explicada aumentou para 114,5 e a soma do
quadrado dos resíduos foi igual a 20,00. Suponha que deseja-se testar se a sazonalidade
é significativa. Calcule a estatística de teste adequada.
Solução:
Temos que:
Modelo I (com 1 variável explicativa):
SQE = 100,5
SQR = 34
SQT = 134,5
n = 80
SQRR − SQNR 34 − 20
m 3 14 75
F= = = × =17,5
SQRNR 20 3 20
n−k 80 − 5
Considerando apenas a parte inteira do resultado acima, chegaremos ao valor de 17.
(0) Variando-se o preço em 1%, a quantidade demandada variará 10β2%, ceteris paribus.
Resposta:
Como temos um modelo log-log, ou seja, um modelo no qual todas as variáveis estão em
logaritmo, β2 nos dá a variação relativa no preço dada uma variação relativa na quantidade:
∆%Q
β̂ 2 =
∆% P
Se o preço variar em 1%:
∆%Q
β̂ 2 =
1%
∆%Q = β̂ 2
Portanto, variando-se o preço em 1%, a quantidade demandada variará em β2%.
FALSA
(1) Ignorando-se o termo aleatório, se o preço ultrapassar determinado limite, será possível
obter quantidades demandadas negativas.
Resposta:
Note que não existe ln de número negativo e, portanto, será impossível obter quantidades
demandadas negativas.
FALSA
(2) Se mudarmos as unidades de Q e P para dólares americanos, então a estimativa de β2
na nova equação será igual a sua estimativa obtida na equação em Reais.
Resposta:
Quando mudamos as unidades de medida tanto da variável dependente quanto da(s)
variável(is) independente(s), os coeficientes de inclinação do modelo não são alterados
(veja questão ANPEC 2002, 10, item 0).
VERDADEIRA
(ANPEC 1999, 4) Seja o seguinte modelo de regressão linear múltipla na forma matricial:
Y = X .β + ε ,
onde as dimensões das matrizes e dos vetores envolvidos são: Y => (n × 1); X => (n × k);
β => (k × 1); e ε => (n × 1).
FALSA
(1) Outro pressuposto básico é: nenhuma das variáveis independentes deve estar
perfeitamente correlacionada com qualquer outra variável independente ou com
qualquer combinação linear de outras variáveis independentes.
Resposta:
Um dos pressupostos básicos do modelo de regressão linear é que nenhuma variável
explicativa deve ser perfeitamente correlacionada com outra variável explicativa, ou seja,
não deve existir multicolinearidade perfeita. Essa hipótese é necessária para que possamos
efetivamente estimar o modelo, já que se ela não for verificada, a estimação será
impossível. Na questão ANPEC 2000, 06, item 0, mostramos que β̂ 2 em uma regressão
múltipla com 3 variáveis é dado por:
β̂ =
∑ x y∑ x − ∑ x y∑ x x
2
2
3 3 2 3
∑ x ∑ x (1 − ρˆ )
2 2 2 2
2 3 23
VERDADEIRA
(2) As equações normais de mínimos quadrados para o modelo dado podem ser
apresentadas em notação matricial como ( X 'Y ) = ( X ' X ) β e a solução para β será
β = ( X ' X ) −1 ( X 'Y ) .
Resposta:
(X'Y) = (X'X) β̂
A hipótese nula realmente é de que todos os coeficientes de inclinação sejam iguais a zero.
Porém a hipótese alternativa é de que pelo menos um desses coeficientes seja diferente de
zero.
FALSA
estimado de βi .
Resposta:
Sabemos que:
| βˆ i − 0 |
~ t n−k
s β̂i
Portanto, o intervalo de confiança para β̂ i será dado por:
( βˆ ± t s )
i n−k βˆi
VERDADEIRA
(ANPEC 1999, 05) Foram encontrados os seguintes resultados para estimar uma
regressão linear com duas variáveis explicativas para uma amostra de tamanho 10.
Variáveis Coeficiente Desvio Estatística p-valor
preditoras padrão “t’
Constante 223,3 254,8 0,88 0,410
X1 -1,26 0,8263 -1,52 0,172
X2 -1,03 3,213 -0,32 0,752
VERDADEIRA
(1) A um nível de significância de 5% podemos afirmar que a regressão existe. Porém, após
elaborarmos os testes de hipóteses para os coeficientes individuais, aceitamos a
hipótese (a um nível de significância de 1%) de que o coeficiente para a variável X2 é
zero.
Resposta:
Para uma amostra de tamanho 10, o valor de 15,1 da estatística F nos permite afirmar que a
regressão é realmente estatisticamente significante a 5%, ou seja, ela existe. Porém, não só
a variável X2 não é significante a 1%, como X3 e o intercepto também, já que os valores-p
para todos os coeficientes ultrapassam 0,01.
VERDADEIRA
(2) O coeficiente de determinação indica que 81,2% da variação amostral de Y podem ser
atribuídos as variações de X1 e X2.
Resposta:
Como o valor do R2 é de 81,2%, sabemos que 81,2% da variação amostral de Y é explicada
por variações em X1 e X2.
VERDADEIRA
(4) Os valores teóricos das estatísticas “t” utilizadas para testar os coeficientes das
variáveis explicativas devem ser calculados para 7 graus de liberdade.
Resposta:
Como temos 10 observações e 3 coeficientes desconhecidos, os graus de liberdade serão
realmente 7.
VERDADEIRA
(1) Se µs e µt são independentes para todo t ≠ s , então dentro da classe dos estimadores
lineares não tendenciosos, os estimadores de Mínimos Quadrados de α, β1 e β2 são os
melhores.
Resposta:
Na questão ANPEC 2004, 11, item (0), elencamos as hipóteses que garantem que os
estimadores de mínimos quadrados ordinários são os melhores dentro da classe dos
estimadores lineares não viesados (MELNV). O próprio enunciado dessa questão já nos diz
que as 3 primeiras hipóteses são satisfeitas, ou seja, os erros têm média zero e variância
constante e os valores das variáveis explicativas são fixos em amostras repetidas (o que
garante que as variáveis explicativas não são correlacionadas com o erro). Portanto para
que os estimadores sejam MELNV, falta apenas a hipótese de não existência de
autocorrelação entre os erros. Mas, se os erros são independentes, então as suas
autocovariâncias são iguais a zero, o que nos garante que não existe autocorrelação.
Portanto, nesse caso, se os erros são independentes, os estimadores de MQO de α, β1 e β2
são MELNV.
VERDADEIRA
(3) Quando a variância dos resíduos, Var( µt ) , varia para cada t , então os estimadores de
Mínimos Quadrados de α, β1 e β2 ainda são não tendenciosos mas ineficientes.
Resposta:
Nesse caso, ocorre o problema de heterocedasticidade, ou seja, a variância dos resíduos
não é constante, o que faz com que os estimadores de MQO sejam ineficientes. Porém a
propriedade de não-tendenciosidade ainda é mantida.
VERDADEIRA
variável exógena e e1t e e2t são os termos aleatórios, com médias zero e variâncias
constantes. São corretas as afirmativas:
G * −1 = 1
Oferta: → G * −1 = K * * → equação exatamente identificada
K ** = 1
FALSA
β0 − α0
Π0 = ;
α 1 − β1
α2
Π1 = − ;
α 1 − β1
e2t − e1t
νt = .
α 1 − β1
Bom, por aqui já dá para ver que a afirmativa é falsa (ν t ). Mas, vamos encontrar
também a equação na forma reduzida para a quantidade. Substituindo a equação do preço
na equação da oferta, obtemos:
Qt = β 0 + β1 Pt + e2t
β0 − α0 α2 e − e1t
Qt = β 0 + β 1 − X t + 2t + e2 t
α 1 − β1 α 1 − β1 α 1 − β1
β β − α 0 β1 βα β e − β1e1t
Qt = β 0 + 0 1 − 1 2 X t + 1 2t + e2 t
α 1 − β1 α 1 − β1 α 1 − β1
α β − α 0 β1 βα α e − β1e1t
Qt = 1 0 − 1 2 X t + 1 2t
α 1 − β1 α 1 − β1 α 1 − β1
Qt = Π 2 + Π 3 X t + wt
em que:
α 1 β 0 − α 0 β1
Π2 =
α 1 − β1
βα
Π3= − 1 2
α 1 − β1
α e − β1e1t
wt = 1 2t
α 1 − β1
e2t − e1t
Assim, a afirmativa então é falsa pois ν t = .
α 1 − β1
FALSA
(3) As estimativas dos parâmetros da forma reduzida descritos no quesito anterior, por
Mínimos Quadrados Ordinários, são consistentes.
Resposta:
VERDADEIRA
(4) Os parâmetros das equações estruturais, obtidos dos parâmetros da forma reduzida, são
estimados por Mínimos Quadrados Ordinários.
Resposta:
Note que a equação da demanda é subidentificada. Portanto, os parâmetros estruturais dessa
equação, obtidos dos parâmetros da forma reduzida, não poderão ser estimados por
mínimos quadrados ordinários.
FALSA
(ANPEC 2004, 07) São corretas as afirmativas. Em modelos de equações simultâneas:
(1) se a condição de ordem for satisfeita, a condição de posto também será satisfeita.
Resposta:
Sabemos que a condição de ordem é necessária, porém não suficiente para a identificação.
A condição suficiente é dada pela condição de posto. E se a "satisfação" da condição de
ordem implicasse a "satisfação" da condição de posto, não precisaríamos verificar se ambas
ocorrem. A condição de ordem consiste em verificar se há informação suficiente, ou seja,
variáveis exógenas excluídas de cada uma das equações, para que possamos diferenciar as
equações do modelo; a condição de posto consiste em verificar se os parâmetros dessas
variáveis realmente existem, ou seja, se são diferentes de zero.
FALSA
(4) o método de mínimos quadrados indiretos pode ser aplicado tanto a equações
exatamente identificadas quanto a equações superidentificadas.
Resposta:
O método dos mínimos quadrados indiretos só se aplica a equações exatamente
identificadas. Se uma equação for superidentificada, este método irá produzir estimativas
diferentes para o mesmo parâmetro, pois teremos mais de uma equação para cada
coeficiente. O método que se aplica tanto a equações exatamente identificadas quanto a
superidentificadas é o dos mínimos quadrados em dois estágios, lembrando que no primeiro
caso, as estimativas de MQI e de MQ2E serão idênticas.
FALSA
em que: QiD é a quantidade demandada, QiS é a quantidade ofertada, Pi é o preço, e u1i e u2i
são termos aleatórios. É correto afirmar que:
(0) o estimador de mínimos quadrados ordinários aplicado a cada uma das equações é
consistente e não-tendencioso;
Resposta: .
Em ambas as equações, temos como variável explicativa uma variável endógena
(preço), ou seja, uma variável que é também determinada pelo modelo (quantidade
determina o preço que por sua vez determina a quantidade). Quando isso acontece, o erro
está correlacionado com a variável explicativa, o que viola uma das hipóteses básicas do
modelo de regressão linear, necessária para que os estimadores sejam não viesados e
consistentes. Para ver intuitivamente porque isso ocorre, suponha que ocorra um choque
aleatório que diminua a quantidade produzida (uma geada, por exemplo). Esse choque fará
também com que o preço suba (já que a quantidade ofertada diminuiu), o que, por sua vez,
fará com que a demanda diminua (já que o preço está maior). Portanto, o preço está
correlacionado com o termo de erro da regressão e, sendo assim, se aplicarmos o método
dos mínimos quadrados ordinários a cada uma das equações deste modelo, obteremos
estimadores tendenciosos e inconsistentes.
FALSA
(1) no modelo acima a equação de demanda é identificada, mas a equação de oferta não é;
Resposta:
Nenhuma das equações está identificada neste modelo, já que não há nenhuma variável
exógena que nos permita identificar qualquer uma das equações. Mais formalmente, temos
que, pela condição de ordem, para que uma equação esteja identificada, é necessário que o
número de variáveis endógenas incluídas na equação menos um seja igual ao (ou menor
que) o número de variáveis exógenas excluídas da equação, o que, claramente, não se
verifica nem na oferta nem na demanda.
FALSA
(2) se a equação de demanda for definida por QiD = α 1 + β ' Pi + γ 1Yi + u1i , em que Yi é a
renda, a equação de oferta será identificada;
Resposta:
O fato de existir uma variável exógena excluída da equação da oferta permite-nos
identificá-la. Aplicando a condição de ordem para a equação da oferta, temos que o número
de variáveis endógenas incluídas nesta equação menos um (G-1) é igual a 1. O número de
variáveis exógenas excluídas da equação (K) também é igual a 1. Portanto, como G-1 = K,
a equação é exatamente identificada.
VERDADEIRA
(3) a equação de demanda será identificada se for definida por QiD = α 1 + β ' Pi + γ 1Yi + u1i ;
Resposta:
A equação da demanda apenas poderá ser identificada se incluirmos uma variável exógena
na equação de oferta. Incluir uma variável exógena na própria equação de demanda, como
vimos no item anterior, torna a equação de oferta identificada.
FALSA
(4) a variável renda, empregada nos dois itens anteriores, é uma “variável instrumental”.
Resposta:
Uma variável instrumental deve possuir as seguintes características:
- é não correlacionada com o erro, ou seja, é uma variável exógena;
- é correlacionada com a variável explicativa endógena.
A variável renda atende a esses "requisitos". Como é uma variável exógena, não está
correlacionada com o erro, e está correlacionada com a variável explicativa endógena, ou
seja, com o preço. Portanto, a renda é uma variável instrumental.
VERDADEIRA
β − α0 α2 β2
(0) Assim sendo, π0 = 0 , π1 = e π2 = .
α1 − β1 α1 − β1 α1 − β1
Resposta:
Igualando as quantidades, obteremos a equação na forma reduzida para o preço:
Qt = Qt
α0 + α1Pt + α2Rt + u1t = β0 + β1Pt + β2Pt-1 + u2t
α1Pt - β1Pt = β0 - α0 + β2Pt-1 - α2Rt + u2t - u1t
(α1 - β1) Pt = β0 - α0 + β2Pt-1 - α2Rt + u2t - u1t
β − α0 α2 β2 u − u 1t
Pt = 0 - Rt + Pt-1 + 2 t
α1 − β1 α1 − β1 α1 − β1 α1 − β1
Pt = π0 +π1Rt + π2Pt-1 + ν1t
β0 − α0 α2 β2
Assim sendo, π0 = , π1 = - e π2 =
α1 − β1 α1 − β1 α1 − β1
FALSA
(1) A condição de posto indica que a primeira e a segunda equações são identificadas.
Resposta:
É muito fácil verificar a condição de posto neste caso. A condição de posto diz que:
A matriz com os coeficientes das variáveis excluídas da equação deve ter posto1
igual ao número de variáveis endógenas totais menos 1. Caso isso não se verifique, a
equação está subidentificada.
1
O posto de uma matriz é a ordem do maior determinante diferente de zero contido nessa matriz.
Equação Qt Pt Rt Pt-1
Demanda 1 1 1 0
Oferta 1 1 0 1
Agora, construímos uma matriz a partir da tabela acima de acordo com o seguinte
critério: excluir a linha correspondente à equação que estamos analisando e excluir as
colunas correspondentes às variáveis excluídas da equação. Então, verificamos se o posto
desta matriz é igual a 1. É fácil verificar que tanto para a equação da oferta quanto para a
equação da demanda a condição de posto é satisfeita.
VERDADEIRA
(2) Se multiplicarmos a equação de demanda por λ (0 < λ < 1) e a equação de oferta por (1-
λ) e somá-las, desde que o resultado dessa soma seja diferente da equação de oferta e da
equação de demanda, as duas serão identificadas.
Resposta:
Multiplicando a equação de demanda por λ e a de oferta por (1- λ ) e somando, obtemos:
Fazendo:
δ0 = λ α0 -β0 + λ β0
δ1 = λ α1Pt - β1Pt + λ β1Pt
δ2 = λ α2Rt
δ3 = β2Pt-1 + λ β2Pt-1
εt = λ u1t -u2t
Como essa equação é diferente tanto da equação de oferta quanto da equação de demanda,
podemos concluir que tanto a oferta quanto a demanda estão identificadas.
VERDADEIRA
(4) Para verificar se qualquer equação do sistema é identificável, basta aplicar a condição
de ordem.
Resposta:
A condição de ordem é necessária para a identificação do sistema, porém não é
suficiente. A condição necessária e suficiente é dada pela condição de posto, já que para
realmente estarem identificadas, os coeficientes das variáveis exógenas excluídas das
equações devem de fato existir, ou seja, devem ser diferentes de zero. Portanto, para
verificar se qualquer equação do sistema está ou não identificada, devem ser verificadas a
condição de ordem e também a de posto.
FALSA
(0) A aplicação do método de mínimos quadrados ordinários (MQO) a cada uma das
equações do sistema, desconsiderando-se a outra, fornecerá estimativas não
tendenciosas.
Resposta:
Em ambas as equações, temos como variável explicativa uma variável endógena, ou seja,
que também é determinada pelo modelo e, dessa forma, o erro de cada equação estará
correlacionado com tal variável, levando a estimativas tendenciosas e inconsistentes. (veja
também questão ANPEC 2003, 8, item 0)
FALSA
G* - 1 = 1
K** = 1
Como G*-1 = K**, temos que a equação de oferta está exatamente identificada.
VERDADEIRA
(4) Caso seja subidentificada, a equação de demanda não pode ser estimada.
Resposta:
Nada impede (a não ser o bom senso) que estimemos uma equação subidentificada
pelo método dos mínimos quadrados ordinários, ou seja, é realmente possível estimá-la.
Mas, se fizermos isso, obteremos estimativas viesadas e inconsistentes dos parâmetros.
Portanto, caso seja subidentificada, não poderemos consistentemente estimar a equação da
demanda.
FALSA
Q = α1 + β1 P + γ 1Y + µ1 : função de demanda
Q = α 2 + β2 P + µ2 : função de oferta
Q=Q
α1 + β1P + γ1Y + µ1 = α2 + β2P + µ2
β1P - β2P = α2 - α1 - γ1Y + µ2 - µ1
(β1 - β2) P = α2 - α1 - γ1Y + µ2 - µ1
α − α1 −γ1 µ − µ1
P= 2 + Y+ 2
β1 − β 2 β1 − β 2 β1 − β 2
P = π3 + π4 Y+ ν2
β −β1 2
β −β β1 2 1
− β2
Q = π1 + π2Y + ν1
(ANPEC 2005, 07) Com respeito à teoria das séries temporais, são corretas as
afirmativas:
(0) Considere uma série temporal Yt auto-regressiva de ordem 1 com parâmetro ρ . No
modelo: Yt − Yt −1 = δYt −1 + u t , em que ut é um ruído branco e δ = ρ − 1 , se δ
for de fato igual a zero, a série Yt será não estacionária.
Resposta:
Considere o modelo original:
Yt = ρ Yt-1 + ut
Dessa forma, se δ = 0 (o que significa que ρ =1), a série não será estacionária.
Note que essa "forma alternativa" de escrever o processo é utilizada para o teste de raiz unitária de
Dickey-Fuller, que testa a hipótese nula que δ = 0 (o que equivale a ρ = 1).
VERDADEIRA
(1) Numa regressão linear simples de duas séries temporais não estacionárias de ordem 1, o teste usual t
de Student ainda é válido.
Resposta:
Temos que as duas variáveis são I(1). Porém, não sabemos se elas são ou não co-integradas. Se elas
forem, o teste usual t de Student será válido. Mas, se não forem, a regressão será espúria e o teste t será
inválido. Para que as variáveis sejam co-integradas, elas precisam ser integradas de mesma ordem e, além
disso, devem “caminhar juntas”. Se isso ocorrer, os resíduos da regressão entre elas serão estacionários.
FALSA
(2) Numa regressão linear múltipla de séries temporais de ordem 1, mas cointegráveis, não se corre o
risco de os resultados serem espúrios.
Resposta:
Dado que as séries são I(1) e cointegráveis, a regressão entre elas será válida e, por isso,
não se corre o risco de obter resultados espúrios.
VERDADEIRA
VERDADEIRA
(4) Se uma série temporal tiver que ser diferenciada n vezes antes de se tornar
estacionária, a série original é integrada de ordem n -1.
Resposta:
Se uma série temporal tiver que ser diferenciada n vezes antes de se tornar estacionária,
a série original é integrada de ordem n. Por exemplo, se a primeira diferença da série for
estacionária, ela será integrada de ordem 1, I(1).
FALSA
(3) Se yt for I(1), zt for I(1) e ut for I(0), então yt e zt são co-integradas.
Resposta:
Nesse caso, as séries são realmente co-integradas: são integradas de mesma ordem e os
resíduos da regressão entre elas seguem um processo estacionário (já que ut é integrado
de ordem 0).
VERDADEIRA
Essa questão foi anulada pois não foi especificado o subscrito do parâmetro φ quando
σ2
se diz que φ < 1 e que a variância de y t = . Se considerarmos que φ ≡ φ1 , a
1−φ 2
afirmativa seria verdadeira. Vejamos:
var(yt) = var(φ 0 + φ1 y t −1 + et )
var(yt) = var(φ1 y t −1 + et )
var(yt) = var (φ1 y t −1 ) + var( et )
var(yt) = φ12 var(yt-1) + σ 2
var(yt) − φ12 var(yt) = σ 2
(1- φ12 )var(yt) = σ 2
σ2
var(yt) =
1 − φ12
γ j = E[( y t - µ )( y t − j - µ )]
γ j = E[( y t - µ )( y t − j - µ )]
Para j = 1:
γ 1 = φ1 E(yt-1yt-1)
γ 1 = φ1 E( y t2−1 )
γ 1 = φ1 var(yt)
φ1σ 2
γ1 =
1 − φ12
Para j = 2:
γ 2 = φ1 E(yt-1yt-2)
γ 2 = φ1 E[( φ1 yt-2+et) yt-2]
γ 2 = φ12 E( y t2− 2 )
γ 2 = φ12 var(yt)
φ12σ 2
γ2=
1 − φ12
Generalizando:
φ1j σ 2
γ j=
1 − φ12
FALSA
y t = φ 0 + φ1 y t −1 + φ 2 y t − 2 + et
y t = φ0 + φ1 Ly t + φ 2 L2 y t + et
(1 − φ L − φ L ) y = φ
1 2
2
t 0 + et
FALSA
VERDADEIRA
(4) No modelo ARMA(1,1), y t = φ 0 + φ1 y t −1 + et + θet −1 , em que et é um ruído branco
φ0
de média nula e variância constante, a média de y t é dada por .
1 − φ1
Resposta:
Calculemos a média de yt:
E(yt) = E( φ 0 + φ1 y t −1 + et + θet −1 )
E(yt) = φ 0 + φ1 E(yt-1) + E(et) + θ E(et-1)
E(yt) = φ 0 + φ1 E(yt) + E(et) + θ E(et)
E(yt) - φ1 E(yt) = φ 0
(1- φ1 )E(yt) = φ 0
φ0
E(yt) =
1 − φ1
VERDADEIRA
(ANPEC 2004, 10) Em relação aos modelos de séries temporais, são corretas as
afirmativas:
Sabemos que a média dos erros é zero e que, como φ < 1 , o processo é estacionário.
Portanto:
E(Zt) = E(φZt) + E(θ0)
E(Zt) - E(φZt) = θ0
(1-φ) E(Zt) = θ0
θ
E(Zt) = 0
1−φ
VERDADEIRA
E agora as autocovariâncias:
cov(Zt, Zt-1) = E(ZtZt-1)
cov(Zt, Zt-1) = E[(at - at-1)Zt-1]
cov(Zt, Zt-1) = E(atZt-1) - E(at-1Zt-1)
cov(Zt, Zt-1) = - E[at-1(at-1 - at-2)]
cov(Zt, Zt-1) = - E( a t2−1 ) + E(at-1at-2)
cov(Zt, Zt-1) = - σ a2
A condição de estacionariedade para um modelo AR(1), Zt = φZt-1 + at, é dada por |φ| <
1. Como, nesse caso, o coeficiente de Zt-1 é menor que 1 em módulo, este processo é
estacionário (um choque ocorrido em dado período será dissipado ao longo do tempo).
VERDADEIRA
(3) No processo AR(1), Zt = φZt −1 + at , em que a t é um ruído branco com Var( a t ) =
σ a2
σ a2 , a variância de Zt é .
1−φ2
Resposta:
Calculemos a variância de Zt:
var(Zt) = var(φZt-1 + at)
var(Zt) = var(φZt-1) + var(at)
var(Zt) = φ2 var(Zt) + σ a2
var(Zt) - φ2 var(Zt) = σ a2
(1 - φ2) var(Zt) = σ a2
σ 2
var(Zt) = a
1−φ 2
VERDADEIRA
E(Zt) = φE(Zt)
(1-φ) E(Zt) = 0
E(Zt) = 0
FALSA
(2) se Ct e Yt são I(1), então o teste ADF aplicado aos resíduos da regressão poderá
identificar a presença de co-integração entre as variáveis;
Resposta:
Se as variáveis são integradas de mesma ordem, há a possibilidade de que elas sejam co-
integradas, ou seja, que caminhem no mesmo passo. Se esse for o caso, os resíduos da
regressão entre essas variáveis serão estacionários. Como o teste ADF verifica a
presença de raiz unitária em uma série, ou seja, testa a hipótese nula de não
estacionariedade, podemos utilizá-lo nos resíduos da regressão para verificar se as séries
são co-integradas. E é exatamente isso que faz o teste de Engle-Granger. Há que se
fazer a ressalva, porém, de que, como os resíduos dessa regressão são obtidos através de
valores estimados dos parâmetros da regressão co-integrante, aumenta-se a incerteza e,
portanto, devem ser utilizados valores críticos diferentes dos utilizados para o teste
ADF.
VERDADEIRA
(3) se Ct e Yt são I(1), mas os resíduos são I(0), então há co-integração entre as
variáveis;
Resposta:
Nesse caso, todos os "requisitos" para que duas variáveis sejam co-integradas foram
satisfeitos: as variáveis são integradas de mesma ordem e caminham juntas (já que os
resíduos da regressão entre elas são estacionários).
VERDADEIRA
Como var(εt) = 1:
0,75 var(yt) = 0,04 + 1 - 0,2 cov(yt, εt-1) (I)
(ANPEC 2002, 12) Em relação aos modelos de Séries de Tempo pode-se afirmar:
1−φ
FALSA
(3) Em uma regressão com duas séries temporais, se estas são I(1), ou seja, não
estacionárias, mas são co-integradas, pode-se empregar a estatística t de Student
para testar a significância dos coeficientes da regressão.
Resposta:
De fato, se a regressão é feita entre variáveis que são co-integradas, os procedimentos
usuais de testes de hipóteses são válidos e, portanto, a significância dos coeficientes da
regressão pode ser testada utilizando-se a estatística t de Student.
VERDADEIRA
(3) O teste de Engle-Granger para co-integração entre três variáveis consiste em utilizar
a estatística e a tabela de valores críticos Dickey-Fuller nos resíduos de uma
regressão entre estas variáveis.
Resposta:
Apesar do teste de Engle-Granger para co-integração ser um teste de Dickey-Fuller
aplicado aos resíduos da regressão entre as variáveis, a tabela de valores críticos de
Dickey-Fuller não é adequada, já que os resíduos foram obtidos de parâmetros que
foram estimados e, portanto, a incerteza aumenta. Para o teste de Engle-Granger deve-
se, então, utilizar-se outros valores críticos.
FALSA
var(yt) =
1−φ 2
Portanto, para que esse processo seja estacionário deve-se verificar que |φ| <1, já que se
isso não ocorrer, a variância será infinita.
FALSA
(1) Se φ1 = 1, o processo é dito um caminho aleatório (random walk).
Resposta:
Se φ1 = 1, teremos:
yt = yt-1 + εt,
que é, por definição, um caminho aleatório.
Se o modelo tivesse o intercepto, teríamos um caminho aleatório com drift:
yt = θ + yt-1 + εt
VERDADEIRA
Resposta:
O estimador de MQO do parâmetro φ1 será não viesado quando |φ1|<1. O estimador de
MQO, neste caso, será uma estimativa da correlação entre yt e yt-1 e, portanto, mesmo
na média, não poderá ser igual se este for o verdadeiro valor de φ1 (ou mesmo se for
muito próximo). O enunciado não dizia se φ1 era menor do que 1, portanto há que se
fazer esta ressalva.
VERDADEIRA
(com a ressalva acima!!)
(3) A estatística t-Student pode ser usada para testar a presença de raiz unitária.
Resposta:
Se a variável não é estacionária, sua variância será infinita e, dessa forma, a estatística t
será viesada e não seguirá a distribuição t de Student. Portanto, para testar a presença de
raiz unitária, devemos utilizar a estatística τ, que na realidade é calculada da mesma
forma que a estatística t, só que com valores críticos próprios (tabelados por Dickey e
Fuller).
FALSA
que δ = φ1 − 1 e ∆ y t = y t − y t −1 .
Resposta:
Considere o modelo original:
y t = φ1 y t −1 + ε t
Subtraindo e somando yt-1, obtemos:
yt = φ1yt-1 + εt + yt-1 - yt-1
yt - yt-1 = φ1 yt-1 - yt-1 + εt
∆y t = (φ1 - 1) yt-1 + εt
∆y t = δy t −1 + εt
onde δ = (φ1 - 1)
Note que essa "forma alternativa" de escrever o processo é utilizada para o teste de raiz
unitária de Dickey-Fuller, que testa a hipótese nula que δ = 0 (o que equivale a φ1 = 1)
VERDADEIRA
(0) Aceitou a hipótese nula do teste ADF, concluindo que as séries de renda e consumo
são não-estacionárias;
Resposta:
O teste ADF (Dickey-Fuller aumentado) testa a hipótese nula de raiz unitária. Portanto,
se os valores obtidos para a estatística τ são menores que os valores tabelados (em
módulo), não se pode rejeitar a hipótese nula de existência de raiz unitária (não-
estacionariedade) nas séries das variáveis.
VERDADEIRA
(4) Necessita fazer mais outros testes para verificar se a regressão estimada é espúria.
Resposta:
Realmente, como leitor já deve estar se cansando de ler, para verificar se a regressão é
espúria, o econometrista necessita realizar um teste de co-integração.
VERDADEIRA
(0) A condição |φ| < 1 é necessária para que o processo apresente média e variância
incondicionais independentes do tempo.
Resposta:
A condição |φ| < 1 é necessária para que o processo seja estacionário, ou seja, tenha
média e variância constantes e covariância dependente apenas da ordem da defasagem e
não do tempo.
Se φ = 1, teremos que:
Yt = Yt-1 + εt
Yt = ∑ε t
Portanto, o valor esperado de Yt será dado por:
E(Yt) = E( ∑ ε t )
Dessa forma, se φ = 1, a média do processo será dependente do tempo (note que nesse
caso particular, E(Yt) = 0).
E a variância será:
n
var(Yt) = var( ∑ ε t )
t =1
VERDADEIRA
FALSA
(3) A previsão dois-passos à frente é dada por: E(Yt+2| Yt) = (φ +1) + φ2Yt , em que Yt
= { Y1 , Y2 ,..., Yt}.
Resposta:
A previsão dois-passos à frente para Yt é dada por:
E(Yt+2|Yt) = φYt+1
Como Yt+1 = φYt, temos que:
E(Yt+2|Yt) = φ(φYt)
E(Yt+2|Yt) = φ2Yt
FALSA
(ANPEC 1999, 1) Com relação aos modelos Auto - Regressivo, Média - Móvel e
Misto, pode-se afirmar que :
var(Zt) = a
(1 − φ 2 )
E a variância:
var(Zt) = var(µ + at - θat-1)
var(Zt) = var(at) + θ2 var(at)
var(Zt) = (1 + θ2)var(at)
var(Zt) = (1 + θ2) σ a2
VERDADEIRA
onde:
Φ (L) =(1 - φ1L - φ2L2 - ... - φpLp)
Θ(L) = (1 - θ1L - θ2L2 - ... - θqLq)
(ANPEC 1999, 2) Uma série temporal mensal de três anos, de janeiro de 1995 a
dezembro de 1997, para o preço do produto agrícola Y, apresentou a seguinte tendência
linear Y = 3 + 0,25.X. Estime o preço do produto Y para o mês de janeiro de 1998,
sabendo que as variações sazonais calculadas com base num modelo aditivo para os três
anos considerados foram:
Solução:
De janeiro de 1995 a dezembro de 1997, temos 36 observações. Portanto, em janeiro de
1998 estaremos no 37º mês. Então:
Y = 3 + 0,25 × 37
Y = 3 + 9,25 = 12,25
12,25-1,25 = 11
(ANPEC 1998, 15) Com relação aos modelos Auto - Regressivo, Média - Móvel e
Misto, pode - se afirmar que :
1−φ
Portanto, se θ0 = 0, a média do processo será igual a zero.
VERDADEIRA
Z1 = Z0 + a1 = a1
Z2 = Z1 + a2 = a1 + a2
Z3 = Z2 + a3 = a1 + a2 + a3
Z4 = Z3 + a4 = a1 + a2 + a3 + a4
Zt = at + at-1 + … a1
Portanto, se ρ for igual a 1, o processo poderá ser descrito como uma soma de choques,
já que um choque ocorrido em determinado período t não será dissipado.
VERDADEIRA
Números índice
n n
∑ p0i q1i ∑p q i i
1 1
Fq = Lq × Pq = i =1
n
× i =1
n
∑p q ∑p q
i =1
i
0
i
0
i =1
i
1
i
0
VERDADEIRA
O índice de preços de Laspeyres realmente pode ser escrito como a média aritmética de
relativos de preços, porém, estes são ponderados pela participação do dispêndio com
cada bem na época base. Vejamos.
Sabemos que o índice de preços de Laspeyres é dado por:
n
∑p q
i =1
i
1
i
0
L= n
∑p q
i =1
i
0
i
0
Desmembrando, temos:
∑p q
i =1
i
0
i
0
∑p q
i =1
i
0
i
0 ∑p q
i =1
i
0
i
0 ∑p q
i =1
i
0
i
0
i p 0i q 0i
Fazendo w = 0 n
(que representa a participação do bem i no orçamento no
∑p q
i =1
i
0
i
0
∑ p0i q0i i =1
i
n
p
L= ∑p
i =1
1
i
× w0i
0
FALSA
∑p q
i =1
i i
1 1
P= n
∑p q
i =1
i i
0 1
∑p q
i =1
i i
1 1
Desmembrando, temos:
1
P= 1 1 2 2
p q p q p 0n q1n
n
0 1
+ n
0 1
+…+ n
∑ p1i q1i
i =1
∑ p1i q1i
i =1
∑p q
i =1
i i
1 1
p1i q1i
Fazendo w1i = n
(que representa a participação no orçamento do bem i no
∑p q
i =1
i i
1 1
1
P= 1 2
p p pn
× w11 +
0
1
× w12 + … + 0n × w1n
0
2
p 1 p p1
1
1
P= n
p 0i
∑
i =1 p1 i
× w1i
FALSA
I01 × I10 = 1
∑ p1i q0i ∑p q i i
0 1
L01×L10 = i =1
n
× i =1
n
≠1
∑p q
i =1
i
0
i
0 ∑p q
i =1
i i
1 1
n n
∑ p1i q1i ∑p q i
0
i
0
P01×P10 = i =1
n
× i =1
n
≠1
∑p q ∑p q
i =1
i i
0 1
i =1
i
1
i
0
FALSA
∑p q
i =1
i
1
i
0 ∑p qi =1
i i
1 1
L= n
P= n
∑p q
i =1
i
0
i
0 ∑p q
i =1
i i
0 1
Como vimos nos itens (1) e (2) dessa questão, esses índices podem ser escritos como
médias ponderadas de relativos de preços: o índice de Laspeyres como uma média
aritmética de relativos ponderados pela participação no orçamento de cada bem na
época base e o de Paasche como uma média harmônica de relativos ponderados pela
participação de cada bem na época atual.
n
p1i 1
L= ∑ p0i
× w0i P= n
p 0i
i =1
∑
i =1 p1i
× w1i
VERDADEIRA
L=
∑pq 1 0
=
32
= 1,28
∑p q 0 0
25
FALSA
P=
∑ p 1 q 1 48
= ≅ 1,17
∑ p 0 q 1 41
VERDADEIRA
Lq =
∑ p 0 q 1 = 41 = 1,64
∑ p 0 q 0 25
FALSA
Pq =
∑ p 1 q 1 48
= = 1,50
∑ p 1 q 0 32
FALSA
V01 =
∑ p1q1
=
48
= 1,92
∑ p q 25
0 0
×
∑pq
2 2
=
∑pq 2 2
= V02
∑p q0 0
∑pq
1 1
∑p q 0 0
(ANPEC 2003, 01) Com relação aos números índice, é correto afirmar que:
(0) o índice de Fisher é uma média harmônica dos índices de Paasche e Laspeyres.
Resposta:
O índice de Fisher é uma média geométrica dos índices de Paasche e
Laspeyres:
F= L× P
FALSA
p1
L= ∑p 0
× w0
FALSA
1
P=
p0
∑ p1
× w1
FALSA
Lp × Pq =
∑pq 1 0
×
∑pq 1 1
=
∑pq 1 1
=V
∑p q 0 0
∑pq 1 0
∑p q 0 0
V01 × V12 =
∑pq 1 1
×
∑p q 2 2
=
∑p q 2 2
= V02
∑p q 0 0
∑pq 1 1
∑p q 0 0
(4) o índice de Paasche de preços pode ser calculado pela divisão de um índice de valor
por um índice Laspeyres de quantidade.
Resposta:
Dividindo um índice de valor por um índice de Laspeyres de quantidade,
obtemos o índice de preços de Paasche:
V ÷ Lq =
∑pq
1 1
÷
∑p q 0 1
=
∑pq 1 1
= Pp
∑p q
0 0
∑p q 0 0
∑p q 0 1
VERDADEIRA
L01 × L10 =
∑pq 1 0
×
∑pq 0 1
≠1 P01 × P10 =
∑pq 1 1
×
∑pq 0 0
≠1
∑pq 0 0 ∑pq 1 1 ∑pq 0 1 ∑pq 1 0
FALSA
(1) Se um determinado índice de preços com ano base em 1992 assume os valores I95 =
300 e I96 = 400 em 1995 e 1996, respectivamente, então um produto com preço
corrente de R$ 10,00 em 1996, tem preço de R$ 7,50, em moeda de 1995.
Resposta:
Como queremos saber o preço de um produto que custava R$10,00 em 1996 em
moeda de 1995, basta deflacionarmos (ou seja, multiplicarmos pelo índice de 1995 e
dividirmos pelo índice de 1996) para obtermos:
300
10× = 7,50
400
VERDADEIRA
Resposta:
Multiplicando um índice de Laspeyres de quantidades por um índice de Laspeyres
de preços, obtemos:
Lp × Lq =
∑pq ×∑pq
1 0 0 1
=
∑pq ∑pq
1 0 0 1
,
∑p q ∑p q
0 0 0 0 (∑ p q ) 0 0
2
∆ICV = ∆p × w 0
Como houve um aumento de 20% nos preços dos automóveis que significou um
aumento de 0,1% no ICV0-3SM e um aumento de 1,2% no ICV10-20SM, temos que:
∆ICV0-3SM = ∆p× w 00−3 SM
0,001 = 0,20 w 00 -3SM
0,001
w 00-3SM = = 0,005 = 0,5%
0,20
Dessa forma, o peso dos automóveis nas despesas das famílias com renda entre
10-20 SM é 12 vezes maior que das famílias com 0 a 3 salários mínimos, já que
12× 0,5% = 6%.
VERDADEIRA
(4) Para calcular o índice de preços de Paasche para uma série de anos requer-se menos
informação do que para calcular o índice de Laspeyres.
Resposta:
Para calcular o índice de preços de Paasche requer-se bem mais informação do
que para calcular o índice de Laspeyres, já que se utiliza as quantidades atuais para o
cálculo em cada ano. Dessa forma, além de informações anuais dos preços dos produtos,
deve-se também pesquisar as quantidades anuais consumidas dos produtos, o que não é
uma tarefa fácil. Já o índice de Laspeyres necessita apenas de informações atualizadas
dos preços, já que utiliza como ponderação as quantidades iniciais.
FALSA
(2) O índice de Fischer é dado pela média harmônica dos índices de Laspeyres e
Paasche e obedece ao critério da decomposição das causas.
Resposta:
O índice de Fisher é dado pela média geométrica dos índices de Laspeyres e
Paasche (F = L × P ) e não obedece ao critério de decomposição das causas
(circularidade), já que:
n n n n
FALSA
∆ICV = ∆p × w 0
Portanto:
0,004 = 0,16w 0
0,004
w0 = = 0,025 = 2,5%
0,16
VERDADEIRA
(4) Tomando o ano zero como base, foram observados os seguintes valores para o
ano 1: índice do PIB nominal = 120; índice de quantidade de Laspeyres = 80. Pode-se
então concluir que a taxa de inflação no período, medida pelo deflator implícito do PIB,
foi de 50%.
Resposta:
Aqui temos que calcular o valor do deflator implícito do PIB. E, para isso, foram
fornecidos os valores do índice do PIB nominal e do índice de quantidade de Laspeyres,
que são dados por:
IPIBn =
∑pq 1 1
= 120
∑p q 0 0
Lq =
∑p q 0 1
= 80
∑p q 0 0
O deflator implícito do PIB é dado pelo quociente entre o PIB nominal e o PIB
real:
D=
PIB nominal
=
∑pq 1 1
PIB real ∑p q 0 1
∑pq 1 1
∑p q 0 0
=
índice PIB nominal
=
120
= 1,5
∑p q 0 1
índice de quantidade de Laspeyres 80
∑p q 0 0
Portanto, houve uma variação de 50% nos preços medida pelo deflator implícito do PIB.
VERDADEIRA
(ANPEC 2000, 2) A tabela abaixo apresenta, para os anos de 1994 e 1999, dados
hipotéticos sobre preços e quantidades vendidas de 6 diferentes produtos
comercializados por certa companhia. Calcule a variação percentual dos preços dos
produtos da companhia neste período, utilizando o índice de Paasche.
1994 1999
Tipo de pro Preço Quantidade Preço Quantidade
duto Vendida Vendida
A 5 80 20 100
B 7 100 6 1000
C 2 200 5 200
D 3 600 4 500
E 1 300 2 200
F 2 100 3 200
Solução:
Para calcularmos o índice de preços de Paasche, precisamos primeiro calcular
∑ p 1999 q 1999 e ∑ p 1994 q 1999 , o que é feito na tabela abaixo:
Tipo de produto P1994 × Q1999 P1999 × Q1999
A 500 2.000
B 7.000 6.000
C 400 1.000
D 1.500 2.000
E 200 400
F 400 600
Soma: 10.000 12.000
P=
∑ p 1999 q 1999
=
12.000
= 1,20
∑p q 1994 1999
10.000
(ANPEC 1999, 3) Com base na teoria dos Números Índices, pode-se afirmar que:
Resposta:
∑p 1
i
I= i =1
n
∑p
i =1
0
i
Ponderando pelo valor da participação relativa de cada bem no período base
( wi ), obteremos o índice de preços de Laspeyres:
0
∑p 1
i
L= i =1
n
× wi0
∑p i =1
0
i
∑q 1
i
Iq = i =1
n
∑q
i =1
0
i
∑q 1
i
Lq = i =1
n
× z i0
∑q
i =1
0
i
VERDADEIRA
F = L×P
F01 × F10 = 1
=
∑p q 1 0
i i
×
∑p q ×∑p q ×∑p q
1 1
i i
0
i
1
i
0
i
0
i
= 1 =1
∑p q 0
i
0
i ∑p q ∑p q ∑p q
0
i
1
i
1 1
i i
1 0
i i
Fp × Fq = L × P × Lq × Pq = =
∑p q ∑p q ∑p q ∑pq
0 0 0 1 0 0 1 0
(∑ p q )
0 0
2
=
∑pq1 1
= índice de valor
∑p q
0 0
Resposta:
Em geral, o índice de preços de Laspeyres é realmente maior que o de Paasche.
Cabe notar que o índice de preços de Laspeyres será maior que o de Paasche quando o
coeficiente de correlação entre preço e quantidade for negativo, situação que é mais
comum (um aumento no preço provoca uma diminuição na quantidade). Porém, é bem
possível que o coeficiente de correlação entre preço e quantidade seja positivo e, nesse
caso, o índice de preços de Paasche será maior que o de Laspeyres.
VERDADEIRA
(3) Os índices de Fisher, definidos como a média geométrica dos índices de Laspeyres e
de Paasche, são sempre maiores do que estes dois últimos.
Resposta:
O índice de Fisher, sendo uma média geométrica dos índices de Laspeyres e de Paasche,
estará sempre entre estes dois, nunca será maior.
FALSA
DEFLATORES
(Base: 1990 = 100)
ÍNDICES 1996
Solução:
Note que o exercício fornece os valores nominais (tanto da renda quanto de cada
um de seus componentes). Portanto, teremos que deflacionar cada um dos componentes
da renda, utilizando seus respectivos deflatores (fornecidos na segunda tabela). O
quadro abaixo mostra o cálculo realizado e os valores deflacionados:
então Z=
( X − µ)
2
segue uma distribuição χ 2 com 1 grau de liberdade.
σ2
Resposta:
Sabemos que a soma de n variáveis aleatórias normais padronizadas ao quadrado segue
a distribuição χ 2 com n graus de liberdade. E como Z é uma variável normal
padronizada ao quadrado, segue a distribuição χ 2 com 1 grau de liberdade.
VERDADEIRA
(1) Se X1, ..., Xn são variáveis aleatórias identicamente distribuídas com distribuição
n
Bernoulli com parâmetro p, então Z = ∑ X i segue uma distribuição Poisson.
i =1
Resposta:
Como Z é a soma de n variáveis de Bernouilli, seguirá a distribuição binomial. Cabe
lembrar, porém, que quando n é grande e p pequeno, a distribuição binomial pode ser
aproximada pela distribuição de Poisson. Mas esse não é o caso!
FALSA
(2) Se X é uma variável aleatória com distribuição t com n graus de liberdade, então
Z = X 2 segue uma distribuição F com 1 e n graus de liberdade.
Resposta:
Sabemos que:
x−µ
σ
n
~ tn
S
σ
(x − µ)
2
σ2
n = σ2
S2 nS 2
σ2 σ2
Note que o numerador da expressão acima é uma variável normal padronizada ao
quadrado e, portanto, segue a distribuição qui-quadrado com 1 grau de liberdade. E no
denominador, temos também uma variável aleatória que segue a distribuição qui-
quadrado com n graus de liberdade. Dessa forma:
(x − µ)
2
σ2 ~ F(1,n)
nS 2
σ2
VERDADEIRA
Dessa forma:
E(X) = var(X) = λ
FALSA
(4) Se a variável X = lnY segue uma distribuição normal, então Y segue uma
distribuição lognormal.
Resposta:
Uma variável aleatória tem distribuição lognormal se seu logaritmo seguir uma
distribuição normal. Dessa forma, se a variável X = lnY é normalmente distribuída,
então Y = e X realmente seguirá a distribuição lognormal. Note que ln(.) é definido
apenas para valores positivos. E como grande parte das variáveis econômicas assume
apenas valores positivos, a distribuição lognormal é muito utilizada em economia.
u(x) = e x
v(y) = lny
1
v’(y) =
y
(ln y − µ )2
1 −
2σ 2
f(y) = e
y 2πσ 2
VERDADEIRA
X −µ
~ N(0,1)
σ
n
1
E(X) = = 0,5
β
1
var(X) = =4
β2
E o desvio-padrão:
dp(X) = 4=2
0,5 − 0,5
= 0,00
2
64
Multiplicando o resultado por 100, como pede o exercício, chegaremos ao valor de 50.
FALSA
(1) Se (Y,X) possuem uma distribuição Normal bivariada, então, segue-se que
E(Y|X) = a + b Y, em que a e b dependem dos momentos de Y e X.
Resposta:
E(Y|X) é chamada de regressão de Y em X. De fato, é possível mostrar que, se X e
Y têm distribuição normal bivariada E(Y|X) = a + bX, a e b constantes (e não a + bY).
Independente disso, E(Y|X), isto é, a esperança de Y dado X será função de X, nunca de
Y.
FALSA
g(x) = ∫ f ( x, y)dy
X
g(x) = ∫ φ 2 e −φy dy
X
+∞
g(x) = φ 2 ∫ e −φy dy
x
+∞
− e −φy
g(x) = φ 2
φ x
e −φx
g(x) = φ 2
φ
g(x) = φ e-φx
Portanto:
∞
E(x) = ∫ xg ( x)dx
0
∫ xφe
−φx
E(x) = dx
0
Para calcular a integral acima, devemos utilizar o método de integração por partes.
Façamos f(x) = x e g'(x) = e-φx. Temos que:
Portanto:
∞
∞
− e −φx ∞
− e −φx
E(x) = φ x( )−∫ dx
φ 0 φ 0
∞
xe −φx 1 ∞
E(x) = φ − + ∫e dx
−φx
φ φ 0 0
xe −φx 1 − e −φx
E(x) = φ − +
φ φ φ 0
∞
xe −φx e −φx
E(x) = φ − −
φ φ 2
0
1
E(x) = φ
φ 2
1
E(x) =
φ
Nota: obviamente, o mesmo resultado seria obtido se tivéssemos calculado E(x) =
∞ y
∫ ∫ xf ( x, y)dxdy .
0 0
VERDADEIRA
P(|X - µ| ≤ ∈ ) ≥ 1 -
∈2
Nesse caso, ∈ = 2 e σ2 = 1. Portanto:
1
P(|X - µ| ≤ 2) ≥ 1 -
4
P(|X - µ| ≤ 2) ≥ 1 - 0,25
P(|X - µ| ≤ 2) ≥ 0,75
VERDADEIRA
(1) E( eX) ≤ eµ, em que E(X) = µ.
Resposta:
Suponha que X assuma apenas dois valores:
X1 = 1
X2 = -1
E E(ex) será:
e 1 + e −1 2,71828 + 0,37
E(ex) = = = 1,54414
2 2
Note que não precisaríamos ter terminado esta conta. Bastaria lembrar que e é um
número maior que 2, e como temos uma soma no numerador de números que não são
negativos, o numerador será maior que o denominador, o que vale dizer, essa divisão
será maior que 1. E como tínhamos encontrado que eµ = 0, temos que, nesse caso, E(ex)
> eµ.
FALSA
FALSA
Resposta:
Suponha que X seja uma constante. Nesse caso, teremos:
Y 1 var(Y)
var(Z) = var = 2 var(Y) ≠
X X var(X)
U
t= onde U ~ N(0,1) e V ~ χ k2
V k
k
Sabemos que a variância da distribuição t de Student é dada por . Portanto, temos
k −2
que:
U k var(U ) 1 k
var(t) = var = ≠ = =
V k k − 2 var(V / k ) 2k / k 2
2
FALSA
(0) Pelo Teorema do Limite Central podemos afirmar que se a variável aleatória X tem
uma distribuição qualquer com média µ e variância σ2, então a distribuição de X
(média da amostra) aproxima-se da distribuição normal com os mesmos parâmetros
média µ e variância σ2, quando o tamanho da amostra aumenta.
Resposta:
Pelo Teorema do Limite Central, sabemos que se uma variável aleatória tem uma
distribuição qualquer com média µ e variância σ2, então a sua média amostral terá uma
σ 2
∑X i
Y= n i =1
= nX
n
E sabemos que a variável nX seguirá uma distribuição normal com média nµ e
variância dada por nσ2:
E( nX ) = n E( X ) = nµ
2σ
2
2
var( nX ) = n var( X ) = n = nσ2
n
Portanto:
(2) Uma distribuição binomial tende a uma distribuição normal quando o número n de
provas independentes de Bernoulli cresce.
Resposta:
Abaixo temos o histograma da distribuição binomial com p = 0,5 para diferentes valores
de n:
n=2 n=3
n=5 n = 10
Note que à medida que aumentamos o tamanho da amostra (ou seja, à medida que o
número de provas de Bernouilli aumenta), a distribuição binomial se aproxima cada vez
mais da distribuição normal e, dessa forma, a distribuição binomial pode ser aproximada
pela distribuição normal para valores grandes de n.
VERDADEIRA
1
Quando a proporção populacional for igual a teremos:
2
1 1 1
var(p) = × 1− =
2 2 4
E para p = 1:
var(p) = 1× (1-1) = 0
Portanto, quando a proporção populacional for igual a zero ou 1, a sua distribuição será
1
menos dispersa que quando for igual a .
2
VERDADEIRA
(0) Se a função densidade conjunta de (X,Y), f(x,y), pode ser fatorada na forma f(x,y)
= f(x).g(y) , onde f(x) e g(y) são ,respectivamente, as funções densidade de X e Y,
então as variáveis aleatórias X e Y são independentes.
Resposta:
De fato, se f(x,y) = f(x).g(y), então x e y são independentes (e a recíproca é
verdadeira).Isto é mostrado abaixo:
Se as variáveis são independentes, então a probabilidade condicional é igual à
probabilidade não condicional, ou seja:
fx|y = f(x)
fy|x = g(y)
f ( x, y )
fx|y =
g ( y)
Então:
f(x,y) = fx|y × g(y)
E(X) = ∫ ∫ xf ( x, y)dxdy
0 0
1 y
E(X) = ∫ ∫ x2dxdy
0 0
1 y
E(X) = ∫ 2 ∫ xdxdy
0 0
y
1
x2
E(X) = ∫ 2 dy
0 2 0
1
y2
E(X) = ∫ 2 dy
0 2
1
E(X) = ∫ y dy
2
1
y3
E(X) =
3 0
1
E(X) =
3
FALSA
E(X) = ∫ xf ( x)dx
−∞
E(X|Y) =
−∞
∫ xf x| y
dx ,
E(X|Y) =
−∞
∫ xf ( x)dx = E(X)
Isto também vale, analogamente, para Y: E(Y) = E(Y|X). Portanto, se duas variáveis são
independentes, a esperança incondicional será igual à esperança condicional.
VERDADEIRA
Resposta:
Sabemos que:
b
P (a < X < b) = ∫ f ( x)dx
a
Que, como sabemos, é a soma de todas as probabilidades, e portanto deve ser igual a 1,
∞
ou seja, ∫ −∞
f ( x)dx = 1 .
VERDADEIRA
Resposta:
É exatamente esse o valor esperado de X para uma distribuição de probabilidade
contínua, como vimos no item (2) desta questão.
VERDADEIRA
Bibliografia
ENDERS, W. Applied Econometric Time Series. New York: John Wiley & Sons,
1994.
JUDGE, G.G.; GRIFFITHS, W.E.; HILL, R.C.; LÜTKEPOHL, H.; LEE, T.C. The
Theory and Practice of Econometrics. Nova York: John Wiley & Sons, 1985.