Você está na página 1de 9

Introdução à inferência estatística

Lista de exercícios # 1

Gabarito seletivo versão beta (28/02)

Entrega quarta-feira dia 19 de Fevereiro em papel na sala de aula

(Q.1) Um florista faz estoque de uma flor de curta duração que lhe custa $0,50 e que ele
vende a $1,50 no primeiro dia em que a flor está na loja. Toda flor que não é vendida
nesse primeiro dia não serve mais e é jogada fora. Seja X a variável aleatória que denota
o número de flores que os fregueses compram em um dia casualmente escolhido. O
florista descobriu que a função de probabilidade de X é dada pela tabela abaixo.

x 0 1 2 3
p(x) 0,1 0,4 0,3 0,2
Quantas flores deveria o florista ter em estoque a fim de maximizar a média (valor
esperado) de seu lucro?

(Q.2) Seja X1, X2,...,XN uma sequência de variáveis aleatórias (VAs) identicamente
distribuídas independentes com média μ e variância σ2, i.e., E[Xi] = μ e V[Xi]= σ2,
i=1,...,N. Considerando isso, faça as demonstrações a seguir requisitadas.

(Q.2.a) V(X1 + X2) = 2σ2 + 2cov(X1,X2), em que cov() é o operador covariância;

R: V(X1 + X2) = E[(X1 + X2 – E[X1 + X2])2] = E[(X1 + X2 – E[X1]-E[X2])2] =


E[(X1 - E[X1]+ X2 – E[X2])2]. Defina A ≡ X1 – E[X1] e B ≡ X2 – E[X2] de modo que
E[(X1 - E[X1]+ X2 – E[X2])2] = E[(A + B)2]. Prosseguindo, tem-se E[(A + B)2] = E[A2
+ B2 + 2AB] = E[(X1 – E[X1])2 + (X2 – E[X2])2 – 2(X1 – E[X1])(X2 – E[X2])] =

E[(X1 – E[X1])2]+ E[(X2 – E[X2])2] – 2E[(X1 – E[X1])(X2 – E[X2])] = V[X1] + V[X2] +


2cov[X1X2].

(Q.2.b) Generalize o resultado do item anterior para N VAs, i.e., demonstre que:
𝑁 𝑁 𝑁
2
𝑉 [∑ 𝑋𝑖 ] = 𝑁𝜎 + ∑ ∑ 𝑐𝑜𝑣(𝑋𝑗 , 𝑋𝑖 )
𝑖=1 𝑗=1 𝑖=1
𝑖≠𝑗

R: (Primeira estratégia de demonstração, mais rápida e equivalente à desenvolvida no


item anterior)

𝑁 𝑁 𝑁 2

𝑉 [∑ 𝑋𝑖 ] = 𝐸 [(∑ 𝑋𝑖 − 𝐸 [∑ 𝑋𝑖 ]) ]
𝑖=1 𝑖=1 𝑖=1
= 𝐸[(𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 − 𝐸[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 ])2 ]
= 𝐸[(𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 − 𝐸[𝑋1 ] − 𝐸[𝑋2 ] − ⋯ − 𝐸[𝑋𝑁 ])2 ]

1
A última passagem segue da propriedade do operador esperança segundo a qual a
expectativa da soma é a soma das expectativas. Continuando:
𝑁

𝑉 [∑ 𝑋𝑖 ] = 𝐸[(𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 − 𝐸[𝑋1 ] − 𝐸[𝑋2 ] − ⋯ − 𝐸[𝑋𝑁 ])2 ]


𝑖=1
= 𝐸[(𝑋1 − 𝐸[𝑋1 ] + 𝑋2 − 𝐸[𝑋2 ] + ⋯ + 𝑋𝑁 − 𝐸[𝑋𝑁 ])2 ]
𝑁 2 𝑁 2

= 𝐸 [(∑ 𝑋𝑖 − 𝐸[𝑋𝑖 ]) ] = 𝐸 [(∑ 𝑎𝑖 ) ] , 𝑝𝑎𝑟𝑎 𝑎𝑖 = 𝑋𝑖 − 𝐸[𝑋𝑖 ]


𝑖=1 𝑖=1

E, portanto:

𝑁 𝑁 𝑁 𝑁

𝑉 [∑ 𝑋𝑖 ] = 𝐸[(𝑎1 + 𝑎2 + ⋯ + 𝑎𝑁 )2 ] =𝐸 ∑ 𝑎𝑖2 + ∑ ∑ 𝑎𝑗 𝑎𝑖
𝑖=1 𝑖=1 𝑗=1 𝑖=1
[ 𝑖≠𝑗 ]
𝑁 𝑁 𝑁

= ∑ 𝐸[𝑎𝑖2 ] + ∑ ∑ 𝐸[𝑎𝑗 𝑎𝑖 ]
𝑖=1 𝑗=1 𝑖=1
𝑖≠𝑗

A última passagem também decorre da propriedade do operador esperança referente à


expectativa da soma. Continuando e retomando a definição de ai:
𝑁 𝑁 𝑁 𝑁
2
𝑉 [∑ 𝑋𝑖 ] = ∑ 𝐸[(𝑋𝑖 − 𝐸[𝑋𝑖 ]) ] + ∑ ∑ 𝐸[(𝑋𝑗 − 𝐸[𝑋𝑗 ])(𝑋𝑖 − 𝐸[𝑋𝑖 ])]
𝑖=1 𝑖=1 𝑗=1 𝑖=1
𝑖≠𝑗

E, portanto:
𝑁 𝑁
2
𝑉 [∑ 𝑋𝑖 ] = 𝑁𝜎 + ∑ ∑ 𝑐𝑜𝑣[𝑋𝑖 𝑋𝑗 ]
𝑖=1 𝑗≠𝑖 𝑖=1

(Segunda estratégia de demonstração, mais longa) Defina X1 + X2+...+ XN = Σ. Assim,


V(X1 + X2+...+ XN) = V(Σ) = E[(Σ – E[Σ])2] =

= E[(Σ2 + E[Σ] 2 – 2Σ E[Σ])] = E[Σ2]+ E[Σ] 2 – 2E[Σ] 2 = E[Σ2] – E[Σ]2  V(X1 +


X2+...+ XN) = E[Σ2] – E[Σ] 2 (i).

Defina A ≡ E[Σ2] e B ≡ E[Σ] 2.

(ii) A ≡ E[Σ2] = E[(X1 + X2+...+ XN)2] = 𝐸[∑𝑁 2 𝑁 𝑁 2


𝑖=1 𝑋𝑖 + ∑𝑗≠𝑖 ∑𝑖=1 𝑋𝑖 𝑋𝑗 ] = ∑𝑖=1 𝐸[𝑋𝑖 ] +
∑𝑗≠𝑖 ∑𝑁 𝑖=1 𝐸[𝑋𝑖 𝑋𝑗 ]

(iii) B ≡ E[Σ] 2 = (E [X1 + X2+...+ XN])2 = (E[X1]+ E[X2]+...+ E[XN])2


= ∑𝑁 2 𝑁
𝑖=1 𝐸[𝑋𝑖 ] + ∑𝑗≠𝑖 ∑𝑖=1 𝐸[𝑋𝑖 ]𝐸[𝑋𝑗 ]

2
Levando (i) e (ii) em (iii):

V(X1 + X2+...+ XN ) =
∑𝑁 2 𝑁 𝑁 2 𝑁
𝑖=1 𝐸[𝑋𝑖 ] + ∑𝑗≠𝑖 ∑𝑖=1 𝐸[𝑋𝑖 𝑋𝑗 ] − (∑𝑖=1 𝐸[𝑋𝑖 ] + ∑𝑗≠𝑖 ∑𝑖=1 𝐸[𝑋𝑖 ]𝐸[𝑋𝑗 ]) =

𝑁 𝑁 𝑁 𝑁

(∑ 𝐸[𝑋𝑖2 ] − ∑ 𝐸[𝑋𝑖 ]2 ) + (∑ ∑ 𝐸[𝑋𝑖 𝑋𝑗 ] − ∑ ∑ 𝐸[𝑋𝑖 ]𝐸[𝑋𝑗 ]) =


𝑖=1 𝑖=1 𝑗≠𝑖 𝑖=1 𝑗≠𝑖 𝑖=1

𝑁 𝑁

(∑ 𝐸[𝑋𝑖2 ] 2
− 𝐸[𝑋𝑖 ] ) + (∑ ∑ 𝐸[𝑋𝑖 𝑋𝑗 ] − 𝐸[𝑋𝑖 ]𝐸[𝑋𝑗 ])
𝑖=1 𝑗≠𝑖 𝑖=1

A expressão no primeiro parêntesis à esquerda é equivalente à soma das variâncias das


N VAs (pois V(X) = E[X2] – E[X] 2), enquanto a expressão no segundo parêntesis é
equivalente à soma das covariâncias entre as N VAs (pois cov(X1,X2) = E[X1X2] –
E[X1]E[X2]). Conclusivamente:
𝑁 𝑁 𝑁 𝑁

𝑉 [∑ 𝑋𝑖 ] = ∑ 𝑉[𝑋𝑖 ] + ∑ ∑ 𝑐𝑜𝑣[𝑋𝑖 𝑋𝑗 ] = 𝑁𝜎 2 + ∑ ∑ 𝑐𝑜𝑣[𝑋𝑖 𝑋𝑗 ]


𝑖=1 𝑖=1 𝑗≠𝑖 𝑖=1 𝑗≠𝑖 𝑖=1

Uma dúvida que pode ter surgido neste item é quanto ao somatório duplo abaixo.
𝑁 𝑁

∑ ∑ 𝑋𝑗 𝑋𝑖 = 𝑋1 (𝑋2 + 𝑋3 + ⋯ + 𝑋𝑁 ) + 𝑋2 (𝑋1 + 𝑋3 + ⋯ + 𝑋𝑁 ) + ⋯
𝑗=1 𝑖=1
𝑖≠𝑗
+ 𝑋𝑁 (𝑋1 + 𝑋3 + ⋯ + 𝑋𝑁−1 )

𝜎2
(Q.2.c) Assumindo, agora, que as N VAs são independentes, demonstre que 𝑉[𝑋̅] = ,
𝑁
1
com 𝑋̅ = 𝑁 ∑𝑁
𝑖=1 𝑋𝑖 . Utilize, para isso, o resultado obtido na demonstração do item
anterior.

R:

1 1 1
1 1 2 1 2
̅
𝑉[𝑋] = 𝑉 [ ∑ 𝑋𝑖 ] = ( ) 𝑉 [∑ 𝑋𝑖 ] = ( ) (𝑁𝜎 2 + ∑ ∑ 𝑐𝑜𝑣(𝑋𝑖 , 𝑋𝑗 ))
𝑁 𝑁 𝑁
𝑖=1 𝑖=1 𝑖≠𝑗 𝑖=1

Como X1, X2,...,XN são independentes, 𝑐𝑜𝑣(𝑋𝑖 , 𝑋𝑗 ) = 0, i,j=1,...,N, i≠j, do que decorre
1 2 𝜎 2
que 𝑉[𝑋̅] = (𝑁) (𝑁𝜎 2 ) = 𝑁 .

3
(Q.3) [binomial] Bussab & Morettin (5ª edição) (Cap.6, Exercício 31) Na manufatura
de certo artigo, é sabido que um entre dez artigos é defeituoso. Qual a probabilidade de
que uma amostra casual de tamanho quatro contenha:

(a) nenhum defeituoso?

(b) exatamente um defeituoso?

(c) exatamente dois defeituosos?

(d) não mais do que dois defeituosos?

R: este exercício requer a utilização da distribuição binomial, conforme segue. O


número de sucessos é definido por “x” e o número de tentativas por “N”.

𝑁 𝑁
(a) ( ) 𝑝 𝑥 (1 − 𝑝)𝑁−𝑥 , x = 0, i.e., trata-se de calcular ( ) 𝑝0 (1 − 𝑝)4 = 1.1. (1 −
𝑥 0
0,1)4 = 0,94 = 0,6561

4
(b) ( ) 𝑝1 (1 − 𝑝)4−1 = 4. 0,11 0,93 = 0,2916
1
4
(c) ( ) 𝑝2 (1 − 𝑝)4−2 = 6. 0,12 0,92 = 0,0486
2
(d) Trata-se de P(X <= 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0,6561 + 0,2916 +
0,0486 = 0,9963.

(Q.4) [Bussab & Morettin (6ª edição), Cap.8, Exercício 33] Numa sala estão cinco
crianças cujas idades são (em anos): 3, 3, 4, 5, 5. Escolhem-se três crianças ao acaso
para formar uma trinca. X indica a idade da mais nova da turma, e Y a da mais velha.

(a) Escreva a F.D. conjunta de X e Y.


(b) Calcule E(X) e Var(X).
(c) Calcule Cov(X, Y ).
(d) Calcule Var(X + Y).

R: [apenas o início da resolução será apresentado por hora]

(a) A FD conjunta deve partir das combinações possíveis de eventos referentes às idades
das três crianças. O que depende da maneira como as crianças são sorteadas, com ou
sem reposição. Vamos assumir a segunda possibilidade, o que resulta na árvore de
possibilidades abaixo, com um total de 18 possibilidades.

4
4 (1)
3
5 (2)

3 (3)
3 4
5 (4)

3 (5)

5 4 (6)

5 (7)

3 (8)
3
5 (9)

4 4

3 (10)
5
5 (11)

3 (12)

3 4 (13)

5 (14)

3 (15)
5 4
5 (16)

3 (17)
5
4 (18)

5
A dificuldade está em notar que os ramos diferem em probabilidade com alguns sendo
duas ou três vezes mais prováveis do que os demais. Por exemplo, o ramo 3-3-5 pode
ocorrer tanto com a primeira criança de 5 anos sendo sorteada como com a segunda
criança de cinco anos sendo sorteada. Já no ramo 3-4-5 há duas crianças que podem
assumir a primeira posição e duas que podem assumir a terceira posição. É necessário,
pois, contar o número de eventos correspondentes a cada ramo. O que é feito no termo
em colchetes.

(Q.5) Bussab & Morettin (5ª edição)Cap.7, Exercício 36. Uma enchedora automática de
garrafas de refrigerantes está regulada para que o volume médio de líquido em cada
garrafa seja de 1.000 cm3 e o desvio padrão de 10 cm3. Pode-se admitir que a variável
volume seja normal.

(a) Qual é a porcentagem de garrafas em que o volume de líquido é menor do que 990
cm3?

(b) Qual é a porcentagem de garrafas em que o volume líquido não se desvia da média
em mais do que dois desvios padrão?

(c) O que acontecerá com a porcentagem do item (b) se a máquina for regulada de
forma que a média seja 1.200 cm3 e o desvio padrão 20 cm3?

R:

(a) P(X < 990), X~N(1.000, 102). Padronizando X, tem-se P(Z < (990-1000)/10) = P(Z
< - 1) = 0.1586553.

(b) P(1000-2*10 ≤ X ≤ 1000+2*10) = 1 - P(X< 1000-2*10 ou X > 1000+2*10) =


1 - P(X< 1000-2*10) – P(X > 1000+2*10) = 1 – 2*P(X< 1000-2*10)

(pois a F.D. normal é simétrica, de modo que P(X< 1000-2*10) = P(X> 1000+2*10))

P(1000-2*10 ≤ X ≤ 1000+2*10) = 1 – 2*P(X< 880) = 1 – 2*P(Z< (880-1000)/10) = 1


– 2*P(Z< -2) = 1 – 2* 0.02275013 = 0.9544997.

(c) Refazer o item b alterado com μ = 1.200 e σ = 20.

(Q.6) [FD conjunta] Bussab & Morettin (5ª edição)Cap.8, Exercício 31. Numa
comunidade em que apenas dez casais trabalham, fez-se um levantamento no qual
foram obtidos os seguintes valores para os rendimentos anuais:

Casal Rendimento do Homem Rendimento da Mulher

6
(X) (Y)
1 10 5
2 10 10
3 5 5
4 10 5
5 15 5
6 10 10
7 5 10
8 15 10
9 10 10
10 5 10

Um casal é escolhido ao acaso entre os dez. Seja X o rendimento do homem e Y o da


mulher.

a) Construa a distribuição de probabilidade conjunta de X e Y;


b) Determine as distribuições marginais de X e Y;
c) X e Y são variáveis dependentes? Justifique;
d) Calcule as médias e variâncias de X e Y e a covariância entre elas;
e) Considere a VA Z igual à soma dos rendimentos de cada homem e mulher. Calcule
a média e variância de Z;
f) Supondo que todos os casais tenham a renda de um ano disponível, e que se
oferecerá ao casal escolhido a possibilidade de comprar uma casa pelo preço de 20,
qual a probabilidade de que o casal possa efetuar a compra?

R: Basta elaborar uma tabela de dupla entrada com colunas contendo todos os valores
observados de Y e linhas todos os valores observados de X (ou vice-versa). E então
contabilizar, para cada célula da tabela, o número de casais para os quais foi
observado o par de valores (X,Y) que define a linha e a coluna em que encontra a
célula. Com isso se obtém as frequências relativas. As probabilidades são a razão dos
valores das células pelo número total de casais, 10. Ver a tabela abaixo.

Frequências absolutas
X\Y 5 10
5 1 2
10 2 3
15 1 1

Frequências relativas
X\Y 5 10
5 10% 20%
10 20% 30%
15 10% 10%

7
(b) As marginais são dadas por P(X=x) e P(Y=y). Basta calcular a frequência de cada
valor de X e Y, o que corresponde a calcular as somas ao longo das colunas para a
variável X e das linhas para a variável Y, como se vê abaixo.

Frequências relativas
X\Y 5 10 P(X=x)
5 10% 20% 30%
10 20% 30% 50%
15 10% 10% 20%
P(Y=x) 40% 60% 100%

(c) Há independência se e somente se P(X=x,Y=y) = P(X=x)P(Y=y), para todos os


valores x e y. Na tabela da questão anterior, basta multiplicar os valores de P(X=x) e
de P(Y=y) associados a uma dada célula e verificar se o resultado é exatamente
equivalente ao valor da célula. Se for, há independente, caso contrário, não há. Por
exemplo, tomando a primeira linha e a primeira coluna, X = 5 e Y = 5, tem-se P(X=5)
P(Y=5) = 12% ≠ P(X=5, Y=5) = 10%. Conclusivamente não há independência pois
uma violação é suficiente para refutar uma afirmação que vale para todos os valores x
e y.

(d) Para calcular as médias é preciso levar em conta o número de ocorrência de cada
um dos valores, ou seja:
𝑀 𝑀
𝑀𝑖 1
𝑋̅ = ∑ 𝑥𝑖 = ∑ 𝑀𝑖 𝑥𝑖
𝑀 𝑀
𝑖=1 𝑖=1

Trata-se de uma média ponderada em que o fator de ponderação é a frequência


relativa, M é o número de valores de cada variável, Mi é o número de ocorrência do M-
ésimo valor.

Resulta 𝑋̅ = 9,5 e 𝑌̅ = 8. A covariância amostral é dada pela fórmula:


𝑁
1
𝑐𝑜𝑣 = ∑(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅)
̅̅̅̅̅
𝑁
𝑗=1

Resulta ̅̅̅̅̅
𝑐𝑜𝑣 = −1.

(e) Resultados na tabela abaixo

X Y X+Y
10 5 15
10 10 20
5 5 10
10 5 15
15 5 20

8
10 10 20
5 10 15
15 10 25
10 10 20
5 10 15
Média 9,50 8,00 17,50
Variância 13,61 6,67 18,06

(f) Basta contar o número de casais cuja soma da renda (X+Y) é igual o maior do que
20 e dividir pelo número de casais. Segundo a tabela do item anterior exatamente 5 dos
10 casais verificam este critério, i.e., a probabilidade é de 50%.

Você também pode gostar