Você está na página 1de 9

Lista 2

(Q.1) Bussab & Morettin (5ª edição) Cap.10, Ex.3. A distribuição do número de filhos, por
família, de uma zona rural está no quadro abaixo.

No de filhos Porcentagem
0 10
1 20
2 30
3 25
4 15
Total 100

(a) [ignorar]

(b) Dê, na forma de uma tabela de dupla entrada, as possíveis amostras de duas famílias que
podem ser formadas e as respectivas probabilidades de ocorrência [trata-se, pois, de
amostras de tamanho 2];

(c) Se fosse escolhida uma amostra de tamanho 4, qual seria a possibilidade de observar a
quádrupla ordenada (2,3,3,1)?

R:

(b)

Foi omitida do enunciado a importante informação de que as duas famílias são


selecionadas aleatoriamente, sendo, pois, duas observações independentes e identicamente
distribuídas. O que permite calcular a probabilidade do evento simultâneo em que a
primeira família tenha x1 filhos e a segunda x2 filhos, P(X=x1 e X = x2), como produto das
probabilidades individuais, i.e., P(X=x1) e P(X = x2). O que foi utilizado para gerar a
tabela abaixo.

Família 1 /
0 1 2 3 4
família 2
0 1,00% 2,00% 3,00% 2,50% 1,50%
1 2,00% 4,00% 6,00% 5,00% 3,00%
2 3,00% 6,00% 9,00% 7,50% 4,50%
3 2,50% 5,00% 7,50% 6,25% 3,75%
4 1,50% 3,00% 4,50% 3,75% 2,25%

1
(c)

Assumindo que se trata de uma AAS, tem-se que P(X1 = 2 e X2 = 3 e X3 = 3 e X4 = 1) =


P(X1=2)P(X2=3)P(X3=3)P(X4=1) = (30/100) (25/100) (25/100) (15/100) = 0,0028125.

(Q.2) Bussab & Morettin (5ª edição) Cap.10, Ex.6 (adaptado) Com base nos dados da
questão anterior e para amostras de tamanho 2:

(a) construa a distribuição amostral de 𝑋̅ (média amostral) seguindo, para isso, o


procedimento do exemplo 10.9 (5ª edição do livro), o que pressupõe o cálculo de duas
tabelas;

R:

Uma maneira de fazer é gerando, como primeiro passo, uma tabela com todos os valores
possíveis da média e respectivas probabilidades de ocorrência, essas últimas definidas
pela tabela da questão anterior (ou seja, assume-se AAS). No segundo passo tal tabela é
agregada, somando-se as probabilidades de ocorrência para cada valor da média (uma
vez que há valores repetidos na tabela do primeiro estágio).

As tabelas do primeiro estágio e do segundo estágio seguem abaixo, nesta ordem.

2
Família Família Probabilidade da
Média
1 2 média
0 0 0 0,01
0 1 0,5 0,02
0 2 1 0,03
0 3 1,5 0,025
0 4 2 0,015
1 0 0,5 0,02
1 1 1 0,04
1 2 1,5 0,06
1 3 2 0,05
1 4 2,5 0,03
2 0 1 0,03
2 1 1,5 0,06
2 2 2 0,09
2 3 2,5 0,075
2 4 3 0,045
3 0 1,5 0,025
3 1 2 0,05
3 2 2,5 0,075
3 3 3 0,0625
3 4 3,5 0,0375
4 0 2 0,015
4 1 2,5 0,03
4 2 3 0,045
4 3 3,5 0,0375
4 4 4 0,0225

Média Probabilidade da média


0 0,01
0,5 0,04
1 0,1
1,5 0,17
2 0,22
2,5 0,21
3 0,1525
3,5 0,075
4 0,0225

3
(b) Apresente o histograma da distribuição amostral de 𝑋̅;

R: na figura à esquerda há o gráfico exato da distribuição de 𝑋̅ (também podendo ser


entendido como um histograma) enquanto que, no gráfico à direita há o histograma com
faixas de tamanho unitário.

(c) Calcule P(|𝑋̅ – μ|> 1)

R: Deve-se considerar que, como a FD da variável aleatória X é exatamente conhecida,


E[X] = μ também é exatamente conhecida e, no caso, igual a 2,15 (basta calcular a média
a partir do enunciado da questão anterior). O item “c” pois pede para calcular P(|𝑋̅ –
2,15| > 1) = P(𝑋̅ – 2,15 < -1 ou 𝑋̅ – 2,15 > 1) = P(𝑋̅ < 1,15 ou 𝑋̅ > 3,15) = P((𝑋̅ = 0 ou 𝑋̅
= 0,5 ou 𝑋̅ = 1) ou (𝑋̅ = 3,5 ou 𝑋̅ = 4)) = P(𝑋̅ = 0) + P(𝑋̅ = 0,5) + P(𝑋̅ = 1) + P(𝑋̅ = 3,5)
+ P(𝑋̅ = 4) = 0,01+0,04+0,1 + 0,075 + 0,0225 = 0,2475.

(d) Se as amostras fossem de tamanho 4, a P(|𝑋̅ – μ|> 1) seria maior ou menor do que a
probabilidade encontrada em (c)? Justifique com base nas estatísticas média e variância
calculadas para a variância amostral, com o histograma apresentado em (b) e na noção de
FD.

R: há um erro no enunciado. O termo “variância amostral” deve ser substituído por


“média amostral” para responder à questão. Conforme visto em sala de aula, E[𝑋̅] = μ e
V[𝑋̅] = σ2/N, ou seja, com o aumento da amostra, a média de 𝑋̅ se mantém constante, mas
a variância é reduzida. O histograma no item “b” se assemelha à função de distribuição
normal, cujo parâmetro variância tem magnitude diretamente proporcional à massa de
probabilidade referente a níveis distantes de μ (probabilidade das caudas). Assim, se a
variância de 𝑋̅ cai com o aumento de N, valores distantes de μ têm de se tornar menos
prováveis e, portanto, P(|𝑋̅ – μ|> 1) tem de ser obrigatoriamente menor para N = 4 do que

4
para N = 2. De fato, se espera que, com tal aumento de N, a FD de 𝑋̅ se altere com o
aumento da massa de probabilidade nas proximidades de μ e queda da massa de
probabilidade para níveis mais afastados de μ.

(Q.3) Bussab & Morettin (5ª edição) Cap.10, Ex.24 A distribuição dos comprimentos dos
elos da corrente de uma bicicleta é normal, com média 2 cm e variância 0,01 cm 2. Para que
uma corrente se ajuste à bicicleta, deve ter comprimento total entre 58 e 61 cm.

(a) Qual é a probabilidade de uma corrente com 30 elos não se ajustar à bicicleta?

(b) E para uma corrente com 29 elos?

[Observação: suponha que os elos sejam selecionados aleatoriamente ao acaso para compor
a corrente, de modo que se tenha independência]

R: Seja X1,...,XN uma amostra aleatória simples (AAS), N = 30, com S = X1+X2+...+XN,
E[Xi] = Nµ = 30*2=60, V[Xi] = σ2 = 0,01, i=1,...N.

Com isso, E[S] = E[X1]+E[X2]+...+E[XN] = Nµ. E, adicionalmente, V[S] =


V[X1+X2+...+XN]. Porém, como X1,...,XN são independentes (AAS), então V[S] = V[X1]
+ V[X2]+...+V[XN] = Nσ2 = 30*0,01 = 0,3.

(item a) P(S < 58 ou S > 61) = P(S < 58) + P(S > 61) = P(S < 58) + 1- P(S < 61) = 1 +
P(S < 58) - P(S < 61).

O próximo passo é padronizar S, de modo a obter uma variável resultante como densidade
de probabilidade normal padrão, i.e., N(0,1) (ver detalhes na próxima resolução).

𝑆-µ 58-µ 𝑆-µ 61-µ −2


P(S < 58 ou S > 61) = 1 + 𝑃 ( 𝜎 < )−𝑃( 𝜎 < ) = 1 + 𝑃 (𝑍 < 0,3) −
𝜎 𝜎
1
𝑃 (𝑍 < 0,3)

Utilizando, no R a função pnorm(Zγ, µ, σ) = P(X ≤ Zγ), chega-se a

P(S < 58 ou S > 61) = 1 + 0.0001303648 - 0.9660554 = 0.03407496.

(item b) análogo ao anterior, porém E[S] = 29*2 = 58.

(Q.4) Bussab & Morettin (5ª edição) Cap.10, Ex.27 Um distribuidor de sementes
determina, por meio de testes, que 5% das sementes não germinam. Ele vende pacotes com
200 sementes com garantia de 90% de germinação. Qual é a probabilidade de que um
pacote não satisfaça à garantia?

5
R: A dificuldade desta questão estava em (i) a omissão, no enunciado, da hipótese de que a
FD subjacente é uma normal, (ii) a necessidade de conhecer a média e variância
populacionais da estatística proporção amostral, (iii) a conveniência de padronizar a
estatística para, com isso, tomar por base a distribuição normal padrão (esta conveniência
não era necessária, caso fosse utilizado um software para obter a probabilidade).

Passo 1: Pergunta a ser respondida. Trata-se de calcular P(𝑝̂ < 0,9), em que 𝑝̂ ≡
proporção amostral. Para isso, é preciso conhecer a FD subjacente à estatística proporção
amostral.

Passo 2: FD subjacente. Sendo a proporção uma média, é comum assumir que a FD


subjacente é uma normal com µ = E[𝑝̂ ] e σ2 = V[𝑝̂ ] . É necessário, pois obter os valores
numéricos destes parâmetros.

Passo 2.a) Expectativa, µ = E[𝑝̂ ]

A proporção é uma média de variáveis binárias. Seja considerada uma amostra aleatória
simples X1,...,XN, com Xi, i=1,..,N sendo variáveis binárias. Este último fato implica em que
Xi ~ Bernoulli(p), i=1,...,N, de modo que E[Xi] = p e V[Xi] = p(1-p)

Atenção: é altamente recomendável saber média e variância de uma variável Bernoulli


(tente demonstrar, como exercício e tenha tais resultados em mente).

Assim:

𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 𝐸[𝑋1 ] + 𝐸[𝑋2 ] + ⋯ + 𝐸[𝑋𝑁 ]


µ = 𝐸[𝑝̂ ] = 𝐸 [ ]= =𝑝
𝑁 𝑁
Segundo o enunciado, p = 0,95 (pois 5% não germinam, em geral). Assim, µ = 0,95.

Passo 2.b) Variância, σ2 = V[𝑝̂ ]

𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 1
𝜎 2 = 𝑉[𝑝̂ ] = 𝑉 [ ] = 2 𝑉[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 ]
𝑁 𝑁
Porém, X1,...,XN compõem uma amostra aleatória simples, sendo variáveis aleatórias
independentes. Assim sendo:

1 1
𝜎 2 = 𝑉[𝑝̂ ] = 2
𝑉[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 ] = 2 (𝑉[𝑋1 ] + 𝑉[𝑋2 ] + ⋯ + 𝑉[𝑋𝑁 ])
𝑁 𝑁
𝑁𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
= =
𝑁2 𝑁
Importante: o desvio-padrão populacional é, pois:

6
𝑝(1 − 𝑝)
𝜎= √
𝑁

De acordo com o enunciado, p = 0,95 e N = 200, deste modo, pois:

0,95 ∗ 0,05
𝜎= √ ~0,0154
200

Passo 3: cálculo da probabilidade visada

Trata-se de calcular P(𝑝̂ < 0,9), considerando que 𝑝̂ ~𝑁(0,95; 0,01542 ). Ocorre que os
valores da média e variância são específicos demais e por isso, por exemplo, não
correspondem às tabelas da FD normal encontradas nos apêndices de livros de estatística.
Por isso é comum padronizar a estatística 𝑝̂ , i.e., subtraí-la de sua média populacional e
dividir o resultado por seu desvio padrão populacional. Com isso, obtém-se uma variável
aleatória com FD normal padrão, i.e., com média zero e variância unitária. Por coerência,
essa operação deve ser realizada em ambos os lados da desigualdade interna à
probabilidade que se deseja calcular, como segue.

𝑝̂ − 0,95 0,9 − 0,95


𝑃( < ) = 𝑃(𝑍 < −3,244)
0,0154 0,0154

Em que Z representa uma variável aleatória com FD normal padrão, i.e., Z ~ N(0,1).

𝑝̂−𝐸[𝑝̂] 𝑋𝛾 −𝐸[𝑝̂]
(Nota: a forma geral da padronização é 𝑃 ( < ))
√𝑉[𝑝̂] √𝑉[𝑝̂]

Aplicando no R a função pnorm(Zγ, µ, σ) = P(X ≤ Zγ) (ou seja, essa função reporta a
probabilidade à esquerda do número Zγ), com Zγ =-3,244 µ = 0, σ =1, obtém-se
0.000588433 ~ 0,06%).

(Q.5) Uma entidade privada apenas apoia candidatos com porcentagem de votos acima de
10%. Para decidir quanto ao apoio a um candidato em específico, a entidade dispõe de
orçamento limitado, e vai coletar uma amostra aleatória de tamanho 100. Suponhamos que
seja cabível assumir que a função densidade da porcentagem amostral de votos seja normal
para o candidato e que a porcentagem de votos “verdadeira” (populacional) seja de 9% para
o candidato (porém a entidade privada não sabe disso). Qual é a probabilidade da entidade
decidir por apoiar após observar as informações contidas na amostra?

R:

Deseja-se calcular P(𝑝̂ > 0.1). Com base no enunciado e na resolução dos itens anteriores,
E[𝑝̂ ] = 0.09 e DP[𝑝̂ ] = √0.09(0.91)/100~0,02862. Deste modo:

7
P(𝑝̂ > 0.1) = P(Z > (0.1 – 0.09)/0.02862) = 1 - P(Z < (0.1 – 0.09)/0.02862) ~ 36,34%

(Q.6) Bussab & Morettin (5ª edição) Cap.10, Ex.8 A máquina de empacotar um
determinado produto o faz segundo uma distribuição normal, com média μ e desvio padrão
10 g. De hora em hora será retirada um amostra de quatro pacotes e esses serão pesados. Se
a média da amostra for inferior a 495 g ou superior a 520 g, encerra-se a produção para
reajustar a máquina, isto é, reajustar o peso médio.

(a) Em quanto deve ser regulado o peso médio μ para que apenas 10% dos pacotes tenham
menos do que 500 g?

(b) Com a máquina assim regulada, qual é a probabilidade de ser feita uma parada
desnecessária?

(c) Se o peso médio da máquina desregulou-se para 500 g, qual é a probabilidade de


continuar a produção fora dos padrões desejados?

R: Para responder o item (a) basta encontrar μ tal que P(𝑋̅ < 500|μ) = 0,1.
Padronizando:
𝑋̅ −𝜇 500−𝜇 500−𝜇 500−𝜇
𝑃( < ) = 𝑃 (𝑍 < ) = 𝑃 (𝑍 < ) = 0,1, em que Z ~ N(0,1) (1)
𝜎/√𝑁 𝜎/√𝑁 𝜎/√𝑁 10/2

De acordo com a tabela da N(0,1) (ou com o comando qnorm do R), P(z<-1,282) = 0,1 (2)

Combinando (1) e (2), tem-se que:

500 − 𝜇
= − 1,282 → 𝜇 = 506,41
5
Quanto ao item (b), é preciso entender o que significa uma parada desnecessária. Isso de
fato não é claro pelo enunciado. Este dá a entender que a grandeza “peso médio” é
ajustável e deve ser ajustada de maneira a manter a massa dos pacotes dentro de um
intervalo pré-definido, no caso 495 e 520 g. A dificuldade de interpretação está em
perceber que “peso médio” é a média populacional, enquanto que o peso (ou massa)
médio da amostra de quatro pacotes é a média amostral. Em suma, uma parada
desnecessária ocorre sempre que (i) a média amostral está fora do intervalo de 495 a 520
gramas e (ii) a média populacional está dentro de tal intervalo (pois não há, neste caso,
necessidade de um ajuste). A probabilidade a ser calculada é:

P(𝑋̅ < 495 𝑜𝑢 𝑋̅ > 520 |495<μ<520)

Porém, o enunciado exige μ = 506,41. Então deve-se calcular:

P(𝑋̅ < 495 𝑜𝑢 𝑋̅ > 520 |μ=506,41)

8
495−506,41 520−506,41 −11,41
Padronizando, tem-se: 𝑃 (𝑍 < ) + 𝑃 (𝑍 > ) = (𝑍 < )+
5 5 5
13,59
𝑃 (𝑍 > ) = (𝑍 < −2,82) + 𝑃(𝑍 > 2,718) = 0,01452856~1,5%.
5

(c) Tendo em conta os itens anteriores, trata-se de:

P(495 < 𝑋̅ < 520 |μ=500) = 1 - P(𝑋̅ < 495 𝑜𝑢 𝑋̅ > 520 |μ=500)

Basta padronizar e utilizar a tabela da normal padrão.

Você também pode gostar