Escolar Documentos
Profissional Documentos
Cultura Documentos
Propriedades da Média:
a) Multiplicando todos os valores por uma constante, sua média ficará multiplicada por essa
constante.
b) Dividindo todos os valores por uma constante, sua média ficará dividida por essa constante.
c) Somando ou subtraindo uma constante a todos os valores a sua média ficará somada ou
subtraída da mesma constante.
1
b) Mediana: é o termo do meio em um conjunto ordenado, ou seja, a mediana divide um
conjunto ordenado e duas partes iguais, 50% inferiores a ela e 50% superiores a ela. Note que
a mediana pode ou não pertencer ao conjunto.
No cálculo da mediana de um conjunto discreto, ou seja, em rol ou tabular, temos que
considerar dois casos :
(1o) Número de dados Ímpar(n é ímpar) : iremos ordenar o conjunto, neste caso a
mediana será igual ao valor que ocupa a posição central, esta posição central será dada por
(2º ) Número de dados Par( n é par) : iremos ordenar o conjunto, neste caso teremos
duas posições centrais, 1ª P.C. e 2ª P.C. , a mediana será a média simples entre os valores
que ocupam as duas posições centrais. Estas posições centrais são dadas por
(2ª ) Utilizando a interpolação linear : vamos usar regra de três, no caso de intervalo de
classe basta usarmos a fórmula da mediana.
2
Ex.: (IBGE/2010) A tabela abaixo apresenta a distribuição de frequências das idades de um
grupo de crianças.
- Veja se as freqüências são simples, se forem acumuladas você terá que transformar para
simples
3
(c) Moda : é o valor que possui a maior freqüência no conjunto, na verdade poderemos ter
mais de uma moda( unimodal ), duas modas( bimodal ) ou nenhuma moda( amodal ). A
moda sempre pertencerá ao conjunto. Quando os dados estiverem agrupados em
intervalos de classes , a classe que possuir a maior freqüência será a classe modal,
poderemos calcular a moda de quatro formas :
(1a) Moda de King: o cálculo da moda leva em conta a influência das classes adjacentes à
classe modal,
"deslocando" a moda em direção a aquelas. A fórmula para cálculo da moda de King é:
onde
(2a) Moda de Czuber: o cálculo da moda de Czuber leva em conta não somente a influência
das classes adjacentes à modal, mas também a própria freqüência modal, lembramos que as
freqüências terão que ser simples. A fórmula para cálculo da moda de Czuber é:
onde
(1ª) Quando os intervalos de classes possuírem amplitudes diferentes, a classe modal será
aquela que possuir a maior densidade de freqüência , que é calculada pela razão entre a
frequência e a amplitude de cada classe.
(2ª) A moda calculada pelo método de Czuber possui algumas limitações: as amplitudes das
classes têm que ser iguais, a classe modal não pode ser a classe extrema( a 1ª e a última
classes da distribuição) e a distribuição terá que ser unimodal.
4
(d) Quartis : Dado um conjunto ordenado (ordem crescente), os quartis, que denotamos por
Q1, Q2 e Q3, são quantidades numéricas caracterizadas pelo fato de 25%, 50% e 75% das
observações, respectivamente, serem menores ou iguais a elas, os quartis dividem o conjunto
em quatro partes iguais!
Observe com muita atenção que o Q2 divide a distribuição em duas partes iguais, Q1 divide a
1ª parte determinada pela mediana em duas partes iguais e Q3 divide a 2ª parte determinada
pela mediana em duas partes iguais, ou seja Q1 é a mediana da 1ª parte e Q3 é a
mediana da 2ª parte. Legal, não é?
O sinal de igual foi colocado na assimétrica positiva e negativa, pois das três medidas duas
poderão ser iguais, se as três forem iguais teremos uma simétrica.
(e) Diagramas de Ramos e Folhas: é uma representação de dados em que a parte das
dezenas(RAMOS) é separada da parte das unidades (FOLHAS). Vejamos o exemplo abaixo:
Ex.: Sejam os dados { 34, 38, 42, 42, 45, 47, 51, 52, 54, 57, 58, 58, 59, 60, 61, 63, 65, 65,
66, 67, 68, 69, 69, 70, 71, 71, 72, 73, 73, 74, 75, 75, 76, 76, 77, 79, 81, 81, 82, 83, 83, 84,
84, 85, 87 } podemos representar da seguinte forma :
RAMOS FOLHAS
3 48
4 2257
5 1247889
6 0135567899
7 0112334556679
8 112334457
5
Se tivermos o diagrama de Ramos e Folhas podemos identificar os dados, iremos proceder
como segue:
Note que no 3º ramo os dados são representados mas não em ordem, por isso temos que
ordenar, pois a ordem é muito importante para o cálculo da mediana, de uma forma geral os
dados serão representados em ordem crescente.
Estas representações serão muito úteis no cálculo das medidas de posição e de dispersão.
6
Se tivermos freqüências teremos , agora se a distribuição for
, neste caso n = Σ f i.
Variância e Desvio Padrão: a variância é obtida pelo cálculo da média dos quadrados dos
desvios em relação à média :
, este n é a quantidade de
dados. Genericamente representamos a variância por Var , mas existe diferença se tivermos
analisando uma população ou uma amostra. O desvio-padrão é a raiz quadrada da
variância e também existe diferença entre população e amostra.
de dados.
n = Σ fi .
MUITA ATENÇÃO!!! No caso de uma população a variância também poderá ser calculada da
menos o quadrado da média , lembrando que a média pode ser também a média com
frequências.
b) Amostra : no caso de uma amostra o grau de liberdade será diferente e neste caso
iremos considerar n – 1 e representar a amostra por uma letra latina que será S2 ,
7
b.1) Dados Brutos : perceba que
,
n = Σ fi .
PROPRIEDADES :
1) Multiplicando ou dividindo todos os valores por uma constante, sua Variância ficará
multiplicada ou dividida pelo quadrado da constante.
2) Somando ou subtraindo uma constante a todos os valores , a sua Variância não se altera.
Desvio-Padrão : como foi dito anteriormente é a raiz quadrada da variância, se tivermos uma
população o desvio-padrão será representado por σ e se tivermos uma amostra será
representado por S, ou sela, iremos utilizar as fórmulas da variância, calculando a raiz
quadrada do resultado teremos o desvio-padrão.
PROPRIEDADES :
1) Multiplicando ou dividindo todos os valores por uma constante, seu Desvio-Padrão ficará
multiplicado ou dividido pela constante.
2) Somando ou subtraindo todos os valores por uma constante, o seu Desvio-Padrão não se
altera.
Ex.: (IBGE/2010) No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas
durações, em minutos, estão apresentadas no rol abaixo.
5 2 11 8 3 8 7 4
O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é
a) 3,1 b) 2,8 c) 2,5 d) 2,2 e) 2,0
8
SOLUÇÃO
Vamos calcular a variância e depois o desvio-padrão,
e utilizando a relação a
variância será :
e o desvio-padrão . Opção B .
Coeficiente de Variação é adimensional (não tem dimensão), não sendo expresso em nenhuma
unidade de medida. Ele estabelece uma relação entre o desvio padrão e a média, sendo
geralmente representado na forma percentual, é por isso que normalmente se multiplica o CV
por 100% .
PROPRIEDADES :
1) Somando-se uma constante positiva a todos os valores de um conjunto de dados, o CV
diminui .
2) Subtraindo-se uma constante positiva a todos os valores de um conjunto de dados, o CV
aumenta.
3) Multiplicando-se ou dividindo-se uma constate positiva a todos os valores de um conjunto
de dados, o CV não se altera.
9
Questão envolvendo propriedades do Coeficiente de Variação, como os salários serão
reajustados em 20%, cada salário será multiplicado pelo fator 1,2, assim o CV não será
alterado. Opção A.
QUESTÕES RESOLVIDAS
(TRE PI/2009) Para responder às questões de números 01 a 03 considere a tabela abaixo que
mostra a distribuição de salários (em reais) dos funcionários de uma empresa. O valor da
mediana, obtido por interpolação linear, é igual a R$ 2.900,00 e a frequência absoluta simples
do terceiro intervalo de classe, igual a X.
(01) A frequência relativa acumulada crescente até o intervalo de classe em que pertence a
mediana é
a) 80% b) 70% c) 60% d) 50% e) 40%
Solução
Podemos utilizar a regra de três, a interpolação, mas podemos utilizar a fórmula da mediana
, logo assim
. Opção A.
75% de 200 vale 150 , até a segunda classe temos 60 assim faltam 90 para a terceira classe.
Vamos montar uma regra de três;
1000 -------- 100
10
X -------- 90 X=900 e o terceiro quartil vale 2500 + 900= 3400.
Note que 1000 é a amplitude da terceira classe e 100 a freqüência da terceira classe. Opção E.
(03) Utilizando interpolação linear, tem-se que o número de funcionários que ganham salários
menores ou iguais a R$ 3.700,00 é
a) 165 b) 166 c) 168 d) 170 e) 172
Solução
O valor de 3700 está na quarta classe( seja y a freqüência ) e , menores do que ele , temos
um total de 160, assim o total será 160 + y. Vamos usar regra de três :
1000 ------- 30
200 ------- y y=6 assim 160 + 6= 166 , perceba que 200 é igual à 3700 – 3500. Opção B.
(04)(IBGE/2010) No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas
durações, em minutos, estão apresentadas no rol abaixo.
5 2 11 8 3 8 7 4
O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é
a) 3,1 b) 2,8 c) 2,5 d) 2,2 e) 2,0
Solução
Vamos calcular a variância e depois o desvio-padrão,
e utilizando a relação a
variância será :
e o desvio-padrão . Opção B .
11
Solução
Pelo CV vamos descobrir as variâncias e como as médias são iguais, a variância conjunta é a
média ponderada entre as variâncias, os pesos serão as quantidades de elementos.
CV(A) = DP(A)/500 = 0,2 DP(A) = 100 Var A = 10.000
CV(B) = DP(B)/500 = 0,3 DP(B) = 150 Var B = 22.500
. Opção A .
(06)(ANS 2007) O histograma abaixo representa a distribuição das idades dos pacientes
atendidos no ano de 2000 em uma clínica infantil, expressa em anos.
(07)(IRB 2004) A questão abaixo diz respeito à distribuição de freqüências conforme o quadro
abaixo, no qual não existem observações coincidentes com os extremos das classes.
12
10.Basta calcularmos qual a freqüência para uma amplitude de 4,5( 164 – 159,5= 4,5)
utilizando uma regra de três;
20 ------- 10
X ------- 4,5 logo x = 9 . Como já temos 26 anteriormente: 26+9= 35. Opção D
(ICMS SP 2009) Para resolver às questões de números 08 e 09, considere a tabela de
frequências relativas abaixo, que mostra a distribuição dos valores arrecadados, em 2008,
sobre determinado tributo, referente a um ramo de atividade escolhido para análise. Sabe-se
que:
I. As frequências absolutas correspondem às quantidades de recolhimentos, sendo as
frequências relativas do segundo e terceiro intervalos de classe iguais a x e y,
respectivamente.
II. A média aritmética da distribuição, valor arrecadado por recolhimento, é igual a R$
3.350,00 (valor encontrado considerando que todos os valores incluídos num certo intervalo de
classe são coincidentes com o ponto médio deste intervalo).
que nos dá
14.y + 10.x = 7 e resolvendo o sistema com x + y = 0,6( pois a soma de todas as freqüências
vale 1,0) encontramos x = 0,35 e y = 0,25.Maiores ou igual a 3000,00 temos: 0,25 + 0,20 +
0,10 = 0,55 = 55% . Opção C.
(09) Utilizando o método da interpolação linear, tem-se que o valor da respectiva mediana é
(A) R$ 3.120,00 (B) R$ 3.200,00 (C) R$ 3.400,00
(D) R$ 3.600,00 (E) R$ 3.800,00
Solução
Até a segunda classe temos 0,45 , com isso faltam 0,05 para a terceira classe. Usando regra
de três temos:
1000 ------- 0,25
13
X ------- 0,05 X= 200 , então 3000 + 200= 3200 . Opção B.
(TRE PI 2009)
(10) O diagrama de ramo e folhas abaixo corresponde às observações das idades de 50
eleitores escolhidos aleatoriamente em uma determinada zona eleitoral:
Cuidado , pois, as folhas podem ou não estar em ordem. No caso acima tivemos que ordenar
as folhas do ramo 3. Como temos 50 idades( o valor é par ) a mediana será a média simples
entre a 25a e a 26a idades ,logo .A moda será o 46, assim Mo=46. Logo
.Opção D.
(11) Numa pesquisa realizada em 160 domicílios de uma cidade obteve-se o seguinte gráfico
em que o eixo y representa a quantidade de domicílios e o eixo horizontal representa o
número de eleitores verificado por domicílio.
14
Com relação à média aritmética (Me), número de eleitores por domicílio, a mediana (Md) e a
moda (Mo) correspondentes tem-se que:
(A) Me =Md e Md <Mo (B) Me <Md <Mo (C) Me <Md e Md >Mo
(D) Me <Md e Md=Mo (E) Me>Md e Md =Mo
Solução
A moda será 2, Mo=2. Temos 160 domicílios a mediana será a média simples entre o 80o e o
81o ,vemos que ambos valem 3,assim Md=3.Para o cálculo da média utilizaremos a média das
freqüências,
.Opção C.
15
A distribuição:
(A) é simétrica. (B) é assimétrica à esquerda. (C) é assimétrica à direita.
(D) tem moda menor que a média. (E) tem moda igual à média.
Solução
Vamos calcular a média , a moda e a mediana.
16
P3: reajuste de 15% mais um fixo de 200. A média será 2500, o dp=460 e o CV=18,4%.
P4: reajuste de 10% mais um fixo de 300. A média será 2500, o dp=440 e o CV=17,6%.
P5: um valor fixo de 500. A média será 2500, o dp=400 e o CV=16%. Opção E.
QUESTÕES DE CONCURSOS
17
A variância dessa amostra é
(A) 1,50
(B) 1,75
(C) 2,00
(D) 2,25
(E) 2,50
18
(05)(PETROBRAS 2010) O gráfico abaixo apresenta os percentuais de acerto dos candidatos do
concurso Z ao responderem às 5 questões de uma prova, todas de múltipla escolha.
(06)(BNDES 2009) Mariana fez sete ligações de seu aparelho celular. Os tempos, em minutos,
de cada ligação, estão relacionados a seguir:
30; 15; 7; 20; 35; 25; 15
Sejam a, b e c, respectivamente, os tempos médio, modal e mediano do rol de tempos
apresentado. É correto afirmar que
(A) a < b < c
(B) a < c < b
(C) b < a < c
(D) b < c < a
(E) c < a < b
(07) Seja μ a média aritmética das idades e σ seu desvio padrão. O número de pessoas desse
grupo cujas idades pertencem ao intervalo [μ – σ , μ + σ ] é
(Considere )
(A) 9
(B) 8
(C) 7
(D) 6
(E) 5
19
(08) Escolhendo-se, aleatoriamente, uma pessoa do grupo, qual a probabilidade de que sua
idade seja maior do que a moda?
(A) 30%
(B) 25%
(C) 20%
(D) 15%
(E) 10%
20
A média, a mediana e a moda desse conjunto de dados são, respectivamente:
(14)(APOG PE/2010) Uma amostra dos registros de dezoito empresas mostrou os seguintes
números de acidentes de trabalho no último mês:
1 0 1 2 1 3 1 1 0 0 0 0 1 1 2 4 0 0
Com base nas informações apresentadas acima, é correto afirmar que
a) o intervalo interquartil foi inferior a 1,2.
b) a mediana do número de acidentes de trabalho no último mês foi igual a zero.
c) a moda da amostra foi igual ou superior a 2.
d) a amplitude dos valores observados na amostra foi igual ou inferior a 3.
e) o número médio de acidentes de trabalho no último mês foi inferior a 0,8.
21
A média e a mediana desses tempos de vôo valem, respectivamente, em horas:
(A) 7,0 e 5,0;
(B) 7,5 e 8,5;
(C) 7,0 e 5,5;
(D) 7,5 e 6,0;
(E) 7,5 e 7,0.
22
(17) A porcentagem de recolhimentos com valores arrecadados maiores ou iguais a R$
3.000,00 é
(A) 70%
(B) 65%
(C) 55%
(D) 45%
(E) 40%
(18) Utilizando o método da interpolação linear, tem-se que o valor da respectiva mediana é
(A) R$ 3.120,00
(B) R$ 3.200,00
(C) R$ 3.400,00
(D) R$ 3.600,00
(E) R$ 3.800,00
23
(E) 1,5
(24)(Br Distribuidora 2008) Suponha que os dez números abaixo (entre parênteses) foram
retirados aleatoriamente de uma urna, sucessivamente, mas com reposição
(1, 2, 3, 3, 5, 3, 4, 8, 4, 1)
Nesta amostra, é correto afirmar que o(a)
(A) desvio padrão é igual a 8.
(B) mediana é 8.
(C) média é igual à moda.
(D) média é 1.
(E) moda é 3.
24
Qual foi, aproximadamente, a mediana dos preços, em reais, do litro de gasolina nesse
período?
(A) 1,991
(B) 1,994
(C) 1,998
(D) 2,002
(E) 2,005
(CESGRANRIO 2010) Considere a amostra de uma variável aleatória, cujos valores estão todos
expressos em uma mesma unidade.
Amostra : 36 38 26 40 40 28 46 40 38 28
25
(B) a média é maior que a moda.
(C) se retirarmos um dos valores da amostra, a média, necessariamente, será alterada.
(D) a mediana é maior que a moda.
(E) a mediana é maior que a média.
(30)(PETROBRAS/2011)
No histograma acima, os pontos médios das classes inicial e final são 40 e 80,
respectivamente. Sabendo-se que todas as classes têm a mesma amplitude, a estimativa
adequada para a média e para a mediana dessa distribuição são, respectivamente,
(A) 59,5 e 59,5
(B) 59,5 e 60
(C) 60 e 59
(D) 60 e 59,5
(E) 60 e 60
26
(D) I e II.
(E) II e III.
(34)(AFC/2008) Seja X uma variável aleatória com média 1 e variância 2. Qual a variância da
variável Y = 2X + 4 ?
a) 2.
b) 4.
c) 6.
d) 8.
27
e)12.
padrão σY . Se então
28
(C) o desvio padrão do conjunto Y é igual ao coeficiente de variação do conjunto X.
(D) o coeficiente de variação do conjunto Y é igual ao desvio padrão do conjunto X dividido por
GABARITO
(01)A (02)C (03)E (04)A (05)D (06)D (07)C (08)A (09)E (10)B (11)C
(12)C (13)B (14)A (15)C (16)B (17)C (18)B (19)C (20)D (21)E (22)C
(23)B (24)E (25)A (26)B (27)B (28)E (29)D (30)D (31)A (32)B (33)C (34)D
(35)D (36)C (37)A (38)C (39)B
29
NOÇÕES DE PROBABILIDADE
Experimentos Aleatórios: os resultados não serão previsíveis, mesmo que haja um grande
número de repetições do mesmo fenômeno.
Ex.: lançamento de um dado; lançamento de duas moedas; retirada de uma carta de um
baralho completo de 52 cartas; determinação da vida útil de um componente eletrônico.
Ex.: (APOFP SP/2010) O total de funcionários em uma repartição pública é igual a 6. João e
sua esposa trabalham nesta repartição em que será formada uma comissão de 3 funcionários
escolhidos aleatoriamente. A probabilidade de que no máximo um deles, João ou sua esposa,
faça parte da comissão é
a) 1/5 b) 2/5 c) 3/5 d) 4/5 e) 3/10
SOLUÇÃO
Nós temos 6 pessoas , de todas as comissões com 3 pessoas pede-se a probabilidade de que
no máximo um deles, João ou Maria, faça parte da comissão.
casos favoráveis : “ no máximo um deles, João ou Maria “ significa com João sem Maria ou
com Maria sem João ou sem os dois ,
30
1º ) com João sem Maria : temos 6 pessoas para uma comissão com 3, o joão já está a
3º ) sem João e sem Maria : das 6 pessoas ficam 4 pessoas e serão escolhidas 3 das 4
Ex.:(MPOG/2010) Em uma urna existem 200 bolas misturadas, diferindo apenas na cor e na
numeração. As bolas azuis estão numeradas de 1 a 50, as bolas amarelas estão numeradas de
51 a 150 e as bolas vermelhas estão numeradas de 151 a 200. Ao se retirar da urna três bolas
escolhidas ao acaso, com reposição, qual a probabilidade de as três bolas serem da mesma cor
e com os respectivos números pares?
a) 10/512. b) 3/512 c) 4/128. d) 3/64. e) 1/64.
SOLUÇÃO
Temos 50 bolas azuis( 1 a 50 ) , 100 bolas amarelas( 51 a 150 ) e 50 bolas vermelhas(151 a
200 ). Vamos atentar para alguns detalhes:
1ª ) as três bolas são da mesma cor podendo ser ou azuis ou amarelas ou vermelhas,
2ª ) com reposição, ou seja, a bola retirada volta para o espaço amostral
3ª ) cada bola terá além da cor um número par
A probabilidade de uma bola ser azul e ter numeração par = 25/200 = 1/8 , lembre-se de que
as azuis são numeradas de 1 a 50 tendo 25 pares e 25 ímpares, como temos reposição a
probabilidade das três serem azuis e pares = 1/8.1/8.1/8 = 1/512.
A probabilidade de uma bola ser amarela e ter numeração par = 50/200 = 1/4 lembre-se de
que as amarelas são numeradas de 51 a 150 tendo 50 pares e 50 ímpares, como temos
reposição a probabilidade das três serem amarelas e pares = 1/4.1/4.1/4 = 1/64.
31
A probabilidade de uma bola ser vermelha e ter numeração par = 25/200 = 1/8 , lembre-se de
que as vermelhas são numeradas de 151 a 200 tendo 25 pares e 25 ímpares, como temos
reposição a probabilidade das três serem vermelhas e pares = 1/8.1/8.1/8 = 1/512.
32
a) 1/10 b) 3/10 c) 4/10 d) 7/10 e) 10/10
SOLUÇÃO
Como os eventos são independentes temos P( P H ) = P( P ) . P( H ) , logo 0,2 = 0,5 .
P( H ) P( H ) = 4/10 . Opção C .
Ex.: (TRE PI/2009) Três candidatos, A, B e C, disputam as próximas eleições para o Governo
do Estado. A, B e C têm respectivamente 30%, 38% e 32% da preferência do eleitorado. Em
sendo eleito, a probabilidade de dar prioridade para a Educação é de 30%, 50% e 40%, para
os candidatos A, B e C, respectivamente. A probabilidade da Educação não ser priorizada no
próximo governo é dada por
a) 0,446 b) 0,554 c) 0,592 d) 0,644 e) 0,652
SOLUÇÃO
Bem, a educação pode não ser priorizada por A ou por B ou por C , logo teremos :
Ex.: (MPU/2004) Carlos diariamente almoça um prato de sopa no mesmo restaurante. A sopa
é feita de forma aleatória por um dos três cozinheiros que lá trabalham: 40% das vezes a sopa
é feita por João; 40% das vezes por José, e 20% das vezes por Maria. João salga demais a
sopa 10% das vezes, José o faz em 5% das vezes e Maria 20% das vezes. Como de costume,
um dia qualquer Carlos pede a sopa e, ao experimentá-la, verifica que está salgada demais. A
probabilidade de que essa sopa tenha sido feita por José é igual a
33
a) 0,15. b) 0,25. c) 0,30. d) 0,20. e) 0,40
SOLUÇÃO
Perceba que a probabilidade é condicional, pois a questão diz que a sopa está salgada e quer
saber a probabilidade de ter sido feita por José. Vamos proceder da seguinte forma:
. Opção D .
QUESTÕES RESOLVIDAS
(02)(ATRFB/2009) Para acessar a sua conta nos caixas eletrônicos de determinado banco, um
correntista deve utilizar sua senha constituída por três letras, não necessariamente distintas,
em determinada seqüência, sendo que as letras usadas são as letras do alfabeto, com exceção
do W, totalizando 25 letras. Essas 25 letras são então distribuídas aleatoriamente, três vezes,
na tela do terminal, por cinco teclas, em grupos de cinco letras por tecla, e, assim, para digitar
sua senha, o correntista deve acionar, a cada vez, a tecla que contém a respectiva letra de sua
senha. Deseja-se saber qual o valor mais próximo da probabilidade de ele apertar
aleatoriamente em seqüência três das cinco teclas à disposição e acertar ao acaso as teclas da
senha?
(A) 0,001. (B) 0,0001. (C) 0,000125. (D) 0,005. (E) 0,008.
SOLUÇÃO
34
Acertar as teclas significa acertar as três letras, ou seja, acertar a 1ª letra e acertar a 2ª letra
e acertar a 3ª letra. Para acertar a 1ª letra ele tem 1 em 5 , a 2ª letra ele tem 1 em 5 e a 3ª
letra ele tem 1 em 5,
logo . Opção E .
Opção A .
(04)(TJ PA/2009) Uma fábrica produz parafusos utilizando duas máquinas A e B. 60% dos
parafusos são produzidos por A e o restante por B. Sabe-se que 1% dos parafusos produzidos
por A e 2% dos produzidos por B são defeituosos. Então, a probabilidade de um processo de
produção desta fábrica produzir parafusos sem defeito é
(A) 96,4% (B) 97,0% (C) 98,0% (D) 98,2% (E) 98,6%
SOLUÇÃO
Vamos analisar cada máquina e suas probabilidades, as probabilidades de defeito e de sem
defeito. A probabilidade de se produzir parafusos sem defeitos é a probabilidade de ser
produzido por A ou por B.
(05)(APO MPOG/2005) Há três moedas em um saco. Apenas uma delas é uma moeda normal,
com “cara” em uma face e “coroa” na outra. As demais são moedas defeituosas. Uma delas
tem “cara” em ambas as faces. A outra tem “coroa” em ambas as faces. Uma moeda é retirada
do saco, ao acaso, e é colocada sobre a mesa sem que se veja qual a face que ficou voltada
35
para baixo. Vê-se que a face voltada para cima é “cara”. Considerando todas estas
informações, a probabilidade de que a face voltada para baixo seja “coroa” é igual a:
a) 1/2 b) 1/3 c) 1/4 d) 2/3 e) 3/4
SOLUÇÃO
É uma probabilidade condicional mas tome cuidado, primeiro você terá que calcular a
probabilidade da moeda ter “ cara “( Ca ) e, tendo Ca, a probabilidade de ter “ coroa “( Co ),
perceba a diferença desta questão com a questão anterior, aqui temos moedas não
normais e cada moeda possui duas opções,ou seja, uma face e outra face . Temos três
moedas uma com Ca e Co, outra com Ca e Ca e uma terceira com Co e Co, podemos
representar da seguinte forma: ( Ca , Co ) , ( Ca , Ca ) e ( Co , Co ), respectivamente, logo:
1º ) a probabilidade da moeda ter “ cara “( Ca ) será de duas moedas em três,
P( ter Ca ) = 2/3 .
2º ) tendo Ca, a probabilidade de ter “ coroa “( Co ) será de uma em duas,
P( ter Co | tem Ca ) = 1/2 .
(06)(MPU/2004) Carlos sabe que Ana e Beatriz estão viajando pela Europa. Com as
informações que dispõe, ele estima corretamente que a probabilidade de Ana estar hoje em
Paris é 3/7, que a probabilidade de Beatriz estar hoje em Paris é 2/7, e que a probabilidade de
ambas, Ana e Beatriz, estarem hoje em Paris é 1/7. Carlos, então, recebe um telefonema de
Ana informando que ela está hoje em Paris. Com a informação recebida pelo telefonema de
Ana, Carlos agora estima corretamente que a probabilidade de Beatriz também estar hoje em
Paris é igual a
a) 2/3 b) 1/7 c) 1/3 d) 5/7 e) 4/7
SOLUÇÃO
A questão pode ser representada na figura abaixo, a probabilidade pedida será
P( Beatriz está em Paris | Ana está em Paris ) = ( 1/7 )/( 3/7 ) = 1/3 . Opção C.
(07) Uma clinica especializada trata apenas de três tipos de doentes: dos que sofrem de
problemas cardíacos, dos que tem calculo renal e dos hipertensos. Temos que 50% dos
pacientes que procuram a clinica são cardíacos, 40% são portadores de calculo renal e apenas
36
10% são hipertensos. Os problemas cardíacos são curados em 80% das vezes, os problemas
de calculo renal em 90% das vezes e os hipertensos em 95% das vezes. Um enfermo saiu
curado da clinica. Qual a probabilidade de ele sofresse de calculo renal?
a) 43,1% b) 42,1% c) 45,1% d) 44,1% e) 46,1%
Solução
Temos três problemas : cardíacos( 50% ) , cálculo renal( 40% ) e hipertensos( 10% ), em
cada um dos problemas temos os curados e os não curados. Podemos representar da
seguinte forma:
Opção B .
37
Sem reposição significa que a bola que for retirada não voltará, desta forma o espaço amostral
mudará, a probabilidade de as duas serem pretas significa que a primeira será preta e a
segunda também será preta, logo :
QUESTÕES DE CONCURSOS
38
(03)(PETROBRAS/2010) Um dado é viciado de tal forma que a probabilidade de observar-se
um número é proporcional ao seu valor. Qual a probabilidade de um jogador obter o resultado
1?
(A) 1/21
(B) 2/21
(C) 1/7
(D) 4/21
(E) 5/21
(05)(ANA/2009) Uma urna possui 5 bolas azuis, 4 vermelhas, 4 amarelas e 2 verdes. Tirando-
se simultaneamente 3 bolas, qual o valor mais próximo da probabilidade de que as 3 bolas
sejam da mesma cor?
a) 11,53%
b) 4,24%
c) 4,50%
d) 5,15%
e) 3,96%
39
(07)(PETROBRAS/2010) A tabela a seguir apresenta a classificação de 200 pessoas de uma
determinada população, segundo o sexo e o clube de futebol de preferência.
(08)(PETROBRAS/2010) Um sorteio é realizado com duas urnas, I e II. As urnas são escolhidas
ao acaso. A urna I contém 2 bolas brancas e 6 pretas. A urna II contém 4 bolas brancas e 4
pretas. Se a bola sorteada for branca, qual a probabilidade de ter sido da urna I?
(A) 1/3
(B) 1/4
(C) 1/6
(D) 2/3
(E) 2/5
(10)(PETROBRAS/2010) Numa pesquisa sobre a participação dos pais na criação dos filhos,
realizada pelo site www.veja.com, 71% dos entrevistados eram casados e 79% tinham menos
de 50 anos. Sorteando-se ao acaso um dos entrevistados, a probabilidade de que o escolhido
seja casado e tenha menos de 50 anos será de, no mínimo,
(A) 21%
(B) 29%
40
(C) 35%
(D) 40%
(E) 50%
(11)(EPE/2009) Um dado cúbico com cada uma de suas faces numeradas de 1 a 6 é dito um
dado comum. Um dado em que todos os resultados têm a mesma probabilidade de serem
obtidos é chamado um dado honesto. Lança-se um dado comum e honesto repetidas vezes.
Qual a probabilidade de que o 6 seja obtido pela primeira vez no terceiro lançamento?
(A) 1/216
(B) 6/216
(C) 25/216
(D) 36/216
(E) 12/5216
Admita que todas as brasileiras que consideram as refeições muito importantes para reunir a
família também as considerem o melhor momento para falar com o marido. Sendo assim, se
uma brasileira que considera as refeições o melhor momento para falar com o marido for
escolhida ao acaso, a probabilidade de que ela também as considere muito importantes para
reunir a família será de, aproximadamente,
(A) 14%
(B) 26%
(C) 52%
41
(D) 75%
(E) 84%
Utilizando as informações nele contidas, calculou-se a média aritmética dos valores dos
salários destes empregados, considerando que todos os valores incluídos num certo intervalo
de classe são coincidentes com o ponto médio deste intervalo. Escolhendo aleatoriamente um
empregado da empresa, a probabilidade dele pertencer ao mesmo intervalo de classe do
histograma ao qual pertence a média aritmética calculada é
(A) 6,25%
42
(B) 12,50%
(C) 18,75%
(D))31,25%
(E) 32,00%
(17)(BNDES/2008)
Considerando-se que uma pessoa será escolhida ao acaso, qual a probabilidade de que a sua
idade esteja entre 28 e 36 anos, dado que a pessoa escolhida terá 24 anos ou mais?
(A) 11/40
(B) 13/32
(C) 19/40
(D) 19/32
(E) 29/40
(19)(EPE/2010) Dado que duas pessoas fazem aniversário no mês de junho, a probabilidade
de que ambas tenham nascido no dia 08 de junho é de
(A) 1/9000
(B) 1/3000
(C) 1/900
(D) 1/300
(E) 1/90
43
(20)(ANP/2008) A tabela abaixo mostra a distribuição de freqüência dos vinte empregados de
uma empresa, de acordo com as suas idades. Dois empregados diferentes são escolhidos em
seqüência, aleatoriamente, para representar a empresa num determinado evento. Qual a
probabilidade de que ambos tenham 34 anos?
(A) 5/20
(B) 5/34
(C) 2/20
(D) 2/34
(E) 1/19
44
GABARITO
(01)B (02)A (03)A (04)A (05)E (06)C (07)D (08)A (09)B (10)E (11)C
(12)E (13)E (14)B (15)D (16)D (17)C (18)A (19)C (20)E (21)C (22)D
2ª PARTE
CAPÍTULO 01
DISTRIBUIÇÃO DE PROBABILIDADE DISCRETA
Obs.: Para uma variável aleatória X com distribuição binomial a média e sua variância são
2
dadas, respectivamente, por: μ = E(X) = n.p e σ = n.p.q
Uma das grandes dificuldades nas questões é saber quem será o sucesso( p ), basta que você
identifique a pergunta da questão, o que for pedido será o sucesso.
Opção E .
45
(1.2) Distribuição de Poisson ou dos eventos raros : quando n for grande e p
pequeno, podemos aproximar a Binomial utilizando a distribuição de Poisson,
que é aplicável a uma v.a. discreta X, quando se conhece o número de
“sucessos” mas se torna difícil calcular o número de “fracassos” ou o número
total de experimentos, por este ser muito grande. Por isso iremos utilizar um
parâmetro como recurso para o cálculo da probabilidade. A probabilidade do
evento ocorrer k vezes em um intervalo é dada a por:
O parâmetro λ da distribuição Poisson pode ser visto como uma taxa de ocorrência do
fenômeno em estudo por unidade (tempo, distância, área , ... ), o símbolo e é uma constante
que é aproximadamente igual a 2,7183.
Obs.: Para uma variável aleatória X com distribuição de Poisson a média e sua variância são
2
dadas, respectivamente, por: E(X) = λ e σ = λ.
QUESTÕES RESOLVIDAS
(01)(ICMS SP/2009) O número de pessoas que chega ao guichê de uma repartição pública
para autuação de processos apresenta uma distribuição de Poisson a uma taxa de duas
pessoas por minuto. A probabilidade de que nos próximos 2 minutos chegue pelo menos uma
pessoa neste guichê é: (Observação: e = 2,71828...)
a) (e4 − 1).e–4 b) 4.e–4 c) (e4 − 4).e–4 d) 2.[(e2 − 1)].e–2 e) (e2 − 2).e–2
Solução
São duas pessoas por minuto , em 2 minutos teremos uma média λ = 4 pessoas/2
minutos.Chegar pelo menos uma pessoa significa P(X ≥ 1) , vamos utilizar a probabilidade
complementar P(X ≥ 1) = 1 – P(X = 0) , ou seja ,
. Opção A.
46
Receber pelo menos uma significa X ≥ 1, note que X ≥ 1 logo P( X ≥ 1 ) = 1 – P( X = 0 ),
muito cuidado na hora de calcular o λ, este λ está ligado com 10 minutos, veja que 96
mensagens em 8 horas nos dá 96 : 8 = 12 mensagens por hora, ou seja, 2 mensagens por 10
(03)(SUSEP/2010) Um estudo indica que, nas comunidades que vivem em clima muito frio e
com uma dieta de baixa ingestão de gordura animal, a probabilidade de os casais terem filhos
do sexo masculino é igual a 1/4. Desse modo, a probabilidade de um casal ter dois meninos e
três meninas é igual a:
a) 37/64 b) 45/216 c) 1/64 d) 45/512 e) 9/16
Solução
(04)(AFRE SC/2010) Uma variável aleatória X segue uma distribuição binomial com os
seguintes parâmetros: número de ensaios =100; probabilidade de sucesso em cada ensaio =
0,2. De acordo com essas informações, qual é o valor esperado de X?
a) 0,2 b) 0,8 c) 20 d) 80 e) 100
Solução
Para a distribuição binomial, o valor esperado é calculado como o produto do número de
ensaios pela probabilidade de sucesso em cada ensaio, ou seja E(X) = n . p ou E(X) = 100 ·
0,2 = 20. Opção C .
47
Logo a receita esperada será : 0.0,14 + 10000.0,28 + 20000.0,28 = 8.400,00.
Opção B.
. Opção A .
(07)(MPE PE/2006) O número de falhas de certo tipo de placa térmica tem distribuição de
Poisson, com taxa média de 0,1 defeitos por m2. Na confecção da superfície de um armário, é
necessário cobrir uma superfície de 2m por 2m com essa placa. A probabilidade de que haja
pelo menos uma falha nessa superfície é de:
a) e–0,1 b) 1 – e– 0,1 c) 1 – e– 0,4 d) e– 0,4 e) 1 – 1,4e– 0,4
Solução
Note que a média é de 0,1 defeitos por m2 , mas a nossa superfície possui
2.2=4 m2 , logo λ = 4.0,1= 0,4 . Pelo menos um será : P( X ≥ 1 ) = 1 – P( X = 0 )
. Opção C .
(08)(MPU/2007) O número de pacientes atendidos por um clínico geral segue uma distribuição
de Poisson com taxa de 4 pacientes por hora. A probabilidade de que pelo menos um paciente
consulte o clínico geral em um período de 15 minutos é:
a) 1 − e– 1 b) 1 − e4 c) e– 4 d) e4 e) e– 1
Solução
4 pacientes por hora significam 4 pacientes por 60 min. ou λ = 1 paciente/15 min , note a
importância de você saber calcular o parâmetro λ . Esse “ pelo menos um “
sempre se repete e é P( X ≥ 1 ) = 1 – P( X = 0 ) , logo
. Opção A .
(09)(TRT 7a R/2009) Seja X a variável aleatória que representa o número de chamadas por
minuto recebidas por um PBX. Sabe-se que X tem média λ e que P(X = 3) = P(X = 4).
48
Supondo que a distribuição de Poisson seja adequada para X, a probabilidade de que ocorra
uma chamada em 30 segundos é
a) e–4 b) 4.e– 4 c) e– 2 d) 2.e– 2 e) 1 – 2.e– 2
Solução
Primeiramente vamos calcular a média λ ( chamadas por minuto ), iremos precisar desta
informação para depois , sabendo que P(X = 3) = P(X = 4).
Na segunda igualdade simplificamos o e-λ nos dois membros , simplificamos o 3.2.1 nos dois
membros e simplificamos o λ3 nos dois membros sobrando o λ na segunda fração, logo λ =
4 chamadas por minuto ou λ = 4 chamadas por 60 segundos . Mas a questão pede para
calcular a probabilidade de que ocorra uma chamada em 30 segundos, neste caso a média
será de 2 chamadas por 30 segundos, teremos uma nova média ( λ = 2 ).
. Opção D .
(10)(MEC/2009) O número de clientes que chega a cada hora a uma empresa tem Distribuição
de Poisson, com parâmetro 2, ou seja, a probabilidade de que cheguem k clientes é dada por
Opção D .
Opção D .
49
(12) Na construção de 2 barcos, que serão cobertos com uma superfície de 8 m2 cada com
essa placa, a probabilidade de que pelo menos 1 não apresente defeito na superfície é
a) 1 − e– 0,4 b) 1 − e– 0,5 c) − e– 0,8 + 2.e– 0,4 d) 1 – 2.e– 0,4 e) 1 − e– 0,8 + 2.e– 0,4
Solução
A probabilidade de que pelo menos 1 não apresente defeito, ou falha , na superfície é igual a
probabilidade complementar de os dois apresentarem defeito, ou seja ,
P( pelo menos 1 não defeito ) = 1 – P ( 1º ter defeito ). P ( 2º ter defeito ) mas como
P ( 1º ter defeito ) = 1 − P ( 1º não ter defeito ) e
P ( 2º ter defeito ) = 1 – P ( 2º não ter defeito ) , logo :
P ( pelo menos 1 não defeito ) = 1 – ( 1 − e– 0,4 ) . ( 1 − e– 0,4 ) =
1 – ( 1 − 2.e– 0,4 + e– 0,8 ) = − e– 0,8 + 2.e– 0,4 . Opção C .
(13)(AFPS/2002) Sabe-se que o número de clientes que procuram atendimento numa agência
da previdência no período das 17 às 18 horas tem distribuição de Poisson com média de 3
clientes. Assinale a opção que dá o valor da probabilidade de que mais de 2 clientes apareçam
no período. Sabe-se que ℮–3 = 0,0498 , sendo ℮ o número neperiano.
a) 0,776 b) 0,667 c) 0,500 d) 0,577 e) 1,000
Solução
(14)(TRF 1ª R/2001) A probabilidade de que um item produzido por uma máquina seja
defeituoso é de 10%. Uma amostra de 30 itens produzidos por esta máquina é selecionada ao
acaso. Use a aproximação pela distribuição de Poisson para determinar a probabilidade de que
não mais do que um item defeituoso seja encontrado nesta amostra.
a)) 4e– 3 b) 4e– 2 c) 3e– 3 d) 1 − 4e– 3 e) 1 − 3e– 3
Solução
Como n é grande ( n ≥ 30 ), p = 0,1 e λ = n.p , teremos λ = 30. 0,1= 3. Logo a probabilidade
de que não mais do que um item defeituoso seja encontrado é P(X ≤ 1).
Opção A .
50
É pedida a probabilidade de pelo menos 1 pagar a sua mensalidade sem atraso, note que o
sucesso é sem atraso , p = 0,95, o fracasso é com atraso, q = 0,05, e n = 5 . Temos
P( X ≥ 1 ) = 1 – P( X = 0 ), calculando P( X = 0 ) temos
(16)(TCE ES/2001) Uma Cia. aérea sabe que as chances são de 5 em 100 de que um
passageiro com reserva confirmada não apareça para o vôo. Neste contexto, a Cia. vende 52
passagens para um vôo que só pode acomodar 50 passageiros. Assinale a opção que dá a
probabilidade de que haja lugar disponível para todo passageiro que se apresente para viajar.
Suponha que os passageiros tomem suas decisões de viajar independentemente.
a) (0,95)50 b) 399/400 c) 1/10 d) 50/52 e) 1 – 3,55 . (0,95)51
Solução
(17)(BACEN/2001) Um fabricante de discos rígidos sabe que 2% dos discos produzidos falham
durante o período de garantia. Assinale a opção que dá a probabilidade de que pelo menos um
disco falhe numa amostra aleatória de 10 discos tomados da linha de produção.
Solução
Pede-se a probabilidade de que pelo menos um disco falhe, o sucesso será falhe e p =
0,02, logo o fracasso será q = 0,98 e n = 10. Com isso temos P( X ≥ 1 ), utilizando a
probabilidade complementar teremos P( X ≥ 1 ) = 1 – P( X = 0 ), ou seja
. Opção C .
(18)(AFC/2008) Seja X uma variável aleatória discreta com função de probabilidade binomial
f(x), onde f(x)= Cn,x . px .(1 − p)n – x e Cn,x é o número de combinações de n elementos
tomados x a x. Sendo n = 6 e p = 1/3, determine f(6).
a) 1/729. b) 1. c) 0. d) 64/729. e) 8/729
Solução
51
6
Substituindo os valores temos f(6)= C 6 , 6 . ( 1/3) .(1 – 1/3) 6 – 6 , f(6) = 1/729. Opção A .
(19)(TJ PR/2009) Uma variável aleatória X segue a Distribuição Binomial com média igual a
oito e desvio padrão igual a dois. Assim, podemos afirmar que o produto da probabilidade de
sucesso p pela probabilidade de insucesso q é igual a:
a) 21% b) 25% c) 16% d) 24%
Solução
Temos μ = n.p e σ2 = n.p.q, como μ = 8 e σ = 2 σ2 = 4, teremos n.p = 8 e
n.p.q = 4, com estas duas equações concluímos que q = 1/2 e p = 1/2. Logo o produto será
1/4 = 25% . Opção B .
QUESTÕES DE CONCURSOS
52
c) 4 e 2,4
d) 8 e 2,4
e) 4 e 4,8
(03)(TCE ES/2001) Uma Cia. aérea sabe que as chances são de 5 em 100 de que um
passageiro com reserva confirmada não apareça para o vôo. Neste contexto, a Cia. vende 52
passagens para um vôo que só pode acomodar 50 passageiros. Assinale a opção que dá a
probabilidade de que haja lugar disponível para todo passageiro que se apresente para viajar.
Suponha que os passageiros tomem suas decisões de viajar independentemente.
a) (0,95)50
b) 399/400
c) 1/10
d) 50/52
e) 1 – 3,55 . (0,95)51
(04)(SEBRAE PA/2010) Sabe-se que o número de clientes que visitam determinada loja no
período das 9 às 10 horas da manhã tem distribuição de Poisson com média igual a 5. A
probabilidade de que mais de 1 cliente visite a loja nesse período é igual a (Dado: e– 5 =
0,0067)
A) 1.
B) 0,9900.
C) 0,9598.
D) 0,9320.
E) 0,9125.
(05)(TRT 9ª R/2010) A probabilidade de que um item produzido por uma máquina seja
defeituoso é 10%. Uma amostra de 40 itens produzidos por esta máquina é selecionada ao
acaso. Usando-se a aproximação pela distribuição de Poisson para determinar a probabilidade
de que não mais que dois itens defeituosos sejam encontrados na amostra, obtemos
(A) 13 e –4
(B) 1 – 13 e –4
(C) 4 e –4
(D) 5 e –4
(E) 1 – 5 e –4
(06)(AFRE SC/2010) Uma variável aleatória X segue uma distribuição binomial com os
seguintes parâmetros: número de ensaios =100; probabilidade de sucesso em cada ensaio =
0,2. De acordo com essas informações, qual é o valor esperado de X?
a) 0,2
b) 0,8
53
c) 20
d) 80
e) 100
(08)(AFRFB/2009) O número de petroleiros que chegam a uma refinaria ocorre segundo uma
distribuição de Poisson, com média de dois petroleiros por dia. Desse modo, a probabilidade de
a refinaria receber no máximo três petroleiros em dois dias é igual a:
a) e –4
b) e –4
c) e –4
d) e –2
e) e –2
(09)(ICMS SP/2009) O número de pessoas que chega ao guichê de uma repartição pública
para autuação de processos apresenta uma distribuição de Poisson a uma taxa de duas
pessoas por minuto. A probabilidade de que nos próximos 2 minutos chegue pelo menos uma
pessoa neste guichê é
Observação: e = 2,71828...
(A) (e 4 − 1).e –4
(B) 4.e –4
(C) (e 4 − 4).e –4
(D) 2.[(e –2 − 1) ].e –2
(E) (e 2 − 2).e –4
54
(10)(TRT 7ª R/2009) Seja X a variável aleatória que representa o número de chamadas por
minuto recebidas por um PBX. Sabe-se que X tem média λ e que P(X = 3) = P(X = 4).
Supondo que a distribuição de Poisson seja adequada para X, a probabilidade de que ocorra
uma chamada em 30 segundos é
(A) e –4 .
(B) 4e –4.
(C) e –2.
(D) 2e –2.
(E) 1 − 2e –2.
(TJ PA/2009) O número de falhas de certo tipo de placa plástica tem distribuição de Poisson,
com taxa média de 0,05 defeitos por m2 . Na construção de um barco, é necessário cobrir uma
superfície de 8 m2 com essa placa.
(11) A probabilidade de que não haja falhas nessa superfície é
a))e– 0,5
b) e– 0.05
c) 1 − e– 0,05
d) e– 0,4
e) 1 − e– 0,4
(12) Na construção de 2 barcos, que serão cobertos com uma superfície de 8 m2 cada com
essa placa, a probabilidade de que pelo menos 1 não apresente defeito na superfície é
a) 1 – e– 0,4
b) 1 – e– 0,5
c) – e– 0,8 + 2.e– 0,4
d) 1 – 2.e– 0,4
e) 1 – e– 0,8 + 2.e– 0,4
(13)(TJ PR/2009) Uma variável aleatória X segue a Distribuição Binomial com média igual a
oito e desvio padrão igual a dois. Assim, podemos afirmar que o produto da probabilidade de
sucesso p pela probabilidade de insucesso q é igual a:
a) 21%
b) 25%
c) 16%
d) 24%
(14)(CGU AFC/2008) Seja X uma variável aleatória discreta com função de probabilidade
binomial f(x), onde f(x)= Cn,x . px .(1 - p)n – x e Cn,x é o número de combinações de n
elementos tomados x a x. Sendo n=6 e p=1/3, determine f(6).
a) 1/729.
55
b) 1.
c) 0.
d) 64/729.
e) 8/729
(15)(TRT 2ª R/2008) O número de peças defeituosas fabricadas por uma empresa tem
distribuição de Poisson, com uma taxa média de 1 peça defeituosa por 1.000 peças fabricadas.
Adquirindo 100 peças desta empresa, a probabilidade de, no máximo, uma peça ser defeituosa
é igual a Dados: (e = 2,71828...)
– 0,2
(A) e
(B) e– 0,1
(C) 1,1 e– 0,1
(D) 0,1 e– 0,1
(E) 2 e– 0,2
56
d) 180 páginas
e) 36 páginas
57
(23)(MEC Matemática/2009) O número de clientes que chega a cada hora a uma empresa tem
Distribuição de Poisson, com parâmetro 2, ou seja, a probabilidade de que cheguem k clientes
(24)(IF RS/2009) Numa linha de produção, 8% das peças produzidas são defeituosas. Sendo X
a variável aleatória que representa os valores totais de peças defeituosas de um total de 10
peças desta linha de produção. Usando uma distribuição binomial, a variância (Var(x)) para
esta distribuição é:
a) 0,934
b) 1,760
c) 0,567
d) 0,736
e) 1,235
GABARITO
58
(01)E (02)A (03)E (04)C (05)A (06)C (07)E (08)C (09)A (10)D (11)D
(12)C (13)B (14)A (15)C (16)D (17)B (18)D (19)C (20)C (21)C (22)C
(23)D (24)D (25)B
CAPÍTULO 02
DISTRIBUIÇÃO NORMAL
(2.2) Função Densidade de Probabilidade : seja X uma variável aleatória contínua, X terá
distribuição normal se:
Obs: Se X possui uma distribuição normal com média μ e variância σ2 e se Y = aX +b, onde a
e b são constantes, com a a≠0, então Y terá uma distribuição normal com média a.μ + b e
variância σ2(Y)= a2σ2 .
59
(2.4) Distribuição Normal Padronizada : para o cálculo das probabilidades, surgem dois
problemas: primeiro, a integração de f(x); segundo, seria a elaboração de uma tabela de
probabilidades, pois f(x) depende das combinações da média e variância. Para resolver esses
problemas, façamos uma mudança de variável obtendo-se a distribuição normal padronizada
(Fig. 03)
Na prática teremos valores de X que você terá que calcular o Z para usar a tabela.
(Tabela I)
Ex.: P( 0 < Z < 0,56 ) note que já está normalizado, você irá procurar na vertical a parte
inteira e a 1ª casa decimal( 0,5 ) e na horizontal a 2ª casa decimal ( 0,06 ), com isso temos
P( 0 < Z < 0,56 ) = 0,2123 = 21,23%. Esta tabela é a mais utilizada.
60
(Tabela II)
(Tabela III)
61
Fig. 04 Fig. 05
Fig. 06 Fig. 07
Ex.: As vendas diárias de uma loja têm distribuição Normal, com média igual
R$ 450,00 por dia e desvio padrão igual a R$ 95,00. Qual é a probabilidade das vendas
excederem R$ 700,00 em determinado dia?
Solução
A probabilidade será P( X > 700 ), normalizando temos 95.Z = 700 – 450 ou Z = 2,63 ,
utilizando a tabela 0 < Z < z e sabendo que P( Z > 700 ) = 0,5 – P( 0 ≤ Z ≤ 2,63 ) teremos
P( Z > 700 ) = 0,5 – P( 0 ≤ Z ≤ 2,63 ) = 0,5 – 0,4957 = 0,0043 = 0,43%.
Ex.: Suponha que entre investidores, o ganho em uma aplicação financeira tenha uma
distribuição aproximadamente Normal de média 105 mil e um desvio padrão 9 mil, por mês.
Qual a proporção de ganhos entre 90 mil e 125 mil, por mês?
Solução
P( 90 < X < 105 ), teremos que normalizar 90 e 105 com a relação Z . σ = X – μ, sendo μ =
105 e σ = 9, temos Z . 9 = 90 – 105 ou Z = – 1,67, e Z . 9 = 125 – 105 ou Z = 2,22. Logo P(
– 1,67 < X < 2,22 ) = P(– 1,67 ≤ Z ≤ 0 ) + P( 0 ≤ Z ≤ 2,22 ) mas sabemos que P(– 1,67 ≤ Z
≤ 0 ) = P( 0 ≤ Z ≤ 1,67 ), por simetria, logo teremos
P( 0 ≤ Z ≤ 1,67 ) = 0,4525 e P( 0 ≤ Z ≤ 2,22 ) = 0,4868 e P( – 1,67 < X < 2,22 ) = 0,9393 =
93,93%.
62
Sempre que tivermos uma variável X que não tenha média zero e desvio padrão unitário, nós
precisaremos obter a variável reduzida Z (para então consultar a tabela).
A transformação para se obter a variável Z (de tal modo que ela tenha média zero e desvio
Ex.:(APOFP/SP 2009) Seja Z uma variável aleatória Normal Padrão. Dados os valores de z e de
P(Z < z) a seguir, obtenha o valor mais próximo de P(–2,58 < Z < 1,96).
63
z 1,96 2,17 2,33 2,41 2,58
P( Z < z ) 0,975 0,985 0,99 0,992 0,995
a) 0,99 b) 0,97 c) 0,98 d) 0,985
SOLUÇÃO
Primeiramente, perceba que a tabela fornecida foi a acumulada, basta subtrair 0,5 . Com isso,
do enunciado P(–2,58 < Z < 1,96)= P( –2,58 < Z < 0 ) + P( 0< Z < 1,96 ), sabemos que
P( –2,58 < Z < 0 )= P( 0< Z< 2,58 )= P( Z< 2,58 ) – 0,5 = 0,995 – 0,5 = 0,495 e P( 0< Z <
1,96 )= P( Z < 1,96 ) – 0,5 = 0,975 – 0,5 = 0,475. Logo P(–2,58 < Z < 1,96) = 0,495 +
0,475 = 0,97 . Opção B . Note que todos os valores fornecidos já estão normalizados.
QUESTÕES RESOLVIDAS
As empresas de um determinado setor têm uma situação líquida bem descrita por uma
distribuição normal, com média igual a 2,5 milhões de reais e desvio padrão de 2 milhões de
reais. Selecionando-se uma empresa aleatoriamente deste setor, a probabilidade dela
apresentar uma situação líquida negativa ou nula é de:
a) 11% b) 16% c) 23% d) 39% e) 50%.
SoluçãoTemos μ = 2,5 , σ =2 e X = 0, pois queremos P( X ≤ 0), teremos que normalizar
utilizando , logo
64
tem-se que o valor do equipamento em que apenas 10% são superiores a ele é igual a :
a)R$ 1.825,00 b) R$ 1.805,00 c) R$ 1.710,00 d) R$ 1.695,00 e) R$ 1.650,00
Solução
Você deve estar percebendo que a tabela é a acumulada, vamos colocar os valores do
enunciado μ = 1500 , P( X < 1290 ) = 20% , P( X > x0 ) = 10% e σ =? . Vamos subtrair 0,5
de cada valor da probabilidade e vamos trabalhar com P (0 ≤ Z ≤ z) . Logo embaixo do 1290
fica -0,84, veja a tabela, pois 30% é a probabilidade entre Z1 e 0 , então Z1 = – 0,84, veja
tabela. Da mesma forma 40% é a probabilidade entre 0 e Z2 , então Z2 = 1,30 .
. Opção A.
Note que Z(1oQ) = – Z(3oQ) , por simetria , logo procurando na tabela qual é o Z tal que a
probabilidade seja 25% = 0,25 temos Z(3oQ) = 0,67, aproximadamente, logo
65
Z(1oQ) = – 0,67.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
(04)(BNDES/2008) Seja X uma variável aleatória com distribuição normal com parâmetros μ=
2
2eσ =16 . A probabilidade de que X esteja entre 1 e 4 é, aproximadamente,
(A) 9% (B) 10% (C) 19% (D) 29% (E) 33%
Solução
P ( 1< X < 4 ) = ? , μ= 2 , σ= 4 , calcularemos os valores normalizados de 1 e 4 com a
expressão Z. σ = X – μ , ou seja , Z.4 = 1 – 2 Z= - 0,25 e Z.4 = 4 – 2 ou Z = 0,5 . P ( 1<
X < 4 ) = P ( - 0,25 < Z < 0,5 ) = P ( 0 < Z < 0,25 ) + P ( 0 < Z < 0,5 ) = 0,0987 + 0,1915
= 0,2902 = 29% . Opção D .
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
66
(06)(SEFAZ MS/2006) Se X tem distribuição normal com média 4 e variância 9, a
probabilidade de X > 6 vale, aproximadamente:
a) 0,25 b) 0,28 c) 0,33 d) 0,37 e) 0,46
Solução
(07)(ANAC/2007) Uma variável aleatória X tem distribuição normal com media 10 e variância
100. O valor do terceiro quartil correspondente é, aproximadamente:
(A) 13,5; (B) 14,7; (C) 15,6; (D) 16,8; (E) 17,9.
Solução
μ= 10 , σ2 =100 , o Q3 é representado na figura abaixo, logo o Z(Q3) será 0,67, note que
Z(Q1) = – Z(Q3) . Substituindo os valores μ= 10 , σ= 10 e Z(Q3)= 0,67 na expressão Z. σ =
X – μ teremos 0,67.10 = X – 10 X = 16,7 . Opção D .
(08)(ISS SP/2007) Para responder à questão seguinte, utilize, dentre as informações abaixo,
as que julgar adequadas. Se Z tem distribuição normal padrão, então:
P(0 < Z < 1) = 0,341 P(0 < Z < 1,6) = 0,445 P(0 < Z < 2) = 0,477
Os depósitos efetuados no banco B, num determinado mês, têm distribuição normal com
média R$ 9.000,00 e desvio padrão R$ 1.500,00. Um depósito é selecionado ao acaso dentre
todos os referentes ao mês em questão. A probabilidade de que o depósito exceda a
R$6.000,00 é de:
a) 97,7% b) 94,5% c) 68,2% d) 47,7% e) 34,1%
Solução
Temos a média R$ 9.000,00 e o desvio padrão R$ 1.500,00, a probabilidade pedida é para
valores maiores do que 600, P( X > 6000 ). Vamos normalizar este valor, ou seja, vamos
encontrar o seu Z usando a expressão Z. σ = X – μ , logo teremos
1500.Z = 6000 – 9000 Z = – 2 ou P( Z > – 2 ) = P(– 2 < Z < 0) + 0,5 ou como
P(– 2 < Z < 0) = P( 0 < Z < 2 ) P( Z > – 2 ) = P( 0 < Z < 2 ) + 0,5 na tabela temos P(0
< Z < 2) = 0,477, ou seja, P( Z > – 2 ) = 0,977 = 97,7%. Opção A.
67
(TRT 2ª R/2008) Para responder às questões de números 09 a 10 considere a tabela abaixo,
que fornece os valores das probabilidades P(Z ≥ z) para a distribuição normal padrão.
(09) O número de processos analisados em uma repartição pública por semana apresenta uma
distribuição normal, com média igual a 50 processos e desvio padrão igual a 10 processos. A
probabilidade de, em uma determinada semana, ser analisado um número de processos menor
ou igual a 40 é igual a
(A) 40% (B) 31% (C) 23% (D) 16% (E) 11%
Solução
Queremos calcular P( X 40 ), sendo σ = 10 e μ = 50, normalizando o 40 temos
Z . 10 = 40 – 50 ou Z = – 1. Logo P( X 40 ) = P( Z – 1 ) e por simetria temos
P( Z – 1 ) = P( Z ≥ 1 ) = 0,5 – P( 0 Z 1 ) , da tabela tiramos que
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
68
QUESTÕES DE CONCURSOS
(01) Os salários dos empregados de uma determinada categoria profissional apresentam uma
distribuição normal com média igual a R$ 1.200,00 e desvio padrão igual a R$ 160,00. A
proporção dos empregados com salários superiores a R$ 1.000,00 e inferiores a R$ 1.520,00 é
(A) 98%
(B) 96%
(C) 92%
(D) 89%
(E) 87%
69
c) 47,72%
d) 19,15%
e) 21,43%
(06)(CETESB/2009) Uma empresa produz um componente eletrônico que tem vida média de
1200 horas e desvio padrão de 60 horas. Sabe-se que a distribuição é normal. A probabilidade
de uma amostra de 9 desses componentes retirados de um lote ter vida média entre 1150 e
1250 horas é de
(A) 10,56%.
(B) 98,76%.
(C) 59,34%.
(D) 5,34%.
(E) 95,25%.
(07)(APOFP/SP 2009) Seja Z uma variável aleatória Normal Padrão. Dados os valores de z e
de P(Z < z) a seguir, obtenha o valor mais próximo de P(-2,58 < Z < 1,96).
z 1,96 2,17 2,33 2,41 2,58
P( Z < z ) 0,975 0,985 0,99 0,992 0,995
70
a) 0,99
b) 0,97
c) 0,98
d) 0,985
e) 0,95
71
e) R$ 4.500,00
(11)(TCE RO/2007) O gasto médio dos clientes de um posto de gasolina é uma variável
aleatória normal com média R$ 100,00 e desvio padrão R$ 25,00. Os 10% dos que mais
consomem recebem um tratamento VIP, incluindo lavagem de carroceria, calibragem nos
pneus e verificação do óleo e da água. Quanto você precisa gastar nesse posto de gasolina, em
reais, para obter tratamento VIP?
(A) 158,00
(B) 149,00
(C) 141,00
(D) 132,00
(E) 128,00
(13)(BNDES/2008) Seja X uma variável aleatória com distribuição normal com parâmetros
μ= 2 e σ²=16 . A probabilidade de que X esteja entre 1 e 4 é, aproximadamente,
(A) 9%
(B) 10%
(C) 19%
(D) 29%
(E) 33%
72
(15)(UNIFESP/2009) Suponha que o tempo necessário para atendimento de clientes em uma
central de atendimento telefônico siga uma distribuição normal de média de 8 minutos e
desvio padrão de 2 minutos, qual é a probabilidade de que um atendimento dure entre 7 e 10
minutos?
a) 47,3%
b) 58,9%
c) 53,28%
d) 67,1%
(16)(ICMS RS/2009) Seja Z uma variável aleatória contínua normalmente distribuída com
média zero e desvio padrão um. Seja P( Z < - 1) = 0,1587 e P( Z > 2 )=0,0228. Seja X uma
variável aleatória contínua normalmente distribuída com média 200 e desvio padrão 20, então
P(180 < X < 240) , é:
a) 0,9772
b) 0,8413
c) 0,3413
d) 0,8185
e) 0,4772
(17)(ICMS RS/2009) Uma pesquisa indica que a distribuição do tempo que os candidatos de
um concurso levam para entregar uma prova é aproximadamente normal, com tempo médio
de 1,5 hora e desvio padrão de 15 minutos. Sabendo que P( μ < X < μ + 2σ ) = 0,4772 e
P( μ - σ < X < μ+σ)=0,6827 , o número esperado de candidatos que levam entre 1 e 2 horas,
de um total de 10.000 candidatos, é;
a) 5.228
b) 9.972
c) 9.544
d) 6.827
e) 3.173
73
(19) (26)(CETESB/2009) Suponha que as pessoas adultas tenham altura média de 170 cm e
desvio padrão de 10 cm. Sabe-se que as alturas têm distribuição normal. Então, a
probabilidade de que uma pessoa tenha mais de 183 cm, é de
(A) 34,13%.
(B) 9,68%.
(C) 5,15%.
(D) 3,34%.
(E) 2,27%.
(20)(CEB Brasília Estatística/2010) Uma pizzaria garante entregar os pedidos dos clientes em
tempo mínimo. O tempo de entrega segue uma distribuição aproximadamente normal com
σ = 4. Sabe-se que 97,13% dos pedidos levam até 13,6 minutos. Qual a probabilidade de que
o pedido de um cliente tenha de esperar mais de 12,6 minutos?
(A) 0,0208
(B) 0,0495
(C) 0,0808
(D) 0,9505
(E) 0,9590
(22)(IBGE/2010) Seja H a variável aleatória que representa as alturas dos cidadãos de certo
país. Sabe-se que H tem distribuição normal com média 1,70 m e desvio padrão 0,04 m. A
probabilidade de que um cidadão desse país tenha mais do que 1,75 m de altura é,
aproximadamente,
(A) 9,9%
(B) 10,6%
(C) 22,2%
(D) 39,4%
(E) 40,6%
74
(23)(TRT 7ª R/2009) Os salários dos analistas de um tribunal é uma variável aleatória X, com
distribuição normal com média μ e desvio padrão R$ 500,00. Sabendo que P(X < 5.000 reais)
= 0,02, o valor do primeiro quartil de X, em reais, é
(A) 5.755.
(B) 5.665.
(C) 5.605.
(D) 5.500.
(E) 5.410.
(24)(MPE SC/2009) Num teste psicológico aplicado a um grupo de pessoas, a média dos
escores foi de 21 pontos e o desvio padrão foi de 7. Considerando uma distribuição normal de
probabilidades, qual a probabilidade de ser encontrada uma pessoa com o escore entre 21 e
28 pontos?
A) 95,44%
B) 68,26%
C) 47,72%
D) 34,13%
E) 50%
GABARITO
(01)E (02)A (03)B (04)A (05)B (06)B (07)B (08)A (09)A (10)D (11)D
(12)B (13)D (14)A (15)C (16)D (17)C (18)E (19)B (20)B (21)D (22)B
(23)B (24)D (25)C
75
CAPÍTULO 03
INTERVALO DE CONFIANÇA
Obs.: Note ainda que a amplitude (A) do intervalo de confiança será o dobro do erro da
amostra (e), ou seja: A = 2e.
(3.1) Intervalo de Confiança para a Média Populacional µ : seja X uma variável aleatória
com média µ e variância σ2, e seja X1, X2, ..., Xn uma amostra aleatória simples( a.a.s. ) de X,
O intervalo de confiança para a média populacional pode ser feito de duas formas, lembrando
que pelo Teorema do Limite Central podemos aproximar por uma Normal:
(3.1.1) Com a variância (σ2) conhecida : mesmo que o tamanho da amostra seja
pequena, n ≤ 30, se a variância (σ2) for conhecida iremos utilizar a Normal, agora
se a variância populacional for desconhecida mas n > 30 também iremos utilizar a
Normal e neste caso a variância usada será a amostral( S ).
. Com a relação
76
(3.1.2) Com a variância (σ2) desconhecida e n ≤ 30 : neste caso deve-se estimar a
variância populacional por S2, e vamos utilizar a distribuição "t" de Student, com
φ = n - 1 graus de liberdade. A distribuição t de Student é uma distribuição de
probabilidade teórica simétrica e semelhante à curva normal, diferindo da normal por possuir
um parâmetro adicional, os chamados graus de liberdade que mudam sua forma. Grau de
liberdade, normalmente simbolizados por gl ou φ, é um parâmetro da distribuição t que pode
ser qualquer número real maior que zero.
. A relação nos dá o
tamanho n da amostra.
t- Student
77
Ex.: gl = φ = 8 e = 10%, na tabela teremos :
gl / 0,10 0,05 0,020 0,010
08 1,860 2,306 2,896 3,355
Da tabela temos que t /2 = t 0,05 = 1,860, mas cuidado, na tabela iremos procurar = 10% .
78
ATENÇÃO : o intervalo de confiança para a Média Populacional µ pode ser calculado pela
Normal ou pela “t” de Student. Mas em apenas um caso iremos utilizar a
“t” de Student é quando n ≤ 30 e σ2 ( ou σ ) for desconhecido. Em qualquer outro caso
usaremos Normal. Note que mesmo que σ2 ( ou σ ) for desconhecido mas se n> 30 iremos
usar a Normal.
. A expressão
QUESTÕES DE RESOLVIDAS
79
(01)(ICMS RJ 2010) Suponha que os salários dos trabalhadores numa certa região sejam
descritos por uma variável populacional com média desconhecida e desvio padrão igual a
R$200,00. Para se garantir, com 95% de probabilidade, que o valor da média amostral dos
salários não diferirá do valor da média populacional por mais de R$10,00, a amostra aleatória
simples deverá ter no mínimo, aproximadamente, o seguinte tamanho:
(A) 3.568. (B) 3.402. (C) 2.489. (D) 2.356. (E) 1.537.
SOlUÇÃO
A questão trata de cálculo do tamanho da amostra da média com σ2 conhecido,
(02)(TRE PI 2009) Uma amostra com apenas 9 elementos foi extraída de uma população
normal de tamanho infinito com variância desconhecida. A média amostral apresentou um
valor igual a 10 com uma variância igual a 16. Um intervalo de confiança de 90% para a média
foi obtido utilizando a distribuição t de Student, considerando t0,05 o quantil da distribuição t de
Student para teste unicaudal tal que P (t > t0,05) = 0,05, com n graus de liberdade. O intervalo
de confiança, utilizando os dados da amostra, é
(03)(TJ PA 2009) A vida de determinado equipamento apresenta uma distribuição normal com
um desvio padrão populacional de 400 horas. Extrai-se uma amostra aleatória de 100
equipamentos e obtém-se uma vida média de 2.000 horas para este equipamento.
Considerando a população de tamanho infinito e a informação da distribuição normal padrão
80
(Z) que P(Z > 1,64) = 5% tem-se um intervalo de confiança de 90% para a vida média dos
equipamentos igual a
(A) [1.800,00; 2.200,00] (B) [1.967,20; 2.032,80] (C) [1.934,40; 2.065,60]
(D) [1.639,20; 2.360,80] (E) [1.344,00; 2.656,00]
SOLUÇÃO
Intervalo de confiança para média em que n =100, n grande, iremos utilizar a Distribuição
e . Opção C .
(04)(FUNASA 2009) Numa região afetada por um surto epidêmico, selecionou-se uma amostra
de 2.500 indivíduos, tendo-se encontrado 500 contaminados. O intervalo de confiança de 95%
para a verdadeira e desconhecida proporção populacional é, aproximadamente,
(A) 20% ± 1% (B) 20% ± 2% (C) 20% ± 3%
(D) 20% ± 4% (E) 20% ± 5%
SOLUÇÃO
Intervalo de confiança para a Proporção, iremos utilizar a Normal, o sucesso f será 500 em
2500, ou seja, 20% e ( 1 – f ) = 80%. Como o intervalo de confiança é de 95% o Z / 2 vale
e 20% ± 2% . Opção B .
(05)(ICMS RJ 2008) Uma pesquisa recente foi realizada para avaliar o percentual da população
favorável à eleição de um determinado ponto turístico para constar no selo comemorativo de
aniversário da cidade. Para isso, selecionou-se uma amostra aleatória simples extraída de uma
população infinita. O resultado apurou 50% de intenção de votos para esse ponto turístico.
Considerando que a margem de erro foi de 2 pontos percentuais, para mais ou para menos, e
que o nível de confiança utilizado foi de 95%, foram ouvidas, aproximadamente:
(A) 50 pessoas. (B) 100 pessoas. (C) 1.200 pessoas.
(D) 2.400 pessoas. (E) 4.800 pessoas.
SOLUÇÃO
81
Questão de tamanho da amostra para a proporção em que f = 1/2 , 1 – f = 1/2,
e = 0,02 e o nível de confiança de 95%. Seria interessante sabermos, para a prova, que se o
nível de confiança for de 95% teremos Z / 2 = 1,96. Sendo
teremos . Opção D .
(06)(AFRE SC/2010) Uma amostra aleatória de 100 elementos de uma população resultou em
um erro padrão igual a 10 para uma variável X. Admite-se que a média amostral de X siga
uma distribuição normal. Com base nas informações anteriores, calcule o erro amostral de um
intervalo bilateral de 95% de confiança para a média de X.
a) 1,645 b) 1,96 c) 10 d) 16,45 e) 19,6
Solução
(07)(ICMS RJ/2010) Para estimar a proporção p de pessoas acometidas por uma certa gripe
numa população, uma amostra aleatória simples de 1600 pessoas foi observada e constatou-
se que, dessas pessoas, 160 estavam com a gripe Um intervalo aproximado de 95% de
confiança para p será dado por:
(A) (0,066, 0,134). (B) (0,085, 0,115). (C) (0,058, 0,142).
(D) (0,091, 0,109). (E) (0,034, 0,166).
Solução
O intervalo de confiança é para estimar a proporção p de pessoas acometidas por uma
certa gripe numa população, que será p ± e. Temos que n = 1600, f = 160/1600 = 0,1, 1 –
82
essa estimativa, obtenha o menor tamanho de amostra aleatória simples necessária para
estimar p com um intervalo de 95% de confiança e um erro de amostragem
, onde =1− .
83
QUESTÕES DE CONCURSOS
(01)(ICMS RJ/2010) Suponha que os salários dos trabalhadores numa certa região sejam
descritos por uma variável populacional com média desconhecida e desvio padrão igual a
R$200,00. Para se garantir, com 95% de probabilidade, que o valor da média amostral dos
salários não diferirá do valor da média populacional por mais de R$10,00, a amostra aleatória
simples deverá ter no mínimo, aproximadamente, o seguinte tamanho:
(A) 3.568.
(B) 3.402.
(C) 2.489.
(D) 2.356.
(E) 1.537.
(02) O intervalo de confiança de 98,8% para o salário médio da população dos empregados de
indústria têxtil é
A) R$ 600,00 ± R$ 1,60.
B) R$ 600,00 ± R$ 16,00.
C) R$ 600,00 ± R$ 40,00.
D) R$ 600,00 ± R$ 400,00.
E) R$ 600,00 ± R$ 1.000,00.
(04)(ICMS AP/2010) Uma amostra aleatória simples de tamanho 400 de uma variável
populacional normalmente distribuída com média μ desconhecida e variância igual a 25 foi
84
observada e indicou uma média amostral igual a 12,52. O intervalo de 95% de confiança para
μ é dado por:
Dados: Se Z tem distribuição normal padrão,
P[0 < Z < 0,45] = 1,64; P[0 < Z < 0,475] = 1,96; P[0 < Z < 0,49] = 2,33
(A) (12,03 , 13,01)
(B) (11,65 , 13,39)
(C) (10,99 , 15,05)
(D) (10,44 , 15,60)
(E) ( 9,99 , 16,05)
(05)(ICMS MS/2006) Uma amostra aleatória de tamanho 400 revelou que 64% dos torcedores
brasileiros acham que conquistaremos o hexacampeonato mundial de futebol. O intervalo de
95% de confiança para a proporção de torcedores na população que acreditam no
hexacampeonato é:
(07)(IPEA/2004) Deseja-se estimar o gasto médio efetuado por grupos de 4 pessoas, num
restaurante, por meio de um intervalo de confiança com coeficiente de 95%. Uma amostra de
16 grupos produziu os valores R$ 150,00 e R$ 20,00 para a média e o desvio padrão
amostrais, respectivamente. Assinale a opção que corresponde ao intervalo procurado. Use a
hipótese de normalidade da distribuição dos gastos e a tabela abaixo da função de distribuição
de Student (Tr) para a escolha do quantil apropriado aos cálculos.
85
a) [139,34; 160,66]
b) [139,40; 160,60]
c) [141,23; 158,77]
d) [141,19; 158,81]
e) [140,00; 160,00]
(08)(MPU/2007) Uma nova marca de lâmpada está sendo estudada. Baseado em estudos
anteriores com outras marcas similares, pode-se admitir que a vida média segue uma
distribuição normal com desvio padrão de 8 meses. Tendo como base estes resultados, o
tamanho da amostra necessário para que a amplitude do intervalo de 95% de confiança
(utilize a aproximação P(−1 ≤ Z ≤ 2) = 0,95, onde Z é a normal padrão) para a vida média
seja de 4 meses é de:
a) 8
b) 12
c) 16
d) 64
e) 128
(09)(ICMS RJ 2009) Uma empresa afirma que os pacotes de bala que ela produz pesam em
média 25g. Para testar essa hipótese, foram selecionados ao acaso 16 pacotes produzidos pela
empresa, registrados seus pesos X1, X2, ... , X16 e calculadas as estatísticas
86
(A) (14,26 ; 15,74 );
(B) (14,51 ; 15,49 );
(C) (13,92 ; 16,08 );
(D) (13,66 ; 16,34 );
(E) (13,20 ; 16,80 ).
(12)(TRT 8ª R/2010) Uma pesquisa realizada em uma região, por meio de uma amostra piloto,
revelou que 80% de seus habitantes são favoráveis à realização de uma obra. Deseja-se obter
um intervalo de confiança de 95% para esta proporção, com base em uma amostra de
tamanho 256, considerando a população de tamanho infinito e que a distribuição amostral da
frequência relativa dos habitantes favoráveis à obra é normal. Utilizando a informação da
distribuição normal padrão (Z) que a probabilidade P(Z > 1,96) = 0,025, o intervalo de
confiança apresenta uma amplitude igual a
(A) 9,8%.
(B) 8,4%.
(C) 7,6%.
(D) 6,4%.
(E) 4,9%.
(13)(SEPLAG RJ/2010) Numa amostra aleatória simples, constituída por 38 funcionários da
SEPLAG, obteve-se, para as suas idades, uma média amostral de 31,82 anos e uma variância
amostral de 1,52 anos2. Considerando que P(Z < 1,96) = 0,975, onde Z é a variável aleatória
normal padrão, o intervalo de 95% de confiança para a média populacional será de,
aproximadamente:
A) [31,04; 32,60] anos
B) [31,43; 32,60] anos
C) [31,04; 32,21] anos
D) [31,43; 32,21] anos
87
E) [30,30; 33,34] anos
(16)(FUNASA 2009) Numa região afetada por um surto epidêmico, selecionou-se uma amostra
de 2.500 indivíduos, tendo-se encontrado 500 contaminados. O intervalo de confiança de 95%
para a verdadeira e desconhecida proporção populacional é, aproximadamente,
(A) 20% ± 1%
(B) 20% ± 2%
(C) 20% ± 3%
(D) 20% ± 4%
(E) 20% ± 5%
88
(B) 58
(C) 139
(D) 200
(E) 322
(18)(ICMS RJ/2011) Um processo X segue uma distribuição normal com média populacional
desconhecida, mas com desvio-padrão conhecido e igual a 4. Uma amostra com 64
observações dessa população é feita com média amostral 45. Dada essa média amostral, a
estimativa da média populacional, a um intervalo de confiança de 95%, é
a) (41;49).
b) (37;54).
c) (44,875;45,125).
d) (42,5;46,5).
e) (44,46).
(19)(TRT 1ª R/2011) Uma amostra aleatória de 9 elementos foi extraída de uma população
normal de tamanho infinito com média μ e variância desconhecida. O desvio padrão da
amostra apresentou o valor de 1,25 e o intervalo de confiança de (1 − ) para μ: [14, 16] foi
obtido com base nesta amostra. Sabe-se que para obtenção deste intervalo utilizou-se a
distribuição t de Student com os correspondentes graus de liberdade, em que a probabilidade
P (− T≤ t ≤ T) = (1 − ). Se T > 0, então o valor de T é
(A) 2,4. (B) 2,7. (C) 3,0. (D) 3,6. (E) 4,2.
GABARITO
01)E 02)C 03)E 04)A 05)C 06)A 07)A 08)D 09)D 10)B 11)C 12)A 13)D 14)C
15)E 16)B 17)C 18)E 19)C
CAPÍTULO 04
TESTE DE HIPÓTESE
89
ser aceita ou rejeitada. Para testarmos parâmetros de uma população, formulamos hipóteses
a respeito desses parâmetros. Essas hipóteses são denominadas:
Geralmente, a hipótese Ho é a hipótese a ser testada. Caso rejeitemos Ho, a hipótese H1 será
considerada aceitável.
Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual se sujeitaria a correr
o risco de um Erro do Tipo I é denominada de Nível de Significância do Teste (os níveis
de significância usualmente adotados são 0,10 (10%), 0,05 (5%) e 0,01 (1%).). Essa
probabilidade, representada freqüentemente por , é geralmente especificada antes da
extração de quaisquer amostras, de modo que os resultados obtidos não influenciem na
escolha. Os valores de e β são as probabilidades de cada um dos erros tipo I e tipo II
ocorrerem( geralmente crescem em sentidos inversos ), respectivamente, ou seja,
90
3º ) De uma forma geral a probabilidade do erro tipo II(β) não pose ser calculada, pois
não sabemos o valor verdadeiro.
4º ) Geralmente, quanto menor for à probabilidade de se cometer o erro tipo I, maior será a
probabilidade de se cometer o erro do tipo II. A única forma de se reduzir às probabilidades
relativas aos dois tipos de erros é aumentando o tamanho da amostra, pois quanto maior
for à amostra, maior será a precisão das estimativas dos parâmetros.
R.A. é a região de aceitação (da hipótese nula) e R.C. é a região crítica ou região de rejeição.
A fronteira entre essas regiões será dada por um valor tabelado
( Distribuição Normal ou da Tabela da Distribuição t-Student).
91
(4.4) Iremos utilizar a Distribuição Normal ou t-Student?
Iremos utilizar a t- Student apenas quando o tamanho da amostra for pequeno ( n ≤ 30 )
e a variância populacional for desconhecida. Caso contrário iremos utilizar a Normal. É
claro que temos que considerar o Qui-Quadrado, quando for o caso.
(4.5) Roteiro para o cálculo do Teste de Hipótese : nada mais é do que uma orientação.
1º : estabelecer a Hipótese Nula (H0) e a Hipótese Alternativa (H1), observando os dados do
enunciado.
2º : definir a distribuição a ser utilizada (Normal ou t-Student), observando o enunciado.
3º : utilizando a Tabela Normal Padrão ou a Tabela t-Student, encontrar o valor de ZTAB ou tTAB
4º : de uma forma geral iremos fazer o desenho da curva, determinando no eixo das
abscissas o valor tabelado, que será a fronteira entre a área de aceitação (RA) e a(s) área(s)
de rejeição (RC - Região Crítica) .
5º : calcular o parâmetro teste (ZCALC ou tCALC) utilizando uma das fórmulas vistas nos capítulos
anteriores.
6º : Comparar o valor calculado com o valor tabelado e concluir pela aceitação ou rejeição da
Hipótese Nula.
Note a ligação entre Estimação e Teste de Hipótese, podemos dizer que se nada é conhecido
acerca da população, a estimação é usada para fornecer uma estimativa de ponto e de
intervalo acerca da população. Se alguma informação acerca da população é proposta ou
suspeitada, o Teste de Hipóteses é usado para determinar a plausibilidade desta informação.
92
2º ) Pode ocorrer que um teste seja significativo se for unilateral mas não seja significativo se
for bilateral, para um mesmo , por isso é muito importante que o tipo de teste seja
determinado antes de se realizar a experiência, seja ela qual for.
QUESTÕES RESOLVIDAS
(01)(IBGE 2010) O salário médio nacional dos trabalhadores de certa categoria é igual a 4
salários mínimos, com desvio padrão de 0,8 salários mínimos. Uma amostra de 25
trabalhadores dessa categoria é escolhida ao acaso em um mesmo estado da União. O salário
médio da amostra é de μ salários mínimos. Deseja-se testar com nível de significância igual a
10%
Ho : μ = 4 contra H1 : μ ≠ 4
Considerando esses dados, analise as afirmativas.
I – O teste rejeitará Ho se for igual a 4,30.
II – O teste rejeitará Ho se for igual a 4,20.
III – O teste não rejeitará H0 se for igual a 3,75.
Está(ão) correta(s) APENAS a(s) afirmativa(s)
(A) I. (B) II. (C) III. (D) I e II. (E) I e III.
SOLUÇÃO
Estamos testando uma média e vamos usar a Normal, note que o teste é bilateral,
= 10% e 1 – = 90%, vamos encontrar ZTAB = 1,64 e – 1,64, ver tabela, logo
afirmação correta.
93
(02)(BNDES/2009) O rótulo das garrafas de certo refrigerante indica que o seu conteúdo
corresponde ao volume de 290 mL. A variável aleatória que representa o volume de líquido no
interior dessas garrafas é X. A máquina que enche essas garrafas o faz segundo uma
distribuição normal, com média e variância igual a 36 mL2, qualquer que seja o valor de μ. A
máquina foi regulada para
μ = 290 mL. Semanalmente, uma amostra de 9 garrafas é colhida para verificar se a máquina
está ou não desregulada para mais ou para menos. Para isso, constrói-se um teste de hipótese
bilateral no qual
X ~ N ( μ , 36)
H0 (Hipótese Nula): μ = 290 mL
H1 (Hipótese Alternativa): μ ≠ 290 mL
O nível de significância do teste foi fixado em . A hipótese nula não será rejeitada se a média
apresentada pela amostra estiver entre 285,66 mL e 294,34 mL. Logo, é igual a
(A) 0,5% (B) 1,0% (C) 1,5% (D) 3,0% (E) 4,0%
SOLUÇÃO
σ2 = 36 σ = 6, n = 9, μ = 290, vamos usar a Normal calculando Z1 e Z2 , pois sabemos
que 285,66 < < 294,34 .
e , a probabilidade será
94
(04)(CAPES 2008) Considere as asserções a seguir.
A região de rejeição de um teste de hipóteses é obtida sob a suposição de que a hipótese da
nulidade (Ho) é verdadeira.
PORQUE
Em testes de hipóteses, o erro do tipo I é aquele cometido ao se rejeitar a hipótese da
nulidade (Ho) quando esta é verdadeira.
Analisando-se as asserções, conclui-se que
(A) as duas asserções são verdadeiras, e a segunda é uma justificativa correta da primeira.
(B) as duas asserções são verdadeiras, e a segunda não é uma justificativa correta da
primeira.
(C) a primeira asserção é verdadeira, e a segunda é falsa.
(D) a primeira asserção é falsa, e a segunda é verdadeira.
(E) a primeira e a segunda asserções são falsas.
SOLUÇÃO
As duas asserções são verdadeiras, pois, é convencionado que a região crítica seja definida
sob a suposição de que a hipótese nula seja verdadeira. Opção B.
(05)(AFRE MG/2005) Um fabricante afirma que pelo menos 95% dos equipamentos que
fornece à indústria encontram-se dentro de suas especificações. Uma amostra de 200 itens
escolhidos ao acaso revelou 10 itens fora de especificação. Assinale a opção que corresponde
ao valor probabilístico (p-valor) do teste de H: θ ≥ 0,95 contra A: θ < 0,95, sendo θ a
proporção populacional de itens dentro de especificação.
a) 0,500 b) 0,050 c) 0,025 d) 0,010 e) 0,100
Solução
Teste de Hipótese para Proporção, unicaudal para a esquerda, p-valor é a probabilidade de ter
um valor para a estatística de teste no mínimo tão extremo como o valor calculado (ZCALC ou
tCALC) para o teste. Então vamos calcular a estatística teste, neste caso, ZCALC para a
proporção que será dado por
95
reservatórios produziu o valor médio de 38 horas. Suponha que a distribuição dos tempos
de duração do gás seja aproximadamente normal com desvio padrão de 7 horas.
Assinale a opção que dá o valor probabilístico (p-valor) do teste constituído com base na
estatística − 40.
a) 5% b) 2,3% c) 3% d) 4% e) 2,5%
Solução
1º) Teste de hipótese para a média, unicaudal a esquerda, = 5% e 1 – = 95% ( na
verdade não precisaremos destas duas informações), μ = 40, = 38, n=49 e σ=7.
até 2, para valores maiores do que 2 temos 2,3%, por simetria para valores menores do que –
2 também teremos 2,3%. Opção B .
QUESTÕES DE CONCURSOS
(01)(AFRE-SC 2010) Sejam as seguintes hipóteses estatísticas sobre a média de uma variável
X em uma população:
Hipótese nula: média = 100
Hipótese alternativa: média ≠ 100
Para testar as hipóteses coletou-se uma amostra aleatória de 16 elementos da população
citada, registrando os valores de X, resultando em: média amostral = 110; erro padrão = 4.
Admite-se que X tem distribuição normal na população. Deseja-se que o teste tenha
significância de 1%, acarretando em um valor crítico para a estatística de teste t, com 15
graus de liberdade, aproximadamente igual a 3. Com base nas informações existentes, o valor
da estatística de teste e a decisão do teste serão:
a) –2,5; aceitar a hipótese nula.
b) 2,5; aceitar a hipótese nula.
c) 2,5; rejeitar a hipótese nula.
d) 10; aceitar a hipótese nula.
e) 10; rejeitar a hipótese nula.
96
máquina está regulada corretamente, foi estabelecido um procedimento para testar a hipótese
H0 de que a massa média dos comprimidos produzidos é, de fato, igual a 0,5 g contra a
hipótese alternativa H1 de que tal massa é inferior a 0,5 g. O procedimento de teste consistiu
em pesar uma amostra de 100 comprimidos, obter a média m e o desvio padrão s das massas
registradas, em gramas, e rejeitar H0 quando m < 0,5 – 0,15 s. O nível de significância do
teste (ou seja, a probabilidade de se rejeitar a hipótese nula caso ela seja verdadeira) é,
aproximadamente,
(A) 0,059
(B) 0,067
(C) 0,119
(D) 0,134
(E) 0,150
(03)(ICMS RJ 2010) Para testar Ho: p < 0,5 contra H1: p > 0,5, sendo p a proporção de
pessoas que são protegidas por planos de previdência privada numa certa população, uma
amostra aleatória simples de tamanho 400 será obtida e será usado como critério de decisão
rejeitar a hipótese Ho se a proporção de pessoas com essa proteção na amostra for maior ou
igual a um certo número k. Ao nível de significância de 5%, o valor de k é aproximadamente
igual a:
(A) 0,508.
(B) 0,541.
(C) 0,562.
(D) 0,588.
(E) 0,602.
97
(05)(BACEN Analista 2010) Com relação a um teste simples de hipótese, assinale a afirmativa
correta.
(A) Um teste bicaudal de nível de significância α rejeita a hipótese nula H0: μ = μo
precisamente quando μo está fora do intervalo de confiança de nível (1 − ) para μ.
(B) A hipótese nula a ser testada deve ser construída com muita atenção porquanto é o objeto
da inferência estatística, enquanto que a hipótese alternativa só precisa ser contrária à
hipótese nula.
(C) Se o grau de significância do teste é α, significa que (1− ) é a probabilidade de se
cometer erro do tipo I.
(D) Na definição de um teste, deve-se levar em conta que quanto menor o grau de
significância do teste (), maior será o poder do teste (π), uma vez que ( + π) = 1.
(E) Erro do tipo II, embora definido para uma hipótese alternativa específica, ocorrerá sempre
com probabilidade igual ao poder do teste.
(06)(IBGE 1999) Considere uma amostra aleatória de tamanho 36 de uma distribuição normal
com média μ e desvio padrão 1,8. Deseja-se testar H 0: μ ≤ 10 versus H 1: μ > 10. O teste
uniformemente mais poderoso de tamanho 1% rejeitará H 0 se a média amostral for, no
mínimo, igual a:
(a) 10,7
(b) 11,1
(c) 11,5
(d) 11,9
(e) 12,3
(08)(IBGE 2010) O salário médio nacional dos trabalhadores de certa categoria é igual a 4
salários mínimos, com desvio padrão de 0,8 salários mínimos. Uma amostra de 25
trabalhadores dessa categoria é escolhida ao acaso em um mesmo estado da União. O salário
médio da amostra é de μ salários mínimos. Deseja-se testar com nível de significância igual a
10%
Ho : μ = 4 contra H1 : μ ≠ 4
Considerando esses dados, analise as afirmativas.
98
I – O teste rejeitará Ho se for igual a 4,30.
II – O teste rejeitará Ho se for igual a 4,20.
III – O teste não rejeitará H0 se for igual a 3,75.
Está(ão) correta(s) APENAS a(s) afirmativa(s)
(A) I. (B) II. (C) III. (D) I e II. (E) I e III.
(10)(TRT 9ª R/2010) Uma amostra aleatória com 16 elementos é extraída de uma população
normal de tamanho infinito com média μ e desvio padrão desconhecido. O valor da média
amostral e o valor da variância amostral foram iguais a M e 625, respectivamente. Deseja-se
testar a hipótese H0: μ = 90 (hipótese nula) contra H1: μ > 90 (hipótese alternativa) com base
nos resultados apresentados pela amostra, ao nível de significância de 5%. Utilizou-se para o
teste a distribuição t de Student, considerando t0,05 o quantil da distribuição t de Student para
o teste unicaudal tal que P (t > t0,05) = 5%.
99
(A) H0 não será rejeitada, ao nível de significância , se t t > 1,875 com n = 24.
(B) Se H0 foi rejeitada, ao nível de significância , tem-se que t t > 9,375 com n = 24.
(C) Se H0 foi rejeitada, ao nível de significância , então para um nível de significância superior
a H0 não seria rejeitada.
(D) 1,875 < t c < 9,375 e n = 23.
(E) t c = 9,375 e n = 23.
(12)(MDA Estatístico/2009) Uma indústria produz baterias cuja duração segue uma
distribuição N (800;2500). O valor da estatística para testar a hipótese de que H0 : μ = 800
contra a alternativa de H1 : μ ≠ 800 se uma amostra aleatória de 30 baterias tem um tempo
médio de vida de 790 horas é:
A) -1,10
B) 3,20
C) -4,75
D) 0,25
E) -0,63
GABARITO
01)B 02)B 03)B 04)E 05)A 06)A 07)E 08)E 09)B (10)A (11)A (12)A
CAPÍTULO 05
CORRELAÇÃO LINEAR E REGRESSÃO LINEAR SIMPLES
100
Fig. 01 Fig. 02
Fig. 03 Fig. 04
101
Obs.: Covariância : A covariância pode ser entendida como uma “variância conjunta” entre
duas variáveis, é uma medida de dependência linear entre X e Y. Enquanto a variância sai de
quadrados (da variável menos a média), a covariância é definida através de produtos:
Cov(X,Y) = E(X.Y) – E(X).E(Y) ,
Cov(X,Y) = média dos produtos - produto da média , se X e Y são variáveis aleatórias
independentes, então Cov( X, Y ) = 0, mas a recíproca não é verdadeira. Algumas
propriedades da covariância:
a) Cov(X, Y ) = Cov(Y,X);
b) Cov(X,X) = Var (X);
c) Cov (a + bX , c + dY ) = bd Cov (X, Y );
ATENÇÃO!!
As propriedades mais importantes do coeficiente de correlação são:
1. O coeficiente de correlação é uma medida adimensional, isto é, ele é independente das
unidades de medida das variáveis X e Y.
2. Quanto mais próximo de +1 for “r”, maior o grau de relacionamento linear positivo entre X
e Y, ou seja, se X varia em uma direção Y variará na mesma direção.
3. Quanto mais próximo de -1 for “r”, maior o grau de relacionamento linear negativo entre X
e Y, isto é, se X varia em um sentido Y variará no sentido inverso.
4. Quanto mais próximo de zero estiver “r” menor será o relacionamento linear entre X e Y.
Um valor igual a zero, indicará ausência apenas de relacionamento linear.
PROPRIEDEADES:
• se ρ > 0, então a relação linear é positiva;
102
• se ρ < 0, então a relação linear é negativa.
• se ρ2 estiver próximo de 1, então dizemos que a relação linear é forte;
• se ρ2 estiver próximo de 0, então dizemos que a relação linear é fraca;
• se ρ2 for intermediário, então dizemos que a relação linear é moderada.
, em que
“ covariância “ entre X e Y
“ variância “ de X
“ variância “ de Y
(5.1.3) Propriedade : Quando soma, subtrai, multiplica ou divide, a nova correlação fica
inalterada, devendo apenas tomar cuidado com o sinal negativo.
(5.2) REGRESSÃO LINEAR : Descrever a relação entre duas variáveis através de um gráfico
e da reta que melhor representa a relação. Essa reta é chamada de reta de regressão. Dada
uma coleção de dados emparelhados, a reta de regressão é aquela cuja equação descreve
algebricamente a relação entre duas variáveis. A reta de regressão também é chamada de reta
dos mínimos quadrados e sua equação é dada por Y= a + bX ,onde a( é o intercepto ) e
b( inclinação da reta ) são os parâmetros do modelo.
103
QUESTÕES RESOLVIDAS
(01) (BNDES 2009) Para ajustar uma reta a um conjunto de pontos no plano cartesiano, (xi,
yi), i = 1 a n, de modo que y = a + bx, as estimativas de a e de b são feitas minimizando a
soma dos quadrados dos erros verticais (supondo que os y sejam representados no eixo das
ordenadas do gráfico entre x e y). Nestas condições, a reta ajustada
(A) tem um intercepto a nulo, se todos os yi forem iguais a 1.
(B) tem uma inclinação b com sinal contrário ao do coeficiente de correlação entre os xi e os
yi.
(C) passa pelos pontos de máximo e de mínimo dos xi e dos yi, respectivamente.
(D) passa pelo ponto onde e são as médias dos xi e dos yi, respectivamente.
(E) passa pelo menos por dois pontos (xi, yi), pois é o mínimo necessário para definir uma
reta.
SOLUÇÃO
Calculado b, o valor de a será calculado, pois, a = -b. . Logo concluímos que
pertence à reta. Opção D.
(02) (ICMS RS 2009) Em relação às variáveis X, definida pela cotação média diária do dólar e
Y definida pelo valor máximo do índice BOVESPA no dia, obteve-se para um período de 30 dias
a equação de regressão linear de y sobre x: é y = 66720 + bx. Para uma cotação média do
dólar em 200 a reta de regressão permitiu estimar pontualmente um BOVESPA igual a 66480
e o teste do coeficiente angular de regressão mostrou uma relação linear estatisticamente
significativa entre as duas variáveis para um nível de significância de 0,05. A afirmação falsa
é:
a) Para uma cotação média de 220, o índice BOVESPA estimado é 66456.
b) Para um nível de significância de 0,05, a correlação linear é estatisticamente significativa
entre X e Y.
c) O coeficiente de correlação linear é positivo.
d) Através dos valores da covariância entre x e y e dos desvios padrões de x e y, pode-se
obter a correlação entre x e y.
e) Através dos valores do coeficiente de correlação, dos desvios padrões e das médias de x e
y, pode-se obter a reta de regressão de y sobre x.
SOLUÇÃO
Y = 66720 + b.X , como (66480, 200) pertence à reta 66480 = 66720 + b.(200), logo b
(coeficiente angular) vale b = -1,2 e teremos Y = 66720 – 1,2.X .
a.) Y = 66720 – 1,2.X Y = 66720 – 1,2.(220) = 66456. Opção correta.
b.) pelo enunciado concluímos que está correto. Opção correta.
c.) o coeficiente angular b = -1,2 é negativo, a correlação é negativa. Opção errada.
104
d.) está correto, ver cálculo da correlação. Opção correta.
e.) está correto, ver cálculo da regressão. Opção correta . Opção c.
105
(A) 0,382 (B) 0,059 (C) 0,059 C (D) 0,118 (E) 0,382
SOLUÇÃO
O coeficiente de correlação entre Y e X1 é de r = − 0,059 (ver figura). A partir destas
variáveis, criamos outras, por meio de uma multiplicação e uma soma, a propriedade da
correlação diz que “ quando soma, subtrai, multiplica ou divide, a nova correlação fica
inalterada, devendo apenas tomar cuidado com o sinal negativo “. Logo teremos
r( Y , X1 ) = - 0,059 e r’( Y1 , X’1 ) = r’( - 2Y + 0,5 , - X1+ 0,5 ) = r’( - Y , - X1 ) = r( Y , X1 )
= - 0,059. Opção C .
(06) (ANAC 2007) As estatísticas a seguir foram obtidas de observações realizadas em 100
indivíduos com relação a duas características X e Y.
. Opção D .
(07) (TRF 2005) O coeficiente de correlação entre duas variáveis Y e X é igual a +0,8.
Considere, agora, a variável Z definida como: Z = 0,2 − 0,5 X
O coeficiente de correlação entre as variáveis Z e X, e o coeficiente de correlação entre as
variáveis Z e Y serão iguais, respectivamente, a:
a) – 1,0; – 0,8 b) + 1,0; + 0,8 c) – 0,5; – 0,8
d) – 0,5; + 0,8 e) – 0,2; – 0,4
106
SOLUÇÃO
r (x;y) = 0,80 e r (z;x) = r (- 0,5x + 0,2 ; x) = r( - x , x ) = - 1. Como apenas umas das
variáveis é negativa, ela irá influenciar o valor da correlação negativamente.
r (z; y) = r (-0,5x + 0,2 ; y) = r( x , y ) = -0,8. Opção A .
(08) (TRF 2005) Para 5 pares de observações das variáveis X e Y obteve-se os seguintes
resultados:
e . Calculando teremos:
, e , logo
. Opção E .
QUESTÕES DE CONCURSOS
(01)(AFRE SC 2010) Um modelo linear (reta) de regressão apresenta inclinação igual a 1,5 e
intercepção igual a 10. Qual é o valor da variável dependente de acordo com o modelo de reta
quando a variável independente vale 20?
(A) 40
(B) 55
(C) 201,5
(D) 300
(E) 2001,5
107
(02)(APOFP SP 2010) Com base em um estudo de correlação e regressão, obteve-se o gráfico
abaixo correspondente à equação da reta deduzida pelo método dos mínimos quadrados (Y =
aX + b), utilizando 10 pares de observações (Xi ,Yi), i = 1, 2, 3, ..., 10. A média aritmética das
observações de Y apresentou o valor de 6,5.
(03)(ICMS AP 2010) Se no ajuste de uma reta de regressão linear simples de uma variável Y
em uma variável X o coeficiente de determinação observado foi igual a 0,64, então o módulo
do coeficiente de correlação amostral entre X e Y é igual a:
(A) 0,24
(B) 0,36
(C) 0,50
(D) 0,64
(E) 0,80
108
E) 0,88
(05)(ISS RJ 2010) A partir de uma amostra aleatória simples formada por 22 observações das
variáveis X e Y calculou-se
.
Obtenha a reta de regressão linear de Y em X.
a) Ŷi = 19 + 0,667 Xi .
b) Ŷi = 12,5 + 1,2 Xi.
c) Ŷi = 4 + 1,2 Xi .
d) Ŷi = 19 + 1,2 Xi .
e) Ŷi = 80 + 22,8 Xi.
(06)(ISS RJ 2010) Com os dados da questão anterior, calcule o valor mais próximo do
coeficiente de determinação R2 da regressão linear de X em Y.
a) 0,65
b) 0,81
c) 0,85
d) 0,91
e) 0,88
(08)(SEPLAG RJ/2010) Para uma amostra de n pares de observações das variáveis X e Y foram
109
O valor da covariância amostral entre X e Y será, aproximadamente, igual a:
A) 1,40
B) 1,68
C) 1,97
D) 3,03
E) 4,67
Sabe-se que:
110
a) 11/5 b) – 3/8 c) – 4/11 d) – 4/17 e) – 11/65
GABARITO
01)A 02)E 03)E 04)C 05)C 06)C 07)C 08)A 09)A 10)D 11)C 12)D
QUESTÕES
111
O valor da mediana destes salários, obtido pelo método da interpolação linear, em R$, igual a
(A) 5.320,00. (B) 5.040,00. (C) 5.260,00. (D) 4.900,00. (E) 5.400,00.
A soma dos valores respectivos da mediana e da moda supera o valor da média aritmética
(quantidade de processos autuados por dia) em
(A) 1,85. (B) 0,50. (C) 1,00. (D) 0,85. (E) 1,35.
(03)(TCM SP 2015) Suponha que o tempo (em meses) decorrido para o exame de processos
administrativos no âmbito do TCM-SP tem distribuição de frequências conforme a seguir:
Considerando, para efeito de cálculo da média, os pontos médios dos intervalos, é possível
afirmar que:
(A) a mediana da distribuição é inferior a 5,5 meses;
(B) a média da distribuição está mais próxima de 4 do que de 6 meses;
(C) a distribuição é assimétrica à direita;
(D) a mediana da distribuição está entre 5,5 e 8 meses, inclusive;
(E) o percentil de ordem 90 é superior a 8 meses.
112
(04)(TRT 3ª R 2015) Durante um período de 40 dias úteis, realizou-se um levantamento com
relação a quantidade de reclamações trabalhistas em uma região. O quadro abaixo apresenta a
quantidade de reclamações correspondente a este levantamento.
Sabendo-se que a mediana da distribuição é igual a 2,5, obtém-se que o resultado do produto
da moda pela média aritmética(reclamações por dia) é
(A) 3,6. (B) 7,8. (C) 4,8. (D) 6,4. (E) 5,1.
Se a média aritmética (realizações por dia), ponderada pelo número de dias, é igual à moda da
distribuição, então (2m + 3n) é igual a
(A) 45. (B) 25. (C) 20. (D) 40. (E) 30.
113
(D) Aproximadamente 50% das caminhonetes multadas estavam acima de 150 km/h.
(09)(TRT 3ª R 2015) Seja uma representação gráfica de dados de acordo com o desenho
esquemático abaixo (box-plot) que foi preparado para comparar todos os salários dos
funcionários do sexo masculino (Grupo I) com todos os salários dos funcionários do sexo
feminino (Grupo II) lotados em um órgão público.
114
Com base nessa tabela, assinale a alternativa que apresenta:
I. a probabilidade de internamento em enfermaria.
II. a probabilidade de internamento em apartamento ou estar com dengue.
III. a probabilidade da pessoa internada em apartamento sabendo-se que teve pneumonia.
(A) I) 0,266; II) 0,666; III) 0,12. (B) I) 0,120; II) 0,666; III) 0,12.
(C) I) 0,266; II) 0,566; III) 0,12. (D) I) 0,120; II) 0,666; III) 0,04.
(E) I) 0,120; II) 0,566; III) 0,04.
(13)(Detran MT 2015) No registro de um hospital, observou-se que 10% das internações por
motivos de acidentes com motocicletas, no trânsito de uma cidade, são fatais. A probabilidade
de que das últimas 6 internações pelo menos 2 sejam fatais é:
(A) 12,32% (B) 11,43%
(C) 11,56% (D) 12,42%
(15)(Detran MT 2015) Dos carros que são utilizados pelo Departamento de Trânsito na
fiscalização das ruas de uma cidade, 40% usam gasolina comum, 35% usam gasolina
aditivada e 25% usam gasolina premium. Dos que usam gasolina comum, apenas 30% rodam
com tanque cheio; dos que usam gasolina aditivada, 60% rodam com tanque cheio e dos que
usam gasolina premium, 50% rodam com tanque cheio. A probabilidade de um carro
selecionado ao acaso usar gasolina aditivada com tanque cheio é:
(A) 12% (B) 21%
(C) 14% (D) 18%
115
Um funcionário será selecionado ao acaso desse grupo, a probabilidade dele não ter salário na
faixa 8 l── 12 ou ser do sexo feminino, é, em %, igual a
(A) 30. (B) 80. (C) 60.
(D) 70. (E) 40.
(18)(CNMPD 2015) Suponha que o número de acidentes, envolvendo motociclistas, que ocorre
diariamente em uma avenida marginal de uma grande cidade, seja uma variável aleatória X
com distribuição de Poisson com média de λ acidentes. Sabe-se que a probabilidade de
ocorrerem, diariamente, 3 acidentes é igual a probabilidade de ocorrerem 4 acidentes. Nessas
condições, a probabilidade de, em um determinado dia, ocorrer pelo menos 2 acidentes é, em
−2 −4
%, igual a Dados: e = 0,135; e = 0,018
(A) 86,5. (B) 94,6. (C) 91,0.
(D) 62,4. (E) 48,8.
(20)(TRE RR 2015) Uma pessoa coloca um anúncio em um site de vendas com o objetivo de
vender seu automóvel. Suponha que o número de consultas que essa pessoa recebe por
semana (7 dias) como resposta ao anúncio seja uma variável aleatória com distribuição de
Poisson com média igual a 3,5. Nessas condições, a probabilidade dessa pessoa receber, pelo
−0,5 −3,5
menos, 2 consultas em um determinado dia é, em %, igual a Dados: e =0,61; e =0,03
(A) 8,5. (B) 13,5. (C) 10,5.
(D) 32,8. (E) 9,6.
ATENÇÃO!!!!! Você vai perceber que, em algumas das questões abaixo, foi usada a
notação de MÓDULO. Quando aparecer, por exemplo, P(|Z|>1,25)=0,21 , significa
P( Z < - 1,25 ou Z > + 1,25 ) = 0,21 , ou seja, temos as duas partes laterais da
Gaussiana e a probabilidade de cada uma será 0,105( 0,21 : 2 ).
(22)(TCM SP 2015) Uma cuidadosa pesquisa de preços sobre os custos da construção civil,
mais especificamente para a edificação de certos tipos de infraestruturas públicas, demonstrou
que o valor por metro quadrado tem distribuição próxima da Normal com média de R$1.600 e
116
variância 14.400. São fornecidos também valores da distribuição normal padrão e respectivas
probabilidades, conforme abaixo:
Suponha que, para fins de fiscalização, o Tribunal de Contas do Município de São Paulo tenha
convencionado que, dentre todas as obras, as 10% mais caras deveriam passar por um exame
ainda mais detalhado. Então, isso significa que o critério estabelecido determina, estatisticamente ,
que uma obra deverá receber um tratamento mais rigoroso quando o custo por metro
quadrado for superior a:
(A) R$ 1.403,20; (B) R$ 1.446,40; (C) R$ 1.753,60;
(D) R$ 1.796,80; (E) R$ 1.835,20.
(23)(TJ RO 2015) Suponha que o valor das causas de ações (X) do juizado especial de certa
localidade seja normalmente distribuído com média 20 (salários mínimos) e variância 25. Além
disso, estão disponíveis as seguintes informações da normal-padrão (Z):
P(|Z|>1,25)=0,21, P(|Z|>1,50)=0,13, P(|Z|>1,75)=0,08
Então a probabilidade de que P(X > 26,25) é de:
(A) 4,0%; (B) 6,5%; (C) 8,0%;
(D) 10,5%; (E) 21,0%.
(24)(TJ SP 2015) Em uma distribuição normal, em que 9% dos dados estão acima de 20, e
15% dos dados estão abaixo de 10, os valores mais próximos da média e do desvio padrão
são, respectivamente,
(A) 10,1 e 2,2. (B) 11,3 e 2,5. (C) 13,1 e 3,2.
(D) 13,5 e 3,3. (E) 14,4 e 4,2.
(27)(TRT 3ª R 2015) Uma amostra aleatória de tamanho 225 é extraída de uma população
(P1) normalmente distribuída e de tamanho infinito. Sabe-se que a variância de P1 é igual a
64. Com base nesta amostra, um intervalo de confiança de nível (1 − α) foi construído para a
média μ' de P1 e foi igual a [28,64 ; 31,36]. Em uma outra população (P2), independente da
primeira, também normalmente distribuída e de tamanho infinito com média μ'', obteve-se
com base em uma amostra aleatória de tamanho 400 um intervalo de confiança de nível (1 −
α) para μ'' igual a [20,286 ; 21,714]. O desvio populacional de P2 é igual a
(A) 6,0. (B) 8,4. (C) 5,6.
117
(D) 6,4. (E) 7,2.
(28)(CNMPD 2015) Uma amostra aleatória de tamanho 256 é extraída de uma população
normalmente distribuída e considerada de tamanho infinito. Considerando que o desvio padrão
populacional é igual a 100, determinou-se, com base na amostra, um intervalo de confiança de
86% igual a [890,75 ; 909,25]. Posteriormente, uma nova amostra de tamanho 400,
independente da primeira, é extraída desta população, encontrando-se uma média amostral
igual a 905,00. O novo intervalo de confiança de 86% é igual a
(A) [897,60 ; 912,40]. (B) [899,08 ; 910,92]. (C) [901,30 ; 908,70].
(D) [903,15 ; 906,85]. (E) [903,30 ; 906,70].
(29)(CNMPD 2015) Uma pesquisa é realizada em uma grande cidade com uma amostra
aleatória de 300 habitantes em que 75% deles manifestaram-se favoráveis à implantação de
um projeto para melhorar o atendimento ao público de sua cidade. Com base nesta amostra,
deseja-se obter um intervalo de confiança de 95% para esta proporção, considerando que a
distribuição amostral da frequência relativa dos habitantes favoráveis ao projeto é normal.
Utilizando a informação da distribuição normal padrão (Z) que as probabilidades P(Z > 1,96) =
0,025 e P(Z > 1,64) = 0,050, este intervalo de confiança é, em %, igual a
(A) [71,68 ; 78,32]. (B) [71,34 ; 78,66] (C) [70,90 ; 79,10].
(D) [70,40 ; 79,60]. (E) [70,10 ; 79,90].
(31)(TRT 3ª R 2015) A amostra aleatória { X1, X2, X3, ... , X9 } foi extraída de uma
população normal de tamanho infinito com variância (σ2) desconhecida.
Com base nesta amostra, deseja-se obter um intervalo de confiança de 90% para a média μ
da população utilizando a distribuição t de Student levando em conta a tabela a seguir.
118
(D) [10,884 ; 13,116]. (E) [11,160 ; 12,840].
(32)(TJ BA 2015) Para a realização de uma pesquisa de opinião será extraída uma amostra
aleatória cujo tamanho deve ser calculado a priori. O objetivo é estimar a proporção de
pessoas que acreditam nos órgãos da Justiça para a solução de conflitos. Levantamentos
anteriores constataram que a proporção estava próxima de 75%. O erro máximo tolerado para
a estimativa é de 5 pontos percentuais e o grau de confiança deve ser de 95%. A tabela a
seguir fornece valores tabelados da Z, normal-padrão.
(33)(TJ SP 2015) Para avaliar o tempo médio de viagem entre o ponto inicial e o ponto final de
uma linha de ônibus, retira-se uma amostra de 36 observações (viagens), encontrando-se,
para essa amostra, o tempo médio de 50 minutos e o desvio padrão de 6 minutos, com
distribuição normal. Considerando-se um intervalo de confiança de 95% para o tempo médio
populacional, é correto afirmar que o valor mais próximo para limite inferior desse intervalo é
o tempo de
(A) 40 min. (B) 44 min. (C) 48 min.
(D) 52 min. (E) 56 min.
(36)(UFSCAR 2015) Com relação ao Erro tipo I e tipo II, assinale a alternativa correta.
(A) Hipótese nula é rejeitada quando é verdadeira; Hipótese nula não é rejeitada quando é
falsa.
(B) Hipótese nula não é rejeitada quando é verdadeira; Hipótese nula não é rejeitada quando é
falsa.
(C) Hipótese nula é rejeitada quando é verdadeira; Hipótese nula é rejeitada quando é falsa.
(D) Hipótese nula não é rejeitada quando é verdadeira; Hipótese nula é rejeitada quando é
falsa
(E) Hipótese nula não interfere no Erro.
119
(37)(TRT 3ª R 2015) De uma população normal e de tamanho infinito com o desvio padrão
populacional igual a 4 extrai-se uma amostra aleatória de tamanho 64. Com base nesta
amostra, deseja-se saber, ao nível de significância de 5%, se a média μ desta população é
inferior a 30. Foram formuladas as hipóteses H0: μ = 30 (hipótese nula) e H1: μ < 30
(hipótese alternativa) com utilização das informações da curva normal padrão (Z) que as
probabilidades P(Z > 1,64) = 0,05 e P(Z > 1,28) = 0,10. O menor valor encontrado para a
média amostral ( ) tal que H0 não é rejeitada apresenta um valor igual a
(A) 29,59. (B) 28,36. (C) 28,72.
(D) 29,84. (E) 29,18.
(38)(Detran MT 2015) Uma firma de ônibus coletivos da cidade W coletou informações sobre
as idades (X) e as alturas (Y) de 12 crianças, filhos dos motoristas, a fim de estudar se estas
estavam bem nutridas. A média e o desvio padrão das 12 idades e alturas são,
respectivamente, = 25 meses, SX = 3 meses e = 80 cm, SY = 2,5 centímetros.
Observou-se que a correlação entre as idades e as alturas foi = 0,90. Um modelo de regressão
linear simples da forma Yi = 0 + 1Xi + i foi ajustado. A estimativa de mínimos quadrados
para 0 e 1 é, respectivamente:
(A) 61,25 e 0,75 (B) 61,10 e 0,73 (C) 61,25 e 0,73 (D) 61,10 e 0,75
(39)(TRE RR 2015) considere um estudo com o objetivo de obter a relação entre duas
variáveis X e Y por meio do modelo Y i = α + βXi + ∈i, em que i corresponde à i-ésima
observação de X e Y. Os parâmetros α e β são desconhecidos e ∈i é o erro aleatório com as
respectivas hipóteses consideradas para a regressão linear simples. Com base em 20 pares de
observações (Xi , Yi), i = 1, 2, ..., 20 e utilizando o método dos mínimos quadrados foram
obtidas as estimativas para α e β.
Considerando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que o
valor para X tal que Y = 15 é
(A) 6,0. (B) 10,5. (C) 9,0.
(D) 7,5. (E) 12,0.
(40)(CNMPD 2015) Seja o modelo linear Yi = βXi + εi estabelecendo uma relação linear, sem
intercepto, entre duas variáveis X e Y, em que Yi é a variável dependente na observação i, Xi é
a variável explicativa na observação i e εi o erro aleatório com as respectivas hipóteses para a
regressão linear simples. O parâmetro β do modelo é desconhecido e sua estimativa foi obtida
pelo método dos mínimos quadrados com base em 10 pares de observações (Xi , Yi).
Considerando a equação da reta obtida pelo método dos mínimos quadrados, obtém-se que Y
é igual a 24 quando X for igual a
(A) 15. (B) 6. (C) 16.
(D) 18. (E) 20.
120
Gabarito:
01)B 02)A 03)D 04)E 05)D 06)D 07)B 08)C 09)D 10)C 11)A 12)C 13)B 14)D
15)B 16)B 17)B 18)C 19)A 20)A 21)B 22)C 23)D 24)E 25)B 26)B 27)C 28)A
29)E 30)C 31)D 32)B 33)C 34)C 35)E 36)A 37)E 38)A 39)C 40)A
TABELAS
121
122
123
124
t- Student
125