Você está na página 1de 125

1ª PARTE

MEDIDAS DE POSIÇÃO E DISPERSÃO

Medidas de Tendência Central ou de Posição – são valores da variável que tendem a


estar no centro da série, por isso o nome. Refere-se ao valor da variável que está, senão no
centro, perto dele. Está dividida em três tipos: média; mediana; moda.

a) Média : Em termos de denominação a média aritmética é denotada como:


para média dos dados de uma amostra μ para média dos dados de uma população

Para calcular a média aritmética de dados brutos use a fórmula

Considere um conjunto com n dados X1 , X2 , ... , Xn e f1 , f2 , ... , fn as suas respectivas


freqüências, a média ponderada, ou média das freqüências, será dada por :

Obs.: se os dados estiverem agrupados em classes utilizaremos os pontos médios ( PM ) de


cada classe, que serão calculados pela média simples entre os limites inferior e superior da
classe.

Propriedades da Média:
a) Multiplicando todos os valores por uma constante, sua média ficará multiplicada por essa
constante.
b) Dividindo todos os valores por uma constante, sua média ficará dividida por essa constante.
c) Somando ou subtraindo uma constante a todos os valores a sua média ficará somada ou
subtraída da mesma constante.

1
b) Mediana: é o termo do meio em um conjunto ordenado, ou seja, a mediana divide um
conjunto ordenado e duas partes iguais, 50% inferiores a ela e 50% superiores a ela. Note que
a mediana pode ou não pertencer ao conjunto.
No cálculo da mediana de um conjunto discreto, ou seja, em rol ou tabular, temos que
considerar dois casos :

(1o) Número de dados Ímpar(n é ímpar) : iremos ordenar o conjunto, neste caso a
mediana será igual ao valor que ocupa a posição central, esta posição central será dada por

Ex. : Calcule a mediana do conjunto { 7, 1, 5, 2, 3, 1, 6 }.

Ordenando teremos { 1, 1, 2, 3, 5, 6, 7 }, n = 7 logo , a mediana será

o valor que estará na 4ª posição, ou seja, Md = 3 .

(2º ) Número de dados Par( n é par) : iremos ordenar o conjunto, neste caso teremos
duas posições centrais, 1ª P.C. e 2ª P.C. , a mediana será a média simples entre os valores
que ocupam as duas posições centrais. Estas posições centrais são dadas por

Ex.: Calcule a mediana do conjunto { 1, 2, 1, 1, 4, 5, 3, 6 } .


Ordenando teremos { 1, 1, 1, 2, 3, 4, 5, 6 }, n = 8 logo

, a mediana será a média simples

entre os valores que ocupam a 4ª e 5ª posições, ou seja, 2 e 3 respectivamente, logo

Quando os dados estiverem agrupados em intervalos de classes poderemos calcular a


mediana de duas formas, que na verdade se equivalem :

(1ª ) Utilizando a relação : , l inf é o limite inferior da

classe da mediana, n é o somatório das freqüências simples, F acum. ant. é a freqüência


acumulada da classe anterior a classe da mediana, f Md é a freqüência simples da classe da
mediana e h é a amplitude do intervalo de classe da mediana.

(2ª ) Utilizando a interpolação linear : vamos usar regra de três, no caso de intervalo de
classe basta usarmos a fórmula da mediana.

2
Ex.: (IBGE/2010) A tabela abaixo apresenta a distribuição de frequências das idades de um
grupo de crianças.

A mediana da distribuição de frequências apresentada é


a) 5,5 b) 5,6 c) 5,7 d) 5,8 e) 5,9
SOLUÇÃO
Iremos resolver usando a Interpolação Linear, depois usaremos a fórmula da mediana, e
para tal iremos proceder da seguinte forma:
1º) Veja se as freqüências são simples, se forem acumuladas você terá que transformar para
simples, nesse caso as freqüências são simples e sua soma dará n = 20.
2º) Divida n por 2 obtendo 20:2 = 10, ou seja, a mediana estará na 10ª “ posição “, na 1ª e
na 2ª classes temos um total de 7 posições, 2 + 5 = 7, logo a mediana estará na 3ª classe, ou
seja, a classe da mediana é a 3ª , cujos limites do intervalo são 4 e 6 .
3º) A mediana está na 10ª “ posição “, na 1ª e na 2ª classes temos um total de 7 posições,
logo para a 3ª classe sobram 3 posições, 10 – 7 = 3, faremos uma regra de três da seguinte
forma:
“ a amplitude do intervalo da classe da mediana está para a sua freqüência simples
assim como x está para as posições que sobram para a classe da mediana “

A mediana será o limite inferior da classe da mediana adicionado ao x


( Md = l inf + x ) . Parece complicado, mas só parece, vejamos como aplicar:

a amplitude do intervalo da classe da mediana( 2 ) está para a sua freqüência simples( 4 )


assim como x está para as posições que sobram para a classe da mediana( 3 ) 

, logo a mediana será Md = 4 + 1,5 = 5,5 .

Agora, utilizando a fórmula teremos :

- Veja se as freqüências são simples, se forem acumuladas você terá que transformar para
simples

- aplicando a fórmula teremos : . Opção A.

3
(c) Moda : é o valor que possui a maior freqüência no conjunto, na verdade poderemos ter
mais de uma moda( unimodal ), duas modas( bimodal ) ou nenhuma moda( amodal ). A
moda sempre pertencerá ao conjunto. Quando os dados estiverem agrupados em
intervalos de classes , a classe que possuir a maior freqüência será a classe modal,
poderemos calcular a moda de quatro formas :

(1a) Moda de King: o cálculo da moda leva em conta a influência das classes adjacentes à
classe modal,
"deslocando" a moda em direção a aquelas. A fórmula para cálculo da moda de King é:

onde

linf é o limite inferior da classe modal


h é a amplitude da classe
fpost é a freqüência da classe imediatamente posterior à classe modal
fant é a freqüência da classe imediatamente anterior classe modal

(2a) Moda de Czuber: o cálculo da moda de Czuber leva em conta não somente a influência
das classes adjacentes à modal, mas também a própria freqüência modal, lembramos que as
freqüências terão que ser simples. A fórmula para cálculo da moda de Czuber é:

onde

é o limite inferior da classe modal

h é a amplitude da classe modal

é a diferença entre a freqüência simples da classe modal e a freqüência simples da classe

anterior a classe modal.

é a diferença entre a freqüência simples da classe modal e a freqüência simples da classe

posterior a classe modal.

ATENÇÃO: Cálculo da Moda

(1ª) Quando os intervalos de classes possuírem amplitudes diferentes, a classe modal será
aquela que possuir a maior densidade de freqüência , que é calculada pela razão entre a
frequência e a amplitude de cada classe.

(2ª) A moda calculada pelo método de Czuber possui algumas limitações: as amplitudes das
classes têm que ser iguais, a classe modal não pode ser a classe extrema( a 1ª e a última
classes da distribuição) e a distribuição terá que ser unimodal.

4
(d) Quartis : Dado um conjunto ordenado (ordem crescente), os quartis, que denotamos por
Q1, Q2 e Q3, são quantidades numéricas caracterizadas pelo fato de 25%, 50% e 75% das
observações, respectivamente, serem menores ou iguais a elas, os quartis dividem o conjunto
em quatro partes iguais!

Observe com muita atenção que o Q2 divide a distribuição em duas partes iguais, Q1 divide a
1ª parte determinada pela mediana em duas partes iguais e Q3 divide a 2ª parte determinada
pela mediana em duas partes iguais, ou seja Q1 é a mediana da 1ª parte e Q3 é a
mediana da 2ª parte. Legal, não é?

ATENÇÃO!!! Medidas de Assimetria: As medidas de assimetria possibilitam analisar uma


distribuição de acordo com as relações entre suas medidas de moda, média e mediana. Note
que a mediana está sempre no meio.

O sinal de igual foi colocado na assimétrica positiva e negativa, pois das três medidas duas
poderão ser iguais, se as três forem iguais teremos uma simétrica.

(e) Diagramas de Ramos e Folhas: é uma representação de dados em que a parte das
dezenas(RAMOS) é separada da parte das unidades (FOLHAS). Vejamos o exemplo abaixo:

Ex.: Sejam os dados { 34, 38, 42, 42, 45, 47, 51, 52, 54, 57, 58, 58, 59, 60, 61, 63, 65, 65,
66, 67, 68, 69, 69, 70, 71, 71, 72, 73, 73, 74, 75, 75, 76, 76, 77, 79, 81, 81, 82, 83, 83, 84,
84, 85, 87 } podemos representar da seguinte forma :

RAMOS FOLHAS
3 48
4 2257
5 1247889
6 0135567899
7 0112334556679
8 112334457

5
Se tivermos o diagrama de Ramos e Folhas podemos identificar os dados, iremos proceder
como segue:

Note que no 3º ramo os dados são representados mas não em ordem, por isso temos que
ordenar, pois a ordem é muito importante para o cálculo da mediana, de uma forma geral os
dados serão representados em ordem crescente.
Estas representações serão muito úteis no cálculo das medidas de posição e de dispersão.

Medidas de Dispersão: duas ou mais distribuições podem possuir as mesmas medidas de


posição e serem completamente diferentes, pois, os seus elementos podem estar mais ou
menos dispersos, ou seja, quando se escolhe uma medida de posição para representar a
distribuição a sua variabilidade fica oculta. A dispersão é a tendência dos dados de se
espalharem em torno de uma medida de posição, geralmente a média, ou seja, o quanto um
conjunto de dados é homogêneo ou heterogêneo. As medidas mais comuns de dispersão são:

1º ) Dispersão Absoluta: a amplitude, desvio médio, a variância e o desvio padrão


2º ) Dispersão Relativa: variância relativa e o coeficiente de variação.

Amplitude: é a diferença entre o maior e o menor valor da distribuição. Se tivermos um


intervalo de classe podemos calcular a amplitude da classe, como vimos anteriormente. Note
que a amplitude é uma medida de dispersão “ fraca “, pois leva em consideração apenas os
extremos.

Desvio médio: o desvio absoluto( d ) é o módulo da diferença entre cada elemento do


conjunto e a média da distribuição. O desvio médio( Dm ) é a média entre os desvios
absolutos. Se tivermos n dados X1, X2, X3, . . . , Xn com média , teremos:

, este n é a quantidade de dados.

6
Se tivermos freqüências teremos , agora se a distribuição for

com intervalos de classe iremos utilizar os pontos médios das classes

, neste caso n = Σ f i.

Variância e Desvio Padrão: a variância é obtida pelo cálculo da média dos quadrados dos
desvios em relação à média :

, este n é a quantidade de

dados. Genericamente representamos a variância por Var , mas existe diferença se tivermos
analisando uma população ou uma amostra. O desvio-padrão é a raiz quadrada da
variância e também existe diferença entre população e amostra.

Variância : No caso da Estatística Descritiva não faz diferença, na população, representarmos


a média por ou por μ , o mesmo vale para o desvio-padrão.
a) População : a variância é representada por uma letra grega e será σ2 , teremos:

a.1) Dados Brutos : , n é a quantidade

de dados.

a.2) Dados Tabulados : ,

n = Σ fi .

a.3) intervalos de classes : basta substituirmos x i por PM i .

MUITA ATENÇÃO!!! No caso de uma população a variância também poderá ser calculada da

seguinte forma : , ou seja, a variância será a média dos quadrados

menos o quadrado da média , lembrando que a média pode ser também a média com
frequências.
b) Amostra : no caso de uma amostra o grau de liberdade será diferente e neste caso
iremos considerar n – 1 e representar a amostra por uma letra latina que será S2 ,

7
b.1) Dados Brutos : perceba que

fora dos colchetes temos n – 1 e dentro temos n , n é a quantidades de elementos.

b.2) Dados Tabulados :

,
n = Σ fi .

b.3) Intervalos de Classes : basta substituirmos x i por PM i .

MUITA ATENÇÃO MESMO!!! podemos calcular a variância amostral multiplicando a

variância populacional pelo fator de correção de Bessel, logo .

PROPRIEDADES :
1) Multiplicando ou dividindo todos os valores por uma constante, sua Variância ficará
multiplicada ou dividida pelo quadrado da constante.
2) Somando ou subtraindo uma constante a todos os valores , a sua Variância não se altera.

Desvio-Padrão : como foi dito anteriormente é a raiz quadrada da variância, se tivermos uma
população o desvio-padrão será representado por σ e se tivermos uma amostra será
representado por S, ou sela, iremos utilizar as fórmulas da variância, calculando a raiz
quadrada do resultado teremos o desvio-padrão.

PROPRIEDADES :
1) Multiplicando ou dividindo todos os valores por uma constante, seu Desvio-Padrão ficará
multiplicado ou dividido pela constante.
2) Somando ou subtraindo todos os valores por uma constante, o seu Desvio-Padrão não se
altera.

Não se preocupe, iremos resolver questões para mostrarmos a aplicação, lembre-se


“ parece complicado, mas só parece “ .

Ex.: (IBGE/2010) No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas
durações, em minutos, estão apresentadas no rol abaixo.
5 2 11 8 3 8 7 4
O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é
a) 3,1 b) 2,8 c) 2,5 d) 2,2 e) 2,0

8
SOLUÇÃO
Vamos calcular a variância e depois o desvio-padrão,

e utilizando a relação a

variância será :

e o desvio-padrão . Opção B .

Coeficiente de Variação(CV) : O coeficiente de variação é muito útil para a comparação em


termos relativos do grau de concentração em torno da média de séries distintas. Quanto maior
for o CV ( maior do que 50% ) maior será a dispersão,mais heterogênea,será a distribuição e
nesse caso a média passa a ter pouca representação. Quanto menor for o CV ( menor do que
50% ) menor será a dispersão,mais homogênea,será a distribuição e nesse caso a média
passa ater maior representação. O coeficiente de variação é a razão entre o desvio-padrão e a

média, logo no caso de uma população e no caso de amostra. Note que o

Coeficiente de Variação é adimensional (não tem dimensão), não sendo expresso em nenhuma
unidade de medida. Ele estabelece uma relação entre o desvio padrão e a média, sendo
geralmente representado na forma percentual, é por isso que normalmente se multiplica o CV
por 100% .

PROPRIEDADES :
1) Somando-se uma constante positiva a todos os valores de um conjunto de dados, o CV
diminui .
2) Subtraindo-se uma constante positiva a todos os valores de um conjunto de dados, o CV
aumenta.
3) Multiplicando-se ou dividindo-se uma constate positiva a todos os valores de um conjunto
de dados, o CV não se altera.

Ex.:(Senado Federal/2008) O coeficiente de variação amostral (em porcentagem) de um


conjunto de salários é 110%. Se os salários desse conjunto forem reajustados em 20%, o
novo coeficiente de variação amostral será:
a) 110%. b) 112,2%. c) 114,2%. d) 122%. e) 130%.
SOLUÇÃO

9
Questão envolvendo propriedades do Coeficiente de Variação, como os salários serão
reajustados em 20%, cada salário será multiplicado pelo fator 1,2, assim o CV não será
alterado. Opção A.
QUESTÕES RESOLVIDAS

(TRE PI/2009) Para responder às questões de números 01 a 03 considere a tabela abaixo que
mostra a distribuição de salários (em reais) dos funcionários de uma empresa. O valor da
mediana, obtido por interpolação linear, é igual a R$ 2.900,00 e a frequência absoluta simples
do terceiro intervalo de classe, igual a X.

(01) A frequência relativa acumulada crescente até o intervalo de classe em que pertence a
mediana é
a) 80% b) 70% c) 60% d) 50% e) 40%
Solução
Podemos utilizar a regra de três, a interpolação, mas podemos utilizar a fórmula da mediana

, logo assim

. Opção A.

(02) O valor do terceiro quartil, obtido por interpolação linear, é igual a


a) R$ 3.800,00 b) R$ 3.750,00 c) R$ 3.600,00 d) R$ 3.500,00 e) R$ 3.400,00
Solução
São necessários três quartis(Q1, Q2 e Q3) para dividir um conjunto de dados ordenados em
quatro partes iguais.
Q1 : deixa 25% dos elementos abaixo dele.
Q2 : deixa 50% dos elementos abaixo dele e coincide com a mediana.
Q3 : deixa 75% dos elementos abaixo dele.

75% de 200 vale 150 , até a segunda classe temos 60 assim faltam 90 para a terceira classe.
Vamos montar uma regra de três;
1000 -------- 100

10
X -------- 90 X=900 e o terceiro quartil vale 2500 + 900= 3400.

Note que 1000 é a amplitude da terceira classe e 100 a freqüência da terceira classe. Opção E.
(03) Utilizando interpolação linear, tem-se que o número de funcionários que ganham salários
menores ou iguais a R$ 3.700,00 é
a) 165 b) 166 c) 168 d) 170 e) 172
Solução
O valor de 3700 está na quarta classe( seja y a freqüência ) e , menores do que ele , temos
um total de 160, assim o total será 160 + y. Vamos usar regra de três :

1000 ------- 30
200 ------- y y=6 assim 160 + 6= 166 , perceba que 200 é igual à 3700 – 3500. Opção B.

(04)(IBGE/2010) No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas
durações, em minutos, estão apresentadas no rol abaixo.
5 2 11 8 3 8 7 4
O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é
a) 3,1 b) 2,8 c) 2,5 d) 2,2 e) 2,0
Solução
Vamos calcular a variância e depois o desvio-padrão,

e utilizando a relação a

variância será :

e o desvio-padrão . Opção B .

(05)(ARCE/2006) Uma administradora de imóveis realizou um estudo sobre todos os imóveis


alugados em duas regiões, A e B, levantando o seguinte quadro:

Observação: Dada uma seqüência de números, o coeficiente de variação é definido como


sendo o quociente da divisão do desvio padrão desta seqüência pela respectiva média
aritmética (diferente de zero). A variância conjunta de A e B, isto é, a variância dos valores
dos aluguéis das regiões A e B reunidas é, em (R$)2 igual a
a))20.000,00 b) 25.000,00 c) 32.500,00 d) 40.000,00 e) 62.500,00

11
Solução
Pelo CV vamos descobrir as variâncias e como as médias são iguais, a variância conjunta é a
média ponderada entre as variâncias, os pesos serão as quantidades de elementos.
CV(A) = DP(A)/500 = 0,2  DP(A) = 100  Var A = 10.000
CV(B) = DP(B)/500 = 0,3  DP(B) = 150  Var B = 22.500

. Opção A .

(06)(ANS 2007) O histograma abaixo representa a distribuição das idades dos pacientes
atendidos no ano de 2000 em uma clínica infantil, expressa em anos.

A idade que separa os 30% mais jovens é


(A) 3,5 (B) 4,2 (C) 4,4 (D) 4,6 (E) 5,0
Solução
Faltam 12% para a segunda classe,vamos utilizar uma regra de três da seguinte forma:
2 -------- 40%
x -------- 12% x=0,6 ,note que o 2 se refere à amplitude da classe, logo 4+0,6=4,6.
Opção D.

(07)(IRB 2004) A questão abaixo diz respeito à distribuição de freqüências conforme o quadro
abaixo, no qual não existem observações coincidentes com os extremos das classes.

Assinale a opção que corresponde à estimativa, via interpolação da ogiva, do número de


observações menores ou iguais ao Valor 164.
a) 46 b) 26 c) 72 d) 35 e) 20
Solução
Ogivas são gráficos de frequência acumulada , interpolar significa colocar entre. Serão pedidos
valores que estarão entre os limites de uma dada classe e iremos resolver com uma regra de
três. Note que na quarta classe temos uma freqüência simples de 20 para uma amplitude de

12
10.Basta calcularmos qual a freqüência para uma amplitude de 4,5( 164 – 159,5= 4,5)
utilizando uma regra de três;
20 ------- 10
X ------- 4,5 logo x = 9 . Como já temos 26 anteriormente: 26+9= 35. Opção D
(ICMS SP 2009) Para resolver às questões de números 08 e 09, considere a tabela de
frequências relativas abaixo, que mostra a distribuição dos valores arrecadados, em 2008,
sobre determinado tributo, referente a um ramo de atividade escolhido para análise. Sabe-se
que:
I. As frequências absolutas correspondem às quantidades de recolhimentos, sendo as
frequências relativas do segundo e terceiro intervalos de classe iguais a x e y,
respectivamente.
II. A média aritmética da distribuição, valor arrecadado por recolhimento, é igual a R$
3.350,00 (valor encontrado considerando que todos os valores incluídos num certo intervalo de
classe são coincidentes com o ponto médio deste intervalo).

(08) A porcentagem de recolhimentos com valores arrecadados maiores ou iguais a R$


3.000,00 é
(A) 70% (B) 65% (C) 55% (D) 45% (E) 40%
Solução
Vamos calcular os valores de x e y pela média de frequência, mas como temos intervalo de
classe iremos utilizar os pontos médios de cada classe.

que nos dá

14.y + 10.x = 7 e resolvendo o sistema com x + y = 0,6( pois a soma de todas as freqüências
vale 1,0) encontramos x = 0,35 e y = 0,25.Maiores ou igual a 3000,00 temos: 0,25 + 0,20 +
0,10 = 0,55 = 55% . Opção C.

(09) Utilizando o método da interpolação linear, tem-se que o valor da respectiva mediana é
(A) R$ 3.120,00 (B) R$ 3.200,00 (C) R$ 3.400,00
(D) R$ 3.600,00 (E) R$ 3.800,00
Solução
Até a segunda classe temos 0,45 , com isso faltam 0,05 para a terceira classe. Usando regra
de três temos:
1000 ------- 0,25

13
X ------- 0,05 X= 200 , então 3000 + 200= 3200 . Opção B.

(TRE PI 2009)
(10) O diagrama de ramo e folhas abaixo corresponde às observações das idades de 50
eleitores escolhidos aleatoriamente em uma determinada zona eleitoral:

O valor do módulo da diferença entre a mediana e a moda destas idades observadas é


(A) 0 (B) 3 (C) 10 (D) 14 (E) 16
Solução
Questão envolvendo a Diagrama de Ramos e Folhas, basta lembrar que os valores
(1, 2, 3, 4, 5, 6, 7 ) são os ramos e os outros algarismos as folhas,vamos unir cada ramo com
as suas folhas, por exemplo, o ramo 1 está ligado com 8 folhas,o ramo 2 está ligado com 13
folhas e assim sucessivamente.

Cuidado , pois, as folhas podem ou não estar em ordem. No caso acima tivemos que ordenar
as folhas do ramo 3. Como temos 50 idades( o valor é par ) a mediana será a média simples

entre a 25a e a 26a idades ,logo .A moda será o 46, assim Mo=46. Logo

.Opção D.

(11) Numa pesquisa realizada em 160 domicílios de uma cidade obteve-se o seguinte gráfico
em que o eixo y representa a quantidade de domicílios e o eixo horizontal representa o
número de eleitores verificado por domicílio.

14
Com relação à média aritmética (Me), número de eleitores por domicílio, a mediana (Md) e a
moda (Mo) correspondentes tem-se que:
(A) Me =Md e Md <Mo (B) Me <Md <Mo (C) Me <Md e Md >Mo
(D) Me <Md e Md=Mo (E) Me>Md e Md =Mo
Solução
A moda será 2, Mo=2. Temos 160 domicílios a mediana será a média simples entre o 80o e o
81o ,vemos que ambos valem 3,assim Md=3.Para o cálculo da média utilizaremos a média das
freqüências,

.Opção C.

(12)(INFRAERO 2009) Um levantamento realizado em um clube com relação à quantidade de


filhos de seus associados forneceu a seguinte distribuição de frequências:

A média aritmética (quantidade de filhos por sócio), a mediana e a moda correspondentes a


essa distribuição são, respectivamente,
(A) 1,03; 1,00 e 1,00 (B) 1,03; 1,00 e 0,00 (C) 1,00; 0,50 e 0,00
(D) 1,00; 1,00 e 1,00 (E) 1,03; 1,50 e 1,00
Solução
A moda é zero , Mo= 0. Como temos 1000 sócios a mediana será a média simples entre a
quantidade de filhos do 500o e 501o,na distribuição vemos que cada um vale 1, Md= 1.Com
estas informações já podemos marcar a resposta correta,a média pode ser calculada como
fizemos em questões anteriores.Opção B.

(13) ( PETROBRAS 2005) A tabela apresenta uma distribuição hipotética de freqüência do


número de anos trabalhados, em uma amostra de 100 aposentados.

15
A distribuição:
(A) é simétrica. (B) é assimétrica à esquerda. (C) é assimétrica à direita.
(D) tem moda menor que a média. (E) tem moda igual à média.

Solução
Vamos calcular a média , a moda e a mediana.

. Vamos calcular a moda pela fórmula de Czuber.

. Vamos calcular a mediana.

. Assim . Opção B. Agora, observando o

desenvolvimento das freqüências concluímos que é uma assimétrica à esquerda.

(14)(ICMS RS 2009) Os salários dos funcionários da empresa AMJ, em setembro de 2009, em


reais tem media de 2.000,00 e desvio padrão de 400,00. A empresa oferece 5 propostas de
reajuste, P1, ....P5, para todos os funcionários, em outubro de 2009, a saber:
P1: reajuste de 20% mais um fixo de 100.
P2: reajuste de 25%.
P3: reajuste de 15% mais um fixo de 200.
P4: reajuste de 10% mais um fixo de 300.
P5: um valor fixo de 500.
A proposta de menor coeficiente de variação é:
a) P1 b) P2 c) P3 d) P4 e) P5
Solução
Uma questão envolvendo propriedades.
P1: reajuste de 20% mais um fixo de 100. Com isso a média passa a ser 2500, o dp=480 e o
CV=19,2%.
P2: reajuste de 25%. Teremos média igual a 2500, o dp=500 e o CV=20%

16
P3: reajuste de 15% mais um fixo de 200. A média será 2500, o dp=460 e o CV=18,4%.
P4: reajuste de 10% mais um fixo de 300. A média será 2500, o dp=440 e o CV=17,6%.
P5: um valor fixo de 500. A média será 2500, o dp=400 e o CV=16%. Opção E.

QUESTÕES DE CONCURSOS

(01)(BNDES 2010) Dez mulheres adultas foram submetidas a uma pesquisa.


A cada uma delas perguntou-se: “Quantos filhos você tem?”. O entrevistador foi anotando
cada uma das respostas na ordem em que foram obtidas. No entanto, devido à pressa,
esqueceu-se de registrar uma das respostas. A listagem abaixo reproduz as respostas dadas,
na ordem em que foram registradas.
2 0 3 1 1 0 1 4 1
A partir das informações acima, analise as afirmativas a seguir.
I - A moda das quantidades de filhos dessas dez mulheres independe da resposta não
registrada.
II - A mediana das quantidades de filhos dessas dez mulheres depende da resposta não
registrada.
III - A média das quantidades de filhos dessas dez mulheres independe da resposta não
registrada.
Está correto APENAS o que se afirma em
(A) I.
(B) II.
(C) III.
(D) I e II.
(E) II e III.

(02)(BNDES 2010) Em uma pesquisa de preços de determinado produto, foram obtidos os


valores, em reais, de uma amostra aleatória colhida em 6 estabelecimentos que o
comercializam.

17
A variância dessa amostra é
(A) 1,50
(B) 1,75
(C) 2,00
(D) 2,25
(E) 2,50

(03)(PETROBRAS 2010) As notas finais dos alunos de determinado curso estão


representadas no gráfico abaixo.

A média da turma foi, aproximadamente,


(A) 5,8
(B) 6,0
(C) 6,2
(D) 6,4
(E) 6,6

(04)(PETROBRAS 2010) O rendimento, em óleo, de algumas espécies de oleaginosas com


potencial para a produção de biodiesel, é apresentado na tabela abaixo.

A moda e a mediana do conjunto de dados dessa tabela são, respectivamente,


(A) 0,80 e 0,85
(B) 0,80 e 0,90
(C) 0,80 e 0,93
(D) 0,85 e 0,90
(E) 0,85 e 0,93

18
(05)(PETROBRAS 2010) O gráfico abaixo apresenta os percentuais de acerto dos candidatos do
concurso Z ao responderem às 5 questões de uma prova, todas de múltipla escolha.

A moda dessa distribuição é


(A) 1
(B) 2
(C) 3
(D) 4
(E) 5

(06)(BNDES 2009) Mariana fez sete ligações de seu aparelho celular. Os tempos, em minutos,
de cada ligação, estão relacionados a seguir:
30; 15; 7; 20; 35; 25; 15
Sejam a, b e c, respectivamente, os tempos médio, modal e mediano do rol de tempos
apresentado. É correto afirmar que
(A) a < b < c
(B) a < c < b
(C) b < a < c
(D) b < c < a
(E) c < a < b

(BNDES 2008) O enunciado abaixo refere-se às questões 07 e 08.


Um grupo é formado por 10 pessoas, cujas idades são:
17 19 19 20 20 20 20 21 22 22

(07) Seja μ a média aritmética das idades e σ seu desvio padrão. O número de pessoas desse
grupo cujas idades pertencem ao intervalo [μ – σ , μ + σ ] é
(Considere )
(A) 9
(B) 8
(C) 7
(D) 6
(E) 5

19
(08) Escolhendo-se, aleatoriamente, uma pessoa do grupo, qual a probabilidade de que sua
idade seja maior do que a moda?
(A) 30%
(B) 25%
(C) 20%
(D) 15%
(E) 10%

(09)(BNDES/2011) A distribuição de frequências de uma certa amostra é representada no


gráfico abaixo.

Sobre a média μ, a mediana m e a moda M dessa amostra, tem-se


(A) m < μ < M
(B) m < M < μ
(C) μ < M < m
(D) M < μ < m
(E) M < m < μ

(10)(ICMS PA/2010) Os dados a seguir são as quantidades de empregados de cinco pequenas


empresas: 6, 5, 8, 5, 6.
A variância da quantidade de empregados dessas cinco empresas é igual a:
a) 0,8.
b) 1,2.
c) 1,6.
d) 2,0.
e) 2,4.

(11)(IRB/2007) Considere o seguinte diagrama de ramos-e-folhas:

20
A média, a mediana e a moda desse conjunto de dados são, respectivamente:

a) 47, 45, 45.


b) 47, 47, 45.
c) 47, 46, 45.
d) 45, 45, 45.

(12)(INVEST RIO ADMINISTRADOR/2010) As notas de nove alunos em uma prova de


administração estão apresentadas a seguir: 73 – 74 – 77 – 52 – 85 – 59 – 73 – 84 – 92.
Determine a mediana e os dois quartis.
a) 74,3 – 66 – 84,5
b) 85 – 76 – 79
c) 74 – 66 – 84,5
d) 74,3 – 55,5 – 88,5
e) 74 – 55,5 – 88,5
(13)(AFRE AP/2010) Os dados a seguir são as quantidades de empregados de cinco pequenas
empresas: 6, 5, 8, 5, 6. A variância da quantidade de empregados dessas cinco empresas é
igual a:
a) 0,8.
b) 1,2.
c) 1,6.
d) 2,0.
e) 2,4.

(14)(APOG PE/2010) Uma amostra dos registros de dezoito empresas mostrou os seguintes
números de acidentes de trabalho no último mês:
1 0 1 2 1 3 1 1 0 0 0 0 1 1 2 4 0 0
Com base nas informações apresentadas acima, é correto afirmar que
a) o intervalo interquartil foi inferior a 1,2.
b) a mediana do número de acidentes de trabalho no último mês foi igual a zero.
c) a moda da amostra foi igual ou superior a 2.
d) a amplitude dos valores observados na amostra foi igual ou inferior a 3.
e) o número médio de acidentes de trabalho no último mês foi inferior a 0,8.

(15)(ANAC 2007) A amostra a seguir refere-se a sete tempos de vôo, em horas:


10,0 12,0 8,5 5,0 4,5 3,5 5,5

21
A média e a mediana desses tempos de vôo valem, respectivamente, em horas:
(A) 7,0 e 5,0;
(B) 7,5 e 8,5;
(C) 7,0 e 5,5;
(D) 7,5 e 6,0;
(E) 7,5 e 7,0.

(16)(SEEDUC/2010) Pesquisando-se as idades das mães de 25 alunos de uma turma, obteve-


se o diagrama de ramos e folhas.

A mediana dessas idades é igual a:


a) 40 anos
b) 41 anos
c) 43 anos
d) 44 anos
e) 45 anos

(ICMS SP 2009) Para resolver às questões de números 17 e 18, considere a tabela de


frequências relativas abaixo, que mostra a distribuição dos valores arrecadados, em 2008,
sobre determinado tributo, referente a um ramo de atividade escolhido para análise. Sabe-se
que:
I. As frequências absolutas correspondem às quantidades de recolhimentos, sendo as
frequências relativas do segundo e terceiro intervalos de classe iguais a x e y,
respectivamente.
II. A média aritmética da distribuição, valor arrecadado por recolhimento, é igual a R$
3.350,00 (valor encontrado considerando que todos os valores incluídos num certo intervalo de
classe são coincidentes com o ponto médio deste intervalo).

22
(17) A porcentagem de recolhimentos com valores arrecadados maiores ou iguais a R$
3.000,00 é
(A) 70%
(B) 65%
(C) 55%
(D) 45%
(E) 40%

(18) Utilizando o método da interpolação linear, tem-se que o valor da respectiva mediana é
(A) R$ 3.120,00
(B) R$ 3.200,00
(C) R$ 3.400,00
(D) R$ 3.600,00
(E) R$ 3.800,00

(19)(APOFP SP 2009) Determine a mediana das seguintes observações:


17, 12, 9, 23, 14, 6, 3, 18, 42, 25, 18, 12, 34, 5, 17, 20, 7, 8, 21, 13, 31, 24, 9.
a) 13,5
b) 14
c) 17
d) 15,5
e) 14,5

(20)(MPE MG 2007) Considere as três curvas a seguir:

Em relação à média ( x ), à mediana (Md) e moda (Mo), pode-se afirmar que:


a) na curva (i), x > Md > Mo.
b) na curva (i), x = Md < Mo.
c) na curva (ii), x = Md < Mo.
d) na curva (iii), x > Md > Mo.

(21)(PETROBRAS 2005) A variância da lista (1; 1; 2; 4) é igual a:


(A) 0,5
(B) 0,75
(C) 1
(D) 1,25

23
(E) 1,5

(PETROBRAS 2005) O enunciado a seguir refere-se às questões de números 22 e 23.


Distribuição de salários mensais em uma empresa:

(22) Qual é a estimativa, em reais, do salário mediano nessa empresa?


(A) 500,00
(B) 515,00
(C) 525,00
(D) 550,00
(E) 575,00

(23) Qual é a estimativa, em reais, do salário médio nessa empresa?


(A) 500,00
(B) 515,00
(C) 525,00
(D) 550,00
(E) 575,00

(24)(Br Distribuidora 2008) Suponha que os dez números abaixo (entre parênteses) foram
retirados aleatoriamente de uma urna, sucessivamente, mas com reposição
(1, 2, 3, 3, 5, 3, 4, 8, 4, 1)
Nesta amostra, é correto afirmar que o(a)
(A) desvio padrão é igual a 8.
(B) mediana é 8.
(C) média é igual à moda.
(D) média é 1.
(E) moda é 3.

(25)(TRANSPETRO 2006) A mediana da lista (1; 1; 3; 5; 9) vale:


(A) 3,0 (B) 3,4 (C) 3,8
(D) 4,0 (E) 4,5

(26)(BNDES/2004) A tabela abaixo mostra o preço médio, em reais, do litro de gasolina na


região metropolitana do Rio de Janeiro, nos meses de julho a dezembro de 2003.

24
Qual foi, aproximadamente, a mediana dos preços, em reais, do litro de gasolina nesse
período?
(A) 1,991
(B) 1,994
(C) 1,998
(D) 2,002
(E) 2,005

(27)(PETROBRAS 2010) A tabela abaixo apresenta a quantidade média de raios registrados,


por ano, em alguns estados brasileiros. Os dados estão em ordem crescente e aqueles
referentes aos estados de São Paulo e de Minas Gerais estão representados, respectivamente,
pelas letras x e y.

* Cálculo com base no número de raios que caem em cada estado


Revista Veja, 10. fev. 2010.
Se a moda e a mediana dessa tabela são, respectivamente, 2,3 e 3,8, conclui-se que
(A) y = 2,3 (B) y = 3,4 (C) y = 3,8 (D) x = 3,4 (E) x = 3,6

(CESGRANRIO 2010) Considere a amostra de uma variável aleatória, cujos valores estão todos
expressos em uma mesma unidade.
Amostra : 36 38 26 40 40 28 46 40 38 28

(28) Sobre essa amostra, tem-se que


(A) a média é igual à mediana.

25
(B) a média é maior que a moda.
(C) se retirarmos um dos valores da amostra, a média, necessariamente, será alterada.
(D) a mediana é maior que a moda.
(E) a mediana é maior que a média.

(29) Dada a amostra, tem-se que


(A) o desvio padrão é menor que 6.
(B) o desvio padrão é igual a 6.
(C) a variância não será alterada, se retirarmos o valor igual a 36 da amostra.
(D) a variância aumentará, se retirarmos o valor igual a 36 da amostra.
(E) apenas dois valores da amostra estão afastados da média mais do que um desvio padrão.

(30)(PETROBRAS/2011)

No histograma acima, os pontos médios das classes inicial e final são 40 e 80,
respectivamente. Sabendo-se que todas as classes têm a mesma amplitude, a estimativa
adequada para a média e para a mediana dessa distribuição são, respectivamente,
(A) 59,5 e 59,5
(B) 59,5 e 60
(C) 60 e 59
(D) 60 e 59,5
(E) 60 e 60

(31)(PETROBRAS/2011) Analise as afirmativas a seguir sobre o coeficiente de variação.


I – O coeficiente de variação é uma medida de variação relativa.
II – Se uma distribuição é bimodal, então seu coeficiente de variação é zero.
III – O coeficiente de variação tem a mesma unidade que o desvio padrão.
É(São) correta(s) APENAS a(s) afirmativa(s)
(A) I.
(B) II.
(C) III.

26
(D) I e II.
(E) II e III.

(32)(PETROBRAS 2010) Uma loja de conveniência localizada em um posto de combustível


realizou um levantamento sobre o valor das compras realizadas pelos seus clientes. Para tal
tomou uma amostra aleatória de 21 compras, que apresentou, em reais, o seguinte resultado:

A mediana dessa série de observações é


(A) 15,50
(B) 18,00
(C) 18,30
(D) 28,50
(E) 34,00

(33)(PETROBRAS 2010) Uma amostra aleatória da quantidade de litros de combustível


abastecida por 16 carros em um posto de combustível apresentou, em litros, o seguinte
resultado:

A amplitude interquartil dessa série de observações é


(A) 3
(B) 10
(C) 13
(D) 17
(E) 22

(34)(AFC/2008) Seja X uma variável aleatória com média 1 e variância 2. Qual a variância da
variável Y = 2X + 4 ?
a) 2.
b) 4.
c) 6.
d) 8.

27
e)12.

(35)(PETROBRAS 2011)Em uma empresa, todos os funcionários receberam um aumento de


10% nos salários e, posteriormente, ganharam um abono de 100 reais. Sobre a nova média e
a nova variância de salários, em relação à média e à variância iniciais, isto é, antes dos
aumentos, tem-se que a
(A) média e a variância não se alteram.
(B) média não se altera, e a variância fica aumentada em 10%.
(C) média e a variância ficam aumentadas em 10% mais 100 reais.
(D) média fica aumentada em 10% mais 100 reais, e a variância em 10%.
(E) média fica aumentada em 10% mais 100 reais, e a variância em 21%.

(36)(ATRFB 2009) Obtenha o valor mais próximo da variância amostral da seguinte


distribuição de frequências, onde xi representa o i-ésimo valor observado e fi a respectiva
frequência.
xi 5 6 7 8 9
fi 2 6 6 4 3
a) 1,429.
b) 1,225.
c) 1,5.
d) 1,39.
e) 1, 4.

(37)(Transpetro 2011) Um investidor precisa calcular a variância dos lucros de algumas


empresas para auxiliá-lo na caracterização do risco de um investimento. As informações sobre
lucros são fornecidas em reais e, como ele não quer trabalhar com valores muito grandes,
resolveu trabalhar com os números em milhões de reais. A variância obtida com os dados em
milhões de reais é a variância dos dados em reais dividida por
(A) 1012
(B) 109
(C) 106
(D) 103
(E) 100

(38)(Transpetro 2011) Considere as séries estatísticas. X: X1, X2, . . . , Xn com média μX ,


desvio padrão σX , Xi > 1, i = 1, 2,..., n, e σX > 0; Y: Y1, Y2, . . . , Yn com média μY , desvio

padrão σY . Se então

(A) o desvio padrão do conjunto X é igual ao desvio padrão do conjunto Y.


(B) o desvio padrão do conjunto X é igual ao coeficiente de variação do conjunto Y.

28
(C) o desvio padrão do conjunto Y é igual ao coeficiente de variação do conjunto X.
(D) o coeficiente de variação do conjunto Y é igual ao desvio padrão do conjunto X dividido por

(E) o coeficiente de variação do conjunto Y é igual ao coeficiente de variação do conjunto X


dividido por μX
(39)(Transpetro 2011) A tabela a seguir apresenta algumas estatísticas sobre o número de
solicitações à Coordenação de Inspeção, Aceitação e Veto de Navios (COINV) da Transpetro,
em 2009, para uso dos terminais aquaviários da empresa por navios de terceiros, por tipo de
carga nos últimos 5 anos.

Os sinais de x, y, z e w são, respectivamente,


(A) positivo , negativo , negativo e negativo
(B) positivo , negativo , negativo e positivo
(C) positivo , negativo , positivo e negativo
(D) negativo , positivo , positivo e negativo
(E) negativo , negativo , negativo e positivo

GABARITO
(01)A (02)C (03)E (04)A (05)D (06)D (07)C (08)A (09)E (10)B (11)C
(12)C (13)B (14)A (15)C (16)B (17)C (18)B (19)C (20)D (21)E (22)C
(23)B (24)E (25)A (26)B (27)B (28)E (29)D (30)D (31)A (32)B (33)C (34)D
(35)D (36)C (37)A (38)C (39)B

29
NOÇÕES DE PROBABILIDADE

Experimentos Aleatórios: os resultados não serão previsíveis, mesmo que haja um grande
número de repetições do mesmo fenômeno.
Ex.: lançamento de um dado; lançamento de duas moedas; retirada de uma carta de um
baralho completo de 52 cartas; determinação da vida útil de um componente eletrônico.

Espaço Amostral (S): conjunto de todos os resultados possíveis de um experimento


aleatório.

Evento (E): qualquer subconjunto do espaço amostral S de um experimento aleatório.

Definição Clássica de Probabilidade :Dado um experimento aleatório, sendo S o seu


espaço amostral , vamos admitir que todos os elementos de S tenham a mesma chance de
acontecer, ou seja, que S é um conjunto equiprovável.

Evento Complementar:O complemento de um evento A é, portanto, o evento contendo


todos os resultados no espaço amostral S que não pertençam a A:

Ex.: (APOFP SP/2010) O total de funcionários em uma repartição pública é igual a 6. João e
sua esposa trabalham nesta repartição em que será formada uma comissão de 3 funcionários
escolhidos aleatoriamente. A probabilidade de que no máximo um deles, João ou sua esposa,
faça parte da comissão é
a) 1/5 b) 2/5 c) 3/5 d) 4/5 e) 3/10
SOLUÇÃO
Nós temos 6 pessoas , de todas as comissões com 3 pessoas pede-se a probabilidade de que
no máximo um deles, João ou Maria, faça parte da comissão.
casos favoráveis : “ no máximo um deles, João ou Maria “ significa com João sem Maria ou
com Maria sem João ou sem os dois ,

30
1º ) com João sem Maria : temos 6 pessoas para uma comissão com 3, o joão já está a

Maria não, logo sobram 4 pessoas para escolhermos 2 pessoas  casos .

2º ) com Maria sem João : mesmo raciocínio anterior  casos .

3º ) sem João e sem Maria : das 6 pessoas ficam 4 pessoas e serão escolhidas 3 das 4 

casos . Logo um total de 6 + 6 + 4 = 16 casos favoráveis.

casos possíveis : todas as comissões com 3 pessoas  casos .

Usando a definição teremos P = 16/20 = 4/5 . Opção D .

Teorema da Soma : dado dois eventos A e B, a probabilidade de pelo menos um deles


ocorrer é igual a soma das probabilidades de cada um menos a probabilidade de ambos
ocorrerem simultaneamente, ou seja:
P(A ou B)=P(A  B) = P(A) + P(B) − P(A  B). Se A e B forem mutuamente exclusivos,
teremos P(A  B) = 0. Assim, P(A  B) = P(A) + P(B).
Obs.:
P(A  B  C) = P(A) + P(B) + P(C) – P(A  B) – P(A  C) – P(B  C) + P(A  B  C)

Ex.:(MPOG/2010) Em uma urna existem 200 bolas misturadas, diferindo apenas na cor e na
numeração. As bolas azuis estão numeradas de 1 a 50, as bolas amarelas estão numeradas de
51 a 150 e as bolas vermelhas estão numeradas de 151 a 200. Ao se retirar da urna três bolas
escolhidas ao acaso, com reposição, qual a probabilidade de as três bolas serem da mesma cor
e com os respectivos números pares?
a) 10/512. b) 3/512 c) 4/128. d) 3/64. e) 1/64.
SOLUÇÃO
Temos 50 bolas azuis( 1 a 50 ) , 100 bolas amarelas( 51 a 150 ) e 50 bolas vermelhas(151 a
200 ). Vamos atentar para alguns detalhes:
1ª ) as três bolas são da mesma cor podendo ser ou azuis ou amarelas ou vermelhas,
2ª ) com reposição, ou seja, a bola retirada volta para o espaço amostral
3ª ) cada bola terá além da cor um número par

A probabilidade de uma bola ser azul e ter numeração par = 25/200 = 1/8 , lembre-se de que
as azuis são numeradas de 1 a 50 tendo 25 pares e 25 ímpares, como temos reposição a
probabilidade das três serem azuis e pares = 1/8.1/8.1/8 = 1/512.

A probabilidade de uma bola ser amarela e ter numeração par = 50/200 = 1/4 lembre-se de
que as amarelas são numeradas de 51 a 150 tendo 50 pares e 50 ímpares, como temos
reposição a probabilidade das três serem amarelas e pares = 1/4.1/4.1/4 = 1/64.

31
A probabilidade de uma bola ser vermelha e ter numeração par = 25/200 = 1/8 , lembre-se de
que as vermelhas são numeradas de 151 a 200 tendo 25 pares e 25 ímpares, como temos
reposição a probabilidade das três serem vermelhas e pares = 1/8.1/8.1/8 = 1/512.

Logo a probabilidade total será . Opção A .

Probabilidade Condicional : existem situações em que a chance de um particular evento


acontecer depende do resultado de outro evento. A probabilidade condicional de A dado que
ocorreu B pode ser determinada dividindo-se a probabilidade de ocorrência de ambos os
eventos A e B pela probabilidade do evento B (note que haverá uma redução do espaço

amostral ); como se mostra a seguir:

Eventos Independentes : suponha que dois eventos A e B ocorram independentes um do


outro no sentido que a ocorrência ou não de um deles tenha nenhuma relação, e nenhuma
influência na ocorrência ou na não ocorrência do outro. Nessas condições
P(A e B)=P(A  B) = P(A). P(B).

OBS.: Eventos Mutuamente Exclusivos : dois ou mais eventos em que aocorrência de um


deles exclui a ocorrência dos outros,ou seja,não podem ocorrer ao mesmo tempo.

Ex.: (SEBRAE/2010) Sejam dois eventos A e B associados a um experimento. Sendo P(A) =


0,4, P(B) = p e P(A  B) = 0,7, analise as afirmativas:
I. Se os eventos forem mutuamente exclusivos, p = 0,3.
II. Se os eventos forem independentes, p = 0,5.
Assinale a alternativa correta:
a) apenas a afirmativa I está correta. b) apenas a afirmativa II está correta.
c) ambas afirmativas estão corretas. d) nenhuma afirmativa está correta.
e) não é possível determinar a probabilidade p.
SOLUÇÃO
Vamos analisar as afirmativas:
I. eventos mutuamente exclusivos: P(A  B) = P(A) + P(B)  0,7 = 0,4 + p 
p = 0,3, correto.
II. eventos independentes: P(A  B) = P(A). P(B)  P(A  B) = 0,4 . p , mas como temos
P(A  B) = P(A) + P(B) − P(A  B)  0,7 = 0,4 + p – 0,4.p  p = 0,5, correto. Opção C .

Ex.: (ANVISA/2010) Sejam P e H dois eventos independentes com P( P ) = 0,5 e


P( P  H ) = 0,2. Desse modo, P( H ) pode ser expresso por

32
a) 1/10 b) 3/10 c) 4/10 d) 7/10 e) 10/10
SOLUÇÃO
Como os eventos são independentes temos P( P  H ) = P( P ) . P( H ) , logo 0,2 = 0,5 .
P( H )  P( H ) = 4/10 . Opção C .

Teorema de Bayes: Se temos as probabilidades condicionais de um evento B dados todos


os eventos do tipo Ai , (i = 1, 2,..., n) e queremos encontrar a probabilidade condicional de um
certo evento Aj dado B ( espaço amostral ), esta será dada por

Ex.: (TRE PI/2009) Três candidatos, A, B e C, disputam as próximas eleições para o Governo
do Estado. A, B e C têm respectivamente 30%, 38% e 32% da preferência do eleitorado. Em
sendo eleito, a probabilidade de dar prioridade para a Educação é de 30%, 50% e 40%, para
os candidatos A, B e C, respectivamente. A probabilidade da Educação não ser priorizada no
próximo governo é dada por
a) 0,446 b) 0,554 c) 0,592 d) 0,644 e) 0,652
SOLUÇÃO
Bem, a educação pode não ser priorizada por A ou por B ou por C , logo teremos :

A ( 30% ) : não priorizada : 70%  0,3 . 0,7 = 0,21


priorizada : 30%

B ( 38% ) : não priorizada : 50%  0,38 . 0,5 = 0,19


Priorizada : 50%

C ( 32% ) : não priorizada : 60%  0,32 . 0,6 = 0,192


priorizada : 40%

Logo , P (A ou por B ou por C ) = 0,21 + 0,19 + 0,192 = 0,592 . Opção C .

Ex.: (MPU/2004) Carlos diariamente almoça um prato de sopa no mesmo restaurante. A sopa
é feita de forma aleatória por um dos três cozinheiros que lá trabalham: 40% das vezes a sopa
é feita por João; 40% das vezes por José, e 20% das vezes por Maria. João salga demais a
sopa 10% das vezes, José o faz em 5% das vezes e Maria 20% das vezes. Como de costume,
um dia qualquer Carlos pede a sopa e, ao experimentá-la, verifica que está salgada demais. A
probabilidade de que essa sopa tenha sido feita por José é igual a

33
a) 0,15. b) 0,25. c) 0,30. d) 0,20. e) 0,40
SOLUÇÃO
Perceba que a probabilidade é condicional, pois a questão diz que a sopa está salgada e quer
saber a probabilidade de ter sido feita por José. Vamos proceder da seguinte forma:

João ( 40% ) : salgada : 10%  0,4 . 0,1 = 0,04


não salgada : 90%

José ( 40% ) : salgada : 5%  0,4 . 0,05 = 0,02


não salgada : 95%

Maria ( 20% ) : salgada : 20%  0,2 . 0,2 = 0,04


não salgada : 80%

. Opção D .

QUESTÕES RESOLVIDAS

(01)(AFRE SC/2010) Sejam dois eventos, A e B, mutuamente exclusivos. A probabilidade de


ocorrência de A vale 0,2. A probabilidade de ocorrência de B vale 0,4. Quanto vale a
probabilidade de ocorrência do evento A união B?
(A) 0,08 (B) 0,4 (C) 0,48 (D) 0,52 (E) 0,6
SOLUÇÃO
Temos a probabilidade da “ união “ P(A U B) = P(A) + P(B) − P(A  B), como são
mutuamente exclusivos temos A  B = Ø  P(A  B) = 0, logo P(A U B) = 0,2 + 0,4 – 0 =
0,6 . Opção E .

(02)(ATRFB/2009) Para acessar a sua conta nos caixas eletrônicos de determinado banco, um
correntista deve utilizar sua senha constituída por três letras, não necessariamente distintas,
em determinada seqüência, sendo que as letras usadas são as letras do alfabeto, com exceção
do W, totalizando 25 letras. Essas 25 letras são então distribuídas aleatoriamente, três vezes,
na tela do terminal, por cinco teclas, em grupos de cinco letras por tecla, e, assim, para digitar
sua senha, o correntista deve acionar, a cada vez, a tecla que contém a respectiva letra de sua
senha. Deseja-se saber qual o valor mais próximo da probabilidade de ele apertar
aleatoriamente em seqüência três das cinco teclas à disposição e acertar ao acaso as teclas da
senha?
(A) 0,001. (B) 0,0001. (C) 0,000125. (D) 0,005. (E) 0,008.
SOLUÇÃO

34
Acertar as teclas significa acertar as três letras, ou seja, acertar a 1ª letra e acertar a 2ª letra
e acertar a 3ª letra. Para acertar a 1ª letra ele tem 1 em 5 , a 2ª letra ele tem 1 em 5 e a 3ª
letra ele tem 1 em 5,

logo . Opção E .

(03)(INFRAERO/2009) Para fazer um curso de “Segurança no Trabalho” será escolhido apenas


um dos 200 funcionários de certo setor da INFRAERO e, para tal, cada um deles receberá uma
única senha, numerada de 1 a 200. A probabilidade de sortear-se aleatoriamente uma senha
em que o número nela marcado não contenha o algarismo 3 é
(A) 81% (B) 80,5% (C) 80% (D) 78,5% (E) 78%
SOLUÇÃO
Calculando, no braço, a quantidade de números que contenha o 3 temos : (3, 13, 23, 30, 31,
32, 33, 34, 35, 36, 37, 38, 39, 43, 53, 63, 73, 83, 93, 103, 113, 123, 130, 131, 132,
133, 134, 135, 136, 137, 138, 139, 143, 153, 163, 173, 183, 193) num total de 38, logo
a quantidade de números que não contenha o 3 será 200 – 38 = 162 . Logo

Opção A .

(04)(TJ PA/2009) Uma fábrica produz parafusos utilizando duas máquinas A e B. 60% dos
parafusos são produzidos por A e o restante por B. Sabe-se que 1% dos parafusos produzidos
por A e 2% dos produzidos por B são defeituosos. Então, a probabilidade de um processo de
produção desta fábrica produzir parafusos sem defeito é
(A) 96,4% (B) 97,0% (C) 98,0% (D) 98,2% (E) 98,6%
SOLUÇÃO
Vamos analisar cada máquina e suas probabilidades, as probabilidades de defeito e de sem
defeito. A probabilidade de se produzir parafusos sem defeitos é a probabilidade de ser
produzido por A ou por B.

máquina A ( 60% ) : defeito : 1%


sem defeito : 99%  0,6 . 0,99 = 0,594

máquina B ( 40% ) : defeito : 2%


sem defeito : 98%  0,4 . 0,98 = 0,392

Logo P( A ou B ) = 0,594 + 0,392 = 0,986 = 98,6% . Opção E .

(05)(APO MPOG/2005) Há três moedas em um saco. Apenas uma delas é uma moeda normal,
com “cara” em uma face e “coroa” na outra. As demais são moedas defeituosas. Uma delas
tem “cara” em ambas as faces. A outra tem “coroa” em ambas as faces. Uma moeda é retirada
do saco, ao acaso, e é colocada sobre a mesa sem que se veja qual a face que ficou voltada

35
para baixo. Vê-se que a face voltada para cima é “cara”. Considerando todas estas
informações, a probabilidade de que a face voltada para baixo seja “coroa” é igual a:
a) 1/2 b) 1/3 c) 1/4 d) 2/3 e) 3/4
SOLUÇÃO

É uma probabilidade condicional mas tome cuidado, primeiro você terá que calcular a
probabilidade da moeda ter “ cara “( Ca ) e, tendo Ca, a probabilidade de ter “ coroa “( Co ),
perceba a diferença desta questão com a questão anterior, aqui temos moedas não
normais e cada moeda possui duas opções,ou seja, uma face e outra face . Temos três
moedas uma com Ca e Co, outra com Ca e Ca e uma terceira com Co e Co, podemos
representar da seguinte forma: ( Ca , Co ) , ( Ca , Ca ) e ( Co , Co ), respectivamente, logo:
1º ) a probabilidade da moeda ter “ cara “( Ca ) será de duas moedas em três,
P( ter Ca ) = 2/3 .
2º ) tendo Ca, a probabilidade de ter “ coroa “( Co ) será de uma em duas,
P( ter Co | tem Ca ) = 1/2 .

Com isso temos: . Opção B .

(06)(MPU/2004) Carlos sabe que Ana e Beatriz estão viajando pela Europa. Com as
informações que dispõe, ele estima corretamente que a probabilidade de Ana estar hoje em
Paris é 3/7, que a probabilidade de Beatriz estar hoje em Paris é 2/7, e que a probabilidade de
ambas, Ana e Beatriz, estarem hoje em Paris é 1/7. Carlos, então, recebe um telefonema de
Ana informando que ela está hoje em Paris. Com a informação recebida pelo telefonema de
Ana, Carlos agora estima corretamente que a probabilidade de Beatriz também estar hoje em
Paris é igual a
a) 2/3 b) 1/7 c) 1/3 d) 5/7 e) 4/7
SOLUÇÃO
A questão pode ser representada na figura abaixo, a probabilidade pedida será
P( Beatriz está em Paris | Ana está em Paris ) = ( 1/7 )/( 3/7 ) = 1/3 . Opção C.

(07) Uma clinica especializada trata apenas de três tipos de doentes: dos que sofrem de
problemas cardíacos, dos que tem calculo renal e dos hipertensos. Temos que 50% dos
pacientes que procuram a clinica são cardíacos, 40% são portadores de calculo renal e apenas

36
10% são hipertensos. Os problemas cardíacos são curados em 80% das vezes, os problemas
de calculo renal em 90% das vezes e os hipertensos em 95% das vezes. Um enfermo saiu
curado da clinica. Qual a probabilidade de ele sofresse de calculo renal?
a) 43,1% b) 42,1% c) 45,1% d) 44,1% e) 46,1%
Solução
Temos três problemas : cardíacos( 50% ) , cálculo renal( 40% ) e hipertensos( 10% ), em
cada um dos problemas temos os curados e os não curados. Podemos representar da
seguinte forma:

cardíacos ( 50% ) : curados : 80%  0,50 . 0,80 = 0,40


não curados : 20%

cálculo renal ( 40% ) : curados : 90%  0,40 . 0,90 = 0,36


não curados : 10%

hipertensos ( 10% ) : curados : 95%  0,10 . 0,95 = 0,095


não curados : 5%
Sabendo-se que um enfermo saiu curado , qual a probabilidade de ele sofresse de
cálculo renal, temos aqui uma probabilidade condicional :

Opção B .

(08)(ATA MF/2009) Ao se jogar um determinado dado viciado, a probabilidade de sair o


número 6 é de 20%, enquanto as probabilidades de sair qualquer outro número são iguais
entre si. Ao se jogar este dado duas vezes, qual o valor mais próximo da probabilidade de um
número par sair duas vezes?
a) 20% b) 27% c) 25% d) 23% e) 50%
Solução
Bem, a probabilidade do 6 é P( 6 ) = 20% , para os outros cinco números sobram 80% e
temos P( 1 ) = P( 2 ) = P( 3 ) = P( 4 ) = P( 5 ) = 80%/5 = 16% . Para que tenhamos dois
números pares teremos um par no 1ª e na 2ª jogadas, ou seja,
P( Par e Par ) = P( Par ) . P( Par ) , só que a P( Par ) vale P( 2 ) + P( 4 ) + P( 6 )
P( Par ) = 0,16 + 0,16 + 0,20 = 0,52. P( Par e Par ) = 0,52 . 0,52 = 0,2704 = 27%.

(09)(TRANSPETRO/2006) Uma urna contém 6 bolas brancas e 4 pretas. Sacam-se,


sucessivamente e sem reposição, duas bolas dessa urna. A probabilidade de que ambas sejam
pretas é:
a)2/5 b)6/25 c)1/5 d)4/25 e)2/15
Solução

37
Sem reposição significa que a bola que for retirada não voltará, desta forma o espaço amostral
mudará, a probabilidade de as duas serem pretas significa que a primeira será preta e a
segunda também será preta, logo :

a primeira será preta :

segunda também será preta :

Calculando temos . Opção E .

QUESTÕES DE CONCURSOS

(01)(Banco do Brasil 2010) Em um banco, qualquer funcionário da carreira de Auditor é


formado em pelo menos um dos cursos: Administração, Ciências Contábeis e Economia. Um
levantamento forneceu as informações de que
I. 50% dos Auditores são formados em Administração, 60% são formados em Ciências
Contábeis e 48% são formados em Economia.
II. 20% dos Auditores são formados em Administração e Ciências Contábeis.
III. 10% dos Auditores são formados em Administração e Economia.
IV. 30% dos Auditores são formados em Ciências Contábeis e Economia.
Escolhendo aleatoriamente um Auditor deste banco, a probabilidade de ele ser formado em
pelo menos dois daqueles cursos citados é
(A) 58%
(B) 56%
(C) 54%
(D) 52%
(E) 48%

(02)(PETROBRAS DISTRIBUIDORA/2010) Em uma pesquisa, 8.500 pessoas responderam à


seguinte pergunta: “Existe amizade entre homem e mulher?”. Desse total, 6.035 responderam
“sim, eu até tenho”; 2.040 responderam “não existe” e as demais responderam “sim, mas eu
não tenho”. Escolhendo-se ao acaso uma das pessoas entrevistadas, qual a probabilidade de
que ela tenha respondido “sim, mas eu não tenho”?
(A) 5%
(B) 8%
(C) 12%
(D) 16%
(E) 24%

38
(03)(PETROBRAS/2010) Um dado é viciado de tal forma que a probabilidade de observar-se
um número é proporcional ao seu valor. Qual a probabilidade de um jogador obter o resultado
1?
(A) 1/21
(B) 2/21
(C) 1/7
(D) 4/21
(E) 5/21

(04)(BACEN/2010) A probabilidade de um indivíduo de classe A comprar um automóvel é 3/4.


Para um indivíduo de classe B, essa probabilidade é 1/6, e para um indivíduo de classe C, ela é
de 1/20. A probabilidade de um indivíduo de classe A comprar um Fusca é 1/10, enquanto
que, para um indivíduo de classe B, essa probabilidade é 3/5, e para um indivíduo de classe C,
é de 3/10. Sabendo-se que a revendedora XPTO vendeu um Fusca, a probabilidade de o
comprador pertencer à classe B é
(A) 0,527
(B) 0,502
(C) 0,426
(D) 0,252
(E) 0,197

(05)(ANA/2009) Uma urna possui 5 bolas azuis, 4 vermelhas, 4 amarelas e 2 verdes. Tirando-
se simultaneamente 3 bolas, qual o valor mais próximo da probabilidade de que as 3 bolas
sejam da mesma cor?
a) 11,53%
b) 4,24%
c) 4,50%
d) 5,15%
e) 3,96%

(06)(BNDES/2010) Em uma caixa há 4 balas de mel, 3 balas de tamarindo e 3 balas de anis.


Duas balas serão retiradas aleatoriamente dessa caixa, sucessivamente e sem reposição. Qual
a probabilidade de que, pelo menos, uma das balas seja de mel?
(A) 3/5
(B) 2/5
(C) 2/3
(D) 1/3
(E) 1/2

39
(07)(PETROBRAS/2010) A tabela a seguir apresenta a classificação de 200 pessoas de uma
determinada população, segundo o sexo e o clube de futebol de preferência.

As probabilidades de que uma pessoa escolhida aleatoriamente na população seja


botafoguense e de que um torcedor do Fluminense seja uma mulher, são, respectivamente,
(A) 1/20 e 1/3
(B) 1/20 e 2/3
(C) 1/10 e 1/3
(D) 1/10 e 2/3
(E) 1/5 e 2/3

(08)(PETROBRAS/2010) Um sorteio é realizado com duas urnas, I e II. As urnas são escolhidas
ao acaso. A urna I contém 2 bolas brancas e 6 pretas. A urna II contém 4 bolas brancas e 4
pretas. Se a bola sorteada for branca, qual a probabilidade de ter sido da urna I?
(A) 1/3
(B) 1/4
(C) 1/6
(D) 2/3
(E) 2/5

(09)(PETROBRAS/2010) Andresa tem três pretendentes: André, José e Ricardo. A


probabilidade de que André convide Andresa para um jantar é de 1/4, enquanto que as
mesmas probabilidades para José e Ricardo são 1/3 e 1/2, respectivamente. Caso as
pretensões entre os pretendentes sejam independentes entre si, qual a probabilidade de que
Andresa não seja convidada para um jantar por nenhum de seus pretendentes?
(A) 1/3
(B) 1/4
(C) 1/5
(D) 1/6
(E) 1/7

(10)(PETROBRAS/2010) Numa pesquisa sobre a participação dos pais na criação dos filhos,
realizada pelo site www.veja.com, 71% dos entrevistados eram casados e 79% tinham menos
de 50 anos. Sorteando-se ao acaso um dos entrevistados, a probabilidade de que o escolhido
seja casado e tenha menos de 50 anos será de, no mínimo,
(A) 21%
(B) 29%

40
(C) 35%
(D) 40%
(E) 50%

(11)(EPE/2009) Um dado cúbico com cada uma de suas faces numeradas de 1 a 6 é dito um
dado comum. Um dado em que todos os resultados têm a mesma probabilidade de serem
obtidos é chamado um dado honesto. Lança-se um dado comum e honesto repetidas vezes.
Qual a probabilidade de que o 6 seja obtido pela primeira vez no terceiro lançamento?
(A) 1/216
(B) 6/216
(C) 25/216
(D) 36/216
(E) 12/5216

(12)(BNDES/2009) Em um dado com seis faces numeradas de 1 a 6, a probabilidade de que


cada um dos resultados ocorra é a mesma. Esse dado será lançado até que se obtenha o
resultado 6. A probabilidade de que isso aconteça em, no máximo, 2 lançamentos é
(A) 1/36
(B) 5/36
(C) 6/36
(D) 7/36
(E) 11/36
(13)(DECEA/2009)

Admita que todas as brasileiras que consideram as refeições muito importantes para reunir a
família também as considerem o melhor momento para falar com o marido. Sendo assim, se
uma brasileira que considera as refeições o melhor momento para falar com o marido for
escolhida ao acaso, a probabilidade de que ela também as considere muito importantes para
reunir a família será de, aproximadamente,
(A) 14%
(B) 26%
(C) 52%

41
(D) 75%
(E) 84%

(14)(BNDES/2011) Em uma urna, são colocadas 2 bolas brancas e 4 pretas.


Alberto e Beatriz retiram bolas da urna alternadamente, iniciando-se com Alberto, até que a
urna esteja vazia. A probabilidade de que a primeira bola branca saia para
Alberto é
(A) 1/2
(B) 3/5
(C) 5/9
(D) 7/12
(E) 8/15

(15)(TERMOAÇU/2008) Em determinada cidade, 80 pessoas foram entrevistadas sobre o meio


de transporte utilizado para ir ao trabalho. Quarenta e duas responderam ônibus, 28
responderam carro e 30 responderam metrô. Doze utilizam ônibus e carro, 14, carro e metrô e
18, ônibus e metrô. Cinco utilizam ônibus, carro e metrô. Dentre as pessoas que responderam
que utilizam pelo menos um desses três meios de transporte, a probabilidade de que uma
pessoa selecionada ao acaso utilize somente um desses veículos é
(A) 27/56
(B) 56/61
(C) 56/80
(D) 27/61
(E) 27/80

(16)(Banco do Brasil 2006) O histograma de freqüências absolutas abaixo demonstra o


comportamento dos salários dos 160 empregados de uma empresa em dezembro de 2005:

Utilizando as informações nele contidas, calculou-se a média aritmética dos valores dos
salários destes empregados, considerando que todos os valores incluídos num certo intervalo
de classe são coincidentes com o ponto médio deste intervalo. Escolhendo aleatoriamente um
empregado da empresa, a probabilidade dele pertencer ao mesmo intervalo de classe do
histograma ao qual pertence a média aritmética calculada é
(A) 6,25%

42
(B) 12,50%
(C) 18,75%
(D))31,25%
(E) 32,00%

(17)(BNDES/2008)

Considerando-se que uma pessoa será escolhida ao acaso, qual a probabilidade de que a sua
idade esteja entre 28 e 36 anos, dado que a pessoa escolhida terá 24 anos ou mais?
(A) 11/40
(B) 13/32
(C) 19/40
(D) 19/32
(E) 29/40

(18)(BNDES/2008) Um grupo é formado por 10 pessoas, cujas idades são:


17 19 19 20 20 20 20 21 22 22
Escolhendo-se, aleatoriamente, uma pessoa do grupo, qual a probabilidade de que sua idade
seja maior do que a moda?
(A) 30%
(B) 25%
(C) 20%
(D) 15%
(E) 10%

(19)(EPE/2010) Dado que duas pessoas fazem aniversário no mês de junho, a probabilidade
de que ambas tenham nascido no dia 08 de junho é de
(A) 1/9000
(B) 1/3000
(C) 1/900
(D) 1/300
(E) 1/90

43
(20)(ANP/2008) A tabela abaixo mostra a distribuição de freqüência dos vinte empregados de
uma empresa, de acordo com as suas idades. Dois empregados diferentes são escolhidos em
seqüência, aleatoriamente, para representar a empresa num determinado evento. Qual a
probabilidade de que ambos tenham 34 anos?

(A) 5/20
(B) 5/34
(C) 2/20
(D) 2/34
(E) 1/19

(21)(Transpetro 2011) Duas empresas diferentes produzem a mesma quantidade de aparelhos


celulares, ou seja, ao se comprar um aparelho celular, a probabilidade de ele ter sido
produzido por qualquer uma delas é a mesma. Cada aparelho produzido pela fábrica A é
defeituoso com probabilidade 1%, enquanto cada aparelho produzido pela fábrica B é
defeituoso com probabilidade 5%. Suponha que você compre dois aparelhos celulares que
foram produzidos na mesma fábrica. Se o primeiro aparelho foi verificado e é defeituoso, a
probabilidade condicional de que o outro aparelho também seja defeituoso é
a) 13/10000
b) 13/1000
c) 13/300
d) 13/100
e) 3/100

(22)(Transpetro 2011) Dez participantes de um programa de televisão serão distribuídos


aleatoriamente em duas casas, sendo que, em cada casa, haverá o mesmo número de
participantes, isto é, 5 em cada uma. Desses 10 participantes, 3 preferem a casa X e 2
preferem a casa Y. Qual é a probabilidade de as preferências serem atendidas?
(A) 1/252
(B) 5/252
(C) 1/126
(D) 5/126
(E) 30/126

44
GABARITO
(01)B (02)A (03)A (04)A (05)E (06)C (07)D (08)A (09)B (10)E (11)C
(12)E (13)E (14)B (15)D (16)D (17)C (18)A (19)C (20)E (21)C (22)D

2ª PARTE

CAPÍTULO 01
DISTRIBUIÇÃO DE PROBABILIDADE DISCRETA

(1.1) Distribuição Binomial : a distribuição binomial é aplicável a uma v.a. discreta


X, quando temos vários experimentos independentes de Bernoulli e, a cada
um deles, associamos apenas dois resultados , sucesso(p) ou fracasso(q) de
modo que p + q = 1 . As probabilidades de sucesso e fracasso são as mesmas
para cada tentativa. A probabilidade de ocorrer x sucessos com n tentativas será:

Obs.: Para uma variável aleatória X com distribuição binomial a média e sua variância são
2
dadas, respectivamente, por: μ = E(X) = n.p e σ = n.p.q

Uma das grandes dificuldades nas questões é saber quem será o sucesso( p ), basta que você
identifique a pergunta da questão, o que for pedido será o sucesso.

Ex.:(Anal. Legislativo/2007) Sabe-se que existem inúmeros fornecedores de um material X.


Porém, somente 60% deles estão aptos a participar de uma licitação para fornecimento do
material X para o setor público. Então, a probabilidade de que, numa amostra aleatória
simples de 3 destes fornecedores, pelo menos um esteja apto a participar de uma licitação
para fornecimento do material X para o setor público é
(A) 60,0% (B) 78,4% (C) 80,4% (D) 90,4% (E) 93,6%
Solução
Note que é pedido pelo menos um esteja apto, ou seja, o sucesso será estar apto e o
fracasso será não estar apto. Logo p = 60% = 2/5 e q = 40% = 2/5 , e a probabilidade
pedida será P( X ≥ 1 ), em uma amostra com n = 3, podemos usar a probabilidade
complementar P( X ≥ 1 ) = 1 – P( X = 0 ). Sabemos que

Opção E .

45
(1.2) Distribuição de Poisson ou dos eventos raros : quando n for grande e p
pequeno, podemos aproximar a Binomial utilizando a distribuição de Poisson,
que é aplicável a uma v.a. discreta X, quando se conhece o número de
“sucessos” mas se torna difícil calcular o número de “fracassos” ou o número
total de experimentos, por este ser muito grande. Por isso iremos utilizar um
parâmetro como recurso para o cálculo da probabilidade. A probabilidade do
evento ocorrer k vezes em um intervalo é dada a por:

O parâmetro λ da distribuição Poisson pode ser visto como uma taxa de ocorrência do
fenômeno em estudo por unidade (tempo, distância, área , ... ), o símbolo e é uma constante
que é aproximadamente igual a 2,7183.

Obs.: Para uma variável aleatória X com distribuição de Poisson a média e sua variância são
2
dadas, respectivamente, por: E(X) = λ e σ = λ.

Atenção : Em geral, a distribuição de Poisson fornece uma boa aproximação da distribuição


Binomial quando n > 20 e p ≤ 0,05 .

QUESTÕES RESOLVIDAS

(01)(ICMS SP/2009) O número de pessoas que chega ao guichê de uma repartição pública
para autuação de processos apresenta uma distribuição de Poisson a uma taxa de duas
pessoas por minuto. A probabilidade de que nos próximos 2 minutos chegue pelo menos uma
pessoa neste guichê é: (Observação: e = 2,71828...)
a) (e4 − 1).e–4 b) 4.e–4 c) (e4 − 4).e–4 d) 2.[(e2 − 1)].e–2 e) (e2 − 2).e–2
Solução
São duas pessoas por minuto , em 2 minutos teremos uma média λ = 4 pessoas/2
minutos.Chegar pelo menos uma pessoa significa P(X ≥ 1) , vamos utilizar a probabilidade
complementar P(X ≥ 1) = 1 – P(X = 0) , ou seja ,

. Opção A.

(02)(TRT 8ª R/2010) Um setor de um órgão público recebe em média 96 mensagens de fax


em 8 horas de funcionamento. Suponha que a variável aleatória X= número de mensagens
recebidas por esse setor, por fax, tenha distribuição de Poisson. A probabilidade de que, em
um período de 10 minutos, o setor receba pelo menos uma chamada é
a) e – 2 b) 1 – e – 2 c) 1 – e – 4 d) e – 4 e) 1 – 2.e – 4
Solução

46
Receber pelo menos uma significa X ≥ 1, note que X ≥ 1 logo P( X ≥ 1 ) = 1 – P( X = 0 ),
muito cuidado na hora de calcular o λ, este λ está ligado com 10 minutos, veja que 96
mensagens em 8 horas nos dá 96 : 8 = 12 mensagens por hora, ou seja, 2 mensagens por 10

minutos, λ = 2 . Teremos . Opção B .

(03)(SUSEP/2010) Um estudo indica que, nas comunidades que vivem em clima muito frio e
com uma dieta de baixa ingestão de gordura animal, a probabilidade de os casais terem filhos
do sexo masculino é igual a 1/4. Desse modo, a probabilidade de um casal ter dois meninos e
três meninas é igual a:
a) 37/64 b) 45/216 c) 1/64 d) 45/512 e) 9/16
Solução

É uma questão sobre binomial, , n = 5 . x = 2, p = 1/4 e

q = 3/4 , logo . A questão foi ANULADA.

(04)(AFRE SC/2010) Uma variável aleatória X segue uma distribuição binomial com os
seguintes parâmetros: número de ensaios =100; probabilidade de sucesso em cada ensaio =
0,2. De acordo com essas informações, qual é o valor esperado de X?
a) 0,2 b) 0,8 c) 20 d) 80 e) 100
Solução
Para a distribuição binomial, o valor esperado é calculado como o produto do número de
ensaios pela probabilidade de sucesso em cada ensaio, ou seja E(X) = n . p ou E(X) = 100 ·
0,2 = 20. Opção C .

(05)(ICMS RJ/2009) O número de clientes que buscam, em cada dia, os serviços de um


renomado cirurgião tem uma distribuição de Poisson com média de 2 pacientes por dia. Para
cada cirurgia efetuada, o cirurgião recebe R$ 10.000,00. No entanto, ele consegue fazer o
máximo de duas cirurgias em um dia; clientes excedentes são perdidos para outros cirurgiões.
Assinale a alternativa que indique o valor esperado da receita diária do cirurgião. (considere
e– 2 = 0,14)
a) R$ 5.600,00. b) R$ 8.400,00. c) R$ 10.000,00.
d) R$ 14.400,00. e) R$ 20.000,00.
Solução
No máximo duas significa P( X ≤ 2 )= P( X = 0) + P( X = 1) + P( X = 2 ), mas cuidado, pois
cada probabilidade está associada com ganho, P(X=0) está associado a um ganho de 0 ,
P( X = 1 ) a um de 10000 e P( X = 2 ) a um de 20000 . Seja λ =2 .

47
Logo a receita esperada será : 0.0,14 + 10000.0,28 + 20000.0,28 = 8.400,00.
Opção B.

(06)(ICMS RJ/2008) Um candidato se submete a uma prova contendo três questões de


múltipla escolha precisando acertar pelo menos duas para ser aprovado. Cada questão
apresenta cinco alternativas, mas apenas uma é correta. Se o candidato não se preparou e
decide responder a cada questão ao acaso, a probabilidade de ser aprovado no concurso é
igual a:
(A) 0,104. (B) 0,040. (C) 0,096. (D) 0,008. (E) 0,200.
Solução
A probabilidade do sucesso vale p = 1/5 = 0,2 e do fracasso vale q = 4/5 = 0,8. Ser aprovado
significa acertar pelo menos duas, P(X ≥ 2) = P( X = 2 ) + P( X = 3 ),

. Opção A .

(07)(MPE PE/2006) O número de falhas de certo tipo de placa térmica tem distribuição de
Poisson, com taxa média de 0,1 defeitos por m2. Na confecção da superfície de um armário, é
necessário cobrir uma superfície de 2m por 2m com essa placa. A probabilidade de que haja
pelo menos uma falha nessa superfície é de:
a) e–0,1 b) 1 – e– 0,1 c) 1 – e– 0,4 d) e– 0,4 e) 1 – 1,4e– 0,4
Solução
Note que a média é de 0,1 defeitos por m2 , mas a nossa superfície possui
2.2=4 m2 , logo λ = 4.0,1= 0,4 . Pelo menos um será : P( X ≥ 1 ) = 1 – P( X = 0 )

. Opção C .

(08)(MPU/2007) O número de pacientes atendidos por um clínico geral segue uma distribuição
de Poisson com taxa de 4 pacientes por hora. A probabilidade de que pelo menos um paciente
consulte o clínico geral em um período de 15 minutos é:
a) 1 − e– 1 b) 1 − e4 c) e– 4 d) e4 e) e– 1
Solução
4 pacientes por hora significam 4 pacientes por 60 min. ou λ = 1 paciente/15 min , note a
importância de você saber calcular o parâmetro λ . Esse “ pelo menos um “
sempre se repete e é P( X ≥ 1 ) = 1 – P( X = 0 ) , logo

. Opção A .

(09)(TRT 7a R/2009) Seja X a variável aleatória que representa o número de chamadas por
minuto recebidas por um PBX. Sabe-se que X tem média λ e que P(X = 3) = P(X = 4).

48
Supondo que a distribuição de Poisson seja adequada para X, a probabilidade de que ocorra
uma chamada em 30 segundos é
a) e–4 b) 4.e– 4 c) e– 2 d) 2.e– 2 e) 1 – 2.e– 2
Solução
Primeiramente vamos calcular a média λ ( chamadas por minuto ), iremos precisar desta
informação para depois , sabendo que P(X = 3) = P(X = 4).

Na segunda igualdade simplificamos o e-λ nos dois membros , simplificamos o 3.2.1 nos dois
membros e simplificamos o λ3 nos dois membros sobrando o λ na segunda fração, logo λ =
4 chamadas por minuto ou λ = 4 chamadas por 60 segundos . Mas a questão pede para
calcular a probabilidade de que ocorra uma chamada em 30 segundos, neste caso a média
será de 2 chamadas por 30 segundos, teremos uma nova média ( λ = 2 ).

. Opção D .

(10)(MEC/2009) O número de clientes que chega a cada hora a uma empresa tem Distribuição
de Poisson, com parâmetro 2, ou seja, a probabilidade de que cheguem k clientes é dada por

para k = 0, 1, 2, .... Qual é a probabilidade de que, em uma determinada hora,

cheguem dois ou mais clientes? ( Dado: e– 2 = 0,14 )


a) 0,28 b) 0,35 c) 0,42 d) 0,58 e) 0,72
Solução
Nesta questão foi dada a probabilidade para k clientes e ele pede P ( X ≥ 2 ), mas como
P ( X ≥ 2 ) = 1 – [ P( X = 0 ) + ( P( X = 1 ) ] teremos :

Opção D .

(TJ PA/2009) Para responder às questões de números 11 e 12 considere o enunciado abaixo.


O número de falhas de certo tipo de placa plástica tem distribuição de Poisson, com taxa
média de 0,05 defeitos por m2 . Na construção de um barco, é necessário cobrir uma superfície
de 8 m2 com essa placa.

(11) A probabilidade de que não haja falhas nessa superfície é


a))e– 0,5 b) e– 0.05 c) 1 − e– 0,05 d) e– 0,4 e) 1 − e– 0,4
Solução
0,05 defeitos por m2 significa uma média de 0,05 . 8 = 0,4 defeitos/8 m2 , λ = 0,4 .
Para que não haja falhas P ( X = 0 ) , ou seja ,

Opção D .

49
(12) Na construção de 2 barcos, que serão cobertos com uma superfície de 8 m2 cada com
essa placa, a probabilidade de que pelo menos 1 não apresente defeito na superfície é
a) 1 − e– 0,4 b) 1 − e– 0,5 c) − e– 0,8 + 2.e– 0,4 d) 1 – 2.e– 0,4 e) 1 − e– 0,8 + 2.e– 0,4
Solução
A probabilidade de que pelo menos 1 não apresente defeito, ou falha , na superfície é igual a
probabilidade complementar de os dois apresentarem defeito, ou seja ,
P( pelo menos 1 não defeito ) = 1 – P ( 1º ter defeito ). P ( 2º ter defeito ) mas como
P ( 1º ter defeito ) = 1 − P ( 1º não ter defeito ) e
P ( 2º ter defeito ) = 1 – P ( 2º não ter defeito ) , logo :
P ( pelo menos 1 não defeito ) = 1 – ( 1 − e– 0,4 ) . ( 1 − e– 0,4 ) =
1 – ( 1 − 2.e– 0,4 + e– 0,8 ) = − e– 0,8 + 2.e– 0,4 . Opção C .

(13)(AFPS/2002) Sabe-se que o número de clientes que procuram atendimento numa agência
da previdência no período das 17 às 18 horas tem distribuição de Poisson com média de 3
clientes. Assinale a opção que dá o valor da probabilidade de que mais de 2 clientes apareçam
no período. Sabe-se que ℮–3 = 0,0498 , sendo ℮ o número neperiano.
a) 0,776 b) 0,667 c) 0,500 d) 0,577 e) 1,000
Solução

Note que P ( X > 2 ) = P ( X ≥ 3 ) . Opção D .

(14)(TRF 1ª R/2001) A probabilidade de que um item produzido por uma máquina seja
defeituoso é de 10%. Uma amostra de 30 itens produzidos por esta máquina é selecionada ao
acaso. Use a aproximação pela distribuição de Poisson para determinar a probabilidade de que
não mais do que um item defeituoso seja encontrado nesta amostra.
a)) 4e– 3 b) 4e– 2 c) 3e– 3 d) 1 − 4e– 3 e) 1 − 3e– 3
Solução
Como n é grande ( n ≥ 30 ), p = 0,1 e λ = n.p , teremos λ = 30. 0,1= 3. Logo a probabilidade
de que não mais do que um item defeituoso seja encontrado é P(X ≤ 1).

Opção A .

(15)(BACEN/2006) A probabilidade de um associado de um clube pagar a sua mensalidade


com atraso é de 5%. Entre 5 associados escolhidos aleatoriamente, a probabilidade de pelo
menos 1 pagar a sua mensalidade sem atraso é:
a) 1 – 0,955 b) 0,955 c) 4,75. 0,955 d) 5. 0,955 e) 1 – 0,055
Solução

50
É pedida a probabilidade de pelo menos 1 pagar a sua mensalidade sem atraso, note que o
sucesso é sem atraso , p = 0,95, o fracasso é com atraso, q = 0,05, e n = 5 . Temos
P( X ≥ 1 ) = 1 – P( X = 0 ), calculando P( X = 0 ) temos

. P(X ≥ 1)= 1 – 0,055 . Opção E .

(16)(TCE ES/2001) Uma Cia. aérea sabe que as chances são de 5 em 100 de que um
passageiro com reserva confirmada não apareça para o vôo. Neste contexto, a Cia. vende 52
passagens para um vôo que só pode acomodar 50 passageiros. Assinale a opção que dá a
probabilidade de que haja lugar disponível para todo passageiro que se apresente para viajar.
Suponha que os passageiros tomem suas decisões de viajar independentemente.
a) (0,95)50 b) 399/400 c) 1/10 d) 50/52 e) 1 – 3,55 . (0,95)51
Solução

É pedida a probabilidade de se apresente para viajar, p = 0,95, e o fracasso será não se


apresente para viajar, q = 0,05, e n = 52. Temos com isso que a probabilidade dos 50
viajarem será a probabilidade complementar dos outros dois viajarem, ou seja,P(X = 50)=1 –
[P(X = 51) + P(X = 52)].

(17)(BACEN/2001) Um fabricante de discos rígidos sabe que 2% dos discos produzidos falham
durante o período de garantia. Assinale a opção que dá a probabilidade de que pelo menos um
disco falhe numa amostra aleatória de 10 discos tomados da linha de produção.

Solução
Pede-se a probabilidade de que pelo menos um disco falhe, o sucesso será falhe e p =
0,02, logo o fracasso será q = 0,98 e n = 10. Com isso temos P( X ≥ 1 ), utilizando a
probabilidade complementar teremos P( X ≥ 1 ) = 1 – P( X = 0 ), ou seja

. Opção C .

(18)(AFC/2008) Seja X uma variável aleatória discreta com função de probabilidade binomial
f(x), onde f(x)= Cn,x . px .(1 − p)n – x e Cn,x é o número de combinações de n elementos
tomados x a x. Sendo n = 6 e p = 1/3, determine f(6).
a) 1/729. b) 1. c) 0. d) 64/729. e) 8/729
Solução

51
6
Substituindo os valores temos f(6)= C 6 , 6 . ( 1/3) .(1 – 1/3) 6 – 6 , f(6) = 1/729. Opção A .

(19)(TJ PR/2009) Uma variável aleatória X segue a Distribuição Binomial com média igual a
oito e desvio padrão igual a dois. Assim, podemos afirmar que o produto da probabilidade de
sucesso p pela probabilidade de insucesso q é igual a:
a) 21% b) 25% c) 16% d) 24%
Solução
Temos μ = n.p e σ2 = n.p.q, como μ = 8 e σ = 2  σ2 = 4, teremos n.p = 8 e
n.p.q = 4, com estas duas equações concluímos que q = 1/2 e p = 1/2. Logo o produto será
1/4 = 25% . Opção B .

(20)(SUSEP/2002) Considere n repetições independentes de um ensaio onde se observa a


ocorrência ou não de um evento E. Suponha que E ocorra com probabilidade 0,5. Assinale a
opção que corresponde ao valor de n que permite garantir que E vai ocorrer no mínimo uma
vez com probabilidade 0,99. Aproxime n para o inteiro imediatamente superior.
a) 5 b) 4 c) 6 d) 7 e) 9
Solução
A questão diz que E vai ocorrer no mínimo uma vez, o sucesso será ocorrer e o fracasso
será não ocorrer . Então P( X ≥ 1 ) = 1 – P( X = 0 ), só que foi dado que

P( X ≥ 1 ) = 0,99 e sabendo que ,

temos 0,99 = 1 – 2– n  2– n = 0,01  2– n = 10– 2 e aplicando logaritmo decimal


encontramos log ( 2– n ) = log( 10– 2 ) ou – n . log 2 = – 2 . log 10 x (– 1) teremos
n . log 2 = 2 . log 10 , como log 2 = 0,301 e log 10 = 1 teremos n = 2/0,301 ou
n = 6,64 ou aproximando n = 7 . Opção D .

QUESTÕES DE CONCURSOS

(01)(Rio Previdência/2010) Se X : b( n , p ), sabendo-se que E(X)=12 e var(X)=3, os valores


de n e p são , respectivamente:
a) 25 e 4/5
b) 16 e 4
c) 16 e 4/5
d) 25 e 3/4
e) 16 e 3/4

(02)(SEEDUC/2010) Sabendo que a variável aleatória X tem distribuição binomial de


parâmetros: n = 20 e p = 0,4 , a média e a variância de X serão, respectivamente:
a) 8 e 4,8
b) 8 e 3,2

52
c) 4 e 2,4
d) 8 e 2,4
e) 4 e 4,8

(03)(TCE ES/2001) Uma Cia. aérea sabe que as chances são de 5 em 100 de que um
passageiro com reserva confirmada não apareça para o vôo. Neste contexto, a Cia. vende 52
passagens para um vôo que só pode acomodar 50 passageiros. Assinale a opção que dá a
probabilidade de que haja lugar disponível para todo passageiro que se apresente para viajar.
Suponha que os passageiros tomem suas decisões de viajar independentemente.
a) (0,95)50
b) 399/400
c) 1/10
d) 50/52
e) 1 – 3,55 . (0,95)51

(04)(SEBRAE PA/2010) Sabe-se que o número de clientes que visitam determinada loja no
período das 9 às 10 horas da manhã tem distribuição de Poisson com média igual a 5. A
probabilidade de que mais de 1 cliente visite a loja nesse período é igual a (Dado: e– 5 =
0,0067)
A) 1.
B) 0,9900.
C) 0,9598.
D) 0,9320.
E) 0,9125.

(05)(TRT 9ª R/2010) A probabilidade de que um item produzido por uma máquina seja
defeituoso é 10%. Uma amostra de 40 itens produzidos por esta máquina é selecionada ao
acaso. Usando-se a aproximação pela distribuição de Poisson para determinar a probabilidade
de que não mais que dois itens defeituosos sejam encontrados na amostra, obtemos
(A) 13 e –4
(B) 1 – 13 e –4
(C) 4 e –4
(D) 5 e –4
(E) 1 – 5 e –4

(06)(AFRE SC/2010) Uma variável aleatória X segue uma distribuição binomial com os
seguintes parâmetros: número de ensaios =100; probabilidade de sucesso em cada ensaio =
0,2. De acordo com essas informações, qual é o valor esperado de X?
a) 0,2
b) 0,8

53
c) 20
d) 80
e) 100

(07)(AFTE SC/2010) Seja a variável aleatória discreta X número de acidentes em um


cruzamento registrado em um mês. A probabilidade de que X seja menor ou igual a 2 (ou seja,
que ocorram até 2 acidentes no cruzamento em um mês) vale 0,0015. Qual é a probabilidade
de que ocorram mais de 2 acidentes no cruzamento em um mês?
a) 0,0015
b) 0,85
c) 0,985
d) 0,995
e) 0,9985

(08)(AFRFB/2009) O número de petroleiros que chegam a uma refinaria ocorre segundo uma
distribuição de Poisson, com média de dois petroleiros por dia. Desse modo, a probabilidade de
a refinaria receber no máximo três petroleiros em dois dias é igual a:

a) e –4

b) e –4

c) e –4

d) e –2

e) e –2

(09)(ICMS SP/2009) O número de pessoas que chega ao guichê de uma repartição pública
para autuação de processos apresenta uma distribuição de Poisson a uma taxa de duas
pessoas por minuto. A probabilidade de que nos próximos 2 minutos chegue pelo menos uma
pessoa neste guichê é
Observação: e = 2,71828...
(A) (e 4 − 1).e –4
(B) 4.e –4
(C) (e 4 − 4).e –4
(D) 2.[(e –2 − 1) ].e –2
(E) (e 2 − 2).e –4

54
(10)(TRT 7ª R/2009) Seja X a variável aleatória que representa o número de chamadas por
minuto recebidas por um PBX. Sabe-se que X tem média λ e que P(X = 3) = P(X = 4).
Supondo que a distribuição de Poisson seja adequada para X, a probabilidade de que ocorra
uma chamada em 30 segundos é
(A) e –4 .
(B) 4e –4.
(C) e –2.
(D) 2e –2.
(E) 1 − 2e –2.

(TJ PA/2009) O número de falhas de certo tipo de placa plástica tem distribuição de Poisson,
com taxa média de 0,05 defeitos por m2 . Na construção de um barco, é necessário cobrir uma
superfície de 8 m2 com essa placa.
(11) A probabilidade de que não haja falhas nessa superfície é
a))e– 0,5
b) e– 0.05
c) 1 − e– 0,05
d) e– 0,4
e) 1 − e– 0,4

(12) Na construção de 2 barcos, que serão cobertos com uma superfície de 8 m2 cada com
essa placa, a probabilidade de que pelo menos 1 não apresente defeito na superfície é
a) 1 – e– 0,4
b) 1 – e– 0,5
c) – e– 0,8 + 2.e– 0,4
d) 1 – 2.e– 0,4
e) 1 – e– 0,8 + 2.e– 0,4

(13)(TJ PR/2009) Uma variável aleatória X segue a Distribuição Binomial com média igual a
oito e desvio padrão igual a dois. Assim, podemos afirmar que o produto da probabilidade de
sucesso p pela probabilidade de insucesso q é igual a:
a) 21%
b) 25%
c) 16%
d) 24%

(14)(CGU AFC/2008) Seja X uma variável aleatória discreta com função de probabilidade
binomial f(x), onde f(x)= Cn,x . px .(1 - p)n – x e Cn,x é o número de combinações de n
elementos tomados x a x. Sendo n=6 e p=1/3, determine f(6).
a) 1/729.

55
b) 1.
c) 0.
d) 64/729.
e) 8/729

(15)(TRT 2ª R/2008) O número de peças defeituosas fabricadas por uma empresa tem
distribuição de Poisson, com uma taxa média de 1 peça defeituosa por 1.000 peças fabricadas.
Adquirindo 100 peças desta empresa, a probabilidade de, no máximo, uma peça ser defeituosa
é igual a Dados: (e = 2,71828...)
– 0,2
(A) e
(B) e– 0,1
(C) 1,1 e– 0,1
(D) 0,1 e– 0,1
(E) 2 e– 0,2

(16)(SUSEP/2002) Considere n repetições independentes de um ensaio onde se observa a


ocorrência ou não de um evento E. Suponha que E ocorra com probabilidade 0,5. Assinale a
opção que corresponde ao valor de n que permite garantir que E vai ocorrer no mínimo uma
vez com probabilidade 0,99. Aproxime n para o inteiro imediatamente superior.
a) 5
b) 4
c) 6
d) 7
e) 9

(17)(SEPLAG RJ EPPGG/2010) Um aparelho de fax da SEPLAG recebe 160 mensagens em 8


horas de funcionamento. Logo, a probabilidade de que em 12 minutos receba, no máximo, 2
mensagens é de:
a) 20.e –8
b) 13.e –4
c) 12.e –4
d) 8.e –4
e) 8.e –12

(18)(SEEDUC/2010) Na revisão tipográfica de um livro com 600 páginas, encontrou-se, em


média, 1,2 erros por página. Considerando e –1,2 = 0,30 e estimando o número de páginas que
não precisam sofrer alterações por não apresentarem defeitos, tem-se:
a) 500 páginas
b) 420 páginas
c) 200 páginas

56
d) 180 páginas
e) 36 páginas

(19)(TRT 9ª R/2010) Em um lote de 8 peças há duas defeituosas e 6 boas. Escolhendo-se ao


acaso e sem reposição 3 peças do lote, a probabilidade de se encontrar no máximo uma
defeituosa é
(A) 13/56
(B) 2/5
(C) 25/28
(D) 5/14
(E) 15/28

(20)(PETROBRAS/2010) Um levantamento realizado em uma agência bancária revelou que, de


cada 200 clientes, 60 terminam o mês com saldo negativo em conta-corrente. Se for tomada
uma amostra aleatória de 20 clientes dessa agência, qual o valor esperado do número de
clientes com saldo negativo em conta-corrente ao final do mês?
(A) 3
(B) 5
(C) 6
(D) 10
(E) 12

(21)(COPEL/2009) A quantidade de acidentes de trabalho que ocorrem mensalmente no setor


da produção de uma empresa segue a Distribuição de Poisson, com média igual a dois.
Considerando e = 2,7, o valor mais próximo da probabilidade de ocorrer no máximo um
acidente de trabalho em determinado mês é
a) 14%.
b) 27%.
c) 40%.
d) 54%.
e) 67%.

(22)(MDA/2009) Uma central de atendimento ao cliente recebe em média 10 ligações por


minuto, de acordo com um processo de Poisson. Calcule a probabilidade de que a central
receba no máximo 1 ligação num intervalo de 2minutos.
A) 6 e –10
B) 12 e –10
C) 11 e –20
D) 22 e –20
E) e –10

57
(23)(MEC Matemática/2009) O número de clientes que chega a cada hora a uma empresa tem
Distribuição de Poisson, com parâmetro 2, ou seja, a probabilidade de que cheguem k clientes

é dada por para k = 0, 1, 2, .... Qual é a probabilidade de que, em uma

determinada hora, cheguem dois ou mais clientes? (Dado: e –2 = 0,14)


(A) 0,28
(B) 0,35
(C) 0,42
(D) 0,58
(E) 0,72

(24)(IF RS/2009) Numa linha de produção, 8% das peças produzidas são defeituosas. Sendo X
a variável aleatória que representa os valores totais de peças defeituosas de um total de 10
peças desta linha de produção. Usando uma distribuição binomial, a variância (Var(x)) para
esta distribuição é:
a) 0,934
b) 1,760
c) 0,567
d) 0,736
e) 1,235

(25)(TRT 8ª R/2010) Um setor de um órgão público recebe em média 96 mensagens de fax


em 8 horas de funcionamento. Suponha que a variável aleatória X= número de mensagens
recebidas por esse setor, por fax, tenha distribuição de Poisson. A probabilidade de que, em
um período de 10 minutos, o setor receba pelo menos uma chamada é
a) e – 2
b) 1 – e – 2
c) 1 – e – 4
d) e – 4
e) 1 – 2.e – 4

GABARITO

58
(01)E (02)A (03)E (04)C (05)A (06)C (07)E (08)C (09)A (10)D (11)D
(12)C (13)B (14)A (15)C (16)D (17)B (18)D (19)C (20)C (21)C (22)C
(23)D (24)D (25)B

CAPÍTULO 02
DISTRIBUIÇÃO NORMAL

(2.1) Distribuição Normal ou Gaussiana : É um modelo de distribuição contínua de


probabilidade, usado tanto para variáveis aleatórias discretas como contínuas. Esta distribuição
tem uma forma de sino.

(2.2) Função Densidade de Probabilidade : seja X uma variável aleatória contínua, X terá
distribuição normal se:

os parâmetros μ e σ representam a média e o desvio padrão, respectivamente.


Usaremos a notação X ~ N(μ, σ2) para indicar que a variável aleatória X tem distribuição
Normal com parâmetros μ e σ2.

(2.3) Características da Distribuição Normal :


• a curva normal tem forma de sino, é simétrica em relação à média, ou seja, a média,
mediana e moda são valores coincidentes; (Fig. 02).
• As probabilidades para a variável aleatória normal são dados por áreas sob a curva.
• a função f(x) tem ponto máximo em x = μ.
• a área total abaixo da curva equivale a 100%=1, cada metade vale 50%=0,5.
• aproximadamente 68% das observações estão no intervalo [μ – σ , μ + σ],
aproximadamente 95% das observações estão no intervalo [μ –2σ, μ + 2σ ] e
aproximadamente 99,7% das observações estão no intervalo [μ – 3σ , μ +3σ]
( Fig. 01).

(Fig. 01) (Fig. 02)

Obs: Se X possui uma distribuição normal com média μ e variância σ2 e se Y = aX +b, onde a
e b são constantes, com a a≠0, então Y terá uma distribuição normal com média a.μ + b e
variância σ2(Y)= a2σ2 .

59
(2.4) Distribuição Normal Padronizada : para o cálculo das probabilidades, surgem dois
problemas: primeiro, a integração de f(x); segundo, seria a elaboração de uma tabela de
probabilidades, pois f(x) depende das combinações da média e variância. Para resolver esses
problemas, façamos uma mudança de variável obtendo-se a distribuição normal padronizada

que chamamos aqui de Z, que será representada por ou Z . σ = X – μ .

Distribuição Normal Padrão é a distribuição Normal de média zero ( μ=0 ) e variância 1


( σ2 = 1 ), ver Fig. 03, representada por Z ~ N(0, 1) . As probabilidades associadas à
distribuição normal padrão são apresentadas em tabelas. A tabela de distribuição normal
padrão (veja abaixo ) fornece a probabilidade da variável normal padrão Z assumir um valor
entre 0 e z0 que é P(z0) = P(0 ≤ Z ≤ z0)( Tabela I ), maior do que z0 que é P(z0) = P(Z ≥ z0)
(Tabela II) e podemos utilizar a distribuição acumulada F(z0) = P( Z ≤ z0)(Tabela III).
Na prova você terá que utilizar a tabela fornecida. ÂNIMO!!!

(Fig. 03)
Na prática teremos valores de X que você terá que calcular o Z para usar a tabela.

(Tabela I)

Ex.: P( 0 < Z < 0,56 )  note que já está normalizado, você irá procurar na vertical a parte
inteira e a 1ª casa decimal( 0,5 ) e na horizontal a 2ª casa decimal ( 0,06 ), com isso temos
P( 0 < Z < 0,56 ) = 0,2123 = 21,23%. Esta tabela é a mais utilizada.

60
(Tabela II)

(Tabela III)

 Podemos transformar as probabilidades para a tabela I da seguinte forma:


Na Fig. 04 temos P( Z ≤ z1 )= 0,5+ P( 0 ≤ Z ≤ z1 ) que é encontrado na tabela I.
Na Fig. 05 temos P(z1 ≤ Z ≤ z2 )= P( 0 ≤ Z ≤ z2 ) – P( 0 ≤ Z ≤ z1 ).
Na Fig. 06 temos P(–z2 ≤ Z ≤ z1 )= P(–z2 ≤ Z ≤ 0 ) + P( 0 ≤ Z ≤ z1 ), mas por simetria em
relação ao zero P(–z2 ≤ Z ≤ 0 ) = P( 0 ≤ Z ≤ z2 ), logo
P(–z2 ≤ Z ≤ z1 )=P(0 ≤ Z ≤ z2 ) + P( 0 ≤ Z ≤ z1 ).

Na Fig. 07 temos P( Z  z1 )=P(0 ≤ Z ≤ +∞ ) – P( 0 ≤ Z ≤ z1 ), lembramos que


P(0 ≤ Z ≤ +∞ )= 0,5, ou P( Z  z1 )= 0,5 – P( 0 ≤ Z ≤ z1 )

61
Fig. 04 Fig. 05

Fig. 06 Fig. 07

Ex.: As vendas diárias de uma loja têm distribuição Normal, com média igual
R$ 450,00 por dia e desvio padrão igual a R$ 95,00. Qual é a probabilidade das vendas
excederem R$ 700,00 em determinado dia?
Solução
A probabilidade será P( X > 700 ), normalizando temos 95.Z = 700 – 450 ou Z = 2,63 ,
utilizando a tabela 0 < Z < z e sabendo que P( Z > 700 ) = 0,5 – P( 0 ≤ Z ≤ 2,63 ) teremos
P( Z > 700 ) = 0,5 – P( 0 ≤ Z ≤ 2,63 ) = 0,5 – 0,4957 = 0,0043 = 0,43%.

Ex.: Suponha que entre investidores, o ganho em uma aplicação financeira tenha uma
distribuição aproximadamente Normal de média 105 mil e um desvio padrão 9 mil, por mês.
Qual a proporção de ganhos entre 90 mil e 125 mil, por mês?
Solução
P( 90 < X < 105 ), teremos que normalizar 90 e 105 com a relação Z . σ = X – μ, sendo μ =
105 e σ = 9, temos Z . 9 = 90 – 105 ou Z = – 1,67, e Z . 9 = 125 – 105 ou Z = 2,22. Logo P(
– 1,67 < X < 2,22 ) = P(– 1,67 ≤ Z ≤ 0 ) + P( 0 ≤ Z ≤ 2,22 ) mas sabemos que P(– 1,67 ≤ Z
≤ 0 ) = P( 0 ≤ Z ≤ 1,67 ), por simetria, logo teremos
P( 0 ≤ Z ≤ 1,67 ) = 0,4525 e P( 0 ≤ Z ≤ 2,22 ) = 0,4868 e P( – 1,67 < X < 2,22 ) = 0,9393 =
93,93%.

62
Sempre que tivermos uma variável X que não tenha média zero e desvio padrão unitário, nós
precisaremos obter a variável reduzida Z (para então consultar a tabela).
A transformação para se obter a variável Z (de tal modo que ela tenha média zero e desvio

padrão unitário) será feita utilizando-se .

Obs.: Para o cálculo de probabilidades sob a distribuição de variáveis aleatórias contínuas


(normal padrão) torna-se indiferente o uso de sinais < ou ≤ bem como > ou  .

Ex.:(APOFP/SP 2009) Seja Z uma variável aleatória Normal Padrão. Dados os valores de z e de
P(Z < z) a seguir, obtenha o valor mais próximo de P(–2,58 < Z < 1,96).

63
z 1,96 2,17 2,33 2,41 2,58
P( Z < z ) 0,975 0,985 0,99 0,992 0,995
a) 0,99 b) 0,97 c) 0,98 d) 0,985
SOLUÇÃO

Primeiramente, perceba que a tabela fornecida foi a acumulada, basta subtrair 0,5 . Com isso,
do enunciado P(–2,58 < Z < 1,96)= P( –2,58 < Z < 0 ) + P( 0< Z < 1,96 ), sabemos que
P( –2,58 < Z < 0 )= P( 0< Z< 2,58 )= P( Z< 2,58 ) – 0,5 = 0,995 – 0,5 = 0,495 e P( 0< Z <
1,96 )= P( Z < 1,96 ) – 0,5 = 0,975 – 0,5 = 0,475. Logo P(–2,58 < Z < 1,96) = 0,495 +
0,475 = 0,97 . Opção B . Note que todos os valores fornecidos já estão normalizados.

QUESTÕES RESOLVIDAS

(01)(BACEN/2006) Para resolver a próxima questão considerar a tabela a seguir.

As empresas de um determinado setor têm uma situação líquida bem descrita por uma
distribuição normal, com média igual a 2,5 milhões de reais e desvio padrão de 2 milhões de
reais. Selecionando-se uma empresa aleatoriamente deste setor, a probabilidade dela
apresentar uma situação líquida negativa ou nula é de:
a) 11% b) 16% c) 23% d) 39% e) 50%.
SoluçãoTemos μ = 2,5 , σ =2 e X = 0, pois queremos P( X ≤ 0), teremos que normalizar

utilizando , logo

Veja que aqui utilizamos a própria tabela acumulada. Opção A .


(02)(Analista Legislativo/2007) Os preços de um equipamento no mercado têm uma
distribuição normal com um valor médio igual a R$ 1.500,00. Verificou-se que 20% dos preços
deste equipamento são inferiores a R$ 1.290,00. Utilizando os valores das probabilidades
P(Z ≤ z) para a distribuição normal padrão:

64
tem-se que o valor do equipamento em que apenas 10% são superiores a ele é igual a :
a)R$ 1.825,00 b) R$ 1.805,00 c) R$ 1.710,00 d) R$ 1.695,00 e) R$ 1.650,00
Solução
Você deve estar percebendo que a tabela é a acumulada, vamos colocar os valores do
enunciado μ = 1500 , P( X < 1290 ) = 20% , P( X > x0 ) = 10% e σ =? . Vamos subtrair 0,5
de cada valor da probabilidade e vamos trabalhar com P (0 ≤ Z ≤ z) . Logo embaixo do 1290
fica -0,84, veja a tabela, pois 30% é a probabilidade entre Z1 e 0 , então Z1 = – 0,84, veja
tabela. Da mesma forma 40% é a probabilidade entre 0 e Z2 , então Z2 = 1,30 .

Podemos relacionar os valores de X e Z pela padronizada e com isso calcular σ ,

logo : com isso calculamos x0 ,

. Opção A.

(03)(DECEA/2009) As notas obtidas pelos candidatos em um determinado concurso


apresentaram distribuição normal, com média 6 e desvio padrão 1. A nota correspondente ao
1º quartil dessa distribuição é, aproximadamente,
(A) 5,0 (B) 5,3 (C) 5,8 (D) 6,3 (E) 6,7
Solução
Bem, temos três quartis que dividem uma distribuição em quatro partes iguais, 25% cada
uma.Podemos representar o 1oQ da seguinte forma :

Note que Z(1oQ) = – Z(3oQ) , por simetria , logo procurando na tabela qual é o Z tal que a
probabilidade seja 25% = 0,25 temos Z(3oQ) = 0,67, aproximadamente, logo

65
Z(1oQ) = – 0,67.

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

Substituindo em encontramos a nota X equivalente a Z(1oQ) = – 0,67, por

comodidade passaremos a escrever a relação de normalização assim Z. σ = X – μ. Pelo


enunciado temos σ = 1 e μ = 6, logo – 0,67.1 = X – 6  X= 5,33 .
Opção B .

(04)(BNDES/2008) Seja X uma variável aleatória com distribuição normal com parâmetros μ=
2
2eσ =16 . A probabilidade de que X esteja entre 1 e 4 é, aproximadamente,
(A) 9% (B) 10% (C) 19% (D) 29% (E) 33%
Solução
P ( 1< X < 4 ) = ? , μ= 2 , σ= 4 , calcularemos os valores normalizados de 1 e 4 com a
expressão Z. σ = X – μ , ou seja , Z.4 = 1 – 2 Z= - 0,25 e Z.4 = 4 – 2 ou Z = 0,5 . P ( 1<
X < 4 ) = P ( - 0,25 < Z < 0,5 ) = P ( 0 < Z < 0,25 ) + P ( 0 < Z < 0,5 ) = 0,0987 + 0,1915
= 0,2902 = 29% . Opção D .
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

(05)(ANS/2007) Se Z tem distribuição normal padrão, então:


P(Z > 2) = 0,023; P(0 < Z < 1,6) = 0,445; P(Z < 1) = 0,84; P(0 < Z < 2,33) = 0,49. O
tempo para ocorrência de defeitos em máquinas, de uma determinada fabricação, tem
distribuição normal com média 1000 dias e desvio padrão 100 dias. Ao desejar que apenas 1%
das máquinas sejam substituídas antes do término da garantia, o tempo de garantia que o
fabricante deve dar às máquinas vendidas deve ser de
(A) 767 dias. (B) 584 dias. (C) 429 dias. (D) 403 dias. (E) 356 dias.
Solução
μ= 1000 , σ= 100 , para calcularmos o Z de 1% , vamos calcular o Z para 49% que ,
segundo os valores fornecidos , vale 2,33 . O Z para 1% será – 2,33.

Como Z. σ = X – μ teremos – 2,33.100 = X – 1000 ou X = 767 . Opção A .

66
(06)(SEFAZ MS/2006) Se X tem distribuição normal com média 4 e variância 9, a
probabilidade de X > 6 vale, aproximadamente:
a) 0,25 b) 0,28 c) 0,33 d) 0,37 e) 0,46
Solução

Vamos utilizar a relação ou Z. σ = X – μ, para calcularmos a probabilidade, Z . 3

= 6 – 4 ou Z = 2/3 = 0,666... , ou seja, P( X > 6 ) = P( Z > 0,66... ). Agora P( Z > 0,66... ) =


0,5 – P( 0< Z < 0,66 ) na tabela temos P(Z > 0,66...) = 0,5 – 0,2454 = 0,2546 . Opção A.

(07)(ANAC/2007) Uma variável aleatória X tem distribuição normal com media 10 e variância
100. O valor do terceiro quartil correspondente é, aproximadamente:
(A) 13,5; (B) 14,7; (C) 15,6; (D) 16,8; (E) 17,9.
Solução
μ= 10 , σ2 =100 , o Q3 é representado na figura abaixo, logo o Z(Q3) será 0,67, note que
Z(Q1) = – Z(Q3) . Substituindo os valores μ= 10 , σ= 10 e Z(Q3)= 0,67 na expressão Z. σ =
X – μ teremos 0,67.10 = X – 10 X = 16,7 . Opção D .

(08)(ISS SP/2007) Para responder à questão seguinte, utilize, dentre as informações abaixo,
as que julgar adequadas. Se Z tem distribuição normal padrão, então:
P(0 < Z < 1) = 0,341 P(0 < Z < 1,6) = 0,445 P(0 < Z < 2) = 0,477
Os depósitos efetuados no banco B, num determinado mês, têm distribuição normal com
média R$ 9.000,00 e desvio padrão R$ 1.500,00. Um depósito é selecionado ao acaso dentre
todos os referentes ao mês em questão. A probabilidade de que o depósito exceda a
R$6.000,00 é de:
a) 97,7% b) 94,5% c) 68,2% d) 47,7% e) 34,1%
Solução
Temos a média R$ 9.000,00 e o desvio padrão R$ 1.500,00, a probabilidade pedida é para
valores maiores do que 600, P( X > 6000 ). Vamos normalizar este valor, ou seja, vamos
encontrar o seu Z usando a expressão Z. σ = X – μ , logo teremos
1500.Z = 6000 – 9000  Z = – 2 ou P( Z > – 2 ) = P(– 2 < Z < 0) + 0,5 ou como
P(– 2 < Z < 0) = P( 0 < Z < 2 )  P( Z > – 2 ) = P( 0 < Z < 2 ) + 0,5 na tabela temos P(0
< Z < 2) = 0,477, ou seja, P( Z > – 2 ) = 0,977 = 97,7%. Opção A.

67
(TRT 2ª R/2008) Para responder às questões de números 09 a 10 considere a tabela abaixo,
que fornece os valores das probabilidades P(Z ≥ z) para a distribuição normal padrão.

(09) O número de processos analisados em uma repartição pública por semana apresenta uma
distribuição normal, com média igual a 50 processos e desvio padrão igual a 10 processos. A
probabilidade de, em uma determinada semana, ser analisado um número de processos menor
ou igual a 40 é igual a
(A) 40% (B) 31% (C) 23% (D) 16% (E) 11%
Solução
Queremos calcular P( X  40 ), sendo σ = 10 e μ = 50, normalizando o 40 temos
Z . 10 = 40 – 50 ou Z = – 1. Logo P( X  40 ) = P( Z  – 1 ) e por simetria temos
P( Z  – 1 ) = P( Z ≥ 1 ) = 0,5 – P( 0  Z  1 ) , da tabela tiramos que
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

P( Z  – 1 ) = P( Z ≥ 1 ) = 0,5 – 0,3413 = 0,1588 = 15,88%. Opção D.

(10) As taxas de retorno no mercado de um determinado investimento distribuem-se


normalmente com média igual a 5% e desvio padrão igual a 4%. Selecionando ao acaso uma
taxa de retorno, a probabilidade dela não ser nula ou negativa é igual a
(A) 93% (B) 89% (C) 69% (D) 64% (E) 50%
Solução
Bem, não ser nula ou negativa significa P( X > 0 ), normalizando o 0 teremos
Z . 0,04 = 0 – 0,05 ou Z = – 1,25, logo P( X > 0 ) = P( Z > – 1,25 ) ou
P( Z > – 1,25 ) = P( – 1,25 < Z < 0 ) + 0,5 , que por simetria teremos
P( Z > – 1,25 ) = P( 0 < Z < 1,25 ) + 0,5 , da tabela tiramos que
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

P( X > 0 ) = P( Z > – 1,25 ) = 0,5 + 0,3944 = 0,8944 = 89,44%. Opção B.

68
QUESTÕES DE CONCURSOS

(APOFP SP/2010) Para resolver às questões de números 01 utilize as informações abaixo


referentes à distribuição normal padrão Z:

(01) Os salários dos empregados de uma determinada categoria profissional apresentam uma
distribuição normal com média igual a R$ 1.200,00 e desvio padrão igual a R$ 160,00. A
proporção dos empregados com salários superiores a R$ 1.000,00 e inferiores a R$ 1.520,00 é
(A) 98%
(B) 96%
(C) 92%
(D) 89%
(E) 87%

(02)(SEFIN RO/2010) Os valores dos salários dos empregados de determinado ramo de


atividade apresentam uma distribuição normal com média R$ 2.000,00 e variância igual a
62.500 (R$)2. Considere os valores das probabilidades P(0 ≤ Z ≤ z) para a distribuição normal
padrão:

Então, a porcentagem dos empregados que ganham salários inferiores a R$ 1.790,00 ou


salários superiores a R$ 2.320,00 é igual a
(A) 30%
(B) 40%
(C) 50%
(D) 60%
(E) 70%

(03)(SEPLAG RJ APO/2010) Uma pesquisa revelou que, no último concurso da SEPLAG, a


distribuição dos tempos gastos pelos candidatos para concluírem a prova foi normalmente
distribuído, com uma média de 136 minutos e uma variância de 64 minutos 2. Sabendo que Z é
a variável correspondente à distribuição normal padronizada, com média zero desvio padrão
unitário, e ainda que: P( Z < – 2 ) = 0,0228 e que P( Z < – 0,5 ) = 0,3085, a probabilidade de
que um candidato qualquer, escolhido aleatoriamente, tenha concluído a prova num tempo
entre 2 horas e 2,2 horas é, aproximadamente, igual a :
a) 33,13%
b) 28,57%

69
c) 47,72%
d) 19,15%
e) 21,43%

(04)(ANS/2007) Para responder à questão seguinte considere, dentre os dados abaixo,


aqueles que julgar apropriados. Se Z tem distribuição normal padrão, então:
P(Z > 2) = 0,023; P(0 < Z < 1,6) = 0,445; P(Z < 1) = 0,84; P(0 < Z < 2,33) = 0,49
O tempo para ocorrência de defeitos em máquinas, de uma determinada fabricação, tem
distribuição normal com média de 1000 dias e desvio-padrão de 100 dias. Ao desejar que
apenas 1% das máquinas sejam substituídas antes do término da garantia, o tempo de
garantia que o fabricante deve dar às máquinas vendidas deve ser de:
a) 767 dias;
b) 584 dias;
c) 429 dias;
d) 403 dias;
e) 356 dias.

(05)(Analista BACEN/2010) Estima-se que os retornos de um determinado mercado tenham


distribuição normal, com média 20% e desvio padrão 10%. A probabilidade de perdas
financeiras é de, aproximadamente,
a) 1%
b) 2,5%
c) 5%
d) 10%
e) 20%

(06)(CETESB/2009) Uma empresa produz um componente eletrônico que tem vida média de
1200 horas e desvio padrão de 60 horas. Sabe-se que a distribuição é normal. A probabilidade
de uma amostra de 9 desses componentes retirados de um lote ter vida média entre 1150 e
1250 horas é de
(A) 10,56%.
(B) 98,76%.
(C) 59,34%.
(D) 5,34%.
(E) 95,25%.

(07)(APOFP/SP 2009) Seja Z uma variável aleatória Normal Padrão. Dados os valores de z e
de P(Z < z) a seguir, obtenha o valor mais próximo de P(-2,58 < Z < 1,96).
z 1,96 2,17 2,33 2,41 2,58
P( Z < z ) 0,975 0,985 0,99 0,992 0,995

70
a) 0,99
b) 0,97
c) 0,98
d) 0,985
e) 0,95

(08)(ICMS/MS 2006) Se X tem distribuição normal com média 4 e variância 9, a probabilidade


de X > 6 vale, aproximadamente:
a) 0,25
b) 0,28
c) 0,33
d) 0,37
e) 0,46

Para resolver as questões 09 e 10 considerar a tabela a seguir.

(09)(BACEN/2006) As empresas de um determinado setor têm uma situação líquida bem


descrita por uma distribuição normal, com média igual a 2,5 milhões de reais e desvio padrão
de 2 milhões de reais. Selecionando-se uma empresa aleatoriamente deste setor, a
probabilidade dela apresentar uma situação líquida negativa ou nula é de:
a) 11%
b) 16%
c) 23%
d) 39%
e) 50%.

(10)(BACEN/2006) Os valores de determinado título no mercado de investimentos apresentam


uma distribuição considerada normal. Sabe-se que os valores de 16% dos títulos são
superiores ou iguais a R$ 10.000,00 e que os valores de 60% dos títulos são inferiores a R$
7.000,00. A média dos valores destes títulos é:
a) R$ 8.500,00
b) R$ 8.000,00
c) R$ 7.500,00
d) R$ 6.500,00

71
e) R$ 4.500,00

(11)(TCE RO/2007) O gasto médio dos clientes de um posto de gasolina é uma variável
aleatória normal com média R$ 100,00 e desvio padrão R$ 25,00. Os 10% dos que mais
consomem recebem um tratamento VIP, incluindo lavagem de carroceria, calibragem nos
pneus e verificação do óleo e da água. Quanto você precisa gastar nesse posto de gasolina, em
reais, para obter tratamento VIP?
(A) 158,00
(B) 149,00
(C) 141,00
(D) 132,00
(E) 128,00

(12)(DECEA/2009) As notas obtidas pelos candidatos em um determinado concurso


apresentaram distribuição normal, com média 6 e desvio padrão 1. A nota correspondente ao
1º quartil dessa distribuição é, aproximadamente,
(A) 5,0
(B) 5,3
(C) 5,8
(D) 6,3
(E) 6,7

(13)(BNDES/2008) Seja X uma variável aleatória com distribuição normal com parâmetros
μ= 2 e σ²=16 . A probabilidade de que X esteja entre 1 e 4 é, aproximadamente,
(A) 9%
(B) 10%
(C) 19%
(D) 29%
(E) 33%

(14)(FIOCRUZ/2010) Suponha uma variável aleatória X normalmente distribuída com média


100 e variância 25. A probabilidade de que X seja maior do que 110 é aproximadamente igual
a:
(A) 2,28%
(B) 4,56%
(C) 34,46%
(D) 47,72%
(E) 97,72%

72
(15)(UNIFESP/2009) Suponha que o tempo necessário para atendimento de clientes em uma
central de atendimento telefônico siga uma distribuição normal de média de 8 minutos e
desvio padrão de 2 minutos, qual é a probabilidade de que um atendimento dure entre 7 e 10
minutos?
a) 47,3%
b) 58,9%
c) 53,28%
d) 67,1%

(16)(ICMS RS/2009) Seja Z uma variável aleatória contínua normalmente distribuída com
média zero e desvio padrão um. Seja P( Z < - 1) = 0,1587 e P( Z > 2 )=0,0228. Seja X uma
variável aleatória contínua normalmente distribuída com média 200 e desvio padrão 20, então
P(180 < X < 240) , é:
a) 0,9772
b) 0,8413
c) 0,3413
d) 0,8185
e) 0,4772

(17)(ICMS RS/2009) Uma pesquisa indica que a distribuição do tempo que os candidatos de
um concurso levam para entregar uma prova é aproximadamente normal, com tempo médio
de 1,5 hora e desvio padrão de 15 minutos. Sabendo que P( μ < X < μ + 2σ ) = 0,4772 e
P( μ - σ < X < μ+σ)=0,6827 , o número esperado de candidatos que levam entre 1 e 2 horas,
de um total de 10.000 candidatos, é;
a) 5.228
b) 9.972
c) 9.544
d) 6.827
e) 3.173

(18)(INVEST RIO/2010) Em um exame de matemática, a média foi 78 e o desvio padrão 10.


Qual o valor de Z para estudantes com graus 93 e 62, respectivamente?
A) 1,5 e 1,3
B) 1,5 e 1,6
C) 1,3 e -1,6
D) 1,3 e 1,6
E) 1,5 e -1,6

73
(19) (26)(CETESB/2009) Suponha que as pessoas adultas tenham altura média de 170 cm e
desvio padrão de 10 cm. Sabe-se que as alturas têm distribuição normal. Então, a
probabilidade de que uma pessoa tenha mais de 183 cm, é de
(A) 34,13%.
(B) 9,68%.
(C) 5,15%.
(D) 3,34%.
(E) 2,27%.

(20)(CEB Brasília Estatística/2010) Uma pizzaria garante entregar os pedidos dos clientes em
tempo mínimo. O tempo de entrega segue uma distribuição aproximadamente normal com
σ = 4. Sabe-se que 97,13% dos pedidos levam até 13,6 minutos. Qual a probabilidade de que
o pedido de um cliente tenha de esperar mais de 12,6 minutos?
(A) 0,0208
(B) 0,0495
(C) 0,0808
(D) 0,9505
(E) 0,9590

(21)(COPEL/2009) As cargas encaminhadas para um depósito têm peso médio de 100 kg e


variância de 225 kg2. A probabilidade de, selecionadas ao acaso, 36 dessas cargas carregadas
em um elevador excederem o limite de segurança deste, que é de 3.735 kg, é igual a
a) P(z > 2) = 2,275%.
b) P(z > 1,96) = 2,5%.
c) P(z > 1,65) = 4,95%.
d) P(z > 1,5) = 6,67%.
e) P(z > 1,28) = 10,03%.

(22)(IBGE/2010) Seja H a variável aleatória que representa as alturas dos cidadãos de certo
país. Sabe-se que H tem distribuição normal com média 1,70 m e desvio padrão 0,04 m. A
probabilidade de que um cidadão desse país tenha mais do que 1,75 m de altura é,
aproximadamente,
(A) 9,9%
(B) 10,6%
(C) 22,2%
(D) 39,4%
(E) 40,6%

74
(23)(TRT 7ª R/2009) Os salários dos analistas de um tribunal é uma variável aleatória X, com
distribuição normal com média μ e desvio padrão R$ 500,00. Sabendo que P(X < 5.000 reais)
= 0,02, o valor do primeiro quartil de X, em reais, é
(A) 5.755.
(B) 5.665.
(C) 5.605.
(D) 5.500.
(E) 5.410.

(24)(MPE SC/2009) Num teste psicológico aplicado a um grupo de pessoas, a média dos
escores foi de 21 pontos e o desvio padrão foi de 7. Considerando uma distribuição normal de
probabilidades, qual a probabilidade de ser encontrada uma pessoa com o escore entre 21 e
28 pontos?
A) 95,44%
B) 68,26%
C) 47,72%
D) 34,13%
E) 50%

(TRT 8ª R/2010) Para responder a questão de número 25 considere as informações dadas


abaixo.
Se Z tem distribuição normal padrão, então:
P(0 < Z < 0,125) = 0,05; P(0 < Z < 0,5) = 0,19; P(0 < Z < 1) = 0,34;
P(0 < Z < 1,28) = 0,40; P(0 < Z < 1,5) = 0,43; P(0 < Z < 2) = 0,48
(25) Um estudo das modificações percentuais dos preços, no atacado, de produtos
industrializados, mostrou que essa variável tem distribuição normal com média de 40% e
desvio padrão de 10%. A porcentagem dos artigos que sofreram aumentos entre 30% e 60%
é
(A) 75%.
(B) 80%.
(C) 82%.
(D) 84%.
(E) 85%.

GABARITO
(01)E (02)A (03)B (04)A (05)B (06)B (07)B (08)A (09)A (10)D (11)D
(12)B (13)D (14)A (15)C (16)D (17)C (18)E (19)B (20)B (21)D (22)B
(23)B (24)D (25)C

75
CAPÍTULO 03
INTERVALO DE CONFIANÇA

Como visto anteriormente, a média é um bom estimador de μ para populações


aproximadamente normais, mas não se espera que seja precisamente igual a μ. Assim,
existe um intervalo de confiança da forma:
ou [ -e , +e].
Suponha que estejamos interessados num parâmetro populacional verdadeiro
(mas desconhecido) θ. Podemos estimar o parâmetro θ usando informação de nossa
amostra. Seria interessante, então, encontrar um intervalo de confiança que forneça um
intervalo de valores plausíveis para o parâmetro baseado nos dados amostrais. É claro que
estamos sujeitos a um erro (e) e de uma forma geral teremos P( -e ≤µ≤ + e)= 1 -  ,
no caso para média, em que 1 -  é o nível de confiança(probabilidade de acertar a
estimativa) e  o nível de significância.

Cuidado!! O erro padrão da média é .

Obs.: Note ainda que a amplitude (A) do intervalo de confiança será o dobro do erro da
amostra (e), ou seja: A = 2e.

(3.1) Intervalo de Confiança para a Média Populacional µ : seja X uma variável aleatória
com média µ e variância σ2, e seja X1, X2, ..., Xn uma amostra aleatória simples( a.a.s. ) de X,

logo se a amostra for retirada com

reposição, porém se a amostra for retirada sem reposição teremos

O intervalo de confiança para a média populacional pode ser feito de duas formas, lembrando
que pelo Teorema do Limite Central podemos aproximar por uma Normal:

(3.1.1) Com a variância (σ2) conhecida : mesmo que o tamanho da amostra seja
pequena, n ≤ 30, se a variância (σ2) for conhecida iremos utilizar a Normal, agora
se a variância populacional for desconhecida mas n > 30 também iremos utilizar a
Normal e neste caso a variância usada será a amostral( S ).

substituindo o Z na probabilidade teremos :

. Com a relação

podemos calcular o tamanho n da amostra .

76
(3.1.2) Com a variância (σ2) desconhecida e n ≤ 30 : neste caso deve-se estimar a
variância populacional por S2, e vamos utilizar a distribuição "t" de Student, com
φ = n - 1 graus de liberdade. A distribuição t de Student é uma distribuição de
probabilidade teórica simétrica e semelhante à curva normal, diferindo da normal por possuir
um parâmetro adicional, os chamados graus de liberdade que mudam sua forma. Grau de
liberdade, normalmente simbolizados por gl ou φ, é um parâmetro da distribuição t que pode
ser qualquer número real maior que zero.

. A relação nos dá o

tamanho n da amostra.

t- Student

77
Ex.: gl = φ = 8 e  = 10%, na tabela teremos :
gl /  0,10 0,05 0,020 0,010
08 1,860 2,306 2,896 3,355

Da tabela temos que t /2 = t 0,05 = 1,860, mas cuidado, na tabela iremos procurar  = 10% .

78
ATENÇÃO : o intervalo de confiança para a Média Populacional µ pode ser calculado pela
Normal ou pela “t” de Student. Mas em apenas um caso iremos utilizar a
“t” de Student é quando n ≤ 30 e σ2 ( ou σ ) for desconhecido. Em qualquer outro caso
usaremos Normal. Note que mesmo que σ2 ( ou σ ) for desconhecido mas se n> 30 iremos
usar a Normal.

(3.2) Intervalo de Confiança para Proporções : lembre-se de que, sendo n > 30 , a


Binomial é aproximada pela Normal, o Intervalo de Confiança para Proporções é
calculado para uma distribuição Binomial, iremos usar a Normal. Seja f a proporção(sucesso)
amostral e p a proporção populacional. Para estimarmos p utilizando a Normal façamos o
seguinte:

, no caso de n grande podemos

substituir, no radical, p por f e q por ( 1 – p ), logo

. A expressão

dará o tamanho n da amostra.

QUESTÕES DE RESOLVIDAS

79
(01)(ICMS RJ 2010) Suponha que os salários dos trabalhadores numa certa região sejam
descritos por uma variável populacional com média desconhecida e desvio padrão igual a
R$200,00. Para se garantir, com 95% de probabilidade, que o valor da média amostral dos
salários não diferirá do valor da média populacional por mais de R$10,00, a amostra aleatória
simples deverá ter no mínimo, aproximadamente, o seguinte tamanho:
(A) 3.568. (B) 3.402. (C) 2.489. (D) 2.356. (E) 1.537.
SOlUÇÃO
A questão trata de cálculo do tamanho da amostra da média com σ2 conhecido,

, em que e = 10 , σ = 200 e Z  / 2 = 1,96, pois o intervalo de confiança é de

95%. Aplicando a relação teremos : . Opção E .

(02)(TRE PI 2009) Uma amostra com apenas 9 elementos foi extraída de uma população
normal de tamanho infinito com variância desconhecida. A média amostral apresentou um
valor igual a 10 com uma variância igual a 16. Um intervalo de confiança de 90% para a média
foi obtido utilizando a distribuição t de Student, considerando t0,05 o quantil da distribuição t de
Student para teste unicaudal tal que P (t > t0,05) = 0,05, com n graus de liberdade. O intervalo
de confiança, utilizando os dados da amostra, é

(A) [7,37; 12,63] (B) [7,41; 12,59] (C) [7,47; 12,53]


(D) [7,52; 12,48] (E) [7,56; 12,44]
SOLUÇÃO
Um intervalo de confiança de a média, com n = 9( pequeno) e σ2 desconhecido, utilizaremos a
distribuição t de Student. Vamos lá, = 10, n = 9 implica em φ = 8 e olhando na tabela da
questão temos t0,05 = 1,86, S2 = 16 ou S = 4, para calcularmos e usamos

e e = 2,48 . Sabemos que [ -e, + e ] logo

[ 7,52 ; 12,48 ] . Opção D .

(03)(TJ PA 2009) A vida de determinado equipamento apresenta uma distribuição normal com
um desvio padrão populacional de 400 horas. Extrai-se uma amostra aleatória de 100
equipamentos e obtém-se uma vida média de 2.000 horas para este equipamento.
Considerando a população de tamanho infinito e a informação da distribuição normal padrão

80
(Z) que P(Z > 1,64) = 5% tem-se um intervalo de confiança de 90% para a vida média dos
equipamentos igual a
(A) [1.800,00; 2.200,00] (B) [1.967,20; 2.032,80] (C) [1.934,40; 2.065,60]
(D) [1.639,20; 2.360,80] (E) [1.344,00; 2.656,00]
SOLUÇÃO
Intervalo de confiança para média em que n =100, n grande, iremos utilizar a Distribuição

Normal e a relação para Z  / 2= 1,64 e Z  / 2= - 1,64 .

e . Opção C .

(04)(FUNASA 2009) Numa região afetada por um surto epidêmico, selecionou-se uma amostra
de 2.500 indivíduos, tendo-se encontrado 500 contaminados. O intervalo de confiança de 95%
para a verdadeira e desconhecida proporção populacional é, aproximadamente,
(A) 20% ± 1% (B) 20% ± 2% (C) 20% ± 3%
(D) 20% ± 4% (E) 20% ± 5%
SOLUÇÃO
Intervalo de confiança para a Proporção, iremos utilizar a Normal, o sucesso f será 500 em
2500, ou seja, 20% e ( 1 – f ) = 80%. Como o intervalo de confiança é de 95% o Z  / 2 vale

1,96 , basta calcularmos o erro com , logo

e 20% ± 2% . Opção B .

(05)(ICMS RJ 2008) Uma pesquisa recente foi realizada para avaliar o percentual da população
favorável à eleição de um determinado ponto turístico para constar no selo comemorativo de
aniversário da cidade. Para isso, selecionou-se uma amostra aleatória simples extraída de uma
população infinita. O resultado apurou 50% de intenção de votos para esse ponto turístico.
Considerando que a margem de erro foi de 2 pontos percentuais, para mais ou para menos, e
que o nível de confiança utilizado foi de 95%, foram ouvidas, aproximadamente:
(A) 50 pessoas. (B) 100 pessoas. (C) 1.200 pessoas.
(D) 2.400 pessoas. (E) 4.800 pessoas.
SOLUÇÃO

81
Questão de tamanho da amostra para a proporção em que f = 1/2 , 1 – f = 1/2,
e = 0,02 e o nível de confiança de 95%. Seria interessante sabermos, para a prova, que se o
nível de confiança for de 95% teremos Z  / 2 = 1,96. Sendo

teremos . Opção D .

(06)(AFRE SC/2010) Uma amostra aleatória de 100 elementos de uma população resultou em
um erro padrão igual a 10 para uma variável X. Admite-se que a média amostral de X siga
uma distribuição normal. Com base nas informações anteriores, calcule o erro amostral de um
intervalo bilateral de 95% de confiança para a média de X.
a) 1,645 b) 1,96 c) 10 d) 16,45 e) 19,6
Solução

Sabemos que o erro amostral para a média é e que o erro padrão é

, ou seja, . Como 1 –  = 95% teremos

Z  / 2 = 1,96, ver tabela, logo e = 1,96 . 10 = 19,6. Opção E.


z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

(07)(ICMS RJ/2010) Para estimar a proporção p de pessoas acometidas por uma certa gripe
numa população, uma amostra aleatória simples de 1600 pessoas foi observada e constatou-
se que, dessas pessoas, 160 estavam com a gripe Um intervalo aproximado de 95% de
confiança para p será dado por:
(A) (0,066, 0,134). (B) (0,085, 0,115). (C) (0,058, 0,142).
(D) (0,091, 0,109). (E) (0,034, 0,166).
Solução
O intervalo de confiança é para estimar a proporção p de pessoas acometidas por uma
certa gripe numa população, que será p ± e. Temos que n = 1600, f = 160/1600 = 0,1, 1 –

f = 0,9 e 1–  = 95%  Z  / 2 = 1,96. Logo aplicando temos ,

10% ± 1,47% = (8,53%; 11,47%). Opção B.

(08)(SUSEP/2010) Deseja-se estimar a proporção p de pessoas com determinada

característica em uma população. Um levantamento preliminar forneceu = 2 /7. Usando

82
essa estimativa, obtenha o menor tamanho de amostra aleatória simples necessária para
estimar p com um intervalo de 95% de confiança e um erro de amostragem

, onde =1− .

A) 7840 B) 2500 C) 1960 D) 9604 E) 2401


Solução

Questão de tamanho de amostra para a proporção, , note que o erro

vale 2%. Aplicando teremos . Opção C.

(09)(MPU/2004) Uma revenda de automóveis vende carros montados no Brasil. O proprietário


está interessado em estimar o valor médio θ dos gastos extras com opcionais casados com a
compra de carros novos. Uma amostra de 16 vendas produziu um valor médio de R$1.062,00
com desvio padrão de R$ 144,00. Assinale a opção que dá os limites de confiança para θ com

coeficiente de 98%. A tabela abaixo dá os quantis x, de ordem , , da

distribuição Tr de Student com r graus de liberdade. Despreze centavos.

a) [R$ 955,00; R$ 1.168,00] b) [R$ 968,00; R$ 1.155,00]


c) [R$ 990,00; R$1.134,00] d) [R$ 997,00; R$ 1.124,00]
e) [R$ 938,00; R$ 1.186,00]
Solução
Bem, do enunciado temos que n = 16 < 30 ; = 1062 , S = 144 ; 1–  =98% e
 = 2%; r = n – 1 = 16 – 1 = 15 graus de liberdade(g.l.). O n é pequeno e σ2 é desconhecido,
usaremos a t de Student que foi fornecida, mas cuidado, a tabela fornecida nos dá Tr  x ,

acumulada, você terá que procurar , ou seja,

P(Tr  x ) = 99% e sendo φ = 15  Tr  2,947 .

O intervalo será ( –e, + e) e o erro é dado por , logo

1062 – 106,092 < θ < 1062 + 106,092  ( 955 ; 1.168 ). Opção A.

83
QUESTÕES DE CONCURSOS

(01)(ICMS RJ/2010) Suponha que os salários dos trabalhadores numa certa região sejam
descritos por uma variável populacional com média desconhecida e desvio padrão igual a
R$200,00. Para se garantir, com 95% de probabilidade, que o valor da média amostral dos
salários não diferirá do valor da média populacional por mais de R$10,00, a amostra aleatória
simples deverá ter no mínimo, aproximadamente, o seguinte tamanho:
(A) 3.568.
(B) 3.402.
(C) 2.489.
(D) 2.356.
(E) 1.537.

(APOG PE/2010) Texto para as questões 02 e 03


A média e o desvio padrão amostral dos salários Z de uma amostra aleatória simples de 625
empregados de indústrias do ramo têxtil são, respectivamente, iguais a R$ 600,00 e
R$ 400,00. Considere que Z siga uma distribuição normal padrão e que P(Z < 2,5) = 0,994.

(02) O intervalo de confiança de 98,8% para o salário médio da população dos empregados de
indústria têxtil é
A) R$ 600,00 ± R$ 1,60.
B) R$ 600,00 ± R$ 16,00.
C) R$ 600,00 ± R$ 40,00.
D) R$ 600,00 ± R$ 400,00.
E) R$ 600,00 ± R$ 1.000,00.

(03) Com base nas informações do texto, assinale a opção correta.


A) A estimativa do erro padrão da média é igual a R$ 400,00.
B) O coeficiente de variação é igual a R$ 400,00.
C) A variância amostral é igual a R$ 400,00.
D) Com 95% de confiança, a margem de erro sobre a estimação do salário médio dessa
população de trabalhadores é igual a 5%.
E) O valor R$ 600,00 é uma estimativa da mediana dos salários dos empregados de indústrias
do ramo têxtil.

(04)(ICMS AP/2010) Uma amostra aleatória simples de tamanho 400 de uma variável
populacional normalmente distribuída com média μ desconhecida e variância igual a 25 foi

84
observada e indicou uma média amostral igual a 12,52. O intervalo de 95% de confiança para
μ é dado por:
Dados: Se Z tem distribuição normal padrão,
P[0 < Z < 0,45] = 1,64; P[0 < Z < 0,475] = 1,96; P[0 < Z < 0,49] = 2,33
(A) (12,03 , 13,01)
(B) (11,65 , 13,39)
(C) (10,99 , 15,05)
(D) (10,44 , 15,60)
(E) ( 9,99 , 16,05)

(05)(ICMS MS/2006) Uma amostra aleatória de tamanho 400 revelou que 64% dos torcedores
brasileiros acham que conquistaremos o hexacampeonato mundial de futebol. O intervalo de
95% de confiança para a proporção de torcedores na população que acreditam no
hexacampeonato é:

(A) 64% ± 3,9%


(B) 64% ± 4,2%
(C) 64% ± 4,7%
(D) 64% ± 5,1%
(E) 64% ± 5,6%

(06)(BACEN/2006) Os preços de um determinado produto vendido no mercado têm uma


distribuição normal com desvio padrão populacional de R$ 20,00. Por meio de uma pesquisa
realizada com uma amostra aleatória de tamanho 100, com um determinado nível de
confiança, apurou-se, para a média destes preços, um intervalo de confiança sendo [R$ 61,08;
R$ 68,92]. A mesma média amostral foi obtida quadruplicando o tamanho da amostra e
utilizando também o mesmo nível de confiança. Nos dois casos considerou-se infinito o
tamanho da população. O novo intervalo de confiança encontrado no segundo caso foi:
a) [R$ 63,04; R$ 66,96]
b) [R$ 62,06; R$ 67,94]
c) [R$ 61,57; R$ 68,43]
d) [R$ 61,33; R$ 68,67]
e) [R$ 61,20; R$ 68,80]

(07)(IPEA/2004) Deseja-se estimar o gasto médio efetuado por grupos de 4 pessoas, num
restaurante, por meio de um intervalo de confiança com coeficiente de 95%. Uma amostra de
16 grupos produziu os valores R$ 150,00 e R$ 20,00 para a média e o desvio padrão
amostrais, respectivamente. Assinale a opção que corresponde ao intervalo procurado. Use a
hipótese de normalidade da distribuição dos gastos e a tabela abaixo da função de distribuição
de Student (Tr) para a escolha do quantil apropriado aos cálculos.

85
a) [139,34; 160,66]
b) [139,40; 160,60]
c) [141,23; 158,77]
d) [141,19; 158,81]
e) [140,00; 160,00]

(08)(MPU/2007) Uma nova marca de lâmpada está sendo estudada. Baseado em estudos
anteriores com outras marcas similares, pode-se admitir que a vida média segue uma
distribuição normal com desvio padrão de 8 meses. Tendo como base estes resultados, o
tamanho da amostra necessário para que a amplitude do intervalo de 95% de confiança
(utilize a aproximação P(−1 ≤ Z ≤ 2) = 0,95, onde Z é a normal padrão) para a vida média
seja de 4 meses é de:
a) 8
b) 12
c) 16
d) 64
e) 128

(09)(ICMS RJ 2009) Uma empresa afirma que os pacotes de bala que ela produz pesam em
média 25g. Para testar essa hipótese, foram selecionados ao acaso 16 pacotes produzidos pela
empresa, registrados seus pesos X1, X2, ... , X16 e calculadas as estatísticas

O valor da estatística t (a ser comparado com o ponto desejado da distribuição t de Student)


para o teste é:
(A) –0,8.
(B) –1,2.
(C) –2,0.
(D) –2,5.
(E) –3,2.

(10)(ELETROBRAS/2007) Uma amostra aleatória simples de tamanho 1.600 de uma população


normal com variância 100 foi observada e resultou numa média amostral igual a 15. Um
intervalo de 95% de confiança para a média populacional será estimado por:

86
(A) (14,26 ; 15,74 );
(B) (14,51 ; 15,49 );
(C) (13,92 ; 16,08 );
(D) (13,66 ; 16,34 );
(E) (13,20 ; 16,80 ).

(11)(TRT 9ª R/2010) Os salários de todos os 170 empregados de uma empresa apresentam


uma distribuição normal com um desvio padrão igual a R$ 364,00. Uma pesquisa com 49
empregados, selecionados ao acaso, detectou uma média de R$ 1.560,00 para os salários
desta amostra. Com base no resultado desta amostra e considerando que, na distribuição
normal padrão (Z), a probabilidade
P(Z > 2,05) = 2%, obtém-se que o intervalo de confiança de 96% para a média dos salários
da empresa, em R$, é igual a
(A) [1.453,40; 1.666,60].
(B) [1.461,60; 1.658,40].
(C) [1.469,80; 1.650,20].
(D) [1.478,00; 1.642,00].
(E) [1.486,20; 1.633,80].

(12)(TRT 8ª R/2010) Uma pesquisa realizada em uma região, por meio de uma amostra piloto,
revelou que 80% de seus habitantes são favoráveis à realização de uma obra. Deseja-se obter
um intervalo de confiança de 95% para esta proporção, com base em uma amostra de
tamanho 256, considerando a população de tamanho infinito e que a distribuição amostral da
frequência relativa dos habitantes favoráveis à obra é normal. Utilizando a informação da
distribuição normal padrão (Z) que a probabilidade P(Z > 1,96) = 0,025, o intervalo de
confiança apresenta uma amplitude igual a
(A) 9,8%.
(B) 8,4%.
(C) 7,6%.
(D) 6,4%.
(E) 4,9%.
(13)(SEPLAG RJ/2010) Numa amostra aleatória simples, constituída por 38 funcionários da
SEPLAG, obteve-se, para as suas idades, uma média amostral de 31,82 anos e uma variância
amostral de 1,52 anos2. Considerando que P(Z < 1,96) = 0,975, onde Z é a variável aleatória
normal padrão, o intervalo de 95% de confiança para a média populacional será de,
aproximadamente:
A) [31,04; 32,60] anos
B) [31,43; 32,60] anos
C) [31,04; 32,21] anos
D) [31,43; 32,21] anos

87
E) [30,30; 33,34] anos

(14)(EBAL/2010) Uma pesquisa realizada com 400 clientes selecionados aleatoriamente


revelou que 10% têm preferência por FCT (Frango Congelado Temperado). Para a proporção
“p” da preferência, a um nível de 95% de confiabilidade (Z=1,96), o intervalo de confiança é
de
A) 4,12% a 15,88%
B) 6,08% a 13,92%
C) 7,06% a 12,94%
D) 9,93% a 10,00%
E) 20,00% a 40,00%

(15)(EBAL/2010) Com a finalidade de estimar o percentual de colaboradores motivados, o


diretor administrativo de uma empresa pretende fazer uma pesquisa com os mil
colaboradores. Assim, com 95% de confiabilidade (Z=1,96) e uma margem de erro amostral
de 5%, o tamanho mínimo de uma amostra que ele deve pesquisar é igual a
A) 50
B) 152
C) 196
D) 384
E) 278

(16)(FUNASA 2009) Numa região afetada por um surto epidêmico, selecionou-se uma amostra
de 2.500 indivíduos, tendo-se encontrado 500 contaminados. O intervalo de confiança de 95%
para a verdadeira e desconhecida proporção populacional é, aproximadamente,
(A) 20% ± 1%
(B) 20% ± 2%
(C) 20% ± 3%
(D) 20% ± 4%
(E) 20% ± 5%

(17)(PETROBRAS/2010) Uma empresa de consultoria em recursos humanos deseja


conhecer o salário médio praticado pelo mercado para a remuneração de uma determinada
classe profissional. Para tal, terá de extrair uma amostra dos salários desses profissionais para
inferir o valor do salário médio da população. É desejada uma confiança de 95%, e o erro de
amostragem, considerado como aceitável, é de R$ 100,00. Estudos anteriores indicam que o
desvio padrão dos salários observado na população constituída por esses profissionais é de R$
600,00. Qual deverá ser o tamanho da amostra a ser utilizada para a estimação da média
aritmética populacional dos salários dessa classe profissional?
(A) 30

88
(B) 58
(C) 139
(D) 200
(E) 322

(18)(ICMS RJ/2011) Um processo X segue uma distribuição normal com média populacional
desconhecida, mas com desvio-padrão conhecido e igual a 4. Uma amostra com 64
observações dessa população é feita com média amostral 45. Dada essa média amostral, a
estimativa da média populacional, a um intervalo de confiança de 95%, é
a) (41;49).
b) (37;54).
c) (44,875;45,125).
d) (42,5;46,5).
e) (44,46).

(19)(TRT 1ª R/2011) Uma amostra aleatória de 9 elementos foi extraída de uma população
normal de tamanho infinito com média μ e variância desconhecida. O desvio padrão da
amostra apresentou o valor de 1,25 e o intervalo de confiança de (1 − ) para μ: [14, 16] foi
obtido com base nesta amostra. Sabe-se que para obtenção deste intervalo utilizou-se a
distribuição t de Student com os correspondentes graus de liberdade, em que a probabilidade
P (− T≤ t ≤ T) = (1 − ). Se T > 0, então o valor de T é
(A) 2,4. (B) 2,7. (C) 3,0. (D) 3,6. (E) 4,2.

GABARITO
01)E 02)C 03)E 04)A 05)C 06)A 07)A 08)D 09)D 10)B 11)C 12)A 13)D 14)C
15)E 16)B 17)C 18)E 19)C

CAPÍTULO 04
TESTE DE HIPÓTESE

(4.1) Definições : Os processos que habilitam a decidir se aceitam ou rejeitam as hipóteses


formuladas, ou determinar se a amostra observada difere, de modo significativo, dos
resultados esperados, são denominados de Testes de Hipóteses ou Testes de
Significância. Testar uma hipótese significa retirar uma amostra, de uma população de um
dado fenômeno, e com ela decidir, ou seja, tomar uma decisão, se a tal hipótese feita deve

89
ser aceita ou rejeitada. Para testarmos parâmetros de uma população, formulamos hipóteses
a respeito desses parâmetros. Essas hipóteses são denominadas:

HIPÓTESE NULA : é aquela Hipótese Estatística, prefixada, formulada sobre o parâmetro


populacional estudado, com o único propósito de ser rejeitada ou invalidada. É representada
por Ho.

HIPÓTESE ALTERNATIVA : são quaisquer hipóteses que difiram da Hipótese Nula.


Utilizaremos uma hipótese alternativa, representada por H1.

Geralmente, a hipótese Ho é a hipótese a ser testada. Caso rejeitemos Ho, a hipótese H1 será
considerada aceitável.

(4.2) Erros do Tipo I e Erros do tipo II :


Quando estabelecemos um procedimento do teste, podemos incorrer em dois tipos de erros:
Erro Tipo I (  ) : rejeitar Ho sendo Ho verdadeira ( erro de rejeição);
Erro Tipo II ( β ): não rejeitar Ho sendo Ho falsa ( erro de não rejeição).

Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual se sujeitaria a correr
o risco de um Erro do Tipo I é denominada de Nível de Significância do Teste (os níveis
de significância usualmente adotados são 0,10 (10%), 0,05 (5%) e 0,01 (1%).). Essa
probabilidade, representada freqüentemente por , é geralmente especificada antes da
extração de quaisquer amostras, de modo que os resultados obtidos não influenciem na
escolha. Os valores de  e β são as probabilidades de cada um dos erros tipo I e tipo II
ocorrerem( geralmente crescem em sentidos inversos ), respectivamente, ou seja,

 = P(erro tipo I) = P(rejeitar Ho dado que Ho é verdadeira)


β = P(erro tipo II) = P(aceitar Ho dado que Ho é falsa)
ATENÇÃO!! 1º ) O Poder de um teste estatistico é a probabilidade de rejeitar a hipótese
nula Ho, quando a hipótese alternativa é verdadeira. O poder do teste é calculado como 1 - β
e também pode ser interpretado como a probabilidade de rejeitar corretamente uma
hipótese nula falsa.
2º ) Um teste é dito o mais poderoso se, admitindo-se um dado nível de significância, for
aquele que apresentar o maior poder de teste, ou seja, a maior probabilidade de rejeitar a
hipótese nula quando ela é falsa.

90
3º ) De uma forma geral a probabilidade do erro tipo II(β) não pose ser calculada, pois
não sabemos o valor verdadeiro.
4º ) Geralmente, quanto menor for à probabilidade de se cometer o erro tipo I, maior será a
probabilidade de se cometer o erro do tipo II. A única forma de se reduzir às probabilidades
relativas aos dois tipos de erros é aumentando o tamanho da amostra, pois quanto maior
for à amostra, maior será a precisão das estimativas dos parâmetros.

(4.3) Tipos de Testes : RC é a região onde rejeitaremos Ho e RA é a região de


aceitaremos de Ho. Considere um dado parâmetro θ estudado e θ0 o valor inicialmente
suposto para θ .

(4.3.1) Teste Bilateral : H0 : θ = θ0


H1 : θ  θ0

R.A. é a região de aceitação (da hipótese nula) e R.C. é a região crítica ou região de rejeição.
A fronteira entre essas regiões será dada por um valor tabelado
( Distribuição Normal ou da Tabela da Distribuição t-Student).

(4.3.2) Teste Unicaudal ou Unilateral à direita : : H0 : θ = θ0


H1 : θ > θ0

(4.3.3) Teste Unicaudal ou Unilateral à esquerda : H0 : θ = θ 0


H1 : θ < θ0

91
(4.4) Iremos utilizar a Distribuição Normal ou t-Student?
Iremos utilizar a t- Student apenas quando o tamanho da amostra for pequeno ( n ≤ 30 )
e a variância populacional for desconhecida. Caso contrário iremos utilizar a Normal. É
claro que temos que considerar o Qui-Quadrado, quando for o caso.

(4.5) Roteiro para o cálculo do Teste de Hipótese : nada mais é do que uma orientação.
1º : estabelecer a Hipótese Nula (H0) e a Hipótese Alternativa (H1), observando os dados do
enunciado.
2º : definir a distribuição a ser utilizada (Normal ou t-Student), observando o enunciado.
3º : utilizando a Tabela Normal Padrão ou a Tabela t-Student, encontrar o valor de ZTAB ou tTAB

4º : de uma forma geral iremos fazer o desenho da curva, determinando no eixo das
abscissas o valor tabelado, que será a fronteira entre a área de aceitação (RA) e a(s) área(s)
de rejeição (RC - Região Crítica) .
5º : calcular o parâmetro teste (ZCALC ou tCALC) utilizando uma das fórmulas vistas nos capítulos
anteriores.
6º : Comparar o valor calculado com o valor tabelado e concluir pela aceitação ou rejeição da
Hipótese Nula.

Note a ligação entre Estimação e Teste de Hipótese, podemos dizer que se nada é conhecido
acerca da população, a estimação é usada para fornecer uma estimativa de ponto e de
intervalo acerca da população. Se alguma informação acerca da população é proposta ou
suspeitada, o Teste de Hipóteses é usado para determinar a plausibilidade desta informação.

Obs.: 1º ) Na prática, questões de concursos, é muito comum apenas se especificar a


probabilidade do erro tipo I, ou seja,  . Porém os resultados obtidos poderão nos levar a
conclusões erradas, neste caso teremos somente um Teste de Significância e não um Teste
de Hipótese. De uma forma geral este  será pequeno e teremos a tendência de aceitarmos
a hipótese nula, o correto seria dizermos que não rejeitaremos a hipótese nula. Note que
se  é pequeno o nosso intervalo de aceitação é maior, por isso que é mais razoável falarmos
em não rejeição da hipótese nula do que aceitação.

92
2º ) Pode ocorrer que um teste seja significativo se for unilateral mas não seja significativo se
for bilateral, para um mesmo , por isso é muito importante que o tipo de teste seja
determinado antes de se realizar a experiência, seja ela qual for.

QUESTÕES RESOLVIDAS

(01)(IBGE 2010) O salário médio nacional dos trabalhadores de certa categoria é igual a 4
salários mínimos, com desvio padrão de 0,8 salários mínimos. Uma amostra de 25
trabalhadores dessa categoria é escolhida ao acaso em um mesmo estado da União. O salário
médio da amostra é de μ salários mínimos. Deseja-se testar com nível de significância igual a
10%
Ho : μ = 4 contra H1 : μ ≠ 4
Considerando esses dados, analise as afirmativas.
I – O teste rejeitará Ho se for igual a 4,30.
II – O teste rejeitará Ho se for igual a 4,20.
III – O teste não rejeitará H0 se for igual a 3,75.
Está(ão) correta(s) APENAS a(s) afirmativa(s)
(A) I. (B) II. (C) III. (D) I e II. (E) I e III.
SOLUÇÃO
Estamos testando uma média e vamos usar a Normal, note que o teste é bilateral,
 = 10% e 1 –  = 90%, vamos encontrar ZTAB = 1,64 e – 1,64, ver tabela, logo

Vamos calcular ZCALC em cada um das afirmativas.

I) sendo μ = 4, = 4,3 , n = 25 e σ = 0,8  , será rejeitada,

afirmação correta.

II) sendo μ = 4, = 4,2 , n = 25 e σ = 0,8  , não será

rejeitada, afirmação errada.

III) sendo μ = 4, = 3,75 , n = 25 e σ = 0,8  , não

será rejeitada, afirmação correta. Opção E .

93
(02)(BNDES/2009) O rótulo das garrafas de certo refrigerante indica que o seu conteúdo
corresponde ao volume de 290 mL. A variável aleatória que representa o volume de líquido no
interior dessas garrafas é X. A máquina que enche essas garrafas o faz segundo uma
distribuição normal, com média e variância igual a 36 mL2, qualquer que seja o valor de μ. A
máquina foi regulada para
μ = 290 mL. Semanalmente, uma amostra de 9 garrafas é colhida para verificar se a máquina
está ou não desregulada para mais ou para menos. Para isso, constrói-se um teste de hipótese
bilateral no qual
X ~ N ( μ , 36)
H0 (Hipótese Nula): μ = 290 mL
H1 (Hipótese Alternativa): μ ≠ 290 mL
O nível de significância do teste foi fixado em . A hipótese nula não será rejeitada se a média
apresentada pela amostra estiver entre 285,66 mL e 294,34 mL. Logo,  é igual a
(A) 0,5% (B) 1,0% (C) 1,5% (D) 3,0% (E) 4,0%
SOLUÇÃO
σ2 = 36  σ = 6, n = 9, μ = 290, vamos usar a Normal calculando Z1 e Z2 , pois sabemos
que 285,66 < < 294,34 .

e , a probabilidade será

P (– 2,17 < Z < 2,17 ) = 1 –  , observando a tabela encontramos

logo 1 –  = 97% e  = 3% . Opção D.

(03)(BNDES/2009) Um pesquisador deseja testar se a renda do filho primogênito é maior que


a renda média de seus irmãos. Formula a hipótese nula Ho de que a diferença de rendas d =
0 e a hipótese alternativa H1 , d > 0, isto é, a de que a renda do primogênito seja maior que a
média das rendas dos irmãos. Desse modo, o(a)
(A) erro do tipo I consiste em aceitar Ho se Ho for falsa.
(B) erro do tipo II consiste em rejeitar Ho se Ho for verdadeira.
(C) poder do teste diminui com o tamanho da amostra.
(D) probabilidade do erro do tipo II é igual a (1 – poder do teste).
(E) probabilidade do erro do tipo II ou do tipo I é chamada de nível de significância do teste.
SOLUÇÃO
Questão envolvendo tipos de erro de um teste de hipótese, sabemos que:
Erro Tipo I (  ) : rejeitar Ho sendo Ho verdadeira ( erro de rejeição);
Erro Tipo II ( β ): não rejeitar Ho sendo Ho falsa ( erro de não rejeição). Opção D.

94
(04)(CAPES 2008) Considere as asserções a seguir.
A região de rejeição de um teste de hipóteses é obtida sob a suposição de que a hipótese da
nulidade (Ho) é verdadeira.
PORQUE
Em testes de hipóteses, o erro do tipo I é aquele cometido ao se rejeitar a hipótese da
nulidade (Ho) quando esta é verdadeira.
Analisando-se as asserções, conclui-se que
(A) as duas asserções são verdadeiras, e a segunda é uma justificativa correta da primeira.
(B) as duas asserções são verdadeiras, e a segunda não é uma justificativa correta da
primeira.
(C) a primeira asserção é verdadeira, e a segunda é falsa.
(D) a primeira asserção é falsa, e a segunda é verdadeira.
(E) a primeira e a segunda asserções são falsas.
SOLUÇÃO
As duas asserções são verdadeiras, pois, é convencionado que a região crítica seja definida
sob a suposição de que a hipótese nula seja verdadeira. Opção B.

(05)(AFRE MG/2005) Um fabricante afirma que pelo menos 95% dos equipamentos que
fornece à indústria encontram-se dentro de suas especificações. Uma amostra de 200 itens
escolhidos ao acaso revelou 10 itens fora de especificação. Assinale a opção que corresponde
ao valor probabilístico (p-valor) do teste de H: θ ≥ 0,95 contra A: θ < 0,95, sendo θ a
proporção populacional de itens dentro de especificação.
a) 0,500 b) 0,050 c) 0,025 d) 0,010 e) 0,100
Solução
Teste de Hipótese para Proporção, unicaudal para a esquerda, p-valor é a probabilidade de ter
um valor para a estatística de teste no mínimo tão extremo como o valor calculado (ZCALC ou
tCALC) para o teste. Então vamos calcular a estatística teste, neste caso, ZCALC para a
proporção que será dado por

note que p = f = 190/200 = 0,95, n = 200, q = 1 – f = 0,05 e p = 0,95 da hipótese. Como


Z = 0 divide a área da curva normal em duas partes de 50%, o p-valor será 0,5 . Opção A .

(06)(IPEA/2004) Um fabricante de lanternas operadas com gás butano anuncia que o


reservatório de gás de seu produto tem duração esperada μ de pelo menos 40 horas. Face à
reclamação de alguns consumidores, uma agência independente resolve verificar a veracidade
da afirmação do fabricante por meio do teste estatístico da hipótese H0: μ ≥ 40 contra a
alternativa H1: μ < 40 com controle do erro do tipo I em 5%. Uma amostra aleatória de 49

95
reservatórios produziu o valor médio de 38 horas. Suponha que a distribuição dos tempos
de duração do gás seja aproximadamente normal com desvio padrão de 7 horas.

Assinale a opção que dá o valor probabilístico (p-valor) do teste constituído com base na
estatística − 40.
a) 5% b) 2,3% c) 3% d) 4% e) 2,5%
Solução
1º) Teste de hipótese para a média, unicaudal a esquerda,  = 5% e 1 –  = 95% ( na
verdade não precisaremos destas duas informações), μ = 40, = 38, n=49 e σ=7.

2º) , note que na tabela temos o valor a probabilidade de 97,7%

até 2, para valores maiores do que 2 temos 2,3%, por simetria para valores menores do que –
2 também teremos 2,3%. Opção B .

QUESTÕES DE CONCURSOS

(01)(AFRE-SC 2010) Sejam as seguintes hipóteses estatísticas sobre a média de uma variável
X em uma população:
Hipótese nula: média = 100
Hipótese alternativa: média ≠ 100
Para testar as hipóteses coletou-se uma amostra aleatória de 16 elementos da população
citada, registrando os valores de X, resultando em: média amostral = 110; erro padrão = 4.
Admite-se que X tem distribuição normal na população. Deseja-se que o teste tenha
significância de 1%, acarretando em um valor crítico para a estatística de teste t, com 15
graus de liberdade, aproximadamente igual a 3. Com base nas informações existentes, o valor
da estatística de teste e a decisão do teste serão:
a) –2,5; aceitar a hipótese nula.
b) 2,5; aceitar a hipótese nula.
c) 2,5; rejeitar a hipótese nula.
d) 10; aceitar a hipótese nula.
e) 10; rejeitar a hipótese nula.

(02)(BNDES/2011) Uma máquina produz comprimidos de um medicamento. Conforme


indicado no rótulo do produto, cada comprimido deve pesar, em média, 0,5 g. Para testar se a

96
máquina está regulada corretamente, foi estabelecido um procedimento para testar a hipótese
H0 de que a massa média dos comprimidos produzidos é, de fato, igual a 0,5 g contra a
hipótese alternativa H1 de que tal massa é inferior a 0,5 g. O procedimento de teste consistiu
em pesar uma amostra de 100 comprimidos, obter a média m e o desvio padrão s das massas
registradas, em gramas, e rejeitar H0 quando m < 0,5 – 0,15 s. O nível de significância do
teste (ou seja, a probabilidade de se rejeitar a hipótese nula caso ela seja verdadeira) é,
aproximadamente,

(A) 0,059
(B) 0,067
(C) 0,119
(D) 0,134
(E) 0,150

(03)(ICMS RJ 2010) Para testar Ho: p < 0,5 contra H1: p > 0,5, sendo p a proporção de
pessoas que são protegidas por planos de previdência privada numa certa população, uma
amostra aleatória simples de tamanho 400 será obtida e será usado como critério de decisão
rejeitar a hipótese Ho se a proporção de pessoas com essa proteção na amostra for maior ou
igual a um certo número k. Ao nível de significância de 5%, o valor de k é aproximadamente
igual a:
(A) 0,508.
(B) 0,541.
(C) 0,562.
(D) 0,588.
(E) 0,602.

(04)(SEPLAG RJ 2010) Um fabricante de um produto alimentício afirma que a média de peso


das embalagens do seu produto é de, no mínimo, 1.015 gramas. Um fiscal, não acreditando
nessa afirmação, resolve testar a informação do fabricante e, para isso, selecionou uma
amostra aleatória simples de 100 embalagens desse produto, obtendo um desvio-padrão
amostral de 25 gramas. Considerando um teste de hipóteses unilateral à esquerda, a um nível
de significância de 5%, e que P(Z > −1,64) = 0,95, onde Z é variável normal padrão, o
menor valor de média amostral que permitirá aceitar a hipótese do fabricante é,
aproximadamente, de:
A) 1,1 Kg
B) 990 gramas
C) 965 gramas
D) 1 Kg
E) 1.011 gramas

97
(05)(BACEN Analista 2010) Com relação a um teste simples de hipótese, assinale a afirmativa
correta.
(A) Um teste bicaudal de nível de significância α rejeita a hipótese nula H0: μ = μo
precisamente quando μo está fora do intervalo de confiança de nível (1 − ) para μ.
(B) A hipótese nula a ser testada deve ser construída com muita atenção porquanto é o objeto
da inferência estatística, enquanto que a hipótese alternativa só precisa ser contrária à
hipótese nula.
(C) Se o grau de significância do teste é α, significa que (1− ) é a probabilidade de se
cometer erro do tipo I.
(D) Na definição de um teste, deve-se levar em conta que quanto menor o grau de
significância do teste (), maior será o poder do teste (π), uma vez que ( + π) = 1.
(E) Erro do tipo II, embora definido para uma hipótese alternativa específica, ocorrerá sempre
com probabilidade igual ao poder do teste.

(06)(IBGE 1999) Considere uma amostra aleatória de tamanho 36 de uma distribuição normal
com média μ e desvio padrão 1,8. Deseja-se testar H 0: μ ≤ 10 versus H 1: μ > 10. O teste
uniformemente mais poderoso de tamanho 1% rejeitará H 0 se a média amostral for, no
mínimo, igual a:
(a) 10,7
(b) 11,1
(c) 11,5
(d) 11,9
(e) 12,3

(07)(SUSEP 2006) Em uma distribuição de sinistro S, formulando-se a hipótese de que não há


diferença entre a freqüência esperada e a observada (hipótese nula: H 0). Donde, segundo um
determinado nível de significância, podemos afirmar que ocorreu
(a) um erro do tipo I, se for aceita a hipótese H0.
(b) um erro do tipo II, se for rejeitada a hipótese H0.
(c) um erro do tipo I, se for aceita a hipótese H0, sendo esta correta.
(d) um erro do tipo II, se for rejeitada a hipótese H0, sendo esta correta.
(e) um erro do tipo I, se for rejeitada a hipótese H0, sendo esta correta.

(08)(IBGE 2010) O salário médio nacional dos trabalhadores de certa categoria é igual a 4
salários mínimos, com desvio padrão de 0,8 salários mínimos. Uma amostra de 25
trabalhadores dessa categoria é escolhida ao acaso em um mesmo estado da União. O salário
médio da amostra é de μ salários mínimos. Deseja-se testar com nível de significância igual a
10%
Ho : μ = 4 contra H1 : μ ≠ 4
Considerando esses dados, analise as afirmativas.

98
I – O teste rejeitará Ho se for igual a 4,30.
II – O teste rejeitará Ho se for igual a 4,20.
III – O teste não rejeitará H0 se for igual a 3,75.
Está(ão) correta(s) APENAS a(s) afirmativa(s)
(A) I. (B) II. (C) III. (D) I e II. (E) I e III.

(09)(PETROBRAS/2010) No caso de um teste estatístico clássico, com a hipótese nula Ho e a


alternativa H1, cometer o erro do tipo II consiste em
(A) rejeitar Ho, sendo Ho verdadeiro.
(B) aceitar Ho, sendo Ho falso.
(C) aceitar H1, sendo H1 verdadeiro.
(D) rejeitar H1, sendo H1 falso.
(E) aceitar Ho e aceitar H1.

(10)(TRT 9ª R/2010) Uma amostra aleatória com 16 elementos é extraída de uma população
normal de tamanho infinito com média μ e desvio padrão desconhecido. O valor da média
amostral e o valor da variância amostral foram iguais a M e 625, respectivamente. Deseja-se
testar a hipótese H0: μ = 90 (hipótese nula) contra H1: μ > 90 (hipótese alternativa) com base
nos resultados apresentados pela amostra, ao nível de significância de 5%. Utilizou-se para o
teste a distribuição t de Student, considerando t0,05 o quantil da distribuição t de Student para
o teste unicaudal tal que P (t > t0,05) = 5%.

Sabendo-se que H0 não foi rejeitada, então o valor de M foi, no máximo,


(A) 103,3125. (B) 103,4750.
(C) 103,5000. (D) 103,6250.
(E) 103,6500.

(11)(TRT 4ª R Estatística/2009) Os lucros brutos anuais das empresas de um determinado


ramo de atividade apresentam uma distribuição normal com média μ e variância populacional
2
σ desconhecidas. A partir de uma amostra aleatória de tamanho 25 da população considerada
de tamanho infinito, deseja-se testar a hipótese H0: μ = 20 milhões de reais contra a
alternativa H0: μ > 20 milhões de reais, com a realização do teste t de Student. A média e o
desvio padrão da amostra são iguais a 23 e 8, respectivamente, em milhões de reais. Seja t c o
valor calculado correspondente para comparar com o valor tabelado t t da distribuição t de
Student, com n graus de liberdade, ao nível de significância . Então, é correto afirmar que

99
(A) H0 não será rejeitada, ao nível de significância  , se t t > 1,875 com n = 24.
(B) Se H0 foi rejeitada, ao nível de significância , tem-se que t t > 9,375 com n = 24.
(C) Se H0 foi rejeitada, ao nível de significância , então para um nível de significância superior
a  H0 não seria rejeitada.
(D) 1,875 < t c < 9,375 e n = 23.
(E) t c = 9,375 e n = 23.

(12)(MDA Estatístico/2009) Uma indústria produz baterias cuja duração segue uma
distribuição N (800;2500). O valor da estatística para testar a hipótese de que H0 : μ = 800
contra a alternativa de H1 : μ ≠ 800 se uma amostra aleatória de 30 baterias tem um tempo
médio de vida de 790 horas é:
A) -1,10
B) 3,20
C) -4,75
D) 0,25
E) -0,63

GABARITO
01)B 02)B 03)B 04)E 05)A 06)A 07)E 08)E 09)B (10)A (11)A (12)A

CAPÍTULO 05
CORRELAÇÃO LINEAR E REGRESSÃO LINEAR SIMPLES

A CORRELAÇÃO mede a força, a intensidade ou grau de relacionamento entre duas ou mais


variáveis, a REGRESSÃO fornece uma equação que descreve esse relacionamento em termos
matemáticos.

(5.1) CORRELAÇÃO : Podemos estudar essa relação com auxílio de um diagrama de


dispersão e/ou de um coeficiente de correlação.

(5.1.1) Diagrama de Dispersão :

100
Fig. 01 Fig. 02

Fig. 03 Fig. 04

Se as variáveis x e y crescem no mesmo sentido, isto é, quando x aumenta, em média y


também aumenta, diz-se que as 2 variáveis tem a mesma correlação positiva (Fig. 02). Se
as variáveis x e y variam em sentidos opostos, isto é, quando x aumenta, em média y diminui,
diz-se que as variáveis têm correlação negativa (Fig. 01). Na Fig. 03 não temos não temos
correlação entre x e y, e na Fig. 04 a correlação não é linear.

(5.1.2) Coeficiente de Correlação Amostral: Mede o grau de relação linear entre os


valores emparelhados X e Y em uma amostra. Assim como para médias e desvios padrão,
existe uma letra grega especial que utilizamos para o coeficiente de correlação populacional ρ .
Podemos considerar r como sendo uma estimativa de ρ.
Assim dadas duas amostras, uma da variável X e outra da variável Y, o coeficiente de
correlação amostral poderá ser calculado através da seguinte expressão:

no caso de uma população

no caso de uma amostra .

101
Obs.: Covariância : A covariância pode ser entendida como uma “variância conjunta” entre
duas variáveis, é uma medida de dependência linear entre X e Y. Enquanto a variância sai de
quadrados (da variável menos a média), a covariância é definida através de produtos:
Cov(X,Y) = E(X.Y) – E(X).E(Y) ,
Cov(X,Y) = média dos produtos - produto da média , se X e Y são variáveis aleatórias
independentes, então Cov( X, Y ) = 0, mas a recíproca não é verdadeira. Algumas
propriedades da covariância:
a) Cov(X, Y ) = Cov(Y,X);
b) Cov(X,X) = Var (X);
c) Cov (a + bX , c + dY ) = bd Cov (X, Y );

Se X e Y são v.a.’s independentes, então ρ(X, Y ) = 0 , note que a recíproca não é


verdadeira( cuidado com este fato!! ). A divisão pelo produto dos desvios-padrão, tem a
função de padronizar a medida e tornar possível a comparação com outras variáveis.

Obs.: Vejamos algumas características de r :


1º ) r = 1 correlação perfeita positiva
r = -1 correlação perfeita negativa
r = 0 correlação nula

2º ) r > 0, a variável independente aumenta quando a variável dependente aumenta, ou


seja, são diretamente proporcionais.
r < 0, a variável independente decresce quando a variável dependente decresce, ou
seja, são diretamente proporcionais.

ATENÇÃO!!
As propriedades mais importantes do coeficiente de correlação são:
1. O coeficiente de correlação é uma medida adimensional, isto é, ele é independente das
unidades de medida das variáveis X e Y.
2. Quanto mais próximo de +1 for “r”, maior o grau de relacionamento linear positivo entre X
e Y, ou seja, se X varia em uma direção Y variará na mesma direção.
3. Quanto mais próximo de -1 for “r”, maior o grau de relacionamento linear negativo entre X
e Y, isto é, se X varia em um sentido Y variará no sentido inverso.
4. Quanto mais próximo de zero estiver “r” menor será o relacionamento linear entre X e Y.
Um valor igual a zero, indicará ausência apenas de relacionamento linear.

Obs.: ρ2 ( r2 ou R2) é chamado de coeficiente de determinação ou de explicação.

PROPRIEDEADES:
• se ρ > 0, então a relação linear é positiva;

102
• se ρ < 0, então a relação linear é negativa.
• se ρ2 estiver próximo de 1, então dizemos que a relação linear é forte;
• se ρ2 estiver próximo de 0, então dizemos que a relação linear é fraca;
• se ρ2 for intermediário, então dizemos que a relação linear é moderada.

Podemos representar o coeficiente de correlação da seguinte forma:

, em que

“ covariância “ entre X e Y

“ variância “ de X

“ variância “ de Y

Mas também podemos representar da seguinte forma:

, esta representação é importante.

(5.1.3) Propriedade : Quando soma, subtrai, multiplica ou divide, a nova correlação fica
inalterada, devendo apenas tomar cuidado com o sinal negativo.

r(x,x)=1,0 r(-x, x)=-1,0 r(x, -x)=-1,0 r(-x,-x)=1,0 r(x,y) = r(y,x)

(5.2) REGRESSÃO LINEAR : Descrever a relação entre duas variáveis através de um gráfico
e da reta que melhor representa a relação. Essa reta é chamada de reta de regressão. Dada
uma coleção de dados emparelhados, a reta de regressão é aquela cuja equação descreve
algebricamente a relação entre duas variáveis. A reta de regressão também é chamada de reta
dos mínimos quadrados e sua equação é dada por Y= a + bX ,onde a( é o intercepto ) e
b( inclinação da reta ) são os parâmetros do modelo.

103
QUESTÕES RESOLVIDAS

(01) (BNDES 2009) Para ajustar uma reta a um conjunto de pontos no plano cartesiano, (xi,
yi), i = 1 a n, de modo que y = a + bx, as estimativas de a e de b são feitas minimizando a
soma dos quadrados dos erros verticais (supondo que os y sejam representados no eixo das
ordenadas do gráfico entre x e y). Nestas condições, a reta ajustada
(A) tem um intercepto a nulo, se todos os yi forem iguais a 1.
(B) tem uma inclinação b com sinal contrário ao do coeficiente de correlação entre os xi e os
yi.
(C) passa pelos pontos de máximo e de mínimo dos xi e dos yi, respectivamente.
(D) passa pelo ponto onde e são as médias dos xi e dos yi, respectivamente.
(E) passa pelo menos por dois pontos (xi, yi), pois é o mínimo necessário para definir uma
reta.
SOLUÇÃO
Calculado b, o valor de a será calculado, pois, a = -b. . Logo concluímos que
pertence à reta. Opção D.

(02) (ICMS RS 2009) Em relação às variáveis X, definida pela cotação média diária do dólar e
Y definida pelo valor máximo do índice BOVESPA no dia, obteve-se para um período de 30 dias
a equação de regressão linear de y sobre x: é y = 66720 + bx. Para uma cotação média do
dólar em 200 a reta de regressão permitiu estimar pontualmente um BOVESPA igual a 66480
e o teste do coeficiente angular de regressão mostrou uma relação linear estatisticamente
significativa entre as duas variáveis para um nível de significância de 0,05. A afirmação falsa
é:
a) Para uma cotação média de 220, o índice BOVESPA estimado é 66456.
b) Para um nível de significância de 0,05, a correlação linear é estatisticamente significativa
entre X e Y.
c) O coeficiente de correlação linear é positivo.
d) Através dos valores da covariância entre x e y e dos desvios padrões de x e y, pode-se
obter a correlação entre x e y.
e) Através dos valores do coeficiente de correlação, dos desvios padrões e das médias de x e
y, pode-se obter a reta de regressão de y sobre x.
SOLUÇÃO
Y = 66720 + b.X , como (66480, 200) pertence à reta  66480 = 66720 + b.(200), logo b
(coeficiente angular) vale b = -1,2 e teremos Y = 66720 – 1,2.X .
a.) Y = 66720 – 1,2.X Y = 66720 – 1,2.(220) = 66456. Opção correta.
b.) pelo enunciado concluímos que está correto. Opção correta.
c.) o coeficiente angular b = -1,2 é negativo, a correlação é negativa. Opção errada.

104
d.) está correto, ver cálculo da correlação. Opção correta.
e.) está correto, ver cálculo da regressão. Opção correta . Opção c.

(03)(CAPES 2008)Considere as asserções a seguir.


O Coeficiente de Correlação Linear de Pearson é necessariamente um número no intervalo
(−1,1) .
PORQUE
O Coeficiente de Correlação Linear de Pearson só pode ser calculado para variáveis
quantitativas.
Analisando-se as asserções, conclui-se que
(A) as duas asserções são verdadeiras, e a segunda é uma justificativa correta da primeira.
(B) as duas asserções são verdadeiras, e a segunda não é uma justificativa correta da
primeira.
(C) a primeira asserção é verdadeira, e a segunda é falsa.
(D) a primeira asserção é falsa, e a segunda é verdadeira.
(E) a primeira e a segunda asserções são falsas.
SOLUÇÃO
A primeira frase está correta. Como vimos, o coeficiente de correlação sempre assume valores
entre -1 e 1. A segunda frase também está correta. O coeficiente de correlação depende de
cálculo de somatório, o que só pode ser feito para variáveis quantitativas. Agora uma não
justifica a outra. Opção B.

(04)(INEP 2008) Considere as afirmações a seguir a respeito do Coeficiente de Correlação (r)


de Pearson entre duas variáveis.
I - Se r = 1, as observações estão todas sobre uma linha reta no diagrama de dispersão.
II - Se r > 0, a variável independente aumenta quando a variável dependente aumenta.
III - Se r < 0, a variável independente decresce quando a variável dependente decresce.
IV - Se r = 0, não existe relação entre as duas variáveis.
São corretas APENAS as afirmações
(A) I e II (B) I e III (C) II e III (D) II e IV (E) III e IV
SOLUÇÃO
I- Se r = 1, a relação linear é dita perfeita e, além disso, as duas variáveis têm relação direta
uma com a outra. Item correto.
II- Se r > 0 , a relação entre as variáveis é direta. Item correto.
III- Se r < 0 , neste caso a relação é inversa. Item errado.
IV- Se r = 0 , temos um forte sinal de que não haja relação linear, o que não impede que haja
outro tipo de relação (exponencial, logarítmica, etc). Item errado. Opção A.

(05)(CAPES 2008) Se as variáveis Y e X1 forem transformadas, respectivamente, para Y1 = -


2Y + 0,5 e X’1 = - X1+ 0,5, o coeficiente de correlação entre Y1 e X’1 será

105
(A) 0,382 (B) 0,059 (C) 0,059 C (D) 0,118 (E) 0,382
SOLUÇÃO
O coeficiente de correlação entre Y e X1 é de r = − 0,059 (ver figura). A partir destas
variáveis, criamos outras, por meio de uma multiplicação e uma soma, a propriedade da
correlação diz que “ quando soma, subtrai, multiplica ou divide, a nova correlação fica
inalterada, devendo apenas tomar cuidado com o sinal negativo “. Logo teremos
r( Y , X1 ) = - 0,059 e r’( Y1 , X’1 ) = r’( - 2Y + 0,5 , - X1+ 0,5 ) = r’( - Y , - X1 ) = r( Y , X1 )
= - 0,059. Opção C .

(06) (ANAC 2007) As estatísticas a seguir foram obtidas de observações realizadas em 100
indivíduos com relação a duas características X e Y.

O coeficiente de correlação amostral entre x e y é igual a:


(A) – 0,36; (B) – 0,18; (C) 0,44; (D) 0,72; (E) 0,80.
SOLUÇÃO

Vamos usar a relação teremos :

. Opção D .

(07) (TRF 2005) O coeficiente de correlação entre duas variáveis Y e X é igual a +0,8.
Considere, agora, a variável Z definida como: Z = 0,2 − 0,5 X
O coeficiente de correlação entre as variáveis Z e X, e o coeficiente de correlação entre as
variáveis Z e Y serão iguais, respectivamente, a:
a) – 1,0; – 0,8 b) + 1,0; + 0,8 c) – 0,5; – 0,8
d) – 0,5; + 0,8 e) – 0,2; – 0,4

106
SOLUÇÃO
r (x;y) = 0,80 e r (z;x) = r (- 0,5x + 0,2 ; x) = r( - x , x ) = - 1. Como apenas umas das
variáveis é negativa, ela irá influenciar o valor da correlação negativamente.
r (z; y) = r (-0,5x + 0,2 ; y) = r( x , y ) = -0,8. Opção A .

(08) (TRF 2005) Para 5 pares de observações das variáveis X e Y obteve-se os seguintes
resultados:

Sabendo-se que esses 5 pares de observações constituem a totalidade da distribuição conjunta


populacional dessas duas variáveis, o valor do coeficiente de correlação entre X e Y é igual a
a) + 1,000 b) + 0,709 c) + 0,390 d) – 0,975 e) – 0,600
SOLUÇÃO

Temos n = 5 e sabemos que , ,

e . Calculando teremos:

, e , logo

. Opção E .

QUESTÕES DE CONCURSOS

(01)(AFRE SC 2010) Um modelo linear (reta) de regressão apresenta inclinação igual a 1,5 e
intercepção igual a 10. Qual é o valor da variável dependente de acordo com o modelo de reta
quando a variável independente vale 20?
(A) 40
(B) 55
(C) 201,5
(D) 300
(E) 2001,5

107
(02)(APOFP SP 2010) Com base em um estudo de correlação e regressão, obteve-se o gráfico
abaixo correspondente à equação da reta deduzida pelo método dos mínimos quadrados (Y =
aX + b), utilizando 10 pares de observações (Xi ,Yi), i = 1, 2, 3, ..., 10. A média aritmética das
observações de Y apresentou o valor de 6,5.

A média aritmética das observações de X é


(A) 3,00
(B) 3,25
(C) 3,50
(D) 3,75
(E) 4,00

(03)(ICMS AP 2010) Se no ajuste de uma reta de regressão linear simples de uma variável Y
em uma variável X o coeficiente de determinação observado foi igual a 0,64, então o módulo
do coeficiente de correlação amostral entre X e Y é igual a:
(A) 0,24
(B) 0,36
(C) 0,50
(D) 0,64
(E) 0,80

(04)(DETRAN RS/2009) A reta de regressão de y sobre x é y= a + bx, Os desvios padrões de y


e x são, respectivamente, 2,1 e 1,4; o valor do coeficiente de correlação de X e Y é 0,8 e a
reta passa no ponto ( 8 ; 12,1). O valor de a (coeficiente linear) é
A) 2,95
B) 2,78
C) 2,50
D) 0,84

108
E) 0,88

(05)(ISS RJ 2010) A partir de uma amostra aleatória simples formada por 22 observações das
variáveis X e Y calculou-se

.
Obtenha a reta de regressão linear de Y em X.
a) Ŷi = 19 + 0,667 Xi .
b) Ŷi = 12,5 + 1,2 Xi.
c) Ŷi = 4 + 1,2 Xi .
d) Ŷi = 19 + 1,2 Xi .
e) Ŷi = 80 + 22,8 Xi.

(06)(ISS RJ 2010) Com os dados da questão anterior, calcule o valor mais próximo do
coeficiente de determinação R2 da regressão linear de X em Y.
a) 0,65
b) 0,81
c) 0,85
d) 0,91
e) 0,88

(07)(ICMS/RJ 2009) Utilizando uma análise de regressão linear simples, um pesquisador


obteve um ajuste Y = a1X + b1 e um coeficiente de determinação R12 . Um segundo
pesquisador analisou os mesmos dados, mas antes aplicou a cada observação de Y a
transformação Y '= 10Y +100 , obtendo um outro ajuste Y '= a2X + b2 , com um coeficiente
de determinação R22 . Considere as afirmativas abaixo, relativas à comparação entre os valores
obtidos nas duas análises:
I. a2 = 10a1; II. b2 = b1+100; III.R22 = R12 .
Assinale:

a) se somente a afirmativa I for verdadeira.


b) se somente as afirmativas I e II forem verdadeiras.
c) se somente as afirmativas I e III forem verdadeiras.
d) se somente as afirmativas II e III forem verdadeiras.
e) se todas as afirmativas forem verdadeiras.

(08)(SEPLAG RJ/2010) Para uma amostra de n pares de observações das variáveis X e Y foram

obtidas as seguintes estatísticas: = 3,24 e = 1,44 e = 0,65

109
O valor da covariância amostral entre X e Y será, aproximadamente, igual a:
A) 1,40
B) 1,68
C) 1,97
D) 3,03
E) 4,67

(09)(FINEP/2011) A equação da regressão linear é Y = a + bx. O método mais usado para


ajustar uma linha reta a um conjunto de pontos é conhecido como técnica dos mínimos
quadrados. Aplicando-se a equação linear com a técnica dos mínimos quadrados num caso em
que a empresa deseja saber o preço de venda de automóveis usados, cujas variáveis são o
preço do automóvel e a quilometragem que o mesmo já rodou (em 1.000 km), obteve-se a
equação Y = 24.356,00 − 155,48 x. Com base nessas informações, pode-se afirmar que o
preço de um automóvel que possua 20.000 quilômetros rodados tenha seu valor avaliado, em
reais, em
(A) 21.246,40
(B) 21.248,00
(C) 24.045,04
(D) 24.200,52
(E) 24.356,00

(10)(BNDES/2009) Para ajustar uma reta a um conjunto de pontos no plano cartesiano,


(xi, yi), i = 1 a n, de modo que y = a + bx, as estimativas de a e de b são feitas minimizando a
soma dos quadrados dos erros verticais (supondo que os y sejam representados no eixo das
ordenadas do gráfico entre x e y). Nestas condições, a reta ajustada
(A) tem um intercepto a nulo, se todos os yi forem iguais a 1.
(B) tem uma inclinação b com sinal contrário ao do coeficiente de correlação entre os x i e os yi.
(C) passa pelos pontos de máximo e de mínimo dos xi e dos yi respectivamente.
(D) passa pelo ponto ( , ), onde e são as médias dos xi e dos yi
respectivamente.
(E) passa pelo menos por dois pontos (xi, yi), pois é o mínimo necessário para definir uma
reta.
(11)(ICMS RJ/2011) A tabela abaixo mostra os valores de duas variáveis, X e Y.

Sabe-se que:

O valor de b na regressão simples Y = a + b.X é

110
a) 11/5 b) – 3/8 c) – 4/11 d) – 4/17 e) – 11/65

(12)(ELETROBRAS/2010) Uma regressão linear simples, Y = a + bX, é estimada pelo método


de minimização da soma dos quadrados dos erros, relacionando dois conjuntos de dados X e Y.
Os parâmetros estimados são a e b. Nesse contexto, NÃO é correto afirmar que a(o)
(A) soma dos resíduos será nula.
(B) reta estimada passará pelo ponto ( , ), onde e são as médias dos dados X e
dos dados Y.
(C) estimativa de b será negativa, se o coeficiente de correlação entre os dados X e Y for
negativo.
(D) distribuição de probabilidade do estimador de b é normal.
(E) método usado não minimiza a soma dos valores absolutos dos resíduos.

GABARITO
01)A 02)E 03)E 04)C 05)C 06)C 07)C 08)A 09)A 10)D 11)C 12)D

QUESTÕES

(01)(CNMPD 2015) A tabela de frequências absolutas abaixo corresponde à distribuição dos


valores dos salários dos funcionários de nível médio lotados em um órgão público no mês de
dezembro de 2014.

111
O valor da mediana destes salários, obtido pelo método da interpolação linear, em R$, igual a
(A) 5.320,00. (B) 5.040,00. (C) 5.260,00. (D) 4.900,00. (E) 5.400,00.

(02)(CNMPD 2015) Analisando a quantidade diária de processos autuados em uma repartição


pública, durante um período, obteve-se o seguinte gráfico em que as colunas representam o
número de dias em que foram autuadas as respectivas quantidades de processos constantes
no eixo horizontal.

A soma dos valores respectivos da mediana e da moda supera o valor da média aritmética
(quantidade de processos autuados por dia) em
(A) 1,85. (B) 0,50. (C) 1,00. (D) 0,85. (E) 1,35.

(03)(TCM SP 2015) Suponha que o tempo (em meses) decorrido para o exame de processos
administrativos no âmbito do TCM-SP tem distribuição de frequências conforme a seguir:

Considerando, para efeito de cálculo da média, os pontos médios dos intervalos, é possível
afirmar que:
(A) a mediana da distribuição é inferior a 5,5 meses;
(B) a média da distribuição está mais próxima de 4 do que de 6 meses;
(C) a distribuição é assimétrica à direita;
(D) a mediana da distribuição está entre 5,5 e 8 meses, inclusive;
(E) o percentil de ordem 90 é superior a 8 meses.

112
(04)(TRT 3ª R 2015) Durante um período de 40 dias úteis, realizou-se um levantamento com
relação a quantidade de reclamações trabalhistas em uma região. O quadro abaixo apresenta a
quantidade de reclamações correspondente a este levantamento.

Sabendo-se que a mediana da distribuição é igual a 2,5, obtém-se que o resultado do produto
da moda pela média aritmética(reclamações por dia) é
(A) 3,6. (B) 7,8. (C) 4,8. (D) 6,4. (E) 5,1.

(05)(TRE RR 2015) O quadro abaixo apresenta a quantidade de realizações de um


determinado evento durante 50 dias.

Se a média aritmética (realizações por dia), ponderada pelo número de dias, é igual à moda da
distribuição, então (2m + 3n) é igual a
(A) 45. (B) 25. (C) 20. (D) 40. (E) 30.

(06)(Detran MT 2015) Em uma determinada região, a população de motoristas do sexo


feminino representa 48% da população total. Sabe-se que a idade média da população de
motoristas do sexo feminino é 25 anos e a idade média de motoristas do sexo masculino é 40
anos. A idade média da população de motoristas é:
(A) 34,6 anos (B) 30,7 anos (C) 35,1 anos (D) 32,8 anos

(Detran MT 2015) O Box-plot (diagrama de caixas) é um gráfico utilizado para verificar a


distribuição de uma variável quantitativa. Segundo o Detran, os três tipos de veículos mais
frequentes em circulação no município de Cuiabá são: Automóvel, Motocicleta e Caminhonete.
Foi feito um levantamento sobre as velocidades em que cada um desses três tipos de veículos
foi multado ao passar por um radar onde a velocidade máxima permitida era 60 km/h.

(07) A partir da figura, assinale a afirmativa correta.


(A) O tipo de veículo caminhonete foi responsável pelo maior número de multas.
(B) O terceiro quartil do tipo de veículo motocicleta é maior que a mediana do tipo de veículo
automóvel.
(C) O tipo de veículo automóvel teve a maior variação na velocidade.
(D) A distância interquartílica do tipo de veículo automóvel é menor que a distância
interquartílica do tipo de veículo motocicleta.

(08) A partir das informações dadas, assinale a afirmativa correta.


(A) Aproximadamente 25% dos automóveis multados estavam acima de 100 km/h.
(B) Menos da metade das motocicletas multadas estava abaixo de 100 km/h.
(C) Mais de 75% das caminhonetes foram multadas por estarem acima de 100 km/h.

113
(D) Aproximadamente 50% das caminhonetes multadas estavam acima de 150 km/h.

(09)(TRT 3ª R 2015) Seja uma representação gráfica de dados de acordo com o desenho
esquemático abaixo (box-plot) que foi preparado para comparar todos os salários dos
funcionários do sexo masculino (Grupo I) com todos os salários dos funcionários do sexo
feminino (Grupo II) lotados em um órgão público.

Neste desenho esquemático


(A) o número de elementos do Grupo I é superior ao número de elementos do Grupo II.
(B) o módulo da diferença entre as medianas dos 2 grupos é igual a 25% do menor salário
deste órgão público.
(C) mais da metade dos elementos do Grupo I possui um salário inferior a R$ 5.000,00 ou
superior a R$ 10.000,00.
(D) o valor do menor salário do Grupo II corresponde a 37,5% do valor da mediana do GrupoI.
(E) a diferença interquartil do Grupo I é superior à diferença interquartil do Grupo II.

(10)(CNMPD 2015) O número de funcionários de três empresas A, B, e C, é igual a 20, 10 e


20, respectivamente. Sabe-se que dentre os funcionários de A, B e C, 40%, 20% e 25%,
respectivamente, são do sexo feminino. Três funcionários serão selecionados aleatoriamente e
sem reposição dentre os funcionários que são do sexo feminino. A probabilidade de,
exatamente, 2 serem da empresa C é igual a
(A) 5/17 . (B) 10/89 . (C) 20/91 . (D) 43/182 . (E) 12/45 .

(11)(CNMPD 2015) A probabilidade de uma criança no ano A e da faixa etária B, contrair


coqueluche é 0,2% se ela for vacinada e 1% se ela não for vacinada. Sabe-se que 90% da
população de crianças no ano A e da faixa etária B foram vacinadas. Se uma criança, da faixa
etária e do ano citados contrair coqueluche, a probabilidade de ela ter sido vacinada é igual a
(A) 9/14 . (B) 8/11 (C) 9/28 .
(D) 5/14 . (E) 10/28 .

(12)(UFSCAR 2015) A tabela a seguir representa o número de internamentos para


determinada patologia conforme acomodação:

114
Com base nessa tabela, assinale a alternativa que apresenta:
I. a probabilidade de internamento em enfermaria.
II. a probabilidade de internamento em apartamento ou estar com dengue.
III. a probabilidade da pessoa internada em apartamento sabendo-se que teve pneumonia.
(A) I) 0,266; II) 0,666; III) 0,12. (B) I) 0,120; II) 0,666; III) 0,12.
(C) I) 0,266; II) 0,566; III) 0,12. (D) I) 0,120; II) 0,666; III) 0,04.
(E) I) 0,120; II) 0,566; III) 0,04.

(13)(Detran MT 2015) No registro de um hospital, observou-se que 10% das internações por
motivos de acidentes com motocicletas, no trânsito de uma cidade, são fatais. A probabilidade
de que das últimas 6 internações pelo menos 2 sejam fatais é:
(A) 12,32% (B) 11,43%
(C) 11,56% (D) 12,42%

(14)(Detran MT 2015) A Secretaria de Trânsito de uma determinada cidade possui carros da


marca A e da marca B, que são utilizados diariamente na inspeção do trânsito nas ruas da
cidade. A probabilidade do carro da marca A apresentar problemas mecânicos é 2/5 e a do
carro da marca B é 3/8. A probabilidade de ao menos um dos carros apresentar problemas
mecânicos é:
(A) 0,628 (B) 0,632
(C) 0,636 (D) 0,625

(15)(Detran MT 2015) Dos carros que são utilizados pelo Departamento de Trânsito na
fiscalização das ruas de uma cidade, 40% usam gasolina comum, 35% usam gasolina
aditivada e 25% usam gasolina premium. Dos que usam gasolina comum, apenas 30% rodam
com tanque cheio; dos que usam gasolina aditivada, 60% rodam com tanque cheio e dos que
usam gasolina premium, 50% rodam com tanque cheio. A probabilidade de um carro
selecionado ao acaso usar gasolina aditivada com tanque cheio é:
(A) 12% (B) 21%
(C) 14% (D) 18%

(16)(Detran MT 2015) Sejam X e Y dois eventos:


X: um motorista possui cartão A para pagamento de taxas do Detran;
Y: um motorista possui cartão B para pagamento de taxas do Detran.
Supondo-se P(X) = 50%, P(Y) = 40% e P(X  Y) = 25%, a probabilidade de um motorista
selecionado aleatoriamente ter pelo menos um dos dois tipos de cartão é:
(A) 0,62 (B) 0,65
(C) 0,64 (D) 0,61

(17)(TRT 3a R 2015) A tabela a seguir apresenta a distribuição de frequências conjunta das


variáveis sexo e salário, relativas a um grupo de 200 funcionários de um órgão público. A
variável salário está representada por faixas de salário em número de Salários Mínimos − SM.

115
Um funcionário será selecionado ao acaso desse grupo, a probabilidade dele não ter salário na
faixa 8 l── 12 ou ser do sexo feminino, é, em %, igual a
(A) 30. (B) 80. (C) 60.
(D) 70. (E) 40.

(18)(CNMPD 2015) Suponha que o número de acidentes, envolvendo motociclistas, que ocorre
diariamente em uma avenida marginal de uma grande cidade, seja uma variável aleatória X
com distribuição de Poisson com média de λ acidentes. Sabe-se que a probabilidade de
ocorrerem, diariamente, 3 acidentes é igual a probabilidade de ocorrerem 4 acidentes. Nessas
condições, a probabilidade de, em um determinado dia, ocorrer pelo menos 2 acidentes é, em
−2 −4
%, igual a Dados: e = 0,135; e = 0,018
(A) 86,5. (B) 94,6. (C) 91,0.
(D) 62,4. (E) 48,8.

(19)(TRT 3ª R 2015) A comissão de erradicação do trabalho infantil de um determinado


Tribunal Regional do Trabalho analisa, por meio de seu canal de denúncias, casos de
desrespeito à legislação que regula o trabalho de menores de 18 anos. Suponha que a variável
X, que representa o número de denúncias mensais que são recebidas, tem distribuição de
Poisson com média 9. Nessas condições, a probabilidade de serem recebidas 2 ou 3 denúncias
−1 −2 −3
em um período de 10 dias é igual a Dados: e =0,37, e =0,14, e =0,05
(A) 0,450. (B) 0,472. (C) 0,230.
(D) 0,375. (E) 0,250.

(20)(TRE RR 2015) Uma pessoa coloca um anúncio em um site de vendas com o objetivo de
vender seu automóvel. Suponha que o número de consultas que essa pessoa recebe por
semana (7 dias) como resposta ao anúncio seja uma variável aleatória com distribuição de
Poisson com média igual a 3,5. Nessas condições, a probabilidade dessa pessoa receber, pelo
−0,5 −3,5
menos, 2 consultas em um determinado dia é, em %, igual a Dados: e =0,61; e =0,03
(A) 8,5. (B) 13,5. (C) 10,5.
(D) 32,8. (E) 9,6.

(21)(TJ RO 2015) O número de recursos em um processo é uma variável aleatória de Poisson


com parâmetro λ = 5. Então a probabilidade de que um processo tenha menos do que 2
recursos é:
–5 –5 –5
(A) 31e ; (B) 6e ; (C) 5e ;
–5 –5
(D) 1 – e ; (E) 1 – 31e .

ATENÇÃO!!!!! Você vai perceber que, em algumas das questões abaixo, foi usada a
notação de MÓDULO. Quando aparecer, por exemplo, P(|Z|>1,25)=0,21 , significa
P( Z < - 1,25 ou Z > + 1,25 ) = 0,21 , ou seja, temos as duas partes laterais da
Gaussiana e a probabilidade de cada uma será 0,105( 0,21 : 2 ).

(22)(TCM SP 2015) Uma cuidadosa pesquisa de preços sobre os custos da construção civil,
mais especificamente para a edificação de certos tipos de infraestruturas públicas, demonstrou
que o valor por metro quadrado tem distribuição próxima da Normal com média de R$1.600 e

116
variância 14.400. São fornecidos também valores da distribuição normal padrão e respectivas
probabilidades, conforme abaixo:

Suponha que, para fins de fiscalização, o Tribunal de Contas do Município de São Paulo tenha
convencionado que, dentre todas as obras, as 10% mais caras deveriam passar por um exame
ainda mais detalhado. Então, isso significa que o critério estabelecido determina, estatisticamente ,
que uma obra deverá receber um tratamento mais rigoroso quando o custo por metro
quadrado for superior a:
(A) R$ 1.403,20; (B) R$ 1.446,40; (C) R$ 1.753,60;
(D) R$ 1.796,80; (E) R$ 1.835,20.

(23)(TJ RO 2015) Suponha que o valor das causas de ações (X) do juizado especial de certa
localidade seja normalmente distribuído com média 20 (salários mínimos) e variância 25. Além
disso, estão disponíveis as seguintes informações da normal-padrão (Z):
P(|Z|>1,25)=0,21, P(|Z|>1,50)=0,13, P(|Z|>1,75)=0,08
Então a probabilidade de que P(X > 26,25) é de:
(A) 4,0%; (B) 6,5%; (C) 8,0%;
(D) 10,5%; (E) 21,0%.

(24)(TJ SP 2015) Em uma distribuição normal, em que 9% dos dados estão acima de 20, e
15% dos dados estão abaixo de 10, os valores mais próximos da média e do desvio padrão
são, respectivamente,
(A) 10,1 e 2,2. (B) 11,3 e 2,5. (C) 13,1 e 3,2.
(D) 13,5 e 3,3. (E) 14,4 e 4,2.

(25)(Detran MT 2015) Em uma cidade, do Centro-Oeste brasileiro, realizou-se uma pesquisa


com uma amostra aleatória de 100 motoristas, dos quais metade disse já não suportar a
violência diária no trânsito. A estimativa da proporção de motoristas que já não suportam a
violência diária no trânsito, por meio de um intervalo de confiança de 95%, é:
Considere Z* = 1,960
(A) (0,4902; 0,5098) (B) (0,4020; 0,5980)
(C) (0,4951; 0,5049) (D) (0,4920; 0,5908)

(26)(Detran MT 2015) Deseja-se saber se a proporção de usuários de determinado posto de


gasolina entre os moradores de uma grande região é realmente 30%, como se imagina. Há
uma relação atualizada desses moradores a partir da qual pretende-se retirar uma amostra
aleatória simples para fazer essa verificação. Que tamanho deve ter a amostra para que o
intervalo de confiança (95%) referente ao parâmetro a ser estimado tenha 10 pontos
percentuais para mais e para menos? Considere z = 2
(A) 88 (B) 84
(C) 841 (D) 384

(27)(TRT 3ª R 2015) Uma amostra aleatória de tamanho 225 é extraída de uma população
(P1) normalmente distribuída e de tamanho infinito. Sabe-se que a variância de P1 é igual a
64. Com base nesta amostra, um intervalo de confiança de nível (1 − α) foi construído para a
média μ' de P1 e foi igual a [28,64 ; 31,36]. Em uma outra população (P2), independente da
primeira, também normalmente distribuída e de tamanho infinito com média μ'', obteve-se
com base em uma amostra aleatória de tamanho 400 um intervalo de confiança de nível (1 −
α) para μ'' igual a [20,286 ; 21,714]. O desvio populacional de P2 é igual a
(A) 6,0. (B) 8,4. (C) 5,6.

117
(D) 6,4. (E) 7,2.

(28)(CNMPD 2015) Uma amostra aleatória de tamanho 256 é extraída de uma população
normalmente distribuída e considerada de tamanho infinito. Considerando que o desvio padrão
populacional é igual a 100, determinou-se, com base na amostra, um intervalo de confiança de
86% igual a [890,75 ; 909,25]. Posteriormente, uma nova amostra de tamanho 400,
independente da primeira, é extraída desta população, encontrando-se uma média amostral
igual a 905,00. O novo intervalo de confiança de 86% é igual a
(A) [897,60 ; 912,40]. (B) [899,08 ; 910,92]. (C) [901,30 ; 908,70].
(D) [903,15 ; 906,85]. (E) [903,30 ; 906,70].

(29)(CNMPD 2015) Uma pesquisa é realizada em uma grande cidade com uma amostra
aleatória de 300 habitantes em que 75% deles manifestaram-se favoráveis à implantação de
um projeto para melhorar o atendimento ao público de sua cidade. Com base nesta amostra,
deseja-se obter um intervalo de confiança de 95% para esta proporção, considerando que a
distribuição amostral da frequência relativa dos habitantes favoráveis ao projeto é normal.
Utilizando a informação da distribuição normal padrão (Z) que as probabilidades P(Z > 1,96) =
0,025 e P(Z > 1,64) = 0,050, este intervalo de confiança é, em %, igual a
(A) [71,68 ; 78,32]. (B) [71,34 ; 78,66] (C) [70,90 ; 79,10].
(D) [70,40 ; 79,60]. (E) [70,10 ; 79,90].

(30)(CNMPD 2015) Um intervalo de confiança de 95% para a média μ de uma população


normal de tamanho infinito e variância desconhecida foi construído com base em uma amostra
aleatória de tamanho 16 e com a utilização da distribuição t de Student. Considere t 0,025 o
quantil da distribuição t de Student para o teste unicaudal tal que a probabilidade
P(t > t0,025) = 0,025, com n graus de liberdade.

Se a variância amostral foi igual a 4,84, então a amplitude do intervalo é igual a


(A) 2,332. (B) 2,338. (C) 2,343. (D) 2,340. (E) 2,354.

(31)(TRT 3ª R 2015) A amostra aleatória { X1, X2, X3, ... , X9 } foi extraída de uma
população normal de tamanho infinito com variância (σ2) desconhecida.

Com base nesta amostra, deseja-se obter um intervalo de confiança de 90% para a média μ
da população utilizando a distribuição t de Student levando em conta a tabela a seguir.

Este intervalo é igual a


(A) [10,860 ; 13,140]. (B) [11,172 ; 12,828]. (C) [10,902 ; 13,098].

118
(D) [10,884 ; 13,116]. (E) [11,160 ; 12,840].

(32)(TJ BA 2015) Para a realização de uma pesquisa de opinião será extraída uma amostra
aleatória cujo tamanho deve ser calculado a priori. O objetivo é estimar a proporção de
pessoas que acreditam nos órgãos da Justiça para a solução de conflitos. Levantamentos
anteriores constataram que a proporção estava próxima de 75%. O erro máximo tolerado para
a estimativa é de 5 pontos percentuais e o grau de confiança deve ser de 95%. A tabela a
seguir fornece valores tabelados da Z, normal-padrão.

Então, o tamanho mínimo da amostra é:


(A) 50 (B) 75 (C) 100
(D) 120 (E) 200

(33)(TJ SP 2015) Para avaliar o tempo médio de viagem entre o ponto inicial e o ponto final de
uma linha de ônibus, retira-se uma amostra de 36 observações (viagens), encontrando-se,
para essa amostra, o tempo médio de 50 minutos e o desvio padrão de 6 minutos, com
distribuição normal. Considerando-se um intervalo de confiança de 95% para o tempo médio
populacional, é correto afirmar que o valor mais próximo para limite inferior desse intervalo é
o tempo de
(A) 40 min. (B) 44 min. (C) 48 min.
(D) 52 min. (E) 56 min.

(34)(CNMPD 2015) Um pesquisador desenvolve um estudo com uma população normal,


considerada de tamanho infinito e desvio padrão populacional igual a 65. Sendo μ a média da
população, deseja executar o teste H0: μ = 70 (hipótese nula) contra H1: μ > 70 (hipótese
alternativa). Para isto, utiliza uma amostra aleatória de tamanho 400 com um nível de
significância de 5%, considerando que na curva normal padrão (Z) as probabilidades P(Z >
1,64) = 0,050 e P(Z > 1,96) = 0,025. O pesquisador encontrou um valor para a média
amostral ( ) sabendo-se que este valor é o maior valor tal que H0 não é rejeitada. O valor
de é
(A) 77,41. (B) 76,37. (C) 75,33. (D) 78,45. (E) 79,49.

(35)(CNMPD 2015) Com relação a testes de hipóteses estatísticas e denominando H0 como


sendo a hipótese nula e H1 a hipótese alternativa, a definição de potência de um teste
corresponde à probabilidade de
(A) não rejeitar H0, quando H0 é verdadeira.
(B) não rejeitar H0, quando H0 é falsa.
(C) não rejeitar H0, independentemente de H0 ser falsa ou verdadeira.
(D) rejeitar H0, quando H0 é verdadeira.
(E) rejeitar H0, quando H0 é falsa.

(36)(UFSCAR 2015) Com relação ao Erro tipo I e tipo II, assinale a alternativa correta.
(A) Hipótese nula é rejeitada quando é verdadeira; Hipótese nula não é rejeitada quando é
falsa.
(B) Hipótese nula não é rejeitada quando é verdadeira; Hipótese nula não é rejeitada quando é
falsa.
(C) Hipótese nula é rejeitada quando é verdadeira; Hipótese nula é rejeitada quando é falsa.
(D) Hipótese nula não é rejeitada quando é verdadeira; Hipótese nula é rejeitada quando é
falsa
(E) Hipótese nula não interfere no Erro.

119
(37)(TRT 3ª R 2015) De uma população normal e de tamanho infinito com o desvio padrão
populacional igual a 4 extrai-se uma amostra aleatória de tamanho 64. Com base nesta
amostra, deseja-se saber, ao nível de significância de 5%, se a média μ desta população é
inferior a 30. Foram formuladas as hipóteses H0: μ = 30 (hipótese nula) e H1: μ < 30
(hipótese alternativa) com utilização das informações da curva normal padrão (Z) que as
probabilidades P(Z > 1,64) = 0,05 e P(Z > 1,28) = 0,10. O menor valor encontrado para a
média amostral ( ) tal que H0 não é rejeitada apresenta um valor igual a
(A) 29,59. (B) 28,36. (C) 28,72.
(D) 29,84. (E) 29,18.

(38)(Detran MT 2015) Uma firma de ônibus coletivos da cidade W coletou informações sobre
as idades (X) e as alturas (Y) de 12 crianças, filhos dos motoristas, a fim de estudar se estas
estavam bem nutridas. A média e o desvio padrão das 12 idades e alturas são,
respectivamente, = 25 meses, SX = 3 meses e = 80 cm, SY = 2,5 centímetros.
Observou-se que a correlação entre as idades e as alturas foi = 0,90. Um modelo de regressão
linear simples da forma Yi = 0 + 1Xi + i foi ajustado. A estimativa de mínimos quadrados
para 0 e 1 é, respectivamente:
(A) 61,25 e 0,75 (B) 61,10 e 0,73 (C) 61,25 e 0,73 (D) 61,10 e 0,75

(39)(TRE RR 2015) considere um estudo com o objetivo de obter a relação entre duas
variáveis X e Y por meio do modelo Y i = α + βXi + ∈i, em que i corresponde à i-ésima
observação de X e Y. Os parâmetros α e β são desconhecidos e ∈i é o erro aleatório com as
respectivas hipóteses consideradas para a regressão linear simples. Com base em 20 pares de
observações (Xi , Yi), i = 1, 2, ..., 20 e utilizando o método dos mínimos quadrados foram
obtidas as estimativas para α e β.

Considerando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que o
valor para X tal que Y = 15 é
(A) 6,0. (B) 10,5. (C) 9,0.
(D) 7,5. (E) 12,0.

(40)(CNMPD 2015) Seja o modelo linear Yi = βXi + εi estabelecendo uma relação linear, sem
intercepto, entre duas variáveis X e Y, em que Yi é a variável dependente na observação i, Xi é
a variável explicativa na observação i e εi o erro aleatório com as respectivas hipóteses para a
regressão linear simples. O parâmetro β do modelo é desconhecido e sua estimativa foi obtida
pelo método dos mínimos quadrados com base em 10 pares de observações (Xi , Yi).

Considerando a equação da reta obtida pelo método dos mínimos quadrados, obtém-se que Y
é igual a 24 quando X for igual a
(A) 15. (B) 6. (C) 16.
(D) 18. (E) 20.

120
Gabarito:
01)B 02)A 03)D 04)E 05)D 06)D 07)B 08)C 09)D 10)C 11)A 12)C 13)B 14)D
15)B 16)B 17)B 18)C 19)A 20)A 21)B 22)C 23)D 24)E 25)B 26)B 27)C 28)A
29)E 30)C 31)D 32)B 33)C 34)C 35)E 36)A 37)E 38)A 39)C 40)A

TABELAS

121
122
123
124
t- Student

125

Você também pode gostar