Você está na página 1de 336

ESTATÍSTICA

PDF SINTÉTICO

Livro Eletrônico
Presidente: Gabriel Granjeiro
Vice-Presidente: Rodrigo Calado
Diretor Pedagógico: Erico Teixeira
Diretora de Produção Educacional: Vivian Higashi
Gerência de Produção de Conteúdo: Magno Coimbra
Coordenadora Pedagógica: Élica Lopes

Todo o material desta apostila (incluídos textos e imagens) está protegido por direitos autorais
do Gran. Será proibida toda forma de plágio, cópia, reprodução ou qualquer outra forma de
uso, não autorizada expressamente, seja ela onerosa ou não, sujeitando-se o transgressor às
penalidades previstas civil e criminalmente.

CÓDIGO:
231227032871

THIAGO CARDOSO

Engenheiro eletrônico formado pelo ITA com distinção em Matemática, analista-


chefe da Múltiplos Investimentos, especialista em mercado de ações. Professor
desde os 19 anos e, atualmente, leciona todos os ramos da Matemática para
concursos públicos.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
PDF SINTÉTICO
Estatística
Thiago Cardoso

SUMÁRIO
Apresentação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
PDF Sintético – Estatística. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1. Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.1. Média Aritmética. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3. Moda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4. Robustez x Sensibilidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2. Gráficos Estatísticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1. Frequências. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2. Gráficos de Barras ou Colunas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3. Gráfico de Setores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4. Histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5. Separatrizes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3. Variância e Desvio Padrão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1. Procedimento de Cálculo da Variância e do Desvio Padrão. . . . . . . . . . . . . . . 35
3.2. Propriedades do Desvio Padrão e Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3. Coeficiente de Variação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.4. Normalização. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.5. Covariância e Correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4. Técnicas de Amostragem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.1. Amostragem Casual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2. Amostragem não Casual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5. Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.1. Conceitos Básicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.2. Categorias Especiais de Eventos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.3. Probabilidade da União . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 3 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

5.4. Probabilidade Condicional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52


6. Distribuições de Probabilidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.1. Números Binomiais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.2. Distribuição de Bernouilli. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.3. Distribuição Binomial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.4. Distribuição Normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.5. Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7. Intervalos de Confiança. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.1. Definição do Intervalo de Confiança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.2. Erro Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.3. Intervalo de Confiança para Proporção. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.4. População Finita. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
8. Testes de Hipóteses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
8.1. Tipos de Testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
8.2. Valor-P ou P-valor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
8.3. Nível de Significância. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
8.4. Tipos de Erros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
8.5. Modalidades dos Testes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
9. Regressão Linear. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
9.1. Equação da Regressão Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
9.2. Análise de Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
10. Momentos de Variáveis Aleatórias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
10.1. Definições dos Momentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
10.2. Integral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
10.3. Distribuições Contínuas de Probabilidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
10.4. Distribuições Discretas de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
10.5. Distribuições Conjuntas de Probabilidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Questões de Concurso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 4 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Gabarito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
Gabarito Comentado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 5 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

APRESENTAÇÃO
Fala meu filho, faaaaaaaaaaaala minha filha!
Escrever um livro é algo desafiador. Porém, escrever para o público concurseiro torna
a tarefa ainda mais árdua.
Afinal, há candidatos com diferentes níveis de conhecimento, estudando para seleções
de áreas variadas. No entanto, existe algo em comum entre aqueles que se preparam
para um concurso público: todos querem a aprovação o mais rápido possível e não têm
tempo a perder!
Foi pensando nisso que esta obra nasceu. Você tem em suas mãos um material sintético!
Isso porque ele não é extenso, para não desperdiçar o seu tempo, que é escasso. De igual
modo, não foge da batalha, trazendo tudo o que é preciso para fazer uma boa prova e
garantir a aprovação que tanto busca!
Também identificará alguns sinais visuais, para facilitar a assimilação do conteúdo. Por
exemplo, afirmações importantes aparecerão grifadas em azul. Já exceções, restrições ou
proibições surgirão em vermelho. Há ainda destaques em marca-texto. Além disso, abusei
de quadros esquemáticos para organizar melhor os conteúdos.
Tudo foi feito com muita objetividade, por alguém que foi concurseiro durante muito
tempo. Para você me conhecer melhor, comecei a estudar para concursos ainda na
adolescência, e sempre senti falta de ler um material que fosse direto ao ponto, que me
ensinasse de um jeito mais fácil, mais didático.
Enfrentei concursos de nível médio e superior. Fiz desde provas simples, como recenseador
do IBGE, até as mais desafiadoras, sendo aprovado para defensor público, promotor de
justiça e juiz de direito.
Usei toda essa experiência, de 16 anos como concurseiro, e de outros tantos ensinando
centenas de milhares de alunos de todo o país para entregar um material que possa
efetivamente te atender.
A Coleção PDF Sintético era o material que faltava para a sua aprovação!
Professor Aragonê Fernandes

APRESENTAÇÃO DO PROFESSOR
Eu sou o Professor Thiago Cardoso, serei o professor que vai te acompanhar na parte
de exatas.
Minha trajetória em concursos públicos começou bem cedo, quando eu tinha 16 anos.
Nessa época, eu resolvi que queria ser militar e decidi estudar para entrar no ITA (Instituto
Tecnológico de Aeronáutica), um dos concursos mais difíceis do país.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 6 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

O meu primeiro ano de estudos foi marcado por muita falta de base, especialmente
em matemática, e, por isso, tive pouca evolução. No final do ano, fiz a prova e obtive um
péssimo resultado. No primeiro momento, achei que seria impossível conseguir meu objetivo.
Porém, eu não desisti e resolvi na minha segunda tentativa reforçar a minha base e
entender de verdade. No meu segundo ano de estudos, cheguei a enfrentar uma rotina de
12 horas por dia de estudos. Mas, mesmo assim, não obtive êxito.
Isso tem muito a ver com ser concurseiro. Não devemos desistir nunca. Somente na
minha terceira tentativa, eu consegui a aprovação e entrei para o ITA, instituição em que
me formei no ano de 2013.
Eu também fui nomeado como analista de controle externo do TCE-PE no concurso
realizado no ano de 2017 e leciono exatas para concursos públicos desde esse ano.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 7 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

PDF SINTÉTICO – ESTATÍSTICA

1. MEDIDAS DE POSIÇÃO
Dois conjuntos fundamentais na estatística são os conceitos de população e amostra.
• População: corresponde a todo o conjunto de pessoas, itens ou eventos sobre os
quais se deseja conhecer uma determinada propriedade ou fazer uma inferência.

Por exemplo, suponha que você deseja conhecer a altura média dos brasileiros. Nesse caso,
a população será todo o conjunto de brasileiros.
• Amostra: na maioria das situações, é inviável medir as propriedades de todo o conjunto
em estudo. Por isso, é comum selecionar um subconjunto de elementos da população
para realizar o estudo. Esse subconjunto é denominado amostra.

Por exemplo, suponha que você é um funcionário do IBGE e fez uma pesquisa com várias
pessoas e aferiu sua altura.

1.1. MÉDIA ARITMÉTICA


A média aritmética é uma medida à qual já estamos bastante acostumados. É utilizada
para calcular a sua média na escola e na faculdade.
Pense, por exemplo, que você faz uma faculdade, em que você precisa de média 6,5 para
ser aprovado em uma matéria, que tem duas provas bimestrais e um exame.
Na primeira prova, você se deu bem e tirou 8,5. Na segunda prova, você estudou um
pouco menos e tirou 7,5. Crente que já estava com boas notas, você estudou menos ainda
para o exame e tirou 5,0. Qual a sua média final?

Então, você conseguiu! Tirou média 7,0 e conseguiu ser aprovado.

1.1.1. MÉDIA ARITMÉTICA PONDERADA

É muito comum na estatística que uma variável estatística seja observada muitas vezes
com o mesmo valor. Por exemplo, na Tabela 1, uma empresa que possui 80 funcionários fez
uma pesquisa com eles para sabre quantos filhos eles possuíam.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 8 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Tabela 1: Número de Filhos por Casal

Número de Filhos Quantidade de Casais


0 17
1 33
2 21
3 7
4 2
5 0

Quando se tem uma tabela desse gênero, para se calcular o número de filhos médio
das pessoas entrevistadas, deve-se utilizar as frequências de cada uma das classes como
peso para a média.
Em outras palavras, devemos multiplicar as observações (no caso, o número de filhos)
pela quantidade de casais que possuem aquela quantidade de filhos. No denominador,
dividimos pela soma dos pesos, no caso, a soma das quantidades de casais.

Portanto, o número médio de filhos da amostra tratada na Tabela 1, é igual a 1,3 filhos.

1.1.2. MÉDIA ARITMÉTICA PARA DADOS CATEGORIZADOS


No caso de uma variável contínua, o gráfico de distribuição de frequências é construído
em torno de categorias.
Uma categoria inclui um conjunto de valores possíveis. É o que acontece, por exemplo,
com o salário, que é normalmente representado por meio de faixas salariais.
Suponha que foi feita uma estatística dos empregados de uma determinada empresa
por faixa salarial (em função do salário mínimo).
Tabela 3: Dados sobre os Salários dos Funcionários de uma Empresa

Faixa Salarial Número de Empregados


1a3 50
3a5 32
5a7 12
7a9 6

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 9 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

O salário é uma variável contínua. Observe que uma pessoa pode ganhar 1,5 salário
mínimo ou 2,4 salários mínimos. Não há qualquer impedimento para isso.
Nesse caso, a técnica mais utilizada para a média é a técnica do ponto médio, que
consiste em supor que todas as observações de uma determinada categoria podem ser
colocadas no ponto médio da respectiva classe.
O ponto médio de uma classe corresponde à média aritmética dos seus extremos.
Tabela 4: Dados sobre os Salários dos Funcionários de uma Empresa

Faixa Salarial Ponto Médio Número de Empregados


1a3 2 50
3a5 4 32
5a7 6 12
7a9 8 6
Agora, podemos calcular a média para o conjunto de dados categorizados fornecidos.

Essa técnica é bem interessante e muito recorrente em questões de prova. Fique de olho.
RESUMO DA ÓPERA

Modalidade Fórmula Conceito


Para dados em rol Soma tudo e divide pela quantidade de termos.

Para dados em tabela Utilizar as frequências como pesos.

Para dados categorizados Utilizar o ponto médio de cada categoria.

1.2. MEDIANA
Para o cálculo da mediana, deve-se dispor em ordem crescente todos os elementos
da amostra. Escolhe-se como a mediana o valor que divide a amostra em duas partes
de tamanho igual, de modo que o número de elementos inferiores à mediana é igual ao
número de elementos superiores à mediana.
Quando a amostra é formada por uma quantidade ímpar de termos, a mediana
corresponderá exatamente a um elemento da amostra. Vejamos um exemplo:
{23, 27, 29, 31, 40, 46, 48}

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 10 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Essa amostra tem 7 elementos, que é um número ímpar. A mediana será igual ao termo
central que é:

O termo 31 tem uma interessante propriedade nessa sequência: ele divide a amostra
em duas partes. São três elementos inferiores à mediana e três elementos superiores
à mediana.
Quando os dados são listados na forma de um rol com N termos, sendo N um número
ímpar, a mediana será sempre um elemento da amostra, que pode ser obtido com a posição:

Por outro lado, quando a amostra possui uma quantidade par de termos, a mediana
corresponderá à média aritmética dos dois termos centrais.
{23, 27, 29, 31, 35, 40, 46, 48}
Os dois termos centrais estão em negrito.

Retornando à amostra, temos que metade dos elementos da amostra são inferiores à
mediana, destacados em negrito, e a outra metade é superior.

É muito comum em questões de provas, os dados serem fornecidos na forma de um


rol, porém, desordenado.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 11 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

{28, 27, 28, 36, 34, 51, 43, 29, 32, 38}
Nesse caso, você precisará ordená-lo para calcular a mediana.
28 27 28 36 34 51 43 29 32 38
x2 x1 x3 x7 x6 x10 x9 x4 x5 x8
Como o rol tem um número par de elementos, já sabemos que a mediana será obtida
pela média aritmética de dois pontos.

A mediana pode ser obtida como a média entre os termos x5 e x6.

1.2.1. MEDIANA EM DADOS CATEGORIZADOS


No caso de dados categorizados, a mediana deve ser calculada com o uso da técnica de
interpolação linear.
Tabela 4: Exemplo de Dados Categorizados

Número de Alunos
Nota
(Frequência Absoluta)
0 |– 1 20
1 |– 2,5 16
2,5 |– 4 5
4 |– 5 1

O total de alunos nessa classe é 42. Tomaremos como mediana o elemento que ocupa
exatamente a posição definida como 42/2. Não se soma 1 no caso de dados categorizados.

Agora, devemos localizar a classe mediana, que é aquela que está localizado o elemento 21.

Nota Número de Alunos Frequência Acumulada Elementos


0a1 20 20 1 a 20
1 a 2,5 16 36 21 a 36
2,5 a 4 5 41 37 a 41
4a5 1 42 42

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 12 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Tomaremos os pontos extremos da segunda classe (onde está localizada a mediana) e


da classe anterior.
Definiremos que o elemento x20 será o ponto extremo da primeira classe e que o elemento
x36 será o extremo da segunda classe. E faremos uma interpolação linear para encontrar o
elemento x21.

Destacaremos a região entre o x21 e o início da interpolação linear.

A parte à esquerda (que vai do 20 ao 21) deve ser proporcional a todo o trecho preto.
Sendo assim, temos:

Perceba que tomamos as medidas 20 a 21 do lado esquerdo e toda a medida de 20 a


36 no lado direito da proporção.
No numerador da fração, estão as medidas da parte superior, ou seja, o valor da variável
X, enquanto, no denominador da fração, estão as medidas da parte inferior, ou seja, a
posição ocupada pela medida.

A interpolação linear pode parecer um pouco estranha, porém, o procedimento será o


mesmo para todas as questões. É só uma questão de treino.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 13 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

1.3. MODA
A moda é a segunda medida de posição que nós vamos estudar. Como o próprio nome
diz, ela se refere ao valor observado mais frequente da amostra.
Quando os dados de uma amostra são apresentados na forma de um rol, basta contar
cada um deles:
{1, 1, 2, 2, 2, 3, 3, 4, 5, 6}
Como destacado no rol em estudo, o número 2 é visto por três vezes, portanto, a moda
da amostra é 2.
Tome cuidado para não cair na seguinte pegadinha: a moda de uma amostra é o valor
mais frequentemente observado, e não a quantidade de vezes que esse valor aparece no rol.
Nesse caso, o número 2 aparece três vezes. Portanto, a moda é igual a 2, e não igual a 3.

1.3.1. MODA DE CZUBER


Essa expressão é utilizada para calcular a moda em dados categorizados, como a
mostrada a seguir.
Faixa Salarial Número de Empregados
1 |– 3 32
3 |– 5 50
5 |– 7 12
7 |– 9 6

O primeiro passo para determinar a moda de Czuber dessa distribuição é determinar a


classe modal, que é a classe com a maior frequência de empregados. Nesse caso, é a classe
de 3 a 5 salários mínimos, que conta com 50 empregados.
Figura 1: Classe Modal

Devemos destacar:
• Linf: o limite inferior da classe modal, ou seja, o menor valor possível da classe;

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 14 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

• h: amplitude da classe modal, ou seja, a diferença entre o limite superior e o inferior


da classe;
• Δfant: a diferença entre as frequências da classe modal e da classe anterior;
• Δfpost: a diferença entre as frequências da classe modal e da classe posterior.
No exemplo em apreço, registramos:

A expressão da Moda de Czuber é:

Agora, vamos às contas:

1.4. ROBUSTEZ X SENSIBILIDADE


A média aritmética é sensível a valores atípicos (outliers). Já a mediana e a moda são
estimativas robustas.
Por exemplo, considere os seguintes dados sobre o número de filhos por casal dos
funcionários de uma determinada empresa.
Tabela 1: Número de Filhos por Casal

Número de Filhos Quantidade de Casais


0 4
1 5
2 7
3 3
4 0
5 1

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 15 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

A média aritmética é calculada como a média ponderada do número filhos, utilizando


a quantidade de casais como peso.

Suponha que, a esse grupo, fosse adicionado um casal que tivesse 20 filhos. Esse casal
é um outlier, pois ele tem um número de filhos muito superior aos outros casais. Enquanto
os demais têm de 0 a 4 filhos, esse casal é o único que tem 20 filhos.
Ao adicionar o outlier, o que aconteceria com a média?
Para descobrirmos, precisamos atualizar os dados da Tabela 1.
Tabela 2: Número de Filhos por Casal com um Outlier

Número de Filhos Quantidade de Casais


0 4
1 5
2 7
3 3
4 0
5 1
20 1
Calculando a nova média ponderada:

Observe que, com a adição de um único elemento outlier à amostra, a média passou
de 1,65 para 2,65 – um aumento bastante expressivo.
Perceba que, quando existem outliers, a média pode ser bastante enganosa

2. GRÁFICOS ESTATÍSTICOS
O ser humano é bastante visual. E os gráficos se comunicam muito bem com essa
necessidade.
Os gráficos transmitem a informação de maneira muito simples de entender. Por
isso, eles podem ser vistos nas mais variadas fontes de informação.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 16 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

2.1. FREQUÊNCIAS
Para estudar o histograma, precisamos ver primeiramente alguns conceitos.
• Frequência Absoluta: é a contagem de todas as vezes que uma variável estatística
assume determinado valor.
• Frequência Relativa: indica a proporção de vezes que uma variável estatística assume
determinado valor. Por proporção, entendemos uma proporção percentual.
• Frequência Acumulada: indica a proporção de vezes que uma variável estatística
assume um valor igual ou menor ao valor de referência.
Para exemplificar esses conceitos, suponha que, dentre os funcionários de uma empresa,
encontram-se: 25 recebem até 5 salários mínimos, 18 recebem entre 5 e 10 salários mínimos,
6 recebem entre 10 e 15 salários mínimos e 1 formado em engenharia. Com base nesses
dados, quais seriam as frequências absoluta, relativa e acumulada de cada categoria?
Primeiramente, vamos montar uma tabela com as frequências absolutas, que são
justamente os dados que foram fornecidos na questão. Podemos, ainda, calcular o total
de funcionários dessa empresa, somando-se todas as categorias.
Tabela 2: Exemplo de Distribuição de Frequências para uma Variável Qualitativa

Frequência
Faixa Salarial Frequência Absoluta Frequência Relativa
Acumulada
Até 5 salários
25
mínimos
5 |– 10 18
10 |– 15 6
15 |– 20 1
Total 50

Para calcular as frequências relativas, vamos calcular os percentuais de cada categoria


em relação ao total.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 17 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Assim, podemos colocar na tabela os valores colocados.


Tabela 2: Cálculo da Frequência Relativa

Frequência
Faixa Salarial Frequência Absoluta Frequência Relativa
Acumulada
Até 5 salários
25 50%
mínimos
5 |– 10 18 36%
10 |– 15 6 12%
15 |– 20 1 2%
Total 50 100%

A frequência acumulada da primeira classe é igual à sua própria frequência relativa. Para
as classes seguintes, é preciso somar a frequência acumulada da classe anterior.

Tabela 8: Cálculo da Frequência Acumulada

Frequência
Faixa Salarial Frequência Absoluta Frequência Relativa
Acumulada
Até 5 salários
25 50% 50%
mínimos
5 |– 10 18 36% 86%
10 |– 15 6 12% 98%
15 |– 20 1 2% 100%
Total 50 100%

O cálculo da frequência acumulada só faz sentido quando a variável é quantitativa ou


ordinativa.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 18 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

2.2. GRÁFICOS DE BARRAS OU COLUNAS


São gráficos bastante versáteis, podendo ser utilizados facilmente com variáveis
qualitativas e também com variáveis quantitativas discretas. Mas não podem ser utilizados
com variáveis quantitativas contínuas, como veremos ainda.
São muito úteis para notar tendências estatísticas nos dados.
Figura 7: Exemplo de Gráfico de Colunas

Fonte: G1 e FBSP
No gráfico mostrado na Figura 7, podemos notar que a tendência de número de
assassinatos no Brasil é relativamente estável. Houve um pequeno crescimento entre os
anos 2012 e 2017, porém, foi normalizado retornando à faixa de 40 mil a 50 mil assassinatos
por ano nos anos de 2018 e 2019.
É possível também usar também colunas e barras mistas. Vejamos exemplos.
Figura 9: Exemplo de um Gráfico para uma Série Mista

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 19 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

2.3. GRÁFICO DE SETORES


O gráfico de setores, também conhecido como pizza, é muito utilizado para comparar
proporções. São muito úteis para representar séries especificativas e geográficas, mas não
há nada que os impeça de serem utilizados para séries temporais.
Nesses gráficos, geralmente, o círculo fechado (ou a pizza completa) corresponde ao
ângulo de 360º e à proporção de 100%.
Vejamos um exemplo:

Curso Alunos Porcentagem


Medicina 200 40%
Engenharia 50 10%
Direito 250 50%
Total 500

O ângulo ocupado pelas instâncias é proporcional à sua porcentagem ocupada na


amostra. Basta multiplicar essa porcentagem pelo ângulo de 360º, que corresponde ao
círculo completo.

Dessa forma, podemos traçar o seguinte gráfico de pizza.


Figura 12: Exemplo de Gráfico de Setores

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 20 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

De maneira geral, você pode ter em mente o seguinte esquema.

O gráfico de pizza é usado preferencialmente para representar a frequência relativa.


O diagrama de barras (ou colunas) é usado preferencialmente para representar a
frequência absoluta.

2.4. HISTOGRAMAS
Uma distribuição de frequência é uma organização da variável em classes de valores,
e não mais em valores únicos. Nesse caso, são muito utilizados os gráficos na forma de
histogramas.

2.4.1. CLASSES
As variáveis contínuas podem ser agrupadas em faixas. Somos acostumados a ouvir
“faixa salarial de quatro a oito salários mínimos”. Considere, por exemplo, o seguinte
conjunto de dados.
Tabela 8: Exemplo de uma Variável Contínua fornecida em classes

Faixa Salarial Frequência Absoluta Frequência Relativa Frequência Acumulada


0 |– 5 25 50% 50%
5 |– 10 18 36% 86%
10 |– 15 6 12% 98%
15 |– 20 1 2% 100%
Total 50 100%

Vejamos os principais elementos em uma classe.


• Intervalo da Classe: corresponde ao conjunto de elementos contidos entre o limite
inferior e superior da classe. É importante prestar atenção ao sinal “|” que identifica
se o intervalo é aberto ou fechado.
− 5 |– 10: é um intervalo fechado à esquerda e aberto à direita. Assim, ele inclui o
extremo inferior, mas não inclui o extremo superior. Logo, ele inclui o 5, mas não
inclui o 10.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 21 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

− 5 –|10: é um intervalo aberto à esquerda e fechado à direita. Assim, ele não inclui
o extremo inferior, mas inclui o extremo superior. Logo, ele não inclui o 5, mas
inclui o 10.
− 5 |–|10: é um intervalo fechado tanto à esquerda como a direita. Assim, ele inclui
tanto o extremo inferior como o extremo superior. Logo, ele inclui tanto o 5 como
o 10.
− 5 – 10: é um intervalo aberto tanto à esquerda como a direita. Assim, ele não in-
clui nem o extremo inferior nem o extremo superior. Logo, ele não inclui nem o 5
nem o 10.
• Amplitude (h): corresponde à diferença entre o limite inferior e superior da classe.
Ponto Médio (PM): corresponde à média aritmética entre os extremos de uma classe.
Tabela 10: Cálculo da Amplitude e do Ponto Mèdio

Faixa Salarial Amplitude Ponto Médio


0 |– 5 5-0=5 (0 + 5)/2 = 2,5
5 |– 10 10 - 5 = 5 (5 + 10)/2 = 7,5
10 |– 15 15 - 10 = 5 (10 + 15)/2 = 12,5
15 |– 20 20 - 15 = 5 (15 + 20)/2 = 17,5

2.4.2. CONSTRUÇÃO DO HISTOGRAMA


As classes podem ser representadas em histogramas tanto pelo seu intervalo completo
como por seu ponto médio. Vejamos exemplos das duas representações:
Figura 4: Representação de um Histograma em Classes representadas por seus intervalos

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 22 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Causa muita estranheza quando as classes são representadas por seus pontos médios.
Mas saiba que isso pode acontecer em algumas situações. Então, esteja preparado para isso.
Figura 5: Representação de um Histograma em Classes representadas por seus pontos médios

2.4.3. HISTOGRAMA X DIAGRAMA DE BARRAS


Devemos observar que existe uma importante diferença entre o histograma e o diagrama
de barras:
• o histograma é utilizado para distribuições de frequências em classes, o que
normalmente acontece com variáveis contínuas;
• o diagrama de barras só pode ser utilizado para variáveis discretas, pois só se aplica
a frequências propriamente ditas, e não a distribuições em classes.
É comum se dizer também que o histograma não tem espaços vazios. Para entender
essa diferença, vamos comparar um diagrama de barras sobre o Número de Filhos (variável
discreta) e os Salários dos Funcionários (variável contínua) de uma empresa.
Figura 6: Comparação entre um Diagrama de Barras e um Histograma

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 23 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

2.5. SEPARATRIZES
Suponha que você queira trazer um carro de super luxo para o Brasil e gostaria de saber
se haverá público. Para você, pode ser interessante saber a renda dos 10% mais ricos do país.
Outra situação é se você for um produtor de arroz e feijão e você precisa saber a renda
dos 30% mais pobres do país para avaliar qual seria o custo ideal do seu produto.
E é justamente aí que entram as separatrizes. Com o auxílio delas, podemos determinar
um valor que separa as 10% maiores observações da amostra ou as 30% menores.
Para calcular as separatrizes, primeiramente, devemos organizar as observações da
variável estatística estudada em ordem crescente.
As separatrizes mais comuns são os quartis e os decis. Os quartis são três marcos que
dividem a amostra em quatro partes de igual tamanho. Já os decis são nove marcos.
Figura 31: Quartis e Decis

A respeito dos quartis de uma amostra, pode-se dizer que:


• Q1 é o número que deixa 25% das observações abaixo e 75% acima;
• Q2 é a mediana da amostra e deixa 50% das observações abaixo e 50% das observações
acima;
• Q3 é o número que deixa 75% das observações abaixo e 25% acima.
Analogamente, pode-se dizer para os decis que:
• D1 é o número que deixa 10% das observações abaixo e 90% acima.
• D2 é o número que deixa 20% das observações abaixo e 80% acima.
• D3 é o número que deixa 30% das observações abaixo e 80% acima.
• E, assim por diante, até chegarmos ao D9, que é o número que deixa 90% das
observações abaixo e 10% acima.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 24 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Os quartis e os decis fazem parte de um grupo de medidas de posição, conhecidas


genericamente como quantis. Um quantil é qualquer tipo de separatriz.
Na obtenção das separatrizes, no caso de dados em rol, assim como é feito para a
mediana, é necessário realizar a correção N + 1. Dessa maneira, se uma amostra é composta
por N elementos, os quartis e decis serão:
Tabela 21: Posição associada aos Quartis e Decis

Quartil Elemento Frequência Acumulada


Q1 (N+1)/4 25%
Q2 (N+1)/2 50%
Q3 3(N+1)/4 75%
D1 (N+1)/10 10%
D9 9(N+1)/10 90%

Como exemplo, temos a seguir a população das 19 cidades mais populosas do Brasil:

Posição Município População Posição Município População

1 São Paulo 12.038.175 11 Goiânia 1.448.639

Rio de
2 6.498.837 12 Belém 1.446.042
Janeiro

3 Brasília 2.977.216 13 Guarulhos 1.337.087

4 Salvador 2.938.092 14 Campinas 1.173.370

5 Fortaleza 2.609.716 15 São Luís 1.082.935

Belo
6 2.513.451 16 São Gonçalo 1.044.058
Horizonte

7 Manaus 2.094.391 17 Maceió 1.021.709

Duque de
8 Curitiba 1.893.997 18 886.917
Caxias

9 Recife 1.625.583 19 Natal 877.662

10 Porto Alegre 1.481.019

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 25 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

No caso do cálculo de quartis, apenas peço atenção para fato de que as cidades foram
organizadas em ordem decrescente de população, como é comum em tabelas de dados
desse gênero. Porém, a medida de quartis pede a organização por ordem crescente.
Sendo assim, a primeira cidade (x1) seria Natal, a quinta cidade seria São Luís – é só
contar de baixo para cima – e a décima quinta cidade seria Fortaleza.
Como a amostra é formada por 19 cidades, podemos calcular os quartis da seguinte maneira:

Nesse caso, o segundo quartil (mediana) seria a população de Porto Alegre.


Por fim, gostaria de chamar a atenção para o caso de que sejam fornecidos dados
categorizados. Nesse caso, os quartis devem ser calculados por interpolação linear.

2.5.1. CÁLCULO DE QUANTIS EM DADOS CATEGORIZADOS


Para mostrar como devemos proceder no cálculo dos quantis no caso de dados
categorizados, vamos utilizar a seguinte distribuição.
É importante destacar que, assim como no caso do cálculo da mediana, a frequência
acumulada também auxilia bastante.
Tabela 22: Exemplo de Distribuição de Frequências em Classes: Cálculo da Frequência Acumulada

Classe de Salários Frequência Relativa Frequência Acumulada


4 |– 8 40% 40%
8 |– 12 25% 65%
12 |– 16 20% 85%
16 |– 20 10% 95%
20 |– 24 5% 100%
Total 100,00% 100,00%

Suponha que precisamos calcular o primeiro quartil (Q1), o terceiro quartil (Q3), o primeiro
decil (D1) e o nono decil (D9).
O primeiro quartil será aquele em que a frequência acumulada atingirá 1/4 ou 25%. Já
o terceiro quartil é registrado quando a frequência acumulada atinge 75%.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 26 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Analogamente, para o primeiro decil, que divide a amostra em 10 partes, temos que o
primeiro decil acontece quando a frequência acumulada atinge 10% e o nono decil quando
atinge 90%.
Vamos localizar as classes em que os quantis desejados estão localizados. Tanto o
primeiro quartil (Q1) como o primeiro decil (D1) estão localizados na primeira classe de 4 a
8 salários mínimos.

Classe de Salários Frequência Relativa Frequência Acumulada


4 |– 8 40% 40%
8 |– 12 25% 65%
12 |– 16 20% 85%
16 |– 20 10% 95%
20 |– 24 5% 100%
Total 100,00% 100,00%

No caso específico da primeira classe, a interpolação linear deve ser feita considerando
que o menor valor possível (4) corresponde à frequência acumulada de 0% e o maior valor
possível (8) corresponde à frequência relativa da classe (40%).

Pela interpolação linear, o pedaço de segmento à esquerda é proporcional ao segmento


inteiro. Isso significa que devemos pegar a razão entre as diferenças da porção superior
(D1 - 4) e inferior (10% – 0%) da porção esquerda do segmento.

Classe de Salários Frequência Relativa Frequência Acumulada


4 |– 8 40% 30%
8 |– 12 25% 65%
12 |– 16 20% 85%
16 |– 20 10% 95%
20 |– 24 5% 100%
Total 100,00% 100,00%

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 27 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Devemos igualar essa razão à mesma razão tomada do segmento inteiro. Assim, devemos
tomar a diferença na porção superior (8 – 4) e dividir pela diferença parte inferior (30% –
0%) referentes ao segmento inteiro.

E, agora, fazemos o mesmo procedimento para o primeiro quartil (Q1).

Agora, vamos calcular o terceiro quartil (Q3). Para isso, devemos localizar a classe em
que a frequência acumulada atinge 75%.
Para a interpolação linear, devemos considerar o extremo da classe anterior (12)
correspondendo à marcação de 65% e o extrema da classe do quantil (16) correspondente
à marcação de 85%.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 28 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Fazendo a interpolação linear, temos:

Por fim, vamos calcular o nono decil.

Classe de Salários Frequência Relativa Frequência Acumulada


4 |– 8 40% 40%
8 |– 12 25% 65%
12 |– 16 20% 85%
16 |– 20 10% 95%
20 |– 24 5% 100%
Total 100,00% 100,00%

Vamos montar o esquema da interpolação linear:

E, agora, façamos as contas.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 29 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Agora, vamos esquematizar para entendermos melhor o significado dos quantis calculados.

No caso de dados categorizados, lembre-se de que, mesmo quando eles são fornecidos
na forma de frequência absoluta, não devemos efetuar a correção (N+1)/4 para o cálculo
dos quartis nem (N+1)/2 para o cálculo da mediana.
Quando os dados são fornecidos em classes, tomamos o quartil como N/4 e a
mediana como N/2.

2.5.2. DIAGRAMA BOX PLOT


Os diagramas Box Plot são utilizados para representar várias observações de uma mesma
variável em função quantitativa, normalmente contínua, em função de outra variável
independente.
Esses diagramas são amplamente usados no meio científico, principalmente em pesquisas
relacionadas à área da saúde. No mercado de investimentos, é utilizado o chamado diagrama
candle stick (ou diagrama de velas), que é uma ligeira alteração do Box Plot.
Sendo assim, eu considero um dos mais importantes no meio profissional e, por isso,
as chances de serem cobrados em uma prova de concurso público são razoáveis.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 30 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Os diagramas Box Plot resumem uma grande quantidade de informação em suas linhas.
Por exemplo, suponha que monitoramos o número de horas que um grupo de pessoas
dormiu durante uma semana. O resultado obtido pode ser resumido a partir do seguinte gráfico:
Figura 32: Diagrama Box Plot sobre o número de horas dormidas por um grupo de pessoas

O diagrama Box Plot recebe esse nome porque é formado por uma série de caixas. As
caixas são compostas por 5 elementos:
Figura 33: Composição da Caixa do Box Plot

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 31 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Por ser composta pelos quartis, a caixa do Box Plot forma quatro regiões em que cada
uma delas contém 25% das observações da amostra.
Figura 34: Box Plot evidenciando os quartis

Sendo assim, podemos afirmar, com segurança, que o interior da caixa do Box Plot
contém 50% das observações da amostra. Isso acontece porque 50% das observações se
situam entre o primeiro e o terceiro quartis.

A faixa no interior da caixa do Box Plot representa a mediana. As questões vão tentar lhe
enganar, afirmando que é a média. Porém, o Box Plot somente evidencia só os quartis da
amostra, incluindo a mediana (Q2), ele não mostra a média.

Agora, vamos falar sobre os limites. Os limites superior e inferior são os limites para
a detecção de outliers. Eles são calculados a partir do chamado desvio interquartílico (D)
ou intervalo interquartílico, que é dado pela diferença entre o terceiro e o primeiro quartis.

Obs.:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 32 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

O limite superior se situa 1,5 desvio interquartílico acima do terceiro quartil e o limite
inferior se situa 1,5 desvio interquartílico abaixo do primeiro quartil. Assim, podemos escrever:

Obs.:
Se uma observação qualquer da amostra está fora dos limites superior e inferior, essa
observação é chamada de outlier.
Os outliers são observações atípicas de uma variável aleatória. No diagrama Box Plot, eles
são destacados. Na Figura 32, pode-se ver vários outliers tanto para cima como para baixo.
Por exemplo, na terça-feira, houve um outlier – uma pessoa que dormiu muito mais
que todos os outros. Ela conseguiu dormir mais de dez horas, enquanto todas as demais
pessoas observadas dormiram menos de nove horas – o limite superior é um pouco inferior
a nove horas.
Por outro lado, na sexta-feira, houve uma pessoa que dormiu 0 horas. Essa também é
um outlier, pois todas as demais dormiram entre 6 e 12 horas.
É importante citar que, quando não é encontrado nenhum outlier, os limites inferior e/
ou superior devem ser modificados para o valor máximo e mínimo da amostra.
Por exemplo, na segunda-feira, não houve nenhum outlier. Portanto, podemos garantir
que uma pessoa dormiu quatro horas e outra pessoa dormiu nove horas, pois esses são os
limites inferior e superior.

2.5.3. AVALIAÇÃO DE OUTLIERS


Um dos grandes objetivos do Box Plot é evidenciar a existência ou não de outliers.
Em alguns casos, os outliers podem indicar a existência de alguma falha no procedimento
de medida.
Por exemplo, imagine que você esteja avaliando um radar de trânsito e descobre que
houve um carro que passou por ele a mais de 500km/h. Essa medida é um outlier.
Porém, é um outlier que não faz nenhum sentido, portanto, é um sinal de que houve
uma falha no radar. Pode ser interessante pedir para um técnico monitorar o equipamento
para descobrir se a falha foi pontual ou se outras medidas podem estar comprometidas.
Em outros casos, como na Figura 32, a existência de outliers é normal. Porém, o excesso
deles é que deve chamar a atenção do pesquisador.
Por exemplo, imagine que houve um dia da semana em que 5% da população de uma
cidade dormiu abaixo de três horas, aparecendo vários outliers.
Esse fato, com certeza, é estranho e o pesquisador pode se interessar por entender o
que causou esse comportamento.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 33 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Em outros casos, a presença de outliers pode ser, por si só, de grande interesse. Por
exemplo, numa pesquisa sobre a margem de lucro de empresas do mesmo setor, se você
encontrar um outlier positivo, essa empresa mais eficiente pode ser um alvo de estudos.
O que faz que ela tenha um desempenho tão acima da média das outras? É possível que
outras empresas do setor copiem as suas práticas para melhorar seus resultados?
Dessa forma, podemos concluir que a avaliação dos outliers depende muito do tipo
de pesquisa que está sendo feita. Vale lembrar que a Estatística é uma ferramenta para
outras áreas do conhecimento e não gera, por si só, conclusões sobre a matéria em análise.

Com relação aos dados que resultaram no diagrama mostrado na figura precedente,
julgue os itens a seguir.

3. VARIÂNCIA E DESVIO PADRÃO


A variância e o desvio padrão são medidas da heterogeneidade de um conjunto de dados.
Porém, considere as três populações a seguir:
{3, 3, 3, 3, 3}
{1, 2, 3, 4, 5}
{-1, 1, 3, 5, 7}
É fácil perceber que todas essas populações têm média igual a 3. Porém, elas são
bastante diferentes entre si.
A primeira delas é homogênea. Ou seja, todos os elementos são iguais e nenhum deles
destoa da média.
A segunda amostra já perde um pouco essa característica. Há um desvio em relação
à média de todos os elementos mostrados. No caso da terceira amostra, ela é a mais
heterogênea, porque existem vários elementos que destoam bastante da média. Ela se
inicia em -1 e termina em 7.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 34 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

É por isso que precisamos de um novo conceito, conhecido como medidas de dispersão.
As principais são a variância e o desvio padrão.
Quanto maior a heterogeneidade de uma amostra, maiores serão a variância e o
desvio padrão da população.
Então, vamos aprender a calculá-las?

3.1. PROCEDIMENTO DE CÁLCULO DA VARIÂNCIA E DO DESVIO PADRÃO


Para calcular a variância de um conjunto de dados, você pode seguir o passo-a-passo:
1. Calcule a média aritmética dos termos da amostra ou população;
2. Calcule os desvios de cada observação em relação à média;
3. Eleve os desvios calculados ao quadrado;
4. Some todos os desvios e:
• se for uma população: divida por N;

Obs.:
Esse estimador deve ser também utilizado quando se fala em uma amostra, mas a
questão pede o estimador de máxima verossimilhança.
• se for uma amostra: divida por N – 1;

Obs.:
Esse estimador é utilizado quando for pedida a estimativa não tendenciosa ou não
viciada. Caso o enunciado não diga nada, fale somente que é uma amostra, suponha que é
esse o estimador a ser utilizado.
A própria questão deve informar se o conjunto em estudo se trata de uma população ou
de uma amostra. Caso a questão não informe, suponha que é uma população e divida por N.
1. O desvio padrão é igual à raiz quadrada da variância:
Desse modo, se estivermos falando de uma população, a fórmula de cálculo do
desvio padrão é:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 35 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Por outro lado, se estivermos falando de uma amostra, a fórmula de cálculo do


desvio padrão é:

Obs.:
Vamos fazer um exemplo, e você vai ser capaz de entender.
Por exemplo, calculemos a variância padrão da população {1, 2, 3, 4, 5}. Devemos fazer
a conta em três passos:
• Calculamos a média da população:

• Calculamos os desvios de todas as observações em relação à média:


X X-μ (X - μ)²
1 1 - 3 = -2
2 2 - 3 = -1
3 3-3=0
4 4-3=1
5 5-3=2
• Elevamos os desvios calculados ao quadrado:
X X–μ (X - μ)²
1 1 - 3 = -2 (-2)² = 4
2 2 - 3 = -1 (-1)² = 1
3 3-3=0 (0)² = 0
4 4-3=1 (1)² = 1
5 5-3=2 (2)² = 4
• Por fim, somamos todos os quadrados dos desvios e dividimos pelo número de
elementos na amostra.

3.1.1. EQUAÇÕES PARA O CÁLCULO DA VARIÂNCIA POPULACIONAL


É possível demonstrar que a variância populacional pode ser obtida como a média dos
quadrados menos o quadrado da média.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 36 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Essa expressão é bastante útil. Algumas questões aparecem com somatório imensos
que assustam à primeira vista. Porém, se a banca fornecer o somatório dos quadrados,
você poderá mais facilmente calcular a variância.

3.2. PROPRIEDADES DO DESVIO PADRÃO E VARIÂNCIA


• Não são afetados por uma constante de soma ou subtração:


• Quando a variável é multiplicada por uma constante, o mesmo acontece com o desvio
padrão:

• No caso da variância, a constante sai elevada ao quadrado:

• A variância da soma de duas variáveis aleatórias independentes é igual à soma das


variâncias:

3.3. COEFICIENTE DE VARIAÇÃO


• É dado pela razão entre o desvio padrão e a média;

• Não é afetado por uma constante multiplicativa;

3.4. NORMALIZAÇÃO
• Consiste em subtrair a média e dividir pelo desvio padrão. Dessa forma, chega-se a
uma variável aleatória com média nula e desvio padrão unitário

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 37 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

3.5. COVARIÂNCIA E CORRELAÇÃO


O desvio padrão e a variância são duas medidas de variabilidade que se aplicam a uma
única variável aleatória.
Elas são muito úteis para medir a oscilação dessas variáveis em torno da média.
A covariância e a correlação são ferramentas matemáticas para avaliar se duas variáveis
oscilam juntas em torno de suas respectivas médias ou se suas oscilações são independentes.

3.5.1. PASSO A PASSO PARA O CÁLCULO DA COVARIÂNCIA


• Calcule as médias das duas variáveis aleatórias.
• Calcule os desvios de cada observação em relação à média.
• Faça o produto dos desvios de cada observação.
• Some todos os produtos calculados e divida por N, se for uma população, ou por N
– 1, se for uma amostra.
Para aprendermos esse passo a passo, vamos considerar um par de variáveis aleatórias:

N. Salário (X) Idade (Y)

1 4,00 26

2 4,56 32

3 5,25 36

4 5,73 20

5 6,26 40

• O primeiro passo é calcular as médias de ambas as variáveis aleatórias:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 38 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

• O segundo passo é calcular os desvios de ambas as variáveis em torno da média:

N. Salário (X) Desvios (X - μX) Idade (Y) Desvios (Y - μY)

1 4,00 4,00 - 5,16 = -1,16 26 26 - 30,8 = -4,8

2 4,56 4,56 - 5,16 = -0,60 32 32 - 30,8 = 1,2

3 5,25 5,25 - 5,16 = 0,09 36 36 - 30,8 = 5,2

4 5,73 5,73 - 5,16 = 0,57 20 20 - 30,8 = -10,8

5 6,26 6,26 - 5,16 = 1,10 40 40 - 30,8 = 9,2

O terceiro passo é calcular os produtos dos desvios de ambas as variáveis em torno da média:

N. Salário (X) (X - μX) Idade (Y) (Y - μY) Produto

1 4,00 -1,16 26 -4,8 (-1,16). (-4,8) = 5,568

2 4,56 -0,60 32 1,2 (-0,60). (1,2) = -0,72

3 5,25 0,09 36 5,2 (0,09). (5,2) = 0,468

4 5,73 0,57 20 -10,8 (0,57). (-10,8) = -6,156

5 6,26 1,10 40 9,2 (1,10). (9,2) = 10,12

• O quarto e último passo consiste em tomar a média aritmética das observações. Vale
lembrar que, assim como o desvio padrão, no caso de uma amostra, devemos usar o
fator de ajuste N - 1 no denominador.

3.5.2. CORRELAÇÃO
• É obtida como a covariância dividida pelo produto dos desvios padrões:

• A correlação entre duas variáveis aleatórias independentes é igual a zero.


• Correlação não implica causalidade.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 39 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

• A correlação não é afetada pelas operações algébricas, exceto pela multiplicação por
número negativo, caso em que fica multiplicada por –1.

4. TÉCNICAS DE AMOSTRAGEM
Em algumas situações, é adequado fazer um censo populacional. O censo acontece
quando todos os elementos da população são medidos.
O censo é recomendável quando:
• a população é considerada muito pequena;
• suas características são de fácil mensuração;
• quando há necessidade de alta precisão.
Por outro lado, existem algumas situações em que o censo seria muito difícil ou até
mesmo impossível.
Pense, por exemplo, que você trabalhe em um laboratório e deseja fazer um teste
estatístico sobre a eficiência de um determinado medicamento para uma doença rara.
Seria impossível reunir todas as pessoas que possuem aquela doença e chamá-las para
testar o medicamento. E, mesmo que fosse possível, não faria sentido para sua empresa,
pois você está produzindo o medicamento para vender, não é?
Quando não for possível ou conveniente fazer o censo, é necessário retirar uma amostra
da população. A partir da amostra, deseja-se inferir uma informação a respeito da população.
Existem duas categorias de técnicas de amostragem:
• a amostragem probabilística, casual ou aleatória: utilizam-se técnicas estatísticas,
seguindo métodos rigorosamente científicos para a escolha das unidades amostrais;
• a amostragem não probabilística ou não casual: há uma escolha deliberada dos
elementos da amostra, a depender dos critérios e do julgamento do pesquisador.
Vale notar que a amostragem probabilística não é necessariamente melhor nem pior
que a não probabilística. Elas são adequadas para contextos diferentes.
Além disso, ainda que todos os critérios estatísticos tenham sido aplicados corretamente
na seleção da amostra, é impossível eliminar completamente o risco de amostragem. É
possível apenas mitigá-lo, controlá-lo ou reduzi-lo a níveis aceitáveis.

Obs.: O risco de amostragem consiste na probabilidade de obter uma conclusão com base
na amostra diferente do que seria obtida caso fosse avaliada toda a população.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 40 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

4.1. AMOSTRAGEM CASUAL


A amostragem casual é qualquer procedimento de amostragem que garante que todos
os elementos da população tenham uma probabilidade de serem selecionados para a
amostra conhecida previamente.
A amostragem casual é também conhecida como probabilística ou aleatória, porque
é possível determinar a probabilidade associada a todas as combinações de amostras
possíveis.
Grave isso, pois é bastante importante para diferenciar de um processo de amostragem
não casual.
Vamos agora ver os principais tipos de amostragens aleatórias casuais.

4.1.1. AMOSTRA ALEATÓRIA SIMPLES (AAS)


É o tipo mais importante de amostras na Estatística. Utilizam-se números aleatórios
para selecionar os elementos da amostra.
Por exemplo, suponha que você organizou um show e deseja fazer uma pesquisa sobre
a idade média das pessoas que compareceram a ele.
Para isso, você poderia, por exemplo, pegar todos os CPF das pessoas que compraram
o ingresso e fazer um sorteio das pessoas pelo número de CPF.
É importante observar que, para realizar um sorteio, é necessário realizar o cadastro
de todas as unidades amostrais previamente. Esse é um fator que impõe custos – ou até
mesmo nem é possível de se fazer – a esse tipo de amostragem. E, por isso, muitas vezes,
ela é evitada.

4.1.2. AMOSTRA ALEATÓRIA ESTRATIFICADA (AAE)


Trata-se de um aperfeiçoamento da amostra aleatória simples.
Consiste em dividir a sua população em estratos. Os estratos devem ser reunidos por
características em comum, de modo que sejam mais homogêneos que a população inteira.

Por exemplo, no caso de altura média, o pesquisador poderia dividir a amostra por classe
social. É natural supor que a altura de uma pessoa seja influenciada pela sua classe social.

Por isso, você poderia criar cinco estratos: classe A, B, C, D e E.


Na alocação proporcional, o número de elementos selecionados em cada estrato deve
ser proporcional ao tamanho do estrato. Isso serve para garantir que todos os elementos
da população tenham a mesma possibilidade de ser selecionado para a amostra.
Por exemplo, se você deseja construir uma amostra de 1000 pessoas e se os estratos
tiverem a seguinte proporção em relação à população.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 41 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Tabela 1: Número de Elementos extraídos de cada estrato em uma Amostra Aleatória Estratificada

Número de Elementos da
Estrato Proporção
Amostra
A 5% 50
B 10% 100
C 25% 250
D 30% 300
E 20% 200
A amostra aleatória estratificada (AAE) terá um custo maior que a simples, porque você
precisará conhecer melhor a sua população e ter mais informações sobre ela.

4.1.3. AMOSTRA ALEATÓRIA POR CONGLOMERADOS (AAC)


Na amostra aleatória por conglomerados ou por clusters, divide-se a população em grupos,
porém, bem menores que um estrato. Em geral, a amostra será um conglomerado inteiro.

Por exemplo, na pesquisa da altura média em Recife, uma forma de estratificar seria dividir
em bairros de acordo com a classe social. Ter-se-ia as áreas nobres e as áreas menos nobres.
Um conglomerado seria, em vez de um bairro, pequenos quarteirões.
Dessa maneira, as amostras seriam compostas quarteirões espalhados na cidade.
Os quarteirões devem ser selecionados por números aleatórios, de modo a se conservar
a característica de que todos os elementos da população têm probabilidade conhecida de
serem selecionados para a amostra.
Esse procedimento de amostragem é muito simples de fazer, por isso, será menos
custoso. Uma importante economia é que é desnecessário o cadastro de todas as unidades
amostrais.
Em contrapartida, tenderá a oferecer resultados inferiores à Amostra Aleatória Simples
(AAS). Há, portanto, um tradeoff entre custo e qualidade dos resultados obtidos.
É importante observar que, para que o conglomerado seja válido para fins de construção
da amostra, ele deve ter heterogeneidade semelhante à da população original.
Perceba, portanto, três importantes diferenças entre a amostragem estratificada e a por
conglomerados:

Estratificada Conglomerados
os estratos devem ser mais homogêneos que a os conglomerados podem ser tão heterogêneos
população original quanto a população original
são selecionados elementos de todos os estratos alguns conglomerados são selecionados inteiros
para a amostra e outros não são selecionados
é mais eficiente e mais custosa é menos eficiente e menos custosa

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 42 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

4.1.4. AMOSTRA ALEATÓRIA SISTEMÁTICA (AAS)


Na amostragem aleatória sistemática, apenas o primeiro elemento da amostra é
escolhido aleatoriamente.
Todos os demais são escolhidos somando uma razão constante.
Por exemplo, supondo que você tenha uma população de 1000 indivíduos e que deseja
escolher 10 delas para uma amostra.
Você dividirá a amostra em 10 grupos de 100 elementos. No primeiro grupo, fará um
sorteio e retirará, por exemplo, o número 31.
A partir daí, todos os números serão selecionados a partir do primeiro somando 10 em 10.
Sendo assim, a sua amostra será composta pelos elementos {31, 131, 231, 331, …, 931}.
A amostra aleatória sistemática será, portanto, mais fácil e mais barata de fazer. Em
geral, ela produzirá resultados inferiores aos demais tipos de amostras, porém, apresenta
resultados semelhantes quando a posição do elemento na amostra não influencia nas
suas propriedades.
No caso da lista de pessoas que compraram o ingresso do show, é bem provável que a
AAS produza resultados muito bons, porque o fato de uma pessoa ter sido a 45ª ou a 96ª
a comprar o ingresso provavelmente influenciará pouco a sua idade.
É bem verdade que você pode supor que uma pessoa mais jovem se disporia a ficar horas
na fila para ser a primeira a comprar. E, sim, isso seria uma falha que prejudicaria a AAS.
Por outro lado, quando se tem uma propriedade que depende bastante da localização de
um indivíduo na amostra, por exemplo, a altura média das pessoas que depende bastante
da região em que ela vive, não é recomendável fazer uma AAS, devendo-se preferir uma
amostra estratificada.

4.1.5. EXEMPLO DE AMOSTRAGEM ESTATÍSTICA


Para facilitar o seu entendimento, considere uma população de 108 elementos.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 43 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Vamos fazer uma amostragem de 21 elementos dessa população.


Com o auxílio do Excel, gerei 21 números aleatórios que forneceram a seguinte amostra
aleatória simples.
Figura 11: Amostra Aleatória Simples de 21 Elementos

Depois, eu dividi a população em três estratos: um com 20 elementos, outro com 35


elementos e outro com 53 elementos. Como o número de elementos na amostra deve ser
proporcional ao tamanho do estrato, o primeiro estrato teve 4 elementos selecionados, o
segundo teve 7 e o terceiro teve 10.
É verdade que não ficou uma proporção exata, porém, não seria possível selecionar
um número fracionário de elementos de um estrato. Por isso, tivemos que aproximar para
números inteiros.
De qualquer modo, a amostra aleatória estratificada ficou da seguinte maneira.
Figura 12: Amostragem Aleatória Estratificada

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 44 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

No caso da amostragem aleatória por conglomerados, a amostra consistiu de pequenos


conglomerados selecionados aleatoriamente por toda a população.
Figura 13: Amostragem Aleatória por Conglomerados

Por fim, na amostragem sistemática, somente o primeiro elemento foi escolhido


aleatoriamente. Todos os demais foram escolhidos somando-se uma razão constante, no
caso, 5 à posição do primeiro elemento.
Figura 14: Amostragem Aleatória Sistemática

4.2. AMOSTRAGEM NÃO CASUAL


A amostragem não casual é todo processo de amostragem que não garante que todos
os elementos tenham a mesma probabilidade de serem chamados.
Os processos de amostragem não casual são disparados os mais comuns, pois a
aleatoriedade é realmente custosa.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 45 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

4.2.1. AMOSTRAGEM AO ACASO


Também conhecida como amostragem por conveniência ou acidental, na amostragem ao
acaso, os elementos são selecionados ao critério, porém, sem nenhum critério estatístico.
Um exemplo mais prático de uma amostragem ao acaso é o que acontece também
quando um pesquisador fica em uma esquina e seleciona as pessoas que passam por ele
para fazer uma entrevista.
Nesse caso, as pessoas são selecionadas ao acaso, porém, não há nenhum critério
estatístico para a sua escolha.
Por exemplo, se o pesquisador ficou na esquina de uma farmácia, é provável que ele
inclua em sua amostra um número maior de pessoas de idade mais avançada.
Caso ele fique numa esquina de uma loja de açaí, é provável que ele se depare com
pessoas mais jovens.
Por isso, uma recomendação muito comum aos pesquisadores é mudar de local
constantemente a fim de diminuir esse tipo de viés na sua pesquisa.

4.2.2. AMOSTRAGEM POR JULGAMENTO


Na amostragem por julgamento, o estatístico escolhe os elementos com base na sua
experiência ou com o auxílio de peritos e especialistas no assunto.
Em muitas situações, esse método é utilizado como uma forma de introduzir um viés
estatístico, com o objetivo de estudar alguns casos críticos. Mas isso deve ser feito com
bastante cuidado.
Pense, por exemplo, que você deseja avaliar se um determinado medicamento pode
causar efeitos colaterais. Suponha que o especialista saiba que estatisticamente os jovens
são menos susceptíveis a esse tipo de efeito colateral.
Por esse motivo, ele pode selecionar indivíduos mais jovens, com o objetivo de evitar
problemas durante a fase de testes. Assim, o produto pode ser certificado sem que seja
oferecido a pessoas que pudessem estar submetidas a um risco acima do que seria necessário
para certifica-lo.

4.2.3. AMOSTRAGEM POR QUOTAS


A amostragem por quotas corresponde à versão não casual da amostragem aleatória
estratificada.
Nesse caso, a população é dividida em quotas. As quotas são semelhantes aos estratos
e devem ser mais homogêneos que a população como um todo.
A diferença entre a AAE e a amostra por quotas é que, dentro de cada quota, será feita
uma amostragem ao acaso.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 46 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Por exemplo, suponha que você deseja fazer uma pesquisa sobre a altura média do
brasileiro.
Nesse caso, você sabe que a altura média das pessoas em um bairro de classe alta, como
Casa Forte, em Recife, tende a ser maior que a altura média das pessoas que moram em
um bairro de classe baixa, como Jordão.
Então, você colocará um pesquisador em Casa Forte e outro no Jordão. Cada pesquisador
ficará em uma esquina desses bairros e selecionará pessoas ao acaso que passaram por eles.
Vamos esquematizar para você não esquecer.
Figura 6: Amostragem por Quotas e Estratificada

4.2.4. SELEÇÃO VOLUNTÁRIA


Nesse tipo de amostragem, todos os elementos da população são convidados para
participar da pesquisa. No entanto, nem todos respondem a pesquisa, somente alguns se
voluntariam.
Por exemplo, suponha que você deseja saber qual o gênero de filme que os frequentadores
de uma sala de cinema mais gostam.
Você pode enviar um e-mail a todos as pessoas que foram a essa sala nos últimos meses.
Dessas pessoas, algumas vão responder, outras não.
É importante destacar que algumas pessoas terão maior probabilidade de pertencerem
à sua amostra, por isso, a amostragem é não casual.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 47 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Por exemplo, se um executivo bastante ocupado foi à sua sala de cinema, é pouco
provável que ele queira dedicar tempo a responder sua pesquisa, ainda que ele goste
bastante de cinema.

4.2.5. BOLA DE NEVE


A amostragem bola de neve pode ser utilizada quando se pesquisa dados sobre uma
população muito difícil de ser encontrada.
Pense, por exemplo, que você deseja fazer uma pesquisa com aquaristas marinhos. Uma
boa saída seria procurar alguém do meio e pedir para que essa pessoa o ajude a encontrar
mais pessoas.
Um bom ponto de partida para encontrar a primeira unidade amostral é por meio das
redes sociais. Hoje em dia, com a internet, é fácil você buscar comunidades e encontrar
algumas pessoas que pertençam a um determinado meio.
Essas pessoas provavelmente terão outros contatos que também sejam aquaristas.
Assim, é bem mais fácil que um aquarista te ajude a encontrar outros aquaristas.
Ao receber novos elementos populacionais para a sua amostra, você pode pedir para
essas pessoas te indicar novas pessoas para a sua pesquisa. E, assim, por diante.
Se cada pessoa te indicar outras 3 pessoas para serem entrevistas, rapidamente o
tamanho do seu espaço amostral crescerá. Daí que vem o nome “bola de neve”.
A principal desvantagem desse método é que você não pode controlar os indivíduos
que pertencerão à amostra. Logo, a sua amostra poderá não apresentar nenhum rigor
estatístico. É bastante possível que cada indivíduo indique somente pessoas semelhantes
a ele, pois elas vão pertencer ao seu próprio meio social.

5. PROBABILIDADES
A probabilidade estuda a ocorrência de eventos incertos.

5.1. CONCEITOS BÁSICOS

5.1.1. AXIOMAS DE KOLGOMOROV


Os axiomas de Kolgomorov são um conjunto de definições básicas para a função que
define a probabilidade de ocorrência de um evento.
São muito importantes no âmbito da Matemática Pura, porém, em concursos, eles só
são cobrados literalmente – ou seja, uma questão bem decoreba.
• Primeiro Axioma: a probabilidade de um evento qualquer é um número real não
negativo:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 48 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

• Segundo Axioma: a probabilidade de todo o espaço amostral é igual a 1:

O segundo axioma define a probabilidade total. Para Kolgomorov, a probabilidade deve


ocupar sempre valores entre 0 e 1 (ou 0% e 100%).
• Terceiro Axioma: para eventos disjuntos, a probabilidade da união é a soma das
probabilidades:

O terceiro axioma é o mais importante para questões de prova. Trata sobre a união
de eventos mutuamente exclusivos, que são fruto de conjuntos disjuntos.
Dois eventos mutuamente exclusivos são aqueles, cuja intersecção é nula. Ou seja, a
probabilidade de eles acontecerem simultaneamente é nula.

5.1.2. CONCEITO CLÁSSICO


No conceito clássico de Probabilidades, considera-se que todos os eventos são
equiprováveis. Por isso, a probabilidade é dada por:

Obs.:
Por exemplo, considere que temos um dado não viciado de seis faces. Qual é a probabilidade
de obtermos, em um lançamento, um número par?
Ora, nesse caso, o total de possibilidades são 6, pois o nosso espaço amostral é
. No entanto, apenas três desses eventos são favoráveis: Fav = {2, 4, 6}.
Assim, temos:

O conceito clássico é o mais importante para a sua prova, porque frequentemente utiliza
conceitos de Análise Combinatória, ou seja, a contagem para o cálculo de probabilidades.

5.1.3. CONCEITO FREQUENCIAL


Em muitos casos, não é possível fazer a suposição de que os vários eventos são
equiprováveis. Por exemplo, qual a probabilidade de uma pessoa nascer loira?

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 49 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Por isso, nesses casos, utilizamos o conceito frequencial. Nesse conceito, tomamos
uma amostra de pessoas e registramos quantas nasceram com que tipo de cabelo.
Na Tabela 13, temos dados fictícios a respeito da coloração dos olhos e dos cabelos das
pessoas em uma cidade.
Tabela 13: Dados a Respeito da Cor dos Olhos e Cabelos de Pessoas

Cor dos cabelos

Cor dos olhos Loiro Castanho Preto Ruivo Total

Azul 1.768 807 189 47 2.811

Verde 946 1.387 746 53 3.132

Castanho 115 438 288 16 857

Total 2.829 2.632 1.223 116 6.800

Agora, suponha que queremos calcular:


1) a probabilidade de que uma pessoa da amostra tenha olhos azuis.

2) a probabilidade de que uma pessoa seja loira de olhos azuis.

Então, prestemos atenção à diferença entre os dois conceitos.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 50 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

5.2. CATEGORIAS ESPECIAIS DE EVENTOS


• Eventos Mutuamente Exclusivos: dois eventos são mutuamente exclusivos quando
não podem acontecer simultaneamente.

Obs.:
Nessa situação, a probabilidade da união é igual à soma das probabilidades.

Obs.:
Considere o lançamento de um dado, e os eventos A = {5} e B = {6}. Esses conjuntos são
mutuamente exclusivos, porque a intersecção entre eles é um conjunto vazio.
Nesse caso, a união entre os dois eventos será:

Então, a probabilidade da soma é:

• Eventos Independentes: dois eventos são independentes quando a ocorrência de


um deles não influencia na ocorrência do outro. Nesse caso, aplica-se diretamente
o Princípio Fundamental da Contagem (PFC).
Se A e B são dois eventos independentes, tem-se que:

Obs.:
Como exemplo, temos o lançamento consecutivo de dois dados não viciados.
Por exemplo, qual é a probabilidade de, em dois lançamentos de um dado, obtermos
dois números iguais a 6?

• Eventos Complementares: dois eventos são independentes quando eles são


mutuamente exclusivos e sua união corresponde ao próprio conjunto universo.
Nessa situação, a probabilidade é:

Obs.:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 51 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Considere um lançamento de dados e que o evento A é o lançamento resultar um número


menor ou igual a 2. Nesse caso:

Por outro lado, o evento complementar será:

A técnica dos eventos complementares pode ser muito útil em diversas questões, porque,
em muitos casos, é mais fácil calcular a probabilidade complementar que calcular a
probabilidade pedida diretamente. Veremos exemplos.

5.3. PROBABILIDADE DA UNIÃO


Para calcular a probabilidade da união, usamos a mesma expressão do número de
elementos da união de dois conjuntos.

Obs.:

5.4. PROBABILIDADE CONDICIONAL


A probabilidade condicional trata da dependência de eventos. Sua definição é a razão
entre a probabilidade da intersecção e a probabilidade do condicionante.

Obs.:
Um caso particular é quando dois eventos são independentes. Nesse caso, podemos
escrever que a probabilidade condicional é igual à própria probabilidade do evento.

Obs.:
Vamos calcular as probabilidades

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 52 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

6. DISTRIBUIÇÕES DE PROBABILIDADE

6.1. NÚMEROS BINOMIAIS


Antes de aprender sobre a distribuição binomial, precisamos aprender importantes
conceitos sobre números binomiais.

6.1.1. NÚMEROS FATORIAIS


Sendo n um número inteiro, um número fatorial n! é definido pela seguinte expressão:

Obs.:
De maneira simples, podemos entendê-lo como o produto de todos os números inteiros
de 1 até n. Vejamos exemplos:

Uma observação interessante é que um número fatorial n! sempre contém a expressão


de todos os fatoriais anteriores. Como exemplo, note que 10! inclui a expressão de 7!, e que
8! inclui também a expressão de 5!

Por isso, é relativamente fácil dividir dois números fatoriais. Vejamos exemplos:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 53 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Devido a essa facilidade, podemos aprender o conceito de números binomiais.


Considere dois números inteiros n e p, de modo que . O binomial de n p a p é o
número definido pela seguinte expressão:

Obs.:
O termo Cn,p se refere à combinação. Vale ressaltar que esse conceito de número binomial
é exatamente o mesmo que se estuda em Análise combinatória.
Vejamos alguns exemplos de números binomiais. Calculemos o binomial de 6, 3 a 3.

Observe que utilizamos cores acima para facilitar a identificação das contas. Colocamos
os números 3! em vermelho evidenciando que eles foram simplificados. Essa simplificação
sempre vai acontecer quando estivermos lidando com números binomiais, pois os fatoriais
são sempre divisíveis um pelo outro.
Vejamos outro exemplo:

6.1.2. CASOS ESPECIAIS DE BINOMIAIS


Alguns números binomiais são relativamente simples de calcular. Por isso, é interessante
sabermos três casos particulares.
• O binomial de qualquer número 0 a 0 é sempre igual a 1.

• O binomial de qualquer número 1 a 1 é sempre igual ao próprio número.

• O binomial de qualquer número n a n é sempre igual a 1.

Outro caso especial que precisamos saber é sobre os binomiais complementares.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 54 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Dois binomiais são complementares quando possuem o mesmo numerador e a soma


dos seus denominadores é igual ao próprio numerador.

6.2. DISTRIBUIÇÃO DE BERNOUILLI


É uma distribuição aplicada para eventos que tem apenas dois resultados possíveis.
por exemplo: sucesso ou falha, cara ou coroa, 0 ou 1.
Uma dica para reconhecer uma distribuição de Bernoulli é que ela sempre trabalha com
proporções entre duas escolhas. São exemplos de variáveis aleatórias que seguem uma
distribuição de Bernoulli:
• uma pessoa ser favorável ou não a um determinado projeto de lei;
• o percentual de votos de um candidato em uma eleição no segundo turno.
A distribuição de probabilidades de Bernoulli é dada por:
P {X = 0} = 1 - p (falha)
P {X = 1} = p (sucesso)
É importante conhecer sobre essa distribuição:
• Valor Esperado:
• Variância:

6.3. DISTRIBUIÇÃO BINOMIAL


Ela pode ser considerada uma distribuição derivada da Bernoulli. Ela consiste em registrar
as probabilidades de se obter k sucessos em n repetições de um experimento. Nessas
repetições, os experimentos devem atender ao seguinte:
• cada repetição do experimento tem exclusivamente como resultado duas possibilidades,
isto é, cada repetição individual do experimento é descrita por uma variável de Bernoulli;
• o resultado de cada tentativa é independente das demais;
• a probabilidade de sucesso a cada repetição do experimento é constante e igual a p.
Um bom exemplo de uma variável que segue a distribuição binomial é uma pesquisa
eleitoral em uma cidade muito grande. O objetivo dessa pesquisa é determinar, de um

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 55 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

grupo de 5 pessoas, qual a probabilidade de que somente uma delas seja contrária a um
projeto de lei.
Vamos fazer um quadrado comparativo entre as distribuições de Bernoulli e binomial.

Distribuição de Bernouilli Distribuição Binomial


Uma pessoa ser favorável a um projeto Em um grupo de 5 pessoas, quantas delas são favoráveis?
Um bebê nascer homem ou mulher Uma família tem 3 filhos, qual é a probabilidade de nascer
um homem?
Marcar uma alternativa certa no chute Em uma prova de 20 questões, qual é o valor esperado
em uma prova abcde de número de acertos nos chutes?

6.3.1. DISTRIBUIÇÃO DE PROBABILIDADES


A probabilidade de k sucessos é:

Obs.:
Os parâmetros da distribuição binomial são:
• p: a probabilidade de sucesso;
• n: o número de repetições do experimento.
É importante conhecer sobre essa distribuição:
• Valor Esperado:

• Variância:

6.4. DISTRIBUIÇÃO NORMAL


A distribuição normal é uma das distribuições mais importantes da Estatística, e
seu gráfico é um dos mais famosos e mais utilizados.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 56 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Os valores da distribuição normal padrão são tabelados e sempre são


fornecidos na prova.

6.4.1. NORMALIZAÇÃO
Uma distribuição normal padrão é aquela que tem média nula e variância igual a 1. A
grande importância da curva normal padrão é que os seus valores são tabelados e serão
fornecidos a você na hora da prova.
Quando você estudar o comportamento de uma variável aleatória que segue uma
distribuição normal com outros valores média e variância, você deve transformá-la
em uma variável aleatória normal padrão, por meio de um procedimento chamado de
normalização. Basta fazer a transformação:

É importante reparar que devemos dividir a variável X pelo desvio padrão, e não pela
variância. Esse é um dos erros mais comuns cometidos pelos alunos em questões de prova.
Os alunos sempre tentam colocar a variância no denominador. Memorize: devemos
dividir pelo desvio padrão. Vamos treinar a normalização?

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 57 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

6.4.2. PROPRIEDADES DA NORMAL PADRÃO


Se uma variável Z segue uma distribuição normal padrão, podemos escrever:

Além disso, precisamos saber sobre essa distribuição de probabilidades que:


• A probabilidade de um ponto qualquer sob o gráfico da distribuição normal é
sempre nula.

• Na curva normal, deve-se medir a probabilidade de um intervalo. Por exemplo, P{a


< x < b} é representa pela área a seguir:

• A área total debaixo da curva normal é igual a 1. Portanto, se soubermos que P (Z <
1) = 0,84, podemos concluir que:

• A distribuição normal é perfeitamente simétrica em relação à origem. Portanto, P


(Z > 1) = P (Z < –1).

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 58 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

• A metade inferior da curva normal tem uma área igual a 0,5. Portanto, se P (Z < 1) =
0,84, então P (0 < Z < 1) = 0,34.

6.5. DISTRIBUIÇÃO DE POISSON


A distribuição de Poisson expressa a probabilidade de uma série de eventos ocorrer,
isto é, a quantidade de ocorrências de um determinado fenômeno em um intervalo
de tempo T.
Pense, por exemplo, que, em média, chegam 4 clientes por hora em um supermercado.
A probabilidade de que cheguem 10 clientes em uma mesma hora naquele supermercado
pode ser calculada pela distribuição de Poisson.
Essa distribuição tem um único parâmetro: o parâmetro λ. Esse parâmetro é justamente
a média de ocorrência dos eventos. Assim, a distribuição de probabilidade é dada por:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 59 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Obs.:
Nessa expressão, P {X = k} representa a probabilidade de k ocorrências no intervalo de
tempo considerado.
O número “e” é conhecido como Número de Euler e é uma importante referência
para o estudo de funções exponenciais. Esse número é um número irracional, sendo
aproximadamente igual a:

Considero desnecessário saber o valor aproximado do número de Euler. O enunciado


fornecerá para você diretamente as potências necessárias para calcular a distribuição de
probabilidade de que trata a questão.
Memorize também uma interessante propriedade da distribuição de Poisson: a variância
de uma distribuição de Poisson é igual à sua média.

Obs.:
Vamos desenhar o gráfico referente a essa distribuição de probabilidade:
Figura 4: Distribuição de Poisson

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 60 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

7. INTERVALOS DE CONFIANÇA
A estatística inferencial tem o objetivo de inferir características da população, como
a sua média e variância, a partir de uma amostra.
Suponha, por exemplo, que queiramos saber qual a altura média dos brasileiros.
Pela definição de média, deveríamos obter as alturas de todos os brasileiros, somá-
las e dividir pelo total da população. Porém, você não concorda que esse procedimento
seria inviável?
Como a população é muito grande, é muito complicado realizar um procedimento com
toda a população.
Então, o mais sensato é obter uma amostra representativa da população e obter as
características da população a partir dessa amostra.
Porém, o fato de não tomarmos a população inteira para calcular sua média embute
um erro. E a estimativa desse erro é feita a partir do intervalo de confiança.

7.1. DEFINIÇÃO DO INTERVALO DE CONFIANÇA


• É sempre centrado na média obtida experimental, ou seja, na média amostral. E sua
largura depende do grau de confiança desejado, geralmente representado por 1 - α.
• A estatística zα do intervalo de confiança é tal que:

Por exemplo, para os graus de confiança 96% e 98%, tem-se:

Grau de Confiança Zα
96% 2,06
98% 2,34
• Podemos escrever que o intervalo de confiança será:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 61 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

7.2. ERRO PADRÃO


O intervalo de confiança é sempre centrado na média populacional. Em torno dessa
média populacional, o intervalo se alarga por uma faixa de valores, que é conhecida como
erro padrão.

Obs.:
Esse termo é muito importante e sua expressão pode ser cobrada diretamente nas provas.

7.3. INTERVALO DE CONFIANÇA PARA PROPORÇÃO


Esse tipo de intervalo de confiança é bastante comum. E, para resolvê-lo, devemos
notar que as proporções são variáveis aleatórias de Bernoulli. E uma expressão bastante
útil que devemos lembrar é o desvio padrão dessa distribuição de probabilidades:

Obs.:
Esse desvio padrão é justamente o que vai ser utilizado na expressão do intervalo de
confiança. Vamos entender melhor essa situação com um exemplo?
Suponha que se saiba que 60% dos habitantes de uma cidade hipotética são favoráveis
a um projeto de lei. Qual será o intervalo de confiança com grau de confiança igual a 95%
para a proporção de pessoas que serão favoráveis em uma amostra de 2.400 pessoas?
Para isso, precisamos do dado: P (|Z| < 2) = 95%.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 62 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Para resolver essa questão, o primeiro passo é determinar o desvio padrão da variável
aleatória. Para isso, devemos notar que 60% das pessoas são favoráveis ao projeto de lei. Mas
ser favorável ao projeto é uma variável de Bernoulli, porque só existem duas possibilidades:
a pessoa pode ser favorável (sucesso) ou não ser favorável (falha).
Por ser uma variável de Bernoulli, o seu desvio padrão é dado pela expressão:

Pelo Teorema do Limite Central, podemos definir a variável normalizada:

A estatística do intervalo de confiança é .

Dessa forma, o intervalo de confiança desejado é:

Podemos, ainda, calcular o erro padrão na estimativa de uma variável de Bernoulli:

Obs.:
Vamos treinar com mais algumas questões de provas?

7.4. POPULAÇÃO FINITA


Quando a população não é infinita, o erro padrão do intervalo de confiança deve ser
reajustado, de acordo com a seguinte expressão:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 63 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Obs.:
Na equação acima, use:
• N é o tamanho real da população;
• n é o tamanho da amostra do intervalo de confiança.
Como o fator multiplicativo é sempre maior que 1, podemos concluir que o erro padrão
amostral da população finita é sempre maior que o da população infinita correspondente.
Vale notar também que, quando o tamanho real da população tende ao infinito, o fator
de ajuste tende a 1.
É possível também aplicar a expressão conhecida para o erro padrão da população infinita.

Obs.:
Veja que, de forma semelhante ao que acontece na correção do desvio padrão amostral,
o que acontece é uma modificação do denominador.

8. TESTES DE HIPÓTESES
O teste de hipóteses, também denominado teste estatístico ou teste de significância, é
o procedimento estatístico que permite tomar a decisão de rejeitar ou não uma hipótese
inicial, denominada hipótese nula (H0).

Obs.: TESTE DE HIPÓTESES 1: Suponha, por exemplo, que uma indústria tenha afirmado
que o tempo médio que suas máquinas levam para fazer um suco era inferior a 120
segundos, com desvio-padrão de 20 segundos. Um comprador, no entanto, adquiriu
uma máquina e, após fazer uma amostra de 100 sucos, ele obteve um tempo médio
de 130 segundos.
Nessa situação, podemos destacar alguns pontos:
• Hipótese nula – H0: é a hipótese que se deseja testar. Nesse caso, essa é a alegação
da empresa, que pode ser escrita, matematicamente, como .
• Hipótese alternativa – H1: é a hipótese que será adotada, caso a hipótese nula
seja considerada rejeitada pelo teste. Nesse caso, é a hipótese oposta, que seria

.
Também, vamos detalhar algumas notações frequentemente utilizadas:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 64 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

• µ é o valor suposto da média amostral;


• é a média amostral calculada com base em um experimento.
Cientes desses conceitos, vamos explorar, com base nessa situação os principais pontos
que são cobrados em questões sobre testes de hipóteses.

8.1. TIPOS DE TESTES


O teste é classificado de acordo com a hipótese alternativa em testes bilaterais ou
unilaterais à esquerda ou à direita.
Um teste é unilateral à esquerda quando a hipótese alternativa está à esquerda da
hipótese nula.
Analogamente, um teste é unilateral à direita quando a hipótese alternativa está à
direita da hipótese nula.
Vejamos exemplos.
Tabela 7: Classificações dos Testes de Hipóteses

Com base no exposto na Tabela 7, vamos retornar ao Teste de Hipóteses 1.

Obs.: TESTE DE HIPÓTESES 1: Suponha, por exemplo, que uma indústria tenha afirmado
que o tempo médio que suas máquinas levam para fazer um suco era inferior a 120
segundos, com desvio-padrão de 20 segundos. Um comprador, no entanto, adquiriu
uma máquina e, após fazer uma amostra de 25 sucos, ele obteve um tempo médio
de 130 segundos.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 65 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Podemos construir uma representação da hipótese nula e da alternativa.

Como a hipótese alternativa está à direita da hipótese nula, o teste de hipótese 1 é


unilateral à direita.

8.2. VALOR-P OU P-VALOR


O Valor-P corresponde justamente à probabilidade de se obter uma amostra de um
determinado patamar ou mais afastado da média, considerando válida a hipótese nula.
No exemplo do Testes de Hipóteses 1, o valor-P seria:

Para calcular essa probabilidade, precisaríamos da tabela da distribuição normal-padrão


ou do dado P (Z < 2) = 0,977.
De posse desses dados, vamos usar o Teorema do Limite Central e fazer a normalização
da média amostral.

Aplicando essa transformação, temos:

Dessa maneira, temos que:

Por fim, podemos utilizar a propriedade de simetria da distribuição normal.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 66 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Dessa maneira, temos que:

8.3. NÍVEL DE SIGNIFICÂNCIA


O nível de significância corresponde à probabilidade de se rejeitar a hipótese nula,
sendo ela verdadeira.
Sendo assim, trata-se de uma restrição ao teste. Quanto maior for o nível de significância,
mais dificilmente a hipótese nula será mantida.
É importante entender que o nível de significância cria uma zona de rejeição na curva
normal padrão. Caso o valor-P associado à sua amostra seja menor que o nível de significância
dentro dessa zona de rejeição, a hipótese nula será rejeitada.
Por outro lado, caso o valor-P seja maior que o nível de significância, a hipótese nula
não será rejeitada. Alguns estatísticos e algumas questões de prova dizem que a hipótese
nula é aceita, porém, em termos científicos, é mais rigoroso dizer que ela não foi rejeitada,
tendo em vista que ela ainda poderá ser contestada mais adiante.
Desse modo, temos a seguinte regra para testes unilaterais:
Tabela 8: Regra de Decisão para Testes Unilaterais

rejeita a Hipótese Nula

não rejeita a Hipótese Nula

Por exemplo, vejamos o que acontece para os níveis de significância de 2% e 5% na


situação-problema apresentada que trata um teste unilateral à direita. Note que o valor-P
associado à situação-problema é de 2,3%, que está marcado em P(Z > 2) = 0,023. Na Figura
8, esse valor foi apresentado em verde:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 67 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Figura 1: Regiões de Rejeição para a Hipótese Nula a Diferentes Níveis de Significância

É possível, ainda, que seja pode ser cobrado o teste de hipóteses bilateral. Nesse
caso, teríamos:
Figura 2: Zonas de Rejeição para o Teste de Hipóteses Bilateral

Perceba que, nesse caso, a zona de rejeição criada pelo nível de significância de 5%
abrange uma área de 2,5% de cada lado da normal.

8.3.1. ESTATÍSTICA DE TESTE LIMITE


A estatística de teste limite corresponde ao valor de zα que cria a zona de rejeição.
Matematicamente, podemos escrever:

• se o teste for unilateral à esquerda, ;


• se o teste for unilateral à direita, ;
• se o teste for bilateral, .

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 68 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

É importante destacar que a estatística limite será:


• negativa, se o teste for unilateral à esquerda;
• positiva, se o teste for unilateral à direita ou bilateral.

Exemplificando, se o nível de significância de um teste unilateral à direita baseado na


distribuição normal for igual a 5%, como faremos para descobrir a estatística de teste limite?
Nesse caso, devemos procurar o ponto em que . Para isso,
podemos olhar em uma tabela da distribuição normal padrão acumulada.

Nesse caso, concluímos que, se o nível de significância do teste for igual a 5%, a estatística
de teste limite é igual a 1,64.
Perceba que a questão necessariamente precisa te fornecer dados para que você seja
capaz de calcular a estatística de teste limite. As formas mais comuns são:
• diretamente na questão. Por exemplo, P(Z < 1,64) = 0,95;
• na forma de tabela de distribuição normal padrão acumulada, como visto anteriormente.

Podemos utilizar a seguinte regra de decisão para testes unilaterais com base na
estatística de teste limite.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 69 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Tabela 9: Regra de Decisão para Testes Unilaterais

rejeita a Hipótese Nula

não rejeita a Hipótese Nula

8.3.2. MANIPULAÇÕES DOS DADOS DA DISTRIBUIÇÃO NORMAL PADRÃO


No caso de o dado ser fornecido diretamente na questão, é importante tomar cuidado,
pois existem várias apresentações diretamente que podem ser utilizadas. Vejamos
alguns exemplos:
• em módulo: suponha que sejam dados:
− P(|Z| < 1,64) = 10%;
− P(|Z| < 1,96) = 5%;
− P(|Z| < 2,24) =2,5%.
Nesse caso, qual a estatística de teste limite para um teste unilateral à direita com nível
de significância igual a 2,5%?
Para obter a estatística de teste limite, temos que utilizar a propriedade de simetria da
distribuição normal. Vamos estudar, por exemplo, a informação P(|Z| < 1,96) = 5%.

Com a simetria da normal, podemos concluir que:

Com isso, podemos concluir que a probabilidade da normal unicaudal (somente um dos
extremos) é metade da normal bicaudal. Analogamente, podemos concluir com os outros
dados fornecidos que:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 70 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Desse modo para o nível de significância de 2,5%, o nível de significância a ser utilizado
é igual a 2,24.
• invertida: é possível, ainda, que os dados sejam fornecidos
− P(Z < 1) = 84%;
− P(Z < 1,64) = 95%;
− P(Z < 1,96) = 97,5%;
− P(Z < 2,24) = 98,75%.
Nesse caso, qual deveria ser a estatística limite de teste corresponde a um nível de
significância de 5%?
Para isso, devemos lembrar que o total da distribuição normal é 100%. Assim, podemos
concluir que, se sabemos P (Z < 1), podemos determinar P (Z > 1).

Analogamente, podemos estudar as demais probabilidades fornecidas na tabela de dados.

Portanto, o nível de significância de 5%, a estatística de teste correspondente é Z = 1,64.


• até a metade: um pouco menos comuns, mas também é possível que os dados sejam
fornecidos da seguinte forma.
− P(0 < Z < 1) = 34%;
− P(0 < Z < 1,64) = 45%;
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 71 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Nesse caso, qual deveria ser a estatística teste limite para o nível de significância de 16%?
Para isso, devemos saber que a probabilidade de metade da normal é igual a 50%. Com
isso, podemos desenhar:

8.4. TIPOS DE ERROS


Em relação à hipótese nula, têm-se duas possibilidades: ela pode ser falsa ou verdadeira.
Podemos, portanto, cometer dois tipos de erros:
• Erro do tipo I : é a possibilidade de rejeitar a hipótese nula, quando ela é verdadeira.
Corresponde ao nível de significância do teste.
• Erro do tipo II : é a possibilidade de não rejeitar (ou aceitar) a hipótese nula,
quando ela é falsa.
Por fim, temos outro conceito interessante a ser apresentado:
• Potência do teste : é a probabilidade de detectar erros, ou seja, de rejeitar a
hipótese nula quando ela é falsa.
Uma interessante relação que já podemos extrair envolve a potência do teste e o erro
do tipo II.

Obs.:
Então, vamos memorizar os conceitos aprendidos na forma de um diagrama.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 72 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

8.5. MODALIDADES DOS TESTES


Nesta seção, vamos estudar técnicas para você resolver as questões de testes de
hipóteses em duas situações diferentes:
• o teste de hipóteses para MÉDIAS populacionais com desvio-padrão populacional
CONHECIDO: é baseado na distribuição normal;
• o teste de hipóteses para MÉDIAS populacionais com desvio-padrão populacional
DESCONHECIDO: é baseado na distribuição t-Student com N – 1 grau de liberdade;
• o teste de hipóteses para PROPORÇÕES populacionais: nesse caso, o desvio-padrão
populacional pode ser calculado diretamente a partir da proporção, então o teste
sempre será baseado na distribuição normal;

8.5.1. TESTE DE HIPÓTESES PARA MÉDIAS COM DESVIO-PADRÃO POPULACIONAL


CONHECIDO
Esse é o caso mais comum e foi, inclusive, o caso que utilizamos de exemplo ao desenvolver
a teoria sobre testes de hipóteses. Quando o desvio-padrão populacional é conhecido, o
teste deriva diretamente do Teorema do Limite Central.
O primeiro passo para você resolver as questões de testes de hipóteses é construir a variável
aleatória para a média normalizada – essa variável é conhecida como estatística de teste:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 73 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Então, você terá duas possibilidades: você pode determinar se a estatística de teste
está mais próxima da hipótese nula que a estatística limite ou determinar se o valor-P
produzido por essa estatística é superior ao nível de significância do teste.
Em provas de concursos, as questões precisam te fornecer os dados sobre a distribuição
normal. Então, elas podem te fornecer:
• caso 1: o nível de significância e sua respectiva estatística de teste limite (essa é a
situação mais comum).
− Nesse caso, se a estatística de teste estiver mais afastada do zero que a estatística
limite, a hipótese nula será rejeitada; caso contrário, não será rejeitada;
• caso 2: pode fornecer o nível de significância e te dar ferramentas para você calcular
o valor-P associado à amostra em estudo.
• Nesse caso, se o valor-P da amostra for inferior ao nível de significância, a hipótese
nula será rejeitada; caso contrário, não será rejeitada;
• caso 3: ela pode te dar uma tabela de distribuição normal. Nesse caso, eu aconselho
você obter a estatística limite e fazer a questão de forma semelhante ao caso 1.

8.5.2. TESTE DE HIPÓTESES PARA MÉDIAS COM DESVIO-PADRÃO POPULACIONAL


DESCONHECIDO
Como vimos no Teorema do Limite Central, a distribuição normal deve ser utilizada
quando a variância populacional é conhecida ou quando o número de elementos na amostra
é maior ou igual a 30.
Caso contrário, devemos recorrer à distribuição t-Student. Se a amostra tem N unidades,
devemos utilizar uma distribuição normal por uma t-Student com N – 1 grau de liberdade.
Desse modo, o passo a passo para resolver os testes de hipóteses para médias com
desvio-padrão populacional desconhecido é bem semelhante aos testes do item anterior.
A única diferença é que as probabilidades serão calculadas com a distribuição t-Student.
Então, vamos rever o passo a passo com suas respectivas adaptações:
• construa a variável aleatória para a média normalizada – essa variável é conhecida
como estatística de teste:

Obs.:
Observe que a expressão é a mesma. Porém, nesse caso, o desvio-padrão σ é, na realidade,
o desvio-padrão amostral, que é uma estimativa do desvio-padrão populacional. E, então,
devemos utilizar a mesma técnica anterior:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 74 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

• se a questão fornecer o nível de significância e a estatística de teste limite, compare


a estatística de teste obtida com o limite;
• se a questão fornecer dados para calcular o valor-P, então, se o valor-P for inferior
ao nível de significância, a hipótese nula será rejeitada; caso contrário, ela não poderá
ser rejeitada.

8.5.3. TESTE DE HIPÓTESES PARA PROPORÇÕES


No caso de proporções, o desvio-padrão populacional sempre será conhecido. Uma
proporção é essencialmente uma variável de Bernoulli. E, como tal, pode-se aplicar a
expressão do desvio-padrão populacional para esse caso:

Obs.:
Então, podemos utilizar o desvio-padrão populacional na expressão da estatística de teste:

Obs.:

9. REGRESSÃO LINEAR
A regressão linear tem por objetivo estudar o comportamento de uma variável em
função da outra. Por exemplo, considere o estudo do salário de pessoas de uma empresa
em função da idade delas.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 75 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

No gráfico, temos algumas definições interessantes:


• Variável Independente, Regressora, Explicativa ou Preditora: é a variável principal.
No caso, é a variável idade, geralmente chamada de X.
A variável independente é também chamada de explicativa ou preditora, porque
ela é utilizada para explicar o comportamento da variável dependente e prever seus
valores futuros.
• Variável Dependente ou Resposta: é a variável, cujos valores são observados em
função da variável independente. No caso em apreço, é a variável salários, geralmente
chamada de Y.

9.1. EQUAÇÃO DA REGRESSÃO LINEAR


A equação geral de um modelo regressão linear é:

A estimativa obtida a partir do modelo de regressão linear é:

O coeficiente de inclinação pode ser obtido por uma das expressões a seguir:

Como o valor esperado é linear, temos que:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 76 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

9.2. ANÁLISE DE VARIÂNCIA


A análise de variância busca medir os erros (ou desvios) provocados por um modelo de
regressão linear. Para isso, vamos comparar:

• : os valores reais da variável resposta;

• as estimativas da variável resposta obtida com o modelo de regressão linear;

• a média dos valores reais da variável resposta.


Com base nesses parâmetros, são definidos os seguintes fatores que avaliam a qualidade
do modelo de regressão linear.
• Soma dos Quadrados Totais SQTot (antes): corresponde aos desvios em relação à
média da variável Y, ou seja, antes de se fazer qualquer estimativa de regressão linear.

Obs.:
Perceba que esse fator é diretamente relacionado ao desvio-padrão (ou à variância SYY)
da variável resposta.

Utilizamos (N-1) no denominador, pois consideramos a variância amostral, que será o


caso da maior parte das questões envolvendo regressão linear.
• Soma dos Quadrados dos Erros ou Resíduos, SQRes ou SQEr (depois): é a soma dos
quadrados dos erros ou resíduos de estimativa. Corresponde aos desvios em relação
às estimativas lineares, ou seja, depois da regressão linear.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 77 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

É natural esperar que a soma dos erros depois da regressão linear seja menor que a soma
dos erros antes da regressão linear. Afinal, é para isso que serve essa técnica: melhorar a
estimativa da variável Y.
Assim, define-se:
• Soma dos Quadrados da Regressão SQReg: é a melhoria ou redução dos erros. Tem-se:

Pode-se provar que a soma dos quadrados da regressão se relaciona com a variância
entre as variáveis.

9.2.1. COEFICIENTE DE DETERMINAÇÃO


O coeficiente de determinação (R²) é dado pela razão de melhoria. Isto é, o quanto
o modelo de regressão melhorou os erros da variável resposta sobre o quanto os erros
eram antes.

Pode-se demonstrar que o coeficiente de determinação é igual ao quadrado da


correlação.

9.2.2. VARIÂNCIA DO ERRO


A estimativa de variância do erro é dada por:

Na equação acima:
• p é o número de variáveis envolvidas na regressão linear – tanto as dependentes como
as independentes. Se estivermos falando de uma regressão linear comum, no caso,
os salários (Y) pela idade (X) de um grupo de entrevistados, temos duas variáveis.
Esse é o caso geral cobrado em questões de prova.
• N é o número de elementos na amostra;
• SqRes é a soma dos quadrados dos resíduos.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 78 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

9.2.3. ANÁLISE DOS RESÍDUOS


Os resíduos do modelo de regressão linear correspondem aos desvios das estimativas
fornecidas pelo modelo em relação ao valor original da variável.

O gráfico de resíduos dispõe os resíduos da variável resposta em função da variável


explicativa. As características ideais de um gráfico de resíduos saudável deve ser:
• não viesado: isto é, a média dos resíduos deve ser igual a zero;
• homocedásticos: o desvio padrão dos resíduos é independente da variável aleatória
independente.
Vejamos na Figura 3 um exemplo ideal dessa situação.
Figura 3: Exemplo de um gráfico de resíduos sem problemas

A seguir, temos alguns problemas comuns nos gráficos de resíduos:


• heterocedasticidade: a variância dos erros apresenta um comportamento heterogêneo
em função da variável independente (X);
• assimetria: a média dos erros não é nula, portanto, o coeficiente de intercepto deve
ser ajustado.
Vejamos a seguir exemplos.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 79 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

10. MOMENTOS DE VARIÁVEIS ALEATÓRIAS


Nesta seção, nós vamos aprender a calcular a média e a variância de uma distribuição
qualquer de probabilidades.
Gostaria de ressaltar que esse tema requer o uso de ferramentas avançadas de
matemática, em especial, o Cálculo Integral. Portanto, só é recomendável para alunos que
tenham maior facilidade de aprender as matérias da área de Exatas.
Além disso, esse tema historicamente só foi cobrado em provas da área de Estatística,
tendo aparecido pela primeira vez em um concurso fora do ramo na Polícia Federal em
2021, aplicado pela banca Cebraspe.

10.1. DEFINIÇÕES DOS MOMENTOS


O momento de ordem “n” são definidos matematicamente como o valor esperado da
variável aleatória elevada à potência “n”.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 80 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Os momentos de primeira e segunda ordem são, particularmente, os mais importantes,


pois são usados para calcular a média e a variância da variável aleatória.
Vejamos uma tabela com o resumo das primeiras ordens de momentos.
RESUMO DA ÓPERA

10.2. INTEGRAL
A integral é a ferramenta matemática que permite o cálculo de áreas debaixo do gráfico
de uma função. Para entendê-la, vamos considerar uma função genérica.

Figura 8: Conceito de Integral

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 81 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

O objetivo da integral é calcular a área subentendida debaixo da curva do gráfico da


função original f, pintada na Figura 6. Uma definição muito importante é a função primitiva,
que consiste em uma função F, tal que a área subentendida entre os pontos x1 e x2, seja:

Uma notação muito importante que devemos saber é a notação de integral:

A notação acima é conhecida como integral definida, porque os limites de integração


foram definidos.
Outra notação bem interessante é a integral indefinida, que consiste na função primitiva
sem os limites de integração. Nesse caso, é possível adicionar uma constante aditiva.

10.2.1. PRINCIPAIS INTEGRAIS


Esse é um tópico somente decoreba. Você precisa apenas memorizar as integrais que
vamos apresentar aqui. Em seguida, vamos aprender como utilizá-las.
• Integral Polinomial: relaciona-se com uma polinomial de ordem n+1

• Integral da Exponencial: igual à própria função exponencial.

Obs.:
A constante “c” é um número real qualquer. Para fins de cálculo de área do gráfico, ela
é irrelevante.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 82 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

10.2.2. COMO USAR A INTEGRAL?


A integral é utilizada para calcular área de gráficos. Como exemplo, qual a área do gráfico
da função f(x) = x² entre os pontos x = -1 e x = 3?

Graficamente, o que queremos é a área pintada acima. Matematicamente, essa área


pode ser calculada pela integral da função. Já vimos que a integral da função polinomial é:

Fazendo n = 2, teremos:

Uma vez que já sabemos a primitiva dessa função, a forma mais simples de calcular a
integral consiste em tomar as diferenças entre a primitiva nos dois pontos extremos: x1 =
-1 e x2 = 3.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 83 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

10.2.3. PROPRIEDADES DA INTEGRAL


O operador integral tem algumas propriedades que podem ser muito úteis para facilitar
o cálculo de derivadas de funções mais complexas.
Você pode memorizar as principais funções e utilizar as propriedades a seguir.
• Integral da Soma: o operador integral é um operador linear. Então, a integral da soma
é igual à soma das integrais. O mesmo vale para a diferença entre duas funções.

Obs.:
Vejamos um exemplo: qual a integral de x³ + x²? Anteriormente, já vimos a integral
polinomial. Então, sabemos que:
• a integral de x³ é x4/4;
• a integral de x² é igual a x³/3;
Assim, podemos escrever:

• Integral do produto por uma constante: nesse caso, basta retirar a constante
multiplicando:

Obs.:
Agora, façamos a derivada de y = f(x) = 4x³ + 3x². Para fazer essa conta, podemos utilizar
alguns resultados já conhecidos:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 84 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

y y’

Assim, a integral da função desejada é:

10.3. DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE


Em uma distribuição contínua de probabilidades, não são definidas probabilidades
em si, mas, sim, uma função de densidade de probabilidade.
Vejamos, como exemplo, a função exponencial com

O gráfico dessa densidade de probabilidades é mostrado a seguir:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 85 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Em uma função contínua, a probabilidade de um único ponto qualquer é sempre nula.


Então, podemos escrever:

Obs.: Tome cuidado com essa observação! Ainda que f(0) seja muito maior que f(2), isso não
significa nada com relação às probabilidades exatas nesses pontos. As probabilidades
de quaisquer pontos em uma distribuição contínua são sempre nulas.
Em uma distribuição contínua, as probabilidades só não são nulas quando calculadas
em um intervalo. Nesse caso, elas correspondem à área debaixo do gráfico. Por exemplo,
qual a probabilidade P(1 < X < 3) na função descrita acima?
Figura 10: Área do Gráfico debaixo da Distribuição Exponencial

A probabilidade é descrita como a área do gráfico.

Para calcular essa área, podemos recorrer ao cálculo integral, lembrando-nos que a integral
da exponencial é a própria exponencial dividida pelo fator que multiplica “x”. Assim, temos:

Então, vamos substituir:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 86 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Usando uma calculadora, podemos calcular os valores da função exponencial:

10.3.1. CONDIÇÃO DE VALIDADE


Uma função densidade de probabilidades qualquer deve necessariamente atender aos
axiomas de Kolgomorov. Isso implica que o total das probabilidades, debaixo do gráfico
deve ser igual a 1.
Isto é, a área total do gráfico é igual a 1. Matematicamente, podemos escrever:

Obs.:
Figura 11: a área debaixo do gráfico de qualquer densidade de probabilidades é igual a 1

Tomemos, como exemplo, a distribuição exponencial com parâmetro λ. Por que essa
distribuição é dada por:

e não simplesmente

A explicação para isso está nos axiomas de Kolgomorov. Vamos calcular a integral da
função distribuição de probabilidade.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 87 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Como vimos a integral de uma exponencial é igual à própria exponencial dividida pelo
fator que multiplica x.

À medida que o “x” vai tendendo a infinito, a função exponencial vai tendendo a zero.
Além disso, qualquer número elevado a zero é igual a 1. Então, temos:

10.3.2. MOMENTOS DE UMA VARIÁVEL ALEATÓRIA CONTÍNUA


O valor esperado de uma função qualquer g(X) de uma variável aleatória contínua pode
ser obtido como a integral do produto dessa função pela densidade de probabilidades
aplicada em todo o domínio da distribuição.

Obs.:
Assim, podemos calcular os chamados momentos. O momento da ordem n é dado pela
expressão E[Xn]:

Obs.:
Assim, estão definidos:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 88 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

E, assim, sucessivamente. Com base neles, podemos calcular algumas características


interessantes das variáveis contínuas:
• valor esperado ou média: é justamente o momento de primeira ordem;

• variância: pela definição, essa propriedade é dada pelo valor esperado de (X – μ)²,
em que μ é a média da variável.

Obs.:
No capítulo de variância, demonstramos que essa grandeza pode ser expressa pela
média dos quadrados menos o quadrado da média. Assim, temos:

Dessa forma, a variância é igual ao momento de segunda ordem menos o quadrado do


momento de primeira ordem.

10.3.3. DISTRIBUIÇÕES SIMÉTRICAS


Uma distribuição é perfeitamente simétrica quando ela é igual à sua imagem no espelho.
Para isso, ela precisa ter um eixo de simetria vertical x = x0. Nessa situação, observa-se que:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 89 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

• a média corresponde ao eixo de simetria, isto é, E[X] = x0;


• a mediana é igual à média, isto é, Md = x0.
Tomemos o caso da distribuição normal e de uma distribuição polinomial

dada por .
Figura 12: Exemplos de Distribuições Simétricas

Ambas as distribuições são simétricas em relação à origem. Portanto, elas possuem média
e medianas iguais a zero. Além disso, como o pico de ambas as distribuições acontecem em
x = 0, as duas possuem moda também igual a zero.

10.4. DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE


Em uma distribuição discreta de probabilidades, todas as probabilidades pontuais são
bem definidas. Tomemos como exemplo o lançamento de um dado não viciado, com faces
de 1 a 6, que segue uma distribuição uniforme com parâmetro 1/6.
Essa distribuição de probabilidades é dada por:

Note que a distribuição discreta corresponde exatamente à probabilidade de cada evento.


Assim, podemos calcular a probabilidade de que o lançamento dos dados seja igual a 3:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 90 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

RESUMO DA ÓPERA
Essa é, portanto, uma diferença crucial entre as distribuições discretas e contínuas de
probabilidade:
• a distribuição discreta de probabilidades, também chamada função distribuição de
probabilidades, estabelece probabilidades concretas;
• a distribuição contínua de probabilidades, também chamada função densidade de
probabilidades, não estabelece as probabilidades concretas. As probabilidades só
são definidas pelas integrais nos intervalos.

10.4.1. CONDIÇÃO DE VALIDADE


Pelos axiomas de Kolgomorov, a soma de todas as probabilidades descritas na distribuição
discreta deve ser igual a 1. Matematicamente, esse conceito pode ser representado como:

Obs.:
No caso da distribuição uniforme, é até fácil de verificar o atendimento dessa condição.
Considere o caso do lançamento do dado, em que cada um dos seis números tem probabilidade
associada igual a 1/6:

Obs.:

10.4.2. MOMENTOS DE UMA VARIÁVEL ALEATÓRIA DISCRETA


De modo análogo às variáveis contínuas, o valor esperado de uma função g(X) qualquer
aplicada à variável aleatória pode ser calculada como a soma dos produtos de g(X) pela
função distribuição de probabilidades f(X), como mostrado a seguir:

Obs.:
Assim, podemos calcular os chamados momentos. O momento da ordem n é dado pela
expressão E[Xn]:

Obs.:
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 91 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Dessa forma, estão definidos:

E, assim, sucessivamente. De modo análogo às variáveis contínuas, nas distribuições


discretas, pode-se calcular a média e a variância da seguinte forma:
• valor esperado ou média: é justamente o momento de primeira ordem;

• variância: pela definição, essa propriedade é dada pelo valor esperado de (X – μ)²,
em que μ é a média da variável.

Obs.:
No capítulo de variância, demonstramos que essa grandeza pode ser expressa pela
média dos quadrados menos o quadrado da média. Assim, temos:

Obs.:
Dessa forma, a variância é igual ao momento de segunda ordem menos o quadrado do
momento de primeira ordem.

10.5. DISTRIBUIÇÕES CONJUNTAS DE PROBABILIDADE


Uma distribuição conjunta de probabilidade consiste na descrição das probabilidades
de duas (ou mais) variáveis conjuntamente. Vejamos um exemplo de distribuição sobre os
gostos de um grupo de pessoas sobre cachorros (entre não gosta, Rottweiler e Maltês) e
matérias (entre Português, Matemática e Direito).
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 92 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Nas linhas, vamos dispor as matérias e, nas colunas, vamos dispor as raças de cachorros
favoritas.
Tabela 1: Exemplo de Distribuição Conjunta de Probabilidades

Não Gosta Rottweiler Maltês


Português 0,050 0,075 0,125
Matemática 0,150 0,100 0,200
Direito 0,100 0,150 0,050

A Tabela 1 exibe uma distribuição conjunta discreta de probabilidades para duas variáveis
aleatórias X e Y, ambas variáveis aleatórias discretas.
A variável X é a variável raças de cachorro favoritas, que pode assumir os valores {não
gosta, rottweiler, maltês}. Já a variável Y é a variável matéria favorita, que pode assumir
três valores {português, matemática, direito}.
Cada célula da tabela deve ser lida como uma probabilidade de intersecção. Por exemplo,
qual a probabilidade de uma pessoa gostar de Matemática e de Rottweiler? Para isso, basta
ler na tabela o ponto de encontro da coluna dos Rottweilers e da linha da Matemática.

Não Gosta Rottweiler Maltês


Português 0,050 0,075 0,125
Matemática 0,150 0,100 0,200
Direito 0,100 0,150 0,050

Dessa forma, a probabilidade de uma pessoa gostar de Matemática e gostar de Rottweiler.

É, ainda, bastante comum a representação com uma vírgula no lugar do sinal de


intersecção, como mostrado a seguir.

Em qualquer distribuição de probabilidades, a soma de todas as probabilidades associadas


deve ser igual a 1. É o que observamos na Tabela 1.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 93 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

10.5.1. PROBABILIDADES MARGINAIS


A probabilidade marginal consiste em isolar uma das variáveis. Suponha, por exemplo,
que queremos responder simplesmente à pergunta: qual a probabilidade de uma pessoa
gostar de matemática?
Nesse caso, devemos somar todas as probabilidades associadas à matemática,
independentemente da raça de cachorro favorita.
Na tabela, a matemática foi associada à segunda linha. Então, basta somar todas as
probabilidades da segunda linha. Assim, teremos:
Tabela 2: Cálculo das Probabilidades Marginais Associadas às Matérias

Probabilidade Marginal das


Não Gosta Rottweiler Maltês
Matérias
Português 0,050 0,075 0,125 0,050+0,075 + 0,125 = 0,250
Matemática 0,150 0,100 0,200 0,150 + 0,100 + 0,200 = 0,450
Direito 0,100 0,150 0,050 0,100 + 0,150 + 0,050 = 0,300

Desse modo, podemos concluir que a probabilidade de a matéria favorita de um elemento


desse conjunto de pessoas ser:
• português é igual a 0,250 ou 25%;
• matemática é igual a 0,450 ou 45%;
• direito é igual a 0,300 ou 30%.
Matematicamente, podemos dizer que a probabilidade marginal é:

Podemos, ainda, generalizar a definição matemática de probabilidade condicional:

Obs.:
Analogamente, podemos calcular as probabilidades marginais relacionadas a cada uma
das raças favoritas de cachorro desse conjunto de pessoas.
Não Gosta Rottweiler Maltês
Português 0,050 0,075 0,125
Matemática 0,150 0,100 0,200
Direito 0,100 0,150 0,050
Probabilidade Marginal 0,050 +0,150 +0,100 0,075 + 0,100 + 0,150 0,125 + 0,200 +
das Raças = 0,300 = 0,325 0,050 = 0,375

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 94 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

10.5.2. PROBABILIDADES CONDICIONAIS


A probabilidade condicional consiste em responder à pergunta: qual a probabilidade de
uma pessoa gostar de matemática, sabendo que ela gosta de maltês?
Pela definição que já estudamos no capítulo de Probabilidades, podemos escrever:

Observe que o denominador corresponde justamente à probabilidade marginal de Y =


maltês, que foi estudada no tópico anterior.
Desse modo, podemos recorrer à tabela de probabilidades estudada.

Não Gosta Rottweiler Maltês


Português 0,050 0,075 0,125
Matemática 0,150 0,100 0,200
Direito 0,100 0,150 0,050
Probabilidade Marginal das Raças 0,300 0,325 0,375

Assim, temos:

Tome cuidado, portanto, para não confundir a probabilidade condicional com a


probabilidade conjunta. Observe que a soma de todas as probabilidades condicionais em
uma linha ou coluna são sempre iguais a 1. Vejamos:

Probabilidade Conjunta Probabilidade Condicional


P(X = x, Y = maltês) (P X = x, Y = maltês)
Português 0,125 0,333
Matemática 0,200 0,533
Direito 0,050 0,133
0,375 1

Observe dois pontos importantes:


• a soma de todas as probabilidades conjuntas em uma linha ou coluna é igual à
probabilidade marginal;
• a soma de todas as probabilidades condicionais em uma linha ou coluna é igual a 1.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 95 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

10.5.3. INDEPENDÊNCIA
Duas variáveis são independentes quando uma não afeta a distribuição de probabilidade
da outra. Nesse caso, a probabilidade pode ser calculada pelo produto das probabilidades
marginais, isto é:

Por exemplo, voltando à distribuição mostrada na Tabela 1. Ela não traz o caso de duas
variáveis independentes, porque:

Porém, o produto das probabilidades marginais é:

Como a probabilidade tabelada é diferente do produto das probabilidades, temos que


as duas variáveis não são independentes.
Mas, considerando as probabilidades marginais que foram calculadas previamente, que são:

X P(X = x) Y P(Y = y)
Português 0,250 Não Gosta 0,300
Matemática 0,450 Rottweiler 0,325
Direito 0,300 Maltês 0,375

Considerando essas probabilidades marginais, a distribuição conjunta de probabilidades


para que as duas variáveis fossem independentes deveria ser a que é mostrada na Tabela 3.
Tabela 3: Distribuição de Probabilidades Conjuntas para que X e Y fossem independentes

Não Gosta Rottweiler Maltês


Português 0,250. 0,300 = 0,075 0,250. 0,325 = 0,08125 0,250. 0,375 = 0,09375
Matemática 0,450. 0,300 = 0,135 0,450. 0,325 = 0,14625 0,450. 0,375 = 0,16875
Direito 0,300. 0,300 = 0,090 0,300. 0,325 = 0,0975 0,300. 0,375 = 0,1125

10.5.4. VALOR ESPERADO

No caso de uma distribuição conjunta de duas variáveis aleatórias discretas e quantitativas.


Tomemos o seguinte exemplo mostrado na Tabela 3.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 96 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Tabela 4: Exemplo de uma Distribuição Conjunta de Variáveis Quantitativas

X = -1 X=0 X = +1
Y=0 0,050 0,075 0,125
Y=1 0,150 0,100 0,200
Y=2 0,100 0,150 0,050

Vamos calcular as probabilidades marginais relacionadas às variáveis X e Y.

X = -1 X=0 X = +1 P (Y = y)
Y=0 0,050 0,075 0,125 0,250
Y=1 0,150 0,100 0,200 0,450
Y=2 0,100 0,150 0,050 0,300
P(X = x) 0,300 0,325 0,375

Com base nas probabilidades marginais, podemos calcular os valores esperados tanto
de X como de Y.

10.5.4.1. VALOR ESPERADO CONDICIONAL


É possível também calcular o valor esperado da variável X quando Y for igual a 0, que é
representado por E[X | Y = 0]. Nesse caso, basta tomar uma média aritmética ponderada
das observações de X pelas probabilidades de intersecção (ou condicionais) quando Y for
igual a zero. Retornemos à Tabela 4.
Tabela 5: Exemplo de uma Distribuição Conjunta de Variáveis Quantitativas

X = -1 X=0 X = +1
Y=0 0,050 0,075 0,125
Y=1 0,150 0,100 0,200
Y=2 0,100 0,150 0,050

Essa é uma prova também de que as variáveis X e Y não são independentes. No caso de
duas variáveis aleatórias independentes, o valor esperado condicional é sempre igual ao
valor esperado global.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 97 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

10.5.5. VARIÂNCIA E COVARIÂNCIA


A variância e a covariância podem ser calculadas pelas suas respectivas definições ou
ainda pelas expressões alternativas:

Já calculamos anteriormente os valores esperados E[X] e E[Y]. Podemos, então, calcular


os valores esperados E[X²], E[Y²] e E[XY].
Para os valores esperados E[X²] e E[Y²], podemos calcular as probabilidades marginais.
Para isso, vamos calcular os quadrados dos valores previstos na Tabela 4.

X² = 1 X² = 0 X² = +1 P (Y = y)
Y² = 0 0,050 0,075 0,125 0,250
Y² = 1 0,150 0,100 0,200 0,450
Y² = 4 0,100 0,150 0,050 0,300
P(X = x) 0,300 0,325 0,375

Assim, podemos calcular as médias dos quadrados das variáveis X e Y. Nesse caso, teremos:

Assim, podemos calcular as variâncias:

Para calcular a média do produto XY, podemos retornar à Tabela 4 e calcular o valor do
produto XY em cada um dos pontos previstos nela.

X = -1 X=0 X = +1
Y=0 0,050 (XY = 0) 0,075 (XY = 0) 0,125 (XY = 0)
Y=1 0,150 (XY = -1) 0,100 (XY = 0) 0,200 (XY = 1)
Y=2 0,100 (XY = -2) 0,150 (XY = 0) 0,050 (XY = 2)

Então, usando a definição de valor esperado, temos:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 98 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

Por fim, a covariância entre as duas variáveis pode ser calculada:

Agora, vamos prestar atenção a um fato muito importante sobre a relação entre
covariância e independência de duas variáveis aleatórias.

Obs.: No caso de duas variáveis aleatórias independentes, a covariância entre elas é sempre
nula. Porém, a recíproca não é verdadeira. Isto é, o fato de duas variáveis terem
covariância nula não significa necessariamente que elas sejam independentes.
Aluno (a), a seguir, nossas questões da disciplina de Estatística dentro do material
Estatística Sob Medida.
O objetivo desse conteúdo é que você possa ter acesso a mais questões recentes
cobradas nos principais concursos das principais bancas examinadoras.
Visamos a organizar as questões por ordem crescente de dificuldade, de modo que você
tenha um progresso ao resolver o material.
Há uma mescla de questões de todos os níveis de dificuldade para que você possa
treinar bem.
E, agora, vamos resolver as nossas questões?

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 99 de 336
PDF SINTÉTICO
Estatística
Thiago Cardoso

QUESTÕES DE CONCURSO

MEDIDAS DE POSIÇÃO

001. (FGV/RFB/2023/ANALISTA TRIBUTÁRIO) Uma pequena amostra de 11 salários (medidos


em quantidades de salários mínimos) de trabalhadores de terceiro setor mostrou os
seguintes resultados:
2,0 2,3 2,7 3,4 3,9 2,8 2,3 1,8 1,5 3,3 1,5
A diferença, em quantidade de salários mínimos, entre os valores da média e da mediana
desses dados é igual a:
a) 0,0
b) 0,1
c) 0,2
d) 0,3
e) 0,4

002. (FGV/FUNSAÚDE-CE/2021) Em um conjunto de 12 números, a média de 4 deles é 15


e a média dos outros 8 é 18. A média dos 12 números é
a) 17
b) 16,8
c) 16,5
d) 16
e) 15,5

003. (FGV/FUNSAÚDE-CE/2021) Sabe-se que x é maior do que 11 e que a diferença entre


a média e a mediana dos cinco números 2, x, 11, 16, 5 é igual a 2. O valor de x é
a) 12
b) 16
c) 21
d) 26
e) 31

004. (FCC/SPAG-PE/2019/ANALISTA DE PLANEJAMENTO/ADAPTADA) Durante 40 dias, foi


registrado o número de pessoas atendidas por dia em um guichê de uma repartição. A tabela
abaixo apresentou os dados observados sendo que não foram fornecidas as quantidades
de dias em que foram atendidas uma pessoa por dia e duas pessoas por dia, indicadas na
tabela por q1 = 11 e q2 = 14, respectivamente.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 100 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Tem-se que a média aritmética do número de pessoas atendidas por dia é:


a) 1,40
b) 1,50
c) 1,25
d) 1,60
e) 1,45

005. (UFU/MG/2019/TÉCNICO EM ESTATÍSTICA) Considere as seguintes variáveis.


I – Tamanho de um objeto (pequeno, médio ou grande)
II – Volume de água em um rio
III – Número de clientes numa fila
IV – Número da seção de votação
V – Comprimento de um inseto
VI – Classe Social
Com relação à classificação dos dados requeridos como variáveis de pesquisa, é correto
afirmar que:
a) as variáveis I, IV e VI são qualitativas.
b) as variáveis III e V são quantitativas contínuas.
c) as variáveis II e III são quantitativas discretas.
d) a variável IV é qualitativa ordinal.

006. (FCC/CÂMARA DE FORTALEZA/CE/2019/AGENTE ADMINISTRATIVO) Em um teatro com


200 lugares, houve quatro apresentações de uma peça. Na primeira apresentação foram
vendidos todos os ingressos; na segunda apresentação foram vendidos 88% dos ingressos;
na terceira, 56% dos ingressos e, na quarta, 44% dos ingressos. Em média, a quantidade
de ingressos vendidos por apresentação foi de
a) 72
b) 144

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 101 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

c) 56
d) 76
e) 140

007. (FGV/SEFAZ-AM/2022/AUDITOR FISCAL DE TRIBUTOS ESTADUAIS) Uma variável aleatória


X tem a seguinte função de probabilidade, sendo k uma constante:

A média de X é igual a
a) -0,4
b) -0,3
c) -0,2
d) 0,0
e) 0,5

008. (FCC/SABESP/2018/ESTAGIÁRIO DE NÍVEL MÉDIO) Para que a média aritmética dos


números: 8, 8, 1, 10, 11, 12, 7, 2, 10, 6, x e 5 seja 7, o valor de x deverá ser:
a) 2
b) 4
c) 8
d) 5
e) 3

009. (CEBRASPE/SEDUC/AL-2018/PROFESSOR DE MATEMÁTICA) Situação hipotética: A


média aritmética dos pesos dos 60 alunos de uma sala de aulas é igual a 51,8 kg. Nessa
sala, a média aritmética do peso dos meninos é de 62 kg e das meninas, 45 kg. Assertiva:
Nesse caso, essa sala de aulas tem 24 meninos e 36 meninas.

010. (CEBRASPE/PF/2018/PERITO CRIMINAL) Considerando que a análise de uma amostra


de minério de chumbo tenha apresentado os seguintes resultados percentuais (%): 8,10;
8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
O valor médio do teor de chumbo presente na amostra foi superior a 8%.

011. (CEBRASPE/PF/2018/PERITO CRIMINAL) Tendo em vista que, diariamente, a Polícia


Federal apreende uma quantidade X, em kg, de drogas em determinado aeroporto do
Brasil, e considerando os dados hipotéticos da tabela precedente, que apresenta os valores

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 102 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

observados da variável X em uma amostra aleatória de 5 dias de apreensões no citado


aeroporto, julgue o próximo item.

A moda da distribuição dos valores X registrados na amostra foi igual a 22 kg.

012. (CEBRASPE/PF/2018/PERITO CRIMINAL) Tendo em vista que, diariamente, a Polícia


Federal apreende uma quantidade X, em kg, de drogas em determinado aeroporto do
Brasil, e considerando os dados hipotéticos da tabela precedente, que apresenta os valores
observados da variável X em uma amostra aleatória de 5 dias de apreensões no citado
aeroporto, julgue o próximo item.

A mediana das quantidades X observadas na amostra em questão foi igual a 18 kg.

013. (CEBRASPE/SEFAZ-DF/2020/AUDITOR FISCAL) A partir de uma amostra aleatória simples


de tamanho n, sabe-se que a média aritmética de uma variável X foi igual a 3. Considerando
que os valores possíveis para a variável X sejam -1 e + 4, julgue o item que se segue.
A mediana amostral da variável X foi igual a 2,5.

014. (FCC/SABESP/2019/ESTAGIÁRIO DE ENSINO MÉDIO REGULAR) A média dos salários dos


25 trabalhadores de uma pequena empresa é de R$ 2.320,00. Um desses trabalhadores,
e apenas ele, terá um aumento de 10% em seu salário e, com isso, a média dos salários
passará a ser R$ 2.360,00. O salário desse trabalhador, sem o aumento, é
a) R$ 10.400,00
b) R$ 9.800,00
c) R$ 10.000,00
d) R$ 8.000,00
e) R$ 11.000,00

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 103 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

015. (CEBRASPE/PREFEITURA DE SÃO CRISTÓVÃO/SE/2019/PROFESSOR DE MATEMÁTICA) Há


cinco anos, João, Paulo e Miguel se associaram para montar uma lanchonete. João entrou
com R$ 80.000; Paulo, com R$ 120.000; e Miguel, com R$ 200.000. A lanchonete foi vendida,
hoje, por R$ 3.200.000 e essa quantia foi dividida entre os três de forma diretamente
proporcional aos valores que cada um investiu.
A partir dessa situação hipotética, julgue o item a seguir.
Considerando o lucro obtido com a venda, é correto inferir que, enquanto na propriedade
dos três, a lanchonete teve uma valorização média anual inferior a R$ 600.000.

016. (FCC/METRÔ-SP/2019/ENFERMEIRO DO TRABALHO) As massas dos objetos A, B e C


satisfazem as seguintes relações:
− as massas de A e B, somadas, excedem em 13 kg a média das massas de B e C;
− subtraindo-se de 79 kg o quádruplo da massa de C, obtém-se a soma da massa de A com
o dobro da massa de B.
Assim, a soma das massas de A, B e C, em kg, é igual a
a) 32
b) 34
c) 35
d) 31
e) 33

017. (FCC/CÂMARA LEGISLATIVA DO DISTRITO FEDERAL/2018/CONSULTOR TÉCNICO-


LEGISLATIVO/ECONOMISTA) Os números de processos autuados em duas repartições
públicas (R1 e R2) independentes, durante 40 dias, estão representados na tabela abaixo,
sendo m e n inteiros positivos.

Calculando a soma da média aritmética (número de processos por dia) com a moda e com
a mediana de cada repartição, verifica-se que a soma obtida na repartição R2 supera a
soma obtida na repartição R1 em:
a) 2,05
b) 0,55
c) 1,05
d) 1,30
e) 1,55

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 104 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

018. (FCC/PREFEITURA DE MANAUS/AM/2019/AUDITOR FISCAL DE TRIBUTOS MUNICIPAIS)


Conforme um levantamento realizado em um órgão público e analisando a distribuição dos
salários, em R$ 1.000,00, de todos os seus funcionários, obteve-se a tabela de frequências
absolutas abaixo, com k sendo um número inteiro positivo.

Considere que a média aritmética (Me) foi calculada considerando que todos os valores
incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo,
que a mediana (Md) foi calculada pelo método da interpolação linear e que a moda (Mo)
foi obtida pela relação de Pearson, ou seja, Mo = 3 Md - 2 Me. O valor encontrado para Mo,
em R$ 1.000,00, foi igual a:
a) 1,76 k
b) 1,70 k
c) 1,64 k
d) 1,60 k
e) 1,82 k

019. (FCC/SEFAZ-BA/2019/AUDITOR FISCAL/ADMINISTRAÇÃO TRIBUTÁRIA/PROVA II/QUESTÃO


DESAFIO) Considere a distribuição dos salários, em R$ 1.000,00, dos funcionários lotados
em uma repartição pública, representada abaixo pela tabela de frequências relativas
acumuladas, sendo k a frequência relativa acumulada do 4º intervalo de classe.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 105 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Sabe-se que a média aritmética (Me) foi calculada considerando que todos os valores
incluídos num certo intervalo de classe são coincidentes com o ponto médio desse intervalo,
que a mediana (Md) foi calculada pelo método da interpolação linear e que a moda (Mo)
foi obtida pela relação de Pearson, ou seja, Mo = 3Md - 2Me. Dado que Me = R$ 7.200,00,
então Mo é igual a
a) R$ 7.350,00
b) R$ 8.500,00
c) R$ 7.700,00
d) R$ 8.100,00
e) R$ 7.400,00

020. (CESPE/TJ-PA/2020/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Uma amostra aleatória dos


registros de furto no município de Abaetetuba, no ano de 2017, apresenta os valores 245,
247, 238, 282 e 261. Uma estimativa não tendenciosa e eficiente para a média de furtos
ocorridos em Abaetetuba no ano de 2017, considerando os dados apresentados na amostra, é
a) 238,0
b) 254,6
c) 260,0
d) 282,7
e) 308,5

021. (FCC/PREFEITURA DE TERESINA/PI) Uma carteira aplica 25% na ação A, 40% na ação
B e o restante na ação C. Os retornos das ações A, B e C são, respectivamente, 10%, 12%
e 20%. O retorno médio da carteira será
a) 14,5%
b) 14,8%
c) 14,6%
d) 14,0%
e) 14,3%

022. (FCC/SPAG-PE/2019/ANALISTA DE PLANEJAMENTO/ADAPTADA) Durante 40 dias, foi


registrado o número de pessoas atendidas por dia em um guichê de uma repartição. A tabela
abaixo apresentou os dados observados sendo que não foram fornecidas as quantidades
de dias em que foram atendidas uma pessoa por dia e duas pessoas por dia, indicadas na
tabela por q1 = 11 e q2 = 14, respectivamente.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 106 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Tem-se que a média aritmética do número de pessoas atendidas por dia é:


a) 1,40
b) 1,50
c) 1,25
d) 1,60
e) 1,45

023. (ESAF/ANAC/2016/ANALISTA ADMINISTRATIVO) Os valores a seguir representam a


quantidade de aviões que decolaram por hora durante as 10 primeiras horas de certo dia.
33 34 27 30 28 26 34 23 14 31
Logo, levando em consideração somente essas 10 horas, pode-se afirmar corretamente que:
a) o número médio de aviões que decolaram por hora é igual a 27.
b) o número mediano de aviões que decolaram por hora é igual a 29.
c) em 50% das horas o número de aviões que decolaram por hora ficou abaixo da média.
d) o número mediano de aviões que decolaram por hora é igual a 27.
e) em 30% das horas o número de aviões que decolaram por hora foi superior a 30.

024. (FCC/SEFAZ-SC/2018/AUDITOR FISCAL DA RECEITA ESTADUAL/AUDITORIA E FISCALIZAÇÃO


(PROVA 1)) A tabela a seguir apresenta a distribuição de frequências dos salários, em número
de salários mínimos (SM), dos funcionários de um órgão público:

Sabe-se que: b - a = 5%,

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 107 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

x é a média salarial, obtida por meio dessa tabela, calculada como se todos os valores
de cada faixa salarial coincidissem com o ponto médio da referida faixa, md é a mediana
salarial, calculada por meio dessa tabela pelo método da interpolação linear.
Nessas condições, x + md, em anos, é igual a:
a) 9,85
b) 11,35
c) 11,05
d) 10,95
e) 11,65

025. (FCC/ALESE/2018/ANALISTA LEGISLATIVO/ECONOMIA/ADAPTADA) Em um grupo de


pessoas encontramos as seguintes idades:
20, 30, 50, 39, 20, 25, 41, 47, 36, 45, 41, 52, 18, 41
A moda é:
a) 42
b) 45
c) 41
d) 20
e) 39

026. (FCC/BACEN/2006) O valor da moda, obtida com a utilização da Fórmula de Czuber, é


igual a (desprezar os centavos na resposta):

a) R$ 3.201,00
b) R$ 3.307,00
c) R$ 3.404,00
d) R$ 3.483,00
e) R$ 3.571,00

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 108 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

APRESENTAÇÃO DAS VARIÁVEIS

027. (VUNESP/UNICAMP/2022/ENGENHEIRO CIVIL/Q2491143) Em uma pesquisa realizada,


450 pessoas responderam “sim” à pergunta feita, 320 responderam “não”, e 40 pessoas
não responderam à pergunta. Na construção de um gráfico de setor (também conhecido
como gráfico de pizza) para representar os dados obtidos nessa pergunta, o setor circular
correspondente às respostas “sim” deverá ter ângulo medindo
a) 170º
b) 180º
c) 190º
d) 200º
e) 210º

028. (IFTO/2023) Dados os valores de uma população: x1 = 4; x2 = 6; x3 = 8 e x4 = 10. A amplitude


total dessa população será:
a) 3
b) 8
c) 4
d) 2
e) 6

029. (CESPE/FUB/2022/ESTATÍSTICO) A tabela de frequência a seguir mostra dados coletados


em uma pesquisa para se verificar o número de disciplinas que os estudantes de determinada
universidade estão cursando por semestre.

Considerando essas informações, julgue o item seguinte.


O gráfico do tipo pizza é o mais apropriado para representar os dados apresentados na
tabela, visto que a variável analisada é qualitativa ordinal.

030. (CESPE/AL-CE/2011/ANALISTA LEGISLATIVO) Um levantamento foi realizado para se


avaliar, por município, a quantidade X de obras que estão sob suspeita de irregularidade.
Com base em uma amostra de municípios, foi obtida a distribuição de frequências mostrada
na tabela acima. Com base nessas informações, julgue o item.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 109 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O diagrama de setores (ou pizza) é um gráfico apropriado para se representar a distribuição


de probabilidade da variável X.

031. (FGV/TJDFT/2022/ANALISTA JUDICIÁRIO/ESTATÍSTICA) O resultado de uma pesquisa


sobre a produtividade dos magistrados em uma determinada região foi publicado em uma
revista científica e está sintetizado na tabela a seguir.

Não existem observações coincidentes com os extremos das classes.


É sabido que, quanto maior a classe de produtividade, maior é a produtividade do magistrado.
Um estatístico precisa estimar a produtividade a partir da qual se encontram os 10% mais
eficientes, isto é, o 9º decil dessa distribuição.
A melhor estimativa é, aproximadamente:
a) 6,5
b) 7
c) 7,5
d) 8
e) 8,5

032. (FGV/TJ-SE/2023/ANALISTA JUDICIÁRIO/ESTATÍSTICA) A análise dos dados multivariados,


como a correlação linear entre dois atributos do conjunto de dados X, pode ser facilitada
pelo uso do gráfico de:
a) pizza
b) boxplot
c) densidade
d) histograma
e) scatter plot

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 110 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

033. (CEBRASPE/CGDF/2023/AUDITOR DE CONTROLE INTERNO) Considerando que a tabela


precedente represente a distribuição de frequências absolutas de uma variável quantitativa
x, é correto afirmar que, em relação a x, a média será

a) igual à mediana e igual à moda.


b) igual à mediana, que é menor que a moda.
c) menor que a mediana, que é menor que a moda.
d) maior que a mediana, que é maior que a moda.
A respeito do conjunto de dados {11, 6, 28, 51, 49, 32, 33}, julgue os itens a seguir.

034. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I) O primeiro quartil do conjunto de


dados em tela é igual ou superior a 33.

Com relação aos dados que resultaram no diagrama mostrado na figura precedente, julgue
os itens a seguir.

035. (CEBRASPE/PETROBRÁS/2021) A amplitude total dos dados em tela é inferior a 6.

036. (CEBRASPE/PETROBRÁS/2021) Nesse diagrama, a porção da distribuição dos dados


representada pela parte inferior do diagrama mostrada a seguir representa exatamente
25% dos dados em questão.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 111 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

037. (CEBRASPE/PETROBRÁS/2021) O terceiro quartil é inferior a 11 e superior a 10.

038. (AOCP/ADAF/2018/Q1750497) Na análise exploratória de um conjunto de dados,


sugere-se a construção de gráficos e diagramas. Dado o seguinte histograma, calcule a
média da variável em estudo.

a) x = 49,08
b) x = 51,08
c) x = 50,08
d) x = 50
e) x = 16,67

039. (CESPE/FUNPRESP/EXE/2016/ANALISTA/ÁREA DE INVESTIMENTOS) O gráfico ilustra cinco


possibilidades de fundos de investimento com suas respectivas rentabilidades. Considerando
que as probabilidades de investimento para os fundos A, B, C e D sejam, respectivamente,
P(A) = 0,182; P(B) = 0,454; P(C) = 0,091; e P(D) = 0,182, julgue o item subsequente.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 112 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O gráfico apresentado é um histograma.

040. (VUNESP/PREFEITURA DE ILHABELA-SP/2020/ANALISTA DE GESTÃO PÚBLICA/DESAFIO)


Um histograma foi elaborado com o objetivo de se analisar a distribuição de todos os
salários dos funcionários em uma empresa. Sabe-se que 108 funcionários dessa empresa
ganham salários com valores pertencentes ao segundo intervalo do histograma [4, 7), em
salários-mínimos (SM), que apresenta uma densidade de frequência igual a 0,15 (SM)–1.
Densidade de frequência de um intervalo é o resultado da divisão da respectiva frequência
relativa pela amplitude deste intervalo. Se o primeiro intervalo do histograma [2, 4), em SM,
apresenta uma densidade de frequência igual a 0,125 (SM)-1, então o número de empregados
do segundo intervalo supera o número de empregados do primeiro intervalo em
a) 48
b) 60
c) 72
d) 78
e) 84

041. (CEBRASPE/2012/POLÍCIA FEDERAL/PAPILOSCOPISTA) Ao contrário da mediana amostral,


a média aritmética é menos sensível à presença de valores extremos (ou valores atípicos
ou outliers).

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 113 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

042. (CESPE/IPHAN/2018/ANALISTA I/ÁREA 2) A tabela seguinte mostra as quantidades de


patrimônios históricos cadastrados nos estados A e B.

A partir dessa tabela, julgue o seguinte item.


As estátuas cadastradas nos estados A e B correspondem a mais de 20% dos patrimônios
históricos cadastrados nesses estados.

043. (CESPE/IPHAN/2018/ANALISTA I/ÁREA 2) O gráfico de barras é adequado para a análise


de variáveis qualitativas ordinais ou quantitativas discretas, pois permite investigar a
presença de tendência nos dados.

044. (VUNESP/UNICAMP/2022/ENGENHEIRO CIVIL/Q2491143) Em uma pesquisa realizada,


450 pessoas responderam “sim” à pergunta feita, 320 responderam “não”, e 40 pessoas
não responderam à pergunta. Na construção de um gráfico de setor (também conhecido
como gráfico de pizza) para representar os dados obtidos nessa pergunta, o setor circular
correspondente às respostas “sim” deverá ter ângulo medindo
a) 170º
b) 180º
c) 190º
d) 200º
e) 210º

045. (CESPE/DEPEN/2015/AGENTE PENITENCIÁRIO FEDERAL/ÁREA 4) A tabela mostrada


apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em 2013.
Nesse ano, o déficit relativo de vagas – que se define pela razão entre o déficit de vagas no
sistema penitenciário e a quantidade de detentos no sistema penitenciário – registrado
em todo o Brasil foi superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100
mil habitantes.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 114 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

(Ministério da Justiça – Departamento Penitenciário Nacional – Sistema Integrado de


Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do Sistema Prisional
Brasileiro, dez. 2013. Internet: www.justica.gov.br. Com adaptações)
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
Na análise exploratória, o histograma é um gráfico adequado para descrever a distribuição
da quantidade de detentos por região em 2013.

046. (INSTITUTO CONSULPLAN/MPE/BA/2023/ANALISTA DE SISTEMAS/Q2852433) A tabela


representa a distribuição das notas de desempenho dos candidatos em um processo de
seleção para uma vaga de emprego. A última fase do processo de seleção consiste em uma
entrevista, que será realizada apenas com os candidatos que obtiveram desempenho acima
da nota de corte, calculada com base no valor do sexto decil, cujo valor é 51,8:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 115 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

“De acordo com os dados apresentados, é correto afirmar que 60% dos candidatados
obtiveram notas ____________ de 51,8; portanto, a empresa realizará ____________ 40
entrevistas.”
Assinale a alternativa que completa correta e sequencialmente a afirmativa anterior.
a) acima / mais
b) abaixo / mais
c) acima / menos
d) abaixo / menos
e) acima / exatamente

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 116 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

047. (CESGRANRIO/TRANSPETRO/2012/ADMINISTRADOR JÚNIOR) A tabela apresenta uma


distribuição hipotética. Não há observações coincidentes com os limites das classes. A
melhor estimativa para o terceiro quartil da distribuição é, aproximadamente, de:

a) 34,75
b) 34,9
c) 35
d) 35,75
e) 35,9

048. (CEBRASPE/PETROBRÁS/2021) A amplitude total dos dados em tela é inferior a 6.

049. (CEBRASPE/PETROBRÁS/2021) Nesse diagrama, a porção da distribuição dos dados


representada pela parte inferior do diagrama mostrada a seguir representa exatamente
25% dos dados em questão.

050. (CEBRASPE/PETROBRÁS/2021) O terceiro quartil é inferior a 11 e superior a 10.

VARIÂNCIA E DESVIO PADRÃO

051. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I)

Com base nas informações apresentadas na tabela precedente e considerando que a


covariância entre as variáveis X e Y seja igual a 3, julgue os itens que se seguem.
A variância de X é igual a 4.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 117 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

052. (AOCP/IBGE/2019/ANALISTA CENSITÁRIO/Q14285555) Em uma escola que atende


alunos de primeira a quinta série, existem duas turmas de cada série. A diretora dessa escola
pretende fazer um estudo quanto à aprendizagem comparando as turmas dentro de cada
série. Quais medidas estatísticas descritivas ela pode utilizar para avaliar a homogeneidade
das turmas e a diferença de aprendizagem entre as turmas?
a) Mediana e moda.
b) Média e variância.
c) Variância e desvio-padrão.
d) Variância e coeficiente de variação.
e) Média e coeficiente de variação.

053. (CEBRASPE/PF/2018/PERITO CRIMINAL) Tendo em vista que, diariamente, a Polícia


Federal apreende uma quantidade X, em kg, de drogas em determinado aeroporto do
Brasil, e considerando os dados hipotéticos da tabela precedente, que apresenta os valores
observados da variável X em uma amostra aleatória de 5 dias de apreensões no citado
aeroporto, julgue o próximo item.

O desvio padrão amostral da variável X foi inferior a 7 kg.

054. (CEBRASPE/TC-DF/2023/AUDITOR-FISCAL DE CONTROLE EXTERNO) Considerando que


X e Y sigam distribuições normais padrão e que a correlação linear entre ambas seja igual
a -1, julgue os seguintes itens.
A soma X + Y segue distribuição normal com média zero e variância 2.

055. (CEBRASPE/TC-DF/2023/AUDITOR-FISCAL DE CONTROLE EXTERNO) Considerando que


X e Y sigam distribuições normais padrão e que a correlação linear entre ambas seja igual
a -1, julgue os seguintes itens.
Se W = 5X + 2, então W segue distribuição normal com média igual a 2 e variância igual a 25.

056. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) Em uma empresa


com 250 empregados, verifica-se que 60% são homens e 40% são mulheres. A média dos
salários dos homens, em salários mínimos (SM), é igual à média dos salários das mulheres.
O coeficiente de variação dos salários dos homens é igual a 4% e as somas dos quadrados

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 118 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

dos salários, em (SM)², dos homens e das mulheres são iguais a 3.756,00 e 2.502,25,
respectivamente. O desvio padrão dos salários das mulheres, em SM, é igual a:
a) 0,40
b) 0,15
c) 0,25
d) 0,20
e) 0,16

057. (CEBRASPE/PF/2018/PERITO CRIMINAL) Considerando que a análise de uma amostra


de minério de chumbo tenha apresentado os seguintes resultados percentuais (%): 8,10;
8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
O coeficiente de variação da análise é dado pela razão entre o desvio padrão e a média,
multiplicada por 100%

058. (CEBRASPE/PF/2018/PERITO CRIMINAL) Considerando que a análise de uma amostra


de minério de chumbo tenha apresentado os seguintes resultados percentuais (%): 8,10;
8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
A variância dos dados em apreço é dada pelo valor do desvio padrão ao quadrado.

059. (CEBRASPE/PF/2018/PERITO CRIMINAL) Considerando que a análise de uma amostra


de minério de chumbo tenha apresentado os seguintes resultados percentuais (%): 8,10;
8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
O desvio padrão da análise em apreço é dado pela raiz quadrada do valor médio dividido
pelo número de amostras, no caso, 6.

060. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I) A respeito do conjunto de dados {11,


6, 28, 51, 49, 32, 33}, julgue os itens a seguir.
Esse conjunto de dados possui variância amostral inferior a 300.

061. (CEBRASPE/PF/2012) Se a amplitude observada em um conjunto de dados formado por


10 elementos for igual a 12, então a variância desse conjunto de dados será inferior a 120.

062. (CEBRASPE/PC-SE/2021) Considere duas variáveis aleatórias contínuas, x e y, tais que


P(x > 0) = 1, P(x ≤ 1) = 1/10, P(x ≤ 1 | y > 1) = 3/10, Var (x) = Var (y) = 1, e Cov (x, y) = 0.
Com base nessas informações, julgue os itens a seguir.
x e y são independentes.

063. (CEBRASPE/PC-SE/2021) Considere duas variáveis aleatórias contínuas, x e y, tais que


P(x > 0) = 1, P(x ≤ 1) = 1/10, P(x ≤ 1 | y > 1) = 3/10, Var (x) = Var (y) = 1, e Cov (x, y) = 0.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 119 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Com base nessas informações, julgue os itens a seguir.


Var (x - y) = 2.

064. (CEBRASPE/2018/POLÍCIA FEDERAL/PERITO CRIMINAL FEDERAL/ÁREA 1)

Tendo em vista que, diariamente, a Polícia Federal apreende uma quantidade x, em kg, de
drogas em determinado aeroporto do Brasil, e considerando os dados hipotéticos da tabela
precedente, que apresenta os valores observados da variável x em uma amostra aleatória
de 5 dias de apreensões no citado aeroporto, julgue o próximo item.
O desvio padrão amostral da variável x foi inferior a 7 kg.

065. (FCC/TRT 9ª REGIÃO (PR)/2020/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Uma população


com 16 valores estritamente positivos x1, x2, x3, …, x16, correspondente a um determinado
atributo, apresenta as seguintes informações:

O elemento x10, tal que x10 = 12, é retirado da população. Os valores da variância da primeira
população e da nova população formada são, respectivamente, iguais a:
a) 144 e 134,40
b) 144 e 144
c) 135 e 144
d) 135 e 135
e) 135 e 126

066. (CESPE/IPHAN/2018/ANALISTA I/ÁREA 2) Cinco municípios de um estado brasileiro


possuem as seguintes quantidades de patrimônios históricos: {2, 3, 5, 3, 2}.
Admitindo que a média e o desvio padrão desse conjunto de valores sejam iguais a 3 e 1,2,
respectivamente, julgue o item seguinte.
O coeficiente de variação é superior a 0,3 e inferior a 0,5.

067. (ESAF/AFRFB/2012) Em um concurso público a nota média da prova de inglês foi igual
a 7 com desvio padrão igual a 2. Por outro lado, a nota média da prova de lógica foi igual

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 120 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

a 7,5 com desvio padrão igual a 4. Naná obteve nota 8 em Inglês e nota 8 em Lógica. Nené
obteve nota 7,5 em Inglês e 8,5 em Lógica. Nini obteve 7,5 em Inglês e 9 em Lógica. Com
relação à melhor posição relativa ─ ou ao melhor desempenho ─, pode-se afirmar que o
desempenho de:
a) Naná foi o mesmo em Inglês e Lógica.
b) Nini foi melhor em Lógica do que o de Naná em Inglês.
c) Nené foi melhor em lógica do que o de Naná em Inglês.
d) Nené foi o mesmo em Inglês e Lógica.
e) Nené foi melhor em Lógica do que em Inglês.

068. (CESPE/TCE-PR/2016) Se satisfação no trabalho e saúde no trabalho forem indicadores


com variâncias populacionais iguais a 8 e 2, respectivamente, e se a covariância populacional
entre esses indicadores for igual a 3, então a correlação populacional entre satisfação no
trabalho e saúde no trabalho será superior a 0,70.

TÉCNICAS DE AMOSTRAGEM

069. (CESPE/PC-DF/2021/AGENTE) Em uma pesquisa de campo, realizada por meio de


amostragem aleatória simples, mediram-se as alturas de moradores masculinos adultos de
determinado município. Os pesquisadores resolveram aproximar a distribuição de alturas
por uma normal. Eles estimaram os parâmetros da normal por meio do método de máxima
verossimilhança. Considerando essa situação hipotética, julgue os itens a seguir.
A amostragem estratificada por faixas de renda familiar quando criança possibilitaria uma
estimação intervalar mais precisa dos parâmetros da distribuição normal.

070. (FCC/PREFEITURA DO RECIFE-PE/2019/ANALISTA DE GESTÃO ADMINISTRATIVA) Uma


população de tamanho 1.600 é dividida em 80 subpopulações distintas. Por meio de um
sorteio, 20 subpopulações são selecionadas e todos os elementos nas subpopulações
selecionadas são observados. Este tipo de amostragem é denominado de Amostragem
a) por Conglomerados.
b) Sistemática.
c) Aleatória Estratificada.
d) Determinística.
e) por Quotas.

071. (CESPE/TJ-PA/2020/ANALISTA JUDICIÁRIO/ESTATÍSTICA) O dono de um restaurante


pretende selecionar 50 de seus clientes fidelizados para a degustação de uma nova receita
que deseja incluir no cardápio. Ele possui um cadastro em que cada cliente fidelizado está

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 121 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

numerado sequencialmente de 1 a 1.980. Cara realizar a seleção, ele decidiu utilizar a técnica
de amostragem sistemática.
Nessa situação, caso o intervalo de seleção da amostra seja igual a 39 e a primeira unidade
populacional selecionada seja a 12ª, então a terceira unidade populacional selecionada será a:
a) 117ª
b) 36ª
c) 90ª
d) 51ª
e) 3ª

072. (FEPESE/ISS/CRICIÚMA/2017/AFTM) Uma agência de publicidade quer estimar o grau


de preferência entre dois produtos (A e B) concorrentes pelos usuários do cartão-fidelidade
de uma certa rede de supermercados. Para isso, realizará uma sondagem junto a uma
população de amostra dos usuários do cartão.
Os usuários selecionados terão de escolher uma das seguintes opções:
• Não tenho preferência entre (ou não uso) esses produtos
• Prefiro o produto A
• Prefiro o produto B
Para selecionar a amostra, a agência deve decidir entre um dos seguintes métodos de
amostragem:
• Método 1: selecionar aleatoriamente, no cadastro de usuários do cartão, 100 usuários
de cartão de crédito e lhes enviar uma enquete.
• Método 2: com base no cadastro, organizar os clientes da rede de supermercados em
grupos de acordo a faixa etária e então selecionar 100 usuários do cartão-fidelidade
aleatoriamente e de forma proporcional à quantidade de clientes em cada faixa
etária considerada.
• Método 3: convidar por meio de e-mail cada usuário do cartão para que participe
da pesquisa de opinião, e utilizar como população de amostra os usuários que se
disponibilizarem a responder o questionário.
Os métodos descritos acima são, respectivamente:
a) 1 e 2: amostragem casual simples; 3: amostragem não casual
b) 1: amostragem casual simples; 2 e 3: amostragem não casual
c) 1 e 2: amostragem casual estratificada; 3: amostragem não casual
d) 1 e 3: amostragem casual simples; 2: amostragem não casual
e) 1: amostragem casual simples; 2: amostragem casual estratificada; 3: amostragem não
casual

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 122 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

073. (FCC/PREFEITURA DE RECIFE-PE/ANALISTA DE PLANEJAMENTO, ORÇAMENTO E GESTÃO)


Uma população de tamanho 1.600 é dividida em 80 subpopulações distintas. Por meio de
um sorteio, 20 subpopulações são selecionadas e todos os elementos nas subpopulações
selecionadas são observados. Este tipo de amostragem é denominado de Amostragem
a) por Conglomerados.
b) Sistemática.
c) Aleatória Estratificada.
d) Determinística.
e) por Quotas.

074. (FCC/PREFEITURA DE RECIFE-PE/2019/ANALISTA DE GESTÃO ADMINISTRATIVA) Uma


população com uma certa quantidade de elementos é dividida previamente em grupos
mutuamente exclusivos e dentro dos quais são sorteadas amostras casuais simples. Esse
tipo de amostragem é denominado de Amostragem:
a) Determinística.
b) por Conveniência.
c) Aleatória Estratificada.
d) por Quotas.
e) por Conglomerados.

075. (FGV/HEMOCENTRO-SP/2013) O método de seleção de amostras em que a quantidade


de unidades de amostragem na população é dividida pelo tamanho da amostra para dar
um intervalo de amostragem é uma seleção:
a) aleatória.
b) sistemática.
c) ao acaso.
d) de bloco.
e) de unidade monetária.

076. (FCC/SEFAZ-SP/AGENTE FISCAL DE RENDAS/2013/ADAPTADA) Na amostragem aleatória


estratificada, a população é dividida em estratos, usualmente, de acordo com os valores
ou categorias de uma variável, e, depois, uma amostragem aleatória simples é utilizada na
seleção de uma amostra de cada estrato.

077. (FGV/IBGE/2016/TECNOLOGISTA/ESTATÍSTICA) A elaboração do Plano Amostral de uma


pesquisa de campo demanda três especificações: a unidade amostral, a forma de seleção
da amostra e o tamanho da amostra. Para seleções de natureza aleatórias, existem algumas
alternativas, sobre as quais é correto afirmar que:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 123 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

a) a amostragem estratificada divide a população em grupos que devem ser os mais


heterogêneos possíveis para algum atributo da população;
b) a amostragem sistemática é realizada em dois estágios, sendo que apenas no segundo
se chega a unidade amostral;
c) na amostragem estratificada proporcional, o número de elementos da amostra, em cada
estrato, é proporcional ao tamanho do estrato;
d) na amostra aleatória simples, as probabilidades de seleção dos indivíduos da população
podem ser diferentes, porém devem ser conhecidas;
e) na amostragem por cotas, a probabilidade de seleção deve ser

078. (FGV/AL-RO/2018/ANALISTA LEGISLATIVO/ESTATÍSTICA) Acerca da amostragem


estratificada, analise as afirmativas a seguir.
I – Visa a produzir estimativas mais precisas, produzir estimativas para a população toda
e para subpopulações.
II – Em geral, quanto menos os elementos de cada estrato forem parecidos entre si e também
entre os estratos, maior será a precisão dos estimadores.
III – A estratificação produz necessariamente estimativas mais eficientes do que a amostragem
aleatória simples.
Está correto o que se afirma em:
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.

079. (FGV/ALERO/ANA LEG/2018) Sobre as vantagens da amostragem por conglomerados,


avalie as afirmativas a seguir.
I – O plano amostral é mais eficiente já que dentro dos conglomerados os elementos tendem
a ser mais parecidos.
II – Não há necessidade de uma lista de identificação dos elementos da população.
III – Tem, em geral, menor custo por elemento, principalmente quando o custo por observação
cresce se aumenta a distância entre os elementos.
Está correto o que se afirma em
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 124 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

080. (CESPE/TELEBRÁS/2013) O risco de amostragem está relacionado, entre outras


hipóteses, com a possibilidade de que uma amostra tenha sido selecionada com base em
critérios estatísticos corretos, mas que não é adequada para representar a população.

081. (FGV/AL-RO/2018/ANALISTA LEGISLATIVO/ESTATÍSTICA) Acerca da amostragem


estratificada, analise as afirmativas a seguir.
I – Visa a produzir estimativas mais precisas, produzir estimativas para a população toda
e para subpopulações.
II – Em geral, quanto menos os elementos de cada estrato forem parecidos entre si e também
entre os estratos, maior será a precisão dos estimadores.
III – A estratificação produz necessariamente estimativas mais eficientes do que a amostragem
aleatória simples.
Está correto o que se afirma em:
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.

082. (CESPE/TJ-PA/2020/ANALISTA JUDICIÁRIO/ESTATÍSTICO) Uma população de 1.200


elementos possui um sistema de referências ordenado de 1 a 1.200. Com o propósito de
se obter uma amostra de 300 elementos dessa população, dividiram-na em 300 grupos de
4 unidades populacionais, tendo sido a unidade 2 selecionada aleatoriamente entre as 4
primeiras unidades. Em seguida, foram selecionadas as segundas unidades dos 299 grupos
restantes, completando-se, assim, a amostra de 300 unidades populacionais.
Nesse caso, foi utilizada a amostragem:
a) por conglomerados em um estágio.
b) estratificada.
c) sistemática.
d) aleatória simples.
e) por intervalos.

PROBABILIDADES

083. (CESPE/MINISTÉRIO DA ECONOMIA/2020/TECNOLOGIA DE INFORMAÇÃO/SEGURANÇA DA


INFORMAÇÃO E PROTEÇÃO DE DADOS) O setor de gestão de pessoas de determinada empresa
realiza regularmente a análise de pedidos de férias e de licenças dos seus funcionários.
Os pedidos são feitos em processos, em que o funcionário solicita apenas férias, apenas

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 125 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

licença ou ambos (férias e licença). Em determinado dia, 30 processos foram analisados,


nos quais constavam 15 pedidos de férias e 23 pedidos de licenças.
Com base nessa situação hipotética, julgue o item que se seguem.
Se todos os processos foram analisados individualmente nesse dia, então a probabilidade
de um processo específico ter sido o primeiro a ser analisado é superior a 1/10.

084. (FGV/DPE-RS/2023/TÉCNICO ADMINISTRATIVO) Um dado cúbico honesto, com as


faces numeradas de 1 a 6, é lançado duas vezes consecutivas. Sabe-se que no primeiro
lançamento saiu um número maior do que 4.
A probabilidade de que a soma dos dois números sorteados seja maior do que 8 é:
a) 1/2
b) 2/3
c) 5/8
d) 7/12
e) 9/16

085. (IF-MA/2023/ASSISTENTE EM ADMINISTRAÇÃO) A respeito dos conceitos associados


à probabilidade, é correto afirmar que:
a) a probabilidade de se obter “cara” no lançamento de uma moeda não viciada é igual à
probabilidade de se obter um número “par” no lançamento de um dado comum, não viciado.
b) quando há a certeza da ocorrência de certo evento, pode-se dizer que a probabilidade
de tal ocorrência é 200%.
c) se lançarmos dois dados comuns, não viciados, há maior probabilidade de a soma dos
pontos voltados para cima ser 11 do que 7.
d) se lançarmos uma moeda não viciada duas vezes e obtivermos “cara” no primeiro
lançamento, a probabilidade de o segundo lançamento resultar “coroa” é maior que 50%.
e) se lançarmos duas moedas comuns, ambas não viciadas e indistinguíveis, a probabilidade
de obtermos faces iguais é maior que a probabilidade de obtermos faces diferentes.

086. (AOCP/PM-DF/2023/SOLDADO) A ocorrência de um crime contava com apenas duas


testemunhas oculares. Após o início das investigações, as evidências apontaram para três
irmãos gêmeos idênticos, sem qualquer característica física que permitisse distingui-los
naquela situação. Sabe-se que nenhum deles tem álibi e que um deles realmente é o único
criminoso. As testemunhas, na ânsia de se livrarem rapidamente da situação, optaram
por apontar aleatoriamente (ainda que de forma imprudente) um dos três irmãos como
culpado. Considerando as informações constantes nesse problema, qual é a probabilidade
de ambas as testemunhas terem apontado corretamente para o criminoso?
a) Aproximadamente 50%.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 126 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

b) Aproximadamente 33%.
c) Aproximadamente 17%.
d) Aproximadamente 11%.
e) Aproximadamente 2%.

087. (CESPE/TJ-PA/2020/ANALISTA JUDICIÁRIO/ANÁLISE DE SISTEMAS) Em um sistema


informatizado, as senhas são formadas por três letras distintas, em uma ordem específica.
Esse sistema bloqueia a conta do usuário a partir da quinta tentativa errada de inserção da
senha. Abel fez seu cadastro no sistema, mas, após certo tempo sem utilizá-lo, esqueceu-
se da senha, lembrando-se apenas de que ela era formada com as letras do seu nome, sem
repetição.
Nessa situação hipotética, a probabilidade de Abel, inserindo senhas com base apenas nas
informações de que ele se lembra, conseguir acessar a sua conta sem bloqueá-la é igual a:
a) 3/192
b) 3/72
c) 3/24
d) 3/18
e) ¾

088. (FGV/MP-SC/2022/AUXILIAR DO MINISTÉRIO PÚBLICO) ALESSANDRA escreveu em 10


cartões diferentes cada uma das 10 letras do seu nome e colocou esses cartões em uma
urna. A seguir, ela retirou, aleatoriamente e em sequência, 3 cartões da urna. A probabilidade
de que ALESSANDRA tenha retirado os 3 cartões com a letra “A” é:
a) 1/120
b) 7/120
c) 1/40
d) 3/10
e) 3/7

089. (CEBRASPE/CBM-TO/2023/ALUNO-PRAÇA) Em um batalhão de bombeiros, estão de


plantão doze soldados, sendo sete homens e cinco mulheres. Desse total de soldados, dois
serão escolhidos ao acaso para compor uma equipe que atuará em uma missão.
Nessa situação hipotética, a probabilidade de que essa equipe tenha pelo menos uma
mulher é de:
a) 35/66
b) 15/22
c) 5/33
d) 7/22

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 127 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

090. (FGV/CBME-RJ/2023/OFICIAL) Solange e Marcelo fazem parte de um grupo de 10


pessoas. Sorteiam-se duas pessoas desse grupo, em sequência e sem reposição.
A probabilidade de Solange ser sorteada e Marcelo não ser sorteado é de:
a) 8/45
b) 1/10
c) 1/5
d) 4/25
e) 3/40

091. (INSTITUTO SELECON/CREA/RJ/2023/AGENTE ADMINISTRATIVO) Em um lote contendo


X camisas, 90% delas são do tamanho G e o restante do tamanho P. Desse lote, 70% das
camisas tamanho G e 20% das camisas tamanho P serão destinadas à venda no exterior. O
percentual de X que não será destinado à venda no exterior corresponde a:
a) 32%
b) 33%
c) 34%
d) 35%
e) 36%

092. (FGV/RECEITA FEDERAL/2023/ANALISTA TRIBUTÁRIO) Ana vai passar o fim de semana


em sua casa de praia. A previsão do tempo diz que a probabilidade de chuva no sábado é
de 30%, e a probabilidade de chuva no domingo é de 40%.
Nesse caso, a probabilidade de que Ana consiga ir à praia no fim de semana sem pegar
chuva é de:
a) 46%
b) 55%
c) 63%
d) 88%
e) 92%

093. (FGV/FUNSAÚDE-CE/2021) Em uma urna, há bolas pequenas e bolas grandes, sendo


75% pequenas e as demais são grandes. Das bolas pequenas, 20% são azuis e as demais
são vermelhas e, das bolas grandes, 60% são azuis e as demais são vermelhas. Retira-se,
aleatoriamente, uma bola da urna e constata-se que ela é azul. A probabilidade de a bola
retirada ser pequena é de
a) 20%
b) 25%
c) 30%

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 128 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

d) 40%
e) 50%

094. (FGV/RECEITA FEDERAL/2023/ANALISTA TRIBUTÁRIO) Nelson dividiu sua vasta biblioteca


entre livros de aventura (a), biografias (b), científicas (c) e diversos (d). Ele também catalogou
os livros segundo o número de páginas (np): os de menos de 200 páginas, aqueles que têm
entre 200 e 500 páginas e os de mais de 500 páginas.
A tabela a seguir apresenta os percentuais de livros com menos de duzentas páginas e
percentuais de livros com mais de 500 páginas para cada uma das categorias a, b, c e d. A
tabela mostra ainda o percentual de livros de cada das 4 categorias.

O percentual de livros da biblioteca com um número de páginas entre 200 e 500 situa-se
entre
a) 0,45 e 0,50
b) 0,40 e 0,45
c) 0,35 e 0,40
d) 0,30 e 0,35
e) 0,25 e 0,30

095. (INSTITUTO SELECON/CREA-RJ/2023/AGENTE ADMINISTRATIVO) Em um grupo formado


por 40 agentes de fiscalização, 26 moram na cidade do Rio de Janeiro, 15 têm quarenta
e cinco anos e 8 moram no Rio de Janeiro e têm quarenta e cinco anos. Escolhendo-se ao
acaso dois desses 40 agentes, a probabilidade de que ambos não morem no Rio de Janeiro
e não tenham quarenta e cinco anos é de:
a) 7/130
b) 7/260
c) 7/380
d) 7/460
e) 7/520

096. (FCC/ALAP/2020/ANALISTA LEGISLATIVO/ECONOMIA) Em determinado setor de um


órgão público foi realizado um levantamento com relação aos cargos de nível superior. A
tabela abaixo apresenta a distribuição dos respectivos funcionários segundo o cargo e sexo.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 129 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Um funcionário é escolhido aleatoriamente neste setor para realizar uma tarefa. Seja E o
evento indicando que o funcionário escolhido é economista e seja H o evento indicando que
o funcionário escolhido é homem. Considerando, então, os eventos E H, a probabilidade de
que pelo menos um destes dois eventos ocorra é igual a
a) 64%
b) 76%
c) 56%
d) 80%
e) 48%
Considerando que A e B sejam eventos aleatórios independentes e que 𝑃(𝐴) = 0,8 e 𝑃(𝐵) =
0,2, julgue os próximos itens.

097. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I) 𝑃(𝐴 ∩ 𝐵) = 0


98. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I)

098. (CEBRASPE/TC-DF/2023/ANALISTA ADMINISTRATIVO DE CONTROLE EXTERNO) O conjunto


Ω representa o espaço amostral de um experimento aleatório. Considerando quatro eventos
aleatórios A, B, C, D  Ω, tais que A e B sejam eventos independentes, C  A e A ∩ D = Ø,
julgue os seguintes itens a seguir, sabendo que P(A) = 0,4; P(B) = 0,3; P(C) = 0,2 e P(D) = 0,1.
P(A Ս B) + P(A Ս C) + P(A Ս D) = 1,48

099. (CEBRASPE/TC-DF/2023/ANALISTA ADMINISTRATIVO DE CONTROLE EXTERNO) P(A|B)


+ P(A|C) + P(A|D) = 1,4.

100. (FGV/IBGE/2016/TECNOLOGIA/ESTATÍSTICO) A teoria das probabilidades está apoiada


em um conjunto de três axiomas, atribuídos a Kolmogorov. Sendo S o espaço amostral, A e
B dois eventos, Ø do vazio e P(.) a medida de probabilidade, os axiomas estabelecem que:
a) P(S) = 1, P(A) ≥ 0 e P(A∩B) = P(A) ⋅ P(B);

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 130 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

b) P(Ø) = 0, P(A) ≤ 1 e P(A U B) = P(A) + P(B);


c) P(A) ≥ 0; P(A) = 1 - P(AC ) e P(S) = 1, AC = Complementar de A;
d) P(A) ≥ 0; P(S) = 1 e P(A U B) = P(A) + P(B) com A∩B = Ø;
e) P(A) ≤ 1; P(S) = 1 e P(A U B) = P(A) + P(B) - P(A∩B).

101. (CESPE/MINISTÉRIO DA ECONOMIA/2020/TECNOLOGIA DE INFORMAÇÃO/SEGURANÇA DA


INFORMAÇÃO E PROTEÇÃO DE DADOS) O setor de gestão de pessoas de determinada empresa
realiza regularmente a análise de pedidos de férias e de licenças dos seus funcionários.
Os pedidos são feitos em processos, em que o funcionário solicita apenas férias, apenas
licença ou ambos (férias e licença). Em determinado dia, 30 processos foram analisados,
nos quais constavam 15 pedidos de férias e 23 pedidos de licenças.
Com base nessa situação hipotética, julgue o item que se seguem.
Se todos os processos foram analisados individualmente nesse dia, então a probabilidade
de um processo específico ter sido o primeiro a ser analisado é superior a 1/10.

102. (CESPE/MINISTÉRIO DA ECONOMIA/2020/TECNOLOGIA DE INFORMAÇÃO/SEGURANÇA


DA INFORMAÇÃO E PROTEÇÃO DE DADOS) A probabilidade de, em um processo, constar um
pedido de férias é calculada pelo conceito clássico de probabilidades.

103. (CESPE/BNB/2018/ANALISTA DE SISTEMA) Um tabuleiro quadrado e quadriculado,


semelhante a um tabuleiro de xadrez, com 12 linhas e 12 colunas, e, portanto, com 12 ⋅ 12
= 144 quadradinhos pintados: 54, na cor azul; 30, na cor marrom; 40, na cor amarela; e 20,
na cor verde. A cada quadradinho é associado um cartão com dois números, que indicam a
posição do quadradinho no tabuleiro; o primeiro número corresponde ao número da linha,
e o segundo corresponde ao número da coluna. Por exemplo, o cartão com os números 5,10
corresponde ao quadradinho posicionado na linha 5 e na coluna 10. Esses cartões estão em
uma urna, da qual podem ser retirados aleatoriamente.
A probabilidade de retirar dessa caixa, de maneira aleatória, um cartão correspondente a
um quadrado que não tenha sido pintado na cor marrom é inferior a 0,72.

104. (FGV/MP-SC/2022/AUXILIAR DO MINISTÉRIO PÚBLICO) ALESSANDRA escreveu em 10


cartões diferentes cada uma das 10 letras do seu nome e colocou esses cartões em uma
urna. A seguir, ela retirou, aleatoriamente e em sequência, 3 cartões da urna. A probabilidade
de que ALESSANDRA tenha retirado os 3 cartões com a letra “A” é:
a) 1/120
b) 7/120
c) 1/40
d) 3/10
e) 3/7
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 131 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

105. (FCC/2019/SEFAZ-BA/AUDITOR FISCAL/ADMINISTRAÇÃO TRIBUTÁRIA/PROVA II) Uma


sala contém 20 homens e 30 mulheres em que todos são funcionários de uma empresa.
Verifica-se que metade desses homens e metade dessas mulheres possuem nível superior.
Escolhendo aleatoriamente uma pessoa dessa sala para realizar uma tarefa, a probabilidade
de ela ser mulher ou possuir nível superior é igual a:
a) 2/3
b) 3/10
c) 5/6
d) 3/4
e) 4/5

106. (FGV/FUNSAÚDE-CE/2021) Em uma urna, há bolas pequenas e bolas grandes, sendo


75% pequenas e as demais são grandes. Das bolas pequenas, 20% são azuis e as demais
são vermelhas e, das bolas grandes, 60% são azuis e as demais são vermelhas. Retira-se,
aleatoriamente, uma bola da urna e constata-se que ela é azul. A probabilidade de a bola
retirada ser pequena é de
a) 20%
b) 25%
c) 30%
d) 40%
e) 50%

DISTRIBUIÇÕES DE PROBABILIDADE

107. (FGV/RFB/2023/ANALISTA TRIBUTÁRIO) Uma variável aleatória discreta x tem função


de probabilidade dada por:
x 0 1 2 3
p(x) 0,5 0,2 0,1 0,2
A probabilidade de que o valor de x seja maior do que 2 é igual a:
a) 10%
b) 20%
c) 25%
d) 30%
e) 50%

108. (FGV/SEFAZ-BA/2022/AGENTE DE TRIBUTOS ESTADUAIS) Uma variável aleatória discreta


x tem a seguinte distribuição de probabilidades:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 132 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A média de x é igual a
a) 3,5
b) 4,0
c) 5,4
d) 6,2
e) 7,0

109. (CEBRASPE/TC-DF/2023/AUDITOR-FISCAL DE CONTROLE EXTERNO) Considerando que


X e Y sigam distribuições normais padrão e que a correlação linear entre ambas seja igual
a -1, julgue os seguintes itens.
P(x > 0) + P(Y ≤ 0) = 1

110. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE) Determinado órgão governamental


estimou que a probabilidade p de um ex-condenado voltar a ser condenado por algum
crime no prazo de 5 anos, contados a partir da data da libertação, seja igual a 0,25. Essa
estimativa foi obtida com base em um levantamento por amostragem aleatória simples
de 1.875 processos judiciais, aplicando-se o método da máxima verossimilhança a partir
da distribuição de Bernoulli.
Sabendo que P(z < 2) = 0,975, em que z representa a distribuição normal padrão, julgue o
item que segue, em relação a essa situação hipotética.
Se x seguir uma distribuição binomial com parâmetros n = 1.000 e probabilidade de sucesso
p, a estimativa de máxima verossimilhança da média de x será superior a 300.

111. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE) Determinado órgão governamental


estimou que a probabilidade p de um ex-condenado voltar a ser condenado por algum
crime no prazo de 5 anos, contados a partir da data da libertação, seja igual a 0,25. Essa
estimativa foi obtida com base em um levantamento por amostragem aleatória simples
de 1.875 processos judiciais, aplicando-se o método da máxima verossimilhança a partir
da distribuição de Bernoulli.
Sabendo que P(z < 2) = 0,975, em que Z representa a distribuição normal padrão, julgue o
item que segue, em relação a essa situação hipotética.
Em um grupo formado aleatoriamente por 4 ex-condenados libertos no mesmo dia, estima-
se que a probabilidade de que apenas um deles volte a ser condenado por algum crime no
prazo de 5 anos, contados a partir do dia em que eles foram libertados, seja superior a 0,4.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 133 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

112. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) O valor diário (em R$


mil) apreendido de contrabando em determinada região do país é uma variável aleatória W
que segue distribuição normal com média igual a R$ 10 mil e desvio padrão igual a R$ 4 mil.
Nessa situação hipotética,
P(W > R$ 10 mil) = 0,5

113. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/2021/ESTATÍSTICO) Um conjunto de dados


possui distribuição normal com média 100 e desvio padrão 10. A área correspondente ao
intervalo de 70 a 130 é igual a:
a) 68,26%
b) 99%
c) 95,44%
d) 99,73%
e) 99,994%

114. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/2021/ESTATÍSTICO) Em um teste de QI


com distribuição normal, em que a média é 100 e o desvio padrão é 10, gostaríamos de
separar os alunos com 2,28% do percentual mais elevado no teste. Qual deve ser a nota de
corte para separar os que alunos que têm 2,28% com notas mais elevadas?
a) 110
b) 115
c) 120
d) 130
e) 140

115. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) O valor diário (em R$


mil) apreendido de contrabando em determinada região do país é uma variável aleatória W
que segue distribuição normal com média igual a R$ 10 mil e desvio padrão igual a R$ 4 mil.
Nessa situação hipotética, se W1 e W2 forem duas cópias independentes e identicamente
distribuídas como W, então a soma W1 + W2 seguirá distribuição normal com média igual a
R$ 20 mil e desvio padrão igual a R$ 8 mil.

116. (CEBRASPE/POLÍCIA FEDERAL/2018/PAPILOSCOPISTA) De acordo com uma agência


internacional de combate ao tráfico de drogas, o volume diário de cocaína líquida (x, em
litros) apreendida por seus agentes segue uma distribuição normal com média igual a 50
L e desvio padrão igual a 10 L.
A partir dessas informações e considerando que Z representa uma distribuição normal
padrão, em que P(Z ≤ -2) = 0,025, julgue os itens subsecutivos.
P(x < 60 litros) = P(x ≥ 40 litros)

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 134 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

117. (CEBRASPE/POLÍCIA FEDERAL/2018/PAPILOSCOPISTA) De acordo com uma agência


internacional de combate ao tráfico de drogas, o volume diário de cocaína líquida (x, em
litros) apreendida por seus agentes segue uma distribuição normal com média igual a 50
L e desvio padrão igual a 10 L.
A partir dessas informações e considerando que Z representa uma distribuição normal
padrão, em que P(Z ≤ -2) = 0,025, julgue os itens subsecutivos.
P(x > 70 litros) = 0,05

118. (CEBRASPE/SERPRO/2023/ANALISTA) Considerando que uma variável aleatória siga uma


distribuição binomial com média igual a 80 e desvio padrão igual a 4, julgue os itens a seguir.
P ( X ≥ 115) = 0

119. (CEBRASPE/SERPRO/2023/ANALISTA) Considerando que uma variável aleatória siga uma


distribuição binomial com média igual a 80 e desvio padrão igual a 4, julgue os itens a seguir.
P ( X = 0) = 0,20

120. (CEBRASPE/PETROBRÁS/2021) Considerando que a variável aleatória X segue uma


distribuição binomial com parâmetros n = 10 e p = 0,1, julgue os itens subsequentes.
P(x>0) = 0,9

121. (CEBRASPE/PETROBRÁS/2021) Considerando que a variável aleatória X segue uma


distribuição binomial com parâmetros n = 10 e p = 0,1, julgue os itens subsequentes.
O valor esperado de é igual a 1.

122. (FGV/SEFAZ-BA/2022/AGENTE DE TRIBUTOS ESTADUAIS) Planeja-se selecionar quatro


pessoas, com reposição, de uma pequena população composta por vinte pessoas, das quais
dez foram acometidas por certa doença.
Se X é a variável aleatória que contará o número de pessoas, dentre as quatro, que foram
acometidas pela referida doença, então a probabilidade de X ser igual a 2 é igual a
a) 0,375
b) 0,425
c) 0,475
b) 0,5
e) 0,525

123. (FGV/SEFAZ-BA/2022/AGENTE DE TRIBUTOS ESTADUAIS) Acerca da distribuição de


probabilidades de uma variável aleatória X normalmente distribuída com média μ e variância
σ2, avalie as afirmativas a seguir.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 135 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

I – A variável Z = (x – μ)/σ tem distribuição normal padrão.


II – Se M é a mediana de X, então M > μ.
III – P[X > μ] = 0,5.
Está correto o que se afirma em
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.

124. (CESPE/TCE-PA/2016/AUDITOR DE CONTROLE EXTERNO) Considere um processo de


amostragem de uma população finita cuja variável de interesse seja binária e assuma valor
0 ou 1, sendo a proporção de indivíduos com valor 1 igual a p = 0,3. Considere, ainda, que
a probabilidade de cada indivíduo ser sorteado seja a mesma para todos os indivíduos
da amostragem e que, após cada sorteio, haja reposição do indivíduo selecionado na
amostragem.
A partir dessas informações, julgue o item subsequente.
Caso, em uma amostra de tamanho n = 10, os valores observados sejam A = {1, 0, 1, 0, 1, 0,
0, 1, 0, 0}, a estimativa via estimador de máxima verossimilhança para a média populacional
será igual a 0,4.

125. (FGV/SEFAZ-RJ/2010/AGENTE FISCAL DE RENDAS) 40% dos eleitores de uma certa


população votaram, na última eleição, num certo candidato A. Se cinco eleitores forem
escolhidos ao acaso, com reposição, a probabilidade de que três tenham votado no candidato
A é igual a:
a) 12,48%
b) 17,58%
c) 23,04%
d) 25,78%
e) 28,64%

126. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/2021/ESTATÍSTICO) Em um teste de QI


com distribuição normal, em que a média é 100 e o desvio padrão é 10, gostaríamos de
separar os alunos com 2,28% do percentual mais elevado no teste. Qual deve ser a nota de
corte para separar os que alunos que têm 2,28% com notas mais elevadas?
a) 110
b) 115
c) 120

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 136 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

d) 130
e) 140

127. (CESPE/POLÍCIA FEDERAL/2018/AGENTE) De acordo com uma agência internacional de


combate ao tráfico de drogas, o volume diário de cocaína líquida (x, em litros) apreendida
por seus agentes segue uma distribuição normal com média igual a 50 L e desvio padrão
igual a 10 L.
A partir dessas informações e considerando que Z representa uma distribuição normal
padrão, em que P(Z ≤ -2) = 0,025, julgue os itens subsecutivos.
O valor mais provável para a realização da variável X é 50 litros, de modo que P(x = 50 litros)
> P(x = 30 litros).

128. (CESPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) O valor diário (em R$


mil) apreendido de contrabando em determinada região do país é uma variável aleatória
W que segue distribuição normal com média igual a R$ 10 mil e desvio padrão igual a R$ 4
mil. Nessa situação hipotética,
A razão w-20/√4 segue distribuição normal padrão.

129. (FCC/DPE-SP/2015/ESTATÍSTICO/ADAPTADA) Suponha que o número mensal de


prisões em flagrante, comunicadas a uma Defensoria Pública de uma determinada região,
tenha distribuição de Poisson com média 9. Nessas condições, a probabilidade de serem
comunicadas, à Defensoria, pelo menos 3 prisões em flagrante em um período de 10 dias
é igual a:
Dados: e–2 = 0,14; e–3 = 0,05
a) 0,575
b) 0,425
c) 0,525
d) 0.475
e) 0,555

130. (FCC/SEFAZ-PI/2015/ANALISTA DO TESOURO ESTADUAL) O número de falhas mensais


de um computador é uma variável que tem distribuição de Poisson com média λ. Sabe-se
que λ é igual à média de uma distribuição uniforme no intervalo [2, 4]. Nessas condições,
a probabilidade de o computador apresentar exatamente duas falhas no período de 15
dias é igual a:
Dados: e–3 = 0,05; e–1,5 = 0,22.
a) 22,50%
b) 12,50%

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 137 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

c) 24,15%
d) 15,25%
e) 24,75%

INTERVALOS DE CONFIANÇA

131. (FGV/RFB/2023/ANALISTA TRIBUTÁRIO) Uma amostra aleatória de tamanho n = 64


de uma variável aleatória suposta normalmente distribuída com média desconhecida µ e
variância 100 foi observada e revelou uma média amostra igual a 44,65.
Lembrando que se Z tem distribuição normal padrão,
P(-1,96 < Z < 1,96) = 0,95
O intervalo de 95% de confiança será µ será dado por:
a) (42,2; 47,1)
b) (41,2; 48,1)
c) (40,2; 49,1)
d) (39,2; 50,1)
e) (38,2; 51,1)

132. (FADESP/UEPA/2020/TÉCNICO DE NÍVEL SUPERIOR/ESTATÍSTICA) Considere as seguintes


afirmações:
I. as distribuições de Bernoulli e Binomial apresentam as mesmas características e, portanto,
os mesmos parâmetros;
II. repetições independentes de um ensaio de Bernoulli, com a mesma probabilidade de
ocorrência de “sucesso”, dão origem ao modelo Binomial;
III. o Teorema do Limite Central garante que, para n suficientemente grande, a distribuição
de Bernoulli pode ser aproximada pela distribuição de Poisson.
Pode-se afirmar que
a) somente II está correta.
b) I e II estão corretas.
c) II e III estão corretas.
d) somente III está correta.
Suponha que y1, y2, …, y16 represente uma amostra aleatória simples retirada de uma
população normal, com média igual a 10 e desvio padrão igual a 32. Com respeito à média
amostral = (y1 + y2 + … + y16)/16, julgue os próximos itens.

133. (CEBRASPE/SERPRO/2023/ANALISTA) O desvio padrão de é igual a 32.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 138 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

134. (CEBRASPE/SERPRO/2023/ANALISTA) O valor esperado da média amostral é igual ao


valor da mediana populacional.

135. (CEBRASPE/SERPRO/2023/ANALISTA) A variável aleatória ⋅ 16 segue uma distribuição


binomial com parâmetro n = 16.

136. (FGV/SEFAZ-BA/2022/AGENTE DE TRIBUTOS ESTADUAIS) Uma amostra aleatória simples


x1, x2, x3, x4, de tamanho 4, será obtida de uma distribuição de probabilidades populacional
com média μ e variância σ².
Considere que o seguinte estimador de μ será usado
𝑋̅ = (x1 + x2 + x3 + x4)/4
A média e a variância de 𝑋̅ valem, respectivamente,
a) μ e σ²/2.
b) μ/2 e σ²/4.
c) μ/4 e σ²/4.
d) μ e σ²/4.
e) 2μ e σ².

137. (FGV/SEFAZ-BA/2022/AGENTE DE TRIBUTOS ESTADUAIS) Suponha que uma variável


aleatória populacional X pode ser suposta normalmente distribuída com média μ desconhecida
e variância σ2 conhecida.
Se uma amostra aleatória de tamanho n for obtida, e se 𝑥̅é o valor observado da média
amostral, então um intervalo de 95% de confiança para μ será dado por
a)
b)
c)
d)
e)

138. (CEBRASPE/PF/2018/ESCRIVÃO) O tempo gasto (em dias) na preparação para determinada


operação policial é uma variável aleatória X que segue distribuição normal com média M,
desconhecida, e desvio padrão igual a 3 dias. A observação de uma amostra aleatória de 100
outras operações policiais semelhantes a essa produziu uma média amostral igual a 10 dias.
Com referência a essas informações, julgue o item que segue, sabendo que P(Z > 2) = 0,025,
em que Z denota uma variável aleatória normal padrão.
O erro padrão da média amostral foi inferior a 0,5 dias.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 139 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

139. (CEBRASPE/PF/2018/ESCRIVÃO) A expressão 10 dias ± 6 dias corresponde a um intervalo


de 95% de confiança para a média populacional M.

140. (VUNESP/EBSERH/2020/ANALISTA ADMINISTRATIVO) Numa pesquisa são entrevistadas


400 pessoas e 80 delas se dizem contrárias a uma determinada proposta do governo. A
“margem de erro” dessa pesquisa (entendida como a metade da amplitude do intervalo de
confiança de 95%) é, em pontos percentuais, aproximadamente:
(Considere que, se z é uma variável aleatória com distribuição normal padrão, P(z < 1,96) =
0,975 e P(z < 1,645) = 0,95, sendo P(A) a probabilidade do evento A).
a) 0
b) 1
c) 2
d) 3
e) 4

141. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) Uma amostra de


tamanho 36 foi extraída, com reposição, de uma população normalmente distribuída com
variância populacional igual a 2,25. Com base nesta amostra, foi construído um intervalo de
confiança, com nível de confiança (1 - α), igual a [19,51; 20,49] para a média µ da população.
Uma outra amostra aleatória de tamanho 100, independente da primeira, foi extraída da
população, com reposição, apresentando uma média amostral igual a 21. Na construção
de um intervalo de confiança para a média µ, com um nível de confiança igual a (1 - α)
com base na amostra com 100 elementos encontra-se que o limite superior do intervalo
apresenta um valor igual a:
a) 21,294
b) 21,706
c) 21,490
d) 22,392
e) 21,510

142. (CEBRASPE/PF/2018/AGENTE) Determinado órgão governamental estimou que a


probabilidade p de um ex-condenado voltar a ser condenado por algum crime no prazo de 5
anos, contados a partir da data da libertação, seja igual a 0,25. Essa estimativa foi obtida com
base em um levantamento por amostragem aleatória simples de 1.875 processos judiciais,
aplicando-se o método da máxima verossimilhança a partir da distribuição de Bernoulli.
Sabendo que P(Z < 2) = 0,975, em que Z representa a distribuição normal padrão, julgue o
item que segue, em relação a essa situação hipotética.
O erro padrão da estimativa da probabilidade p foi igual a 0,01.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 140 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

143. (CEBRASPE/PF/2018/ESCRIVÃO) Uma pesquisa realizada com passageiros estrangeiros


que se encontravam em determinado aeroporto durante um grande evento esportivo no
país teve como finalidade investigar a sensação de segurança nos voos internacionais.
Foram entrevistados 1.000 passageiros, alocando-se a amostra de acordo com o continente
de origem de cada um – África, América do Norte (AN), América do Sul (AS), Ásia/Oceania
(A/O) ou Europa. Na tabela seguinte, N é o tamanho populacional de passageiros em voos
internacionais no período de interesse da pesquisa; n é o tamanho da amostra por origem;
P é o percentual dos passageiros entrevistados que se manifestaram satisfeitos no que se
refere à sensação de segurança.

Em cada grupo de origem, os passageiros entrevistados foram selecionados por amostragem


aleatória simples. A última linha da tabela mostra o total populacional no período da
pesquisa, o tamanho total da amostra e Ppop representa o percentual populacional de
passageiros satisfeitos.
A partir dessas informações, julgue o próximo item.
A estimativa do percentual populacional de passageiros originários da África que se mostraram
satisfeitos com a sensação de segurança nos voos internacionais foi igual a 80% e a estimativa
do erro padrão associado a esse resultado foi inferior a 4%.

144. (CEBRASPE/PF/2018/ESCRIVÃO) Considerando o referido desenho amostral, estima-


se que o percentual populacional Ppop seja inferior a 79%.
Um pesquisador deseja avaliar a significância estatística da diferença entre as médias
amostrais produzida por dois conjuntos de dados, amostras 1 e 2, conforme mostra o quadro
a seguir. Esses conjuntos de dados foram obtidos por amostragem aleatória de populações
normais, sendo que a primeira amostra foi retirada da população N(µ1, σ²), e a segunda foi
extraída da N(µ2, σ²). As duas amostras são independentes e possuem tamanhos distintos:
21 e 31, respectivamente. O quadro também apresenta duas estimativas diferentes para a
variância populacional σ²: 5 (amostra 1) e 10 (amostra 2). Nessas condições, o o pesquisador
deseja testar a hipótese nula H0: µ1 = µ2 contra a hipótese alternativa H1: µ1 ≠ µ2 mediante
aplicação do teste (paramétrico) t de Student para comparação de duas médias.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 141 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

tamanho da variância
amostra média amostral
amostra amostral
1 21 12 5
2 31 15 10
Considerando a situação hipotética apresentada, julgue os próximos itens.

145. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) A avaliação da


significância estatística da diferença entre as médias amostrais produzidas por esses
dois conjuntos de dados deve ser com base na distribuição t de Student com 50 graus de
liberdade.

146. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) Sob a hipótese nula H0:


µ1 = µ2, as amostras são combinadas para se obter uma estimativa comum para a variância
populacional σ², e o valor dessa estimativa combinada é igual a 8.

147. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) O referido teste de


hipóteses é unilateral à esquerda, pois a diferença entre as médias é negativa.

148. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) A estimativa da


variância da diferença entre as médias amostrais é igual a 5/21 + 10/31.

149. (CEBRASPE/PC-SE/2021) Com base em uma amostra aleatória simples de tamanho


n = 16 retirada de uma população normal com média desconhecida μ e variância σ² = 9,
deseja-se testar a hipótese nula H0: μ = 0 contra a hipótese alternativa H1: μ ≠ 0 por meio
da estatística , na qual denota a média amostral.
Com respeito a esse teste de hipóteses, julgue os itens a seguir, sabendo que o valor da
média amostral observado na amostra foi igual a 1 e que, relativo a esse teste, o P-valor
foi igual a 0,18.

Sob a hipótese nula, a estatística segue uma distribuição t de Student com 15


graus de liberdade.

150. (CEBRASPE/PC-SE/2021) O desvio padrão da média amostral é igual a 0,75.

151. (CESPE/TJ-PA/2020/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Na construção de um intervalo


de confiança para a média, conhecida a variância, considerando o intervalo na forma [x + ε;
x - ε], sendo x o valor do estimador da média e ε a semiamplitude do intervalo de confiança
ou, como é mais popularmente conhecida, a margem de erro do intervalo de confiança.
Considere que, para uma determinada peça automotiva, um lote de 100 peças tenha

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 142 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

apresentado espessura média de 4,561 polegada, com desvio padrão de 1,125 polegada. Um
intervalo de confiança de 95% para a média apresentou limite superior de 4,7815 e limite
inferior de 4,3405. Nessa situação, a margem de erro do intervalo é de, aproximadamente,
a) ε = 0,4410
b) ε = 0,3436
c) ε = 0,2205
d) ε = 0,1125
e) ε = 0,1103

152. (FCC/CNMP/2015/ANALISTA) Uma pesquisa é realizada em uma grande cidade com


uma amostra aleatória de 300 habitantes em que 75% deles manifestaram-se favoráveis
à implantação de um projeto para melhorar o atendimento ao público de sua cidade. Com
base nesta amostra, deseja-se obter um intervalo de confiança de 95% para esta proporção,
considerando que a distribuição amostral da frequência relativa dos habitantes favoráveis
ao projeto é normal. Utilizando a informação da distribuição normal padrão (Z) que as
probabilidades P(Z > 1,96) = 0,025 e P(Z > 1,64) = 0,050, este intervalo de confiança é, em
%, igual a:
a) [71,68; 78,32]
b) [71,34; 78,66]
c) [70,90; 79,10]
d) [70,40; 79,60]
e) [70,10; 79,90]

153. (CESPE/TCDF/2021/ANALISTA DE CONTROLE EXTERNO) Uma amostra aleatória simples,


sem reposição, de tamanho 100, será retirada de uma população constituída por 1.000
indivíduos, com o objetivo de se estimar a média μ das idades desses 1.000 indivíduos. Essa
amostra é representada por um conjunto de variáveis aleatórias x1, …, x100, e o estimador
da média populacional μ é dado pela seguinte expressão.

Tendo como referência essa situação hipotética, e considerando que o desvio padrão
populacional da distribuição das idades seja igual a 2 anos, julgue os itens que se seguem.

154. (CESPE/TC-DF/2021/ANALISTA DE CONTROLE EXTERNO) A variância do estimador


é inferior a 0,04.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 143 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

TESTES DE HIPÓTESES

155. (CEBRASPE/PC-SE/2021) Com base em uma amostra aleatória simples de tamanho


n = 16 retirada de uma população normal com média desconhecida μ e variância σ² = 9,
deseja-se testar a hipótese nula H0: μ = 0 contra a hipótese alternativa H1: μ ≠ 0 por meio
da estatística , na qual denota a média amostral.
Com respeito a esse teste de hipóteses, julgue os itens a seguir, sabendo que o valor da
média amostral observado na amostra foi igual a 1 e que, relativo a esse teste, o P-valor
foi igual a 0,18.
Se o nível de significância escolhido para o teste foi igual a 10%, então, nesse caso, a hipótese
nula H0: μ = 0 não seria rejeitada, embora a média amostral tenha sido diferente de zero.

156. (CEBRASPE/PC-SE/2021) O P-valor é uma medida que representa a potência do


teste em tela.
Um remédio para baixar a pressão arterial foi testado em pessoas com hipertensão. O
referido medicamento foi comparado a outro medicamento que já estava em uso no
mercado, por meio de amostragens aleatórias simples. Um teste t foi implementado para
verificar se a pressão arterial dos testados baixava mais, em média, com o uso do novo
remédio. Os pesquisadores escolheram um nível de significância de 0,01. Se o remédio
baixasse a pressão arterial em mais que certa quantidade, p, o fabricante mudaria sua
linha de produção para produzir o novo remédio. A potência do teste para detectar uma
redução dessa quantidade, p, foi 0,9.
Com relação a essa situação hipotética, julgue os itens que se seguem.

157. (CESPE/PC-DF/2021/AGENTE) Se fosse aumentado o tamanho da amostra, seria


possível diminuir o nível de significância e aumentar a potência do teste.

158. (CESPE/PC-DF/2021/AGENTE) Se o verdadeiro valor da redução média de pressão do


novo remédio fosse igual a p, então existiria uma chance de 90% de o teste ter detectado
essa diferença.

159. (CESPE/PC-DF/2021/AGENTE) Se o nível de significância fosse aumentado para 0,05,


a potência do teste diminuiria.

160. (AOCP/EBSERH/2016/ANALISTA ADMINISTRATIVO/Q1269637) Um pesquisador está


realizando um teste unilateral para a média com variância populacional conhecida e obteve
um p-valor igual a 0,065. Referente ao exposto, assinale a alternativa correta.
a) Se o nível de significância for fixado em 0,05, a hipótese H1 deverá ser aceita como
verdadeira.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 144 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

b) Ele não rejeitará a hipótese nula para níveis de significância maiores que 0,065.
c) A probabilidade de haver uma amostra com tal característica é de 0,01.
d) Ele rejeitará a hipótese nula para níveis de significância menores que 0,065.
e) Ele rejeitará a hipótese nula para níveis de significância maiores que 0,065.

161. (FCC/SEFAZ-BA/2019/AUDITOR FISCAL) Para obter um intervalo de confiança de 90%


para a média p de uma população normalmente distribuída, de tamanho infinito e variância
desconhecida, extraiu-se uma amostra aleatória de tamanho 9 dessa população, obtendo-
se uma média amostral igual a 15 e variância igual a 16. Considerou-se a distribuição t de
Student para o teste unicaudal tal que a probabilidade = 0,05, com n graus
de liberdade. Com base nos dados da amostra, esse intervalo é igual a:

a) (12,56; 17,44)
b) (13,76; 16,24)
c) (12,47; 17,53)
d) (12,59; 17,41)
e) (12,52; 17,48)

162. (FGV/DPE-RJ/2019/TÉCNICO SUPERIOR ESPECIALIZADO/ESTATÍSTICA) Acredita-se que


o valor do rendimento médio das pessoas que procuram ajuda na Defensoria Pública do
Rio de Janeiro seja inferior a R$ 2.000. Para tentar gerar uma evidência estatística de que
isso é verdade, foi proposto um teste de hipóteses com base numa amostra de tamanho
n = 64, tendo sido apurado um rendimento médio de R$ 1.952, com desvio-padrão de R$
256. Para a realização do teste será usada a aproximação da T-Student pela distribuição
Normal, para qual sabe-se que:
P(Z > 1,28) = 0,10, P(Z > 1,5) = 0,07, P(Z > 1,75) = 0,04 e P(Z > 2) = 0,02
Assim sendo, é correto concluir que:
a) ao nível de significância de 4% rejeita-se a hipótese nula;
b) ao nível de significância de 10% não é possível rejeitar a hipótese nula;
c) o conjunto de hipóteses a ser testado é: H0: μ = 2000 contra Ha; μ ≥ 2.000;
d) o p-valor correspondente ao teste bilateral e a observação obtida a partir da amostra,
= 1.952, é igual a 14%;
e) se o conjunto de hipóteses formulado fosse: H0: μ = 2.000 contra Ha: μ ≠ 2.000, ao nível
de significância de 7% a H0 seria rejeitada.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 145 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

163. (FGV/DPE-RJ/2014/TÉCNICO SUPERIOR ESPECIALIZADO/ESTATÍSTICA) Para testar a


renda média dos cidadãos efetivamente atendidos pela Defensoria Pública do Estado foi
realizado um levantamento a partir dos registros já existentes, que geraram uma amostra
aleatória de tamanho n = 100, para a qual foi calculada a média amostral igual a R$ 920,00
por mês. Deseja-se demonstrar, cabalmente, que, em média, os beneficiários ganham mais
do que R$ 1.000 por mês. Além disso, o desvio-padrão populacional é conhecido, sendo
igual a 500. Portanto, se Ø (-2,00) = 2,28% e Ø (-1,50) = 6,68%, onde Ø (,) é a distribuição
acumulada da Normal Padrão. Então, neste caso, a hipótese nula seria:
a) rejeitada ao nível de 2,28% e não rejeitada com significância de 6,68%.
b) não rejeitada ao nível de 2,28% e rejeitada com significância de 6,68%.
c) rejeitada tanto com 97,72% quanto com 93,32% de grau de confiança.
d) rejeitada ao nível de significância de 1,14% e 3,34%, bilateral.
e) não rejeitada tanto ao nível de significância 2,28% quanto de 6,68%.

164. (CESPE/STM/2018/ANALISTA JUDICIÁRIO) Diversos processos buscam reparação


financeira por danos morais. A tabela seguinte mostra os valores, em reais, buscados
em 10 processos – numerados de 1 a 10 – de reparação por danos morais, selecionados
aleatoriamente em um tribunal.

A partir dessas informações e sabendo que os dados seguem uma distribuição normal,
julgue o item subsequente.
Nessa situação, se for possível usar o teste t de Student, então esse teste teria 9 graus de
liberdade.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 146 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

165. (CESPE/TCE-PR/2016/ANALISTA DE CONTROLE ATUARIAL) Por meio de uma pesquisa,


estimou-se que, em uma população, o percentual p de famílias endividadas era de 57%.
Esse resultado foi observado com base em uma amostra aleatória simples de 600 famílias.
Nessa situação, considerando a hipótese nula H0: p ≥ 60%,a hipótese alternativa H1: p < 60%
e P(Z ≤ 2) = 0,977, em que Z representa a distribuição normal padrão, bem como sabendo
que o teste se baseia na aproximação normal, assinale a opção correta a respeito desse
teste de hipóteses.
a) O erro do tipo II representa a probabilidade de se rejeitar a hipótese nula, uma vez que,
na realidade, p = 60%.
b) Com nível de significância α = 2,3%, a regra de decisão do teste é rejeitar a hipótese nula
caso o percentual de famílias endividadas na amostra seja inferior a 56%.
c) Trata-se de um teste unilateral à direita.
d) A estatística do teste foi igual ou superior a 1.
e) A hipótese nula deve ser rejeitada caso a probabilidade de ocorrência de erro do tipo I
seja igual ou inferior a 0,01.

REGRESSÃO LINEAR

166. (IBFC/IBGE/2021/SUPERVISOR DE PESQUISAS) Num modelo de regressão linear pelo


método dos mínimos quadrados, sabe-se que a inclinação da reta é a = 3,24 e o intercepto
da reta é b = 12,6, então o valor de para x = 30 é:
a) 126,8
b) 136,8
c) 116,2
d) 108,2
e) 109,8

167. (FGV/RFB/2023/ANALISTA TRIBUTÁRIO) Uma reta de regressão linear simples foi obtida
a partir do modelo Y = αX + β + e pelo método de mínimos quadrados usual e mostrou as
seguintes estimativas dos coeficientes: a = 3,4 e b = 0,5; além disso, obteve-se um coeficiente
de correlação amostral igual a 0,9.
Com base nesses dados, avalie se as afirmativas a seguir estão corretas.
I – A porcentagem da variação total dos dados que é explicada pela regressão é menor do
que 60%.
II – A reta de regressão obtida ajusta bem o modelo.
III – O intercepto a = 3,4 mostra que a valor grandes de x correspondem valores grandes de y.
Está correto o que se afirma em:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 147 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

a) I, apenas.
b) II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I e II, apenas.

168. (VUNESP/EBSERH/2020/ANALISTA ADMINISTRATIVO/ESTATÍSTICO) A variável x tem média


4 e desvio padrão 2, enquanto a variável y tem média 3 e desvio padrão 1. A covariância
entre x e y é -1.
A equação estimada da regressão linear simples de y por x é:
a) y = 2 - 0,25x
b) y = 3 - 0,5x
c) y = 3 - x
d) y = 4 - x
e) y = 4 - 0,25x

169. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Em uma análise


de regressão, se o coeficiente de determinação r² = 1, então:
(Considere SQT = Soma de quadrados total; SQE = Soma de quadrados do erro; SQR = Soma
de quadrados da regressão.)
a) SQE = SQT
b) SQE = 1
c) SQR = SQE
d) SQR = SQT
e) SQR > SQT

Com base nas informações apresentadas na tabela precedente e considerando que a


covariância entre as variáveis X e Y seja igual a 3, julgue os itens que se seguem.

170. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I) A reta de regressão linear da variável


Y em função da variável X, obtida pelo método de mínimos quadrados ordinários, pode ser
escrita como 𝑌� = 0,75𝑋 + 6,25.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 148 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

171. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I) O coeficiente de determinação (ou


de explicação) da reta de regressão linear da variável X em função da variável Y é igual ou
superior a 0,60.

172. (CEBRASPE/SEFAZ-RR/2021/CONSULTOR) A tabela a seguir apresenta uma amostra


aleatória simples formada por 5 pares de valores (𝑋𝑖, 𝑌𝑖), em que 𝑖 = 1,2, …,5, 𝑋𝑖 é uma
variável explicativa e 𝑌𝑖 é uma variável dependente.

Considere o modelo de regressão linear simples na forma 𝑌𝑖 = 𝑏𝑋𝑖 + 𝜖𝑖, no qual 𝜖 representa
um erro aleatório normal com média zero e variância 𝜎2 e 𝑏 é o coeficiente do modelo. Com
base nos dados da tabela e nas informações apresentadas, é correto afirmar que o valor
da estimativa de mínimos quadrados ordinários do coeficiente b é igual a
a) 0,75
b) 0,9
c) 1,2
d) 1,35
e) 1,45

173. (IBFC/IBGE/2021/SUPERVISOR DE PESQUISAS) Dentre os gráficos abaixo, o que melhor


representa um coeficiente de correlação linear próximo de -0,23 é:

a)

b)

c)

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 149 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

d)

e)

174. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Considerando o


relacionamento entre a variável independente X e a variável dependente Y, mostrado na
figura abaixo, assinale a alternativa correta.

a) O relacionamento entre X e Y é positivo, e o coeficiente de correlação é igual a 73,2%.


b) O relacionamento entre X e Y é fraco e não deve ser considerado.
c) Não existe relação linear entre as variáveis analisadas.
d) O relacionamento entre X e Y é negativo, e a variável X explica 73,2% da variação da
variável Y.
e) O relacionamento entre X e Y é positivo, e a variável X explica 73,2% da variação da
variável Y.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 150 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

175. (CESPE/2019/CGE-CE/CONHECIMENTOS BÁSICOS) Considerando-se que, em uma


regressão múltipla de dados estatísticos, a soma dos quadrados da regressão seja igual
a 60.000 e a soma dos quadrados dos erros seja igual a 15.000, é correto afirmar que o
coeficiente de determinação – R² – é igual a:
a) 0,75
b) 0,25
c) 0,50
d) 0,20
e) 0,80

176. (CEBRASPE/POLÍCIA FEDERAL/2021) Um estudo objetivou avaliar a evolução do número


mensal Y de milhares de ocorrências de certo tipo de crime em determinado ano. Com
base no método dos mínimos quadrados ordinários, esse estudo apresentou um modelo
de regressão linear simples da forma.
Ŷ = 5 - 0,1 x T
Em que Ŷ representa a reta ajustada em função da variável regressora T, tal que 1 ≤ T ≤ 12.
Os erros padrão das estimativas dos coeficientes desse modelo, as razões t e seus respectivos
p-valores encontram-se na tabela a seguir.

Os desvios padrão amostrais das variáveis Y e T foram, respectivamente, 1 e 3,6.


Com base nessas informações, julgue o item a seguir.
Se a média amostral da variável T for igual a 6,5, então a média amostral da variável Y será
igual a 4,35 mil ocorrências.

177. (CEBRASPE/POLÍCIA FEDERAL/2021) A correlação linear entre as variáveis Y e T foi


igual a -0,1.

178. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Em um gráfico de


resíduos em uma análise de regressão, são exibidos:
a) Resíduos da variável explicativa versus resíduos da variável de resposta.
b) Resíduos da variável explicativa versus a variável de resposta.
c) A variável explicativa versus a variável de resposta.
d) A variável explicativa sobre o eixo x, contra a variável resposta sobre o eixo y
e) A variável explicativa versus resíduos da variável resposta.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 151 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

179. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Complete a tabela


de graus de liberdade para a realização do teste de ANOVA, a tabela deve ser preenchida
de acordo os dados da tabela de dados abaixo, para comparar o desempenho de médias
entre variáveis x1, x2 e x3:

Tabela de graus de liberdade da ANOVA:

Os graus de liberdade, respectivamente para o fator (I), para o erro (II) e para o total (III) são:
a) 2,18 e 20
b) 3,18 e 21
c) 2,20 e 22
d) 3,20 e 23
e) 2,19 e 21

180. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) Um pesquisador


estudou a relação entre a taxa de criminalidade (Y) e a taxa de desocupação da população
economicamente ativa (x) em determinada região do país. Esse pesquisador aplicou um
modelo de regressão linear simples na forma Y = bx + a + ε, em que b representa o coeficiente
angular, a é o intercepto do modelo e ε denota o erro aleatório com média zero e variância σ2.
A tabela a seguir representa a análise de variância (ANOVA) proporcionada por esse modelo.

A respeito dessa situação hipotética, julgue o próximo item, sabendo que b > 0 e que o
desvio padrão amostral da variável x é igual a 2.
A estimativa do coeficiente angular b, pelo método de mínimos quadrados ordinários, é
igual a 0,25.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 152 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

181. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) A estimativa da


variância σ² é superior a 0,5.

182. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) A correlação linear


de Pearson entre a variável resposta Y e a variável regressora X é igual a 0,75.

183. (IBFC/EBSERH/2020/ANALISTA ADMINISTRATIVO/ESTATÍSTICA) Um modelo de regressão


linear simples foi gerado para explicar vendas (Y, em milhares de reais) a partir de propaganda
(X, em centenas de reais). Algumas informações do modelo são apresentadas:
Equação de regressão estimada: Y = 12 + 1,8X
Tamanho da amostra: 17 observações.
Soma de quadrados da regressão: 225,00.
Soma de quadrados dos resíduos: 75,00.
Sb1 = 0,27.
Considere as seguintes afirmações:
I – De acordo com a equação de regressão estimada, um gasto de R$ 1.000,00 em propaganda
resulta em vendas estimadas de R$ 40.000,00.
II – O coeficiente de determinação do modelo (R²) é de 75%.
III – A cada incremento unitário em X, espera-se que Y aumente 1,8.
Estão corretas as afirmativas:
a) I apenas
b) I e II, apenas
c) I e III, apenas
d) II e III, apenas

184. (IBFC/EBSERH/2020/ANALISTA ADMINISTRATIVO/ESTATÍSTICA) Um modelo de regressão


linear simples foi gerado para explicar vendas (Y, em milhares de reais) a partir de propaganda
(x, em centenas de reais). Algumas informações do modelo são apresentadas:
Equação de regressão estimada: Y = 12 + 1,8X
Tamanho da amostra: 17 observações.
Soma de quadrados da regressão: 225,00.
Soma de quadrados dos resíduos: 75,00.
Sb1 = 0,27.
Considere as seguintes afirmações:
I – De acordo com a equação de regressão estimada, um gasto de R$ 1.000,00 em propaganda
resulta em vendas estimadas de R$ 40.000,00.
II – O coeficiente de determinação do modelo (R²) é de 75%.
III – A cada incremento unitário em X, espera-se que Y aumente 1,8.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 153 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Estão corretas as afirmativas:


a) I apenas
b) I e II, apenas
c) I e III, apenas
d) II e III, apenas

185. (CEBRASPE/POLÍCIA FEDERAL/2021) Um estudo objetivou avaliar a evolução do número


mensal Y de milhares de ocorrências de certo tipo de crime em determinado ano. Com
base no método dos mínimos quadrados ordinários, esse estudo apresentou um modelo
de regressão linear simples da forma.
Ŷ = 5 – 0,1 x T
Em que Ŷ representa a reta ajustada em função da variável regressora T, tal que 1 ≤ T ≤ 12.
Os erros padrão das estimativas dos coeficientes desse modelo, as razões t e seus respectivos
p-valores encontram-se na tabela a seguir.

Os desvios padrão amostrais das variáveis Y e T foram, respectivamente, 1 e 3,6.


Com base nessas informações, julgue o item a seguir.
Considere que a denote o coeficiente angular do modelo de regressão linear simples e
considere, ainda, que o teste de hipóteses H0: a = 0 versus H1: a ≠ 0. Nessa situação, com
referência a esse teste, caso o nível de significância escolhido seja igual a 5%, os resultados
do estudo em questão indicarão que não há evidências estatísticas contra a hipótese nula
H0: a = 0.

186. (CEBRASPE/2018/POLÍCIA FEDERAL/PAPILOSCOPISTA POLICIAL FEDERAL) O intervalo de


tempo entre a morte de uma vítima até que ela seja encontrada (y em horas) denomina-se
intervalo post mortem. Um grupo de pesquisadores mostrou que esse tempo se relaciona
com a concentração molar de potássio encontrada na vítima (x, em mmol/dm3). Esses
pesquisadores consideraram um modelo de regressão linear simples na forma y = ax + b +
ε, em que a representa o coeficiente angular, b denomina-se intercepto, e ε denota um erro
aleatório que segue distribuição normal com média zero e desvio padrão igual a 4.
As estimativas dos coeficientes a e b, obtidas pelo método dos mínimos quadrados ordinários
foram, respectivamente, iguais a 2,5 e 10. O tamanho da amostra para a obtenção desses
resultados foi n = 101. A média amostral e o desvio padrão amostral da variável x foram,
respectivamente, iguais a 9 mmol/dm3 e 1,6 mmol/dm3 e o desvio padrão da variável y foi
igual a 5 horas.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 154 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A respeito dessa situação hipotética, julgue o item a seguir.


O coeficiente de explicação do modelo (R2) foi superior a 0,70.

187. (VUNESP/EBSERH/2020/ANALISTA ADMINISTRATIVO/ESTATÍSTICO) A variável x tem média


4 e desvio padrão 2, enquanto a variável y tem média 3 e desvio padrão 1. A covariância
entre x e y é -1.
A equação estimada da regressão linear simples de y por x é:
a) y = 2 - 0,25x
b) y = 3 - 0,5x
c) y = 3 - x
d) y = 4 - x
e) y = 4 - 0,25x

188. (CEBRASPE/2018/POLÍCIA FEDERAL/PAPILOSCOPISTA) O intervalo de tempo entre


a morte de uma vítima até que ela seja encontrada (y em horas) denomina-se intervalo
post mortem. Um grupo de pesquisadores mostrou que esse tempo se relaciona com a
concentração molar de potássio encontrada na vítima (x, em mmol/dm3). Esses pesquisadores
consideraram um modelo de regressão linear simples na forma y = ax + b + ε, em que a
representa o coeficiente angular, b denomina-se intercepto, e ε denota um erro aleatório
que segue distribuição normal com média zero e desvio padrão igual a 4.
As estimativas dos coeficientes a e b, obtidas pelo método dos mínimos quadrados ordinários
foram, respectivamente, iguais a 2,5 e 10. O tamanho da amostra para a obtenção desses
resultados foi n = 101. A média amostral e o desvio padrão amostral da variável x foram,
respectivamente, iguais a 9 mmol/dm3 e 1,6 mmol/dm3 e o desvio padrão da variável y foi
igual a 5 horas.
A respeito dessa situação hipotética, julgue o item a seguir.
A média amostral da variável resposta y foi superior a 30 horas.

189. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Em uma análise


de regressão, se o coeficiente de determinação r² = 1, então:
(Considere SQT = Soma de quadrados total; SQE = Soma de quadrados do erro; SQR = Soma
de quadrados da regressão.)
a) SQE = SQT
b) SQE = 1
c) SQR = SQE
d) SQR = SQT
e) SQR > SQT

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 155 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

190. (CESPE/TCE-PA/2016) Uma regressão linear simples é expressa por Y = a + b ⋅ X + e,


em que o termo e corresponde ao erro aleatório da regressão e os parâmetros a e b são
desconhecidos e devem ser estimados a partir de uma amostra disponível. Assumindo
que a variável X é não correlacionada com o erro e, julgue o item subsecutivo, no qual os
resíduos das amostras consideradas são IID, com distribuição normal, média zero e variância
constante.
Se, em uma amostra de tamanho n = 25, o coeficiente de correlação entre as variáveis X e Y
for igual a 0,8, o coeficiente de determinação da regressão estimada via mínimos quadrados
ordinários, com base nessa amostra, terá valor R2 = 0,64.

191. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Em um gráfico de


resíduos em uma análise de regressão, são exibidos:
a) Resíduos da variável explicativa versus resíduos da variável de resposta.
b) Resíduos da variável explicativa versus a variável de resposta.
c) A variável explicativa versus a variável de resposta.
d) A variável explicativa sobre o eixo x, contra a variável resposta sobre o eixo y
e) A variável explicativa versus resíduos da variável resposta.

MOMENTOS DE VARIÁVEIS ALEATÓRIAS

192. (CESPE/CEBRASPE/2016/TCE-PA) Se as variáveis aleatórias x e y seguem distribuições


de Bernoulli, tais que P[x = 1] = P[y = 0] = 0,9, então a distribuição de X² é Bernoulli com
média igual a 0,81.

193. (CESPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
O valor esperado de X é igual a 12.

194. (CESPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
P(x = 5) > γ

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 156 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

195. (FCC/2013/TRT 5ª REGIÃO (BA)) Considere uma variável aleatória X uniformemente


distribuída no intervalo (m, n) em que nem m e nem n são conhecidos. Com base em uma
amostra aleatória de tamanho 10 obteve-se que os valores do primeiro e do segundo
momentos da amostra foram, respectivamente, 1,00 e 1,12. Aplicando o método dos
momentos, tem-se que as estimativas de m e n são, respectivamente,
a) 0,30 e 1,70
b) 0,40 e 1,60
c) 0,50 e 1,50
d) 0,60 e 1,40
e) 0,70 e 1,30

196. (FCC/TRT 1ª REGIÃO (RJ)/2011/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Seja X uma variável


aleatória contínua com função densidade de probabilidade dada por:

Se F(x) é a função de distribuição acumulada de X, então


a) F(2) - F(1) = 0,5.
b) F(x) é uma função escada.
c) F(x) = 0,5 x, se 1 < x < 2.
d) F(x) = 0,25 x², se 0 ≤ x ≤ 2.
e) F(x) = 0,5 x², se 0 ≤ x ≤ 2.

197. (FCC/2014/TRT 13ª REGIÃO (PB)) Suponha que uma variável aleatória X é uniformemente
distribuída no intervalo (a, b), em que nem a nem b são conhecidos. Utilizando o método
dos momentos, com base em uma amostra de tamanho 10, obtiveram-se os valores 1
e 4 para a e b, respectivamente. O valor do momento de ordem 2, centrado na origem,
correspondente aos elementos da amostra é:
a) 8
b) 6
c) 7
d) 5
e) 9

198. (VUNESP/TJ-SP/2015/ESTATÍSTICO JUDICIÁRIO) Leia o texto para responder à questão.


A função densidade de probabilidade de uma variável aleatória contínua é dada por:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 157 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

f(x) = 0 se x < 0
f(x) = k se 0 ≤ x < 2
f(x) = kx/2 se 2 ≤ x < 4
f(x) = 0 se x ≥ 4
De acordo com essa definição, o valor de k é:
a) 1/2
b) 1/3
c) 1/4
d) 1/5
e) 1/6

199. (VUNESP/TJ-SP/2015/ESTATÍSTICO JUDICIÁRIO) Leia o texto para responder à questão.


A função densidade de probabilidade de uma variável aleatória contínua é dada por:
f(x) = 0 se x < 0
f(x) = k se 0 ≤ x < 2
f(x) = kx/2 se 2 ≤ x < 4
f(x) = 0 se x ≥ 4
A probabilidade P(1 ≤ x ≤ 3) é
a) 9/15
b) 9/20
c) 12/15
d) 17/20
e) 13/15

200. (CESPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
O valor da constante γ é inferior a 0,01.

201. (INÉDITA/2023) Calcule a seguinte integral indefinida:

202. (INÉDITA/2023) Considere a seguinte distribuição de probabilidades:


f(x) = 2β²/x³, para x ≥ β, com β > 0
Essa função representa uma distribuição de probabilidades válida.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 158 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

203. (VUNESP/TJ-SP/2015/ESTATÍSTICO JUDICIÁRIO) Leia o texto para responder à questão.


A função densidade de probabilidade de uma variável aleatória contínua é dada por:
f(x) = 0 se x < 0
f(x) = k se 0 ≤ x < 2
f(x) = kx/2 se 2 ≤ x < 4
f(x) = 0 se x ≥ 4
De acordo com essa definição, o valor de k é:
a) 1/2
b) 1/3
c) 1/4
d) 1/5
e) 1/6

204. (VUNESP/TJ-SP/2015/ESTATÍSTICO JUDICIÁRIO) Leia o texto para responder à questão.


A função densidade de probabilidade de uma variável aleatória contínua é dada por:
f(x) = 0 se x < 0
f(x) = k se 0 ≤ x < 2
f(x) = kx/2 se 2 ≤ x < 4
f(x) = 0 se x ≥ 4
A probabilidade P(1 ≤ x ≤ 3) é
a) 9/15
b) 9/20
c) 12/15
d) 17/20
e) 13/15

205. (CEBRASPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
O valor da constante γ é inferior a 0,01.

206. (INÉDITA/2023) Considere a seguinte distribuição de probabilidades:


f(x) = 2/x³, para x ≥ 1
O valor esperado dessa variável é maior que 4.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 159 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

207. (CEBRASPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
O valor esperado de X é igual a 12.

208. (CEBRASPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
P(x = 5) > γ

209. (INÉDITA/2023/TFC) Considere, para a função

Para que seja uma função de probabilidade, deve ser:


a) 2
b) 4
c) 6
d) 8
e) 10

210. (FCC/TRE-PR/2015/ANALISTA JUDICIÁRIO) A função de probabilidade conjunta das


variáveis X e Y é dada por:

Nessas condições, a média de Y e P(x + Y = 3) são dados, respectivamente, por


a) 1 e 7/16
b) 7/16 e 13/16
c) 7/16 e 9/16
d) 9/16 e 7/16
e) 9/16 e 5/16

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 160 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

211. (CESPE/PC-SE/2021) Considere duas variáveis aleatórias contínuas, x e y, tais que P(x
> 0) = 1, P(x ≤ 1) = 1/10, P(x ≤ 1 | y > 1) = 3/10, Var(x) = Var(y) = 1, e Cov(x, y) = 0.
Com base nessas informações, julgue os itens a seguir.
X e Y são independentes.

212. (CONSULPLAN/TSE/2012/ANALISTA JUDICIÁRIO/ESTATÍSTICO) A função de densidade


conjunta para as variáveis aleatórias x e y é:

A covariância entre x e y é
a) -0,4
b) -1,2
c) -2,4
d) -3,6

213. (FCC/TRF (2ª REGIÃO)/2012/ANALISTA JUDICIÁRIO) Se X e Y tem função de probabilidade


conjunta dada por:

a) 1/3
b) 2/3
c) 2/9
d) 4/9
e) 1/6

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 161 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

GABARITO

MEDIDAS DE POSIÇÃO

1. c 10. E 19. d
2. a 11. C 20. b
3. e 12. E 21. e
4. e 13. E 22. e
5. e 14. c 23. b
6. b 15. C 24. b
7. d 16. c 25. c
8. b 17. e 26. e
9. C 18. e

APRESENTAÇÃO DAS VARIÁVEIS

27. d 35. E 43. C


28. e 36. E 44. d
29. E 37. C 45. E
30. E 38. c 46. d
31. b 39. E 47. e
32. e 40. a 48. E
33. a 41. E 49. E
34. E 42. E 50. C

VARIÂNCIA E DESVIO PADRÃO

51. C 57. C 63. C


52. d 58. C 64. C
53. C 59. E 65. c
54. E 60. C 66. C
55. C 61. C 67. d
56. b 62. E 68. C

TÉCNICAS DE AMOSTRAGEM

69. C 70. a 71. c

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 162 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

72. e 76. C 80. C


73. a 77. c 81. a
74. c 78. a 82. c
75. b 79. d

PROBABILIDADES

83. E 91. d 99. C


84. a 92. Conferir resolução 100. C
85. a 93. e 101. d
86. d 94. b 102. E
87. d 95. b 103. E
88. a 96. a 104. E
89. b 97. E 105. a
90. a 98. E 106. e

DISTRIBUIÇÕES DE PROBABILIDADE

107. e 115. c 123. a


108. b 116. E 124. c
109. d 117. C 125. C
110. C 118. E 126. c
111. E 119. C 127. c
112. C 120. E 128. E
113. C 121. C 129. E
114. d 122. C 130. a

INTERVALOS DE CONFIANÇA

131. e 140. E 149. C


132. a 141. e 150. E
133. a 142. a 151. C
134. E 143. C 152. c
135. E 144. C 153. e
136. E 145. C 154. E
137. d 146. C
138. e 147. C
139. C 148. E

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 163 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

TESTES DE HIPÓTESES

155. E 159. E 163. b


156. E 160. e 164. C
157. C 161. e 165. b
158. E 162. d

REGRESSÃO LINEAR

166. e 175. e 184. d


167. b 176. C 185. C
168. e 177. E 186. E
169. d 178. e 187. e
170. C 179. a 188. C
171. E 180. C 189. d
172. c 181. E 190. C
173. c 182. C 191. e
174. d 183. d

MOMENTOS DE VARIÁVEIS ALEATÓRIAS

192. E 208. E
193. C 209. b
194. E 210. d
195. b 211. E
196. d 212. a
197. c 213. d
198. d
199. b
200. C
201.
202. C
203. d
204. b
205. C
206. E
207. C

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 164 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

GABARITO COMENTADO

MEDIDAS DE POSIÇÃO

001. (FGV/RFB/2023/ANALISTA TRIBUTÁRIO) Uma pequena amostra de 11 salários (medidos


em quantidades de salários mínimos) de trabalhadores de terceiro setor mostrou os
seguintes resultados:
2,0 2,3 2,7 3,4 3,9 2,8 2,3 1,8 1,5 3,3 1,5
A diferença, em quantidade de salários mínimos, entre os valores da média e da mediana
desses dados é igual a:
a) 0,0
b) 0,1
c) 0,2
d) 0,3
e) 0,4

Vamos calcular a média.

Para calcular a mediana, vamos organizar o rol de dados.


2,0 2,3 2,7 3,4 3,9 2,8 2,3 1,8 1,5 3,3 1,5
Como a amostra tem 11 elementos, a mediana ocupará a posição:

2,0 2,3 2,7 3,4 3,9 2,8 2,3 1,8 1,5 3,3 1,5
4 6 7 10 11 8 5 3 1 9 2
Portanto, a diferença entre a média e a mediana será:

Letra c.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 165 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

002. (FGV/FUNSAÚDE-CE/2021) Em um conjunto de 12 números, a média de 4 deles é 15


e a média dos outros 8 é 18. A média dos 12 números é
a) 17
b) 16,8
c) 16,5
d) 16
e) 15,5

Para calcular a média global do conjunto de 12 números, devemos utilizar a média ponderada.

Letra a.

003. (FGV/FUNSAÚDE-CE/2021) Sabe-se que x é maior do que 11 e que a diferença entre


a média e a mediana dos cinco números 2, x, 11, 16, 5 é igual a 2. O valor de x é
a) 12
b) 16
c) 21
d) 26
e) 31

Se x > 11, então, x é o segundo maior termo dentre os cinco números. Portanto, 11 é a
mediana entre eles, já que 11 é o terceiro termo.
Desse modo, a média dos cinco números é igual a 13. Então, podemos calcular:

Letra e.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 166 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

004. (FCC/SPAG-PE/2019/ANALISTA DE PLANEJAMENTO/ADAPTADA) Durante 40 dias, foi


registrado o número de pessoas atendidas por dia em um guichê de uma repartição. A tabela
abaixo apresentou os dados observados sendo que não foram fornecidas as quantidades
de dias em que foram atendidas uma pessoa por dia e duas pessoas por dia, indicadas na
tabela por q1 = 11 e q2 = 14, respectivamente.

Tem-se que a média aritmética do número de pessoas atendidas por dia é:


a) 1,40
b) 1,50
c) 1,25
d) 1,60
e) 1,45

Devemos tomar como pesos para a média a quantidade de dias. Então, devemos multiplicar a
quantidade de dias pelo número de pessoas atendidas e somar. No denominador, colocamos
a soma dos pesos.

Letra e.

005. (UFU/MG/2019/TÉCNICO EM ESTATÍSTICA) Considere as seguintes variáveis.


I – Tamanho de um objeto (pequeno, médio ou grande)
II – Volume de água em um rio
III – Número de clientes numa fila
IV – Número da seção de votação
V – Comprimento de um inseto
VI – Classe Social
Com relação à classificação dos dados requeridos como variáveis de pesquisa, é correto
afirmar que:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 167 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

a) as variáveis I, IV e VI são qualitativas.


b) as variáveis III e V são quantitativas contínuas.
c) as variáveis II e III são quantitativas discretas.
d) a variável IV é qualitativa ordinal.

Vamos analisar as afirmações.


I – Da forma como foi descrito, o tamanho não foi medido, apenas categorizado em pequeno,
médio ou grande. Trata-se, portanto, de uma variável qualitativa. Ela também é ordinal,
porque existe uma hierarquia entre os tamanhos.
II – O volume de um rio pode ser medido, portanto, é uma variável quantitativa. É também
uma variável contínua, porque o volume pode assumir qualquer valor, inteiro ou não. É
possível que o rio tenha 14,5 m³ ou 18,33 m³.
III – O número de clientes em uma fila pode ser contado: 1, 2, 3, 4. Não é possível que exista
uma fila com 2,4 pessoas. Portanto, é uma variável quantitativa discreta.
IV – Embora o número da seção de votação seja um número, ele não representa uma medida,
apenas uma identificação. Quando dizemos que a seção é a número 235, isso não quer dizer
nada sobre a seção específica. Portanto, trata-se de uma variável qualitativa nominativa.
V – O comprimento de um inseto pode ser medido e pode assumir qualquer valor, inteiro
ou não. Portanto, é uma variável quantitativa contínua.
VI – A classe social de uma pessoa não pode ser expressa numericamente. Por exemplo, A,
B, C, D ou E. Porém, existe uma ordenação entre esses valores. Trata-se, portanto, de uma
variável quantitativa ordinal.
Com base nisso, vamos analisar as afirmações.
a) Certa. É isso mesmo.
b) Errada. O número de clientes em uma fila é uma variável discreta, e não contínua.
c) Errada. O volume de água no rio é uma variável contínua.
d) Errada. Essa é uma variável qualitativa nominativa.
Letra a.

006. (FCC/CÂMARA DE FORTALEZA/CE/2019/AGENTE ADMINISTRATIVO) Em um teatro com


200 lugares, houve quatro apresentações de uma peça. Na primeira apresentação foram
vendidos todos os ingressos; na segunda apresentação foram vendidos 88% dos ingressos;
na terceira, 56% dos ingressos e, na quarta, 44% dos ingressos. Em média, a quantidade
de ingressos vendidos por apresentação foi de
a) 72
b) 144

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 168 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

c) 56
d) 76
e) 140

A média do percentual de ingressos vendidos pode ser obtida pela definição, que é a soma
dos percentuais dividida pelo total de observações, que é igual a 4.

Agora, podemos calcular a média dos ingressos vendidos

Letra b.

007. (FGV/SEFAZ-AM/2022/AUDITOR FISCAL DE TRIBUTOS ESTADUAIS) Uma variável aleatória


X tem a seguinte função de probabilidade, sendo k uma constante:

A média de X é igual a
a) -0,4
b) -0,3
c) -0,2
d) 0,0
e) 0,5

Em uma distribuição de probabilidades, a soma das probabilidades deve ser sempre igual
a 1. Então, podemos calcular o valor de k:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 169 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O valor esperado em uma distribuição de probabilidades discreta pode ser calculado como
a soma das probabilidades multiplicadas pelos valores a elas associados. Então, podemos
escrever:

Letra d.

008. (FCC/SABESP/2018/ESTAGIÁRIO DE NÍVEL MÉDIO) Para que a média aritmética dos


números: 8, 8, 1, 10, 11, 12, 7, 2, 10, 6, x e 5 seja 7, o valor de x deverá ser:
a) 2
b) 4
c) 8
d) 5
e) 3

O produto da média aritmética pela quantidade de termos é igual à soma de todos os


elementos. Observe que são 12 elementos na amostra.

Agora, vamos calcular o valor de x dentro da soma dos termos.

Letra b.

009. (CEBRASPE/SEDUC/AL-2018/PROFESSOR DE MATEMÁTICA) Situação hipotética: A


média aritmética dos pesos dos 60 alunos de uma sala de aulas é igual a 51,8 kg. Nessa
sala, a média aritmética do peso dos meninos é de 62 kg e das meninas, 45 kg. Assertiva:
Nesse caso, essa sala de aulas tem 24 meninos e 36 meninas.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 170 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A média global dos pesos dos alunos da turma é igual à média aritmética dos pesos dos
meninos e das meninas ponderada pela quantidade de meninos e meninas na sala.
Supondo que a sala tenha realmente 24 meninos e 36 meninas como afirmado pela assertiva,
a média global seria:

Portanto, a proporção de 24 meninos e 36 meninas realmente é coerente com a média


igual a 51,8 kg.
Certo.

010. (CEBRASPE/PF/2018/PERITO CRIMINAL) Considerando que a análise de uma amostra


de minério de chumbo tenha apresentado os seguintes resultados percentuais (%): 8,10;
8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
O valor médio do teor de chumbo presente na amostra foi superior a 8%.

A média corresponde à soma de todas as observações dividida pelo número de elementos


na amostra.

Portanto, o teor médio realmente é superior a 8%.


Errado.

011. (CEBRASPE/PF/2018/PERITO CRIMINAL) Tendo em vista que, diariamente, a Polícia


Federal apreende uma quantidade X, em kg, de drogas em determinado aeroporto do
Brasil, e considerando os dados hipotéticos da tabela precedente, que apresenta os valores
observados da variável X em uma amostra aleatória de 5 dias de apreensões no citado
aeroporto, julgue o próximo item.

A moda da distribuição dos valores X registrados na amostra foi igual a 22 kg.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 171 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A moda consiste no valor que é observado com maior frequência. No caso dessa distribuição,
a moda é igual a 22, porque existem duas observações da variável com X = 22.
Certo.

012. (CEBRASPE/PF/2018/PERITO CRIMINAL) Tendo em vista que, diariamente, a Polícia


Federal apreende uma quantidade X, em kg, de drogas em determinado aeroporto do
Brasil, e considerando os dados hipotéticos da tabela precedente, que apresenta os valores
observados da variável X em uma amostra aleatória de 5 dias de apreensões no citado
aeroporto, julgue o próximo item.

A mediana das quantidades X observadas na amostra em questão foi igual a 18 kg.

A forma mais simples de calcular a mediana é organizando a amostra por ordem crescente.

A mediana corresponde ao elemento central da amostra.

Portanto, a mediana corresponde ao termo x3. E esse termo é x3 = 22.


Errado.

013. (CEBRASPE/SEFAZ-DF/2020/AUDITOR FISCAL) A partir de uma amostra aleatória simples


de tamanho n, sabe-se que a média aritmética de uma variável X foi igual a 3. Considerando
que os valores possíveis para a variável X sejam -1 e + 4, julgue o item que se segue.
A mediana amostral da variável X foi igual a 2,5.

É uma bela questão.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 172 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Note que a variável só pode assumir dois valores e que a média aritmética simples entre
eles é:

Portanto, a média aritmética deve ser uma média ponderada para que cheguem ao valor
3. Inclusive, a média é mais próxima de 4 do que de -1, portanto, precisamos de um peso
maior para o 4. Por exemplo:

Não conseguimos chegar à média desejada. Então, vamos tentar atribuir um novo peso pro 4.

Mais uma vez, não conseguimos. Mas, podemos tentar novamente:

Olha só. Notamos que somos capazes de construir uma amostra: {1, 4, 4, 4, 4}, cuja média
é igual a 3. Note que, nessa amostra, a mediana é igual a 4.
{1, 4, 4, 4, 4}
Portanto, a afirmação está incorreta.
Se você não tivesse percebido de cara a proporção correta entre os números, poderíamos
estabelecer: p1 e p2 como pesos para os números 1 e 4.

Fazendo meios pelos extremos, teríamos:

Agora, basta fazer p1 = 1 e p2 = 4. Poderíamos também fazer outras proporções que


chegaríamos ao mesmo resultado.
{-1, 4, 4, 4, 4}

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 173 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Por exemplo, p2 = 2 e p2 = 8, teríamos:


{-1, -1, 4, 4, 4, 4, 4, 4, 4, 4}
Nesse caso, a mediana é obtida pelos dois termos destacados.
{-1, -1, 4, 4, 4, 4, 4, 4, 4, 4}
Portanto, a mediana da amostra é:

Mais uma prova de que a afirmação está errada.


Errado.

014. (FCC/SABESP/2019/ESTAGIÁRIO DE ENSINO MÉDIO REGULAR) A média dos salários dos


25 trabalhadores de uma pequena empresa é de R$ 2.320,00. Um desses trabalhadores,
e apenas ele, terá um aumento de 10% em seu salário e, com isso, a média dos salários
passará a ser R$ 2.360,00. O salário desse trabalhador, sem o aumento, é
a) R$ 10.400,00
b) R$ 9.800,00
c) R$ 10.000,00
d) R$ 8.000,00
e) R$ 11.000,00

A soma inicial dos salários dos 25 trabalhadores pode ser obtido como o produto entre a
média salarial e o número de trabalhadores.

Fazendo as contas, temos:

Depois de o funcionário ter recebido aumento, a soma passou a ser superior – denotaremos
por S’ – e ela será igual à nova média multiplicada pela quantidade de trabalhadores.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 174 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Como o aumento salarial foi recebido por um único funcionário, a variação da folha de
pagamentos corresponde exatamente ao aumento por ele recebido.

Sabemos, ainda, que esse aumento corresponde a 10% do salário inicial do trabalhador.

Portanto, o seu salário inicial era de R$ 10.000 e ele recebeu um aumento de 10% (ou seja,
R$ 1.000), passando a receber R$ 11.000 de salário. Como a questão pediu o salário sem o
aumento, a resposta é R$ 10.000.
Letra c.

015. (CEBRASPE/PREFEITURA DE SÃO CRISTÓVÃO/SE/2019/PROFESSOR DE MATEMÁTICA) Há


cinco anos, João, Paulo e Miguel se associaram para montar uma lanchonete. João entrou
com R$ 80.000; Paulo, com R$ 120.000; e Miguel, com R$ 200.000. A lanchonete foi vendida,
hoje, por R$ 3.200.000 e essa quantia foi dividida entre os três de forma diretamente
proporcional aos valores que cada um investiu.
A partir dessa situação hipotética, julgue o item a seguir.
Considerando o lucro obtido com a venda, é correto inferir que, enquanto na propriedade
dos três, a lanchonete teve uma valorização média anual inferior a R$ 600.000.

Tomemos o valor inicial investido pelos quatro sócios, que corresponde à soma

A valorização pode ser obtida como a diferença entre o quanto os sócios receberam pela
venda da lanchonete e o investimento inicial.

Agora, podemos calcular a valorização média anual, que pode ser obtida como a razão entre
a valorização observada nos 5 anos e o total dos 5 anos.

Certo.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 175 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

016. (FCC/METRÔ-SP/2019/ENFERMEIRO DO TRABALHO) As massas dos objetos A, B e C


satisfazem as seguintes relações:
− as massas de A e B, somadas, excedem em 13 kg a média das massas de B e C;
− subtraindo-se de 79 kg o quádruplo da massa de C, obtém-se a soma da massa de A com
o dobro da massa de B.
Assim, a soma das massas de A, B e C, em kg, é igual a
a) 32
b) 34
c) 35
d) 31
e) 33

Vamos analisar e equacionar as informações do enunciado.


− as massas de A e B, somadas, excedem em 13 kg a média das massas de B e C;

Multiplicando por 2, temos:

− subtraindo-se de 79 kg o quádruplo da massa de C, obtém-se a soma da massa de A com


o dobro da massa de B.

Observe que podemos somar as duas equações:

Letra c.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 176 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

017. (FCC/CÂMARA LEGISLATIVA DO DISTRITO FEDERAL/2018/CONSULTOR TÉCNICO-


LEGISLATIVO/ECONOMISTA) Os números de processos autuados em duas repartições
públicas (R1 e R2) independentes, durante 40 dias, estão representados na tabela abaixo,
sendo m e n inteiros positivos.

Calculando a soma da média aritmética (número de processos por dia) com a moda e com
a mediana de cada repartição, verifica-se que a soma obtida na repartição R2 supera a
soma obtida na repartição R1 em:
a) 2,05
b) 0,55
c) 1,05
d) 1,30
e) 1,55

Devemos impor que a soma do número de elementos é igual ao total de elementos, que é
40 em ambos os dias. Para o dia R1, temos:

Para o dia R2, temos:

Podemos subtrair as duas equações.

Agora, vamos calcular o valor de n.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 177 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Com base nisso, vamos montar os diagramas das repartições 1 e 2.


Número de Processos Quantidade de Dias (R1) Quantidade de Dias (R2)
0 0 2
1 10 8
2 15 10
3 10 16
4 5 4
Vamos calcular as médias.

Para calcular as medianas, devemos identificar as classes medianas. Considerando que a


amostra tem 40 elementos, concluímos que a mediana será o elemento dado pela posição:

Então, vamos obter as classes em que se localizam os elementos x20 e x21.


Número de Quantidade de Quantidade de
Acumuladas Acumuladas
Processos Dias (R1) Dias (R2)
0 0 0 2 x1 a x2
1 10 x1 a x10 8 x3 a x10
2 15 x11 a x25 10 x11 a x20
3 10 16 x21 a x36
4 5 4

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 178 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Dessa forma, as medianas das duas distribuições são:

Agora, vamos ao cálculo da moda, que deve ser feito buscando a classe que tem a maior
quantidade de dias registrados.
Número de Processos Quantidade de Dias (R1) Quantidade de Dias (R2)
0 0 2
1 10 8
2 15 10
3 10 16
4 5 4
Dessa forma, temos as modas:

Assim, a soma das médias, moda e mediana referentes a cada distribuição são:

Portanto, a diferença pedida é:

Letra e.

018. (FCC/PREFEITURA DE MANAUS/AM/2019/AUDITOR FISCAL DE TRIBUTOS MUNICIPAIS)


Conforme um levantamento realizado em um órgão público e analisando a distribuição dos
salários, em R$ 1.000,00, de todos os seus funcionários, obteve-se a tabela de frequências
absolutas abaixo, com k sendo um número inteiro positivo.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 179 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Considere que a média aritmética (Me) foi calculada considerando que todos os valores
incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo,
que a mediana (Md) foi calculada pelo método da interpolação linear e que a moda (Mo)
foi obtida pela relação de Pearson, ou seja, Mo = 3 Md - 2 Me. O valor encontrado para Mo,
em R$ 1.000,00, foi igual a:
a) 1,76 k
b) 1,70 k
c) 1,64 k
d) 1,60 k
e) 1,82 k

Primeiramente, vamos calcular o valor de k. Sabemos que o número total de funcionários


é 40k. Portanto, podemos escrever:

Com base nisso, podemos completar a tabela, na qual incluiremos também o ponto médio
de cada classe.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 180 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Número de Funcionários Salários (s) Ponto Médio


10 2<s<4 3
20 4<s<6 5
50 6<s<8 7
80 8 < s < 10 9
40 10 < s < 12 11
Seguindo as orientações do enunciado, podemos utilizar o ponto médio.

Para calcular a mediana, primeiramente, notemos que o total de funcionários na empresa


é igual a 200. Portanto, a mediana equivale ao x100. Agora, vamos organizar a amostra por
ordem crescente.
Número de Funcionários Salários (s) Posição
10 2<s<4 x1 a x10
20 4<s<6 x11 a x30
50 6<s<8 x31 a x80
80 8 < s < 10 x81 a x160
40 10 < s < 12 x161 a x2.000
Agora, basta construir o esquema de interpolar linear. Associamos o final da classe anterior
ao elemento máximo da classe.

Pela interpolação linear, temos:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 181 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Aplicando a expressão da moda de Pearson fornecida no enunciado, temos:

Nas alternativas, os valores aparecem multiplicados por k. Portanto, é interessante dividirmos


a moda por k.

Letra e.

019. (FCC/SEFAZ-BA/2019/AUDITOR FISCAL/ADMINISTRAÇÃO TRIBUTÁRIA/PROVA II/QUESTÃO


DESAFIO) Considere a distribuição dos salários, em R$ 1.000,00, dos funcionários lotados
em uma repartição pública, representada abaixo pela tabela de frequências relativas
acumuladas, sendo k a frequência relativa acumulada do 4º intervalo de classe.

Sabe-se que a média aritmética (Me) foi calculada considerando que todos os valores
incluídos num certo intervalo de classe são coincidentes com o ponto médio desse intervalo,
que a mediana (Md) foi calculada pelo método da interpolação linear e que a moda (Mo)

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 182 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

foi obtida pela relação de Pearson, ou seja, Mo = 3Md - 2Me. Dado que Me = R$ 7.200,00,
então Mo é igual a
a) R$ 7.350,00
b) R$ 8.500,00
c) R$ 7.700,00
d) R$ 8.100,00
e) R$ 7.400,00

Essa é uma questão bastante trabalhosa e cheia de etapas. Vamos fazê-las uma a uma.
Primeiramente, precisamos calcular o valor de k, mas observemos que a tabela foi dada
em forma de distribuição acumulada, ou seja, foi dada a soma de todas as frequências
relativas de cada classe.
Classes de Frequência Relativa Frequência
Ponto Médio
Salários Acumulada Relativa
1a3 2 5% 5%
3a5 4 15% 10%
5a7 6 40% 25%
7a9 8 K x
9 a 11 10 100 60% - x
A média foi fornecida no enunciado: Me = R$ 7.200,00. Porém, como os dados foram fornecidos
em múltiplos de R$ 1.000, na verdade, o valor calculado para a média foi igual a 7,2.

Com isso, chegamos à seguinte distribuição de frequências para as classes de salários:


Classes de Salários Frequência Acumulada
1a3 0% a 5%
3a5 5% a 15%
5a7 15% a 40%
7a9 40% a 80%
9 a 11 80% a 100%

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 183 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A classe mediana de salários é a que está destacada na tabela. A mediana será obtida pelo
método da Interpolação Linear.

O primeiro pedaço do segmento é proporcional ao segmento inteiro.

Por fim, a moda é obtida pela Relação de Pearson. Note que o enunciado foi muito gentil
em nos fornecer a expressão dessa relação. Não espere que seja sempre assim.

Letra d.

020. (CESPE/TJ-PA/2020/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Uma amostra aleatória dos


registros de furto no município de Abaetetuba, no ano de 2017, apresenta os valores 245,
247, 238, 282 e 261. Uma estimativa não tendenciosa e eficiente para a média de furtos
ocorridos em Abaetetuba no ano de 2017, considerando os dados apresentados na amostra, é
a) 238,0
b) 254,6
c) 260,0
d) 282,7
e) 308,5

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 184 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A média pode ser calculada pela soma de todos os valores dividida pelo número de elementos
presentes na amostra.

Letra b.

021. (FCC/PREFEITURA DE TERESINA/PI) Uma carteira aplica 25% na ação A, 40% na ação
B e o restante na ação C. Os retornos das ações A, B e C são, respectivamente, 10%, 12%
e 20%. O retorno médio da carteira será
a) 14,5%
b) 14,8%
c) 14,6%
d) 14,0%
e) 14,3%

Devemos calcular os retornos pela média aritmética, em que a composição das carteiras
são os pesos.
Devemos notar que o teor da ação C na carteira pode ser obtido, impondo que a soma de
todas as participações das ações é igual a 100%.

Agora, vamos calcular a média usando os teores de cada ação na carteira como pesos.

Letra e.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 185 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

022. (FCC/SPAG-PE/2019/ANALISTA DE PLANEJAMENTO/ADAPTADA) Durante 40 dias, foi


registrado o número de pessoas atendidas por dia em um guichê de uma repartição. A tabela
abaixo apresentou os dados observados sendo que não foram fornecidas as quantidades
de dias em que foram atendidas uma pessoa por dia e duas pessoas por dia, indicadas na
tabela por q1 = 11 e q2 = 14, respectivamente.

Tem-se que a média aritmética do número de pessoas atendidas por dia é:


a) 1,40
b) 1,50
c) 1,25
d) 1,60
e) 1,45

Devemos tomar como pesos para a média a quantidade de dias. Então, devemos multiplicar a
quantidade de dias pelo número de pessoas atendidas e somar. No denominador, colocamos
a soma dos pesos.

Letra e.

023. (ESAF/ANAC/2016/ANALISTA ADMINISTRATIVO) Os valores a seguir representam a


quantidade de aviões que decolaram por hora durante as 10 primeiras horas de certo dia.
33 34 27 30 28 26 34 23 14 31
Logo, levando em consideração somente essas 10 horas, pode-se afirmar corretamente que:
a) o número médio de aviões que decolaram por hora é igual a 27.
b) o número mediano de aviões que decolaram por hora é igual a 29.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 186 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

c) em 50% das horas o número de aviões que decolaram por hora ficou abaixo da média.
d) o número mediano de aviões que decolaram por hora é igual a 27.
e) em 30% das horas o número de aviões que decolaram por hora foi superior a 30.

Primeiramente, calcularemos o número médio de aviões que decolaram por hora.

Portanto, em 5 horas, o número de aviões ficou acima da média e, em 4 horas, ficou abaixo
da média. Logo, o item c está errado.
Por outro lado, a mediana pode ser calculada colocando a sequência em ordem crescente.
14 23 26 27 28 30 31 33 34 34
Tomemos os dois termos centrais e sua média:

Por fim, apenas para descartar a letra e), temos que, em 4 horas (40%), o número de aviões
que decolaram foi superior a 30.
Letra b.

024. (FCC/SEFAZ-SC/2018/AUDITOR FISCAL DA RECEITA ESTADUAL/AUDITORIA E FISCALIZAÇÃO


(PROVA 1)) A tabela a seguir apresenta a distribuição de frequências dos salários, em número
de salários mínimos (SM), dos funcionários de um órgão público:

Sabe-se que: b - a = 5%,


x é a média salarial, obtida por meio dessa tabela, calculada como se todos os valores
de cada faixa salarial coincidissem com o ponto médio da referida faixa, md é a mediana
salarial, calculada por meio dessa tabela pelo método da interpolação linear.
Nessas condições, x + md, em anos, é igual a:
a) 9,85
b) 11,35
c) 11,05

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 187 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

d) 10,95
e) 11,65

Sabemos que b - a = 5%, dessa forma, temos que:

Para calcular o valor de a, vamos utilizar o fato de que a soma das porcentagens é igual a
100%.

De posse do valor de a, podemos montar a tabela de distribuição de porcentagem de cada


uma das faixas salariais.
Faixa Salarial (SM) Porcentagem Porcentagem Acumulada
2a4 20% 0% a 20%
4a6 40% 20% a 60%
6a8 25% 60% a 85%
8 a 12 15% 85% a 100%
Para calcular a mediana, primeiramente, devemos identificar a classe mediana, que está
em destaque, pois é a classe em que a porcentagem acumulada atinge 50%.
Podemos calcular a mediana por interpolação linear exatamente no momento em que a
porcentagem acumulada atinge 50%.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 188 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Já a média pode ser calculada pela técnica do ponto médio.


Faixa Salarial (SM) Ponto Médio Porcentagem
2a4 3 20%
4a6 5 40%
6a8 7 25%
8 a 12 10 15%
Usando o ponto médio, temos:

Portanto, a soma pedida no enunciado da média com a mediana é:

Letra b.

025. (FCC/ALESE/2018/ANALISTA LEGISLATIVO/ECONOMIA/ADAPTADA) Em um grupo de


pessoas encontramos as seguintes idades:
20, 30, 50, 39, 20, 25, 41, 47, 36, 45, 41, 52, 18, 41
A moda é:
a) 42
b) 45
c) 41
d) 20
e) 39

Notemos que o número 20 se repete duas vezes.


20, 30, 50, 39, 20, 25, 41, 47, 36, 45, 41, 52, 18, 41.
Por sua vez, o número 41 se repete três vezes.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 189 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

20, 30, 50, 39, 20, 25, 41, 47, 36, 45, 41, 52, 18, 41.
Nenhum outro número se repete três vezes ou mais. Portanto, a moda é realmente o
número 41.
Letra c.

026. (FCC/BACEN/2006) O valor da moda, obtida com a utilização da Fórmula de Czuber, é


igual a (desprezar os centavos na resposta):

a) R$ 3.201,00
b) R$ 3.307,00
c) R$ 3.404,00
d) R$ 3.483,00
e) R$ 3.571,00

Devemos lembrar que a Moda de Czuber é dada pelas variações de frequência. No numerador,
devemos colocar a variação de frequência em relação à frequência anterior.

Primeiramente, devemos identificar a classe modal, que é aquela, cuja frequência absoluta
é a maior. Identificaremos também as frequências absolutas das classes anterior e posterior
e o limite inferior da classe modal.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 190 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Agora, vamos utilizar a Fórmula de Czuber:

O termo h é a amplitude da classe modal que é igual à diferença entre R$ 4.000 e R$ 3.000,
ou seja, h = R$ 1.000.

Letra e.

APRESENTAÇÃO DAS VARIÁVEIS

027. (VUNESP/UNICAMP/2022/ENGENHEIRO CIVIL/Q2491143) Em uma pesquisa realizada,


450 pessoas responderam “sim” à pergunta feita, 320 responderam “não”, e 40 pessoas
não responderam à pergunta. Na construção de um gráfico de setor (também conhecido
como gráfico de pizza) para representar os dados obtidos nessa pergunta, o setor circular
correspondente às respostas “sim” deverá ter ângulo medindo
a) 170º
b) 180º
c) 190º
d) 200º
e) 210º

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 191 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Veja que 320 pessoas responderam “não”, 40 pessoas não responderam. Então, o número
de total de pessoas que responderam à pesquisa foi:

O total de pessoas que responderam à pesquisa corresponde ao ângulo total de 360º


Por outro lado, o ângulo que deve ser ocupada pelo “Sim” é proporcional. Montemos a
proporcionalidade.

Letra d.

028. (IFTO/2023) Dados os valores de uma população: x1 = 4; x2 = 6; x3 = 8 e x4 = 10. A amplitude


total dessa população será:
a) 3
b) 8
c) 4
d) 2
e) 6

A amplitude corresponde à diferença entre o valor máximo e o mínimo entre os observados


na amostra.

Letra e.

029. (CESPE/FUB/2022/ESTATÍSTICO) A tabela de frequência a seguir mostra dados coletados


em uma pesquisa para se verificar o número de disciplinas que os estudantes de determinada
universidade estão cursando por semestre.

Considerando essas informações, julgue o item seguinte.


O gráfico do tipo pizza é o mais apropriado para representar os dados apresentados na
tabela, visto que a variável analisada é qualitativa ordinal.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 192 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O número de disciplinas é uma variável quantitativa discreta, tendo em vista que ela é
medida como um valor numérico.
As variáveis qualitativas ordinais não são expressas por números.
Errado.

030. (CESPE/AL-CE/2011/ANALISTA LEGISLATIVO) Um levantamento foi realizado para se


avaliar, por município, a quantidade X de obras que estão sob suspeita de irregularidade.
Com base em uma amostra de municípios, foi obtida a distribuição de frequências mostrada
na tabela acima. Com base nessas informações, julgue o item.

O diagrama de setores (ou pizza) é um gráfico apropriado para se representar a distribuição


de probabilidade da variável X.

O gráfico de pizza é mais adequado para representar a frequência relativa, e não para a
frequência absoluta. Deve ser sempre utilizado para representar proporções.
Como foram fornecidos dados sobre a frequência absoluta, o diagrama de setores não é
adequado.
Errado.

031. (FGV/TJDFT/2022/ANALISTA JUDICIÁRIO/ESTATÍSTICA) O resultado de uma pesquisa


sobre a produtividade dos magistrados em uma determinada região foi publicado em uma
revista científica e está sintetizado na tabela a seguir.

Não existem observações coincidentes com os extremos das classes.


É sabido que, quanto maior a classe de produtividade, maior é a produtividade do magistrado.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 193 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Um estatístico precisa estimar a produtividade a partir da qual se encontram os 10% mais


eficientes, isto é, o 9º decil dessa distribuição.
A melhor estimativa é, aproximadamente:
a) 6,5
b) 7
c) 7,5
d) 8
e) 8,5

Para calcular o nono decil, devemos recorrer à técnica da interpolação linear.

Vamos usar a proporcionalidade entre a parte e o todo.

Vamos fazer o meio pelos extremos.

Então, podemos passar para o 6 outro lado.

Letra b.

032. (FGV/TJ-SE/2023/ANALISTA JUDICIÁRIO/ESTATÍSTICA) A análise dos dados multivariados,


como a correlação linear entre dois atributos do conjunto de dados X, pode ser facilitada
pelo uso do gráfico de:
a) pizza
b) boxplot

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 194 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

c) densidade
d) histograma
e) scatter plot

O diagrama de dispersão (ou o “scatter plot”) serve permite visualizar todas as observações
de duas variáveis aleatórias ao mesmo tempo. Esse diagrama é muito utilizado para verificar
relações de causa e efeito. Como exemplo, veja a dispersão dos salários pela idade.

Nesse exemplo, é possível construir uma linha de tendência que facilita visualizar a existência
de correlação positiva ou negativa entre as variáveis.

Letra e.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 195 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

033. (CEBRASPE/CGDF/2023/AUDITOR DE CONTROLE INTERNO) Considerando que a tabela


precedente represente a distribuição de frequências absolutas de uma variável quantitativa
x, é correto afirmar que, em relação a x, a média será

a) igual à mediana e igual à moda.


b) igual à mediana, que é menor que a moda.
c) menor que a mediana, que é menor que a moda.
d) maior que a mediana, que é maior que a moda.

A média pode ser calculada usando as frequências absolutas como pesos:

Por outro lado, mediana pode ser obtida pelo termo: ⋅⋅

Para obter o quinto termo, precisamos observar as frequências acumuladas em cada classe.

x Frequência Absoluta Frequência Acumulada

0 1 x1
1 2 x2 a x3
2 4 x4 a x7
3 0
4 2 x8 a x9
Portanto, a mediana é Md = x5 = 2.
A moda, por sua vez, corresponde ao valor de “x” observado com mais frequência, que, no
caso, é x = 2, cuja frequência absoluta é igual a 4.
Letra a.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 196 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A respeito do conjunto de dados {11, 6, 28, 51, 49, 32, 33}, julgue os itens a seguir.

034. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I) O primeiro quartil do conjunto de


dados em tela é igual ou superior a 33.

Para o primeiro quartil, devemos utilizar a posição:

Assim, vamos procurar o elemento x2 dessa sequência por ordem crescente.


11 6 28 51 49 32 33
x2 x1 x3 x7 x6 x4 x5
Portanto, o primeiro quartil é:

Errado.

Com relação aos dados que resultaram no diagrama mostrado na figura precedente, julgue
os itens a seguir.

035. (CEBRASPE/PETROBRÁS/2021) A amplitude total dos dados em tela é inferior a 6.

Observe que existe pelo menos uma observação maior que 13 e uma observação menor que
7. Então, a amplitude, que corresponde à diferença entre a maior e a menor observação
da amostra, é

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 197 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Portanto, a amplitude é maior que 6.


Errado.

036. (CEBRASPE/PETROBRÁS/2021) Nesse diagrama, a porção da distribuição dos dados


representada pela parte inferior do diagrama mostrada a seguir representa exatamente
25% dos dados em questão.

Abaixo da caixa do boxplot, encontram-se 25% dos dados. Portanto, na região citada,
encontram-se 25% dos dados menos os 4 outliers.
Errado.

037. (CEBRASPE/PETROBRÁS/2021) O terceiro quartil é inferior a 11 e superior a 10.

O terceiro quartil é o limite superior da caixa, que realmente se encontra entre 10 e 11.
Certo.

038. (AOCP/ADAF/2018/Q1750497) Na análise exploratória de um conjunto de dados,


sugere-se a construção de gráficos e diagramas. Dado o seguinte histograma, calcule a
média da variável em estudo.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 198 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

a) x = 49,08
b) x = 51,08
c) x = 50,08
d) x = 50
e) x = 16,67

A média deve ser calculada pelo ponto médio. Para isso, vamos converter os dados para
uma tabela.
Classe Ponto Médio Frequência
44 a 46 45 10%
46 a 48 47 14%
48 a 50 49 22%
50 a 52 51 33%
52 a 54 53 8%
54 a 56 55 13%
A média pode, então, ser calculada pela média aritmética ponderada pela frequência das
classes.

Letra c.

039. (CESPE/FUNPRESP/EXE/2016/ANALISTA/ÁREA DE INVESTIMENTOS) O gráfico ilustra cinco


possibilidades de fundos de investimento com suas respectivas rentabilidades. Considerando
que as probabilidades de investimento para os fundos A, B, C e D sejam, respectivamente,
P(A) = 0,182; P(B) = 0,454; P(C) = 0,091; e P(D) = 0,182, julgue o item subsequente.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 199 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O gráfico apresentado é um histograma.

O histograma se refere a uma distribuição de frequências de uma variável quantitativa


contínua. Esse gráfico não mostra uma distribuição de frequências, mas sim a rentabilidade
dos fundos.
Portanto, esse não pode ser um histograma, mas sim um gráfico de barras genérico.
Errado.

040. (VUNESP/PREFEITURA DE ILHABELA-SP/2020/ANALISTA DE GESTÃO PÚBLICA/DESAFIO)


Um histograma foi elaborado com o objetivo de se analisar a distribuição de todos os
salários dos funcionários em uma empresa. Sabe-se que 108 funcionários dessa empresa
ganham salários com valores pertencentes ao segundo intervalo do histograma [4, 7), em
salários-mínimos (SM), que apresenta uma densidade de frequência igual a 0,15 (SM)–1.
Densidade de frequência de um intervalo é o resultado da divisão da respectiva frequência
relativa pela amplitude deste intervalo. Se o primeiro intervalo do histograma [2, 4), em SM,
apresenta uma densidade de frequência igual a 0,125 (SM)-1, então o número de empregados
do segundo intervalo supera o número de empregados do primeiro intervalo em
a) 48
b) 60
c) 72
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 200 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

d) 78
e) 84

A frequência de uma categoria pode ser obtida como o produto da amplitude pela densidade
de frequência. Então, a frequência da classe [4, 7) é:

Como a frequência absoluta da classe é igual a 108 e sabemos que ela corresponde a 45% do
total da população, podemos usar essas informações para calcular o número de elementos
totais da população.

Portanto, temos uma população de 240 elementos.


A frequência relativa da classe [2, 4) é, por sua vez, a amplitude da classe multiplicada pela
sua densidade de frequência:

Então, essa classe corresponde a uma frequência relativa de 25%; a frequência absoluta
da classe pode ser obtida como o produto do número de elementos da população pela sua
frequência relativa. Vejamos:

Portanto, o primeiro intervalo tem 108 funcionários e o segundo intervalo tem 60 funcionários.
Então, o primeiro intervalo supera o segundo em:

Letra a.

041. (CEBRASPE/2012/POLÍCIA FEDERAL/PAPILOSCOPISTA) Ao contrário da mediana amostral,


a média aritmética é menos sensível à presença de valores extremos (ou valores atípicos
ou outliers).

Como estudamos, a mediana é uma estimativa robusta, enquanto a média aritmética é


sensível à presença de valores extremos.
Errado.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 201 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

042. (CESPE/IPHAN/2018/ANALISTA I/ÁREA 2) A tabela seguinte mostra as quantidades de


patrimônios históricos cadastrados nos estados A e B.

A partir dessa tabela, julgue o seguinte item.


As estátuas cadastradas nos estados A e B correspondem a mais de 20% dos patrimônios
históricos cadastrados nesses estados.

Vamos calcular as frequências relativas referentes às estátuas nos estados A e B.

Portanto, a frequência relativa das estátuas no estado B não é maior que 20%. É apenas
igual.
Errado.

043. (CESPE/IPHAN/2018/ANALISTA I/ÁREA 2) O gráfico de barras é adequado para a análise


de variáveis qualitativas ordinais ou quantitativas discretas, pois permite investigar a
presença de tendência nos dados.

É isso mesmo. O gráfico de barras é muito útil para investigar tendências de dados. Vejamos
um exemplo com uma variável qualitativa ordinal, como o grau de instrução dos trabalhadores
de uma empresa.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 202 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Nesse gráfico, notamos claramente que a empresa tende a contratar mais trabalhadores
com ensino superior.
Vejamos também um exemplo com uma variável discreta, como o número de filhos dos
trabalhadores de uma empresa, em que podemos notar que a maioria dos funcionários
tende a ter até dois filhos.

Certo.

044. (VUNESP/UNICAMP/2022/ENGENHEIRO CIVIL/Q2491143) Em uma pesquisa realizada,


450 pessoas responderam “sim” à pergunta feita, 320 responderam “não”, e 40 pessoas
não responderam à pergunta. Na construção de um gráfico de setor (também conhecido

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 203 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

como gráfico de pizza) para representar os dados obtidos nessa pergunta, o setor circular
correspondente às respostas “sim” deverá ter ângulo medindo
a) 170º
b) 180º
c) 190º
d) 200º
e) 210º

Veja que 320 pessoas responderam “não”, 40 pessoas não responderam. Então, o número
de total de pessoas que responderam à pesquisa foi:

O total de pessoas que responderam à pesquisa corresponde ao ângulo total de 360º


Por outro lado, o ângulo que deve ser ocupada pelo “Sim” é proporcional. Montemos a
proporcionalidade.

Letra d.

045. (CESPE/DEPEN/2015/AGENTE PENITENCIÁRIO FEDERAL/ÁREA 4) A tabela mostrada


apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em 2013.
Nesse ano, o déficit relativo de vagas – que se define pela razão entre o déficit de vagas no
sistema penitenciário e a quantidade de detentos no sistema penitenciário – registrado
em todo o Brasil foi superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100
mil habitantes.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 204 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

(Ministério da Justiça – Departamento Penitenciário Nacional – Sistema Integrado de


Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do Sistema Prisional
Brasileiro, dez. 2013. Internet: www.justica.gov.br. Com adaptações)
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
Na análise exploratória, o histograma é um gráfico adequado para descrever a distribuição
da quantidade de detentos por região em 2013.

Observe que a variável aleatória é descrita em função da região. Portanto, não se trata de
uma variável categorizada, mas sim uma variável nominativa.
Dessa forma, o gráfico mais adequado é o diagrama de barras.

Errado.

046. (INSTITUTO CONSULPLAN/MPE/BA/2023/ANALISTA DE SISTEMAS/Q2852433) A tabela


representa a distribuição das notas de desempenho dos candidatos em um processo de
seleção para uma vaga de emprego. A última fase do processo de seleção consiste em uma
entrevista, que será realizada apenas com os candidatos que obtiveram desempenho acima
da nota de corte, calculada com base no valor do sexto decil, cujo valor é 51,8:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 205 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

“De acordo com os dados apresentados, é correto afirmar que 60% dos candidatados
obtiveram notas ____________ de 51,8; portanto, a empresa realizará ____________ 40
entrevistas.”
Assinale a alternativa que completa correta e sequencialmente a afirmativa anterior.
a) acima / mais
b) abaixo / mais
c) acima / menos
d) abaixo / menos
e) acima / exatamente

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 206 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Por definição, o sexto decil (60%) é o limiar em que 60% dos candidatos se situam abaixo
dessa nota. Desse modo, podemos concluir que 60% dos candidatos obtiveram notas
abaixo de 51,8.
Os demais, portanto, menos de 40, serão chamados para a entrevista.
Letra d.

047. (CESGRANRIO/TRANSPETRO/2012/ADMINISTRADOR JÚNIOR) A tabela apresenta uma


distribuição hipotética. Não há observações coincidentes com os limites das classes. A
melhor estimativa para o terceiro quartil da distribuição é, aproximadamente, de:

a) 34,75
b) 34,9
c) 35
d) 35,75
e) 35,9

Uma questão bastante ilustrativa sobre quartis em dados categorizados. Como a amostra
é formada por 164 elementos, temos que o terceiro quartil será associado à posição:

O primeiro passo para calcular esse quartil é identificar em que categoria ele se localiza.
Classes Frequência Absoluta Elementos
0 a 10 4 1a4
10 a 20 10 5 a 14

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 207 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Classes Frequência Absoluta Elementos


20 a 30 50 15 a 64
30 a 40 100 65 a 164
O terceiro quartil está localizado na última categoria entre os dois elementos destacados
em negrito. Sendo assim, devemos proceder à interpolação linear.

Usando a proporção entre a menor parte e todo, pode-se escrever:

Letra e.

048. (CEBRASPE/PETROBRÁS/2021) A amplitude total dos dados em tela é inferior a 6.

Observe que existe pelo menos uma observação maior que 13 e uma observação menor que
7. Então, a amplitude, que corresponde à diferença entre a maior e a menor observação
da amostra, é

Portanto, a amplitude é maior que 6.


Errado.

049. (CEBRASPE/PETROBRÁS/2021) Nesse diagrama, a porção da distribuição dos dados


representada pela parte inferior do diagrama mostrada a seguir representa exatamente
25% dos dados em questão.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 208 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Abaixo da caixa do boxplot, encontram-se 25% dos dados. Portanto, na região citada,
encontram-se 25% dos dados menos os 4 outliers.
Errado.

050. (CEBRASPE/PETROBRÁS/2021) O terceiro quartil é inferior a 11 e superior a 10.

O terceiro quartil é o limite superior da caixa, que realmente se encontra entre 10 e 11.
Certo.

VARIÂNCIA E DESVIO PADRÃO

051. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I)

Com base nas informações apresentadas na tabela precedente e considerando que a


covariância entre as variáveis X e Y seja igual a 3, julgue os itens que se seguem.
A variância de X é igual a 4.

A variância de X é igual ao quadrado do seu desvio padrão.

Certo.

052. (AOCP/IBGE/2019/ANALISTA CENSITÁRIO/Q14285555) Em uma escola que atende


alunos de primeira a quinta série, existem duas turmas de cada série. A diretora dessa escola
pretende fazer um estudo quanto à aprendizagem comparando as turmas dentro de cada
série. Quais medidas estatísticas descritivas ela pode utilizar para avaliar a homogeneidade
das turmas e a diferença de aprendizagem entre as turmas?
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 209 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

a) Mediana e moda.
b) Média e variância.
c) Variância e desvio-padrão.
d) Variância e coeficiente de variação.
e) Média e coeficiente de variação.

A homogeneidade dos dados da amostra pode ser determinada pelas medidas de variação,
que seriam o caso da variância e do desvio-padrão.
A média e a mediana são medidas de posição e normalmente escondem a heterogeneidade
da amostra.
Por outro lado, para comparar a diferença de aprendizagem entre as duas turmas, é muito
útil usar o coeficiente de variação. A turma que tiver o maior coeficiente de variação é a
mais heterogênea em termos de aprendizagem.
Letra d.

053. (CEBRASPE/PF/2018/PERITO CRIMINAL) Tendo em vista que, diariamente, a Polícia


Federal apreende uma quantidade X, em kg, de drogas em determinado aeroporto do
Brasil, e considerando os dados hipotéticos da tabela precedente, que apresenta os valores
observados da variável X em uma amostra aleatória de 5 dias de apreensões no citado
aeroporto, julgue o próximo item.

O desvio padrão amostral da variável X foi inferior a 7 kg.

Para calcular o desvio-padrão, podemos primeiramente calcular a média amostral.

Em seguida, podemos calcular os desvios em relação à média.


Dia Desvio |x - µ|²
1 10/20 = -10 (-10)² = 100
2 22/20 = 2 2² = 4

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 210 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Dia Desvio |x - µ|²


3 18/20 = -2 (-2)² = 4
4 22/20 = 2 2² = 4
5 28/20 = 8 8² = 64
Então usando a expressão do desvio-padrão amostral, temos:

Veja que 7² = 49, portanto:

Certo.

054. (CEBRASPE/TC-DF/2023/AUDITOR-FISCAL DE CONTROLE EXTERNO) Considerando que


X e Y sigam distribuições normais padrão e que a correlação linear entre ambas seja igual
a -1, julgue os seguintes itens.
A soma X + Y segue distribuição normal com média zero e variância 2.

A variância da soma de duas variáveis pode ser calculada como:

A covariância pode ser calculada a partir da correlação:

Portanto, a variância da soma é:

Errado.

055. (CEBRASPE/TC-DF/2023/AUDITOR-FISCAL DE CONTROLE EXTERNO) Considerando que


X e Y sigam distribuições normais padrão e que a correlação linear entre ambas seja igual
a -1, julgue os seguintes itens.
Se W = 5X + 2, então W segue distribuição normal com média igual a 2 e variância igual a 25.

A média é um operador linear. Então, teremos:


O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 211 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Já a variância depende do termo que multiplica X ao quadrado.

Certo.

056. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) Em uma empresa


com 250 empregados, verifica-se que 60% são homens e 40% são mulheres. A média dos
salários dos homens, em salários mínimos (SM), é igual à média dos salários das mulheres.
O coeficiente de variação dos salários dos homens é igual a 4% e as somas dos quadrados
dos salários, em (SM)², dos homens e das mulheres são iguais a 3.756,00 e 2.502,25,
respectivamente. O desvio padrão dos salários das mulheres, em SM, é igual a:
a) 0,40
b) 0,15
c) 0,25
d) 0,20
e) 0,16

São 250 pessoas ao total. Delas, 150 são homens e 100 são mulheres.
Como o coeficiente de variação do salário dos homens é 4%, podemos concluir que:

Vamos calcular a média dos quadrados dos salários dos homens como a razão entre a soma
dos quadrados e o número de homens.

Então, podemos usar a relação entre variância, média dos quadrados e quadrado da média.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 212 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Em seguida, vamos calcular a média dos quadrados dos salários das mulheres.

Então, a variância será igual à média dos quadrados menos o quadrado da média.

Por fim, o desvio-padrão é a raiz quadrada da variância:

Letra b.

057. (CEBRASPE/PF/2018/PERITO CRIMINAL) Considerando que a análise de uma amostra


de minério de chumbo tenha apresentado os seguintes resultados percentuais (%): 8,10;
8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
O coeficiente de variação da análise é dado pela razão entre o desvio padrão e a média,
multiplicada por 100%

Essa questão cobrou a definição de coeficiente de variação. E a definição é exatamente essa.

Então, a afirmação está correta. Precisamos dividir o desvio padrão pela média e multiplicar
por 100% para transformar em número percentual.
Certo.

058. (CEBRASPE/PF/2018/PERITO CRIMINAL) Considerando que a análise de uma amostra


de minério de chumbo tenha apresentado os seguintes resultados percentuais (%): 8,10;
8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
A variância dos dados em apreço é dada pelo valor do desvio padrão ao quadrado.

A definição de variância é exatamente essa.

Portanto, a variância é igual ao quadrado do desvio padrão, como sugerido pelo enunciado.
Certo.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 213 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

059. (CEBRASPE/PF/2018/PERITO CRIMINAL) Considerando que a análise de uma amostra


de minério de chumbo tenha apresentado os seguintes resultados percentuais (%): 8,10;
8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
O desvio padrão da análise em apreço é dado pela raiz quadrada do valor médio dividido
pelo número de amostras, no caso, 6.

A definição de desvio-padrão é a seguinte.

Então, na realidade, o desvio padrão corresponde à raiz quadrada da soma dos quadrados
dos desvios dividido pelo número de elementos na amostra subtraída de 1.
Errado.

060. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I) A respeito do conjunto de dados {11,


6, 28, 51, 49, 32, 33}, julgue os itens a seguir.
Esse conjunto de dados possui variância amostral inferior a 300.

Vamos seguir o passo a passo para o cálculo da variância. Para isso, vamos calcular a média
dos dados:

Vamos, então, montar a tabela para facilitar a conta dos desvios de cada observação em
relação à média.
X (x - μ) (x - μ)²
11 11 - 30 = -19 (-19)² = 361
6 6 - 30 = -24 (-24)² = 576
28 28 - 30 = -2 (-2)² = 4
51 51 - 30 = 21 (21)² = 441
49 49 - 30 = 19 (19)² = 361
32 32 - 30 = 2 (2)² = 4
33 33 - 30 = 3 (3)² = 9
Para calcular a variância amostral, devemos somar os quadrados dos desvios e dividir pelo
número de observações menos 1, como fator de ajuste.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 214 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Portanto, é inferior a 300.


Certo.

061. (CEBRASPE/PF/2012) Se a amplitude observada em um conjunto de dados formado por


10 elementos for igual a 12, então a variância desse conjunto de dados será inferior a 120.

Questão interessante, pois nos obriga a pensar no caso em que existe maior variância.
A variância será máxima quando os termos estiverem o mais distante possível da média.
Nesse caso, teríamos 5 à esquerda e 5 à direita.

Nesse caso, todos os elementos distam 6 da média. Portanto, temos que a variância máxima
será igual a:

Certo.

062. (CEBRASPE/PC-SE/2021) Considere duas variáveis aleatórias contínuas, x e y, tais que


P(x > 0) = 1, P(x ≤ 1) = 1/10, P(x ≤ 1 | y > 1) = 3/10, Var (x) = Var (y) = 1, e Cov (x, y) = 0.
Com base nessas informações, julgue os itens a seguir.
x e y são independentes.

Para que duas variáveis sejam independentes, a probabilidade condicional tem que ser igual
à probabilidade incondicional. Como o fato de saber que y > 1 altera a probabilidade de que
P(x ≤ 1), podemos concluir que y interfere na variável x. Logo, elas não são independentes.
É importante destacar que a covariância nula é uma condição necessária, mas não é suficiente
para garantir que as duas variáveis são independentes.
Errado.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 215 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

063. (CEBRASPE/PC-SE/2021) Considere duas variáveis aleatórias contínuas, x e y, tais que


P(x > 0) = 1, P(x ≤ 1) = 1/10, P(x ≤ 1 | y > 1) = 3/10, Var (x) = Var (y) = 1, e Cov (x, y) = 0.
Com base nessas informações, julgue os itens a seguir.
Var (x - y) = 2.

A variância da diferença de duas variáveis aleatórias é dada por:

Certo.

064. (CEBRASPE/2018/POLÍCIA FEDERAL/PERITO CRIMINAL FEDERAL/ÁREA 1)

Tendo em vista que, diariamente, a Polícia Federal apreende uma quantidade x, em kg, de
drogas em determinado aeroporto do Brasil, e considerando os dados hipotéticos da tabela
precedente, que apresenta os valores observados da variável x em uma amostra aleatória
de 5 dias de apreensões no citado aeroporto, julgue o próximo item.
O desvio padrão amostral da variável x foi inferior a 7 kg.

Primeiramente, vamos calcular a média amostral.

Agora, vamos aplicar a expressão da variância amostral. Como temos uma amostra e vamos
calcular a variância amostral, devemos lembrar que, no denominador, aparece o termo N
- 1, em que N é o número de elementos da amostra.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 216 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O desvio padrão, por sua vez, é igual à raiz quadrada da variância.

De fato, a raiz quadrada de 44 é menor que 7. Podemos verificar isso facilmente, pois 7² =
49. Portanto, a raiz de quadrada de 44 deve ser um número menor que 7.
Certo.

065. (FCC/TRT 9ª REGIÃO (PR)/2020/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Uma população


com 16 valores estritamente positivos x1, x2, x3, …, x16, correspondente a um determinado
atributo, apresenta as seguintes informações:

O elemento x10, tal que x10 = 12, é retirado da população. Os valores da variância da primeira
população e da nova população formada são, respectivamente, iguais a:
a) 144 e 134,40
b) 144 e 144
c) 135 e 144
d) 135 e 135
e) 135 e 126

Nesse tipo de questão, muitos alunos costumam se assustar quando veem os somatórios.
Porém, veja que, na verdade, eles facilitam muito a resolução de questões.
Basta que você se lembre de que a variância é igual à média dos quadrados menos o quadrado
das médias.

A média da população pode ser calculada como a soma de todos os elementos dividida pelo
número de elementos da população.

Da mesma forma, a esperança de X² é igual ao somatório de x² dividido pelo total do número


de elementos da amostra.

Agora, vamos aplicar os valores calculados na expressão da variância.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 217 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Portanto, a variância da população original é igual a 135.


Na nova população, com a exclusão de um dos elementos, o elemento x12 = 10 deve ser
abatido tanto da soma dos termos como da soma dos quadrados.

Por fim, podemos calcular a média populacional e a esperança de x², observando que o
número de elementos da população diminui para 15, pois um elemento foi retirado.

Finalmente, devemos utilizar novamente a expressão da variância, que é igual à média dos
quadrados menos o quadrado da média.

Letra c.

066. (CESPE/IPHAN/2018/ANALISTA I/ÁREA 2) Cinco municípios de um estado brasileiro


possuem as seguintes quantidades de patrimônios históricos: {2, 3, 5, 3, 2}.
Admitindo que a média e o desvio padrão desse conjunto de valores sejam iguais a 3 e 1,2,
respectivamente, julgue o item seguinte.
O coeficiente de variação é superior a 0,3 e inferior a 0,5.

O coeficiente de variação é dado pela razão entre o desvio padrão e a média amostral.

De fato, o coeficiente de variação é superior a 0,3 e inferior a 0,5.


Certo.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 218 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

067. (ESAF/AFRFB/2012) Em um concurso público a nota média da prova de inglês foi igual
a 7 com desvio padrão igual a 2. Por outro lado, a nota média da prova de lógica foi igual
a 7,5 com desvio padrão igual a 4. Naná obteve nota 8 em Inglês e nota 8 em Lógica. Nené
obteve nota 7,5 em Inglês e 8,5 em Lógica. Nini obteve 7,5 em Inglês e 9 em Lógica. Com
relação à melhor posição relativa ─ ou ao melhor desempenho ─, pode-se afirmar que o
desempenho de:
a) Naná foi o mesmo em Inglês e Lógica.
b) Nini foi melhor em Lógica do que o de Naná em Inglês.
c) Nené foi melhor em lógica do que o de Naná em Inglês.
d) Nené foi o mesmo em Inglês e Lógica.
e) Nené foi melhor em Lógica do que em Inglês.

A Receita Federal poderia ter sido mais criativa e ter inventado nomes melhores para Naná,
Nené e Nini.
De qualquer forma, quando a questão fala em posição relativa, ela nos pede para comparar
as notas normalizadas.

Sendo assim, o desempenho relativo de Nené foi o mesmo em Inglês e Lógica.


Letra d.

068. (CESPE/TCE-PR/2016) Se satisfação no trabalho e saúde no trabalho forem indicadores


com variâncias populacionais iguais a 8 e 2, respectivamente, e se a covariância populacional
entre esses indicadores for igual a 3, então a correlação populacional entre satisfação no
trabalho e saúde no trabalho será superior a 0,70.

Para o cálculo da correlação, precisaremos dos desvios-padrão das variáveis, que são iguais
à raiz quadrada das variâncias populacionais. Lembrando-se disso, a correlação é dada por:
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 219 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Certo.

TÉCNICAS DE AMOSTRAGEM

069. (CESPE/PC-DF/2021/AGENTE) Em uma pesquisa de campo, realizada por meio de


amostragem aleatória simples, mediram-se as alturas de moradores masculinos adultos de
determinado município. Os pesquisadores resolveram aproximar a distribuição de alturas
por uma normal. Eles estimaram os parâmetros da normal por meio do método de máxima
verossimilhança. Considerando essa situação hipotética, julgue os itens a seguir.
A amostragem estratificada por faixas de renda familiar quando criança possibilitaria uma
estimação intervalar mais precisa dos parâmetros da distribuição normal.

A amostragem aleatória estratificada consiste em dividir as observações da variável aleatória


em estratos, que são mais homogêneos que a população original. Nesse caso, as faixas de
renda familiar seriam os estratos.
Ao se fazer isso, tem-se um custo maior. Porém, tem-se uma amostragem mais eficiente,
de modo que a estimação é realmente mais precisa.
Certo.

070. (FCC/PREFEITURA DO RECIFE-PE/2019/ANALISTA DE GESTÃO ADMINISTRATIVA) Uma


população de tamanho 1.600 é dividida em 80 subpopulações distintas. Por meio de um
sorteio, 20 subpopulações são selecionadas e todos os elementos nas subpopulações
selecionadas são observados. Este tipo de amostragem é denominado de Amostragem
a) por Conglomerados.
b) Sistemática.
c) Aleatória Estratificada.
d) Determinística.
e) por Quotas.

Observe que as 20 populações que foram selecionadas correspondem aos conglomerados.


A característica principal da amostragem por conglomerados é justamente a seleção do
conglomerado inteiro para a amostra.
Em oposição, na amostragem aleatória estratificada, teria que se garantir que:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 220 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

• as subpopulações formadas são mais homogêneas que a população original;


• seria feito um sorteio e que seria extraídos elementos de cada uma das subpopulações
selecionadas.
Vejamos as diferenças entre esses dois tipos:

Letra a.

071. (CESPE/TJ-PA/2020/ANALISTA JUDICIÁRIO/ESTATÍSTICA) O dono de um restaurante


pretende selecionar 50 de seus clientes fidelizados para a degustação de uma nova receita
que deseja incluir no cardápio. Ele possui um cadastro em que cada cliente fidelizado está
numerado sequencialmente de 1 a 1.980. Cara realizar a seleção, ele decidiu utilizar a técnica
de amostragem sistemática.
Nessa situação, caso o intervalo de seleção da amostra seja igual a 39 e a primeira unidade
populacional selecionada seja a 12ª, então a terceira unidade populacional selecionada será a:
a) 117ª
b) 36ª
c) 90ª
d) 51ª
e) 3ª

Na amostragem sistemática, somente a primeira unidade é selecionada ao acaso. As demais


são selecionadas por uma progressão aritmética, cuja razão é igual ao intervalo de seleção.
Ou seja, para obter a próxima unidade amostral, basta acrescentar o intervalo de seleção
(39).

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 221 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Outra forma de fazer seria utilizada a fórmula da progressão aritmética:

Letra c.

072. (FEPESE/ISS/CRICIÚMA/2017/AFTM) Uma agência de publicidade quer estimar o grau


de preferência entre dois produtos (A e B) concorrentes pelos usuários do cartão-fidelidade
de uma certa rede de supermercados. Para isso, realizará uma sondagem junto a uma
população de amostra dos usuários do cartão.
Os usuários selecionados terão de escolher uma das seguintes opções:
• Não tenho preferência entre (ou não uso) esses produtos
• Prefiro o produto A
• Prefiro o produto B
Para selecionar a amostra, a agência deve decidir entre um dos seguintes métodos de
amostragem:
• Método 1: selecionar aleatoriamente, no cadastro de usuários do cartão, 100 usuários
de cartão de crédito e lhes enviar uma enquete.
• Método 2: com base no cadastro, organizar os clientes da rede de supermercados em
grupos de acordo a faixa etária e então selecionar 100 usuários do cartão-fidelidade
aleatoriamente e de forma proporcional à quantidade de clientes em cada faixa
etária considerada.
• Método 3: convidar por meio de e-mail cada usuário do cartão para que participe
da pesquisa de opinião, e utilizar como população de amostra os usuários que se
disponibilizarem a responder o questionário.
Os métodos descritos acima são, respectivamente:
a) 1 e 2: amostragem casual simples; 3: amostragem não casual
b) 1: amostragem casual simples; 2 e 3: amostragem não casual
c) 1 e 2: amostragem casual estratificada; 3: amostragem não casual
d) 1 e 3: amostragem casual simples; 2: amostragem não casual
e) 1: amostragem casual simples; 2: amostragem casual estratificada; 3: amostragem não
casual

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 222 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O primeiro método é exatamente uma amostra aleatória simples. Os elementos da amostra


são selecionados casualmente por números aleatórios, sem nenhuma preocupação de dividir
a amostra em grupos homogêneos.
No segundo método, foi feita uma estratificação com base na faixa etária do cliente. De fato,
a faixa etária tende a influenciar na forma como os clientes utilizam seu cartão fidelidade.
Portanto, ao se dividir os clientes por faixa etária, realmente se obtém grupos mais
homogêneos do que a população inteira. Portanto, trata-se de uma amostragem casual
estratificada.
Finalmente, no terceiro método, há o risco de que alguns elementos da população tenham
menor disposição para responder o formulário. Por exemplo, um executivo bastante ocupado
terá menor disposição para preencher essa pesquisa, portanto, terá menor probabilidade
de pertencer à amostra.
Trata-se, portanto, de uma amostragem não casual.
Letra e.

073. (FCC/PREFEITURA DE RECIFE-PE/ANALISTA DE PLANEJAMENTO, ORÇAMENTO E GESTÃO)


Uma população de tamanho 1.600 é dividida em 80 subpopulações distintas. Por meio de
um sorteio, 20 subpopulações são selecionadas e todos os elementos nas subpopulações
selecionadas são observados. Este tipo de amostragem é denominado de Amostragem
a) por Conglomerados.
b) Sistemática.
c) Aleatória Estratificada.
d) Determinística.
e) por Quotas.

Nessa situação, a população foi dividida grupos (ou conglomerados). E a amostra selecionada
foi um conglomerado inteiro.
Trata-se, portanto, de uma amostragem por conglomerados.
Letra a.

074. (FCC/PREFEITURA DE RECIFE-PE/2019/ANALISTA DE GESTÃO ADMINISTRATIVA) Uma


população com uma certa quantidade de elementos é dividida previamente em grupos
mutuamente exclusivos e dentro dos quais são sorteadas amostras casuais simples. Esse
tipo de amostragem é denominado de Amostragem:
a) Determinística.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 223 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

b) por Conveniência.
c) Aleatória Estratificada.
d) por Quotas.
e) por Conglomerados.

Os grupos mutuamente exclusivos podem ser estratos ou conglomerados. A diferença entre


os dois tipos de amostragem é que:
• Na amostragem aleatória estratificada, é feita uma amostragem aleatória simples
dentro de cada estrato, sendo que o número de elementos retirados de cada estrato
é proporcional ao tamanho do estrato;
• Na amostragem aleatória por conglomerados, a amostra selecionada é o conglomerado
inteiro.
Dessa forma, como foi feita uma amostragem aleatória dentro de cada grupo, a situação
só pode se referir à amostragem aleatória estratificada.
Letra c.

075. (FGV/HEMOCENTRO-SP/2013) O método de seleção de amostras em que a quantidade


de unidades de amostragem na população é dividida pelo tamanho da amostra para dar
um intervalo de amostragem é uma seleção:
a) aleatória.
b) sistemática.
c) ao acaso.
d) de bloco.
e) de unidade monetária.

Na amostragem sistemática, somente o primeiro elemento é selecionado por números


aleatórios. Os demais são selecionados por meio da adição de uma razão constante, também
conhecida como intervalo de amostragem.
Letra b.

076. (FCC/SEFAZ-SP/AGENTE FISCAL DE RENDAS/2013/ADAPTADA) Na amostragem aleatória


estratificada, a população é dividida em estratos, usualmente, de acordo com os valores
ou categorias de uma variável, e, depois, uma amostragem aleatória simples é utilizada na
seleção de uma amostra de cada estrato.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 224 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Muito boa a definição.


De fato, na amostragem aleatória estratificada, a população deve ser dividida em estratos.
É muito importante também o ponto de que a amostragem aleatória simples deve ser
utilizada para selecionar a amostra dentro de cada estrato.
Certo.

077. (FGV/IBGE/2016/TECNOLOGISTA/ESTATÍSTICA) A elaboração do Plano Amostral de uma


pesquisa de campo demanda três especificações: a unidade amostral, a forma de seleção
da amostra e o tamanho da amostra. Para seleções de natureza aleatórias, existem algumas
alternativas, sobre as quais é correto afirmar que:
a) a amostragem estratificada divide a população em grupos que devem ser os mais
heterogêneos possíveis para algum atributo da população;
b) a amostragem sistemática é realizada em dois estágios, sendo que apenas no segundo
se chega a unidade amostral;
c) na amostragem estratificada proporcional, o número de elementos da amostra, em cada
estrato, é proporcional ao tamanho do estrato;
d) na amostra aleatória simples, as probabilidades de seleção dos indivíduos da população
podem ser diferentes, porém devem ser conhecidas;
e) na amostragem por cotas, a probabilidade de seleção deve ser proporcional ao tamanho
da cota, essa determinada de forma aleatória.

Mais uma questão cheia de complicações sobre amostragem.


Na amostragem estratificada, a população é dividida em grupos que devem ser mais
homogêneos que a população inteira. Quanto mais homogêneos forem os grupos, mais
efetiva será essa amostra. Portanto, o erro da letra a) é dizer que os grupos são heterogêneos.
Por outro lado, o número de elementos de cada estrato presentes na amostra deve ser
proporcional ao tamanho do estrato. Logo, a letra c) está correta.
Na amostragem aleatória simples, a probabilidade de seleção de todos os indivíduos da
população deve ser necessariamente igual. Portanto, a letra d) está errada.
A amostragem sistemática realmente é feita em duas etapas. Na primeira, faz-se uma
seleção aleatória de um indivíduo da amostra. Todos os demais são selecionados adicionando
uma razão constante.
Sendo assim, o erro da letra b) é que em ambas as etapas se chega a uma unidade amostral.
Por fim, na amostragem por cotas, a cota não é aleatória. Também não se pode dizer que
a probabilidade de seleção do elemento é proporcional ao tamanho da cota.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 225 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Ela é semelhante à amostragem estratificada, porém, a seleção dentro de cada estrato ou


cota é feita ao acaso, e não por uma amostragem estatística.
Letra c.

078. (FGV/AL-RO/2018/ANALISTA LEGISLATIVO/ESTATÍSTICA) Acerca da amostragem


estratificada, analise as afirmativas a seguir.
I – Visa a produzir estimativas mais precisas, produzir estimativas para a população toda
e para subpopulações.
II – Em geral, quanto menos os elementos de cada estrato forem parecidos entre si e também
entre os estratos, maior será a precisão dos estimadores.
III – A estratificação produz necessariamente estimativas mais eficientes do que a amostragem
aleatória simples.
Está correto o que se afirma em:
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.

Vamos analisar as afirmações.


I – Certo. A estratificação tem por objetivo melhorar a precisão do estimador ao subdividir
a população original em estratos.
II – Errado. Na realidade, é o contrário: quanto mais homogêneos forem os estratos, maior
será a eficiência da estratificação. Por exemplo, quando queremos pesquisar a altura média
do brasileiro e dividimos a população por faixas de renda, é porque esperam que pessoas
de uma mesma faixa de renda tenham uma altura mais homogênea do que na população
inteira.
III – Errado. A estratificação somente produz melhores resultados quando o parâmetro
utilizado para a estratificação é realmente um fator importante para a variável de interesse
da pesquisa.
Por exemplo, na determinação da altura média do brasileiro, não seria interessante utilizar
o critério de preferência por gênero de filme favorito, pois o gênero do filme não tem nada
a ver com a altura da pessoa.
Letra a.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 226 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

079. (FGV/ALERO/ANA LEG/2018) Sobre as vantagens da amostragem por conglomerados,


avalie as afirmativas a seguir.
I – O plano amostral é mais eficiente já que dentro dos conglomerados os elementos tendem
a ser mais parecidos.
II – Não há necessidade de uma lista de identificação dos elementos da população.
III – Tem, em geral, menor custo por elemento, principalmente quando o custo por observação
cresce se aumenta a distância entre os elementos.
Está correto o que se afirma em
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.

I – Errado. A amostragem mais eficiente é a estratificada. A amostragem por conglomerados


tem a vantagem de ser mais barata, porém, isso diminui a eficiência do plano amostral.
II – Certo. Como na amostragem por conglomerados, é selecionado para a amostra o
conglomerado inteiro, de fato, não há necessidade de lista de identificação dos elementos
da população.
III – Certo. É isso mesmo. Ao concentrar várias unidades amostrais em um único conglomerado,
isso vai tornar a amostragem mais barata, porém, perde em eficiência.
Letra d.

080. (CESPE/TELEBRÁS/2013) O risco de amostragem está relacionado, entre outras


hipóteses, com a possibilidade de que uma amostra tenha sido selecionada com base em
critérios estatísticos corretos, mas que não é adequada para representar a população.

De fato, ainda que sejam aplicados os critérios estatísticos perfeitamente, ainda há um


risco de que a amostra selecionada não seja adequada para representar a população. É
simplesmente impossível eliminar essa realidade.
Certo.

081. (FGV/AL-RO/2018/ANALISTA LEGISLATIVO/ESTATÍSTICA) Acerca da amostragem


estratificada, analise as afirmativas a seguir.
I – Visa a produzir estimativas mais precisas, produzir estimativas para a população toda
e para subpopulações.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 227 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

II – Em geral, quanto menos os elementos de cada estrato forem parecidos entre si e também
entre os estratos, maior será a precisão dos estimadores.
III – A estratificação produz necessariamente estimativas mais eficientes do que a amostragem
aleatória simples.
Está correto o que se afirma em:
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.

Vamos analisar as afirmações.


I – Certo. A estratificação tem por objetivo melhorar a precisão do estimador ao subdividir
a população original em estratos.
II – Errado. Na realidade, é o contrário: quanto mais homogêneos forem os estratos, maior
será a eficiência da estratificação. Por exemplo, quando queremos pesquisar a altura média
do brasileiro e dividimos a população por faixas de renda, é porque esperam que pessoas
de uma mesma faixa de renda tenham uma altura mais homogênea do que na população
inteira.
III – Errado. A estratificação somente produz melhores resultados quando o parâmetro
utilizado para a estratificação é realmente um fator importante para a variável de interesse
da pesquisa.
Por exemplo, na determinação da altura média do brasileiro, não seria interessante utilizar
o critério de preferência por gênero de filme favorito, pois o gênero do filme não tem nada
a ver com a altura da pessoa.
Letra a.

082. (CESPE/TJ-PA/2020/ANALISTA JUDICIÁRIO/ESTATÍSTICO) Uma população de 1.200


elementos possui um sistema de referências ordenado de 1 a 1.200. Com o propósito de
se obter uma amostra de 300 elementos dessa população, dividiram-na em 300 grupos de
4 unidades populacionais, tendo sido a unidade 2 selecionada aleatoriamente entre as 4
primeiras unidades. Em seguida, foram selecionadas as segundas unidades dos 299 grupos
restantes, completando-se, assim, a amostra de 300 unidades populacionais.
Nesse caso, foi utilizada a amostragem:
a) por conglomerados em um estágio.
b) estratificada.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 228 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

c) sistemática.
d) aleatória simples.
e) por intervalos.

Note que a primeira unidade foi selecionada aleatoriamente com o número 2. A partir daí,
todas as unidades foram selecionadas com base na primeira. Foi o número 2 de todos os
conjuntos em que foi subdividida a população original.
Trata-se, portanto, de uma amostragem sistemática, em que somente o primeiro elemento
da amostra é determinado por padrões aleatórios.
Letra c.

PROBABILIDADES

083. (CESPE/MINISTÉRIO DA ECONOMIA/2020/TECNOLOGIA DE INFORMAÇÃO/SEGURANÇA DA


INFORMAÇÃO E PROTEÇÃO DE DADOS) O setor de gestão de pessoas de determinada empresa
realiza regularmente a análise de pedidos de férias e de licenças dos seus funcionários.
Os pedidos são feitos em processos, em que o funcionário solicita apenas férias, apenas
licença ou ambos (férias e licença). Em determinado dia, 30 processos foram analisados,
nos quais constavam 15 pedidos de férias e 23 pedidos de licenças.
Com base nessa situação hipotética, julgue o item que se seguem.
Se todos os processos foram analisados individualmente nesse dia, então a probabilidade
de um processo específico ter sido o primeiro a ser analisado é superior a 1/10.

Como foram analisados 30 processos naquele dia, a chance de um processo qualquer ser
o primeiro a ser analisado é:

Essa probabilidade é inferior a 1/10, porque, quanto maior o denominador, menor a fração.
Errado.

084. (FGV/DPE-RS/2023/TÉCNICO ADMINISTRATIVO) Um dado cúbico honesto, com as


faces numeradas de 1 a 6, é lançado duas vezes consecutivas. Sabe-se que no primeiro
lançamento saiu um número maior do que 4.
A probabilidade de que a soma dos dois números sorteados seja maior do que 8 é:
a) 1/2

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 229 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

b) 2/3
c) 5/8
d) 7/12
e) 9/16

Vamos montar uma tabela de probabilidades, marcando os eventos favoráveis.


4 5 6
1 ❌ ❌ ❌
2 ❌ ❌ ❌
3 ❌ ❌ ✅
4 ❌ ✅ ✅
5 ✅ ✅ ✅
6 ✅ ✅ ✅
Assim, temos 9 eventos favoráveis no total de 18 eventos possíveis. Então, pela teoria
clássica da probabilidade, a probabilidade do evento é:

Letra a.

085. (IF-MA/2023/ASSISTENTE EM ADMINISTRAÇÃO) A respeito dos conceitos associados


à probabilidade, é correto afirmar que:
a) a probabilidade de se obter “cara” no lançamento de uma moeda não viciada é igual à
probabilidade de se obter um número “par” no lançamento de um dado comum, não viciado.
b) quando há a certeza da ocorrência de certo evento, pode-se dizer que a probabilidade
de tal ocorrência é 200%.
c) se lançarmos dois dados comuns, não viciados, há maior probabilidade de a soma dos
pontos voltados para cima ser 11 do que 7.
d) se lançarmos uma moeda não viciada duas vezes e obtivermos “cara” no primeiro
lançamento, a probabilidade de o segundo lançamento resultar “coroa” é maior que 50%.
e) se lançarmos duas moedas comuns, ambas não viciadas e indistinguíveis, a probabilidade
de obtermos faces iguais é maior que a probabilidade de obtermos faces diferentes.

Vamos analisar as afirmações.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 230 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

a) Certa. Uma moeda não viciada tem 2 resultados possíveis – cara ou coroa. Portanto, a
probabilidade de se obter “cara” é:

Por outro lado, um dado tem seis resultados possíveis {1, 2, 3, 4, 5, 6}. Como são 3 números
pares, a probabilidade é:

b) Errada. Pelos axiomas de Kolgomorov, a probabilidade total, isto é, a probabilidade de


todo o espaço amostral, que corresponde a um evento certo, é igual a 100%.
c) Errada. Para a soma dos dados ser igual a 11, temos apenas duas possibilidades – 5 + 6
ou 6 + 5.
Por outro lado, para a soma dos dados ser igual a 7, temos mais possibilidades – 1 + 6, 2 +
5, 3 + 4, 4 + 3, 5 + 2 e 6 + 1.
Portanto, a probabilidade de a soma ser igual a 7 é maior.
d) Errada. Dois lançamentos consecutivos de uma moeda são independentes. Portanto, o
fato de ter dado “cara” no primeiro lançamento não altera a probabilidade de dar “coroa”
no segundo. Sendo assim, a probabilidade de dar “coroa” no segundo lançamento é sempre
igual a 50%, independente do resultado do primeiro lançamento.
e) Errada. A probabilidade de dois lançamentos de uma moeda serem iguais é igual a 1/2.
No caso de dados de 6 faces, a probabilidade de as duas faces terem resultado igual é igual
a 1/6.
Letra a.

086. (AOCP/PM-DF/2023/SOLDADO) A ocorrência de um crime contava com apenas duas


testemunhas oculares. Após o início das investigações, as evidências apontaram para três
irmãos gêmeos idênticos, sem qualquer característica física que permitisse distingui-los
naquela situação. Sabe-se que nenhum deles tem álibi e que um deles realmente é o único
criminoso. As testemunhas, na ânsia de se livrarem rapidamente da situação, optaram
por apontar aleatoriamente (ainda que de forma imprudente) um dos três irmãos como
culpado. Considerando as informações constantes nesse problema, qual é a probabilidade
de ambas as testemunhas terem apontado corretamente para o criminoso?
a) Aproximadamente 50%.
b) Aproximadamente 33%.
c) Aproximadamente 17%.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 231 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

d) Aproximadamente 11%.
e) Aproximadamente 2%.

A primeira testemunha tem 3 opções de irmãos, sendo que somente 1 deles foi o real
culpado. Portanto, a chance de ele acertar ao acaso é igual a 1/3.
A mesma situação é válida para a segunda testemunha, porque ela fez um testemunho
independente da primeira. Ela tem 3 opções de irmãos, mas somente 1 deles foi o real
culpado. Portanto, a chance de ele acertar ao acaso é igual a 1/3.
Usando o princípio fundamental da contagem, a probabilidade de ambas as testemunhas
apontarem para o culpado correto é:

Letra d.

087. (CESPE/TJ-PA/2020/ANALISTA JUDICIÁRIO/ANÁLISE DE SISTEMAS) Em um sistema


informatizado, as senhas são formadas por três letras distintas, em uma ordem específica.
Esse sistema bloqueia a conta do usuário a partir da quinta tentativa errada de inserção da
senha. Abel fez seu cadastro no sistema, mas, após certo tempo sem utilizá-lo, esqueceu-
se da senha, lembrando-se apenas de que ela era formada com as letras do seu nome, sem
repetição.
Nessa situação hipotética, a probabilidade de Abel, inserindo senhas com base apenas nas
informações de que ele se lembra, conseguir acessar a sua conta sem bloqueá-la é igual a:
a) 3/192
b) 3/72
c) 3/24
d) 3/18
e) ¾

Como o nome Abel tem 4 letras e a senha deve ter 3 letras distintas, temos 4 opções para
a primeira letra, 3 opções para a segunda ( já que não podemos repetir) e 2 opções para a
terceira letra.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 232 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Abel pode realizar 4 tentativas antes de bloquear a senha. Assim, concluímos que a
probabilidade de ele acertar a sua senha é:

Letra d.

088. (FGV/MP-SC/2022/AUXILIAR DO MINISTÉRIO PÚBLICO) ALESSANDRA escreveu em 10


cartões diferentes cada uma das 10 letras do seu nome e colocou esses cartões em uma
urna. A seguir, ela retirou, aleatoriamente e em sequência, 3 cartões da urna. A probabilidade
de que ALESSANDRA tenha retirado os 3 cartões com a letra “A” é:
a) 1/120
b) 7/120
c) 1/40
d) 3/10
e) 3/7

No início, havia 3 letras A dentre 10 cartões. Então, a probabilidade de Alessandra tirar o


primeiro cartão com a letra A é 3/10.
Na segunda retirada, haverá 9 cartões, dentre os quais 2 letras A. Portanto, a probabilidade
de ela retirar o segundo cartão também com a letra A passou a ser de 2/9.
Por fim, na terceira retirada, haverá 8 cartões, dentre os quais só restou 1 letra A. Então,
a probabilidade de ela retirar o terceiro cartão com a terceira letra A passou a ser de 1/8.
Assim, teremos que a probabilidade:

Portanto, a probabilidade

Letra a.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 233 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

089. (CEBRASPE/CBM-TO/2023/ALUNO-PRAÇA) Em um batalhão de bombeiros, estão de


plantão doze soldados, sendo sete homens e cinco mulheres. Desse total de soldados, dois
serão escolhidos ao acaso para compor uma equipe que atuará em uma missão.
Nessa situação hipotética, a probabilidade de que essa equipe tenha pelo menos uma
mulher é de:
a) 35/66
b) 15/22
c) 5/33
d) 7/22

O número total de comissões que podem ser formadas consiste em escolher 2 pessoas no
total de 12 soldados.

Podemos usar o princípio da exclusão para calcular o número de comissões que têm pelo
menos uma mulher. Para isso, vamos calcular o número de comissões que não contém
mulheres podem ser calculadas escolhendo 2 pessoas no total de 7 homens.

Pelo princípio da exclusão, o número de comissões que possuem pelo menos uma mulher é:

Desse modo, pela definição de probabilidade, temos:

Letra b.

090. (FGV/CBME-RJ/2023/OFICIAL) Solange e Marcelo fazem parte de um grupo de 10


pessoas. Sorteiam-se duas pessoas desse grupo, em sequência e sem reposição.
A probabilidade de Solange ser sorteada e Marcelo não ser sorteado é de:
a) 8/45
b) 1/10
c) 1/5
d) 4/25
e) 3/40

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 234 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O número total de formas de se sortear duas pessoas nesse grupo de 10 seria:

Em seguida, queremos que Solange seja sorteada e que Marcelo não seja. Então, veja que,
na realidade, só precisamos escolher uma das outras 8 pessoas para ser a outra pessoa
sorteada no grupo. Então, o número de sorteios favoráveis é 8.
Então, pela definição clássica de probabilidade, temos:

Letra a.

091. (INSTITUTO SELECON/CREA/RJ/2023/AGENTE ADMINISTRATIVO) Em um lote contendo


X camisas, 90% delas são do tamanho G e o restante do tamanho P. Desse lote, 70% das
camisas tamanho G e 20% das camisas tamanho P serão destinadas à venda no exterior. O
percentual de X que não será destinado à venda no exterior corresponde a:
a) 32%
b) 33%
c) 34%
d) 35%
e) 36%

Vamos montar a árvore das probabilidades.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 235 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

No detalhe, os percentuais de camisas destinadas ao exterior podem ser calculados pela


técnica do percentual de percentual, que seria o produto dos percentuais.

Então, o percentual de camisas que não são destinadas à venda no exterior corresponde a:

Letra d.

092. (FGV/RECEITA FEDERAL/2023/ANALISTA TRIBUTÁRIO) Ana vai passar o fim de semana


em sua casa de praia. A previsão do tempo diz que a probabilidade de chuva no sábado é
de 30%, e a probabilidade de chuva no domingo é de 40%.
Nesse caso, a probabilidade de que Ana consiga ir à praia no fim de semana sem pegar
chuva é de:
a) 46%
b) 55%
c) 63%
d) 88%
e) 92%

Usando as probabilidades complementares, a probabilidade não chover no sábado é 70%


e a probabilidade não chover no domingo é 60%. Portanto, a probabilidade que Ana pegue
os dois dias sem chuva.

Anulado.

093. (FGV/FUNSAÚDE-CE/2021) Em uma urna, há bolas pequenas e bolas grandes, sendo


75% pequenas e as demais são grandes. Das bolas pequenas, 20% são azuis e as demais
são vermelhas e, das bolas grandes, 60% são azuis e as demais são vermelhas. Retira-se,
aleatoriamente, uma bola da urna e constata-se que ela é azul. A probabilidade de a bola
retirada ser pequena é de
a) 20%

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 236 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

b) 25%
c) 30%
d) 40%
e) 50%

Vamos construir a árvore de probabilidades.

Desse modo, 30% das bolas são azuis. Dessas bolas, 15% são pequenas e 15% são grandes.
Assim, pelo Teorema de Bayes, a probabilidade de a bola ser pequena, sabendo que ela é
azul é:

Letra e.

094. (FGV/RECEITA FEDERAL/2023/ANALISTA TRIBUTÁRIO) Nelson dividiu sua vasta biblioteca


entre livros de aventura (a), biografias (b), científicas (c) e diversos (d). Ele também catalogou
os livros segundo o número de páginas (np): os de menos de 200 páginas, aqueles que têm
entre 200 e 500 páginas e os de mais de 500 páginas.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 237 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A tabela a seguir apresenta os percentuais de livros com menos de duzentas páginas e


percentuais de livros com mais de 500 páginas para cada uma das categorias a, b, c e d. A
tabela mostra ainda o percentual de livros de cada das 4 categorias.

O percentual de livros da biblioteca com um número de páginas entre 200 e 500 situa-se
entre
a) 0,45 e 0,50
b) 0,40 e 0,45
c) 0,35 e 0,40
d) 0,30 e 0,35
e) 0,25 e 0,30

Podemos calcular o percentual de livros entre 200 e 500 páginas de todas as categorias
usando a probabilidade complementar.
Categoria np < 200 np > 500 200 < np < 500
A 0,3 0,2 1 - 0,3 - 0,2 = 0,5
B 0,1 0,7 1 - 0,1 - 0,7 = 0,2
C 0,1 0,5 1 - 0,1 - 0,5 = 0,4
D 0,3 0,3 1 - 0,3 - 0,3 = 0,4
Então, para calcular o percentual de livros desejados, devemos somar os percentuais de livros
entre 200 e 500 páginas de todas as características. Esses percentuais podem ser obtidos
multiplicando-se o percentual encontrado acima pelo percentual de livros correspondentes
a cada categoria.

Letra b.

095. (INSTITUTO SELECON/CREA-RJ/2023/AGENTE ADMINISTRATIVO) Em um grupo formado


por 40 agentes de fiscalização, 26 moram na cidade do Rio de Janeiro, 15 têm quarenta
e cinco anos e 8 moram no Rio de Janeiro e têm quarenta e cinco anos. Escolhendo-se ao

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 238 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

acaso dois desses 40 agentes, a probabilidade de que ambos não morem no Rio de Janeiro
e não tenham quarenta e cinco anos é de:
a) 7/130
b) 7/260
c) 7/380
d) 7/460
e) 7/520

Vamos calcular a quantidade de agentes que moram no Rio de Janeiro ou possuem a idade
de 45 anos.

Então, o total de agentes que não possuem nenhuma dessas duas características é:

O número total de formas de escolher dois agentes dentre os 40 é:

Por outro lado, o número de formas de escolher dois agentes que não possuam nenhuma
das duas características é:

Então, podemos calcular a probabilidade usando a teoria clássica.

Letra b.

096. (FCC/ALAP/2020/ANALISTA LEGISLATIVO/ECONOMIA) Em determinado setor de um


órgão público foi realizado um levantamento com relação aos cargos de nível superior. A
tabela abaixo apresenta a distribuição dos respectivos funcionários segundo o cargo e sexo.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 239 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Um funcionário é escolhido aleatoriamente neste setor para realizar uma tarefa. Seja E o
evento indicando que o funcionário escolhido é economista e seja H o evento indicando que
o funcionário escolhido é homem. Considerando, então, os eventos E H, a probabilidade de
que pelo menos um destes dois eventos ocorra é igual a
a) 64%
b) 76%
c) 56%
d) 80%
e) 48%

Quando a questão falou em pelo menos um dos dois eventos, ela pediu a probabilidade
da união. Para isso, precisamos calcular as probabilidades dos dois eventos isolados e a
probabilidade da intersecção, como mostrado a seguir:

Agora, vamos utilizar a fórmula da probabilidade da união.

Letra a.

Considerando que A e B sejam eventos aleatórios independentes e que 𝑃(𝐴) = 0,8 e 𝑃(𝐵) =
0,2, julgue os próximos itens.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 240 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

097. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I) 𝑃(𝐴 ∩ 𝐵) = 0

Como A e B são dois eventos aleatórios independentes, a probabilidade da intersecção é


igual ao produto das probabilidades.

Errado.

098. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I)

Como A e B são dois eventos aleatórios independentes, a probabilidade da intersecção é


igual ao produto das probabilidades.

Dividindo os dois termos, temos:

Podemos utilizar a regra para calcular a razão de frações: conserva a primeira e multiplica
pelo inverso da segunda.

Errado.

099. (CEBRASPE/TC-DF/2023/ANALISTA ADMINISTRATIVO DE CONTROLE EXTERNO) O conjunto


Ω representa o espaço amostral de um experimento aleatório. Considerando quatro eventos
aleatórios A, B, C, D  Ω, tais que A e B sejam eventos independentes, C  A e A ∩ D = Ø,
julgue os seguintes itens a seguir, sabendo que P(A) = 0,4; P(B) = 0,3; P(C) = 0,2 e P(D) = 0,1.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 241 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

P(A Ս B) + P(A Ս C) + P(A Ս D) = 1,48

Vamos calcular a probabilidade da união A e B.

Como A e B são eventos independentes, a probabilidade da intersecção é igual ao produto


das probabilidades.

Então, a probabilidade da união pedida é:

Para a probabilidade da união entre A e C, como C está contido em A, a união dos dois
conjuntos é o próprio conjunto A. Então:

Por fim, entre A e D, a probabilidade da intersecção é nula. Então, a probabilidade da união é:

Então, a soma pedida é:

Certo.

100. (CEBRASPE/TC-DF/2023/ANALISTA ADMINISTRATIVO DE CONTROLE EXTERNO) P(A|B)


+ P(A|C) + P(A|D) = 1,4.

Como A e B são eventos independentes, a probabilidade condicional é igual à própria


probabilidade do evento A. Então, temos:

Como C está contido em A, a probabilidade condicional é igual a 1, porque a probabilidade


da intersecção entre A e C seja igual à probabilidade do evento C.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 242 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Como A e D são disjuntos, é impossível ocorrerem simultaneamente. Então, a probabilidade


de intersecção é nula, logo a probabilidade condicional é nula.

Portanto, a soma pedida é:

Certo.

101. (FGV/IBGE/2016/TECNOLOGIA/ESTATÍSTICO) A teoria das probabilidades está apoiada


em um conjunto de três axiomas, atribuídos a Kolmogorov. Sendo S o espaço amostral, A e
B dois eventos, Ø do vazio e P(.) a medida de probabilidade, os axiomas estabelecem que:
a) P(S) = 1, P(A) ≥ 0 e P(A∩B) = P(A) ⋅ P(B);
b) P(Ø) = 0, P(A) ≤ 1 e P(A U B) = P(A) + P(B);
c) P(A) ≥ 0; P(A) = 1 - P(AC ) e P(S) = 1, AC = Complementar de A;
d) P(A) ≥ 0; P(S) = 1 e P(A U B) = P(A) + P(B) com A∩B = Ø;
e) P(A) ≤ 1; P(S) = 1 e P(A U B) = P(A) + P(B) - P(A∩B).

Talvez você tenha notado meu tom de melancolia ao pedir para que você decorasse os três
axiomas de Kolgomorov. Mas, realmente, é triste quando uma Matemática tão bonita tem
que ser empurrada goela abaixo.
Bom, vamos repeti-los para que você não se esqueça.
• Primeiro Axioma: a probabilidade de um evento qualquer é um número real não
negativo:

• Segundo Axioma: a probabilidade de todo o espaço amostral é igual a 1:

• Terceiro Axioma: para eventos disjuntos, a probabilidade da união é a soma das


probabilidades:
Gostaria de acrescentar que muitas alternativas apresentam consequências dos axiomas.
Por exemplo, é uma consequência direta dos dois primeiros axiomas, pois, como
a probabilidade de qualquer evento é não negativa e a probabilidade do universo é 1, então,
a probabilidade de qualquer evento será menor que a probabilidade do universo.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 243 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

No entanto, a questão não perguntou o que se poderia afirmar, mas, sim, o que estava
escrito nos axiomas. Por isso, só há um gabarito.
Letra d.

102. (CESPE/MINISTÉRIO DA ECONOMIA/2020/TECNOLOGIA DE INFORMAÇÃO/SEGURANÇA DA


INFORMAÇÃO E PROTEÇÃO DE DADOS) O setor de gestão de pessoas de determinada empresa
realiza regularmente a análise de pedidos de férias e de licenças dos seus funcionários.
Os pedidos são feitos em processos, em que o funcionário solicita apenas férias, apenas
licença ou ambos (férias e licença). Em determinado dia, 30 processos foram analisados,
nos quais constavam 15 pedidos de férias e 23 pedidos de licenças.
Com base nessa situação hipotética, julgue o item que se seguem.
Se todos os processos foram analisados individualmente nesse dia, então a probabilidade
de um processo específico ter sido o primeiro a ser analisado é superior a 1/10.

Como foram analisados 30 processos naquele dia, a chance de um processo qualquer ser
o primeiro a ser analisado é:

Essa probabilidade é inferior a 1/10, porque quanto maior o denominador, menor a fração.
Errado.

103. (CESPE/MINISTÉRIO DA ECONOMIA/2020/TECNOLOGIA DE INFORMAÇÃO/SEGURANÇA


DA INFORMAÇÃO E PROTEÇÃO DE DADOS) A probabilidade de, em um processo, constar um
pedido de férias é calculada pelo conceito clássico de probabilidades.

Veja que foi fornecida a contagem direta do número de pedidos que se referem a licença
de férias. Por isso, a questão utilizou o conceito frequencial.
O conceito clássico supõe eventos equiprováveis e utiliza as técnicas da análise combinatória
para calcular o número de eventos favoráveis.
Errado.

104. (CESPE/BNB/2018/ANALISTA DE SISTEMA) Um tabuleiro quadrado e quadriculado,


semelhante a um tabuleiro de xadrez, com 12 linhas e 12 colunas, e, portanto, com 12 ⋅ 12
= 144 quadradinhos pintados: 54, na cor azul; 30, na cor marrom; 40, na cor amarela; e 20,
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 244 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

na cor verde. A cada quadradinho é associado um cartão com dois números, que indicam a
posição do quadradinho no tabuleiro; o primeiro número corresponde ao número da linha,
e o segundo corresponde ao número da coluna. Por exemplo, o cartão com os números 5,10
corresponde ao quadradinho posicionado na linha 5 e na coluna 10. Esses cartões estão em
uma urna, da qual podem ser retirados aleatoriamente.
A probabilidade de retirar dessa caixa, de maneira aleatória, um cartão correspondente a
um quadrado que não tenha sido pintado na cor marrom é inferior a 0,72.

Observe que, dos 144 quadradinhos, 30 deles são marrons. Portanto, o número de
quadradinhos que não são marrons é:

Como o total de quadrados existentes no tabuleiro é igual a 144, podemos escrever pela
definição clássica de probabilidade:

Errado.

105. (FGV/MP-SC/2022/AUXILIAR DO MINISTÉRIO PÚBLICO) ALESSANDRA escreveu em 10


cartões diferentes cada uma das 10 letras do seu nome e colocou esses cartões em uma
urna. A seguir, ela retirou, aleatoriamente e em sequência, 3 cartões da urna. A probabilidade
de que ALESSANDRA tenha retirado os 3 cartões com a letra “A” é:
a) 1/120
b) 7/120
c) 1/40
d) 3/10
e) 3/7

No início, havia 3 letras A dentre 10 cartões. Então, a probabilidade de Alessandra tirar o


primeiro cartão com a letra A é 3/10.
Na segunda retirada, haverá 9 cartões, dentre os quais 2 letras A. Portanto, a probabilidade
de ela retirar o segundo cartão também com a letra A passou a ser de 2/9.
Por fim, na terceira retirada, haverá 8 cartões, dentre os quais só restou 1 letra A. Então,
a probabilidade de ela retirar o terceiro cartão com a terceira letra A passou a ser de 1/8.
Assim, teremos que a probabilidade:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 245 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Portanto, a probabilidade

Letra a.

106. (FCC/2019/SEFAZ-BA/AUDITOR FISCAL/ADMINISTRAÇÃO TRIBUTÁRIA/PROVA II) Uma


sala contém 20 homens e 30 mulheres em que todos são funcionários de uma empresa.
Verifica-se que metade desses homens e metade dessas mulheres possuem nível superior.
Escolhendo aleatoriamente uma pessoa dessa sala para realizar uma tarefa, a probabilidade
de ela ser mulher ou possuir nível superior é igual a:
a) 2/3
b) 3/10
c) 5/6
d) 3/4
e) 4/5

Vamos montar a árvore de probabilidades. Para isso, vamos obter as probabilidades de que
uma pessoa da sala seja homem e de que ela seja mulher

A seguir, sabemos que metade dos homens e metade das mulheres possuem nível superior.
Vamos montar a árvore de probabilidades, destacando as pessoas que possuem nível superior.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 246 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Por fim, basta utilizar a probabilidade da união.

Letra e.

107. (FGV/FUNSAÚDE-CE/2021) Em uma urna, há bolas pequenas e bolas grandes, sendo


75% pequenas e as demais são grandes. Das bolas pequenas, 20% são azuis e as demais
são vermelhas e, das bolas grandes, 60% são azuis e as demais são vermelhas. Retira-se,
aleatoriamente, uma bola da urna e constata-se que ela é azul. A probabilidade de a bola
retirada ser pequena é de
a) 20%
b) 25%
c) 30%
d) 40%
e) 50%

Vamos construir a árvore de probabilidades.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 247 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Desse modo, 30% das bolas são azuis. Dessas bolas, 15% são pequenas e 15% são grandes.
Assim, pelo Teorema de Bayes, a probabilidade de a bola ser pequena, sabendo que ela é
azul é:

Letra e.

DISTRIBUIÇÕES DE PROBABILIDADE

108. (FGV/RFB/2023/ANALISTA TRIBUTÁRIO) Uma variável aleatória discreta x tem função


de probabilidade dada por:
x 0 1 2 3
p(x) 0,5 0,2 0,1 0,2
A probabilidade de que o valor de x seja maior do que 2 é igual a:
a) 10%
b) 20%
c) 25%
d) 30%
e) 50%

Como x tem que ser maior que 2, então x só pode ser igual a 3.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 248 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A probabilidade de isso acontece é 0,2 ou 20%.


Letra b.

109. (FGV/SEFAZ-BA/2022/AGENTE DE TRIBUTOS ESTADUAIS) Uma variável aleatória discreta


x tem a seguinte distribuição de probabilidades:

A média de x é igual a
a) 3,5
b) 4,0
c) 5,4
d) 6,2
e) 7,0

Pela definição de valor esperado, ele é igual à somatória dos produtos das probabilidades
observadas pelo valor associado a cada probabilidade. Então, podemos escrever:

Letra d.

110. (CEBRASPE/TC-DF/2023/AUDITOR-FISCAL DE CONTROLE EXTERNO) Considerando que


X e Y sigam distribuições normais padrão e que a correlação linear entre ambas seja igual
a -1, julgue os seguintes itens.
P(x > 0) + P(Y ≤ 0) = 1

Como a distribuição normal é simétrica em relação à origem, podemos escrever:

Então, a soma é:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 249 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Certo.

111. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE) Determinado órgão governamental


estimou que a probabilidade p de um ex-condenado voltar a ser condenado por algum
crime no prazo de 5 anos, contados a partir da data da libertação, seja igual a 0,25. Essa
estimativa foi obtida com base em um levantamento por amostragem aleatória simples
de 1.875 processos judiciais, aplicando-se o método da máxima verossimilhança a partir
da distribuição de Bernoulli.
Sabendo que P(z < 2) = 0,975, em que z representa a distribuição normal padrão, julgue o
item que segue, em relação a essa situação hipotética.
Se x seguir uma distribuição binomial com parâmetros n = 1.000 e probabilidade de sucesso
p, a estimativa de máxima verossimilhança da média de x será superior a 300.

O valor esperado de uma distribuição binomial é dado por:

Errado.

112. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE) Determinado órgão governamental


estimou que a probabilidade p de um ex-condenado voltar a ser condenado por algum
crime no prazo de 5 anos, contados a partir da data da libertação, seja igual a 0,25. Essa
estimativa foi obtida com base em um levantamento por amostragem aleatória simples
de 1.875 processos judiciais, aplicando-se o método da máxima verossimilhança a partir
da distribuição de Bernoulli.
Sabendo que P(z < 2) = 0,975, em que Z representa a distribuição normal padrão, julgue o
item que segue, em relação a essa situação hipotética.
Em um grupo formado aleatoriamente por 4 ex-condenados libertos no mesmo dia, estima-
se que a probabilidade de que apenas um deles volte a ser condenado por algum crime no
prazo de 5 anos, contados a partir do dia em que eles foram libertados, seja superior a 0,4.

Vamos utilizar a expressão da distribuição binomial.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 250 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Estamos falando de 4 ex-condenados (n = 4) e queremos que somente um deles volte a ser


condenado (k = 1). O enunciado forneceu a probabilidade (p = 0,25). Então, usando tudo
na expressão da distribuição binomial, temos:

Certo.

113. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) O valor diário (em R$


mil) apreendido de contrabando em determinada região do país é uma variável aleatória W
que segue distribuição normal com média igual a R$ 10 mil e desvio padrão igual a R$ 4 mil.
Nessa situação hipotética,
P(W > R$ 10 mil) = 0,5

Para uma distribuição normal, a média é igual à mediana. Isto é, a probabilidade de .

Podemos entender o exercício pensando na padronização da distribuição normal, dada por:

Para W = R$ 10 mil, substituindo em (I):

No gráfico, isso significa:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 251 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A metade do gráfico de uma função normal padrão corresponde a uma probabilidade de


50%.
Certo.

114. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/2021/ESTATÍSTICO) Um conjunto de dados


possui distribuição normal com média 100 e desvio padrão 10. A área correspondente ao
intervalo de 70 a 130 é igual a:
a) 68,26%
b) 99%
c) 95,44%
d) 99,73%
e) 99,994%

Vamos proceder à normalização do intervalo x1 = 70 a x2 = 130:

Desse modo, podemos converter o intervalo para a variável aleatória normalizada:

Por fim, basta utilizar uma tabela de distribuição normal para obter a probabilidade acima.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 252 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Como P (Z < 3) = 0,9987, temos, pela simetria da normal:

Letra d.

115. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/2021/ESTATÍSTICO) Em um teste de QI


com distribuição normal, em que a média é 100 e o desvio padrão é 10, gostaríamos de
separar os alunos com 2,28% do percentual mais elevado no teste. Qual deve ser a nota de
corte para separar os que alunos que têm 2,28% com notas mais elevadas?
a) 110
b) 115

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 253 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

c) 120
d) 130
e) 140

Queremos obter uma estatística tal que:

Ao fazer isso, estamos impondo que somente 2,28% dos alunos tenham um QI superior ao
correspondente à estatística alfa. Usando a simetria da normal, temos:

Olhando na tabela da distribuição normal, temos:

Assim, . Usando a normalização, temos:

Letra c.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 254 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

116. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) O valor diário (em R$


mil) apreendido de contrabando em determinada região do país é uma variável aleatória W
que segue distribuição normal com média igual a R$ 10 mil e desvio padrão igual a R$ 4 mil.
Nessa situação hipotética, se W1 e W2 forem duas cópias independentes e identicamente
distribuídas como W, então a soma W1 + W2 seguirá distribuição normal com média igual a
R$ 20 mil e desvio padrão igual a R$ 8 mil.

A média ou valor esperado da soma de duas variáveis aleatórias pode ser obtida como a
soma das médias.

Da mesma forma, a variância da soma das duas variáveis pode ser obtida como a soma
das variâncias.

Então, o desvio padrão da soma é:

Errado.

117. (CEBRASPE/POLÍCIA FEDERAL/2018/PAPILOSCOPISTA) De acordo com uma agência


internacional de combate ao tráfico de drogas, o volume diário de cocaína líquida (x, em
litros) apreendida por seus agentes segue uma distribuição normal com média igual a 50
L e desvio padrão igual a 10 L.
A partir dessas informações e considerando que Z representa uma distribuição normal
padrão, em que P(Z ≤ -2) = 0,025, julgue os itens subsecutivos.
P(x < 60 litros) = P(x ≥ 40 litros)

Vamos fazer a normalização.

Para X = 60, temos:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 255 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Para X = 40, temos:

Então, teremos:

Como a distribuição normal é simétrica em relação à origem, podemos dizer que:

Vale notar que, como a probabilidade de um ponto qualquer na distribuição normal é nula,
o fato de termos uma igualdade não afeta em nada a probabilidade. Então, podemos dizer
que:

Com isso, podemos concluir que realmente a afirmação do enunciado está correta.
Certo.

118. (CEBRASPE/POLÍCIA FEDERAL/2018/PAPILOSCOPISTA) De acordo com uma agência


internacional de combate ao tráfico de drogas, o volume diário de cocaína líquida (x, em
litros) apreendida por seus agentes segue uma distribuição normal com média igual a 50
L e desvio padrão igual a 10 L.
A partir dessas informações e considerando que Z representa uma distribuição normal
padrão, em que P(Z ≤ -2) = 0,025, julgue os itens subsecutivos.
P(x > 70 litros) = 0,05

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 256 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Vamos fazer a normalização, usando a expressão:

Para X = 70, temos:

Então, pela normalização, temos:

Como a distribuição normal é simétrica em relação à origem, temos:

Como esse valor P(Z < –2) foi fornecido pelo enunciado, temos:

Errado.

119. (CEBRASPE/SERPRO/2023/ANALISTA) Considerando que uma variável aleatória siga uma


distribuição binomial com média igual a 80 e desvio padrão igual a 4, julgue os itens a seguir.
P ( X ≥ 115) = 0

Podemos calcular os parâmetros “n” e “p” dessa distribuição binomial.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 257 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Podemos elevar o desvio-padrão ao quadrado. Aí teremos:

Sabemos que o produto np = 80.

Então, podemos obter o valor de “n”:

Como temos n = 100, a probabilidade de se ter 115 ou mais sucessos é realmente igual a zero.
Certo.

120. (CEBRASPE/SERPRO/2023/ANALISTA) Considerando que uma variável aleatória siga uma


distribuição binomial com média igual a 80 e desvio padrão igual a 4, julgue os itens a seguir.
P ( X = 0) = 0,20

Podemos utilizar a expressão da distribuição de probabilidades binomial.

Fazendo k = 0, teremos:

A potência (0,80)100 é muito menor que 0,20. Podemos calcular as primeiras potências de
0,80 para checar.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 258 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Veja que (0,80)8 já é menor que 0,20.


Errado.

121. (CEBRASPE/PETROBRÁS/2021) Considerando que a variável aleatória X segue uma


distribuição binomial com parâmetros n = 10 e p = 0,1, julgue os itens subsequentes.
P(x>0) = 0,9.

A variável binomial só pode assumir dois valores: 0 ou 1. Então P(x > 0) é equivalente a P(x
= 1). E essa probabilidade é exatamente igual ao valor p definido como parâmetro.
Certo.

122. (CEBRASPE/PETROBRÁS/2021) Considerando que a variável aleatória X segue uma


distribuição binomial com parâmetros n = 10 e p = 0,1, julgue os itens subsequentes.
O valor esperado de é igual a 1.

O valor esperado de uma variável binomial é:

Certo.

123. (FGV/SEFAZ-BA/2022/AGENTE DE TRIBUTOS ESTADUAIS) Planeja-se selecionar quatro


pessoas, com reposição, de uma pequena população composta por vinte pessoas, das quais
dez foram acometidas por certa doença.
Se X é a variável aleatória que contará o número de pessoas, dentre as quatro, que foram
acometidas pela referida doença, então a probabilidade de X ser igual a 2 é igual a
a) 0,375
b) 0,425
c) 0,475
b) 0,5
e) 0,525

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 259 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Como a amostra é retirada com reposição, a probabilidade de que a pessoa selecionada


para a amostra esteja doente não se altera. Portanto, a distribuição binomial se aplica a
esse caso. Assim, temos:

A probabilidade característica pode ser calculada pela definição clássica como o número
de doentes dividido pelo número total de habitantes:

Então, podemos calcular:

O número binomial é:

Então, a probabilidade desejada é:

Letra a.

124. (FGV/SEFAZ-BA/2022/AGENTE DE TRIBUTOS ESTADUAIS) Acerca da distribuição de


probabilidades de uma variável aleatória X normalmente distribuída com média μ e variância
σ2, avalie as afirmativas a seguir.
I – A variável Z = (x – μ)/σ tem distribuição normal padrão.
II – Se M é a mediana de X, então M > μ.
III – P[X > μ] = 0,5.
Está correto o que se afirma em
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.

Vamos analisar as afirmações.


O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 260 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

I – Certo. A normalização consiste exatamente nesse processo: subtrai a média e divide


pelo desvio-padrão.
II – Errado. A distribuição normal é perfeitamente simétrica em torno da média. Então, a
média é sempre igual à mediana.
III – Certo. Como a normal é perfeitamente simétrica, a probabilidade de X ser maior que a
média é igual a 50%, assim como a probabilidade de X ser inferior à média também é igual
a 50%.
Portanto, as afirmações I e III estão corretas.
Letra c.

125. (CESPE/TCE-PA/2016/AUDITOR DE CONTROLE EXTERNO) Considere um processo de


amostragem de uma população finita cuja variável de interesse seja binária e assuma valor
0 ou 1, sendo a proporção de indivíduos com valor 1 igual a p = 0,3. Considere, ainda, que
a probabilidade de cada indivíduo ser sorteado seja a mesma para todos os indivíduos
da amostragem e que, após cada sorteio, haja reposição do indivíduo selecionado na
amostragem.
A partir dessas informações, julgue o item subsequente.
Caso, em uma amostra de tamanho n = 10, os valores observados sejam A = {1, 0, 1, 0, 1, 0,
0, 1, 0, 0}, a estimativa via estimador de máxima verossimilhança para a média populacional
será igual a 0,4.

A estimativa de máxima verossimilhança toma a amostra obtida como representativa da


população original. Portanto, a média populacional pode ser obtida como a média amostral.

Certo.

126. (FGV/SEFAZ-RJ/2010/AGENTE FISCAL DE RENDAS) 40% dos eleitores de uma certa


população votaram, na última eleição, num certo candidato A. Se cinco eleitores forem
escolhidos ao acaso, com reposição, a probabilidade de que três tenham votado no candidato
A é igual a:
a) 12,48%
b) 17,58%
c) 23,04%
d) 25,78%
e) 28,64%

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 261 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Questão direta sobre a distribuição binomial. Como a amostra foi escolhida com reposição,
o(a) candidato(a) poderia aplicar diretamente a distribuição binomial:

Letra c.

127. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/2021/ESTATÍSTICO) Em um teste de QI


com distribuição normal, em que a média é 100 e o desvio padrão é 10, gostaríamos de
separar os alunos com 2,28% do percentual mais elevado no teste. Qual deve ser a nota de
corte para separar os que alunos que têm 2,28% com notas mais elevadas?
a) 110
b) 115
c) 120
d) 130
e) 140

Queremos obter uma estatística tal que:

Ao fazer isso, estamos impondo que somente 2,28% dos alunos tenham um QI superior ao
correspondente à estatística alfa. Usando a simetria da normal, temos:

Olhando na tabela da distribuição normal, temos:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 262 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Assim, . Usando a normalização, temos:

Letra c.

128. (CESPE/POLÍCIA FEDERAL/2018/AGENTE) De acordo com uma agência internacional de


combate ao tráfico de drogas, o volume diário de cocaína líquida (x, em litros) apreendida
por seus agentes segue uma distribuição normal com média igual a 50 L e desvio padrão
igual a 10 L.
A partir dessas informações e considerando que Z representa uma distribuição normal
padrão, em que P(Z ≤ -2) = 0,025, julgue os itens subsecutivos.
O valor mais provável para a realização da variável X é 50 litros, de modo que P(x = 50 litros)
> P(x = 30 litros).

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 263 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A distribuição normal é uma distribuição contínua de probabilidades. Isso significa que a


probabilidade de um ponto qualquer é sempre igual a zero.
Assim, podemos concluir que:
P(x = 50 litros) = P(x = 30 litros) = 0
Errado.

129. (CESPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) O valor diário (em R$


mil) apreendido de contrabando em determinada região do país é uma variável aleatória
W que segue distribuição normal com média igual a R$ 10 mil e desvio padrão igual a R$ 4
mil. Nessa situação hipotética,
A razão w-20/√4 segue distribuição normal padrão.

Para encontrarmos a expressão que segue a distribuição normal padrão, temos:

Do enunciado temos os parâmetros:

Substituindo os valores acima em (I):

Errado.

130. (FCC/DPE-SP/2015/ESTATÍSTICO/ADAPTADA) Suponha que o número mensal de


prisões em flagrante, comunicadas a uma Defensoria Pública de uma determinada região,
tenha distribuição de Poisson com média 9. Nessas condições, a probabilidade de serem
comunicadas, à Defensoria, pelo menos 3 prisões em flagrante em um período de 10 dias
é igual a:
Dados: e–2 = 0,14; e–3 = 0,05
a) 0,575

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 264 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

b) 0,425
c) 0,525
d) 0.475
e) 0,555

A média da distribuição de Poisson é dada pelo próprio parâmetro . Foi fornecida a média
mensal (30 dias), que é . Para o período de 10 dias, a média seria proporcional:

Dessa forma, a média da Poisson é igual a 3.


Queremos calcular a probabilidade de pelo menos 4 prisões em flagrante. Para isso, é mais
fácil calcular a probabilidade complementar: ou seja, de haver 3 ou menos prisões em
flagrante.

Dessa forma, basta calcular P(x = 0), P(x = 1) e P(x = 2):

Assim, temos:

Por fim, temos:

Letra a.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 265 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

131. (FCC/SEFAZ-PI/2015/ANALISTA DO TESOURO ESTADUAL) O número de falhas mensais


de um computador é uma variável que tem distribuição de Poisson com média λ. Sabe-se
que λ é igual à média de uma distribuição uniforme no intervalo [2, 4]. Nessas condições,
a probabilidade de o computador apresentar exatamente duas falhas no período de 15
dias é igual a:
Dados: e–3 = 0,05; e–1,5 = 0,22.
a) 22,50%
b) 12,50%
c) 24,15%
d) 15,25%
e) 24,75%

O número de falhas mensais terá a média exatamente igual ao ponto médio do intervalo
fornecido:

Porém, não nos interessam as falhas mensais. Estamos interessados apenas nas falhas no
período de 15 dias. Se a média de falhas em 30 dias é de 3 falhas, então, a média de falhas
em metade do período será também a metade, portanto 1,5 falhas.

Agora, podemos calcular a probabilidade de ocorrência de exatamente duas falhas:

Letra e.

INTERVALOS DE CONFIANÇA

132. (FGV/RFB/2023/ANALISTA TRIBUTÁRIO) Uma amostra aleatória de tamanho n = 64


de uma variável aleatória suposta normalmente distribuída com média desconhecida µ e
variância 100 foi observada e revelou uma média amostra igual a 44,65.
Lembrando que se Z tem distribuição normal padrão,
P(-1,96 < Z < 1,96) = 0,95

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 266 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O intervalo de 95% de confiança será µ será dado por:


a) (42,2; 47,1)
b) (41,2; 48,1)
c) (40,2; 49,1)
d) (39,2; 50,1)
e) (38,2; 51,1)

Primeiramente, podemos calcular o desvio-padrão como a raiz quadrada da variância.

Vamos calcular a largura do intervalo de confiança.

Portanto,

Letra a.

133. (FADESP/UEPA/2020/TÉCNICO DE NÍVEL SUPERIOR/ESTATÍSTICA) Considere as seguintes


afirmações:
I. as distribuições de Bernoulli e Binomial apresentam as mesmas características e, portanto,
os mesmos parâmetros;
II. repetições independentes de um ensaio de Bernoulli, com a mesma probabilidade de
ocorrência de “sucesso”, dão origem ao modelo Binomial;
III. o Teorema do Limite Central garante que, para n suficientemente grande, a distribuição
de Bernoulli pode ser aproximada pela distribuição de Poisson.
Pode-se afirmar que
a) somente II está correta.
b) I e II estão corretas.
c) II e III estão corretas.
d) somente III está correta.

Vamos analisar as afirmações separadamente.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 267 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

I – Errado. A diferença entre as distribuições de Bernoulli e binomial está no fato de que a


binomial possui o parâmetro “n”, ou seja, o número de vezes que o experimento é repetido.
A distribuição de Bernoulli considera apenas um evento com sucesso ou falha.
II – Certo. Foi citado acima que uma distribuição binomial é uma Bernoulli realizada repetidas
vezes.
III – Errado. O Teorema do Limite Central garante que, para n suficientemente grande, a
distribuição amostral de sua média pode ser aproximada para uma distribuição normal
populacional. A afirmação (III) está errada.
Letra a.

Suponha que y1, y2, …, y16 represente uma amostra aleatória simples retirada de uma
população normal, com média igual a 10 e desvio padrão igual a 32. Com respeito à média
amostral = (y1 + y2 + … + y16)/16, julgue os próximos itens.

134. (CEBRASPE/SERPRO/2023/ANALISTA) O desvio padrão de é igual a 32.

Pelo teorema do limite central, temos:

Errado.

135. (CEBRASPE/SERPRO/2023/ANALISTA) O valor esperado da média amostral é igual ao


valor da mediana populacional.

Pelo teorema do limite central, o estimador média é não viesado. Isso significa que o estimador
citado realmente converge para o valor real da média populacional, e não da mediana.
Errado.

136. (CEBRASPE/SERPRO/2023/ANALISTA) A variável aleatória ⋅ 16 segue uma distribuição


binomial com parâmetro n = 16.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 268 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Na realidade, pelo teorema do limite central, a variável segue uma distribuição normal.

Portanto, a variável também segue distribuição normal.


Errado.

137. (FGV/SEFAZ-BA/2022/AGENTE DE TRIBUTOS ESTADUAIS) Uma amostra aleatória simples


x1, x2, x3, x4, de tamanho 4, será obtida de uma distribuição de probabilidades populacional
com média μ e variância σ².
Considere que o seguinte estimador de μ será usado
𝑋̅ = (x1 + x2 + x3 + x4)/4
A média e a variância de 𝑋̅ valem, respectivamente,
a) μ e σ²/2.
b) μ/2 e σ²/4.
c) μ/4 e σ²/4.
d) μ e σ²/4.
e) 2μ e σ².

Pelo Teorema do Limite Central, o estimador média aritmética é não viesado, isto é, tem
média igual à própria média da variável. Já sua variância é igual à variância da variável
dividida pelo tamanho da amostra. Então, podemos escrever:

Letra d.

138. (FGV/SEFAZ-BA/2022/AGENTE DE TRIBUTOS ESTADUAIS) Suponha que uma variável


aleatória populacional X pode ser suposta normalmente distribuída com média μ desconhecida
e variância σ2 conhecida.
Se uma amostra aleatória de tamanho n for obtida, e se 𝑥̅é o valor observado da média
amostral, então um intervalo de 95% de confiança para μ será dado por
a)

b)

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 269 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

c)
d)
e)

A questão cobrou diretamente a definição de intervalo de confiança. Ele é centrado na


média e acrescido do fator:

Observe que o fator não foi fornecido. Porém,em todas as alternativas, consta o valor
1,96; então, vamos considerar que .
A questão consiste apenas em observar qual dos itens tem a fórmula correta, isto é, usando

, e essa fórmula pode ser encontrada no item E.


Letra e.

139. (CEBRASPE/PF/2018/ESCRIVÃO) O tempo gasto (em dias) na preparação para determinada


operação policial é uma variável aleatória X que segue distribuição normal com média M,
desconhecida, e desvio padrão igual a 3 dias. A observação de uma amostra aleatória de 100
outras operações policiais semelhantes a essa produziu uma média amostral igual a 10 dias.
Com referência a essas informações, julgue o item que segue, sabendo que P(Z > 2) = 0,025,
em que Z denota uma variável aleatória normal padrão.
O erro padrão da média amostral foi inferior a 0,5 dias.

Pelo teorema do limite central, o erro padrão da estimativa da média amostral é dado por:

Certo.

140. (CEBRASPE/PF/2018/ESCRIVÃO) A expressão 10 dias ± 6 dias corresponde a um intervalo


de 95% de confiança para a média populacional M.

O intervalo de confiança é centrado na média, que é igual a 10 dias.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 270 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Vamos calcular o segundo termo do intervalo de confiança:

Portanto, o intervalo de confiança com grau de 95% seria:

Errado.

141. (VUNESP/EBSERH/2020/ANALISTA ADMINISTRATIVO) Numa pesquisa são entrevistadas


400 pessoas e 80 delas se dizem contrárias a uma determinada proposta do governo. A
“margem de erro” dessa pesquisa (entendida como a metade da amplitude do intervalo de
confiança de 95%) é, em pontos percentuais, aproximadamente:
(Considere que, se z é uma variável aleatória com distribuição normal padrão, P(z < 1,96) =
0,975 e P(z < 1,645) = 0,95, sendo P(A) a probabilidade do evento A).
a) 0
b) 1
c) 2
d) 3
e) 4

Pelo enunciado é possível perceber que a questão trata de intervalo de confiança para
proporção, pois há apenas duas opções: concordar ou discordar da proposta governamental.
Nesses casos usamos Bernoulli.
A estimativa de proporção daqueles que se dizem contrários à proposta é:

Para esses casos, o cálculo da variância é dado abaixo:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 271 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O desvio padrão é dado pela raiz quadrada da variância, então:

Devemos nos lembrar de que, para intervalos de confiança de 95%, há 2,5% à direita da
curva normal e 2,5% à esquerda. Assim, .
Por fim, o erro. Temos a fórmula:

Se n, do enunciado, vale 400, temos, substituindo os valores calculados em (I):

Letra e.

142. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) Uma amostra de


tamanho 36 foi extraída, com reposição, de uma população normalmente distribuída com
variância populacional igual a 2,25. Com base nesta amostra, foi construído um intervalo de
confiança, com nível de confiança (1 - α), igual a [19,51; 20,49] para a média µ da população.
Uma outra amostra aleatória de tamanho 100, independente da primeira, foi extraída da
população, com reposição, apresentando uma média amostral igual a 21. Na construção
de um intervalo de confiança para a média µ, com um nível de confiança igual a (1 - α)
com base na amostra com 100 elementos encontra-se que o limite superior do intervalo
apresenta um valor igual a:
a) 21,294
b) 21,706
c) 21,490
d) 22,392
e) 21,510

Vamos calcular a média do primeiro intervalo de confiança:

Então, o desvio do primeiro intervalo de confiança foi:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 272 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

No segundo intervalo de confiança, devemos nos lembrar que a largura é inversamente


proporcional à raiz quadrada do tamanho da amostra.

Como a média amostral no segundo experimento foi de 21, o extremo desse novo intervalo
será:

Letra a.

143. (CEBRASPE/PF/2018/AGENTE) Determinado órgão governamental estimou que a


probabilidade p de um ex-condenado voltar a ser condenado por algum crime no prazo de 5
anos, contados a partir da data da libertação, seja igual a 0,25. Essa estimativa foi obtida com
base em um levantamento por amostragem aleatória simples de 1.875 processos judiciais,
aplicando-se o método da máxima verossimilhança a partir da distribuição de Bernoulli.
Sabendo que P(Z < 2) = 0,975, em que Z representa a distribuição normal padrão, julgue o
item que segue, em relação a essa situação hipotética.
O erro padrão da estimativa da probabilidade p foi igual a 0,01.

O desvio padrão de uma variável de Bernoulli é:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 273 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Pela expressão do intervalo de confiança, o erro padrão pode ser calculado como o desvio
padrão dividido pela raiz da quantidade de termos da amostra:

Podemos simplificar os radicais por 3:

Certo.

144. (CEBRASPE/PF/2018/ESCRIVÃO) Uma pesquisa realizada com passageiros estrangeiros


que se encontravam em determinado aeroporto durante um grande evento esportivo no
país teve como finalidade investigar a sensação de segurança nos voos internacionais.
Foram entrevistados 1.000 passageiros, alocando-se a amostra de acordo com o continente
de origem de cada um – África, América do Norte (AN), América do Sul (AS), Ásia/Oceania
(A/O) ou Europa. Na tabela seguinte, N é o tamanho populacional de passageiros em voos
internacionais no período de interesse da pesquisa; n é o tamanho da amostra por origem;
P é o percentual dos passageiros entrevistados que se manifestaram satisfeitos no que se
refere à sensação de segurança.

Em cada grupo de origem, os passageiros entrevistados foram selecionados por amostragem


aleatória simples. A última linha da tabela mostra o total populacional no período da
pesquisa, o tamanho total da amostra e Ppop representa o percentual populacional de
passageiros satisfeitos.
A partir dessas informações, julgue o próximo item.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 274 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A estimativa do percentual populacional de passageiros originários da África que se mostraram


satisfeitos com a sensação de segurança nos voos internacionais foi igual a 80% e a estimativa
do erro padrão associado a esse resultado foi inferior a 4%.

A estimativa da probabilidade de que os passageiros originárias da África estejam satisfeitos


com a sensação de segurança nos voos internacionais é dada pela definição clássica de
probabilidade:

Então, o desvio padrão de uma variável de Bernoulli é dada por:

Já o erro padrão pode ser calculado como:

Porém, como a população não é de tamanho infinito, é necessário realizar uma correção
no cálculo do erro padrão:

Observe que o termo de ajuste é sempre maior que 1:

Portanto, o erro padrão é ligeiramente maior que 4%:

Certo.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 275 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

145. (CEBRASPE/PF/2018/ESCRIVÃO) Considerando o referido desenho amostral, estima-


se que o percentual populacional Ppop seja inferior a 79%.

A probabilidade geral pode ser calculada como a média aritmética das probabilidades em
cada amostra ponderada pelos tamanhos de cada uma delas.

Podemos simplificar por 100 todos o termos:

Certo.

Um pesquisador deseja avaliar a significância estatística da diferença entre as médias


amostrais produzida por dois conjuntos de dados, amostras 1 e 2, conforme mostra o quadro
a seguir. Esses conjuntos de dados foram obtidos por amostragem aleatória de populações
normais, sendo que a primeira amostra foi retirada da população N(µ1, σ²), e a segunda foi
extraída da N(µ2, σ²). As duas amostras são independentes e possuem tamanhos distintos:
21 e 31, respectivamente. O quadro também apresenta duas estimativas diferentes para a
variância populacional σ²: 5 (amostra 1) e 10 (amostra 2). Nessas condições, o o pesquisador
deseja testar a hipótese nula H0: µ1 = µ2 contra a hipótese alternativa H1: µ1 ≠ µ2 mediante
aplicação do teste (paramétrico) t de Student para comparação de duas médias.
tamanho da variância
amostra média amostral
amostra amostral
1 21 12 5
2 31 15 10
Considerando a situação hipotética apresentada, julgue os próximos itens.

146. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) A avaliação da


significância estatística da diferença entre as médias amostrais produzidas por esses
dois conjuntos de dados deve ser com base na distribuição t de Student com 50 graus de
liberdade.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 276 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Para realizar o teste de hipóteses para a diferença das médias, devemos tomar a soma dos
graus de liberdade de cada média.

Portanto, deve-se usar a T de Student com 50 graus de liberdade.


Certo.

147. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) Sob a hipótese nula H0:


µ1 = µ2, as amostras são combinadas para se obter uma estimativa comum para a variância
populacional σ², e o valor dessa estimativa combinada é igual a 8.

A estimativa para a variância populacional é calculada pela média aritmética ponderada


pelo tamanho da amostra. Porém, devemos levar em conta que, como estamos falando de
variância amostral, no denominador da expressão da variância, vai o número de elementos
na amostra menos 1. Então, por isso, os pesos serão também o tamanho da amostra menos
1. Então, temos:

Certo.

148. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) O referido teste de


hipóteses é unilateral à esquerda, pois a diferença entre as médias é negativa.

O referido teste é bilateral, porque a hipótese alternativa aceita tanto que esteja à
esquerda ou à direita de .
Errado.

149. (FCC/SEFAZ-PE/2023/AUDITOR-FISCAL DO TESOURO ESTADUAL) A estimativa da


variância da diferença entre as médias amostrais é igual a 5/21 + 10/31.

Pelo teorema do limite central, a variância da média amostral é dada por:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 277 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Então, as variâncias das médias amostrais em x1 e x2 são:

Como x1 e x2 são independentes, a variância da diferença é igual à soma das variâncias.


Então, a afirmação está certa.
Certo.

150. (CEBRASPE/PC-SE/2021) Com base em uma amostra aleatória simples de tamanho


n = 16 retirada de uma população normal com média desconhecida μ e variância σ² = 9,
deseja-se testar a hipótese nula H0: μ = 0 contra a hipótese alternativa H1: μ ≠ 0 por meio
da estatística , na qual denota a média amostral.
Com respeito a esse teste de hipóteses, julgue os itens a seguir, sabendo que o valor da
média amostral observado na amostra foi igual a 1 e que, relativo a esse teste, o P-valor
foi igual a 0,18.

Sob a hipótese nula, a estatística segue uma distribuição t de Student com 15


graus de liberdade.

Como a variância populacional é conhecida, a estatística não segue a distribuição t de


Student, mas sim a distribuição normal. Vamos nos lembrar de que a t de Student só deve
ser utilizada quando: a variância populacional é desconhecida e o número de observações
é inferior a 30.
Errado.

151. (CEBRASPE/PC-SE/2021) O desvio padrão da média amostral é igual a 0,75.

Pelo Teorema do Limite Central, o desvio-padrão da média amostral é:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 278 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Certo.

152. (CESPE/TJ-PA/2020/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Na construção de um intervalo


de confiança para a média, conhecida a variância, considerando o intervalo na forma [x + ε;
x - ε], sendo x o valor do estimador da média e ε a semiamplitude do intervalo de confiança
ou, como é mais popularmente conhecida, a margem de erro do intervalo de confiança.
Considere que, para uma determinada peça automotiva, um lote de 100 peças tenha
apresentado espessura média de 4,561 polegada, com desvio padrão de 1,125 polegada. Um
intervalo de confiança de 95% para a média apresentou limite superior de 4,7815 e limite
inferior de 4,3405. Nessa situação, a margem de erro do intervalo é de, aproximadamente,
a) ε = 0,4410
b) ε = 0,3436
c) ε = 0,2205
d) ε = 0,1125
e) ε = 0,1103

O erro pode ser dado pela metade da amplitude do intervalo de confiança. Assim, temos:

Letra c.

153. (FCC/CNMP/2015/ANALISTA) Uma pesquisa é realizada em uma grande cidade com


uma amostra aleatória de 300 habitantes em que 75% deles manifestaram-se favoráveis
à implantação de um projeto para melhorar o atendimento ao público de sua cidade. Com
base nesta amostra, deseja-se obter um intervalo de confiança de 95% para esta proporção,
considerando que a distribuição amostral da frequência relativa dos habitantes favoráveis
ao projeto é normal. Utilizando a informação da distribuição normal padrão (Z) que as
probabilidades P(Z > 1,96) = 0,025 e P(Z > 1,64) = 0,050, este intervalo de confiança é, em
%, igual a:
a) [71,68; 78,32]
b) [71,34; 78,66]

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 279 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

c) [70,90; 79,10]
d) [70,40; 79,60]
e) [70,10; 79,90]

Como temos uma proporção de habitantes que são favoráveis a determinado projeto,
estamos claramente falando de uma variável aleatória de Bernoulli, cuja média foi fornecida
de 75% e cuja variância podemos calcular pela expressão:

Agora, podemos calcular a expressão do erro padrão:

Por fim, precisamos da estatística de teste e precisamos pensar muito bem no valor a
ser utilizado. Note que foi fornecida a probabilidade unilateral. Graficamente, podemos
representar os dados do enunciado:

Note que esses dados não estão prontos para serem usados na expressão do intervalo de
confiança, pois foram fornecidos os dados unilaterais e nós precisamos dos dados bilaterais.
Mas, para isso, podemos fazer a conversão:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 280 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Dessa maneira, devemos utilizar . Agora, apliquemos na expressão do intervalo


de confiança:

Letra e.

(CESPE/TCDF/2021/ANALISTA DE CONTROLE EXTERNO) Uma amostra aleatória simples,


sem reposição, de tamanho 100, será retirada de uma população constituída por 1.000
indivíduos, com o objetivo de se estimar a média μ das idades desses 1.000 indivíduos. Essa
amostra é representada por um conjunto de variáveis aleatórias x1, …, x100, e o estimador
da média populacional μ é dado pela seguinte expressão.

Tendo como referência essa situação hipotética, e considerando que o desvio padrão
populacional da distribuição das idades seja igual a 2 anos, julgue os itens que se seguem.

154. (CESPE/TC-DF/2021/ANALISTA DE CONTROLE EXTERNO) A variância do estimador


é inferior a 0,04.

Pelo Teorema Central do Limite, se a população fosse infinita, teríamos que a variância do
estimador seria:

Porém, considerando que a população é finita e tem apenas 1.000 elementos, deve-se
fazer o ajuste do desvio padrão. Observe que o desvio padrão deve ficar multiplicado por:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 281 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Portanto, o ajuste para uma população finita torna o desvio padrão ligeiramente maior.
Assim, a variância do estimador vai ser, na realidade, um pouco maior que 0,04. Essa variância
de 0,04 só seria obtida para uma população infinita.
Errado.

TESTES DE HIPÓTESES

155. (CEBRASPE/PC-SE/2021) Com base em uma amostra aleatória simples de tamanho


n = 16 retirada de uma população normal com média desconhecida μ e variância σ² = 9,
deseja-se testar a hipótese nula H0: μ = 0 contra a hipótese alternativa H1: μ ≠ 0 por meio
da estatística , na qual denota a média amostral.
Com respeito a esse teste de hipóteses, julgue os itens a seguir, sabendo que o valor da
média amostral observado na amostra foi igual a 1 e que, relativo a esse teste, o P-valor
foi igual a 0,18.
Se o nível de significância escolhido para o teste foi igual a 10%, então, nesse caso, a hipótese
nula H0: μ = 0 não seria rejeitada, embora a média amostral tenha sido diferente de zero.

Como o P-valor é maior que o nível de significância do teste, isso significa que a amostra
obtida é bastante provável. Logo, a hipótese nula não deve ser rejeitada.
Observe que o nível de significância cria uma zona de rejeição no gráfico da normal. A hipótese
nula é rejeitada quando o P-valor está inteiramente dentro dessa região de rejeição.
Errado.

156. (CEBRASPE/PC-SE/2021) O P-valor é uma medida que representa a potência do


teste em tela.

O P-valor é uma medida da probabilidade: a probabilidade de se produzir uma amostra


com as características obtidas na situação em estudo, considerando que a hipótese nula
seja verdadeira.
Já a potência do teste é a probabilidade do teste como um todo rejeitar a hipótese nula
quando ela for falsa. Observe, portanto, que eles não têm nenhuma relação entre si.
Vale observar que, caso sejam feitos vários testes, serão obtidas várias amostras aleatórias
diferentes, com P-valores diferentes associados a elas.
Porém, a potência do teste é sempre o mesmo, não varia conforme a amostra. Ele é uma
característica dos parâmetros do próprio teste.
Errado.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 282 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Um remédio para baixar a pressão arterial foi testado em pessoas com hipertensão. O
referido medicamento foi comparado a outro medicamento que já estava em uso no
mercado, por meio de amostragens aleatórias simples. Um teste t foi implementado para
verificar se a pressão arterial dos testados baixava mais, em média, com o uso do novo
remédio. Os pesquisadores escolheram um nível de significância de 0,01. Se o remédio
baixasse a pressão arterial em mais que certa quantidade, p, o fabricante mudaria sua
linha de produção para produzir o novo remédio. A potência do teste para detectar uma
redução dessa quantidade, p, foi 0,9.
Com relação a essa situação hipotética, julgue os itens que se seguem.

157. (CESPE/PC-DF/2021/AGENTE) Se fosse aumentado o tamanho da amostra, seria


possível diminuir o nível de significância e aumentar a potência do teste.

O nível de significância é um parâmetro definido pelo pesquisador. Ele corresponde à


probabilidade de rejeitar a hipótese nula quando ela é falsa. Quando o tamanho da amostra
aumenta, a probabilidade de que a média amostral disto e da média populacional se reduz.
Assim, os erros do tipo I e do tipo II se tornam realmente menos prováveis. Como a potência
do teste é o complementar ao erro do tipo II, essa potência aumenta.
Certo.

158. (CESPE/PC-DF/2021/AGENTE) Se o verdadeiro valor da redução média de pressão do


novo remédio fosse igual a p, então existiria uma chance de 90% de o teste ter detectado
essa diferença.

A potência de um teste corresponde à probabilidade de detectar erros, isto é, a probabilidade


de rejeitar a hipótese nula quando ela é falsa.
Perceba que a definição de potência do teste não envolve somente o caso de o desvio for
igual a p. Essa definição envolve, na realidade, que o desvio seja maior ou igual a p. Portanto,
foi usada nesse item uma definição inadequada da potência do teste.
Errado.

159. (CESPE/PC-DF/2021/AGENTE) Se o nível de significância fosse aumentado para 0,05,


a potência do teste diminuiria.

Quando o nível de significância aumenta, o teste se torna mais rigoroso. Portanto, a potência
do teste também aumenta.
Errado.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 283 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

160. (AOCP/EBSERH/2016/ANALISTA ADMINISTRATIVO/Q1269637) Um pesquisador está


realizando um teste unilateral para a média com variância populacional conhecida e obteve
um p-valor igual a 0,065. Referente ao exposto, assinale a alternativa correta.
a) Se o nível de significância for fixado em 0,05, a hipótese H1 deverá ser aceita como
verdadeira.
b) Ele não rejeitará a hipótese nula para níveis de significância maiores que 0,065.
c) A probabilidade de haver uma amostra com tal característica é de 0,01.
d) Ele rejeitará a hipótese nula para níveis de significância menores que 0,065.
e) Ele rejeitará a hipótese nula para níveis de significância maiores que 0,065.

A hipótese nula deve ser rejeitada sempre que o nível de significância for maior que o
p-valor. Nesse caso, portanto, se o nível de significância for maior que 0,065, a hipótese
nula deve ser rejeitada.
Letra e.

161. (FCC/SEFAZ-BA/2019/AUDITOR FISCAL) Para obter um intervalo de confiança de 90%


para a média p de uma população normalmente distribuída, de tamanho infinito e variância
desconhecida, extraiu-se uma amostra aleatória de tamanho 9 dessa população, obtendo-
se uma média amostral igual a 15 e variância igual a 16. Considerou-se a distribuição t de

Student para o teste unicaudal tal que a probabilidade = 0,05, com n graus
de liberdade. Com base nos dados da amostra, esse intervalo é igual a:

a) (12,56; 17,44)
b) (13,76; 16,24)
c) (12,47; 17,53)
d) (12,59; 17,41)
e) (12,52; 17,48)

Coletando as informações enunciadas, temos

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 284 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Como a questão pede um intervalo com 90% de confiança, sendo a confiança complementar

ao nível de significância, , temos

O intervalo de confiança é obtido de acordo com a relação

A amostra fornecida possui 9 elementos, então temos que o grau de liberdade é

Dessa forma, podemos extrair dos dados fornecidos que . Substituindo na


relação do intervalo de confiança:

Letra e.

162. (FGV/DPE-RJ/2019/TÉCNICO SUPERIOR ESPECIALIZADO/ESTATÍSTICA) Acredita-se que


o valor do rendimento médio das pessoas que procuram ajuda na Defensoria Pública do
Rio de Janeiro seja inferior a R$ 2.000. Para tentar gerar uma evidência estatística de que
isso é verdade, foi proposto um teste de hipóteses com base numa amostra de tamanho
n = 64, tendo sido apurado um rendimento médio de R$ 1.952, com desvio-padrão de R$
256. Para a realização do teste será usada a aproximação da T-Student pela distribuição
Normal, para qual sabe-se que:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 285 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

P(Z > 1,28) = 0,10, P(Z > 1,5) = 0,07, P(Z > 1,75) = 0,04 e P(Z > 2) = 0,02
Assim sendo, é correto concluir que:
a) ao nível de significância de 4% rejeita-se a hipótese nula;
b) ao nível de significância de 10% não é possível rejeitar a hipótese nula;
c) o conjunto de hipóteses a ser testado é: H0: μ = 2000 contra Ha; μ ≥ 2.000;
d) o p-valor correspondente ao teste bilateral e a observação obtida a partir da amostra,
= 1.952, é igual a 14%;
e) se o conjunto de hipóteses formulado fosse: H0: μ = 2.000 contra Ha: μ ≠ 2.000, ao nível
de significância de 7% a H0 seria rejeitada.

O primeiro passo ao se deparar com uma questão de teste de hipóteses é identificar as


hipóteses a serem testadas.
A questão nos diz que a hipótese a ser testada é a de que o rendimento médio das pessoas
que procuram ajuda na Defensoria Pública do Rio de Janeiro seja inferior a R$ 2.000, logo,
temos:

Dessa forma, já eliminamos a alternativa C.


Nossa estatística será dada a partir da aproximação da T-Student pela distribuição Normal,
e para isso vamos coletar os dados do enunciado e aplicar a padronização:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 286 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

É importante lembrar que, devido ao o sinal em , se trata de um teste unilateral à


esquerda. Assim, a hipótese nula será rejeitada se .
Agora vamos analisar alternativa por alternativa:
a) ao nível de significância de 4% rejeita-se a hipótese nula:
Para saber se a hipótese nula será rejeitada ou não, precisamos encontrar a região crítica,
que é dada por , sendo o nível de significância:

Como não está na região crítica, a hipótese nula não é rejeitada. Alternativa incorreta.
b) ao nível de significância de 10% não é possível rejeitar a hipótese nula;
Da mesma forma que fizemos no item a, vamos encontrar a região crítica, que é dada por

, sendo o nível de significância:

está na região crítica, logo, a hipótese nula é rejeitada. Alternativa incorreta.


d) o p-valor correspondente ao teste bilateral e a observação obtida a partir da amostra,
= 1.952, é igual a 14%;

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 287 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Como temos nosso , nosso p-valor será a probabilidade de Z assumir um valor menor
que -1,5 multiplicado por 2, já que se trata de um teste bilateral. Assim, ficamos com

Alternativa correta.
e) se o conjunto de hipóteses formulado fosse: H0: μ = 2.000 contra Ha: μ ≠ 2.000, ao nível
de significância de 7% a H0 seria rejeitada.
Para um teste bilateral, o critério de rejeição se altera um pouquinho, passa-se a considerar

E a hipótese nula será rejeitada se

Para que possamos utilizar os dados fornecidos pela questão, vamos aproximar o valor de

, ficando , obtendo então

Logo, a hipótese nula não seria rejeitada. Alternativa incorreta.


Letra d.

163. (FGV/DPE-RJ/2014/TÉCNICO SUPERIOR ESPECIALIZADO/ESTATÍSTICA) Para testar a


renda média dos cidadãos efetivamente atendidos pela Defensoria Pública do Estado foi
realizado um levantamento a partir dos registros já existentes, que geraram uma amostra
aleatória de tamanho n = 100, para a qual foi calculada a média amostral igual a R$ 920,00
por mês. Deseja-se demonstrar, cabalmente, que, em média, os beneficiários ganham mais
do que R$ 1.000 por mês. Além disso, o desvio-padrão populacional é conhecido, sendo
igual a 500. Portanto, se Ø (-2,00) = 2,28% e Ø (-1,50) = 6,68%, onde Ø (,) é a distribuição
acumulada da Normal Padrão. Então, neste caso, a hipótese nula seria:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 288 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

a) rejeitada ao nível de 2,28% e não rejeitada com significância de 6,68%.


b) não rejeitada ao nível de 2,28% e rejeitada com significância de 6,68%.
c) rejeitada tanto com 97,72% quanto com 93,32% de grau de confiança.
d) rejeitada ao nível de significância de 1,14% e 3,34%, bilateral.
e) não rejeitada tanto ao nível de significância 2,28% quanto de 6,68%.

Tomemos a variável normalizada:

Podemos colocar essa estatística de teste em comparação com os dois níveis de significância
fornecidos.

Perceba que, para a estatística de -1,5 que corresponde ao nível de significância de 6,68%,
o Valor-P está inteiramente contido na zona de rejeição, portanto a hipótese nula será
rejeitada.
Por outro lado, para a estatística de -2 que corresponde ao nível de significância de 2,28%,
o Valor-P não está inteiramente contido na zona de rejeição, portanto a hipótese nula não
será rejeitada.
Letra b.

164. (CESPE/STM/2018/ANALISTA JUDICIÁRIO) Diversos processos buscam reparação


financeira por danos morais. A tabela seguinte mostra os valores, em reais, buscados
em 10 processos – numerados de 1 a 10 – de reparação por danos morais, selecionados
aleatoriamente em um tribunal.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 289 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A partir dessas informações e sabendo que os dados seguem uma distribuição normal,
julgue o item subsequente.
Nessa situação, se for possível usar o teste t de Student, então esse teste teria 9 graus de
liberdade.

O grau de liberdade se dá subtraindo 1 do tamanho da amostra:

Como a amostra apresentada possui 10 elementos,

Esse teste teria 9 graus de liberdade.


Certo.

165. (CESPE/TCE-PR/2016/ANALISTA DE CONTROLE ATUARIAL) Por meio de uma pesquisa,


estimou-se que, em uma população, o percentual p de famílias endividadas era de 57%.
Esse resultado foi observado com base em uma amostra aleatória simples de 600 famílias.
Nessa situação, considerando a hipótese nula H0: p ≥ 60%,a hipótese alternativa H1: p < 60%
e P(Z ≤ 2) = 0,977, em que Z representa a distribuição normal padrão, bem como sabendo
que o teste se baseia na aproximação normal, assinale a opção correta a respeito desse
teste de hipóteses.
a) O erro do tipo II representa a probabilidade de se rejeitar a hipótese nula, uma vez que,
na realidade, p = 60%.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 290 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

b) Com nível de significância α = 2,3%, a regra de decisão do teste é rejeitar a hipótese nula
caso o percentual de famílias endividadas na amostra seja inferior a 56%.
c) Trata-se de um teste unilateral à direita.
d) A estatística do teste foi igual ou superior a 1.
e) A hipótese nula deve ser rejeitada caso a probabilidade de ocorrência de erro do tipo I
seja igual ou inferior a 0,01.

O erro do tipo II representa a probabilidade de aceitar a hipótese nula quando ela é falsa.
Portanto, a letra “a” está errada.
O teste é unilateral à esquerda, pois a hipótese alternativa está à esquerda da hipótese nula.

No teste em apreço, tivemos a renda média da família de 57%, portanto podemos calcular
a estatística do teste por:

O desvio-padrão populacional pode ser calculado lembrando-nos de que, como estamos


falando de proporção, podemos calcular pela expressão das variáveis de Bernoulli:

Agora, vamos à estatística de teste. Vamos calcular o denominador antes para facilitar:

Assim, a estatística de teste foi de -1,5, portanto foi negativa, logo inferior a 1. Assim, a
letra “d” está errada.
Por fim, vamos testar a região de rejeição ao nível de significância de 0,023 (2,3%). Como
foi fornecido que P(Z < 2) = 0,977, podemos desenhar as seguintes regiões:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 291 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Como o teste é unilateral à esquerda, estamos de olho em Z = -2.

Sendo assim, a média amostral de 56% é, de fato, o limite para a rejeição da hipótese nula.
Letra b.

REGRESSÃO LINEAR

166. (IBFC/IBGE/2021/SUPERVISOR DE PESQUISAS) Num modelo de regressão linear pelo


método dos mínimos quadrados, sabe-se que a inclinação da reta é a = 3,24 e o intercepto
da reta é b = 12,6, então o valor de para x = 30 é:
a) 126,8
b) 136,8
c) 116,2
d) 108,2
e) 109,8

Em uma reta de regressão linear, o coeficiente de inclinação é o que acompanha a variável


independente x, enquanto o intercepto é o termo independente. Assim, temos a reta:

Letra e.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 292 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

167. (FGV/RFB/2023/ANALISTA TRIBUTÁRIO) Uma reta de regressão linear simples foi obtida
a partir do modelo Y = αX + β + e pelo método de mínimos quadrados usual e mostrou as
seguintes estimativas dos coeficientes: a = 3,4 e b = 0,5; além disso, obteve-se um coeficiente
de correlação amostral igual a 0,9.
Com base nesses dados, avalie se as afirmativas a seguir estão corretas.
I – A porcentagem da variação total dos dados que é explicada pela regressão é menor do
que 60%.
II – A reta de regressão obtida ajusta bem o modelo.
III – O intercepto a = 3,4 mostra que a valor grandes de x correspondem valores grandes de y.
Está correto o que se afirma em:
a) I, apenas.
b) II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I e II, apenas.

I – Errado. O coeficiente de determinação do modelo é igual ao quadrado da correlação.

Portanto, é maior que 60%.


II – Certo. A reta se ajusta bem, porque tem um ajuste de 81%.
III – Errado. O coeficiente a = 3,4 é o coeficiente de inclinação.
Letra b.

168. (VUNESP/EBSERH/2020/ANALISTA ADMINISTRATIVO/ESTATÍSTICO) A variável x tem média


4 e desvio padrão 2, enquanto a variável y tem média 3 e desvio padrão 1. A covariância
entre x e y é -1.
A equação estimada da regressão linear simples de y por x é:
a) y = 2 - 0,25x
b) y = 3 - 0,5x
c) y = 3 - x
d) y = 4 - x
e) y = 4 - 0,25x

Pela estimativa dos mínimos quadrados, podemos obter o coeficiente de inclinação do


modelo como a razão entre a covariância e a variância da regressora.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 293 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Substituindo na expressão geral do modelo de regressão linear, temos:

Substituindo os dados do enunciado e o valor calculado para o coeficiente b, temos:

Portanto, a estimativa do coeficiente Y a partir de X é:

Letra e.

169. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Em uma análise


de regressão, se o coeficiente de determinação r² = 1, então:
(Considere SQT = Soma de quadrados total; SQE = Soma de quadrados do erro; SQR = Soma
de quadrados da regressão.)
a) SQE = SQT
b) SQE = 1
c) SQR = SQE
d) SQR = SQT
e) SQR > SQT

O coeficiente de determinação corresponde à razão entre a soma dos quadrados da regressão


(SQR) e a soma dos quadrados total (SQT). Assim, temos:

Letra d.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 294 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Com base nas informações apresentadas na tabela precedente e considerando que a


covariância entre as variáveis X e Y seja igual a 3, julgue os itens que se seguem.

170. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I) A reta de regressão linear da variável


Y em função da variável X, obtida pelo método de mínimos quadrados ordinários, pode ser
escrita como 𝑌� = 0,75𝑋 + 6,25.

Seja uma reta de regressão definida por:

O coeficiente de inclinação da reta pode ser obtido pela covariância dividida pela variância
da regressora:

Podemos obter o coeficiente de intercepto pela

Portanto, a reta é:

Certo.

171. (CEBRASPE/BANESE/2021/TÉCNICO BANCÁRIO/I) O coeficiente de determinação (ou


de explicação) da reta de regressão linear da variável X em função da variável Y é igual ou
superior a 0,60.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 295 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Primeiramente, vamos calcular a correlação entre as duas variáveis, que é definida como
a covariância dividida pelo produto dos desvios padrão.

Já o coeficiente de determinação é igual ao quadrado do coeficiente de correlação.

Portanto, é inferior a 60%.


Errado.

172. (CEBRASPE/SEFAZ-RR/2021/CONSULTOR) A tabela a seguir apresenta uma amostra


aleatória simples formada por 5 pares de valores (𝑋𝑖, 𝑌𝑖), em que 𝑖 = 1,2, …,5, 𝑋𝑖 é uma
variável explicativa e 𝑌𝑖 é uma variável dependente.

Considere o modelo de regressão linear simples na forma 𝑌𝑖 = 𝑏𝑋𝑖 + 𝜖𝑖, no qual 𝜖 representa
um erro aleatório normal com média zero e variância 𝜎2 e 𝑏 é o coeficiente do modelo. Com
base nos dados da tabela e nas informações apresentadas, é correto afirmar que o valor
da estimativa de mínimos quadrados ordinários do coeficiente b é igual a
a) 0,75
b) 0,9
c) 1,2
d) 1,35
e) 1,45

Em um modelo sem o intercepto, precisamos recorrer à seguinte expressão:

Vamos, então, calcular as médias do produto XY e do termo X²:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 296 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Desse modo, o coeficiente b é dado por:

Letra c.

173. (IBFC/IBGE/2021/SUPERVISOR DE PESQUISAS) Dentre os gráficos abaixo, o que melhor


representa um coeficiente de correlação linear próximo de -0,23 é:

a)

b)

c)

d)

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 297 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

e)

Como a correlação é negativa, a tendência geral é de que Y decresça com X. Por isso, as
letras “a” e “b” estão incorretas.
Além disso, como a correlação tem valor absoluto pequeno, muito distante de 1, devemos
ter bastante flutuação em torno da reta de tendência. Vamos comparar o que acontece
nas demais alternativas.
Vale notar que o coeficiente de determinação do modelo é (-0,23)² = 0,0529 = 5,29%.
Portanto, haverá muita flutuação em torno da linha de tendência.

Perceba, então, que a letra “e” se aproxima de uma elevada correlação negativa, que seria
uma correlação próxima de -1. A letra “d” ainda tem um ajuste muito próximo, o que indica
uma forte correlação.
A letra “c”, portanto, é a que mais se adéqua à correlação -0,23, porque mostra uma tendência
geral de decrescimento do item C, mas com baixíssimo coeficiente de determinação.
Letra c.

174. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Considerando o


relacionamento entre a variável independente X e a variável dependente Y, mostrado na
figura abaixo, assinale a alternativa correta.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 298 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

a) O relacionamento entre X e Y é positivo, e o coeficiente de correlação é igual a 73,2%.


b) O relacionamento entre X e Y é fraco e não deve ser considerado.
c) Não existe relação linear entre as variáveis analisadas.
d) O relacionamento entre X e Y é negativo, e a variável X explica 73,2% da variação da
variável Y.
e) O relacionamento entre X e Y é positivo, e a variável X explica 73,2% da variação da
variável Y.

Como a variável Y decresce com o aumento da variável X, elas estão negativamente


correlacionadas.
Além disso, foi fornecido o R², o coeficiente de determinação do modelo. Podemos dizer,
então, que a variação da variável X explica 73,2% das variações da variável Y.
Não podemos dizer que o coeficiente de correlação é igual a –73,2%, porque o coeficiente
de correlação é igual à raiz quadrada do coeficiente de determinação, que seria:

Letra d.

175. (CESPE/2019/CGE-CE/CONHECIMENTOS BÁSICOS) Considerando-se que, em uma


regressão múltipla de dados estatísticos, a soma dos quadrados da regressão seja igual
a 60.000 e a soma dos quadrados dos erros seja igual a 15.000, é correto afirmar que o
coeficiente de determinação – R² – é igual a:
a) 0,75

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 299 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

b) 0,25
c) 0,50
d) 0,20
e) 0,80

O coeficiente de determinação é dado por:

Podemos, agora, calcular o SQTot nos lembrando de que:

Voltando para a fórmula do coeficiente, temos:

Letra e.

176. (CEBRASPE/POLÍCIA FEDERAL/2021) Um estudo objetivou avaliar a evolução do número


mensal Y de milhares de ocorrências de certo tipo de crime em determinado ano. Com
base no método dos mínimos quadrados ordinários, esse estudo apresentou um modelo
de regressão linear simples da forma.
Ŷ = 5 - 0,1 x T
Em que Ŷ representa a reta ajustada em função da variável regressora T, tal que 1 ≤ T ≤ 12.
Os erros padrão das estimativas dos coeficientes desse modelo, as razões t e seus respectivos
p-valores encontram-se na tabela a seguir.

Os desvios padrão amostrais das variáveis Y e T foram, respectivamente, 1 e 3,6.


Com base nessas informações, julgue o item a seguir.
Se a média amostral da variável T for igual a 6,5, então a média amostral da variável Y será
igual a 4,35 mil ocorrências.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 300 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Podemos utilizar a propriedade de que o valor esperado é linear. Então, o valor esperado da
soma é igual à soma de valores esperados e o produto por uma constante; o valor esperado
também fica multiplicado por essa mesma constante.

Certo.

177. (CEBRASPE/POLÍCIA FEDERAL/2021) A correlação linear entre as variáveis Y e T foi


igual a -0,1.

Foi fornecido o coeficiente de inclinação do modelo de regressão, que é dado pela razão
entre a covariância e o desvio-padrão da variável regressora (T). Então, podemos calcular
a covariância:

Em seguida, podemos calcular a correlação entre as duas variáveis pela definição de


covariância dividida pelos desvios-padrões:

Errado.

178. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Em um gráfico de


resíduos em uma análise de regressão, são exibidos:
a) Resíduos da variável explicativa versus resíduos da variável de resposta.
b) Resíduos da variável explicativa versus a variável de resposta.
c) A variável explicativa versus a variável de resposta.
d) A variável explicativa sobre o eixo x, contra a variável resposta sobre o eixo y
e) A variável explicativa versus resíduos da variável resposta.

O gráfico de resíduos tem por objetivo estudar os resíduos da variável resposta em função
da variável explicativa, que correspondem à diferença entre o valor correto e a estimativa
da variável resposta.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 301 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Letra e.

179. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Complete a tabela


de graus de liberdade para a realização do teste de ANOVA, a tabela deve ser preenchida
de acordo os dados da tabela de dados abaixo, para comparar o desempenho de médias
entre variáveis x1, x2 e x3:

Tabela de graus de liberdade da ANOVA:

Os graus de liberdade, respectivamente para o fator (I), para o erro (II) e para o total (III) são:
a) 2,18 e 20
b) 3,18 e 21
c) 2,20 e 22
d) 3,20 e 23
e) 2,19 e 21

Observe que foram colocados um total de 21 dados (N = 21) na tabela e que foram registrados
3 parâmetros (p = 3). Assim, podemos obter:
• Total: N - 1 = 21 - 1 = 20
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 302 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

• Fator: p - 1 = 3 - 1 = 2
• Erro: N - p = 21 - 3 = 18
Letra a.

180. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) Um pesquisador


estudou a relação entre a taxa de criminalidade (Y) e a taxa de desocupação da população
economicamente ativa (x) em determinada região do país. Esse pesquisador aplicou um
modelo de regressão linear simples na forma Y = bx + a + ε, em que b representa o coeficiente
angular, a é o intercepto do modelo e ε denota o erro aleatório com média zero e variância σ2.
A tabela a seguir representa a análise de variância (ANOVA) proporcionada por esse modelo.

A respeito dessa situação hipotética, julgue o próximo item, sabendo que b > 0 e que o
desvio padrão amostral da variável x é igual a 2.
A estimativa do coeficiente angular b, pelo método de mínimos quadrados ordinários, é
igual a 0,25.

Questão muito complicada! O enunciado forneceu o desvio-padrão de X e também o número


de graus de liberdade total da amostra (N - 1 = 900). Então, podemos calcular:

Como o enunciado forneceu a soma dos quadrados da regressão (SQReg), podemos relacioná-
lo com a variância de X usando o coeficiente b e a variância de X usando a expressão:

Então, basta tirar a raiz de b:

Certo.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 303 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

181. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) A estimativa da


variância σ² é superior a 0,5.

A variância do erro pode ser calculada pela expressão:

Errado.

182. (CEBRASPE/POLÍCIA FEDERAL/2018/AGENTE DA POLÍCIA FEDERAL) A correlação linear


de Pearson entre a variável resposta Y e a variável regressora X é igual a 0,75.

A forma mais simples e direta de calcular o coeficiente de determinação é por meio da sua
definição:

Como o coeficiente de determinação é igual ao quadrado da correlação linear, basta tirar


a raiz quadrada:

Certo.

183. (IBFC/EBSERH/2020/ANALISTA ADMINISTRATIVO/ESTATÍSTICA) Um modelo de regressão


linear simples foi gerado para explicar vendas (Y, em milhares de reais) a partir de propaganda
(X, em centenas de reais). Algumas informações do modelo são apresentadas:
Equação de regressão estimada: Y = 12 + 1,8X
Tamanho da amostra: 17 observações.
Soma de quadrados da regressão: 225,00.
Soma de quadrados dos resíduos: 75,00.
Sb1 = 0,27.
Considere as seguintes afirmações:
I – De acordo com a equação de regressão estimada, um gasto de R$ 1.000,00 em propaganda
resulta em vendas estimadas de R$ 40.000,00.
II – O coeficiente de determinação do modelo (R²) é de 75%.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 304 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

III – A cada incremento unitário em X, espera-se que Y aumente 1,8.


Estão corretas as afirmativas:
a) I apenas
b) I e II, apenas
c) I e III, apenas
d) II e III, apenas

Vamos analisar as afirmações.


I – Errado. Façamos X = 1.000 na equação de regressão apresentada pelo enunciado.

Portanto, as receitas serão de R$ 30.000,00.


II – Certo. O coeficiente de determinação é dado pela expressão:

O enunciado não forneceu o SQTot, mas ele pode ser obtido como a soma:

Então, substituindo na expressão do coeficiente de determinação, temos:

III – Certo. Para X = 0, temos:

Para X = 1, temos:

Portanto, o incremento é:

Letra d.

184. (IBFC/EBSERH/2020/ANALISTA ADMINISTRATIVO/ESTATÍSTICA) Um modelo de regressão


linear simples foi gerado para explicar vendas (Y, em milhares de reais) a partir de propaganda
(x, em centenas de reais). Algumas informações do modelo são apresentadas:
Equação de regressão estimada: Y = 12 + 1,8X
Tamanho da amostra: 17 observações.
Soma de quadrados da regressão: 225,00.
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 305 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Soma de quadrados dos resíduos: 75,00.


Sb1 = 0,27.
Considere as seguintes afirmações:
I – De acordo com a equação de regressão estimada, um gasto de R$ 1.000,00 em propaganda
resulta em vendas estimadas de R$ 40.000,00.
II – O coeficiente de determinação do modelo (R²) é de 75%.
III – A cada incremento unitário em X, espera-se que Y aumente 1,8.
Estão corretas as afirmativas:
a) I apenas
b) I e II, apenas
c) I e III, apenas
d) II e III, apenas

Vamos analisar as afirmações.


I – Errado. Façamos X = 1.000 na equação de regressão apresentada pelo enunciado.

Portanto, as receitas serão de R$ 30.000,00.


II – Certo. O coeficiente de determinação é dado pela expressão:

O enunciado não forneceu o SQTot, mas ele pode ser obtido como a soma:

Então, substituindo na expressão do coeficiente de determinação, temos:

III – Certo.
Para X = 0, temos:

Para X = 1, temos:

Portanto, o incremento é:

Letra d.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 306 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

185. (CEBRASPE/POLÍCIA FEDERAL/2021) Um estudo objetivou avaliar a evolução do número


mensal Y de milhares de ocorrências de certo tipo de crime em determinado ano. Com
base no método dos mínimos quadrados ordinários, esse estudo apresentou um modelo
de regressão linear simples da forma.
Ŷ = 5 – 0,1 x T
Em que Ŷ representa a reta ajustada em função da variável regressora T, tal que 1 ≤ T ≤ 12.
Os erros padrão das estimativas dos coeficientes desse modelo, as razões t e seus respectivos
p-valores encontram-se na tabela a seguir.

Os desvios padrão amostrais das variáveis Y e T foram, respectivamente, 1 e 3,6.


Com base nessas informações, julgue o item a seguir.
Considere que a denote o coeficiente angular do modelo de regressão linear simples e
considere, ainda, que o teste de hipóteses H0: a = 0 versus H1: a ≠ 0. Nessa situação, com
referência a esse teste, caso o nível de significância escolhido seja igual a 5%, os resultados
do estudo em questão indicarão que não há evidências estatísticas contra a hipótese nula
H0: a = 0.

Foi fornecido o erro padrão para o modelo de coeficiente angular igual a 0,064. Esse erro
já é muito próximo da própria estimativa do coeficiente. Podemos calcular a estatística
normalizada para ele:

O enunciado forneceu ainda o p-valor:

Esse p-valor é maior que 5%. Isso significa que, ao nível de 5% de significância, não temos
como garantir que realmente o coeficiente de inclinação seja maior que zero. Portanto, não
temos provas estatísticas suficientes contra essa hipótese nula.
Em outras palavras, isso significa que o modelo de regressão linear deduzido não garante
que o seu próprio coeficiente de inclinação seja significativo. Logo, a influência do parâmetro
T sobre Y é muito pequena, materialmente nula.
Podemos, então, dizer que a variável T é, na realidade, uma variável exógena, tendo em
vista que sua influência sobre o parâmetro Y é pouco significativa.
Certo.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 307 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

186. (CEBRASPE/2018/POLÍCIA FEDERAL/PAPILOSCOPISTA POLICIAL FEDERAL) O intervalo de


tempo entre a morte de uma vítima até que ela seja encontrada (y em horas) denomina-se
intervalo post mortem. Um grupo de pesquisadores mostrou que esse tempo se relaciona
com a concentração molar de potássio encontrada na vítima (x, em mmol/dm3). Esses
pesquisadores consideraram um modelo de regressão linear simples na forma y = ax + b +
ε, em que a representa o coeficiente angular, b denomina-se intercepto, e ε denota um erro
aleatório que segue distribuição normal com média zero e desvio padrão igual a 4.
As estimativas dos coeficientes a e b, obtidas pelo método dos mínimos quadrados ordinários
foram, respectivamente, iguais a 2,5 e 10. O tamanho da amostra para a obtenção desses
resultados foi n = 101. A média amostral e o desvio padrão amostral da variável x foram,
respectivamente, iguais a 9 mmol/dm3 e 1,6 mmol/dm3 e o desvio padrão da variável y foi
igual a 5 horas.
A respeito dessa situação hipotética, julgue o item a seguir.
O coeficiente de explicação do modelo (R2) foi superior a 0,70.

Primeiramente, podemos utilizar a fórmula que relaciona o coeficiente angular com a


correlação linear, para uma regressão do tipo y = a·x + b:

Temos:
• a = coeficiente angular = 2,5
• r = correlação linear
• σy = desvio-padrão amostral de y = 5
• σx = desvio-padrão amostral de x = 1,6
Logo, basta substituir os valores:

Entretanto, a pergunta é sobre o coeficiente de explicação do modelo, ou seja, o R2. Assim:

Portanto, o resultado é menor que 0,70.


Errado.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 308 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

187. (VUNESP/EBSERH/2020/ANALISTA ADMINISTRATIVO/ESTATÍSTICO) A variável x tem média


4 e desvio padrão 2, enquanto a variável y tem média 3 e desvio padrão 1. A covariância
entre x e y é -1.
A equação estimada da regressão linear simples de y por x é:
a) y = 2 - 0,25x
b) y = 3 - 0,5x
c) y = 3 - x
d) y = 4 - x
e) y = 4 - 0,25x

Pela estimativa dos mínimos quadrados, podemos obter o coeficiente de inclinação do


modelo como a razão entre a covariância e a variância da regressora.

Substituindo na expressão geral do modelo de regressão linear, temos:

Substituindo os dados do enunciado e o valor calculado para o coeficiente b, temos:

Portanto, a estimativa do coeficiente Y a partir de X é:

Letra e.

188. (CEBRASPE/2018/POLÍCIA FEDERAL/PAPILOSCOPISTA) O intervalo de tempo entre


a morte de uma vítima até que ela seja encontrada (y em horas) denomina-se intervalo
post mortem. Um grupo de pesquisadores mostrou que esse tempo se relaciona com a
concentração molar de potássio encontrada na vítima (x, em mmol/dm3). Esses pesquisadores
consideraram um modelo de regressão linear simples na forma y = ax + b + ε, em que a
representa o coeficiente angular, b denomina-se intercepto, e ε denota um erro aleatório
que segue distribuição normal com média zero e desvio padrão igual a 4.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 309 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

As estimativas dos coeficientes a e b, obtidas pelo método dos mínimos quadrados ordinários
foram, respectivamente, iguais a 2,5 e 10. O tamanho da amostra para a obtenção desses
resultados foi n = 101. A média amostral e o desvio padrão amostral da variável x foram,
respectivamente, iguais a 9 mmol/dm3 e 1,6 mmol/dm3 e o desvio padrão da variável y foi
igual a 5 horas.
A respeito dessa situação hipotética, julgue o item a seguir.
A média amostral da variável resposta y foi superior a 30 horas.

Apesar do tamanho, trata-se de uma questão apenas de substituição de valores. Note que
as estimativas ocorreram pelo método de mínimos quadrados ordinários, ou seja, o ε = 0.
Assim, usando a fórmula:

Com as seguintes substituições:


• a = 2,5
• b = 10
• x=9
• ε=0
Temos:

Como a média amostral de y é superior a 30, a afirmação é correta.


Certo.

189. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Em uma análise


de regressão, se o coeficiente de determinação r² = 1, então:
(Considere SQT = Soma de quadrados total; SQE = Soma de quadrados do erro; SQR = Soma
de quadrados da regressão.)
a) SQE = SQT
b) SQE = 1
c) SQR = SQE
d) SQR = SQT
e) SQR > SQT
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 310 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O coeficiente de determinação corresponde à razão entre a soma dos quadrados da regressão


(SQR) e a soma dos quadrados total (SQT). Assim, temos:

Letra d.

190. (CESPE/TCE-PA/2016) Uma regressão linear simples é expressa por Y = a + b ⋅ X + e,


em que o termo e corresponde ao erro aleatório da regressão e os parâmetros a e b são
desconhecidos e devem ser estimados a partir de uma amostra disponível. Assumindo
que a variável X é não correlacionada com o erro e, julgue o item subsecutivo, no qual os
resíduos das amostras consideradas são IID, com distribuição normal, média zero e variância
constante.
Se, em uma amostra de tamanho n = 25, o coeficiente de correlação entre as variáveis X e Y
for igual a 0,8, o coeficiente de determinação da regressão estimada via mínimos quadrados
ordinários, com base nessa amostra, terá valor R2 = 0,64.

Questão bastante direta. Basta nos lembrarmos de que o coeficiente de determinação é


igual ao quadrado da correlação.

Certo.

191. (FUNDATEC/PREFEITURA DE PORTO ALEGRE/RS/2021/ESTATÍSTICO) Em um gráfico de


resíduos em uma análise de regressão, são exibidos:
a) Resíduos da variável explicativa versus resíduos da variável de resposta.
b) Resíduos da variável explicativa versus a variável de resposta.
c) A variável explicativa versus a variável de resposta.
d) A variável explicativa sobre o eixo x, contra a variável resposta sobre o eixo y
e) A variável explicativa versus resíduos da variável resposta.

O gráfico de resíduos tem por objetivo estudar os resíduos da variável resposta em função
da variável explicativa, que correspondem à diferença entre o valor correto e a estimativa
da variável resposta.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 311 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Letra e.

MOMENTOS DE VARIÁVEIS ALEATÓRIAS

192. (CESPE/CEBRASPE/2016/TCE-PA) Se as variáveis aleatórias x e y seguem distribuições


de Bernoulli, tais que P[x = 1] = P[y = 0] = 0,9, então a distribuição de X² é Bernoulli com
média igual a 0,81.

Observe que P(x = 1) = 0,9, então P(x = 0) = 0,1. Além disso, podemos escrever para X²:
k P(x² = k)
0 0,1
1 0,9
Assim, a média de x² é:

Errado.

193. (CESPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
O valor esperado de X é igual a 12.

Como a função distribuição de probabilidades é simétrica em relação a x = 12, a média da


distribuição é igual a 12.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 312 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Certo.

194. (CESPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
P(x = 5) > γ

Como a distribuição de probabilidade é contínua, a probabilidade um único ponto dessa


distribuição é sempre igual a 0. Nas distribuições contínuas, só se define a probabilidade
de um intervalo. Por exemplo P (5 < X < 12) ou P(x > 5). Mas, nesse caso, queremos somente
o ponto P(x = 5), e a probabilidade de um único ponto é sempre nulo.
Errado.

195. (FCC/2013/TRT 5ª REGIÃO (BA)) Considere uma variável aleatória X uniformemente


distribuída no intervalo (m, n) em que nem m e nem n são conhecidos. Com base em uma
amostra aleatória de tamanho 10 obteve-se que os valores do primeiro e do segundo
momentos da amostra foram, respectivamente, 1,00 e 1,12. Aplicando o método dos
momentos, tem-se que as estimativas de m e n são, respectivamente,
a) 0,30 e 1,70
b) 0,40 e 1,60
c) 0,50 e 1,50
d) 0,60 e 1,40
e) 0,70 e 1,30

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 313 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Devemos nos lembrar que, para uma distribuição uniforme, a média e a variância são dadas
em função dos parâmetros m e n:

O primeiro momento da variável aleatória X é igual ao valor esperado de X. Assim, podemos


dizer que:

A variância de X é dada pela média dos quadrados (segundo momentos) menos o quadrado
da média:

Para uma distribuição uniforme, essa variância é escrita em função do comprimento do


intervalo:

Assim, podemos calcular esse comprimento:

Chegamos, então, a um sistema com duas equações e duas incógnitas. Esse sistema pode
ser resolvido pelo método da adição:

Então, temos o valor de n:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 314 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Para calcular o valor de m, podemos substituir na equação (I):

Letra b.

196. (FCC/TRT 1ª REGIÃO (RJ)/2011/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Seja X uma variável


aleatória contínua com função densidade de probabilidade dada por:

Se F(x) é a função de distribuição acumulada de X, então


a) F(2) - F(1) = 0,5.
b) F(x) é uma função escada.
c) F(x) = 0,5 x, se 1 < x < 2.
d) F(x) = 0,25 x², se 0 ≤ x ≤ 2.
e) F(x) = 0,5 x², se 0 ≤ x ≤ 2.

A função densidade de probabilidade acumulada corresponde à integral partindo de menos


infinito até o ponto x. Porém, essa função é nula para x < 0, então, a distribuição só se inicia
efetivamente em x = 0:

A seguir, mostramos a função original e a área debaixo do gráfico, evidenciando a sua


função acumulada.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 315 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A integral de x é x²/2, então:

Mas essa regra só vale para 0 < x < 2, porque, para x > 2, a função volta a se anular. Logo, a
integral para de contar.
Letra d.

197. (FCC/2014/TRT 13ª REGIÃO (PB)) Suponha que uma variável aleatória X é uniformemente
distribuída no intervalo (a, b), em que nem a nem b são conhecidos. Utilizando o método
dos momentos, com base em uma amostra de tamanho 10, obtiveram-se os valores 1
e 4 para a e b, respectivamente. O valor do momento de ordem 2, centrado na origem,
correspondente aos elementos da amostra é:
a) 8
b) 6
c) 7
d) 5
e) 9

Para uma variável que segue a distribuição uniforme, a média e a variância são dadas pelas
expressões:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 316 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A variância pode também ser calculada em função dos momentos de primeira e segunda
ordem, tendo em vista que ela pode ser expressa como a média dos quadrados menos o
quadrado da média:

Assim, podemos calcular o momento de segunda ordem:

Letra c.

198. (VUNESP/TJ-SP/2015/ESTATÍSTICO JUDICIÁRIO) Leia o texto para responder à questão.


A função densidade de probabilidade de uma variável aleatória contínua é dada por:
f(x) = 0 se x < 0
f(x) = k se 0 ≤ x < 2
f(x) = kx/2 se 2 ≤ x < 4
f(x) = 0 se x ≥ 4
De acordo com essa definição, o valor de k é:
a) 1/2
b) 1/3
c) 1/4
d) 1/5
e) 1/6

O gráfico dessa distribuição de probabilidades está mostrado a seguir: ele tem o início
constante até chegar em 2 e depois cresce por meio de uma linha reta.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 317 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O primeiro passo nessa distribuição é determinar o valor de k. Para isso, devemos utilizar
o axioma de Kolgomorov, que impõe que a integral da função densidade de probabilidade
sobre todo o domínio é igual a 1.
Nesse caso, podemos calcular toda a área do gráfico usando o Ensino Médio, tendo em vista
que ela pode ser obtida como um retângulo e um trapézio. Assim, teremos:

Outra forma de fazer é, como a função foi picada em vários pedaços, podemos somar as
integrais em cada pedaço em que ela é definida. Assim, temos:

Agora, vamos utilizar a integral polinomial. A integral de x é x²/2 e a integral da constante


k é o produto kx. Assim, temos:

Substituindo os extremos dos intervalos de integração:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 318 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

De ambas as formas concluímos que 5k = 1. Assim, temos:

Letra d.

199. (VUNESP/TJ-SP/2015/ESTATÍSTICO JUDICIÁRIO) Leia o texto para responder à questão.


A função densidade de probabilidade de uma variável aleatória contínua é dada por:
f(x) = 0 se x < 0
f(x) = k se 0 ≤ x < 2
f(x) = kx/2 se 2 ≤ x < 4
f(x) = 0 se x ≥ 4
A probabilidade P(1 ≤ x ≤ 3) é
a) 9/15
b) 9/20
c) 12/15
d) 17/20
e) 13/15

Já havíamos calculado anteriormente k = 1/5. Assim, a probabilidade pedida no enunciado é:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 319 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Tirando o mínimo múltiplo comum, temos:

Letra b.

200. (CESPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
O valor da constante γ é inferior a 0,01.

Vamos plotar o gráfico dessa distribuição de probabilidades.

Pelos axiomas de Kolgomorov, a área total debaixo do gráfico deve ser igual a 1. Então,
podemos escrever:
O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 320 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A integral polinomial de u² é igual a u³/3. Então, temos:

Portanto, a constante gama é realmente bem inferior a 0,01.


Certo.

201. (INÉDITA/2023) Calcule a seguinte integral indefinida:

A integral da soma é a soma das integrais, logo:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 321 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Relembrando a regra básica de integração:

Então:

202. (INÉDITA/2023) Considere a seguinte distribuição de probabilidades:


f(x) = 2β²/x³, para x ≥ β, com β > 0
Essa função representa uma distribuição de probabilidades válida.

Primeiramente, vamos entender a função trabalhada no enunciado por meio do seu gráfico:

Para saber se uma distribuição de probabilidades é válida, devemos integrar sobre todo o
domínio. Nesse caso, o domínio é x ≥ β, isto é, de β a mais infinito.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 322 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Para facilitar as contas, vamos primeiro fazer a integral indefinida:

E, agora, vamos fazer a integral definida:

Observe que um dos extremos da integração é o infinito que o inverso do infinito vai
tendendo a zero.
Como a integral sobre todo o domínio da função é igual a 1, concluímos que a distribuição
de probabilidades é válida.
Certo.

203. (VUNESP/TJ-SP/2015/ESTATÍSTICO JUDICIÁRIO) Leia o texto para responder à questão.


A função densidade de probabilidade de uma variável aleatória contínua é dada por:
f(x) = 0 se x < 0
f(x) = k se 0 ≤ x < 2
f(x) = kx/2 se 2 ≤ x < 4
f(x) = 0 se x ≥ 4
De acordo com essa definição, o valor de k é:
a) 1/2
b) 1/3
c) 1/4
d) 1/5
e) 1/6

O gráfico dessa distribuição de probabilidades está mostrado a seguir: ele tem o início
constante até chegar em 2 e depois cresce por meio de uma linha reta.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 323 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

O primeiro passo nessa distribuição é determinar o valor de k. Para isso, devemos utilizar
o axioma de Kolgomorov, que impõe que a integral da função densidade de probabilidade
sobre todo o domínio é igual a 1.
Nesse caso, podemos calcular toda a área do gráfico usando o Ensino Médio, tendo em vista
que ela pode ser obtida como um retângulo e um trapézio. Assim, teremos:

Outra forma de fazer é, como a função foi picada em vários pedaços, podemos somar as
integrais em cada pedaço em que ela é definida. Assim, temos:

Agora, vamos utilizar a integral polinomial. A integral de x é x²/2 e a integral da constante


k é o produto kx. Assim, temos:

Substituindo os extremos dos intervalos de integração:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 324 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

De ambas as formas concluímos que 5k = 1. Assim, temos:

Letra d.

204. (VUNESP/TJ-SP/2015/ESTATÍSTICO JUDICIÁRIO) Leia o texto para responder à questão.


A função densidade de probabilidade de uma variável aleatória contínua é dada por:
f(x) = 0 se x < 0
f(x) = k se 0 ≤ x < 2
f(x) = kx/2 se 2 ≤ x < 4
f(x) = 0 se x ≥ 4
A probabilidade P(1 ≤ x ≤ 3) é
a) 9/15
b) 9/20
c) 12/15
d) 17/20
e) 13/15

Já havíamos calculado anteriormente k = 1/5. Assim, a probabilidade pedida no enunciado é:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 325 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Tirando o mínimo múltiplo comum, temos:

Letra b.

205. (CEBRASPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
O valor da constante γ é inferior a 0,01.

Vamos plotar o gráfico dessa distribuição de probabilidades.

Pelos axiomas de Kolgomorov, a área total debaixo do gráfico deve ser igual a 1. Então,
podemos escrever:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 326 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

A integral polinomial de u² é igual a u³/3. Então, temos:

Portanto, a constante gama é realmente bem inferior a 0,01.


Certo.

206. (INÉDITA/2023) Considere a seguinte distribuição de probabilidades:


f(x) = 2/x³, para x ≥ 1
O valor esperado dessa variável é maior que 4.

Por definição, o valor esperado de uma distribuição de probabilidades é:

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 327 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Vamos entender a função trabalhada no enunciado por meio do seu gráfico:

Observe que o gráfico dessa função vai tendendo a zero quando x vai tendendo ao infinito.

Errado.

207. (CEBRASPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
O valor esperado de X é igual a 12.

Como a função distribuição de probabilidades é simétrica em relação a x = 12, a média da


distribuição é igual a 12.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 328 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Certo.

208. (CEBRASPE/PF/2021) Considere que o horário de ocorrência de certo tipo de crime em


determinado local seja representado por uma variável aleatória contínua X, cuja função de
densidade é escrita como:
f(x) = γ(x – 12)²
Em que 0 ≤ x ≤ 24 e γ é uma constante de normalização (γ > 0), julgue os itens subsequentes.
P(x = 5) > γ

Como a distribuição de probabilidade é contínua, a probabilidade um único ponto dessa


distribuição é sempre igual a 0. Nas distribuições contínuas, só se define a probabilidade
de um intervalo. Por exemplo P (5 < x < 12) ou P(x > 5). Mas, nesse caso, queremos somente
o ponto P(x = 5), e a probabilidade de um único ponto é sempre nulo.
Errado.

209. (INÉDITA/2023/TFC) Considere, para a função

Para que seja uma função de probabilidade, deve ser:


a) 2
b) 4
c) 6
d) 8
e) 10

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 329 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Como x = 0, 1, 2, 3, 4, 5, sabemos que estamos lidando com uma variável discreta. Logo,
para que seja uma função de probabilidade, seu somatório deve ser igual a 1.
Para cada x:

Somando os resultados:

Letra b.

210. (FCC/TRE-PR/2015/ANALISTA JUDICIÁRIO) A função de probabilidade conjunta das


variáveis X e Y é dada por:

Nessas condições, a média de Y e P(x + Y = 3) são dados, respectivamente, por


a) 1 e 7/16
b) 7/16 e 13/16
c) 7/16 e 9/16

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 330 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

d) 9/16 e 7/16
e) 9/16 e 5/16

Podemos montar a tabela com os valores fornecidos para as probabilidades.

Em seguida, vamos calcular as probabilidades marginais de Y.

Então, podemos calcular a média de Y como o somatório dos valores de Y pela probabilidade
associada.

Para que a soma X + Y seja igual a 3, existem duas possibilidades: X = 2 e Y = 1; ou X = 3 e Y


= 0. Assim, temos:

Letra d.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 331 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

211. (CESPE/PC-SE/2021) Considere duas variáveis aleatórias contínuas, x e y, tais que P(x
> 0) = 1, P(x ≤ 1) = 1/10, P(x ≤ 1 | y > 1) = 3/10, Var(x) = Var(y) = 1, e Cov(x, y) = 0.
Com base nessas informações, julgue os itens a seguir.
X e Y são independentes.

Para que duas variáveis sejam independentes, a probabilidade condicional tem que ser igual
à probabilidade incondicional. Como o fato de saber que y > 1 altera a probabilidade de que
P(x ≤ 1), podemos concluir que y interfere na variável x. Logo, elas não são independentes.
É importante destacar que a covariância nula é uma condição necessária, mas não é suficiente
para garantir que as duas variáveis são independentes.
Errado.

212. (CONSULPLAN/TSE/2012/ANALISTA JUDICIÁRIO/ESTATÍSTICO) A função de densidade


conjunta para as variáveis aleatórias x e y é:

A covariância entre x e y é
a) -0,4
b) -1,2
c) -2,4
d) -3,6

Vamos calcular as probabilidades marginais e também os valores dos produtos xy.


y=1 y=2 y=4
x=0 0 (xy = 0) 0,2 (xy = 0) 0,6 (xy = 0) 0,8
x=1 0,2 (xy = 1) 0 (xy = 2) 0 (xy = 4) 0,2
0,2 0,2 0,6
Assim, podemos calcular as esperanças de X e Y usando o somatório dos valores associados
a eles multiplicados pelas respectivas probabilidades marginais.

Para calcular a esperança do produto, vamos montar a tabela de probabilidades.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 332 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

xy P(xy)
0 0 + 0,2 + 0,6 = 0,8
1 0,2
2 0
4 0
Então, usando os valores e as probabilidades calculadas acima para o produto xy, temos:

Por fim, a covariância é igual à esperança dos produtos menos o produto das esperanças.

Letra a.

213. (FCC/TRF (2ª REGIÃO)/2012/ANALISTA JUDICIÁRIO) Se X e Y tem função de probabilidade


conjunta dada por:

a) 1/3
b) 2/3
c) 2/9
d) 4/9
e) 1/6

Vamos montar a tabela de probabilidades e calcular as probabilidades marginais.


X=0 X=1
Y=0 1/3 0 1/3
Y=1 1/3 1/3 2/3
2/3 1/3
Diante das probabilidades marginais, podemos calcular as esperanças de x e y, usando o
somatório dos valores possíveis para essas variáveis multiplicados pelas probabilidades
associadas.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 333 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

Podemos também calcular os valores associados aos produtos XY.


x=0 x=1
y=0 1/3 (xy = 0) 0 (xy = 0) 1/3
y=1 1/3 (xy = 0) 1/3 (xy = 1) 2/3
2/3 1/3
Então, podemos montar a tabela de probabilidades para o produto xy.
xy P(xy)
0 2/3
1 1/3
Assim, podemos calcular a esperança de xy:

A covariância, por fim, é igual à esperança do produto menos o produto das esperanças.

Por fim, vamos utilizar as propriedades da covariância: os termos multiplicativos podem


ser retirados e saem multiplicando a covariância.

Letra d.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 334 de 336


PDF SINTÉTICO
Estatística
Thiago Cardoso

REFERÊNCIAS

ALCÂNTARA, F. Estatística para concursos. 3. ed. [S.l.]: Método, 2014.

CARVALHO, S.; CAMPOS, W. Estatística básica simplificada. 3. ed. [S.l.]: Juspodivm, 2021.

CARVALHO, S.; CAMPOS, W. Estatística inferencial simplificada. [S.l.]: Juspodivm, 2021.

DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. 9. ed. [S.l.]: Cengage


Learning, 2018.

HUFF, D. Como mentir com estatística. [S.l.]: Intrínseca, 2019.

MLODINOW, L. O andar do bêbado: como o acaso determina nossas vidas. [S.l.]: Zahar,
2018.

QUINSLER, A. P. Probabilidade e estatística. [S.l.]: Inter Saberes, 2022.

SPIEGEL, M. R.; SCHILLER, J. J. Coleção Schaum: probabilidade e estatística. 3. ed. [S.l.]:


Bookman, 2012.

TRIOLA, M. F. Introdução à estatística. [S.l.]: LTC, 2017.

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

gran.com.br 335 de 336


Abra

caminhos

crie

futuros
gran.com.br

O conteúdo deste livro eletrônico é licenciado para Douglas Marinho - 04540929208, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

Você também pode gostar