Você está na página 1de 10

UNIVERSIDADE FEDERAL DA BAHIA

INSTITUTO DE MATEMÁTICA E ESTATÍSTICA - IME


DEPARTAMENTO DE ESTATÍSTICA - DEST
Estatística I-A / MAT020

1ª LISTA DE EXERCÍCIOS

1. As fases principais do método estatístico são:


a. Coleta dos dados, amostragem, apresentação tabular e apresentação gráfica e definição
dos problemas.
b. Amostragem, apresentação tabular, apuração dos dados, interpretação dos dados e
planejamento.
c. Definição do problema, planejamento, coleta dos dados, apuração, apresentação dos
dados, análise e interpretação dos dados.

2. Para cada um dos itens a seguir, indique a população em estudo e a amostra escolhida.
a. Para determinar o gasto médio das famílias em férias na cidade de Salvador, foram
selecionadas 62 famílias que estavam chegando ao aeroporto de Salvador e foi
perguntado quanto pretendiam gastar.
b. Pretende-se fazer um estudo sobre o número de membros do agregado familiar, numa
cidade. Para isso efetuou-se um inquérito ao qual responderam 50 famílias.
c. A fim de determinar os salários anuais de administradores recém-formados na cidade de
Salvador foram considerados 150 jovens administradores e seus salários anuais foram
contabilizados.

3. Você está realizando um estudo para determinar a opinião dos estudantes em sua universidade
sobre auditorias de contas públicas em seu Estado. Identifique a técnica de amostragem que
você usaria se selecionasse as amostras listadas.
a. Você seleciona uma classe aleatoriamente e questiona cada aluno da classe.
b. Você divide a população de estudantes com relação às graduações, seleciona
aleatoriamente e questiona alguns de cada curso de graduação.
c. Você designa um número para cada aluno e gera aleatoriamente. Então, você questiona
cada estudante cujo número é selecionado aleatoriamente.
d. Você seleciona estudantes que estão em sua aula de estatística.
e. Você designa um número para cada estudante e, depois de escolher um número inicial,
questiona cada 25º aluno.

4. Classifique cada uma das variáveis abaixo em qualitativa (nominal/ordinal) ou quantitativa


(discreta/contínua).
a. Número de matrícula da UFBA.
b. Intenção de voto de um eleitor à presidência da República (possíveis respostas são os
nomes dos candidatos, além de “indeciso”).
c. Consumo de combustível de diferentes modelos de automóveis em km/l.
d. Número de filhos por família em diferentes países.
e. Renda, em reais, dos funcionários de uma empresa.
f. Número de disciplinas cursadas por alunos de graduação em Administração.
g. Classificação da redação dos candidatos de um concurso público em “excelente”, “ótima”,
“boa”, “regular” e “insuficiente”.
h. Aprovação na disciplina Estatística I-A, tendo como opções de resposta “sim” ou “não”.

1
i. Nível de instrução dos funcionários de uma empresa, medido pelo número de anos
completos na escola (excluindo repetências).
j. Velocidade de automóveis em uma rodovia federal, sendo a velocidade declarada como
“legal” ou “em excesso”.

5. Renda é uma variável que frequentemente está incluída em pesquisas. Às vezes a pergunta é
formulada como: “Qual é a sua renda (em reais)?”. Em outras pesquisas, é pedido ao
entrevistado que “Coloque um X no círculo correspondente ao seu nível de renda”, e são
fornecidas várias faixas de renda para escolher.
a. No primeiro formato, explique por que a renda pode ser considerada tanto discreta quanto
contínua.
b. Qual destes dois formatos você preferiria utilizar se estivesse definindo uma pesquisa?
Por quê?
c. Qual destes dois formatos iria, provavelmente, trazer a você uma melhor taxa de
resposta? Por quê?

6. Considere as representações gráfica e tabular, apresentadas a seguir.


Figura 1: Distribuição dos óbitos confirmados de COVID-19, segundo faixa
etária no estado da Bahia até 31/03/21.

Fonte: Boletim epidemiológico nº 372 (31/03/2021) - SESAB.

Figura 2: Piora nas contas públicas do Brasil, em bilhões de reais, de 2010 a 2020.

Nota: figura extraída de reportagem publicada no portal G1.


* não contabilizou o mês de dezembro/2020

2
Figura 3: Distribuição do salário pago aos funcionários de determinada
empresa, de acordo com a escolaridade

Fonte: RH da empresa

Infográfico: Cenário epidemiológico da Covid-19 até 27/02/21.

Assinale apenas a(s) sentença(s) verdadeira(s) e justifique as falsas, tornando-as


verdadeiras.
a. Os dados apresentados no Infográfico representam uma série do tipo mista.
b. Os dados apresentados na Figura 1 representam uma série específica.
c. O gráfico de linhas poderia ser utilizado para representar graficamente as informações da
Figura 2.
d. A Figura 2 mostra que o rombo nas contas públicas em 2020 é menor que o valor
acumulado entre 2014 e 2019.
e. A Figura 3 mostra que a distribuição do salário recebido pelos funcionários é assimétrica
em qualquer dos níveis de ensino.
f. A Figura 3 está comparando 2 variáveis qualitativas.
g. A Figura 1 mostra que a faixa até os 69 anos concentra 50% dos óbitos confirmados de
Covid-19 na Bahia, até 31/03/21.
h. Segundo o infográfico apresentado, até 27/02/21 Salvador concentrava 21,66% do total
de casos confirmados no estado da Bahia.
i. Segundo a Figura 3, a distribuição dos salários dos funcionários com ensino médio é mais
homogênea que a dos funcionários com ensino superior.
j. Segundo o Infográfico apresentado, o Brasil corresponde a 6,5% do total de óbitos de
covid-19 no mundo até 27/02/21.
k. A Figura 3 mostra que existe uma observação discrepante na distribuição dos salários
segundo o nível de escolaridade.
3
7. Complete o seguinte quadro de distribuição de frequências:

Quadro 1. Quociente de inteligência de alunos de determinada escola. Bahia. 2018.


QI fi Fi fi (%)
68 – 80 25 25 5,0
80 - A 137 D 27,4
92 - 104 238 400 47,6
104 - 116 B 482 16,4
116 – 128 18 500 3,6
TOTAL 500 .. C
Fonte: Secretaria da Escola

Baseado nos dados acima, responda:


a. “A análise do QI dos alunos da escola estudada mostrou que _________ escolares
apresentaram um QI entre 92 e 104; ______ % apresentaram um QI inferior a 104; e
________% apresentaram um QI entre 116 e 128.
b. Que gráfico você sugeriria para apresentação dos dados da tabela da questão 2? Por
quê? Faça um esboço do gráfico sugerido.

8. De acordo com informações do IBGE, em 31.12.1999, o pessoal administrativo ocupado em


estabelecimento público, segundo o tipo de ocupação, era: Administração - 41.371; Serviço de
Pessoal - 6.067; Contabilidade - 2.989; Estatística - 5.481; Limpeza e Conservação - 26.520;
Almoxarifado - 3.970; Serviços Gerais - 46.073; e Outros - 15.689. Nos estabelecimentos de
rede particular, nas mesmas ocupações anteriores, as quantidades eram: 45.932, 4.555, 6.627,
3.112, 42.155, 4.019, 59.038 e 17.302.
a. Use uma planilha, como o EXCEL ou planilhas google e construa uma tabela com os
dados acima.
b. Classifique esta série estatística
c. Caso desejássemos construir um gráfico com estes dados, qual(s) dos tipos estudados
seriam adequados?

9. Por engano um professor omitiu uma nota no conjunto de notas de 10 alunos. As nove notas
são: {48, 71, 79, 95, 45, 57, 75, 83, 97} e sabe-se que a média das 10 notas é 72.
a. Qual o valor da nota omitida?
b. Qual a nota de 25% destes alunos?
c. O professor informou que 30% dos alunos com as maiores notas receberão um ponto
extra. Qual a nota mínima para receber esta pontuação?

10. Você é o responsável pela confecção de um relatório sobre o desempenho de vendas das 32
filiais da empresa em que trabalha. A alta direção investiu muito em uma série de promoções
para aumentar as vendas, e quer verificar se isso realmente ocorreu: havia sido estabelecido
um valor mínimo aceitável de 10%, em relação ao mesmo período do ano passado. Os valores
de crescimento percentual das vendas foram:

4,30 6,34 7,38 3,51 10,90 0,28 7,96 8,12 1,58 5,53 4,11
0,41 8,31 1,54 4,49 4,65 4,19 -1,28 5,67 -0,25 12,00 4,32
8,43 2,95 8,54 18,76 7,34 1,82 -3,15 9,03 2,31 0,17

4
a. Construa a tabela de frequências que julgar apropriada para resumir os dados. Com base
na tabela, o que você conclui acerca da eficácia das promoções?
b. Que ferramenta gráfica você utilizaria para resumir os dados? Por quê?
c. Que medida(s) de síntese você utilizaria para resumir os dados? Por quê?
d. Calcule a(s) medida(s) escolhida(s) no item c, e com base nela(s), o que você conclui
acerca da eficácia das promoções?

11. Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo
necessário para realizar a auditoria de 50 balanços contábeis. Calcular as medidas de posição
e de dispersão para o tempo de auditoria necessário para esta amostra de registro e escreva
um breve resumo com suas conclusões.

Tempo necessário para a auditoria de balanços contábeis.


Tempo de auditoria Nº de balanços
(min.) (fi)
10 |-- 20 3
20 |-- 30 5
30 |-- 40 10
40 |-- 50 12
50 |-- 60 20
Total 50

12. Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos
durante uma certa semana, arredondados para o valor mais próximo e apresentados em rol:
140, 140, 140, 140, 140, 140, 140, 140, 165, 165, 165, 165, 180, 180, 180, 200, 200, 230, 230,
230. Calcular: (a) a média, (b) a mediana, (c) a moda, (d) o desvio padrão, (e) o coeficiente de
variação, para este grupo de salários. Analise estas medidas e faça uma breve conclusão sobre
o salário dos operários desta companhia.

13. O peso em uma amostra de alunos do primeiro ano de uma escola é mostrado no histograma
(o menor peso encontrado foi 41,5 quilogramas).

a. Faça a distribuição de frequência para os dados e acrescente a frequência acumulada


relativa “acima de”.
b. Qual o peso médio encontrado na amostra de alunos do primeiro ano desta escola?
c. Em quantos por cento dos alunos encontrou-se um peso igual ou maior a 73,5
quilogramas?
5
14. Para os casos a seguir indique qual é o método estatístico (tabela, gráfico, medida de síntese)
mais apropriado para resumir e interpretar os dados. JUSTIFIQUE suas respostas.
a. A diretoria de uma empresa especializada em entrega expressa quer ter uma ideia do
peso dos pacotes das encomendas, para decidir ou não a adoção de um tipo maior de
caixa. Há um arquivo com os pesos em kg (com até três casas decimais) das últimas
3000 encomendas. Você tem cinco minutos para fazer uma apresentação para a diretoria
que é IGNORANTE em Estatística.
b. Uma corretora de valores tem 450 clientes, desde pequenos a mega-investidores. A
diretoria quer ter uma ideia dos valores investidos por estes clientes, identificando
inclusive os “discrepantes”. Você tem três minutos para apresentar o relatório, e a diretoria
é versada em Análise Exploratória de Dados.

15. Em uma amostra aleatória de 16 dias, um restaurante recebeu os seguintes números de pedidos
de frango e bife:
Frango: 46, 55, 43, 48, 54, 65, 36, 40, 51, 53, 64, 32, 41, 46, 53, 47
Bife: 39, 41, 25, 30, 46, 36, 37, 23, 30, 33, 50, 44, 41, 28, 35, 37

Calcule os dois coeficientes de variação para determinar em que produto o número de pedidos
é relativamente mais variável, sabendo-se que o desvio-padrão para os dois tipos de carne é
dado, respectivamente, por: SFrango = 9,1 e SBife= 7,6.

16. O quadro, a seguir, traz algumas medidas descritivas para as variáveis circunferência e altura
de 20 árvores. Faça um breve resumo dos resultados e compare.

Quadro: Medidas descritivas para a circunferência (X) e altura (Y), em centímetros


Variável Mínimo Máximo Q1 Q3 Média Mediana DP CV rx,y

X 0,70 9,90 3,03 6,15 5,06 4,85 2,66 52,53


0,73
Y 8,54 33,59 15,07 24,58 19,85 20,02 6,66 33,58

DP: desvio-padrão; CV: coeficiente de variação; rx,y: coeficiente de correlação

17. Com base na figura a seguir, que mostra a distribuição de idades dos funcionários de três
empresas similares A, B e C, responda:

a. Qual o tipo de gráfico que está sendo apresentado?


b. Você tem alguma crítica a fazer em relação à construção deste gráfico? Qual(is)?
6
c. É possível construir um histograma com os resultados citados? Por quê?
d. Em qual das empresas há o funcionário mais jovem? E o mais velho?
e. Em qual das empresas é maior a mediana das idades?
f. Qual das empresas apresenta menor amplitude interquartílica?
g. Descreva, quanto à simetria, a forma das distribuições para cada empresa.

18. O transporte público e o automóvel são dois meios de transporte que os trabalhadores podem
usar para chegar ao trabalho diariamente. Os resultados amostrais sobre o tempo do percurso
estão registrados a seguir para cada meio de transporte. Os tempos estão expressos em
minutos:

Transporte Público: 25 28 29 29 32 32 33 34 37 41
Automóvel: 29 30 31 31 32 32 33 33 34 35

Transporte Público:
Automóvel:

a. Com os dados da amostra, calcule a média e o desvio padrão para o tempo do percurso
para se chegar ao trabalho utilizando cada um dos meios de transporte. Com base apenas
nestas informações, qual meio de transporte preferível? Explique.
b. Faça uma análise da figura de acordo com os meios de transporte e verifique se sustenta
suas conclusões para o item (a.). Explique com uma breve descrição sobre as principais
características da figura.
Box plot do tempo do percurso gasto pelos trabalhadores para chegar
ao trabalho, segundo o meio de transporte utilizado

19. A partir dos dados a seguir, referentes às idades dos frequentadores de duas boates mais
frequentadas da cidade, construa o box plot para a variável em questão. Quais as conclusões
que você pode tirar sobre os dois conjuntos de dados?

Boate Mínimo Quartil 1 Mediana Quartil 3 Máximo

A 18 21 35 45 65

B 18 30 35 40 54

7
20. Em um teste automobilístico de quilometragem e consumo de gasolina, 13 automóveis foram
testados na estrada, em um percurso de 482,80 quilômetros, em condições de dirigibilidade
tanto na cidade como na rodovia. Os dados apresentados a seguir referem-se à análise do
desempenho obtido em termos de quilometragem por galão (1 galão = 3,78 litros).
---------------------------------------------------------------------
-> local = Cidade
Desempenho em termos de quilômetros
-------------------------------------------------------------
Percentiles Smallest
1% 21.24 21.24
5% 21.24 23.17
10% 23.17 24.46 Obs 13
25% 24.62 24.62 Sum of Wgt. 13

50% 25.58 Mean 25.05154


Largest Std. Dev. 1.559892
75% 25.91 25.91
90% 26.87 26.07 Variance 2.433264
95% 27.03 26.87 Skewness -1.056555
99% 27.03 27.03 Kurtosis 3.845761

---------------------------------------------------------------------
-> local = Rodovia
Desempenho em termos de quilômetros
-------------------------------------------------------------
Percentiles Smallest
1% 27.35 27.35
5% 27.35 27.35
10% 27.35 28.96 Obs 13
25% 28.96 28.96 Sum of Wgt. 13

50% 29.93 Mean 29.98846


Largest Std. Dev. 1.863236
75% 30.89 30.89
90% 32.18 31.22 Variance 3.471648
95% 33.95 32.18 Skewness .4640106
99% 33.95 33.95 Kurtosis 2.801077
*Smallest – os quatro menores valores do conjunto de dados
**Largest – os quatro maiores valores do conjunto de dados

8
a. Use a média, a mediana e algumas separatrizes para fazer uma afirmação sobre a
diferença de desempenho quando se dirige na cidade e na rodovia.
b. Qual é o primeiro quartil? Interprete seu valor.
c. Através da análise do boxplot da quilometragem de acordo com a estrada, é possível
identificar valores discrepantes? Especifique os limites para detecção de valores
discrepantes para estes dados, justificando sua resposta anterior. Se existirem valores
discrepantes, que valores são estes?
d. Avalie a assimetria destas distribuições com base nos boxplots. Justifique sua resposta.

21. Um estudo realizado junto a 218 alunos da Ohio State University sugere uma ligação entre o
tempo gasto no portal eletrônico de relacionamento social Facebook e a média geral de notas
do aluno. Alunos que raramente ou jamais utilizaram o Facebook apresentaram médias gerais
mais altas do que alunos que fazem uso do Facebook. O estudo sugere que o tempo gasto no
Facebook e a média geral de notas do aluno estão positivamente ou negativamente
correlacionados?

22. Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em
unidades monetárias) para uma amostra de 25 famílias:
Renda Gasto com Renda Gasto com
Familiar (X) Alimentação (Y) Familiar (X) Alimentação (Y)
3 1,5 80 25,0
5 2,0 100 40,0
10 6,0 100 35,0
10 7,0 100 40,0
20 10,0 120 30,0
20 12,0 120 40,0
20 15,0 140 40,0
30 8,0 150 50,0
40 10,0 180 40,0
50 20,0 180 50,0
60 20,0 200 60,0
70 25,0 200 50,0
70 30,0

a. Construa o diagrama de dispersão da variável gasto com alimentação (Y) em função da


renda familiar (X).
b. A que conclusões você consegue chegar sobre a relação entre a renda familiar e os
gastos com alimentação?

23. Foi observada uma amostra de 20 empresas segundo o número de empregados e a receita
anual da empresa. Sendo o coeficiente de correlação de Pearson, aproximadamente, 0,82 e
analisando o diagrama de dispersão a seguir, qual a conclusão da relação entre a receita e o
porte da empresa?

9
Gráfico de dispersão para as variáveis número de
empregados e receita anual da empresa

24. Muitas pessoas nos Estados Unidos acreditam que os criminosos que se confessam culpados
tendem a sofrer penas mais leves do que os que são condenados em julgamento. Considere
na tabela seguinte os dados de acusados de roubo em São Francisco, EUA. Verifique se existe
evidência de associação entre a sentença e a alegação do acusado. Qual sua conclusão?
Justifique sua resposta com base no cálculo do coeficiente apropriado.

Alegação do acusado
Sentença Total
Culpado Inocente
Enviado à prisão 392 58 450
Mantido em liberdade 564 14 578
Total 956 72 1028

25. O que pode ser dito da associação entre a idade que o indivíduo começou a trabalhar com a
série em que parou de estudar? Justifique sua resposta.

Série Total
Idade do início do trabalho
Fundamental Médio
16 anos ou menos 182 57 239
mais de 16 anos 18 43 61
Total 200 100 300

10

Você também pode gostar