Você está na página 1de 17

—————————————————————————————————————————

TÓPICOS DE MATEMÁTICA E ESTATÍSTICA


Licenciatura em Solicitadoria e Administração

Caderno de exercícios de Estatística com soluções (v.3)


—————————————————————————————————————————

Parte I – Estatística Descritiva

1. Foi feita uma auditoria às faturas emitidas pela empresa ABC em 2017, para analisar os
erros de …xação de preços. Para tal foram selecionadas as últimas 50 faturas emitidas em
2017, registando-se os seguintes números de erros de …xação de preços por fatura:
0 0 2 1 4 1 0 4 3 2
2 0 3 1 1 4 0 3 1 5
1 1 0 2 0 0 1 0 4 3
0 2 0 2 1 4 3 1 0 0
5 1 2 0 3 0 2 0 0 3
concretamente, já com as contagens feitas:

N.o de erros 0 1 2 3 4 5
o
N. de faturas 17 11 8 7 5 2

Parte 1: Generalidades, tabelas e grá…cos


(a) Identi…que a população e a amostra. Indique o tamanho da amostra.
(b) Identi…que a variável em estudo. De que tipo é?
(c) Para a construção da tabela e do grá…co de frequências, acha que estes dados devem
ser agrupados? Apresente uma justi…cação breve.
(d) Obtenha a tabela de frequências.
(e) Faça o grá…co de barras para as frequências absolutas.
(f) Indique a percentagem de faturas que tem:
i. 5 erros; ii. 2 ou menos erros; iii. pelo menos 1 erro.

Parte 2: Medidas resumo e sua interpretação


(g) Calcule e interprete a média, a moda e a mediana.
(h) Trace o diagrama de extremos e quartis, determinando, previamente, as medidas
necessárias para tal.
(i) Identi…que e interprete o percentil 95.
(j) Calcule a amplitude de variação e a amplitude interquartil.
(k) Determine e interprete, ainda que, de modo informal, o desvio-padrão.
(l) Determine e comente o coe…ciente de variação.

Página 1 de 17
(m) Calcule o coe…ciente de assimetria de Bowley.
(n) Com base nas alíneas anteriores, classi…que quanto à forma a distribuição desta
variável. Justi…que.
Parte 3: Questões …nais
(o) Diga, justi…cando, se esperava o tipo de assimetria que indicou na alínea anterior.
(p) Acha que a média é su…ciente para resumir a distribuição do número de erros por
fatura? Fundamente a sua resposta.
(q) Pode extrapolar a análise que fez nas alíneas anteriores para a população em estudo?
Apresente uma justi…cação breve.
(r) Atendendo ao cenário de erros detetado no …nal de 2017, para 2018 foi estabelecido
o seguinte objetivo: "Pelo menos, 75% das faturas têm que ter 0 erros e 99% têm
que ter, no máximo, 2 erros.". Traduza este objetivo em termos de percentis.

2. Os dados seguintes dizem respeito a uma amostra dos tempos, em minutos, de deslocação
de casa para o emprego de 100 colaboradores de um grande escritório localizado no centro
de Lisboa.

Os dados originais:
44,0 35,4 28,4 37,0 46,0 35,4 19,4 20,4 56,4 43,2
36,2 38,4 49,2 31,8 86,4 12,6 27,4 14,0 39,4 39,4
15,8 28,8 38,0 44,0 38,4 74,0 23,0 11,4 39,8 30,2
29,2 40,6 49,6 30,4 12,2 113,8 42,0 47,0 32,4 39,2
35,2 56,4 31,0 45,0 90,2 100,0 39,0 37,0 49,4 28,2
12,6 27,0 47,8 52,6 41,0 40,0 28,0 23,6 37,6 37,8
30,0 45,8 18,0 41,0 22,6 24,2 89,6 90,4 43,0 29,8
56,2 24,8 12,6 53,6 115,4 16,2 39,0 40,8 33,6 39,4
45,6 37,4 18,0 50,6 103,4 52,4 20,2 64,6 22,2 60,0
42,2 42,0 16,2 108,2 44,0 42,6 39,4 37,6 41,4 40,4

Os mesmos dados mas agora ordenados:


11,4 12,2 12,6 12,6 12,6 14,0 15,8 16,2 16,2 18,0
18,0 19,4 20,2 20,4 22,2 22,6 23,0 23,6 24,2 24,8
27,0 27,4 28,0 28,2 28,4 28,8 29,2 29,8 30,0 30,2
30,4 31,0 31,8 32,4 33,6 35,2 35,4 35,4 36,2 37,0
37,0 37,4 37,6 37,6 37,8 38,0 38,4 38,4 39,0 39,0
39,2 39,4 39,4 39,4 39,4 39,8 40,0 40,4 40,6 40,8
41,0 41,0 41,4 42,0 42,0 42,2 42,6 43,0 43,2 44,0
44,0 44,0 45,0 45,6 45,8 46,0 47,0 47,8 49,2 49,4
49,6 50,6 52,4 52,6 53,6 56,2 56,4 56,4 60,0 64,6
74,0 86,4 89,6 90,2 90,4 100,0 103,4 108,2 113,8 115,4

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 2 de 17
(a) Identi…que a variável em estudo. De que tipo é?
(b) De modo a conseguir responder às perguntas da alínea seguinte, agrupe os dados em
classes e construa a tabela de frequências.
(c) Responda às seguintes questões:
i. Quantos colaboradores demoram menos de 1 hora de casa para o emprego?
ii. Quantos colaboradores demoram pelo menos 30 minutos e menos de 45 minutos
de casa para o emprego?
iii. Qual é a percentagem de colaboradores que demora 1 horas e 45 minutos ou
mais de casa para o emprego?
(d) Sabendo adicionalmente que para a variável em estudo
P
100 P
100
xi = 4174;00 e x2i = 222985;4 ,
i=1 i=1

calcule e comente o coe…ciente de variação.


(e) Atendendo à tabela de frequências que construiu, sabendo que dentre os seis valores
indicados seguidamente, três são os quartis, identi…que-os e interprete-os.
(A) 14; 2 (B) 28; 6 (C) 39; 1 (D) 45; 9 (E) 70; 35 (F) 110; 2
(f) Trace o diagrama de extremos e quartis.
(g) Diga, justi…cando, se há outliers. Em caso a…rmativo, liste-os e classi…que-os.
(h) Calcule o coe…ciente de assimetria de Bowley.
(i) Sabendo adicionalmente que o coe…ciente de assimetria de Fisher-Pearson, CAFP , é
igual a 1;53, como é que classi…ca forma da distribuição aos tempos de deslocação
de casa para o emprego? Justi…que a sua resposta.

3. Relativamente aos trabalhadores de uma grande empresa de construção civil, o quadro


seguinte contém o número de acidentes sofridos por trabalhador no ano passado para uma
amostra de 100 trabalhadores.
N.o de acidentes N.o de trabalhadores
0 15
1 15
2 28
3 20
4 16
5 6

(a) Identi…que a variável em estudo.


(b) Calcule e interprete a média, a moda e a mediana.
(c) Determine o 1.o e o 3.o quartil. Interprete-os.
(d) Obtenha o diagrama de extremos e quartis.
(e) Calcule o coe…ciente de assimetria de Bowley.

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 3 de 17
(f) Atendendo às alíneas anteriores, considera simétrica ou assimétrica a distribuição do
número de acidentes sofridos por trabalhador no ano passado? Justi…que.
(g) Calcule a amplitude de variação e a amplitude interquartil.
(h) Calcule e interprete o desvio-padrão.
(i) Determine o coe…ciente de variação e, com base nele, comente a representatividade
da média como medida estatística.
(j) Este registo de acidentes foi considerado preocupante pela administração da em-
presa. Nesta perspetiva, qual das seguintes opções deve traduzir o objetivo para a
distribuição do número de acidentes por trabalhador para este ano? Justi…que a sua
opção.
(A) x > 1 e CV > 50%
(B) x < 1 e CV > 50%
(C) x > 1 e CV < 50%
(D) x < 1 e CV < 50%

4. O departamento de Recursos Humanos de uma empresa pretende analisar a distribuição


do número de faltas (dias completos) por funcionário no passado mês de setembro. Para
tal, recolheu a informação, que se apresenta abaixo, relativamente a todos os 40 fun-
cionários que faltaram nesse mês. Esses registos são apresentados agrupados na tabela
abaixo, onde também constam alguns cálculos auxiliares.

i xi ni fi Ai ni xi ni x2i
1 1 9 0;225 0;225 9 9
2 2 8 0;2 0;425 16 32
3 3 5 0;125 * (2) * 15 45
4 4 4 0;1 0;65 16 64
5 5 6 0;15 0;8 30 * (4) *
6 6 3 * (1) * 0;875 18 108
7 7 1 0;025 0;9 7 49
8 22 4 0;1 1 * (3) * 1936
Totais: 40 1 199 2393

(a) Atendendo ao objetivo descrito do estudo, o conjunto de dados que está a ser ana-
lisado deve ser classi…cado como população ou amostra? Justi…que.
(b) Identi…que a variável em estudo. De que tipo é?
(c) Complete a tabela apresentada, indicando os cálculos que efetuou.
(d) Calcule e interprete a média, a moda e a mediana.
(e) Determine o 1.o e o 3.o quartil. Interprete-os.
(f) Obtenha o diagrama de extremos e quartis.
(g) Esta distribuição tem outliers? Em caso a…rmativo, diga quais são.

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 4 de 17
(h) Se tivesse que escolher uma das seguintes medidas de localização, média, moda ou
mediana, para ilustrar a tendência central dos dados sobre o número de faltas por
funcionário no mês em estudo, qual escolheria? Justi…que a sua opção, considerando
também as suas respostas às alíneas anteriores.

5. Considere os seguintes diagramas de extremos e quartis relativos aos salários anuais dos
homens e mulheres que trabalham num mesmo setor de atividade.

Concorda com a a…rmação “A percentagem de homens que ganha um salário anual supe-
rior a 11250 euros é consideravelmente superior à das mulheres.”? Justi…que, indicando,
a partir dos diagramas fornecidos, os valores (aproximados) dos quartis em causa.

6. Um banco tem à disposição dos seus clientes duas zonas de atendimento geral –Zona 1 e
Zona 2 –cada uma com duas pessoas a fazer atendimento. Na Zona 1, os clientes formam
…la única e, na Zona 2, fazem …las separadas.
Em cada uma das zonas, registaram-se, por amostragem, os seguintes tempos de espera,
em minutos, até atendimento:

Zona 1 4;0 4;0 4;9 5;1 5;4 5;4 5;7 5;8 5;8 5;8
Zona 2 2;0 2;2 2;2 4;5 5;4 5;4 5;8 5;8 5;8 12;8

(a) Organize os dados em dois quadros de frequências, um para cada uma das zonas.
(b) Calcule a média, a moda e a mediana para os tempos de espera na Zona 1. Faça,
agora, os cálculos para a Zona 2.
(c) Determine o coe…ciente de variação para os tempos de espera na Zona 1. Repita
para a Zona 2.

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 5 de 17
(d) Com base nestes dados e admitindo que os clientes priviligiam tempos de espera
mais previsíveis, que conselho daria ao banco quanto ao método a usar, …la única ou
…las separadas? Justi…que.

Parte II – Correlação e Regressão Linear

7. Com o objetivo de estudar a relação entre o volume de vendas (y) efetuadas durante um
dado período de tempo por um vendedor e o seu número de anos de experiência (x),
considerou-se uma amostra de 15 vendedores. Os valores das vendas (yi , em milhares
de euros) efetuadas pelos vendedores da empresa e os respetivos anos de experiência (xi )
estão disponíveis na tabela seguinte.
xi 9 6 4 3 3 5 8 2 7 4 10 7 6 5 3
yi 6 5 3 1 4 3 6 2 4 2 7 4 3 3 1

(a) Comente o diagrama de dispersão seguinte obtido a partir dos dados fornecidos.

(b) Considere a tabela abaixo de cálculos auxiliares obtida a partir dos dados fornecidos.
i xi yi x2i yi2 xi yi
1 9 6 81 36 54
2 6 5 36 25 30
3 4 3 16 9 12
4 3 1 9 1 3
5 3 4 9 16 12
6 5 3 25 9 15
7 8 6 64 36 48
8 2 2 4 4 4
9 7 4 49 16 28
10 4 2 16 4 8
11 10 7 100 49 70
12 7 4 49 16 28
13 6 3 36 9 18
14 5 3 25 9 15
15 3 1 9 1 3
Totais 82 54 528 240 348
Calcule e comente o coe…ciente de correlação linear.

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 6 de 17
(c) Determine a equação da reta de regressão (ou reta dos mínimos quadrados) de y
sobre x.
(d) Pronuncie-se quanto à qualidade do ajustamento.
(e) Interprete o valor obtido para o coe…ciente da variável explicativa (ou seja, o declive
da reta).
(f) Obtenha uma previsão para o volume de vendas de um vendedor com 8 anos de
experiência.

8. Foram fornecidos os seguintes dados relativos à evolução do custo unitário médio de


produção (y, em euros) e do número de trabalhadores (x) de uma empresa ao longo de
oito anos consecutivos. No quadro abaixo encontram-se os dados disponíveis bem como
alguns cálculos auxiliares:

i xi yi x2i yi2 xi yi
1 120 12 14400 144 1440
2 125 14;5 15625 210;25 1812;5
3 146 15;2 21316 231;04 2219;2
4 124 13;6 15376 184;96 1686;4
5 110 11;2 12100 125;44 1232
6 94 8;4 8836 70;56 789;6
7 98 8;4 9604 70;56 823;2
8 108 10;8 11664 116;64 1166;4
Totais 925 94;1 108921 1153;45 11169;3

P
8 P
8 P
8 P
8 P
8
(a) Indique: xi , yi , x2i , yi2 e xi yi .
i=1 i=1 i=1 i=1 i=1

(b) Determine: x, sx , y e sy .
(c) Calcule o coe…ciente de correlação linear e interprete o valor obtido.
(d) Determine a equação da reta de regressão de y em x que se ajusta aos dados.
(e) Interprete o valor obtido para o coe…ciente da variável explicativa.
(f) Pronuncie-se quanto à qualidade do ajustamento.
(g) Admitindo que no nono ano o número de trabalhadores será 105, qual é o valor
previsto para o custo unitário médio de produção nesse ano?

9. A administração de uma cadeia de lojas, todas com dimensão semelhante e oferecendo


o mesmo tipo de produtos, pretende analisar a relação entre o número de clientes (x)
que …zeram compras numa semana e as vendas (y), em milhares de euros, nessa semana.
Para tal selecionou uma amostra aleatória de 20 lojas, a partir de todas as lojas do
grupo, recolhendo a informação relativa às duas variáveis a analisar. Os cálculos efetuados
permitiram, então, obter:
P
20 P
20 P
20
x = 731;15 , sx = 179;854 , yi = 176;11 , yi2 = 1602;097 e xi yi = 134127;9 .
i=1 i=1 i=1

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 7 de 17
(a) Comente o diagrama de dispersão seguinte obtido a partir dos dados recolhidos.

(b) Calcule o coe…ciente de correlação linear. O valor obtido é coerente com o que
observou na alíena anterior? Justi…que.
(c) Obtenha a equação da reta de regressão de y sobre x que se ajusta aos dados.
(d) Pronuncie-se quanto à qualidade do ajustamento.
(e) Interprete o valor obtido para o coe…ciente da variável explicativa.
(f) Obtenha uma previsão para as vendas de lojas dessa cadeia que tenham 1000 clientes
numa semana.

10. Com o objetivo de estudar a relação entre a quilometragem (x) de um carro usado e o
seu preço de venda (y), considerou-se uma amostra de 14 carros. Tendo sido registada
a quilometragem (xi , em milhares de quilómetros) dos carros e o respetivo preço (yi , em
milhares de euros), obtive-se o seguinte diagrama de dispersão

e também os seguintes totais:


P
14 P
14 P
14 P
14 P
14
xi = 505 , yi = 216 , x2i = 21825 , yi2 = 3996 e xi yi = 6400 .
i=1 i=1 i=1 i=1 i=1

(a) Descreva a relação entre as variáveis em estudo que observa no diagrama de dispersão.
(b) Calcule o coe…ciente de correlação linear. O valor obtido é consistente com o que
observou na alínea anterior? Justi…que.
(c) Obtenha a equação da reta de regressão de y sobre x que se ajusta aos dados.
(d) Pronuncie-se quanto à qualidade do ajustamento.
(e) Interprete o valor obtido para o coe…ciente da variável explicativa.
(f) Obtenha uma previsão para o preço de um carro usado que tenha 45000 km.

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 8 de 17
SOLUÇÕES:

1. (a) população –todas as faturas emitidas pela empresa ABC em 2017


amostra –últimas 50 faturas emitidas pela empresa ABC em 2017
tamanho da amostra n = 50
(b) x número de erros de …xação de preços (por fatura)
É uma variável quantitativa discreta.
(c) Não. O principal objetivo do agrupamento dos dados é melhorar a legibilidade de
tabelas e grá…cos mas tem, como desvantagem, a perda de informação. Neste caso
não se justi…ca o agrupamento, pois o número de valores distintos observados é de
apenas 6. Portanto, uma tabela/grá…co para estes dados tem 6 linhas/barras, um
número reduzido que não causa problemas de legibilidade.
(d) Tabela de frequências e de cálculos auxiliares para as alíneas (f) e (j)
i xi ni fi Ai ni xi ni x2i
1 0 17 0;34 0;34 0 0
2 1 11 0;22 0;56 11 11
3 2 8 0;16 0;72 16 32
4 3 7 0;14 0;86 21 63
5 4 5 0;1 0;96 20 80
6 5 2 0;04 1 10 50
Totais 50 1 78 236
(e)

(f) i. 4%
ii. 72%
iii. 66%
(g) x 1;56 ! Cada fatura desta amostra tem, em média, 1;56 erros.
M o = 0 ! 0 erros é o número de erros por fatura que é observado com mais
frequência nesta amostra.
M e = 1 ! Pelo menos 50% das faturas desta amostra tem 1 ou menos erros.

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 9 de 17
(h) Mínimo = 0 (erros); Q1 = 0 (erros); Q2 = M e = 1 (erro); Q3 = 3 (erros);
Máximo = 5 (erros)

(i) P95 = 4 ! Interpretação padrão: Pelo menos 95% das faturas desta amostra tem
4 ou menos erros. Interpretação alternativa mais adaptada a este caso concreto:
Aproximadamente 95% das faturas desta amostra tem no máximo 4 erros.
(j) AV = 5 (erros); AIQ = 3 (erros)
(k) sc 1; 53 ! Nesta amostra, o "desvio típico" é de 1;53 erros relativamente à média
de erros por fatura.
(l) CV 98; 1% ! Nesta amostra, a dispersão dos dados relativamente à média é
grande, concretamente, é de 98; 1% do valor da média. Assim, como é superior a
50%, …ca em causa a representatividade da média como medida de tendência central,
pois há um afastamento considerado grande dos dados relativamente à média.
(m) CA 0;33
(n) Para esta amostra, atendendo a que CA > 0, pode dizer-se que a distribuição do
número de erros de …xação de preços por fatura é assimétrica positiva. Tal é con-
sistente com a ordenação das medidas de tendência central, já que M o < M e < x.
Esta assimetria positiva é também evidente a partir da observação do diagrama de
extremos e quartis, que é claramente assimétrico relativamente à mediana, com uma
maior concentração das observações do lado esquerdo da mediana (i.e., nos valores
mais baixos observados) e com as observações mais espalhadas do lado direito da
mediana (i.e., uma cauda mais comprida para os valores mais altos observados).
(o) Sim, pois espera-se que haja muitas faturas com nenhum (que é o mínimo) ou muito
poucos erros e poucas faturas com alguns erros, ou seja, espera-se uma distribuição
mais concentrada nos valores mais baixos (i.e., à esquerda) e mais espalhada nos
valores mais altos (i.e., à direita), portanto, espera-se assimetria positiva. Estranho
seria encontrar assimetria negativa ou mesmo simetria.
(p) Não. Neste caso, a indicação apenas da média para representar estes dados apresenta
dois problemas, um relacionado com dispersão e outro com a assimetria.
Quando se comunica a média, a tendência de quem recebe a informação é pensar que
os dados estão relativamente próximos dela. No entanto, neste caso, atendendo ao
coe…ciente de variação calculado, percebe-se que a dispersão dos dados foi conside-
rada ser relativamente grande. Assim, a média deve ser companhada de uma medida
de dispersão ou, eventualmente, de algum percentil relevante.
Quando se comunica a média, quem recebe a informação também tem tendência a
pensar que os dados se distribuem de igual forma à sua esquerda e à sua direita. Ora,
neste caso, como a distribuição é assimétrica, isso não acontece (M e < x). Assim,
para além da média deve ser também dada a mediana.

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 10 de 17
(q) Neste caso, tudo indica que não é possível extrapolar da amostra para a população
as medidas calculadas (nem as interpretações que delas possam ser feitas), visto que
a amostra não deve ser aleatória, pois é constituída pelas últimas 50 faturas, …cando
em causa a sua representatividade.
(r) O percentil 75 (i.e., o 3.o quartil) tem que ser igual a 0 e o percentil 99 tem que ser
menor ou igual a 2, ou seja, Q3 = 0 e P99 2.

2. (a) x tempo, em minutos, de deslocação de casa para o emprego (por colaborador)


É uma variável quantitativa contínua.
(b) O número de classes sugerido pela regra de Sturges para agrupar os dados é:

ln (100)
n.o de classes 1 + log2 (100) = 1 + 8.
ln (2)

A menor observação (i.e., o mínimo) é M in = 11;4 minutos e a maior observação


(i.e., o máximo) é M ax = 115;4 minutos. Assim, como primeira abordagem ao valor
da amplitude, temos:
115;4 11;4
amp = = 13 (minutos) .
8
No entanto, como a variável em estudo é tempo de deslocação medido em minutos
e atendendo às questões colocadas na alínea seguinte, parece ser mais adequado
considerar a primeira classe a começar em 0 minutos e a amplitude das classes de 15
minutos. Desta forma vem:

i Classei ni fi Ai
1 [0 ; 15[ 6 0;06 0;06
2 [15 ; 30[ 22 0;22 0;28
3 [30 ; 45[ 44 0;44 0;72
4 [45 ; 60[ 16 0;16 0;88
5 [60 ; 75[ 3 0;03 0;91
6 [75 ; 90[ 2 0;02 0;93
7 [90 ; 105[ 4 0;04 0;97
8 [105 ; 120[ 3 0;03 1
Totais 100 1

(c) i. 88 colaboradores
ii. 44
iii. 3%
(d) x = 41;74; s 22;19; CV 53;16%
O "desvio típico" dos tempos relativamente ao tempo médio de deslocação é de cerca
de pouco mais de 50%, um valor que se pode dizer que começa a pôr em causa a
representatividade da média como medida de tendência central dos dados.

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 11 de 17
(e) Q1 = 28;6 e Q2 = M e = 39;1 (pois Q1 Q2 e, analisando os Ai , percebe-se que
Q1 ; Q2 2 A3 = [30 ; 45[);
Q3 = 45;9 (pois, analisando os Ai , percebe-se que Q3 2 A4 = [45 ; 60[);
Relativamente à amostra recolhida, na deslocação de casa para o trabalho, aproxi-
madamente:
– 25% dos colaboradores demoram menos do que 28;60 minutos;
– 50% dos colaboradores demoram menos do que 39;10 minutos;
– 75% dos colaboradores demoram menos do que 45;90 minutos.
(f)

(g) Q1 = 28;6
Q3 = 45;9
AIQ = Q3 Q1 = 17;3
BEI = Q1 3 AIQ = 23;3
BII = Q1 1;5 AIQ = 2;65
M in = 11;4
Como M in > BII, então não há outliers na cauda esquerda.
BIS = Q3 + 1;5 AIQ = 71;85
BES = Q3 + 3 AI = 97;8
M ax = 115;4
Na cauda direita há outliers, concretamente:
– os outliers moderados são valores observados maiores do que BIS e menores do
que BES, portanto, são os seguintes registos: 74;0; 86;4; 89;6; 90;2; 90;4;
– os outliers severos são valores observados maiores ou iguais a BES, portanto,
são os seguintes registos: 100;0; 103;4; 108;2; 113;8; 115;4.
(h) CAB 0;21
(i) Algumas notas prévias:
– CAB < 0 (no seu cálculo não se consideram todos os dados)
– CAFP > 0 (no seu cálculo consideram-se todos os dados)
– M e = 39;1 < x = 41;74
– Só há outliers na cauda direita.
O coe…ciente de assimetria de Bowley aponta para uma assimetria negativa e, real-
mente, olhando apenas para a parte da "caixa" do diagrama de extremos e quartis
(i.e., para a parte entre o 1.o e o 3.o quartil), o que se vê é que os dados estão ligeira-
mente mais espalhados para o lado esquerdo da mediana, o que é consistente com a
assimetria negativa.

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 12 de 17
No entanto, olhando para todo o diagrama de extremos e quartis, atendendo a que
o coe…ciente de assimetria de Fisher-Pearson é positivo, ao facto da mediana ser
inferior à média e ainda ao facto de apenas existirem outliers na cauda direita (não
havendo qualquer motivo para os deixar de fora da análise), deve classi…car-se a
distribuição dos tempos de deslocação como assimétrica positiva.

3. i xi ni fi Ai ni xi ni x2i
1 0 15 0;15 0;15 0 0
2 1 15 0;15 0;3 15 15
3 2 28 0;28 0;58 56 112
4 3 20 0;2 0;78 60 180
5 4 16 0;16 0;94 64 256
6 5 6 0;06 1 30 150
Totais 100 1 225 713

(a) x número de acidentes sofridos no ano passado (por trabalhador)


(b) x = 2;25; M o = 2; M e = 2
Assim, relativamente à amostra considerada:
– cada trabalhador sofreu, em média, 2;25 acidentes no ano passado;
– 2 foi o número mais frequente de acidentes por trabalhador no ano passado;
– pelo menos 50% dos trabalhadores tiveram 2 ou menos acidentes no ano passado.
(c) Q1 = 1; Q3 = 3
Assim, relativamente à amostra considerada:
– pelo menos 25% dos trabalhadores tiveram 1 ou menos acidentes no ano passado;
– pelo menos 75% dos trabalhadores tiveram 3 ou menos acidentes no ano passado.
(d)

(e) CAB = 0
(f) Relativamente à amostra considerada, a distribuição do número de acidentes sofridos
por trabalhador no ano passado é aproximadamente simétrica, pois CA = 0, com
uma ligeira assimetria positiva, que se pode observar no diagrama de extremos e
quartis, cuja cauda direita se prolonga mais do que a cauda esquerda.
(g) AV = 5 (acidentes); AIQ = 2 (acidentes)
(h) sc 1;45
Assim, relativamente à amostra considerada, o "desvio típico" do número de aci-
dentes relativamente à média é de 1;45 acidentes. Embora com algum abuso de
linguagem, isto signi…ca que, em média, os trabalhadores tiveram 1;45 acidentes a
mais ou a menos do que o número de acidentes médio (que é 2;25 acidentes).

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 13 de 17
(i) CV 64;23%
Atendendo a que CV > 50%, pode considerar-se que a dispersão relativa é elevada
e, consequentemente, há uma pequena representatividade da média como medida de
tendência central. Isso signi…ca que, caso a média seja usada, deve necessariamente
ser acompanhada de outras medidas de estatística descritiva, em princípio e pelo
menos, uma medida de dispersão.
(j) De entre as quatro opções apresentadas, deve ser escolhida a opção D, pois clara-
mente que se quer que, em média, cada trabalhador tenha menos de 1 acidente
(logo x < 1) e que se pretende que esta média seja representativa como medida de
tendência central (portanto, CV < 50%).

4. (a) Como se pretende apenas analisar as faltas por funcionário do passado mês de setem-
bro e foi recolhida informação relativamente às faltas a todos os funcionários faltosos,
então este conjunto de dados deve ser classi…cado como uma população.
(b) x número de faltas, em dias completos, no mês passado de setembro (por traba-
lhador faltoso)
É uma variável qualitativa discreta.
(c) (1) f6 = 3=40 = 0;075
(2) A3 = 0;125 + 0;425 = 0;55
(3) n8 x8 = 4 22 = 88
(4) n5 x25 = 6 52 = 150
(d) x = 4;98; M o = 1; M e = 3
Em média, cada trabalhador faltoso esteve ausente (aproximadamente) 5 dias no
mês em análise.
1 foi o número mais frequente de faltas por trabalhador faltoso no mês em análise.
Pelo menos 50% dos trabalhadores faltosos deram 3 ou menos faltas no mês em
análise.
(e) Q1 = 2; Q3 = 5
Pelo menos 25% dos trabalhadores faltosos deram 2 ou menos faltas no mês em
análise.
Pelo menos 75% dos trabalhadores faltosos deram 5 ou menos faltas no mês em
análise.
(f)

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 14 de 17
(g) Q1 = 2
Q3 = 5
AIQ = Q3 Q1 = 3
BEI = Q1 3 AIQ = 7
BII = Q1 1;5 AIQ = 2;5
M in = 1
Como M in > BII, então não há outliers na cauda esquerda.
BIS = Q3 + 1;5 AIQ = 9;5
BES = Q3 + 3 AI = 14
M ax = 22
Na cauda direita:
– não há outliers moderados, pois não há valores observados maiores do que BIS
e menores do que BES;
– há outliers severos, que são os 4 registos de 22 faltas.
(h) A medida de localização que melhor ilustra a tendência central dos dados sobre o
número de faltas por funcionário faltoso no mês em estudo é a mediana. As razões
são: (i) a assimetria da distribuição dos dados, que faz com que a três medidas não
coincidam, tendo-se, neste caso, M o < M e < x; (ii) os valores extremos discrepantes
observados, ou seja, os outliers, com registos de 22 dias de faltas, quando o valor
imediatamente inferior registado é de apenas 7 faltas, o que afeta fortemente o valor
da média fazendo-a, neste caso, coincidir com o 3.o quartil; (iii) a moda que, neste
caso, é igual ao mínimo.

5. Sim, pois o 3.o quartil da distribuição dos salários das mulheres é aproximadamente igual
ao 1.o quartil da distribuição dos salários dos homens (Qmulheres
3 Qhomens
1 11250 e),
ou seja, 75% das mulheres recebe menos de 11250 euros mas esta percentagem baixa
para apenas 25% no caso dos homens (ou, dito de outra forma, apenas 25% das mulheres
recebe mais de 11250 euros mas esta percentagem sobe substancialmente para os 75% no
caso dos homens).

6. (a) Zona 1
i xi ni fi Ai ni xi ni x2i
1
4 2 0;2 0;2 8 32
2
4;9 1 0;1 0;3 4;9 24;01
3
5;1 1 0;1 0;4 5;1 26;01
4
5;4 2 0;2 0;6 10;8 58;32
5
5;7 1 0;1 0;7 5;7 32;49
6
5;8 3 0;3 1 17;4 100;92
Totais 10 1 51;9 273;75

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 15 de 17
Zona 2
i xi ni fi Ai ni xi ni x2i
1
2 1 0;1 0;1 2 4
2
2;2 2 0;2 0;3 4;4 9;68
3
4;5 1 0;1 0;4 4;5 20;25
4
5;4 2 0;2 0;6 10;8 58;32
5
5;8 3 0;3 0;9 17;4 100;92
6
12;8 1 0;1 1 12;8 163;84
Totais 10 1 51;9 357;01

(b) Zona 1: x = 5;19; M o = 5;8; M e = 5;4


Zona 2: x = 5;19; M o = 5;8; M e = 5;4
(c) Zona 1: sc 0;70; CV 13;46%
Zona 2: sc 3;12; CV 60;1%
(d) Os tempos de espera nas duas zonas de atendimento têm a mesma média, moda
e mediana, mas apresentam coe…cientes de variação (CV ) consideravelmente dife-
rentes, sendo o CV da Zona 1 (sistema …la única) muito mais baixo, o que signi…ca
que a magnitude da diferença dos tempos de espera na Zona 1 em relação à média é
menor (média mais representativa). Assim, na Zona 1, os clientes sabem mais com
o que podem contar em termos de tempo de espera, o que nos parece ser do agrado
dos clientes, logo sugerimos o sistema de …la única.

7. (a) A análise do diagrama de dispersão permite dizer que os dados recolhidos sugerem
que, entre os anos de experiência e as vendas:
– há uma associação (estatística) linear, já que os pontos parecem organizar-se
em torno de uma linha reta;
– a relação se pode descrever como forte, pois os pontos estão próximos dessa
reta imaginária;
– a associação é positiva, pois a reta imaginária tem declive positivo (o que indica
que quantos mais forem os anos de experiência, maiores são, tendencialmente,
as vendas);
– não aparentam existir outliers.
(b) x = 5;467 , sx = 2;386 , y = 3;6 , sy = 1;805 .
r = 0;875. O valor de r obtido, por estar entre 0;75 e 1, indica que a associação linear
entre as variáveis anos de experiência e vendas é positiva e forte, o que é coerente
com o que foi observado na alínea anterior.
(c) y = 0;662x 0;019
(d) r2 = 0;766. Assim, pode dizer-se que os anos de experiência explicam 76;6% da
variabilidade observada nas vendas. Logo, atendendo à alta percentagem de varia-
bilidade explicada pela regressão, estamos perante um bom ajustamento.
(e) m = 0;662. Estima-se que, por cada ano de experiência adicional de um vendedor,
as suas vendas aumentem, em média, 0;662 mil euros (ou seja, 662 euros).

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 16 de 17
(f) x = 8 anos; y^ = 5;277 mil euros (ou seja, 5277 euros).

P
8 P
8 P
8 P
8 P
8
8. (a) xi = 925 , yi = 94;1 , x2i = 108921 , yi2 = 1153;45 , xi yi = 11169;3 .
i=1 i=1 i=1 i=1 i=1

(b) x = 115;625 , sx = 16;767 , y = 11;763 , sy = 2;578 .


(c) r = 0;954 (comentário... ver 7.(b))
(d) y = 0;147x 5;234
(e) m = 0;147 (interpretação... ver 7.(e))
(f) r2 = 0;910 (interpretação... ver 7.(d))
(g) x = 105 trabalhadores; y^ = 10;201 euros (i.e., 10;20 e)

9. (a) (comentário... ver 7.(a))


(b) (x = 731;15 , sx = 179;854 ,) y = 8;806 , sy = 1;641
r = 0;955 (comentário... ver 7.(b))
(c) y = 0;009x + 2;226
(d) r2 = 0;912 (interpretação... ver 7.(d))
(e) m = 0;009 (interpretação... ver 7.(e))
(f) x = 1000 clientes; y^ = 11;226 mil euros (i.e., 11226 euros)

10. (a) (comentário... ver 7.(a))


(b) x = 36;071 , sx = 16;663 , y = 15;429 , sy = 7;143 .
r= 0;899 (comentário... ver 7.(b))
(c) y = 0;385x + 29;316
(d) r2 = 0;808 (interpretação... ver 7.(d))
(e) m = 0;385 (interpretação... ver 7.(e))
(f) x = 45 mil quilómetros; y^ = 11;991 mil euros (i.e., 11991 euros)

Joana Leite (ISCAC) – Tópicos de Matemática e Estatística (LSA) – Caderno de Exercícios de Estatística (v.3) Página 17 de 17

Você também pode gostar