Escolar Documentos
Profissional Documentos
Cultura Documentos
Módulo 13
Modelação Estatística e Previsão
1. Uma empresa fabrica peças que utilizam tubos de plástico e no mercado existem dois potenciais
fornecedores: A e B. Foram analisados os comprimentos (em cm) dos tubos em amostras dos dois
fornecedores que conduziram aos seguintes resultados.
(A) Na amostra do fornecedor A, mais de 50% das observações têm valor superior a 26cm;
(B) O 3º quartil da amostra do fornecedor A é inferior à mediana da amostra do fornecedor B;
(C) As duas amostras têm igual amplitude interquartil e amplitude total;
(D) 75% das observações da amostra do fornecedor B são inferiores a 26 cm.
EGER – Modelação Estatística e Previsão Ficha Nº 1
2. Considere o seguinte gráfico de barras correspondente a uma amostra de 100 observações da variável: X
- tipo de tecnologia de acesso utilizada no acesso à internet através da rede fixa.
3. Apresentam-se na tabela seguinte os dados obtidos através do registo de uma empresa. Das 2152
toneladas de matéria-prima adquiridas durante o último ano indica-se a sua proveniência e as respectivas
quantidades devolvidas aos fornecedores, por deficiência de fabrico:
Sabendo que chegou uma encomenda do fornecedor A, calcule a probabilidade da mesma ser devolvida.
4. O número de automóveis que passam, por minuto, numa portagem é uma variável aleatória X com
distribuição de Poisson. Considerando = 1 para 1 minuto, qual a probabilidade de passarem pelo menos
5 automóveis em 5 minutos?
(A) 0.5595 (B) 0.3840 (C) 0.6100 (D) 0.4405
Página 2
EGER – Modelação Estatística e Previsão Ficha Nº 1
Grupo A Grupo B
Quantidade de peças 45 30
Peso médio (g) 500 400
Desvio-padrão do peso (g) 40 35
7. Uma máquina tem em média 4 avarias por cada turno de 8 horas. A probabilidade do tempo entre avarias
consecutivas ser superior a 5 horas é:
(A) 0.0183 (B) 0.9179 (C) 0.0821 (D) 0.1353
8. Na mesma situação que a da pergunta anterior e sabendo que não houve avarias nas primeiras 3 horas do
turno, a probabilidade de não haver avarias no turno é:
(A) 0.0183 (B) 0.9179 (C) 0.0821 (D) 0.1353
9. Sabe-se que o atraso, em minutos, dos voos nas partidas de uma companhia aérea é uma variável aleatória
X com a seguinte função densidade de probabilidade:
1/12, 0 < 𝑥 < 12
𝑓(𝑥) = {
0, 𝑜𝑢𝑡𝑟𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑥
Sabendo que o atraso médio é 6 minutos, qual a probabilidade do próximo passageiro esperar mais do que
a média dos atrasos?
(A) 1 (B) 0.75 (C) 0.5 (D) 0.25
10. Considere que o tempo a velocidade do vento, num certo local, é bem modelada por uma distribuição de
Weibull com parâmetros k=3.9 e c=10. O valor médio da velocidade do vento e o desvio padrão são
respetivamente:
(A) 9.05 e 6.75 (B) 9.05 e 2.60 (C) 3.9 e 2.60 (D) 10 e 2.60
Página 3
EGER – Modelação Estatística e Previsão Ficha Nº 1
11. Em relação à pergunta anterior, se o parâmetro de forma k aumentar para 5, mantando-se c=10, qual das
seguintes afirmações é verdadeira:
(A) O valor médio não altera e a velocidade do vento apresenta maior dispersão
(B) Não altera o valor médio nem o desvio padrão da velocidade do vento
12. Sabe-se que o tempo de vida, em anos, de um determinado componente tem um comportamento normal.
O fabricante afirma que o tempo médio de vida é superior a 10 anos. Qual a ferramenta estatística que
escolheria para testar essa afirmação?
(A) H0: µ=10 vs H1: µ≠10 (B) H0: µ10 vs H1: µ>10
(C) H0: µ10 vs H1: µ<10 (D) nenhuma das anteriores
13. Um estudo de viabilidade para a instalação dum parque eólico permitiu estabelecer certos valores de
referência, entre os quais se destaca a verificação de um valor mínimo de 9 m/s, para o valor médio da
velocidade do vento. Realizou-se um teste de hipóteses adequado tendo-se obtido um p-value de 0.03. O
que se pode concluir?
(A) O valor médio da velocidade do vento respeita o valor de referência, ao nível de significância de 5%;
(B) O valor médio da velocidade do vento não respeita o valor de referência, ao nível de significância de 5%;
(C) O valor médio da velocidade do vento não respeita o valor de referência, ao nível de significância de 1%;
(D) Nada se pode concluir.
14. Considere os registos de sinistros de uma determinada companhia seguradora relativos a 2011.
Nº de sinistros 0 1 2 3 4 5
Nº de apólices 3 859 3 462 450 26 4 0
a) Qual é a média do número de sinistros? Qual a proporção de apólices com número de sinistros abaixo
da média?
b) Com o objetivo de analisar o número de acidentes com o fator idade (em anos) do condutor,
selecionaram-se as idades dos condutores que tiveram mais do que 2 acidentes no ano de 2011 tendo-se
obtido a seguinte tabela:
Idade 20 22 23 25 28 33 35 36 40
Frequência 2 3 4 6 4 3 3 2 3
i) Calcule a média e desvio padrão da idade dos condutores que tiveram mais do que 2 acidentes.
Interprete.
Página 4
EGER – Modelação Estatística e Previsão Ficha Nº 1
ii) Construa o gráfico de extremos-e-quartis para a idade dos condutores e diga, justificando, se se
trata ou não de uma assimetria e, em caso afirmativo, qual o seu tipo.
GWh (Gigawatt-hora)
Fontes de Dados: DGEG/MEE
Fonte: PORDATA
a) Considere a variável que representa o tipo de fonte renovável, utilizado para produção de energia
eléctrica em 2012. Qual a moda desta variável? O que indica este resultado?
b) Considere os seguintes resultados relativos à produção de energia eléctrica a partir de centrais
hidroeléctricas com capacidade inferior a 10MW:
Min. 1st Qu. Median Mean 3rd Qu. Max.
516.0 533.2 693.5 735.7 880.8 1088.0
Explique o que representam os valores dos quartis e da mediana.
16. Segundo estudos realizados no passado estimou-se a velocidade média do vento, num certo local, tendo-se
obtido 9 m/s.
Assumindo que a velocidade do vento se caracteriza bem por uma distribuição de Rayleigh, determine:
a) O parâmetro caracterizador da distribuição.
b) A probabilidade de que a velocidade do vento se encontre entre 7 e 10 m/s?
17. A vida em horas de uma unidade de processamento de um computador, CPU, é bem modelada por uma
distribuição de Weibull com parâmetros 𝑘 = 3 𝑒 𝑐 = 900 ℎ𝑜𝑟𝑎𝑠.
a) Determinar a vida esperada da unidade de CPU, em horas;
b) Determinar a variância da vida da unidade CPU, em horas;
c) Qual a probabilidade de que a unidade de CPU falhe entre as 500 e as 700 horas de funcionamento?
Página 5
EGER – Modelação Estatística e Previsão Ficha Nº 1
18. Um fabricante de computadores garante substituir por novos, todos os computadores que se avariem nos
dois primeiros anos após a data da compra. Admite-se que o tempo de vida destes computadores são
variáveis independentes e identicamente distribuídas com uma distribuição normal com valor esperado de
42 meses e desvio padrão de 10 meses.
a) Qual a proporção de computadores que o fabricante pode ter que substituir?
b) Qual deve ser a garantia, de maneira a que no máximo, 1% dos computadores são substituídos?
c) O tempo de vida do mesmo tipo de componentes noutro fabricante (fabricante B) também segue uma
distribuição normal com valor esperado de 40 meses e desvio padrão de 8 meses. Usando a mesma garantia
de dois anos, qual dos dois fabricantes substitui mais componentes?
19. Num processo produtivo determinadas tarefas podem ser realizadas através de operadores. Estes afirmam
que o tempo médio de execução das tarefas é de 10 minutos. Admita que o tempo de execução, em minutos,
pode ser considerado uma variável aleatória com distribuição normal. Para uma seleção de dez tarefas, o
estudo levou às seguintes observações:
Tarefa 1 2 3 4 5 6 7 8 9 10
X 4.1 5.0 4.9 5.3 13.5 12.0 19.2 10.0 24.1 6.9
A empresa suspeita que tempo médio de execução das tarefas é superior ao indicado pelos operadores.
Acha que a empresa tem razões para isso? Justifique, utilizando um nível de significância de 1%.
Página 6
EGER – Modelação Estatística e Previsão Ficha Nº 1
SOLUÇÕES
1 2 3 4 5 6 7 8 9 10 11 12 13
B C D A D B C C C B C B B
14. a) 𝑥̅ = 0.5712. A proporção de apólices com número de sinistros abaixo da média (com zero sinistros)
é aproximadamente 49,5%.
b) i) 𝑥̅ = 28.533; 𝑠 = 6.334.
Os condutores que tiveram mais do que dois acidentes, apresentam uma idade média de 28.533 anos. A
média é uma medida de localização central da amostra e representa o seu “ponto de equilíbrio” – é nula a
soma dos desvios das observações em relação à média.
O desvio padrão desta amostra é de 6.334 anos. Este valor representa a variabilidade em relação à média.
Neste caso o valor do desvio padrão não é muito elevado o que significa que não é grande a variabilidade
em torno da média.
ii)
15. a) Eólica. É a fonte de energia renovável com maior produção no ano de 2012.
b) A mediana é 693.5, o que significa que em metade dos anos observados a produção de energia a partir
deste tipo de fonte foi inferior ou igual a este valor. Em 25% dos anos observados, este tipo de produção
de energia eléctrica foi inferior ou igual a 533.2 (1º quartil) e em 25% dos anos foi superior ou igual a
880.8(3º quartil).
16. a) 7.181 b) 0.2426
17. a) 803.682 b) 85319.64 c) 0.218
18. a) 0.0359 b) 18.7 meses c) O fabricante A
19. Hipóteses a testar:
H0 : 10 vs Ha : 10
1) Nível de significância: 1%
2) Estatística de teste: neste caso concreto escolhe-se a distribuição T-student porque o parâmetro a testar
é o valor médio, a característica em estudo tem distribuição normal, a variância populacional é
desconhecida e a dimensão da amostra é inferior a 30.
𝑋̅−𝜇
3) 𝑆⁄ ∩ 𝑡(𝑛−1)
√𝑛
Página 7
EGER – Modelação Estatística e Previsão Ficha Nº 1
Página 8