Você está na página 1de 8

Pós-graduação em Engenharia e Gestão de ENERGIAS RENOVÁVEIS

Módulo 13
Modelação Estatística e Previsão

FICHA Nº 1 Estatística Descritiva


Variáveis Aleatórias e Distribuições Teóricas
Inferência Estatística

1. Uma empresa fabrica peças que utilizam tubos de plástico e no mercado existem dois potenciais
fornecedores: A e B. Foram analisados os comprimentos (em cm) dos tubos em amostras dos dois
fornecedores que conduziram aos seguintes resultados.

Qual das seguintes afirmações é verdadeira?

(A) Na amostra do fornecedor A, mais de 50% das observações têm valor superior a 26cm;
(B) O 3º quartil da amostra do fornecedor A é inferior à mediana da amostra do fornecedor B;
(C) As duas amostras têm igual amplitude interquartil e amplitude total;
(D) 75% das observações da amostra do fornecedor B são inferiores a 26 cm.
EGER – Modelação Estatística e Previsão Ficha Nº 1

2. Considere o seguinte gráfico de barras correspondente a uma amostra de 100 observações da variável: X
- tipo de tecnologia de acesso utilizada no acesso à internet através da rede fixa.

Qual é a moda desta distribuição?


(A) Não tem moda (B) 39,551% (C) ADSL (D) 58,796%

3. Apresentam-se na tabela seguinte os dados obtidos através do registo de uma empresa. Das 2152
toneladas de matéria-prima adquiridas durante o último ano indica-se a sua proveniência e as respectivas
quantidades devolvidas aos fornecedores, por deficiência de fabrico:

Fornecedor Quant. Fornecida (ton.) Devoluções (ton.)


A 605 20
B 721 30
C 826 55

Sabendo que chegou uma encomenda do fornecedor A, calcule a probabilidade da mesma ser devolvida.

(A) 0.190 (B) 0.281 (C) 0.009 (D) 0.033

4. O número de automóveis que passam, por minuto, numa portagem é uma variável aleatória X com
distribuição de Poisson. Considerando  = 1 para 1 minuto, qual a probabilidade de passarem pelo menos
5 automóveis em 5 minutos?
(A) 0.5595 (B) 0.3840 (C) 0.6100 (D) 0.4405

5. Sabe-se que a variável aleatória X tem distribuição de Poisson e que P( X = 2) = P( X = 3) . Então, o


desvio padrão e a probabilidade de X tomar um valor superior a dois são iguais, respectivamente, a:

(A) 3 e 0.4232 (B) 3 e 0.5768 (C) 3 e 0.4232 (D) 3 e 0.5768

Página 2
EGER – Modelação Estatística e Previsão Ficha Nº 1

6. As seguintes estatísticas amostrais foram calculadas em 2 grupos de peças (A e B):

Grupo A Grupo B
Quantidade de peças 45 30
Peso médio (g) 500 400
Desvio-padrão do peso (g) 40 35

Qual das seguintes afirmações é verdadeira?


(A) O grupo A tem menos variabilidade do que o grupo B porque o desvio padrão de A é maior.
(B) O grupo A tem menor variabilidade relativa do que o grupo B porque o coeficiente de variação de A é
menor.
(C) O grupo A tem mais variabilidade do que o grupo B porque a média de A é maior.
(D) O grupo A tem mais variabilidade do que o grupo B porque a dimensão da amostra A é maior.

7. Uma máquina tem em média 4 avarias por cada turno de 8 horas. A probabilidade do tempo entre avarias
consecutivas ser superior a 5 horas é:
(A) 0.0183 (B) 0.9179 (C) 0.0821 (D) 0.1353

8. Na mesma situação que a da pergunta anterior e sabendo que não houve avarias nas primeiras 3 horas do
turno, a probabilidade de não haver avarias no turno é:
(A) 0.0183 (B) 0.9179 (C) 0.0821 (D) 0.1353

9. Sabe-se que o atraso, em minutos, dos voos nas partidas de uma companhia aérea é uma variável aleatória
X com a seguinte função densidade de probabilidade:
1/12, 0 < 𝑥 < 12
𝑓(𝑥) = {
0, 𝑜𝑢𝑡𝑟𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑥
Sabendo que o atraso médio é 6 minutos, qual a probabilidade do próximo passageiro esperar mais do que
a média dos atrasos?
(A) 1 (B) 0.75 (C) 0.5 (D) 0.25

10. Considere que o tempo a velocidade do vento, num certo local, é bem modelada por uma distribuição de
Weibull com parâmetros k=3.9 e c=10. O valor médio da velocidade do vento e o desvio padrão são
respetivamente:
(A) 9.05 e 6.75 (B) 9.05 e 2.60 (C) 3.9 e 2.60 (D) 10 e 2.60

Página 3
EGER – Modelação Estatística e Previsão Ficha Nº 1

11. Em relação à pergunta anterior, se o parâmetro de forma k aumentar para 5, mantando-se c=10, qual das
seguintes afirmações é verdadeira:
(A) O valor médio não altera e a velocidade do vento apresenta maior dispersão
(B) Não altera o valor médio nem o desvio padrão da velocidade do vento

(C) A velocidade do vento apresenta menor dispersão


(D) Nenhuma das anteriores

12. Sabe-se que o tempo de vida, em anos, de um determinado componente tem um comportamento normal.
O fabricante afirma que o tempo médio de vida é superior a 10 anos. Qual a ferramenta estatística que
escolheria para testar essa afirmação?

(A) H0: µ=10 vs H1: µ≠10 (B) H0: µ10 vs H1: µ>10
(C) H0: µ10 vs H1: µ<10 (D) nenhuma das anteriores

13. Um estudo de viabilidade para a instalação dum parque eólico permitiu estabelecer certos valores de
referência, entre os quais se destaca a verificação de um valor mínimo de 9 m/s, para o valor médio da
velocidade do vento. Realizou-se um teste de hipóteses adequado tendo-se obtido um p-value de 0.03. O
que se pode concluir?
(A) O valor médio da velocidade do vento respeita o valor de referência, ao nível de significância de 5%;
(B) O valor médio da velocidade do vento não respeita o valor de referência, ao nível de significância de 5%;
(C) O valor médio da velocidade do vento não respeita o valor de referência, ao nível de significância de 1%;
(D) Nada se pode concluir.

14. Considere os registos de sinistros de uma determinada companhia seguradora relativos a 2011.

Nº de sinistros 0 1 2 3 4 5
Nº de apólices 3 859 3 462 450 26 4 0

a) Qual é a média do número de sinistros? Qual a proporção de apólices com número de sinistros abaixo
da média?
b) Com o objetivo de analisar o número de acidentes com o fator idade (em anos) do condutor,
selecionaram-se as idades dos condutores que tiveram mais do que 2 acidentes no ano de 2011 tendo-se
obtido a seguinte tabela:
Idade 20 22 23 25 28 33 35 36 40
Frequência 2 3 4 6 4 3 3 2 3

i) Calcule a média e desvio padrão da idade dos condutores que tiveram mais do que 2 acidentes.
Interprete.

Página 4
EGER – Modelação Estatística e Previsão Ficha Nº 1

ii) Construa o gráfico de extremos-e-quartis para a idade dos condutores e diga, justificando, se se
trata ou não de uma assimetria e, em caso afirmativo, qual o seu tipo.

15. Considere dados apresentados na tabela seguinte:


Produção de energia eléctrica a partir de fontes renováveis
Anos Hídrica Hídrica
Total Biomassa Eólica Geotérmica Fotovoltaica
> 10MW < 10MW
2007 16 851 9 927 522 2 140 4 037 201 24
2008 15 419 6 780 516 2 134 5 757 192 38
2009 19 314 8 108 901 2 384 7 577 184 160
2010 29 041 15 458 1 088 2 902 9 182 197 214
2011 24 985 11 294 820 3 219 9 162 210 280
2012 20 654 6 093 567 3 195 10 260 146 393

GWh (Gigawatt-hora)
Fontes de Dados: DGEG/MEE
Fonte: PORDATA

a) Considere a variável que representa o tipo de fonte renovável, utilizado para produção de energia
eléctrica em 2012. Qual a moda desta variável? O que indica este resultado?
b) Considere os seguintes resultados relativos à produção de energia eléctrica a partir de centrais
hidroeléctricas com capacidade inferior a 10MW:
Min. 1st Qu. Median Mean 3rd Qu. Max.
516.0 533.2 693.5 735.7 880.8 1088.0
Explique o que representam os valores dos quartis e da mediana.

16. Segundo estudos realizados no passado estimou-se a velocidade média do vento, num certo local, tendo-se
obtido 9 m/s.
Assumindo que a velocidade do vento se caracteriza bem por uma distribuição de Rayleigh, determine:
a) O parâmetro caracterizador da distribuição.
b) A probabilidade de que a velocidade do vento se encontre entre 7 e 10 m/s?

17. A vida em horas de uma unidade de processamento de um computador, CPU, é bem modelada por uma
distribuição de Weibull com parâmetros 𝑘 = 3 𝑒 𝑐 = 900 ℎ𝑜𝑟𝑎𝑠.
a) Determinar a vida esperada da unidade de CPU, em horas;
b) Determinar a variância da vida da unidade CPU, em horas;
c) Qual a probabilidade de que a unidade de CPU falhe entre as 500 e as 700 horas de funcionamento?

Página 5
EGER – Modelação Estatística e Previsão Ficha Nº 1

18. Um fabricante de computadores garante substituir por novos, todos os computadores que se avariem nos
dois primeiros anos após a data da compra. Admite-se que o tempo de vida destes computadores são
variáveis independentes e identicamente distribuídas com uma distribuição normal com valor esperado de
42 meses e desvio padrão de 10 meses.
a) Qual a proporção de computadores que o fabricante pode ter que substituir?
b) Qual deve ser a garantia, de maneira a que no máximo, 1% dos computadores são substituídos?
c) O tempo de vida do mesmo tipo de componentes noutro fabricante (fabricante B) também segue uma
distribuição normal com valor esperado de 40 meses e desvio padrão de 8 meses. Usando a mesma garantia
de dois anos, qual dos dois fabricantes substitui mais componentes?

19. Num processo produtivo determinadas tarefas podem ser realizadas através de operadores. Estes afirmam
que o tempo médio de execução das tarefas é de 10 minutos. Admita que o tempo de execução, em minutos,
pode ser considerado uma variável aleatória com distribuição normal. Para uma seleção de dez tarefas, o
estudo levou às seguintes observações:
Tarefa 1 2 3 4 5 6 7 8 9 10
X 4.1 5.0 4.9 5.3 13.5 12.0 19.2 10.0 24.1 6.9

A empresa suspeita que tempo médio de execução das tarefas é superior ao indicado pelos operadores.
Acha que a empresa tem razões para isso? Justifique, utilizando um nível de significância de 1%.

Página 6
EGER – Modelação Estatística e Previsão Ficha Nº 1

SOLUÇÕES

1 2 3 4 5 6 7 8 9 10 11 12 13
B C D A D B C C C B C B B

14. a) 𝑥̅ = 0.5712. A proporção de apólices com número de sinistros abaixo da média (com zero sinistros)
é aproximadamente 49,5%.
b) i) 𝑥̅ = 28.533; 𝑠 = 6.334.
Os condutores que tiveram mais do que dois acidentes, apresentam uma idade média de 28.533 anos. A
média é uma medida de localização central da amostra e representa o seu “ponto de equilíbrio” – é nula a
soma dos desvios das observações em relação à média.
O desvio padrão desta amostra é de 6.334 anos. Este valor representa a variabilidade em relação à média.
Neste caso o valor do desvio padrão não é muito elevado o que significa que não é grande a variabilidade
em torno da média.
ii)

(Obs: A amostra não tem outliers).


Por observação do diagrama verifica-se que a distribuição é enviesada à direita ou assimétrica positiva.
Verifica-se maior dispersão nas idades superiores à mediana.

15. a) Eólica. É a fonte de energia renovável com maior produção no ano de 2012.
b) A mediana é 693.5, o que significa que em metade dos anos observados a produção de energia a partir
deste tipo de fonte foi inferior ou igual a este valor. Em 25% dos anos observados, este tipo de produção
de energia eléctrica foi inferior ou igual a 533.2 (1º quartil) e em 25% dos anos foi superior ou igual a
880.8(3º quartil).
16. a) 7.181 b) 0.2426
17. a) 803.682 b) 85319.64 c) 0.218
18. a) 0.0359 b) 18.7 meses c) O fabricante A
19. Hipóteses a testar:
H0 :   10 vs Ha :   10
1) Nível de significância: 1%
2) Estatística de teste: neste caso concreto escolhe-se a distribuição T-student porque o parâmetro a testar
é o valor médio, a característica em estudo tem distribuição normal, a variância populacional é
desconhecida e a dimensão da amostra é inferior a 30.
𝑋̅−𝜇
3) 𝑆⁄ ∩ 𝑡(𝑛−1)
√𝑛

Valor observado da E.T. tobs = 0.23292374


p-value = 0.41052

Página 7
EGER – Modelação Estatística e Previsão Ficha Nº 1

Nota: como temos um teste unilateral direito o p-value obtém-se P(T>tobs).


Decisão: Como o p-value é superior ao nível de significância fixado, não se rejeita a hipótese nula, ao nível de
significância de 1%.
Conclusão: Ao nível de significância de 1%, concluímos que não existe evidência estatística nesta amostra
que justifique a suspeita da empresa.

Página 8

Você também pode gostar