Você está na página 1de 9

PROBABILIDADES E ESTATÍSTICA C

Exercı́cios sobre Estatı́stica

Maria de Fátima Miguens

2009/2010
PROBABILIDADES E ESTATÍSTICA C 1

Estimação Pontual
1. Considere a população X, constituı́da pelo número de filhos por famı́lia num determinado paı́s. Suponha
que se conhece a função de probabilidade de X, nomeadamente:

0 1 2 3 4
X
0.15 0.25 0.30 0.20 0.10

(a) Quais os valores populacionais de µ ≡ E (X) e de σ 2 ≡ V (X)?


(b) Desta população recolhe-se uma amostra aleatória do n.o de filhos de duas famı́lias - (X1 , X2 ). Qual
a função de probabilidade de X1 e de X2 e o valor dos respectivos parâmetros µ e σ 2 ?
(c) Admita que (X1 , X2 , . . . , Xn ) é uma amostra aleatória do n.o de filhos de n famı́lias da população
X. Apresente estimadores para o número esperado de filhos por famı́lia neste paı́s. Indique também
um estimador para a variância do n.o de filhos por famı́lia.
(d) Suponha que recolheu a seguinte amostra de n.o de filhos de 10 famı́lias:

(1, 3, 0, 0, 2, 3, 0, 2, 4, 1) .

Com base nesta amostra estime pontualmente µ e σ 2 .


(e) Admitindo que σ 2 é conhecido, determine o erro padrão associado à estimativa de µ.
Supondo agora que σ 2 não é conhecido, estime o erro padrão associado à estimativa de µ.
2. Considere (X1 , X2 , . . . , Xn ) uma amostra aleatória de dimensão n ≥ 3 de uma população X com valor
médio µ e variância σ 2 .
1 Pn
(a) Mostre que X̄ = Xi é um estimador centrado e consistente para o valor médio da população.
n i=1
X1 + Xn 2X1 + 3X2 + 5X3
(b) Mostre que µ̂1 = e µ̂2 = também são estimadores centrados para µ.
2 10
Qual o melhor? São estimadores consistentes de µ?
2
(c) Mostre que X̄ não é estimador centrado para µ2 .
3. Suponha que (X1 , X2 , . . . , Xn ) é uma amostra aleatória de uma população X com distribuição U (0, θ).
(a) Mostre que 2X̄ é um estimador centrado de θ. É também estimador consistente de θ?
(b) Deduza o estimador de momentos para θ.
4. Um produtor de peças electrónicas resolveu inspeccionar um lote de peças produzidas, anotando o n.o de
peças inspeccionadas (X) até encontrar a primeira defeituosa. Seja 0 < p < 1 a probabilidade de uma
qualquer peça ser defeituosa. Retirando com reposição, as peças do lote a serem inspeccionadas, sabemos
que X tem uma distribuição tal que E (X) = θ e V (X) = θ (1 − θ), com θ = 1/p.
(a) Deduza o estimador de momentos para θ e o estimador de momentos para p.
(b) Verifique se o estimador de momentos para θ é centrado.
(c) Avalie a eficiência do estimador de momentos para θ relativamente a outro estimador T para o mesmo
parâmetro, sabendo que E (T ) = θ + 1 e que V (T ) = θ2 − 1
5. Seja (X1 , X2 , . . . , Xn ), n ≥ 2, uma amostra aleatória de uma população X com distribuição Uniforme no
intervalo [0, 2θ], isto é, X ∼ U (0, 2θ) , θ ∈ R+ .
(a) Determine o estimador de momentos para θ e represente-o por θ∗ .
n+1
(b) Considere Mn = max (X1 , X2 , . . . , Xn ) (máximo da amostra) e θe = Mn , um outro estimador
2n
para θ.
2n
Sabendo que E (Mn ) = θ, mostre que θe é um estimador centrado para θ.
n+1
Mostre que θ∗ é também um estimador centrado para θ.
PROBABILIDADES E ESTATÍSTICA C 2

(c) Diga qual dos estimadores é mais eficiente na estimação de θ.


4n 2
Nota: V (Mn ) = 2 θ
(n + 2) (n + 1)
(d) Os valores que a seguir se apresentam são registos de atrasos de comboios verificados numa determi-
nada estação (expressos em minutos):
2.23 6.74 1.03 4.28 11.14 12.71 3.50 5.17
Admitindo que os atrasos seguem uma distribuição U [0, 2θ], apresente as estimativas para θ, pro-
duzidas pelos estimadores atrás referidos.
(2o Teste, Ano Lectivo 2008/2009)

6. Seja X uma v.a. discreta cuja função de probabilidade depende do valor de um parâmetro θ ∈ [0, 0.5].
Sabe-se que E (X) = 2θ + 1 e que V (X) = 1 + 2θ − 4θ2 .
Se (X1 , X2 , . . . , Xn ) é uma amostra aleatória de X e X é a correspondente média aritmética,

(a) Para n = 64 e θ = 0, determine o valor aproximado de P X ≤ 5/4 .
(b) Deduza o estimador de momentos para θ. Trata-se de um estimador centrado para θ?

(Época Normal, Ano Lectivo 2008/2009)

Estimação por Intervalo de Confiança


7. Para avaliar o peso médio das maçãs produzidas por um determinado agricultor analisaram-se 20 maçãs
seleccionadas ao acaso da produção. Estas resultaram numa média de pesos x̄ = 320g. Assuma que os
pesos das maçãs têm distribuição Normal com desvio padrão σ = 20g.
(a) Construa um intervalo de confiança a 90% para o peso médio das maçãs.
(b) Qual deve ser o tamanho da amostra de forma a que a amplitude do correspondente intervalo de
confiança a 90% para o peso médio das maçãs seja de 1g? E 5g? Comente.

8. O Dr. Costa quer avaliar os custos com reparações das bancadas do estádio das Pantas na sequência de
distúrbios envolvendo as claques em jogos de risco. Para isso pede os valores das reparações realizadas
nos últimos 10 jogos de risco que se realizaram neste estádio em 2006, e que foram (em 103 euros):

137.9 176.8 225.3 231.7 275.8


312.1 243.0 143.6 205.3 176.1

(a) Estime pontualmente o valor médio e o desvio padrão do gasto em reparações no ano de 2006.
(b) Admitindo uma distribuição Normal para este tipo de despesas, estime por intervalo de 95% de
confiança o gasto médio em reparações das bancadas no ano 2006.

9. A quantidade de combustı́vel dispendido num percurso de Lisboa a Faro (em litros) é uma variável aleatória
com valor medio µ e variância σ 2 .

(a) Assuma que em 8 viagens Lisboa-Faro seleccionadas ao acaso, se verificou uma média de gasto em
combustı́vel de 36 litros e um desvio padrão de 10 litros. Impondo todos os pressupostos populacionais
necessários, determine intervalos de confiança a 90% e a 95%, para a quantidade média de combustı́vel
dispendida numa viagem entre estas duas cidade e compare-os.
(b) Assuma agora que foi em 50 viagens Lisboa-Faro, seleccionadas ao acaso, que se verificou uma média
de gasto em combustı́vel de 36 litros e um desvio padrão de 10 litros. Construa intervalos de confiança
para o gasto esperado de combustı́vel a 90% e a 95% e compare com os anteriores. Comente.
PROBABILIDADES E ESTATÍSTICA C 3

10. Um conjunto de 140 condutores de camião, escolhidos aleatoriamente nas estradas nacionais, dispôs-se a
participar numa experiência que tinha por objectivo medir os seus tempos de reacção depois do almoço.
A média amostral e o desvio padrão dos tempos observados foram respectivamente, respectivamente, de
0.85 e 0.20 segundos.
Estime por intervalo de 95% de confiança o tempo médio de reacção dos condutores, após o almoço.

11. Numa fábrica de embalagem de queijo em fatias seleccionaram-se aleatoriamente 100 embalagens, das
quais se verificaram que 18 tinham peso inferior ao suposto - sendo por isso inadequadas. Construa um
intervalo de confiança a 98% para a verdadeira proporção de pacotes inadequados na produção total.
12. Um profissional de bowling jogou 8 partidas num torneio, tendo obtido as seguintes pontuações:

117.0 220.2 199.5 237.2 249.5 179.8 259.2 248.5

Admitindo a normalidade das pontuações, construa um intervalo de confiança a 95% para a variância e
para o desvio padrão das pontuações obtidas pelo jogador (este último fornece uma medida da consistência
da prestação do jogador).

13. Os valores que se seguem são os volumes de produção (em toneladas de produtos acabados) registados
numa empresa metalomecânica em vinte dias consecutivos.

9.6 11.5 10.5 11.1 12.0 10.3 9.1 10.7 8.6 10.3 10.2 12.5 11.8 10.0 11.9 11.8 11.7 11.3 14.4 10.1

Apresente a estimativa por intervalo de 98% de confiança, do volume médio de produção diária. (Assuma
que a amostra provém de uma população normal).
(2o Teste, Ano Lectivo 2008/2009)

14. O administrador de um hospital sabe que as contas em aberto (pagamentos de tratamentos e internamentos
não cobrados) no fim de cada mês do ano de 2008 são quantias bem descritas por uma distribuição normal.
Para estimar o desvio padrão da quantia mensal em dı́vida nesse ano, escolhe ao acaso 25 dessas contas
que lhe fornecem a seguinte indicação:
25
X 25
X 2
xi = 2748 (xi − x̄) = 9
i=1 i=1

Indique a estimativa pontual e a estimativa por intervalo de 90% de confiança para o desvio padrão atrás
referido.
(Época Normal, Ano Lectivo 2008/2009)

15. Segundo informação disponibilizada pelo Instituto de Meteorologia, a humidade relativa do ar (X) tem
sido medida (numa dada estação meteorológica) todos os dias às 9 horas, ao longo de vários anos.
Querendo realizar um trabalho sobre a humidade relativa do ar, um aluno de PEC seleccionou ao acaso
valores referentes a 100 dias, tendo obtido a seguinte informação:
100
X 100
X 2
xi = 101 900 (xi − x̄) = 3564
i=1 i=1

Estime por intervalo de 95% de confiança, a humidade relativa do ar esperada às 9 horas.
(Época Recurso, Ano Lectivo 2008/2008)
PROBABILIDADES E ESTATÍSTICA C 4

Teste de Hipóteses
16. Uma fábrica de gelados afirma que a procura do gelado de chocolate no verão, por dia e em euros, é uma
v.a. Normalmente distribuı́da com valor médio 200 euros e desvio padrão de 40 euros. Numa amostra
aleatória constituı́da por 10 dias seleccionados ao acaso do perı́odo de verão verificou-se que x̄ = 216.
(a) Teste, ao nı́vel de significância 5%, se de facto o consumo médio de gelado de chocolate no verão é
de 200 euros por dia.
(b) Teste, ao ao nı́vel de significância 5%, se de facto o consumo médio de gelado de chocolate no verão
é menor do que 200 euros por dia.
(c) Resolva as duas primeiras alı́neas usando o p-value.
(d) Qual a potência do teste, da alı́nea b), se µ = 190.
17. Um produtor de azeite afirma que a acidez média do seu azeite é de 0.9o . De forma a confirmar tal facto
recolheu-se uma amostra aleatória da sua produção de azeite, tendo-se medido os seguintes valores de
acidez: 0.9 0.8 0.7 1.1 0.9 0.9 1.0 0.7 1.5 1.1. Admitindo a Normalidade da acidez do azeite:
(a) Teste, ao nı́vel de significância 1%, se o produtor tem razão.
(b) Teste, ao ao nı́vel de significância 1%, se a acidez média é superior a 0.9o .
18. O limite de velocidade imposto por uma empresa de transporte para a circulação da sua frota é de 110
km/h. Sabe-se que a velocidade dos veı́culos dessa frota apresenta um desvio padrão de 20 km/h. Com o
objectivo de analisar a efectiva velocidade média de circulação, foi registada a velocidade de 50 veı́culos e
a correspondente média foi de 114 km/h.
(a) Estime por intervalo de 94% de confiança a velocidade média de circulação dos veı́culos dessa frota.
(b) Se quisermos reduzir em 20%, a amplitude do intervalo anterior, quantas observações adicionais
seriam necessárias?
(c) Teste com uma significância de 10% se a velocidade média excede a velocidade máxima permitida
pela empresa de transportes.
(d) Calcule o valor de prova e com base nesse valor, indique qual a decisão a tomar para um nı́vel de
significância de 5%.
19. Uma companhia de seguros tem previsto no seu orçamento um total de 5000e/dia para pagar as indem-
nizações aos seus segurados. De forma a confirmar se o valor médio das indemnizações pagas por dia não
excede o valor previsto seleccionaram-se, de anos anteriores, 100 dias, tendo-se verificado x̄ = 5625e e
P
(xi − x̄)2 = 6187500e2 . Teste, ao nı́vel de significância 5%, se a previsão se adequa.
20. Numa operação stop da brigada de trânsito, de 120 camiões TIR que foram parados, 42 iam com excesso
de peso. Com base nesta amostra aleatória, teste a hipótese de que a proporção de camiões TIR, que
circulam nas nossas estradas em situação ilegal, ultrapassa os 30%. Use um nı́vel de significância de 10%.
21. Determinada desordem genética no sangue pode ser prevista com base num teste de sangue muito simples.
De forma a ter uma noção da proporção de pessoas que na população possam vir a ter esta desordem,
testaram-se 100 pessoas, seleccionadas ao acaso, para as quais 14 testes deram positivo. Teste, usando um
nı́vel de significância 5% e o p-value, se percentagem de pessoas com tal desordem difere de 10%.
22. No fabrico de parafusos admite-se, relativamente aos seus comprimentos, uma variabilidade máxima de
0.5mm2 . Recolheu-se uma amostra aleatória de 20 parafusos que se verificou terem s2 = 0.3. Admitindo a
Normalidade do comprimento dos parafusos, teste, ao nı́vel de significância de 5% se a especificação sobre
a variabilidade do comprimento dos parafusos está a ser respeitada.
23. A partir de uma amostra de dimensão 25, registou-se o peso de sacos de ração para perus, tendo-se obtido
os seguintes resultados:

25
X 25
X
xi = 1255 x2i = 63252
i=1 i=1
PROBABILIDADES E ESTATÍSTICA C 5

(a) Apresente uma estimativa pontual da variância do peso dos sacos de ração.
(b) Admitindo que o peso dos sacos tem distribuição normal, teste a hipótese do peso ter um desvio
padrão diferente de 3.5 kg, para um nı́vel de significância de 10%.

24. Os valores que se seguem são os volumes de produção (em toneladas de produtos acabados) registados
numa empresa metalomecânica em vinte dias consecutivos.

9.6 11.5 10.5 11.1 12.0 10.3 9.1 10.7 8.6 10.3 10.2 12.5 11.8 10.0 11.9 11.8 11.7 11.3 14.4 10.1

Os objectivos de produtividade estabelecem que a proporção de dias com um volume de produção acima
das 11.5 toneladas, não deve ser inferior a 55%.
No sentido de averiguar se estes objectivos estão a ser atingidos, foram registados os seguintes valores do
volume de produção em mais 12 dias:

9.9 11.8 11.7 10.7 11.9 10.1 12.1 11.4 11.6 11.5 9.4 9.6

A partir dos registos para os 32 dias, que conclusões pode retirar sobre o cumprimento destes objectivos,
ao nı́vel de 4% de significância?
(2o Teste, Ano Lectivo 2008/2009)
25. O administrador de um hospital sabe que as contas em aberto (pagamentos de tratamentos e internamentos
não cobrados) no fim de cada mês do ano de 2008 são quantias bem descritas por uma distribuição normal.
Admita que o desvio padrão desta população é conhecido e tem o valor de 0.58 e. Para uma amostra
de 10 quantias em dı́vida do mês de Junho de 2008, diga quais os valores da respectiva média que lhe
permitem rejeitar com um nı́vel de 5% de significância, a hipótese de que a quantia média em dı́vida neste
mês é de 115 e contra a hipótese alternativa desta quantia média diferir de 115 e.
(Época Normal, Ano Lectivo 2008/2009)
26. Teste a um nı́vel de significância 5% que a seguinte amostra aleatória provêm de uma distribuição
Normal(3, 22 ):
1.14, 3.11, 3.55, 2.81, 6.28, 1.61, 4.36, 0.90, 0.81, −0.18, 2.08, 2.68, 2.12, −0.33, 2.57,
3.55, 1.81, 2.56, 5.56, 2.46, 4.20, 1.63, 4.21, 4.85, 4.24, 3.98, 1.40, 3.00, 2.01, 3.31
27. Pensa-se que a altura a que os eucaliptos chegam aos 20 anos é uma v.a. Normal de média 2m. Para o
confirmar seleccionou-se uma amostra aleatória de 30 eucaliptos, tendo observado as seguintes alturas:
0.2, 0.8, 3.6, 1.0, 0.2, 4.3, 3.1, 0.4, 3.3, 3.1, 3.2, 5.3, 1.7, 0.2, 2.8, 0.4, 0.5, 3.0, 1.2, 4.2, 4.8,
3.4, 2.1, 2.5, 2.4, 2.1, 0.8, 3.5, 1.7, 1.3

Teste, ao nı́vel de significância 1%, a conjectura referida.


28. Teste se a amostra do exercı́cio 24 relativa aos volumes de produção em 32 dias, isto é:

9.6 11.5 10.5 11.1 12.0 10.3 9.1 10.7 8.6 10.3 10.2 12.5 11.8 10.0 11.9 11.8
11.7 11.3 14.4 10.1 9.9 11.8 11.7 10.7 11.9 10.1 12.1 11.4 11.6 11.5 9.4 9.6

provém de uma população com distribuição Normal de parâmetros (µ, 1). Para tal considere o seguinte
agrupamento em classes assim como a respectiva informação:

Classes Oi Ei
]−∞, 8.6] 1
]8.6, 10.1] 8 5.8656
]10.1, 11.5] 16.3104
]11.5, 12.9] 8.6816
]12.9, +∞[ 1
PROBABILIDADES E ESTATÍSTICA C 6

(a) Complete a tabela.


(b) Indique a decisão a tomar ao nı́vel de 10% de significância.

(2o Teste, Ano Lectivo 2008/2009)


29. Segundo informação disponibilizada pelo Instituto de Meteorologia, a humidade relativa do ar (X) tem
sido medida (numa dada estação meteorológica) todos os dias às 9 horas, ao longo de vários anos.
Querendo realizar um trabalho sobre a humidade relativa do ar, um aluno de PEC seleccionou ao acaso
valores referentes a 100 dias, tendo obtido a seguinte informação:
100
X 100
X 2
xi = 101 900 (xi − x̄) = 3564
i=1 i=1

Para verificar se pode assumir que a v.a. X tem distribuição normal, o aluno organizou os dados na
seguinte tabela:
Classe ]−∞, 1010] ]1010, 1019] ]1019, 1028] ]1028, +∞[
Frequência observada (Oi ) 8 51 4
Frequência esperada (Ei ) 43.32 43.32
Será que a amostra seleccionada permitirá ao aluno concluir com 5% de significância, que X tem dis-
tribuição normal com variância 36?
(Época Recurso, Ano Lectivo 2008/2009)

Regressão Linear Simples


30. Determinada empresa está interessada em contabilizar o tempo que o ar condicionado está ligado no verão,
por dia, mediante a temperatura exterior (o C). Assim, seleccionaram-se 14 dias ao acaso, para os quais se
mediram as temperaturas (x) e se registarem o número de horas de utilização do ar condicionado (Y ):
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14
xi 29 28 29 35 26 25 32 31 34 27 33 33 32 28
Yi 10.5 9.0 10.4 18.6 5.5 5.2 11.6 10.4 17.8 9.9 13.7 14.2 12.3 8.7

(a) Disponha os dados em gráfico.


(b) Estime a recta de regressão linear simples. Refira quais os pressupostos efectuados. Desenhe-a no
gráfico anterior.
(c) Comente a qualidade da estimação efectuada, com base no coeficiente de determinação.
(d) Teste a hipótese de o verdadeiro declive da recta de regressão ser nulo. Comente o resultado à luz
da alı́nea anterior.
(e) Para uma temperatura exterior de 30o C qual o número de horas que estima que o ar condicionado
esteja a trabalhar? E para uma temperatura de 40o C?
(f) Estime por intervalo de 90% de confiança, o n.o esperado de horas de funcionamento do ar condi-
cionado, num dia em que a temperatura exterior é de 30o C.
(g) Para um dia em que a temperatura exterior é de 30o C, qual a estimativa por intervalo de 95% de
confiança para o tempo de funcionamento do ar condicionado?
31. Com o objectivo de estudar a qualidade do ar na região de Lisboa, pretende-se modelar a quantidade Y
de Ozono troposférico (O3 ), com a quantidade x de partı́culas em suspensão com diâmetro aerodinâmico
inferior a 10 µm (P M10 ). Para tal, registaram-se os seguintes dados:

xi 60.5 78.8 89.8 80.9 74.8 49.9 97.5 92.5 36.5 18.1 29.6 15.9
yi 124.2 158 177.1 185.6 179.2 145.7 163.7 188.8 122.2 75.4 94.8 80.3
X X 2 X
xi = 724.8; xi = 53414.92; SY Y = 18620.05; xi yi = 114890.35; σ̂ 2 = 237.44;
PROBABILIDADES E ESTATÍSTICA C 7

(a) Ajuste um modelo de regressão linear simples aos dados. Refira quais os pressupostos do modelo.
(b) Comente a qualidade do modelo.
(c) Teste, ao nı́vel de significância de 5%, a hipótese de o declive da recta de regressão ser nulo.
(d) Determine um intervalo de confiança para o valor previsto para a quantidade de Ozono troposférico
quando a quantidade de partı́culas em suspensão com diâmetro aerodinâmico inferior a 10 µm é igual
a 80.
(e) Prove que qualquer recta dos mı́nimos quadrados passa por (x, y).

32. Para determinar o tempo durante o qual um anestésico faz efeito, procedeu-se à determinação experimen-
tal, a diversas concentrações, obtendo-se os seguintes resultados:
Concentração (x) 3 3 3 5 5 5 7 7 7 9 9 9
Efeito (y) 12.1 14.6 12.2 15.8 14.5 17.6 18.6 18.6 19.1 21.4 21.2 22.3
X X X X X
xi = 72; yi = 208; xi yi = 1334.4; x2i = 492; yi2 = 3739.48

(a) Estime a recta dos mı́nimos quadrados que exprime y em função de x.


(b) Considere a afirmação: ”A concentração de anestésico é um factor importante na determinação do
tempo de efeito”. Comente a afirmação usando o resultado de um teste de hipóteses adequado (com
α = 5%).
(c) Apresente uma estimativa por intervalo de 99% de confiança para o tempo de efeito esperado resul-
tante de uma concentração de 6 unidades.
33. Da análise do consumo médio de energia por agregado familiar durante 10 dias de um mês de Inverno
numa determinada cidade, obtiveram-se os seguintes resultados para as variáveis:

x: temperatura média diária (◦ C) Y : consumo médio de energia (kW )

x 15 14 12 14 12 11 11 10 12 13
y 4.3 4.4 5.3 4.6 5.5 5.9 5.7 6.2 5.2 5.0

dos quais resultam: x̄ = 12.4, ȳ = 5.21, sxx = 22.4, sxY = −8.94 e sY Y = 3.689.

Nas alı́neas que se seguem, arredonde a 3 casas decimais, os valores calculados.


(a) Considere um modelo de regressão linear simples para explicar o consumo médio de energia em termos
da temperatura média diária e estime da recta de regressão.
Determine o coeficiente de determinação e comente o seu valor.
(b) Verifique (com α = 1%) se a recta de regressão permite explicar os valores do consumo médio de
energia em função da temperatura média diária.
(c) Para um dia em que se regista uma temperatura média de 12.4 ◦ C, estime por intervalo de 95% de
confiança o consumo médio esperado de energia.
(2o Teste, Ano Lectivo 2008/2009)
34. Um estudo sobre o consumo de bebidas alcoólicas com um teor superior a 5% pretende verificar se os
hábitos tabágicos podem ser uma variável explicativa para este consumo. Assim foram inquiridos 16
indivı́duos e registada a quantidade de bebidas alcoólicas ingerida (Y ) e o número de cigarros fumados
diariamente (x). Os dados obtidos são apresentados na tabela seguinte:

Bebidas alcoólicas consumidas(cl), yi 33 35 17 13 35 25 55 25 28 42 26 28 24 5 40 45


No de cigarros fumados, xi 24 25 12 2 10 5 28 20 12 18 15 21 9 1 17 21

y = 29.75 , x = 15 , sxx = 1004 , sxy = 1188 , syy = 2345

Nas alı́neas que se seguem, arredonde a 3 casas decimais, os valores calculados.


PROBABILIDADES E ESTATÍSTICA C 8

(a) Estime a recta de regressão que relaciona a quantidade de bebidas alcoólicas consumidas diariamente
com o número de cigarros fumados diariamente.
(b) Verifique (com α = 10%) se a recta de regressão permite explicar a quantidade de bebidas alcoólicas
consumidas em função do número de cigarros fumados diariamente.
(c) Supondo que o modelo obtido pela recta de regressão é válido, qual a estimativa, por intervalo de 90%
de confiança, da quantidade de bebidas alcoólicas (em cl) ingeridas diariamente por um indivı́duo
que fume 22 cigarros num dia?

(Época Normal, Ano Lectivo 2008/2009)

35. Numa revista cientı́fica foi publicado um trabalho onde são reportados os seguintes dados referentes ao
consumo de combustı́vel (em galões) por cada 100 milhas percorridas e ao peso (em milhares de libras)
de 10 marcas de automóveis:

i 1 2 3 4 5 6 7 8 9 10
Peso (xi ) 3.4 3.8 4.1 2.2 2.6 2.9 2.0 2.7 1.9 3.4
Consumo (yi ) 5.5 5.9 6.5 3.3 3.6 4.6 2.9 3.6 3.1 4.9

x̄ = 2.9, ȳ = 4.39, sxx = 5.18, sxY = 8.49 e sY Y = 14.589

Nas alı́neas que se seguem, arredonde a 3 casas decimais, os valores calculados.

(a) Considere um modelo de regressão linear simples para explicar o consumo em termos do peso do
automóvel e estime a recta de regressão.
(b) Será que a amostra de que dispõe permite concluir que o consumo é influenciado de forma linear pelo
peso, ao nı́vel de significância de 5%?
(c) Calcule o coeficiente de determinação e comente o resultado obtido.

(Época Recurso, Ano Lectivo 2008/2009)