Você está na página 1de 18

Curso Diurno e Noturno

ESTATÍSTICA E OTIMIZAÇÃO – ESTATÍSTICA (GRUPOS DE EXERCÍCIOS)

Maria Filipa Mourão


Grupo de Exercícios 1: Intervalos de Confiança
1. O peso de um certo artigo metálico produzido por uma máquina segue uma
distribuição normal com desvio padrão igual a 3. Com base numa amostra
aleatória de 35 unidades que forneceu um valor médio igual a 48 gramas,
construa um intervalo de confiança a 95% para o valor médio do universo.

2. Uma máquina fabrica cabos cuja resistência à rutura (em kg/cm 2) é uma variável
com distribuição normal de média 100 e desvio-padrão 30. Pretende-se testar
uma nova máquina que, segundo indicações do fabricante, produz cabos com
resistência média superior. Para isso, observam-se 100 cabos fabricados pela
nova máquina, que apresentam uma resistência média de 110 kg/cm 2. Admita
que o novo processo não altera o desvio-padrão da resistência à rutura dos
cabos.
a) Construa um intervalo de confiança a 95% para a resistência média
dos cabos fabricados pela nova máquina.
b) Suponha que pretendíamos obter um intervalo com a mesma
amplitude do obtido na alínea anterior, mas com um nível de
confiança de 99%. Quantos cabos deveriam ser observados?

3. Com o fim de prever qual será o valor das importações de carne, realiza-se um
inquérito a 2400 famílias, tendo-se obtido um consumo anual médio de €260.00
com um desvio-padrão de €75.00. Sabendo que, no país em causa, existem 2
milhões de famílias e que o valor previsto da produção de carne é de 400 milhões
de Euros, diga, com 95% de confiança, entre que valores é de esperar que se
situem as importações de carne.

4. Extrai-se uma amostra de 25 peças fabricadas pela máquina A, registando-se


seguidamente o respetivo diâmetro. Obtém-se um valor médio de 10 mm com
uma variância de 1,15 mm2. Admita que o diâmetro de uma peça fabricada pela
máquina A tem distribuição normal.
a) Diga, com 99% de confiança, entre que valores se situa a variância do
diâmetro de uma peça produzida pela referida máquina.
b) Calcule a amplitude do intervalo obtido na alínea anterior e confronte-a
com a que resultaria de um intervalo construído com 95% de confiança.

5. Uma máquina de bebidas encontra-se regulada de modo a servir uma


quantidade de líquido que é uma variável aleatória normal. Sabendo que numa
amostra de 25 bebidas se obtiveram os seguintes resultados:
2
25
 xi  6250ml
25
 
 xi  x  384ml
2
i 1 i 1
Pretende-se:
a) Construir um intervalo de confiança a 95% para a verdadeira quantidade
média de líquido das bebidas servidas.
b) Determinar quantas bebidas devem ser incluídas na amostra, se se
pretender aumentar a precisão do intervalo para 2 ml.

6. Certo equipamento de empacotamento automático encontra-se regulado para


encher embalagens de um quilo de produto. O seu deficiente funcionamento
origina prejuízo para a empresa: se a maioria das embalagens têm peso inferior
ao estabelecido, haverá reclamações por parte dos clientes e perda de prestígio;
peso excessivo será, por outro lado, antieconómico. Aceita-se de experiências
passadas que o peso das embalagens se comporta normalmente com uma
dispersão dada por 12gramas. Para verificar a afinação do equipamento,
selecionaram-se em certo período, nove embalagens cujos pesos foram anotados
(em gramas): 983,992,1011,976,997,1000,1004,983,998.

a) Construa intervalos de confiança para o valor médio da população, com


os seguintes graus de confiança: 90% e 95%. Como varia a precisão do
intervalo com o grau de confiança escolhido?
b) Suponha que, em vez de nove embalagens, tinha sido obtida uma outra de
100 embalagens, que após os necessários cálculos, tinha fornecido um
peso médio 994 gramas. Construa um novo intervalo de confiança a 95%
com base nesta amostra.
c) Qual deverá ser o tamanho da amostra a recolher de tal forma que a
amplitude do intervalo (a 95%) seja de 2 gramas?

7. Um determinado método de análise permite determinar o conteúdo de enxofre


no petróleo bruto. Os ensaios efetuados em 10 amostras de 1 kg de petróleo
bruto, provenientes de furos pertencentes a um determinado campo, revelaram
os seguintes resultados (em gramas):

{105, 111, 114, 112, 106, 110, 109, 107, 112, 110}
As análises efetuadas em 8 amostras de 1 kg de petróleo bruto extraído de furos
localizados noutro campo conduziram aos seguintes resultados (em gramas):
{101, 106, 104, 105, 103, 110, 108, 109}
Qual será o intervalo que inclui, com 95% de confiança, a diferença entre os
valores médios da quantidade de enxofre por quilogramas de petróleo
proveniente de cada campo?

8. O número de horas de vida das lâmpadas produzidas segundo determinado


processo de fabrico segue distribuição normal. Obtida uma amostra aleatória de
20 lâmpadas, verificou-se a respetiva duração, tendo-se obtido uma média de
1832 horas e um desvio-padrão corrigido de 497 horas. Construa um intervalo
de confiança a 90% para o desvio-padrão da duração de uma lâmpada.

3
9. O Director de recursos humanos de certa Empresa ouviu um seu adjunto
garantir, numa conversa informal que mais de 40% dos quadros superiores da
empresa haviam estado de baixa por mais de 5 dias. Após “dormir sobre o
assunto”, o Director resolveu encomendar um estudo para confirmar ou
desmentir a afirmação que ouvira. Uma amostra aleatória de 45 elementos foi
selecionada dentre os quadros superiores da história da empresa, tendo
revelado que 20 estiveram de baixa mais de 5 dias. Com essa informação
construa um intervalo de confiança, de nível 95% para a percentagem de
quadros superiores da história da empresa que haviam estado de baixa mais de
5 dias.

10. Foi feito um estudo para determinar se a ausência ao trabalho durante o período
de Inverno é superior num centro urbano do norte ou do sul. Foram selecionados
dois grupos de indivíduos aleatoriamente: um grupo na cidade de Faro e outro
na cidade de Braga. De 300 trabalhadores de Faro, 64 faltaram pelo menos um
dia e de 400 de Braga, 51 faltaram um ou mais dias. Para retirar alguma
conclusão, qual o estudo que propõe que se faça? Que conclusão pode ser
retirada?

11. Foram efetuados estudos no Porto e Lisboa com o objetivo de determinar a


concentração de Carbono (CO) perto das vias rápidas. Para o efeito recolheram-
se amostras de ar para as quais se determinou a respetiva concentração. Os
resultados, no período de uma semana foram:

Porto: 112.2, 118.4, 114.1


Lisboa:101.1, 102.2, 100.4, 96.8, 88.2
Assumindo que a distribuição subjacente aos dados relativamente a cada cidade
é Normal, com parâmetros desconhecidos e variâncias iguais:

a) Determine um intervalo de confiança a 90% para a média da


concentração de Carbono na cidade de Lisboa.
b) Determine um intervalo de confiança a 90% para a média da
concentração de Carbono na cidade do Porto.
c) Num programa sobre questões ambientais o Presidente da Câmara de
Lisboa afirmou: “A média de concentração de CO no Porto é igual à de
Lisboa”. Concorda com esta afirmação?

12. Pretende-se estimar a média e a variância do comprimento de barras produzidas


em série. Para o efeito, recolhe-se uma amostra de 10 barras, obtendo-se os
seguintes comprimentos (valores em centímetros): 10,5 10,3 10,2 10,4 10,1 10,3
10,2 10, 10,1 10,4. Construa, com base nesta amostra, e admitindo que o
comprimento de uma barra tem distribuição normal
a) um intervalo de confiança a 95% para a média do comprimento de uma
barra;

4
b) um intervalo de confiança a 99% para a variância do comprimento de
uma barra.

13. Um construtor civil utiliza dois tipos de cimento, A e B, que são fornecidos, em
ambos os casos, em sacos de 50 kg. No entanto, os 50 kg podem não ser
respeitados, pois existe uma tolerância para o peso do saco. Contudo, existe
uma norma de 4 kg2 quanto à variância, que é respeitada. O construtor
suspeita que os sacos do cimento B costumam vir com menos cimento. Para
averiguar se a sua suspeita se verifica, recolheu as seguintes amostras:

Cimento A 49,4 48,6 51 50,2 49,5 48,7 49 49,1


Cimento B 50 50,2 48,5 48,5 48,6 51 49,9 49,8

Admita que os pesos de sacos de cimento tipo A e tipo B seguem distribuições


normais.
a) Construa o intervalo de confiança a 95% para a diferença de médias do
peso dos dois tipos de cimento.
b) Construa o intervalo de confiança a 95% para a média do peso do cimento
A.
c) Qual a amplitude máxima dos intervalos de confiança para a média do peso
do cimento A que é possível obter com esta amostra e com níveis de
confiança não superiores a 99%?

14. Da produção de duas máquinas, A e B, são retiradas amostras aleatórias,


procedendo-se à pesagem das respetivas unidades. Da primeira máquina é
retirada uma amostra de 36 unidades, obtendo-se um peso médio de 120 gramas
e uma variância de 4. Da segunda máquina, são observados 64 artigos, obtendo-
se um peso médio de 130 gramas e uma variância de 5. Admitido que os pesos
dos artigos têm distribuição N ( 1; ) na máquina A e N ( 2; ) na máquina B,
construa um intervalo de confiança a 99% para a diferença entre os pesos
médios dos artigos fabricados pelas duas máquinas.

15. Numa fábrica, procura conhecer-se a incidência de defeituosos na produção de


uma máquina. Para tanto, colhe-se uma amostra de dimensão suficientemente
grande para que um intervalo com um nível de confiança de 99% não possa ter
amplitude superior a 2,5%.

a) Calcule o número de observações a incluir na amostra.


b) Construa o intervalo de confiança para a proporção de defeituosos,
admitindo que, na amostra, 90% dos artigos eram de boa qualidade.

16. Em determinado concelho pretende-se efetuar uma sondagem junto da


população a fim de determinar a proporção de pessoas que diariamente utilizam
os transportes públicos. Com os meios financeiros disponíveis, podem realizar-

5
se, para o efeito, 1600 inquéritos individuais. Supondo que o nível de confiança
adotado é de 99%.

a) calcule a amplitude máxima do intervalo que a amostra permitirá construir;


b) determine o intervalo de confiança para a referida proporção, admitindo que,
dos inquiridos, 160 utilizam diariamente transportes públicos.

17. Dois institutos de inquérito à opinião pública foram encarregados de levar a


cabo, separadamente, sondagens com vista à estimação da percentagem de
famílias que, numa dada região, possuem máquina de lavar roupa. Os resultados,
anunciados com um nível de confiança de 90%, foram os seguintes:
Instituto A: de 8,355% a 11,645%
Instituto B: de 7,355% a 10,645%.

a) Qual a percentagem dada pela amostra colhida por cada um dos institutos?
b) Determine o número de famílias inquiridas por cada instituto.
c) Tomando a média aritmética simples dos resultados obtidos em a), construa,
para um nível de confiança de 90%, um novo intervalo para a percentagem
de famílias que possuem máquina de lavar roupa.

18. Qual deve ser o número de habitantes da cidade do Porto a selecionar


aleatoriamente, para estudar a proporção de portuenses que usam óculos, de
modo a garantir que um intervalo de confiança a 95% para essa proporção tenha
uma amplitude não superior a 8%?

19. Um candidato à presidência da câmara de determinado concelho pretende


efetuar uma sondagem para estimar qual a proporção de eleitores que vão votar
em si.

a) Para ter 95% de confiança que o resultado esteja a menos de 2% dos


votos que irá ter, qual deve ser a dimensão da amostra?
b) Suponha que ele faz uma pequena sondagem junto de 100 eleitores e
regista que tem 40% dos votos. Estime, com 99% de confiança, a
proporção de votos que o candidato irá alcançar.

20. Um supermercado possui estabelecimentos em duas cidades, A e B. Pretende-se


comparar as proporções de habitantes das duas cidades que são clientes do
supermercado. Para tal, efetuam-se dois inquéritos, um em cada cidade:
selecionam-se ao acaso 100 habitantes de A e 200 de B, perguntando-se-lhes se
são ou não clientes do supermercado. Obtêm-se os seguintes resultados:
- dos 100 habitantes de A inquiridos, 30 dizem ser clientes
- dos 200 habitantes de B inquiridos, 50 dizem ser clientes.

6
a) Suponha que, com base nos resultados do inquérito, se construiu o seguinte
intervalo para a diferença entre as proporções de clientes em A e B:
[ -0,092; 0,192].
Qual o nível de confiança com que se construiu esse intervalo?
b) Construa um intervalo de confiança a 95% para a diferença entre as
proporções de clientes do supermercado em A e B.

7
Grupo de Exercícios 2: Testes de Hipóteses

8
1. Suponha que X ~ N(; 2 ) com 2  4 . Com base na amostra

27.1 29.3 31.5 33.0 30.1 30.9 28.4 32.4 31.6 28.9 27.3 29.1

a) construa um intervalo de confiança a 95% para  ;


b) teste a hipótese H0 :  = 30 contra H1 :   30, com nível de significância de
1%.

2. Suponha que a precipitação anual num dado local tem distribuição normal com
média 75mm e variância desconhecida. Nos últimos 8 anos, registaram-se os
seguintes valores de precipitação:

85.3 84.3 68.5 77.8 77.3 88.0 71.0 80.3

a) Construa um IC a 95% para  .


b) Teste a hipótese de que a precipitação anual se tenha alterado, isto é,
pretende-se testar H0 :  = 75 contra H1   : 75.

3. O peso dos pacotes de farinha de 1 kg, produzidos por uma fábrica, é uma
variável normalmente distribuída, com desvio-padrão 0,01. Da produção de
determinado dia é retirada uma amostra de 49 pacotes, com peso médio 0,998
kg. Pode-se afirmar, a um nível de significância de 1%, que o peso médio dos
pacotes de farinha desse dia não está de acordo com o peso indicado?

4. As vendas diárias de um armazém podem ser consideradas como uma variável


com distribuição normal. Nos últimos dois anos, o valor médio das vendas
diárias foi de 8000 Euros e a direção decidiu efetuar uma campanha publicitária
com o objetivo de aumentar o valor das vendas. Das vendas diárias nos 3 meses
seguintes ao lançamento da campanha, retirou-se uma amostra de 16 dias,
tendo-se obtido um valor médio de 8750 Euros, com um desvio-padrão de 1250
Euros. Poderemos afirmar, a um nível de significância de 5%, que o objetivo da
campanha publicitária foi atingido?

5. Uma firma tem seguido a política de oferecer uma garantia de 2000 utilizações
para determinado aparelho que vende. Esse procedimento baseia-se em estudos
levados a efeito no período inicial de produção, que indicaram um número médio
de utilizações possíveis por aparelho de 2060 com uma variabilidade traduzida
por σ  20 . Existindo indícios de que presentemente a situação pode ter

9
mudado, pretende-se averiguar se continua a ser de 2060 o número médio de
utilizações possíveis por aparelho. Proceda a um ensaio apropriado (supondo
que σ se mantém), sabendo que 10 aparelhos selecionados ao acaso e testados
pela firma forneceram os seguintes valores:
2100 2025 2071 2067 2150
2115 2064 2088 1995 2095
NOTA: suponha que o número de utilizações permitidas por aparelho se comporta de
forma aproximadamente normal e considere   0.05 .

6. O departamento de controlo de qualidade, de uma firma produtora de conservas de


alimentos, especifica que o peso líquido médio por embalagem de certo produto deve
ser de 500gramas. Experiência passada indica que os pesos são normalmente
distribuídos com desvio padrão igual a 15gramas. Se, numa amostra de 20 embalagens,
for encontrado um peso líquido médio de 495gramas, poder-se-á concluir que o
verdadeiro peso médio é inferior ao estipulado? (   0.05)

7. Uma máquina, M1, produz artigos cujo peso apresenta uma variância de 60 g2. A
variância do peso dos artigos produzidos por outra máquina, M2, é de 80 g2. Da
produção de M1 escolhem-se, ao acaso, 30 artigos, que pesam, em média, 130g. Dos
artigos produzidos por M2 escolhem-se, ao acaso, 40, obtendo-se um peso médio de
125g. A diferença entre as médias é significativa? (Utilize um nível de significância de
5%).

8. O semanário S afirma ter atingido, numa região, a percentagem, até então nunca
atingida por qualquer semanário, de 60% dos leitores que regularmente
compram um jornal desse tipo. Efetuando um inquérito junto de 600 leitores,
55% declararam adquirir, por hábito, o semanário em causa.

a) Adotando um nível de significância de 1%, pronuncie-se quanto à projeção


de que o semanário se reclama.
b) Sabendo que a afirmação do semanário S foi baseada num teste a um nível de
significância de 1%, incidindo sobre os dados fornecidos por uma amostra de
150 observações, diga qual a percentagem mínima de leitores de S que a
amostra revelou.

9. O presidente de certa coletividade pretende avançar com um projecto que tem


suscitado opiniões controversas. Ele afirma, em sua defesa, que mais de 50% dos
associados concordam com o projeto. O que se pode concluir da afirmação do
presidente, sabendo que em 80 associados escolhidos ao acaso 47 se
manifestaram a favor do projeto? Use α  0.10 .

10
10. Numa sondagem 60 das 200 pessoas inquiridas revelaram-se conhecedoras de
determinado produto. Após uma campanha publicitária foi feito novo inquérito
a 300 pessoas, das quais 111 se revelaram conhecedoras do produto. Pode
considerar-se que, devido à campanha publicitária, o referido produto se tornou
mais conhecido? Use   0.01.

11. Considere dois universos normais de variâncias 12  620 e  22  700 dos quais
foram retiradas duas amostras que forneceram os seguintes resultados:
n1  440  xi  19920(amostra1)
n2  300 x i  14730(amostra2)

Para   0.05 , teste se a média do 1º universo pode ser considerada superior à média
do 2º universo.

12. Poder-se-á concluir com base nas duas amostras cujos resultados se apresentam
a seguir que fora das grandes cidades se vê mais televisão?

Número de pessoas Resultados


inquiridas x s2
Fora das
60 16 4,4
grandes cidades
Nas grandes
80 14,5 6,2
cidades
Os valores referem-se ao número de horas por semana que uma pessoa vê televisão e
consideram-se ser normalmente distribuídos.

13. Pretende-se testar se a variância da população A é inferior à da população B, para


o que se recolheram amostras independentes de cada uma das populações. Os
resultados encontrados foram:

Amostra A 17 18,6 16,7 17,5 18,2 17,4 16,9 ----- ----- -----
Amostra B 16,5 18,2 16,4 17,1 18 19,3 16 16,4 17,5 16,3
Supondo tratar-se de populações com distribuição normal, proceda ao ensaio
adequado e conclua para   0.05 .

14. Havendo indícios de que o esquema de avaliação e as classificações finais


atribuídas diferem fortemente entre duas escolas, decidiu-se comprovar
estatisticamente esta hipótese. Assim, 30 fichas de alunos da escola A, escolhidas

11
ao acaso levaram aos seguintes resultados: xA  12.9 com sA  2.1 . Das 20 fichas
selecionadas na escola B obteve-se: xB  14.7 com sB  1.8 . Admitindo que as
classificações atribuídas em cada escola se comportam segundo uma
distribuição normal, diga se é de concluir que:
a) A variabilidade das classificações é significativamente diferente nas duas escolas.
b) A classificação média na escola B é significativamente mais alta que na escola A.

15. No fabrico de certo tipo de peças admite-se uma variabilidade máxima nos
respetivos diâmetros traduzida por σ  0.5mm . Perante uma amostra de 20
peças que forneceu s2=0.3, é de concluir que o processo de fabrico está fora de
controlo? (isto é, que a especificação não está sendo respeitada). Use   0.05 .
Pressupõe-se que os diâmetros das peças obedecem a uma lei normal.

16. Os Serviços de Turismo (ST) de uma praia nortenha informam que, em certa hora
do dia, a temperatura média das águas do mar é “elevada”. Tendo surgido
dúvidas entre os frequentadores da praia, registou-se a temperatura à hora
indicada, ao longo de 25 dias, e obteve-se uma temperatura média de 17 graus,
com o desvio-padrão corrigido de 1 grau. Sabe-se ainda que a temperatura das
águas do mar se distribui normalmente.

a) Diga se se pode afirmar, com 99% de confiança, que a temperatura média não
atinge os 18 graus.
b) Ainda segundo os ST, a proporção de indivíduos que contestam a sua
afirmação é muito reduzida, 10%, garantindo estes serem muitos mais.
Inquiriram-se 100 pessoas e verificou-se que 15 apoiavam tal contestação.
Para um nível de significância de 1%, teste as hipóteses em causa.

17. Um jornal desportivo noticiou que o número de espectadores de um programa


desportivo que é apresentado na televisão aos domingos à noite está igualmente
dividido entre homens e mulheres. De uma amostra aleatória de 400 pessoas que
veem regularmente o referido programa, concluiu-se que 240 são homens.
Podemos concluir, com um nível de significância de 10%, que a notícia é falsa?

12
Grupo de Exercícios 3: Regressão Linear Simples

13
1. Numa tentativa de prever o preço (em u.m.) das casas vendidas em determinada área
em função do número de divisões, obteve-se uma amostra aleatória para 5 casas,
medindo-se as duas variáveis

Preço 24 840 24 860 25 760 26 580 32 680


Nº de divisões 3 4 5 6 8

Obteve-se também a média, a variância e outras medidas associadas:


x  5; s  3,7; y  26944; s  10801480. ∑ 𝑥 2 = 150; ∑ 𝑦 2 = 3673101600; ∑ 𝑥𝑦 =
2
x
2
y

723680.
O diagrama de dispersão obtido foi o seguinte (e no qual consta o modelo de regressão
estimado e o coeficiente de determinação associado):

a) Interprete os valores obtidos para os parâmetros do modelo.


b) Teste, para um nível de significância de 5%, se a relação entre o nº de divisões e o
preço de venda, é estatisticamente significativa (com base no declive do modelo).
c) Interprete o coeficiente de correlação.
d) Será que a correlação linear entre o nº de divisões e o preço de venda pode ser
considerada significativa? (α=5%)
e) Valide o modelo em termos globais (α=1%).
f) Determine uma estimativa pontual e intervalar para o preço de venda de uma casa
com 2 divisões.

2. Para saber se é possível prever a nota de um exame em função do tempo de estudo, em


horas, na semana anterior ao exame, obteve-se uma amostra aleatória de 5 alunos,
medindo-se as duas variáveis:

Média Desvio-padrão

Horas de estudo (X) 2 3 5 4 8 4,4 2,30

Nota do exame (Y) 9 10 12 8 16 11 3,16

14
O modelo de regressão linear ajustado aos dados foi: 𝑦̂ = 5,6+1,23x . Obtiveram-se
também os seguintes resultados: ∑ 𝑥 2 = 118; ∑ 𝑦 2 = 645; ∑ 𝑥𝑦 = 268; 𝑆𝑄𝑅 =
582,1; 𝑆𝑄𝐸 = 8,1.
a) Interprete os valores obtidos para os parâmetros do modelo.
b) Teste, para um nível de significância de 5%, se a relação entre as horas de estudo e
a nota do exame, é estatisticamente significativa (com base no declive do modelo).
c) Interprete o coeficiente de correlação.
d) Será que a correlação linear entre as horas de estudo e a nota de exame pode ser
considerada significativa? (α=5%)
e) Valide o modelo em termos globais (α=1%).
f) Determine uma estimativa pontual.

3. Os dados representam o lucro Y, das vendas de uma empresa de construção, em sete


projetos diferentes, e os anos de experiência X, do chefe da obra responsável pelo
projeto.

Média Variância 𝛼̂ 𝛽̂
X 2,5 3,5 4 5 6 6,5 7 4,93 2,79 -1,83 2,60
Y 5 6 10 11 13 15 17 11,00 19,67

Para cada variável em estudo, obtiveram-se os seguintes resultados: ∑ 𝑥 2 = 186,75; ∑ 𝑦 2 =


965; ∑ 𝑥𝑦 = 423; 𝑆𝑄𝑅 = 112,99; 𝑆𝑄𝐸 = 4,79.
a) Interprete os valores obtidos para os parâmetros do modelo.
b) Teste, para um nível de significância de 5%, se a relação entre os anos de experiência
e o lucro da empresa, é estatisticamente significativa (com base no declive do
modelo).
c) Interprete o coeficiente de correlação.
d) Será que a correlação linear entre os anos de experiência do chefe da obra e o lucro
da empresa pode ser considerada significativa (α=5%)?
e) Valide o modelo em termos globais (α=1%)

4. Ao querer avaliar o ganho em termos de rapidez na leitura versus o número de semanas


de frequência em determinado programa de treino de leitura, obteve-se o modelo linear
𝑦̂ = 11,8𝑥 + 2,6 com r=0,99 para o conjunto de observações seguinte:

Nº semanas (X) 2 3 8 11 4 5 9 7 5 7
Ganho em rapidez
21 42 102 130 52 57 105 85 62 90
(palavras/min) (Y)

Algumas medidas amostrais obtidas foram:

Média Variância
X 6,1 7,9
Y 74,6 1111,6
Para cada variável em estudo, obtiveram-se os seguintes resultados: ∑ 𝑥 2 = 443; ∑ 𝑦 2 =
65656; ∑ 𝑥𝑦 = 5387; 𝑆𝑄𝑅 = 9872,12; 𝑆𝑄𝐸 = 137,48.

15
a) Interprete os valores obtidos para os parâmetros do modelo.
b) Será que a correlação linear entre o nº de semanas de frequência no programa e o
ganho em rapidez pode ser considerada significativa? (α=5%)
c) Valide o modelo em termos globais (α=1%).
d) Determine uma estimativa pontual e intervalar para o ganho em rapidez de uma
pessoa que frequentou o curso durante 7 semanas.

5. A massa muscular dos adultos decresce, em geral, com a idade. Com o objetivo de
averiguar tal relação em mulheres, um nutricionista selecionou aleatoriamente 16
mulheres com idades entre os 40 e os 79 anos, tendo chegado aos seguintes resultados:

X
71 64 43 67 56 73 68 56 76 65 45 58 45 53 49 78
(idade)
Y
(medida 82 91 100 68 87 73 78 80 65 84 116 76 97 100 105 77
da M.M)

Para cada variável em estudo, obtiveram-se os seguintes resultados: ∑ 𝑥 2 = 60409; ∑ 𝑦 2 =


121887; ∑ 𝑥𝑦 = 81331; 𝑆𝑄𝑅 = 2059,82; 𝑆𝑄𝐸 = 974,66. Obteve-se ainda

X Y
Média 60,44 59,73
Desvio padrão 11,44 14,22
Interseção ajustada 148,05
Declive ajustado -1,0236

a) Interprete os valores obtidos para os parâmetros do modelo.


b) Teste, para um nível de significância de 5%, se a relação entre a massa muscular e a
idade, é estatisticamente significativa (com base no declive do modelo).
c) Interprete o coeficiente de correlação.
d) Será que a correlação linear entre a massa muscular e a idade pode ser considerada
significativa? (α=5%)
e) Determine um intervalo de confiança para o declive do modelo global.

6. Técnicos em auditoria são frequentemente requeridos para comparar valores correntes


ou examinados oficialmente de um inventário de artigos separados em faturas com os
valores registados. Se a empresa arquiva os seus inventários e registos, deverá detetar-
se uma forte relação linear entre os valores auditados e registados. Uma amostra
aleatória de 10 artigos inventariados de determinada empresa revelou os dados que se
apresentam na tabela seguinte. Também nessa tabela são fornecidas a média e a
variância das amostras. O modelo ajustado a partir das amostras é 𝑦̂ = −0,65 + 1,0076𝑥
Artigos 1 2 3 4 5 6 7 8 9 10 Média Variância
Valor registado (X) 9 14 7 29 45 109 40 238 60 170 72,10 5981,43
Valor auditado (Y) 10 12 9 27 47 112 36 241 59 167 72,00 6079,33

16
Para cada variável em estudo, obtiveram-se os seguintes resultados: ∑ 𝑥 2 =
105817; ∑ 𝑦 2 = 106544; ∑ 𝑥𝑦 = 106155; 𝑆𝑄𝑅 = 54654,27; 𝑆𝑄𝐸 = 57,78

a) Interprete os valores obtidos para os parâmetros do modelo.


b) Teste, para um nível de significância de 5%, se a relação entre o valor registado e o
valor auditado, é estatisticamente significativa (com base no declive do modelo).
c) Interprete o coeficiente de correlação.
d) Será que a correlação linear entre o valor registado e o valor auditado pode ser
considerada significativa? (α=5%)
e) Valide o modelo em termos globais (α=1%).

7. (exercício de exame). Foi realizado um estudo para examinar a influência da televisão


na vida das pessoas com mais de 65 anos, em determinada região. A intenção do estudo
era fornecer guias para o desenvolvimento de programas de televisão, de forma a
satisfazer as necessidades desse tipo de audiência, através das seguintes características:
tempo que despende a ver televisão (em horas/dia) e grau de escolaridade (em anos).
Os resultados obtidos numa amostra de 25 pessoas, com mais de 65 anos e nessa região,
conduziram às seguintes estatísticas sumárias:
x  14,44; sx2  70,51; y  6,68; s y2  7,40 .

Ajustado um modelo de regressão linear simples aos dados obtidos, chegou-se à


seguinte estimativa dos mínimos quadrados da reta de regressão
ŷ  2,49  0,29x x [0,22] .

a) Avalie a qualidade do ajustamento baseando-se no coeficiente de determinação.


b) Com um teste de hipóteses adequado, avalie se a relação entre as duas variáveis é
significativa. O desvio-padrão do declive é 𝑆𝛽 = 0,045.
c) Determine um intervalo de confiança para o declive do modelo geral da reta.
Interprete o intervalo obtido.

17

Você também pode gostar