Você está na página 1de 20

1.- Existem diversos métodos para se calcular a economia de combustível.

A seguinte tabela contém a


milhagem com base no cálculo feito por proprietários de veículos e pelos padrões correntes do governo norte-
americano:
a) a)  Determine que tipo de covariância existe?
b) b)  Que tipo de correlação representa os dados?
c) c)  Qual será a conclusão baseando-se nesses dados ?

Veículo Proprietário Padrões do governo


Ford F150 2005 14.3 16.8
Chevrolet Silverado 2005 15 17.8
Honda Accord LX 2002 27.8 26.2
Honda Civic 2002 27.9 34.2
Honda Civic Hybrid 2004 48.8 47.6
Ford Explorer 2002 16.8 18.3
Toyota Camry 2005 23.7 28.5
Toyota Corolla 2003 32.8 33.1
Toyota Prius 2005 37.3 56

variança 129.552777777777 Toyota Prius 2005


covariança 123.023086419753 37.3
correl 0.893488767207488 56

-1 negativa perfeita
correlação -0,75 forte
-0.5 moderada
-0.25 fraca
0 não há correlação
1 positiva perfeita

2.- Desejamos conhecer uma possível relação linear entre o preço de venda (Y) e o valor estimado ou “valor
contábil” (X) de residências em determinado bairro. Escolhemos uma amostra de cinco residências que
foram vendidas no último ano. Os valores estão em unidades de $100,000.

a)  Determine que tipo de covariância existe?


b)  Que tipo de correlação representa os dados?
c)  Qual será a conclusão baseando-se nesses dados ?

Residências Valor Contábil (X) Preço de venda (Y)


1 2 2
2 3 5
3 4 7
4 5 10
5 6 11

4.6 Positiva
0.989762410697451 Quase perfeita

3.- A cada ano, os empregados de uma grande empresa são avaliados quanto ao nível de motivação, sendo 1
(não motivado) e 50 (maior nível de motivação). A empresa deseja determinar se há relação entre o número
horas-trabalho que o empregado perde por ano e o score motivacional. Uma amostra de 15 empregados
revelou os seguintes dados:

a)  Determine que tipo de covariância existe?


b)  Que tipo de correlação representa os dados?
c)  Qual será a conclusão baseando-se nesses dados ?

Empregado Horas-trabalho Score motivacional


1 49 39
2 36 42
3 127 10
4 91 25
5 72 22
6 34 35
7 155 15
8 11 48
9 192 7
10 6 45
11 63 29
12 79 21
13 43 36
14 57 49
15 82 31

COVAR -574.968889 a) covariancia negativa


CORREL -0.88943395 b) correlação negativa forte
c) Concluimos que qto mais o empregado perde horas de trabalho, menos motivado ele fica
4.- Para uma empresa manter-se competitiva, gastos em pesquisas e desenvolvimento (P&D) são essenciais.
Para determinar o nível ótimo de gastos em P&D e seu efeito sobre o valor da empresa, foi aplicada análise de
regressão linear simples, onde:
Y = razão entre preços e ganhos, X=razão entre gastos com
P&D e vendas
a) a)  Determine que tipo de covariância existe? Positiva
b) b)  Que tipo de correlação representa os dados? Positiva Forte
c) c)  Qual será a conclusão baseando-se nesses dados ? Concluímos que qto maior o investimento em P&D, maior a razão entre preços e ganhos

Empresas Y X
1 5.6 0.003 covar 0.058328
2 7.2 0.004 correlação 0.726249
3 8.1 0.009
4 9.9 0.021
5 6 0.023
6 8.2 0.03
7 6.3 0.035
8 10 0.037
9 8.5 0.044
10 13.2 0.051
11 8.4 0.058
12 11.1 0.058
13 11.1 0.067
14 13.2 0.08
15 13.4 0.08
16 11.5 0.083
17 9.8 0.091
18 16.1 0.092
19 7 0.064
20 5.9 0.028

EXTRA
Qual é a relação entre o custo de um hambúrger em lanchonetes e o custo de um ingresso de cinema? Com base nas 10 idades da tabela, calcule a covariância entre hambúrger e ingresso de cinema.

Cidade Hambúrger Ingresso


Tóquio 5.99 32.66
Londres 7.62 28.41
Nova 5.75 20
Sydney 4.45 20.71
Chicago 4.99 18
San 5.29 19.5
Boston 4.39 18
Atlanta 3.7 16
Toronto 4.62 18.05
Rio 2.99 9.9

Importante: como a covariância pode assumir qualquer valor, não se consegue determinar a força relativa da relação entre as duas variáveis.
6.83777 Positiva =COVARIAÇÃO.S
0.834808634 Relação Forte =CORREL

A existência de uma correlação relativamente forte, por si só, não implica em um efeito de causalidade. Indica somente as tendências presentes nos dados.
Fundo Dow Fundo Mútuo para Condições
P(Xi Yi) Condição Econômica
Jones Econômicas Desfavoráveis
0.2 Recessã o -300 200
0.5 Economia está vel 100 50
0.3 Economia em expansã o 250 -100

Dow Jones Mútuo


a) Valor esperado para inve 65 35
b) Variâ ncia 37525 11025
Desvio padrã o 193.71 105 risco
c) Covariâ ncia -19275 =SOMARPRODUTO(A3:A5;C3:C5;D3:D5)-C8*D8 --> -19275
Correlaçã o - 0.95 quase negativamente perfeito padroniza as unid de medidas
(inversamente proporcional)

a) a)       Calcule o valor esperado para cada um dos investimentos. (65; 35)
b) b)      Calcule a variância e o desvio padrão de cada distribuição. (37525 ; 193,7137 11025 ; 105)
c) c)       Calcule a covariância (-19275)

Exercício 2.- Você está tentando desenvolver uma estratégia para investir em duas
ações distintas. O retorno anual antecipado para um investimento de $1.000 em cada
uma das ações, sob quatro condições econômicas diferentes, apresenta a seguinte
distribuição de probabilidades:

RETORNOS
Probabilid Condição Econômica Ação X Ação Y
0.1 Recessão -100 50
0.3 Crescimento lento 0 150
0.3 Crescimento Moderado 80 -20
0.3 Crescimento Acelerado 150 -100

a) a)       O retorno esperado para a ação X a)


e       
para O retorno
a ação Yesperado
(59 ; 14)para a ação X e para a ação Y (59 ; 14)
b) b)      Calcule a variância e o desvio padrão
b)     de
Calcule
cada distribuição.
a variância e (6189;
o desvio
78,6702)
padrão (9924;
de cada99,619)
distribuição. (6189; 78,6702) (9924; 99,619)
c) c)       A covariância para a ação X e a ação
c)      YA(-6306)
covariância para a ação X e a ação Y (-6306)
d) d)      Você investiria na ação X ou na ação
d)     Y?Você
Explique.
investiria na ação X ou na ação Y? Explique.

a) Valor esperado (=SOMARPRODUTO) 59 14


b) Variância 6189 9924
Devio Padrão (=raiz da covariância) 78.67 99.62
c) Covariância - 6,306.0
d) Eu investiria na ação X , pois estatisticamente, ela apresenta um retorno esperado maior (59% contra 14%).
1.- ESTUDO DE CASO

Você é um desenvolvedor de um portal na Web destinado à Our Campus!, uma rede de relacionamentos que tem como público-alvo os alunos de
uma faculdade. Para atrair e reter visitantes ao portal, você precisa garantir que os vídeos diários com conteúdo exclusivo possam ser
rapidamente baixados e executados no navegador de um usuário. O tempo necessário para a abertura do arquivo, a quantidade de tempo em
segundos, que decorre desde o primeiro clique no link da página inicial na Web até que o primeiro vídeo esteja pronto para ser executado é, ao
mesmo tempo, função do projeto da página inicial e função do número de usuários simultâneos que estão acessando o portal.

Para verificar a velocidade com que um vídeo é baixado, você abre um navegador na Web em um computador de uso pessoal (PC) nos escritórios
oficiais da Our Campus! E mede o tempo de download. Dados passados indicam que a média aritmética do tempo de download corresponde a 7
segundos e que o desvio padrão é de 2 segundos. Aproximadamente dois terços dos tempos de download estão entre 5 e 9 segundos, e cerca de
95% dos tempos de download estão entre 3 e 11 segundos. Em outras palavras, os tempos de download estão distribuídos como uma curva em
formato de sino, com uma concentração de 7 segundos em torno da média aritmética. Como você poderia utilizar essas informações para
responder a perguntas sobre os tempos de download para o primeiro vídeo?

De que modo você é capaz de responder a perguntas sobre essa variável numérica contínua, tais como?
a) Que proporção dos downloads de vídeos demora mais de 9 segundos?
b) Quantos segundos se passam antes que 10% dos downloads sejam completados?
c) Quantos segundos se passam antes que 99% dos downloads sejam completados?
De que modo o desenho de um novo projeto para que a página inicial abra mais rapidamente afeta as respostas a essas
d) perguntas?

média 7 a) =1-DIST.NORM.N(9;7;2;1) 15.87%


desvio padrão 2 b) =INV.NORM(0,1;7;2) 4.44
c) =INV.NORM(0,99;7;2) 11.65
d) Foram atribuidos por mim nova média e desvio padrão para recalcular as questões anteriores.
média 5 a') 0.38%
desvio padrão 1.5 b') 3.08
c') 8.49

2.- Suponha que a Grear Tire Company tenha desenvolvido um novo pneu radial com cinturão de aço que será vendido por meio de
uma cadeia nacional de discount stories. Uma vez que esse tipo de pneu é um novo produto, os gerentes da Grear acreditam que a
durabilidade (em termos de milhas rodadas) oferecida com o pneu será um fator importante na aceitação do produto. Antes de fechar
os termos do contrato de garantia de durabilidade do pneu, os gerentes da Grear desejam obter informações de probabilidade a
respeito do número de milhas que os pneus durarão.
Dos testes reais de estrada com os pneus, a equipe de engenharia da Grear estima que a durabilidade média dos pneus é µ=36,500
milhas (58,741 quilômetros) e que o desvio padrão é 𝞼 = 5000. Além disso, os dados coletados indicam que a distribuição normal é
uma hipótese razoável.

a)     Qual porcentagem dos pneus possivelmente duraria mais de 40 mil milhas (64,373 quilômetros) ?
b)     Qual porcentagem dos pneus possivelmente duraria mais de 40 mil milhas (64,373 quilômetros) ?

a) = b) 24% =1-DIST.NORM.N(40000;36500;5000;VERDADEIRO)

3.- A média de preço das ações das empresas que compõem a S&P 500 é US$30, e o desvio padrão US$ 8,20 (Business Week, edição especial
anual, primavera de 2003). Suponha que os preços das ações se distribuam normalmente.

a) Qual é a probabilidade de uma empresa ter no mínimo US$40 para suas ações?
b) Qual é a probabilidade de uma empresa ter um preço não superior a US$20 para suas ações?
c) Qual deve ser o preço das ações para que a empresa seja incluída entre as 10% maiores?

média 30
desvio padrão 8.2
a) 11.13% =1-DIST.NORM.N(40;B35;B36;VERDADEIRO)
b) 11.13% =DIST.NORM.N(20;B35;B36;VERDADEIRO)
c) 40.5087228 =INV.NORM.N(0,9;B35;B36)

4.- O volume diário (milhões de ações) de títulos negociados na Bolsa de Valores de Nova York durante 12 dias de agosto e setembro é mostrado a
seguir (Barrons, 7 de agosto de 2000, 4 de setembro de 2000 e 11 de setembro de 2000). A distribuição de probabilidades do volume de negócios
é aproximadamente normal.
917 983 1046
944 723 783
813 1057 766
836 992 973

a)     Calcule a média e o desvio padrão do volume diário de negócios para usá-los como estimativas da média da popul. e do desvio padrão.
b)     Qual é a probabilidade de, em determinado dia, o volume de negócios ser inferior a 800 milhões de ações?
c)      Qual é a probabilidade de o volume de negócios ultrapassarem um bilhão de ações?
d)     Se a Bolsa de Valores quiser emitir um release sobre os 5% melhores dias de negócios, qual volume motivará um release?

a) média 902.750
desvio padrão 114.185
b) 18.4% Probabilidade de em determinado dia o volume de negocios ser < 800M ações
c) 19.7% =1-DIST.NORM.N(1000;C55;C56;VERDADEIRO) "d.2") 1% dos piores dias:
637.12 =INV.NORM(0,01;C55;C56)
d) 1,090.57 =INV.NORM(0,95;C55;C56)

ATENÇÃO PARA OS INTERVALOS. DEVEM SER ABERTOS. OS SEJA, O LIMITE INFERIOR DO INTERVALO POSTERIOR
DEVE SER O LIMITE SUPERIOR DO INTERVALO ANTERIOR +1.
Péssimo 15 15 784.40 até 784,40
Ruim 15 30 842.87 entre 784,41 e 842,87
Normal 40 70 962.63 entre 842,88 e 962,63
Bom 20 90 1,049.08 entre 962,64 e 1049,08
Mto bom 10 acima de 1.049,08
1.- Para a seguinte amostra composta de 28 escores amostrais:

3 3 2 1 5 4 5 1 6 3 2 1 1 2
3 5 3 3 2 2 3 2 4 6 1 1 3 4

a) Calcule o erro padrão da média =INT.CONFIANÇA.T ( ) para erro padrão "T" n<30
b) O intervalo de confiança de 95% para a média populacional =INT.CONFIANÇA.NORM ( ) para erro padrão "Z" n>30
c) O intervalo de confiança de 99% para a média populacional
28 n
a) 1° calcula: 1.5236 desvio padrão b) 95% 1° calcula: 2.8929 média C)99% 1° calcula: 2.8929 média
depois: 5.2915 raiz depois: 0.5908 int conf depois: 0.7978 int conf
, 0.2879 a) erro padrão finalmente: 2.30 lim bx finalmente: 2.10 lim bx
3.48 lim cima 3.69 lim cima
intervalo de confiança 2,3 ≤ μ ≤ 3,48 2,1 ≤ μ ≤ 3,69

Um erro padrão pequeno indica que muitas médias amostrais são similares (estão próximas) à média da população e, assim, a nossa amostra será (provavelmente) uma boa representação
da população.
(sem a fórmula do Excel) Usamos o erro padrão e não o desvio padrão porque estamos interessados na variabilidade das médias das amostras e não na variabilidade das observações
dentro da amostra.

2.- Para a seguinte amostra composta de 34 escores amostrais: Observe que n>30; logo podem ser usadas as duas fórmulas!

10 4 10 5 5 6 7 3 5 4 4 5 6 6 7 5 8
1 8 7 5 6 10 6 8 7 7 6 5 5 4 3 4 5

a) Calcule o erro padrão da média


b) O intervalo de confiança de 90% para a média amostral populacional
c) O intervalo de confiança de 99% para a média amostral populacional

34 n
a) 1° calcula: 2.0268 desvio padrão b) 90% 1° calcula: 5.7941 média c) 1° calcula: 5.7941 média
depois: 5.8310 raiz depois: 0.5717 int conf depois: 0.8953 int conf
finalmente: 0.3476 erro padrão finalmente: 5.22 lim bx finalmente: 4.90 lim bx
6.37 lim cima 6.69 lim cima
intervalo de confiança 5,22 ≤ μ ≤ 6,37 4,9 ≤ μ ≤ 6,69

3.- Para a seguinte amostra composta de 32 escores amostrais:

4 2 5 6 1 1 7 8 8 2 6 5 6 4 4 3
6 6 7 1 5 7 8 8 4 5 3 2 6 7 8 5

a) a)  Calcule o erro padrão da média


b) b)  O intervalo de confiança de 95% para a média amostral populacional
c) c)  O intervalo de confiança de 99% para a média amostral populacional

a) 1° calcula: 2.2288 desvio padrão b) 1° calcula: 5.0000 média c) 1° calcula: 5.0000 média
depois: 5.6569 raiz depois: 0.7722 int conf depois: 1.0149 int conf
finalmente: 0.3940 erro padrão finalmente: 4.23 lim bx finalmente: 3.99 lim bx
5.77 lim cima 6.01 lim cima
intervalo de confiança 4,23 ≤ μ ≤ 5,77 3,99 ≤ μ ≤ 6,01

4.- Um auditor de banco declara que as contas de cartões de crédito são normalmente distribuídas, com uma media de $2870 e um desvio padrão de $900
a) Qual é a probabilidade de que um titular de cartão de crédito aleatoriamente selecionado tenha uma conta menor que $2500?
b) Você seleciona 25 titulares de cartões de crédito de forma aleatória. Qual é a probabilidade de que a média da conta deles seja menor que $2500?
c) Compare as duas probabilidades obtidas e interprete a resposta.
Media 2870
b) COMO 25 TITULARES É UMA AMOSTRA.
a) 0.34049553149 D.Padrao 900 UTILIZAR RAIZ QUADRADA DO DESVIO
=DIST.NORM.N PADRAO NA FORMULA
b) 0.01991268775

c) Posso concluir que é muito mais provável encontrar alguém com conta menor que $2500 do que 25 titulares com média de conta nesse valor.

Dist Amostral

5.- Durante certa semana , o preço médio da gasolina na região de New England era de $2,81 por galão. Uma amostra aleatória de 32 postos de gasolina é retirada da
população. Qual é a probabilidade de que o peso médio da amostra esteja entre $2,76 e $2,91 por galão durante aquela semana? Suponha que desvio padrão = $0,045.
n 32
média 2.81 x1 (vlr proc) = 2.91 2.91
d. padrão 0.045 x2 (vlr proc) = 2.76 2.76
erro padrão 0.007955
=DIST.NORM.N(I72;D72;D73/RAIZ(D71);VERDADEIRO) 100% 0%
ou =DIST.NORM.N(I72;D72;D74;VERDADEIRO) 100%
Resp: 100%

6.- Uma grande loja de departamentos passou por uma forte expansão no último ano. Em particular, a quantidade de funcionários do departamento de pisos passou de dois
especialistas em instalação para um supervisor, um medidor e quinze especialistas em instalação. No ano passado, houve muita reclamação com relação à instalação de carpetes
e, por isso, foi coletada uma amostra de 50 reclamações para a elaboração de um estudo. Foram tratados estatisticamente os tempos que cada uma dessas 50 reclamações levou
para ser atendida (quantidade de dias entre o recebimento de cada reclamação e a respectiva solução do problema), obtendo-se uma média aritmética de 43,04 dias e um desvio-
padrão de 41,9261 dias.

a) Construa uma estimativa para um int. de confiança de 95% para a média aritmética do tempo que as reclamações levaram p/ ser atendidas.
b) Qual é a estimação por ponto para a média aritmética populacional?
=INT.CONFIANÇA.T ( ) para erro padrão "T"
a) 41.926 desvio padrão =INT.CONFIANÇA.NORM ( ) para erro padrão "Z"
43.04 média uso de T
uso de Z 11.62 int conf ou 11.92 int conf Observe que n>30; logo podem ser usadas as duas fórmulas!
31.42 lim bx 31.12 lim bx
54.66 lim cima 54.96 lim cima
interv. confiança 31,42 ≤ μ ≤ 54,66 31,12 ≤ μ ≤ 54,96

b) 43.04 média = μ

7.- Chamados pelo nome da Seção do Código da Receita Interna de 1978 que os autorizou, os planos 401(k) permitem aos empregados usar
uma parte de seus salários, antes do desconto dos impostos, em investimentos, tais como fundos mútuos. Os empregadores em geral
contribuem com 50% da contribuição dos empregados, até 6% do salário (Fortune, 28 dez. 1992). Uma empresa preocupada com o que
acreditava ser uma baixa participação dos empregados no seu plano 401 (k), tirou uma amostra de outras 24 empresas, com planos similares
e perguntou a respeito das taxas de participação nos seus planos 401(k). As seguintes taxas (em porcentagens) foram obtidas:

80 76 81 77 82 80 85 60
80 79 82 70 88 85 80 79
83 75 87 78 80 84 72 75

a) Determine o intervalo de confiança de 90% para a taxa de participação nos planos de 401(k)
b) Determine o intervalo de confiança de 99% para a taxa de participação nos planos de 401(k)
a) b)
desvio padrão 5.9776152 uso de T uso de T
média 79.083333 2.09 int conf 3.43 int conf
76.99 lim bx 75.66 lim bx
81.17 lim cima 82.51 lim cima
76,99 ≤ μ ≤ 81,17 75,66 ≤ μ ≤ 82,51

=INT.CONFIANÇA.T(0,1;D100;24) =INT.CONFIANÇA.T(0,01;D100;24)
Teste de Hipotese 1.64485363 =INV.NORMP(0,95) Se o Z cair na região crítica, rejeita a Ho (hipótese nula)
2.32634787 =INV.NORMP(0,99)
Teste unilateral a direita - Será que aumentou?
Decisão Aceitar H0 Rejeitar H0 Teste unilateral a esqueda - Será que diminuiu?
H0 verd erro 1
H0 falsa erro 2 Resultado é significativo? Ver se está no intervalo de confiança.

1.- Na legislação dos EUA, o acusado é tido como inocente até que seja provado culpado. Considere uma hipótese nula, H0, em que o acusado
seja inocente, e uma hipótese alternativa, H1, em que o acusado seja culpado. Um júri tem duas decisões possíveis: condenar o acusado (isto é,
rejeitar H0) ou não condenar o acusado (isto é, não rejeitar H0). Explique o significado dos riscos de ser cometido um erro do tipo I ou do tipo II.

H0 inocente Decisão Aceitar H0 Rejeitar H0


H1 culpado H0 verd erro 1
Erro tipo I Condenar o inocente (rejeitar H0, sendo que ela é verdadeira) H0 falsa erro 2
Erro tipo II Inocentar o culpado (aceitar H0, sendo que ela é falsa)

2.- O gerente de uma concessionária de automóveis está pensando em um novo plano de bonificações para aumentar o volume de vendas.
Atualmente, o volume médio de vendas é de 14 automóveis por mês. O gerente quer realizar um estudo e pesquisa para verificar se o novo
plano de bonificações aumenta o volume de vendas. Para coletar dados sobre o plano, uma amostra da equipe de vendas será autorizada a
vender sob o novo plano de bonificação durante o período de um mês.

a) Desenvolva as hipóteses nula e alternativa mais apropriada a essa situação de pesquisa.


b) Comente a conclusão relativa a quando a Ho não pode ser rejeitada.
c) Comente a conclusão relativa a quando a Ho pode ser rejeitada

a) Ho μ = 14 b) e c) Decisão H0 verd H0 falsa


Ha μ > 14 Sempre que Rejeitar H0 erro 1
Sempre que Aceitar H0 erro 2

3.- Uma operação de linha de produção foi projetada para encher caixas de sabão em pó com um peso médio de 0,907 kg. Uma
amostra das caixas é selecionada periodicamente e pesada para determinar se há ocorrência de enchimentos abaixo ou acima do
padrão. Se os dados da amostra levarem à conclusão de que há a ocorrência de enchimentos abaixo ou acima do padrão, a linha de
produção será interrompida e ajustada para se obter o enchimento apropriado.

a) Formule as hipóteses nula e alternativa que ajudem a decidir se a linha de produção deve ser interrompida e ajustada.
b) Comente a conclusão relativa a quando a Ho não pode ser rejeitada.
c) Comente a conclusão relativa a quando a Ho pode ser rejeitada

a) Ho μ = 0,907 b) e c) Decisão H0 verd H0 falsa


Ha μ ≠ 0,907 Sempre que Rejeitar H0 erro 1
Sempre que Aceitar H0 erro 2

b) H0 não pode ser rejeitada quando ela for verdadeira, ou seja, quando o peso for 0,907Kg, caso contrário, estará incorrendo no erro
tipo 1
c) H0 pode ser rejeitada quando ela for falsa, ou seja, quando o peso for diferente de 0,907Kg, caso contrário, estará incorrendo no
erro tipo 2

4.- Em virtude do tempo e dos custos elevados de produção e transformação, um diretor de manufatura precisa convencer a
administração de que um novo método de manufatura proposto reduz os custos, antes de o novo método ser implementado. O
método de produção atual opera com um custo médio de $220,00 por hora. Um estudo e pesquisa medirão o custo do novo método
ao longo de um período de produção amostral.

a) Formule as hipóteses nula e alternativa mais apropriada a esse estudo.


b) Comente a conclusão relativa a quando a Ho não pode ser rejeitada.
c) Comente a conclusão relativa a quando a Ho pode ser rejeitada

a) Ho = μ = 220
Há = μ < 220
b) H0 não pode ser rejeitada quando ela for verdadeira, caso contrário, estará incorrendo no erro tipo 1
c) H0 pode ser rejeitada quando ela for falsa, caso contrário, estará incorrendo no erro tipo 2 / Isso implica que temos evidências
estatísticas para rejeitá-la com um risco conhecido: α

5.- O proprietário de um posto de gasolina deseja estudar os hábitos de compra de gasolina dos motoristas em seu posto. Ele
seleciona uma amostra aleatória de 60 motoristas, durante uma determinada semana, com os seguintes resultados:
A média aritmética foi de 11,3 galões e o desvio padrão de 3,1 galões.
a) No nível de significância de 0,05, existem evidências de que a média aritmética de aquisição de gasolina seja difte de 10 galões?
b) Qual seria sua resposta em (a) se a média aritmética da amostra fosse 10,3 galões?

1º) DADOS
n 60 Z é a quantidade de desvios padrões que se afastaram da média
Média 11.3 Z é a quantidade de desvios padrões que existem entre 11,3 e 10
D.Padrao 3.1
Nivel Significancia 0.05 Alfa (α) Grau de Liberadade = N - 1; por isso utilizamos 59 na fórmula
Nivel de confiança 0.95
H0: M = 10 10
Há: M ≠ 10

2º) CALCULAR Z 3.248

3º) CALCULAR A REGIÃO CRÍTICA (T)


=INV.NORMP.N(0,975) 1.960
ou
=INV.T(0,025;C52-1) -2.001
Utilizar o espelho --> 2.00 ---> está abaixo de 3,24 --> rejeita!

a) Não existem evidencias suficientes para considerar que a média aritmética seja
diferente de 10 a um nível de significância de 5%.
b) Nova média: 10.3
Z 0.75 está abaixo de 1,96 Rejeito H0
6.- Uma empresa de coleta de informações verificou que em 2003, o preço médio das refeições em restaurantes da
cidade de São Paulo era de R$28,44. Neste ano realizou-se uma pesquisa em 40 restaurantes, aleatoriamente escolhidos
e foram obtidos os valores da tabela. Os dados fornecidos proporcionam evidência suficiente para concluir que o preço
médio deste ano dos restaurantes da cidade de São Paulo aumentou com relação à média de $28,44 de 2003? Realize o
teste apropriado com nível de significância de 1%.

Tabela .- Preço médio das refeições (por pessoa) nos restaurantes de São Paulo neste ano.

35 37 33 26 50 32 30 39 1 criar as hipóteses
32 33 48 27 20 24 33 31 2 Qual modelo estatistico Z ou T
39 25 28 31 36 32 26 41 3 Aplico a formula
33 25 35 32 41 36 45 27 4 Desenho o grafico
18 28 32 36 22 34 26 21 5 Tomar decisão

1º) DADOS
n 40
Média 31.975
D.Padrao 7.20927999
Nivel Significancia 0.01 Alfa (α) (monocaudal)
Nivel de confiança 0.99
H0: μ = 28,44 28.44
Ha: μ > 28,44

2º) CALCULAR Z teste 3.101

3º) CALCULAR A REGIÃO CRÍTICA (Z)


=-1*INV.NORMP.N(C87) 2.32634787

Z teste está na região crítica, logo, rejeita-se a hipótese nula.

7.- Assuma que a média de gasto com combustível de todas as famílias de uma certa região seja de RS1123,00 em um determinado ano. Neste mesmo
ano, coletando-se uma amostra aleatória de 15 famílias de classe média obteve-se os valores abaixo, arredondados para o inteiro mais próximo. Com um
nível de significância de 5%, os dados indicam que famílias de classe média alta gastam, em média, em combustível mais do que a média da região de RS
1123,00? Assuma que a distribuição de gasto com energia das famílias as classe média alta seja normalmente distribuída.

Tabela.- Gastos com combustível mi: 1123 1 criar as hipoteses


n 15 2 Qual modelo estatistico Z ou T T
1254 1350 1227 1154 1790 3 Aplico a formula
1615 1521 908 1231 1369 4 Desenho o grafico
1711 1293 1205 1351 1185 5 Tomar decisão -1.76131014 1.76
-2.14478669
1123 T 221.26666667 3.7 a) Ho Mi=1123
n 15 59.643421915 Há Mi>1123
Nív signif 0.05 0.025 O quanto que 1344 se afasta de 1123
Probabili 0.95
1344.266667
230.9979798
1) Criar hipoteses
H0: M = 1123
Há: M> 1123

2) Qual modelo estatístico? Z ou T


T
3) Aplico a formula
media 1344.266667
D.Padrao 230.9979798
T 3.70982515
t crítico 1.761310136 define a região crítica
Compara T com T crítico para avaliar se descarta ou não.

EXISTEM EVIDENCIAS Q NOS LEVAM A CONSIDERAR QUE FAMILIAS DE CLASSE MÉDIA GASTAM MAIS
COMBUSTIVEL DO QUE A MEDIA 1123, COM UM GRAU DE CONFIANÇA DE 95% DE CERTEZA.

8.- ESTUDO DE CASO

Na tentativa de verificar a afirmação do gerente de marketing foi realizada uma pesquisa de renda mensal em uma amostra de 50 associados
escolhidos aleatoriamente na população de associados. O resultado da pesquisa mostrou que a variável aleatória renda mensal tem média $2.590
e desvio padrão $285. Que conclusões podemos tirar desses dados da amostra?

Podemos dizer que o aumento da renda mensal de $2.500 para $2.590 pode ser proveniente: Da própria variabilidade das médias amostrais ou
de um aumento real dos salários dos associados.
Para determinarmos qual é a afirmação verdadeira, recorreremos ao teste de hipóteses.
H0 : μ ≤ 2500
H1 : μ > 2500
Aparentemente, a média amostral igual a $2.590 não é muito diferente da média da população $2.500.
a) Verifique se a afirmação do pessoal de marketing é significativa considerando o intervalo de confiança de 95%.
b) Há evidências de rejeitar H0 e aceitar H1?

n 50 n>30 Z a) Estatisticamente, há evidências de que a afirmação do pessoal de marketing é


μ 2590 significativa (válida).
desvio 285
int conf 0.95 b) Devemos rejeitar a hipótese nula, pois o teste mostra que essa média amostral está
α 0.05 na região crítica, indicando, com 95% de confiança, que houve um aumento na renda
mensal.
Z calculad 2.232968783
z crítico 1.644853627 define região crítica
m² $ casa
1400 245 RESUMO DOS RESULTADOS
1600 312
1700 279 Estatística de regressão
1875 308 R múltiplo 0.7621137132 Correlação Forte
1100 199 R-Quadrado 0.5808173119
É o percentual que explica a variação da casa em função do preço.
1550 219 R-quadrado ajustado 0.5284194759 Logo, 1-r², corresponde a parcela que não é influenciada pelo preço, ou seja, há outros fatores
2350 405 Erro padrão 41.33032365 influenciando o preço (~42%)
2450 324 Observações 10
1425 319
1700 255 ANOVA
gl SQ MQ F F de significação
Regressão 1 18934.934775692 18934.934776 11.084757617 0.010394016376
=CORREL 0.762114 Resíduo 8 13665.565224308 1708.195653
Total 9 32600.5
$ casa
450
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0%
400 Interseção 98.248329621 58.0334785847115 1.6929595126 0.1289188159 -35.577111975246 232.073771218 -35.5771119752 232.073771218
350 f(x) = 0.109767737830099 x + 98.2483296213808 Variável X 1 0.1097677378 0.032969443262147 3.3293779624 0.0103940164 0.0337400653322 0.185795410328 0.03374006533 0.185795410328
300 TESTE T: Testar o coef de inclinação
250
200
Se for 0 (estatisticamente) não há relação linear
150 Se for diferente existe relação
100 Será que se afastou muito? (3,32) para que 0,109 não
50 seja zero e sendo assim nós teríamos que rejeitar Ho
0
1000 1200 1400 1600 1800 2000 2200 2400 2600
REGRESSÃO LINEAR SIMPLES

1.-. Uma empresa de vendas por catálogos, que vende componentes de informática, software e hardware, mantém um depósito
centralizado para a distribuição dos produtos encomendados. A gerência está atualmente examinando o processo de distribuição que
sai do depósito e está interessada em estudar os fatores que afetam os custos de distribuição do depósito. Atualmente, uma pequena
taxa de frete está sendo adicionada ao pedido, independentemente do valor do pedido. Ao longo dos últimos 24 meses foram
coletados dados que indicam os custos de distribuição do depósito e o número de pedidos recebidos. Os resultados são apresentados
na tabela a seguir:

Y X
Custo de Distribuição 1000
Meses (Milhares dNúmero de pedidos
1 52.95 4,015
2 71.66 3,806
3 85.58 5,309
Plotagem de probabilidade normal
4 63.69 4,262 100
80
5 72.81 4,296
60
6 68.44 4,097 40
Y

7 52.46 3,213 20
8 70.77 4,809 0
9 82.03 5,237 0 20 40 60 80 100 120
10 74.39 4,732 Percentil da amostra
11 70.84 4,413
12 54.08 2,921
13 62.98 3,977
Variável X 1 Plotagem de resíduos
14 72.3 4,428
15 58.99 3,964 15
10
16 79.38 4,582
Resíduos

5
17 94.44 5,582 0
18 59.74 3,450 -52,500 3,000 3,500 4,000 4,500 5,000 5,500 6,000
19 90.5 5,079 -10
20 93.24 5,735 -15
21 69.33 4,269 Variável X 1
22 53.71 3,708
23 89.18 5,387
24 66.8 4,161 n= 24

a) Pressupondo uma relação linear, utilize o método dos mínimos quadrados para encontrar os coeficientes de regressão bo e b1

RESUMO DOS RESULTADOS


Coeficiente de correlação linear
Estatística de regressão
R múltiplo 0.918804 Correlação muito forte
R-Quadrad 0.844201
É o percentual que explica a variação do custo de distribuição em função do número de pedidos.
R-quadrado0.837119 Logo, 1-r², corresponde a parcela que não é influenciada pelo nr de pedidos, ou seja, há outros fatores influenciando o
Erro padrã 5.218274 custo de distribuição (~17%).
Observaçõ 24
Coeficiente de determinação

ANOVA
gl SQ MQ F F de significação
Regressão 1 3246.062049 3246.062 119.2074 2.385E-10
Resíduo 22 599.0683465 27.23038
Total 23 3845.130396
(10,918 para que 16,118 não seja zero, pois senão teríamos que rejeitar h0)
Coeficientes Erro padrão Stat t valor-P95% inferiores
95% superiores
Inferior 95,0%
Superior 95,0%
Interseção 0.457625 6.571882688 0.069634 0.945114 -13.17163 14.08688 -13.17163 14.08688
Variável X 0.016118 0.001476209 10.91821 2.385E-10 0.013056 0.019179 0.013056 0.019179
TESTE T: Testar o coef de inclinação
Se for 0 (estatisticamente) não há relação linear
Se for diferente existe relação b) Faça a previsão dos custos mensais de distribuição do depósito quando o
RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE número de pedidos é 4,500.
y= 72.987
ObservaçãoY previsto ResíduosResíduos padrão Percentil Y y = C58+C59*(4500)
1 65.16964 -12.2196442 -2.394332 2.083333 52.46
2 61.80107 9.858926651 1.93177 6.25 52.95 c) Faça o gráfico dos resíduos em relação ao período de tempo.
3 86.02577 -0.44577183 -0.087345 10.41667 53.71
4 69.15068 -5.46068247 -1.069973 14.58333 54.08
5 69.69868 3.111320361 0.609636 18.75 58.99 d) Com base nos resultados de b) e c), existe alguma razão para questionar a
6 66.49128 1.948715569 0.381834 22.91667 59.74 validade do modelo
7 52.24336 0.216642019 0.042449 27.08333 62.98
8 77.96699 -7.1969899 -1.410187 31.25 63.69 Não há motivo para questionar pois ele atende os 4 requisitos
9 84.86531 -2.83530723 -0.555553 35.41667 66.8 1) Normalidade
10 76.72594 -2.33593748 -0.457706 39.58333 68.44 2) Independência
11 71.58443 -0.74443461 -0.145865 43.75 69.33 3) Linearidade
12 47.53703 6.542970666 1.282037 47.91667 70.77 4) Variância
13 64.55718 -1.57717677 -0.309034 52.08333 70.84
14 71.8262 0.473801932 0.092837 56.25 71.66
15 64.34765 -5.35764844 -1.049784 60.41667 72.3
16 74.3083 5.071697098 0.993754 64.58333 72.81
17 90.42587 4.01413324 0.786534 68.75 74.39
18 56.06322 3.676779385 0.720433 72.91667 79.38
19 82.31873 8.18126786 1.603047 77.08333 82.03
20 92.89185 0.348145969 0.068216 81.25 85.58
21 69.26351 0.066494585 0.013029 85.41667 89.18
22 60.22155 -6.51155209 -1.275881 89.58333 90.5
23 87.28294 1.897058192 0.371712 93.75 93.24
24 67.52281 -0.72280852 -0.141628 97.91667 94.44
2.- A tabela que segue lista o número de empregados e o faturamento anual para as 10 maiores padarias de atacado:
x y

Companhia Empregados Faturamento (US$ Milhoes)


Nabisco 9500 1734 a) Determine o coeficiente de correlação linear
Continental 22400 1600 b) Determine o coeficiente de determinação
Campbell 19000 1044 c) O que este coeficiente representa?
Keepler 8943 988 d) Com base nos resultados de Excel, existe alguma
Interstate 11200 704 razão para questionar a validade do modelo?
Floweers 10200 557
Sunshine 5000 490
American 6600 461
Entenmann´s 3734 450
Kitchens 1550 405

RESUMO DOS RESULTADOS

Estatística de regressão
A) R múltiplo 0.682332644 Correlação linear, mas não é forte. É moderada.
B) R-Quadrado 0.465577837 Numero de empregados explica 46% da variação do faturamento.
R-quadrado aju 0.398775066 C) Representa o quanto da variação do nível de faturamento pode ser explicado a partir da variação do numero de empregados (46,5%)
Erro padrão 378.6537458
Observações 10

ANOVA
gl SQ MQ F F de significação
Regressão 1 999268.826176231 999268.83 6.969439 0.0297147
Valor P < 5%
Resíduo 8 1147029.27382377 143378.66 O modelo está
Total 9 2146298.1 valendo.

Coeficientes Erro padrão Stat t valor-P 95% inferiores


95% superiores
Inferior 95,0%
Superior 95,0%
Interseção 343.0445155 224.154914694041 1.5303903 0.1644508 -173.8576 859.94668 -173.8576 859.94668 Não invalida o modelo.
Empregados 0.050980412 0.019310984934717 2.6399695 0.0297147 0.0064492 0.0955116 0.0064492 0.0955116

Y = 343,044 + 0,05098x Modelo é valido mas não suficiente.

RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE


D) O grafico de plotagem de probabilidade normal não segue o
Observação
Previsto(a) Faturamento (US$ Milhoes)Resíduos Resíduos padrão Percentil
Faturamento (US$ Milhoes) padrão adequado.
1 827.3584253 906.64157469437 2.5396252 5 405
2 1485.005734 114.994265588595 0.3221144 15 450 Plotagem de probabilidade normal
Faturamento (US$ Milhoes)

3 1311.672335 -267.672335112208 -0.749786 25 461


4 798.9623361 189.037663932503 0.52952 35 490 2000
1500
5 914.025125 -210.025124955228 -0.588309 45 557 1000
6 863.0447134 -306.044713396641 -0.857272 55 704 500
7 597.9465733 -107.946573291987 -0.302373 65 988 0
8 679.5152318 -218.515231785727 -0.612091 75 1044 0 10 20 30 40 50 60 70 80 90 100
9 533.4053723 -83.405372258816 -0.23363 85 1600 Percentil da amostra
10 422.0641534 -17.0641534148616 -0.047799 95 1734
3.- O gerente de marketing de uma grande cadeia de supermercado gostaría de utilizar o espaço disponível
em prateleiras de supermercado para prever as vendas de rações para animais de estimação. Uma amostra
aleatória de 12 lojas de igual tamanho foi selecionada, com os seguintes resultados.

Loja Espaço de pVendas semanais (Y)


1 5 160
2 5 220
Variável X 1 Plotagem de resíduos Plotagem de probabilidade normal
3 5 140
60 400
4 10 190
40 300
5 10 240
20

Resíduos
6 10 260 200
0

Y
7 15 230 -20 4 6 8 10 12 14 16 18 20 22 100
8 15 270 -40 0
9 15 280 -60 0 20 40 60 80 100 120
10 20 260 Variável X 1 Percentil da amostra
11 20 290
12 20 310

a) Construa um gráfico de dispersão


b) Interprete o significado do coeficiente de inclinação.
c) Faça a previsão das vendas semanais para rações para animais de estimação

RESUMO DOS RESULTADOS c) y = 145 + 7,4x X Vendas


5 182
Estatística de regressão 10 219
R múltiplo 0.827001 15 256
R-Quadrado 0.68393 20 293
R-quadrado ajustado 0.652323
Erro padrão 30.80584
Observações 12

ANOVA
gl SQ MQ F F de significação
Regressão 1 20535 20535 21.63857 0.000906
Resíduo 10 9490 949
Total 11 30025

CoeficientesErro padrão Stat t valor-P 95% inferio95% superiInferior 95 Superior 95,0%


Interseção 145 21.78302 6.65656065767089 5.663E-05 96.4644 193.5356 96.4644 193.5356
Variável X 1 7.4 1.590807 4.65172730418922 0.000906 3.855461 10.94454 3.855461 10.94454
y = 145 + 7,4x
b) As vendas semanais aumentam em 7,4 a cada aumento de espaço correspondente a 1 "pé" de prateleira.

RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE


Observação Y previsto Resíduos Resíduos padrão Percentil Y
1 182 -22 -0.749007070159273 4.166667 140
2 182 38 1.29373948482056 12.5 160
3 182 -42 -1.42992258848588 20.83333 190
4 219 -29 -0.987327501573586 29.16667 220
5 219 21 0.714961294242942 37.5 230
6 219 41 1.39587681256955 45.83333 240
7 256 -26 -0.885190173824595 54.16667 260
8 256 14 0.476640862828628 62.5 260
9 256 24 0.817098621991934 70.83333 270
10 293 -33 -1.12351060523891 79.16667 280
11 293 -3 -0.102137327748992 87.5 290
12 293 17 0.57877819057762 95.83333 310
4.- Você deseja desenvolver um modelo para prever o valor de avaliação de casas, com base na área aquecida. Foi
selecionada uma amostra de 15 residências unifamiliares em uma determinada cidade. O valor de avaliação (em
milhares de dólares) e a área aquecida (em milhares de pés quadrados) são registrados, com os seguintes resultados:
y x
Casa Valor de avÁrea aquecida da residência (Milhares de pés quadrados)
1 184.4 2
2 177.4 1.71 Variável X 1 Plotagem de resíduos
3 175.7 1.45 10
4 185.9 1.76 5

Resíduos
5 179.1 1.93 0
6 170.4 1.2 -5 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1
7 175.8 1.55 -10
8 185.9 1.93 Variável X 1
9 178.5 1.59
10 179.2 1.5
11 186.7 1.9
a) Determine o coeficiente de correlação linear.
b) Determine o coeficiente de determinação.
c) O que este coeficiente representa?.

RESUMO DOS RESULTADOS

Estatística de regressão
a) R múltiplo 0.840041 Correlação linear é forte.
b) R-Quadrado 0.705669 A variação do valor de avaliação das casas pode ser explicado em 70% pela área aquecida.
c) R-quadrado ajustado 0.672966 O coeficiente de correlação ao quadrado (conhecido como o coeficiente de determinação, R2) é uma
Erro padrão 2.985404 medida da quantidade de variação em uma variável que é explicada pela outra.
Observações 11

O R Múltiplo é a correlação entre os valores observados de Y e os de Y previstos pelo modelo de regressão múltipla. Desta forma, valores grandes
do R Múltiplo representam uma alta correlação entre os valores previstos e observados da variável de saída. Um R Múltiplo igual a 1 representa a
situação na qual o modelo prediz com perfeição os valores observados, isto é, ele adere perfeitamente a todos os pontos.

ANOVA
gl SQ MQ F F de significação
Regressão 1 192.315344954 192.315344954162 21.57782 0.00121
Resíduo 9 80.2137459549 8.91263843943648
Total 10 272.529090909

Coeficientes Erro padrão Stat t valor-P95% inferiores


95% superiores
Inferior 95,0%
Superior 95,0%
Interseção 150.3437 6.42805708291 23.3886733812415 2.274E-09 135.8025 164.885 135.8025 164.885
Variável X 1 17.56042 3.78034206106 4.64519366113964 0.00121 9.008693 26.11215 9.008693 26.11215

y = 150,34 + 17,54*área aquecida

RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE


Observação Y previsto Resíduos Resíduos padrão Percentil Y
1 185.4646 -1.0645695461 -0.375880364328946 4.545455 170.4
2 180.372 -2.9720474622 -1.04937651748619 13.63636 175.7
3 175.8063 -0.1063380076 -0.037546038396812 22.72727 175.8
4 181.2501 4.64993148888 1.64180719670614 31.81818 177.4
5 184.2353 -5.1353400775 -1.81319624106714 40.90909 178.5
6 171.4162 -1.0162327629 -0.358813515346932 50 179.1
7 177.5624 -1.7623801055 -0.622264725302325 59.09091 179.2
8 184.2353 1.66465992245 0.587761485795191 68.18182 184.4
9 178.2648 0.2352030553 0.083045969561018 77.27273 185.9
10 176.6844 2.51564094341 0.888227582514397 86.36364 185.9
11 183.7085 2.99147255182 1.05623516735151 95.45455 186.7
Y X X
Semana Vendas Preço Gastos Publicidade Preço
1 350 5.5 3.3 600
2 460 7.5 3.3 500
3 350 8 3
400 f(x) = − 24.0338583223479 x + 558.277249705127
4 430 8 4.5 R² = 0.196491114535315
300
5 350 6.8 3
6 380 7.5 4 200

7 430 4.5 3 100


8 470 6.4 3.7 0
4 4.5 5 5.5 6 6.5 7 7.5 8 8.5
9 450 7 3.5
10 490 5 4
Preço Plotagem de resíduos
11 340 7.2 3.5
150
12 300 7.9 3.2
13 440 5.9 4 100

Resíduos
14 450 5 3.5 50
15 300 7 2.7 0
-50 4 4.5 5 5.5 6 6.5 7 7.5 8 8.5
RESUMO DOS RESULTADOS -100
Preço
Estatística de regressão
R múltiplo 0.722134 Correlação é linear, moderada, quase forte.
R-Quadrad 0.521478 Somente 52% das vendas podem ser explicadas pelas variáveis preço e publicidade
R-quadrado0.441724 Numero de amostras x numero de variáveis independentes
Erro padrã 47.46341
Observaçõ 15

ANOVA
gl SQ MQ F F de significação
Regressão 2 29460.03 14730.01 6.538607 0.012006 O modelo é valido. É menor do que 5%
Resíduo 12 27033.31 2252.776
Total 14 56493.33
Intervalo de confiança

CoeficientesErro padrão Stat t valor-P 95% inferio95% superi


Inferior 95,0%
Superior 95,0%
Interseção 306.5262 114.2539 2.682851 0.019932 57.58834 555.464 57.58834 555.464
Preço -24.97509 10.83213 -2.30565 0.039788 -48.57626 -1.373916 -48.57626 -1.373916
Gastos Pub 74.13096 25.96732 2.854779 0.014494 17.55303 130.7089 17.55303 130.7089
Abaixo de 5%
Não passa pelo zero. Tem correlação.
Não passa pelo zero. Tem correlação.
RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE

Observação
Previsto(a) Vendas
Resíduos
Resíduos padrão Percentil Vendas
1 413.7954 -63.79536 -1.451789 3.333333 300
2 363.8452 96.15482 2.188192 10 300
3 329.1183 20.88165 0.475203 16.66667 340
4 440.3148 -10.31479 -0.234733 23.33333 350
5 359.0885 -9.088457 -0.206826 30 350
6 415.7369 -35.73685 -0.813262 36.66667 350
7 416.5312 13.46884 0.30651 43.33333 380
8 420.9702 49.02984 1.115771 50 430
9 391.1589 58.84108 1.339045 56.66667 430
10 478.1746 11.82542 0.269111 63.33333 440
11 386.1639 -46.1639 -1.05055 70 450
12 346.4421 -46.44205 -1.05688 76.66667 450
13 455.697 -15.697 -0.357216 83.33333 460
14 441.1091 8.890903 0.20233 90 470
15 331.8542 -31.85415 -0.724904 96.66667 490
Gastos Publicidade Plotagem de resíduos
150
100
Resíduos

7249705127 50
0
-50 2.6 2.8 3 3.2 3.4 3.6 3.8 4 4.2 4.4 4.6
-100
Gastos Publicidade
5 8 8.5

s Plotagem de probabilidade normal


600
500
400
Vendas

300
200
5 8 8.5 100
0
0 20 40 60 80 100 120
Percentil da amostra

eço e publicidade

enor do que 5%

erior 95,0%

elo zero. Tem correlação.


elo zero. Tem correlação.
Y X X
Vendas Radios Jornais
Cidade ($1.000) ($1.000) ($1.000) 1.- Uma empresa de produtos para consumo deseja medir a eficácia de diferentes meios de propaganda na promoção de seus produtos.
Especificamente, a empresa está interessada na eficácia da propaganda no rádio e em jornais (incluindo o custo de cupons de desconto). É
1 973 0 40 selecionada para estudo uma amostra de 22 cidades, com populações aproximadamente iguais, durante um período de teste de um mês. A
2 1119 0 40 cada cidade é alocado um nível específico de despesas tanto para propaganda em rádio quanto para propaganda em jornais. As vendas do
3 875 25 25 produto (em milhares de dólares) bem como os níveis de despesa com os meios de propaganda durante o mês do teste, foram registradas com
os seguintes resultados:
4 625 25 25
5 910 30 30
6 971 30 30
7 931 35 35
8 1177 35 35 Radios Plotagem de resíduos Jornais Plotagem de resíduos
9 882 40 25
400 400
10 982 40 25
200 200
11 1628 45 45

Resíduos
Resíduos
12 1577 45 45 0 0
0 10 20 30 40 50 60 70 80 0 5 10 15 20 25 30 35 40 45 50
13 1044 50 0 -200 -200
14 914 50 0 -400 -400
15 1329 55 25 Jornais
Radios
16 1330 55 25
17 1405 60 30
18 1436 60 30 a) Função a) Equação
19 1521 65 35
Plotagem de probabilidade normal Y=156,4304+13,0806x1+16,7952x2 Vendas=156,43+13,08(P RADIO) + 16,79 (P JORNAL)
20 1741 65 35 2000
21 1866 70 40 1500 b) Interprete o significado das inclinações b1 e b2.

Vendas
22 1717 70 40 1000
500 Radios 13.08068 A cada 1 real investido em rádios haverá um retorno de 13,08 reais.
0 Jornais 16.79528 A cada 1 real investido em jornais haverá um retorno de 16,79 reais.
RESUMO DOS RESULTADOS 0 20 40 60 80 100 120
Percentil da amostra
Estatística de regressão
R múltiplo 0.899273 Coeficiente de relação forte.
R-Quadrad 0.808692 c) Interprete o significado do coeficiente de regressão b0.
R-quadrado0.788555 Explica a consistencia do modelo b0 é 156 (vendas). Sem radio e jornal. Ou seja, sem propaganda vc vende.
Erro padrã 158.9041 nesse caso é muito baixa, o que faz rejeitarmos a Ho.
Observaçõ 22
d) Faça a previsão para a média aritmética das vendas para uma cidade na qual a
ANOVA propaganda em rádio custe $20.000 e a propaganda em jornais custe $20.000.
gl SQ MQ F F de significação
Regressão 2 2028033 1014016 40.15823 1.501264275143E-07 Modelo é válido 753.94961523
Resíduo 19 479759.9 25250.52 Explica a consistencia do modelo
Total 21 2507793 nesse caso é muito baixa, o que faz rejeitarmos a Ho.
e) Construa uma estimativa para o intervalo de confiança de 95% da média aritmética das
CoeficientesErro padrão Stat t valor-P 95% inferiores 95% superiores
Inferior 95,0%
Superior 95,0% vendas para cidades nas quais a propaganda em rádio custe $20.000 e a propaganda em
b0 ou "a" Interseção 156.4304 126.7579 1.234089 0.232217 -108.876807722994 421.7377 -108.8768 421.7377 jornais custe $20.000.
b1 Radios 13.08068 1.759374 7.434851 4.889E-07 9.39826951277972 16.76309 9.39827 16.76309
b2 Jornais 16.79528 2.963378 5.667613 1.831E-05 10.5928568204545 22.9977 10.59286 22.9977
Bem menor que 5% 95% inferiores 95% superiores
-108.8768077 421.7377
9.3982695128 16.76309
RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE 10.59285682 22.9977

Observação
Previsto(a) Vendas
Resíduos
Resíduos padrão Percentil Vendas 290.94571894 1216.954
1 828.2416 144.7584 0.957727 2.27272727272727 625
2 828.2416 290.7584 1.923667 6.81818181818182 875
3 903.3294 -28.32941 -0.187428 11.3636363636364 882
4 903.3294 -278.3294 -1.841437 15.9090909090909 910
5 1052.709 -142.7092 -0.944169 20.4545454545455 914
6 1052.709 -81.70921 -0.540591 25 931
7 1202.089 -271.089 -1.793534 29.5454545454545 971
8 1202.089 -25.089 -0.16599 34.0909090909091 973
9 1099.54 -217.5396 -1.439249 38.6363636363636 982
10 1099.54 -117.5396 -0.777646 43.1818181818182 1044
11 1500.849 127.1514 0.841238 47.7272727272727 1119
12 1500.849 76.15141 0.50382 52.2727272727273 1177
13 810.4645 233.5355 1.545079 56.8181818181818 1329
14 810.4645 103.5355 0.684994 61.3636363636364 1330
15 1295.75 33.25016 0.219984 65.9090909090909 1405
16 1295.75 34.25016 0.2266 70.4545454545455 1436
17 1445.13 -40.12963 -0.265499 75 1521
18 1445.13 -9.129634 -0.060402 79.5454545454546 1577
19 1594.509 -73.50943 -0.486341 84.0909090909091 1628
20 1594.509 146.4906 0.969186 88.6363636363636 1717
21 1743.889 122.1108 0.807889 93.1818181818182 1741
22 1743.889 -26.88922 -0.1779 97.7272727272727 1866
2.- O proprietário da Showtime Movie Theters, Inc., gostaria de estimar semanalmente a receita bruta em função dos gastos de
propaganda. Os dados históricos de uma amostra de oito semanas são os seguintes:

Prop
Rec Bruta Prop TV Jornal
Sem ($1.000) ($1.000) ($1.000)
96 5 1.5
90 2 2
95 4 1.5
92 2.5 2.5
95 3 3.3
94 3.5 2.3
94 2.5 4.2
94 3 2.5

Desenvolva uma equação de regressão estimada, sendo a quantía gasta em propaganda de televisão a variável
a) independente.
Estabeleça uma equação de regressão estimada, sendo a quantía gasta em propaganda de televisão e a quantía gasta em
b) propaganda de jornal as variáveis independentes.
O coeficiente da equação de regressão estimada correspondente aos gastos de propaganda de TV é idêntico nos itens (a) e
c) (b) ? interprete o coeficiente em cada caso.
Qual é a estimativa da receita bruta seminal de uma semana em que são gastos $3500 em propaganda de TV e 1800 em
d) propaganda de jornal?

Estatística de regressão
R múltiplo 0.807807
R-Quadrado 0.652553
R-quadrado aj 0.594645
Erro padrão 1.215175 c) Os
coeficientes
Observações 8 são
diferentes,
eo
ANOVA
resultado
gl SQ MQcom
gerado F F de significação
Regressão 1 16.6401 a16.6400966 11.26881 0.015288
propaganda
Resíduo 6 8.859903 de 1.47665056
TV na
Total 7 25.5 receita
bruta será
maior
CoeficientesErro padrãoquanto
Stat t valor-P95% inferiores
95% superiores
Inferior 95,0%
Superior 95,0%
Interseção 88.63768 1.582367 maior for
56.0158761 2.174E-09 84.76577 92.50959 84.76576827 92.50959
esse
Variável X 1 1.603865 0.477781 3.35690502 0.015288 0.434777 2.772952 0.434777257 2.772952
coeficiente.
Podemos
a) afirmar que b)
o impacto é
y = 88,63 + 1,60(x1) maior qdo y = 83,23 + 2,29(x1) + 1,30(x2)
Receita Bruta = 88,63 + 1,60 (Prop TV) há as Receita Bruta = 83,23 + 2,29 (Prop TV) + 1,30 (Prop Jornal)
variáveis TV
e jornais
RESUMO DOS RESULTADOS juntas. (2°
Estatística de regressão caso)
R múltiplo 0.958663
R-Quadrado 0.919036
R-quadrado aj 0.88665
Erro padrão 0.642587 d) TV = 3.5 jornal = 1.8
Observações 8 y = 83,23 + 2,29(3500) + 1,30(1800)
y = C57+C58*F47+C59*I47 93.58751474
ANOVA
gl SQ MQ F F de significação
Regressão 2 23.43541 11.7177039 28.37777 0.001865
Resíduo 5 2.064592 0.41291844
Total 7 25.5

CoeficientesErro padrão Stat t valor-P95% inferiores


95% superiores
Inferior 95,0%
Superior 95,0%
Interseção 83.23009 1.573869 52.8824789 4.572E-08 79.18433 87.27585 79.18433275 87.27585
Variável X 1 2.290184 0.304065 7.53189931 0.000653 1.508561 3.071806 1.508560796 3.071806
Variável X 2 1.300989 0.320702 4.05669666 0.009761 0.476599 2.125379 0.476599398 2.125379
3.- A Barron´s realiza uma revisão anual das corretoras on-line, incluindo tanto as corretoras que podem ser acessadas por meio de um navegador de internet como as corredotoras de acesso direto, as quais conectam os clientes
diretamente com o servidor de rede da corretora. As ofertas e o desempenho de cada corretora são avaliados em seis áreas usando uma pontuação de 0 a 5 em cada categoria. Os resultados são ponderados para se obter uma
pontuação global e, então, uma classificação final designada por estrelas, a qual varia de zero a cinco estrelas, é atribuída a cada corretora. A execução do negócio, facilidade de uso e a variedade de ofertas são três das áreas avaliadas.
Uma pontuação igual a 5 na execução do negócio significa que o processo de entrada e execução do pedido fluiu facilmente de uma etapa para a seguinte. Um valor igual a 5 para a facilidade de uso significa que o site foi fácil de usar e
que pode ser personalizado para exibir aquilo que o cliente quer ver. Um valor igual a 5 para a área de variedade de ofertas significa que todas as transações de investimentos podem ser executadas online. Os dados a seguir apresentam
as pontuações correspondents à execução do negócio, facilidade de uso e variedade de ofertas, bem como uma classificação por estrelas de uma amostra de dez das corretoras on-line que a Barron´s avaliou (Barron´s, 10/03/2003).

X X X Y
Corretora Execução do NeFacilidade de Uso Variedade de Ofertas Avaliação
Wall St. Access 3.7 4.5 4.8 4
E*TRADE (Power) 3.4 3 4.2 3.5
E*TRADE(Standard) 2.5 4 4 3.5 E
P
x e cu ç
l o tag
ã o d o Ne g ó c
e m d e re sí d
i o
u o s
Fa ci l i
d e re
d a d
s í d
e d e
u os
Us o P l
o tag em

Preferred Trade 4.8 3.7 3.4 3.5


My Track 4 3.5 3.2 3.5
Variedade de Ofertas Plotagem de probabilidade
TD Waterhouse 3 3 4.6 3.5 Plotagem de resíduos normal

Resíduos

Avaliação
Brown & Co. 2.7 2.5 3.3 3
-0.5 0
Brokerage America 1.7 3.5 3.1 3 2 2.5 3 3.5 4 4.5 5
0 10 20 30 40 50 60 70 80 90 100
Merrill Lynch Direct 2.2 2.7 3 2.5 Variedade de Ofertas Percentil da amostra
Strong Funds 1.4 3.6 2.5 2

a) Determine a equação de regressão estimada que possa ser usada para prever a classificação por estrelas, dadas as pontuações para a execução, facilidade de uso e variedade de ofertas.
b) Use o teste F para determiner a significância global da relação. Qual é a sua conclusão no nível de significância 0,05?
c) Use o teste t para determiner a significância de cada variável independente. Qual é a sua conclusão ao nível de significância de 0,05?
d) Retire da equação de regressão estimada quaisquer variáveis independents que não sejam significativas.
RESUMO DOS RESULTADOS Qual é a sua equação de regressão estimada recomendada? Compare R2 com o valor de R2 obtido no item (a). Discuta as diferenças.
a) 'Y=0,345097+0,254822(negocio)+0,132492(Fac.Uso)+0,458519(Var.Oferta)
Estatística de regressão
R múltiplo 0.94107254931 Correl. linear forte b) 0.0031298138 Modelo é válido. O alfa é menor do que 5%. Rejeita a hipotese nula.
R-Quadrado 0.88561754306 ~88% da avaliação pode ser explicado pelas avaliações de ex. negocio, facilidade de uso e variedade de ofertas
R-quadrado ajustado 0.82842631459 c) As variáveis execução de negocio e variedade de ofertas estão abaixo de 5% e devem ser consideradas no modelo
Erro padrão 0.24309998509 valor-P
Observações 10 d) Retirar facilidade de uso / A variável Facilidade de Uso não tem impacto Interseção 0.539580378009
significativo no modelo global. Ex. Negocio 0.024686196617
ANOVA Facilidade Uso 0.381848040771
gl SQ MQ F F de significação Var. Ofertas 0.009827254921
Regressão 3 2.74541438349203 0.915138127830676 15.485198811 0.003129813822641 0.31% b) valido por que menor que 5%
Resíduo 6 0.354585616507972 0.059097602751329
Total 9 3.1

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0%
b0 Interseção 0.34509700531 0.530667258823113 0.650307701432282 0.539580378 -0.953398999318262 1.6435930099395 -0.953398999318262 1.64359300994
b1 Execução do Negócio 0.25482207553 0.08555537021565 2.97844629610177 0.0246861966 0.045475626220649 0.4641685248402 0.045475626220649 0.46416852484
b2 Facilidade de Uso 0.13249195474 0.140425860089989 0.94350110908804 0.3818480408 -0.211117746521872 0.476101656001 -0.211117746521872 0.476101656001
b3 Variedade de Ofertas 0.45851896025 0.123186272274833 3.72215955387161 0.0098272549 0.157093010725939 0.7599449097813 0.157093010725939 0.759944909781
coef/erro padrão
A variação da variável "avaliação"
pode ser explicada a partir da variação
das variáveis 1,2,3 em 88%
RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE

Observação Previsto(a) Avaliação Resíduos Resíduos padrão Percentil Avaliação


1 4.08504349032 -0.0850434903184 -0.428451604279766 5 2
2 3.5347475594 -0.034747559397797 -0.175059225733254 15 2.5
3 3.34619585411 0.153804145890752 0.774869808436289 25 3
4 3.61742766526 -0.117427665255185 -0.591604029621138 35 3
5 3.29536782183 0.204632178167778 1.03094292925884 45 3.5
6 3.61622631329 -0.116226313287069 -0.585551583089171 55 3.5
7 2.87745906493 0.122540935071506 0.61736483327249 65 3.5
8 2.66342515209 0.336574847913097 1.69567397820436 75 3.5
9 2.63899073004 -0.138990730035115 -0.700239383879997 85 3.5
10 2.32511634875 -0.325116348749574 -1.63794572256869 95 4
RETIRANDO UMA VARIÁVEL

Corretora Ex. Negocio Var. Ofertas Avaliação


Wall St. Access 3.7 4.8 4 d) Função:
E*TRADE (Power) 3.4 4.2 3.5 Y=0,671844+0,264057(Ex.Negocio)+0,45(Var.Oferta)
E*TRADE (Standard) 2.5 4 3.5
Preferred Trade 4.8 3.4 3.5 Interseção 0.671844163385
My Track 4 3.2 3.5 Ex. Negocio 0.264056673297
TD Waterhouse 3 4.6 3.5 Var. Ofertas 0.48527125128
Brown & Co. 2.7 3.3 3
Brokerage America 1.7 3.1 3 O R2 variou pouco pois a variáveis independente não era significativa.
Merrill Lynch Direct 2.2 3 2.5
Strong Funds 1.4 2.5 2

ANTES DEPOIS
RESUMO DOS RESULTADOS
r2 0.88 r2' 0.86
Estatística de regressão
R múltiplo 0.9320123964 B0 Interseção 0.345097005310629 B0 Interseção
R-Quadrado 0.86864710705 B1 Ex. Negocio 0.254822075530417 B1 Ex. Negocio
R-quadrado ajustado 0.83111770906 B2 Facilidade Uso 0.132491954739546 B3 Var. Ofertas
Erro padrão 0.24118575182 B3 Var. Ofertas 0.458518960253598 A variação da variável
Observações 10 "avaliação" pode ser
A variação da variável "avaliação" pode ser explicada a explicada a partir da
partir da variação das variáveis "1,2 e 3" (nome das variação das variáveis
variáveis) em 88% "1 e 3" (nome das
ANOVA
variáveis) em 86%
gl SQ MQ F F de significação
Regressão 2 2.69280603184678 1.34640301592339 23.145777808 0.000821369832411
Resíduo 7 0.407193968153223 0.058170566879032
Total 9 3.1

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0%
Interseção 0.67184416339 0.398921790694816 1.6841500741669 0.1360252506 -0.271455977380317 1.6151443041513 -0.271455977380317 1.615144304151
Ex. Negocio 0.2640566733 0.084324410987984 3.1314380996295 0.0165763501 0.064661126073126 0.4634522205201 0.064661126073126 0.46345222052
Var. Ofertas 0.48527125128 0.118934702118882 4.08014854062889 0.0046888069 0.204035370294216 0.7665071322668 0.204035370294216 0.766507132267

RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE

Observação Previsto(a) Avaliação Resíduos Resíduos padrão Percentil Avaliação


1 3.97815586073 0.021844139270811 0.102696471814787 5 2
2 3.60777610797 -0.10777610797192 -0.506690874720601 15 2.5
3 3.27307085175 0.226929148251108 1.06686844413525 25 3
4 3.58923844956 -0.089238449562754 -0.419539255207125 35 3
5 3.28093886067 0.219061139330615 1.02987835053053 45 3.5
6 3.69626193917 -0.196261939165479 -0.922691823831935 55 3.5
7 2.98619231051 0.013807689488132 0.064914482404904 65 3.5
8 2.62508138696 0.374918613040819 1.76261551437895 75 3.5
9 2.70858259848 -0.208582598479427 -0.980615289082183 85 3.5
10 2.2547016342 -0.254701634201911 -1.19743602042261 95 4