Escolar Documentos
Profissional Documentos
Cultura Documentos
-1 negativa perfeita
correlação -0,75 forte
-0.5 moderada
-0.25 fraca
0 não há correlação
1 positiva perfeita
2.- Desejamos conhecer uma possível relação linear entre o preço de venda (Y) e o valor estimado ou “valor
contábil” (X) de residências em determinado bairro. Escolhemos uma amostra de cinco residências que
foram vendidas no último ano. Os valores estão em unidades de $100,000.
4.6 Positiva
0.989762410697451 Quase perfeita
3.- A cada ano, os empregados de uma grande empresa são avaliados quanto ao nível de motivação, sendo 1
(não motivado) e 50 (maior nível de motivação). A empresa deseja determinar se há relação entre o número
horas-trabalho que o empregado perde por ano e o score motivacional. Uma amostra de 15 empregados
revelou os seguintes dados:
Empresas Y X
1 5.6 0.003 covar 0.058328
2 7.2 0.004 correlação 0.726249
3 8.1 0.009
4 9.9 0.021
5 6 0.023
6 8.2 0.03
7 6.3 0.035
8 10 0.037
9 8.5 0.044
10 13.2 0.051
11 8.4 0.058
12 11.1 0.058
13 11.1 0.067
14 13.2 0.08
15 13.4 0.08
16 11.5 0.083
17 9.8 0.091
18 16.1 0.092
19 7 0.064
20 5.9 0.028
EXTRA
Qual é a relação entre o custo de um hambúrger em lanchonetes e o custo de um ingresso de cinema? Com base nas 10 idades da tabela, calcule a covariância entre hambúrger e ingresso de cinema.
Importante: como a covariância pode assumir qualquer valor, não se consegue determinar a força relativa da relação entre as duas variáveis.
6.83777 Positiva =COVARIAÇÃO.S
0.834808634 Relação Forte =CORREL
A existência de uma correlação relativamente forte, por si só, não implica em um efeito de causalidade. Indica somente as tendências presentes nos dados.
Fundo Dow Fundo Mútuo para Condições
P(Xi Yi) Condição Econômica
Jones Econômicas Desfavoráveis
0.2 Recessã o -300 200
0.5 Economia está vel 100 50
0.3 Economia em expansã o 250 -100
a) a) Calcule o valor esperado para cada um dos investimentos. (65; 35)
b) b) Calcule a variância e o desvio padrão de cada distribuição. (37525 ; 193,7137 11025 ; 105)
c) c) Calcule a covariância (-19275)
Exercício 2.- Você está tentando desenvolver uma estratégia para investir em duas
ações distintas. O retorno anual antecipado para um investimento de $1.000 em cada
uma das ações, sob quatro condições econômicas diferentes, apresenta a seguinte
distribuição de probabilidades:
RETORNOS
Probabilid Condição Econômica Ação X Ação Y
0.1 Recessão -100 50
0.3 Crescimento lento 0 150
0.3 Crescimento Moderado 80 -20
0.3 Crescimento Acelerado 150 -100
d) De que modo o desenho de um novo projeto para que a página inicial abra mais rapidamente afeta as respostas a essas perguntas?
2.- Suponha que a Grear Tire Company tenha desenvolvido um novo pneu radial com cinturão de aço que será vendido por meio de uma cadeia nacional de discount stories. Uma vez que esse tipo de pneu é um novo produto, os gerentes da Grear acreditam que a durabilidade (em termos de milhas rodadas) oferecida com o pneu será um fator importante na aceitação do produto. Antes de fechar os termos do contrato de garantia de durabilidade do pneu, os gerentes da Grear desejam obter informações de probabilidade a respeito do número de milhas que os pneus durarão.
Dos testes reais de estrada com os pneus, a equipe de engenharia da Grear estima que a durabilidade média dos pneus é µ=36,500 milhas (58,741 quilômetros) e que o desvio padrão é 𝞼 = 5000. Além disso, os dados coletados indicam que a distribuição normal é uma hipótese razoável.
a) a) Qual porcentagem dos pneus possivelmente duraria mais de 40 mil milhas (64,373 quilômetros) ?
b) b) Qual porcentagem dos pneus possivelmente duraria mais de 40 mil milhas (64,373 quilômetros) ?
a) = b) 0.2419637 =1-DIST.NORM.N(40000;36500;5000;VERDADEIRO)
3.- A média de preço das ações das empresas que compõem a S&P 500 é US$30, e o desvio padrão US$ 8,20 (Business Week, edição especial anual, primavera de 2003). Suponha que os preços das ações se distribuam normalmente.
a) Qual é a probabilidade de uma empresa ter no mínimo US$40 para suas ações?
b) Qual é a probabilidade de uma empresa ter um preço não superior a US$20 para suas ações?
c) Qual deve ser o preço das ações para que a empresa seja incluída entre as 10% maiores?
média 30
desvio padrão 8.2
a) 0.1113249 =1-DIST.NORM.N(40;B35;B36;VERDADEIRO)
b) 0.1113249 =DIST.NORM.N(20;B35;B36;VERDADEIRO)
c) 40.508723 =INV.NORM.N(0,9;B35;B36)
4.- O volume diário (milhões de ações) de títulos negociados na Bolsa de Valores de Nova York durante 12 dias de agosto e setembro é mostrado a seguir (Barrons, 7 de agosto de 2000, 4 de setembro de 2000 e 11 de setembro de 2000). A distribuição de probabilidades do volume de negócios é aproximadamente normal.
a) a) Calcule a média e o desvio padrão do volume diário de negócios para usá-los como estimativas da média da popul. e do desvio padrão.
b) b) Qual é a probabilidade de, em determinado dia, o volume de negócios ser inferior a 800 milhões de ações?
c) c) Qual é a probabilidade de o volume de negócios ultrapassarem um bilhão de ações?
d) d) Se a Bolsa de Valores quiser emitir um release sobre os 5% melhores dias de negócios, qual volume motivará um release?
a) média 902.75
desvio padrão 114.18496
b) 0.1840985 Probabilidade de em determinado dia o volume de negocios ser < 800M ações
c) 0.1971935 =1-DIST.NORM.N(1000;C55;C56;VERDADEIRO) "d.2") 1% dos piores dias:
637.1160666058 =INV.NORM(0,01;C55;C56)
d) 1090.5675 =INV.NORM(0,95;C55;C56)
ATENÇÃO PARA OS INTERVALOS. DEVEM SER ABERTOS. OS SEJA, O LIMITE INFERIOR DO INTERVALO POSTERIOR DEVE SER O LIMITE SUPERIOR DO INTERVALO ANTERIOR +1.
Péssimo 15 15 784.4 até 784,40
Ruim 15 30 842.87 entre 784,41 e 842,87
Normal 40 70 962.63 entre 842,88 e 962,63
Bom 20 90 1049.08 entre 962,64 e 1049,08
Mto bom 10 acima de 1.049,08
a) Qual a probabilidade de que a m[edia da amostra venha a conter entre 1,95 e 2,1 l
Amostra b) Existe uma chance de 83,15% de que a média aritimética da amostra seja menor que quantos litros
media 800
desv pad popul 60
desv pad amostr 15
amostra 16
a) 0.747507462439993
b) 780.776726516831 <mi< 819.2233
que quantos litros
1.- Para a seguinte amostra composta de 28 escores amostrais:
3 3 2 1 5 4 5 1 6
3 5 3 3 2 2 3 2 4
Um erro padrão pequeno indica que muitas médias amostrais são similares (estão próximas) à média da população e, assim, a no
(sem a fórmula do Excel) Usamos o erro padrão e não o desvio padrão porque estamos interessados na variabilidade das médias
2.- Para a seguinte amostra composta de 34 escores amostrais: Observe que n>30; logo podem ser usa
10 4 10 5 5 6 7 3 5
1 8 7 5 6 10 6 8 7
34 n
a) 1° calcula: 2.0267815 desvio padrão b) 90% 1° calcula: 5.7941176 média
depois: 5.8309519 raiz depois: 0.5717349 int conf
finalmente: 0.3475902 erro padrão finalmente: 5.22 lim bx
6.37 lim cima
intervalo de confiança 5,22 ≤ μ ≤ 6,37
4 2 5 6 1 1 7 8 8
6 6 7 1 5 7 8 8 4
4.- Um auditor de banco declara que as contas de cartões de crédito são normalmente distribuídas, com uma media de $287
a) Qual é a probabilidade de que um titular de cartão de crédito aleatoriamente selecionado tenha uma conta menor q
b) Você seleciona 25 titulares de cartões de crédito de forma aleatória. Qual é a probabilidade de que a média da conta
c) Compare as duas probabilidades obtidas e interprete a resposta.
Media
a) 0.34049553149 D.Padrao
=DIST.NORM.N
b) 0.01991268775
c) Posso concluir que é muito mais provável encontrar alguém com conta menor que $2500 do que 25 titulares com mé
Dist Amostral
5.- Durante certa semana , o preço médio da gasolina na região de New England era de $2,81 por galão. Uma amostra aleató
n 32
média 2.81 x1 (vlr proc) = 2.91
d. padrão 0.045 x2 (vlr proc) = 2.76
erro padrão 0.007955
=DIST.NORM.N(I72;D72;D73/RAIZ(D71);VERDADEIRO) 1 1.635E-10
ou =DIST.NORM.N(I72;D72;D74;VERDADEIRO) 1
Resp: 0.9999999998
6.- Uma grande loja de departamentos passou por uma forte expansão no último ano. Em particular, a quantidade de funcion
a) Construa uma estimativa para um int. de confiança de 95% para a média aritmética do tempo que as reclamações lev
b) Qual é a estimação por ponto para a média aritmética populacional?
b) 43.04 média = μ
7.- Chamados pelo nome da Seção do Código da Receita Interna de 1978 que os autorizou, os planos 401(k) permitem aos em
80 76 81 77 82 80 85 60
80 79 82 70 88 85 80 79
83 75 87 78 80 84 72 75
a) Determine o intervalo de confiança de 90% para a taxa de participação nos planos de 401(k)
b) Determine o intervalo de confiança de 99% para a taxa de participação nos planos de 401(k)
a) b)
desvio padrão 5.9776152 uso de T uso de T
média 79.083333 2.0912242 int conf 3.4254425 int conf
76.99 lim bx 75.66 lim bx
81.17 lim cima 82.51 lim cima
76,99 ≤ μ ≤ 81,17 75,66 ≤ μ ≤ 82,51
=INT.CONFIANÇA.T(0,1;D100;24) =INT.CONFIANÇA.T(0,01;D100;24)
3 2 1 1 2
6 1 1 3 4
população e, assim, a nossa amostra será (provavelmente) uma boa representação da população.
variabilidade das médias das amostras e não na variabilidade das observações dentro da amostra.
4 4 5 6 6 7 5 8
7 6 5 5 4 3 4 5
2 6 5 6 4 4 3
5 3 2 6 7 8 5
c) 1° calcula: 5 média
depois: 1.0148961 int conf
finalmente: 3.99 lim bx
6.01 lim cima
3,99 ≤ μ ≤ 6,01
2870 b) COMO 25 TITULARES É UMA AMOSTRA. UTILIZAR RAIZ QUADRADA DO DESVIO PADRAO NA FORMULA
900
IST.NORM.N
alão. Uma amostra aleatória de 32 postos de gasolina é retirada da população. Qual é a probabilidade de que o peso médio da amostra es
2.91
2.76
r, a quantidade de funcionários do departamento de pisos passou de dois especialistas em instalação para um supervisor, um medidor e q
po que as reclamações levaram p/ ser atendidas.
s 401(k) permitem aos empregados usar uma parte de seus salários, antes do desconto dos impostos, em investimentos, tais como fundos
NA FORMULA
peso médio da amostra esteja entre $2,76 e $2,91 por galão durante aquela semana? Suponha que desvio padrão = $0,045.
upervisor, um medidor e quinze especialistas em instalação. No ano passado, houve muita reclamação com relação à instalação de carpete
timentos, tais como fundos mútuos. Os empregadores em geral contribuem com 50% da contribuição dos empregados, até 6% do salário (
= $0,045.
o à instalação de carpetes e, por isso, foi coletada uma amostra de 50 reclamações para a elaboração de um estudo. Foram tratados estati
ados, até 6% do salário (Fortune, 28 dez. 1992). Uma empresa preocupada com o que acreditava ser uma baixa participação dos empregad
o. Foram tratados estatisticamente os tempos que cada uma dessas 50 reclamações levou para ser atendida (quantidade de dias entre o r
rticipação dos empregados no seu plano 401 (k), tirou uma amostra de outras 24 empresas, com planos similares e perguntou a respeito d
ntidade de dias entre o recebimento de cada reclamação e a respectiva solução do problema), obtendo-se uma média aritmética de 43,04
e perguntou a respeito das taxas de participação nos seus planos 401(k). As seguintes taxas (em porcentagens) foram obtidas:
édia aritmética de 43,04 dias e um desvio-padrão de 41,9261 dias.
am obtidas:
Teste de Hipotese 1.644853627 =INV.NORMP(0,95) Se o Z cair na região crítica, rejeita a Ho (hipótese nula) Aceito a hipotese nula - Ao nível de 5% de significâncias não há evidências
2.326347874 =INV.NORMP(0,99)
Bi caudal 0,9 1.960 =INV.NORMP.N(0,975)
Decisão Aceitar H0 Rejeitar H0
H0 verd erro 1
H0 falsa erro 2
1.- Na legislação dos EUA, o acusado é tido como inocente até que seja provado culpado. Considere uma hipótese nula, H0, em que o acusado seja
inocente, e uma hipótese alternativa, H1, em que o acusado seja culpado. Um júri tem duas decisões possíveis: condenar o acusado (isto é, rejeitar
H0) ou não condenar o acusado (isto é, não rejeitar H0). Explique o significado dos riscos de ser cometido um erro do tipo I ou do tipo II.
2.- O gerente de uma concessionária de automóveis está pensando em um novo plano de bonificações para aumentar o volume de vendas.
Atualmente, o volume médio de vendas é de 14 automóveis por mês. O gerente quer realizar um estudo e pesquisa para verificar se o novo plano
de bonificações aumenta o volume de vendas. Para coletar dados sobre o plano, uma amostra da equipe de vendas será autorizada a vender sob o
novo plano de bonificação durante o período de um mês.
3.- Uma operação de linha de produção foi projetada para encher caixas de sabão em pó com um peso médio de 0,907 kg. Uma amostra
das caixas é selecionada periodicamente e pesada para determinar se há ocorrência de enchimentos abaixo ou acima do padrão. Se os
dados da amostra levarem à conclusão de que há a ocorrência de enchimentos abaixo ou acima do padrão, a linha de produção será
interrompida e ajustada para se obter o enchimento apropriado.
a) Formule as hipóteses nula e alternativa que ajudem a decidir se a linha de produção deve ser interrompida e ajustada.
b) Comente a conclusão relativa a quando a Ho não pode ser rejeitada.
c) Comente a conclusão relativa a quando a Ho pode ser rejeitada
b) H0 não pode ser rejeitada quando ela for verdadeira, ou seja, quando o peso for 0,907Kg, caso contrário, estará incorrendo no erro tipo
1
c) H0 pode ser rejeitada quando ela for falsa, ou seja, quando o peso for diferente de 0,907Kg, caso contrário, estará incorrendo no erro
tipo 2
4.- Em virtude do tempo e dos custos elevados de produção e transformação, um diretor de manufatura precisa convencer a
administração de que um novo método de manufatura proposto reduz os custos, antes de o novo método ser implementado. O método
de produção atual opera com um custo médio de $220,00 por hora. Um estudo e pesquisa medirão o custo do novo método ao longo de
um período de produção amostral.
a) Ho = μ = 220
Há = μ < 220
b) H0 não pode ser rejeitada quando ela for verdadeira, caso contrário, estará incorrendo no erro tipo 1
c) H0 pode ser rejeitada quando ela for falsa, caso contrário, estará incorrendo no erro tipo 2 / Isso implica que temos evidências
estatísticas para rejeitá-la com um risco conhecido: α
5.- O proprietário de um posto de gasolina deseja estudar os hábitos de compra de gasolina dos motoristas em seu posto. Ele seleciona
uma amostra aleatória de 60 motoristas, durante uma determinada semana, com os seguintes resultados:
A média aritmética foi de 11,3 galões e o desvio padrão de 3,1 galões.
a) No nível de significância de 0,05, existem evidências de que a média aritmética de aquisição de gasolina seja difte de 10 galões?
b) Qual seria sua resposta em (a) se a média aritmética da amostra fosse 10,3 galões?
1º) DADOS
n 10 Z é a quantidade de desvios padrões que se afastaram da média
Média 314 Z é a quantidade de desvios padrões que existem entre 11,3 e 10
D.Padrao 30
Nivel Significancia 0.1 Alfa (α) Grau de Liberadade = N - 1; por isso utilizamos 59 na fórmula
Nivel de confiança 0.9
H0: M = 10 300
Há: M ≠ 10 300
a) Não existem evidencias suficientes para considerar que a média aritmética seja diferente de 10 a um
nível de significância de 5%.
b) Nova média: 10.3
Z - 30.54 está abaixo de 1,96
6.- Uma empresa de coleta de informações verificou que em 2003, o preço médio das refeições em restaurantes da cidade
de São Paulo era de R$28,44. Neste ano realizou-se uma pesquisa em 40 restaurantes, aleatoriamente escolhidos e foram
obtidos os valores da tabela. Os dados fornecidos proporcionam evidência suficiente para concluir que o preço médio deste
ano dos restaurantes da cidade de São Paulo aumentou com relação à média de $28,44 de 2003? Realize o teste
apropriado com nível de significância de 1%.
Tabela .- Preço médio das refeições (por pessoa) nos restaurantes de São Paulo neste ano.
35 37 33 26 50 32 30 39 1 criar as hipóteses
32 33 48 27 20 24 33 31 2 Qual modelo estatistico Z ou T
39 25 28 31 36 32 26 41 3 Aplico a formula
33 25 35 32 41 36 45 27 4 Desenho o grafico
18 28 32 36 22 34 26 21 5 Tomar decisão
1º) DADOS
n 10
Média 314
D.Padrao 30
Nivel Significancia 0.01 Alfa (α) (monocaudal)
Nivel de confiança 0.99
H0: μ = 28,44 300
Ha: μ > 28,44
7.- Assuma que a média de gasto com combustível de todas as famílias de uma certa região seja de RS1123,00 em um determinado ano. Neste mesmo ano,
coletando-se uma amostra aleatória de 15 famílias de classe média obteve-se os valores abaixo, arredondados para o inteiro mais próximo. Com um nível de
significância de 5%, os dados indicam que famílias de classe média alta gastam, em média, em combustível mais do que a média da região de RS 1123,00?
Assuma que a distribuição de gasto com energia das famílias as classe média alta seja normalmente distribuída.
EXISTEM EVIDENCIAS Q NOS LEVAM A CONSIDERAR QUE FAMILIAS DE CLASSE MÉDIA GASTAM MAIS
COMBUSTIVEL DO QUE A MEDIA 1123, COM UM GRAU DE CONFIANÇA DE 95% DE CERTEZA.
Na tentativa de verificar a afirmação do gerente de marketing foi realizada uma pesquisa de renda mensal em uma amostra de 50 associados
escolhidos aleatoriamente na população de associados. O resultado da pesquisa mostrou que a variável aleatória renda mensal tem média $2.590 e
desvio padrão $285. Que conclusões podemos tirar desses dados da amostra?
Podemos dizer que o aumento da renda mensal de $2.500 para $2.590 pode ser proveniente: Da própria variabilidade das médias amostrais ou de
um aumento real dos salários dos associados.
Para determinarmos qual é a afirmação verdadeira, recorreremos ao teste de hipóteses.
H0 : μ ≤ 2500
H1 : μ > 2500
Aparentemente, a média amostral igual a $2.590 não é muito diferente da média da população $2.500.
a) Verifique se a afirmação do pessoal de marketing é significativa considerando o intervalo de confiança de 95%.
b) Há evidências de rejeitar H0 e aceitar H1?
RC Região Crítica
Estou Rejeitando H0
Estou aceitando H0
media 300
desv pad 30 z=media-mi/desv pad/amostra^0,5
amostra 10 z calculado=
media 314
Ho mi=300
alfa 10%
z critico 1.64
comprova pois, para alfa = 10%, a media deveria ficar a menos de 1,64 desvios padroes, e, para a media de 314, a media ficou em 1,48 desvios padroes
não há evidências de que o salario
m² $ casa
1400 245 RESUMO DOS RESULTADOS
1600 312
1700 279 Estatística de regressão
1875 308 R múltiplo 0.7621137132 Correlação Forte
1100 199 R-Quadrado 0.5808173119
É o percentual que explica a variação da casa em função do preço.
1550 219 R-quadrado ajustado 0.5284194759 Logo, 1-r², corresponde a parcela que não é influenciada pelo preço, ou seja, há outros fatores
2350 405 Erro padrão 41.33032365 influenciando o preço (~42%)
2450 324 Observações 10
1425 319
1700 255 ANOVA
gl SQ MQ F F de significação
Regressão 1 18934.934775692 18934.934776 11.084757617 0.010394016376
=CORREL 0.762114 Resíduo 8 13665.565224308 1708.195653
Total 9 32600.5
$ casa
450
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0%
400 Interseção 98.248329621 58.0334785847115 1.6929595126 0.1289188159 -35.577111975246 232.073771218 -35.5771119752 232.073771218
350 f(x) = 0.109767737830099 x + 98.2483296213808 Variável X 1 0.1097677378 0.032969443262147 3.3293779624 0.0103940164 0.0337400653322 0.185795410328 0.03374006533 0.185795410328
300 TESTE T: Testar o coef de inclinação
250
200
Se for 0 (estatisticamente) não há relação linear
150 Se for diferente existe relação
100 Será que se afastou muito? (3,32) para que 0,109 não
50 seja zero e sendo assim nós teríamos que rejeitar Ho
0
1000 1200 1400 1600 1800 2000 2200 2400 2600
REGRESSÃO LINEAR SIMPLES
1.-. Uma empresa de vendas por catálogos, que vende componentes de informática, software e hardware, mantém um depósito
centralizado para a distribuição dos produtos encomendados. A gerência está atualmente examinando o processo de distribuição que
sai do depósito e está interessada em estudar os fatores que afetam os custos de distribuição do depósito. Atualmente, uma pequena
taxa de frete está sendo adicionada ao pedido, independentemente do valor do pedido. Ao longo dos últimos 24 meses foram
coletados dados que indicam os custos de distribuição do depósito e o número de pedidos recebidos. Os resultados são apresentados
na tabela a seguir:
Y X
Custo de Distribuição 1000
Meses (Milhares dNúmero de pedidos
1 52.95 4,015
2 71.66 3,806
3 85.58 5,309
Plotagem de probabilidade normal
4 63.69 4,262 100
80
5 72.81 4,296
60
6 68.44 4,097 40
Y
7 52.46 3,213 20
8 70.77 4,809 0
9 82.03 5,237 0 20 40 60 80 100 120
10 74.39 4,732 Percentil da amostra
11 70.84 4,413
12 54.08 2,921
13 62.98 3,977
Variável X 1 Plotagem de resíduos
14 72.3 4,428
15 58.99 3,964 15
10
16 79.38 4,582
Resíduos
5
17 94.44 5,582 0
18 59.74 3,450 -52,500 3,000 3,500 4,000 4,500 5,000 5,500 6,000
19 90.5 5,079 -10
20 93.24 5,735 -15
21 69.33 4,269 Variável X 1
22 53.71 3,708
23 89.18 5,387
24 66.8 4,161 n= 24
a) Pressupondo uma relação linear, utilize o método dos mínimos quadrados para encontrar os coeficientes de regressão bo e b1
ANOVA
gl SQ MQ F F de significação
Regressão 1 3246.062049 3246.062 119.2074 2.385E-10
Resíduo 22 599.0683465 27.23038
Total 23 3845.130396
(10,918 para que 16,118 não seja zero, pois senão teríamos que rejeitar h0)
Coeficientes Erro padrão Stat t valor-P95% inferiores
95% superiores
Inferior 95,0%
Superior 95,0%
Interseção 0.457625 6.571882688 0.069634 0.945114 -13.17163 14.08688 -13.17163 14.08688
Variável X 0.016118 0.001476209 10.91821 2.385E-10 0.013056 0.019179 0.013056 0.019179
TESTE T: Testar o coef de inclinação
Se for 0 (estatisticamente) não há relação linear
Se for diferente existe relação b) Faça a previsão dos custos mensais de distribuição do depósito quando o
RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE número de pedidos é 4,500.
y= 72.987
ObservaçãoY previsto ResíduosResíduos padrão Percentil Y y = C58+C59*(4500)
1 65.16964 -12.2196442 -2.394332 2.083333 52.46
2 61.80107 9.858926651 1.93177 6.25 52.95 c) Faça o gráfico dos resíduos em relação ao período de tempo.
3 86.02577 -0.44577183 -0.087345 10.41667 53.71
4 69.15068 -5.46068247 -1.069973 14.58333 54.08
5 69.69868 3.111320361 0.609636 18.75 58.99 d) Com base nos resultados de b) e c), existe alguma razão para questionar a
6 66.49128 1.948715569 0.381834 22.91667 59.74 validade do modelo
7 52.24336 0.216642019 0.042449 27.08333 62.98
8 77.96699 -7.1969899 -1.410187 31.25 63.69 Não há motivo para questionar pois ele atende os 4 requisitos
9 84.86531 -2.83530723 -0.555553 35.41667 66.8 1) Normalidade
10 76.72594 -2.33593748 -0.457706 39.58333 68.44 2) Independência
11 71.58443 -0.74443461 -0.145865 43.75 69.33 3) Linearidade
12 47.53703 6.542970666 1.282037 47.91667 70.77 4) Variância
13 64.55718 -1.57717677 -0.309034 52.08333 70.84
14 71.8262 0.473801932 0.092837 56.25 71.66
15 64.34765 -5.35764844 -1.049784 60.41667 72.3
16 74.3083 5.071697098 0.993754 64.58333 72.81
17 90.42587 4.01413324 0.786534 68.75 74.39
18 56.06322 3.676779385 0.720433 72.91667 79.38
19 82.31873 8.18126786 1.603047 77.08333 82.03
20 92.89185 0.348145969 0.068216 81.25 85.58
21 69.26351 0.066494585 0.013029 85.41667 89.18
22 60.22155 -6.51155209 -1.275881 89.58333 90.5
23 87.28294 1.897058192 0.371712 93.75 93.24
24 67.52281 -0.72280852 -0.141628 97.91667 94.44
2.- A tabela que segue lista o número de empregados e o faturamento anual para as 10 maiores padarias de atacado:
x y
Estatística de regressão
A) R múltiplo 0.682332644 Correlação linear, mas não é forte. É moderada.
B) R-Quadrado 0.465577837 Numero de empregados explica 46% da variação do faturamento.
R-quadrado aju 0.398775066 C) Representa o quanto da variação do nível de faturamento pode ser explicado a partir da variação do numero de empregados (46,5%)
Erro padrão 378.6537458
Observações 10
ANOVA
gl SQ MQ F F de significação
Regressão 1 999268.826176231 999268.83 6.969439 0.0297147
Valor P < 5%
Resíduo 8 1147029.27382377 143378.66 O modelo está
Total 9 2146298.1 valendo.
Resíduos
6 10 260 200
0
Y
7 15 230 -20 4 6 8 10 12 14 16 18 20 22 100
8 15 270 -40 0
9 15 280 -60 0 20 40 60 80 100 120
10 20 260 Variável X 1 Percentil da amostra
11 20 290
12 20 310
ANOVA
gl SQ MQ F F de significação
Regressão 1 20535 20535 21.63857 0.000906
Resíduo 10 9490 949
Total 11 30025
Resíduos
5 179.1 1.93 0
6 170.4 1.2 -5 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1
7 175.8 1.55 -10
8 185.9 1.93 Variável X 1
9 178.5 1.59
10 179.2 1.5
11 186.7 1.9
a) Determine o coeficiente de correlação linear.
b) Determine o coeficiente de determinação.
c) O que este coeficiente representa?.
Estatística de regressão
a) R múltiplo 0.840041 Correlação linear é forte.
b) R-Quadrado 0.705669 A variação do valor de avaliação das casas pode ser explicado em 70% pela área aquecida.
c) R-quadrado ajustado 0.672966 O coeficiente de correlação ao quadrado (conhecido como o coeficiente de determinação, R2) é uma
Erro padrão 2.985404 medida da quantidade de variação em uma variável que é explicada pela outra.
Observações 11
O R Múltiplo é a correlação entre os valores observados de Y e os de Y previstos pelo modelo de regressão múltipla. Desta forma, valores grandes
do R Múltiplo representam uma alta correlação entre os valores previstos e observados da variável de saída. Um R Múltiplo igual a 1 representa a
situação na qual o modelo prediz com perfeição os valores observados, isto é, ele adere perfeitamente a todos os pontos.
ANOVA
gl SQ MQ F F de significação
Regressão 1 192.315344954 192.315344954162 21.57782 0.00121
Resíduo 9 80.2137459549 8.91263843943648
Total 10 272.529090909
Resíduos
14 450 5 3.5 50
15 300 7 2.7 0
-50 4 4.5 5 5.5 6 6.5 7 7.5 8 8.5
RESUMO DOS RESULTADOS -100
Preço
Estatística de regressão
R múltiplo 0.722134 Correlação é linear, moderada, quase forte.
R-Quadrad 0.521478 Somente 52% das vendas podem ser explicadas pelas variáveis preço e publicidade
R-quadrado0.441724 Numero de amostras x numero de variáveis independentes
Erro padrã 47.46341
Observaçõ 15
ANOVA
gl SQ MQ F F de significação
Regressão 2 29460.03 14730.01 6.538607 0.012006 O modelo é valido. É menor do que 5%
Resíduo 12 27033.31 2252.776
Total 14 56493.33
Intervalo de confiança
Observação
Previsto(a) Vendas
Resíduos
Resíduos padrão Percentil Vendas
1 413.7954 -63.79536 -1.451789 3.333333 300
2 363.8452 96.15482 2.188192 10 300
3 329.1183 20.88165 0.475203 16.66667 340
4 440.3148 -10.31479 -0.234733 23.33333 350
5 359.0885 -9.088457 -0.206826 30 350
6 415.7369 -35.73685 -0.813262 36.66667 350
7 416.5312 13.46884 0.30651 43.33333 380
8 420.9702 49.02984 1.115771 50 430
9 391.1589 58.84108 1.339045 56.66667 430
10 478.1746 11.82542 0.269111 63.33333 440
11 386.1639 -46.1639 -1.05055 70 450
12 346.4421 -46.44205 -1.05688 76.66667 450
13 455.697 -15.697 -0.357216 83.33333 460
14 441.1091 8.890903 0.20233 90 470
15 331.8542 -31.85415 -0.724904 96.66667 490
Gastos Publicidade Plotagem de resíduos
150
100
Resíduos
7249705127 50
0
-50 2.6 2.8 3 3.2 3.4 3.6 3.8 4 4.2 4.4 4.6
-100
Gastos Publicidade
5 8 8.5
300
200
5 8 8.5 100
0
0 20 40 60 80 100 120
Percentil da amostra
eço e publicidade
enor do que 5%
erior 95,0%
Resíduos
11 1628 45 45
Resíduos
12 1577 45 45 0 0
0 10 20 30 40 50 60 70 80 0 5 10 15 20 25 30 35 40 45 50
13 1044 50 0 -200 -200
14 914 50 0 -400 -400
15 1329 55 25 Jornais
Radios
16 1330 55 25
17 1405 60 30
18 1436 60 30 a) Função a) Equação
19 1521 65 35
Plotagem de probabilidade normal Y=156,4304+13,0806x1+16,7952x2 Vendas=156,43+13,08(P RADIO) + 16,79 (P JORNAL)
20 1741 65 35 2000
21 1866 70 40 1500 b) Interprete o significado das inclinações b1 e b2.
Vendas
22 1717 70 40 1000
500 Radios 13.08068 A cada 1 real investido em rádios haverá um retorno de 13,08 reais.
0 Jornais 16.79528 A cada 1 real investido em jornais haverá um retorno de 16,79 reais.
RESUMO DOS RESULTADOS 0 20 40 60 80 100 120
Percentil da amostra
Estatística de regressão
R múltiplo 0.899273 Coeficiente de relação forte.
R-Quadrad 0.808692 c) Interprete o significado do coeficiente de regressão b0.
R-quadrado 0.788555 Explica a consistencia do modelo b0 é 156 (vendas). Sem radio e jornal. Ou seja, sem propaganda vc vende.
Erro padrã 158.9041 nesse caso é muito baixa, o que faz rejeitarmos a Ho.
Observaçõ 22
d) Faça a previsão para a média aritmética das vendas para uma cidade na qual a
ANOVA propaganda em rádio custe $20.000 e a propaganda em jornais custe $20.000.
gl SQ MQ F F de significação
Regressão 2 2028033 1014016 40.15823 1.501264275E-07 Modelo é válido 753.94961523
Resíduo 19 479759.9 25250.52 Explica a consistencia do modelo
Total 21 2507793 nesse caso é muito baixa, o que faz rejeitarmos a Ho.
e) Construa uma estimativa para o intervalo de confiança de 95% da média aritmética das
CoeficientesErro padrão Stat t valor-P 95% inferiores95% superiores
Inferior 95,0%
Superior 95,0% vendas para cidades nas quais a propaganda em rádio custe $20.000 e a propaganda em
b0 ou "a" Interseção 156.4304 126.7579 1.234089 0.232217 -108.876807723 421.7377 -108.8768 421.7377 jornais custe $20.000.
b1 Radios 13.08068 1.759374 7.434851 4.889E-07 9.39826951278 16.76309 9.39827 16.76309
b2 Jornais 16.79528 2.963378 5.667613 1.831E-05 10.59285682045 22.9977 10.59286 22.9977
Bem menor que 5% Intervalo de confiança 95% inferiores 95% superiores
-108.8768077 421.7377
9.3982695128 16.76309
RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE 10.59285682 22.9977
Observação
Previsto(a) Vendas
Resíduos
Resíduos padrão Percentil Vendas 290.94571894 1216.954
1 828.2416 144.7584 0.957727 2.272727272727 625 Intervalo de Confiança
2 828.2416 290.7584 1.923667 6.818181818182 875
3 903.3294 -28.32941 -0.187428 11.36363636364 882
4 903.3294 -278.3294 -1.841437 15.90909090909 910
5 1052.709 -142.7092 -0.944169 20.45454545455 914
6 1052.709 -81.70921 -0.540591 25 931
7 1202.089 -271.089 -1.793534 29.54545454545 971
8 1202.089 -25.089 -0.16599 34.09090909091 973
9 1099.54 -217.5396 -1.439249 38.63636363636 982
10 1099.54 -117.5396 -0.777646 43.18181818182 1044
11 1500.849 127.1514 0.841238 47.72727272727 1119
12 1500.849 76.15141 0.50382 52.27272727273 1177
13 810.4645 233.5355 1.545079 56.81818181818 1329
14 810.4645 103.5355 0.684994 61.36363636364 1330
15 1295.75 33.25016 0.219984 65.90909090909 1405
16 1295.75 34.25016 0.2266 70.45454545455 1436
17 1445.13 -40.12963 -0.265499 75 1521
18 1445.13 -9.129634 -0.060402 79.54545454545 1577
19 1594.509 -73.50943 -0.486341 84.09090909091 1628
20 1594.509 146.4906 0.969186 88.63636363636 1717
21 1743.889 122.1108 0.807889 93.18181818182 1741
22 1743.889 -26.88922 -0.1779 97.72727272727 1866
2.- O proprietário da Showtime Movie Theters, Inc., gostaria de estimar semanalmente a receita bruta em função dos gastos de
propaganda. Os dados históricos de uma amostra de oito semanas são os seguintes:
Prop
Rec Bruta Prop TV Jornal
Sem ($1.000) ($1.000) ($1.000)
96 5 1.5
90 2 2
95 4 1.5
92 2.5 2.5
95 3 3.3
94 3.5 2.3
94 2.5 4.2
94 3 2.5
Desenvolva uma equação de regressão estimada, sendo a quantía gasta em propaganda de televisão a variável
a) independente.
Estabeleça uma equação de regressão estimada, sendo a quantía gasta em propaganda de televisão e a quantía gasta em
b) propaganda de jornal as variáveis independentes.
O coeficiente da equação de regressão estimada correspondente aos gastos de propaganda de TV é idêntico nos itens (a) e
c) (b) ? interprete o coeficiente em cada caso.
Qual é a estimativa da receita bruta seminal de uma semana em que são gastos $3500 em propaganda de TV e 1800 em
d) propaganda de jornal?
Estatística de regressão
R múltiplo 0.807807
R-Quadrado 0.652553
R-quadrado aj 0.594645
Erro padrão 1.215175 c) Os
coeficientes
Observações 8 são
diferentes,
eo
ANOVA
resultado
gl SQ MQcom
gerado F F de significação
Regressão 1 16.6401 a16.6400966 11.26881 0.015288
propaganda
Resíduo 6 8.859903 de 1.47665056
TV na
Total 7 25.5 receita
bruta será
maior
CoeficientesErro padrãoquanto
Stat t valor-P95% inferiores
95% superiores
Inferior 95,0%
Superior 95,0%
Interseção 88.63768 1.582367 maior for
56.0158761 2.174E-09 84.76577 92.50959 84.76576827 92.50959
esse
Variável X 1 1.603865 0.477781 3.35690502 0.015288 0.434777 2.772952 0.434777257 2.772952
coeficiente.
Podemos
a) afirmar que b)
o impacto é
y = 88,63 + 1,60(x1) maior qdo y = 83,23 + 2,29(x1) + 1,30(x2)
Receita Bruta = 88,63 + 1,60 (Prop TV) há as Receita Bruta = 83,23 + 2,29 (Prop TV) + 1,30 (Prop Jornal)
variáveis TV
e jornais
RESUMO DOS RESULTADOS juntas. (2°
Estatística de regressão caso)
R múltiplo 0.958663
R-Quadrado 0.919036
R-quadrado aj 0.88665
Erro padrão 0.642587 d) TV = 3.5 jornal = 1.8
Observações 8 y = 83,23 + 2,29(3500) + 1,30(1800)
y = C57+C58*F47+C59*I47 93.58751474
ANOVA
gl SQ MQ F F de significação
Regressão 2 23.43541 11.7177039 28.37777 0.001865
Resíduo 5 2.064592 0.41291844
Total 7 25.5
X X X Y
Corretora Execução do NeFacilidade de Uso Variedade de Ofertas Avaliação
Wall St. Access 3.7 4.5 4.8 4
E*TRADE (Power) 3.4 3 4.2 3.5
E*TRADE(Standard) 2.5 4 4 3.5 E
P
x e cu ç
l o tag
ã o d o Ne g ó c
e m d e re sí d
i o
u o s
Fa ci l i
d e re
d a d
s í d
e d e
u os
Us o P l
o tag em
Resíduos
Avaliação
Brown & Co. 2.7 2.5 3.3 3
-0.5 0
Brokerage America 1.7 3.5 3.1 3 2 2.5 3 3.5 4 4.5 5
0 10 20 30 40 50 60 70 80 90 100
Merrill Lynch Direct 2.2 2.7 3 2.5 Variedade de Ofertas Percentil da amostra
Strong Funds 1.4 3.6 2.5 2
a) Determine a equação de regressão estimada que possa ser usada para prever a classificação por estrelas, dadas as pontuações para a execução, facilidade de uso e variedade de ofertas.
b) Use o teste F para determiner a significância global da relação. Qual é a sua conclusão no nível de significância 0,05?
c) Use o teste t para determiner a significância de cada variável independente. Qual é a sua conclusão ao nível de significância de 0,05?
d) Retire da equação de regressão estimada quaisquer variáveis independents que não sejam significativas.
RESUMO DOS RESULTADOS Qual é a sua equação de regressão estimada recomendada? Compare R2 com o valor de R2 obtido no item (a). Discuta as diferenças.
a) 'Y=0,345097+0,254822(negocio)+0,132492(Fac.Uso)+0,458519(Var.Oferta)
Estatística de regressão
R múltiplo 0.94107254931 Correl. linear forte b) 0.0031298138 Modelo é válido. O alfa é menor do que 5%. Rejeita a hipotese nula.
R-Quadrado 0.88561754306 ~88% da avaliação pode ser explicado pelas avaliações de ex. negocio, facilidade de uso e variedade de ofertas
R-quadrado ajustado 0.82842631459 c) As variáveis execução de negocio e variedade de ofertas estão abaixo de 5% e devem ser consideradas no modelo
Erro padrão 0.24309998509 valor-P
Observações 10 d) Retirar facilidade de uso / A variável Facilidade de Uso não tem impacto Interseção 0.539580378009
significativo no modelo global. Ex. Negocio 0.024686196617
ANOVA Facilidade Uso 0.381848040771
gl SQ MQ F F de significação Var. Ofertas 0.009827254921
Regressão 3 2.74541438349203 0.915138127830676 15.485198811 0.003129813822641 0.31% b) valido por que menor que 5%
Resíduo 6 0.354585616507972 0.059097602751329
Total 9 3.1
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0%
b0 Interseção 0.34509700531 0.530667258823113 0.650307701432282 0.539580378 -0.953398999318262 1.6435930099395 -0.953398999318262 1.64359300994
b1 Execução do Negócio 0.25482207553 0.08555537021565 2.97844629610177 0.0246861966 0.045475626220649 0.4641685248402 0.045475626220649 0.46416852484
b2 Facilidade de Uso 0.13249195474 0.140425860089989 0.94350110908804 0.3818480408 -0.211117746521872 0.476101656001 -0.211117746521872 0.476101656001
b3 Variedade de Ofertas 0.45851896025 0.123186272274833 3.72215955387161 0.0098272549 0.157093010725939 0.7599449097813 0.157093010725939 0.759944909781
coef/erro padrão
A variação da variável "avaliação"
pode ser explicada a partir da variação
das variáveis 1,2,3 em 88%
RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE
ANTES DEPOIS
RESUMO DOS RESULTADOS
r2 0.88 r2' 0.86
Estatística de regressão
R múltiplo 0.9320123964 B0 Interseção 0.345097005310629 B0 Interseção
R-Quadrado 0.86864710705 B1 Ex. Negocio 0.254822075530417 B1 Ex. Negocio
R-quadrado ajustado 0.83111770906 B2 Facilidade Uso 0.132491954739546 B3 Var. Ofertas
Erro padrão 0.24118575182 B3 Var. Ofertas 0.458518960253598 A variação da variável
Observações 10 "avaliação" pode ser
A variação da variável "avaliação" pode ser explicada a explicada a partir da
partir da variação das variáveis "1,2 e 3" (nome das variação das variáveis
variáveis) em 88% "1 e 3" (nome das
ANOVA
variáveis) em 86%
gl SQ MQ F F de significação
Regressão 2 2.69280603184678 1.34640301592339 23.145777808 0.000821369832411
Resíduo 7 0.407193968153223 0.058170566879032
Total 9 3.1
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0%
Interseção 0.67184416339 0.398921790694816 1.6841500741669 0.1360252506 -0.271455977380317 1.6151443041513 -0.271455977380317 1.615144304151
Ex. Negocio 0.2640566733 0.084324410987984 3.1314380996295 0.0165763501 0.064661126073126 0.4634522205201 0.064661126073126 0.46345222052
Var. Ofertas 0.48527125128 0.118934702118882 4.08014854062889 0.0046888069 0.204035370294216 0.7665071322668 0.204035370294216 0.766507132267