Escolar Documentos
Profissional Documentos
Cultura Documentos
Diagrama de dispersão
Coeficiente de correlação linear de Pearson
Coeficiente de determinação
CORRELAÇÃO LINEAR
𝐶𝑂𝑉(𝑋,𝑌)
= 𝜎𝑥 .𝜎𝑦
n xy − x y
rxy =
(n x 2 − ( x) 2 ).(n y 2 − ( y ) 2 )
Variável de teste:
𝑟
tcalc= 2
1−𝑟
𝑛−2
EXEMPLO
A variável X representa os gastos com propaganda (em milhões de reais) e a
variável Y representa o montante obtido pela venda dos produtos (em milhões
de reais) de certa companhia em oito anos consecutivos.
5. Localizando tcalc =5,48 na figura, concluímos que ele está na região de rejeição
de Ho.
6. Conclusão: Para =5%, há evidências de existência de correlação populacional
significativa entre os gastos com propaganda e as vendas da empresa.
EXERCÍCIO
Considere X a quilometragem (em 1000 quilômetros) e Y o preço ($) de venda
de carros do ano de 2017 de certa marca.
4. ttab
• Graus de liberdade v=n-2=14-2=12.
• O teste é bilateral com =0,05, logo, procurando na tabela t o encontro de
12 com 0,025 encontramos ttab =2,1788
Situação:
Embora muitas retas possam ser desenhadas partindo de um conjunto de dados, a melhor
reta ajustada será aquela para a qual a diferença global entre os valores reais e os valores
preditos de y é mínima. Para isso, utiliza-se o Método dos Mínimos Quadrados Esse
método consiste em uma técnica de otimização matemática que procura encontrar o
melhor ajuste para um conjunto de dados, tentando minimizar a soma dos quadrados das
diferenças entre os valores estimados e os respectivos dados observados. Tais diferenças
são chamadas de erros ou resíduos e serão indicados por 𝑒Ƹ𝑖 .
Sendo:
ERRO PADRÃO DE ESTIMATIVA DA
RETA DE REGRESSÃO LINEAR
Quanto menor o erro, melhor será este ajuste. Ele é dado por:
^
2
( y − y)
Se =
n−2
Nós também fizemos o gráfico de dispersão deste caso e notamos que ele
sugeria uma tendência linear crescente.
15,8.1634
3289,8−
𝛽መ1 = 8
15,82
50,7287
32,44− 8
1634 15,8
𝛽መ0 = 8 - 50,7287. 8 104,0608
𝑦=50,7287.
ො (2,5) +104,0608= 230,88255 milhões de reais.
RESOLUÇÃO NO EXCEL
^
2
( y − y)
Se =
n−2
Para calcular 𝑌(𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑦 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜), temos que substituir cada valor de X na
equação da reta de regressão obtida, dada por 𝑦=50,7287x+104,0608
ො
Por exemplo, 𝑌 2,4 = 50,7287.2,4 + 104,0608 = 225,80968
635,345326
Se= =10,29032 milhões de reais é o erro padrão da estimativa das
6
vendas para um gasto específico de propaganda.
ERRO PADRÃO ESTIMADO NO EXCEL
Pede-se:
a) Qual é o coeficiente de correlação?
Resp: + 0,9922 = 0,9961 (como a reta de regressão é crescente, o
coeficiente de correlação é positivo)
Vamos analisar o caso obtido no problema dos gastos com propaganda, cuja
equação da reta de regressão foi dada por 𝑦ො =50,7287x+104,0608,
considerando α=0,05. (Obs: lembrar que o erro padrão estimado foi calculado
anteriormente, obtendo s=10,29032).
1) Ho: 1 = 0
H1: 1 ≠ 0
2) tcalc?
15,82
SSxx=32,44 - = 1,235
8
50,7287
tcalc = 10,29032 5,48
1,235
TESTE DO COEFICIENTE DE DECLIVE
3. ttab