Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística e
Regressão linear
𝑟𝑥𝑦 = 0.
• Correlação forte
Correlação forte Ausência Correlação forte
Correlação moderada
Direta inversa
Direta
CORRELAÇÃO LINEAR
CÁLCULO DO ÍNDICE
O Coeficiente de Correlação (𝑟𝑥𝑦 ) varia apenas no intervalo [–1; 1],
podendo ser calculado pelas formas abaixo:
Σ 𝑑𝑥 ∙𝑑𝑦
𝑟𝑥𝑦 =
Σ(𝑑𝑥 )2 ∙Σ(𝑑𝑦 )2
dx = 𝑥 − 𝑥ҧ (desvio)
dy = y − 𝑦ത (desvio)
CORRELAÇÃO LINEAR
CÁLCULO DO ÍNDICE
b) Em função da Covariância e dos desvios-padrão
𝐶𝑜𝑣(𝑥, 𝑦)
𝑟𝑥𝑦 =
𝜎𝑥 ∙ 𝜎𝑦
• 𝐶𝑜𝑣 𝑥, 𝑦 = 𝐸 𝑥 ∙ 𝑦 − 𝐸 𝑥 ∙ 𝐸 𝑦
σ 𝑥∙𝑦
• 𝐸 𝑥∙𝑦 =
𝑛
σ𝑥
• 𝐸 𝑥 =
𝑛
σ𝑦
• 𝐸 𝑦 =
𝑛
CORRELAÇÃO LINEAR – CÁLCULO DO ÍNDICE
𝑋 𝑌 𝑋2 𝑌2 𝑋∙𝑌
Exemplo 10 1,5 100 2,25 15
15 2,0 225 4,00 30
5 0,5 25 0,25 2,5
12 1,5 144 2,25 18
18 2,5 324 6,25 45
𝑋 = 60 𝑌 = 8 𝑋 2 = 818 𝑌 2 = 15 𝑋 ∙ 𝑌 = 110,5
Passo 1: Cálculo da Covariância
σ 𝑥∙𝑦 110,5
• 𝐸 𝑥∙𝑦 = = = 22,1
𝑛 5
σ𝑥 60
• 𝐸 𝑥 = = = 12
𝑛 5
σ𝑦 8
• 𝐸 𝑦 = = = 1,6
𝑛 5
• 𝐶𝑜𝑣 𝑥, 𝑦 = 𝐸(𝑥 ∙ 𝑦) − 𝐸ถ𝑥 ∙ 𝐸ถ𝑦 = 2,9
22,1 12 1,6
CORRELAÇÃO LINEAR – CÁLCULO DO ÍNDICE
Variância de X e de Y
818
𝑉 𝑥 = 𝐸 𝑥2 − 𝐸 𝑥 2 = − 12 2 = 19,6
5
15
𝑉 𝑦 =𝐸 𝑦2 − 𝐸 𝑦 2 = − 1,6 2 = 0,44
5
σ𝑼 ∙ σ𝑽
𝑺𝑼𝑽 = 𝑼 ∙ 𝑽 −
𝒏
Deve-se calcular 𝑆𝑥𝑦 , 𝑆𝑥𝑥 e 𝑆𝑦𝑦 . Para tanto, substitua U e V, na notação
acima, por 𝑥 e 𝑦 conforme o indicador. O índice de correlação será
𝑆𝑥𝑦
𝑟𝑥𝑦 =
𝑆𝑥𝑥 ∙ 𝑆𝑦𝑦
Exemplo
notação Suv
σ𝑼 ∙ σ𝑽
𝑺𝑼𝑽 = 𝑼 ∙ 𝑽 −
𝒏
σ 𝒙∙σ𝒚 𝟔𝟎∙𝟖
𝑺𝒙𝒚 = σ 𝒙 ∙ 𝒚 − ⇒ 𝑺𝒙𝒚 = 𝟏𝟏𝟎, 𝟓 − = 𝟏𝟒, 𝟓𝟎
𝒏 𝟓
σ 𝒙∙σ𝒙 𝟔𝟎∙𝟔𝟎
𝟐
𝑺𝒙𝒙 = σ𝒙 − ⇒ 𝑺𝒙𝒙 = 𝟖𝟏𝟖 − = 𝟗𝟖, 𝟎𝟎
𝒏 𝟓
σ 𝒚∙σ𝒚 𝟖∙𝟖
𝟐
𝑺𝒚𝒚 = σ 𝒚 − ⇒ 𝑺𝒚𝒚 = 𝟏𝟓 − = 𝟐, 𝟐
𝒏 𝟓
𝑆𝑥𝑦 14,5
𝑟𝑥𝑦 = ⇒ 𝑟𝑥𝑦 = = 0,986
𝑆𝑥𝑥 ∙𝑆𝑦𝑦 98∙2,2
PROPRIEDADES
Seja r o coeficiente de correlação entre X e Y.
➢Se multiplicarmos cada uma destas variáveis por duas constantes a e
b, o novo coeficiente r' é dado por:
r'= r , se ab > 0 (não se altera)
r'= -r , se ab < 0 (é o simétrico de r)
(1) 𝛽መ < 0
(2) Para X = 10, a estimativa de Y é 𝑌 = 12.
Exemplo – questão 14
(FCC) Uma empresa, com a finalidade de determinar a relação entre os
gastos anuais com propaganda (X), em R$ 1 000,00, e o lucro bruto
anual (Y), em R$ 1 000,00, optou por utilizar o modelo linear simples Yi
= α + βXi + εi , em que Yi é o valor do lucro bruto auferido no ano i, Xi é
o valor gasto com propaganda no ano i e εi o erro aleatório com as
respectivas hipóteses consideradas para a regressão linear simples (α e
β são parâmetros desconhecidos). Considerou, para o estudo, as
seguintes informações referentes às observações nos últimos 10 anos
da empresa:
Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-
se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão
do lucro anual, em mil reais, será de
(A)158.
(B)128,4.
(C)121.
(D)102,5.
(E)84.
Correlação e
Estatística Regressão linear
Exercícios
Gab. B
Questão 2
(Funiversa – perito PCDF) Considerando a tabela, referente aos valores das
variáveis X e Y, é correto afirmar que a correlação entre as variáveis X e Y
(A) é menor que – 1.
(B) encontra-se entre + 0,9 e + 1.
(C) é zero.
(D) encontra-se entre – 0,9 e – 1.
(E) é maior do que +1
Gab. B
Questão 3
(CESGRANRIO) Considere as afirmações a seguir a respeito do Coeficiente de Correlação (r)
de Pearson entre duas variáveis.
I - Se r = 1, as observações estão todas sobre uma linha reta no diagrama de dispersão.
II - Se r > 0, a variável independente aumenta quando a variável dependente aumenta.
III - Se r < 0, a variável independente decresce quando a variável dependente decresce.
IV - Se r = 0, não existe relação entre as duas variáveis.
São corretas APENAS as afirmações
(A) I e II
(B) I e III
(C) II e III
(D) II e IV
(E) III e IV
Gab. A
Questão 4
(2) O coeficiente de determinação R2 entre consumo e renda será maior para os dados do gráfico II do que
para os dados do gráfico I.
(3) O valor referente à esperança do número de filhos de uma família escolhida aleatoriamente entre as
famílias da amostra é 1,42.
Questão 5
(CESPE) Uma agência de desenvolvimento urbano divulgou os dados apresentados
na tabela a seguir, acerca dos números de imóveis ofertados (X) e vendidos (Y) em
determinado município, nos anos de 2005 a 2007. Julgue o item
(1) 𝛽መ < 0
(2) Para X = 10, a estimativa de Y é 𝑌 = 12.
Questão 8
(CESPE) Uma concessionária de veículos estudou o preço de determinado
tipo de veículo em função da idade (anos de uso). Os resultados encontram-
se na seguinte tabela.