Você está na página 1de 10

Correlação Profª Josefa A .

Alvarez 1

Diagrama de Dispersão
Tem por objetivo analisar o que ocorre com uma variável quando a outra
variável se altera, para saber se as duas estão relacionadas.
(relação entre causa e efeito).
Procedimento
colete os dados - preferencialmente entre 50 e 100 dados, cuja relação será
verificada.
desenhe os eixos - o eixo horizontal para as causas e o vertical para os efeitos.
plote os pontos; se houver valores repetidos use círculos concêntricos.
Coeficiente de Correlação
O estudo da correlação tem como objetivo medir e avaliar o grau de relação
linear entre duas variáveis aleatórias. Essa variável é um número entre –1 e +1
que mede a força da relação linear entre duas variáveis por exemplo renda e
poupança. Quanto mais próximo o valor estiver de +1, mais forte será a relação.
O valor negativo indica que valores altos de uma variável estão associados a
valores baixos da outra
variável.
A correlação não implica casualidade. O coeficiente +1 e –1 pode ocorrer por
acaso.
A população da Índia e o número de automóveis nos Estados Unidos, exibem
uma correlação positiva; esta é uma correlação falsa. Duas variáveis podem
estar altamente correlacionadas porque ambas são influenciadas pelos mesmos
fatores. Na Inglaterra existe uma correlação forte entre o número de casas de
apostas e o número de igrejas
O coeficiente de correlação desempenha um papel chave na análise de portfólios.
Para diversificar o risco, os investidores buscam ações cujos retornos
apresentam um baixo grau de correlação.

( , )
= =
O coeficiente de correlação Linear r (PEARSON) é

-1  r  +1

= ∑( − ) =∑ − (∑ )
∑( )
Variância = =
Desvio padrão da variável X
∑( )
= =

= ∑( − ) =∑ − (∑ )

= =
∑( − )
Variância

Desvio padrão da variável X

= =
∑( − )
Correlação Profª Josefa A . Alvarez 2

X Y XY X2 Y2

SOMA

Variação de r Interpretação do valor da correlação

+1,0 Existe uma correlação positiva perfeita entre os dados. À medida


que x aumenta, y aumenta.
0,8 < r < 1,0 Existe forte correlação positiva entre os dados. À medida que x
aumenta, y aumenta.
0,4 < r < 0,8 Existe uma correlação positiva moderada entre os dados. À
medida que x aumenta, y aumenta.
-0,4 < r < 0,4 Existe muito pouca correlação entre os dados.
-0,8 < r < -0,4 Existe uma correlação negativa moderada entre os dados. À
medida que x aumenta, y diminui.
-1,0 < r < -0,8 Existe forte correlação negativa entre os dados. À medida que x
aumenta, y diminui.
-1,0 Existe uma correlação negativa perfeita entre os dados. À medida
que x aumenta, y diminui.
Correlação Profª Josefa A . Alvarez 3

Teste de Hipótese para o Coeficiente de Correlação


Teste de Hipótese para  = 0
Região crítica Estatística teste
" :% = 0 √ −2
! # =
"' : % > 0
T > t n-2, 
√1 −
"# : % = 0
!
"' : % < 0
T < - tn-2 , 

" :% = 0
! #
"' : % ≠ 0
T < - t n-2 ,  / 2 ou T > t n-2 ,  / 2

Teste de Hipótese para % = %# ≠ 0

+ + 12
Região crítica Estatística teste
"# : % = %# +>+ 4 ,- . − ,- .
!
"' : % > %# − 0 − 12 0
+=
" : % = %# + < −+ 4
! # −3
"' : % < %#
" : % = %# + < −+ 4 56 + > +
! #
4
"' : % ≠ %#

Intervalo de confiança para o coeficiente de correlação


+
7= 8 9 : − ;<
− −3

+
== 8 9 : + ;<
− −3
? 7 ? =
1> = 1 = IC(;)=[  I; S]
? 7@ ? =@

z tabela da normal inversa z 1-  /2

Exercícios
1. Considere as variáveis X: idade da máquina (meses) Y: custo com manutenção
X 2 4 5 6 8
Y 48 56 64 60 72
Correlação Profª Josefa A . Alvarez 4

a-Faça o diagrama de dispersão


Diagrama de dispersão
80
custo com manutenção
70
60
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8 9
idade da máquina

-Calcule o coeficiente de correlação de Pearson


X Y XY X2 Y2
1 2 48 96 4 2304
2 4 56 224 16 3136
3 5 64 320 25 4096
4 6 60 360 36 3600
5 8 72 576 64 5184
SOMAS 25 300 1576 145 18320

1
= ∑( − ) =∑ − (∑ ) ABB = 145 − (25) = 20
5

1
= ∑( − ) =∑ − (∑ ) AEE = 18320 − (300) = 320
5
'
= ∑( − )( − )=∑ − ∑ ∑ ABE = 1576 − J 25.300=76

n=5 X=25 Y=300 =5 L=60 X2=145


Y2=1832 XY=1576

=
SXX=20 SYY=320 SXY=76

Coeficiente de Correlação Linear r (PEARSON)

MN
= = 2, PQ
√ 2∗3 2
COEF DE CORRELAÇÃO= 0,9500
Correlação positiva forte
Correlação Profª Josefa A . Alvarez 5

c-Calcule a covariancia e o coeficiente de correlação

MN
covariancia
( , )= = = P
− R

2
Variância de X

= = =Q
− R
Variância de Y

3 2
= = = S2
− R
coeficiente de correlação

( , ) P
= = = = 2, PQ
T √Q √S2
Correlação Profª Josefa A . Alvarez 6

d. Verifique se o coeficiente de correlação é zero


H :ρ=0
Hipóteses ! #
H' : ρ ≠ 0
Teste bilateral
nível de significância =0,05
Estatística Teste
2,PQ√Q
W= = Q, M
2,PQ
Região crítica t(n-2;alfa/2)=3,182

T < - t  ,  /2 = - 3,182 ou T > t  ,  / 2 =t3; 0.025=+ 3,182


=n-2=5-2=3 t  ;  / 2 =t3; 0.025= 3,182
Como a Estatística Teste cai na região crítica devemos rejeitar H0 ao
nível de significância de 5%

Correlação Ordinal (Spearman)


Este coeficiente leva em conta os valores que as variáveis ocupam quando
ordenadas na forma crescente
r s = + 1 há concordância completa entre as classificações
r s = - 1 há discordância completa entre as classificações
N. ∑ X
= −
( − )
3. Seja X: altura e Y: peso
Calcule o coeficiente de correlação de Spearman
entre as variáveis X e Y
X: altura Y: peso A P Di2
1 174 73 6 6 0
2 161 66 2 4 4
3 170 64 5 2,5 6,25
4 180 94 9 10 1
5 182 79 10 7 9
6 164 72 3 5 4
7 156 62 1 1 0
8 168 64 4 2,5 2,25
9 176 90 8 9 1
10 175 81 7 8 1
Soma 28,5

N. S,Q
= − 2( 2 )
= 2, S M
Há concordância entre as classificações.

4.Uma amostra de tamanho 15 apresentou um coeficiente de correlação igual


a 0,40. Pode- se concluir ao nível de 5% que o coeficiente de correlação da
população é zero ou diferente?
Respostas
H0: =0 Tcal =1,574
Não podemos rejeitar Ho com nível de significância de 5%
Correlação Profª Josefa A . Alvarez 7

Solução:
Teste de Hipótese para o coeficiente de correlação
" :% = 0
Hipóteses ! #
"' : % ≠ 0
nível de significância =0,05
Região Crítica t 13;0,025=2,160 portanto T<-2,160 ou T>+2,160

Estatística Teste
√ 2,R√ Q
W= = = , QMR
2,R
Conclusão: Não devemos rejeitar Ho ao nível de 5% de significância
5. Para os dados da tabela abaixo;
a. Determinar o coeficiente de correlação linear (Pearson) e verifique ao nível
de 5% se o coeficiente de correlação é zero ou diferente
b. Determinar o coeficiente de correlação ordinal (Spearman) e verifique ao
nível de 5% se o coeficiente de correlação é zero ou diferente.
Estudantes A B C D E
Alturas (cm) 183 175 168 178 173
Peso (Kg) 77 75 68 82 84
∑X= 877 n= 5 SXX= 125,2000
∑Y= 386,00 ∑X = 153951,00 SYY= 158,8000
2

∑XY= 67768,00 ∑Y2= 29958,00 SXY= 63,6000


Respostas.
a. r=0,45 ;
H0 : ρ = 0
! Tcal = 0,875 RC={T|T<-3,182 ou T>3,182}
H1 : ρ ≠ 0
Tcal não cai na região crítica portanto não devemos rejeitar H0.
H0: =0
Não podemos rejeitar Ho com nível de significância de 5%
b. rs=0,3
H0 : ρ = 0
! Tcal = 0,545 RC={T|T<-3,182 ou T>3,182}
H1 : ρ ≠ 0
H0: =0 Tcal =0,545
Não podemos rejeitar Ho com nível de significância de 5%
Solução:
Teste de Hipótese para o coeficiente de correlação
N3, N
= = = 2, RQ
Q, ∗ QS, S
" :% = 0
Hipóteses ! #
"' : % ≠ 0
nível de significância =0,05
Região Crítica t 3;0,025=3,182 portanto RC={T| T<-3,182 ou T>+3,182}

Estatística Teste

√ 2,RQ√Q
W= = = 2, SMQ
2,RQ
Tcal não cai na RC portanto não devemos rejeitar H0
Correlação Profª Josefa A . Alvarez 8

Estudantes Alturas (cm) Peso (Kg) rank x rank y ]^ = ( _ `a − _ `E )


A 183 77 5 3 4
B 175 75 3 2 1
C 168 68 1 1 0
D 178 82 4 4 0
E 173 84 2 5 9
∑=14

N.∑ X N∗ R
= − ( )
 = − Q(Q )
= 2, 3
H2 : b = 0
!
c :b ≠ 0
√ − 2, 3√Q −
W= →W= = 2, QRQ
√ − − 2, 3
Conclusão
RC={TT<-3,182 ou T>3,182}
Tcal=0,545 não cai na RC portanto não devemos rejeitar Ho
6. Para estudar a poluição de um rio, um cientista mediu a concentração de um
determinado composto orgânico (Y) e a precipitação pluviométrica na semana
anterior (X):
X 0,91 1,33 4,19 2,68 1,86 1,17
Y 0,1 1,1 3,4 2,1 2,6 1

∑X= 12,14000 n= 6 SXX= 7,60073


∑Y= 10,30000 ∑X2= 32,16400 SYY= 7,26833
∑XY= 27,43400 ∑Y2 = 24,95000 SXY= 6,59367
a. Existe alguma relação entre o nível de poluição e a precipitação
pluviométrica?
b. Teste sua significância, ao nível de 5%.
Solução:
M, N22M3
= = = 2, M3P
M, NS33 ∗ N, QP3NM

Teste de Hipótese para o coeficiente de correlação


" :% = 0
Hipóteses ! #
"' : % ≠ 0
nível de significância =0,05

Região Crítica t 3;0,025=2,776


portanto RC={T| T<-2,776ou T>+2,776}
"# : % = 0
!
"' : % ≠ 0

√ − 2, M3P√N −
W= = = , P
√ − − (2, M3P)
O valor crítico de t para n-2 = 4 graus de liberdade e 5% de nível se significância
é 2,78.
Correlação Profª Josefa A . Alvarez 9

Como o valor calculado de t é inferior ao valor crítico, podemos concluir que não
existem evidências suficientes para afirmar que o composto orgânico (Y) e a
precipitação pluviométrica (X) estejam correlacionados.
7. Procurando quantificar os efeitos da escassez de sono sobre a capacidade de
resolução de problemas simples, um agente tomou ao acaso 10 sujeitos e os
submeteu a experimentação. Deixou-os sem dormir por diferentes números de
horas, após o que solicitou que os mesmos resolvessem os itens "contas de
adicionar" de um teste. Obteve, assim, os seguintes dados:
Calcule o coeficiente de correlação linear de Pearson e teste a sua significância
ao nível de 5%.
∑X= 160 n= 10 SXX= 320

∑Y= 106 ∑ X2= 2.880 SYY= 112,4


∑ XY= 1.848 2
∑ Y = 1.236 SXY= 152

Solução:
Q
= = = 2, P2
√3 2 ∗ ,R
Teste de Hipótese para o coeficiente de correlação
" :% = 0
Hipóteses ! #
"' : % ≠ 0
nível de significância =0,05
Região Crítica t 8;0,025=2,306 portanto RC={T| T<-2,306 ou T>+2,306}
H :b = 0
! 2
c :b ≠ 0
√ − 2, P2 √S −
W= →= = Q,
√ − − (2, P2 )
O valor crítico de t para n-2 = 8 graus de liberdade e 5% de nível se significância
é 2,306.
Como o valor calculado de t é superior ao valor crítico, podemos concluir que
existem evidências suficientes para afirmar que o número de horas sem dormir
(X) influencia significativamente o número de erros (Y).
8. A tabela ao lado apresenta as taxas de retorno das ações (RA) da Agressiva
S.A. e as taxas de retorno da carteira de mercado (RM), relativas aos últimos
7 meses.
Solução
∑X 0,61900 n= 7 SXX= 0,02156 Sx 0,05995

∑Y 0,69360 ∑X2= 0,07630 SYY= 0,04381 SY 0,08545


∑XY 0,08387 2
∑Y = 0,11253 SXY= 0,02254 COV(X,Y) 0,00376
a. Calcule o coeficiente de correlação de Pearson
b. Teste a hipótese de que a correlação e diferente de zero.
c. Calcule a covariância entre as taxas de retorno das ações e os respectivos
desvios.
Respostas
a. r=0,733 b. Tcal=2,411
H# : ρ = 0
b. ! RC={T|T<-2,571 ou T>2,571}
H' : ρ ≠ 0
Tcal não cai na região crítica portanto não devemos rejeitar H0.
c. COV(X,Y)= 0,0038 Sx=0,0599 Sx =0,0854
Correlação Profª Josefa A . Alvarez 10

9.Uma empresa de propaganda testou o grau de memorização proporcionado


por 10 anúncios de televisão através de dois grupos, um de homens e outro de
mulheres. Ambos os grupos possuíam idênticas características
socioeconômicas. Os resultados em termos do grau de memorização relativa
encontram-se na tabela.
Anúncios A B C D E F G H I J
Homens 8 3 9 2 7 10 4 6 1 5
Mulheres 9 5 10 1 8 7 3 4 2 6
a.Calcule o coeficiente de correlação ordinal (Spearman).
b. Verificar ao nível de 5% se o coeficiente de correlação é zero ou diferente?
Respostas
a. rs=0,855
H# : ρ = 0
b. ! RC={T|T<-2,306 ou T>2,306}
H' : ρ ≠ 0
H0: =0 Tcal =4,654 podemos rejeitar Ho com nível de significância de 5%

10. Os dados se referem ao retorno anual médio (Y%) e ao desvio padrão do


retorno anual (X %)
Y 12,4 14,4 14,6 16 11,3 10 16,2 10,4 13,1 11,3
X 12,1 21,4 18,7 21,7 12,5 10,4 20,8 10,2 16 12
Resíduos 1,03 -1,24 0,20 0,22 -0,26 -0,59 0,83 -0,10 -0,06 -0,03

X 12,1 21,4 18,7 21,7 12,5 10,4 20,8 10,2 16 12


│Resíduos│ 1,03 1,24 0,20 0,22 0,26 0,59 0,83 0,10 0,06 0,03

X |Resíduos| Rank x Rank |Resíduos| ]^ = ( _ `a − _ `|fgh^ijkh| )


1 12,1 1,03
2 21,4 1,24
3 18,7 0,20
4 21,7 0,22
5 12,5 0,26
6 10,4 0,59
7 20,8 0,83
8 10,2 0,10
9 16 0,06
10 12 0,03

a. Calcule o coeficiente de correlação ordinal Spearman


b. Verifique se o coeficiente de correlação é igual a zero ou diferente de zero.
Adotar =0,05.
Respostas
a.0,333
b. lm = n | < −2,306 op > +2,306}
Tcal=1,0 não cai na RC portanto não devemos rejeitar H0 (Hipótese
nula), isto é, não existe correlação ao nível de 5% de significância

Você também pode gostar