Você está na página 1de 2

TESTES DE HIPTESE PARA COEFICIENTE DE CORRELAO

COEFICIENTE DE CORRELAO : DEFINIO


A razo entre a variao explicada por uma reta de regresso pela varincia total dos dados chamada de coeficiente de
determinao. Essa razo sempre um nmero no-negativo que chamamos de r2. A quantidade r, chamada de coeficiente
de correlao, dada por:
r

variacao explicada

total da variacao

(Yest Y )
(Y Y )

, onde r varia entre -1 e 1

(1)

Usando o fato de que o desvio-padro de Y dado por:


Sy

(Y Y )

N
Substituindo em 1

S Y2. X
r 1 2
SY

ou

(2)

S XY S Y 1 r 2

Para o caso das correlaes lineares, a quantidade r a mesma no importando se X ou Y so consideradas variveis
independentes. Assim, r uma boa medida da correlao linear entre 2 variveis.
TESTE DE HIPTESE DO COEFICIENTE DE CORRELAO
Os N pares de valores (X,Y) de duas variveis pode ser pensado como amostras de uma populao de todos pares possveis.
Uma vez que duas variveis so envolvidas, isto chamado de uma POPULAO BIVARIADA, a qual supomos possumir uma
distribuio bivariada normal. Podemos pensar em uma popula terica de coeficientes de correlao, denotados por , a
qual estimada por um coeficiente de correlao r. Testes de significncia ou hiptese com respeito aos vrios valores de
requerem o conhecimento das distribuies amostrais de r. Para = 0 esta distribuio simtrica, e a estatstica envolvendo
a distribuio de Student pode ser usada. Para 0, a distribuio skewed (alongada). Nestes casos uma transformao
desenvolvida por Fisher produz uma estatstica que aproximadamente normalmente distribuda. Os seguintes testes
resumem os procedimentos envolvidos:
1) Teste de Hiptese para = 0. Aqui usamos a estatstica de Student :
t

r N 2

(3)

1 r2

Que tem distribuio de Student com = N-2 graus de liberdade


--------------------------------------------------------------------------------------------------------------------Exemplo 1 (Ex. 14.1 Coleo Schaum, Statistica, terceira Edio):
Um coeficiente de correlao baseado em uma amostra de tamanho 18 foi calculado como 0.32. Podemos concluir que aos
nveis de significncia de (a) 0.05 e (b) 0.01 a correspondente correlao populacional difere de zero?
Soluo: Queremos decidir sobre a hiptese Ho: = 0 e H1: > 0.
t

r N 2
1 r

0.32 18 2
1 (0.32) 2

1.35

(4)

a) Usando o teste da distribuio uni-lateral (ONE-TAILED TEST) da distribuio de Student ao nvel de 0.05, rejeitaremos Ho
se t > t.95 = 1.75 para (18-2) = 16 graus de liberdade (PRESTEM ATENO NA TABELA QUE ESTIVEREM USANDO PARA
TER CERTEZA QUE SE TRATA DE ONE-TAIL). NOTEM QUE A NOMENCLATURA PODE APARECER TAMBM EM ALGUNS
CASOS COMO t0.05. ). Assim, no podemos rejeitar Ho ao nvel de 0.05 (O que isso quer dizer?)

b) Uma vez que no podemos rejeitar Ho ao nvel de 0.05, o que esperaramos concluir ao nvel de 0.01?
----------------------------------------------------2) Teste de Hiptese : = o 0. Aqui usamos o fato de que a estatstica:
1
1 r
1 r
Z log e
1.1513 log 10

(5)
2
1 r
1 r
Onde e= 2.71828..., aproximadamente normalmente distribuda com mdia e desvio-padro dado por:
1 0
1 0
1
1
1.1513 log10

Z log e
com Z
(6)
N 3
2
1 0
1 0
As equaes 5 e 6 podem tambm ser utilizado\as para encontrar limites de confiana para o coeficiente de correlao.
Exemplo 2 (Ex. 14.33 Coleo Schaum)
Um coeficiente de correlao ode uma amostra de tamanho 24 foi calculada como sendo r=0.75. Ao nvel de 0.05 de
significncia, podemos rejeitar a hiptese que o coeficiente de correlao da populao to pequeno quanto (a) =0.60 e (b)
=0.50
Soluo
1
1 r
1 0.75
1.1513 log 10
0.9730
a) Z log e
2
1 r
1 0.75

Z
Z

1 0
1
log e
2
1 0
1
N 3

1 0.60
0.6932
1 0.60

1.1513 log10

1
21

0.2182

Z Z 0.9730 0.6932

1.28
Z
0.2182
Usando a distribuio normal para um teste UNILATERAL (uma s cauda ou one-tail test) ao nvel de 0.05 de significncia,
rejeitaramos a hiptese apenas se z fosse maior que 1.64. Esse valor foi encontrado na tabela onde a rea correspondeu a
0.45. Como se trata de um teste ao nvel de 0.05, a rea total de aceitao da hiptese Ho corresponde a 0.95. A rea total sob
a curva normal igual a 1. Se voc estiver utilizando uma tabela com area sob a curva para z variando de 0 a Z a rea total
sob a curva nesse intervalo (0-z) igual a 0.5. O valor de corte para a aceitao ou rejeio da hiptese Ho deve ocorrer em
0.50 0.05 = 0.45. Se voc procurar esse valor na tabela, ver que corresponde a um z= 1.64. Assim no podemos rejeitar a
hiptese que a correlao da populao seja to pequena quanto 0.60.
Assim, z

b) O que podemos dizer sobre o valor igual a 0.50?

Você também pode gostar