Você está na página 1de 19

1

Professor Mauricio Lutz

CORRELAÇÃO

Em muitas situações, torna-se interessante e útil estabelecer uma


relação entre duas ou mais variáveis. A matemática estabelece vários tipos de
relações entre variáveis, por exemplo, as relações funcionais e as correlações.

Relações Funcionais
São relações matemáticas expressas por sentenças matemáticas, como
por exemplo:
• Área do retângulo (A=a.b) é a relação entre os lados do retângulo;
• Densidade de massa (dm= m/v) é a relação entre a massa e o volume de um
corpo;
• Perímetro de uma circunferência (C=2πR) é a relação entre o comprimento da
circunferência e o valor do raio.

Relações Estatísticas e Correlações


São relações estabelecidas após uma pesquisa. Com base nos
resultados da pesquisa, são feitas comparações que eventualmente podem
conduzir (ou não) à ligação entre as variáveis.
Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a
classe social de uma pessoa e o número de viagens por ela realizado.
No estudo estatístico, a relação entre duas ou mais variáveis denomina-
se correlação. A utilidade e importância das correlações entre duas variáveis
podem conduzir à descoberta de novos métodos, cujas estimativas são vitais em
tomadas de decisões.
Em outras palavras quando duas variáveis estão ligadas por uma
relação estatística, dizemos que existe correlação entre elas.

1) Diagrama de dispersão
O diagrama de dispersão é um gráfico cartesiano em que cada um dos
eixos corresponde às variáveis correlacionadas. A variável dependente (Y) situa-se
no eixo vertical e o eixo das abscissas é reservado para a variável independente
(X). Os pares ordenados formam uma nuvem de pontos.
A configuração geométrica do diagrama de dispersão pode estar associada a uma
linha reta (correlação linear), uma linha curva (correlação curvilínea) ou, ainda, ter
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
2
Professor Mauricio Lutz

os pontos dispersos de maneira que não definam nenhuma configuração linear;


nesta última situação, não há correlação.
100 100
50 50
0 0
0 5 10 0 5 10

Correlação Linear Correlação Curvilínea

2) Correlação Linear
Correlação linear é uma correlação entre duas variáveis, cujo gráfico
aproxima-se de uma linha. É uma linha de tendência, porque procura acompanhar
a tendência da distribuição de pontos, que pode corresponder a uma reta ou a uma
curva. Por outro lado, é, também, uma linha média, porque procura deixar a mesma
quantidade de pontos abaixo e acima da linha.

Correlação linear positiva Correlação linear negativa

Não há correlação
Para definir se a correlação entre as variáveis corresponde a uma linha
reta ou a uma curva, pode-se utilizar modos qualitativos ou quantitativos.
No modo qualitativo, vai imperar o “bom senso” do pesquisador para
verificar qual o grau de intensidade na correlação entre as variáveis; isso significa o
estabelecimento de uma relação numérica que medirá o nível da correlação.

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
3
Professor Mauricio Lutz

3) Coeficiente de Correlação Linear


O instrumento empregado para a medida da correlação linear é o
coeficiente de correlação. Este coeficiente deve indicar o grau de intensidade de
correlação entre duas variáveis e, ainda, o sentido dessa correlação (positiva ou
negativa). Uma das formas de medir o coeficiente de correlação linear foi
desenvolvido por Pearson e recebe o nome de coeficiente de correlação de
Pearson. O coeficiente de correlação de Pearson mede o grau de ajustamento dos
valores em torno de uma reta.
Coeficiente de Correlação de Pearson (r):
nå xi y i - (å xi )(
. å yi )
r=
[nå x 2
i
2
][
- (å xi ) . nå y i2 - (å y i )
2
]
onde temos:
r é o coeficiente de Pearson;
n é o número de observações;
xi é a variável independente;

yi é a variável dependente.
O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou
seja, está limitado entre os valores do Intervalo[–1,+1].
• r = +1 (correlação positiva entre as variáveis);
• r = –1 (correlação perfeita negativa entre as variáveis);
• r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear,
caso exista).
Quanto mais próximo o valor de r estiver do valor “1”, mais forte a
correlação linear.
Quanto mais próximo o valor de r estiver do valor “0”, mais fraca a
correlação linear.
Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado
passa a ser expresso em porcentagem. Na prática, estabelecem-se critérios para
verificar os diversos níveis do fraco ao forte, chegando até o perfeito:
• 0 < |r| < 0,3 : a correlação é fraca e fica difícil estabelecer relação entre as
variáveis. Em porcentagem: 0% < |r| < 30%;

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
4
Professor Mauricio Lutz

• 0,3 ≤ |r| < 0,6 : a correlação é fraca, porém, podemos considerar a existência de
relativa correlação entre as variáveis. Em porcentagem: 30% ≤ |r| < 60%;
• 0,6 ≤ |r| < 1 : a correlação é de média para forte; a relação entre as variáveis é
significativa, o que permite coerência com poucos conflitos na obtenção das
conclusões. Em porcentagem: 60% ≤ |r| ≤ 100%.

4) Teste de hipótese para a existência de correlação


Para aplicar o teste de hipótese para existência de correlação linear, é
necessário que as variáveis populacionais (X, Y) tenham distribuição normal
bivariada. Quando as amostras forem superiores a 30, a hipótese de normalidade
das duas variáveis é razoavelmente atendida.
O coeficiente de correlação linear da população (X, Y) é designado ρ (ler
Rô). Se o teste indicar a rejeição da hipótese r = 0 , poderemos concluir que existe
correlação entre as variáveis ao nível de significância admitido. Eis o procedimento
para realizar o teste:
(1) H0: r = 0
H1: r ¹ 0
(2) Fixar ∝ e escolher uma distribuição t de Student com j = n - 2 graus
de liberdade.
(3) Determinar as regiões de rejeição e aceitação para H0, com auxilio
da tabela t de Student.

r n-2
(4) Calculo do valor da variável: t cal =
1- r2
(5) Conclusão:

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
5
Professor Mauricio Lutz

Se t cal > t a ou t cal > -t a , rejeita-se H0, concluindo, com risco ∝, que há
2 2

correlação entre as variáveis.


Se - t a £ t cal £ t a , não se pode rejeita-se H0, concluindo que há
2 2

correlação entre as variáveis.

Exemplos: a) Uma pesquisa pretende verificar se há correlação significativa entre o


peso total do lixo descartado, por dia, numa empresa com o peso do papel contido
nesse lixo.
Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10
Peso total 10,47 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14
Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43

De acordo com os dados, fazemos a representação gráfica. Os pares


ordenados formam o diagrama de dispersão.

Correlação entre o peso total do lixo descartado e o peso do papel contido nesse
lixo
Para se verificar o grau de correlação entre as variáveis, calcula-se o
coeficiente de correlação linear pela fórmula do coeficiente de correlação de
Pearson:
nå xi y i - (å xi )(
. å yi )
r=
[nå x 2
i
2
][
- (å xi ) . nå y i2 - (å y i )
2
]
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
6
Professor Mauricio Lutz

Para facilitar o cálculo construímos a seguinte tabela:


Peso total ( xi ) Peso do papel ( y i ) xi . y i x i2 yi2
H1 10,47 2,43 25,44 109,62 5,90
H2 19,85 5,12 101,63 394,02 26,21
H3 21,25 6,88 146,20 451,56 47,33
H4 24,36 6,22 151,52 593,41 38,69
H5 27,38 8,84 242,04 749,66 78,15
H6 28,09 8,76 246,07 789,05 76,74
H7 33,61 7,54 253,42 1129,63 56,85
H8 35,73 8,47 302,63 1276,63 71,74
H9 38,33 9,55 366,05 1469,19 91,20
H10 49,14 11,43 561,67 2414,74 130,64
å 288,21 75,24 2396,68 9377,52 623,47
n å xi yi - (å xi )(
. å yi )
r=
[nå x 2
i
2
][
- (å xi ) . n å yi2 - (å yi )
2
]
(10 x 2396,68) - ( 288,21x 75,24)
r=
[10 x9377,52 - (288,21) ]x[10 x623,47 - (75,24) ]
2 2

( 23966,8) - ( 21684,9) 2281,83


r= = = 0,9206
[93775,2 - 83065]x[6234,7 - 5661,06] 2478,57
r = 0,9206 ou r = 92,06 %
Observamos, assim: 0,6 ≤ r ≤ 1 . Esse resultado indica que há uma forte
correlação entre as variáveis ou, ainda, que a correlação entre as duas variáveis é
bastante
significativa. Nesse caso, podemos concluir haver coerência na afirmação de que
existe correlação entre o peso total do lixo descartado e o peso do papel contido
nesse lixo.

Realizando o teste de hipótese com um ∝=5% temos:


(1) H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
7
Professor Mauricio Lutz

(3) Regiões de rejeição e aceitação para H0.

r n-2 0,9206 10 - 2 2,6039


(4) Cálculo do valor da variável: t cal = = = = 6,6679
1- r2 1 - (0,9206) 2 0,3905

(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que

há correlação entre o peso total de lixo descartada com o peso total de papel
contido neste lixo, ou ainda, existe uma correlação positiva entre X e Y, significa
que as variáveis são diretamente proporcionais, portando quanto maior o lixo
produzido maior será a quantidade de papel contida neste lixo.

b) Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em matemática e estatística:
Notas
Números
Matemática ( xi ) Estatística ( y i )

01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0

Vamos verificar a correlação primeiro fazendo um diagrama de


dispersão:

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
8
Professor Mauricio Lutz

Correlação entre as notas de matemática e estatística

Notas
Números xi . y i x i2 yi2
Matemática ( xi ) Estatística ( y i )
01 5,0 6,0 30 25 36
08 8,0 9,0 72 64 81
24 7,0 8,0 56 49 64
38 10,0 10,0 100 100 100
44 6,0 5,0 30 36 25
58 7,0 7,0 49 49 49
59 9,0 8,0 72 81 64
72 3,0 4,0 12 9 16
80 8,0 6,0 48 64 36
92 2,0 2,0 4 4 4
å 65 65 473 481 475
n å xi y i - (å x i )(
. å yi )
r=
[nå x 2
i
2
][
- (å xi ) . n å y i2 - (å y i )
2
]
(10 x 473) - (65 x 65)
r=
[10 x481 - (65) ]x[10 x475 - (65) ]
2 2

( 4730 ) - ( 4225) 505 505


r= = = = 0,9112
[4810 - 4225]x[4750 - 4225] 585 x525 554,18

Portanto r = 0,9112 ou r = 92,12% , o que resulta uma correlação positiva


altamente significativa entre as duas variáveis.

Realizando o teste de hipótese com um ∝=5% temos:


(1) H0: r = 0
H1: r ¹ 0
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
9
Professor Mauricio Lutz

(2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8


(3) Regiões de rejeição e aceitação para H0.

r n-2 0,9112 10 - 2 2,5773


(4) Cálculo do valor da variável: t cal = = = = 6,2560
1- r2 1 - (0,9112) 2 0,4120

(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que

há correlação entre as notas de matemática e estatística, ou ainda, existe uma


correlação positiva entre X e Y, significa que as variáveis são diretamente
proporcionais, portando quanto maior a nota de matemática maior será a nota de
estatística.

Exercícios
1)Complete o esquema de cálculo do coeficiente de correlação para os valores das
variáveis xi e y i :

xi 4 6 8 10 12

yi 12 10 8 12 14

Temos:

xi yi xi . y i x i2 yi2
4 12 48 16 144
........ ........ ........ ........ ........
........ ........ ........ ........ ........
........ ........ ........ ........ ........
12 14 168 144 196

å =........ å =........ å =........ å =........ å =........

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
10
Professor Mauricio Lutz

Logo:
(........ x........) - (........ x........)
r=
[........ x........ - ........]x[........ x........ - ........]
........ - ........ ........ ........
r= = = = ........
[........ - ........]x[........ - ........] ........ x........ ........
Donde r = 0,42 . A correlação linear entre as variáveis x e y é positiva,
porém fraca.

2) Correlacionar os valores de produção leiteira e o teor de gordura de animais


bovinos da fazenda Pica Pau Amarelo.
Produção (kg) Teor de Gordura (%)

10 6,0

12 5,7

14 5,3

17 5,2

19 5,0

22 4,7

25 4,5

3) Para os dados abaixo:


a) Desenhe o diagrama de dispersão;
b) Calcule o coeficiente de correlação de Pearson e interprete.
c) Teste o coeficiente encontrado na letra b).
Concentração Protombina no Plasma (x) Tempo de coagulação em segundos (y)

5 70

10 40

20 27

30 22

40 18

50 16

60 15

70 14

80 13

90 12

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
11
Professor Mauricio Lutz

4) Uma amostra revelou o coeficiente de correlação entre o salário e o número de


anos de escolaridade para um grupo de 60 pessoas é de 0,78. Teste a hipótese de
existência de correlação entre essas variáveis, ao nível de 5%.

5) Sessenta e quatro estudantes foram submetidos a dois testes: raciocínio lógico e


quantitativo e conhecimentos gerais. Dos escores obtidos, foram calculadas as
somas:
å X = 169 ; å Y = 327 ; å X 2
= 1450 ; åY 2
= 2304 ; å XY = 837 .
a)Determine o coeficiente de correlação.
b) Ao nível de significância de 5%, testar a existência de correlação.

6) A tabela a seguir expressa os pesos e as alturas de 30 crianças:


Peso (kg) 30 32 24 30 26 35 25 23 35 31 29 28 25 29 30

Altura (cm) 145 150 125 157 127 140 132 107 155 145 140 142 130 135 138

Peso (kg) 31 32 33 25 26 28 29 30 31 35 34 33 32 28 30

Altura (cm) 140 150 157 144 145 147 150 152 150 160 149 150 129 130 140
Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as
alturas?

7) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos.


Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a
tabela:
Peso Real 18 30 42 62 73 97 120

Peso Aparente 10 23 33 60 91 98 159


Calcule o índice de correlação.

8) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos


da escola A:
xi 11 14 19 19 22 28 30 31 34 37

yi 13 14 18 15 22 17 24 22 24 25

a) Verifique, pelo diagrama, se existe correlação retilínea.


b) Em caso afirmativo, calcule o coeficiente de correlação.
c) Escreva em poucas linhas, as conclusões a que chegou sobre a relação entre
essas variáveis.
d) Ao nível de significância de 5%, testar a existência de correlação.

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
12
Professor Mauricio Lutz

Gabarito
1)Complete o esquema de cálculo do coeficiente de correlação para os valores das
variáveis xi e y i :

xi 4 6 8 10 12

yi 12 10 8 12 14

Temos:

xi yi xi . y i x i2 yi2
4 12 48 16 144
6 10 60 36 100
8 8 64 64 64
10 12 120 100 144
12 14 168 144 196

å =40 å =56 å =460 å =360 å =648


Logo:
(5 x 460) - ( 40 x56)
r=
[5x360 - (40) ]x[5x648 - (56) ]
2 2

2300 - 2240 60 60
r= = = = 0,42
[1800 - 1600]x[3240 - 3136 ] 200 x104 144,22
Donde r = 0,42 . A correlação linear entre as variáveis x e y é positiva,
porém fraca.

2) Correlacionar os valores de produção leiteira e o teor de gordura de animais


bovinos da fazenda Pica Pau Amarelo.
Produção (kg) Teor de Gordura (%) xi . y i x i2 yi2
10 6,0 60 100 36

12 5,7 68,4 144 32,49

14 5,3 74,2 196 28,09

17 5,2 88,4 289 27,04

19 5,0 95 361 25

22 4,7 103,4 484 22,09

25 4,5 112,5 625 20,25

å =119 å =36,4 å =601,9 å =2199 å =190,96


Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
13
Professor Mauricio Lutz

(7 x 601,9) - (119 x36,4)


r=
[7 x2199 - (119) ]x[7 x190,96 - (36,4) ]
2 2

4213,3 - 4331,6 - 118,3 - 118,3


r= = = = -0,9828
[15393 - 14161]x[1336,72 - 1324,96] 1232 x11,76 120,37

Existe uma forte correlação negativa entre x e y, significa que as


variáveis são inversamente proporcionais, ou seja, quanto mais leite produz a vaca
menor o teor de gordura do leite.

3) Para os dados abaixo:


a) Desenhe o diagrama de dispersão;
b) Calcule o coeficiente de correlação de Pearson e interprete.
c) Teste o coeficiente encontrado na letra b).
Concentração Protombina no Tempo de coagulação
xi . y i x i2 yi2
Plasma (x) em segundos (y)

5 70 350 25 4900

10 40 400 100 1600

20 27 540 400 729

30 22 660 900 484

40 18 720 1600 324

50 16 800 2500 256

60 15 900 3600 225

70 14 980 4900 196

80 13 1040 6400 169

90 12 1080 8100 144

å =455 å =247 å =7470 å =28525 å =9027


a)

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
14
Professor Mauricio Lutz

b)
(10 x7470 ) - ( 455 x 247 )
r=
[10 x28525 - (455) ]x[10 x9027 - (247 ) ]
2 2

74700 - 112385 - 37685 - 37685


r= = = = -0,7877
[285250 - 207025]x[90270 - 61000 ] 78225 x 29261 47842,89
Existe uma correlação negativa entre x e y, significa que as variáveis são
inversamente proporcionais, ou seja, quanto maior a concentração de protombina
menor é o tempo de coagulação.
c) Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8
(3) Regiões de rejeição e aceitação para H0.

r n-2 - 0,7877 10 - 2 - 2,2279


(4) Cálculo do valor da variável: t cal = = = = -3,6163
1- r2 1 - (-0,7877) 2 0,6162

(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que

há correlação entre a concentração protombina no plasma e tempo de coagulação.

4) Uma amostra revelou o coeficiente de correlação entre o salário e o número de


anos de escolaridade para um grupo de 60 pessoas é de 0,78. Teste a hipótese de
existência de correlação entre essas variáveis, ao nível de 5%.
Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 60 - 2 = 58

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
15
Professor Mauricio Lutz

(3) Regiões de rejeição e aceitação para H0.

r n-2 0,78 60 - 2 5,9403


(4) Cálculo do valor da variável: t cal = = = = 9,4926
1- r 2
1 - (0,78) 2 0,6258

(5) Conclusão: Como t cal > 2,0017 , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre o salário e o número de anos de escolaridade.

5) Sessenta e quatro estudantes foram submetidos a dois testes: raciocínio lógico e


quantitativo e conhecimentos gerais. Dos escores obtidos, foram calculadas as
somas:
å X = 169 ; å Y = 327 ; å X 2
= 1450 ; åY 2
= 2304 ; å XY = 837 .
a)Determine o coeficiente de correlação.
b) Ao nível de significância de 5%, testar a existência de correlação.
a)
(64 x837 ) - (169 x327 )
r=
[ ][
64 x1450 - (169 ) x 64 x 2304 - (327 )
2 2
]
53568 - 55263 - 1695 - 1695
r= = = = -0,03322
[92800 - 28561]x[147456 - 106929 ] 64239 x 40527 51023,6607
r = -3,322%
Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 64 - 2 = 62
(3) Regiões de rejeição e aceitação para H0.

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
16
Professor Mauricio Lutz

(4) Cálculo do valor da variável:


r n-2 - 0,03322 64 - 2 - 0,26157
t cal = = = = -0,2617
1- r2 1 - (-0,03322) 2 0,99945

(5) Conclusão: Como t cal < 2,0017 , aceita-se H0, concluindo, com riso de 5%, que
não há correlação entre os testes raciocínio lógico e quantitativo e conhecimentos
gerais.

6) A tabela a seguir expressa os pesos e as alturas de 30 crianças:

Peso (kg) 30 32 24 30 26 35 25 23 35 31 29 28 25 29 30

Altura (cm) 145 150 125 157 127 140 132 107 155 145 140 142 130 135 138

Peso (kg) 31 32 33 25 26 28 29 30 31 35 34 33 32 28 30

Altura (cm) 140 150 157 144 145 147 150 152 150 160 149 150 129 130 140
Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as
alturas?
Peso Altura Peso (x) Altura (y)
xi . y i x i2 yi2 xi . y i x i2 yi2
(x) (y)

30 145 4350 900 21025 31 140 4340 961 19600

32 150 4800 1024 22500 32 150 4800 1024 22500

24 125 3000 576 15625 33 157 5181 1089 24649

30 157 4710 900 24649 25 144 3600 625 20736

26 127 3302 676 16129 26 145 3770 676 21025

35 140 4900 1225 19600 28 147 4116 784 21609

25 132 3300 625 17424 29 150 4350 841 22500

23 107 2461 529 11449 30 152 4560 900 23104

35 155 5425 1225 24025 31 150 4650 961 22500

31 145 4495 961 21025 35 160 5600 1225 25600

29 140 4060 841 19600 34 149 5066 1156 22201

28 142 3976 784 20164 33 150 4950 1089 22500

25 130 3250 625 16900 33 129 4257 1089 16641

29 135 3915 841 18225 28 130 3640 784 16900

30 138 4140 900 19044 30 140 4200 900 19600

å =890 å =4261 å =127164 å =26736 å =609049

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
17
Professor Mauricio Lutz

Ao nível de significância de 5%, testar a existência de correlação.


a)
(30 x127164 ) - (890 x 4261) 3814920 - 3792290
r= =
[30 x 26736 - (890 ) ]x[30 x609049 - (4261) ]
2 2
[802080 - 792100 ]x[18271470 - 18156121]
22630 22630
r= = = 0,667
9980 x11549 33929,08811

Realizando o teste de hipótese com um ∝=5% temos:


(1) H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 30 - 2 = 28
(3) Regiões de rejeição e aceitação para H0.

r n-2 0,667 30 - 2 3,5294


(4) Cálculo do valor da variável: t cal = = = = 4,7371
1- r2 1 - (0,667) 2 0,7451

(5) Conclusão: Como t cal > 2,0484 , rejeita-se H0, concluindo, com riso de 5%, que

há correlação linear entre os pesos e as alturas das 30 crianças avaliadas.

7) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos.


Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a
tabela:
Peso Real 18 30 42 62 73 97 120

Peso Aparente 10 23 33 60 91 98 159


Calcule o índice de correlação.

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
18
Professor Mauricio Lutz

Peso real (x) Peso aparente (y) xi . y i x i2 yi2

18 10 180 324 100

30 23 690 900 529

42 33 1386 1764 1089

62 60 3720 3844 3600

73 91 6643 5329 8281

97 98 9506 9409 9604

120 159 19080 14400 25281

å =442 å =474 å =41205 å =35970 å =48484


(7 x 41205) - ( 442 x 474) 288435 - 209508
r= =
[7 x35970 - (442 ) ]x[7 x48484 - (474 ) ]
2 2
[251790 - 195364 ]x[339288 - 224676 ]
78927 78927
r= = = 0,9810
56426 x114712 8045,336

8) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos


da escola A:
xi 11 14 19 19 22 28 30 31 34 37

yi 13 14 18 15 22 17 24 22 24 25

a) Verifique, pelo diagrama, se existe correlação retilínea.


b) Em caso afirmativo, calcule o coeficiente de correlação.
c) Escreva em poucas linhas, as conclusões a que chegou sobre a relação entre
essas variáveis.
d) Ao nível de significância de 5%, testar a existência de correlação.
xi yi
xi . y i x i2 yi2
11 13 143 121 169
14 14 196 196 196
19 18 342 361 324
19 15 285 361 225
22 22 484 484 484
28 17 476 784 289
30 24 720 900 576
31 22 682 961 484
34 24 816 1156 576
37 25 925 1369 625

å =245 å =194 å =5069 å =6693 å =3948


Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
19
Professor Mauricio Lutz

a)

b)
(10 x5069 ) - ( 245 x194) 50690 - 47530
r= =
[10 x6693 - (245) ]x[10 x3948 - (194 ) ]
2 2
[66930 - 60025]x[9480 - 37636 ]
3160 3160
r= = = 0,8856
6905 x1844 3568,308
c) Existe uma correlação positiva entre os testes x e y, significa que as variáveis
são diretamente proporcionais.
d) Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8
(3) Regiões de rejeição e aceitação para H0.

r n-2 0,8856 10 - 2 2,5048


(4) Cálculo do valor da variável: t cal = = = = 5,3924
1- r2 1 - (0,8856) 2 0,4645

(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que

há correlação entre os teste x e y.

Instituto Federal farroupilha Campus Alegrete


RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br

Você também pode gostar