Escolar Documentos
Profissional Documentos
Cultura Documentos
CORRELAÇÃO
Relações Funcionais
São relações matemáticas expressas por sentenças matemáticas, como
por exemplo:
• Área do retângulo (A=a.b) é a relação entre os lados do retângulo;
• Densidade de massa (dm= m/v) é a relação entre a massa e o volume de um
corpo;
• Perímetro de uma circunferência (C=2πR) é a relação entre o comprimento da
circunferência e o valor do raio.
1) Diagrama de dispersão
O diagrama de dispersão é um gráfico cartesiano em que cada um dos
eixos corresponde às variáveis correlacionadas. A variável dependente (Y) situa-se
no eixo vertical e o eixo das abscissas é reservado para a variável independente
(X). Os pares ordenados formam uma nuvem de pontos.
A configuração geométrica do diagrama de dispersão pode estar associada a uma
linha reta (correlação linear), uma linha curva (correlação curvilínea) ou, ainda, ter
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
2
Professor Mauricio Lutz
2) Correlação Linear
Correlação linear é uma correlação entre duas variáveis, cujo gráfico
aproxima-se de uma linha. É uma linha de tendência, porque procura acompanhar
a tendência da distribuição de pontos, que pode corresponder a uma reta ou a uma
curva. Por outro lado, é, também, uma linha média, porque procura deixar a mesma
quantidade de pontos abaixo e acima da linha.
Não há correlação
Para definir se a correlação entre as variáveis corresponde a uma linha
reta ou a uma curva, pode-se utilizar modos qualitativos ou quantitativos.
No modo qualitativo, vai imperar o “bom senso” do pesquisador para
verificar qual o grau de intensidade na correlação entre as variáveis; isso significa o
estabelecimento de uma relação numérica que medirá o nível da correlação.
yi é a variável dependente.
O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou
seja, está limitado entre os valores do Intervalo[–1,+1].
• r = +1 (correlação positiva entre as variáveis);
• r = –1 (correlação perfeita negativa entre as variáveis);
• r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear,
caso exista).
Quanto mais próximo o valor de r estiver do valor “1”, mais forte a
correlação linear.
Quanto mais próximo o valor de r estiver do valor “0”, mais fraca a
correlação linear.
Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado
passa a ser expresso em porcentagem. Na prática, estabelecem-se critérios para
verificar os diversos níveis do fraco ao forte, chegando até o perfeito:
• 0 < |r| < 0,3 : a correlação é fraca e fica difícil estabelecer relação entre as
variáveis. Em porcentagem: 0% < |r| < 30%;
• 0,3 ≤ |r| < 0,6 : a correlação é fraca, porém, podemos considerar a existência de
relativa correlação entre as variáveis. Em porcentagem: 30% ≤ |r| < 60%;
• 0,6 ≤ |r| < 1 : a correlação é de média para forte; a relação entre as variáveis é
significativa, o que permite coerência com poucos conflitos na obtenção das
conclusões. Em porcentagem: 60% ≤ |r| ≤ 100%.
r n-2
(4) Calculo do valor da variável: t cal =
1- r2
(5) Conclusão:
Se t cal > t a ou t cal > -t a , rejeita-se H0, concluindo, com risco ∝, que há
2 2
Correlação entre o peso total do lixo descartado e o peso do papel contido nesse
lixo
Para se verificar o grau de correlação entre as variáveis, calcula-se o
coeficiente de correlação linear pela fórmula do coeficiente de correlação de
Pearson:
nå xi y i - (å xi )(
. å yi )
r=
[nå x 2
i
2
][
- (å xi ) . nå y i2 - (å y i )
2
]
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
6
Professor Mauricio Lutz
(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre o peso total de lixo descartada com o peso total de papel
contido neste lixo, ou ainda, existe uma correlação positiva entre X e Y, significa
que as variáveis são diretamente proporcionais, portando quanto maior o lixo
produzido maior será a quantidade de papel contida neste lixo.
b) Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em matemática e estatística:
Notas
Números
Matemática ( xi ) Estatística ( y i )
01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
Notas
Números xi . y i x i2 yi2
Matemática ( xi ) Estatística ( y i )
01 5,0 6,0 30 25 36
08 8,0 9,0 72 64 81
24 7,0 8,0 56 49 64
38 10,0 10,0 100 100 100
44 6,0 5,0 30 36 25
58 7,0 7,0 49 49 49
59 9,0 8,0 72 81 64
72 3,0 4,0 12 9 16
80 8,0 6,0 48 64 36
92 2,0 2,0 4 4 4
å 65 65 473 481 475
n å xi y i - (å x i )(
. å yi )
r=
[nå x 2
i
2
][
- (å xi ) . n å y i2 - (å y i )
2
]
(10 x 473) - (65 x 65)
r=
[10 x481 - (65) ]x[10 x475 - (65) ]
2 2
(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que
Exercícios
1)Complete o esquema de cálculo do coeficiente de correlação para os valores das
variáveis xi e y i :
xi 4 6 8 10 12
yi 12 10 8 12 14
Temos:
xi yi xi . y i x i2 yi2
4 12 48 16 144
........ ........ ........ ........ ........
........ ........ ........ ........ ........
........ ........ ........ ........ ........
12 14 168 144 196
Logo:
(........ x........) - (........ x........)
r=
[........ x........ - ........]x[........ x........ - ........]
........ - ........ ........ ........
r= = = = ........
[........ - ........]x[........ - ........] ........ x........ ........
Donde r = 0,42 . A correlação linear entre as variáveis x e y é positiva,
porém fraca.
10 6,0
12 5,7
14 5,3
17 5,2
19 5,0
22 4,7
25 4,5
5 70
10 40
20 27
30 22
40 18
50 16
60 15
70 14
80 13
90 12
Altura (cm) 145 150 125 157 127 140 132 107 155 145 140 142 130 135 138
Peso (kg) 31 32 33 25 26 28 29 30 31 35 34 33 32 28 30
Altura (cm) 140 150 157 144 145 147 150 152 150 160 149 150 129 130 140
Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as
alturas?
yi 13 14 18 15 22 17 24 22 24 25
Gabarito
1)Complete o esquema de cálculo do coeficiente de correlação para os valores das
variáveis xi e y i :
xi 4 6 8 10 12
yi 12 10 8 12 14
Temos:
xi yi xi . y i x i2 yi2
4 12 48 16 144
6 10 60 36 100
8 8 64 64 64
10 12 120 100 144
12 14 168 144 196
2300 - 2240 60 60
r= = = = 0,42
[1800 - 1600]x[3240 - 3136 ] 200 x104 144,22
Donde r = 0,42 . A correlação linear entre as variáveis x e y é positiva,
porém fraca.
19 5,0 95 361 25
5 70 350 25 4900
b)
(10 x7470 ) - ( 455 x 247 )
r=
[10 x28525 - (455) ]x[10 x9027 - (247 ) ]
2 2
(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que
(5) Conclusão: Como t cal > 2,0017 , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre o salário e o número de anos de escolaridade.
(5) Conclusão: Como t cal < 2,0017 , aceita-se H0, concluindo, com riso de 5%, que
não há correlação entre os testes raciocínio lógico e quantitativo e conhecimentos
gerais.
Peso (kg) 30 32 24 30 26 35 25 23 35 31 29 28 25 29 30
Altura (cm) 145 150 125 157 127 140 132 107 155 145 140 142 130 135 138
Peso (kg) 31 32 33 25 26 28 29 30 31 35 34 33 32 28 30
Altura (cm) 140 150 157 144 145 147 150 152 150 160 149 150 129 130 140
Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as
alturas?
Peso Altura Peso (x) Altura (y)
xi . y i x i2 yi2 xi . y i x i2 yi2
(x) (y)
(5) Conclusão: Como t cal > 2,0484 , rejeita-se H0, concluindo, com riso de 5%, que
yi 13 14 18 15 22 17 24 22 24 25
a)
b)
(10 x5069 ) - ( 245 x194) 50690 - 47530
r= =
[10 x6693 - (245) ]x[10 x3948 - (194 ) ]
2 2
[66930 - 60025]x[9480 - 37636 ]
3160 3160
r= = = 0,8856
6905 x1844 3568,308
c) Existe uma correlação positiva entre os testes x e y, significa que as variáveis
são diretamente proporcionais.
d) Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8
(3) Regiões de rejeição e aceitação para H0.
(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que