Escolar Documentos
Profissional Documentos
Cultura Documentos
Correlações
Cristiane da Silva
OBJETIVOS DE APRENDIZAGEM
Introdução
A maior parte dos problemas do nosso cotidiano envolve a interação entre
pelos menos duas variáveis. Medir a relação entre elas ajuda a compreender o
comportamento dos dados e o que essa relação significa. Para isso, utiliza-se
o coeficiente de correlação, que permite mensurar o grau de relacionamento
entre duas variáveis. Ao gerar um gráfico de dispersão, caso os pontos das
variáveis apresentem uma distribuição ao longo de uma reta imaginária, diz-se
que os dados apresentam uma correlação linear.
Uma medida para avaliar o grau e o sinal da correlação linear entre duas
variáveis (x, y) é dada pelo coeficiente de correlação linear de Pearson.
Essa medida é relevante nas mais diversas áreas do conhecimento. Pode haver
interesse, por exemplo, em saber se existe e como é a relação entre: i) o peso e
a altura dos indivíduos; ii) o preço do vinho e o montante da colheita em cada
ano; iii) a receita das vendas e os descontos fornecidos; iv) a renda e a despesa
das famílias. Entre tantas outras.
Neste capítulo, você vai conhecer o teste de correlação, os tipos e subtipos
de correlações existentes, bem como a utilidade de um teste de correlação.
Além disso, a resolução de problemas aplicados utilizando o teste de correlação
e os diagramas de dispersão permitirão avaliar cada situação particular.
2 Correlações
Idade Percentual
25 10,5
27 14,0
31 16,5
36 15,5
38 15,0
41 18,0
45 17,0
48 18,5
52 19,0
53 20,5
56 20,0
67 20,5
70 21,0
A inspeção visual desses dados significa que existe uma relação positiva
(direta) entre o percentual de gordura corporal (y) e a idade (x) dos homens
que fazem parte da amostra investigada. Também pode-se dizer que a relação
é linear. No entanto, apenas a inspeção visual não é suficiente. É necessária
uma forma mais objetiva de fazer essa análise, utilizando o coeficiente de
variação de Pearson.
Esse coeficiente foi elaborado para avaliar uma forma específica de relação
entre duas variáveis contínuas, que é o grau de relação linear existente entre
elas. Ele é conhecido como coeficiente de correlação de Pearson, coeficiente de
correlação produto-momento ou, simplesmente, r de Pearson (BLAIR; TAYLOR,
2013). O coeficiente de correlação é uma medida numérica da “força” da relação
ou associação entre duas variáveis quantitativas contínuas (MARTINEZ, 2015).
Existem diversas equações para o cálculo do r de Pearson, mas algebrica-
mente elas são todas idênticas (BLAIR; TAYLOR, 2013). Aqui vamos representar
o coeficiente de correlação de Pearson por meio da Equação 1:
(∑ )(∑ )
∑ −
= (1)
2 (∑ )2 2 (∑ )2
∑ − ∑ −
Correlações 5
Fêmur 38 56 59 64 74
Úmero 41 63 70 72 84
(∑ )(∑ )
∑ −
=
2 (∑ )2 2 (∑ )2
∑ − ∑ −
X Y XY X2 Y2
(Continuação)
X Y XY X2 Y2
(291)(330)
20040 −
= 5
84681 108900
17633 − 22790 −
5 5
20040 − 19206
=
[696,80][1010]
834
=
√703768
0,9941
Tipos de correlação
O coeficiente de correlação (r) assume valores que podem variar entre –1 e
+1. A partir dos valores e sinais observados para o coeficiente, definimos o
tipo de correlação e a sua intensidade. Valores negativos de r indicam uma
correlação do tipo inversa: na medida em que x aumenta, y em média diminui,
e vice-versa. Já valores positivos de r indicam uma correlação do tipo direta:
na medida em que x aumenta, y em média aumenta, e vice-versa (BALDI;
MOORE, 2014; CALLEGARI-JACQUES, 2003; VIEIRA, 2018).
Quando todos os pontos do diagrama de dispersão estiverem em uma
linha reta inclinada, significa que o valor de r será igual a –1 ou +1, o que se
denomina correlação perfeita. Observe a Figura 7, que evidencia essa situação
(BALDI; MOORE, 2014; CALLEGARI-JACQUES, 2003; VIEIRA, 2018).
–1 1
A B
0
Figura 8. Correlação nula.
Fonte: Adaptada de zizou7/Shutterstock.com.
A B
Figura 9. Correlações (a) r = 0,8 (maior correlação positiva) e (b) r = 0,6 (menor correlação
positiva).
Fonte: Adaptada de Callegari-Jacques (2003).
Nos casos em que os pontos formam uma nuvem cujo eixo principal é uma
curva, o valor de r não mede corretamente a associação entre as variáveis.
Isso ocorre porque a técnica para calcular esse coeficiente supõe que os
pontos do gráfico formam nuvens elípticas, cujo eixo principal é uma reta.
Observe a Figura 10.
Correlações 11
0 nula
0 — 0,3 fraca
1 plena/perfeita
Exemplo 1
Ao calcular o coeficiente de correlação para os percentuais de gordura corporal
de homens conforme a idade, chegamos ao resultado apresentado na Figura 11.
Exemplo 2
Ao analisar o coeficiente de correlação entre o fêmur (osso da perna) e o úmero
(osso da parte superior do braço) do Archaeopteryx, chegamos ao resultado
apresentando na Figura 12.
Exemplo 3
Considere que o preço de duas ações é registrado no fechamento todas as
sextas-feiras durante oito semanas, como mostra o Quadro 3.
14 Correlações
Empresa 1 2 3 4 5 6 7 8
Pela Figura 13 podemos observar que os preços dessas duas ações tendem a
caminhar em direções opostas. Para nos certificarmos do que está ocorrendo,
calculamos o coeficiente de variação de Pearson, como mostra a Figura 14.
Correlações 15
Referências
BALDI, B.; MOORE, D. S. A prática da estatística nas ciências da vida. 2. ed. Rio de
Janeiro: LTC, 2014.
BLAIR, R. C.; TAYLOR, R. A. Bioestatística para ciências da saúde. São Paulo: Pearson, 2013.
CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed,
2003.
DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed.
Porto Alegre: AMGH, 2014.
MARTINEZ, E. Z. Bioestatística para os cursos de graduação da área da saúde. São
Paulo: Blucher, 2015.
RAUPP, C. A. F. Método quantitativo com o uso de software. São Leopoldo: Unisinbos, 2013.
VIEIRA, S. Estatística básica. 2. ed. São Paulo: Cengage, 2018.