Você está na página 1de 15

Universidade Aberta Isced

Faculdade de Ciências de Educação

Curso de Licenciatura em Ensino de Matemática

Coeficiente de Correlação de Pearson

Paulo Narciso Novele: 31220341

Xai-Xai, Maio de 2023


Universidade Aberta Isced

Departamento de Ciências de Educação

Curso de Licenciatura em Ensino de Matemática

Coeficiente de Correlação de Pearson

Trabalho de Campo a ser


submetido na Coordenação do
Curso de Licenciatura em Ensino de
Matemática da UnISCED.
Tutor: Jossias Arnaldo Vilanculo

Paulo Narciso Novele: 31220341

Xai-Xai, Maio de 2023


Índice
1 INTRODUÇÃO..................................................................................................................5

1.1 OBJECTIVOS:.............................................................................................................5

1.1.1 Geral:.....................................................................................................................5

1.1.2 Específicos:...........................................................................................................5

1.2 METODOLOGIA........................................................................................................5

2 Resolução do Problema.......................................................................................................6

2.1 Exercício:.....................................................................................................................6

2.1.1 Determinação ou investigação da relação entre o número de filhos de um casal e


o nível académico da esposa...............................................................................................6

2.1.2 Cálculo do coeficiente de correlação linear de Pearson (r)...................................8

2.1.3 Significância estatística do coeficiente calculado...............................................16

3 Considerações Finais........................................................................................................18

4 Referencias Bibliográficas................................................................................................19

5 ANEXO.............................................................................................................................14

iii
Índice de Figuras

Figura 1: Representação do valor calculado do coeficiente de linear de Pearson (r) na recta…8

Figura 2: Gráfico da distribuição normal das variáveis estudadas……………………………11

Índice de Tabelas

Tabela 1: Resumo dos cálculos das variáveis X e Y………………………………………….6

Tabela 2: Valores críticos do coeficiente de correlação de Pearson………………………….14

Tabela 3: Valores da distribuição t de Student…………………………………………....…15

Índice de Gráficos

Gráfico 1: Nuvem da relação Linear entre as variáveis………………………………………8

Gráfico 2: Representação linear da relação das variáveis…………………………………….9

iv
1 INTRODUÇÃO
A regressão e a correlação linear são técnicas destinadas a estudar o relacionamento entre
duas variáveis. Estas relações além de serem importantes são fáceis de serem interpretadas e
podem ser aplicadas em muitos estudos da vida real. Quando se deseja estudar o
comportamento simultâneo de duas ou mais variáveis, emprega-se a análise de Regressão e a
de Correlação para avaliação da informação desejada. A correlação que às vezes se confunde
com regressão, estuda o grau em que duas ou mais variáveis variam simultaneamente. Isto é,
o grau de inter-relacionamento entre as variáveis. O coeficiente de correlação de Pearson não
tem esse nome por acaso. Foi proposto por Karl Pearson em 1896 “coeficiente de correlação
de Pearson (r)”, usado para medir a intensidade da associação linear existente entre duas
variáveis quantitativas (Rodrigues 2016/17).
O objectivo desse trabalho é determinar a relação entre o número de filhos dum casal e o nível
académico da esposa a partir de uma análise de correlação linear, fazendo o cálculo do
coeficiente de correlação de Pearson (r) de acordo com as suas propriedades.

1.1 OBJECTIVOS:

1.1.1 Geral:
 Determinar a relação entre o número de filhos de um casal e o nível académico da
esposa, usando o coeficiente de correlação de Pearson.

1.1.2 Específicos:
 Apresentar os dados para a análise de correlação;
 Fazer a análise dos dados;
 Calcular o coeficiente de correlação;
 Fazer o teste de significância estatística do coeficiente correlação calculado.

1.2 METODOLOGIA
Para a realização do presente trabalho baseou-se na revisão de literaturas, ou seja, pesquisa
bibliográfica de trabalhos feitos por vários autores sobre a correlação linear e o coeficiente de
Pearson. Apresentado o método de cálculo do coeficiente de correlação Pearson.

5
2 Resolução do Problema

2.1 Exercício:
Usando o Coeficiente de Correlação de Pearson investigue a relação entre o número de filhos
de um casal e o nível académico da esposa. Use a escala seguinte para quantificar o nível
académico: Elementar -5, Básico -7, Médio -12 e Superior -20. O número de entrevistados
deverá ser entre 30 a 35 pessoas adultas.

2.1.1 Determinação ou investigação da relação entre o número de filhos de um casal e o


nível académico da esposa
Para que pudesse se investigar o grau e magnitude da relação entre o número de filhos de um
casal e o nível académico da esposa, primeiramente teve que se obter um grupo amostral para
avaliar-se, onde foram inqueridos (entrevistados) casais de pessoas adultas aleatoriamente
num universo de 35 casais entrevistados. Tendo-se obtido o grupo alvo (amostra) a avaliar,
seguiu-se com os procedimentos para avaliação da correlação, organizando-se os dados numa
tabela na ordem das entrevistas e calculando os valores das variáveis X 2, Y2 e XY, assim
como, os seus somatórios. As variáveis X e Y representam o número de filhos do casal e nível
académico da esposa respectivamente. A seguir apresenta-se a tabela com os valores das
variáveis calculadas:

Tabela 1: Resumo dos cálculos das variáveis X e Y.

Observações X Y X2 Y2 XY
1 3 5 9 25 15
2 5 7 25 49 35
3 5 7 25 49 35
4 3 5 9 25 15
5 6 5 36 25 30
6 8 7 64 49 56
7 2 5 4 25 10
8 7 5 49 25 35
9 6 7 36 49 42
10 4 5 16 25 20
11 5 12 25 144 60
12 6 7 36 49 42
13 5 7 25 49 35
14 6 5 36 25 30
15 7 7 49 49 49
16 6 5 36 25 30
17 8 7 64 49 56
6
18 6 5 36 25 30
19 3 7 9 49 21
20 9 5 81 25 45
21 7 5 49 25 35
22 5 7 25 49 35
23 4 7 16 49 28
24 3 5 9 25 15
25 6 7 36 49 42
26 7 7 49 49 49
27 4 20 16 400 80
28 5 7 25 49 35
29 6 5 36 25 30
30 8 5 64 25 40
31 7 5 49 25 35
32 9 7 81 49 63
33 6 5 36 25 30
34 8 7 64 49 56
35 7 5 49 25 35
2 2
n = 35 ∑x=202 ∑y=229 ∑x =1238 ∑y =1753 ∑xy=1299

Depois de elaborar a tabela e calcular os somatórios das variáveis X e Y, procedeu o cálculo


do coeficiente de correlação linear de Pearson (r) pela fórmula encontrada em TRIOLA
(Elementary Statistics, 11th Edition).

n ( Σ xy )−( Σ x )( Σ y )
r=
√ n ( Σ x ) −¿ ¿ ¿
2

Mas antes analisou-se os dados para garantir os requisitos para o caso de teste de hipótese,
gerando um gráfico de dispersão dos dados com a planilha do Excel através do qual foi
possível avaliar os requisitos. Feito isso, elaboraram-se as hipóteses estatísticas da pesquisa e
o intervalo de confiança escolhido foi o de 95% com alfa igual a 0,05.

Da análise feita nos dados, foram satisfeitos dois dos requisitos necessários e observou-se a
existência de dois outliers (valores superiores que a maioria dos valores da colecção) no
gráfico de dispersão. Realizou-se a análise de correlação com a existência dos valores atípicos
nos dados porque o universo escolhido para a amostra no estudo foi de 35 entrevistados e não
era possível fazer mais entrevistas, também porque os outliers não eram significativos. A
seguir é apresentado o gráfico de dispersão da análise dos dados da pesquisa:

7
25

20

Nivel academico da esposa 15

10 Series2

0
1 2 3 4 5 6 7 8 9 10
Numero de filhos

Gráfico 1: Nuvem da relação Linear entre as variáveis.

2.1.2 Cálculo do coeficiente de correlação linear de Pearson (r)


Dados Fórmula

n ( Σ xy )−( Σ x )( Σ y )
n = 35 r=
√ n ( Σ x ) −¿ ¿ ¿
2

∑X = 202 r =¿

∑Y = 229 r =−0,167

∑X2 = 1238

∑Y2 = 1753

∑XY = 1299

r =?

Figura 1: Representação do valor calculado do coeficiente de linear de Pearson (r) na recta.

Realizado o cálculo e representado o valor do coeficiente de correlação linear de Pearson na


recta graduada no intervalo de -1 a 1, valores em que é avaliada a correlação, também foi

8
representado o valor crítico do r para n = 35 e a = 0,05. O valor do coeficiente de correlação
obtido foi de -0,167, menor que o valor encontrado na tabela de valores críticos do coeficiente
de correlação de Pearson, representados na recta da figura 7 demostrada acima e que indica
uma correlação negativa fraca, que pode se observar no gráfico abaixo representando a recta
da relação linear das variáveis estudadas.

25

20
Nivel academico da esposa

15

10 Series2
Linear (Series2)

0
1 2 3 4 5 6 7 8 9 10
Numero de filhos

Gráfico 2: Representação linear da relação das variáveis.

Resposta: De acordo com a análise de correlação feita há evidencias para concluir-se que há
uma correlação negativa fraca entre o número de filhos de um casal e o nível académico da
esposa, pois o valor do coeficiente de correlação é negativo e encontra-se no intervalo de 0 a
0,3 que é de intensidade fraca, de acordo com RODRIGUES (2016/17).

2.1.3 Significância estatística do coeficiente calculado


Para saber se o coeficiente de correlação calculado é significativo, realizou-se o teste de
hipóteses aplicando o teste t-student.

I. Hipóteses:
 H0: A correlação entre o número de filhos de um casal e nível académico da esposa é
nula (ρ = 0);
 H1: A correlação entre o número de filhos de um casal e nível académico da esposa
não é nula (ρ ≠ 0).
II. Nível de significância

O teste foi realizado a 95% de significância: a = 0,05

9
III. Determinação do valor t calculado

Segundo (SELAU) a hipótese da existência de uma relação entre X e Y pode ser verificada
directamente a partir do valor amostral do coeficiente de correlação. Assim, a hipótese nula
será rejeitada se o valor t calculado for maior que o tabelado:

|t |>t c

Dados Fórmula

r √ n−2
n = 35 t= 2
√ 1−r

−0,167∗√35−2
r = -0,167 t=
√1−¿ ¿ ¿
t =? t=−0,973

IV. Valor tabelado de t

t c =t a/ 2 ;n−2

a = 0,05; v = n-2 = 33

Na tabela dos valores da distribuição t de Student, não é encontrado o valor para o grau de
liberdade 33 achado no exercício. Para se obter o valor tabelado ou uma estimativa, será feita
uma interpolação.

Interpolação

30 2,042

33 X

35 2,030

30−33 30−35 −3 −5 −3
= ⇔ = ⇔ =−416 ,67
2,042−x 2,042−2,030 2,042−x 0,012 2,042−x

−3=−416 , 67 ( 2,042−x ) ⇔−3=−850 , 84+ 416 , 67 x ⇔−3+850 , 84=416 , 67 x

847 ,84
847 , 84=416 , 67 x ⇔ x = ⇔ x=2,035
416 , 67

10
|−0,973|<t 0,025;33=2,035

Figura 2: Gráfico da distribuição normal das variáveis estudadas.

De acordo com o resultado obtido há evidencias para aceitar a hipótese nula, o valor de t
calculado é menor que o tabelado.

Conclusão: Aceita-se a hipótese nula (H 0), isto é, a 5% de significância, pode se afirmar que
o número de filhos de um casal e o nível académico da esposa não deve estar correlacionado
com a de estatística, ou seja, Pode haver correlação negativa fraca e estatisticamente não
significante.

Nota: As tabelas dos valores críticos do coeficiente de correlação de Pearson (r) e t da


distribuição t de Student, usadas no auxílio da resolução do exercício, ou seja, no estudo da
correlação das variáveis, constam dos anexos.

3 Considerações Finais
Correlação é o estudo do grau de associação entre variáveis. Na correlação interessa observar
se duas ou mais variáveis são independentes ou variam juntas. CHEN & POPOVIC (2002:
pag 09, citados por FILHO & JÚNIOR 2009), afirmam que estima-se que o coeficiente de
correlação de Pearson e suas derivações são escolhidos em 95% dos casos para descrever o
11
padrão de relacionamento entre variáveis ou para fazer inferências válidas para a população a
partir de dados amostrais. Por outro lado, CARROLL (1961 também citado por FILHO &
JÚNIOR 2009) diz que o coeficiente de correlação é geralmente utilizado de forma
inapropriada. Por tanto, conclui-se que a correlação é um método estatístico usado para
pesquisar a associação entre duas variáveis quantitativas sendo o coeficiente de correlação de
Pearson (r) usado para determinar a relação linear entre as variáveis em análise, e este varia
entre os valores de -1 a 1, com o sinal indicando a direcção/sentido e valor a magnitude da
correlação, sendo possível observar-se por meio de um gráfico de dispersão e pela recta da
relação linear entre as variáveis. Com tudo, a correlação do número de filhos de um casal e o
nível académico da esposa investigado através do coeficiente de correlação de Pearson (r)
revelou que há evidencias para afirmar que existe uma correlação negativa fraca, pois o
resultado do coeficiente de correlação calculado foi de -0,167 estando no intervalo de 0 a 0,3
que é classificado de intensidade fraca, assim como, o seu sinal é negativo indicando uma
relação negativa o que se observou pelo gráfico da recta de relação linear entre essas variáveis
que é decrescente. Por fim, constatou-se que o valor calculado do coeficiente de correlação
não é estatisticamente significativo pois o valor tabelado de t é maior que o t calculado,
aceitando-se a hipótese nula, concluindo que estatisticamente não há relação entre o número
de filhos de um casal e o nível académico da esposa.

4 Referencias Bibliográficas
AULA 4. CORRELAÇÃO LINEAR. Cap. 7 -Métodos Estatísticos para Geografia.
Sem ano de publicação

12
AULA 10. BIOESTATÍSTICA. CORRELAÇÃO LINEAR: Tipos de Correlação.
Regressão Linear Pelo Estudo Da Correlação E Utilizando Os Mínimos Quadrados.
Sem ano de publicação
BARBETTA, P. A. - Estatística aplicada às Ciências Sociais. 7 ed. Florianópolis:
Editora da UFSC, 2010
FARIAS, A. L. M; & LAURENCEL, L. C. ESTATÍSTICA DESCRITIVA.
Universidade Federal Fluminense, Centro De Estudos Gerais, Instituto De
Matemática: Departamento De Estatística. Agosto de 2008.
FILHO, D. B. F. & JÚNIOR, J. A. S. Desvendando Os Mistérios Do Coeficiente De
Correlação De Pearson (r). Revista Política Hoje, Vol. 18, n. 1, 2009.
GARSON, G. David. Statnotes: Topics in Multivariate Analysis, (2009). Disponível
em: http://faculty.chass.ncsu.edu/garson/PA765/statnote.htm
GUIMARÃES, P. R. B. Análise de Correlação e medidas de associação. Sem ano de
publicação
MARTINS, M. E. G. COEFICIENTE DE CORRELAÇÃO AMOSTRAL. Revista de
Ciência Elementar, Volume 2 | Número 2:0069, 2014.
MOORE, David S. The Basic Practice of Statistics. New York, Freeman. (2007)
RODRIGUES, Inês. INFERÊNCIA ESTATÍSTICA: Correlação e Regressão.
UNIVERSIDADE DO ALGARVE: Escola Superior De Saúde. Licenciatura em
Ciências Biomédicas Laboratoriais. AULA 8, Investigação Aplicada I. 1º Semestre
2016/17.
SELAU, Lisiane. INFERÊNCIA ESTATÍSTICA: Correlação E Regressão.
COEFICIENTE DE CORRELAÇÃO - Regressão Linear Simples. Sem ano de
publicação
TRIOLA, M. F. Correlação e Regressão. UNIVERSIDADE DE SÃO PAULO.
Elementary Statistics, 11th Edition. Sem ano de publicação

5 ANEXO
Tabela 2: Valores críticos do coeficiente de correlação de Pearson (TRIOLA 11th Edition).

13
Tabela 3: Valores da distribuição t de Student (BARBETTA 2010).

14
15

Você também pode gostar