Escolar Documentos
Profissional Documentos
Cultura Documentos
1.1 OBJECTIVOS:.............................................................................................................5
1.1.1 Geral:.....................................................................................................................5
1.1.2 Específicos:...........................................................................................................5
1.2 METODOLOGIA........................................................................................................5
2 Resolução do Problema.......................................................................................................6
2.1 Exercício:.....................................................................................................................6
3 Considerações Finais........................................................................................................18
4 Referencias Bibliográficas................................................................................................19
5 ANEXO.............................................................................................................................14
iii
Índice de Figuras
Índice de Tabelas
Índice de Gráficos
iv
1 INTRODUÇÃO
A regressão e a correlação linear são técnicas destinadas a estudar o relacionamento entre
duas variáveis. Estas relações além de serem importantes são fáceis de serem interpretadas e
podem ser aplicadas em muitos estudos da vida real. Quando se deseja estudar o
comportamento simultâneo de duas ou mais variáveis, emprega-se a análise de Regressão e a
de Correlação para avaliação da informação desejada. A correlação que às vezes se confunde
com regressão, estuda o grau em que duas ou mais variáveis variam simultaneamente. Isto é,
o grau de inter-relacionamento entre as variáveis. O coeficiente de correlação de Pearson não
tem esse nome por acaso. Foi proposto por Karl Pearson em 1896 “coeficiente de correlação
de Pearson (r)”, usado para medir a intensidade da associação linear existente entre duas
variáveis quantitativas (Rodrigues 2016/17).
O objectivo desse trabalho é determinar a relação entre o número de filhos dum casal e o nível
académico da esposa a partir de uma análise de correlação linear, fazendo o cálculo do
coeficiente de correlação de Pearson (r) de acordo com as suas propriedades.
1.1 OBJECTIVOS:
1.1.1 Geral:
Determinar a relação entre o número de filhos de um casal e o nível académico da
esposa, usando o coeficiente de correlação de Pearson.
1.1.2 Específicos:
Apresentar os dados para a análise de correlação;
Fazer a análise dos dados;
Calcular o coeficiente de correlação;
Fazer o teste de significância estatística do coeficiente correlação calculado.
1.2 METODOLOGIA
Para a realização do presente trabalho baseou-se na revisão de literaturas, ou seja, pesquisa
bibliográfica de trabalhos feitos por vários autores sobre a correlação linear e o coeficiente de
Pearson. Apresentado o método de cálculo do coeficiente de correlação Pearson.
5
2 Resolução do Problema
2.1 Exercício:
Usando o Coeficiente de Correlação de Pearson investigue a relação entre o número de filhos
de um casal e o nível académico da esposa. Use a escala seguinte para quantificar o nível
académico: Elementar -5, Básico -7, Médio -12 e Superior -20. O número de entrevistados
deverá ser entre 30 a 35 pessoas adultas.
Observações X Y X2 Y2 XY
1 3 5 9 25 15
2 5 7 25 49 35
3 5 7 25 49 35
4 3 5 9 25 15
5 6 5 36 25 30
6 8 7 64 49 56
7 2 5 4 25 10
8 7 5 49 25 35
9 6 7 36 49 42
10 4 5 16 25 20
11 5 12 25 144 60
12 6 7 36 49 42
13 5 7 25 49 35
14 6 5 36 25 30
15 7 7 49 49 49
16 6 5 36 25 30
17 8 7 64 49 56
6
18 6 5 36 25 30
19 3 7 9 49 21
20 9 5 81 25 45
21 7 5 49 25 35
22 5 7 25 49 35
23 4 7 16 49 28
24 3 5 9 25 15
25 6 7 36 49 42
26 7 7 49 49 49
27 4 20 16 400 80
28 5 7 25 49 35
29 6 5 36 25 30
30 8 5 64 25 40
31 7 5 49 25 35
32 9 7 81 49 63
33 6 5 36 25 30
34 8 7 64 49 56
35 7 5 49 25 35
2 2
n = 35 ∑x=202 ∑y=229 ∑x =1238 ∑y =1753 ∑xy=1299
n ( Σ xy )−( Σ x )( Σ y )
r=
√ n ( Σ x ) −¿ ¿ ¿
2
Mas antes analisou-se os dados para garantir os requisitos para o caso de teste de hipótese,
gerando um gráfico de dispersão dos dados com a planilha do Excel através do qual foi
possível avaliar os requisitos. Feito isso, elaboraram-se as hipóteses estatísticas da pesquisa e
o intervalo de confiança escolhido foi o de 95% com alfa igual a 0,05.
Da análise feita nos dados, foram satisfeitos dois dos requisitos necessários e observou-se a
existência de dois outliers (valores superiores que a maioria dos valores da colecção) no
gráfico de dispersão. Realizou-se a análise de correlação com a existência dos valores atípicos
nos dados porque o universo escolhido para a amostra no estudo foi de 35 entrevistados e não
era possível fazer mais entrevistas, também porque os outliers não eram significativos. A
seguir é apresentado o gráfico de dispersão da análise dos dados da pesquisa:
7
25
20
10 Series2
0
1 2 3 4 5 6 7 8 9 10
Numero de filhos
n ( Σ xy )−( Σ x )( Σ y )
n = 35 r=
√ n ( Σ x ) −¿ ¿ ¿
2
∑X = 202 r =¿
∑Y = 229 r =−0,167
∑X2 = 1238
∑Y2 = 1753
∑XY = 1299
r =?
8
representado o valor crítico do r para n = 35 e a = 0,05. O valor do coeficiente de correlação
obtido foi de -0,167, menor que o valor encontrado na tabela de valores críticos do coeficiente
de correlação de Pearson, representados na recta da figura 7 demostrada acima e que indica
uma correlação negativa fraca, que pode se observar no gráfico abaixo representando a recta
da relação linear das variáveis estudadas.
25
20
Nivel academico da esposa
15
10 Series2
Linear (Series2)
0
1 2 3 4 5 6 7 8 9 10
Numero de filhos
Resposta: De acordo com a análise de correlação feita há evidencias para concluir-se que há
uma correlação negativa fraca entre o número de filhos de um casal e o nível académico da
esposa, pois o valor do coeficiente de correlação é negativo e encontra-se no intervalo de 0 a
0,3 que é de intensidade fraca, de acordo com RODRIGUES (2016/17).
I. Hipóteses:
H0: A correlação entre o número de filhos de um casal e nível académico da esposa é
nula (ρ = 0);
H1: A correlação entre o número de filhos de um casal e nível académico da esposa
não é nula (ρ ≠ 0).
II. Nível de significância
9
III. Determinação do valor t calculado
Segundo (SELAU) a hipótese da existência de uma relação entre X e Y pode ser verificada
directamente a partir do valor amostral do coeficiente de correlação. Assim, a hipótese nula
será rejeitada se o valor t calculado for maior que o tabelado:
|t |>t c
Dados Fórmula
r √ n−2
n = 35 t= 2
√ 1−r
−0,167∗√35−2
r = -0,167 t=
√1−¿ ¿ ¿
t =? t=−0,973
t c =t a/ 2 ;n−2
a = 0,05; v = n-2 = 33
Na tabela dos valores da distribuição t de Student, não é encontrado o valor para o grau de
liberdade 33 achado no exercício. Para se obter o valor tabelado ou uma estimativa, será feita
uma interpolação.
Interpolação
30 2,042
33 X
35 2,030
30−33 30−35 −3 −5 −3
= ⇔ = ⇔ =−416 ,67
2,042−x 2,042−2,030 2,042−x 0,012 2,042−x
847 ,84
847 , 84=416 , 67 x ⇔ x = ⇔ x=2,035
416 , 67
10
|−0,973|<t 0,025;33=2,035
De acordo com o resultado obtido há evidencias para aceitar a hipótese nula, o valor de t
calculado é menor que o tabelado.
Conclusão: Aceita-se a hipótese nula (H 0), isto é, a 5% de significância, pode se afirmar que
o número de filhos de um casal e o nível académico da esposa não deve estar correlacionado
com a de estatística, ou seja, Pode haver correlação negativa fraca e estatisticamente não
significante.
3 Considerações Finais
Correlação é o estudo do grau de associação entre variáveis. Na correlação interessa observar
se duas ou mais variáveis são independentes ou variam juntas. CHEN & POPOVIC (2002:
pag 09, citados por FILHO & JÚNIOR 2009), afirmam que estima-se que o coeficiente de
correlação de Pearson e suas derivações são escolhidos em 95% dos casos para descrever o
11
padrão de relacionamento entre variáveis ou para fazer inferências válidas para a população a
partir de dados amostrais. Por outro lado, CARROLL (1961 também citado por FILHO &
JÚNIOR 2009) diz que o coeficiente de correlação é geralmente utilizado de forma
inapropriada. Por tanto, conclui-se que a correlação é um método estatístico usado para
pesquisar a associação entre duas variáveis quantitativas sendo o coeficiente de correlação de
Pearson (r) usado para determinar a relação linear entre as variáveis em análise, e este varia
entre os valores de -1 a 1, com o sinal indicando a direcção/sentido e valor a magnitude da
correlação, sendo possível observar-se por meio de um gráfico de dispersão e pela recta da
relação linear entre as variáveis. Com tudo, a correlação do número de filhos de um casal e o
nível académico da esposa investigado através do coeficiente de correlação de Pearson (r)
revelou que há evidencias para afirmar que existe uma correlação negativa fraca, pois o
resultado do coeficiente de correlação calculado foi de -0,167 estando no intervalo de 0 a 0,3
que é classificado de intensidade fraca, assim como, o seu sinal é negativo indicando uma
relação negativa o que se observou pelo gráfico da recta de relação linear entre essas variáveis
que é decrescente. Por fim, constatou-se que o valor calculado do coeficiente de correlação
não é estatisticamente significativo pois o valor tabelado de t é maior que o t calculado,
aceitando-se a hipótese nula, concluindo que estatisticamente não há relação entre o número
de filhos de um casal e o nível académico da esposa.
4 Referencias Bibliográficas
AULA 4. CORRELAÇÃO LINEAR. Cap. 7 -Métodos Estatísticos para Geografia.
Sem ano de publicação
12
AULA 10. BIOESTATÍSTICA. CORRELAÇÃO LINEAR: Tipos de Correlação.
Regressão Linear Pelo Estudo Da Correlação E Utilizando Os Mínimos Quadrados.
Sem ano de publicação
BARBETTA, P. A. - Estatística aplicada às Ciências Sociais. 7 ed. Florianópolis:
Editora da UFSC, 2010
FARIAS, A. L. M; & LAURENCEL, L. C. ESTATÍSTICA DESCRITIVA.
Universidade Federal Fluminense, Centro De Estudos Gerais, Instituto De
Matemática: Departamento De Estatística. Agosto de 2008.
FILHO, D. B. F. & JÚNIOR, J. A. S. Desvendando Os Mistérios Do Coeficiente De
Correlação De Pearson (r). Revista Política Hoje, Vol. 18, n. 1, 2009.
GARSON, G. David. Statnotes: Topics in Multivariate Analysis, (2009). Disponível
em: http://faculty.chass.ncsu.edu/garson/PA765/statnote.htm
GUIMARÃES, P. R. B. Análise de Correlação e medidas de associação. Sem ano de
publicação
MARTINS, M. E. G. COEFICIENTE DE CORRELAÇÃO AMOSTRAL. Revista de
Ciência Elementar, Volume 2 | Número 2:0069, 2014.
MOORE, David S. The Basic Practice of Statistics. New York, Freeman. (2007)
RODRIGUES, Inês. INFERÊNCIA ESTATÍSTICA: Correlação e Regressão.
UNIVERSIDADE DO ALGARVE: Escola Superior De Saúde. Licenciatura em
Ciências Biomédicas Laboratoriais. AULA 8, Investigação Aplicada I. 1º Semestre
2016/17.
SELAU, Lisiane. INFERÊNCIA ESTATÍSTICA: Correlação E Regressão.
COEFICIENTE DE CORRELAÇÃO - Regressão Linear Simples. Sem ano de
publicação
TRIOLA, M. F. Correlação e Regressão. UNIVERSIDADE DE SÃO PAULO.
Elementary Statistics, 11th Edition. Sem ano de publicação
5 ANEXO
Tabela 2: Valores críticos do coeficiente de correlação de Pearson (TRIOLA 11th Edition).
13
Tabela 3: Valores da distribuição t de Student (BARBETTA 2010).
14
15