Você está na página 1de 13

Prudêncio Francisco Muxlhanga

Estatística II

Correlação e Regrassão Linear

Universidade São Tomás de Moçambique

Faculdade de Ciências Económicas e Empresariais

Xai-xai, Junho de 2021


Prudêncio Francisco Muxlhanga

Estatística II

Correlação e Regrassão Linear

Trabalho de investigação na cadeira de


Estatística II com o carácter avaliativo,
licenciatura em Gestão Financeira e
Bancária, sob a orientação de Docente:
Muzimba

Universidade São Tomás de Moçambique

Faculdade de Ciências Económicas e Empresariais

Xai-xai, Junho de 2021


Índice

1. Introdução.............................................................................................1
1.1. Delimitação do Estudo...................................................................2
1.2. Objectivo geral..............................................................................2
1.3. Objectivos específicos....................................................................2
1.4. Metodologia..................................................................................2
2. Correlação............................................................................................3
2.1. Coeciente de Correlação......................................................................3
2.2. Cálculo do coeciente de correlação de Pearson ................................3
2.3. Cálculo do coeciente de correlação de Spearman..............................4
2.4. Regressão Linear..................................................................................5
2.5. Regressão linear simples......................................................................6
2.6. Como serve a regressão linear simples...............................................6
2.7. Regressão múltipla...............................................................................6
2.8. Objetivos da regrassão múltipla.........................................................7
2.9. Coeficiente de determinação Múltiplo...............................................8
3. Conclusão..............................................................................................9
3.1. Bibliografia...........................................................................................10
1. Introdução

O presente trabalho visa falar do estudo da correlação e regreçao, tendo em conta que Ao se
estudar uma variável o interesse eram as medidas de tendência central, dispersão, Assimetria.
Com duas ou mais variáveis além destas medidas individuais também é de interesse conhecer
se elas tem algum relacionamento entre si, isto é, se valores altos (baixos) de uma das
variáveis implicam em valores altos (ou baixos) da outra variável.

Regressão é uma técnica que permite explorar e inferir a relação de uma variável dependente
(variável de resposta) com variáveis independentes específicas (variáveis explicatórias). A
análise da regressão pode ser usada como um método descritivo da análise de dados (como,
por exemplo, o ajustamento de curvas) sem serem necessárias quaisquer suposições acerca
dos processos que permitiram gerar os dados. Regressão designa também uma equação
matemática que descreva a relação entre duas ou mais variáveis. O método de estimação mais
amplamente utilizado é o método dos mínimos quadrados ordinários. Os principais problemas
que devem ser enfrentados em uma regressão são: multicolinearidade, heteroscedasticidade,
autocorreção, endogeneizado e atipicidade.

A associação entre duas variáveis poder ser de dois tipos: correlacional e experimental. Numa
relação experimental os valores de uma das variáveis são controlados pela atribuição ao acaso
do objeto sendo estudado e observando o que acontece com os valores da outra variável. Por
exemplo,pode-se atribuir dosagens casuais de uma certa droga e observar a resposta do
organismo; pode-seatribuir níveis de fertilizante ao acaso e observar as diferenças na
produção de uma determinada cultura. No relacionamento correlacional, por outro lado, não
se tem nenhum controle sobre as variáveis sendo estudadas. Elas são observadas como
ocorrem no ambiente natural, sem nenhuma interferência, isto é, as duas variáveis são
aleatórias
1.1. Delimitação do Estudo
 O presente trabalho limitar-se-á a apresentar Correlação e regressão linear

1.2. Objectivo geral


 Abordar como funciona a Correlação e regressão linear

1.3. Objectivos específicos


 Definir Correlação e regressão linear
 Desmostrar fórmulas
 Saber como calcular

1.4. Metodologia
A metodologia é a parte mais pertinente da pesquisa, uma vez que providência com detalhes,
os caminhos, procedimentos, técnicas e métodos seguidos para o alcance dos objectivos da
pesquisa. Falar da pesquisa científica, é falar de um conjunto de caminhos sistémicos e
racionais do ponto de vista.
2. Correlação

Signica uma semelhança ou relação entre duas coisas, pessoas ou ideias. É uma semelhança
ou equivalência que existe entre duas hipóteses, situações ou objetos diferentes.

No campo da estatística e da matemática a correlação se refere a uma medida entre duas ou


mais variáveis que se relacionam.

O termo correlação é um substantivo feminino que tem origem do latim correlatiōne.

A palavra correlação pode ser substituída por sinônimos como: relação, equiparação, nexo,
correspondência, analogia e conexão.

2.1. Coeciente de Correlação

na estatística o coeciente de correlação de Pearson (r), que também é chamado de coeciente


de correlação produto-momento, mede a relação que existe entre duas variáveis dentro de
uma mesma escala métrica.

A função do coeciente de correlação é determinar qual é a intensidade da relação que existe


entre conjuntos de dados ou informações conhecidas.

O valor do coeciente de correlação pode variar entre -1 e 1 e o resultado obtido dene se a


correlação é negativa ou positiva.

Para interpretar o coeciente é preciso saber que 1 signica que a correlação entre as variáveis é
perfeita positiva e -1 signica que é perfeita negativa. Se o coeciente for igual a 0 signica que
as variáveis não dependem uma da outra.

Na estatística também existe o coeciente de correlação Spearman, que tem esse nome em
homenagem ao estatístico Charles Spearman. A função desse coeciente é medir a intensidade
da relação entre duas variáveis, sendo elas lineares ou não.

A correlação Spearman serve para avaliar se a intensidade da relação entre as duas variáveis
analisadas pode ser medida por uma função monótona (função matemática que preserva ou
inverte a relação de ordem inicial

2.2. Cálculo do coeciente de correlação de Pearson

Cálculo do coeciente de correlação de Pearson utilizando a covariância e o desvio padrão.


n

S xy
∑ (xi −x)( y i− y)
i=1
r= = ¿

√∑ √∑
Sx S y n
2
n
2
(x i−x ) y i− y ¿
i=1 i=1

Onde:

S xy é a covariância;

S x e S y representam o desvio padrão, respectivamente, das variáveis x e y.

Neste caso, o cálculo passa por achar primeiro a covariância entre as variáveis, e o desvio
padrão de cada uma delas. Depois, divide-se a covariância pela multiplicação dos desvios
padrões.

Muitas vezes, o enunciado já fornece ou os desvios padrões das variáveis, ou a covariância


entre elas, bastando só aplicar a fórmula.

2.3. Cálculo do coeciente de correlação de Spearman

O cálculo do coeciente de correlação de Spearman é um pouco diferente. Para isso


precisamos de organizar os nossos dados na seguinte tabela.

Dados A Dados B Classificação A Classificação B d d2

1 . Tendo no enunciado 2 pares de dados, devemos introduzi-los na tabela.

Por exemplo.

Dados A Dados B Classificação A Classificação B d d2


7 8
6 3
1 2
4 5

2. Na coluna “Classificação A” vamos classicar as observações que estão em “Dados A” de


forma crescente, sendo “1” o valor mais baixo da coluna, e n (número total de observações) o
valor mais alto da coluna “Dados A”.

Dados A Dados B Classificação A Classificação B d d2


7 8 4
6 3 3
1 2 1
4 5 2
3. Fazemos o mesmo para obter a coluna “Classificação B”, utilizando agora as observações
da coluna “Dados B”.

Dados A Dados B Classificação A Classificação B d d2


7 8 4 4
6 3 3 2
1 2 1 1
4 5 2 3

4. Na coluna “d” colocamos a diferença entre as duas Classificaçoes (A e B). Aqui o sinal
não importa.

Dados A Dados B Classificação A Classificação B d d2


7 8 4 4 0
6 3 3 2 1
1 2 1 1 0
4 5 2 3 1

5. Elevar ao quadrado cada um dos valores da coluna “d” e registrar na coluna d²:

Dados A Dados B Classificação A Classificação B d d2


7 8 4 4 0 02=0
6 3 3 2 1 12=1
1 2 1 1 0 02=0
4 5 2 3 1 12=1

6. Somar todos os dados da coluna "d²". Esse valor é Σd². No nosso exemplo Σd² = 0+1+0+1
=2

7. Agora utilizamos a fórmula de Spearman

1−¿

No nosso caso, n é igual a 4, pois olhamos para quantidade de linhas de dados (que
corresponde ao número de observações).

8. Finalmente, substituímos os dados na fórmula anterior:


1−¿ = 1−¿

2.4. Regressão Linear

A regressão linear é uma metodologia desenvolvida a partir da estatística e da econometria.


Este método serve para avaliar os efeitos que outras variáveis causam sobre uma variável
analisada.

É chamada "linear" porque se considera que a relação da resposta às variáveis é uma função
linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos
parâmetros se chamam modelos de regressão não- linear. Sendo uma das primeiras formas de
análise regressiva a ser estudada rigorosamente, é usada extensamente em aplicações práticas.
Isso acontece porque modelos que dependem de forma linear dos seus parâmetros
desconhecidos, são mais fáceis de ajustar que os modelos não-lineares aos seus parâmetros, e
porque as propriedades estatísticas dos estimadores resultantes são fáceis de determinar.

A relação parte de uma variável de interesse (dependente) com outras que a possam
inuenciar. Por exemplo: analisar a venda de um produto relacionada ao crescimento
populacional de um país.

Com os resultados obtidos, a regressão linear visualiza as maiores tendências que as variáveis
analisadas apresentam. A regressão consiste em modelar, estatisticamente, os valores que se
quer observar.

Esta regressão é linear quando os acontecimentos observados em um gráco de dispersão


indicam uma tendência em um formato de linha reta, como na imagem a seguir:

10

9
*Dados observados
8
Regressão Linear
7

0 0 1 2 3 4
A análise de regressão é mais útil quando apresentada em um diagrama de dispersão, muito
utilizados na economia, administração de empresas, ou também para os dados de um país.

Quando os acontecimentos não estão combinados em forma linear cam conhecidos como
regressão não-linear e, gracamente, a tendência se apresenta em outros formatos.

2.5. Regressão linear simples

A regressão linear é simples quando são analisadas apenas duas variáveis, normalmente X e
Y, sendo que uma é dependente (Y) e será a função de outra que se comporta independente

(X).

A regressão linear simples é analisada através da fórmula:

Y= α + βX

Em que: "α" é o coeciente linear e "β" é o coeciente angular ou de regressão.

Este cálculo pode ser feito apenas se existir uma relação linear entre X e Y e conterem a
mesma quantidade de elementos que se relacionam.

Nos casos em que existem mais do que duas variáveis passa a se chamar regressão linear
múltipla e a demonstração visual a partir de um gráfico se torna mais complexa.

Um exemplo muito conhecido na Economia para regressão linear é a Lei de Okun, que
relaciona negativamente o crescimento do PIB de um país com as suas taxas de desemprego.
Conheça este exemplo em nosso artigo sobre Econometria.

2.6. Como serve a regressão linear simples

O modelo de regressão serve para prever comportamentos com base na associação entre duas
variáveis que geralmente possuem uma boa correlação.

Se você quisesse apenas saber qual o grau de relação entre as variáveis, calcular o coeficiente
de Pearson seria suficiente

2.7. Regressão múltipla

A regressão múltipla é uma generalização da regressão simples, visto que, há mais de uma
variável explicativa no modelo.

Logo, o que determina se uma regressão é do tipo simples ou múltipla é o número de


variáveis explicativas no modelo. É comum encontrar alguns materiais se referir a regressão
do tipo polinomial como múltipla simplesmente por haver no modelo o termo de segundo
grau, terceiro grau, etc. Se há uma regressão com termos acima do de primeiro grau, mas a
variável explicativa continua sendo apenas uma, então temos uma regressão simples.

Existem também alguns materiais referindo a regressão múltipla como regressão


multivariada. O termo "multivariado", é utilizado em análises estatísticas quando ocorre mais
de uma variável resposta. Aliás, é o número de variáveis respostas que determina se a análise
é do tipo univariado ou multivariado.

2.8. Objetivos da regrassão múltipla

Estudar a relação funcional entre variáveis, sendo uma resposta e duas ou mais explicativas.

Estabelecer um modelo para entender a relação funcional entre as variáveis.

Fazer predições como o modelo ajustado principalmente para valores que não foram
observados na amostra.

2.9. Coeficiente de determinação Múltiplo

Tem a mesma interpretação e cálculo como no caso da regressão simples.

No entanto, utilizamos o maiúsculo para representar tal eficiência, uma vez que, não tem
relação direta com o coeficiente de correlação
3. Conclusão

O presente trabalho de pesquisa apresentou a definição de Correlação, e regressão linear


significa uma semelhança ou relação entre duas coisas, pessoas ou ideias. É uma semelhança
ou equivalência que existe entre duas hipóteses, situações ou objetos diferentes. No campo da
estatística e da matemática a correlação se refere a uma medida entre duas ou mais variáveis
que se relacionam, e a Correlação onde defini que  é o processo de traçar uma reta através
dos dados em um diagrama de dispersão. A reta resume esses dados, o que é útil quando
fazemos previsões.
3.1. Bibliografia

https://www.respondeai.com.br/conteudo/probabilidade-e-estatistica/estatistica/regressao-
linear/1226

https://pt.khanacademy.org/math/statistics-probability/describing-relationships-quantitative-
data/introduction-to-trend-lines/a/linear-regression-review

https://oestatistico.com.br/regressao-linear-simples/

Você também pode gostar