Você está na página 1de 12

Maria Lourenço A.

Ziza
Mário Carimo Batista
Rui Gimo
Rute Severino Jefure
Rosa Fernando João

Curso: Estatística e gestão de informações

Estatística descritiva

Tema: Correlação e regressão linear simples

Docente:
__________________________
(Msc. Cristina F. Chumussora da Costa)

UNIVERSIDADE LICUNGO - EXTENSÃO DODO


BEIRA
ÍNDICE
Introdução.................................................................................................................................... 3

Regressão Linear Simples ........................................................................................................... 4

Conceitos Fundamentais ............................................................................................................. 4

Interpretação dos Coeficientes: ................................................................................................... 6

Avaliação do Ajuste do Modelo .................................................................................................. 6

Aplicações da Regressão Linear Simples.................................................................................... 6

Análise De Correlação Linear ..................................................................................................... 6

Tipos de correlação ..................................................................................................................... 7

Exemplo: ..................................................................................................................................... 8

Conclusão .................................................................................................................................. 11

Referência bibliográfica ............................................................................................................ 12


Introdução
O presente trabalho tem como objetivo explorar os conceitos fundamentais da correlação e
regressão simples. Ambas as técnicas são essenciais na análise estatística, permitindo-nos
compreender a relação entre variáveis e realizar previsões com base em dados observados. Neste
trabalho, vamos abordar os conceitos básicos, o modelo de regressão linear e a interpretação dos
parâmetros, bem como o cálculo do coeficiente de correlação.

Na ciência dos dados e na análise estatística, entender a relação entre variáveis é crucial para
compreender fenômenos complexos e tomar decisões informadas. A correlação e a regressão são
ferramentas poderosas para investigar e quantificar essas relações. A correlação simples mede a
força e a direção da associação entre duas variáveis, enquanto a regressão linear busca modelar
essa relação por meio de uma equação matemática que descreve a linha de melhor ajuste entre os
dados. A regressão linear, especificamente, é uma técnica estatística amplamente utilizada para
entender como uma variável independente influencia uma variável dependente. No decorrer deste
trabalho, será demonstrado como calcular os parâmetros e interpretar seus significados em um
contexto prático. Além disso, exploraremos a correlação entre variáveis e sua importância na
análise estatística. Ao final deste trabalho, esperamos deixar uma compreensão mais sólida desses
conceitos.
Regressão Linear Simples
Na análise estatística, a regressão linear simples é uma ferramenta poderosa para compreender e
modelar a relação entre duas variáveis. Ela é particularmente útil quando queremos entender como
uma variável dependente é afetada por uma única variável independente. A Seguir trazemos os
fundamentos da regressão linear simples, seus princípios básicos e sua aplicação em diversos
contextos.

Conceitos Fundamentais
A regressão linear simples parte do princípio de que existe uma relação linear entre a variável
independente (x) e a variável dependente (y). Essa relação é representada por uma linha reta que
melhor se ajusta aos dados disponíveis. O objetivo é encontrar essa linha de melhor ajuste, que
minimize a diferença entre os valores observados e os valores previstos pela linha de regressão.

A regressão linear é utilizada para analisar, qualitativamente e quantitativamente, relações entre


variáveis. Chama-se de variável dependente ou variável endógena, (y), aquela cujo comportamento
será explicado pela variável (x), chamada de variável explicativa, regressor ou variável
independente. A ideia aqui é bastante simples; é, praticamente, estimar a equação de uma reta,

Tal equação é descrita como y = β0+β1⋅x.

O ponto central é, portanto, encontrar valores para β0 e β1. Em outras palavras, queremos estimar
a inclinação da reta utilizando uma amostra aleatória de dados de x e y. A inclinação nos fornece
o efeito em y da mudança de uma unidade em x.

Equação da Regressão Linear Simples: A equação geral da regressão linear simples é expressa
como: y =β0 + β1⋅x + ε

Onde:

 y é a variável dependente que desejamos prever,

 x é a variável independente que está sendo utilizada para prever y,


β0
 é o intercepto da linha de regressão, representando o valor esperado de y quando

x é igual a zero,

 β1 é o coeficiente de inclinação da linha de regressão, indicando a mudança


esperada em y para uma unidade de mudança em x,

 ε representa o erro aleatório, que são as diferenças entre os valores observados e


os valores previstos pela linha de regressão.

A reta de regressão depende de cinco estatísticas básicas:

Média De X

Desvio Padrao X

Media De Y

Desvio Padrão De Y

Correlação De X E Y

𝜷𝟏 𝒏 ∑ 𝒙𝒚 − (∑ 𝒙). (∑ 𝒚)
𝜷𝟏 =
𝒏 ∑ 𝒙𝟐 − (∑ 𝒙)𝟐
𝜷𝟎 o intercepto ∑𝒚 ∑𝒙
𝜷𝟎 = − 𝜷𝟏
𝒏 𝒏

Estimativa dos Coeficientes: O processo de ajuste da linha de regressão envolve estimar os


valores dos coeficientes β0 e β1 com base nos dados disponíveis. Isso é geralmente feito utilizando
técnicas como o método dos mínimos quadrados, que minimiza a soma dos quadrados das
diferenças entre os valores observados e os valores previstos.
Interpretação dos Coeficientes:
 O intercepto β0 representa o valor esperado de y quando x é igual a zero. Ele indica
onde a linha de regressão intercepta o eixo vertical.

 O coeficiente de inclinação β1 indica a mudança esperada em y para uma unidade


de mudança em x. Ele descreve a inclinação da linha de regressão.

Avaliação do Ajuste do Modelo


Uma vez ajustada a linha de regressão, é importante avaliar o quão bem o modelo se ajusta aos
dados. Isso pode ser feito através de diversas métricas, como o coeficiente de determinação (R2),
que indica a proporção da variabilidade na variável dependente que é explicada pelo modelo de
regressão.

Aplicações da Regressão Linear Simples


A regressão linear simples é amplamente utilizada em diversos campos, incluindo ciências sociais,
economia, biologia, medicina, engenharia e muito mais. Ela pode ser aplicada para fazer previsões,
identificar tendências, entender relações de causa e efeito e fazer inferências sobre o
comportamento de sistemas complexos.

Ao compreender os princípios básicos da regressão linear simples e suas aplicações, os analistas


de dados podem extrair conhecimentos valiosos a partir de conjuntos de dados unidimensionais e
tomar decisões embasadas em evidências.

Análise De Correlação Linear


A análise de correlação linear é uma medida de associação (ou dependência) entre variáveis.
Quando se tem apenas duas variáveis, trata-se de uma correlação linear simples (coeficiente de
correlação linear de Pearson, r); e quando se tem mais de duas variáveis, trata-se de uma
correlação múltipla (análise da matriz de correlação entre as variáveis: coeficiente de
correlação múltiplo (R múltiplo)).

Na análise de correlação pretende-se medir o grão de associação linear entre duas variáveis
aleatórias, enquanto na análise de regressão linear o interesse é estimar ou prever o valor medio de
uma variável aleatória com base nos valores fixos da outra variável.

Fórmula de correlação:
𝑛 ∑ 𝑥𝑦−(∑ 𝑥).(∑ 𝑦)
𝑟=
√𝑛 ∑ 𝑥 2 −(∑ 𝑥)2 . √𝑛 ∑ 𝑦 2 −(∑ 𝑦)2

Tipos de correlação
O Coeficiente de correlação de Pearson (r) é uma medida adimensional que pode assumir valores
no intervalo entre -1 e +1.

 Se r = -1, Enato diz-se que há uma relação linear negativa perfeita entre as duas variáveis
X e Y ( Relação inversa).
 Se r = 1, Diz-se que há uma relação linear positiva perfeita entre as variáveis X e Y
(Relação direta).
 Se r = 0, Diz-se que não existe uma relação linear entre as variáveis X e Y.
 Se −1 < 𝑟 < −0,7, Diz-se que há uma relação negativa forte entre as variáveis X e Y.
 Se −0,7 ≤ 𝑟 ≤ −0,5, Diz-se que há uma relação linear moderada negativa
 Se −0,5 ≤ 𝑟 ≤ −0,1 Diz-se que há relação linear negativa fraca.
 Se 0,1 ≤ 𝑟 ≤ 0,5, Diz-se que há relação linear positiva fraca.
 Se 0,7 ≤ 𝑟 ≤ 1, Diz-se que há relação linear positiva forte.
 Se 0,5 ≤ 𝑟 ≤ 0,7, Diz-se que há relação linear positiva moderada.
Exemplo:
A tabela a seguir fornece dados sobre a taxa de demissão por 100 empregados e taxa de
desemprego na industria dos EUA no período de 1960 a 1970.

Ano 1960 11961 1962 1963 1964 1965 1966 1967 1968 1969 1970
Taxa de demissão 1,3 1,2 1,4 1,4 1,5 1,9 2,6 2,3 2,5 2,7 2,1
Taxa d desemprego 6,2 7,8 5,8 4,0 5,0 4,0 3,2 3,7 3,3 3,3 5,6

a. Suponha que a taxa de desemprego Y se relaciona com a taxa de demissão x, como


y =β0 + β1⋅x + ε, estime os parâmetros β0 e β1 e interprete os resultados obtidos.
b. Calcule o coeficiente de correlação e interprete o resultado
c. Determine o coeficiente de determinação e interprete o resultado

Para resolver o problema devemos primeiro contruir uma tabela que vai nos facilitar a achar os
somatórios.

Taxa de Taxa de desemprego


demissão (X) (Y)) XY X² Y2
1.3 6.2 8.06 1.69 38.44
1.2 7.8 9.36 1.44 60.84
1.4 5.8 8.12 1.96 33.64
1.4 5.7 7.98 1.96 32.49
1.5 5 7.5 2.25 25
1.9 4 7.6 3.61 16
2.6 3.2 8.32 6.76 10.24
2.3 3.6 8.28 5.29 12.96
2.5 3.3 8.25 6.25 10.89
2.7 3.3 8.91 7.29 10.89
2.1 5.6 11.76 4.41 31.36

∑ 20.9 53.5 94.14 42.91 282.75


a. Tendo a tabela, podemos calcular os parâmetros de β0 e β1 estimados.
O tamanho da amostra e de 11 ( n = 11).
𝒏 ∑ 𝒙𝒚 −(∑ 𝒙).(∑ 𝒚)
Começamos a calcular o β1 usando a formula 𝜷𝟏 =
𝒏 ∑ 𝒙𝟐 − (∑ 𝒙)𝟐

Dados: 𝑛 = 𝟏𝟏; ∑ 𝒙𝒚 = 𝟗𝟒. 𝟏𝟒 ; (∑ 𝒙) = 𝟐𝟎. 𝟗; (∑ 𝒚) = 𝟓𝟑. 𝟓; ∑ 𝒙𝟐 = 𝟒𝟐, 𝟗𝟏

𝑛 ∑ 𝑥𝑦 − (∑ 𝑥). (∑ 𝑦) Interpretação: de 𝜷𝟏 𝒆𝒔𝒕𝒊𝒎𝒂𝒅𝒐


𝛽1 =
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 𝜷𝟏 ≈ −𝟐, 𝟑𝟓 É o valor que diminui na taxa de
11 . 94,14 − 20,9 . 53,5 desemprego quando a taxa de demissão aumenta em una
𝛽1 =
11 . 42.91 − 20,92 unidade
1035,54 − 1118,15
𝛽1 =
472,01 − 436,81
−82,61
𝛽1 =
35,2
𝛽1 = −2,3485 ≈ −2,35
Tendo o B1 podemos calcular o 𝛽0 estimado Aplicando a seguinte formula

∑𝒚 ∑𝒙
𝜷𝟎 = − 𝜷𝟏
𝒏 𝒏

Dados: 𝒏 = 𝟏𝟏, ∑ 𝒚 = 𝟓𝟑, 𝟓 𝜷𝟏 = -2,346875 (∑ 𝒙) = 𝟐𝟎. 𝟗;

∑𝑦 ∑𝑥 Interpretação do 𝜷0 estimado
𝛽0 = − 𝛽1
𝑛 𝑛 É o valor estimado da taxa de desemprego quando a
53,5 20,9 taxa de demissão é igual a zero, ou seja quando a taxa
𝛽0 = − (−2,346875)
11 11 de demissão é zero espera-se que a taxa de
𝛽0 = 4,86363636 + 4,4590625 desemprego seja ou aproximadamente a igual a 9,32
𝛽0 = 9,32269 ≈ 9,32

Logo o modelo estimado de regressão linear que explica a relação das duas variáveis e:

y = 9,32 − 2,35𝑋
b. Calcule o coeficiente de correlação e interprete o resultado.
Dados: 𝑛 = 11; ∑ 𝑥𝑦 = 94,14 (∑ 𝑥) = 𝟐𝟎. 𝟗; (∑ 𝑦) = 𝟓𝟑. 𝟓; ∑ 𝑦 2 = 282,75

𝑛 ∑ 𝑥𝑦−(∑ 𝑥).(∑ 𝑦) 11.94,14−20,9 .53,5


𝑟= =
√𝑛 ∑ 𝑥 2 −(∑ 𝑥)2 . √𝑛 ∑ 𝑦 2 −(∑ 𝑦)2 √11.42,91−20,92 . √11.282,75 −(53,5)2

r = -0,884169338

Interpretação:

Com 𝑟 = −0,884169338. Este valor pertence ao intervalo −1 < 𝑟 < −0,7, Então podemos
afirmar que existe uma relação linear negativa forte entre a taxa de demissão e a taxa de
desemprego, o que significa que quanto maior for a taxa de desemprego menor é a taxa de
demissão ou vice-versa.
Conclusão
Em conclusão, a correlação simples e a regressão linear simples são ferramentas fundamentais na
análise estatística de dados, permitindo aos pesquisadores e analistas entenderem as relações entre
variáveis quantitativas. Através da interpretação dos coeficientes de correlação e regressão,
podemos extrair conhecimentos significativos sobre a natureza e a força das relações entre as
variáveis em estudo. No exemplo apresentado, exploramos a relação entre a taxa de desemprego e
a taxa de demissão nas indústrias dos Estados Unidos, demonstrando como calcular e interpretar
os parâmetros da regressão linear e o coeficiente de correlação. Essa análise nos permitiu entender
melhor como as taxas de desemprego e demissão estão relacionadas e como uma pode influenciar
a outra.
Referência bibliográfica
 CHEIN, Flávia. Introdução aos Modelos de Regressão linear: um passo inicial para
compreensão da econometria como uma ferramenta de avaliação de políticas públicas.
Brasília: ENAP, 2019
 SOUSA ANDRADE, João, Apontamentos de Econometria Aplicada, Dezembro de 2001
- (Maio 2004)

Você também pode gostar