Escolar Documentos
Profissional Documentos
Cultura Documentos
Ziza
Mário Carimo Batista
Rui Gimo
Rute Severino Jefure
Rosa Fernando João
Estatística descritiva
Docente:
__________________________
(Msc. Cristina F. Chumussora da Costa)
Exemplo: ..................................................................................................................................... 8
Conclusão .................................................................................................................................. 11
Na ciência dos dados e na análise estatística, entender a relação entre variáveis é crucial para
compreender fenômenos complexos e tomar decisões informadas. A correlação e a regressão são
ferramentas poderosas para investigar e quantificar essas relações. A correlação simples mede a
força e a direção da associação entre duas variáveis, enquanto a regressão linear busca modelar
essa relação por meio de uma equação matemática que descreve a linha de melhor ajuste entre os
dados. A regressão linear, especificamente, é uma técnica estatística amplamente utilizada para
entender como uma variável independente influencia uma variável dependente. No decorrer deste
trabalho, será demonstrado como calcular os parâmetros e interpretar seus significados em um
contexto prático. Além disso, exploraremos a correlação entre variáveis e sua importância na
análise estatística. Ao final deste trabalho, esperamos deixar uma compreensão mais sólida desses
conceitos.
Regressão Linear Simples
Na análise estatística, a regressão linear simples é uma ferramenta poderosa para compreender e
modelar a relação entre duas variáveis. Ela é particularmente útil quando queremos entender como
uma variável dependente é afetada por uma única variável independente. A Seguir trazemos os
fundamentos da regressão linear simples, seus princípios básicos e sua aplicação em diversos
contextos.
Conceitos Fundamentais
A regressão linear simples parte do princípio de que existe uma relação linear entre a variável
independente (x) e a variável dependente (y). Essa relação é representada por uma linha reta que
melhor se ajusta aos dados disponíveis. O objetivo é encontrar essa linha de melhor ajuste, que
minimize a diferença entre os valores observados e os valores previstos pela linha de regressão.
O ponto central é, portanto, encontrar valores para β0 e β1. Em outras palavras, queremos estimar
a inclinação da reta utilizando uma amostra aleatória de dados de x e y. A inclinação nos fornece
o efeito em y da mudança de uma unidade em x.
Equação da Regressão Linear Simples: A equação geral da regressão linear simples é expressa
como: y =β0 + β1⋅x + ε
Onde:
x é igual a zero,
Média De X
Desvio Padrao X
Media De Y
Desvio Padrão De Y
Correlação De X E Y
𝜷𝟏 𝒏 ∑ 𝒙𝒚 − (∑ 𝒙). (∑ 𝒚)
𝜷𝟏 =
𝒏 ∑ 𝒙𝟐 − (∑ 𝒙)𝟐
𝜷𝟎 o intercepto ∑𝒚 ∑𝒙
𝜷𝟎 = − 𝜷𝟏
𝒏 𝒏
Na análise de correlação pretende-se medir o grão de associação linear entre duas variáveis
aleatórias, enquanto na análise de regressão linear o interesse é estimar ou prever o valor medio de
uma variável aleatória com base nos valores fixos da outra variável.
Fórmula de correlação:
𝑛 ∑ 𝑥𝑦−(∑ 𝑥).(∑ 𝑦)
𝑟=
√𝑛 ∑ 𝑥 2 −(∑ 𝑥)2 . √𝑛 ∑ 𝑦 2 −(∑ 𝑦)2
Tipos de correlação
O Coeficiente de correlação de Pearson (r) é uma medida adimensional que pode assumir valores
no intervalo entre -1 e +1.
Se r = -1, Enato diz-se que há uma relação linear negativa perfeita entre as duas variáveis
X e Y ( Relação inversa).
Se r = 1, Diz-se que há uma relação linear positiva perfeita entre as variáveis X e Y
(Relação direta).
Se r = 0, Diz-se que não existe uma relação linear entre as variáveis X e Y.
Se −1 < 𝑟 < −0,7, Diz-se que há uma relação negativa forte entre as variáveis X e Y.
Se −0,7 ≤ 𝑟 ≤ −0,5, Diz-se que há uma relação linear moderada negativa
Se −0,5 ≤ 𝑟 ≤ −0,1 Diz-se que há relação linear negativa fraca.
Se 0,1 ≤ 𝑟 ≤ 0,5, Diz-se que há relação linear positiva fraca.
Se 0,7 ≤ 𝑟 ≤ 1, Diz-se que há relação linear positiva forte.
Se 0,5 ≤ 𝑟 ≤ 0,7, Diz-se que há relação linear positiva moderada.
Exemplo:
A tabela a seguir fornece dados sobre a taxa de demissão por 100 empregados e taxa de
desemprego na industria dos EUA no período de 1960 a 1970.
Ano 1960 11961 1962 1963 1964 1965 1966 1967 1968 1969 1970
Taxa de demissão 1,3 1,2 1,4 1,4 1,5 1,9 2,6 2,3 2,5 2,7 2,1
Taxa d desemprego 6,2 7,8 5,8 4,0 5,0 4,0 3,2 3,7 3,3 3,3 5,6
Para resolver o problema devemos primeiro contruir uma tabela que vai nos facilitar a achar os
somatórios.
∑𝒚 ∑𝒙
𝜷𝟎 = − 𝜷𝟏
𝒏 𝒏
∑𝑦 ∑𝑥 Interpretação do 𝜷0 estimado
𝛽0 = − 𝛽1
𝑛 𝑛 É o valor estimado da taxa de desemprego quando a
53,5 20,9 taxa de demissão é igual a zero, ou seja quando a taxa
𝛽0 = − (−2,346875)
11 11 de demissão é zero espera-se que a taxa de
𝛽0 = 4,86363636 + 4,4590625 desemprego seja ou aproximadamente a igual a 9,32
𝛽0 = 9,32269 ≈ 9,32
Logo o modelo estimado de regressão linear que explica a relação das duas variáveis e:
y = 9,32 − 2,35𝑋
b. Calcule o coeficiente de correlação e interprete o resultado.
Dados: 𝑛 = 11; ∑ 𝑥𝑦 = 94,14 (∑ 𝑥) = 𝟐𝟎. 𝟗; (∑ 𝑦) = 𝟓𝟑. 𝟓; ∑ 𝑦 2 = 282,75
r = -0,884169338
Interpretação:
Com 𝑟 = −0,884169338. Este valor pertence ao intervalo −1 < 𝑟 < −0,7, Então podemos
afirmar que existe uma relação linear negativa forte entre a taxa de demissão e a taxa de
desemprego, o que significa que quanto maior for a taxa de desemprego menor é a taxa de
demissão ou vice-versa.
Conclusão
Em conclusão, a correlação simples e a regressão linear simples são ferramentas fundamentais na
análise estatística de dados, permitindo aos pesquisadores e analistas entenderem as relações entre
variáveis quantitativas. Através da interpretação dos coeficientes de correlação e regressão,
podemos extrair conhecimentos significativos sobre a natureza e a força das relações entre as
variáveis em estudo. No exemplo apresentado, exploramos a relação entre a taxa de desemprego e
a taxa de demissão nas indústrias dos Estados Unidos, demonstrando como calcular e interpretar
os parâmetros da regressão linear e o coeficiente de correlação. Essa análise nos permitiu entender
melhor como as taxas de desemprego e demissão estão relacionadas e como uma pode influenciar
a outra.
Referência bibliográfica
CHEIN, Flávia. Introdução aos Modelos de Regressão linear: um passo inicial para
compreensão da econometria como uma ferramenta de avaliação de políticas públicas.
Brasília: ENAP, 2019
SOUSA ANDRADE, João, Apontamentos de Econometria Aplicada, Dezembro de 2001
- (Maio 2004)