PROBABILIDADE E ESTATÍSTICA

Regressão Linear

Estatística - Aula 8

SUMÁRIO
1. Covariância e Correlação 2. Regressão Linear Simples 2.1 Modelos de Regressão 2.2 Análise de Resíduos 2.3 IC em Torno da Resposta Média 2.4 IC para uma Observação Futura 2.5 Coeficiente de Determinação 2.6. Exemplo no Excel

Covariância e Correlação
• Até o presente momento o trabalho de análise de dados limitou-se a estudar uma variável de cada vez. Agora, será feito o estudo de medidas e relações matemáticas entre mais de uma variável. Exemplo 1: Faturamento e Lucro Será possível estabelecer algum relacionamento entre o faturamento e o lucro acumulado de uma empresa? Exemplo 2: Juros e Bolsa Será possível estabelecer alguma relação entre a taxa básica de juros do Banco Central e os índices associados nas bolsas de valores do Brasil?

Covariância e Correlação
Dependência entre Variáveis • Duas variáveis quaisquer X e Y são consideradas independentes se os resultados obtidos por X não influenciarem os resultados obtidos por Y, e vice-versa. Se os resultados de X influenciarem os resultados de Y, X e Y serão dependentes. • Para tratar da dependência entre variáveis, serão estudados novos conceitos, fundamentais para o estudo do relacionamento entre variáveis. São eles Correlação e a Covariância

a cada momento que observamos uma ocorrência. “anotarmos” dois valores: um para a variável X e outro para a variável Y Variáveis emparelhadas vêm juntas uma das outras. Covariância e Correlação Exemplo 6 Supondo dados de uma empresa onde estão em destaque o faturamento e o lucro da seguinte forma Ano 1981 1982 1983 Faturamento (X) 200 300 500 Lucro Líquido (Y) 20 35 48 .Covariância e Correlação Variáveis Emparelhadas Duas variáveis X e Y estarão EMPARELHADAS quando. Quando uma é observada a outra também é.

Covariância e Correlação Utilizando Diagramas de Dispersão Para o estudo do comportamento de duas variáveis emparelhadas X e Y são largamente utilizados os Diagramas de Dispersão. • Quanto aos tipos de relacionamento eles podem ser positivos (quando X e Y caminham na mesma direção) ou negativos (quando X e Y caminham em direções opostas) • O formato pode indicar se as variáveis possuem relacionamento linear. Covariância e Correlação Utilizando Diagramas de Dispersão • Com esse tipo de gráfico o analista poderá observar se há relacionamento entre as variáveis. o tipo de relacionamento e o formato do relacionamento. quadrático etc. . exponencial.

As mesmas análises que podem ser feitas nos Gráficos de Dispersão podem ser feitas utilizando os cálculos de Covariância • Equação alternativa para a Covariância de dados emparelhados. Porém. necessariamente que elas sejam independentes. . Y = 0 : Duas variáveis independentes possuem covariância nula. Y > 0 : X e Y são dependentes e possuem um relacionamento positivo. Se o valor de X cai o de Y também cai. • σX. • σX. quando a covariância entre duas variáveis for nula não implicará. Onde: µx = média dos valores de X µY = média dos valores de Y N = no de elementos de X e Y σ x . Se o valor de X cai o de Y aumenta. Se o valor de X aumenta o de Y diminui. Y < 0 : X e Y são dependentes e possuem um relacionamento negativo.Covariância e Correlação Covariância • Para efetuar análises quantitativas sobre dados emparelhados de duas variáveis. Se o valor de X aumenta o de Y também aumenta. uma medida importante é a Covariância.y = ∑ (X i − µ X )( Yi − µ Y ) i =1 N N Covariância e Correlação Interpretações da Covariância • σX.

. . Se o valor de X aumenta o de Y também aumenta.. .. . . .. Y < 0 : X e Y são dependentes e possuem um relacionamento negativo. . . . . . Y X Y Covariância e Correlação Covariância Negativa σX.. . . X. . .. . . . . . . . . X. Se o valor de X aumenta o de Y diminui. Se o valor de X cai o de Y também cai. Y X Y . . . Y > 0 : X e Y são dependentes e possuem um relacionamento positivo.. ... . Se o valor de X cai o de Y aumenta. . .Covariância e Correlação Covariância Positiva σX..

. . . necessariamente que elas sejam independentes. .Covariância e Correlação Covariância Nula σX. quando a covariância entre duas variáveis for nula não implicará. . Y X Y . X. . Y = 0 : Duas variáveis independentes possuem covariância nula. ... . .. .. .. . .. Y .. . .. . . .. . X. . . . .. . Porém. . . . Y X. . ... .. . Covariância e Correlação Covariância Nula – Outros Exemplos .

por exemplo.Y σ X . a covariância terá como unidade $2. Se. -1< ρ < 1.Y = σX σ Y Propriedades: • Quando diferente de zero indicará dependência. . • Pode assumir grandes valores. Se X for número de empregados e Y salário.Covariância e Correlação Desvantagens da Utilização da Covariância • É uma unidade de difícil entendimento. as variáveis X e Y representarem dinheiro. a unidade da covariância será empregados × salários. ρ X . • Será limitada. • não possuirá unidades. Covariância e Correlação Correlação Para contornar essas desvantagens o idealizador dessa medida (Karl Pearson) criou a correlação que é dada pela seguinte equação.

. . .95 ..0.5. .0. Valores intermediários irão estabelecer níveis de dependência entre elas.... . . .. . ... .95 ρ = . . . . ..ρ. .. ..8 ρ = ... ρ = 0. ...0.... Y’. Se variáveis X e Y possuem ρ = 0. .. . X e Y possuem nível de dependência maior que X’... ....... ..Covariância e Correlação Observações: • Os valores de correlação podem variar entre -1 e 1.. Covariância e Correlação . .= 0. .. . ..6 .. ... • Para calcular a correlação será necessário calcular a covariância e os desvios padrão de ambas as variáveis... .. Y’ possuem ρ = 0. ρ = . .6 .. . ......9 e outras variáveis X’. ...... .8 . ρ = 0...

Xn serão chamadas de variáveis independentes ou explicativas. Xn) • O que se deseja é poder estimar esse valor de Y estabelecendo um intervalo de confiança. Os demais modelos formados com mais de uma variável explicativa serão modelos de Regressão Múltipla.. que serão mostradas mais adiante. em modelos de regressão.. X2. também poderá ser chamada de variável dependente ou explicada.. . . . . . X2. . • A Regressão Simples irá abordar modelos com somente uma variável explicativa X. enquanto que as variáveis X1. X3. ou seja: Y = f(X1. X3.. X2. Xn .. .. Regressão Linear Modelos de Regressão • A variável Y. X3.Regressão Linear Modelos de Regressão • A Análise de Regressão procurará estabelecer uma relação matemática para determinar o comportamento de uma variável Y em função do comportamento de outras variáveis X1. • Esse tipo de modelo somente será válido em condições bem específicas.

2. 3. entre outros. Estimarmos a média para a variável dependente a partir do conhecimento de um valor para a variável independente. Regressão Linear Modelos de Regressão .Aplicações • O estabelecimento dessas equações matemáticas entre as variáveis proporcionará que sejam realizadas algumas aplicações: 1.. y = a1 + a2x + a3x2 + . 3. Estimativa de valores futuros para a variável dependente. 4.+ anxn.Regressão Linear Modelos de Regressão • Quanto à linearidade os modelos de regressão podem ser lineares ou não lineares. falaremos de modelos de Regressão Simples. + anxn . Explicarmos as oscilações verificadas na variável dependente em função das oscilações verificadas na variável independente. y = log x. y = sen x.. 2. .. y = x12 + x23. Modelos não-lineares possuirão equações do tipo: 1. • Aqui. Nos lineares as equações dos modelos são do tipo y = b + a1x1 +..

Regressão Linear Exemplo A tabela que se segue mostra o faturamento de uma empresa hipotética durante um período de 18 meses Faturamento 25 8 27 10 26 27 29 9 16 14 27 13 20 25 22 25 20 7 Lucro Líquido 32 14 37 20 37 34 28 18 26 25 37 21 28 36 34 36 31 20 Regressão Linear Exemplo Diagrama de Dispersão Ao desenhar o diagrama de dispersão desses valores encontramos o gráfico ao lado 40 Lucro Líquido 30 20 10 0 0 10 20 Faturamento 30 40 .

. • Queremos montar um intervalo de confiança para Y em função do valor de X. Regressão Linear Exemplo • É sabido que as retas. • O objetivo é encontrar a relação que melhor interprete o comportamento dos pontos do Diagrama de Dispersão. vamos determinar uma faixa de valores para Y para um dado valor de X. são representadas pela equação genérica: Y = AX + B onde: A = coeficiente angular B = coeficiente linear • Encontraremos a melhor reta que se adapta ao diagrama de pontos. em gráficos (X. Isso significa determinar os valores de A e de B. • Para fazer isso. tal que os resíduos ou erros (ei) encontrados sejam os menores possíveis. Essa reta será a média procurada para o Intervalo de Confiança que contém Y. um modelo de Regressão Simples. sendo. o primeiro passo será estabelecer a média desse intervalo de confiança em função de X. portanto. Assim.Regressão Linear Exemplo • Este exemplo mostra uma variável Y explicada por uma única variável X. Y).

.Diagrama de Dispersão 40 Lucro Líquido 30 20 10 0 0 10 Xi Ypi = AXi + B Yi = AXi + B + ei Erro ei (resíduo ei) 20 30 40 Faturamento Regressão Linear Exemplo • Para determinar os valores de A e B com essas características é utilizado o Método dos Mínimos Quadrados Ordinários. • Após encontrados esses valores de A e B. Este método se utiliza de cálculo diferencial para achar os valores ideais de A e B que minimizam a soma dos erros ao quadrado. é possível determinar a Linha de Tendência que melhor descreve o comportamento dos ponto do gráfico.

• Se σ2 não for constante não será possível construir um intervalo de confiança pois ele mudará em função de X. • Somente será possível construir um modelo de regressão linear simples se os resíduos estiverem distribuídos normalmente com média 0 (zero) e variância σ2 constante. é necessário expor outros aspectos importantes para que seja possível construir um modelo de regressão.Regressão Linear Exemplo Diagrama de Dispersão 40 Lucro Líquido 30 20 10 0 0 10 20 Faturamento 30 40 Linha de Tendência Essa linha de tendência será a média para o intervalo de confiança que conterá Y em função de X. σ2 = cte) • Após encontrar o valor médio do intervalo de confiança de Y em função de X (linha de tendência). Regressão Linear Modelos de Regressão – resíduos ~ N(0. .

• O valor de σ2 pode ser calculado como: n n SQE 2 σ = onde SQE = ∑ ei = ∑ [ yi − ( Axi + B )] n−2 i =1 i =1 2 • O Excel fornece o valor de σ no campo “Erro-Padrão” . • Os principais intervalos de confiança que iremos trabalhar são: IC em torno da resposta média IC para uma observação futura.Regressão Linear Modelos de Regressão Y Variância σ2 = constante indica que será possível usar um mesmo valor de σ2 para todo o intervalo considerado Y1 Y2 Y3 X1 X3 Média 0(zero) significa que a média da normal está sobre a reta AX + B X2 Y = AX + B X Regressão Linear Modelos de Regressão – resíduos ~ N(0. σ2 = cte) • Com essa idéia é possível avançar para a determinação dos intervalos de confiança.

n − 2 Onde: 2 ) 2  1 (xo − x )  σ 1 + +  n S xx   yo = A + Bxo S xx = ∑ ( xi − x ) i =1 n 2 . µY | x ± tα 2. yo ± tα 2. n − 2 o ) 2 ) 2  1 (xo − x )  σ  +  n S xx   Onde: µY | x = A + Bxo o ) S xx = ∑ ( xi − x ) i =1 n 2 Regressão Linear IC para uma Observação Futura Para calcular o intervalo que representa a resposta em torno da média para uma observação futura será usado o seguinte intervalo de confiança.Regressão Linear IC em Torno da Resposta Média Para calcular o intervalo que representa a resposta em torno da média será usado o seguinte intervalo de confiança.

.. . R2 = 0.6 2 ... .8 R2 = 0.. ... ............. . R = 0. .. . .... .95 R2 = 0.... . .Regressão Linear Coeficiente de Determinação (R2) • O Coeficiente de Determinação (R2) medirá a proporção da Variação de Y que poderá ser explicada pela variação de X • R2 será o quadrado do valor da correlação das variáveis e por isso irá variar entre 0 (zero) e 1 (um) Regressão Linear Coeficiente de Determinação (R2) ... . ... . . ... 2 ... ... . . = 0... ..... ...8 . . R2 = 0. .R.... .95 .. .. . . .6 ... .

Supondo um exemplo hipotético onde se comparam a rentabilidade mensal de uma ação A e o número de dias de sol ocorridos nesse mês. com alguma confiança. financeira. 3.) 2. 1. utilizando a meteorologia. que é um fenômeno econômico-administrativo. Regressão Linear Observações Importantes (Cont. Tal relacionamento poderá ser explicado pelos movimentos próprios do mercado. pontos que estejam dentro do intervalo em estudo. Esta linha servirá para explicar. elas não necessariamente irão explicar os pontos posteriores. Os valores seguintes somente serão inferidos. porém absurdo! . alimentos não influenciarão o mercado de telecomunicações e vice-versa.35RB + 0. RELACIONAMENTO ESPÚRIO: Podem ocorrer certos tipos de coincidências curiosas. científica etc. indicando um relacionamento indireto entre A e B. PREVISÃO: Apesar das Linhas de Tendência possuírem esse nome.Regressão Linear Observações Importantes Vale salientar que mesmo estabelecendo uma equação matemática a regressão não é uma condição necessária e suficiente para determinar relações de causa e efeito entre variáveis envolvidas. Dados assim sugerem prever rentabilidade. A relação deve ser justificada através de teoria econômica.RELACIONAMENTO INDIRETO: Supondo duas ações hipotéticas A (telecomunicações) e B (alimentos). um analista financeiro estabeleceu a seguinte equação: RA = 0. Isso é curioso. caso o fenômeno em estudo seja de conhecimento e se possa fazer tal tipo de previsão.5. Na prática.

Apertar: direito sobre os pontos “adicionar linha de 20 25 30 35 tendência” Regressão Linear Colocando o Exemplo no Excel . Apertar o botão 2.Regressão Linear Colocando o Exemplo no Excel O conjunto de dados emparelhados gerou o seguinte diagrama de dispersão. Diagrama de Dispersão 40 35 Lucro líquido 30 25 20 15 10 5 0 0 5 10 15 Faturamento 1.

9014x + 11.8331 Faturamento Regressão Linear Colocando o Exemplo no Excel Para fazer análises mais detalhadas siga os passos ao lado.Regressão Linear Colocando o Exemplo no Excel Diagrama de Dispersão 40 35 Lucro líquido 30 25 20 15 10 5 0 0 5 10 15 20 25 30 35 y = 0. .028 2 R = 0.

Regressão Linear Colocando o Exemplo no Excel 1. √ √ √ √ Regressão Linear Colocando o Exemplo no Excel . aperte “OK”. 3. Selecionar a plotagem de probabilidade normal 5. 4. 2. Selecionar a plotagem dos resíduos. Selecionar o cálculo dos resíduos. Selecione “Nova Planilha” e por fim. Selecionar os intervalos x e y na planilha.

Plotagem de resíduos Variável X 1 Plotagem de resíduos 4 2 Resíduos 0 10 20 30 40 Y 40 35 30 25 20 15 10 5 0 0 20 40 60 80 100 120 Percentil da amostra 2.Regressão Linear Colocando o Exemplo no Excel Regressão Linear Colocando o Exemplo no Excel 1. Plotagem de Probabilidade Normal Plotagem de probabilidade normal 0 -2 -4 -6 -8 -10 Variável X 1 .

Regressão Linear Colocando o Exemplo no Excel – Plotagem de resíduos ei ei Ideal: σ = cte média = 0 ei ei Regressão Linear Significado das avaliações mostradas no Excel R Múltiplo – Índice especial para a regressão múltipla. este índice será mais apropriado. Na regressão simples o seu valor equivale à raiz quadrada de R2. indicará que será benéfico para o modelo a inclusão de mais variáveis. Indica o grau de relacionamento linear entre os valores reais e estimados para a variável Y. R-quadrado – Já mencionado R-quadrado ajustado – quando se trabalha com regressão múltipla. . Quando a inclusão de outra variável implicar no crescimento do seu valor.

Sign up to vote on this title
UsefulNot useful