P. 1
Regressão Linear - Exemplo no EXCEL

Regressão Linear - Exemplo no EXCEL

|Views: 4.605|Likes:
Publicado porPâmela Rodrigues

More info:

Published by: Pâmela Rodrigues on Jun 11, 2011
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

08/09/2013

pdf

text

original

PROBABILIDADE E ESTATÍSTICA

Regressão Linear

Estatística - Aula 8

SUMÁRIO
1. Covariância e Correlação 2. Regressão Linear Simples 2.1 Modelos de Regressão 2.2 Análise de Resíduos 2.3 IC em Torno da Resposta Média 2.4 IC para uma Observação Futura 2.5 Coeficiente de Determinação 2.6. Exemplo no Excel

Covariância e Correlação
• Até o presente momento o trabalho de análise de dados limitou-se a estudar uma variável de cada vez. Agora, será feito o estudo de medidas e relações matemáticas entre mais de uma variável. Exemplo 1: Faturamento e Lucro Será possível estabelecer algum relacionamento entre o faturamento e o lucro acumulado de uma empresa? Exemplo 2: Juros e Bolsa Será possível estabelecer alguma relação entre a taxa básica de juros do Banco Central e os índices associados nas bolsas de valores do Brasil?

Covariância e Correlação
Dependência entre Variáveis • Duas variáveis quaisquer X e Y são consideradas independentes se os resultados obtidos por X não influenciarem os resultados obtidos por Y, e vice-versa. Se os resultados de X influenciarem os resultados de Y, X e Y serão dependentes. • Para tratar da dependência entre variáveis, serão estudados novos conceitos, fundamentais para o estudo do relacionamento entre variáveis. São eles Correlação e a Covariância

Quando uma é observada a outra também é.Covariância e Correlação Variáveis Emparelhadas Duas variáveis X e Y estarão EMPARELHADAS quando. a cada momento que observamos uma ocorrência. Covariância e Correlação Exemplo 6 Supondo dados de uma empresa onde estão em destaque o faturamento e o lucro da seguinte forma Ano 1981 1982 1983 Faturamento (X) 200 300 500 Lucro Líquido (Y) 20 35 48 . “anotarmos” dois valores: um para a variável X e outro para a variável Y Variáveis emparelhadas vêm juntas uma das outras.

o tipo de relacionamento e o formato do relacionamento. Covariância e Correlação Utilizando Diagramas de Dispersão • Com esse tipo de gráfico o analista poderá observar se há relacionamento entre as variáveis. .Covariância e Correlação Utilizando Diagramas de Dispersão Para o estudo do comportamento de duas variáveis emparelhadas X e Y são largamente utilizados os Diagramas de Dispersão. exponencial. quadrático etc. • Quanto aos tipos de relacionamento eles podem ser positivos (quando X e Y caminham na mesma direção) ou negativos (quando X e Y caminham em direções opostas) • O formato pode indicar se as variáveis possuem relacionamento linear.

Se o valor de X aumenta o de Y diminui. Y > 0 : X e Y são dependentes e possuem um relacionamento positivo. . Se o valor de X aumenta o de Y também aumenta. • σX.Covariância e Correlação Covariância • Para efetuar análises quantitativas sobre dados emparelhados de duas variáveis. Se o valor de X cai o de Y também cai. Porém. uma medida importante é a Covariância. Onde: µx = média dos valores de X µY = média dos valores de Y N = no de elementos de X e Y σ x . necessariamente que elas sejam independentes. Se o valor de X cai o de Y aumenta. quando a covariância entre duas variáveis for nula não implicará. Y = 0 : Duas variáveis independentes possuem covariância nula. As mesmas análises que podem ser feitas nos Gráficos de Dispersão podem ser feitas utilizando os cálculos de Covariância • Equação alternativa para a Covariância de dados emparelhados. Y < 0 : X e Y são dependentes e possuem um relacionamento negativo. • σX.y = ∑ (X i − µ X )( Yi − µ Y ) i =1 N N Covariância e Correlação Interpretações da Covariância • σX.

... Se o valor de X aumenta o de Y diminui. . . . Se o valor de X cai o de Y também cai. . . . . Y X Y Covariância e Correlação Covariância Negativa σX. .. . . . Y X Y . .. .. X. Y > 0 : X e Y são dependentes e possuem um relacionamento positivo. . . . . . . . .Covariância e Correlação Covariância Positiva σX. . . . Se o valor de X cai o de Y aumenta. . . . X.... . . Y < 0 : X e Y são dependentes e possuem um relacionamento negativo. Se o valor de X aumenta o de Y também aumenta.

. .. . . .. Y X Y . necessariamente que elas sejam independentes.. . .. .. Porém. quando a covariância entre duas variáveis for nula não implicará. . . . X. . Y X. . . .. . .. . .. .. . Y = 0 : Duas variáveis independentes possuem covariância nula. .Covariância e Correlação Covariância Nula σX... . . . . . X. . Covariância e Correlação Covariância Nula – Outros Exemplos . . Y .. .. .

Y = σX σ Y Propriedades: • Quando diferente de zero indicará dependência. Se. a unidade da covariância será empregados × salários. ρ X . -1< ρ < 1. as variáveis X e Y representarem dinheiro. a covariância terá como unidade $2.Covariância e Correlação Desvantagens da Utilização da Covariância • É uma unidade de difícil entendimento. • Será limitada. • não possuirá unidades. . por exemplo. Se X for número de empregados e Y salário. • Pode assumir grandes valores. Covariância e Correlação Correlação Para contornar essas desvantagens o idealizador dessa medida (Karl Pearson) criou a correlação que é dada pela seguinte equação.Y σ X .

.. X e Y possuem nível de dependência maior que X’. Covariância e Correlação .... .8 . ..9 e outras variáveis X’..... . ρ = 0.6 . . .......95 ρ = .95 .... . . . . ρ = 0. .0. ...... ... .. .. Valores intermediários irão estabelecer níveis de dependência entre elas.= 0.. .. . . Se variáveis X e Y possuem ρ = 0.. . .. .. ..ρ. . • Para calcular a correlação será necessário calcular a covariância e os desvios padrão de ambas as variáveis.....6 ..0... . .Covariância e Correlação Observações: • Os valores de correlação podem variar entre -1 e 1. ..8 ρ = . Y’.. . ρ = ... Y’ possuem ρ = 0.. .0.. .. . .5... .

X3. Xn . • A Regressão Simples irá abordar modelos com somente uma variável explicativa X. . enquanto que as variáveis X1. em modelos de regressão. Xn) • O que se deseja é poder estimar esse valor de Y estabelecendo um intervalo de confiança. ou seja: Y = f(X1. . X2.. • Esse tipo de modelo somente será válido em condições bem específicas. .... Regressão Linear Modelos de Regressão • A variável Y. Os demais modelos formados com mais de uma variável explicativa serão modelos de Regressão Múltipla. . X2. .Regressão Linear Modelos de Regressão • A Análise de Regressão procurará estabelecer uma relação matemática para determinar o comportamento de uma variável Y em função do comportamento de outras variáveis X1. X2.. também poderá ser chamada de variável dependente ou explicada.. X3. Xn serão chamadas de variáveis independentes ou explicativas. . X3. . que serão mostradas mais adiante.

y = a1 + a2x + a3x2 + . 2. Estimativa de valores futuros para a variável dependente. Modelos não-lineares possuirão equações do tipo: 1. + anxn . 2.Regressão Linear Modelos de Regressão • Quanto à linearidade os modelos de regressão podem ser lineares ou não lineares. • Aqui. Regressão Linear Modelos de Regressão .Aplicações • O estabelecimento dessas equações matemáticas entre as variáveis proporcionará que sejam realizadas algumas aplicações: 1. y = log x. 3. Estimarmos a média para a variável dependente a partir do conhecimento de um valor para a variável independente. . y = sen x.. entre outros. y = x12 + x23. falaremos de modelos de Regressão Simples.. Nos lineares as equações dos modelos são do tipo y = b + a1x1 +. 3. 4... Explicarmos as oscilações verificadas na variável dependente em função das oscilações verificadas na variável independente.+ anxn.

Regressão Linear Exemplo A tabela que se segue mostra o faturamento de uma empresa hipotética durante um período de 18 meses Faturamento 25 8 27 10 26 27 29 9 16 14 27 13 20 25 22 25 20 7 Lucro Líquido 32 14 37 20 37 34 28 18 26 25 37 21 28 36 34 36 31 20 Regressão Linear Exemplo Diagrama de Dispersão Ao desenhar o diagrama de dispersão desses valores encontramos o gráfico ao lado 40 Lucro Líquido 30 20 10 0 0 10 20 Faturamento 30 40 .

um modelo de Regressão Simples. sendo. são representadas pela equação genérica: Y = AX + B onde: A = coeficiente angular B = coeficiente linear • Encontraremos a melhor reta que se adapta ao diagrama de pontos. o primeiro passo será estabelecer a média desse intervalo de confiança em função de X. Assim. • Para fazer isso.Regressão Linear Exemplo • Este exemplo mostra uma variável Y explicada por uma única variável X. . Y). • Queremos montar um intervalo de confiança para Y em função do valor de X. Regressão Linear Exemplo • É sabido que as retas. Essa reta será a média procurada para o Intervalo de Confiança que contém Y. tal que os resíduos ou erros (ei) encontrados sejam os menores possíveis. portanto. em gráficos (X. • O objetivo é encontrar a relação que melhor interprete o comportamento dos pontos do Diagrama de Dispersão. Isso significa determinar os valores de A e de B. vamos determinar uma faixa de valores para Y para um dado valor de X.

Diagrama de Dispersão 40 Lucro Líquido 30 20 10 0 0 10 Xi Ypi = AXi + B Yi = AXi + B + ei Erro ei (resíduo ei) 20 30 40 Faturamento Regressão Linear Exemplo • Para determinar os valores de A e B com essas características é utilizado o Método dos Mínimos Quadrados Ordinários. . Este método se utiliza de cálculo diferencial para achar os valores ideais de A e B que minimizam a soma dos erros ao quadrado. • Após encontrados esses valores de A e B. é possível determinar a Linha de Tendência que melhor descreve o comportamento dos ponto do gráfico.

• Somente será possível construir um modelo de regressão linear simples se os resíduos estiverem distribuídos normalmente com média 0 (zero) e variância σ2 constante. . σ2 = cte) • Após encontrar o valor médio do intervalo de confiança de Y em função de X (linha de tendência). • Se σ2 não for constante não será possível construir um intervalo de confiança pois ele mudará em função de X. é necessário expor outros aspectos importantes para que seja possível construir um modelo de regressão. Regressão Linear Modelos de Regressão – resíduos ~ N(0.Regressão Linear Exemplo Diagrama de Dispersão 40 Lucro Líquido 30 20 10 0 0 10 20 Faturamento 30 40 Linha de Tendência Essa linha de tendência será a média para o intervalo de confiança que conterá Y em função de X.

• Os principais intervalos de confiança que iremos trabalhar são: IC em torno da resposta média IC para uma observação futura. σ2 = cte) • Com essa idéia é possível avançar para a determinação dos intervalos de confiança. • O valor de σ2 pode ser calculado como: n n SQE 2 σ = onde SQE = ∑ ei = ∑ [ yi − ( Axi + B )] n−2 i =1 i =1 2 • O Excel fornece o valor de σ no campo “Erro-Padrão” .Regressão Linear Modelos de Regressão Y Variância σ2 = constante indica que será possível usar um mesmo valor de σ2 para todo o intervalo considerado Y1 Y2 Y3 X1 X3 Média 0(zero) significa que a média da normal está sobre a reta AX + B X2 Y = AX + B X Regressão Linear Modelos de Regressão – resíduos ~ N(0.

µY | x ± tα 2. n − 2 o ) 2 ) 2  1 (xo − x )  σ  +  n S xx   Onde: µY | x = A + Bxo o ) S xx = ∑ ( xi − x ) i =1 n 2 Regressão Linear IC para uma Observação Futura Para calcular o intervalo que representa a resposta em torno da média para uma observação futura será usado o seguinte intervalo de confiança. yo ± tα 2. n − 2 Onde: 2 ) 2  1 (xo − x )  σ 1 + +  n S xx   yo = A + Bxo S xx = ∑ ( xi − x ) i =1 n 2 .Regressão Linear IC em Torno da Resposta Média Para calcular o intervalo que representa a resposta em torno da média será usado o seguinte intervalo de confiança.

.. .8 R2 = 0.. 2 .R.. ....8 .. . . . . ... .. ...... . .. ... . ....... .... . .6 ... . .... .. . ... . R = 0. ..... . ......95 . . .. .95 R2 = 0. R2 = 0....Regressão Linear Coeficiente de Determinação (R2) • O Coeficiente de Determinação (R2) medirá a proporção da Variação de Y que poderá ser explicada pela variação de X • R2 será o quadrado do valor da correlação das variáveis e por isso irá variar entre 0 (zero) e 1 (um) Regressão Linear Coeficiente de Determinação (R2) . R2 = 0.6 2 .. = 0..

caso o fenômeno em estudo seja de conhecimento e se possa fazer tal tipo de previsão. pontos que estejam dentro do intervalo em estudo. indicando um relacionamento indireto entre A e B. Esta linha servirá para explicar.) 2.5. Regressão Linear Observações Importantes (Cont.35RB + 0. Isso é curioso. elas não necessariamente irão explicar os pontos posteriores. Supondo um exemplo hipotético onde se comparam a rentabilidade mensal de uma ação A e o número de dias de sol ocorridos nesse mês.Regressão Linear Observações Importantes Vale salientar que mesmo estabelecendo uma equação matemática a regressão não é uma condição necessária e suficiente para determinar relações de causa e efeito entre variáveis envolvidas. um analista financeiro estabeleceu a seguinte equação: RA = 0. A relação deve ser justificada através de teoria econômica. que é um fenômeno econômico-administrativo. Dados assim sugerem prever rentabilidade. Tal relacionamento poderá ser explicado pelos movimentos próprios do mercado. Na prática. RELACIONAMENTO ESPÚRIO: Podem ocorrer certos tipos de coincidências curiosas. 3. com alguma confiança. 1.RELACIONAMENTO INDIRETO: Supondo duas ações hipotéticas A (telecomunicações) e B (alimentos). alimentos não influenciarão o mercado de telecomunicações e vice-versa. Os valores seguintes somente serão inferidos. científica etc. utilizando a meteorologia. PREVISÃO: Apesar das Linhas de Tendência possuírem esse nome. porém absurdo! . financeira.

Apertar: direito sobre os pontos “adicionar linha de 20 25 30 35 tendência” Regressão Linear Colocando o Exemplo no Excel . Apertar o botão 2.Regressão Linear Colocando o Exemplo no Excel O conjunto de dados emparelhados gerou o seguinte diagrama de dispersão. Diagrama de Dispersão 40 35 Lucro líquido 30 25 20 15 10 5 0 0 5 10 15 Faturamento 1.

8331 Faturamento Regressão Linear Colocando o Exemplo no Excel Para fazer análises mais detalhadas siga os passos ao lado.9014x + 11. .Regressão Linear Colocando o Exemplo no Excel Diagrama de Dispersão 40 35 Lucro líquido 30 25 20 15 10 5 0 0 5 10 15 20 25 30 35 y = 0.028 2 R = 0.

Selecionar o cálculo dos resíduos. Selecionar a plotagem de probabilidade normal 5. 2. Selecionar a plotagem dos resíduos. √ √ √ √ Regressão Linear Colocando o Exemplo no Excel . Selecione “Nova Planilha” e por fim. aperte “OK”. 4. 3.Regressão Linear Colocando o Exemplo no Excel 1. Selecionar os intervalos x e y na planilha.

Plotagem de resíduos Variável X 1 Plotagem de resíduos 4 2 Resíduos 0 10 20 30 40 Y 40 35 30 25 20 15 10 5 0 0 20 40 60 80 100 120 Percentil da amostra 2. Plotagem de Probabilidade Normal Plotagem de probabilidade normal 0 -2 -4 -6 -8 -10 Variável X 1 .Regressão Linear Colocando o Exemplo no Excel Regressão Linear Colocando o Exemplo no Excel 1.

. indicará que será benéfico para o modelo a inclusão de mais variáveis. este índice será mais apropriado. Quando a inclusão de outra variável implicar no crescimento do seu valor. Indica o grau de relacionamento linear entre os valores reais e estimados para a variável Y. R-quadrado – Já mencionado R-quadrado ajustado – quando se trabalha com regressão múltipla.Regressão Linear Colocando o Exemplo no Excel – Plotagem de resíduos ei ei Ideal: σ = cte média = 0 ei ei Regressão Linear Significado das avaliações mostradas no Excel R Múltiplo – Índice especial para a regressão múltipla. Na regressão simples o seu valor equivale à raiz quadrada de R2.

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->