Você está na página 1de 24

PROBABILIDADE E ESTATSTICA

Regresso Linear

Estatstica - Aula 8

SUMRIO
1. Covarincia e Correlao 2. Regresso Linear Simples 2.1 Modelos de Regresso 2.2 Anlise de Resduos 2.3 IC em Torno da Resposta Mdia 2.4 IC para uma Observao Futura 2.5 Coeficiente de Determinao 2.6. Exemplo no Excel

Covarincia e Correlao
At o presente momento o trabalho de anlise de dados limitou-se a estudar uma varivel de cada vez. Agora, ser feito o estudo de medidas e relaes matemticas entre mais de uma varivel. Exemplo 1: Faturamento e Lucro Ser possvel estabelecer algum relacionamento entre o faturamento e o lucro acumulado de uma empresa? Exemplo 2: Juros e Bolsa Ser possvel estabelecer alguma relao entre a taxa bsica de juros do Banco Central e os ndices associados nas bolsas de valores do Brasil?

Covarincia e Correlao
Dependncia entre Variveis Duas variveis quaisquer X e Y so consideradas independentes se os resultados obtidos por X no influenciarem os resultados obtidos por Y, e vice-versa. Se os resultados de X influenciarem os resultados de Y, X e Y sero dependentes. Para tratar da dependncia entre variveis, sero estudados novos conceitos, fundamentais para o estudo do relacionamento entre variveis. So eles Correlao e a Covarincia

Covarincia e Correlao
Variveis Emparelhadas

Duas variveis X e Y estaro EMPARELHADAS quando, a cada momento que observamos uma ocorrncia, anotarmos dois valores: um para a varivel X e outro para a varivel Y Variveis emparelhadas vm juntas uma das outras. Quando uma observada a outra tambm .

Covarincia e Correlao
Exemplo 6 Supondo dados de uma empresa onde esto em destaque o faturamento e o lucro da seguinte forma
Ano 1981 1982 1983 Faturamento (X) 200 300 500 Lucro Lquido (Y) 20 35 48

Covarincia e Correlao
Utilizando Diagramas de Disperso Para o estudo do comportamento de duas variveis emparelhadas X e Y so largamente utilizados os Diagramas de Disperso.

Covarincia e Correlao
Utilizando Diagramas de Disperso Com esse tipo de grfico o analista poder observar se h relacionamento entre as variveis, o tipo de relacionamento e o formato do relacionamento. Quanto aos tipos de relacionamento eles podem ser positivos (quando X e Y caminham na mesma direo) ou negativos (quando X e Y caminham em direes opostas) O formato pode indicar se as variveis possuem relacionamento linear, exponencial, quadrtico etc.

Covarincia e Correlao
Covarincia Para efetuar anlises quantitativas sobre dados emparelhados de duas variveis, uma medida importante a Covarincia. As mesmas anlises que podem ser feitas nos Grficos de Disperso podem ser feitas utilizando os clculos de Covarincia Equao alternativa para a Covarincia de dados emparelhados.
Onde: x = mdia dos valores de X Y = mdia dos valores de Y N = no de elementos de X e Y

x ,y =

(X i X )( Yi Y )
i =1

Covarincia e Correlao
Interpretaes da Covarincia X, Y > 0 : X e Y so dependentes e possuem um relacionamento positivo. Se o valor de X aumenta o de Y tambm aumenta. Se o valor de X cai o de Y tambm cai. X, Y < 0 : X e Y so dependentes e possuem um relacionamento negativo. Se o valor de X aumenta o de Y diminui. Se o valor de X cai o de Y aumenta. X, Y = 0 : Duas variveis independentes possuem covarincia nula. Porm, quando a covarincia entre duas variveis for nula no implicar, necessariamente que elas sejam independentes.

Covarincia e Correlao
Covarincia Positiva X, Y > 0 : X e Y so dependentes e possuem um relacionamento positivo. Se o valor de X aumenta o de Y tambm aumenta. Se o valor de X cai o de Y tambm cai.

. . . . .. . .. . . . . . .. . .

X, Y X Y

Covarincia e Correlao
Covarincia Negativa X, Y < 0 : X e Y so dependentes e possuem um relacionamento negativo. Se o valor de X aumenta o de Y diminui. Se o valor de X cai o de Y aumenta.

.. .. . . . . .. .. .. . . .. .

X, Y X Y

Covarincia e Correlao
Covarincia Nula X, Y = 0 : Duas variveis independentes possuem covarincia nula. Porm, quando a covarincia entre duas variveis for nula no implicar, necessariamente que elas sejam independentes.
X, Y X Y

.. . . .. . ... .. . . .

Covarincia e Correlao
Covarincia Nula Outros Exemplos

.. . . . .. . .. ... . .

X, Y

X, Y

. . . .

.. . . .. ..

. . . .

Covarincia e Correlao
Desvantagens da Utilizao da Covarincia

uma unidade de difcil entendimento. Se, por exemplo, as variveis X e Y representarem dinheiro, a covarincia ter como unidade $2. Se X for nmero de empregados e Y salrio, a unidade da covarincia ser empregados salrios. Pode assumir grandes valores.

Covarincia e Correlao
Correlao Para contornar essas desvantagens o idealizador dessa medida (Karl Pearson) criou a correlao que dada pela seguinte equao.

X ,Y

X ,Y = X Y

Propriedades: Quando diferente de zero indicar dependncia. no possuir unidades. Ser limitada, -1< < 1.

Covarincia e Correlao
Observaes: Os valores de correlao podem variar entre -1 e 1. Valores intermedirios iro estabelecer nveis de dependncia entre elas. Se variveis X e Y possuem = 0,9 e outras variveis X, Y possuem = 0,5. X e Y possuem nvel de dependncia maior que X, Y. Para calcular a correlao ser necessrio calcular a covarincia e os desvios padro de ambas as variveis.

Covarincia e Correlao

...

.. .... ..

= 0,95

. ..... ...... = 0,8 .

. ........ ....... ..= 0,6

. .... .. . .. . .......

. ... . . .. . . .. . . .

= - 0,95

= - 0,8

= - 0,6

..... . .. . . .

Regresso Linear
Modelos de Regresso A Anlise de Regresso procurar estabelecer uma relao matemtica para determinar o comportamento de uma varivel Y em funo do comportamento de outras variveis X1, X2, X3, ... , Xn , ou seja: Y = f(X1, X2, X3, ... , Xn) O que se deseja poder estimar esse valor de Y estabelecendo um intervalo de confiana. Esse tipo de modelo somente ser vlido em condies bem especficas, que sero mostradas mais adiante.

Regresso Linear
Modelos de Regresso A varivel Y, em modelos de regresso, tambm poder ser chamada de varivel dependente ou explicada, enquanto que as variveis X1, X2, X3, ... , Xn sero chamadas de variveis independentes ou explicativas. A Regresso Simples ir abordar modelos com somente uma varivel explicativa X. Os demais modelos formados com mais de uma varivel explicativa sero modelos de Regresso Mltipla.

Regresso Linear
Modelos de Regresso Quanto linearidade os modelos de regresso podem ser lineares ou no lineares. Nos lineares as equaes dos modelos so do tipo y = b + a1x1 +...+ anxn. Modelos no-lineares possuiro equaes do tipo: 1. y = sen x, 2. y = x12 + x23, 3. y = log x, 4. y = a1 + a2x + a3x2 + ... + anxn , entre outros. Aqui, falaremos de modelos de Regresso Simples.

Regresso Linear
Modelos de Regresso - Aplicaes O estabelecimento dessas equaes matemticas entre as variveis proporcionar que sejam realizadas algumas aplicaes: 1. Estimarmos a mdia para a varivel dependente a partir do conhecimento de um valor para a varivel independente. 2. Explicarmos as oscilaes verificadas na varivel dependente em funo das oscilaes verificadas na varivel independente. 3. Estimativa de valores futuros para a varivel dependente.

Regresso Linear
Exemplo A tabela que se segue mostra o faturamento de uma empresa hipottica durante um perodo de 18 meses
Faturamento 25 8 27 10 26 27 29 9 16 14 27 13 20 25 22 25 20 7 Lucro Lquido 32 14 37 20 37 34 28 18 26 25 37 21 28 36 34 36 31 20

Regresso Linear
Exemplo
Diagrama de Disperso

Ao desenhar o diagrama de disperso desses valores encontramos o grfico ao lado

40 Lucro Lquido 30 20 10 0 0 10 20 Faturamento 30 40

Regresso Linear
Exemplo Este exemplo mostra uma varivel Y explicada por uma nica varivel X, sendo, portanto, um modelo de Regresso Simples. O objetivo encontrar a relao que melhor interprete o comportamento dos pontos do Diagrama de Disperso. Queremos montar um intervalo de confiana para Y em funo do valor de X. Assim, vamos determinar uma faixa de valores para Y para um dado valor de X. Para fazer isso, o primeiro passo ser estabelecer a mdia desse intervalo de confiana em funo de X.

Regresso Linear
Exemplo sabido que as retas, em grficos (X, Y), so representadas pela equao genrica: Y = AX + B onde: A = coeficiente angular B = coeficiente linear

Encontraremos a melhor reta que se adapta ao diagrama de pontos. Isso significa determinar os valores de A e de B, tal que os resduos ou erros (ei) encontrados sejam os menores possveis. Essa reta ser a mdia procurada para o Intervalo de Confiana que contm Y.

Diagrama de Disperso
40 Lucro Lquido 30 20 10 0 0 10
Xi Ypi = AXi + B Yi = AXi + B + ei

Erro ei (resduo ei)

20

30

40

Faturamento

Regresso Linear
Exemplo Para determinar os valores de A e B com essas caractersticas utilizado o Mtodo dos Mnimos Quadrados Ordinrios. Este mtodo se utiliza de clculo diferencial para achar os valores ideais de A e B que minimizam a soma dos erros ao quadrado. Aps encontrados esses valores de A e B, possvel determinar a Linha de Tendncia que melhor descreve o comportamento dos ponto do grfico.

Regresso Linear
Exemplo
Diagrama de Disperso
40 Lucro Lquido 30 20 10 0 0 10 20 Faturamento 30 40

Linha de Tendncia

Essa linha de tendncia ser a mdia para o intervalo de confiana que conter Y em funo de X.

Regresso Linear
Modelos de Regresso resduos ~ N(0, 2 = cte) Aps encontrar o valor mdio do intervalo de confiana de Y em funo de X (linha de tendncia), necessrio expor outros aspectos importantes para que seja possvel construir um modelo de regresso. Somente ser possvel construir um modelo de regresso linear simples se os resduos estiverem distribudos normalmente com mdia 0 (zero) e varincia 2 constante. Se 2 no for constante no ser possvel construir um intervalo de confiana pois ele mudar em funo de X.

Regresso Linear
Modelos de Regresso Y Varincia 2 = constante indica que ser possvel usar um mesmo valor de 2 para todo o intervalo considerado

Y1

Y2

Y3

X1

X3 Mdia 0(zero) significa que a mdia da normal est sobre a reta AX + B

X2

Y = AX + B

Regresso Linear
Modelos de Regresso resduos ~ N(0, 2 = cte) Com essa idia possvel avanar para a determinao dos intervalos de confiana. Os principais intervalos de confiana que iremos trabalhar so: IC em torno da resposta mdia IC para uma observao futura. O valor de 2 pode ser calculado como:
n n SQE 2 = onde SQE = ei = [ yi ( Axi + B )] n2 i =1 i =1 2

O Excel fornece o valor de no campo Erro-Padro

Regresso Linear
IC em Torno da Resposta Mdia Para calcular o intervalo que representa a resposta em torno da mdia ser usado o seguinte intervalo de confiana.

Y | x t 2, n 2
o

2 ) 2 1 (xo x ) + n S xx

Onde:

Y | x = A + Bxo
o

S xx = ( xi x )
i =1

Regresso Linear
IC para uma Observao Futura Para calcular o intervalo que representa a resposta em torno da mdia para uma observao futura ser usado o seguinte intervalo de confiana.

yo t 2, n 2
Onde:

2 ) 2 1 (xo x ) 1 + + n S xx

yo = A + Bxo

S xx = ( xi x )
i =1

Regresso Linear
Coeficiente de Determinao (R2)

O Coeficiente de Determinao (R2) medir a proporo da Variao de Y que poder ser explicada pela variao de X R2 ser o quadrado do valor da correlao das variveis e por isso ir variar entre 0 (zero) e 1 (um)

Regresso Linear
Coeficiente de Determinao (R2)

...

.. .... ..

R2 = 0,95

. ..... ...... R = 0,8 .


2

. ........ ....... .R. = 0,6


2

. .... .. . .. . .......

.. ..... . . .. . . . .

R2 = 0,95

R2 = 0,8

R2 = 0,6

..... . . . .. .

Regresso Linear
Observaes Importantes
Vale salientar que mesmo estabelecendo uma equao matemtica a regresso no uma condio necessria e suficiente para determinar relaes de causa e efeito entre variveis envolvidas. A relao deve ser justificada atravs de teoria econmica, financeira, cientfica etc. 1.RELACIONAMENTO INDIRETO: Supondo duas aes hipotticas A (telecomunicaes) e B (alimentos), um analista financeiro estabeleceu a seguinte equao: RA = 0,35RB + 0,5. Na prtica, alimentos no influenciaro o mercado de telecomunicaes e vice-versa. Tal relacionamento poder ser explicado pelos movimentos prprios do mercado, indicando um relacionamento indireto entre A e B.

Regresso Linear
Observaes Importantes (Cont.)
2. PREVISO: Apesar das Linhas de Tendncia possurem esse nome, elas no necessariamente iro explicar os pontos posteriores. Esta linha servir para explicar, com alguma confiana, pontos que estejam dentro do intervalo em estudo. Os valores seguintes somente sero inferidos, caso o fenmeno em estudo seja de conhecimento e se possa fazer tal tipo de previso. 3. RELACIONAMENTO ESPRIO: Podem ocorrer certos tipos de coincidncias curiosas. Supondo um exemplo hipottico onde se comparam a rentabilidade mensal de uma ao A e o nmero de dias de sol ocorridos nesse ms. Dados assim sugerem prever rentabilidade, que um fenmeno econmico-administrativo, utilizando a meteorologia. Isso curioso, porm absurdo!

Regresso Linear
Colocando o Exemplo no Excel
O conjunto de dados emparelhados gerou o seguinte diagrama de disperso.

Diagrama de Disperso
40 35

Lucro lquido

30 25 20 15 10 5 0 0 5 10 15

Faturamento

1. Apertar o boto 2. Apertar: direito sobre os pontos adicionar linha de 20 25 30 35 tendncia

Regresso Linear
Colocando o Exemplo no Excel

Regresso Linear
Colocando o Exemplo no Excel

Diagrama de Disperso
40 35

Lucro lquido

30 25 20 15 10 5 0 0 5 10 15 20 25 30 35

y = 0,9014x + 11,028 2 R = 0,8331

Faturamento

Regresso Linear
Colocando o Exemplo no Excel

Para fazer anlises mais detalhadas siga os passos ao lado.

Regresso Linear
Colocando o Exemplo no Excel
1. Selecionar os intervalos x e y na planilha. 2. Selecionar o clculo dos resduos. 3. Selecionar a plotagem dos resduos. 4. Selecionar a plotagem de probabilidade normal 5. Selecione Nova Planilha e por fim, aperte OK.

Regresso Linear
Colocando o Exemplo no Excel

Regresso Linear
Colocando o Exemplo no Excel

Regresso Linear
Colocando o Exemplo no Excel 1. Plotagem de resduos
Varivel X 1 Plotagem de resduos
4 2 Resduos 0 10 20 30 40
Y 40 35 30 25 20 15 10 5 0 0 20 40 60 80 100 120 Percentil da amostra

2. Plotagem de Probabilidade Normal


Plotagem de probabilidade normal

0 -2 -4 -6 -8 -10 Varivel X 1

Regresso Linear
Colocando o Exemplo no Excel Plotagem de resduos
ei ei

Ideal:
= cte mdia = 0

ei

ei

Regresso Linear
Significado das avaliaes mostradas no Excel R Mltiplo ndice especial para a regresso mltipla. Indica o grau de relacionamento linear entre os valores reais e estimados para a varivel Y. Na regresso simples o seu valor equivale raiz quadrada de R2. R-quadrado J mencionado R-quadrado ajustado quando se trabalha com regresso mltipla, este ndice ser mais apropriado. Quando a incluso de outra varivel implicar no crescimento do seu valor, indicar que ser benfico para o modelo a incluso de mais variveis.