Você está na página 1de 9

UNIVERSIDADE ZAMBEZE

Faculdade de Ciências Sociais e Humanidade

Disciplina: Métodos Quantitativos (Curso: Contabilidade e Finanças, 3o ano)

Aula Teórica 8

Tema: Análise de regressão

 Execução das etapas da análise de regressão

1. Selecção e preparação de variáveis


Em função das variáveis presentes na base de dados são selecionadas as variáveis de
interesse para analise do seu comportamento (interacção ).
Exemplo: Considere a planilha de dados referentes a um certo produto produzido e
vendido na empresa MAWETO.

Ano Gastos em Custos de Lucros


publicidade produção

2010 1,5 5,3 10,1

2011 1,6 5,6 10,3

2012 1,6 6,7 10,2

2013 1,8 7,3 10,0

2014 1,7 8,3 9,5

2015 1,3 9,4 9,3


2. Ajuste do Modelo económico e estatístico

a) O modelo económico,
A construção do modelo económico pressupõe a identificação da variável dependente
e independente(s) em função do conhecimento da teoria económica. No caso da
organização Maweto, estão em estudos as seguintes variáveis: Gastos em publicidade,
Custos de produção, Lucros. Onde o lucro representa a variável dependente, sendo
que os gastos em publicidade e custos de produção são as variáveis independentes.

b) O modelo estatístico
Essencialmente o modelo estatístico esta directamente interligado ao processamento
de dados com recurso a aplicativos informáticos (Excell, SPSS, Eviews entre outros).
O processamento tem em vista, a criação de um modelo linear capaz de representar a
relação linear entre as variáveis.
Modelo: Y= α+β1X1+...+ βnXn + e

Onde: Y é a variável independente (para o caso da empresa MAWETO é o Lucro)


Xn são as variáveis dependentes (para o caso da empresa MAWETO são os
gastos em publicidade e custos de produção)

Em termos concretos, o modelo final será dado por,


Lucro= α + β1*gastos em publicidade + β2*(custos de produção) + resíduos

Nota 1: essencialmente o processamento dos dados vai permitir obter, os valores do


parâmetro α e dos parâmetros β. Onde o α representa a constante.

Nota 2: Os resíduos não sao observáveis no modelo, mas devem ser diagnosticados.

Nota 2: Os testes estatísticos permitem avaliar a significância(validade) dos


parâmetros no modelo.
Teste t
O teste t avalia, de cada vez cada, um dos coeficiente (parâmetros) de regressão com
recurso a análise da probabilidade, isto é, os parâmetros que tiverem um valor da
probabilidade (P-value) inferior que 5%(0,05) são validados pelo modelo, e os que
tiverem um valor superior que 5%( 0,05) são retirados do modelo.

Exemplo: Supondo que os parâmetros do modelo da empresa MAWETO, após o


processamento, sejam:
α = 3,4 com P-value (0,00)
β1= 2,3 com P-value (0,09)
β2= - 0,2 com P-value (0,03)

Em função do teste vamos invalidar o parâmetros β1, e teremos o seguinte modelo


final:
Lucro= 3.4 – 0,2 *(custos de produção) + e

Teste F
O teste F avalia globalmente a existência do modelo, isto é, se o valor da
probabilidade (P-value) inferior que 5%(0,05) o modelo é validado, e se for inferior
que (0,05) o modelo não existe.

Nota: A validação do modelo com recurso ao teste t nao pressupõem a validação de


todos parâmetros.

Coeficiente de correlação (r)

O coeficiente de correlação permite medir as relações entre variáveis  e o que elas


representam. Isto é a correlação procura entender como uma variável se comporta em um
cenário onde outra está variando, visando identificar se existe alguma relação entre a
variabilidade de ambas. Embora não implique em causalidade, o coeficiente de correlação
exprime em números essa relação, ou seja, quantifica a relação entre as variáveis.
Nota 1 : Quando o coeficiente de correlação se aproxima de 1, nota-se um aumento no valor
de uma variável quando a outra também aumenta, ou seja, há uma relação linear positiva.

Nota 2 : Quando o coeficiente se aproxima de -1, também é possível dizer que as variáveis
são correlacionadas, mas nesse caso quando o valor de uma variável aumenta o da outra
diminui. Isso é o que é chamado de correlação negativa ou inversa.

Nota 3: Um coeficiente de correlação próximo de zero indica que não há relação entre as duas
variáveis, e quanto mais eles se aproximam de 1 ou  -1, mais forte é a relação.

Para o caso da empresa MAWETO pode dar-se o caso da correlação entre as variáveis ser :

Lucro e gastos em publicidade( r = 0,6)

Lucro e custos de produção (r = - 0,3)

Custos de Produção e gastos em publicidade (r = 0,01)

3. Diagnóstico dos resíduos do Modelo

Os resíduos contém informação sobre o motivo do modelo não ter se ajustado bem aos dados,
assim sendo, o diagnóstico permite saber, em que medida o modelo é capaz de representar
corretamente o fenómeno em estudo.

Nota: Caso os resíduos não estejam devidamente controlados, o modelo pode sofrer de
efeitos espúria que representa uma previsão dominada por factores exógenos ao modelo.

a) A linearidade

As análises de regressão pressupõem que os resíduos da variável dependentes tenham uma


relação linear com cada uma das variáveis independentes.A linearidade é observada por meio
ao teste dos resíduos, efectuado com recurso ao gráfico de resíduos.

No gráfico abaixo verifica-se uma linearidade, na medida que os resíduos encontram-se


distribuídos em torno do eixo, de forma homogénea.

1
Unstandardized Residual

-1

-2

-3
11 12 13 14 15 16

Unstandardized Predicted Value

Nota: Se Distribuição dos resíduos apresenta uma tendência não linear a


solução passa por incorporar novas variáveis explicativas ao modelo, ou considerar alguma
transformação em X e/ou Y, ou utilizar algum modelo de regressão não linear
b) Normalidade

O modelo de regressão supõem que todos erros estejam distribuidos normalmente(mesma


media, moda e mediana), a normalidade ee testada com recurso ao Testes de normalidade
(Shapiro-Wilk,).

Se P-value for maior que 0,05 afirmamaos que se verifica a normalidade.

Assim, podemos afirmar com nível de significância de 5% que os residuos provém de uma
população normal.

c) Variância (Homocedasticidade)

O modelo de regressão supõem que todos erros tenham a mesma variancia , a


Homoscedsticidade ee testada com recurso ao teste de Breusch-Pagan

Se P-value for maior que 0,05 afirmamaos que nao se verifica a Homoscedasticidade
d) Correlação (Autocorreção entre os residuos )

Testa o grau de dependência entre os resíduos, isto e, se os resíduos estão


correlacionados. O modelo de regressão pressupõe a inexistência da correlação entre os
resíduos.
O teste de resíduos é feito com recurso ao Durbin-Watson.Este indicador situa-se
simetricamente em torno do 2, no interval de 0 a 4

Nota 1: Se for maior que 2 estamos perante uma correlação negativa


Nota 2:Se for menor que 2 estamos perante uma correlação postiva
Nota 3: Se for aproximadamente igual a 2 nao existe correlacao

Qualidade do Modelo

A qualidade do modelo corresponde a uma analise dos factores que afectam a capacidade
explicativa das variáveis independente relativamente as variáveis dependentes do modelo.

a) Coeficiente de Determinacao (R2)

Mede a qualidade do ajuste do modelo, ou por outra, indica quanto o modelo é capaz de
explicar o efeito que as variáveis independentes causam as variáveis dependentes. Varia
de 0 a 1 ou por outra, de 0% a 100%.

Nota1 : Quando R2 inferior que 0,5 classificasse como sendo Mau


Nota2: Quando R2 esta entre 0,51 a 0,70 classificasse como sendo Razoavel
Nota 3: Quando R2 esta entre 0,71 a 0,90 classificasse como sendo Bom
Nota 4: Quando R2 esta acima de 0.9 classificasse como sendo Muito Bom
b) Multicolinearidade

Multicolinearidade representa a existência de relação linear entre uma variável explicativa


e as demais. Ou por outra podemos afirmar que representa a correlação entre as variáveis
independentes.

Quando trabalhamos com mais de uma variável regressora, é muito importante verificar
se essas variáveis explicativas são correlacionadas. Desta forma, se não houver nenhum
relacionamento entre elas, dizemos que nao apresentam colinearidade. O que significa
que o modelo é adequado.

Nota: felizmente a existência de Muiticolinearidade não compremete o modelo . Mas se


as variáveis forem muito correlacionadas, as inferências baseadas no modelo de regressão
podem ser errôneas ou pouco confiáveis. Na medida que estaremos perante um grau
dependência acentuado entre as variáveis independentes.

A multicolinearidade ee medida com recurso ao VIF.

Nota: Se o VIF for maior que 10 logo existe a Multicolinearidade.

Aplicação do Modelo

a) Previsão

O uso do modelo para previsão consiste na aplicação de valores das variáveis.

Ex: Lucro= 3.4 – 0,2 *(custos de produção)


Se custo de produção for igual a 10, o lucro será igual a 1.4 u.m

b) Interpretação do Modelo

Consiste na analise geral do modelo final com recurso aos coeficientes do modelo.

Ex: com acréscimo de uma unidade de custo de produção, o lucro reduz em 0,2 unidades.
`

Você também pode gostar