Você está na página 1de 19

Fidel Diamante Mateus

Frank Bartolomeu Mário Guidione

Guido Tito Pinto

Hélder Vicente Miguel

Sancho Alfredo

SISTEMAS DE EQUAÇÕES DE REGRESSÃO LINEAR

(Licenciatura em Ensino de Matemática com Habilitação em Estatística – 4º Ano)

3º Grupo

Universidade Rovuma

Lichinga

2024
2

Fidel Diamante Mateus

Frank Bartolomeu Mário Guidione

Guido Tito Pinto

Hélder Vicente Miguel

Sancho Alfredo

SISTEMAS DE EQUAÇÕES DE REGRESSÃO LINEAR

(Licenciatura em Ensino de Matemática com Habilitação em Estatística – 4º Ano)

3º Grupo

Trabalho de pesquisa da Cadeira de


Econometria Básica, a ser apresentado no
departamento de Ciências Tecnologia
Engenharia e Matemática, para fins
avaliativos:

Orientador

MSc. Juma Mayawo


(Assistente Universitário)

Universidade Rovuma
Lichinga
2024
3

Índice
1. Introdução................................................................................................................................. 4

1.1. Objectivos ......................................................................................................................... 4

1.1.1. Objectivo geral .......................................................................................................... 4

1.1.2. Objectivos específicos ............................................................................................... 4

1.2. Metodologia ...................................................................................................................... 4

2. Sistemas de Equações de Regressão Linear ............................................................................. 5

2.1. Apresentação do modelo ................................................................................................... 5

2.2. Hipóteses do modelo ......................................................................................................... 6

2.2.1. Hipótese SER.1 – Linearidade .................................................................................. 6

2.2.2. Hipótese SER.2 – Estacionaridade ergódica ............................................................. 6

2.2.3. Hipótese SER.3 – Ortogonalidade ............................................................................. 6

2.2.4. Hipótese SER.4 – Condições de característica .......................................................... 7

2.2.5. Hipótese SER.5 – Diferença-martingala ................................................................... 8

2.3. O modelo generalizado dos momentos ........................................................................... 12

2.3.1. Propriedades do estimador MGM e inferência estatística ....................................... 13

2.4. Estimação conjunta versus estimação separada .............................................................. 14

2.5. Implicações da homocedasticidade condicionada .......................................................... 15

2.5.1. Implicações .............................................................................................................. 16

2.6. Coeficientes comuns ....................................................................................................... 16

3. Conclusão ............................................................................................................................... 18

4. Referências bibliográficas ...................................................................................................... 19


4

1. Introdução

A econometria está relacionada à aplicação de métodos estatísticos e matemáticos para analisar e


medir o comportamento de variáveis económicas. A regressão linear é uma técnica estatística
amplamente utilizada para modelar a relação entre uma variável dependente e uma ou mais
variáveis independentes. Este trabalho explora os conceitos fundamentais da regressão linear,
incluindo os modelos de regressão, o método dos momentos generalizados (GMM), estimação
conjunta versus estimação separada, homocedasticidade condicionada e coeficientes comuns.

1.1.Objectivos
1.1.1. Objectivo geral
 Compreender os sistemas de equações de regressão linear.
1.1.2. Objectivos específicos
 Apresentar o modelo de regressão linear e as hipóteses do modelo;
 Explicar o modelo generalizado dos momentos; estimação conjunta versus estimação
separada; implicações da homocedasticidade condicionada; e Coeficientes Comuns;
 Interpretar os resultados obtidos.
1.2.Metodologia

Este trabalho realizou-se através das referências bibliográficas e de algumas investigações mais
amplas pela internet.
5

2. Sistemas de Equações de Regressão Linear

Segundo HOFFMANN, R. (2016) “Um sistema de equações de regressão linear envolve várias
equações de regressão que estão interligadas de alguma forma. Por exemplo, podemos ter um
sistema de equações onde várias variáveis dependentes estão sendo agredidas em várias variáveis
independentes comuns.”

Um sistema de equações de regressão linear é um conjunto de equações que descrevem as


relações entre múltiplas variáveis independentes e uma variável dependente. Cada equação no
sistema representa uma relação específica entre as variáveis independentes e a variável
dependente. O objectivo é encontrar os coeficientes de regressão que melhor representam essas
relações, minimizando a soma dos quadrados dos resíduos.

Resolver um sistema de equações de regressão linear envolve encontrar os valores dos


coeficientes que melhor se ajustam aos dados observados, usando técnicas como o método dos
mínimos quadrados. Uma vez que os coeficientes são determinados, podemos usar o modelo para
fazer previsões ou inferências sobre a variável dependente com base nos valores das variáveis
independentes.

2.1.Apresentação do modelo

O modelo de regressão linear é usado para descrever a relação entre uma variável dependente e
uma ou mais variáveis independentes. A equação do modelo de regressão linear é expressa como:

Onde:

- A variável dependente da i-ésima observação;

– é a intercessão ou o intercepto;

– Coeficiente de regressão associado à variável ;

- Coeficiente de regressão associado à variável ;

- Coeficiente de regressão associado à variável ;


6

- Termo de erro da i-ésima observação.

Este modelo permite analisar a influência de diversas variáveis independentes sobre uma variável
dependente. A interceptação representa o valor de Y quando todas as variáveis independentes são
iguais a zero. Os coeficientes de regressão indicam a mudança em Y para uma mudança de uma
unidade em X específica, mantendo as outras variáveis independentes constantes. O termo de erro
representa a diferença entre o valor observado de Y e o valor previsto pelo modelo.

2.2.Hipóteses do modelo

As hipóteses do modelo de regressão linear são importantes para garantir a validade das
inferências que podem ser feitas a partir dos resultados. As hipóteses têm o prefixo SER (sistema
de equações de regressão linear). As hipóteses do modelo são:

2.2.1. Hipótese SER.1 – Linearidade

, onde é a variável dependente, é a variável independente,


é o coeficiente de regressão e é o termo de erro.

Esta hipótese refere-se à suposição de que a relação entre as variáveis Y e X é linear, ou seja, de
acordo com CHEIN, F. (2019, p.20) “os betas do modelo populacional entram de forma linear na
equação.”

2.2.2. Hipótese SER.2 – Estacionaridade ergódica

O processo estocástico – dimensional é


estacionário ergódico.

Esta hipótese sugere que as propriedades estatísticas do processo gerador dos dados permanecem
inalteradas ao longo do tempo. Em outras palavras, não há mudanças sistemáticas na média ou na
variabilidade das variáveis ao longo do tempo.

2.2.3. Hipótese SER.3 – Ortogonalidade

Os vectores são ortogonais às respectivas variáveis residuais,


, onde [o elemento genérico deste vector é ( )].
7

Facilmente se verifica que o número total de condições de ortogonalidade é p.

Fazendo [ ], as m condições podem ser escritas da seguinte forma:

. Onde .

A hipótese SER.3 é a hipótese mais fraca de não correlação entre variáveis instrumentais e
variáveis residuais; nem sequer exige ortogonalidades “cruzadas” (não estabelece, por exemplo,
que é ortogonal a ). Podem estabelecer-se hipóteses mais fortes do que SER.3:

1) . Esta hipótese admite que existam ortogonalidades entre


cada variável instrumental e cada variável residual para a mesma equação e para equações
diferentes (intra-equações e inter-equações).
2) , e, portanto, . As condições
estabelecidas implicam que não há correlação entre e qualquer função de . Admite-
se, portanto, que as formas funcionais das variáveis instrumentais escolhidas estão bem
especificadas.
3) [ ]. Estas condições implicam que não existe correlação
entre qualquer e qualquer função de todas as variáveis instrumentais
do modelo. Assim, supõe-se que as formas funcionais dos instrumentos considerados no
modelo estão bem especificadas.

É imediato concluir que estas condições são sucessivamente mais fortes. No entanto, a hipótese
SER.3 é suficiente para estabelecer as propriedades assintóticas desejáveis dos estimadores
MGM dos parâmetros do modelo: consistência e normalidade assintótica.

Contudo, a ortogonalidade refere-se à independência linear entre as variáveis independentes. Isso


significa que as variáveis independentes não devem estar correlacionadas entre si. Se houver
correlação entre as variáveis independentes, pode haver multicolinearidade, o que pode levar a
estimativas imprecisas dos coeficientes.

2.2.4. Hipótese SER.4 – Condições de característica

As matrizes do tipo ,
8

existem e verificam, ( ) .

2.2.5. Hipótese SER.5 – Diferença-martingala

O processo é uma diferença-martingala,

A matriz quadrada de ordem p,

existe e tem inversa.

Neste caso, a matriz S tem a seguinte forma:

[ ]

O modelo econométrico que verifica as hipóteses SER.1 a SER.5 designa-se por sistema de
equações de regressão linear (SER), admitindo-se a possibilidade de existirem regressores
endógenos.Estas hipóteses são importantes para garantir a validade dos resultados da análise. A
violação de qualquer uma dessas hipóteses pode levar a resultados incorrectos ou enganosos.

Exemplo: Suponha que estamos analisando o desempenho académico de alunos em duas


disciplinas diferentes: Matemática ( ) e Português ( ). Queremos examinar como o tempo de
estudo ( e a quantidade de sono ( ) afectam o desempenho dos alunos em ambas as
disciplinas.

Vamos supor que temos os seguintes dados para cinco alunos:


9

Tempo de Quantidade Nota em Nota em


Aluno
estudo ( ) de sono ( Matemática ( ) Português ( )
1 4 8 13 11
2 6 6 17 14
3 5 7 15 12
4 7 5 19 15
5 3 9 11 8

1º Passo: Estimar as equações de regressão:

Podemos formular o sistema de equações de regressão linear da seguinte forma:

Para Matemática:

Para Português:

Onde:

 e são as variáveis dependentes para Matemática e Português, respectivamente.

 e são as variáveis independentes comuns para ambas as equações.

 , , , , , são os coeficientes de regressão a serem estimados.

 e são os termos de erros associados a cada equação.

O modelo de regressão linear será:

Vamos usar os dados fornecidos para estimar os coeficientes , , , , ,e para cada


disciplina usando o método dos mínimos quadrados ordinários (MQO).

Para Matemática:
10

i. Calcular a media das variáveis:

ii. Calcular os desvios das variáveis em relação às médias:

iii. Calcular o produto dos desvios de Matemática, tempo de estudo e quantidade de


sono:

iv. Calcular a soma dos quadrados dos desvios de tempo de estudo e quantidade de
sono:

v. Calcular a soma dos produtos dos desvios

vi. Estimar , ,e

̂ ̂

̂
11

Portanto, para Matemática, os coeficientes estimados são ̂ e ̂ ̂


vii. Calcular o resíduo (erro) e Verificar a Homocedasticidade Condicionada
̂ (̂ ̂ ̂ )

Para Português:

Os passos para calcular os coeficientes para Português são os mesmos que os anteriores, e,
portanto, para Português, os coeficientes estimados são e

̂ ̂ ̂ ̂

Passo 2: Análise e interpretação dos resultados

Para Matemática:

 Intercessão : 15
 Coeficiente de tempo de estudo ( ): 0
 Coeficiente de quantidade de sono ( ): 0

Isso significa que o tempo de estudo e a quantidade de sono não afectam o desempenho dos
alunos em Matemática, mantendo todas as outras variáveis constantes.

Para Português:

 Intercessão : 12
 Coeficiente de tempo de estudo ( ): 0
 Coeficiente de quantidade de sono ( ): 0

Isso significa que o tempo de estudo e a quantidade de sono não afectam o desempenho dos
alunos em Português, mantendo todas as outras variáveis constantes.
12

 As intercessões indicam as notas esperadas quando o tempo de estudo e quantidade de


sono é zero. Isso pode não fazer sentido no contexto, já que é impossível estudar e dormir
zero horas.
 Os coeficientes de tempo de estudo e a quantidade de sono são idênticos nas duas
equações, o que sugere que o efeito de tempo de estudo e quantidade de sono é o mesmo
em todas as disciplinas.
 A variância dos resíduos não é constante para todos os valores de e . Sendo assim, a
homocedasticidade condicionada não é satisfeita, os resíduos não têm uma dispersão
uniforme em torno de zero para todos os níveis das variáveis independentes.
2.3.O modelo generalizado dos momentos

O modelo generalizado dos momentos (MGM) é usado quando as hipóteses do modelo de


regressão linear não são satisfeitas. O MGM é um método de estimação que permite que as
hipóteses do modelo sejam relaxadas. O objectivo do MGM é minimizar uma função de
momentos para encontrar as estimativas dos parâmetros do modelo.

O MGM baseia-se na ideia de que as expectativas de certos momentos da amostra são iguais às
expectativas dos momentos da população.

A fórmula do MGM é:

[ ]

Onde:

é uma função dos parâmetros do modelo e do termo de erro da i-ésima observação.

[ ] é o operador de expectativa.

é o peso da i-ésima observação.

é o termo de erro da i-ésima observação.

O MGM é um método flexível que pode ser utilizado para estimar os parâmetros de uma ampla
gama de modelos de regressão. O método é robusto à violação da homocedasticidade e da
normalidade do termo de erro.
13

Aqui estão os passos básicos para calcular o MGM de um sistema de equações de regressão
linear:

1. Defina o modelo: Comece definindo o modelo de regressão linear que você deseja
estimar. Isso inclui identificar as variáveis dependentes e independentes.

2. Identifique os momentos: Identifique os momentos que serão usados na estimação. Os


momentos são estatísticas descritivas das distribuições das variáveis, como a média, a
variância e assim por diante.

3. Estime os parâmetros: A ideia principal do MGM é encontrar os valores dos parâmetros


que tornam os momentos teóricos calculados a partir do modelo estatístico mais próximos
possível dos momentos empíricos observados nos dados. Isso é feito minimizando uma
função de distância entre os momentos empíricos e teóricos.

4. Verifique as condições: Para que o MGM seja válido e produza estimativas consistentes
dos parâmetros, é necessário que seja a solução única para a equação e também pertença a
um espaço compacto.

5. Interprete os resultados: Finalmente, interprete os resultados da sua estimação. Os


coeficientes estimados lhe darão uma ideia da relação entre as variáveis no seu modelo.

2.3.1. Propriedades do estimador MGM e inferência estatística

Propriedade 1: seja ̂ um estimador consistente de , verificando-se as hipóteses SER.1 e


SER.2, e existindo , vem

onde

̂ ∑̂ ̂

desde que exista esse valor esperado.


14

Propriedade 2: Considerem-se os resíduos ̂ ̂ onde ̂ é o


estimador consistente de , e a seguinte hipótese adicional: existem os momentos

{( ) }, para [ é o elemento genérico

do vector (que tem componentes); é o elemento genérico do vector (que tem


componentes)]. Se existir a matriz S, as hipóteses SER.1 e SER.2 implicam que ̂ , é estimador
consistente de S.

2.4.Estimação conjunta versus estimação separada

A estimação conjunta dos parâmetros de um sistema de equações de regressão linear envolve


estimar todos os parâmetros simultaneamente, ou seja, a estimação conjunta é utilizada quando há
duas ou mais equações de regressão relacionadas e as variáveis independentes estão presentes em
todas as equações. A estimação separada envolve estimar cada equação do sistema
separadamente, ou seja, a estimação separada é usada quando as variáveis independentes não
estão presentes em todas as equações. A escolha entre estimação conjunta e estimação separada
depende da estrutura do modelo. A estimação conjunta é geralmente mais eficiente do que a
estimação separada, pois leva em consideração a correlação entre as equações.

No entanto, esta estimação apresenta alguns inconvenientes práticos. Por um lado, a qualidade
dos estimadores dos coeficientes de uma dada equação, no caso de amostras pequenas, pode
melhorar fazendo-se a estimação separada.

Para calcular a estimação (seja ela conjunta ou separada), pode-se usar o método dos mínimos
quadrados. Aqui está um exemplo simplificado de como pode-se calcular a estimação para uma
única equação de regressão linear:

1. Defina a equação de regressão: A equação de regressão linear tem a forma


, onde é a variável dependente, é a variável independente, é a interceptação e
é a inclinação.

2. Calcule os coeficientes de regressão: Os coeficientes de regressão e podem ser


calculados usando as seguintes fórmulas:
15

̅ ̅

Onde é a soma dos produtos das diferenças entre cada ̅ e a média de e cada ̅ e a média
de , a soma dos quadrados das diferen as entre cada e a m dia de , a m dia de
e a m dia de .

3. Substitua os coeficientes na equação de regressão: Agora você pode substituir os


coeficientes a e b calculados na equação de regressão para obter a equação final.

2.5.Implicações da homocedasticidade condicionada

Homocedasticidade condicionada é uma propriedade de modelos de regressão linear que indica


que a variabilidade dos erros de previsão é constante em toda a faixa de valores das variáveis
independentes. Em outras palavras, a dispersão dos erros ao redor da linha de regressão é
uniforme, não variando de acordo com os níveis das variáveis independentes

George E. P. Box defende que a homocedasticidade condicionada refere-se à propriedade dos


erros de previsão terem a mesma variância para todos os níveis das variáveis independentes em
um modelo de regressão linear;

Hipótese SER.6 – Homocedasticidade condicionada: Tem-se , para


.

Exemplo: Consideremos um estudo que investiga a relação entre a quantidade de chuva (em
milímetros) e a produção de trigo (em toneladas) em uma determinada região agrícola ao longo
de vários anos. Se os erros de previsão da produção de trigo (isto é, a diferença entre a produção
observada e a produção prevista pelo modelo de regressão) tiverem a mesma variância para todos
os níveis de chuva, então o modelo exibe homocedasticidade condicionada.

Se o modelo prevê a produção de trigo com base na quantidade de chuva e os erros de previsão
(diferença entre a produção real e a produção prevista pelo modelo) não variarem
significativamente, independentemente de quanto choveu em um determinado ano, então o
modelo atende à condição de homocedasticidade condicionada.
16

A homocedasticidade condicionada é uma suposição importante em modelos de regressão linear,


pois garante a validade das inferências feitas a partir do modelo e a precisão das estimativas dos
parâmetros.

2.5.1. Implicações

1. Estimativas de Coeficientes Precisas: A homocedasticidade condicionada garante que as


estimativas dos coeficientes de regressão sejam precisas e não enviesadas, pois os erros de
previsão têm a mesma variância em todos os níveis das variáveis independentes.

2. Testes de Hipóteses Válidos: A validade dos testes de hipóteses para os coeficientes de


regressão depende da homocedasticidade condicionada. Se essa condição não for
atendida, os testes podem produzir resultados incorrectos, levando a conclusões erróneas
sobre a significância das variáveis independentes.

3. Intervalos de Confiança Acurados: A homocedasticidade condicionada é fundamental


para a precisão dos intervalos de confiança das estimativas dos coeficientes de regressão e
das previsões do modelo. Se os erros de previsão variarem em diferentes níveis das
variáveis independentes, os intervalos de confiança podem ser imprecisos.

2.6.Coeficientes comuns

De acordo com RIBEIRO, C.S. (2014, p.415) “ Em muitas aplicações, em particular no contexto
de dados de painel, trabalha-se com um caso especial de modelo de equações múltiplas, onde o
número de regressores é o mesmo para todas as equações, e os coeficientes de regressão são os
mesmos. Diz-se, então, que o modelo tem coeficientes comuns.”

Nos modelos de regressão, os coeficientes comuns referem-se à situação em que os coeficientes


de regressão são os mesmos para diferentes grupos ou subconjuntos de dados. Isso significa que a
relação entre as variáveis independentes e a variável dependente é consistente em todos os
grupos, não havendo variação nos efeitos entre eles.

Por exemplo, suponhamos que estamos estudando o desempenho acadêmico dos alunos em
diferentes escolas e queremos entender como a quantidade de horas de estudo influencia o
desempenho nos exames. Podemos usar um modelo de regressão para isso, incluindo horas de
17

estudo como variável independente e o desempenho nos exames como variável dependente. Se os
coeficientes para "horas de estudo" forem os mesmos em todas as escolas, então temos
coeficientes comuns.

Os coeficientes comuns simplificam o modelo, reduzindo a complexidade e o número de


parâmetros a serem estimados. Isso pode ser útil quando há pouca variação nos efeitos entre os
grupos ou quando há limitações de dados para estimar coeficientes separados com precisão.
18

3. Conclusão

Portanto, o modelo de regressão linear é uma técnica útil e popular na economia e na


econometria. Para que as inferências sejam válidas, é importante que as hipóteses do modelo
sejam respeitadas. O modelo generalizado dos momentos é uma técnica útil para estimar
parâmetros de um modelo quando as hipóteses do modelo não são completamente satisfeitas. A
escolha entre estimação conjunta e estimação separada depende da estrutura do modelo. A
homocedasticidade condicionada pode ter implicações significativas na interpretação dos
resultados do modelo. Finalmente, os coeficientes comuns podem ser úteis para restringir
parâmetros à medida que a estrutura do modelo é desenvolvida.
19

4. Referências bibliográficas

CHEIN, F. (2019). Introdução aos modelos de regressão linear: um passo inicial para
compreensão da econometria como uma ferramenta de avaliação de políticas públicas. Brasília:
Enap.

HOFFMANN, R. (2016). Análise de regressão: uma introdução à econometria [recurso


eletrônico]. 5. ed. Piracicaba: Autor

RIBEIRO, C.S. (2014). Econometria. Escolar Editora.

Você também pode gostar