Você está na página 1de 12

Índice

1. Introdução ........................................................................................................................... 2

2. Teste de Normalidade ......................................................................................................... 3

3. Análise de Regressão Múltipla ........................................................................................... 5

4. O Problema da Estimação................................................................................................... 5

5. O problema da inferência ................................................................................................... 9

6. Conclusão ......................................................................................................................... 11

7. Referências bibliográficas ................................................................................................ 12


1. Introdução

O presente trabalho com tema teste de normalidade pretende-se fazer uma abordagem sobre
parâmetros desconhecidos, testar hipóteses em relação entre variáveis económicas. Em
particular dos subtemas que compõem a análise de regressão múltipla, o problema da
estimativa e o problema da inferência.

Nós expressamos nossas idéias sobre relações entre variáveis econômicas, utilizando o
conceito matemático da função de regressão múltipla. No caso da Regressão Linear Múltipla,
a diferença fundamental reside no número de variáveis explicativas, que agora não fica limitada
a apenas uma, mas podendo expandir este número para quantas variáveis explicativas forem
necessárias.

Quando temos três ou mais variáveis denominamos o processo de regressão múltipla, porém,
nos limitaremos a seguir à regressão linear múltipla com três variáveis.

Objectivo Geral: abordar de forma clara e objectiva o teste de normalidade.

Objetivos Específicos: demonstrar variáveis explicativas, variável independente.

Metodologia: Neste estudo, utilizamos inicialmente a pesquisa em fontes bibliográficas,


através da busca por documentos que tratassem da temática de forma explicativa. Tratando-se
de trabalhos no âmbito da reflexão teórica, tais documentos são basicamente textos: livros,
artigos, etc.

2
2. Teste de Normalidade

Os testes de normalidade são usados para determinar-se um conjunto de dados de uma


dada variável aleatória, é bem modelada por uma distribuição normal ou não, ou para calcular
a probabilidade da variável aleatória subjacente estar normalmente distribuída.

Testar a normalidade dos resíduos de uma regressão linear. A regressão linear só deve ser
usada se os erros são normais, portanto, caso o teste aponte que esta premissa é inválida, os
resultados da regressão (intervalos de confiança, etc) não podem ser usados. Neste caso, o
modelo deve ser modificado (introduzindo outras variáveis explanatórias ou mudando o
modelo) para que os erros se comportem como uma variável normal.

Embora a literatura específica examine vários testes de normalidade, consideraremos apenas


de três: (1) histograma de resíduos; (2) representação de probabilidade normal, um artifício
gráfico; e (3) o teste Jarque-Bera.

Histograma de resíduos
O histograma dos resíduos mostra a distribuição dos resíduos para todas as observações. Usa-
se o histograma de resíduos para determinar se os dados são assimétricos ou se incluem
outliers. Um histograma é mais eficaz quando tem aproximadamente 20 ou mais pontos de
dados. Se a amostra é muito pequena, então cada barra no histograma não contém pontos de
dados suficientes para confiavelmente mostrar assimetria ou outliers.

No eixo horizontal, dividimos os valores da variável de interesse (no caso, os resíduos de


MQO) em intervalos adequados e, em cada intervalo de classe, traçamos retângulos com altura
correspondente ao número de observações (sua frequência) nesse intervalo de classe.

Este histograma dos resíduos padronizados revela um padrão simétrico, em formato de sino,
indicando que os resíduos não estão assimétricos e que não há outliers.

3
Gráfico de probabilidades normal
Um gráfico de probabilidade normal é uma maneira simples de medir o quão normal são os
dados, independentemente da quantidade de dados que estão disponível. Com um conjunto de
dados de um processo ou característica do produto.

O gráfico de probabilidade normal mostra os resíduos padronizados versus seus valores


esperados quando a distribuição é normal.

Usa-se o gráfico de probabilidade normal para verificar a pressuposição de que os resíduos são
distribuídos normalmente. O gráfico de probabilidade normal deve seguir aproximadamente
uma linha reta. No eixo horizontal, marcamos os valores da variável de interesse (no caso, os
resíduos de MQO, ui ) e no eixo vertical, representamos o valor esperado para essa variável
caso estivesse normalmente distribuída. Se a variável provém de facto de uma população
normal, o GPN será aproximadamente uma linha reta.

Teste de normalidade Jarque-Bera

O teste de normalidade JB é um teste assintótico ou de amostra grande. Também se baseia nos


resíduos de MQO. Ele calcula, primeiro, a assimetria e a curtose dos resíduos de MQO e usa o
seguinte teste estatístico:

4
Onde:
n - tamanho da amostra;
S - coeficiente de assimetria;
K - coeficiente de curtose.

Para uma variável normalmente distribuída, S=0 e K=3. Portanto, o teste JB de normalidade é
um teste da hipótese conjunta de que S e K são iguais a 0 e 3, respectivamente. Nesse caso,
espera-se que o valor da estatística JB seja igual a 0.

3. Análise de Regressão Múltipla

Na regressão múltipla são consideradas duas ou mais variáveis explicativas (𝑥𝑖 ) , como por
exemplo: salário (𝑥1 ), renda de aluguel (𝑥2 ), renda de investimento (𝑥3 ), etc. que influenciam
a variável dependente 𝑦𝑖 .

O mais simples dos modelos de regressão múltipla é a regressão de três variáveis, com uma
variável dependente e duas variáveis explicativas. Portanto, estamos interessados nos modelos
de regressão linear múltipla, ou seja, modelos lineares nos parâmetros, eles podem ou não ser
lineares nas variáveis. A função de regressão linear múltipla é dada por:

𝒀𝒊 = 𝜷𝟏 + 𝜷𝟐 𝑿𝟐𝒊 + 𝜷𝟑 𝑿𝟑𝒊 + 𝒖𝒊 (1)

Em que Y é a variável dependente, 𝑿𝟐 e 𝑿𝟑 são as variáveis explicativas, 𝒖 é o termo de


perturbação estocástico e i é a i-ésima observação. Na equação a cima 𝜷𝟏 é o termo de
intercepto. Como de hábito, ele fornece a sua média ou efeito médio sobre Y de todas variáveis
excluídas do modelo, embora a sua interpretação mecânica seja o valor médio de Y quando 𝑿𝟐
e 𝑿𝟑 forem igualados a zero. Os coeficientes 𝜷𝟏 e 𝜷𝟐 são chamados de coeficientes de
regressão parcial.

4. O Problema da Estimação

A ausência de relação linear exata entre 𝑿𝟐 e 𝑿𝟑 , é conhecida tecnicamente como ausência de


colinearidade ou ausência de multicolinearidade, se estiverem envolvidas mais de uma relação
linear exata.

Portanto, a ausência de colinearidade significa que nenhum dos regressores pode ser expresso
como uma combinação linear exata dos demais regressores do modelo.

5
Deste modo, a ausência de colinearidade significa que não existe um conjunto de números, 𝜷𝟐
e 𝜷𝟑 , que não sejam os dois iguais a zero, tais que:

𝜷𝟐 𝑿𝟐 + 𝜷𝟑 𝑿𝟑 = 0

Se essa relação linear exata existe, diz-se que 𝑿𝟐 e 𝑿𝟑 são colineares ou linearmente
dependentes. Por outro lado, só é verdadeira quando 𝜷𝟐 =𝜷𝟑 =0, diz-se que 𝑿𝟐 e 𝑿𝟑 são
linearmente independentes. Assim, se:

𝑿𝟐 = −𝟒𝑿𝟑 ou 𝑿𝟐 + 𝟒𝑿𝟑 = 𝟎

as duas variáveis são linearmente dependentes, e, se ambas forem incluídas em um modelo de


regressão, haverá colinearidade perfeita ou relação linear exata entre os dois regressores.
Embora consideremos o problema da colinearidade, a lógica por trás da hipótese de ausência
de colinearidade exata não é difícil de entender.

Suponhemos que na equação (1), 𝒀, 𝑿𝟐 e 𝑿𝟑 , respetivamente, representem despesa de


consumo, renda e riqueza do consumidor.

Ao postular que a despesa de consumo relaciona-se linearmente com a renda e a riqueza, a


teoria econômica presume que a riqueza e a renda podem ter uma influência independente sobre
o consumo. Caso contrário, não faz sentido incluir as duas variáveis no modelo. No extremo,
se houver uma relação linear exata entre renda e riqueza, só teremos uma variável
independente, não duas, e não haverá forma de avaliar a influência separada da renda e da
riqueza sobre o consumo.

Para melhor entendermos, seja 𝑿𝟐 = 𝟐𝑿𝟑 na regressão de consumo, renda e riqueza. A


regressão (1) torna-se:

𝒀𝒊 = 𝜷𝟏 + 𝜷𝟐 𝑿𝟐𝒊 + 𝜷𝟑 𝑿𝟐𝒊 + 𝒖𝒊 (2)

= 𝜷𝟏 + (𝜷𝟐 + 𝟐𝜷𝟑 )𝑿𝟐𝒊 + 𝒖𝒊

= 𝜷𝟏 + 𝜶𝑿𝟐𝒊 + 𝒖𝒊

Em termos matemáticos, 𝜶 = (𝜷𝟐 + 𝟐𝜷𝟑 ), é uma equação com duas incógnitas e não há uma
forma única de estimar 𝜷𝟐 e 𝜷𝟑 com base no 𝜶 estimado. Em resumo, a hipótese de ausência
de multicolinearidade perfeita exige que se inclua na função de regressão populacional apenas
aquelas variáveis que não sejam funções lineares exatas de uma ou mais variáveis do modelo.

6
Estimação dos coeficientes parciais de regressão por meio dos métodos de mínimos
quadrados ordinários.

Para encontrarmos os estimadores de MQO, vejamos primeiro a função de regressão amostral


(FRA) correspondente à função de regressão populacional (FRP) da Equação (1) que é a
seguinte:

̂𝟏 + 𝜷
𝒀̂𝒊 = 𝜷 ̂𝟐 𝑿𝟐𝒊 + 𝜷
̂𝟑 𝑿𝟑𝒊 + ̂
𝒖𝒊 (3)

em que 𝒖𝒊 é o termo residual, a contrapartida amostral do termo de erro estocástico 𝒖𝒊 .

Com base na equação (), verificamos de imediato que

̂𝟏 = 𝒀
𝜷 ̂𝟐 𝑿
̅−𝜷 ̂𝟑 𝑿
̅ 𝟑𝒊 − 𝜷 ̅ 𝟑𝒊 (4)

que é o estimador de MQO do intercepto populacional 𝜷𝟏 .

Seguindo a convenção de denotar por minúsculas os desvios dos valores médios amostrais,
podemos deduzir a seguinte fórmula com base na equação normal (3):

𝛽̂1 = 𝛽̂2 𝑋̅2 − 𝛽̂3 𝑋̅3

2
(∑ 𝑦𝑖 𝑥2𝑖 )(∑ 𝑥3𝑖 )−(∑ 𝑥2𝑖 𝑥3𝑖 )(∑ 𝑥2𝑖 𝑥3𝑖 )
𝛽̂2 = 2 2 2
(∑ 𝑥2𝑖 )(∑ 𝑥3𝑖 )−(∑ 𝑥2𝑖 𝑥3𝑖 )

2
(∑ 𝑦𝑖 𝑥3𝑖 )(∑ 𝑥2𝑖 ) − (∑ 𝑦𝑖 𝑥2𝑖 )(∑ 𝑥2𝑖 𝑥3𝑖 )
𝛽̂3 = 2 2 2
(∑ 𝑥2𝑖 )(∑ 𝑥3𝑖 ) − (∑ 𝑥2𝑖 𝑥3𝑖 )

respetivamente nos dão os estimadores de MQO dos coeficientes parciais de regressão


populacional 𝜷𝟐 𝑒 𝜷𝟑 .

Variâncias e erros padrão dos estimadores de MQO

Após obtermos os estimadores de MQO dos coeficientes parciais de regressão. Como no caso
de duas variáveis, precisamos dos erros-padrão para dois propósitos principais: estabelecer
intervalos de confiança e testar hipóteses estatísticas. As fórmulas relevantes são as seguintes:

7
ou de modo equivalente,

em que 𝑟23 é o coeficiente de correlação amostral entre 𝑋2 e 𝑋3

ou, de modo equivalente,

Em todas essas fórmulas, σ2 é a variância dos termos de erro da população, 𝑢𝑖 .

Pode verificar que um estimador não viesado de σ2 é dado por:

O coeficiente de determinação múltiplo, R2

No caso de duas variáveis, vimos que 𝑟2 , mede a qualidade do ajustamento da equação de


regressão, isto é, fornece a proporção ou percentual da variação total da variável dependente Y
que é explicada pela variável explanatória (única) X.

Essa notação de 𝑟2 pode ser facilmente estendida aos modelos com mais de duas variáveis. No
caso de modelos com três variáveis, queremos conhecer a proporção da variação de Y que é
explicada, conjuntamente, pelas variáveis 𝑋2 e 𝑋3. A medida que nos oferece essa informação
é o coeficiente de determinação múltiplo, denotado por 𝑟2 conceitualmente, é semelhante ao 𝑟2
.

8
Por definição,

5. O problema da inferência

𝒚𝒊 = 𝜷𝟏 + 𝜷𝟐 𝑿𝟐𝒊 + 𝜷𝟑 𝑿𝟑𝒊 + 𝒖𝒊

Para fazer inferências precisamos supor que 𝑢𝑖 segue alguma distribuição de probabilidade.

Normalidade dos 𝑢𝑖 ~𝑁(0, 𝜎 2 ).

̂1 , 𝛽
Os estimados são: 𝛽 ̂2 , 𝛽
̂3 são normalmente distribuídos com médias iguais a 𝛽1 , 𝛽2 , 𝛽3 e
variáveis.

Hipótese da normalidade

Segue a distribuição t com n - 3 graus de liberdade.

Porquê 3 graus de liberdade?


t => para testar coeficientes parciais da regressão múltipla
𝑥 2 => para testar hipóteses sobre o verdadeiro 𝜎 2 da população.
Testes de hipóteses relativos aos coeficientes de regressão individuais
 𝐻0 : 𝛽2 = 0
 𝐻1 : 𝛽2 ≠ 0

9
 Comparar t com t-crítico;
 Qual seria o t-crítico para o caso de MI;
 Na pratica olhamos o p-valor;
 E se eu espero um determinado sinal?
 O teste não é mais bilateral; exemplo da MI poderia supor que o coeficiente de PNBpc
seja negativo. Então:
𝐻0 : 𝛽2 ≥ 0
𝐻1 : 𝛽2 < 0

Teste de significancia geral da regressão amostral


 Teste há uma relação linear entre o y e as variáveis explicativas em conjunto
𝐻0 : 𝛽2 = 𝛽3 = 0
 É o mesmo que testar 𝛽2 = 0 𝑒 𝛽3 = 0?
- não.
-usamos a mesma amostra para testar 𝛽2 = 0 𝑒 𝛽3 = 0, portanto não são independentes.

10
6. Conclusão

Ao decorrer do trabalho concluiu-se que o mais simples possível dos modelos de regressão
linear múltipla, a saber é o modelo de regressão de três variáveis. Fica entendido que o termo
linear refere-se à linearidade nos parâmetros, e não necessariamente nas variáveis.

Embora o modelo de regressão de três variáveis seja, sob muitos aspectos, uma extensão do
modelo de duas variáveis, envolve alguns conceitos como multicolinearidade. Portanto, o R2 é
a medida global de como o modelo escolhido se ajusta a um determinado conjunto de dados.

Assim, entendemos que o conteúdo apresentado será suficiente para dar uma ideia da
importância do conhecimento de econometria como base na formação dos futuros profissionais
em economia. Contudo, que a econometria, como também ocorre em outras ciências, apresenta
suas limitações, principalmente de natureza estatística e econômica.

11
7. Referências bibliográficas

Gujarati, D. N. (2006). Econometria Básica (4ª ed.). Rio de Janeiro: Elsiver editora Ltda.

HILL, R. CARTER. (1999). Econometria. São Paulo: Saraiva

KELEIJIAN, HARRY H. Introdução à Econometria: princípios e aplicações. Rio de Janeiro:


Campus

12

Você também pode gostar