Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introdução ........................................................................................................................... 2
4. O Problema da Estimação................................................................................................... 5
6. Conclusão ......................................................................................................................... 11
O presente trabalho com tema teste de normalidade pretende-se fazer uma abordagem sobre
parâmetros desconhecidos, testar hipóteses em relação entre variáveis económicas. Em
particular dos subtemas que compõem a análise de regressão múltipla, o problema da
estimativa e o problema da inferência.
Nós expressamos nossas idéias sobre relações entre variáveis econômicas, utilizando o
conceito matemático da função de regressão múltipla. No caso da Regressão Linear Múltipla,
a diferença fundamental reside no número de variáveis explicativas, que agora não fica limitada
a apenas uma, mas podendo expandir este número para quantas variáveis explicativas forem
necessárias.
Quando temos três ou mais variáveis denominamos o processo de regressão múltipla, porém,
nos limitaremos a seguir à regressão linear múltipla com três variáveis.
2
2. Teste de Normalidade
Testar a normalidade dos resíduos de uma regressão linear. A regressão linear só deve ser
usada se os erros são normais, portanto, caso o teste aponte que esta premissa é inválida, os
resultados da regressão (intervalos de confiança, etc) não podem ser usados. Neste caso, o
modelo deve ser modificado (introduzindo outras variáveis explanatórias ou mudando o
modelo) para que os erros se comportem como uma variável normal.
Histograma de resíduos
O histograma dos resíduos mostra a distribuição dos resíduos para todas as observações. Usa-
se o histograma de resíduos para determinar se os dados são assimétricos ou se incluem
outliers. Um histograma é mais eficaz quando tem aproximadamente 20 ou mais pontos de
dados. Se a amostra é muito pequena, então cada barra no histograma não contém pontos de
dados suficientes para confiavelmente mostrar assimetria ou outliers.
Este histograma dos resíduos padronizados revela um padrão simétrico, em formato de sino,
indicando que os resíduos não estão assimétricos e que não há outliers.
3
Gráfico de probabilidades normal
Um gráfico de probabilidade normal é uma maneira simples de medir o quão normal são os
dados, independentemente da quantidade de dados que estão disponível. Com um conjunto de
dados de um processo ou característica do produto.
Usa-se o gráfico de probabilidade normal para verificar a pressuposição de que os resíduos são
distribuídos normalmente. O gráfico de probabilidade normal deve seguir aproximadamente
uma linha reta. No eixo horizontal, marcamos os valores da variável de interesse (no caso, os
resíduos de MQO, ui ) e no eixo vertical, representamos o valor esperado para essa variável
caso estivesse normalmente distribuída. Se a variável provém de facto de uma população
normal, o GPN será aproximadamente uma linha reta.
4
Onde:
n - tamanho da amostra;
S - coeficiente de assimetria;
K - coeficiente de curtose.
Para uma variável normalmente distribuída, S=0 e K=3. Portanto, o teste JB de normalidade é
um teste da hipótese conjunta de que S e K são iguais a 0 e 3, respectivamente. Nesse caso,
espera-se que o valor da estatística JB seja igual a 0.
Na regressão múltipla são consideradas duas ou mais variáveis explicativas (𝑥𝑖 ) , como por
exemplo: salário (𝑥1 ), renda de aluguel (𝑥2 ), renda de investimento (𝑥3 ), etc. que influenciam
a variável dependente 𝑦𝑖 .
O mais simples dos modelos de regressão múltipla é a regressão de três variáveis, com uma
variável dependente e duas variáveis explicativas. Portanto, estamos interessados nos modelos
de regressão linear múltipla, ou seja, modelos lineares nos parâmetros, eles podem ou não ser
lineares nas variáveis. A função de regressão linear múltipla é dada por:
4. O Problema da Estimação
Portanto, a ausência de colinearidade significa que nenhum dos regressores pode ser expresso
como uma combinação linear exata dos demais regressores do modelo.
5
Deste modo, a ausência de colinearidade significa que não existe um conjunto de números, 𝜷𝟐
e 𝜷𝟑 , que não sejam os dois iguais a zero, tais que:
𝜷𝟐 𝑿𝟐 + 𝜷𝟑 𝑿𝟑 = 0
Se essa relação linear exata existe, diz-se que 𝑿𝟐 e 𝑿𝟑 são colineares ou linearmente
dependentes. Por outro lado, só é verdadeira quando 𝜷𝟐 =𝜷𝟑 =0, diz-se que 𝑿𝟐 e 𝑿𝟑 são
linearmente independentes. Assim, se:
𝑿𝟐 = −𝟒𝑿𝟑 ou 𝑿𝟐 + 𝟒𝑿𝟑 = 𝟎
= 𝜷𝟏 + 𝜶𝑿𝟐𝒊 + 𝒖𝒊
Em termos matemáticos, 𝜶 = (𝜷𝟐 + 𝟐𝜷𝟑 ), é uma equação com duas incógnitas e não há uma
forma única de estimar 𝜷𝟐 e 𝜷𝟑 com base no 𝜶 estimado. Em resumo, a hipótese de ausência
de multicolinearidade perfeita exige que se inclua na função de regressão populacional apenas
aquelas variáveis que não sejam funções lineares exatas de uma ou mais variáveis do modelo.
6
Estimação dos coeficientes parciais de regressão por meio dos métodos de mínimos
quadrados ordinários.
̂𝟏 + 𝜷
𝒀̂𝒊 = 𝜷 ̂𝟐 𝑿𝟐𝒊 + 𝜷
̂𝟑 𝑿𝟑𝒊 + ̂
𝒖𝒊 (3)
̂𝟏 = 𝒀
𝜷 ̂𝟐 𝑿
̅−𝜷 ̂𝟑 𝑿
̅ 𝟑𝒊 − 𝜷 ̅ 𝟑𝒊 (4)
Seguindo a convenção de denotar por minúsculas os desvios dos valores médios amostrais,
podemos deduzir a seguinte fórmula com base na equação normal (3):
2
(∑ 𝑦𝑖 𝑥2𝑖 )(∑ 𝑥3𝑖 )−(∑ 𝑥2𝑖 𝑥3𝑖 )(∑ 𝑥2𝑖 𝑥3𝑖 )
𝛽̂2 = 2 2 2
(∑ 𝑥2𝑖 )(∑ 𝑥3𝑖 )−(∑ 𝑥2𝑖 𝑥3𝑖 )
2
(∑ 𝑦𝑖 𝑥3𝑖 )(∑ 𝑥2𝑖 ) − (∑ 𝑦𝑖 𝑥2𝑖 )(∑ 𝑥2𝑖 𝑥3𝑖 )
𝛽̂3 = 2 2 2
(∑ 𝑥2𝑖 )(∑ 𝑥3𝑖 ) − (∑ 𝑥2𝑖 𝑥3𝑖 )
Após obtermos os estimadores de MQO dos coeficientes parciais de regressão. Como no caso
de duas variáveis, precisamos dos erros-padrão para dois propósitos principais: estabelecer
intervalos de confiança e testar hipóteses estatísticas. As fórmulas relevantes são as seguintes:
7
ou de modo equivalente,
Essa notação de 𝑟2 pode ser facilmente estendida aos modelos com mais de duas variáveis. No
caso de modelos com três variáveis, queremos conhecer a proporção da variação de Y que é
explicada, conjuntamente, pelas variáveis 𝑋2 e 𝑋3. A medida que nos oferece essa informação
é o coeficiente de determinação múltiplo, denotado por 𝑟2 conceitualmente, é semelhante ao 𝑟2
.
8
Por definição,
5. O problema da inferência
𝒚𝒊 = 𝜷𝟏 + 𝜷𝟐 𝑿𝟐𝒊 + 𝜷𝟑 𝑿𝟑𝒊 + 𝒖𝒊
Para fazer inferências precisamos supor que 𝑢𝑖 segue alguma distribuição de probabilidade.
̂1 , 𝛽
Os estimados são: 𝛽 ̂2 , 𝛽
̂3 são normalmente distribuídos com médias iguais a 𝛽1 , 𝛽2 , 𝛽3 e
variáveis.
Hipótese da normalidade
9
Comparar t com t-crítico;
Qual seria o t-crítico para o caso de MI;
Na pratica olhamos o p-valor;
E se eu espero um determinado sinal?
O teste não é mais bilateral; exemplo da MI poderia supor que o coeficiente de PNBpc
seja negativo. Então:
𝐻0 : 𝛽2 ≥ 0
𝐻1 : 𝛽2 < 0
10
6. Conclusão
Ao decorrer do trabalho concluiu-se que o mais simples possível dos modelos de regressão
linear múltipla, a saber é o modelo de regressão de três variáveis. Fica entendido que o termo
linear refere-se à linearidade nos parâmetros, e não necessariamente nas variáveis.
Embora o modelo de regressão de três variáveis seja, sob muitos aspectos, uma extensão do
modelo de duas variáveis, envolve alguns conceitos como multicolinearidade. Portanto, o R2 é
a medida global de como o modelo escolhido se ajusta a um determinado conjunto de dados.
Assim, entendemos que o conteúdo apresentado será suficiente para dar uma ideia da
importância do conhecimento de econometria como base na formação dos futuros profissionais
em economia. Contudo, que a econometria, como também ocorre em outras ciências, apresenta
suas limitações, principalmente de natureza estatística e econômica.
11
7. Referências bibliográficas
Gujarati, D. N. (2006). Econometria Básica (4ª ed.). Rio de Janeiro: Elsiver editora Ltda.
12