Você está na página 1de 5

Multicolinearidade

● Qual é a natureza da multicolinearidade?

Originalmente a multicolinearidade era entendida como a existência de uma ​relação linear


perfeita entre as variáveis, porém agora ela já foi expandida para abranger os casos em que as
variáveis x estão intercorrelacionadas.

Correlação alta entre as variáveis explicativas.

Exemplos de multicolinearidade:

O que pode causar o problema de multicolinearidade?


> Faixa limitada de dados.
> Restrições ao modelo, ou seja variáveis que impõe uma condição para outras variáveis.
> Especificação de modelo.
> Regressores com tendência comum. Sobem ou descem juntas.

● A multicolinearidade é realmente um problema?

Queremos saber o efeito marginal de uma determinada variável sobre Y ceteris paribus, se há
multicolinearidade, quando uma variável aleatória varia, outra(s) também varia(m), tornando
impossível separar o efeito da variável estudada sobre Y.

No caso de multicolinearidade perfeita, os coeficientes de regressão são incalculáveis e seus


erros padrão são infinitos. Quando temos por exemplo, uma variável X que possui uma relação
linear perfeita com outro X, teremos 0/0, e será impossível calcular o coeficiente de regressão.
A presença de um problema de multicolinearidade traz consequências para MQO, mas este
continua sendo BLUE, ​best linear unbiased estimator.​ Não há problema de viés nos
estimadores, nem de destruição da hipótese de variância mínima, ​as propriedades
estatísticas de MQO continuam sendo válidas​.

A multicolinearidade é um fenômeno amostra, mesmo que as variáveis não estejam


relacionadas linearmente entre si na população, elas podem estar na amostra.

● Quais são suas consequências práticas?

> Causará grande variância e covariância dos estimadores. Estimação imprecisa.

Devido a isso os intervalos de confiança tendem a ser muitos mais amplos, facilitando a
aceitação da hipótese nula. Da mesma forma, a razão t do coeficiente tende a ser mais
insignificante.

> Pode causar um R² artificialmente alto, uma vez que um aumento no número de variáveis
sempre aumenta o R² ou pelo menos não o altera.

> Os estimadores de MQO podem ser sensíveis a pequenas alterações nos dados.
Nesse caso, caso haja uma correlação nula entre x2 e x3, a variância vai ser igual ao erro
padrão sobre o somatório da variável ao quadrado. Porém se houver correlação perfeita, a
base tenderá a 0, levando a variância para o infinito.

● Como se detecta isso?

A velocidade com que a variância e a covariância aumenta pode ser vista a partir do fator de
inflação da variância o FIV:

Também temos o TOL, que é basicamente 1 sobre o FIV, 1/FIV.

Há algumas maneiras práticas de se detectar a multicolinearidade, dentre elas:

> Um R² alto embora haja poucas estatísticas t significantes.

> Altas correlações entre pares de regressores, no entanto esse fator não abrange a relação
entre mais de duas variáveis
.
> Exame de correlações parciais

> Regressões auxiliares: Uma vez que a multicolinearidade surge quando um X possui uma
relação linear muito forte com um ou mais outros X, uma forma de detectar qual variável X está
relacionada com qual outra variável X é rodando uma regressão para cada X em função dos
outros X e calcular o R² de cada! Exemplo:
É um teste F, no qual a hipótese nula é que o X testado não é colinear com os demais, já a
hipótese alternativa é que X testado é colinear com os demais. Se você rejeita H0 então há
correlação entre essa variável testada e as demais variáveis do seu modelo.

Em geral, apenas haverá problema de multicolinearidade se o R² encontrado na regressão


auxiliar for maior que o R² encontrado na regressão geral.

> FIV e TOL: Um FIV maior que 10 pode começar a sinalizar multicolinearidade, e um TOL
perto de 0 também pode indicar.

● Que medidas corretivas podem ser tomadas para aliviar o problema de


multicolinearidade?

> Pode-se simplesmente não fazer nada, uma vez que a multicolinearidade é um problema
amostral e não de MQO em si. Como alguns problemas não são possíveis de serem corrigidos,
mas se a multicolinearidade não for muito forte, também não haverá grandes problemas.

> Pode-se usar um conhecimento a priori para designar relações lineares entre as variáveis,
possibilitando que transformemos a variável que causa problemas em uma nova variável:

> Combinando dados de corte transversal e séries temporais. Suponha que queremos estimar
uma regressão de séries temporais, porém temos a expectativa que haverá multicolinearidade
entre os termos da regressão, para resolver esse problema podemos fazer uma proxy para
estimar uma das variáveis por meio de corte transversal, depois usamos esse valor obtido para
subtrair do Y da nova equação e retirar a variável, assim teremos excluído uma variável, mas
levado em conta seu efeito sobre Y.
>Exclusão de variável(is): Isso é arriscado pois pode causar vício em MQO, enquanto a
multicolinearidade não o causa.

> Transformação de variáveis: Para contornar esse problema de multicolinearidade, podemos


usar o processo de transformação de variáveis, na qual usamos a série de um período anterior
para subtrair com a do momento analisado, com isso criamos novas variáveis. Essa técnica é
conhecida como técnica de primeiras diferenças, na qual as novas variáveis são expressas em
termos da diferença entre o valor na variável no período com a do valor da mesma em um
período anterior.

A vantagem de usar esse método é que as séries temporais são não estacionárias, e por isso
possuem variância muito alta, por meio da utilização da técnica de primeiras diferenças,
transformamos a série um uma estacionária.

Existem outras formas além da técnica de primeiras diferenças, como por meio da divisão de
todos os termos da regressão por uma variável específica.

Um problema do uso de transformação de variáveis é que algumas vezes podemos estar


dependendo da variação do erro ao longo do tempo, e caso o erro do presente esteja
relacionado com o erro do passado passaremos a quebrar algumas hipóteses de MQO.

> Aumento do número de dados: A medida que a amostra aumenta a variância dos
estimadores tende a diminuir.

Para predição e previsão a multicolinearidade não necessariamente é um problema, no entanto


para fazer teste de hipóteses elas passam a representar empecilhos.

Você também pode gostar