Você está na página 1de 16

Eugenia Xadreque Quembo

Intervalo de confiança, testes de hipóteses, modelo clássico de regressão linear

Licenciatura em Ensino de Matemática com Habilitações em Estatística

Universidade Pungue

Chimoio

2021
2

Eugenia Xadreque Quembo

Intervalo de confiança, testes de hipóteses, modelo clássico de regressão linear

Licenciatura em Ensino de Matemática com Habilitações em Estatística

Trabalho apresentado na Faculdade


de Ciências Exactas e Tecnológicas,
para fins avaliativos na cadeira de
Econometria Básica sob a orientação
do docente MSc. Nelson.

Universidade Pungue

Chimoio

2021
3

Índice
1. Introdução............................................................................................................................4

1.1. Objectivos........................................................................................................................4

1.1.1. Geral.............................................................................................................................4

1.1.2. Específicos...................................................................................................................4

1.2. Metodologia.....................................................................................................................4

2. Revisão bibliográfica...........................................................................................................5

2.1. Intervalo de confiança......................................................................................................5

2.1.1. Intervalo de confiança para média................................................................................5

2.1.2. Intervalo de confiança para a variância de uma população normal.............................5

2.1.3. Intervalo de confiança para proporção.........................................................................6

2.2. TESTES DE HIPÓTESES...........................................................................................6

2.2.1. Exemplo de Aplicação..............................................................................................7

2.3.1. Pressupostos ou hipóteses subjacentes ao modelo clássico de regressão linear...........9

3. Conclusão..............................................................................................................................13

4. Referências bibliográficas.................................................................................................14
4

1. Introdução
O presente trabalho é de carácter avaliativo abandeira de econometria básica. Far-se-á
abordagem sobre intervalo de confiança, testes de hipóteses, modelo clássico de regressão
linear e fórmulas de aplicação deste modelo. Em aspectos organizacionais o trabalho esta
constituído por: introdução, objectivos gerais e específicos, metodologia, revisão
bibliográfica, conclusão e as referências bibliográficas.

1.1. Objectivos
1.1.1. Geral
 Compreender intervalo de confiança, testes de hipóteses, modelo clássico de regressão
linear e fórmulas de aplicação deste modelo.
1.1.2. Específicos
 Definir intervalo de confiança, testes de hipóteses, modelo clássico de regressão linear;
 Identificar os pressupostos básicos do modelo clássico de regressão linear;
 Aplicar os conhecimentos de intervalo de confiança, testes de hipóteses, modelo clássico
de regressão linear e fórmulas de aplicação deste modelo na resolução de exercícios.
1.2. Metodologia
Para a materialização deste trabalho recorreu-se ã revisão bibliográfica.
5

2. Revisão bibliográfica
2.1. Intervalo de confiança
É uma maneira de calcularmos uma estimativa de um parâmetro desconhecido.

Muitas vezes também funciona como um teste de hipóteses.

A ideia é construir um intervalo de confiança para o parâmetro com uma probabilidade de


1−α (nível de confiança) de que o intervalo contenha o verdadeiro parâmetro.

Obs: α é o nível de significância, isto é, o erro que estaremos cometendo ao afirmarmos que,
por exemplo, 95% das vezes o intervalo θ^ 1 <θ< θ^ 2contém θ . Nesse caso, o erro seria de 5%.

2.1.1. Intervalo de confiança para média


Será visto apenas o intervalo de confiança para a média populacional ( μ ) quando a variância
( σ 2 ) populacional é desconhecida.

Ex: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma população normal.
Construir o intervalo de confiança, de 95%, para μ .

Solução:

pelo fato de π se um parâmetro e não uma v.a. o intervalo acima deve ser interpretado da
seguinte maneira: 95% dos intervalos assim construídos conterão a verdadeira média.

2.1.2. Intervalo de confiança para a variância de uma população normal


6

Onde x 2maior e x 2menor são obtidos na tabela de x 2 com n-1 graus de liberdade e nível de
significância.

Exemplo: Considerando a mesma amostra do exemplo anterior, calcule o I.C. para


θ 2 ao nível de 90% de confiança (ou seja α =¿ 100% ).

2.1.3. Intervalo de confiança para proporção


Obs: O método apresentado abaixo é apropriado quando n for maior que 30.

onde f é a estimativa da proporção p .

Exemplo: Entre 500 pessoas inquiridas a respeito de suas preferências eleitorais, 260
mostraram-se favoráveis ao candidato B. Calcular o intervalo de confiança ao nível de 90%
para a percentagem (ou proporção) dos eleitores favoráveis a B.

2.2. TESTES DE HIPÓTESES

Hipótese estatística: pode ser definida como uma afirmação sobre a distribuição de uma
variável aleatória (no geral sobre seus parâmetros).
7

Exemplos: Em uma população com média  e variância 2, possíveis hipóteses seriam
H:=0; H:>50; H:0; H:2=100; H:2<10.

A hipótese estatística pode ser simples ou composta:


 Simples: se a hipótese especifica completamente a distribuição (H:=0, H:2=100).
 Composta: se a hipótese não especifica completamente a distribuição (H:>50,
H:2<10).

Teste de hipóteses: Como o próprio nome diz, são critérios estatísticos que permitem
rejeitar ou não hipóteses testadas, com determinado grau de confiança, baseados em valores
amostrais.
Os testes de hipóteses, no geral, apresentam duas hipóteses:

 Hipótese nula (ou da nulidade), geralmente representada por H0, que é a hipótese natural
colocada à prova.

 Hipótese alternativa, geralmente representada por H1 ou HA, que é a hipótese alternativa


à hipótese colocada à prova.

Os testes de hipóteses devem seguir os passos:

Passo 1. Estabelecer as hipóteses (H0 e H1).

Passo 2. Obter uma estatística, com distribuição conhecida, que fique completamente
definida sob H0.

Passo 3. Estabelecer os critérios do teste.

Todo teste estatístico apresenta dois tipos de erro:


Erro tipo I: Erro que se comete ao rejeitar H0, dado que ela é verdadeira, geralmente
representado por , e denominado nível de significância do teste.

Erro tipo II: Erro que se comete ao não rejeitar H0, dado que ela é falsa.
O critério mais comum em testes de hipóteses é fixar o erro Tipo I (nível de
significância do teste).

Passo 4. Calcular o valor da estatística, item (2), para os valores da amostra.

Passo 5. Aplicar o critério do teste.

2.2.1. Exemplo de Aplicação


8

Para exemplificar, apresentemos esses passos em uma situação prática:

Exemplo: A quantidade de calorias de um produto (v.a. X) é tal que X~ N(,2).onde


=média populacional e 2=variância populacional. Para a indústria, =31, mas para os
concorrentes 31. Para avaliar o produto foi tirada uma amostra de tamanho 25, cujos
valores são apresentados a seguir:
30,55 29,88 28,95 31,72 31,57 34,94 35,00 34,98 32,25 31,09

32,42 32,26 30,75 33,78 33,90 31,96 31,93 33,42 30,41 34,13

28,48 33,57 31,51 30,35 30,20

=0,025 =0,025

p-valor=0,0125 p-valor=0,0125
tc=2,70

Passo 5. Aplicar o critério do teste.

Como tc pertence à região crítica do teste (p-valor < ), rejeita-se H0 em favor de H1, ao nível
de 5% de probabilidade.
9

Conclusão: Ao nível de 5% de probabilidade rejeita-se a hipótese da média de calorias ser


31 (H0) em favor da hipótese da média de calorias ser diferente de 31 (H1).

Os resultados dos testes geralmente apresentam o p-valor dos testes, que é a área limitada
pelo valor da estatística calculada. Se o p-valor for menor que o nível de significância do
teste, o teste é significativo e rejeita-se H0 em favor de H1 a esses nível de significância.

2.3. O Modelo Clássico de Regressão Linear (MCRL)

O termo regressão foi criado por Francis Galton. Em um artigo famoso de 1886, Galton
verificou que os filhos de pais mais altos e os filhos de pais mais baixos tendiam a apresentar
uma altura que se assemelhava a altura média da população. Em outras palavras, a estatura
dos filhos de pais com certa altura tendia a “regredir” para a altura média da população como
um todo.
A análise de regressão tornou-se a base da econometria e, actualmente, refere-se ao estudo
da dependência de uma variável (dependente), em relação a outras variáveis (explicativas).
A análise de regressão é uma ferramenta interessante, pois consegue aproximar a Função de
Esperança Condicional (Conditional Expectation Function – CEF) ou Função de Regressão
Populacional (RFP) ou ainda Função de Média Condicional. A partir disso, ela é utilizada
para estimar e/ou prever o valor médio da variável dependente em termos dos valores
conhecidos ou fixados (em amostras repetidas) das variáveis explicativas.
A teoria ou a estrutura básica da análise de regressão é o Modelo Clássico de Regressão
Linear (MCRL), que trata das hipóteses ou pressupostos subjacentes ao estimador de
Mínimos Quadrados Ordinários (MQO). Sob a validade desses pressupostos é possível
mostrar que o estimador de MQO é BLUE (Best Linear Unbiased Estimator).
Além disso, as estruturas dos dados ditam ou impõem novos desafios à estimação
econométrica. A base da econometria é a análise de regressão a partir da estrutura de dados
seccionais, em outras palavras, toda a teoria econométrica é construída a partir dessa
estrutura de dados. Nesse sentido, a utilização de dados com estrutura temporal,
longitudinal ou espacial incluem novas hipóteses à estimação do modelo. Por esse motivo,
tais estruturas de dados devem ser expostas e trabalhadas de forma separada.
10

2.3.1. Pressupostos ou hipóteses subjacentes ao modelo clássico de regressão


linear

1) A relação entre 𝒀e os 𝑿′𝒔 é linear.

𝑌 = 𝑋𝛽 + 𝜀

Linear significando linearidade nos parâmetros. Relações não lineares (intrinsecamente


lineares) que podem ser linearizadas podem ser estimadas pelos MQO, contudo a violação
desse pressuposto, ou seja, modelos não lineares nos parâmetros (intrinsecamente não
lineares) devem ser estimados por métodos não lineares.

2) Não há relação linear perfeita entre as variáveis explicativas.

𝑝𝑜𝑠𝑡𝑜(𝑋) = 𝑘
Indica ausência de multicolinearidade perfeita entre as variáveis explicativas, esse
pressuposto garante que a matriz (𝑋′𝑋) é não singular e, portanto, assegura a existência da
matriz (𝑋′𝑋)−1. Caso
𝑝𝑜𝑠𝑡𝑜(𝑋) < 𝑘 a matriz (𝑋′𝑋)−1 é singular, o que impossibilita a estimação dos parâmetros.

Outras hipóteses relacionadas a esse pressuposto são a de que o número de observações


deve ser no mínimo maior que o número de parâmetros estimados (𝑛 > 𝑘) e a de que as
variáveis explicativas possuam variabilidade suficiente.
A violação desse pressuposto impossibilita a estimação dos parâmetros e torna os
erros padrão infinitos. A presença de multicolinearidade forte não viola o pressuposto,
nesse caso os estimadores de MQO preservam suas propriedades de BLUE, contudo os
erros padrão tornam-se grandes e os testes de significância individual (𝑡) tendem a aceitar a
hipótese nula.

3) A matriz 𝑿 é não estocástica, ou seja, os 𝑿′𝒔 são fixos em amostras repetidas.

Esse pressuposto indica que para cada valor fixo de 𝑋 existe uma distribuição de
probabilidade associada. Estamos interessados no valor médio condicional de 𝑌 para cada
valor fixo de 𝑋. Caso 𝑋 seja estocástico pressupõe-se que o mesmo não está correlacionado
11

com o termo de erro 𝑋′𝜀 = 0.


a. A variável 𝗌 tem média zero.

𝐸(𝜀𝑖|𝑋𝑖) = 0

Implica que:

𝐸(𝑌) = 𝐸(𝑋𝛽) + 𝐸(𝜀)

Como 𝑋 é fixo e 𝛽 é constante 𝐸(𝑋𝛽) = 𝑋𝛽. Dado que 𝐸(𝜀) = 0, tem-se que:

𝐸(𝑌) = 𝑋𝛽

Em outras palavras, as variáveis incluídas no termo de erro não influenciam


sistematicamente o valor médio de 𝑌, ou seja, em média a influência do termo de erro para
explicar 𝑌 é nula.
Outras hipóteses relacionadas a esse pressuposto são as de que o modelo está bem
especificado, ou seja, não existem erros de medida nas variáveis dependente e explicativas,
não há variáveis relevantes omitidas ou relações endógenas entre regressor e regressores (𝑋
𝜀 = 0) e (𝑌′𝜀 = 0).

A violação desse pressuposto torna os estimadores de MQO tendenciosos e


inconsistentes, porém mantém a eficiência dos estimadores.
b. Os erros 𝗌𝒊 são variáveis aleatórias com variância constante (homocedasticidade).

𝑉𝑎𝑟(𝜀𝑖) = 𝜎2

𝑉𝑎𝑟(𝜀𝑖) = 𝐸[𝜀𝑖 − 𝐸(𝜀𝑖)]2

Dado 𝐸(𝜀) = 0:
𝑉𝑎𝑟(𝜀𝑖) = 𝐸(𝜀2) = 𝜎2 𝑞𝑢𝑒 é 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒
O pressuposto de homocedasticidade garante que a dispersão dos diferentes níveis fixos de
𝑋 em torno da média é constante, ou seja, é a mesma. Esse pressuposto assegura que a
média condicional de 𝑌 possui a mesma precisão para os diferentes níveis da variável 𝑋.
A violação desse pressuposto mantém as propriedades de não tendencioso e
consistente dos estimadores de MQO, contudo eles não são mais eficientes e os testes
estatísticos deixam de ser válidos.

a. Ausência de autocorrelação no erro.

𝐶𝑜𝑣(𝜀𝑖𝜀𝑗) = 0 𝑝𝑎𝑟𝑎 𝑖 ≠ 𝑗

O pressuposto de ausência de autocorrelação ou correlação serial no termo de erro


assegura que não existe uma relação sistemática entre o termo de erro e a variável
dependente, em outras palavras, o valor médio de 𝑌 não é afetado pelo termo de erro de
forma sistemática, ou seja, um choque aleatório em um período que causa um aumento na
média de 𝑌 não afetará o valor do mesmo nos próximos períodos.
A violação desse pressuposto mantém as propriedades de não tendencioso e
consistente dos estimadores de MQO, contudo eles não são mais eficientes e os testes
estatísticos deixam de ser válidos.

b. Os erros têm distribuição normal.

Esse pressuposto é necessário apenas para os testes de hipóteses, ou seja, ele não
influencia as propriedades dos estimadores de MQO. A adição desse pressuposto ao MCRL
gera o MCRL normal (MCRLN).

Esses pressupostos são, portanto, a base da análise de regressão utilizando os


estimadores de MQO.
3. Conclusão
Terminado o trabalho percebeu-se, pode-se demonstrar facilmente que intervalos de confiança são obtidos com
base na teoria sobre testes de hipóteses. Teste de hipóteses pode ser definida como uma afirmação sobre a
distribuição de uma variável aleatória. A base da econometria é a análise de regressão a partir da estrutura de
dados seccionais, em outras palavras, toda a teoria econométrica é construída a partir dessa estrutura de dados.
4. Referências bibliográficas
GUJARATI, Damodar N.; PORTER, Dawn C. Econometria Básica. 5a Ed., Porto Alegre:
Bookman, 2011.

ANGRIST, J. D.; PISCHKE, J. S. Mostly harmless econometrics: An empiricist's companion.

2008.

GALTON, F. Regression towards mediocrity in hereditary staturep. Anthropological


Miscellanea, p. 246-263, 1886.

Você também pode gostar