Você está na página 1de 28

UNIVERSIDADE ZAMBEZE

Faculdade de Ciências Sociais e Humanidades


Curso: economia, 3° ano laboral, cadeira: Econometria

TEOREMA DE GAUSS
TEOREMA DE LIMITE CENTRAL
INFERENCIA E INTERVALO DE CONFIANÇA
TESTE DE HIPOTESE

Gaio de Natalio Luís Ferrão Muanahilha

Beira, 05 de Março de 2023


Gaio de Natalio Luís Ferrão Muanahilha

TEOREMA DE GAUSS
TEOREMA DE LIMITE CENTRAL
INFERENCIA E INTERVALO DE CONFIANÇA
TESTE DE HIPOTESE

Trabalho de pesquisa
científica, de caracter avaliativo,
apresentado na disciplina de
Econometria que tem como
regente a doutora Quiniteria
Gabriel

Beira, 11 de Março 2023


Índice
1. Introdução ................................................................................................................ 1

1.1 Objectivos .......................................................................................................... 1

1.1.1 Objectivo geral ............................................................................................ 1

1.1.2 Objectivos específicos ................................................................................. 1

1.2 Metodologia ....................................................................................................... 2

2. Teorema de Gauss ou Teorema da divergência ....................................................... 3

3. Teorema do Limite Central ...................................................................................... 3

4. Inferência e Intervalo de confiança.......................................................................... 5

4.1 Intervalos de confiança para a media 𝝈 conhecido)........................................... 6

4.2 Intervalos de confiança para a media populacional ........................................... 9

4.2.1 Instruções..................................................................................................... 9

4.2.2 Tamanho da amostra ................................................................................. 10

4.3 Intervalos de confiança para a média (𝜎 desconhecido) .................................. 10

4.4 Intervalos de confiança e distribuições t .......................................................... 12

4.4.1Como construir um intervalo de confiança para a média populacional (𝝈


desconhecido) ................................................................................................................... 12

4.5 Intervalos de confiança para uma proporção populacional .............................. 13

4.6 Intervalos de confiança para variância e desvio padrão ................................... 14

4.6.1 A distribuição qui-quadrado ...................................................................... 14

4.6.1 Intervalos de confiança para 𝝈𝟐 𝒆 𝝈 ......................................................... 15

5. Teste De Hipóteses ................................................................................................ 16

5.1 Teste T.............................................................................................................. 17

5.1.1 Valores-P Dos Testes T ............................................................................. 18

5.2 O Teste F .......................................................................................................... 18

5.2.1 Regras De Rejeição De F .......................................................................... 19

5.2.2 Forma R-Quadrado Da Estatística F ......................................................... 20


5.2.3 Descrição dos resultados da regressão ...................................................... 20

5.3 Relação entre estatísticas F e t ......................................................................... 21

5.4 O valor P .......................................................................................................... 21

6. Conclusão .............................................................................................................. 23

7. Referencias Bibliográficas ..................................................................................... 24


1. Introdução

Antes dos anos 1913, que foi um ano em que não existia a econometria e a aplicação
das fórmulas matemáticas e estatísticas na econometria, tornava-se trabalhoso para um
economista fazer previsões sobre as variáveis económicas. Com a introdução da econometria
tornou-se mais eficiente fazer previsões sobre as variáveis económicas e ela e usada ate os dias
de hoje.

O presente trabalho aborda acerca dos seguintes temas, teorema de gauss, teorema
de limite central, inferência no sentido de testes de hipótese e de intervalos de confiança, esses
conteúdos são muito importantes para um econometrista pois eles contribuem muito para
analise de dados econométricos e que tem uma ferramenta fundamental para tomada de
decisões nos ramos da macroeconomia e microeconomia.

Assim o presente trabalho esta organizado em 3 partes, a primeira parte referente a


introdução do trabalho que a parte em que o leitor se encontra, podendo perceber aquilo que
são os objetivos do trabalho e a metodologia usada na criação do trabalho, a segunda parte é
referente ao desenvolvimento nessa parte ele esta dividido em 4 capítulos, o primeiro que
aborda acerca do teorema de Gauss também conhecido como teorema de divergência de Gauss,
o segundo capitulo fala do teorema do limite central e de seguida temos o capitulo 3 que vem
retratar acerca da Inferência estatística sendo esse o capitulo mais longo e complexo do trabalho
e por fim temos o ultimo capitulo acerca dos testes de hipótese principalmente teste t, teste F e
valor p, e a ultima parte é referente a conclusão e referencias bibliográficas.

1.1 Objectivos
1.1.1 Objectivo geral
Avaliar as Ferramentas Matemáticas e Estatísticas para tomada de decisões no campo
da economia.

1.1.2 Objectivos específicos


Descrever o teorema de Gauss
Analisar o intervalo de confiança
Descrever o teorema do limite central
Saber testar as hipóteses estatísticas de maneira minuciosa

1
1.2 Metodologia

O presente trabalho é de pesquisa qualitativa, que foi feita através da consulta do material
bibliográfico relativo aos temas.

2
2. Teorema de Gauss ou Teorema da divergência

Feliz MINHOS 1estabelece que o teorema de Gauss, ou teorema da divergência,


exprime uma relação entre num integral triplo estendido a um sólido e uma integral de superfície
tomado sobre a superfície fronteira desse sólido.

Sejam V um sólido limitado em R3 por uma superfície fechada S e n o vector normal


unitário orientado para o exterior de S. Se F é uma função vectorial continuamente
diferenciável definida em V, tem-se:

∬ ∫(𝑑𝑖𝑣 𝐹) dxdydz = ∬ 𝐹 ∙ 𝑛 𝑑𝑆
S
𝑽

Calcular o fluxo de F(x; y; z) = (x; y; z) para o exterior do cubo C formado pelos


planos x = 0; y = 0; z = 0; x = 1; y = 1; e z = 1; utilizando o Teorema da divergência.
∬ 𝐹 ∙ 𝑛 𝑑𝑆 = ∭(𝑑𝑖𝑣 𝐹)𝑑𝑥𝑑𝑦𝑑𝑧
𝑆 𝑐

3. Teorema do Limite Central

Para Filipe MAHALUÇUA2 em teoria das probabilidades, o teorema do limite central


afirma que quando o tamanho da amostra aumenta, a distribuição amostral da sua média
aproxima-se cada vez mais de uma distribuição normal. Este resultado é fundamental na teoria
da inferência estatística. Na inferência estatística a utilidade do teorema central do limite vai
desde estimar os parâmetros como a média populacional ou o desvio padrão da média
populacional, a partir de uma amostra aleatória dessa população, ou seja, da média amostral e
do desvio padrão da média amostral até calcular a probabilidade de um parâmetro ocorrer dado
um intervalo, sua média amostral e o desvio padrão da média amostral.

Seja X1, X2, X3…. Xn uma amostra aleatória de tamanho n de uma população (finita
ou infinita), com média 𝜇 e variância 𝜎 2 finita. Então:

1
MINHOS, Feliz. Analise Matemática. Sd. P. 203.
2
MAHALUÇA, Filipe António. Estatística Aplicada. 2016. P. 168.

3
𝑥̅ − 𝜇
𝑍= ~ 𝑁(0,1) 𝑛 → ∞
𝜎/√𝑛

Para Ron LARSON3, temos os seguintes pressupostos mediante ao teorema do


limite central

1. Se amostras de tamanho n, em que n ≥ 30, são retiradas ao acaso de uma


população qualquer com uma média 𝜇 e um desvio padrão 𝜎, então a distribuição
amostral das médias se aproxima de uma distribuição normal. Quanto maior o tamanho
da amostra, melhor a aproximação.
2. Se a população é normalmente distribuída, então a distribuição amostral das
médias é normalmente distribuída para qualquer tamanho de amostra n.

Em qualquer dos casos, a distribuição amostral das médias tem média igual à média
da população.

𝜇𝑥̅ = 𝜇 Media das médias amostrais

A distribuição amostral das médias tem uma variância igual a 1/n vezes a variância da
população e um desvio padrão igual ao desvio padrão da população dividido pela raiz quadrada
de n.

𝜎2
𝜎𝑥̅2 = variância das médias amostrais
𝑛

𝜎
𝜎𝑥̅ = desvio das médias amostrais
√𝑛

De ressaltar que o desvio padrão da distribuição amostral das médias amostrais, 𝜎𝑥̅ ,
também é chamado de erro padrão da média.

Em seguida a tabela que ilustra distribuições não normal, normal e respectivas


distribuições

amostrais das médias.

3
LARSON, Ron e FARBER, betsy. Estatistica aplicada 6a edição. Pearson Education do Brasil, 2015.
P.247.

4
4. Inferência e Intervalo de confiança

Segundo Nilo SAMPAIO e Bernardo FONSECA4, inferência estatística é um ramo


estatístico cujo objetivo é fazer afirmações a partir de um conjunto de valores representativo
sobre um universo, assume-se que a população e muito maior do que o conjunto de dados
observados, a amostra.

Por exemplo, um clube de xadrez quer estimar o QI medio de seus membros. A media
de uma amostra aleatória dos membros e 115. Como essa estimativa consiste em um único
número representado por um ponto em uma linha numerada, ele e chamado de estimativa
pontual.

4
SAMPAIO, Nilo e FONSECA, Bernardo, ASSUMPÇÃO, Alzira. Estatística Inferencial. 1a edição.
editora Poisson. P.7.

5
4.1 Intervalos de confiança para a media 𝝈 conhecido)

Nesta secção estaremos aprendendo como fazer uma estimativa de parâmetro


populacional se o desvio padrão (𝜎) for conhecido.

Para Ron LARSON e Betsy FARBER5, uma estimativa pontual e um valor único
estimado para um parâmetro populacional. A estimativa pontual menos tendenciosa (viesada)
da média populacional 𝜇 e a media amostral 𝑥̅ .

A validade de um método de estimativa aumenta quando se utiliza uma estatística


amostral que seja não tendenciosa e de variância mínima. Uma estatística e não tendenciosa se
não superestima ou subestima o parâmetro populacional, como bem se sabe de todas as médias
amostrais possíveis de mesmo tamanho e igual a média populacional. Como resultado, 𝑥̅ e um
estimador não tendencioso de 𝜇. Alem disso, o erro padrão 𝑆/√𝑛 da média diminui em função
do aumento de n. No limite, quando n tende ao infinito, o erro padrão tende a zero.

Exemplo pratico de uma estimativa pontual

Encontrando uma estimativa pontual

Um pesquisador da área econômica está coletando dados sobre funcionários de


mercearias em um condado. Os dados listados a seguir representam uma amostra aleatória do
número de horas semanais trabalhadas por 40 funcionários de diversas mercearias no condado.
Encontre uma estimativa pontual da média populacional m. (Adaptado de: U.S. Bureau of
Labor Statistics.)

30 26 33 26 26 33 31 31 21 37
27 20 34 35 30 24 38 34 39 31
22 30 23 23 31 44 31 33 33 26
27 28 25 35 23 32 29 31 25 27
Solução

5
LARSON, Ron e FARBER, betsy. Estatística aplicada 6a edição. Pearson Education do Brasil, 2015.
P.277.

6
A média amostral dos dados é
∑𝑥 1,184
𝑥̅ = = = 29,6
𝑛 40
Então, a estimativa pontual para o número médio de horas semanais trabalhadas por
funcionários de mercearias nesse condado é de 29,6 horas.

No exemplo acima ilustrado, a probabilidade de que a média populacional seja


exatamente 29,6 e praticamente zero. Então, em vez de estimar 𝜇 como sendo exatamente 29,6
por meio da estimativa pontual, você pode estimar que 𝜇 esta em um intervalo. Isso se chama
fazer uma estimativa intervalar (ou estimativa por intervalo).

Segundo Ron LARSON e Besty FARBER6, uma estimativa intervalar é um


intervalo, ou amplitude de valores, usado para estimar um parâmetro populacional.

Embora possamos supor que a estimativa pontual do exemplo acima exposto não
seja igual a média real da população, provavelmente esta muito próxima dela. Para formar uma
estimativa intervalar, use a estimativa pontual como o centro do intervalo e depois adicione e
subtraia uma margem de erro. Por exemplo, se a margem de erro for 2,1, então uma estimativa
intervalar seria dada por 29,6 ± 2,1 ou 27,5 < 𝜇< 31,7 para estimar um parâmetro populacional.
A figura que se segue é uma ilustração da estimativa pontual e estimativa intervalar.

Antes de encontrar uma margem de erro para uma estimativa intervalar, devemos
primeiro determinar quão confiante você precisa estar de que sua estimativa intervalar contenha
a media populacional 𝜇.

6
LARSON, Ron e FARBER, betsy. Estatistica aplicada 6a edição. Pearson Education do Brasil, 2015.
P.278.

7
Segundo Ron LARSON e Betsy FARBER7, o nível de confiança c é a probabilidade
de que a estimativa intervalar contenha o parâmetro populacional, supondo que o processo de
estimação é repetido um grande número de vezes.

Como bem sabemos do do teorema do limite central que aprendemos no capítulo


anterior, quando n ≥ 30, a média amostral terá, no mínimo, distribuição aproximadamente
normal. O nível de confiança c corresponde à área sob a curva normal padrão entre os valores
críticos, -Zc e Zc. Esses valores críticos, em geral, separam resultados prováveis (região
central) de improváveis, ou incomuns (caudas) Pode-se ver na que se segue logo abaixo que c
é a percentagem da área sob a curva normal entre -Zc e Zc A área restante é 1 – c, então a área
em cada cauda é (1 – c)/2. Por exemplo, se c = 90%, então 5% da área está à esquerda de -Zc =
–1,645 e 5% está à direita de Zc = 1,645, conforme a Tabela que segue

Figura: Área sob a curva normal padrão representando o nível de confiança (c).

Figura: Detalhamento das áreas sob a curva normal padrão em função dos valores críticos.

7
LARSON, Ron e FARBER, betsy. Estatistica aplicada 6a edição. Pearson Education do Brasil, 2015.
P.279.

8
A diferença entre a estimativa pontual e o valor real do parâmetro é chamada de erro
de amostragem ou erro amostral. Quando 𝑥̅ é estimado, o erro de amostragem é a diferença de
𝑥̅ − 𝜇. Na maioria dos casos, é claro, m é desconhecido e x varia de amostra para amostra.
Entretanto, você pode calcular o valor máximo para o erro quando souber o nível de confiança
e a distribuição amostral da variável.

Dado um nível de confiança c, a margem de erro E (às vezes chamada também de


erro máximo da estimativa ou tolerância de erro) é a maior distância possível entre a estimativa
pontual e o valor do parâmetro que ela está estimando. Para uma média populacional 𝜇 em que
s é conhecido, a margem de erro é
𝜎
𝐸 = 𝑍𝑐 𝜎𝑥̅ = 𝑍𝑐 Margem de erro para 𝜇 ( 𝜎 conhecido)
√𝑛

quando são atendidas as duas condições a seguir:


1. A amostra e aleatória.
2. Pelo menos um dos seguintes e verdade: a população e normalmente distribuída ou
n ≥ 30.

4.2 Intervalos de confiança para a media populacional

Usando uma estimativa pontual e uma margem de erro, você pode construir uma
estimativa intervalar de um parâmetro populacional tal como 𝜇. Essa estimativa intervalar e
chamada de intervalo de confiança.
Um intervalo de confiança c para a média populacional 𝜇 é:
𝑥̅ - E < 𝜇 < 𝑥̅ + E
A probabilidade de que o intervalo de confiança contenha 𝜇 é igual a c, assumindo
que o processo de estimação é repetido um grande número de vezes.

4.2.1 Instruções

Construindo um intervalo de confiança para a média populacional (S conhecido)


1. Verificar se s é conhecido, a amostra é aleatória, e a população é normalmente
distribuída ou n ≥ 30.
∑𝑥
2. Encontrar as estatísticas amostrais n é 𝑥̅ . 𝑥̅ = 𝑛

3. Encontrar o valor crítico que corresponde ao nível de confiança dado.

9
4. Calcular a margem de erro E. E = zc
5. Calcular os limites inferior e superior e construir o intervalo de confiança.
Limite inferior: 𝑥̅ - E
Limite superior: 𝑥̅ + E
Intervalo: 𝑥̅ - E < 𝜇< 𝑥̅ + E
Após construir um intervalo de confiança, é importante que você interprete os
resultados corretamente.
4.2.2 Tamanho da amostra

Para a mesma estatística amostral, conforme o nível de confiança aumenta, o


intervalo de confiança fica mais largo. Conforme o intervalo de confiança fica mais largo, a
precisão da estimativa decresce. Uma maneira de melhorar a precisão de uma estimativa sem
diminuir o nível de confiança é aumentar o tamanho da amostra. Mas qual tamanho da amostra
é necessário para garantir um certo nível de confiança para uma margem de erro dada?
A partir da fórmula para o cálculo da margem de erro
𝜎
𝐸 = 𝑍𝑐
√𝑛
uma fórmula pode ser derivada para encontrar o tamanho mínimo de amostra n,
conforme mostrado na próxima definição.

Encontrar o tamanho mínimo de uma amostra para estimar M Dado o nível de


confiança c e uma margem de erro E, o tamanho mínimo da amostra n necessário para estimar
a média populacional 𝜇 é:
𝑍𝑐 𝜎 2
𝑛=( )
𝐸
Quando 𝜎 e desconhecido, você pode estima-lo usando 𝑠, dado que você tenha uma
amostra preliminar com pelo menos 30 membros.

4.3 Intervalos de confiança para a média (𝜎 desconhecido)

Em muitas situações de vida real, o desvio padrão da população é desconhecido.


Então, como podemos construir um intervalo de confiança para uma média populacional no
qual 𝜎 não é conhecido? Para uma variável aleatória que é normalmente distribuída (ou

10
aproximadamente normalmente distribuída), a variável média amostral comporta-se tal qual
outro modelo, a distribuição t.
Para Ron LARSON e Betsy FARBER8, se a distribuição de uma variável aleatória x
for, no mínimo, aproximadamente normal, então a média amostral distribui-se tal qual a
estatística
𝑥̅ − 𝜇
𝑡=
𝑠/√𝑛
denominada distribuição t.
Valores críticos de t são denotados por tc. Apresentamos a seguir diversas
propriedades da distribuição t.
1. A média, a mediana e a moda da distribuição t são iguais a 0.
2. A distribuição t tem forma de sino e é simétrica em relação à média.
3. A área total sob a curva da distribuição t é igual a 1.
4. As caudas na distribuição t são “mais grossas” que as da distribuição normal padrão.
5. O desvio padrão da distribuição t varia com o tamanho da amostra, mas é maior que
1.
6. A distribuição t é uma família de curvas, cada uma determinada por um parâmetro
chamado de graus de liberdade. Os graus de liberdade (algumas vezes abreviados
como g.l.) são o número de escolhas livres deixadas depois que uma estatística amostral tal
como 𝑥̅ é calculada. Quando usamos a distribuição t para estimar uma média populacional, os
graus de liberdade são iguais ao tamanho da amostra menos um.
𝑔. 𝑖 = 𝑛 − 1 𝐺𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒
7. Conforme os graus de liberdade aumentam, a distribuição t se aproxima da
distribuição normal, conforme mostrado na Figura que se segue a partir dos 30 g.l., a
distribuição t tende a se aproximar da distribuição normal padrão.

8
LARSON, Ron e FARBER, betsy. Estatistica aplicada 6a edição. Pearson Education do Brasil, 2015.
P.289.

11
4.4 Intervalos de confiança e distribuições t

Construir um intervalo de confiança para m quando s não é conhecido usando a


distribuição t é similar a construir um intervalo de confiança para m quando s é conhecido
usando a distribuição normal padrão, ambos usam uma estimativa pontual 𝑥̅ e uma margem de
erro E. Quando 𝜎 não é conhecido, a margem de erro E é calculada usando o desvio padrão
amostral s e o valor crítico tc. Então, a fórmula para E é:
𝑆
𝐸 = 𝑡𝑐
√𝑛
Antes de usar essa fórmula, verifique se a amostra é aleatória e ou a população é
normalmente distribuída ou n ≥ 30.

4.4.1Como construir um intervalo de confiança para a média populacional (𝝈


desconhecido)

1. Verificar se s não é conhecido, a amostra é aleatória, e ou a população é


normalmente distribuída ou n ≥ 30.
∑𝑋 ∑(𝑋−𝑥̅ )2
2. Calcular as estatísticas amostrais n, 𝑥̅ e s. 𝑥̅ = ,𝑆 = √
𝑛 𝑛−1

3. Identificar os graus de liberdade, o nível de confiança c e o valor crítico tc 𝑔. 𝑖 =


𝑛−1
𝑠
4. Calcular a margem de erro E. 𝐸 = 𝑡𝑐
√𝑛

5. Calcular os limites inferior e superior e construir o intervalo de confiança.


Limite inferior: x - E
Limite superior: x + E

12
Intervalo: 𝑥̅ - E < 𝜇 < 𝑥̅ + E

Intervalos de confiança para a proporção


Neste capítulo iremos aprender como estimar uma proporção populacional p usando
um intervalo de confiança. Como no caso dos intervalos de confiança para m, você começará
com uma estimativa pontual.

A estimativa pontual para p, a proporção populacional de sucessos, é dada


pela proporção de sucessos em uma amostra e é denotada por:
𝑥
𝑃̂ =
𝑛
em que x é o número de sucessos em uma amostra e n é o tamanho da amostra.
A estimativa pontual para a proporção populacional de não sucessos é 𝑞̂ =1 - 𝑃̂.
Os símbolos 𝑃̂ e 𝑞̂ são lidos como “p chapéu” e “q chapéu”

4.5 Intervalos de confiança para uma proporção populacional

Construir um intervalo de confiança para uma proporção populacional p e similar a


construir um intervalo de confiança para uma média populacional. Você começa com uma
estimação pontual e calcula uma margem de erro.

Um intervalo de confiança c para uma proporção populacional p é


𝑃̂ − 𝐸 < 𝑝 < 𝑃̂ + 𝐸
𝑝̂𝑞̂
Em que 𝐸 = 𝑍𝑐 √ 𝑛 Margem de Erro de p.

A probabilidade de que o intervalo de confiança contenha p é c, supondo que o


processo de estimação é repetido um grande número de vezes.
Construindo um intervalo de confiança para a proporção populacional
1. Identificar as estatísticas amostrais n e x.
𝑋
2. Encontrar a estimativa pontual 𝑃̂. 𝑃̂ = 𝑛

3. Verificar se a distribuição amostral de 𝑃̂ pode ser aproximada por uma distribuição


normal 𝑛𝑃̂ ≥ 5, 𝑛𝑞̂ ≥ 5.
4. Encontrar o valor crítico 𝑍𝑐 que corresponde ao nível de confiança c dado.

13
𝑝̂𝑞̂
5. Calcular a margem de erro E. 𝐸 = 𝑍𝑐 √ 𝑛

6. Calcular os limites inferior e superior e formar o intervalo de confiança.


Limite inferior: 𝑃̂ − 𝐸
Limite superior: 𝑃̂ + 𝐸
Intervalo: 𝑃̂ − 𝐸 < 𝑝 < 𝑃̂ + 𝐸

Encontrando um tamanho mínimo de amostra


Uma forma de aumentar a precisão do intervalo de confiança sem diminuir o nível
de confiança é aumentar o tamanho da amostra.
Encontrando um tamanho mínimo de amostra para estimar p
Dado um nível de confiança c e uma margem de erro E, o tamanho mínimo da
amostra n necessário para estimar a proporção populacional p é:
𝑍𝑐
𝑛 = 𝑝̂ 𝑞̂( )2
𝐸
Essa fórmula supõe que você tenha estimativas preliminares de 𝑝̂ 𝑒 𝑞̂. Se não tiver use
𝑝̂ = 0,5 𝑒 𝑞̂ = 0,5.

4.6 Intervalos de confiança para variância e desvio padrão

4.6.1 A distribuição qui-quadrado

Na indústria, é necessário controlar o quanto um processo varia. Por exemplo, o


fabricante de uma peça de automóvel deve produzir milhares de peças para serem usadas no
processo de fabricação. É importante que as peças variem muito pouco dentro do intervalo
especificado. Como você pode medir, e consequentemente controlar, a quantidade de variação
nas peças? Você pode começar com uma estimativa pontual.

A estimativa pontual para 𝜎 2 é 𝑠 2 e a estimativa pontual para 𝜎 é s. A melhor


estimativa não viesada para 𝜎 2 é 𝑠 2 .
Você pode usar uma distribuição qui-quadrado para construir um intervalo de
confiança para a variância e o desvio padrão.
Se a variável aleatória x tem uma distribuição normal com desvio padrão 𝜎, então:

2
(𝑛 − 1)𝑠 2
𝑥 =
𝜎2

14
resulta uma distribuição qui-quadrado com n – 1 graus de liberdade, para amostras de
qualquer tamanho n > 1. A seguir algumas propriedades da distribuição qui-quadrado.
1. Todos valores de 𝑋 2 são maiores ou iguais a 0.
2. A distribuição qui-quadrado é uma família de curvas, cada uma determinada pelos
graus de liberdade. Para construir um intervalo de confiança para 𝜎², use a distribuição qui-
quadrado com graus de liberdade iguais ao tamanho da amostra menos um.
𝑔. 𝐼 = 𝑛 − 1 graus de liberdade
3. A área total abaixo de cada curva da distribuição qui-quadrado é igual a 1.
4. A distribuição qui-quadrado é assimétrica positiva.
5. A distribuição qui-quadrado é diferente para cada número de graus de liberdade.
Conforme os graus de liberdade aumentam, a distribuição qui-quadrado se aproxima de uma
distribuição normal.

Distribuição qui-quadrado para diferentes graus de liberdade

4.6.1 Intervalos de confiança para 𝝈𝟐 𝒆 𝝈

O intervalo de confiança c para a variância e o desvio padrão populacional é:

Intervalo de confiança para 𝜎²:


(𝑛 − 1)𝑠 2 2
(𝑛 − 1)𝑠 2
< 𝜎 <
𝑋𝑅2 𝑋𝐿2
Intervalo de confiança para 𝜎:

15
(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
√ < 𝜎 < √
𝑋𝑅2 𝑋𝐿2

A probabilidade de que os intervalos de confiança contenham 𝜎 2 ou 𝜎 é c, supondo


que o processo de estimação é repetido um grande número de vezes.

Construindo um intervalo de confiança para variância e desvio padrão


1. Verificar se a população tem uma distribuição normal.
2. Identificar a dimensão amostral n e os graus de liberdade. 𝑔. 𝐼 = 𝑛 − 1
∑(𝑥−𝑥̅ )2
3. Encontrar a estimativa pontual 𝑠 2 . 𝑠2 = 𝑛−1

4. Encontrar os valores críticos 𝑋𝑅2 𝑒 𝑋𝐿2 que correspondem ao nível de confiança c


dado e aos graus de liberdade.
5. Encontrar os limites inferior e superior e formar o intervalo de confiança para a
variância populacional.
Limite Inferior Limite superior
(𝑛 − 1)𝑠 2 2
(𝑛 − 1)𝑠 2
<𝜎 <
𝑋𝑅2 𝑋𝐿2
6. Encontrar intervalo de confiança para o desvio padrão populacional tirando a raiz
quadrada de cada limite.
Limite inferior Limite superior

(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
√ < 𝜎 < √
𝑋𝑅2 𝑋𝐿2

5. Teste De Hipóteses

Segundo Nilo SAMPAIO et all9, o teste de Hipóteses é um procedimento que permite


tomar uma decisão (aceitar ou rejeitar a hipótese nula) entre duas ou mais hipóteses (hipótese
nula ou hipótese alternativa), utilizando os dados observados de um determinado experimento.
Há diversos métodos para realizar o teste de hipóteses, dos quais se destacam o método de
Fisher (teste de significância), o método de Neyman–Pearson e o método de Bayes.

9 9 SAMPAIO, Nilo et all. Estatística Inferencial. 1a edição. editora Poisson. P.34.

16
São dois os tipos de erros que podemos cometer na realização de um teste de
hipóteses:
1. Rejeitar a hipótese 𝐻0, quando ela é verdadeira.
2. Não rejeitar a hipótese 𝐻0, quando ela é falsa
A tabela que se segue demonstra de uma maneira resumida as situações acima
descritas:
Aceitar 𝐻𝑂 Rejeitar Ho
𝐻𝑜 Verdadeira Decisão correta Erro tipo I
𝐻𝑜 Falsa Erro tipo II Decisão correta

Nilo SAMPAIO e Bernardo FONSECA 10


estabelecem que se a hipótese 𝐻0 for
verdadeira e não rejeitada ou falsa e rejeitada, a decisão estará correta. No
entanto, se a hipótese 𝐻0 for rejeitada sendo verdadeira ou se não for rejeitada sendo
falsa, a
decisão estará errada. O primeiro destes erros é chamado de Erro do Tipo I e a
probabilidade de cometê-lo é denotada pela letra grega 𝛼 (alfa); o segundo é chamado de Erro
do Tipo II e a
probabilidade de cometê-lo é denotada pela letra grega 𝛽 (beta). Assim temos:
𝛼 = ℙ(Erro do tipo I) = 𝑃(rejeitar 𝐻0 dado 𝐻0 verdadeira);
𝛽 = ℙ(Erro do tipo II) = 𝑃(aceitar 𝐻0 dado 𝐻0 falsa);

5.1 Teste T

Para Jeffrey WOOLDRIDGE 11


a estatística t é a razão entre o coeficiente estimado
(βj) e seu erro padrão: ep (βj). O erro padrão é sempre positivo, então a razão t sempre terá o
mesmo sinal que o coeficiente estimado.

GUJARATI e PORTER 12estabelecem que a ideia fundamental por trás dos testes de
significância é a de um teste estatístico (estimador) e a distribuição amostral dessa estatística

10
SAMPAIO, Nilo et all. Op. Cit. P.34.

WOOLDRIDGE, Jeffrey M. “Introdução à econometria: uma abordagem moderna”. São Paulo:


11

CengageLearning, 2008. P.113.


12
GUJARATI, Damodar N. & PORTER, Dawn C. Op. Cit. P. 135.

17
sob a hipótese nula. A decisão de aceitar ou rejeitar H0 é tomada com base no valor do teste
estatístico dos dados disponíveis.
𝛽̂ 2 − 𝛽̂ 2
𝑡=
𝑒𝑝 (𝛽̂ 2)

(𝛽̂ 2 − 𝛽2)√∑ 𝑋𝑖2


=
𝜎̂

Valor estimado de beta distante de zero é evidência contra a hipótese nula, mas devemos
ponderar pelo erro amostral. Como o erro-padrão de βj é uma estimativa do desvio-padrão de
βj, o teste t mede quantos desvios-padrão estimados βj está afastado de zero. Isso é o mesmo
que testar se a média de uma população é zero, usando a estatística t padrão.

A regra de rejeição depende da hipótese alternativa e do nível de significância escolhido do


teste. Sempre testamos hipótese sobre parâmetros populacionais, e não sobre estimativas de
uma amostra particular.

5.1.1 Valores-P Dos Testes T

Dado o valor observado da estatística t, qual é o menor nível de significância ao qual


a hipótese nula seria rejeitada?
➢ Não há nível de significância “correto”.
➢ O p-valor é a probabilidade de a hipótese nula ser verdadeira:
➢ p-valores pequenos são evidências contra-hipótese nula.
➢ p-valores grandes fornecem pouca evidência contra 𝐻0 .
➢ Se αé o nível de significância do teste, então H𝐻0 é rejeitada se p-valor < α.
➢ 𝐻0 não é rejeitada ao nível de 100*α%.

5.2 O Teste F

Não podemos empregar o conhecido teste t para verificar a hipótese conjunta de que
os verdadeiros coeficientes parciais angulares são simultaneamente iguais a zero. No entanto,
essa hipótese conjunta pode ser verificada pela técnica da análise de variância.

18
De acordo com Jeffrey WOOLDRIDGE 13
o teste F também é conhecido como razão F
ou estatística F e podemos defini-la da seguinte maneira:
(𝑆𝑄𝑅𝑟 − 𝑆𝑄𝑅𝑖𝑟 )/𝑄
𝐹=
𝑆𝑄𝑅𝑖𝑟 /(𝑛 − 𝑘 − 1)

SQRr é a soma dos resíduos quadrados do modelo restrito.


SQRir é a soma dos resíduos quadrados do modelo irrestrito.
q é o número de variáveis independentes retiradas (neste caso temos três: β3, β4eβ5),
ou seja, q=glr-glir.
Quando falamos da estatística F queremos saber exatamente o seguinte:
➢ Precisamos saber o quanto SQR aumenta, quando retiramos as variáveis que estamos
testando.
➢ Modelo restrito terá β0, β1e β2.
➢ Modelo irrestrito terá β0, β1, β2, β3, β4eβ5.

5.2.1 Regras De Rejeição De F

O valor crítico (c) depende de:


➢ Nível de significância (10%, 5% ou 1%, por exemplo).
➢ Graus de liberdade do numerador (q=glr-glir).
➢ Graus de liberdade do denominador (n-k-1).
➢ Quando os gl do denominador chegam a 120, a distribuição Fnão é mais sensível a eles
(usar gl=∞).
➢ Uma vez obtido c, rejeitamos H0, em favor de H1, ao nível de significância escolhido
se: F > c.
➢ Se H0 (β3=0, β4=0, β5=0) é rejeitada, β3, β4e β5 são estatisticamente significantes
conjuntamente.
➢ Se H0 (β3=0, β4=0, β5=0) não é rejeitada, β3, β4e β5 são conjuntamente não significantes

13
WOOLDRIDGE, Jeffrey M. “Introdução à econometria: uma abordagem moderna”. São Paulo:
CengageLearning, 2008. P.137.

19
5.2.2 Forma R-Quadrado Da Estatística F

Para Jeffrey WOOLDRIDGE14, o teste F pode ser calculado usando os R-quadrados


dos modelos resitrito e irrestrito. É mais fácil utilizar números entre zero e um (R2) do que
números que podem ser muito grandes (SQR). Como SQRr=SQT(1 -Rr2), SQRir=SQT(1 -Rir2)
e:
(𝑆𝑄𝑅𝑟 − 𝑆𝑄𝑅𝑖𝑟 )/𝑞
𝐹=
𝑆𝑄𝑅𝑖𝑟 /(𝑛 − 𝑘 − 1)
... os termos SQT são cancelados:
2
(𝑅𝑖𝑟 − 𝑅𝑟2 )/𝑞
𝐹= 2
(1 − 𝑅𝑖𝑟 )/(𝑛 − 𝑘 − 1)

Cálculo dos p-valores para testes F


p-valor = P(F> F)
O p-valor é a probabilidade de observarmos um valor de F pelo menos tão grande
(F) quanto aquele valor real que encontramos (F), dado que a hipótese nula é verdadeira. Um
p-valor pequeno é evidência para rejeitar H0, porque a probabilidade de observarmos um valor
de F tão grande quanto aquele para o qual a hipótese nula é verdadeira é muito baixa. Um p-
valor alto é evidência para não rejeitar H0, porque a probabilidade de observarmos um valor de
F tão grande quanto aquele para o qual a hipótese nula é verdadeira é muito alta.

5.2.3 Descrição dos resultados da regressão

➢ Informar os coeficientes estimados de MQO (betas).


➢ Interpretar significância econômica(prática) dos coeficientes das variáveis
fundamentais, levando em consideração as unidades de medida.
➢ Interpretar significância estatística, ao incluir erros-padrão entre parênteses abaixo dos
coeficientes (ou estatísticas t, ou p-valores, ou asteriscos).
➢ Erro padrão é preferível, pois podemos: (1) testar hipótese nula quando parâmetro
populacional não é zero; (2) calcular intervalos de confiança.
➢ Informar o R-quadrado: (1) grau de ajuste; (2) cálculo de F.
➢ Número de observações usado na estimação (n).

14
WOOLDRIDGE, Jeffrey M. “Introdução à econometria: uma abordagem moderna”. São Paulo:
CengageLearning, 2008. P.144.

20
➢ Apresentar resultados em equações sou tabelas (indicar variável dependente, além de
independentes na 1ª coluna).
➢ Mostrar SQRe erro-padrão (Root MRE), mas não é crucial.

5.3 Relação entre estatísticas F e t

➢ A estatística F para testar a exclusão de uma única variável é igual ao quadrado da


estatística t correspondente.
➢ As duas abordagens levam ao mesmo resultado, desde que a hipótese alternativa seja
bilateral.
➢ A estatística t é mais flexível para testar uma única hipótese, porque pode ser usada
para testar alternativas unilaterais.
➢ As estatísticas t são mais fáceis de serem obtidas do que o teste F.

5.4 O valor P

Segundo GUJARATI e PORTER 15


o valor p (o valor da probabilidade) é definido
como o menor nível de significância em que uma hipótese nula pode ser rejeitada, também
conhecida como nível de significância exato ou observado ou probabilidade exata de cometer
um erro do Tipo I.
O cálculo do valor P requer programas computacionais que calculem probabilidades
da distribuição t para qualquer abscissa. Mas a interpretação do valor P é basicamente a
seguinte:
valores pequenos de P indicam eventos pouco prováveis de ocorrerem quando H0 é
verdadeira.
Assim a decisão pode ser feita em termos do p-valor: rejeitamos ou não H0, conforme
o p-valor seja, respectivamente, menor ou não que o nível α, de significância, estabelecido.

Qual a relação entre o valor p e o nível de significância Æ? Se nos acostumarmos a


fixar Æ igual ao valor p de um teste estatístico (como a estatística t), não haverá conflito entre
os dois valores. Em outras palavras, é melhor abrir mão de fixar Æ arbitrariamente em algum
nível e apenas escolher o valor p do teste estatístico.

15
GUJARATI, Damodar N. & PORTER, Dawn C. Op. Cit. P. 142.

21
É preferível deixar ao leitor a decisão de rejeitar ou não a hipótese nula a um dado
valor p. Se, em uma aplicação, o valor p em um teste estatístico for de 0,145% ou 14,5% e se
o leitor desejar rejeitar a hipótese nula neste (exato) nível de significância, que assim seja. Não
há nada de mau em arriscar estar errado em 14,5% das vezes se você rejeitar a hipótese nula
verdadeira. Do mesmo modo, como em nosso exemplo salários-escolaridade, não há nada de
errado se o pesquisador escolher um valor p de 0,02% e não correr o risco de estar errado mais
do que 2 em 10 mil vezes. Afinal, alguns pesquisadores podem ser adeptos ao risco e outros
avessos a ele.

22
6. Conclusão

Após pesquisas relacionadas aos temas dados e propostos para a elaboração do


trabalho pode se concluir que o teorema de Gauss é um instrumento poderoso para os modelos
matemáticos que descrevem alguns fenómenos físicos como fluxo de fluidos, fluxo de campos
elétricos ou magnéticos e fluxo de calor ele e acerca do teorema central do limite pode se dizer
que é um importante resultado da estatística e a demonstração de muitos outros teoremas
estatísticos dependem dele.

Inferência estatística é uma área da Estatística cujo objetivo é fazer afirmações a


partir de um conjunto de valores representativos (amostra) sobre um universo e se assume que
a amostra é muito maior do que o conjunto de dados observados.

O objetivo dos testes de hipóteses é validar ou não determinadas afirmações sobre a


população com base na informação amostral. No caso particular dos testes de hipóteses
paramétricos a validação diz apenas respeito aos parâmetros da população.

No que diz respeito aos testes de hipótese t pode se dizer que são mais fáceis de
serem obtidas do que o teste F, porque, estatística t é mais flexível para testar uma única
hipótese, porque pode ser usada para testar alternativas unilaterais.
.

23
7. Referencias Bibliográficas

• GUJARATI, Damodar N. & 2.PORTER, Dawn C. Econometria Básica. 5ª Ed. AMGH


editora, 2011
• LARSON, Ron & FARBER, Besty , Estatística aplicada 6ª edição São Paulo.
• MAHALUÇA, Filipe António. Estatística Aplicada. 2016.
• MORETTIN, Pedro Alberto, Wilton O. Bussab, estatística básica 9. ed. – São Paulo:
Saraiva, 2017
• MINHÓS, Feliz. Análise Matemática. Sd.
• SAMPAIO, Nilo Antônio de Souza; ASSUMPÇÃO, Alzira Ramalho Pinheiro de;
FONSECA, Bernardo Bastos da – Estatística Inferencial. Belo Horizonte, Editora
Poisson, 2018.
• WOOLDRIDGE, Jeffrey M. “Introdução à econometria: uma abordagem moderna”. São Paulo:
CengageLearning, 2008

24

Você também pode gostar