Você está na página 1de 4

Universidade de Brasília - Departamento de Estatística - Estatística Aplicada – Profa.

Claudete Ruas
NOÇÕES DE INFERÊNCIA: material de apoio

ESTIMAÇÃO DE PARÂMETROS

• OBJETIVO: avaliar (estimar) valores de características populacionais desconhecidas C __ como média,


proporção de sucessos, desvio padrão__ , com base em uma amostra aleatória de tamanho n .

• Para estimar C, usamos um ESTIMADOR, que é função das variáveis aleatórias que compõem a amostra.

• ESTIMADOR Î tem distribuição de probabilidade Î DISTRIBUIÇÃO AMOSTRAL


(v. a. ) permite verificarmos quão próximo
está um resultado amostral da
característica populacional

• HÁ CRITÉRIOS PARA SE DETERMINAR QUAL É O MELHOR ESTIMADOR .

• TIPOS DE ESTIMAÇÃO

• PONTUAL: um único valor estima a característica populacional . Há uma única estimativa. Não se tem
margem de erro do resultado ou o grau de confiança dele.

• INTERVALAR: um intervalo de valores possíveis no qual temos contida a característica populacional com
grau de confiança e erro conhecidos.

Esse intervalo é denominado INTERVALO DE CONFIANÇA que, com probabilidade conhecida , ou


GRAU DE CONFIANÇA, contém a característica populacional.

• PARA A CONSTRUÇÃO DO INTERVALO DE CONFIANÇA, PRECISAMOS:


• amostra aleatória simples retirada da população
• conhecer a distribuição amostral do estimador
Estimador : Média Amostral . Pode ter distribuição normal ou t-student
Estimador: Proporção Amostral. Pode ter distribuição normal
• a precisão desejada para a estimativa: que depende do tamanho da amostra e do grau de confiança
desejado na estimação.

EXEMPLOS:

1) População : veículos de uma frota


Objetivo: estudar o consumo médio por veículo, com base em uma amostra deles
Parâmetro populacional: média ( da variável Consumo)
Estimação pontual: O consumo médio de combustível por veículo é de 12 km por litro.
Estimação intervalar: O consumo médio de combustível por veículo está entre 11 e 13 km/ litro, com
confiança de 95%.

2) População : veículos de uma frota


Objetivo: estudar a variabilidade do consumo por veículo, com base em uma amostra deles
Parâmetro populacional: desvio padrão ( da variável Consumo)
Estimação pontual: O desvio padrão do consumo de combustível por veículo é de 1,2 km por litro.
Estimação intervalar: O desvio padrão do consumo de combustível por veículo está entre 1 e 1,4 km/ litro,
com confiança de 95%.

3) População : eleitores de um município


Objetivo: estudar a proporção ( ou % ) de eleitores do candidato José , com base em uma amostra deles
Parâmetro populacional: proporção ( ou % ) de eleitores do candidato José no município
Estimação pontual: A proporção ( ou % ) de eleitores do candidato José é de 0,42 ( ou 42%)
Estimação intervalar: A proporção ( % ) de eleitores do candidato José está entre 0,39 e 0,45 ( ou 39% e
45%), com confiança de 90%.
Universidade de Brasília - Departamento de Estatística - Estatística Aplicada – Profa. Claudete Ruas

DISTRIBUIÇÃO DE PROBABILIDADE DA MÉDIA AMOSTRAL , usada para estimar a média


(desconhecida) de uma população.

V.A . X na população com média µ e desvio padrão σ

Tomando uma amostra aleatória simples de tamanho n, temos


( X1, X2, X3, X4, ... , Xn-1, Xn ) , então

X = ( X1 + X2 + X3 + ... + Xn ) / n
Se X ( na população) tem distribuição normal Î

a) sendo o desvio padrão σ ( na população ) conhecido,


X tem distribuição normal com média µ e desvio padrão σ / n e, portanto

X −µ
Z= tem distribuição normal com média 0 e variância 1.
σ
n

b) sendo o desvio padrão σ ( na população ) desconhecido, este deve ser estimado pelo desvio padrão da
amostra, s = √ [∑ (xi - x )2/(n-1)]

X −µ
e a variável aleatória ( transformada) T = tem distribuição t –student com n-1 graus de liberdade.
s
n
____________________________________________________________________________

NA ESTIMAÇÃO DA MÉDIA POPULACIONAL, para amostra suficientemente grande podemos


utilizar a distribuição normal como aproximação para a distribuição da média amostral.

DISTRIBUIÇÃO DE PROBABILIDADE DA PROPORÇÃO AMOSTRAL , usada para estimar proporção


(desconhecida) de sucessos em uma população.

Seja a proporção π de sucessos na população

Tomando uma amostra aleatória simples de tamanho n, temos

p = proporção de sucessos na amostra, que é o estimador da proporção π de sucessos na população,

e cuja distribuição de probabilidade é normal com média π e variância π(1-π)/n, quando a amostra é grande ( que
pode ser verificado quando np > 5 e n(1-p) > 5).
Com base na amostra a variância será estimada por p(1-p)/n.
Universidade de Brasília - Departamento de Estatística - Estatística Aplicada – Profa. Claudete Ruas

INTERVALOS DE CONFIANÇA ,considerando população infinita e amostragem aleatória simples:


1a) IC PARA A MÉDIA µ DE UMA POPULAÇÃO com distribuição normal com desvio padrão σ conhecido,
com base em uma amostra de tamanho n.
X −µ
Estimador: X ~ N( média µ, desvio padrão σ / n ) Î Z = ~ N(0,1)
σ
n
• Intervalo com (1-α) de confiança:
P ( x - z σ / n ≤ µ ≤ x + z σ / n ) = 1- α , onde z é o escore da normal padrão cuja probabilidade
acumulada é 1-α/2.

• Tamanho de amostra necessário para estimar µ com confiança (1- α) e erro amostral
e =  x - µ: n = z2. σ2 / e2

1b) IC PARA A MÉDIA µ DE UMA POPULAÇÃO com distribuição normal com desvio padrão σ
desconhecido, com base em uma amostra de tamanho n. O desvio σ deve ser estimado pelo desvio padrão da
amostra, s = √ [∑ (xi - x )2/(n-1)].

X −µ
Estimador : T = ~ t –student com
s
n
n-1 graus de liberdade.
• Intervalo com (1-α) de confiança:
P ( x - t s / n ≤ µ ≤ x + t s / n ) = 1- α, onde t é o escore da distribuição tn-1 cuja probabilidade acumulada
é 1-α/2.

• Tamanho de amostra necessário para estimar µ com confiança (1- α) e erro amostral e =  x - µ, tendo
como base uma amostra piloto de tamanho n0 e estimativa s do desvio padrão: n = t2. s2 / e2 , sendo t
com (n0-1) graus de liberdade. Se n > n0, completar a amostra piloto.

No caso de amostras suficientemente grandes, a distribuição da média amostral pode ser aproximada para a
distribuição normal.

2)IC para a PROPORÇÃO π de SUCESSOS de uma POPULAÇÃO, com base em uma amostra de tamanho n
Estimador : p = proporção de sucessos na amostra
p ~ N (média π, variância estimada p(1-p)/n) , quando a amostra é grande (OBS: quando np ≥ 5 e n(1-p) ≥ 5 )
p −π
Î Z= ~ N( 0,1)
p(1− p)
n
• Intervalo com (1-α) de confiança para proporção populacional:
P (p - z p(1 − p) / n ≤ π ≤ p + z p(1 − p) / n ) = 1- α , onde z é o escore da normal padrão cuja
probabilidade acumulada é 1-α/2.

• Tamanho de amostra necessário para estimar π com confiança (1- α) e erro amostral e =  p - π , tendo
como base uma amostra piloto de tamanho n0 e estimativa p da proporção amostral : n = z2. p(1-p) / e2. Se n
> n0, completar a amostra piloto.

TRABALHANDO COM POPULAÇÕES FINITAS: Conhecer o tamanho N da população é relevante


particularmente quando a população é pequena. Neste caso, é feita uma correção na estimativa da variância do
estimador utilizado, N − n , chamado de fator de correção para população finita . Por exemplo, o IC do item
N −1
1b) fica x +- t s N − n . Em geral, essa correção é desprezível quando [ ( n/N) 100] < 5 %.
n N −1
Universidade de Brasília - Departamento de Estatística - Estatística Aplicada – Profa. Claudete Ruas

TESTES DE HIPÓTESES

OBJETIVO: com base em uma amostra aleatória simples de tamanho n,


avaliar afirmações sobre os valores de uma característica populacional c, colocadas sobre a forma de hipóteses.

PROCEDIMENTO: usando a distribuição de probabilidade do melhor estimador de c ( conforme visto em


estimação de parâmetros), verificamos se a diferença entre a estimativa obtida na amostra e o valor de c pode ser
atribuída à variabilidade amostral ou não. Isto nos leva à decisão de aceitar uma das hipóteses formuladas, com
probabilidade de erro controlada.

HIPÓTESES:
Hipótese Nula, H0: afirmação sobre a característica populacional, que trabalharemos como se fosse verdadeira.
Hipótese Alternativa, H1: alegação alternativa a H0.

Em um teste, a decisão será aceitar H0 ou rejeitar H0 ( consequentemente aceitando H1).

Podemos cometer dois tipos de erro ao decidirmos:

DECISÃO REALIDADE
H0 Verdadeira H1 Verdadeira
Aceitar H0 Decisão Correta Erro Tipo II
Rejeitar H0 Erro Tipo I Decisão Correta

α = P(ocorrer Erro Tipo I) = P ( rejeitar H0, quando H0 é verdadeira) = nível de significância de um teste

β = P(ocorrer Erro Tipo II ) = P ( aceitar H0, quando H0 é falsa)

IDEAL: α e β mínimos ( em geral, são fixados como 0,01; 0,05; 0,10)


Quando α diminui, β aumenta . Ambos diminuem, se aumentarmos o tamanho da amostra.

REGRA DE DECISÃO: quando aceitar ou rejeitar H0 ?


Fixando as probabilidades de erro, determinamos a regra de decisão.
Em geral, só é fixada a probabilidade de ocorrer erro tipo I, α.

TIPOS DE HIPÓTESES:
a) teste unilateral à esquerda H0: c = c0 H1: c < c0 onde c0 é valor conhecido
b) teste unilateral à direita H0: c = c0 H1: c > c0
c) teste bilateral H0: c = c0 H1: c ≠ c0

TESTE DE HIPÓTESES para a média µ de uma população normal com variância populacional desconhecida,
com base em uma amostra aleatória simples de tamanho n

1) Fixar as hipóteses
2) Especificar o nível de significância α
X −µ
3) Identificar a variável ou estatística do teste. Neste caso é , que tem distribuição t –student com n-1
s
n
graus de liberdade.

4) Região crítica do teste: valores da estatística do teste ( tcrítico) que levam à rejeição de Ho, considerando o
nível de significância e o tipo de hipótese considerado.

x − µ0
5) Calcular o valor da estatística do teste com base na amostra , tobservado = , considerando a hipótese
s
n
nula como verdadeira

6) Se o valor observado com base na amostra estiver na região crítica do teste, rejeitar H0, isto é , houve
evidência de que H0 é falsa ; caso contrário, aceitar H0, ou seja, não houve evidência para rejeitar H0.

Você também pode gostar