Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introdução
2. Teorema Central do Limite
3. Conceitos de Estimação Pontual
Distribuição Amostral e Estimação
4. Métodos de Estimação Pontual
Pontual de Parâmetros 5. Referências
População e Amostra
• População:
√ Conjunto de elementos que apresentam pelo menos
Introdução uma característica em comum
• População Alvo:
√ População de interesse da pesquisa
• Amostra:
√ Qualquer subconjunto não vazio da população
1
Técnicas de Amostragem
INFERÊNCIA
amostra representativa
ESTATÍSTICA
√ Amostra que representa toda a população da
melhor maneira possível
EXTRAÇÃO
DE AMOSTRAS PROBABILIDADE • A representatividade depende de:
ALEATÓRIAS ESTATÍSTICA
DESCRITIVA
√ Metodologia adotada para seleção da amostra
Amostra CARACTERÍSTICAS √ Tamanho da amostra
DA
AMOSTRA
2
Erro Amostral Erro Não–amostral
Inferência Estatística
Estimação de Parâmetros
• Definição:
√ Procedimentos generalizar características de • Estimação Pontual
população a partir da informação contida na amostra.
• Estimação Intervalar
• Baseia-se na Teoria de Probabilidades √ Intervalos de Confiança
• Áreas:
√ Estimação de parâmetros
√ Testes de hipóteses.
3
Teste de Hipóteses
Conceitos Fundamentais
• Parâmetro: • Estatística:
√ Quantidades de interesse da população √ Qualquer função da amostra que não dependa de
√ Em geral, desconhecidas parâmetros desconhecidos
– Média de uma população (µ) √ Exemplo : Algumas estatísticas da amostra aleatória
– Desvio-padrão de uma população (σ) X1, X2, ..., Xn:
√ Representadas por letras gregas X(1) = mín(X1, X2, ..., Xn)
√ Notação para estimador qualquer: θ X(n) = máx(X1, X2, ..., Xn)
4
• Distribuição amostral: • Espaço paramétrico (Θ)
√ Distribuição de probabilidades de uma estatística √ Conjunto em que o parâmetro θ toma valores
√ Exemplo: √ Exemplo: Seja a amostra aleatória X1, X2, ..., Xn da
– Distribuição amostral da média variável X ~ N(µ, σ2)
– Parâmetros da distribuição amostral da média – Se σ2=1, então θ = µ é o parâmetro desconhecido e
Θ = {µ, –∞ < µ < ∞}
– Se µ = 0, então θ = σ2 é o parâmetro desconhecido e
Θ = {σ2, σ2 > 0}
5
Teorema Central do Limite
quando n → ∞.
Exemplo – Simulação
• Comentários:
√ A aproximação normal para a média amostral • População exponencial com média 1:
depende do tamanho da amostra √λ=1
√ Com população contínua, unimodal e simétrica, na √ Geração de 10.000 valores dessa população
maioria dos casos, o TCL trabalha bem para √ Amostra de tamanho 1 (n = 1)
pequenas amostras (n = 4, 5).
√ Em muitos casos de interesse prático, a aproximação
normal será satisfatória para n ≥ 30
√ Se n < 30, o TCL funcionará se a distribuição da
população não for muito diferente da normal
6
• Amostra n =1 • Amostra n = 2
Exemplo – Simulação
• Amostras de tamanhos 2, 4, 10 e 20
• População com densidade em U:
√ f(x) = 12 (x – 0,5)2
√ Geração de 10.000 valores dessa população
√ Amostra de tamanho 1 (n = 1)
7
• Amostra n =1 • Amostras de tamanhos 2, 4, 10 e 20
8
• Caso 2: populações não normais com tamanhos Distribuição Amostral Aproximada de
amostrais maiores que 30 Diferença de Médias Amostrais
√ Pode-se usar o TCL para aproximar a distribuição • Suponha:
amostral da diferença:
√ Duas populações independentes, com médias µ1 e µ2
e variâncias σ12 e σ22
√ Amostras aleatórias independentes de tamanhos n1 e
n2 dessas populações
9
Propriedades de um Estimador Vício
10
Variância de Estimador
Estimador de Variância Mínima
^ ^
• θ1 e θ2 estimadores não-viciados de θ
√ Variâncias diferentes • Se considerarmos todos os estimadores não-
tendenciosos de θ, aquele com a menor variância
será chamado de estimador não-tendencioso de
variância mínima
√ Esse estimador é o mais provável, dentre todos os
não-viciados, para produzir uma estimativa que seja
próxima do valor verdadeiro
^ ^
√ Var(θ1) < Var(θ2)
– É mais provável que ^θ1 produza uma estimativa mais
próxima do valor verdadeiro de θ
11
√ Quando o estimador seguir uma distribuição normal, • Quadro comparativo:
podemos estar confiantes que o valor verdadeiro do
parâmetro estará entre dois erros-padrão da
estimativa
– Para grandes valores de n este é um resultado útil
√ Nos casos em que o estimador é não-viciado e não
normalmente distribuído
– Estimativa do parâmetro, em no máximo 6% das vezes, se
desviará do valor verdadeiro tanto quanto 4 erros-padrão
Consistência
• Exemplos:
^ √ A média amostral é consistente para estimar a média
• Um estimador θ é consistente se à medida em verdadeira
que o tamanho amostral aumenta, seu valor √ O primeiro item coletado da amostra não é
esperado converge para o parâmetro de interesse consistente para estimar a média populacional.
e sua variância converge para zero.
√ O estimador é consistente se e
12
Erro Quadrático Médio
√ Estimadores tendenciosos podem ser preferíveis a
^ estimadores não-tendenciosos se tiverem EQM menor
• O erro quadrático médio de um estimador θ do
parâmetro θ é definido como:
13
• Exemplo:
Eficiência √ No caso de amostra proveniente de distribuição
Normal.
^ ^
• Dados dois estimadores θ1 e θ2, não viciados – Média amostral e mediana amostral são não viciadas para
^
para um parâmetro θ, dizemos que θ1 é mais estimar a média populacional:
^ ^ e
eficiente que θ2 se Var[θ1] < Var[θ2]. – Média amostral e mediana amostral são consistentes para
estimar a média verdadeira
e
14
Momentos
Método dos Momentos
• Seja X1, X2, ..., Xn uma amostra aleatória de
• Ideia geral: população com distribuição de probabilidades
√ Igualar os momentos da população (definidos em expressa por f(x) (função de probabilidade, se X
termos de esperanças) aos correspondentes for discreta ou função de densidade de
momentos da amostra probabilidades, se X for contínua)
√ Os momentos da população são funções de √ k-ésimo momento populacional
parâmetros desconhecidos
√ Essas equações são resolvidas de modo a se obter √ k-ésimo momento da amostra
estimadores dos parâmetros desconhecidos
com k = 1, 2, ...
15
Exemplo Estimador de Momento da Normal
• Tempo de falha de módulo eletrônico de motor • Amostra aleatória oriunda de população normal,
√ Amostra: com parâmetros µ e σ2.
– n=8 √ Momentos da normal:
– (11,96; 5,03; 67,40; 16,07; 31,50; 7,73; 11,10; 22,38)
– Média amostral: 21,65
Estimativa de momento de λ:
√ Estimador de momentos:
–
• Amostra aleatória oriunda de população normal, • Continuação exemplo 7.6 – Tempos de falha
com parâmetros r e λ.
√ Momentos da gama:
√ Estimador de momentos:
16
Método da Máxima Verossimilhança • Não conhecemos p0, mas podemos considerar o
cenário em p0 = ½.
• Exemplo de Motivação: √ Sob esta particular condição, a probabilidade de
√ Dados oriundos de população binomial com gerar o dado que realmente observamos (X = 3) é:
parâmetros 10 e p0.
p0: constante e desconhecido
Função de probabilidade de X:
• Podemos calcular esta probabilidade sob a
condição que p0 = p
Observa-se X = 3
√ Objetivo:
– Basear-se no dado disponível para estimar o valor √ Essa função é denominada função de
verdadeiro do parâmetro verossimilhança e denotamos por L(p; 3)
17
√ O ponto crítico da função é um ponto no domínio de
em que a derivada é zero
18
Estimador de Máxima Verossimilhança Exemplo – Distribuição de Bernoulli
• Função de log-verossimilhança
• Estimador de máxima verossimilhança para
amostras de Bernoulli
√ Proporção de sucessos na amostra
19
Exemplo √ Duas amostras de n= 40 com e
√ Estatística de teste:
20
Exemplo – Distribuição Exponencial • Função de verossimilhança da amostra
• Função de log-verossimilhança
λ é o parâmetro desconhecido a ser estimado
Exemplo
• Derivada da função de log-verossimilhança:
• (Continuação Ex. 7.6)
√ Tempo de falha de módulo eletrônico de motor
• Estimativa de máxima verossimilhança da √ Amostra:
– n=8
amostra x:
– (11,96; 5,03; 67,40; 16,07; 31,50; 7,73; 11,10; 22,38)
– Média amostral: 21,65
– Estimativa de máxima verossimilhança de λ:
21
• Função de log-verossimilhança da amostra • Comparação exponenciais:
√ Curvas das diferenças de log-verossimilhança com o
máximo em cada tamanho amostral
√ Mantida mesma média amostral de 21,65
Função atinge máximo
para λ=0,0462 n λmáx)
l(λ
8 –32,599
20 –81,497
40 –162,994
Inclinação da curva de log-
verossimilhança acentua-se com
aumento da amostra.
22
• Função de verossimilhança da amostra
• Derivada da função de log-verossimilhança:
√ µ e σ2 desconhecidos
23
• Estimador de máxima verossimilhança da média
Comentários
e variâncias verdadeiras para amostras normais
24
Complicações no Uso da Estimação de
Exemplo – Distribuição Gama
Máxima Verossimilhança
• Nem sempre é simples maximizar a função de • Seja X uma variável aleatória exponencial
verossimilhança √ Função de densidade de probabilidade:
• Pode não ser possível utilizar diretamente
métodos de cálculo para determinar o máximo
de L(θ; x) r e λ são os parâmetros desconhecidos a serem estimados
√ Função gama:
• Função de log-verossimilhança
25
Aplicação • Função de verossimilhança da amostra
26
Exemplo
• Objetivo:
√ Estimar população de peixes
• Procedimento:
√ São marcados t = 200 peixes
√ Peixes são devolvidos ao habitat
√ Aguarda-se que os peixes devolvidos misturem-se à
população
√ São recapturados k = 400 peixes
√ Dos peixes recapturados, há r = 43 peixes marcados
√ População estimada: 1.860 peixes
• Obs. Dados obtidos em simulação com N=2000
√ População real: 2000 (na prática, desconhecido)
Bibliografia Recomendada
• Montgomery, D. C. (LTC)
Referências Estatística Aplicada e Probabilidade para
Engenheiros
27