Enunciado

Trabalho 1: Estudo Monte Carlo de estimadores para
a variância populacional
• Em grupo com até 4 pessoas (Pode ser um número menor de componentes);
• Valor: 25 pontos;
• Data de entrega: 29/04/2016;
• Material a ser entregue: Relatório impresso (em preto e branco).
Objetivo: O objetivo principal do trabalho é fazer uma simulação de

PnMonte Carlo
1 2
para comparar dois estimadores para a variância populacional, σ̂1 = n−1 i=1 (xi − x̄) e
σ̂2 = n1 ni=1 (xi − x̄)2 .
P
Objetivos secundários:
• Mostrar o que acontece com os estimadores quando o tamanho n da amostra au-

menta. Usar pelo menos três valores diferentes para n;
• Mostrar se os comportamentos dos estimadores são os mesmos em distribuições

simétricas e assimétricas;
• Avaliar se existe diferença do comportamento dos estimadores quando o valor real

da variância aumenta.
O relatório do trabalho (feito com o R Markdown para Word e seguindo o modelo dis-
ponibilizado) deve ter uma descrição dos objetivos do trabalho, descrição dos cenários de
simulação elaborados, análise dos resultados e código do R comentado (Os códigos devem
aparecer apenas no final do relatório). O Código do R Markdown usado na elaboração
do relatório deve ser enviado por email.
Conteúdo do trabalho:
• O estudo de simulação deve ter 1000 réplicas Monte Carlo em cada cenário utilizado;
• Na geração dos bancos de dados, as distribuições de probabilidade e o tamanhos

amostrais devem ser escolhidos pelo grupo;
• Os resultados podem ser mostrados, por exemplo, em tabelas com resumos das es-
timativas em cada cenário, boxplots, histogramas das estimativas e outros gráficos.
• Também devem ser usadas medidas como: viés empı́rico, viés empı́rico relativo, erro
quadrático médio (EQM) e erro absoluto médio (EAM). Esses resultados podem
ser mostrados em tabelas ou gráficos.
1 Roteiro
1.1 Comparação do tamanho amostral
1. Escolher uma distribuição e os valores para os parâmetros desta distribuição (estas
informações serão fixas nesta parte). Para esses parâmetros existirá uma variância
teórica da distribuição (variância populacional nesse caso);
2. Escolher alguns valores para o tamanho amostral n;
3. Para cada valor de n e com a única distribuição escolhida (e únicos valores dos
parâmetros desta distribuição), gere 1000 amostras e calcule os valores dos estima-
dores σ̂1 e σ̂2 ;
4. Até este passo haverá dois vetores de tamanho 1000 para cada especificação do
tamanho amostral n (um vetor para cada estimador). Estes vetores de estimativas
devem ser resumidos usando as medidas de qualidade dos estimadores (EQM, EAM,
viés e viés relativo, neste trabalho o θ nas fórmulas destas medidas é substituı́do
pelo valor da variância populacional e similarmente para os estimadores) e gráficos
(boxplots, histogramas, etc). Por exemplo, quando olhamos apenas os gráficos
construı́dos para o primeiro valor de tamanho amostral, podemos comparar o gráfico
para o estimador 1 com o gráfico para o estimador 2. E se olhamos apenas um dos
estimadores, podemos comparar o gráfico com amostra pequena com o gráfico com
amostra grande. Isso também pode ser feito com as medidas resumo em uma
tabela. Uma forma mais simples de fazer isto é criar um data.frame com variáveis
categóricas representando o tipo de estimador e o tamanho amostral. Depois podem
ser usados os comandos passados em sala de aula.
1.2 Comparação de assimetria

1. Escolher um tamanho amostral e um valor teórico para variância (variância popu-
lacional);
2. Escolher duas distribuições de probabilidade para gerar dos dados, sendo uma
simétrica e outra assimétrica. Os parâmetros dessas distribuições devem ser esco-
lhidos de forma que a variância teórica seja o valor escolhido anteriormente (basta
ver no help da distribuição qual é a expressão da variância);
3. Para cada distribuição, gere 1000 amostras e calcule os valores dos estimadores σ̂1
e σ̂2 ;
4. Até este passo haverá dois vetores de tamanho 1000 para cada distribuição es-
colhida (um vetor para cada estimador). Resumir estes vetores com as medidas
apresentadas e gráficos.
1.3 Comparação do valor da variância populacional
1. Escolher um tamanho amostral e uma distribuição para gerar dos dados;
2. Escolher valores para a variância populacional. Os parâmetros da distribuição usada

devem ser escolhidos de forma que a variância teórica seja o valor escolhido an-
teriormente (Na distribuição Normal seria simplesmente escolher valores para o
parâmetro σ 2 );
3. Para cada valor escolhido para a variância populacional, gere 1000 amostras e cal-
cule os valores dos estimadores σ̂1 e σ̂2 ;
4. Existiram dois vetores de tamanho 1000 para cada valor de variância populacional
escolhido (um vetor para cada estimador). Resumir estes vetores com as medidas
apresentadas e gráficos.
2 Simulação de Monte Carlo
Métodos de Monte Carlo (ou experimentos Monte Carlo) são uma classe ampla de
algoritmos computacionais que dependem da repetição de amostragens aleatórias para
obter resultados numéricos. Cada amostra gerada sob as mesmas condições é chamada
de réplica Monte Carlo. Os resultados obtidos em uma simulação de Monte Carlo não
podem ser considerados um demonstração teórica de um resultado, mas podem ser úteis
para uma avaliação informal e ilustrativa do comportamento de estimadores, testes de
hipóteses, modelos estatı́sticos, etc.
Um estudo de simulação Monte Carlo para a avaliação de um estimador pode ser

realizado gerando N amostras sob as mesmas condições e calculando a estimativa obtida
para cada amostra. Desta forma, obtemos uma amostra da distribuição de probabilidades
do estimador.
2.1 Viés
O viés (bias em inglês) de um estimador θ̂ é a quantidade
B(θ̂) = E[θ̂ − θ].
O estimador θ̂ é dito não viciado para θ se B(θ̂) = 0, tal que E(θ̂) = θ. O estimador
θ̂ é assintoticamente não viciado para θ se E(θ̂) → θ quando n → ∞ (n é tamanho da
amostra). Em estudos de Monte Carlo, uma aproximação (estimativa) para o Viés é dada
por
N
1 X
B(θ̂) = (θ̂j − θ),
N j=1
em que N é o número de réplicas Monte Carlo (amostras) e θ̂j é a estimativa obtida com
a j-ésima amostra.
2.2 Viés relativo

O viés relativo (relative bias em inglês) de um estimador θ̂ é a quantidade
" #
θ̂ − θ
Br(θ̂) = E ,
|θ|
em que |A| representa o módulo de A. Em estudos de Monte Carlo, uma aproximação

(estimativa) para o Viés relativo é dada por
N
1 X
Br(θ̂) = (θ̂j − θ)/(|θ|).
N j=1
2.3 Erro quadrático médio
O erro quadrático médio (EQM, ou MSE em inglês) de um estimador θ̂ de um
parâmetro θ escalar é definido por
h i
EQM(θ̂) = E (θ̂ − θ)2 .
Em estudos de Monte Carlo, uma aproximação (estimativa) para o EQM é dada por
N
1 X
EQM(θ̂) = (θ̂j − θ)2 .
N j=1
2.4 Erro absoluto médio

O erro absoluto médio (EAM) de um estimador θ̂ de um parâmetro θ escalar é definido
por h i
EAM(θ̂) = E |θ̂ − θ| ,
em que |A| representa o módulo de A. Em estudos de Monte Carlo, uma aproximação

(estimativa) para o EQM é dada por
N
1 X
EAM(θ̂) = |θ̂j − θ|.
N j=1

Enunciado

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Enunciado

Enviado por

Direitos autorais:

Formatos disponíveis

Trabalho 1: Estudo Monte Carlo de estimadores para

• Em grupo com até 4 pessoas (Pode ser um número menor de componentes);

• Data de entrega: 29/04/2016;

• Material a ser entregue: Relatório impresso (em preto e branco).

Objetivo: O objetivo principal do trabalho é fazer uma simulação de

• Mostrar o que acontece com os estimadores quando o tamanho n da amostra au-

• Mostrar se os comportamentos dos estimadores são os mesmos em distribuições

• Avaliar se existe diferença do comportamento dos estimadores quando o valor real

• Na geração dos bancos de dados, as distribuições de probabilidade e o tamanhos

2. Escolher alguns valores para o tamanho amostral n;

1.2 Comparação de assimetria

2. Escolher valores para a variância populacional. Os parâmetros da distribuição usada

Um estudo de simulação Monte Carlo para a avaliação de um estimador pode ser

B(θ̂) = E[θ̂ − θ].

2.2 Viés relativo

em que |A| representa o módulo de A. Em estudos de Monte Carlo, uma aproximação

2.4 Erro absoluto médio

em que |A| representa o módulo de A. Em estudos de Monte Carlo, uma aproximação

Você também pode gostar