Você está na página 1de 5

Trabalho 1: Estudo Monte Carlo de estimadores para

a variância populacional

• Em grupo com até 4 pessoas (Pode ser um número menor de componentes);

• Valor: 25 pontos;

• Data de entrega: 29/04/2016;

• Material a ser entregue: Relatório impresso (em preto e branco).

Objetivo: O objetivo principal do trabalho é fazer uma simulação de


PnMonte Carlo
1 2
para comparar dois estimadores para a variância populacional, σ̂1 = n−1 i=1 (xi − x̄) e
σ̂2 = n1 ni=1 (xi − x̄)2 .
P

Objetivos secundários:

• Mostrar o que acontece com os estimadores quando o tamanho n da amostra au-


menta. Usar pelo menos três valores diferentes para n;

• Mostrar se os comportamentos dos estimadores são os mesmos em distribuições


simétricas e assimétricas;

• Avaliar se existe diferença do comportamento dos estimadores quando o valor real


da variância aumenta.

O relatório do trabalho (feito com o R Markdown para Word e seguindo o modelo dis-
ponibilizado) deve ter uma descrição dos objetivos do trabalho, descrição dos cenários de
simulação elaborados, análise dos resultados e código do R comentado (Os códigos devem
aparecer apenas no final do relatório). O Código do R Markdown usado na elaboração
do relatório deve ser enviado por email.

Conteúdo do trabalho:

• O estudo de simulação deve ter 1000 réplicas Monte Carlo em cada cenário utilizado;

• Na geração dos bancos de dados, as distribuições de probabilidade e o tamanhos


amostrais devem ser escolhidos pelo grupo;

• Os resultados podem ser mostrados, por exemplo, em tabelas com resumos das es-
timativas em cada cenário, boxplots, histogramas das estimativas e outros gráficos.

• Também devem ser usadas medidas como: viés empı́rico, viés empı́rico relativo, erro
quadrático médio (EQM) e erro absoluto médio (EAM). Esses resultados podem
ser mostrados em tabelas ou gráficos.
1 Roteiro
1.1 Comparação do tamanho amostral
1. Escolher uma distribuição e os valores para os parâmetros desta distribuição (estas
informações serão fixas nesta parte). Para esses parâmetros existirá uma variância
teórica da distribuição (variância populacional nesse caso);

2. Escolher alguns valores para o tamanho amostral n;

3. Para cada valor de n e com a única distribuição escolhida (e únicos valores dos
parâmetros desta distribuição), gere 1000 amostras e calcule os valores dos estima-
dores σ̂1 e σ̂2 ;

4. Até este passo haverá dois vetores de tamanho 1000 para cada especificação do
tamanho amostral n (um vetor para cada estimador). Estes vetores de estimativas
devem ser resumidos usando as medidas de qualidade dos estimadores (EQM, EAM,
viés e viés relativo, neste trabalho o θ nas fórmulas destas medidas é substituı́do
pelo valor da variância populacional e similarmente para os estimadores) e gráficos
(boxplots, histogramas, etc). Por exemplo, quando olhamos apenas os gráficos
construı́dos para o primeiro valor de tamanho amostral, podemos comparar o gráfico
para o estimador 1 com o gráfico para o estimador 2. E se olhamos apenas um dos
estimadores, podemos comparar o gráfico com amostra pequena com o gráfico com
amostra grande. Isso também pode ser feito com as medidas resumo em uma
tabela. Uma forma mais simples de fazer isto é criar um data.frame com variáveis
categóricas representando o tipo de estimador e o tamanho amostral. Depois podem
ser usados os comandos passados em sala de aula.

1.2 Comparação de assimetria


1. Escolher um tamanho amostral e um valor teórico para variância (variância popu-
lacional);

2. Escolher duas distribuições de probabilidade para gerar dos dados, sendo uma
simétrica e outra assimétrica. Os parâmetros dessas distribuições devem ser esco-
lhidos de forma que a variância teórica seja o valor escolhido anteriormente (basta
ver no help da distribuição qual é a expressão da variância);

3. Para cada distribuição, gere 1000 amostras e calcule os valores dos estimadores σ̂1
e σ̂2 ;

4. Até este passo haverá dois vetores de tamanho 1000 para cada distribuição es-
colhida (um vetor para cada estimador). Resumir estes vetores com as medidas
apresentadas e gráficos.
1.3 Comparação do valor da variância populacional
1. Escolher um tamanho amostral e uma distribuição para gerar dos dados;

2. Escolher valores para a variância populacional. Os parâmetros da distribuição usada


devem ser escolhidos de forma que a variância teórica seja o valor escolhido an-
teriormente (Na distribuição Normal seria simplesmente escolher valores para o
parâmetro σ 2 );

3. Para cada valor escolhido para a variância populacional, gere 1000 amostras e cal-
cule os valores dos estimadores σ̂1 e σ̂2 ;

4. Existiram dois vetores de tamanho 1000 para cada valor de variância populacional
escolhido (um vetor para cada estimador). Resumir estes vetores com as medidas
apresentadas e gráficos.
2 Simulação de Monte Carlo
Métodos de Monte Carlo (ou experimentos Monte Carlo) são uma classe ampla de
algoritmos computacionais que dependem da repetição de amostragens aleatórias para
obter resultados numéricos. Cada amostra gerada sob as mesmas condições é chamada
de réplica Monte Carlo. Os resultados obtidos em uma simulação de Monte Carlo não
podem ser considerados um demonstração teórica de um resultado, mas podem ser úteis
para uma avaliação informal e ilustrativa do comportamento de estimadores, testes de
hipóteses, modelos estatı́sticos, etc.

Um estudo de simulação Monte Carlo para a avaliação de um estimador pode ser


realizado gerando N amostras sob as mesmas condições e calculando a estimativa obtida
para cada amostra. Desta forma, obtemos uma amostra da distribuição de probabilidades
do estimador.

2.1 Viés
O viés (bias em inglês) de um estimador θ̂ é a quantidade

B(θ̂) = E[θ̂ − θ].

O estimador θ̂ é dito não viciado para θ se B(θ̂) = 0, tal que E(θ̂) = θ. O estimador
θ̂ é assintoticamente não viciado para θ se E(θ̂) → θ quando n → ∞ (n é tamanho da
amostra). Em estudos de Monte Carlo, uma aproximação (estimativa) para o Viés é dada
por
N
1 X
B(θ̂) = (θ̂j − θ),
N j=1

em que N é o número de réplicas Monte Carlo (amostras) e θ̂j é a estimativa obtida com
a j-ésima amostra.

2.2 Viés relativo


O viés relativo (relative bias em inglês) de um estimador θ̂ é a quantidade
" #
θ̂ − θ
Br(θ̂) = E ,
|θ|

em que |A| representa o módulo de A. Em estudos de Monte Carlo, uma aproximação


(estimativa) para o Viés relativo é dada por
N
1 X
Br(θ̂) = (θ̂j − θ)/(|θ|).
N j=1
2.3 Erro quadrático médio
O erro quadrático médio (EQM, ou MSE em inglês) de um estimador θ̂ de um
parâmetro θ escalar é definido por
h i
EQM(θ̂) = E (θ̂ − θ)2 .

Em estudos de Monte Carlo, uma aproximação (estimativa) para o EQM é dada por
N
1 X
EQM(θ̂) = (θ̂j − θ)2 .
N j=1

2.4 Erro absoluto médio


O erro absoluto médio (EAM) de um estimador θ̂ de um parâmetro θ escalar é definido
por h i
EAM(θ̂) = E |θ̂ − θ| ,

em que |A| representa o módulo de A. Em estudos de Monte Carlo, uma aproximação


(estimativa) para o EQM é dada por
N
1 X
EAM(θ̂) = |θ̂j − θ|.
N j=1