Escolar Documentos
Profissional Documentos
Cultura Documentos
Departamento de Estatística,
Universidade Federal de Minas Gerais (UFMG)
Introdução
B
1
θ̂(b) .
P
em que θ̄ = B
b=1
E(new) − E(old)
θ= .
E(old) − E(placebo)
Se |θ| ≤ 0, 2, isso indica bioequivalência dos adesivos antigo e
novo. A estatística é Ȳ /Z̄.
Desejamos calcular uma estimativa bootstrap de viés na estatística
de razão de bioequivalência.
Jackknife
Suponha que
I O parâmetro θ = g(F ) é uma função da distribuição F ;
I Fn é a fda empírica de uma amostra aleatória de F ;
I A estimativa “plug-in” de θ é θ̂ = g(Fn ).
I Um “plug-in” θ̂ é suave no sentido que pequenas mudanças
nos dados correspondem a pequenas mudanças em θ̂.
Jackknife para estimar viés
Se θ̂ é uma estatística suave, então θ̂[−i] = g(Fn−1 (x[−i] )) e a
estimativa jackknife do viés é dada por
[
V iésjack (θ̂) = (n − 1)(θ̄[.] − θ̂),
O fator n−1
n
ˆ jack seja um estimador não viciado do
faz com que se
erro padrão da média.
Exemplo
I bootstrap básico;
I bootstrap percentílico;
I bootstrap t.
O intervalo de confiança bootstrap normal padrão
θ̂ − E[θ̂]
Z=
se(θ̂)
θ̂ ± zα/2 se(θ̂),
P (T − θ > aα ) = 1 − α → P (T − aα > θ) = 1 − α.
(t − a1−α , t − aα ).
(θ̂α/2 , θ̂1−α/2 ),
yi = ci β + i , para i = 1, 2, . . . , n.
Note que
E[Yi |ci ] = E[ci β + i |ci ] = ci β,
em que usamos o fato de que E[i |ci ] = E[i ] = 0, dado que i é
selecionado independentemente de ci .
Definimos o erro quadrático residual por
n
(yi − ci b)2 .
X
RSE(b) =
i=1
C T C β̂ = C T y
i=1
i=1
Os correspondentes erros padrão estimados para os componentes
de β̂ são
√ √
ˆ β̂j ) = σ̂F Gjj ou se(
se( ˜ β̂j ) = σ̃F Gjj .
Aplicação do bootstrap
dosei = zi i = 1, 2, . . . , 14
e variável resposta
µi = E[yi |zi ] = β1 zi ,
Não existe intercepto por que era conhecido que com uma dose
zero a proporção de sobrevivência era 1, logo y = log 1 = 0.
Seja
M SR(b) = median(yi − ci b)2 .
A estimativa de minima mediana dos quadrados da regressão
(LMS) para β é o valor que minimiza M SR(b), isto é,
yi = ci β + zi i para i = 1, . . . , 14.
Suponha que os dados observados são usados para estimar θ por θ̂.
No bootstrap paramétrico, Cada pseudo banco de dados X ∗ pode
ser gerado por amostrar tal que
iid
X ∗1 , . . . , X ∗n ∼ F (x, θ̂).
I Quando o modelo é conhecido ou acredita-se ser uma boa
representação da realidade, o bootstrap paramétrico pode ser
uma ferramenta poderosa:
I permitindo inferência em situações de outra forma intratáveis;
I produzindo intervalos de confiança muito mais precisos do
que aqueles produzidos pela teoria assintótica padrão.
F → z = (z1 , . . . , zn ) independente de
G → y = (y1 , . . . , ym )
H0 : F = G.
Um teste de hipóteses é baseado em uma estatística de teste t(x).
Podemos considerar, por exemplo, t(x) = z̄ − ȳ.
1/(n + m)
em que
n m 1/2
2 2
− z̄) + (yj − ȳ)
P P
(zi
i=1 j=1
σ̄ =
.
n+m−2
Algoritmo
1. Gere B amostras de tamanho n + m com reposição de x.
Para cada uma das amostras, denote as primeiras n
observações por z ∗ e as m observações restantes por y∗.
3. Calcule
B
I{|t(x∗b )| ≥ |tobs |}/B,
X
\ boot =
p-valor
b=1
em que
n m
2
(yj − ȳ)2 /(m − 1).
X X
σ̄1 = (zi − z̄) /(n − 1) e σ̄2 =
i=1 j=1
I A suposição de variância igual é atraente para o teste t porque
simplifica a forma da distribuição da estatística de teste.
z̃i = zi − z̄ + x̄,
4. Calcule
B
I{|t(x∗b )| ≥ |tobs |}/B,
X
\ boot =
p-valor
b=1
Simulação no script!
O problema com uma amostra
F → z = (z1 , . . . , zn )
H0 : µZ = µ0 .
z̃i = zi − z̄ + µ0 , para i = 1, . . . , n.
Então, amostramos
z̃1∗ , . . . , z̃n∗
com reposição de z̃1 , . . . , z̃n e para cada amostra bootstrap
calculamos a estatística
z̃¯∗ − µ0
t(z ∗ ) = ¯ ∗ √ .
σ̃ / n
Logo,
B
I{|t(z ∗b )| ≥ |tobs |}/B.
X
\ boot =
p-valor
b=1
Existe uma maneira diferente, mas equivalente, de fazer um
bootstrap no problema de uma amostra.
z̃¯∗ − µ0 = (z̄ ∗ − z̄ + µ0 ) − µ0 = z̄ ∗ − z̄
Simulação no script!
Testes de permutação
F → z = (z1 , . . . , zn ) independente de
G → y = (y1 , . . . , ym )
x = (z1 , . . . , zn , y1 , . . . , yn ),
v = {1, . . . , n, n + 1, . . . , n + m} = {1, . . . , N }.
Seja X ∗ = (Z ∗ , Y ∗ ) representando uma partição da amostra
agrupada X, em que Z ∗ tem n elementos e Y ∗ tem m = N − n
elementos.
H0 : F = G,
Se
θ̂(Z, Y ) = θ̂(X, v)
é uma estatística, então a distribuição de permutação de θ̂∗ é a
distribuição de replicações
( !)
∗ N
{θ̂ } = θ̂(X, πj (v)), j = 1, . . . , .
n
Assim,
!−1 (Nn )
N
p-valor = P (|θ̂∗ | ≥ |θ̂|) = I{|θ̂(j) | ≥ |θ̂|},
X
n j=1
No script!
Teste de independência
H0 : FZY = FZ FY vs H1 : FZY 6= FZ FY