Escolar Documentos
Profissional Documentos
Cultura Documentos
1 Introdução
1
Departamento de Estatística, Universidade Federal de São Carlos – UFSCar, CEP 13565-905, São Carlos, SP,
Brasil, E-mail: cbarreto@power.ufscar.br.
j =i j
1 k
F ( x) = F( i ) ( x ) (1)
k i =1
∏
k
conjunta com função densidade conjunta h(x) =
i =1
f(i ) ( xi(i ) ) . Da mesma forma, as
∏
q
conjunta com função densidade conjunta p(y) =
s =1
g ( s ) ( ys ( s ) ) . Além disso, (X1, ... ,
Xm) e (Y1, ... , Yn) são também independentes. Supondo-se ordenação perfeita na seleção
de estatísticas de ordem para as amostras de conjuntos ordenados, as funções densidade
f(i)(x) e g(s)(y) são as densidades marginais das estatísticas de ordem de forma
k!
[ F ( x)] [1 − F ( x)] f ( x)
i −1 k −i
f (i ) ( x) = (2)
(i − 1)!(k − i )!
e
q!
[ F ( y − ∆)] [1 − F ( y − ∆)] f ( y − ∆) ,
s −1 q−s
g( s ) ( y) = (3)
( s − 1)!(q − s )!
e suas integrais, dadas por Fm ,k ( x) e G n ,q ( x) , correspondem a uma função distribuição
acumulada (David, 1981).
Para testar a hipótese H0: ∆ = 0 contra H1: ∆ > 0 Bohn e Wolfe (1990, 1992)
elaboraram uma estatística análoga à estatística de MWW para ACO que é definida como
∞
U RSS = mnkq Fm , k ( x)dGn, q ( x) =
−∞
q n k m
= Ψ (Yts ( s ) − X ji (i ) ) = (4)
s =1 t =1 i =1 j =1
q n k m
Var (U RSS ) = Var Ψ (Yts ( s ) − X ji ( i ) ) =
s =1 t =1 i =1 j =1
ζ 1,0 = Cov (υ ( X1 , Y1 ) ,υ ( X1 , Y2 ) ) ,
ζ 0,1 = Cov (υ ( X1 , Y1 ) ,υ ( X 2 , Y1 ) ) e
ζ 1,1 = Var (υ ( X1 , Y1 ) )
As expressões de ζ1,0, ζ0,1 e ζ1,1 são bastante intrincadas e estão em Bohn and Wolfe
(1990; 1992).
Ao desenvolver as propriedades assintóticas da forma padronizada de URSS, Bohn e
Wolfe (1990; 1992) consideraram os tamanhos k e q dos conjuntos fixos, uma vez que as
dificuldades de ordenação crescem com o aumento do tamanho dos conjuntos. Sejam,
então, N = m + n e λ = lim N →∞ ( m / N ) . Se 0 < λ < 1 e ζ1,0/λ + ζ0,1/(1-λ) > 0, então,
N (URSS / mn – γ) = N (URSS – E[URSS])/mn tem uma distribuição normal assintótica,
no sentido de min(m, n) → ∞, com média 0 e variância:
ζ 1,0 ζ
σ ∞2 = + 0,1 , (6)
λ (1 − λ )
Bohn e Wolfe (1990) mostram também que sob H0 a distribuição de URSS é simétrica
em torno de EH0 (U RSS ) = mnkq 12 e, conseqüentemente, N (URSS / mn – kq/2) tem
uma distribuição assintótica normal com média 0 e variância dada em (6).
Para conduzir o teste de hipótese de H0: ∆ = 0 baseado na estatística URSS, Bohn e
Wolfe (1990) compararam valores críticos encontrados por aproximação assintótica e pela
distribuição exata. Como URSS tem distribuição livre de parâmetros sob H0, para se obter a
função de distribuição de URSS para quaisquer m, n, q e k basta avaliar URSS para cada
possível arranjo ordenado das mk + nq observações combinadas Xj1(1), ... , Xjk(k), para j = 1,
…, m, e Yt1(1), ... , Ytq(q), para t = 1, …, n, calcular as probabilidades de cada arranjo e
tabular os resultados. Como os arranjos não são igualmente prováveis esses cálculos são
relativamente trabalhosos.
Os valores críticos para o teste proposto também poderiam ser obtidos pela
distribuição assintótica da estatística URSS padronizada. Para avaliar a precisão dessa
aproximação normal, Bohn e Wolfe (1990) simularam a distribuição nula de URSS para
4 O método Bootstrap
ϕ γ ( x, y ) =
{
1 se (x, y ) ∈ (x, y ) : t ( x, y ) > t J 0 ,α = D J−01 (1 − α ) }, (7)
0, caso contrário
O método bootstrap é útil nesse caso para fornecer uma aproximação à distribuição
de t sob a hipótese nula (Hall e Wilson, 1991; Efron e Tibishirani, 1993). A preocupação
básica ao se utilizar o bootstrap, além da escolha da estatística de teste, é formular um
ϕ γ (x, y ) =
{
1 se ( x , y ) ∈ ( x , y ) : t ( x , y ) > t J 0 ,α = D J−01 (1 − α ) },
0 caso contrário
onde t Jˆ é a estimativa plug-in do ponto que define a região crítica do teste. O método
0 ,α
segundo o Algoritmo 1.
Algoritmo 1
1) Denota-se por z a união das amostras observadas x = (x1, x2, ... , xm) de X e y = (y1, y2,
... , yn) de Y e por Ĵ 0 a distribuição empírica de z. Sob H0, Ĵ 0 proporciona uma
estimativa não-paramétrica da distribuição comum que originou tanto x quanto y.
2) Substitui-se J0 por Ĵ 0 em (7) e obtêm-se B amostras bootstrap, denotadas por z*b , b
= 1, ... , B, de tamanho n + m de Ĵ 0 .
3) Em cada amostra bootstrap z*b , chamam-se as m primeiras observações de x*b e as n
restantes de y*b , b = 1, ... , B.
4) Avalia-se t(⋅) em cada amostra bootstrap: t ( z*b ) = t ( x*b , y *b ) , b = 1, ... , B.
5) Rejeita-se H0 se t (z ) = t (x, y ) > tˆJˆ ,α = Dˆ J−ˆ 1 (1 − α ) , onde tˆJˆ ,α é o percentil
0 0 0
amostral (1 − α ) de {t ( z *
1 ),t (z ),*
2 ,t (z *
B )} , ou seja, tˆ
Jˆ0 ,α
é tal que
{
# t ( z*b ) > tˆJˆ ,α } =α ,
(
Pˆ t Jˆ > t Jˆ ,α =
0 0
) B
0 (8)
5.1 O algoritmo bootstrap para amostras obtidas por meio de conjuntos ordenados
Pela seção 2, uma amostra de tamanho km obtida a partir de conjuntos ordenados em
k postos de ordenação pode ser vista como a união de amostras aleatórias simples de
tamanho m de cada um dos k postos, já que as observações em cada posto são
independentes e identicamente distribuídas. As observações de um posto são
independentes das observações dos outros postos, mas não têm a mesma distribuição. Um
procedimento bootstrap para amostras obtidas por meio de conjuntos ordenados deve
levar em conta esses aspectos.
A nova proposta, elaborada por Magro (2003), modifica o algoritmo bootstrap de
forma que o processo de reamostragem seja feito independentemente nas amostras de
cada posto, onde os elementos são independentes e identicamente distribuídos. Para isso, é
necessário estender a notação introduzida na Seção 4.
Sejam as amostras aleatórias simples de m elementos de cada um dos k postos
considerados de X , X (1) , , X ( k ) , onde X( i ) = ( X 1i (i ) , , X mi (i ) ) , para i = 1, ... , k,.
Sejam também as amostras aleatórias simples de n elementos de cada um dos q postos
considerados de Y , Y(1) , , Y( q ) , onde Y( s ) = (Y1s ( s ) , , Yns ( s ) ) , para s = 1, ... , q.
Para q = k, a idéia básica da reamostragem bootstrap para o teste de duas amostras
obtidas a partir de conjuntos ordenados aqui desenvolvido é concatenar para cada posto as
amostras de X e de Y e realizar o procedimento de reamostragem em cada posto.
O procedimento envolve diversos passos. Primeiro, denotam-se por z (1) , , z ( k ) as
teste. O método bootstrap é então empregado para fornecer uma aproximação à estimativa
plug-in t Jˆ ,α = t 1 k ˆ . Desse modo, o algoritmo bootstrap para duas ACO pode ser
0 J ,α
k i =1 ( i ) 0
formulado por:
Algoritmo 2
{
# t ( z *b ) > tˆJˆ ,α } =α .
(
Pˆ t Jˆ > t Jˆ ,α =
0 0
) B
0 (9)
{
1 se ( x, y ) ∈ ( x, y ) : t (x, y ) > t Jˆ ,α = DJ−ˆ 1 (1 − α )
0 0
}
,
ϕϒ′′ ( x, y ) = p se ( x, y ) ∈ {( x, y ) : t (x, y ) = t Jˆ0 ,α
= DJ−ˆ 1 (1 − α )}
0
0 c.c.
( )
E ϕ ϒ′′ ( x, y ) | H 0 = 1 ⋅ P t Jˆ > t Jˆ ,α + p ⋅ P t Jˆ = t Jˆ ,α = α ,
0 0
( 0 0
)
sendo estimado por p̂ , obtido de forma que
Eˆ ϕ ϒ′′ ( x, y ) | H 0 = 1 ⋅
{
# t ( z*b ) > tˆJˆ ,α
0
} + pˆ ⋅ #{t ( z ) = tˆ } = α . *
b Jˆ0 ,α
B B
A seguir é descrito o experimento Monte Carlo implementado por Magro (2003)
para avaliar as funções poder para os testes de hipóteses bootstrap realizados a partir de
cada uma das estatísticas de teste apresentadas acima.
Conclusões
Uma primeira conclusão básica extraída dos resultados do experimento de simulação
para amostragem por conjuntos ordenados é que testes de reamostragem bootstrap usando
a estatística modificada MWW para a diferença entre médias podem ser empregados com
êxito como uma alternativa ao teste proposto por Bohn e Wolfe (1990; 1992). O teste de
reamostragem bootstrap envolvendo a diferença entre medianas, entretanto, parece não
ser um procedimento vantajoso ao teste estudado por aqueles autores.
Poder
Poder
0,5 0,5 0,5
0,4 0,4 0,4
0,3 0,3 0,3
0,2 0,2 0,2
0,1 0,1 0,1
0 0 0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
∆ ∆ ∆
Tamanho
Tamanho
0,05 0,05 0,046 0,05
0,05 0,03 0,05 0,05
0 0 0
UB&W UB Tmd Tmdn UB&W UB Tmd Tmdn UB&W UB Tmd Tmdn
Poder
Poder
0,5 0,5 0,5
0,4 0,4 0,4
0,3 0,3 0,3
0,2 0,2 0,2
0,1 0,1 0,1
0 0 0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
∆ ∆ ∆
Tamanho
Tamanho
0 0 0
Poder
Poder
Tamanho
Tamanho
0 0 0
UB&W UB Tmd
Figura 1 - Gráficos das estimativas das funções poder para cada uma das estatísticas de teste
analisadas e alguns valores de ∆ para cada configuração amostral (m,n,k,q) para a
Distribuição Exponencial.
Poder
Poder
0,5 0,5 0,5
0,4 0,4 0,4
0,3 0,3 0,3
0,2 0,2 0,2
0,1 0,1 0,1
0 0 0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
∆ ∆ ∆
Tamanho
Tamanho
0,05 0,045 0,05 0,05 0,055 0,05 0,055
0,032 0,038
0,05 0,05 0,05
0 0 0
UB&W UB Tmd Tmdn UB&W UB Tmd Tmdn UB&W UB Tmd Tmdn
Poder
0,5 0,5 0,5
0,4 0,4 0,4
0,3 0,3 0,3
0,2 0,2 0,2
0,1 0,1 0,1
0 0 0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
∆ ∆ ∆
0,058
Tamanho
Tamanho
0 0 0
Poder
Poder
Tamanho
0,056 0,056
Tamanho
0 0 0
UB&W UB Tmd
Figura 2 - Gráficos das estimativas das funções poder para cada uma das estatísticas de teste
analisadas e alguns valores de ∆ para cada configuração amostral (m,n,k,q) para a
Distribuição Normal.
Poder
Poder
Poder
∆ ∆ ∆
Tamanho
0,057
Tamanho
0 0 0
UB&W UB Tmd Tmdn UB&W UB Tmd Tmdn UB&W UB Tmd Tmdn
Poder
Poder
0,5 0,5 0,5
0,4 0,4 0,4
0,3 0,3 0,3
0,2 0,2 0,2
0,1 0,1 0,1
0 0 0
0 0,1 0,2 0,3 0,4 0,5 0 0,1 0,2 0,3 0,4 0 0,1 0,2 0,3 0,4
∆ ∆ ∆
Tamanho
0,054
Tamanho
0 0 0
Poder
Poder
0,057
Tamanho
0 0 0
UB&W UB Tmd
Figura 3 - Gráficos das estimativas das funções poder para cada uma das estatísticas de teste
analisadas e alguns valores de ∆ para cada configuração amostral (m,n,k,q) para a
Distribuição Uniforme.
Poder
Poder
0,5 0,5 0,5
0,4 0,4 0,4
0,3 0,3 0,3
0,2 0,2 0,2
0,1 0,1 0,1
0 0 0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
∆ ∆ ∆
Tamanho
Tamanho
0,05 0,047 0,05 0,052 0,05
0,05 0,05 0,03 0,05
0,01
0 0 0
UB&W UB Tmdn UB&W UB Tmdn UB&W UB Tmdn
Poder
0,5 0,5 0,5
0,4 0,4 0,4
0,3 0,3 0,3
0,2 0,2 0,2
0,1 0,1 0,1
0 0 0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
∆ ∆ ∆
Tamanho
0 0 0
Poder
Poder
Tamanho
Tamanho
0 0 0
UB&W UB Tmd
Figura 4 - Gráficos das estimativas das funções poder para cada uma das estatísticas de teste
analisadas e alguns valores de ∆ para cada configuração amostral (m,n,k,q) para a
Distribuição Cauchy.
Agradecimentos
Alexandre de Souza Magro contou com o apoio da Capes durante parte do período de
desenvolvimento deste trabalho.
MAGRO, A. S.; BARRETO, M. C. M. Bootstrap tests for two independent samples under
ranked set sampling. Rev. Mat. Est., São Paulo, v.24, n.1, p.7-27, 2006.
ABSTRACT: Ranked set sampling is more efficient than single random sampling for several
statistical procedures when the measurement of the main variable is costly or difficult to obtain.
Bohn and Wolfe (1990, 1992) presented a modified statistic of the Mann-Whitney-Wilcoxon test
to compare two independent samples under a ranked set sample procedure. This paper considers
an original implementation of the bootstrap resampling method to compare the location
parameters of two independent samples under the ranked set design. A Monte Carlo study is
conducted to validate the size and the power of the bootstrap test using the modified statistic of
Mann-Whitney-Wilcoxon and the difference of sample means and the difference of sample
medians as the statistic test. Our results are quite equivalent in size and power to those of the
modified statistic of Bohn and Wolfe. The bootstrap tests for the modified statistic of Mann-
Whitney-Wilcoxon can be used as a successful alternative to Bohn and Wolfe´s asymptotic test.
KEYWORDS: Ranked set sampling; bootstrap; modified statistic of Mann-Whitney-Wilcoxon test;
tests for two independent samples.