Você está na página 1de 6

4762 IEEE LATIN AMERICA TRANSACTIONS, VOL. 14, NO.

12, DECEMBER 2016

A Nonlinear Optimization Algorithm Applied to


Optimal Allocation Problem
J. A. M. Brito and A. E. Xavier
1
Abstract— This article presents a new algorithm to optimize estratificação, utiliza-se a conhecida fórmula da alocação
the multivariate optimal allocation problem. Many researchers ótima de Neyman [1].
have studied and proposed new methods for the solution this Não obstante, se há a necessidade de produzir estimativas
problem, which can be performed by choosing one of the
com determinado nível de precisão para um conjunto de
following goals: (i) minimizing the weighted combination of
relative variances, considering the sample size fixed or (ii) variáveis da pesquisa, e essas variáveis não são fortemente
minimizing the sample size in a way that the coefficients of correlacionadas, deve-se utilizar um método que efetue a
variation are lower or equal to the previously fixed coefficients of alocação da amostra de forma que a precisão previamente
variation. The proposed algorithm is based on a nonlinear definida seja alcançada para todas as variáveis de pesquisa.
optimization method denoted hyperbolic penalty. Results Neste caso, fica caracterizado o problema de alocação ótima
obtained for real populations show that the algorithm is a good multivariado.
alternative to solve this problem. Segundo a literatura, essa alocação pode ser efetuada de
forma a atender um dos objetivos a seguir: (i) Fixado um
Keywords— Stratification, Optimization, Hyperbolic Penalty. tamanho de amostra n, deve-se definir os tamanhos de amostra
I. INTRODUÇÃO que serão alocados aos H estratos, de forma a minimizar uma
soma ponderada de variâncias relativas (ou de coeficientes de

A TUALMENTE, a maioria das pesquisas realizadas pelos


institutos oficiais de estatística são baseadas em um
levantamento por amostragem. A partir desse levantamento é
variação) associadas a um conjunto de m variáveis de
pesquisa; (ii) Minimizar o tamanho total de amostra que será
alocado aos estratos, de forma que os coeficientes de variação
possível produzir estimativas para parâmetros reais da associados às variáveis de interesse sejam menores ou iguais a
população da pesquisa, investigando, apenas, um subconjunto patamares previamente fixados, para os coeficientes de
dessa população denominado amostra [1]. A realização desse variação de estimadores de total ou de média [1], por exemplo.
levantamento depende, basicamente, de um plano amostral Considerando o segundo objetivo, o presente trabalho traz
que é elaborado em função do recorte geográfico da pesquisa, uma proposta de resolução para o problema de alocação ótima,
do cadastro que será disponibilizado à seleção da amostra e do mediante a aplicação de um algoritmo de otimização não
orçamento disponível para pesquisa [3]. linear baseado no método de penalização proposto por [2].
Ainda neste sentido, ao ser adotado um plano amostral, O presente trabalho está dividido da seguinte forma: na
busca-se o equilíbrio entre os recursos orçamentários seção dois são apresentados os conceitos básicos de
disponíveis à realização da pesquisa e a necessidade de um amostragem estratificada, sendo feita uma descrição detalhada
do problema de alocação ótima multivariado. A seção três traz
bom nível de precisão para as estimativas a serem divulgadas.
a descrição do método de penalização. A seção quatro
O nível de precisão, por sua vez, pode ser alcançado
apresenta experimentos computacionais realizados com dados
explorando de uma forma eficiente a relação de
reais, considerando a aplicação da nova metodologia e de um
homogeneidade observada entre elementos da população em método proposto na literatura e a seção cinco traz as
estudo. Neste sentido, uma alternativa para contemplar essas considerações finais e conclusões sobre o trabalho.
duas necessidades consiste na utilização de um plano amostral
que incorpore a amostragem estratificada. II.CONCEITOS DE AMOSTRAGEM ESTRATIFICADA E
Ao utilizar a amostragem estratificada, efetua-se a divisão PROBLEMA DE ALOCAÇÃO ÓTIMA MULTIVARIADO
dos N elementos da população U em H estratos homogêneos o
De acordo com a teoria da amostragem, a precisão de um
que, por sua vez, possibilita a produção de estimativas com
estimador como, por exemplo, o estimador da média, depende
um maior nível de precisão. Essa homogeneidade é avaliada a
não apenas do tamanho da amostra e da fração amostral, mas
partir do cálculo de uma variância associada com uma variável também da variabilidade dos elementos que compõem a
de estratificação, previamente escolhida e que precisa ter os população de pesquisa a partir da qual será selecionada uma
seus valores conhecidos para todos os elementos que amostra [1], [3].
constituem a população. Uma vez definidos os estratos e um Destarte, alternativamente a aumentar o tamanho de
tamanho de amostra n, o problema seguinte consiste em amostra, pode-se estimar o total ou a média, com ganhos de
definir quantas unidades amostrais serão alocadas a cada um precisão, considerando a divisão da população em grupos
dos estratos. denominados estratos. Os elementos reunidos em cada um dos
Nesse contexto, se o interesse está apenas restrito ao ganho estratos são mais homogêneos entre si, quando comparados
de precisão no que diz respeito à própria variável de com a população inteira. Neste caso, em vez de selecionar-se
uma amostra aleatória simples de tamanho de n de toda a
1
J. A. M. Brito, Escola Nacional de Ciências Estatísticas, Rio de Janeiro, população, são selecionadas amostras aleatórias simples em
Brasil, jambrito@gmail.com
A. E. Xavier, Universidade Federal do Rio de Janeiro, Rio de Janeiro, cada um dos estratos, de forma que a soma desses tamanhos
Brasil, adilson.xavier@gmail.com de amostra corresponda à amostra total n, previamente
MOURA BRITO AND XAVIER : A NONLINEAR OPTIMIZATION ALGORITHM APPLIED 4763

definida para a pesquisa. Este procedimento caracteriza uma onde


amostragem estratificada simples [3], que não está restrita ao H
Nh
planejamento de pesquisas amostrais. Mais especificamente, tj =   y ij , j = 1,..., m (11)
h =1 n h i∈s h
em [24] e [25] são apresentadas duas importantes aplicações
da amostragem estratificada. (sh amostra associada ao h-ésimo estrato).
Por exemplo, para estimar a renda média por família em
determinada região, pode ser apropriado agrupar as famílias Tendo em vista que os valores de Nh e Shj2 são obtidos a
em dois ou mais estratos, de acordo com uma variável partir da definição dos estratos, o valor da variância na
indicadora da renda recebida pelas famílias. Os agregados equação (10) depende, apenas, dos tamanhos de amostra nh
familiares, em qualquer estrato, tendem a ser mais que serão alocados aos estratos. Essa alocação é muito
homogêneos em relação à renda, em comparação com toda a importante, pois é ela que irá garantir a precisão do
população [4]. procedimento amostral. Em geral, ao efetuar uma alocação,
Formalmente, ao considerar a adoção de uma amostragem busca-se o equilíbrio entre a precisão em relação a cada uma
estratificada [1], [3], uma população U composta por N das variáveis de pesquisa e o custo da pesquisa em relação às
unidades é dividida em H estratos E1, E2,..., EH constituídos, unidades amostrais que serão investigadas.
respectivamente, por N1, N2,..., NH unidades. Esses estratos De acordo com a literatura, o problema de alocação
não se superpõem e, juntos, abrangem a totalidade da multivariado pode ser resolvido considerando dois objetivos, a
população de tal modo que: saber: (i) Minimizar uma soma ponderada das variâncias
(1) relativas (ou de coeficientes de variação) associadas às
N1 + N 2 + ... + N H = N
variáveis de interesse da pesquisa, definido um tamanho
Eh  Ek = ∅ , h ≠ k (2) máximo de amostra; (ii) Determinar os tamanhos de amostra
H
 h =1 Eh = U (3) nh que serão alocados aos estratos, de forma que o tamanho
Uma vez definidos os estratos e um tamanho de amostra n, total da amostra n seja o menor possível, e que os coeficientes
são selecionadas nh observações (amostras independentes) de variação associados às estimativas de total produzidas para
dentre as Nh observações disponíveis em cada um dos estratos as variáveis de pesquisa não excedam patamares definidos a
Eh, de forma que as duas restrições abaixo sejam cumpridas: priori. Apresenta-se a seguir a formulação de programação
n = n1 + n2 +...+nH (4) matemática que contempla o segundo objetivo:
H
nmin≤nh≤Nh (h=1,...,H) (5) Minimizar  nh (12)
sendo nmin correspondente ao menor tamanho de amostra h=1

possível que pode ser selecionada em cada estrato Sujeito a


populacional.
A partir dessa amostra, são levantadas informações e nmin ≤ nh ≤ Nh , h = 1,...,H (13)
produzidas estimativas (total, média, proporção etc) para um
conjunto de m variáveis de pesquisa. Supondo que essas V(t j )/ Yj ≤ cv j j = 1,..., m (14)
variáveis sejam denotadas, respectivamente, por y1,...,yj,...,ym,
a variância dessas variáveis, em cada um dos estratos, é nh ∈Z+ (h=1,...,H) (15)
definida por: Nessa formulação, a função objetivo a ser minimizada
corresponde à soma dos tamanhos de amostra alocados aos
1 estratos. A restrição apresentada na equação (13) garante que
S 2hj =  (y ij − Y hj )2 , j = 1,..., m, h = 1,..., H
(N h − 1) i∈Eh
(6)
serão alocadas pelo menos nmin unidades amostrais a cada um
sendo yij correspondente ao valor de yj para i-ésima dos estratos e que o número de unidades alocadas não será
observação da população e Y hj corresponde à média dessa superior aos tamanhos dos estratos.
Já a restrição associada à equação (14) garante que a razão
variável no h-ésimo estrato, isto é, entre o desvio padrão do estimador de total de cada variável de
1 (7) pesquisa e o seu respectivo total será menor ou igual a um
Y hj = Yhj , j = 1,...,m, h = 1,...,H
Nh coeficiente de variação cvj (j=1,...,m), (chamado de cv alvo)
fixado previamente. Finalmente, a restrição da equação (15)
Yhj =  y , h = 1,...,H e j = 1,..., m
i∈E h
ij
(8)
garante que os tamanhos de amostra alocados aos estratos
serão inteiros (restrição de integralidade do problema).
E, complementando, tem-se que Yj corresponde ao total da Em função da relevância desse problema para a área de
j-ésima variável de pesquisa, ou seja: Estatística e da sua natureza não linear mista, explicitada na
H H formulação acima, nas últimas décadas, foram desenvolvidos
Yj =  y ij =  Yhj (9)
diversos trabalhos onde são propostos métodos que atendem
h =1 i∈E h h =1
os dois objetivos.
Considerando a utilização de amostragem estratificada Mais especificamente, esses trabalhos contemplam
simples, a variância do estimador Horvitz Thompson do total métodos baseados na teoria de programação não linear
[1] para cada uma das m variáveis de pesquisa é definida por: [5],[6],[7],[9],[10],[11],[12], programação convexa [8], [19],
H
1 1 programação dinâmica [14], programação multiobjectivo
V(t j ) =  N2h ( − )S2hj , j = 1,..., m (10)
h=1 n h N h
4764 IEEE LATIN AMERICA TRANSACTIONS, VOL. 14, NO. 12, DECEMBER 2016

[13],[15],[18],[20], heurísticas[16], metaheurísticas [17] e A característica comum aos métodos de penalidades é a


programação inteira [21]. transformação do problema de minimização com restrições em
Em particular, no presente trabalho, o problema associado à um problema sem restrições, ou seja:
formulação acima será abordado como um problema de
programação não linear (PPNL), sendo todas as variáveis Minimizar F(x)=f(x)+P(x) (32)
tratadas, inicialmente, como contínuas (relaxação das
restrições de integralidade). Na equação acima, P(x) corresponde à função penalidade
Neste sentido, a seção seguinte traz uma proposta de que incorpora as restrições associadas à g(x) e h(x).
resolução para o problema de alocação, considerando a A ideia básica, comum a todos os métodos de penalidades,
aplicação de um método de programação não linear baseado é que a função penalidade possua o poder de aumentar
em penalidades, mais especificamente, o método proposto por fortemente os valores fora da região viável [22] e,
[2], doravante denominado método de penalização concomitantemente, tenha uma influência desprezível dentro
hiperbólica. Neste ponto, deve-se ressaltar que, nenhuma das dessa região, de forma que o ponto ótimo do problema
abordagens de programação não linear da literatura, propostas modificado esteja, aceitavelmente, próximo do ponto ótimo do
para esse problema, fazem uso de um método de penalização. problema original.
Em particular, o método da literatura proposto por Bethel A maioria dos métodos de penalidade produz o ponto ótimo
[10][11], e que foi utilizado para comparação com o método através da resolução de uma sequência de problemas de
penalização hiperbólica, é baseado teoria de Kuhn-Tucker e minimização, obtida pela variação controlada de um
faz uso de multiplicadores de Lagrange [22]. parâmetro externo, que faz com que se aumente,
De forma a facilitar o entendimento do método de progressivamente, o grau em que o problema sem restrições se
penalização, as restrições presentes na formulação definida aproxima do problema original.
pelas equações (13)-(15) serão apresentadas, a seguir, na Ao contrário de outros métodos que trabalham com apenas
forma padrão de programação não linear: um parâmetro, o método de penalização proposto em [2]
g i (n1 , n2 ,..., n H ) = n i - n min , i = 1,..., H (16) trabalha com dois parâmetros, quais sejam: um ângulo α e
hk (n1 , n2 ,..., nH ) = Nk - nk , k = 1,..., H (17) uma distância d.
Cabe observar que a utilização de dois parâmetros não traz
s j(n1 , n2 ,..., n H ) = − V(t j )/ Yj + cv j , j = 1,..., m (18) problemas ao desempenho do método, uma vez que esses
considerando parâmetros são manipulados separadamente, em duas fases
g i (n1 , n 2 ,..., n H ) ≥ 0, i = 1,..., H (19) distintas do algoritmo [2]. A função penalidade associada a
h k (n1 , n2 ,..., n H ) ≥ 0, k = 1,..., H (20) esse método apresenta a característica de ser completamente
diferenciável. Outra característica importante é que qualquer
sj(n1 , n2 ,..., nH ) ≥ 0, j = 1,..., m (21) ponto inicial pode ser escolhido para iniciar o algoritmo.
n1 , n2 ,..., nH ∈ ℜ (22) Como a formulação que é o objeto de estudo desse trabalho
não tem restrições de igualdade, o algoritmo apresentado a
As equações (16) e (17) e as restrições (19) e (20) seguir, tratou do seguinte o problema:
correspondem, respectivamente, à restrição (13), já a equação (P) Minimizar f(x) (33)
(18) corresponde à restrição (14). Sujeito a
A partir dessas considerações, pode-se reescrever a (34)
g i (x) ≥ 0, i = 1,..., u
formulação original da seguinte forma: n
H x∈ℜ (35)
Minimizar f(n1 , n 2 ,..., n H ) =  n h (23) Considerando a aplicação do método de penalização
h =1
hiperbólica, a solução desse problema é obtida através de uma
Sujeito a sequência de minimizações sem restrições da função objetivo
g i (n1 , n 2 ,..., n H ) ≥ 0, i = 1,..., H (24)
original f(x), acrescida de um termo P(g(x),α,d)
h i (n1 , n 2 ,..., n H ) ≥ 0, i = 1,..., H (25) correspondente à penalidade. A função a ser minimizada é:
s j(n1 , n2 ,..., n H ) ≥ 0, j = 1,..., m (26) u
F(x, α, d) = f(x) + P(g(x), α, d) = f(x) +  P(g i (x), α, d) (36)
n1 , n2 ,..., nH ∈ ℜ (27) i =1

1 1 (37)
P(y, α, d) = − ( tan( α ). y ) + ( tan( α )) 2 . y 2 + d 2
III. MÉTODO DE PENALIZAÇÃO HIPERBÓLICA 2 2
Considere o problema geral de Programação Não-Linear: com α ∈ [0, π ) e d ≥ 0
2
(P) Minimizar f(x) (28) A ideia básica do método é a seguinte: Inicialmente,
aumenta-se o ângulo α da assíntota da função penalidade P
Sujeito a
conforme Fig. 1, provocando significativo aumento da
g i (x) ≥ 0, i = 1,..., u (29)
penalização (valor da função F) fora da região viável e,
h j (x) = 0, j = 1,..., p (30) reduzindo simultaneamente a penalização para pontos
x ∈ ℜn (31) pertencentes à região viável. O processo continua até que se
obtenha um ponto viável.
MOURA BRITO AND XAVIER : A NONLINEAR OPTIMIZATION ALGORITHM APPLIED 4765

Em seguida, mantem-se α constante e diminui-se Se esse ponto não for viável, aumenta-se o valor do
sequencialmente o valor d de acordo com Fig. 2. parâmetro α implicando, consequentemente, o aumento do
valor da função F(x,α,d) (passo 6). Caso contrário, reduz-se no
passo (5) o valor do parâmetro d. Ao final de k iterações,
sendo xk um ponto viável e cuja diferença em relação ao ponto
xk-1, em módulo, é menor ou igual a um parâmetro ε, esse
ponto corresponde ao ótimo x* do problema.

Algoritmo 1: Algoritmo de Penalização Hiperbólica


1 Defina os valores ρ1 e ρ2 ∈(0,1), k=0, α1=α0, d1= d0, ε,
α0∈(0,π/2) e d0>0 e tome x0 (ponto inicial)
2 Repita

k=k+1
m
3 Minimize F(x, α, d) = f(x) +  P(g i (x), α k , d k ) a usando xk-1
i=1
e produzindo o ponto xk
4 Se xk é viável Então
Figura 1. Aumento do ângulo α. Se ||xk-xk-1|| > ε Então (ainda não é aceitável)
5 dk+1=ρ2dk, αk+1=αk
Fim-se
Senão
6 αk+1=ρ1αk+(1-ρ1)π/2 e dk+1=dk
Fim-se
7 Até que (||xk-xk-1|| ≤ε)
8 Faça x*=xk (ponto de ótimo)

IV. EXPERIMENTOS COMPUTACIONAIS


Esta seção traz os resultados obtidos para o problema de
alocação ótima, considerando a aplicação do método de
penalização hiperbólica e um método da literatura, proposto
por Bethel [10], [11] e implementado por Barcaroli [23]. O
método de penalização hiperbólica foi desenvolvido em
Figura 2. Redução do valor d. linguagem R e a versão melhorada do algoritmo de Bethel está
disponível em uma função de um pacote do R denominado
Destarte, a penalização interior [2] e [22] torna-se cada vez SamplingStrata. Os resultados de todos os experimentos
mais irrelevante, mantendo-se o mesmo nível de computacionais reportados neste trabalho foram obtidos a
proibitividade fora da região viável. partir da execução das funções no ambiente do software R,
Ao aplicar o método de penalização hiperbólica à utilizando um computador dotado de 24GB de memória RAM
formulação de PNL definida nas equações (23), (24), (25), e um processador de 3.40 GHz (I7).
(26) e (27), mais especificamente, a função de penalidade, O método de penalização e o método da literatura foram
temos: aplicados em quatro populações reais. Em particular, para
aplicação do método de penalização hiperbólica, foram
F(x, α, d) = f(x) + P(g(x), α, d) + P(h(x), α, d) + P(s(x), α, d) = considerados, respectivamente, os seguintes valores para os
H H m (38) parâmetros d0, ρ1 ,ρ2, α0, ε: 50, 0.3, 0.5, π/18, 10-6. E o ponto
f(x) +  P(g i (x), α, d) +  P(h i (x), α, d) +  P(s j (x), α, d)
i =1 i =1 j=1
inicial xo= (0.8xN1,0.8xN2,...,0.8xNH).
A seguir é apresentado o Algoritmo 1 que diz respeito ao Tendo em vista que foi adotada uma abordagem de
algoritmo de penalização hiperbólica (PH) proposto em [2]. programação não linear para o problema de alocação,
No passo (1) do algoritmo são definidos os parâmetros de naturalmente, as soluções produzidas a partir da aplicação do
entrada utilizados no método de penalização hiperbólica e no algoritmo não correspondem a valores inteiros. Assim sendo,
passo (3) ocorre a minimização da função de penalidade que após a execução do algoritmo, em cada uma das populações,
incorpora as restrições do problema. Na k-ésima iteração do foi efetuado um arredondamento dos tamanhos de amostra.
algoritmo, a função é minimizada considerando ponto A tabela I traz informações concernentes às quatro
produzido na iteração anterior (k-1). No passo 4 é avaliado se populações consideradas neste experimento. Além da
o novo ponto xk produzido é viável, ou seja, se pertence à identificação da população, a segunda coluna tem o número de
região viável definida pelas restrições do problema de PNL. estratos H, a terceira coluna tem o número de variáveis Y da
população (m) e a quarta coluna, representada por N, contém o
número de observações da população. E a tabela II tem
4766 IEEE LATIN AMERICA TRANSACTIONS, VOL. 14, NO. 12, DECEMBER 2016

informações relativas à origem da população e às variáveis de TABELA V


RESULTADOS POP3
pesquisa utilizadas.
PH
TABELA I cvj n CV(t1) CV(t2) CV(t3) CV(t4)
INFORMAÇÕES SOBRE AS POPULAÇÕES
5 1527 1.99 3.87 5.00 4.41
População H m N 10 761 3.58 7.21 9.99 8.77
15 439 4.98 10.20 14.98 13.07
POP1 3 3 20742 BE
POP2 12 2 59778
POP3 7 4 2896 cvj n CV(t1) CV(t2) CV(t3) CV(t4)
POP4 4 3 338 5 1529 2.00 3.88 4.99 4.40
10 763 3.60 7.25 9.97 8.75
15 441 4.95 10.16 14.94 13.03
TABELA II
DADOS SOBRE AS POPULAÇÕES
TABELA VI
RESULTADOS POP4
População Descrição Variáveis (Y)
PH
POP1 Estabelecimentos agropecuários Efetivo, Área Total e cvj n CV(t1) CV(t2) CV(t3)
produtores de café no estado do Produção 2 248 1.84 1.83 2.00
Paraná (Censo AGRO 1998). 5 110 4.59 4.66 4.99
POP2 Dados do censo escolar Número de Salas e 10 37 9.17 9.34 9.96
brasileiro de 2012 – Região Número de BE
Sudeste Funcionários por Escola cvj n CV(t1) CV(t2) CV(t3)
POP3 Informações sobre os Área de Cultivo, Área 2 250 1.81 1.79 1.96
municípios suíços em 2003 Industrial, Número de 5 113 4.50 4.56 4.89
( pacote SamplingStrata) Domicílios e População 10 39 8.87 9.02 9.67
POP4 Informações sobre fazendas de Quantidade, Receita e
cana de açúcar da Austrália Despesa
utilizadas em [27] Analisando-se as tabelas III, IV, V, e VI, e levando-se em
conta que o objetivo é minimizar o tamanho de amostra, é
As tabelas III, IV, V e VI trazem os coeficientes de possível observar que, em todos os casos, o método de
variação alvo (cvj) fixados para cada uma das variáveis de penalização hiperbólica foi mais eficaz do que o método de
pesquisa, além dos tamanhos de amostra (n) obtidos usando o Bethel, uma vez que produziu tamanhos de amostra inferiores
método de penalização (PH) e o método proposto por Bethel aos tamanhos de amostra produzidos pelo método de Bethel.
(BE), além dos coeficientes de variação (em percentual) Ainda considerando essa análise, os maiores ganhos
produzidos (CV(ti)) a partir da aplicação desses dois métodos. produzidos (redução no tamanho de amostra) estão associados
à segunda população, que contém o maior número de
elementos (N) e mais estratos.
TABELA III
RESULTADOS POP1 Além disso, para todas as populações, o método de
penalização hiperbólica consumiu um tempo computacional
PH
cvj
inferior a 2 minutos. Isso demonstra que o método proposto
n CV(t1) CV(t2) CV(t3)
neste trabalho se constitui como uma boa alternativa à
5 2545 1.23 5.00 2.91
10 754 3.30 10.00 7.07 resolução do problema de alocação ótima multivariado.
15 347 5.11 15.00 10.86
BE
cvj n CV(t1) CV(t2) CV(t3)
V. CONCLUSÕES
5 2546 1.23 5.00 2.91 O presente trabalho trouxe a proposta de uma nova
10 755 3.30 9.99 7.07 metodologia para a resolução do problema de alocação ótima
15 349 5.11 14.95 10.85
multivariado. Mais especificamente, esse problema foi
formulado como um problema de programação não linear,
TABELA IV cuja solução foi obtida mediante a aplicação do método de
RESULTADOS POP2 penalização proposto por [2]. Além disso, essa formulação
PH permite a definição prévia de um tamanho mínimo de amostra
cvj n CV(t1) CV(t2) por estrato, algo que não é possível estabelecer em vários
2 5240 2.00 1.00 métodos da literatura, em particular, no método proposto por
5 932 5.00 2.41 Bethel [10], [11].
10 242 10.00 4.51
BE
Conforme comentado, esta nova metodologia se diferencia
cvj n CV(t1) CV(t2) das demais metodologias da literatura por tratar o problema de
2 5247 2.00 1.00 alocação de forma direta, considerando a sua não linearidade
5 937 4.98 2.41 no que diz respeito à restrição que limita os coeficientes de
10 246 9.89 4.58 variação.
Foram realizados experimentos numéricos com um
pequeno conjunto de populações que demonstraram a
viabilidade da nova abordagem proposta.
MOURA BRITO AND XAVIER : A NONLINEAR OPTIMIZATION ALGORITHM APPLIED 4767

Não obstante, em trabalhos futuros, pretende-se avaliar o [24] T.Liu, F.Wang and G.Agraw, “Stratified Sampling for Data Mining on
the Deep Web”, IEEE International Conference on Data Mining, pp. 324-333,
novo método proposto considerando um quantitativo maior de 2010.
novas populações com mais estratos e mais variáveis de [25] S.Joshi and Christopher Jermaine, “Robust Stratified Sampling Plans for
pesquisa. Low Selectivity Queries”, IEEE 24th International Conference on Data
Ainda que o método de penalização hiperbólica não seja Engineering, pp. 199-208, 2008.
[26] S. A. Souza, R. A. Macêdo, E. T. Vargas, D. V. Coury, M. Oleskovicz,
diretamente dependente do ponto de partida, também se “Estimação de Parâmetros de um Sistema Elétrico de Potência Utilizando
pretende desenvolver e utilizar, em experimentos futuros, uma Algoritmos Genéticos”, IEEE Latin America Transactions, vol. 4(1),
heurística que produza pontos iniciais viáveis que propiciarão pp. 47-54, 2006.
a convergência do algoritmo em um tempo computacional [27] R. L. Chambers and R. Dunstan, “Estimating Distribution Functions
from Survey Data”, Biometrika, vol. 73 (3), pp. 597-604, 1986.
menor. Neste sentido, uma possível alternativa seria a
utilização de algoritmos genéticos [26].
José André de Moura Brito tem bacharelado em Matemática
REFERÊNCIAS pela Universidade Federal do Rio de Janeiro (1997), Mestrado
[1] W. G. Cochran, “Sampling Techniques”, Third Edition – Wiley, 1977 em Engenharia de Sistemas e Computação (Otimização) pela
[2] A.D.E.Xavier, “ Hyperbolic Penalty: A New Method for Nonlinear Universidade Federal do Rio de Janeiro (1999), Doutorado em
Programing with inequalities,” International Transactions in Operational Engenharia de Sistemas e Computação (Otimização) pela
Research, vol. 8 (6), p. 659-672, 2001. Universidade Federal do Rio de Janeiro (2004) e
[3] S.L. Lohr, “Sampling: Design and Analysis”, 2nd edition. Brooks/Cole, Pós-Doutorado em Otimização na UFF (2008). É professor da
Cengage Learning, 2010. Escola Nacional de Ciências e Estatística (ENCE/IBGE), onde leciona
[4] P.V. Sukhatme, B.V. Sukhatme, S. Sukhatme and C. Asok, “Sampling disciplinas na graduação e no mestrado. É editor executivo da Revista
Theory of Surveys with Applications”. Iowa State University Press, 3rd Brasileira de Estatística (RBE). Tem experiência nas áreas de Otimização,
Edition, 1984. Estatística e Computação, atuando principalmente nos seguintes temas:
[5] A.R. Kokan, “Optimum Allocation in Multivariate Surveys”, Journal Metaheurísticas, Programação Inteira, Otimização Combinatória, Suavização,
of the Royal Statistical Society, Series A, vol. 126 (4), pp. 557-565, 1963. Análise de Algoritmos, Análise de Agrupamentos e
[6] J.L. Folks and C.E.Antle, “Optimum Allocation of Sampling Units to Amostragem. http://lattes.cnpq.br/9036541085964477.
Strata When There Are R Responses of Interest”, Journal of the American
Statistical Association, vol. 60 (309), pp. 225-233, 1965. Adilson Elias Xavier possui graduação em Engenharia
[7] A.R. Kokan and S. Khan, “Optimum Allocation in Multivariate Surveys: Mecanica pela Universidade Federal de Minas Gerais (1966),
An Analytical Solution”. Journal of the Royal Statistical Society, Series B, especialização em Análise de Sistemas pela Analista de
vol. 29 (1), pp.115-125, 1967. Sistemas (1970), mestrado em Engenharia de Sistemas e
[8] H.F. Huddleston, P.L. Claypool and R.R. Hocking, “Optimal Sample Computação pela Universidade Federal do Rio de
Allocation to Strata Using Convex Programming”, Journal of the Royal Janeiro(1982) e doutorado em Engenharia de Sistemas e
Statistical Society, Series C, vol. 19 (3), pp. 273- 278,1970. Computação pela Universidade Federal do Rio de
[9] L. Kish, “ Optima and Proxima in Linear Sample Designs”, Journal of Janeiro(1992). Atualmente é Professor Adjunto da Universidade Federal do
the Royal Statistical Society, Series A, vol. 139 (1), pp. 80-95, 1976. Rio de Janeiro, Revisor de periódico da Pesquisa Operacional, Membro de
[10] J. Bethel,“An Optimum Allocation Algorithm for Multivariate Surveys”, corpo editorial da Revista de Matemática: Teoria y Aplicaciones, Revisor de
Proceedings of the Survey Research Methods Section of the American periódico da International Transactions in Operational Research, Revisor de
Statistical Association, pp. 209-212, 1985. periódico da Revista de Matemática: Teoria y Aplicaciones, Membro de corpo
[11] J. Bethel, “Sample Allocation in Multivariate Surveys”, Survey editorial da Investicacion Operativa, Revisor de periódico da Investicacion
Methodology, vol 15 (1), pp. 47-57, 1989. Operativa, Revisor de periódico da Computational and Applied Mathematics,
[12] J. Chromy, “Design Optimization with Multiple Objectives”. Revisor de periódico da Mathematical Problems in Engineering, Revisor de
Proceedings of the Survey Research Methods Section of the American periódico da INFORMATICA (Lithuania) e Revisor de periódico da
Statistical Association, pp. 194-199, 1987. Optimization (Print). Tem experiência na área de Matemática, com ênfase em
[13] R. Valliant and J.E. Gentle, “An Application of Mathematical
Modelos e Algoritmos em Programação Matemática. Atuando principalmente
Programming to Sample Allocation”, Computational Statistics & Data
Analysis, vol. 25, pp. 337-360, 1997. nos seguintes temas:Penalização Hiperbólica, Otimização, Programação Não-
[14] M.G.M. Khan and M.J. Ahsan, “A note on optimum allocation in Linear, Métodos dos Multiplicadores. http://lattes.cnpq.br/6653416458352062
multivariate stratified sampling”, S.Pac. Journal Nat. Sci, vol. 21, pp. 91-95,
2003.
[15] J.A.D. Garciá and L.U. Cortez, “Optimum Allocation in Multivariate
Stratified Sampling: Multi-Objective Programming”, Comunicaciones Del
Cimat, no I-06-07/28-03-2006, 2006.
[16] M. Kozak, “Multivariate Sample Allocation: Application of Random
Search Method”, Statistics in Transition, vol. 7 (4), pp. 889-900, 2006.
[17] C.D.Day, “A Multi-Objective Evolutionary Algorithm for Multivariate
Optimal Allocation”, Proceedings of the Survey Research Methods Section of
the American Statistical Association, 2010.
[18] M.V. Ismail, K. Nasser, and Q.S. Ahmad, “Solution of a Multivariate
Stratified Sampling Problem through Chebyshev´s Goal Programming”,
Pak.J.Stat.Oper.Res, vol. 7 (1), pp. 101-108, 2011.
[19] M. F. Khan, I. Ali, Y.S. Raghav and A. Bari, “Allocation in Multivariate
Stratified Surveys with Non-linear Random Cost Function”, American
Journal of Operations Research, vol. 2, pp. 100-105, 2012.
[20] R. Varshey, M.G.M. Khan, U. Fatima, and M.J. Ahsan, “Integer
Compromise Allocation in Multivariate Stratified Surveys”, Annals of
Operations Research, vol. 226, pp. 659-668, 2015.
[21] J.A.M. Brito, P.L.N Silva, G.S. Semaan and N. Maculan, “Integer
Programming Formulations Applied to Optimal Allocation in Stratified
Sampling”, Survey Methodology, vol. 41 (2),pp. 427-442, 2015.
[22] M.S.Bazaraa, H. D. Sherali and C. M. Shetty, “Nonlinear Programming:
Theory and Algorithms”, 3rd Edition, Wiley, 2006.
[23]G. Barcaroli, “SamplingStrata: An R Package for the Optimization of
Stratified Sampling”, Journal of Statistical Software, 61 (4), pp. 1-24, 2014.

Você também pode gostar