Você está na página 1de 14

Anlise do Impacto de Migrao de Mquinas Virtuais em

Ambiente Computacional Virtualizado


*
Deborah V. Magalhes
1
, Jos Marques Soares
2
, Danielo G. Gomes
1,2
1
Grupo de Redes de Computadores, Engenharia de Software e Sistemas (GREat)

2
Departamento de Engenharia de Teleinformtica (DETI)
Universidade Federal do Cear (UFC)
Fortaleza CE Brasil
deborah@great.ufc.br,{marques,danielo}@ufc.br
Resumo. Migrao de mquinas virtuais tem sido uma alternativa comumente
adotada em clusters e datacenters devido principalmente s suas vantagens de
balanceamento de carga, tolerncia a falha e economia de energia.
Entretanto, o processo de migrao provoca degradaes no desempenho,
refletindo negativamente nos servios providos pelas mquinas virtuais. Nesse
trabalho, apresentamos uma avaliao do impacto de duas abordagens de
migrao de mquinas virtuais amplamente referenciadas na literatura e
disponibilizadas pelo hipervisor Xen: stop-and-copy e pr-cpia. Essas duas
abordagens foram analisadas em um ambiente de experimentao real, com 4
servidores fsicos heterogneos, a partir de 4 mtricas de performance: tempo
total de migrao, downtime, tempo de resposta e vazo de demanda. Os
resultados experimentais obtidos mostram que (i) o downtime da stop-and-
copy pelo menos 5 vezes maior que o da pr-cpia, (ii) o tempo total de
migrao da pr-cpia foi superior ao da stop-and-copy para todas as cargas
de trabalho, (iii) a pr-cpia provocou um incremento no tempo de resposta
das aplicaes, caracterizando quebra de SLA para benchmarks de aplicaes
web, enquanto a stop-and-copy causou indisponibilidade dos servios.
Abstract. Virtual machines migration has been widely applied in datacenter
environments due to various benefits including load balancing, fault tolerance
and energy saving. However, the migration process causes degradation on the
services provided by the virtual machines. In this paper, we present an impact
evaluation of two virtual machines migration approaches that have been
widely cited in the literature: stop-and-copy and pre-copy. We present an
indoor experimental testbed for evaluating these two approaches through four
performance metrics: total migration time, downtime, response time and
throughput. Experimental results show that (i) the stop-and-copy downtime is
at least 5 times higher than the pre-copy one, (ii) the total migration time of
pre-copy was higher than stop-and-copy for all workloads, (iii) the pre-copy
strategy increases the applications response time, while the use of stop-and-
copy led to services downtime.
*
Apoio da Capes e do INCT-MACC (processo CNPq 573710/2008-2).

Laboratrio associado ao INCT-MACC.


XXIX Simpsio Brasileiro de Redes de Computadores e Sistemas Distribudos 235
1. Introduo
A utilizao de tecnologias para virtualizao em ambientes de datacenters tem
aumentado consideravelmente nos ltimos anos, principalmente devido a sua
capacidade de isolamento, consolidao e migrao da carga de trabalho [Voorsluys et
al 2009]. Uma das principais vantagens da virtualizao a possibilidade de
remapeamento de recursos fsicos em servidores virtuais a fim de lidar com carga de
trabalho dinmica. Isso especialmente til em Computao em Nuvem, uma vez que
tais ambientes necessitam de uma infraestrutura computacional dinmica, capaz de
suportar a natureza elstica da alocao de recursos conforme a demanda dos usurios.
A migrao de mquinas virtuais (VMs) atravs de servidores fsicos distintos
traz diversas vantagens, tais como: (i) balanceamento de carga - as VMs podem ser
rearranjadas em ns fsicos do datacenter para aliviar a carga sobre hospedeiros
saturados, (ii) manuteno online e tolerncia a falhas - uma mquina fsica pode
precisar de upgrade ou manuteno do sistema devido a falhas, de forma que um
administrador pode migrar as VMs em execuo para uma mquina alternativa,
liberando a mquina original para manuteno e, (iii) gerenciamento de energia -
quando as VMs podem ser consolidadas em um nmero reduzido de servidores,
reduzindo assim o custo de energia. Tais vantagens permitem aumentar a flexibilidade e
reduzir a complexidade de gerenciamento dos recursos fsicos em ambientes
virtualizados. Entretanto, a migrao provoca uma degradao no desempenho do
sistema, uma vez que para realiz-la, necessrio parar a execuo da VM, provocando
sua indisponibilidade e, por conseguinte, das aplicaes que nela executam. Alm disso,
h um consumo extra de ciclos de CPU e de largura de banda no processo de
transferncia da VM de um hospedeiro para outro, impactando nos recursos
disponibilizados para os servios providos pela mesma. Nesse contexto, uma melhor
compreenso do impacto da migrao no desempenho do sistema fundamental para
concepo de estratgias aptas a utilizar os recursos de maneira eficiente sem
comprometer a capacidade de resposta e disponibilidade dos servios ofertados.
Diante deste contexto, apresentamos uma avaliao do impacto de duas
abordagens de migrao de mquinas virtuais amplamente referenciadas na literatura e
disponibilizadas pelo hipervisor Xen [Barham et al 2003]: stop-and-copy e pr-cpia. O
objetivo da nossa avaliao compreender o impacto gerado por essas duas abordagens
no desempenho de um testbed real dedicado, destacando as vantagens e desvantagens de
cada uma delas, de maneira a contribuir com os administradores de ambientes
virtualizados na escolha da tcnica mais adequada s suas metas de desempenho.
Dentre os objetivos especficos do trabalho, destacam-se: (i) para cada uma das
tcnicas avaliadas, medir e analisar o impacto da migrao no desempenho do sistema a
partir de quatro mtricas relevantes no contexto de migrao de mquinas virtuais:
tempo total de migrao, downtime, tempo de resposta e vazo de demanda; e (ii)
apontar vantagens e desvantagens de cada uma das tcnicas atravs de seis
experimentos realizados no ambiente de testes.
2. Trabalhos Relacionados
As abordagens de migrao de mquinas virtuais dividem-se em: non-live migration ou
pure stop-and-copy e live migration. A non-live migration [Schmidt 2000] [Osman et al
2002] caracterizada pela suspenso da VM no hospedeiro de origem durante o
processo de transferncia das pginas de memria para o hospedeiro de destino. Essa
abordagem possui vantagens em termos de simplicidade, e reduz o tempo total de
236 Anais
migrao em relao abordagem live. Em contrapartida, o downtime sofrido pelas
aplicaes que so executadas na VM maior nesse tipo de abordagem.
O primeiro trabalho a desenvolver uma estratgia live migration utilizando
tecnologia de virtualizao Xen foi proposto por Clark et al [Clark et al 2005]. Nesse
trabalho, a soluo conta com uma etapa de pr-cpia utilizada para reconstruo da
imagem da memria da VM no hospedeiro de destino, realizada atravs da transferncia
das pginas de memria em vrias iteraes. A vantagem dessa proposta reside no fato
da VM e, portanto, todas as aplicaes nela hospedadas, continuarem a executar
enquanto a imagem da memria transferida, proporcionando um menor downtime dos
servios. No trabalho de Clark et al [Clark et al 2005], os autores pressupunham que as
pginas de memria atualizadas eram transferidas muito mais rpido que a taxa de
atualizao - caso contrrio, todo o trabalho seria ineficaz e deveria ser interrompido.
Com o intuito de reduzir o overhead gerado pela transferncia das pginas de
memria durante o processo de pr-cpia, foi proposta uma abordagem que utiliza
tecnologias de trace/replay [Xu et al 2007] e checkpointing/recovery [Cully et al 2008]
para recuperar o estado da VM no hospedeiro de destino de forma eficiente e, assim,
minimizar o downtime das aplicaes que nela executam e o trfego da rede [Liu et al
2009]. Nessa soluo, a quantidade de dados transferidos durante a etapa de pr-cpia
reduzida significativamente. Todavia, a ferramenta utilizada para recuperao do estado
da VM no hospedeiro de destino, chamada ReVirt [Dunlap 2002], executa as instrues
necessrias para tal, desde que o processador no hospedeiro de origem e destino sejam
iguais, ou seja, a soluo est limitada a cenrios onde o hardware homogneo.
Em contraste s abordagens de pr-cpia, foi proposta a estratgia live migration
baseada na ps-cpia [Hines 2009] com o propsito de reduzir o tempo de realocao
das VMs durante o processo de migrao. Essa abordagem caracterizada pela
execuo da VM no hospedeiro de destino antes da transferncia de suas pginas de
memria para o mesmo. Apesar da ps-cpia reduzir o tempo de realocao da VM,
provoca uma degradao no desempenho das aplicaes, visto que ela interrompida
toda vez que uma pgina de memria no est disponvel e somente reinicializada
quando a pgina de memria recuperada a partir do hospedeiro de origem. No sentido
de atenuar o downtime sofrido pela VM depois de sua realocao no hospedeiro de
destino, os autores implementaram a tcnica de pr-paginao para trabalhar juntamente
com mecanismo de paginao sob demanda. Esta tcnica utilizada para esconder a
latncia das falhas de pgina ocorridas quando a VM acessa uma pgina de memria
que ainda no est disponvel. Recentemente, a combinao de paginao sob demanda
com a pr-paginao tambm foi utilizada em [Hirofuchi et al 2010] para compor a
estratgia de migrao de mquinas virtuais baseada na abordagem ps-cpia visando
reduzir o downtime experimentado pela VM.
3. Metolodogia de Avaliao e Cenrio de Experimentao
3.1. Mtricas
Atravs da anlise de trabalhos recentes [Voorsluys et al 2009] [Clark et al 2005] [Liu
et al 2009] [Hines 2009] [Oliveira 2010], identificamos as mtricas mais utilizadas e
relevantes no contexto de migrao de mquinas virtuais. Neste trabalho, as seguintes
mtricas foram escolhidas: (1) Downtime, refere-se ao tempo durante o qual a execuo
da VM em migrao interrompida. No mnimo, esse intervalo de tempo inclui a
transferncia do estado do processador e dispositivos de rede e disco. Na stop-and-copy
esta transferncia tambm inclui todas as pginas que compem a memria. Na pr-
XXIX Simpsio Brasileiro de Redes de Computadores e Sistemas Distribudos 237
cpia, essa etapa inclui apenas as pginas de memria modificadas remanescentes. O
downtime uma mtrica fundamental para avaliao de desempenho da migrao, visto
que a inatividade da VM impacta diretamente nos servios por ela disponibilizados,
podendo comprometer a transparncia de migrao em nvel de usurio; (2) Tempo total
de migrao refere-se ao tempo gasto na realizao de todas as etapas necessrias ao
processo de migrao. Essa mtrica de suma importncia porque afeta a liberao de
recursos em ambos os hospedeiros participantes. A memria ocupada no hospedeiro de
origem pela VM fica alocada migrao e s ser liberada aps a concluso do
processo; (3) Tempo de resposta est relacionado com os atrasos sofridos pelas
aplicaes em execuo dentro da VM causados pelo processo de migrao. Essa
mtrica refere-se responsividade das aplicaes e visa medir o quanto a migrao
compromete a capacidade das aplicaes atenderem em tempo hbil s requisies dos
usurios; (4) Vazo de demanda corresponde taxa de requisies por segundo
submetidas pelos usurios durante o processo de execuo da aplicao.
3.2. Cargas de trabalho
A fim de conduzir a avaliao do impacto das abordagens de migrao no desempenho
do sistema, sero utilizados quatro diferentes benchmarks:
1. O Netperf [Netperf 2010] utilizado para medir aspectos de desempenho de
rede. Ele gera um trfego de rede e avalia o desempenho da
requisio/resposta utilizando os protocolos UDP e TCP;
2. O Sample Web Application [The SampleWeb Application 2010] utilizado
para testar uma aplicao web simples formada pela combinao de trs
pginas: uma homepage (home.html), uma pgina produtos (products.html) e
uma pgina contatos (contacts.html);
3. O Olio [Olio 2010] representa um website de eventos sociais que permite
usurios executarem diversas aes como: carregar homepage, acessar o
sistema, criar novos eventos, atender eventos e buscar eventos por data ou tag.
Em nossos experimentos, utilizamos a implementao PHP do Olio,
empregando a pilha LAMP (Linux, Apache, MySQL e PHP);
4. O Apache Benchmark (AB) [The Apache Software Foundation 2010] um
programa de linha de comando que faz parte do servidor web Apache, e
utilizado para medir o desempenho de servidores web atravs de requisies
HTTP a URLs especificadas pelo usurio.
Utilizamos o Faban [Faban 2010] na qualidade de gerador de trfego open-source para
gerar a carga de trabalho, dispar-la contra o Sample Web Application e o Olio bem
como monitorar seus resultados. O nvel de carga disparado contra essas aplicaes
pode ser variado alterando o nmero de usurios simultneos que as acessam. Alm do
Sample Web Applicaton, o Olio foi utilizado por se tratar de uma aplicao Web 2.0
realista e representativa com padres de comunicao cliente/servidor, padres de
escrita e carga do servidor particulares que a torna diferente de outras cargas estticas
clssicas. A combinao Olio/Faban foi originalmente proposta em [Sobel et al 2008],
como parte do benchmark Cloudstone e, posteriormente, utilizada em [Voorsluys et al
2009].
3.3. Cenrio de Experimentao
O cenrio utilizado consiste em quatro servidores fsicos com especificaes de
hardware e software heterogneas (vide Tabela 1), definidas de acordo com o papel
desempenhado por cada mquina no sistema. A arquitetura do ambiente de
238 Anais
experimentao ilustrada na Figura 1, na qual podemos destacar 3 diferentes funes:
(1) o Front-end responsvel por gerenciar o conjunto de recursos formados pelo XCP-
storage, XCP-resource01 e XCP-resource02, atravs da ferramenta Open Xen Manager
[OpenXenManager 2010]; (2) os servidores XCP-resource01 e XCP-resource02
representam os hospedeiros onde sero instanciadas as VMs e suas respectivas
aplicaes. Para tanto, utilizado o XCP Server que faz parte da infraestrutura de
virtualizao para Nuvens XCP (Xen Cloud Platform) [Xen 2010]. Essa infraestrutura
baseada no hipervisor Xen [Xen, 2010] e foi escolhida por permitir agregar recursos
fsicos heterogneos em um mesmo conjunto de recursos. Todas a VMs instanciadas
contam com a pilha LAMP (Linux Ubuntu 10.04, Apache, MySQL e PHP) para a
execuo dos benchmarks Sample Wev Application, Olio e Apache benchmark; (3) o
XCP-storage representa o servidor NFS (Network File System) e tambm hospeda o
gerador de carga responsvel por gerar a carga que ser disparada contra as aplicaes
que so executadas nas VMs. Os quatro ns compartilham esse dispositivo de
armazenamento, onde residem as imagens das VMs e os discos virtuais. Para realizar a
migrao, o Xen exige que as imagens estejam hospedadas em um dispositivo de
armazenamento compartilhado [Wood et al 2009]. Todas as mquinas esto conectadas
atravs de uma rede LAN Fast Ethernet.
Figura 1. Arquitetura do ambiente de experimentao
Tabela 1. Hardwares e softwares utilizados para compor o ambiente de experimentao
Hardware Software Papel no ambiente
Intel Core2 Duo Processor . Memria DDR2
2GB Disco 120 GB
Windows Vista Home,
OpenXenManager
Frontend - gerente do
conjunto de recursos
Processador Intel Core Duo Memria DDR2
2GB. Disco 80GB
Ubuntu Server 10.04 Storage NFS
Gerador de carga (mestre)
Processador Intel Core2 Duo Processor.
Memria DDR2 1.5GB.
XCP 0.5 Hospedeiro 1
Intel Pentium Processor Memria 2GB. Disco
500GB
XCP 0.5 Hospedeiro 2
XXIX Simpsio Brasileiro de Redes de Computadores e Sistemas Distribudos 239
4. Resultados
Nesta seo descrevemos seis experimentos realizados para avaliar as abordagens de
migrao pr-cpia e stop-and-copy. Na avaliao, as abordagens foram submetidas a
cargas de trabalho com diferentes caractersticas e o impacto no desempenho do sistema
associado a cada uma delas quantificado a partir de quatro mtricas: tempo total de
migrao, downtime, tempo de resposta e vazo de demanda. Em todos os
experimentos, os ns do tesbed e as conexes de rede so dedicados. As migraes de
todos os experimentos (exceto o teste de estresse) acontecem entre os ns fsicos XCP-
resource01 e XCP-resource02 (Figura 1).
4.1. Experimento #1
O primeiro experimento consistiu na migrao de 3 VMs sem o uso de qualquer tipo de
carga de trabalho. Cada VM, com um tamanho de memria RAM definido (256 MB,
512 MB e 1024 MB, respectivamente) foi submetida pr-cpia e stop-and-copy. O
objetivo desse teste avaliar a influncia do tamanho da imagem de memria da
mquina virtual sobre o downtime e o tempo total de migrao.
Podemos observar na Figura 2(a) que a abordagem stop-and-copy obteve os
valores de downtime igual a 21 s, 38 s e 71 s, respectivamente para as VMs de 256 MB,
512 MB e 1024 MB, enquanto a pr-cpia manteve seu downtime em 4 s para os trs
tamanhos de memria. Isso justificado devido ao fato do downtime na stop-and-copy
ser determinado pelo tempo necessrio para transferir o contexto (informaes
referentes aos registradores de CPU, disco, interface de rede e pginas de memria) da
VM para o hospedeiro de destino. Em contrapartida, na abordagem pr-cpia, o
dowtime calculado a partir de um tamanho mnimo pr-estabelecido de pginas
remanescentes a serem transferidas, ou seja, independe do tamanho da memria da VM.
Portanto, o incremento no tamanho da memria da VM impacta negativamente na
abordagem stop-and-copy. Alm do downtime apresentado pela stop-and-copy ser pelo
menos cinco vezes maior que o da pr-cpia, ele varia de acordo com o tamanho de
memria das VMs, ou seja, para VM com memria muito grande o downtime pode
atingir valores inaceitveis, comprometendo a capacidade de resposta dos servios
disponibilizados pelas VMs.
(a) (b)
Figura 2: Experimento #1 - impacto da migrao de VMs com diferentes
tamanhos de memria utilizando as abordagens stop-and-copy e pr-cpia
(a) sobre o downtime; (b) sobre o tempo total de migrao
240 Anais
A Figura 2(b) ilustra o comportamento da mtrica tempo total de migrao
versus tamanho da memria das VMs. Observamos que o incremento no tamanho da
memria da mquina virtual impacta negativamente (e por igual) no tempo total de
migrao em ambas as abordagens. Isso esperado, visto que necessrio copiar todas
as pginas de memria em algumas das etapas do processo de migrao nas duas
abordagens. Como a taxa de transmisso da rede permanece constante, uma vez
ocorrendo incremento do tamanho da memria na VM mais pginas sero transmitidas
e maior ser o tempo total de migrao. As duas abordagens obtiveram os mesmos
tempos totais de migrao, a saber, 30 s, 51 s e 94 s, respectivamente para as VMs de
256 MB, 512 MB e 1024 MB. Essa igualdade d-se pelo fato das VMs encontrarem-se
ociosas neste primeiro experimento, portanto, sem operao de escrita na memria.
4.2. Experimento #2
O segundo experimento consistiu na migrao de uma VM de 256 MB (RAM). Os
resultados desse experimento correspondem a uma mdia de 10 execues e apresentam
um intervalo de confiana de 95%. Para cada grupo de 10 execues, a VM foi
submetida a uma carga de trabalho diferente (benchmarks Netperf, SampleWeb e Olio).
Nesse experimento, o nvel de carga foi fixado em 200 usurios simultneos para o
benchmark SampleWeb e 25 usurios simultneos para o Olio. Na Figura 3(a), o
downtime apresentado pela stop-and-copy igual a 21 s para todas as cargas, valor este
prximo ao esperado para transmitir uma VM de 256 MB de RAM a uma taxa efetiva
100 Mbits/s. Na pr-cpia, o downtime permanece igual a 4 s para todas as cargas. A
partir dos valores apresentados, constatamos que a variao da carga de trabalho no
impacta no downtime em nenhuma das duas abordagens. Esse resultado deve-se ao fato
da definio do downtime em ambas no depender do tipo de carga de trabalho. O
resultado ilustrado na Figura 3(a) positivo do ponto de vista de gerenciamento de
recursos, pois o valor atribudo ao downtime conhecido independentemente da carga
de trabalho que esteja sendo executada.
(a)
(b)
Figura 3: Experimento #2 - impacto da stop-and-copy e pr-cpia com VM de
256 MB (RAM) submetida a diferentes cargas de trabalho (a) sobre o downtime
(b) sobre o tempo total de migrao
A Figura 3(b) ilustra o comportamento da mtrica tempo total de migrao
versus cargas de trabalho. A stop-and-copy obteve os tempos totais de migrao 30,609
s, 30,100 s e 30,155 s, respectivamente, para os benchmarks NetPerf, SampleWeb e
Olio, enquanto a pr-cpia obteve, para as mesmas cargas, os tempos de 31,943 s,
42,650 s e 45,540 s, respectivamente. Percebemos, portanto, que independentemente do
XXIX Simpsio Brasileiro de Redes de Computadores e Sistemas Distribudos 241
tipo de carga de trabalho utilizada, a stop-and-copy apresentou um tempo total de
migrao prximo a 30 s, justamente o tempo total de migrao encontrado na Figura
2(b) para a mesma VM de 256 MB. Este resultado esperado, visto que o tempo total
de migrao na stop-and-copy depende diretamente do tamanho da imagem de memria
da VM a ser migrada e no do tipo de carga executada. Em contrapartida, a pr-cpia
vulnervel ao tipo de carga submetida VM. O benchmark NetPerf gera trfego na
rede, sendo, portanto, I/O de rede intensivo, mas no causa impacto na memria. Logo,
o tempo total de migrao da abordagem pr-cpia para esse benchmark muito
prximo ao da stop-and-copy. No entanto, o SampleWeb gera carga que mistura
operaes orientadas CPU e orientadas memria, de modo que percebemos, pela
Figura 3(b), que a diferena entre as duas abordagens aumenta para aproximadamente
12 segundos. J no benchmark Olio, que realiza operaes do tipo memria intensiva, a
diferena aumenta para aproximadamente 15 segundos. Esses resultados so justificados
pela fase de pr-cpia iterativa, durante a qual na primeira iterao todas as pginas so
transferidas da origem para o destino. Nas iteraes subsequentes, so copiadas apenas
as pginas que foram modificadas durante a fase de transferncia anterior, ou seja, para
cargas de trabalho na quais as pginas de memria so atualizadas com muita
frequncia, a sobrecarga causada pela transferncia de pginas de memria que sero
posteriormente modificadas ser grande. Nesse experimento, a abordagem pr-cpia
teve um desempenho inferior a stop-and-copy, tendo em vista que quanto maior a fase
de pr-cpia iterativa mais tempo os recursos de CPU e rede so utilizados para a
transferncia das pginas de memria. Estes recursos poderiam estar sendo
disponibilizados s aplicaes que executam na VM. Alm disso, as pginas de
memria ocupadas no hospedeiro de origem so liberadas apenas aps a concluso da
migrao, ocupando assim espao de memria que poderia estar sendo utilizado por
outras VMs.
4.3. Experiento #3 teste de estresse
Antes de realizar o quarto experimento, executamos um teste de estresse com a
combinao Faban/Sample Web em uma VM de 512 MB de memria sem efetuar
qualquer migrao. O objetivo desse teste detectar o limite mximo de usurios
simultneos atendidos pela aplicao sem comprometer o SLA (Service Level
Agreement). A carga de trabalho foi submetida aplicao web e aumentamos
gradualmente o nmero de usurios simultneos entre as execues, em incrementos de
100 usurios (vide Figura 4). O tempo total de execuo do benchmark para cada grupo
de usurios configurado atravs do ajuste de 3 parmetros distintos: ramp-up, steady
state e ramp-down. Os valores ilustrados nas figuras levam em considerao apenas o
steady state (regime permanente), configurado para durar 10 minutos. O tempo de
resposta de 250 ms atende o SLA previamente definido no Sample Web para a ao do
usurio de carregar sua homepage. Caso esse tempo seja superior a 250 ms,
caracterizada a quebra do SLA. Ao analisarmos os valores obtidos, descobrimos que
900 o nmero mximo de usurios simultneos que podem ser servidos pelo nosso
ambiente de experimentao sem a quebra do SLA (Figura 4).
242 Anais
4.4. E
O qu
nica
desse
das r
a mi
estre
900
algum
usur
cuja
migr
respo
cresc
redu
de 23
Figura 4: E
simultneos
Experimen
uarto experi
a VM de 5
e teste ava
requisies
grao, a a
esse (vide F
usurios si
mas requisi
rios simult
durao fo
rao, i.e. e
osta da apli
cimento de 5
Figura 5:
carregamen
vazo de de
Na Figu
o no nm
3,8%. Depo
Experiment
s no tempo
nto #4
mento cons
12 MB (RA
aliar o impa
da aplica
aplicao fo
igura 4) ter
imultneos
es falham
neos. Nest
oi de 10 m
entre 250 s
icao, prov
55,7% no te
(a)
Experiment
nto de uma
emanda
ura 5(b), ob
mero de requ
ois do trmi
o #3 - imp
de resposta
sistiu na mig
AM) execut
acto da abor
o para ao
oi submetida
r mostrado
sem provo
m e esse nm
te experime
minutos. A
s e 350 s,
vocando a
empo de res
to #4 - im
homepage
bservamos q
uisies por
ino da migr
pacto da v
a do Sample
grao, util
tando o wor
rdagem pr-
o do usurio
a a 300 usu
que nosso a
car a queb
mero vai cr
ento, a mig
Figura 5(a
ocorre um
quebra do
sposta da ap
mpacto da
Sample We
que durante
r segundo.
rao (insta
variao do
e Web
izando a ab
rkload Faba
-cpia no te
o de carrega
urios simu
ambiente de
ra do SLA
rescendo com
grao ocor
a) ilustra q
m increment
SLA. Esse
plicao.
pr-cpia
eb (a) no tem
e o process
A reduo
ante 350 s),
o nmero d
bordagem pr
an/Sample
empo de res
ar uma hom
ultneos. Ap
e experimen
A, a partir d
m o aumen
rreu durante
que, durante
to substanc
e increment
(b)
para a ap
mpo de res
so de migra
na vazo d
percebemo
de usurios
r-cpia, de
Web. O obj
sposta e na v
mepage. Du
pesar do tes
ntao com
de 300 usu
nto do nme
e o steady
e o process
ial no temp
o represent
plicao de
posta (b) na
ao ocorre
de requisie
os que exist
s
e uma
jetivo
vazo
urante
ste de
mporta
urios,
ero de
state,
so de
po de
ta um
e
a
e uma
es foi
te um
XXIX Simpsio Brasileiro de Redes de Computadores e Sistemas Distribudos 243
aume
segun
justif
hosp
de or
4.5. E
O qu
Benc
Samp
avali
mxi
resul
valor
utiliz
Figur
proce
no ho
servi
expe
decre
aprox
que a
Web.
proce
respe
stop-
obser
O m
resul
migr
ento na vaz
ndo. Essa t
ficado pela
edeiro de d
rigem.
Experimen
uinto experim
chmark (AB
ple Web. O
iar o impac
imo de requ
ltados colet
res de temp
zando a pr-
ra 6(a), ob
esso de mig
ospedeiro d
ir todas a
rimentado
emento dur
ximadamen
a abordagem
. Isso se dev
esso de mig
Figura 6: Ex
carregar um
demanda
As Figu
ectivamente
-and-copy. O
rvamos que
mesmo com
ltados se de
rao, causa
zo das requ
axa maior
a heteroge
destino poss
nto #5
mento cons
B) para gera
O experimen
to da pr-c
uisies qu
tados a part
o de respos
-cpia. O pr
bservamos
grao. O p
de destino, e
as requisi
pela aplica
rante o pr
nte 69% da
m pr-cpia
ve diviso
grao, recu
(a)
xperimento
ma homepag
uras 7(a) e
e, coletados
O processo
e o tempo de
mportamento
evem ao fa
ando indisp
uisies, ch
r que o valo
eneidade do
sui um hard
sistiu na mig
ar as requis
nto teve dur
pia e da s
e a mquin
tir desse ex
sta e vazo,
rocesso de m
que o temp
pico mais al
e sua dura
es que
ao. Na F
rocesso de
taxa de req
a impacta ne
o dos recurs
ursos esses a
#5 - impac
ge Sample W
7(b) aprese
durante o
de migra
e resposta d
o pode ser
ato da execu
ponibilidade
hegando a al
or encontra
o ambiente
dware com
grao de u
sies dispa
rao de 40
stop-and-cop
na fsica con
xperimento.
respectivam
migrao ac
po de resp
lto ocorre im
o correspon
haviam si
Figura 6(b),
migrao,
quisies p
egativament
sos de rede
anteriormen
to da abord
Web (a) no t
entam os v
experiment
o acontece
durante todo
observado
uo da VM
e do servi
lcanar a ta
ado antes da
e de expe
desempenh
uma nica V
aradas contr
00 segundos
py no temp
nsegue sup
As Figuras
mente, colet
conteceu en
posta sofre
mediatamen
nde ao temp
ido iniciad
, observam
correspon
or segundo
te no desem
e processa
nte destinado
dagem de m
tempo de re
alores de t
to utilizando
eu entre 185
o o processo
com a va
M ser suspe
o, o que to
axa de 3105
a migrao.
erimentao
ho melhor q
VM de 512 M
ra a homepa
s. Seu objet
po de respo
ortar. A Fig
s 6(a) e 6(b
tados durant
ntre 168 e 2
um increm
nte aps a e
po necessri
das durant
mos que a
dendo a u
o. Esses resu
mpenho da a
amento entre
os apenas
(b)
migrao pr
esposta (b)
empo de re
o a abordag
5 s e 233 s.
o de migra
azo na Fig
ensa durant
orna esse ti
5 requisie
Esse aume
o, visto qu
que o hospe
MB com Ap
age da aplic
tivo consist
sta e no n
gura 6 ilust
b) apresenta
te o experim
42 segundo
mento duran
execuo da
io para o sis
te o down
vazo sofre
uma redu
ultados mo
aplicao Sa
e a aplica
aplicao.
-cpia para
na vazo de
esposta e v
gem de mig
. Na Figura
o cai para
gura 7(b).
te o proces
ipo de mig
es por
ento
ue o
edeiro
pache
cao
te em
mero
tra os
am os
mento
os. Na
nte o
a VM
stema
ntime
e um
o de
stram
ample
o e o
a
e
vazo,
grao
a 7(a),
zero.
Esses
so de
grao
244 Anais
inapr
aplic
4.6. E
O sex
512
subm
o ste
avali
aplic
demo
Figur
trmi
prov
de re
pico
corre
cpia
rema
imed
corre
sido
mais
Olio
de se
[Clar
em [
sistem
refor
comp
s o n
alcan
ropriada pa
caes de tem
Figura 7: E
para carreg
vazo de de
Experimen
xto experim
MB execu
metida a 150
eady state q
iar o impac
cao para a
ore mais qu
ra 8(a) ilus
ino da migr
ocando a qu
Na Figur
esposta da a
mais alto
esponde ao
a, na qual
anescentes e
diatamente
esponde ao
iniciadas d
um resulta
servindo a
egundo, pre
rk et al 200
Voorsluys e
ma e o mes
rando os
portamento
nmero de re
nando um v
ara aplica
mpo real.
(a)
xperimento
gar uma ho
emanda
nto #6
mento consis
utando o w
0 usurios s
que foi con
cto da pr-c
ao do usu
ue a 1 s para
stra o proce
rao (~ 428
uebra de SL
ra 8(b) (zoo
aplicao ch
nos tempo
downtime s
a execuo
e o estado d
aps a ex
tempo nece
durante o d
ado interessa
150 usurio
eviamente r
05] [Oliveir
et al 2009]
smo downti
resultados
semelhante
equisies p
valor de 12
es com r
#5 - Impac
omepage Sa
stiu na migr
workload Fa
simultneos
nfigurado p
cpia no te
urio de ca
a reagir a
esso de mig
8 s), observ
LA.
om da Figur
hega a zero
os de respo
sofrido pela
o da VM
da CPU para
ecuo da
essrio para
downtime ex
ante. O tem
os simultn
relatados na
ra 2010]. E
para avalia
ime e comp
alcanados
e da vazo e
por segundo
1 requisie
gidas restri
cto da abord
ample Web
rao, utiliz
aban/Olio.
s. Nesse exp
ara durar 1
empo de re
arregar uma
o do usur
grao (inte
vamos um p
a 8(a)), obs
o e permane
osta obse
aplicao d
suspensa
a o hospede
VM no h
a o sistema
xperimentad
mpo de inati
neos bem a
a literatura
Entretanto, a
ar o impacto
portamento
s nesse trab
em relao
o chega a ze
es/s.
ies de te
dagem de m
(a) no tem
zando a pr-
Durante a
perimento,
10 minutos.
esposta e na
a homepage
rio, caract
ervalo 293
pico em seu
ervamos no
ece durante
ervado. Es
durante o pr
a para copi
iro de desti
hospedeiro
servir todas
do pela apl
vidade expe
acima do n
para uma
a combina
o da live m
do tempo
balho. Na
ao tempo d
ero e, em se
empo, como
(b)
migrao sto
mpo de resp
-cpia, de um
migrao,
a migrao
O objetivo
a vazo da
e do Olio. C
erizada a qu
s a 429 s).
tempo de r
o instante 42
3 segundos
se perodo
rocesso de m
ar as pgin
no. O pico
de destino
s as requisi
licao. Aq
erimentado
vel esperad
srie de ca
o Olio/Fab
igration no
de resposta
Figura 8(c
de resposta.
eguida, um p
o, por exem
op-and-copy
posta (b) na
ma nica V
a aplica
ocorreu du
o desse test
s requisi
Caso a aplic
uebra do SL
Pouco ant
resposta pr
25 s que o t
s. Em segui
de 3 segu
migrao da
nas de mem
mais alto o
o e sua du
es que ha
qui vale res
pelo bench
do em mils
argas conhe
ban foi util
o desempenh
a foi encont
c), notamo
No instant
pico obser
mplo,
y
a
VM de
o foi
urante
te foi
es da
cao
LA. A
es do
ximo
empo
ida, o
undos
a pr-
mria
ocorre
urao
aviam
ssaltar
hmark
simos
ecidas
lizada
ho do
trado,
s um
e 425
rvado
XXIX Simpsio Brasileiro de Redes de Computadores e Sistemas Distribudos 245
4. C
Nest
dinm
utiliz
copy
veze
VMs
inace
pelas
valor
na lit
comb
migr
comp
alcan
das a
Figura 8: E
carregamen
resposta (zo
oncluso
e trabalho,
mica de m
zadas na lit
y e pr-cpia
Alm do
s maior que
s. Portanto,
eitveis, co
s VMs. Ape
r bem aci
teratura par
binao Oli
ration no de
portamento
nados neste
Notamos
aplicaes,
(a)
Experimento
nto de hom
oom destac
desenvolve
quinas vir
teratura e d
a.
o downtime
e o da pr-
para VMs
mprometen
esar no dow
ma do nve
ra uma srie
io/Faban foi
esempenho
do tempo
e trabalho.
s ainda que
caracterizan
o #6 - impac
mepage Olio
cando o dow
emos um am
rtuais atrav
disponibiliza
e apresentad
-cpia, ele v
com mem
ndo a capac
wntime na pr
el esperado
e de cargas
i utilizada e
do sistema
o de respo
e a pr-cpi
ndo quebra
(c)
cto da abor
o (a) no tem
wntime); (c)
mbiente com
s de duas
adas, por p
do pela stop
varia de ac
ria muito g
cidade de r
r-cpia ser
em milsim
s [Clark et a
em outros tr
a [Voorsluy
osta foi e
ia provocou
a de SLA pa
rdagem de m
mpo de resp
na vazo de
mputacional
abordagens
adro, pelo
p-and-copy
cordo com o
grande o dow
resposta do
r bem inferi
mos de segu
al 2005] [O
rabalhos pa
ys et al 200
ncontrado,
u um increm
ara os work
(b)
migrao p
posta (b) n
e demanda
l virtualizad
s de migra
o hipervisor
ter sido pe
o tamanho
wntime pod
os servios
ior ao da sto
undo, previa
Oliveira 201
ara avaliar o
09] e o mes
reforando
mento no te
kloads Faba
r-cpia em
o tempo de
do para aloc
o amplam
r Xen: stop
elo menos
de memri
de atingir va
disponibiliz
op-and-copy
amente rela
0]. Entretan
o impacto d
smo downti
o os resul
mpo de res
an/SampleW
m
e
cao
mente
p-and-
cinco
ia das
alores
zados
y, seu
atados
nto, a
da live
ime e
ltados
sposta
Web e
246 Anais
Faban/Olio, enquanto a stop-and-copy causou indisponibilidade dos servios. Vale a
pena ressaltar que a pr-cpia impacta negativamente no desempenho das aplicaes
Sample Web, visto que o processo de migrao consome recursos de rede e
processamento destinados aplicao, resultando em um incremento no tempo de
resposta e uma reduo de 69% da vazo das requisies durante o processo de
migrao, enquanto a stop-and-copy provoca queda de 100% no tempo de resposta e na
vazo da aplicao, causando indisponibilidade do servio, o que torna essa abordagem
inapropriada para aplicaes com rgidas restries de tempo, como, por exemplo,
aplicaes de tempo real.
Dentre as perspectivas de trabalhos futuros, pretendemos realizar experimentos
com novas configuraes de hardware (memria e CPU) e utilizar a tcnica Dynamic
Self-Ballooning (DSB) para reduzir o nmero de pginas livres transferidas durante a
migrao e, assim, melhorar o desempenho da pr-cpia e ps-cpia [Hines 2009].
Alm disso, planejamos utilizar a abordagem de migrao ps-cpia na avaliao, que
tem como objetivo a reduo do tempo de realocao das VMs durante o processo de
migrao em comparao com as abordagens stop-and-copy e pr-copia.
Referncias
Barham, P., Dragovic, B., Fraser, K., Hand, S., Harris, T., Ho, A., Neugebauer, R.,
Pratt, I., and Warfield, A. (2003) Xen and the art of virtualization. In SOSP '03:
Proceedings of the 19th ACM Symposium on Operating Systems Principles, pages
164-177, New York, NY, USA. ACM.
Clark, C., Fraser, K., Hand, S., Hansen, J.G., Jul, E., Limpach, C., Pratt, I., and
Warfield, A. (2005) Live migration of virtual machines. In NSDI'05: Proceedings
of the 2nd Conference on Symposium on Networked Systems Design &
Implementation, pages 273-286, Berkeley, CA, USA. USENIX Association.
Cully B., Lefebvre G., Meyer D. T., Karollil A., Feeley M. J., Hutchinson N. C., and
Warfield A. (2008) Remus: High Availability via Asynchronous Virtual Machine
Replication. In NSDI08: Proceedings of 5th Symposium on Networked Systems
Design and Implementation, San Francisco, CA, USA.
Dunlap G. W., S. King T., Cinar S., Basrai M., and Chen P. M. (2002) ReVirt:
Enabling Intrusion Analysis through Virtual-Machine Logging and Replay. In
OSDI02: Proceedings of the 5th Symposium on Operating Systems Design and
Implementation, pages 211-224, Boston, MA,USA. ACM Press.
Faban (2010). Faban Harness and Benchmark Framework. Disponvel em:
http://java.net/projects/faban/
Hines, M. R. and Gopalan, K. (2009) Post-copy based live virtual machine migration
using adaptive pre-paging and dynamic self-ballooning. In Proceedings of the 2009
ACM SIGPLAN/SIGOPS International Conference on Virtual Execution
Environments, Washington, DC, USA.
Hirofuchi, T., Nakada, H., Itoh, S., and Sekiguchi, S. (2010) Enabling Instantaneous
Relocation of Virtual Machines with a Lightweight VMM Extension. In
Proceedings of the 2010 10th IEEE/ACM international Conference on Cluster,
Cloud and Grid Computing, pages 73-83, Washington, DC.
Liu, H., Jin, H., Liao, X., Hu, L., and Yu, C. (2009). Live migration of virtual machine
based on full system trace and replay. In HPDC '09: Proceedings of the 18th ACM
XXIX Simpsio Brasileiro de Redes de Computadores e Sistemas Distribudos 247
international Symposium on High Performance Distributed Computing, pages 101-
110, Garching, Germany.ACM.
Netperf Homepage (2010). Disponvel em: http://www.netperf.org/netperf/. Acesso:
Novembro de 2010.
Olio (2010). Olio Index. Disponvel em: http://incubator.apache.org/olio
Oliveira, C., Petrucci, V., and Loques, O. (2010) Impact of server dynamic allocation
on the response time for energy-efficient virtualized web clusters. In: XXVIII
Simpsio Brasileiro de Redes de Computadores e Sistemas Distribudos - 12th
Brazillian Workshop on Real-Time and Embedded Systems (WTR), Gramado, RS.
OpenXenManager (2010). Disponvel em: http://www.openxenmanager.com/. Acesso:
Outubro de 2010.
Osman, S., Subhraveti, D., Su, G., and Nieh, J. (2002) The design and implementation
of Zap: A system for migrating computing environments. In OSDI02:Proceedings
of the 5th Symposium on Operating Systems Design and Implementation, pages 361
376.
Schmidt, B. K. (2000) Supporting Ubiquitous Computing with Stateless Consoles and
Computation Caches. PhD thesis, Computer Science Dept., Stanford University.
Sobel, W., Subramanyam, S., Sucharitakul, A., Nguyen, J., Wong, H., Patil, S., Fox, A.,
and Patterson, D. (2008) Cloudstone: Multi-platform, multi-language benchmark
and measurement tools for web 2.0. In CCA08: Proceedings of the 1st Workshop
on Cloud Computing.
The Apache Software Foundation (2010). Apache HTTP server version 2.2. Disponvel
em: http://httpd.apache.org/docs/2.2/
The SampleWeb Application (2010). Creating your first Workload in Faban. Disponvel
em: http://testnscale.com/docs/CreatingWorkloadTutorial.html
Voorsluys, W., Broberg, J., Venugopal, S., and Buyya, R. (2009) Cost of Virtual
Machine Live Migration in Clouds: A Performance Evaluation. In Proceedings of
the 1st international Conference on Cloud Computing, pages 254-265. Lecture Notes
In Computer Science, vol. 5931. Springer-Verlag, Berlin, Heidelberg. DOI=
http://dx.doi.org/10.1007/978-3-642-10665-1_23.
Wood, T., Shenoy, P., Venkataramani, A., and Yousif, M. (2009) Sandpiper: Black-
box and gray-box resource management for virtual machines. In Comput. Netw,
pages 2923-2938. DOI= http://dx.doi.org/10.1016/j.comnet.2009.04.014.
Xen (2010). Xen Cloud Platform - Advanced Virtualization Infrastructure for the
Clouds. Disponvel em: http://www.xen.org/products/cloudxen.html. Acesso:
Outubro de 2010.
Xen (2010). What is Xen?. Disponvel em: http://www.xen.org/. Acesso: Outubro de
2010.
Xu M., Malyugin, V., Sheldon, J., Venkitachalam, G., and Weissman, B. (2007)
ReTrace: Collecting Execution Trace with Virtual Machine Deterministic Replay.
In MoBS07: Proceedings of the Third Annual Workshop on Modeling,
Benchmarking and Simulation.
248 Anais

Você também pode gostar