Escolar Documentos
Profissional Documentos
Cultura Documentos
experiments on federated
sites using BonFIRE
Grupo:
O Problema:
A falha dos sites na Cloud e a variabilidade da performance das
mquinas virtuais (VMs) neste ambiente.
Exemplo:
No vero de 2012, dois dos maiores fornecedores de servios
cloud sofreram interrupes no servio em algumas reas.
Como consequncia, servios dos seus clientes estiveram total
ou parcialmente parados.
1. Introduo
Tem-se observado uma variao na performance na Amazon
EC2, mesmo em dois nveis diferentes de performance para a
mesma configurao da mesma infraestrutura virtual mas
medidas em alturas diferentes.
1. Introduo (cont.)
Neste caso, para manter a qualidade do servio, uma possvel
estratgia explorar a elasticidade da Cloud para se auto adaptar
a esta variabilidade indesejada.
Significa isto usar um Indicador Chave da performance da
Aplicao (KAI) para activar o alargamento da infraestrutura virtual
que o suporta quando necessrio ou para o reduzir quando em
repouso, para evitar custos desnecessrios.
1. Introduo (cont.)
Para verificar o desenho desta arquitetura, esta foi testada em
trs experincias:
1. Introduo (cont.)
E um teste de Tolerncia a Falhas onde se simula a perda de
uma parte do cluster virtual, restaurando a performance da
aplicao no Site da Cloud sobrevivente, usando mecanismos
de recuperao e regras de elasticidade, sem interrupo do
servio.
2. Materiais e mtodos
[2.1] Arquitectura de Cluster Virtual
A Arquitetura de Cluster
Virtual (VC) contempla:
dois nodos principais
("Master" e "Shadow")
Controlador da queue
Gestor de aplicaes
E configurao do Cluster
Execuo de trabalhos.
Para
Este
Etapa 1
Leitura dos ficheiros de input.
Etapa 2
Execuo de um elevado nmero de simulaes que podem correr em
paralelo (individualmente pequenas).
So
de calendarizao.
Etapa 3
Execuo no Master Node.
Adquire os dados de output da simulao do acelerador e cria novos
ficheiros de input para a simulao de paciente que sero utilizados pela
aplicao DOSXYZnrc.
Etapa 4
Novamente cada tarefa copia os ficheiros de input para o disco local e
depois armazena os ficheiros de output no volume partilhado.
Etapa 5
Todos os ficheiros de output so ps-processados no Master Node.
So unidos num ficheiro de dosagem nico (na ordem das dezenas de
MB), terminando o processo de verificao.
Isto
Exemplo
Utilizando o sistema de Tomografia por computador que distribudo
pelo Hospital da Universidade de Wrzburg, foi definida a execuo da
verificao de tratamentos.
LINK:
http://www.daten.strahlentherapie.uni-wuerzburg.de/quasimodo.html
[3.0] Experincias/Testes
Foram
- Distribuio Multi-site;
- Caso com um objetivo especfico definido (deadline);
- Sistema de Tolerncia a Falhas;
Parmetros
ELASTICITY_PERIOD
DEPLOYMENT_PERIOD
UNDEPLOYMENT_PERIOD
LOW_PERFORMANCE_INTERVAL
MAX_CORES
MARGIN
[3.5] Resultados
A
Tordsson
Montero
Omer
Yang
Niehorster
[5.0] Concluses
Esta arquitetura pode ser implementada de vrios modos diferentes
utilizando plataformas cloud laaS single site ou multi site:
- single site;
- distributed sites;
- single sites e distributed sites tolerantes a falhas;
[5.0] Concluses
Foi demonstrado que a performance da aplicao pode ser utilizada
para tomar decises de elasticidade, resultando no aumento do VC por
forma a atingir o deadline, apesar ser necessria alguma metodologia
para calibrar os vrios parmetros.