Você está na página 1de 10

ULT

Universidade Latino-americana de Tecnologia


Marcos Fernando Dotta
mfdotta@hotmail.com
Gestão com ERP SAP, Tópicos Avançados I - Tecnologia.

SAP HANA

RESUMO

SAP HANA é uma plataforma de dados in-memory, executada em CPUs multi-core e


contém terabytes de memória permitindo que todos os dados estejam disponíveis na
memória principal e as operações de backup realizadas em segundo plano e possui
como característica o armazenamento em colunas (column-oriented), permitindo
uma alta compressão e em localizações de memória adjacentes eliminando a
necessidade de estruturas adicionais de índices possibilitando leituras com altíssimo
desempenho, ou seja, a análise de grandes volumes de dados pode ser feita em
tempo real com o maior nível de detalhes possível, além da redução ou eliminação
de agregações e mapeamento de dados, bem como operações de ETL (Extração,
Transformação e Carga) necessárias em Data Warehouses e Data Marts. Foi
desenhada para realizar seus cálculos básicos, como joins analíticos, scans e
agregações em paralelo usando múltiplos núcleos (otimização pré-configurada para
processadores de 64 bits com vários núcleos). Além disso, em relação à
implantação, existem diferentes alternativas disponíveis de uma infraestrutura
HANA, sendo elas: on-premise, cloud e híbrida.

Palavras-Chaves: SAP HANA. In-memory. Column-oriented. Multi-Core.


INTRODUÇÃO

SAP HANA é uma plataforma de dados in-memory, possui um Sistema de


Gerenciamento de Banco de Dados Relacional (SGDBR) e como característica o
armazenamento em colunas. É pré-configurada para processadores de 64 bits com
vários núcleos (CPUs multi-core) e contém terabytes de memória principal. Todos os
dados estão disponíveis na memória principal e não há gravação e leitura em disco,
pois operações de backup são efetuadas em segundo plano para não afetar o
desempenho. No entanto, ainda há a necessidade de discos ou drives para a
persistência permanente dos dados no caso de incidentes.

Com compactações in-memory avançadas, os dados gerenciados pelo SAP


HANA são otimizados para processamento, e não para entrada e saída de
disco. Os dados são compactados e armazenados em cache local,
acelerando significativamente o acesso e transformando a agregação
materializada, a indexação e a duplicação em itens ultrapassados. (SAP,
2014 p. 4).

A arquitetura de HANA é projetada para lidar com dados transacionais (OLTP)


e processamento de consultas complexas (OLAP) sobre a mesma plataforma, de
forma simplificada, permitindo ao cliente analisar grandes volumes de dados de
praticamente qualquer fonte, em tempo real.

“Menos camadas, estrutura mais simples, custos mais baixos.” (SAP, 2012 p.
10)

Ela permite a utilização de todas as capacidades de hardware aumentando o


desempenho da aplicação reduzindo o Custo Total de Propriedade (TCO) e
permitindo a criação de novos cenários e aplicações que antes não eram possíveis.

Em termos de custo total de propriedade (TCO), o maior gerador de custos


está nas operações e no gerenciamento de aplicativos. Ambientes
baseados na plataforma SAP HANA não precisam manter sistemas
separados para dar suporte ao processamento de transações on-line
(OLTP) e ao processamento analítico de funções on-line (OLAP). Ao
oferecer a possibilidade de fusão dessas funções e fazer com que você
gerencie dados espaciais e não estruturados, o SAP HANA reduz o custo
total de propriedade ao colocar o poder de consolidação do ambiente em
suas mãos. (SAP, 2014 p. 6).
É possível criar aplicações que integram o controle lógico de negócios e com
desempenho na camada de banco de dados. Quanto mais os dados forem
direcionados para a CPU melhor a aplicação será executada.

O SAP HANA facilita o processo de simplificação das arquiteturas de TI


complexas e de alto custo. Por ser uma plataforma de computação in-
memory, ela permite o processamento de grandes volumes de dados, em
tempo real, para que você possa disponibilizar informações a velocidades
sem precedentes. (SAP, 2014 p. 3).

A plataforma HANA evoluiu para o paradigma code-to-data na qual a lógica


da aplicação é empurrada do servidor de aplicação para o servidor de banco de
dados sendo executada exatamente onde os dados estão e, com isso, eliminando o
transporte entre as duas camadas permitindo a implementação de novas aplicações.
E como base, a plataforma HANA fornece um ambiente de múltiplas linguagens e
um rico conjunto de bibliotecas de aplicações e serviços.

ARMAZENAMENTO DE DADOS EM COLUNA

Uma tabela de banco de dados é conceitualmente uma estrutura de dados


bidimensional organizada em linhas e colunas criando uma sequência de registros.
E a plataforma HANA suporta ambos os tipos de armazenamento, ou seja, em linhas
ou colunas, sendo particularmente otimizada através do armazenamento em
colunas, pois permite uma compressão altamente eficiente, já que uma coluna é
armazenada em localizações de memória adjacentes e, quando ordenada, os
valores repetem-se.

Existem métodos altamente eficientes de compressão de dados, são eles:


run-length encoding, cluster encoding e dictionary coding. Através do dictionary
coding, as colunas são armazenadas como sequências de inteiros bit-coded. E uma
checagem por igualdade pode ser executada em inteiros, por exemplo, durante
operações de scans ou join, sendo muito mais rápido do que comparações por
valores de strings.

Agora e no futuro, a velocidade é fundamental para a adaptação a um


ambiente de negócios em constante mudança. A velocidade permitida pelo
SAP HANA é rápida e significativa, com potencial para transformar todos os
modelos de negócios. (SAP, 2012 p.3).

O armazenamento em colunas, em muitos casos, elimina a necessidade de


estruturas adicionais de índices, pois a funcionalidade é similar à criação de índices
para cada coluna, reduzindo a complexidade e eliminando o esforço de definição e
manutenção de metadados. A operação de scan e os mecanismos de compressão
permitem leituras com altíssimo desempenho.

PROCESSAMENTO PARALELO

A plataforma SAP HANA foi desenhada para realizar seus cálculos básicos,
como joins analíticos, scans e agregações em paralelo, pois o armazenamento
baseado em coluna permite a execução de operações em paralelo usando múltiplos
núcleos. Os dados já são verticalmente particionados permitindo que operações em
diferentes colunas possam ser facilmente processadas em paralelo. Se múltiplas
colunas necessitam ser selecionadas ou agregadas, cada uma dessas operações
pode ser atribuída para um diferente núcleo do processador. Operações em uma
coluna podem ser paralelas através da partição da coluna em múltiplas seções que
podem ser processadas em diferentes núcleos.

Com o armazenamento em colunas, as operações como busca e agregações


podem ser implementadas como loops sobre uma matriz armazenada em locais de
memória contíguos. Como uma operação que tem localização espacial e pode ser
eficientemente executada no cache da CPU. Já com o armazenamento orientado a
linha, a mesma operação seria mais lenta, pois a mesma coluna está distribuída
através da memória.

Dados compressos podem ser carregados rapidamente para o cache da CPU.


Porque o fator de limitação é o transporte de dados entre a memória e o cache da
CPU e o desempenho excede o tempo adicional de processamento para a
descompressão.
APLICAÇÕES SIMPLIFICADAS

Aplicações tradicionais de negócios frequentemente usam agregações para


aumentar o desempenho, sendo processadas e armazenadas ou depois de cada
operação de gravação ou em tempos escalonados. As operações de leitura leem as
agregações ao invés de computa-las toda vez que são requisitadas.

Com a velocidade de scan de muitos gigabytes por milissegundos, é possível


calcular agregações em grandes quantidades de dados em tempo real com alto
desempenho, simplificando modelos de dados e a lógica de aplicação
correspondente.

ARQUITETURA DO BANCO DE DADOS SAP HANA

Um sistema SAP HANA em execução consiste de múltiplos processos


(serviços) de comunicação, sendo o seu principal componente de gerenciamento de
banco de dados o index server, que contém os armazenamentos de dados atuais e
os engines para processamento dos dados.

O banco de dados SAP HANA tem sua própria linguagem chamada


SQLScript que incorpora a lógica intensiva da aplicação dentro do banco de dados e
é baseada em funções livres de efeitos colaterais que operam em tabelas usando
consultas SQL para processamento conjunto, e é paralelizável através de múltiplos
processadores. E, em adição ao SQLScript, suporta um framework para a instalação
de bibliotecas funcionais especializadas e otimizadas que são fortemente integradas
com diferentes engines de dados, o index server. Duas dessas bibliotecas funcionais
são a Business Function Library (BFL) e a Predictive Analytics Library (PAL). Elas
possuem funções que podem ser chamadas diretamente de dentro do SQLScript.

O SAP HANA também conta com bibliotecas compartilhadas para tarefas


associadas à previsão e planejamento de negócios. Você pode reduzir ou
descartar bancos de dados e aplicativos separados para executar essas
funções a uma velocidade extremamente rápida. Simplifique sua
infraestrutura de aplicativos e conquiste o data center otimizado e integrado
do futuro. (SAP, 2014 p. 6).
SQL e SQLScript são implementadas usando uma infraestrutura comum de
funções que têm acesso a várias meta-definições, como definições de tabelas
relacionais, colunas, views e índices e definições de procedures SQLScript.

A camada de persistência do banco de dados é responsável pela durabilidade


e atomicidade de transações. Isso garante que o banco de dados pode ser
recuperado para o mais recente estado committed depois de uma reinicialização e
que transações são ou completamente executada ou completamente desfeitas.

O index server usa o servidor pré-processador para análise de dados em


texto e extração da informação em que o as capacidades de busca em texto são
baseadas. O nome do servidor possui a informação sobre a topologia do sistema
SAP HANA. Em um sistema distribuído, o nome do servidor conhece onde os
componentes estão rodando e quais dados estão localizados em qual servidor.

CONFIGURAÇÃO SIMPLIFICADA

O SAP HANA, possibilita diversas opções de implantação que permitem


simplificar a instalação. Pode-se combinar o software SAP HANA pré-configurado
com o hardware fornecido por parceiros. A implementação é rápida e há suporte da
SAP. Há a opção de optar pelo conceito de integração personalizada do data center
para SAP HANA. Os componentes são certificados e se alinham aos padrões do
data center fornecendo a flexibilidade para usufruir do armazenamento já existente e
a infraestrutura de rede e minimizando os custos. Além disso, existe o serviço SAP
HANA Enterprise Cloud. Um serviço de nuvem gerenciável, pode-se implementar,
manter, integrar e ampliar aplicativos em um ambiente de nuvem privada.

ALTERNATIVAS DE IMPLANTAÇÃO

“Para fornecer efetivamente os cenários de HANA, é fundamental conhecer


as diferentes alternativas disponíveis na implantação de uma infraestrutura HANA.”
(SAP, 2015 p.17).
On-premise: Implantação clássica da infraestrutura HANA, localmente, em
um data center da empresa.

Cloud: Há a possibilidade de implantar o HANA como uma solução baseada


em nuvem com diversas opções que precisam ser consideradas para casos de uso
diferentes.

Acessar uma das mais avançadas plataformas de computação em nuvem


do mundo.

Rápido

Concentrar as informações em uma única plataforma elimina latência –


possibilitando colaboração, processamento e planejamento em tempo real.

Escalável

Um serviço de computação em nuvem altamente robusto permite a rápida


implementação de aplicativos atuais e de próxima geração, ampliados de
acordo com as necessidades de seu negócio.

Seguro

Nós garantimos a segurança de seus dados em toda a solução de


computação em nuvem, mediante padrões de segurança de dados e de
governança, auditados de modo independente.

(SAP, 2012 p. 10)

Híbrida: As implantações híbridas descrevem infraestruturas em que uma


parte é implantada on-premise e as outras partes na nuvem.

Finalmente, seja on-premise ou na nuvem, as soluções de rápida


implantação (RDS) devem fazer parte de qualquer processo de decisão de
implantação do SAP HANA do cliente. A SAP construiu várias soluções pré-
empacotadas em uma caixa destinadas aos casos de uso mais comuns.
(SAP, 2015 p. 8).

SEGURANÇA

SAP HANA suporta múltiplos banco de dados isolados em um único sistema


SAP HANA, Banco de Dados Multi-Inquilino (Multitenant database). Em geral, todas
as características relacionadas à segurança do banco de dados SAP HANA (como
Autenticação, Autorização, Encriptação e Auditoria) aplicam-se em sistemas que
suportam banco de dados inquilinos (tenant) da mesma forma dos que não
suportam.

Mais recentemente, o “objectivo da equipa era perceber se era possível


aceder a mais dados e outros servidores da empresa”, explicou Polyakov.
Assim, descobriu ser possível ter acesso a informações como passwords de
utilizador e a chaves de raiz de sistema, por estarem normalmente
guardadas com o mesmo código de encriptação em todas as plataformas de
Hana.

A situação beneficia potenciais hackers com um acesso relativamente fácil.


“A chave é a mesma para todas as instalações, até os gestores [de
sistemas a mudarem]”, admite Polyakov. Mas, após mais alguns testes de
penetração, descobriu que “ninguém estava realmente a alterar a chave”.
(Computerworld, 2015).

ALTA DISPONIBILIDADE

SAP HANA é completamente desenhado para alta disponibilidade (high


availability) através de um conjunto de técnicas, práticas de engenharia e princípios
de design suportando o objetivo de continuidade do negócio, pois suporta medidas
de recuperação de falhas, erros de software e desastres em um data center. Sendo
obtida através da eliminação de pontos únicos de falha e provê a habilidade de
operações com a mínima perda do negócio (resiliência a falha).

A recuperação de falha é o processo de recuperar e resumir operações


depois do sistema ter permanecido inoperante. Já a recuperação em caso de
desastres é o processo de recuperação de operações depois de ter permanecido
inoperante devido a falha prolongada em um data center ou localmente.
Preparações para desastres requerem backup de dados através de longas
distâncias podendo ser mais complexa e custosa. A redundância é a chave da
obtenção da alta disponibilidade. Tanto a redundância de hardware quanto a de rede
e de data center. Para isso o SAP HANA provê os seguintes níveis de defesa:

 Redundância de Hardware: múltiplas camadas de redundância


de hardware, software e componentes de rede provêm correção de memória,
switches e roteadores (altamente redundantes) e UPS (Ininterrupto Poder de
Fornecimento). Sistemas de armazenamento de disco que usam baterias
para garantir a gravação na possibilidade de falha e espelhamento para
permitir a recuperação automática de falhas em disco.
 Software: baseado no SUSE Linux Enterprise 11 para SAP inclui
pré-configurações de segurança, uma função de “cão-de-guarda” que,
automaticamente, reinicia os serviços configurados (index server, name
server, etc.) no caso de detecção de parada.
 Persistência: logs persistentes de transação, savepoints e
snapshots para o reinício do sistema de suporte e recuperação de falhas no
host, com mínima demora e sem perda de dados.
 Standby e Failover – Hosts separados e dedicados em standby
são usados para failover, em caso de falha do primário, hosts ativos.
Melhorando a disponibilidade ao reduzir significativamente o tempo de
recuperação de uma interrupção.

Hipóteses para pesquisa Referências


Benefícios

“A velocidade permitida pelo SAP HANA é rápida e SAP (2012);


significativa, com potencial para transformar todos os SAP (2014);
modelos de negócios.” SAP (2015).

“... permitindo ao cliente analisar grandes volumes de SAP (2012).


dados de praticamente qualquer fonte, em tempo real.”

“Há a possibilidade de implantar o HANA como uma SAP (2012);


solução baseada em nuvem com diversas opções que SAP (2014);
precisam ser consideradas para casos de uso SAP (2015).
diferentes.”
“Menos camadas, estrutura mais simples, custos mais SAP (2012)
baixos.”

Limite “A chave é a mesma para todas as instalações, até os Computerworld


gestores [de sistemas a mudarem]”, (2015).

Quadro 1 – Modelo de Análise


Elaborado por Marcos Fernando Dotta

BIBLIOGRAFIA
Computerworld. Revelada falha de segurança na SAP HANA. Disponível em:
<http://www.computerworld.com.pt/2015/06/19/revelada-falha-de-seguranca-na-sap-
hana/> Acesso em 01 de agosto de 2015.

SAP. Sua Jornada Rumo ao SAP HANA. 2015. Disponível em:


<http://www.sap.com/bin/sapcom/pt_br/downloadasset.2015-04-apr-17-10.your-sap-
hana-journey-brazilian-portuguese-pdf.html?isSubmittedAfterAuth=true> Acesso em
01 de agosto de 2015.

SAP. SAP HANA Developer Quick Start Guide. Disponível em:


<http://help.sap.com/hana/SAP_HANA_Developer_Quick_Start_Guide_en.pdf>
Acesso em 01 de agosto de 2015.

SAP. Simplificação da TI com a plataforma SAP HANA. 2014. Disponível em:


<http://www.sap.com/bin/sapcom/pt_br/downloadasset.2014-10-oct-31-14.7e910d16-
746c-4455-8065-5d72b0a541dc-pdf.html> Acesso em 01 de agosto de 2015.

SAP. TOP 10. 2012. Disponível em:


<http://www.g2tecnologia.com.br/Top10ReasonsSAPHANA.pdf> Acesso em 01 de
agosto de 2015.

Você também pode gostar