Você está na página 1de 4

1

PÓS GRADUAÇÃO EM BIG DATA – FMU

PROCESSAMENTO MASSIVO DE DADOS

RESOLUÇÃO CASE (N1)

SÃO PAULO

2021

FMU

RESOLUÇÃO CASE (N1)

Trabalho referente a solução do case N1


2

SÃO PAULO

2021

FMU

CASE
3

A empresa Expertise PMD trabalha com soluções em tecnologia e tem o objetivo de


aprimorar seus serviços de gerência e uso de recursos em clusters, oferecendo aos
seus clientes orientações na tomada de decisão em diferentes áreas.

Sendo você consultor de uma empresa de tecnologia, como empregaria a gerência e


o uso de recursos em clusters para orientar empresas na tomada de decisões?

Assim, para o desenvolvimento da questão, é importante que você:

 analise os dados que possam construir modelos que resultem em


informações que orientem as corporações a definir as ações;
 avalie as plataformas de processamento orientadas aos dados.

SOLUÇÃO

A partir da análise dos dados da empresa, poderemos refinar os tipos de dados


existentes, mapeando suas similaridades, a fim de agregar valor e eficiência aos
dados armazenados.

O objetivo do agrupamento trará alguns benefícios no consumo dos dados e um


processamento eficiente.

Para o processamento dos dados, recomendo o processamento Distribuído, por ser


menos complexo em sua implementação e não ter conflitos de códigos de falhas de
programação, com o processamento Distribuído teremos força computacional por
meio de diferentes máquinas interligadas na rede e com softwares que possibilitam o
compartilhamento de informações. A utilização dos clusters será essencial para o
levantamento das informações de acordo com a demanda dos clientes, pois será
possível o tratamento de várias segmentações ao mesmo tempo.

Outro ponto relevante na escolha é que o custo para se implementar e manter é


inferior aos gastos com computadores mainframe. E a arquitetura possibilita
crescimentos de acordo com a necessidade da empresa.

Para suporte Data Science, sugiro a plataforma de processamento orientada a


dados Anaconda. A mesma é definida como uma distribuição das
4

linguagens Python e R, na qual é a mais comum em ambientes de data Science e


Machine Learning. Essa plataforma além de ser considerada uma plataforma de
desenvolvimento, sua instalação possibilita uma interface web permitindo o uso de
aplicações nativas e maior integração.

Com essa proposta a empresa terá uma plataforma de processamento de dados


para ampliar sua qualidade na toma de decisões, tornando melhores seus processos
internos, uma plataforma com escalabilidade, análise do comportamento de diversas
dimensões de informações, sejam elas de seu clientes, produtos ou serviços

Você também pode gostar