Escolar Documentos
Profissional Documentos
Cultura Documentos
de Dados
Unidade IV
Big Data, Ia E Cloud Computing
Diretor Executivo
DAVID LIRA STEPHEN BARROS
Gerente Editorial
CRISTIANE SILVEIRA CESAR DE OLIVEIRA
Projeto Gráfico
TIAGO DA ROCHA
Autoria
JÉSSICA LAISA DIAS DA SILVA
ALAN DE OLIVEIRA SANTANA
AUTORIA
Jéssica Laisa Dias da Silva
Olá, possuo graduação em Sistema da Informação pela Unifacisa
– Universidade de Ciências Sociais Aplicadas. Sou mestre em Sistema e
Computação pela UFRN-Universidade Federal de Rio Grande do Norte.
Atualmente sou doutoranda em Sistema e Computação pela UFRN-
Universidade Federal de Rio Grande do Norte e professora conteudista
elaborando cadernos.
OBJETIVO: DEFINIÇÃO:
para o início do houver necessidade
desenvolvimento de de se apresentar um
uma nova compe- novo conceito;
tência;
NOTA: IMPORTANTE:
quando forem as observações
necessários obser- escritas tiveram que
vações ou comple- ser priorizadas para
mentações para o você;
seu conhecimento;
EXPLICANDO VOCÊ SABIA?
MELHOR: curiosidades e
algo precisa ser indagações lúdicas
melhor explicado ou sobre o tema em
detalhado; estudo, se forem
necessárias;
SAIBA MAIS: REFLITA:
textos, referências se houver a neces-
bibliográficas e links sidade de chamar a
para aprofundamen- atenção sobre algo
to do seu conheci- a ser refletido ou dis-
mento; cutido sobre;
ACESSE: RESUMINDO:
se for preciso aces- quando for preciso
sar um ou mais sites se fazer um resumo
para fazer download, acumulativo das últi-
assistir vídeos, ler mas abordagens;
textos, ouvir podcast;
ATIVIDADES: TESTANDO:
quando alguma quando o desen-
atividade de au- volvimento de uma
toaprendizagem for competência for
aplicada; concluído e questões
forem explicadas;
SUMÁRIO
Técnicas de aprendizado de máquinas..............................................12
Aprendizagem supervisionada........................................................................... 17
Aprendizagem não-supervisionada............................................................... 17
Sistemas de recomendação................................................................................ 20
Agrupamento .................................................................................................................. 21
Bioinformática................................................................................................33
Aplicações da Bioinformática................................................................................................. 39
Tecnologia Blockchain..............................................................................................47
04
UNIDADE
10 Big Data e Ciência de Dados
INTRODUÇÃO
Nesta unidade vamos abordar sobre o aprendizado de máquina e
suas técnicas, bem como estas podem contribuir no processo de análise
de dados e tomada decisão.
OBJETIVOS
Olá. Seja muito bem-vinda (o). Nosso propósito é auxiliar você no
desenvolvimento das seguintes objetivos de aprendizagem até o término
desta etapa de estudos:
OBJETIVO:
REFLITA:
Matemática Métodos
Estáticas
Fundamental otimizados
Data Minig
Aprendizado
Redes Neurais
de Maquina
Processamento Método de
de sinal Visualização
Computação
Binformática Astronomia Financeira
social
SAIBA MAIS:
Fonte: Freepik
IMPORTANTE:
Aprendizagem supervisionada
Aprendizagem supervisionado são direcionadas quando se é
aplicada técnicas onde algoritmos indutores podem realizar inferências
através de exemplos rotulados, ou seja, cada exemplo observado é
descrito por um conjunto de atributos e pelo valor da classe, também
chamado de atributo meta, à qual, o exemplo pertence (RUSSELL;
NORVIG, 2003).
Aprendizagem não-supervisionada
Aprendizagem não-supervisionada se refere ao algoritmo indutor
não possuir a informação sobre a classe à qual pertence. O intuito na
aprendizagem não supervisionada é buscar similaridades ou diferenças
no conjunto de valores dos atributos dos exemplos que possibilitam a
elaboração de agrupamentos ou clusters.
Fonte: Freepik
Análise preditiva
Essa é uma das técnicas mais usadas nas aplicações de Big Data
para realizar previsão, uma vez que essa análise consiste no uso de dados
e técnicas de Aprendizado de Máquina para determinar a probabilidade
de futuros resultados com base nas informações adquiridas no passado.
Previsão de demanda
Uma boa previsão de demanda ajuda qualquer empresa a vender
mais nas épocas de pico, assim como a evitar prejuízos e desperdícios em
períodos de baixa.
Sistemas de recomendação
Essa técnica trabalha do seguinte modo: após ter os dados coletados
e analisados por meio da combinação das técnicas de Aprendizado de
Máquina e Big Data, é possível realizar recomendações a partir de um
conjunto de dados coletados.
Agrupamento
Outra técnica que pode podemos destacar é o Clustergram, utilizada
para visualizar análises de clusters (cluster analysis) ou agrupamentos,
onde se combina as técnicas de Aprendizado de Máquina e Big Data para
realizar análise de agrupamentos que fazem a classificação de objetos em
diversos grupos, cada um dos quais, contendo os objetos semelhantes
segundo alguma função de distância estatística.
RESUMINDO:
OBJETIVO:
Fonte: Pixabay
Big Data e Ciência de Dados 23
IMPORTANTE:
Modelo de Implantação
É importante descrever que o acesso e disponibilidade aos
ambientes de computação em nuvem, apresentam diferentes tipos de
modelos de implantação. Algumas exceções ou aberturas de acesso
dependem do tipo de informação e do nível de visão.
• Nuvem Privada:
• Nuvem Pública:
• Nuvem Comunidade:
• Nuvem Híbrida:
Modelos de Serviço
Outro aspecto importante para destacar na computação em
nuvem, são os modelos de serviços que ajudam a atender às demandas
de serviços conforme os padrões e características, assim, criou-se uma
série de modelos de serviço de Cloud. Os principais modelos segundo
Pedroso (2014) são:
26 Big Data e Ciência de Dados
Dessa forma, a nuvem permite ser uma opção mais viável para a
idealização de aplicações de gestão e análise de grandes massas de
dados (AGRAWAL et al., 2011)
Fonte: Pixabay
SAIBA MAIS:
Fonte: Pixabay
RESUMINDO:
Bioinformática
OBJETIVO:
Histórico da Bioinformática
Ao longo do tempo, a biologia molecular cresceu exponencialmente.
Isso se deve pelo fato do aperfeiçoamento da automação na produção
de dados de sequências de genótipos para fenótipos, tornando-se muito
mais uma ciência de informação.
Fonte: Pixabay
34 Big Data e Ciência de Dados
Alinhamento
de sequência
Dinâmica Biologia de
molecular sistemas
Abordagem
computacional
Atrocamento Modelagem
para os
molecular comparativa
sistemas
biólogicos
Modelagem ab
FIlogênia
inito
Predição
de função
génetica
SAIBA MAIS:
Workflow de Bioinformática
Um workflow científico pode ser conceituado como uma
especificação formal de um processo científico que representa as etapas
a serem executados em algum experimento (DEELMAN et al., 2009).
IMPORTANTE:
Fonte: Pixabay
Aplicações da Bioinformática
Assim, podemos destacar no campo da bioinformática algumas
aplicações e suas contribuições, o qual, estão descritas conforme
Lorenzoni (2019):
Bioinformata
Fonte: Pixabay
42 Big Data e Ciência de Dados
RESUMINDO:
OBJETIVO:
Inovação Tecnológica
O Big Data traz inovações em vários aspectos, como: contribui
no desenvolvimento de novas tecnologia, aplicações e na forma de
processos de tomada de decisões nas empresas.
Fonte: Pixabay
NOTA:
Fonte: Pixabay
IMPORTANTE:
Isso implica afirmar que essas análises devem ser eficientes, como
efetuadas quase em tempo real e com a capacidade de prover trabalhos
com vários grafos.
Tecnologia Blockchain
Temos atualmente o surgimento de uma nova tecnologia, o banco
de dados de Blockchain. O BigchainDB trata de combinar as vantagens
de bancos de dados distribuídos, por sua vez, o Blockchains se refere a
trilhas descentralizadas e imutáveis de auditoria e troca de ativos.
Fonte: Pixabay
Fonte: Pixabay
Conforme O’leary (2013), uma grande parte dos dados são originados
de objetos do universo da Internet das Coisas, tendo em visto que, os
mesmos produzem grandes massas de dados.
Por fim, temos que a Veracidade dos dados estão cada dia mais
garantido confiabilidade devido ao modo que a qualidade dos sensores
e outras fontes de dados, tem melhorado com o tempo. Gerando assim
que esses aspectos associados impulsionam a geração de Big Data pela
Internet da Coisas
RESUMINDO:
REFERÊNCIAS
ABADI, D. J. (2009). Data management in the cloud: Limitations
and opportunities. IEEE Data Eng. Bull., 32:3–12.
AGRAWAL, D., Das, S., and El Abbadi, A. (2011). Big Data and cloud
computing: current state and future opportunities. In Proceedings of the
14th International Conference on Extending Database Technology, EDBT/
ICDT ’11, pages 530–533, New York, NY, USA. ACM.
BRANTNER, M., Florescu, D., Graf, D., Kossmann, D., and Kraska,
T. (2008). Building a database on s3. In Proceedings of the 2008 ACM
SIGMOD international conference on Management of data - SIGMOD ’08,
page 251, New York. ACM Press.
CHEN, M., MAO, S., LIU,Y. Big Data: a survey. Nova Iorque, 2014.
CURINO, C., Jones, E., Zhang, Y., Wu, E., and Madden, S. (2010).
Relational cloud: The case for a database service. Technical report,
MIT-CSAIL-TR2010-014. Computer Science and Artificial Intelligence
Laboratory, MIT, USA.
O’LEARY, D. E., ‘Big Data’, The ‘Internet Of Things’ And The ‘Internet
of Signs’. Intell. Sys. Acc. Fin. Mgmt. 20, 53–65, 2013.
PAREDES A.Tendências Big Data 2019 para que o futuro não te pegue
de surpresa .2019. Disponível em:<https://www.iebschool.com/pt-br/blog/
software-de-gestao/big-data/tendencias-big-data-2019-para-que-o-futuro-
nao-te-pegue-de-surpresa/>. Acesso em: 19 de jun. de 2020.