Escolar Documentos
Profissional Documentos
Cultura Documentos
Ciência de Dados
Unidade 4
Big Data, Ia e Cloud Computing
Diretor Executivo
DAVID LIRA STEPHEN BARROS
Gerente Editorial
CRISTIANE SILVEIRA CESAR DE OLIVEIRA
Projeto Gráfico
TIAGO DA ROCHA
Autoria
JÉSSICA LAISA DIAS DA SILVA
ALAN DE OLIVEIRA SANTANA
AUTORIA
Jéssica Laisa Dias da Silva
Olá. Sou graduada em Sistemas da Informação pela Universidade de
Ciências Sociais Aplicadas (Unifacisa) e mestre em Sistema e Computação
pela Universidade Federal de Rio Grande do Norte (UFRN). Atualmente,
sou doutoranda em Sistema e Computação pela UFRN e professora
conteudista na elaboração de cadernos.
OBJETIVO: DEFINIÇÃO:
para o início do houver necessidade
desenvolvimento de se apresentar um
de uma nova novo conceito;
competência;
NOTA: IMPORTANTE:
quando necessária as observações
observações ou escritas tiveram que
complementações ser priorizadas para
para o seu você;
conhecimento;
EXPLICANDO VOCÊ SABIA?
MELHOR: curiosidades e
algo precisa ser indagações lúdicas
melhor explicado ou sobre o tema em
detalhado; estudo, se forem
necessárias;
SAIBA MAIS: REFLITA:
textos, referências se houver a
bibliográficas necessidade de
e links para chamar a atenção
aprofundamento do sobre algo a ser
seu conhecimento; refletido ou discutido
sobre;
ACESSE: RESUMINDO:
se for preciso acessar quando for preciso
um ou mais sites se fazer um resumo
para fazer download, acumulativo das
assistir vídeos, ler últimas abordagens;
textos, ouvir podcast;
ATIVIDADES: TESTANDO:
quando alguma quando uma
atividade de competência for
autoaprendizagem concluída e questões
for aplicada; forem explicadas;
SUMÁRIO
Técnicas de Aprendizado de Máquina.................................................... 12
Aprendizagem supervisionada........................................................................... 17
Sistemas de recomendação................................................................................ 20
Agrupamento .................................................................................................................. 21
Computação na Nuvem.............................................................................................................. 22
Modelos de serviço.....................................................................................................25
Bioinformática.....................................................................................................32
Workflow de Bioinformática....................................................................................35
Bioinformata........................................................................................................................................ 40
Tecnologia Blockchain......................................................................46
04
UNIDADE
10 Big Data e Ciência de Dados
INTRODUÇÃO
Nesta unidade, vamos abordar sobre o aprendizado de máquina e
suas técnicas, bem como estas podem contribuir no processo de análise
de dados e tomada de decisão.
OBJETIVOS
Olá. Seja muito bem-vinda (o). Nosso propósito é auxiliar você no
desenvolvimento das seguintes objetivos de aprendizagem até o término
desta etapa de estudos:
OBJETIVO:
REFLITA:
Matemática Métodos
Estáticas
Fundamental otimizados
Data Minig
Aprendizado
Redes Neurais
de Maquina
Processamento Método de
de sinal Visualização
Computação
Binformática Astronomia Financeira
social
SAIBA MAIS:
Fonte: Freepik
IMPORTANTE:
Aprendizagem supervisionada
A aprendizagem supervisionada é direcionada quando se é aplicada
técnicas em que algoritmos indutores podem realizar inferências por meio
de exemplos rotulados, ou seja, cada exemplo observado é descrito por
um conjunto de atributos e pelo valor da classe, também chamado de
atributo meta, a qual o exemplo pertence (RUSSELL; NORVIG, 2003).
Fonte: Freepik
Análise preditiva
Essa é uma das técnicas mais usadas nas aplicações de Big Data
para realizar previsão, uma vez que essa análise consiste no uso de dados
e técnicas de aprendizado de máquina para determinar a probabilidade
de futuros resultados com base nas informações adquiridas no passado.
Previsão de demanda
Uma boa previsão de demanda ajuda qualquer empresa a vender
mais nas épocas de pico, assim como a evitar prejuízos e desperdícios em
períodos de baixa.
20 Big Data e Ciência de Dados
Sistemas de recomendação
Essa técnica trabalha do seguinte modo: após ter os dados coletados
e analisados por meio da combinação das técnicas de aprendizado de
máquina e Big Data, é possível realizar recomendações a partir de um
conjunto de dados coletados.
REFLITA:
Agrupamento
Outra técnica que pode podemos destacar é o Clustergram, utilizada
para visualizar análises de clusters (cluster analysis) ou agrupamentos, as
quais se combina as técnicas de aprendizado de máquina e Big Data para
realizar a análise de agrupamentos que fazem a classificação de objetos
em diversos grupos, cada um contendo os objetos semelhantes segundo
alguma função de distância estatística.
RESUMINDO:
OBJETIVO:
Computação na Nuvem
A Computação em Nuvem pode ser conceituada como um modelo
que possibilita acesso por demanda a um agrupamento de elementos
computacionais que podem ser configuráveis, como CPU, armazenamento
e memória. Estes, por sua vez, podem ser disponibilizados de modo rápido
com o mínimo esforço de gerenciamento ou assistência do provedor da
Nuvem (MELL; GRANCE, 2009).
Figura 4 – Computação em Nuvem
Fonte: Pixabay
Big Data e Ciência de Dados 23
IMPORTANTE:
Modelo de implementação
É importante descrever que o acesso e disponibilidade aos
ambientes de Computação em Nuvem, apresentam diferentes tipos de
modelos de implementação. Algumas exceções ou aberturas de acesso
dependem do tipo de informação e do nível de visão.
• Nuvem privada
• Nuvem pública
• Nuvem comunidade
• Nuvem híbrida
Modelos de serviço
Outro aspecto importante para destacar na Computação em
Nuvem, são os modelos de serviços que ajudam a atender às demandas
26 Big Data e Ciência de Dados
Dessa forma, a Nuvem permite ser uma opção mais viável para
a idealização de aplicações de gestão e análise de grandes massas de
dados (AGRAWAL et al., 2011)
Fonte: Pixabay
SAIBA MAIS:
Fonte: Pixabay
RESUMINDO:
Bioinformática
OBJETIVO:
Histórico da Bioinformática
Ao longo do tempo, a biologia molecular cresceu exponencialmente.
Isso se deve pelo fato do aperfeiçoamento da automação na produção
de dados de sequências de genótipos para fenótipos, tornando-se muito
mais uma ciência de informação.
Fonte: Pixabay
Big Data e Ciência de Dados 33
Alinhamento
de sequência
Dinâmica Biologia de
molecular sistemas
Abordagem
computacional
Atrocamento Modelagem
para os
molecular comparativa
sistemas
biólogicos
Modelagem ab
FIlogênia
inito
Predição
de função
génetica
SAIBA MAIS:
Workflow de Bioinformática
Um workflow científico pode ser conceituado como uma
especificação formal de um processo científico que representa as etapas
a serem executadas em algum experimento (DEELMAN et al., 2009).
IMPORTANTE:
Fonte: Pixabay
38 Big Data e Ciência de Dados
Aplicações da Bioinformática
Assim, podemos destacar no campo da Bioinformática algumas
aplicações e suas contribuições, descritas conforme Lorenzoni (2019):
Bioinformata
Neste contexto da Bioinformática e seus objetos de estudos, surge
outro tipo de profissional: o bioinformata. Esse deve ter a habilidade e
competência de identificar os problemas biológicos e solucioná-los por
meio do uso de ferramentas computacionais (SOARES, 2006).
Figura 11 – Bioinformata
Fonte: Pixabay
RESUMINDO:
OBJETIVO:
Inovação tecnológica
O Big Data traz inovações em vários aspectos, como: contribui
no desenvolvimento de novas tecnologias, aplicações e na forma de
processos de tomada de decisões nas empresas.
Figura 12 – Inovação
Fonte: Pixabay
NOTA:
Fonte: Pixabay
IMPORTANTE:
Isso implica afirmar que essas análises devem ser eficientes, como
efetuadas quase em tempo real e com a capacidade de prover trabalhos
com vários grafos.
Tecnologia Blockchain
Temos atualmente o surgimento de uma nova tecnologia, o banco
de dados de blockchain. O BigchainDB trata de combinar as vantagens de
bancos de dados distribuídos, por sua vez, o blockchain refere-se a trilhas
descentralizadas e imutáveis de auditoria e troca de ativos.
Figura 14 – Blockchain
Fonte: Pixabay
Fonte: Pixabay
Por fim, temos que a veracidade dos dados estão mais garantindo
confiabilidade devido ao modo que a qualidade dos sensores e outras
fontes de dados, tem melhorado com o tempo. Gerando, assim, que esses
aspectos associados impulsionam a geração de Big Data pela Internet
das Coisas.
RESUMINDO:
REFERÊNCIAS
ABADI, J. Data management in the cloud: Limitations and
opportunities. IEEE Data Eng. Bull, v. 32, p. 3-12. 2009.
AGRAWAL, D.; DAS, S.; El Abbadi, A. Big Data and cloud computing:
current state and future opportunities. In: INTERNATIONAL CONFERENCE
ON EXTENDING DATABASE TECHNOLOGY, 14., 2009, New York.
Proceedings […] New York: EDBT/ICDT, 2009. p. 530-533.
CHEN, M.; MAO, S.; LIU, Y. Big Data: a survey. New York: [s. n.], 2014.