Você está na página 1de 3

Estudos avançados em Segurança da Informação

Adenir Souza Felix 0040971513042


Big data e Mineração de dados
1) Como podemos definir Big Data
Podemos definir Big Data como uma quantidade grande de dados sendo
criada pela sociedade a uma velocidade muito grande que excede a
cada dia a capacidade das tecnologias atuais de as tratarem
adequadamente.
2) Defina quais são os 5Vs no big data?
Volume
Velocidade
Variedade
Veracidade
Valor

3) Identifique a importância do big data para a segurança da


informação, no que diz respeito a integridade, confidencialidade e
disponibilidade ?
Se os dados analisados do big data não forem autênticos, o
conhecimento gerado não satisfará um dos pilares da SI, a integridade.
Com relação a privacidade, mecanismos devem ser bem estruturados
para que não afete um outro pilar, a confidencialidade.
E com relação a disponibilidade, com uma quantidade tão grande de
informações, tem se a necessidade de uma atenção especial em relação
ao armazenamento, para não comprometer o acesso a elas.

4) Quais são os principais modelos de data mining?


Classificação
Estimativa
Previsão
Análise de Afinidades
Análise de agrupamentos

5) Apresente os conceitos de cada um desses modelos.


Classificação
A classificação pode ser sintetizada por um processo de discriminação
de unidades em classes ou categorias.
Estimativa
A estimativa está associada a respostas contínuas, ou seja, determinar o
valor mais provável em cima de dados que se tem conhecimento

Previsão
A previsão, está associada à avaliação de um valor futuro de uma
variável a partir dos dados históricos do seu comportamento
passado.
Análise de Afinidades
A análise de afinidades baseia-se em reconhecer padrões de
ocorrência simultânea de determinados eventos nos dados
analisados.
Análise de agrupamentos
A análise de agrupamentos visa formar grupos de objetos ou
elementos mais homogêneos entre si.

6) Quantos e quais são as ferramentas para a mineração de dados?

Pesquisa da Rexer Analytics sobre Ferramentas de Mineração de Dados

Fonte: https://mineracaodedados.wordpress.com/2013/02/10/pesquisa-
da-rexer-analytics-sobre-ferramentas-de-mineracao-de-dados/ Acesso
em 07 abr 2016

R: O R é uma linguagem de programação totalmente pensada para


estatísticos. A linguagem é totalmente otimizada para lidar e calcular
testes estatísticos em cima de grandes conjuntos de dados.
Weka: É um software livre para mineração de dados, do tipo open
source, desenvolvido em Java dentro das especificações da GPL
(General Public License) que se consolidou como a ferramenta de
mineração de dados mais utilizada por estudantes e professores de
universidades. A ferramenta também é muito utilizada por profissionais
que desejam aprender os conceitos básicos sobre mineração de dados.
Através de sua interface gráfica (conhecida como Weka Explorer) é
possível conduzir processos de mineração de dados de forma simples,
realizando a avaliação dos resultados obtidos e a comparação de
algoritmos. Além disso, a ferramenta oferece recursos para a execução
de tarefas relacionadas ao pré-processamento de dados como, por
exemplo, a seleção e a transformação de atributos.
Rapid Miner: O RapidMiner é um ambiente open-source desenvolvido
em Java que permite explorar os dados de diversas maneiras por meio
de operadores (sejam eles para pré-processamento, aprendizado,
validação, etc) organizados em uma estrutura de árvore.
Matlab: O Matlab é um ambiente de programação para
desenvolvimento de algoritmos, análise de dados, visualização e
cálculo numérico de alto desempenho, integrando cálculo com
matrizes, processamento de sinais e construção de gráficos
KNIME = Konstanz Information Miner: Desenvolvido na Universidade de
Konstanz na Alemanha. Plataforma modular para criar e executar
WORKFLOWS usando componentes predefinidos, chamados NODES
SAS Enterprise Miner: É aplicado na exploração de grandes volumes
de dados à procura de padrões consistentes, como por exemplo, regras
de associação ou sequências temporais.

7) Como a mineração de dados atende a disponibilidade,


confidencialidade e integridade?

A mineração de dados atende através de técnicas estatísticas,


matemáticas ou de reconhecimento de padrões sobre os dados
analisados, descobrindo correlações, padrões e tendências entre as
informações.

Você também pode gostar