Escolar Documentos
Profissional Documentos
Cultura Documentos
Material Teórico
Análise de Dados
Revisão Textual:
Prof.ª Dr.ª Luciene Oliveira da Costa Granadeiro
Análise de Dados
• Introdução;
• Tipos de Análises de Dados;
• Análise Preditiva.
OBJETIVOS DE APRENDIZADO
• Conhecer e identificar os Tipos de Análises de Dados;
• Definir a Análise Descritiva, conhecer suas características e exemplos de uso;
• Definir a Análise Preditiva, conhecer suas características e exemplos de uso;
• Definir a Análise Prescritiva, conhecer suas características e exemplos de uso;
• Definir a Análise Diagnóstica, conhecer suas características e exemplos de uso.
Orientações de estudo
Para que o conteúdo desta Disciplina seja bem
aproveitado e haja maior aplicabilidade na sua
formação acadêmica e atuação profissional, siga
algumas recomendações básicas:
Conserve seu
material e local de
estudos sempre
organizados.
Aproveite as
Procure manter indicações
contato com seus de Material
colegas e tutores Complementar.
para trocar ideias!
Determine um Isso amplia a
horário fixo aprendizagem.
para estudar.
Mantenha o foco!
Evite se distrair com
as redes sociais.
Seja original!
Nunca plagie
trabalhos.
Não se esqueça
de se alimentar
Assim: e de se manter
Organize seus estudos de maneira que passem a fazer parte hidratado.
da sua rotina. Por exemplo, você poderá determinar um dia e
horário fixos como seu “momento do estudo”;
No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos
e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam-
bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua
interpretação e auxiliarão no pleno entendimento dos temas abordados;
Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus-
são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o
contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de
aprendizagem.
UNIDADE Análise de Dados
Introdução
A otimização de decisão preocupa-se em resolver problemas de tomada de decisão
onde há um objetivo a ser atingido (como maximizar o lucro ou minimizar o custo),
mas onde também há restrições (como recursos limitados, orçamento ou tempo).
Análise Descritiva
É considerada como o primeiro nível de análise, onde é possível entender o que
está acontecendo no negócio atualmente. Tem como principal objetivo resumir,
sumarizar e explorar o comportamento dos dados. Permite saber o que aconteceu
no passado. Ela permite tomar decisões com base em estatísticas obtidas a partir
de dados históricos.
Essa análise busca trazer uma fotografia do presente, para que decisões possam
ser tomadas com segurança, o que torna esse modelo muito útil para análise de
crédito, por exemplo. A análise descritiva trabalha com histórico de dados, cruzan-
do informações com o objetivo de gerar um panorama claro e preciso dos temas
relevantes para a empresa no presente momento. A diferença entre a análise des-
critiva e a mineração propriamente dita é que a ADD visa descrever e encontrar o
que há nos dados, ao passo que os algoritmos de mineração buscam conclusões
que extrapolam os dados e permitem inferir algo a partir deles.
Por exemplo:
• Quantos clientes têm reclamado ou desistiram devido a atrito nas últimas
seis semanas?
• Quanto dinheiro foi perdido devido à fraude nos últimos três meses?
• Com que frequência os chamados de suporte estão sendo criados?
• Onde estão localizados os clientes (talvez mostrados por meio do Google Maps)?
8
Figura 1 – Análise Descritiva
Fonte: Reprodução
Por exemplo, em uma base de dados de câncer de mama, uma análise descritiva
pode ser usada para se conhecer a média de idade das mulheres que sofrem dessa
doença, ao passo que um algoritmo de mineração pode ser usado para predizer,
com determinada margem de erro, se uma mulher terá ou não câncer, baseado em
um conjunto de exames e características dessa mulher.
9
9
UNIDADE Análise de Dados
No quadro abaixo, temos o rol com os dados das idades das crianças que fre-
quentam o acampamento, organizados.
10
Idade Frequência
5 1
6 3
7 4
8 4
9 4
10 4
11 3
12 4
13 4
14 2
15 1
11
11
UNIDADE Análise de Dados
Xi = li + Li/2
12
Frequência
Idade (Quantidade de crianças
por faixa etária)
10I-12 7
12I-14 8
14I-16 3
Fr2= 7/37*100 = 18,9% essa classe representa 18,9% do número total de ob-
servações.
• Frequência acumulada: soma de uma frequência e todas que a antecedem na
distribuição de frequências, ou seja, é a soma de todas as frequências abaixo
do limite superior de uma classe considerada.
F4 = f1 + f2 + f3 + f4 = 4 + 7 + 8 + 7 = 26
F4 =26
13
13
UNIDADE Análise de Dados
Frequência
Idade
(fi)
12I-14 8
14I-16 3
Total 37
14
Anos de estudo das pessoas de 10 anos e mais - 2005
%
35
30
25
20
15
10
0
Sem instrução e 1 a 3 anos 4 a 7 anos 8 a 10 anos 11 anos e mais
menos de 1 ano
Homens Mulheres
15
15
UNIDADE Análise de Dados
5,00
4,50
4,00
3,50
3,00
2,50
2,00
10/09 17/09 24/09 01/10 05/10
120
100
Contagem
80
60
40
20
0
-4 -2 0 2 4
Amplitude do ruído
16
Análise Preditiva
Na sociedade atual, é imprescindível que as decisões sejam altamente precisas e
repetidas. Para isso, as empresas estão usando análise preditiva para literalmente
tocar para o futuro e, com isso, definir decisões de negócio e processos.
Sua relevância no segmento de mercado cresceu juntamente com a quantidade
de dados sendo capturados pelas pessoas (por exemplo, a partir de transações on-
line e redes sociais) e sensores (por exemplo, a partir de dispositivos móveis GPS),
bem como a disponibilidade do poder de processamento com custo reduzido, seja
baseado em Hadoop ou na Nuvem.
Esse tipo de análise é o mais indicado para quem precisa prever algum tipo de
comportamento ou resultado. Essa técnica procura analisar dados relevantes ao
longo do tempo, buscando padrões comportamentais e suas variações de acordo
com cada contexto, a fim de prever como será o comportamento de seu público ou
mercado no futuro, dadas as condições atuais. É muito útil para avaliar tendências
de consumo e flutuações econômicas.
A análise preditiva é o uso de dados, algoritmos estatísticos e técnicas de
machine learning para identificar a probabilidade de resultados futuros com base
em dados históricos.
O objetivo é ir além da estatística descritiva e dos relatórios sobre o que aconteceu
para fornecer uma melhor avaliação sobre o que vai acontecer no futuro. O resultado
final é a simplificação da tomada de decisão e a geração de novos insights que levem
a melhores ações.
Os modelos preditivos utilizam os resultados conhecidos para desenvolver (ou
treinar) um modelo que possa ser usado para prever valores para dados diferentes
ou novos. Os resultados da modelagem em previsões que representam a probabili-
dade da variável-alvo (por exemplo, a receita) com base na importância estimada a
partir de um conjunto de variáveis de entrada. Isso é diferente dos modelos descri-
tivos, que ajudam a entender o que aconteceu, ou dos modelos de diagnóstico, que
ajudam a entender as principais relações e a determinar por que algo aconteceu.
Cada vez mais organizações estão se voltando para a análise preditiva visando au-
mentar seu lucro e sua vantagem competitiva.
Com o software interativo e fácil de usar se tornando cada vez mais predomi-
nante, a análise preditiva não é mais apenas o domínio de matemáticos e estatís-
ticos. Os analistas de negócios e especialistas na linha de negócios também estão
usando essas tecnologias.
17
17
UNIDADE Análise de Dados
18
anomalias, análises preditivas, link analytics etc. É possível obter maior pre-
cisão e melhor desempenho preditivo. E, no mundo de hoje, a ciberseguran-
ça é uma preocupação crescente. A análise comportamental de alto desem-
penho examina todas as ações em uma rede em tempo real para detectar
anormalidades que podem indicar fraude ocupacional, vulnerabilidades no
dia zero e ameaças persistentes avançadas;
• Marketing: O uso da análise preditiva pode ajudar a entender melhor os
clientes. A maioria das organizações modernas usa a análise de dados para
determinar as respostas ou compras dos clientes, bem como para promover
oportunidades de vendas cruzadas. Os modelos preditivos ajudam as empresas
a atrair, reter e desenvolver os clientes mais rentáveis e maximizar seus gastos
com marketing.
Modelo Preditivo
A análise preditiva é o uso de dados e algoritmos para identificar a probabili-
dade de resultados futuros com base em dados históricos. Os modelos preditivos
utilizam os resultados conhecidos para desenvolver e treinar um modelo que possa
ser usado para prever valores para dados diferentes ou novos, usando para isso um
algoritmo preditivo de Data Mining.
19
19
UNIDADE Análise de Dados
Análise Prescritiva
Segue um modelo similar à análise preditiva, porém, com objetivos ligeiramente
diferentes; ao invés de tentar prever um determinado acontecimento, essa análise
busca trazer informações de consequências desse acontecimento. Para efeitos de
comparação, enquanto o modelo preditivo focaria em tendências de consumo do
seu público, por exemplo, a análise prescritiva busca trazer um panorama dos tipos
de produto que serão mais desejados ou o impacto que essas tendências terão no
montante de vendas. Modelo muito útil, principalmente se aliado com o anterior.
A análise prescritiva, juntamente com a análise preditiva, ajuda a criar uma es-
tratégia e tomada de decisão baseada em dados.
20
A empresa pagou pela troca supondo que o cliente ficaria com nove peças de
roupa, mas o algoritmo não levou em consideração o comportamento do cliente,
fazendo com que a empresa tivesse uma perda nessa transação.
A análise prescritiva, pode evitar essa perda, por exemplo apontando que a
empresa ofertasse opções de troca na loja para clientes que fazem devoluções,
incentivando outra compra ou notificando clientes sobre a necessidade de pagar
pela devolução.
Análise Diagnóstica
Essa análise é feita após o trabalho, de coleta de dados e outros tipos de análises,
serem realizados. Perguntas importantes fundamentais para esse tipo de análise
são: Quem fez? Quando fez? Onde fez? Por que fez? Seu objetivo é responder à
pergunta “Por que aconteceu?”. Nesse modelo, o foco está na relação de causas
e consequências percebidas ao longo do tempo, dentro de um determinado tema.
Assim, a análise diagnóstica funciona baseada na coleta de dados relacionados a
um determinado assunto, cruzando informações com o objetivo de entender quais
fatores influenciaram o resultado atual. Bastante utilizado em vendas, esse modelo
funciona bem em conjunto com análises preditivas, servindo de base para as pro-
jeções futuras. Análises diagnósticas também são úteis para entender quais fatores
devem ser ajustados em determinadas ações, a fim de obter os resultados desejados.
Outro exemplo é que, através desse tipo de análise, pode-se chegar à conclusão
de que a perda de clientes ocorreu porque os preços dos produtos do mercado es-
tavam altos quando comparados com a concorrência.
21
21
UNIDADE Análise de Dados
Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:
Livros
Banco de dados: Projeto e Implementação
MACHADO, F. N. R. Banco de dados: projeto e implementação. São Paulo: Érica,
2004. 398 p.
Projeto de Banco de Dados: Uma Visão Prática
MACHADO, F. N. R.; ABREU, M. P. de. Projeto de banco de dados: uma visão
prática. 15 ed. São Paulo: Érica, 2007. 300 p.
OCA Oracle Database 11g – Administração I
WATSON, J. OCA Oracle Database 11g – Administração I. São Paulo: Bookman
Companhia, 2009.
OCP Oracle Database 11g – Administração II
BRYLA, B. OCP Oracle Database 11g – Administração II. São Paulo: Bookman
Companhia, 2009.
OCA Oracle Database 11g – Fundamentos I ao SQL
RAMKLASS, R.; WATSON, J. Oca Oracle Database 11g – Fundamentos I ao SQL.
Rio de Janeiro: Alta Books, 2010
Projetando e Administrando Banco de Dados SQL Server 2000 .net: Como Servidor Enterprise
PATTON, R.; OGLE, J. Projetando e Administrando Banco de Dados SQL Server
2000 .net: Como Servidor Enterprise. Tradução de Andréa Barbosa Bento; Cláudia
Reali; Lineu Carneiro de Castro. Rio de Janeiro: Alta Books, 2002. 792 p.
22
Referências
CASTRO, L. N. de. Introdução à mineração de dados: conceitos básicos, algo-
ritmos e aplicações. São Paulo: Saraiva 2016.
23
23