Você está na página 1de 24

Ciência de Dados

Material Teórico
Análise de Dados

Responsável pelo Conteúdo:


Profa. Esp. Lucia Contente Mós

Revisão Textual:
Prof.ª Dr.ª Luciene Oliveira da Costa Granadeiro
Análise de Dados

• Introdução;
• Tipos de Análises de Dados;
• Análise Preditiva.

OBJETIVOS DE APRENDIZADO
• Conhecer e identificar os Tipos de Análises de Dados;
• Definir a Análise Descritiva, conhecer suas características e exemplos de uso;
• Definir a Análise Preditiva, conhecer suas características e exemplos de uso;
• Definir a Análise Prescritiva, conhecer suas características e exemplos de uso;
• Definir a Análise Diagnóstica, conhecer suas características e exemplos de uso.
Orientações de estudo
Para que o conteúdo desta Disciplina seja bem
aproveitado e haja maior aplicabilidade na sua
formação acadêmica e atuação profissional, siga
algumas recomendações básicas:
Conserve seu
material e local de
estudos sempre
organizados.
Aproveite as
Procure manter indicações
contato com seus de Material
colegas e tutores Complementar.
para trocar ideias!
Determine um Isso amplia a
horário fixo aprendizagem.
para estudar.

Mantenha o foco!
Evite se distrair com
as redes sociais.

Seja original!
Nunca plagie
trabalhos.

Não se esqueça
de se alimentar
Assim: e de se manter
Organize seus estudos de maneira que passem a fazer parte hidratado.
da sua rotina. Por exemplo, você poderá determinar um dia e
horário fixos como seu “momento do estudo”;

Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma


alimentação saudável pode proporcionar melhor aproveitamento do estudo;

No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos
e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam-
bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua
interpretação e auxiliarão no pleno entendimento dos temas abordados;

Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus-
são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o
contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de
aprendizagem.
UNIDADE Análise de Dados

Introdução
A otimização de decisão preocupa-se em resolver problemas de tomada de decisão
onde há um objetivo a ser atingido (como maximizar o lucro ou minimizar o custo),
mas onde também há restrições (como recursos limitados, orçamento ou tempo).

A otimização de decisão aplica técnicas avançadas de inteligência artificial e


matemática para encontrar as melhores soluções e mais viáveis. Através da combi-
nação de modelos matemáticos que representam problemas de tomada de decisão
do mundo real com grandes conjuntos de dados.

Tipos de Análises de Dados


As análises de dados podem ser classificadas como: descritiva, preditiva, pres-
critiva e diagnóstica.

Análise Descritiva
É considerada como o primeiro nível de análise, onde é possível entender o que
está acontecendo no negócio atualmente. Tem como principal objetivo resumir,
sumarizar e explorar o comportamento dos dados. Permite saber o que aconteceu
no passado. Ela permite tomar decisões com base em estatísticas obtidas a partir
de dados históricos.

Essa análise busca trazer uma fotografia do presente, para que decisões possam
ser tomadas com segurança, o que torna esse modelo muito útil para análise de
crédito, por exemplo. A análise descritiva trabalha com histórico de dados, cruzan-
do informações com o objetivo de gerar um panorama claro e preciso dos temas
relevantes para a empresa no presente momento. A diferença entre a análise des-
critiva e a mineração propriamente dita é que a ADD visa descrever e encontrar o
que há nos dados, ao passo que os algoritmos de mineração buscam conclusões
que extrapolam os dados e permitem inferir algo a partir deles.

Por exemplo:
• Quantos clientes têm reclamado ou desistiram devido a atrito nas últimas
seis semanas?
• Quanto dinheiro foi perdido devido à fraude nos últimos três meses?
• Com que frequência os chamados de suporte estão sendo criados?
• Onde estão localizados os clientes (talvez mostrados por meio do Google Maps)?

8
Figura 1 – Análise Descritiva
Fonte: Reprodução

A análise descritiva percorre um longo caminho para a viabilização de decisões


de negócio baseadas em fatos e não em sentimentos.

Por exemplo, em uma base de dados de câncer de mama, uma análise descritiva
pode ser usada para se conhecer a média de idade das mulheres que sofrem dessa
doença, ao passo que um algoritmo de mineração pode ser usado para predizer,
com determinada margem de erro, se uma mulher terá ou não câncer, baseado em
um conjunto de exames e características dessa mulher.

Análise Descritiva dos Dados x Algoritmos de Mineração


A mineração de dados pode ser usada em análises mais gerais dos dados, enquan-
to que a análise descritiva simplesmente descreve suas características. É importante
ressaltar que descrever um conjunto de dados por meio de alguns índices pode gerar
interpretações distorcidas ou perda de detalhes importantes. Por exemplo, a média
de idade das mulheres que têm câncer não traz informação alguma sobre a forma
ou o contorno das massas medidas em um exame de mamografia, aspectos que
são importantes na predição do câncer. De maneira geral, as análises descritivas
são univariadas ou bivariadas, ou seja, envolvem a descrição da distribuição de um
único atributo ou a descrição de relações entre pares de atributos. Como os dados
univariados envolvem um único atributo, as análises descritivas têm como objetivo
principal organizar os dados em distribuições de frequência, visualizar o atributo
usando gráficos e determinar a tendência central e variação. Em contrapartida, a
análise bivariada trata causas e relações entre atributos, buscando explicá-las.

O Processo de Análise Descritiva de Dados


A análise descritiva de dados é um processo que pode ser desmembrado em três
passos principais:
• 1º Passo: organizar os dados usando distribuições de frequência;
• 2º Passo: apresentar os dados usando técnicas de visualização;
• 3º Passo: calcular medidas de tendência central, variação e associação.

9
9
UNIDADE Análise de Dados

Organizar os dados Apresentar os dados Calcular medidas de


usando distribuições usando técnicas de tendência central,
de frequência visualização variação e associação

Figura 2 – Processo de Análise Descritiva dos Dados

1º Passo – Estatística Descritiva


• Frequência: é a quantidade de vezes que um mesmo valor de um dado é re-
petido;
• Dados Brutos: são os dados originais que ainda não foram numericamente
organizados após a coleta;
• Rol: é a ordenação dos valores obtidos em ordem crescente ou descrente de
grandeza numérica ou qualitativa.

No quadro abaixo, temos um exemplo de dados de idades de crianças que fre-


quentam um acampamento.

Tabela 1 – Exemplo de Dados Brutos


6 10 9 14 7 4
8 11 12 5 9 13
9 10 8 6 7 14
11 6 12 11 15 13
10 9 8 12 13 7

Analisando os dados brutos, é muito difícil estabelecer em torno de qual valor


tendem a se concentrar as idades das crianças, ou ainda as que se encontram acima
ou abaixo de determinada idade. Daí a necessidade de criar o rol, ou seja, organizar
os dados.

No quadro abaixo, temos o rol com os dados das idades das crianças que fre-
quentam o acampamento, organizados.

Tabela 2 – Rol: Dados Organizados


4 6 8 10 11 13
4 7 8 10 12 13
4 7 8 10 12 13
5 7 9 10 12 14
6 7 9 11 12 14
6 8 9 11 13 15

Com base no rol, podemos, então, calcular a frequência.

Tabela 3 – Exemplo de Frequência


Idade Frequência
4 3

10
Idade Frequência
5 1
6 3
7 4
8 4
9 4
10 4
11 3
12 4
13 4
14 2
15 1

É necessário organizar e resumir os dados com a construção de uma tabela que


liste os diferentes possíveis valores dos atributos (individualmente ou por grupos),
com as frequências correspondentes, que representam o número de vezes que
aqueles valores ocorrem. Uma distribuição de frequências mostra um resumo dos
dados agrupados em classes mutuamente exclusivas e o número de ocorrências
(frequência) em cada faixa, e pode ser utilizada tanto com dados numéricos quan-
to categóricos.

As distribuições de frequências permitem a sumarização de grandes conjuntos


de dados, ajudam a entender a natureza desses dados e fornecem uma base para a
construção de gráficos importantes, como os histogramas, gráficos de barra e do
tipo torta.

Elementos de uma Distribuição de Frequência


Classes: caso as colunas da tabela de distribuição de frequência contenham
muitos valores elencados, podemos reduzir a quantidade desses valores elenca-
dos agrupando-os em intervalos. Esses agrupamentos de valores num intervalo de
abrangência são chamados de classes.

Tabela 4 – Exemplo de Classes


Idade Frequência
4-6 4
6-8 7
8-10 8
10-12 7
12-14 8
14-16 3
15 1

• Classes: grupos ou intervalos entre os quais se deseja dividir os valores


dos atributos;

11
11
UNIDADE Análise de Dados

• Limites inferiores de classe: menores números que podem pertencer às dife-


rentes classes. O número menor é o limite inferior da classe (4-6) em que l1 = 4.
• Limites superiores de classe: maiores números que podem pertencer às dife-
rentes classes. O número maior é o limite superior da classe (4-6) em que L1 = 6;
• Fronteiras de classes: números usados para separar as classes, mas sem os
saltos criados pelos limites de classe. São obtidos da seguinte maneira: en-
contre o tamanho do salto entre o limite superior de uma classe e o limite
inferior da classe seguinte. Acrescente a metade dessa quantidade a cada limite
superior de classe para encontrar as fronteiras superiores de classe; e subtraia
metade daquela mesma quantidade de cada um dos limites inferiores de classe
para encontrar as fronteiras inferiores de classe;
• Pontos médios das classes: são os pontos médios dos intervalos que
determinam cada classe (soma dos limites superior e inferior da classe dividida
por dois). Ponto médio de uma classe (xi) é o ponto que, por situar-se numa
posição média da distribuição de valores do intervalo de classe, divide o inter-
valo em duas partes iguais;

Xi = li + Li/2

O ponto médio da primeira classe: x1 = 4+6/2 = 5;


• Amplitude de classes: diferença entre dois limites inferiores de classe conse-
cutivos ou duas fronteiras inferiores de classes consecutivas. A amplitude de
um intervalo de classe (hi) é a diferença entre o limite superior e inferior de
uma classe:
»» hi = L i – l i
»» h1= 6 – 4 = 2 anos;
»» h2= 8 – 6 = 2 anos;
»» h3= 10 – 8 = 2 anos;
»» h4= 12 – 10 = 2 anos;
»» h5= 14 – 12 = 2 anos;
»» h6= 16 – 14 = 2 anos;
• Frequência absoluta (de uma classe): é o número de vezes em que ela ocorre,
ou seja, é o número de observações de um valor individual (ou de uma classe);

Tabela 5 – Exemplo de Frequência Simples ou Absoluta


Frequência
Idade (Quantidade de crianças
por faixa etária)
4I-6 4
6I-8 7
8I-10 8

12
Frequência
Idade (Quantidade de crianças
por faixa etária)
10I-12 7
12I-14 8
14I-16 3

• Frequência relativa (de uma classe): corresponde a quanto ela ocorre em


relação a toda a distribuição de frequências, ou seja, representa a proporção
de observações de um valor (ou de uma classe) em relação ao número total
de observações, o que facilita a observação. A frequência relativa é obtida
através da frequência absoluta de classe dividida pela soma de todas as fre-
quências absolutas.

Tabela 6 – Frequência Relativa


Frequência
Idade
(fi)
4I-6 4
6I-8 7
8I-10 8
10I-12 7
12I-14 8
14I-16 3
Total 37

Aplicando a fórmula de frequência relativa Fr = fi/∑fi *100

Fr2= 7/37*100 = 18,9% essa classe representa 18,9% do número total de ob-
servações.
• Frequência acumulada: soma de uma frequência e todas que a antecedem na
distribuição de frequências, ou seja, é a soma de todas as frequências abaixo
do limite superior de uma classe considerada.

F4 = f1 + f2 + f3 + f4 = 4 + 7 + 8 + 7 = 26

F4 =26

Existem 30 crianças abaixo de 12 anos.

Tabela 7 – Frequência Acumulada


Frequência
Idade
(fi)
4I-6 4
6I-8 7
8I-10 8
10I-12 7

13
13
UNIDADE Análise de Dados

Frequência
Idade
(fi)
12I-14 8
14I-16 3
Total 37

Outro Exemplo: A construção de uma distribuição de frequências, para as idades


das mulheres das classes “benigno” e “maligno”, utilizando a base de dados abaixo.
Atributo Idade para os primeiros 80 objetos
67, 43, 58, 28, 74, 65, 70, 42, 57, 60, 76, 42, 64, 36, 60, 54, 52, 59, 54, 40,
66, 56, 43, 42, 59, 75, 66, 63, 45, 55, 46, 54, 57, 39, 81, 77, 60, 67, 48, 55,
59, 78, 50, 61, 62, 44, 64, 23, 42, 67, 74, 80, 23, 63, 53, 43, 49, 51, 45, 59,
52, 60, 57, 57, 74, 25, 49, 72, 45, 64, 73, 68, 52, 66, 70, 25, 74, 64, 60, 67.

• Passo 1: Número de classes escolhido: 5;


• Passo 2: Amplitude de classe: (81 – 23)/5  ceil(11,6)  12.5 Passo 3: Limite
inferior inicial: 23;
• Passo 4: Limites inferiores das classes: 23, 35, 47, 59, 71;
• Passo 5: Limites superiores das classes: 34, 46, 58, 70, 82;
• Passo 6: Rótulos para os valores do atributo: 4, 2, 3, 1, 5, 4, 4, 2, 3, 4, 5, 2,
4, 2, 4, 3, 3, 4, 3, 2, 4, 3, 2, 2, 4, 5, 4, 4, 2, 3, 2, 3, 3, 2, 5, 5, 4, 4, 3, 3, 4,
5, 3, 4, 4, 2, 4, 1, 2, 4, 5, 5, 1, 4, 3, 2, 3, 3, 2, 4, 3, 4, 3, 3, 5, 1, 3, 5, 2, 4,
5, 4, 3, 4, 4, 1, 5, 4, 4, 4.

Tabela 8 – Distribuição de frequência do atributo idade das mulheres


Limite Ponto Limite Frequência Frequência Frequência
Classe Fronteira
Inferior Médio Superior absoluta relativa acumulada
1 23 28,5 34 34,5 5 6,25% 5 6,25%
2 35 40,5 46 46,5 15 18,75% 20 25%
3 47 52,5 58 58,5 20 25% 40 50%

4 59 64,5 70 28 35% 68 85%


70,5
5 71 76,5 82 12 15% 80 100%

2º Passo – Visualização dos Dados


A visualização dos dados corresponde à apresentação de dados em forma pictó-
rica ou gráfica (representações visuais) com o objetivo de se entender a natureza das
distribuições dos dados, extrair conhecimento mais fácil e rapidamente e permitir
o compartilhamento desse conhecimento de maneira mais direta entre diferentes
pessoas e entidades. As técnicas de visualização ajudam na descoberta de conheci-
mento que não é óbvio apenas ao olhar os dados.
• Técnica de Visualização de Dados – Gráfico de Barras: Apresenta a frequ-
ência absoluta ou relativa (NÃO cumulativa), ou seja, quantas observações, ou a
fração de observações para um dado valor da variável em estudo (ou classe de
valores). A altura das barras representa o que foi mais observado;

14
Anos de estudo das pessoas de 10 anos e mais - 2005
%
35

30

25

20

15

10

0
Sem instrução e 1 a 3 anos 4 a 7 anos 8 a 10 anos 11 anos e mais
menos de 1 ano
Homens Mulheres

Figura 3 – Técnica de Visualização de Dados – Gráfico de Barras


Fonte:Adaptado de IBGE

• Técnica de Visualização de Dados – Gráfico de Setores ou Pizza: utilizado


para representar uma série categórica. Nesse tipo de gráfico, todo o conjunto
de dados é representado por um círculo, e cada categoria é representada por
parte desse círculo (isto é, um setor);

Figura 4 – Técnica de Visualização de Dados – Gráfico de Setores ou Pizza


• Técnica de Visualização de Dados – Gráfico de Dispersão: mostra as rela-
ções entre os valores numéricos em várias sequências de dados ou plotam dois
grupos de números como uma sequência de coordenadas XY;

15
15
UNIDADE Análise de Dados

5,00

4,50

4,00

3,50

3,00

2,50

2,00
10/09 17/09 24/09 01/10 05/10

Figura 5 – Técnica de Visualização de Dados – Gráfico de Dispersão


• Técnica de Visualização de Dados – Histograma: é a representação de
uma distribuição de frequências, por meio de um gráfico de barras, normal-
mente de um ou mais atributos da base. O histograma é uma representação
das frequências tabuladas;

Histograma do Ruído Branco

120

100
Contagem

80
60
40
20
0
-4 -2 0 2 4

Amplitude do ruído

Figura 6 – Exemplo de histograma

Na figura acima, aproximadamente, 20 elementos com amplitude de ruído igual a 2.

Ferramentas para visualização de dados


Existem várias ferramentas que permitem a visualização de dados. Algumas
mais simples, como, por exemplo, a ferramenta do pacote Office, o Excel, que é
simples, fácil de manusear e de conhecimento da maioria dos usuários. Mas tam-
bém podemos encontrar outro tipo de ferramenta muito mais potente, no entanto,
mais complexa também, como o Tableau. Essa ferramenta provê mais segurança
no compartilhamento dos dados, permite a implantação local e/ou na nuvem e
permite a geração de novos gráficos e painéis de apresentação de dados a qualquer
momento, inclusive on-line.

16
Análise Preditiva
Na sociedade atual, é imprescindível que as decisões sejam altamente precisas e
repetidas. Para isso, as empresas estão usando análise preditiva para literalmente
tocar para o futuro e, com isso, definir decisões de negócio e processos.
Sua relevância no segmento de mercado cresceu juntamente com a quantidade
de dados sendo capturados pelas pessoas (por exemplo, a partir de transações on-
line e redes sociais) e sensores (por exemplo, a partir de dispositivos móveis GPS),
bem como a disponibilidade do poder de processamento com custo reduzido, seja
baseado em Hadoop ou na Nuvem.
Esse tipo de análise é o mais indicado para quem precisa prever algum tipo de
comportamento ou resultado. Essa técnica procura analisar dados relevantes ao
longo do tempo, buscando padrões comportamentais e suas variações de acordo
com cada contexto, a fim de prever como será o comportamento de seu público ou
mercado no futuro, dadas as condições atuais. É muito útil para avaliar tendências
de consumo e flutuações econômicas. 
A análise preditiva é o uso de dados, algoritmos estatísticos e técnicas de
machine learning para identificar a probabilidade de resultados futuros com base
em dados históricos.
O objetivo é ir além da estatística descritiva e dos relatórios sobre o que aconteceu
para fornecer uma melhor avaliação sobre o que vai acontecer no futuro. O resultado
final é a simplificação da tomada de decisão e a geração de novos insights que levem
a melhores ações.
Os modelos preditivos utilizam os resultados conhecidos para desenvolver (ou
treinar) um modelo que possa ser usado para prever valores para dados diferentes
ou novos. Os resultados da modelagem em previsões que representam a probabili-
dade da variável-alvo (por exemplo, a receita) com base na importância estimada a
partir de um conjunto de variáveis de entrada. Isso é diferente dos modelos descri-
tivos, que ajudam a entender o que aconteceu, ou dos modelos de diagnóstico, que
ajudam a entender as principais relações e a determinar por que algo aconteceu.
Cada vez mais organizações estão se voltando para a análise preditiva visando au-
mentar seu lucro e sua vantagem competitiva.

Isso ocorre, nesse momento, porque:


• Crescentes volumes e tipos de dados e mais interesse na utilização de dados
para produzir informações valiosas;
• Computadores mais rápidos e mais baratos e softwares mais fáceis de usar;
• Agravamento das condições econômicas e uma necessidade de diferencia-
ção competitiva.

Com o software interativo e fácil de usar se tornando cada vez mais predomi-
nante, a análise preditiva não é mais apenas o domínio de matemáticos e estatís-
ticos. Os analistas de negócios e especialistas na linha de negócios também estão
usando essas tecnologias.

17
17
UNIDADE Análise de Dados

A análise é capaz de produzir estatísticas confiáveis, previsões e contagens. É


até um sistema baseado em regras, no entanto, para decidir sobre o que fazer com
todo o conhecimento que é voltado para dados. Por exemplo, pode-se usar uma
série de regras para acionar decisões de negócios, dependendo do resultado obtido
por um modelo preditivo.

Por exemplo, se um modelo existe para prever o risco de perda de clientes ou


deserção, podemos colocar regras conhecidas para reduzir a rotatividade no local
a fim de definir as decisões de negócios específicas de acordo com diferentes níveis
de risco. Portanto, se o risco for alto, podemos dar a um cliente um desconto de
20% em sua próxima compra, mas se o risco for muito alto, podemos, então, dar
um desconto de 50%.

Benefícios da Análise Preditiva


Um relatório de 2014 do TDWI descobriu que a análise preditiva é utilizada ba-
sicamente para realizar cinco tarefas:
1. Identificar tendências;
2. Entender os clientes;
3. Melhorar o desempenho dos negócios;
4. Promover a tomada de decisão estratégica;
5. Prever o comportamento.

Algumas das aplicações mais comuns das análises preditivas incluem:


• Operações: O analytics desempenha um papel importante nas operações
para muitas organizações, permitindo que elas operem sem problemas e de
forma eficiente. Muitas empresas utilizam modelos preditivos para prever o es-
toque e gerenciar os recursos das fábricas. Outras os usam para necessidades
mais especializadas. Companhias aéreas usam a análise preditiva para decidir
quantos bilhetes devem ser vendidos por cada preço para um voo. Hotéis ten-
tam prever o número de hóspedes esperado em qualquer noite para ajustar os
preços para maximizar a ocupação e aumentar a receita. A análise preditiva
de dados também é usada em recursos humanos, manutenção de ativos, no
governo e ciências da vida e saúde;
• Risco: Um dos exemplos mais conhecidos de análise preditiva é a pontuação
de crédito. As pontuações de crédito são usadas de modo onipresente para
avaliar a probabilidade de inadimplência de um comprador para as compras
que vão desde casas até carros e seguros. A pontuação de crédito é um núme-
ro gerado por um modelo preditivo que incorpora todos os dados relevantes
para a capacidade de crédito de uma pessoa. A análise preditiva de dados tem
outros usos relacionados aos riscos, incluindo reclamações e cobranças;
• Detecção de fraude e segurança: A análise preditiva pode ajudar a pôr um
fim às perdas ocorridas por atividades fraudulentas antes que elas ocorram.
Ao combinar vários métodos de detecção, regras empresariais, detecção de

18
anomalias, análises preditivas, link analytics etc. É possível obter maior pre-
cisão e melhor desempenho preditivo. E, no mundo de hoje, a ciberseguran-
ça é uma preocupação crescente. A análise comportamental de alto desem-
penho examina todas as ações em uma rede em tempo real para detectar
anormalidades que podem indicar fraude ocupacional, vulnerabilidades no
dia zero e ameaças persistentes avançadas;
• Marketing: O uso da análise preditiva pode ajudar a entender melhor os
clientes. A maioria das organizações modernas usa a análise de dados para
determinar as respostas ou compras dos clientes, bem como para promover
oportunidades de vendas cruzadas. Os modelos preditivos ajudam as empresas
a atrair, reter e desenvolver os clientes mais rentáveis e maximizar seus gastos
com marketing.

Modelo Preditivo
A análise preditiva é o uso de dados e algoritmos para identificar a probabili-
dade de resultados futuros com base em dados históricos. Os modelos preditivos
utilizam os resultados conhecidos para desenvolver e treinar um modelo que possa
ser usado para prever valores para dados diferentes ou novos, usando para isso um
algoritmo preditivo de Data Mining.

Um algoritmo preditivo é uma função que, dado um conjunto de exemplos rotu-


lados, constrói um estimador. Se o domínio dos rótulos for um conjunto de valores
nominais, estamos perante um problema de classificação, e o estimador criado
é um classificador. Se o domínio for um conjunto infinito e ordenado de valores,
estamos perante um problema de regressão e é criado um regressor. Os principais
algoritmos, de classificação e regressão, foram vistos na Unidade 3.

Um estimador (classificador ou regressor) é uma função que atribui a uma das


classes, ou um valor real, a um exemplo não rotulado.

Figura 7 – Análise Preditiva


Fonte: Reprodução

19
19
UNIDADE Análise de Dados

Análise Prescritiva
Segue um modelo similar à análise preditiva, porém, com objetivos ligeiramente
diferentes; ao invés de tentar prever um determinado acontecimento, essa análise
busca trazer informações de consequências desse acontecimento. Para efeitos de
comparação, enquanto o modelo preditivo focaria em tendências de consumo do
seu público, por exemplo, a análise prescritiva busca trazer um panorama dos tipos
de produto que serão mais desejados ou o impacto que essas tendências terão no
montante de vendas. Modelo muito útil, principalmente se aliado com o anterior. 

A análise prescritiva fornece às empresas recomendações sobre ações ideais


para atingir objetivos de negócios, como atendimento ao cliente, lucros e eficiência
operacional. As soluções de análise prescritiva usam a tecnologia de otimização
para resolver decisões complexas com milhões de variáveis de decisão e restrições.

As análises prescritivas permitem melhores decisões sobre o que fazer. A deci-


são pode ser enviar uma tarefa automatizada para um tomador de decisões huma-
no junto com um conjunto de próximas recomendações de ação, ou para enviar um
próximo comando de ação para outro sistema.

Figura 8 – Análise Prescritiva


Fonte: Reprodução

A análise prescritiva, juntamente com a análise preditiva, ajuda a criar uma es-
tratégia e tomada de decisão baseada em dados.

A diferença entre análise preditiva e prescritiva é que a análise preditiva ajuda a


prever o que vai acontecer no futuro, enquanto a análise prescritiva oferece opções
estratégicas para realizar alterações do futuro.

Exemplo do uso da junção da análise preditiva com a análise prescritiva: vamos


pensar em um loja de varejo, que comercializa roupas e oferece trocas grátis em
casa a clientes fiéis para que eles experimentem os produtos.

Um modelo preditivo, que analisa o comportamento do consumidor, supõe que


os clientes ficarão com todas roupas, no entanto, um cliente compra nove roupas e
fica somente com uma.

20
A empresa pagou pela troca supondo que o cliente ficaria com nove peças de
roupa, mas o algoritmo não levou em consideração o comportamento do cliente,
fazendo com que a empresa tivesse uma perda nessa transação.

A análise prescritiva, pode evitar essa perda, por exemplo apontando que a
empresa ofertasse opções de troca na loja para clientes que fazem devoluções,
incentivando outra compra ou notificando clientes sobre a necessidade de pagar
pela devolução.

Análise Diagnóstica
Essa análise é feita após o trabalho, de coleta de dados e outros tipos de análises,
serem realizados.  Perguntas importantes fundamentais para esse tipo de análise
são: Quem fez? Quando fez? Onde fez? Por que fez?  Seu objetivo é responder à
pergunta “Por que aconteceu?”. Nesse modelo, o foco está na relação de causas
e consequências percebidas ao longo do tempo, dentro de um determinado tema.
Assim, a análise diagnóstica funciona baseada na coleta de dados relacionados a
um determinado assunto, cruzando informações com o objetivo de entender quais
fatores influenciaram o resultado atual. Bastante utilizado em vendas, esse modelo
funciona bem em conjunto com análises preditivas, servindo de base para as pro-
jeções futuras. Análises diagnósticas também são úteis para entender quais fatores
devem ser ajustados em determinadas ações, a fim de obter os resultados desejados.

Figura 9 – Análise Diagnóstica


Fonte: Reprodução

Exemplo do Uso de Análise Diagnóstica: um mercado precisa vender um


determinado produto que está no estoque, pode utilizar a análise diagnóstica para
compreender o perfil do cliente que pode vir a comprar esse produto, criando cam-
panhas direcionadas e aumentando o ROI (retorno sobre o investimento).

Outro exemplo é que, através desse tipo de análise, pode-se chegar à conclusão
de que a perda de clientes ocorreu porque os preços dos produtos do mercado es-
tavam altos quando comparados com a concorrência.

21
21
UNIDADE Análise de Dados

Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:

 Livros
Banco de dados: Projeto e Implementação
MACHADO, F. N. R. Banco de dados: projeto e implementação. São Paulo: Érica,
2004. 398 p.
Projeto de Banco de Dados: Uma Visão Prática
MACHADO, F. N. R.; ABREU, M. P. de. Projeto de banco de dados: uma visão
prática. 15 ed. São Paulo: Érica, 2007. 300 p.
OCA Oracle Database 11g – Administração I
WATSON, J. OCA Oracle Database 11g – Administração I. São Paulo: Bookman
Companhia, 2009.
OCP Oracle Database 11g – Administração II
BRYLA, B. OCP Oracle Database 11g – Administração II. São Paulo: Bookman
Companhia, 2009.
OCA Oracle Database 11g – Fundamentos I ao SQL
RAMKLASS, R.; WATSON, J. Oca Oracle Database 11g – Fundamentos I ao SQL.
Rio de Janeiro: Alta Books, 2010
Projetando e Administrando Banco de Dados SQL Server 2000 .net: Como Servidor Enterprise
PATTON, R.; OGLE, J. Projetando e Administrando Banco de Dados SQL Server
2000 .net: Como Servidor Enterprise. Tradução de Andréa Barbosa Bento; Cláudia
Reali; Lineu Carneiro de Castro. Rio de Janeiro: Alta Books, 2002. 792 p.

22
Referências
CASTRO, L. N. de. Introdução à mineração de dados: conceitos básicos, algo-
ritmos e aplicações. São Paulo: Saraiva 2016.

BECKER, J. L.  Estatística básica:  transformando dados em informação. Porto


Alegre: Bookman, 2015.

DATE, C. J. Introdução a sistemas de bancos de dados. Tradução [8th. ed.


Americana] de Daniel Vieira. Revisão técnica Sérgio Lifschitz. Rio de Janeiro:
Elsevier, 2003. 865 p.

ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. 6.ed. São Paulo:


Pearson, 2011.

ELMASRI, R.; NAVATHE, S. B. Sistemas de Banco de Dados. Tradução de Ma-


rília Guimarães Pinheiro et al. Revisão técnica Luis Ricardo de Figueiredo. 4. ed.
São Paulo: Pearson Addison Wesley, 2005. 724 p.

GILLENSON, M. L. Fundamentos de sistemas de gerência de banco de dados.


Tradução de Acauan Fernandes; Elvira Maria Antunes Uchoa. Rio de Janeiro: LTC,
2006. 304 p.

KWECKO, V. et al. Ciência de dados aplicada na análise de processos cognitivos em


grupos sociais: um estudo de caso. In: Brazilian Symposium on Computers in
Education (Simpósio Brasileiro de Informática na Educação – SBIE). 2018. p. 1543.

SILBERSCHATZ, A., KORTH, H. F.; SUDARSHAN, S. Sistema de Banco de


Dados. Tradução de Daniel Vieira. Revisão técnica Luis Ricardo de Figueiredo;
Caetano Traina Junior. 3. ed. São Paulo: Pearson Makron Books, 2007. 778 p.

23
23

Você também pode gostar