Você está na página 1de 28

Aula 1

ANÁLISE DE DADOS NA TRANSFORMAÇÃO DIGITAL


De acordo com Castro e Ferrari (2016), a Mineração de Dados, ou Data Mining, é o processo que utiliza
ferramentas, principalmente matemáticas, para extrair dados de uma dada fonte, re�ná-los e gerar
conhecimento, garantindo dessa forma aplicação para esses dados.

26 minutos

INTRODUÇÃO

A Mineração de Dados, também conhecida por seu nome em inglês, Data Mining, é uma área inovadora e de
extrema importância, tanto para o meio acadêmico quanto para o empresarial. A necessidade da aplicação

das técnicas de mineração de dados vem se intensi�cando nos últimos anos, principalmente com a evolução

de redes sociais e a migração de operações para o mundo virtual, como compras de produtos e atividades
�nanceiras.

Meu objetivo, como resultado desta aula, é lhe apresentar a importância dessa área de estudo, assim como a

introdução aos conceitos iniciais e fundamentas para se aprofundar nos conteúdos de Data Mining.

Desejo a você, aluno, um bom início aos estudos de Mineração de Dados, e que este material seja de grande

in�uência para cativar sua vontade em se aprofundar nesse incrível campo de estudo.

OS DADOS NA TOMADA DE DECISÃO

De acordo com Castro e Ferrari (2016), a Mineração de Dados, ou Data Mining, é o processo que utiliza

ferramentas, principalmente matemáticas, para extrair dados de uma dada fonte, re�ná-los e gerar
conhecimento, garantindo dessa forma aplicação para esses dados. Esse processo tem como base a

mineração de materiais encontrados na natureza, que gera produtos valiosos, como materiais preciosos, a

partir de extração e tratamento de materiais brutos.

Os pro�ssionais quali�cados na área são bastante valorizados, pois possuem grande in�uência na tomada de

decisão, desde tarefas simples até processos de magnitude mundial. Segundo Amaral (2016), o grande �uxo
de informações atual que movimenta a sociedade está em uma escala gigantesca, devido à grande
quantidade de fontes de dados, como sensores e celulares, e pela velocidade com que esses dados �uem

pelas redes sociais, sites de busca, noticiários e aplicativos.

O pro�ssional responsável pela Mineração de Dados deve conseguir lidar com esse ritmo de transferência de

dados e estar apto a �ltrar qual parte desses dados é útil para sua pesquisa, seja pesquisa para produção de
um artigo ou pesquisa para preenchimento de per�l do público-alvo da empresa em que trabalha.

Existem várias atividades, atualmente, que utilizam a Mineração de Dados para melhorar a e�ciência de sua
gestão com base na tomada de decisão. Um exemplo muito comum é a de anúncios que nos são
recomendados em plataformas de vídeo, redes socais ou sites de entretenimento geral. Isso acontece, pois
alguns serviços como redes sociais e mecanismos de buscas aprendem nossas preferências e posteriormente

relacionam com quais tipos de conteúdo e produtos estamos interessados, e �nalmente disponibilizam
anúncios personalizados para cada usuário.

Esse tipo de processo interfere diretamente no investimento �nanceiro de empresas, por agora possuírem os

dados dos seus possíveis usuários, sabendo em quais públicos devem intensi�car ou reduzir suas

propagandas. Outro resultado desse processo de mineração é o feedback (retorno) preciso e quase que
imediato do consumidor, assim, quem está vendendo um produto ou serviço, agora sabe com detalhes o que
aprimorar e o que os clientes desejam da empresa, podendo mais facilmente decidir as alterações a serem
feitas, sem correr muitos riscos.
Existem, também, exemplos voltados para a área cientí�ca, que dependem da e�ciência adquirida via
mineração de dados para tomar decisões corretas e precisas. Um desses exemplos é da aplicação de Data

Mining no gerenciamento de redes elétricas, que podem ser desde redes domésticas até redes de um país. Ao
analisar a rede elétrica de uma casa, existem várias grandezas envolvidas em seu estudo, tensão, corrente,

reatância, capacitância, entre múltiplas outras, portanto, existem muitos dados na amostra de um intervalo de
24 horas do circuito elétrico de uma casa.

Ao tentar identi�car qual a causa de um comportamento anômalo na rede, existem diversas possibilidades, e
analisar todas as grandezas pode custar um tempo grandioso, com a mineração dos dados da rede elétrica é
possível identi�car qual grandeza possui maior in�uência no circuito e assim fazer uma ordem de prioridade

de quais são as possíveis causas do problema. Essa tomada de decisão é aplicada não só em situações de

circuitos domésticos, mas também é adaptada para magnitudes maiores, sendo utilizada para otimização da
segurança da distribuição energética de países (COSTA; GOMES; COSTA, 2021).

VIDEOAULA: OS DADOS NA TOMADA DE DECISÃO

No vídeo, é apresentada a importância da extração de dados e utilização deles para tomadas de decisão,

como a utilização de informações sobre produtos para realizar compras e análises sociais no setor da saúde.

Também é utilizada, como exemplo, a in�uência das redes sociais na tomada de decisão nas eleições de 2016

nos Estados Unidos.

Videoaula: Os dados na tomada de decisão

Para visualizar o objeto, acesse seu material digital.

DADOS, INFORMAÇÃO E CONHECIMENTO

Estudar os conceitos de Mineração de Dados é um componente fundamental para se aprofundar em seus

conteúdos, pois permite abstrair e compreender conceitos mais complexos e utilizar o que foi aprendido para
superar obstáculos, portanto, para poder iniciar de formar adequada os estudos na área de Mineração de

Dados, é necessário compreender fundamentos que formam a base desse conteúdo, iniciando pelos

elementos mais fundamentais destes, os dados.

Segundo Silva, Peres e Boscarioli (2016), os dados são elementos resultantes de medições ou produções,

podendo ser números, textos, entre outros tipos de dados. Os dados podem ser considerados as partículas
básicas, ou matéria-prima, no universo computacional. Esses elementos compõem todas as estruturas virtuais
que serão estudadas não só na área de Mineração de Dados, mas também em outros campos de estudo que

envolvem aspectos computacionais. Eles por si só não apresentam qualquer mensagem ou conteúdo, sendo
apenas partículas brutas que exigem análise para poder possuir algum sentido. Os dados podem ser

representados em bits ou bytes (1 byte = 8 bits), que dependendo de sua magnitude podem chegar a kilobytes
(kB), megabytes (MB), gigabytes (GB), e assim por diante.

Quando um conjunto de dados passa a ter uma orientação e organização, ele passa a formar informação,

podendo agora representar um conteúdo ou uma mensagem, segundo Silva, Peres e Boscarioli (2016). A
informação é composta por um conjunto de dados que passou por extração e �ltragem, portanto esses dados
agora possuem um “formato” ao invés de serem apenas dados brutos dispostos de forma aleatória em sem
signi�cado. Segundo Madden (2000, p. 2), “Informação é qualquer conjunto de dados que apresente caráter

informativo após o processo de interpretação”.

Após a construção da informação com a utilização dos dados, pode-se chegar ao conceito de conhecimento.

Quando uma ou mais informações passam a ter uma aplicação, esse conjunto de informações se transforma
em conhecimento, portanto as informações passam a ser encaixadas em um contexto. O conhecimento pode

ser relacionado com a capacidade cognitiva, podendo assumir caraterísticas objetivas e subjetivas, de acordo
com Bolisani e Bratianu (2018), portanto a capacidade de compreender algo e relacionar com outros
conteúdos. Quando a informação é incorporada em um produto ou material, como livros, revistas e artigos,
por meio de �guras ou grá�cos, é dito que foi gerado um produto de conhecimento. O grá�co da Figura 1 é
um exemplo de incorporação de informação em um produto, o livro Making Sense of Data II, de Myatt e
Johnson (2009).

Figura 1 | Exemplo de produto do conhecimento

Fonte: Myatt e Johnson (2009).

Apesar de causar uma primeira impressão de serem conceitos puramente teóricos, compreender claramente
esses termos, principalmente as relações entre eles, é de grande importância para trabalhar com os

processos de Data Mining conforme formos nos aprofundando no estudo dessa área. Uma ótima forma de

praticar esses conceitos é analisar elementos no seu cotidiano, ao ler um livro, visualizar uma tabela ou
acessar postagens nas redes sociais, tente classi�car se o devido conteúdo é um dado, uma informação ou um
conhecimento, esse tipo de exercício ajuda a desenvolver naturalidade quando você precisar reconhecer a

classi�cação do elemento com que está trabalhando.

VIDEOAULA: DADOS, INFORMAÇÃO E CONHECIMENTO

No vídeo, são introduzidos três conceitos fundamentais da Mineração de Dados, sendo eles: “Dados”,

“Informação” e “Conhecimento”. Para facilitar a compreensão, são utilizados métodos visuais e ilustrativos e
algumas analogias, para que mesmo as pessoas leigas no assunto possam compreender o conteúdo ao

relacionar com elementos do seu cotidiano.

Videoaula: Dados, informação e conhecimento

Para visualizar o objeto, acesse seu material digital.

DADOS ESTRUTURADOS, DADOS NÃO ESTRUTURADOS E CONVENÇÕES

Devido aos conjuntos de dados volumosos, variados e velozes trabalhados na sociedade moderna, conhecidos
como Big Data de acordo com Amaral (2016), é comum se encontrar em situações de caos e desordem ao
buscar um arquivo especí�co, essa condição pode acontecer em cenários pequenos, como ao buscar uma
foto na galeria do seu celular, até cenários de magnitude mais complexa, como buscar um arquivo dentro de

vários servidores de uma empresa multinacional, em que são encontradas quantidades volumosas de dados.
Nesse contexto, é necessário desenvolver a prática de organizar esses dados nas suas plataformas de
armazenamento, para melhorar a e�ciência da análise descritiva dos dados, processo em que são utilizados

métodos estatísticos para avaliar possíveis imprecisões e tendências nos dados, segundo Silva, Peres e
Boscarioli (2016).

Apesar de serem descritos como conteúdos que não apresentam uma mensagem ou signi�cados, os dados
podem ser encontrados sob um certo esquema de organização, que auxilia principalmente na �ltragem
desses dados, por possuírem padrões e nomenclaturas em sua ordenação. Também é possível encontrar
dados sem qualquer organização ou ordenação, sem as devidas nomenclaturas e totalmente misturados,

características que di�cultam bastante as tarefas de quem precisa operar com base nesses dados. Por causa
dessas possibilidades, iremos estudar neste material a diferença entre duas classi�cações importantíssimas

quanto à organização dos dados, em que temos os dados estruturados e os dados não estruturados.

Os dados estruturados são, conforme a nomenclatura, dados que se encontram dentro uma estrutura
composta por padrões e regras, facilmente compreensíveis para os que acessam esses arquivos, segundo

Silva, Peres e Boscarioli (2016). Esse tipo de estruturação de dados é muito comum em tabelas e planilhas,
onde as organizações dos dados são padronizadas, cada parâmetro ou atributo possui nomenclatura e existe
uma clara e objetiva ordenação dos dados, como ordem crescente dos valores numéricos ou ordem alfabética
dos elementos textuais. Esse tipo de organização poupa o tempo de análise de ambos, usuário e máquina,

pois arquivos corretamente padronizados e com o mínimo de incompletude, facilitam a varredura dos dados e
reduz a necessidade de futuras �ltragens. A Figura 2 apresenta uma ilustração de dados estruturados.

Figura 2 | Base de dados sobre candidatos com associação de signi�cado

Fonte: Silva, Peres e Boscarioli (2016).

Por outro lado, de acordo com Sharda, Delen e Turban (2019), os dados não estruturados, ou
semiestruturados, apresentam o mínimo de organização possível e má estruturação dos títulos dos atributos,

esse tipo de falta de organização também é perceptível pela ausência de uma lógica clara e intuitiva quanto à
ordenação de valores. Apesar de ser preferível evitar esse tipo de má estruturação dos dados, é comum
observar esse cenário em redes sociais, onde em uma mesma tela é possível observar imagens, vídeos, textos,

gifs sem separação por categorias ou padrões.

Os dados, estruturados e não estruturados, podem ser classi�cados em subcategorias, como categóricos,
numéricos, textuais, entre outras classi�cações. A Figura 3 apresenta as diversas subcategorias dos dados

quanto à sua taxonomia.

Figura 3 | Taxonomia dos dados

Fonte: Sharda, Delen e Turban (2019).

Com o objetivo de incentivar a adoção de padrões organizacionais e consequentemente facilitar as atividades


de análise e mineração de dados, começaram a ser adotadas convenções de organização de dados, desde

nomenclatura de arquivos e variáveis até paradigmas de linguagens de programação e arquiteturas de bancos


de dados.

Um dos exemplos desse tipo de convenção é a adoção do modelo camelCase para a nomenclatura de itens
que utilizem mais de uma palavra. Nesse modelo não há espaçamento entre as palavras e, com exceção da
primeira palavra, todos os termos seguintes possuem inicial maiúscula, facilitando a clareza na leitura de

elementos com nomes complexos, como em linguagens de programação.

VIDEOAULA: DADOS ESTRUTURADOS, DADOS NÃO ESTRUTURADOS E CONVENÇÕES

No vídeo, o conteúdo abordado fala sobre duas classi�cações quanto aos dados, essas classi�cações abordam
a estruturação e organização dos dados, são utilizadas tabelas para representar de forma estrutural e visual a

diferença entre tais classi�cações. Também é abordado sobre a presença de convenções dentro do campo da
Mineração de Dados.

Videoaula: Dados estruturados, dados não estruturados e convenções


Para visualizar o objeto, acesse seu material digital.

ESTUDO DE CASO

Imagine que você trabalha com análise de dados em uma empresa do setor gastronômico e que essa

empresa deseja lançar um produto novo no mercado para aumentar o número de vendas, porém é

necessário realizar uma análise das preferências dos seus clientes para ter certeza de que seja realizada a

melhor tomada de decisão. O produto em questão é um novo sabor de pizza e é necessário decidir entre três
novos sabores. Para que seja escolhido qual será lançado, é necessária a análise dos dados sobre os clientes

da empresa, os dados estão distribuídos em duas tabelas como apresentados abaixo.

Tabela 1 | Sabores novos que os clientes desejam

Faixa de Idade Pizzas no Mês por Cliente Sabor Desejado

Entre 14 e 18 4 Canadense

Entre 18 e 24 7 4 Queijos

Entre 24 e 32 5 Abacaxi

Fonte: elaborada pelo autor.

Tabela 2 | Clientes da empresa

Faixa de Idade Quantidade de Clientes Tipo de Pagamento

Entre 14 e 18 300 Dinheiro

Entre 18 e 24 200 Crédito

Entre 24 e 32 150 Débito

Fonte: elaborada pelo autor.

Com base nessas tabelas, é pedido que você consiga utilizar esses dados para realizar uma análise que irá ser
responsável pela tomada de decisão da empresa, portanto você precisará gerar informação a partir desses

dados. Para justi�car os seus resultados, logo, a decisão tomada, é necessário que você consiga transformar
essa informação em conhecimento, para isso é sugerido que você aplique as análises no contexto da
empresa, gerando uma tabela que comprove o motivo de dado sabor de pizza ser a melhor opção para a

empresa.

RESOLUÇÃO DO ESTUDO DE CASO

Para realizar a resolução do estudo de caso proposto, é necessário fazer uma análise do cenário descrito, ou
seja, analisar a situação da empresa que deseja lançar um sabor novo de pizza. Além disso, é fundamental

relacionar o problema que se deseja resolver com os dados disponíveis e tentar desenvolver uma resolução
partindo desses dados.

Ao conseguir extrair e �ltrar os dados, é formada a informação sobre os clientes e seus respectivos consumos
do produto, para esse estudo de caso é necessário gerar a informação de qual sabor vai aumentar a
quantidade de vendas da empresa. Portanto, é possível relacionar a quantidade de pizzas por mês com a

quantidade de cliente em cada faixa de idade, gerando a Tabela 3 apresentada abaixo.

Tabela 3 | Total de pizzas no mês por faixa de idade


Faixa de Idade Pizzas por Mês Quantidade de Clientes Total de Pizzas

Entre 14 e 18 4 300 4 x 300 = 1200

Entre 18 e 24 7 200 7 x 200 = 1400

Entre 24 e 32 5 150 5 x 150 = 750

Fonte: elaborada pelo autor.

Na Tabela 3 são apresentadas as quantidades de pizza por cada faixa de idade no mês. Esses dados podem
ser estruturados de forma diferente, adotando a ordem com base na quantidade de pizzas por faixa de idade,

resultando na Tabela 4.

Tabela 4 | Total de pizzas no mês (ordenado por total de pizzas)

Faixa de Idade Pizzas por Mês Quantidade de Clientes Total de Pizzas por Mês

Entre 18 e 24 7 200 1400

Entre 14 e 18 4 300 1200

Entre 24 e 32 5 150 750

Fonte: elaborada pelo autor.

A informação, proporcionada pela geração da Tabela 4, deve então ser aplicada ao contexto do problema da

empresa.

Quando aplicada, a informação se transforma em conhecimento sobre qual a melhor decisão a ser tomada,

você vai conseguir veri�car que o sabor que atenderá a maior quantidade de clientes possível é o sabor de “4
Queijos”, portanto a empresa deve investir em lançar esse novo sabor nas suas opções para ter o maior lucro

possível dentre as três opções disponíveis.

 Saiba mais

Caso deseje aprofundar seus estudos na parte conceitual da Mineração de Dados, para aumentar seu
vocabulário de fundamentos na área, recomendo o material Introduction to Data Mining do professor

Saman Siadati, disponível de forma gratuita no DOI: 10.13140/RG.2.2.21050.21447. Nesse material o


professor Saman, que é um excelente pesquisador nas áreas de Mineração de Dados e Aprendizagem de

Máquina, traz um pouco da história da linha de pesquisa de Data Mining, além de explicar sobre algumas

etapas e conceitos novos dentro dessa área.

Se você estiver interessado em começar a explorar mais sobre esse campo de estudo de forma prática,
uma ferramenta gratuita e de alta popularidade é o “Weka”, disponível em: https://www.cs.waikato.ac.nz
/ml/weka/. Nessa ferramenta você encontra ferramentas para análises de dados e modelagem preditiva,
além de possuir várias formas de ilustração dos algoritmos e seus resultados, facilitando o entendimento

e gerando produtos de conhecimento.

Vamos então revisar os principais conceitos estudados nesta aula.

Data Mining: é uma área de estudos que busca descobrir padrões por meio da extração e �ltragem de dados.

Dados: são as estruturas mais básicas na Mineração de Dados, não possuem organização, necessitando de
tratamento para que tenham algum signi�cado.

Informação: é um conjunto de dados devidamente tratado, que agora apresenta um signi�cado e uma
orientação.

Conhecimento: uma ou mais informações aplicadas em um contexto, muitas vezes relacionado com as

capacidades cognitivas de aprendizagem e compreensão.

Figura 1 | Relação dos conceitos de Dados, Informação e Conhecimento

Fonte: elaborada pelo autor.

Estruturação dos dados: os dados estruturados são aqueles que possuem padrões organizacionais e fácil

compreensão, os dados não estruturados demonstram ausência de lógica em sua organização, além de serem
de difícil entendimento.

Convenções: são padrões e regras estabelecidas para facilitar a leitura e compreensão de pessoas e

máquinas, que podem existir em nomenclaturas de variáveis, pontuação de valores, entre outras aplicações.

Resolução do Estudo de Caso

Para visualizar o objeto, acesse seu material digital.

Aula 2

CICLO DE VIDA DA INFORMAÇÃO INTELIGENTE


Existe uma relação forte e direta entre dados e informação, sendo o segundo formado pelo primeiro, de
acordo com Silva, Peres e Boscarioli (2016). Entretanto, existe a necessidade de demonstrar como, de
fato, transformar um elemento em outro.

22 minutos

INTRODUÇÃO

Nesta aula serão apresentadas as etapas que formam o processo de análise exploratória dos dados, portanto,
são devidamente exibidas como são encaixadas as ações, usualmente feitas por pro�ssionais da área de

mineração de dados, ao executarem tomadas de decisão e análises de resultado.

Após ser apresentado aos conceitos fundamentais e introdutórios do campo de Data Mining, você pode

começar a exercer a implementação de seus conhecimentos em cenários da vida real para iniciar suas
experiências práticas com base no conteúdo teórico e conceitual das aulas anteriores. Portanto, nesta aula
serão utilizados os conceitos como dados, informação, conhecimento e tomada de decisão, vistos

anteriormente, mas aplicados de forma uni�cada e sequencial.

Eu lhe desejo, estudante, sucesso no aprendizado desta aula e que você consiga compreender de forma suave

este conteúdo. Caso perceba di�culdades nesta aula, sugiro revisar os conteúdos da aula anterior.
AQUISIÇÃO DE DADOS E GERAÇÃO DA INFORMAÇÃO

Existe uma relação forte e direta entre dados e informação, sendo o segundo formado pelo primeiro, de
acordo com Silva, Peres e Boscarioli (2016). Entretanto, existe a necessidade de demonstrar como, de fato,

transformar um elemento em outro. Para que de forma suave seja possível transcender esses conceitos, é
importante ter um conhecimento razoável em relação às ferramentas, preferencialmente computacionais,

que lhe permitam aplicar o que foi estudado por você.

Iniciando com os dados, o processo de análise depende do cenário em que sua exploração estará inserida,

portanto a análise é iniciada no processo de escolha do contexto estudado, de acordo com Sharda, Delen e
Turban (2019). Após a de�nição do objeto de estudo, deve-se de�nir o que, dentro desse campo, será

estudado, já que na natureza existem in�nitas variáveis, cada uma com in�nitas amostras, toda e qualquer

análise precisa de uma limitação em seu domínio de busca, pois não existem ferramentas atuais capazes de
processar a magnitude de dados que existem na natureza. Seguindo com o processo de estruturação da

análise, com as variáveis ou os atributos bem de�nidos, devem ser escolhidas as formas de alimentação de
dados que funcionarão como entrada para o algoritmo a ser construído. Segundo Silva, Peres e Boscarioli

(2016), existem diferentes caraterísticas quanto à organização dos dados onde você encontrará as entradas
que deseja, como explicado abaixo:

• Dados não estruturados: se os dados que você deseja utilizar estão dispersos pela natureza, ainda que a

natureza seja virtual, será necessário que você consiga extrair esses dados da fonte e aplique um processo de

�ltragem e organização, a �m de estruturar estes para uso posterior. As principais operações dessa etapa
consistem na retirada de ruídos desses dados, portanto, a remoção de dados incompletos ou dados oriundos

de medições incorretas, muitas vezes é proporcionada por erro nos aparelhos ou ferramentas utilizadas.
Quando a fonte desses dados se encontra em ambiente virtual, como as redes sociais, os dados encontram-se
dispersos e sem organização como falado em aula anterior, portanto, o processo de captação dos dados exige

um processo que possibilite a extração apenas dos dados desejados e logo a seguir suas ordenações.

• Dados estruturados: diferente das condições da classi�cação anterior, quando os dados desejados para seu
estudo são encontrados em um padrão de organização, isso facilita muito o processo de captação deles por

reduzir a quantidade de tratamentos necessários. Esse tipo de dado se encontra geralmente em plataformas
especializadas com esse tipo de serviço, como a plataforma Kaggle, disponível em: https://www.kaggle.com

/datasets. Acesso em: 22 nov. 2021.

• Dados semiestruturados: são caracterizados por serem dados não estruturados com um dado nível de

organização aplicado, facilitando o seu processamento, como futuras alterações. Um dos exemplos desse tipo
de organização são dados desordenados classi�cados por tags, que são marcações descritivas sobre os

objetos, facilitando processos de busca.

Após o devido tratamento dos dados, eles estão aptos a trabalharem com a entrada do seu processo,
portanto eles além de possuírem uma orientação, também possuem signi�cado. Ao alcançar essas

caraterísticas, o conjunto de dados passa a se tornar informação, então é possível identi�car padrões e
compreender possíveis mensagens oriundas desses conjuntos de dados. A etapa de geração da informação se
inicia quando os dados são tratados e, após a construção da informação, a próxima etapa será a estruturação

do conhecimento, que será estudada no próximo bloco.

VIDEOAULA: AQUISIÇÃO DE DADOS E GERAÇÃO DA INFORMAÇÃO

No vídeo, é iniciado o aprofundamento em conceitos fundamentais estudados na aula anterior, por meio de
maior detalhamento de como se dão os processos da análise exploratória. Este vídeo tem como foco as

etapas iniciais de uma análise, como a escolha do objeto de estudo e variáveis analisadas.

Videoaula: Aquisição de dados e geração da informação

Para visualizar o objeto, acesse seu material digital.


O CONHECIMENTO E A DECISÃO

Existe uma longa jornada entre a decisão do cenário a ser estudado até a geração de informações que possam
impactar na exploração do estudo de caso. Após obter as informações, faz-se possível a geração de

conhecimento, entretanto essa transformação é um pouco mais complexa se comparada à transformação do


bloco anterior. Essa complexidade se ocasiona, pois a formação do conhecimento exige que a informação seja

aplicada a um contexto, portanto, um ambiente de análise, entretanto, essa execução exige o conhecimento
especí�co da área.

É importante ressaltar que tal necessidade de conhecimento especí�co da área não deve ser considerada uma
característica desmotivadora, pois nem sempre será necessário que você seja encarregado dessa tarefa. Em

equipes de pesquisa acadêmicas ou empresariais, é comum a presença de alguém responsável por dominar o
conteúdo do estudo de caso, portanto, você como responsável pela parte de Data Mining, irá focar

principalmente na metodologia do tratamento e da utilização de dados.

Após o trabalho conjunto dos métodos computacionais com a devida contribuição do especialista na área, o

conhecimento se torna um produto �nalizado, podendo ser aplicado para a solução de um problema
trabalhado ou para futuras análises e comparações do resultado de outros modelos. De acordo com Correia

Neto e Marques (2020), o conhecimento é utilizado como recurso para a execução de um processo muito
citado anteriormente, a tomada de decisão.

Segundo Yu (2011), a tomada de decisão é um processo complexo que envolve múltiplas subetapas, além de
apresentar diversas estruturas de processos para serem seguidos, que depende da capitação dos dados e da

geração de informação. De forma mais direta, a tomada de decisão de múltiplos conhecimentos apresentam

diversas alternativas e possibilidades, essas possibilidades são geradas por diferentes formas de trabalhar
com os conhecimentos, um dos exemplos mais básicos é quanto ao peso que se confere a cada resultado,

que impacta na sua possível adoção como melhor alternativa para dado problema.

Como forma de melhorar a tomada de decisão, muitos autores propuseram, e continuam aprimorando e
elaborando, modelos pré-de�nidos para servir como referência para facilitar como trabalhar com conjuntos

de conhecimentos. Um dos modelos mais populares é o Processo de Hierarquia Analítica, ou Analytic

Hierarchy Process (AHP), que ainda conforme Yu (2011) é um modelo que trabalha com múltiplos critérios,
para isso o modelo trabalha com a pontuação de diversas alternativas e escolhe a que apresentar maior
pontuação. Costa et al. (2020) utilizam o método AHP, pois ele possibilita a identi�cação dos principais
parâmetros na análise do estudo de caso.

Caso deseje se aprofundar nos estudos da tomada de decisão e ter uma introdução prática da utilização do
método AHP, recomendo a leitura do livro Pratical Decision Making, de Enrique Mu e Milagros Pereyra-Rojas

(2017). Recomendo, também, a busca de outros processos de tomada de decisão para a comparação de suas

funcionalidades e resultados.

VIDEOAULA: O CONHECIMENTO E A DECISÃO

O vídeo serve como continuação para os processos da análise exploratória iniciada no Bloco 1. Neste vídeo, é
passado como se dá o trabalho em torno do conhecimento e como a partir da relação de conhecimentos é

possível realizar a tomada de decisão, além de ser apresentado mais detalhes dela.

Videoaula: O conhecimento e a decisão

Para visualizar o objeto, acesse seu material digital.

AÇÃO DO CONHECIMENTO E RESULTADO

Quando estudamos sobre os dados, as informações e os conhecimentos, aprendemos que o conhecimento


forma o topo da pirâmide hierárquica, como ilustrado na �gura abaixo.
Figura 1 - Pirâmide hierárquica

Fonte: elaborada pelo autor.

Na Figura 1, é possível observar que os dados ocupam o maior volume e se dispõem em maior quantidade, ao
unir um conjunto, mesmo que pequeno desses dados, passamos para o próximo nível da pirâmide, a

informação. Esta é ilustrada ocupando menos espaço que os dados, mas, com base nos conteúdos anteriores,
sabe-se que ela, apesar de possuir menor volume, apresenta maior importância e in�uência. Essas
características são resultado da capacidade da informação de possuir signi�cado e poder portar uma

mensagem.

Seguindo essa linha de raciocínio, você pode inferir que o conhecimento, portanto, é o elemento da pirâmide

que apresenta maior in�uência e valor, por ser o produto re�nado de múltiplos processos, e poder causar

maior impacto nas análises. Essa valorização do conhecimento causado por sua in�uência na tomada decisão
ocorre, pois esse fenômeno está presente em todas as ações feitas por seres vivos, seja de forma racional ou

irracional. No caso dos seres humanos, a tomada de decisão racional se baseia em conhecimentos a priori,

podendo ser conhecimentos adquiridos por estudo ou experiências prévias. Para Marchisotti , Domingos e
Almeida (2018), ao descrever que o ato de realizar uma decisão faz parte da vida de qualquer ser vivo, é
apresentado também que esse padrão �ca mais evidente em ambientes organizacionais, como instituições de

ensino, empresas e interações sociais.

Voltando a trabalhar no exemplo da análise exploratória, seja empresarial ou acadêmica, é sempre desejado

que a metodologia adotada seja capaz de gerar resultados, esses resultados em grande parte dos cenários

são avaliações das consequências da tomada de decisão. É possível de�nir, portanto, que um resultado é
produto da aplicação do conhecimento por meio de uma ou mais técnicas em um cenário.

Ao tomar como exemplo uma empresa que deseja, de alguma forma, reduzir seus custos, como no exemplo
do estudo de caso da aula anterior, é necessário seguir todo o processo até que haja produção de
conhecimento. Após a obtenção do conhecimento, é realizada a tomada de decisão para solucionar o
problema em questão, ou apenas otimizar o processo que é atualmente aplicado. Após essa etapa, os

mesmos parâmetros incorporados na análise que proporcionou a tomada de decisão devem ser comparados
a seus valores antes e após as alterações ocorridas, a �m de efetivamente obter os resultados.

Em um contexto de pesquisas cientí�co-acadêmicas, é comum que os resultados iniciais não sejam


satisfatórios, ou que apresentem margem para melhoria, nesses casos é dito que os valores dos parâmetros

precisam ser sintonizados, ou ajustados, até que se obtenham os resultados ótimos, ou o mais próximo disso.
Com a evolução das ferramentas computacionais, esses ajustes são feitos com base em diversas simulações
virtuais do fenômeno, podendo replicar um fenômeno do mundo real em ambiente computacional,
permitindo ao grupo de pesquisadores que consigam realizar milhares de simulações de diferentes cenários

para descobrir quais ajustes causam maior melhoria. Perceba que todo esse processo complexo trabalha em
torno dos resultados adquiridos pelo conhecimento gerado, usando-os como referência para aprimoramento,

comprovando o motivo da importância do conhecimento na composição dos resultados.

VIDEOAULA: AÇÃO DO CONHECIMENTO E RESULTADO

O Bloco 3 apresenta o signi�cado de in�uência, portanto, comprovando a valorização do conhecimento em


estudos de análise exploratória. Também é falado com mais detalhes sobre a de�nição de resultados e como
existe, no �nal desse processo, um ciclo que utiliza os resultados como conhecimento para geração de novos
resultados.

Videoaula: Ação do conhecimento e resultado

Para visualizar o objeto, acesse seu material digital.

ESTUDO DE CASO

Imagine que você está trabalhando para uma equipe de Fórmula 1, um dos principais esportes
automobilísticos do mundo, conhecido por sua grande quantidade de dados que são analisados em tempo

real para a elaboração de táticas e tomadas de decisão durante as corridas. Em dado momento, você �ca
responsável por elaborar a estratégia que a equipe adotará quanto à decisão de pneus a serem utilizados pelo

piloto para as corridas, para isso é necessário possuir um conhecimento introdutório nos comportamentos
dos pneus quanto às condições da corrida.

No cenário analisado, existem dois tipos de pneus, o pneu macio (M), que garante maior velocidade, e o pneu
duro (D), que garante menor velocidade, entretanto os pneus macios possuem um desgaste maior do que os

pneus duros. Ambos apresentam desgaste maior ao serem submetidos a temperaturas mais altas, então

serão analisadas duas possibilidades de temperatura, corridas em que a temperatura ambiente é 25 °C (graus
celsius), e corridas em que a temperatura ambiente é 15 °C (graus celsius). A Tabela 1 apresenta as

características de cada tipo de pneu em diferentes temperaturas e quantas voltas cada um deles consegue

completar em certas condições.

Tabela 1 | Relação de desgaste dos pneus

Tipo de Pneu Temperatura Ambiente Desgaste/Volta Capacidade de Voltas

Macio 25 5% 20

Duro 25 2% 50

Macio 15 4% 25

Duro 15 1% 100

Fonte: elaborada pelo autor.

Após avaliar os valores dispostos na Tabela 1 e analisar as relações entre os dados e os conhecimentos
adquiridos por você, é desejado que você proponha diferentes táticas para que seja possível completar as

corridas, mas garantindo maior velocidade possível para o piloto do carro. Os conhecimentos que você utilizar
terão como resultado a decisão de qual tipo de pneu usar em cada uma das corridas apresentadas na Tabela
2. A Tabela 2 apresenta as próximas quatro corridas a serem percorridas, as temperaturas ambientes em cada

uma delas e a quantidade de voltas para completar cada corrida.

Tabela 2 | Próximas corridas

Corrida Temperatura Ambiente Voltas

1 25 15

2 15 22

3 25 45

4 15 70

Fonte: elaborada pelo autor.


Responda, então, qual deverá ser o pneu utilizado em cada uma das próximas quatro corridas para conseguir
terminá-la, porém, garantindo maior velocidade.

RESOLUÇÃO DO ESTUDO DE CASO

Para resolver o estudo de caso proposto, é necessário relacionar as informações adquiridas pela observação
dos dados e utilizar os conhecimentos adquiridos por você sobre as características da área. De forma mais

especí�ca, é preciso utilizar os conhecimentos de comportamento das variáveis, como tipo de pneu e suas
respectivas características, com as condições de cada corrida, para solucionar o que foi pedido.

Deve-se relacionar as duas tabelas disponíveis, o primeiro critério de decisão a ser analisado é a temperatura
da corrida, pois essa propriedade permite que você descubra quanto vai ser o desgaste por volta de cada

pneu, portanto essa é a variável principal na análise. Após saber o desgaste de cada pneu para uma dada

corrida, é preciso fazer uma comparação de quantas voltas são necessárias para completar a corrida e ver
qual tipo de pneu consegue alcançar esse número de voltas. Uma observação importante é que, se em algum

caso, dois tipos de pneu possam completar a quantidade de voltas da corrida, deve-se optar pelo tipo que irá
garantir maior velocidade.

Ao seguir essas etapas, é

Tabela 3 | Solução para as próximas corridas

Corrida Temperatura Ambiente Voltas Tipo de Pneu Sugerido

1 25 15 M

2 15 22 M

3 25 45 D

4 15 70 D

Fonte: elaborada pelo autor.

Na Tabela 3, são colocadas as corridas e suas respectivas características, assim como na Tabela 2, porém com

uma nova coluna nomeada “Tipo de Pneu Sugerido”, em que é apresentada a solução da análise, mostrando
qual foi o pneu escolhido para cada uma das quatro corridas analisadas.

 Saiba mais

Neste material foi citado um dos métodos de decisão utilizados para análise de critérios, o método AHP,
entretanto, existem vários outros métodos e ferramentas utilizados para auxiliar na tomada de decisão

com base na análise de informação e geração de conhecimento. Um desses métodos é a Árvore de


Decisão, que cria uma estrutura de etapas para representar as relações lógicas entre elementos
envolvidos na análise. Caso deseje conhecer melhor a técnica da Árvore de Decisão, recomendo a obra

Decision Trees and Random Forests: A Visual Introduction For Beginners , de Chris Smith e Mark Koming.

Uma das principais vantagens dessa técnica é que por sua popularidade e facilidade de implementação,
ela encontra-se disponível em várias ferramentas, como bibliotecas de linguagens de programação,
tendo como exemplo o MATLAB e o Python. É possível aprender sobre essas linguagens nos livros

Introdução à Computação usando Python, de Perkovic (2016), e Introdução ao MATLAB para engenheiros,
de Palm III (2013).

Os conceitos utilizados nesta aula foram os mesmos da aula anterior, em que aprendemos sobre os termos
fundamentais da Mineração de Dados, entretanto, nesta aula, estudamos como se dão, de forma mais
detalhada, as aplicações e relações entre esses conceitos. Dessa forma, a relação dos conceitos anteriores,
aplicados à lógica do processo de obtenção de conhecimento estudado nesta aula, pode ser representada na

Figura 2 a seguir.

Figura 2 | Relação de dados, informação e conhecimento no processo

Fonte: elaborada pelo autor.

Figura 3 | Ciclo de geração dos resultados

Fonte: elaborada pelo autor.

Resolução do Estudo de Caso

Para visualizar o objeto, acesse seu material digital.

Aula 3

CONCEITOS DE MINERAÇÃO DE DADOS


Em Mineração de Dados, para que o processo de mineração seja iniciado, é necessário que a
alimentação do sistema esteja propriamente con�gurada e organizada. Essa estrutura responsável por
conter as entradas dos sistemas é conhecida como Banco de Dados.

23 minutos
INTRODUÇÃO

A Mineração de Dados, por ser uma área de trabalho que se desenvolve diariamente e serve como base para

in�nitos processos na sociedade moderna, acaba envolvendo outros componentes importante para que seja

possível a sua existência.

Com base na magnitude apresentada por esse campo de estudo, serão estudados nesta aula a formação e
evolução de banco de dados, por serem o componente-chave para a execução de Mineração de Dados.
Também será estudado mais sobre a Mineração de Dados em si, aprofundando em características de sua área

e suas aplicações, focando sempre no que há de mais moderno e atual na indústria e na academia.

Desejo que você tenha um ótimo aprendizado nesta aula e que este conteúdo sirva como base para seu

aprofundamento na área de mineração de dados e suas aplicações.

EVOLUÇÃO DA TECNOLOGIA DE BANCO DE DADOS

Em Mineração de Dados, para que o processo de mineração seja iniciado, é necessário que a alimentação do

sistema esteja propriamente con�gurada e organizada. Essa estrutura responsável por conter as entradas dos
sistemas é conhecida como Banco de Dados.

O Banco de Dados é um termo popular que nos remete quase que imediatamente a servidores e processos
computacionais, entretanto os bancos de dados estão presentes em nossas vidas desde antes da criação do

computador. Um exemplo defasado de banco de dados são os armários compostos de múltiplas gavetas, em

que �cavam armazenadas diversas pastas com folhas de dados. A organização desses armários ocorria por
diversos meios de identi�cação, em sua maioria, combinações de letras e números para facilitar consultas a

alterações, identi�cado na parte de fora das gavetas, como demonstrado abaixo na Figura 1.

Figura 1 | Armário de dados

Fonte:Unsplash.
Existem vários outros exemplos, que de forma conceitual poderiam ser classi�cados como banco de dados,
como uma biblioteca, que apresenta diversos dados organizados sob uma estrutura lógica. Os armários de

dados foram evoluindo com o tempo, e com as mudanças na tecnologia, de certa forma que em dado
momento os papéis foram trocados por �oppy disks, ou também conhecidos como diskette, mas que se

popularizou no Brasil com o nome disquete, que posteriormente foram trocados pelos compact discs, ou CDs,

até que se chegou aos métodos de armazenamento atuais que utilizam discos rígidos para compor seus
bancos de dados.

A nomenclatura banco de dados, como utilizamos atualmente no meio computacional, foi introduzida por
volta de 1970, pelo pesquisador Ted Codd, na época funcionário da empresa IBM (International Business
Machines ou Máquinas de Negócios Internacionais), que na época proporcionou uma criação que mais tarde

seria a base para toda a área de mineração de dados. Ted, com o intuito de resolver o problema de
complexidade de trabalhar com múltiplos dados de forma manual e mecânica, propôs um sistema
automatizado que relacionava os dados utilizando técnicas matemáticas de álgebra relacional, para que fosse

possível acessar e modi�car dados através de comandos computacionais, esse sistema foi ilustrado por Ted
como exibido na Figura 2.

Figura 2 | Proposta de banco de dados

Fonte: IBM’s 100 Icons of Progress (2011).

O trabalho original deu início ao campo de pesquisa focado em desenvolver sistemas de automação para

trabalhar com dados, gerando a ferramenta Structured Query Language (SQL), ou Linguagem de Consulta
Estruturada. Os sistemas modernos que utilizam essa linguagem são conhecidos como bancos de dados

relacionais, por sua capacidade de interligação e comunicação entre os dados, segundo Date (2004). Essas
relações entre dados e tabelas é ilustrado na Figura 3.

Figura 3 | Banco de dados relacional


Fonte: Pixabay.

Atualmente existem diversas ferramentas e programas que trabalham com base em SQL (Structured Query

Language ou Linguagem de Consulta Estruturada), além de compor sistemas de grandes empresas como
Facebook e Google, que têm como seu principal produto a informação. Algumas dessas ferramentas são

apresentadas abaixo:

• MySQL: disponível em: https://www.mysql.com/. Acesso em: 24 nov. 2021.

• Postgree: disponível em: https://www.postgresql.org/. Acesso em: 24 nov. 2021.

• MariaDB: disponível em: https://mariadb.org/. Acesso em: 24 nov. 2021.

Entretanto, existem diversas outras ferramentas e versões para operar bancos de dados relacionais, cada

uma com suas características, portanto lhe recomendo pesquisar sobre elas para que você possa aprofundar
seus estudos na ferramenta que lhe servir melhor.

VIDEOAULA: EVOLUÇÃO DA TECNOLOGIA DE BANCO DE DADOS

Neste vídeo são abordados alguns pontos sobre o progresso evolutivo do banco de dados e a apresentação

do termo como conhecemos atualmente. É feito um resgate histórico para demonstrar como o termo banco
de dados esteve presente há vários anos na humanidade e como ele foi se atualizando ao longo do tempo e

dos avanços tecnológicos.

Videoaula: Evolução da tecnologia de banco de dados

Para visualizar o objeto, acesse seu material digital.

MINERAÇÃO DE DADOS

Segundo Castro e Ferrari (2016), a mineração de dados pode ser de�nida como uma técnica, ou processo, que

tem como principal foco a análise de dados, sendo principalmente aplicada em cenários de Big Data. Esse

termo refere-se ao conjunto de dados tão volumosos que ferramentas tradicionais não são capazes de operá-
los, de acordo com Amaral (2016). Nesse contexto, de acordo com Sharda, Delen e Turban (2019), a mineração

de dados foca em permitir o gerenciamento desses conjuntos de dados, por meio de processos de busca,
agrupamento, �ltragem e análise, compondo um método de extração dos itens importantes.

Seguindo a de�nição da Data Mining, essa técnica utiliza análises matemáticas para encontrar padrões e

tendências nos conjuntos de dados, que normalmente não são encontrados por se tratar da análise de dados

extremamente volumosos. Esses padrões podem ser encontrados por meio de múltiplos modelos dentro da
mineração de dados, alguns desses modelos são apresentados e explicados a seguir, conforme apresentado
por Castro e Ferrari (2016).

• Descoberta de sequências: esse modelo busca identi�car comportamentos de interesse, medindo sua
relevância com base na frequência de sua repetição. Essa aplicação é muito utilizada em cenários de

aprendizagem das tendências de compras, que relaciona padrões de interesse em produtos e suas relações,
recomendando de forma mais embasada sugestões para o cliente.

• Agrupamento: muitas vezes apresentado em literaturas com o nome Clustering, o agrupamento divide o
conjunto total de dados em subconjuntos menores, baseados nas características dos dados analisados, de

forma que cada grupo possa apresentar o maior grau de similaridade entre seus componentes. Esse processo
é comum em estudos comportamentais de populações, pois ainda que existam muitos dados, esses podem
ser simpli�cados de forma mais generalizada pelo grupo em que estão inseridos.

Existem diversos outros modelos de trabalhar com a padronização de dados, que possuem diferentes
aplicações dependendo do cenário de estudo e da disposição dos dados. Além disso, existem cenários em que

são utilizados dois ou mais modelos, seja de forma comparativa ou de forma combinada, visando garantir os
melhores resultados, tanto em precisão quanto em e�ciência computacional.

É importante ressaltar que a mineração de dados e muitos de seus modelos de análises precedem a

existência do mundo computacional, entretanto ela foi popularizada e mais valorizada com a instalação da era
da informação e seus impactos na sociedade. Com o avanço da tecnologia, foi possível integralizar

ferramentas da estatística, aprendizagem de máquina, inteligência arti�cial e reconhecimento de padrões,


dando à mineração de dados a estrutura que ela apresenta nos tempos atuais.

Para compreender com mais detalhes sobre a estrutura e formação da mineração de dados, recomendo a
leitura do livro Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplicações , de Castro e

Ferrari (2016). Nessa obra são apresentados os conceitos da mineração, desde sua formação até exemplos de

aplicações dessa área.

VIDEOAULA: MINERAÇÃO DE DADOS

Neste vídeo, nos aprofundamos nos estudos do Data Mining, aprendendo mais sobre seus processos de

mineração e sua estrutura, abordando o contexto da popularização da mineração de dados no cenário atual.
São apresentados modelos de mineração que viabilizam a implementação prática da Mineração de Dados em

diversos cenários.

Videoaula: Mineração de Dados

Para visualizar o objeto, acesse seu material digital.

APLICAÇÕES POTENCIAIS DA MINERAÇÃO DE DADOS

Dentro do contexto do mundo moderno, em que vários setores se encontram interligados em tempo real por

meio de redes de comunicação, como a internet, as possibilidades de utilizar técnicas da Mineração de Dados
são incontáveis, gerando todo um horizonte de cenários para a aplicação da descoberta de padrões em

conjuntos de dados volumosos. Dentre essas possibilidades, existem alguns ramos principais mais populares,

alguns deles vão ser apresentados a seguir.

igura 4 | E-commerce

Fonte: Unsplash.

• E-commerce: este setor, que foca em ambientes de compras e vendas em plataformas on-line, trabalha com
processos bem mais complexos do que apenas cadastro de clientes e análise de estoque. Essa área de serviço
moderna trabalha com modelos da Mineração de Dados para aumentar a e�ciência das suas vendas. Para
aprimorar suas vendas, as lojas focam em melhorar suas recomendações de produtos, com anúncios

personalizados adequadamente para cada grupo de cliente, geralmente separados por meio do processo de
clustering (agrupamento). Esse tipo de atividade pode ser visualizado ao acessar sites de compras on-line, e ao
visualizar artigos especí�cos, a plataforma irá começar a recomendar outros produtos em categorias, como

“pessoas que visualizaram este produto também tiveram interesse nestes” ou “produtos geralmente
comprados juntos”.

Figura 5 | Agropecuária moderna

Fonte: Freepik.

• Agropecuária: o setor da agropecuária, por ser um conjunto de atividades que acompanha a origem e a

evolução de sociedade, seguiu também o progresso cientí�co, e dessa forma agregando e incorporando em
suas atividades as tecnologias mais modernas, sejam elas dispositivos ou técnicas. Dentro dessas técnicas é

encontrada a presença direta da mineração de dados, que coopera com a agropecuária por meio da análise
preditiva de comportamentos das espécies cultivadas. Isso permite que os envolvidos com o gerenciamento

das atividades possam ter um conhecimento mais preciso sobre os ciclos de reprodução e cultivo das espécies
trabalhadas.

Figura 6 | Sistemas computadorizados de transporte


Fonte: Freepik.

• Transporte: a mineração de dados tem um grande potencial no setor de transporte, isso ocorre, pois a

análise em tempo real de padrões permite um maior dinamismo na logística de transporte. Essa característica
dinâmica possui capacidade de agir em serviços de caronas, que mudam seus preços baseados na proporção
de oferta e demanda de cada área de uma cidade, podendo maximizar os lucros da empresa. Outra aplicação

na área de transporte, utilizando a mineração de dados, foca em projetar as melhores possibilidades de rota,

considerando os trajetos que possam prover melhor consumo de combustível, ou que permitam chegar no
destino de forma mais rápida, não só considerando o comprimento dos trajetos, e sim a combinação da

situação atual do trânsito em tais vias com o histórico de percurso dos trajetos.

É importante ressaltar que, mesmo que seja escolhido um setor de aplicação da mineração de dados, ainda

existem múltiplas possibilidades do que ser estudado dentro do cenário escolhido e in�nitas formas de
realizar o processo de mineração de dados. Portanto, recomendo que você busque sempre acessar conteúdos

que apresentem estratégias de aplicações da mineração de dados, em diversos cenários, para desenvolver

maior familiaridade com as possibilidades de implementação dessa ferramenta.

VIDEOAULA: APLICAÇÕES POTENCIAIS DA MINERAÇÃO DE DADOS

No vídeo desta aula, é destacada a capacidade da mineração de dados de ser aplicada em vários cenários de

diferentes setores, gerando uma vasta área de possibilidades para a implementação da Mineração de Dados.
Além dessa constatação, também são apresentados alguns cenários, não tão triviais, que exempli�cam

algumas das possibilidades de aplicações da mineração de dados.

Videoaula: Aplicações potenciais da Mineração de Dados

Para visualizar o objeto, acesse seu material digital.

ESTUDO DE CASO

Para esse estudo de caso, considere que você faz parte de um grupo de pesquisa e sua nova tarefa é

apresentar uma situação-problema que pode ser solucionada de forma ótima utilizando a Mineração de
Dados. Para isso, é necessário que você elabore uma aplicação das técnicas de Mineração de Dados que
foram estudadas, escolhendo um cenário de estudo que será usado como base da análise, posteriormente

elaborando uma análise das características desse cenário para que possam ser escolhidas as variáveis de
estudo e demonstrando como poderia ser utilizada a Mineração de Dados para aprimorar o funcionamento

de dado processo.

O foco desta atividade é fazer com que você consiga desenvolver sensibilidade para práticas interdisciplinares,
combinando seus conhecimentos sobre Mineração de Dados com a análise de cenários otimizáveis.

Importante ressaltar que não é necessária a realização de cálculos ou implementações diretas, o resultado
esperado desse estudo de caso é o processo de análise e elaboração de uma proposta de melhoria.

Escreva, portanto, o seu processo de escolha do cenário de estudo, destacando quais serão as variáveis
utilizadas e o motivo da escolha delas. É fundamental descrever como se dá o funcionamento do processo
escolhido, portanto dedique uma parte do seu texto para apresentar com detalhes como são realizadas as

etapas, é de extrema importância ter conhecimento profundo sobre o cenário que está sendo estudado para
compreender a sua dinâmica e, posteriormente, explicá-la para seus cooperadores ou clientes.

Por último, apresente com detalhes como seria possível aprimorar o funcionamento do processo escolhido

com a utilização da Mineração de Dados, descreva como cada técnica ou ferramenta dessa área de estudos irá
otimizar o processo de estudo, em cada uma das etapas destacadas.
RESOLUÇÃO DO ESTUDO DE CASO

Para realizar esta atividade, é necessário dividir o processo em etapas para facilitar o progresso do raciocínio,
podendo representar a metodologia de resolução em tópicos, como apresentado a seguir.

1. Escolha do cenário de estudo: nessa etapa inicial, você deve escolher um campo de estudo, um processo,
um serviço que trabalhe com a utilização de dados em sua funcionalidade.

2. Análise do comportamento: após escolher um cenário, é necessário que você perceba como se dá o
funcionamento dos processos envolvidos e como se relacionam, com o objetivo de descobrir quais são as
variáveis ou os componentes mais importantes para a operação desse cenário.

3. Proposta de otimização: com as análises �nalizadas, você deve propor uma forma de aprimorar o

funcionamento da operação escolhida no cenário, utilizando técnicas e processos estudados ao longo do


aprendizado sobre Mineração de Dados.

Escreva um texto curto apresentando todo o processo de elaboração e resolução de forma clara e organizada,

sem a necessidade de incluir dados ou resultados numéricos.

 Saiba mais

Caso deseje aprofundar um pouco mais nos conteúdos desta aula e, consequentemente, nos conteúdos

do curso, realize a leitura da obra Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e

Aplicações, de Leandro Castro e Daniel Ferrari.

Esse livro apresenta uma metodologia muito bem organizada, pois inicia com a apresentação e

explicação de vários conceitos fundamentais para a mineração de dados, avançando até a composição de

modelos e algoritmos importantíssimos para a aplicação prática dessas ferramentas.

O livro também apresenta ao leitor alguns exemplos de aplicações que podem servir como base para

você iniciar ou dar continuidade em seus estudos de forma mais experimental.

CASTRO, L. N.; FERRARI, D. G. Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e

Aplicações. 1. ed. São Paulo: Saraiva, 2016.

Nesta aula, foram aprendidos alguns conceitos e relações muito importantes para o estudo da Mineração de
Dados, como revisados a seguir.

• Big Data: conjuntos volumosos de dados, apresentam grande quantidade de elementos e ocupam grandes
porções do armazenamento disponível na plataforma em que se encontra.

• Banco de dados relacional: sistema de gerenciamento de dados que estabelece um modelo automatizado
em que existe a constante troca de informações entre os conjuntos de dados inseridos no banco.

Esses conceitos populares são muito comuns na existência e operação dos processos de mineração de dados.
É possível ilustrar a relação entre esses dois conceitos como apresentado na Figura 7.

Figura 7 | Big Data e o banco de dados


Fonte:elaborada pelo autor.

Na Figura 7, é possível perceber de forma visual a relação entre os conceitos, de modo que o banco de dados
consegue comportar, de maneira sistematizada, conjuntos de dados volumosos e dispersos, com base em

relação bem de�nida entre os dados.

Resolução do Estudo de Caso

Para visualizar o objeto, acesse seu material digital.

Aula 4

INTELIGÊNCIA DE NEGÓCIOS
No cenário atual de intensa competitividade entre instituições, qualquer erro pode signi�car grandes
perdas no desenvolvimento e na estabilidade de uma empresa, portanto, existe uma tendência que
preza pela tomada de decisão que apresente riscos mínimos para a entidade e seus envolvidos.

22 minutos

INTRODUÇÃO

Com o avanço das tecnologias e o surgimento de novas áreas de estudo como a mineração, setores

tradicionais da sociedade começaram a receber transformações. Esse fenômeno foi muito presente no setor
de gestão empresarial, que passou por múltiplas restruturações com a chegada das ferramentas

computacionais. O planejamento estratégico e o setor de Business Intelligence são dois exemplos claros e

diretos dessas mudanças modernas.

Nesta aula, desejamos que você aprenda sobre o efeito da aplicação de técnicas da mineração de dados no

setor de gestão, com base na administração computadorizada, assim como adquira a capacidade de elaborar
um raciocínio lógico e analítico sobre a combinação da área computacional e gerencial.

Espero que esta aula cative em você o interesse por essa área interdisciplinar, que está sendo cada vez mais

valorizada por pro�ssionais de todos os setores e áreas.

EMPREGO DE PLANEJAMENTO ESTRATÉGICO

No cenário atual de intensa competitividade entre instituições, qualquer erro pode signi�car grandes perdas
no desenvolvimento e na estabilidade de uma empresa, portanto, existe uma tendência que preza pela

tomada de decisão que apresente riscos mínimos para a entidade e seus envolvidos. Essa tendência tem
como sua principal componente o planejamento estratégico, que traz para a empresa maior embasamento e
estruturação na composição de suas ações.

Segundo Sharda, Delen e Turban (2019), o planejamento estratégico preza por analisar previamente as
possibilidades de cenários e decisões, dentro do ambiente em que você está envolvido, de forma que os

próximos passos que a empresa irá seguir, nas semanas ou nos meses seguintes, sejam planejados
considerando possíveis alterações e mudanças bruscas. Dentro do planejamento estratégico, existem
múltiplas etapas e componentes analisadas, como decisões que possam trazer maiores lucros ou menores
riscos, e essas componentes estão contidas entre os ciclos de planejamento.

Dentro das empresas, existem ciclos de atividades, que começam com o planejamento das operações da
empresa por um dado intervalo de tempo, que pode variar bastante com o tipo de empresa, e qual setor dela

está sendo trabalhado, de acordo com Oliveira (2019). Esses ciclos são compostos por quatro partes:

• Planejamento: é a etapa principal de qualquer atividade, pois ela sustenta todo o comportamento da

instituição, por isso a necessidade de extrema atenção e análise. Esta etapa é onde ocorre o planejamento
estratégico, momento em que são de�nidas as metas tal como o plano de ações necessário para que elas
sejam devidamente alcançadas, considerando os riscos e investimentos na sua estruturação.

• Organização: nesta etapa, são conferidas as tarefas de cada setor e de cada contribuinte para a realização

das atividades de�nidas no planejamento. Esta etapa é crucial para que os integrantes saibam exatamente o
que deverão fazer e para que em posteriores análises seja mais fácil identi�car quais setores obtiveram
melhores e piores rendimentos.

• Direção: esta etapa é responsável pela devida execução das atividades, em que os encarregados de

liderança devem orientar e cobrar suas equipes para que as atividades sejam cumpridas de acordo com o

planejamento. Os líderes também devem estar preparados para tomadas de decisão em caso de imprevistos,

carregando a maior responsabilidade de seus respectivos setores.

• Controle: a última etapa é responsável pelo controle das atividades, nesta parte são trabalhados os

resultados, produtos das análises de desempenho e informações sobre os processos, persiste então o

acompanhamento dos relatórios gerados sobre como foram realizados os processos estabelecidos desde a
etapa de planejamento. Nesta etapa ocorre a avaliação dos critérios analisados, para poder veri�car o

rendimento da estratégia escolhida e, portanto, estabelecer um planejamento para início do próximo ciclo da

empresa.

Esse ciclo, ou conjunto de etapas, é popularmente conhecido pela sigla PODC (Planejar, Organizar, Dirigir e
Controlar), proposto por Drucker (1980), conhecido como o pai da Administração Moderna. Essa contribuição

de Peter serve como referência para a administração de empresas em todo o mundo nesse cenário moderno,

em que é necessário calcular todos os riscos de possibilidades envolvidas.

VIDEOAULA: EMPREGO DE PLANEJAMENTO ESTRATÉGICO

Nesta aula são apresentados alguns conceitos iniciais voltados para a parte de planejamento estratégico,
mostrando um pouco mais sobre a parte de gestão e administração empresarial, focando no processo de

planejamento como etapa fundamental para a redução de erros. O vídeo também apresenta algumas etapas
essenciais para a execução de administração em formato de ciclos.

Videoaula: Emprego de planejamento estratégico

Para visualizar o objeto, acesse seu material digital.

ARQUITETURA DE BUSINESS INTELLIGENCE

Existem processos da Mineração de Dados com diversos exemplos focados principalmente na aplicação do
setor empresarial, isso ocorre, pois esse setor é um dos que mais se bene�ciou dos avanços tecnológicos da

área de Data Mining. Essa combinação de recursos da mineração de dados aplicados à gestão empresarial

gerou uma nova área de estudo, conhecida como Business Intelligence (inteligência de negócios), de acordo
com Schaedler e Mendes (2021).

Segundo Sharda, Delen e Turban (2019), Business Intelligence (BI) pode ser de�nida como um conjunto de

técnicas que envolvem extração de tratamento de dados, análise de padrões, visualização de dados, práticas

para tomada de decisão e padrões de organização. O BI foca em utilizar técnicas da mineração de dados para
promover conteúdos mais organizados e ilustrativos, como grá�cos e �uxogramas, capazes de representar o
funcionamento de um dado sistema ou fenômeno.

A importância da análise e, consequente, produto de visualização gerados pelo BI, ocorre por permitir a

produção de conteúdos de fácil entendimento, permitindo que pessoas leigas em dado assunto consigam
compreender o que está sendo apresentado de forma mais suave e clara. Essas vantagens de entendimento

contribuem para a �uidez na troca de informação entre setores de uma mesma empresa, já que as
metodologias e os resultados podem ser compreendidos de formas mais simples e práticas.

Ainda conforme apresentado por Sharda, Delen e Turban (2019), a estrutura do BI relaciona as técnicas e os
processos já vistos no estudo da mineração de dados, com utilização dos resultados, produtos do
conhecimento. Para que seja possível amparar a tomada de decisão executada pelos gestores e diretores de

dada empresa, essa tomada de decisão é feita com a utilização de evidências com o intuito de reduzir as
chances de erro causadas por decisões empíricas.

Frese e Keith (2015) apresentam a importância da utilização de gerenciamento inteligente com a análise em
tempo real, pois ainda que haja o planejamento prévio para prevenção de erros, quando um erro ocorre é

necessário que exista uma análise ágil para que seja possível minimizar as consequências negativas deste. No
livro Business Intelligence e Análise de Dados para Gestão de Negócio , os autores trazem ao leitor a

necessidade da adoção de suporte computadorizado para tomadas de decisão gerenciais, por garantir maior

velocidade e precisão com a utilização das ferramentas disponíveis para esse setor.

É importante ressaltar que o BI não depende de uma ferramenta ou um software especí�co, entretanto

existem milhares de ferramentas elaboradas a partir dos processos e das necessidades comuns nessa área.

Com isso, possuir os conhecimentos essenciais de Data Mining, assim como compreender as formas de

trabalho das atividades de Business Intelligence, permitirá que você consiga ter uma visão mais expandida do

cenário de gerenciamento empresarial moderno, assim como ter o conteúdo especí�co para poder operar, ou
até elaborar, programas que auxiliem nas tomadas de decisão e garantir melhores planejamentos

estratégicos com base em evidências cienti�camente embasadas.

VIDEOAULA: ARQUITETURA DE BUSINESS INTELLIGENCE

Neste vídeo, é apresentado sobre a moderna área de Business Intelligence, focando em explicar a causa e o

contexto da criação dessa área, caracterizando o cenário moderno que ocasionou e que efetivamente utiliza,
as ferramentas e funcionalidades do Business Intelligence. Com essa introdução, são apresentadas algumas

caraterísticas que formam essa nova área e os resultados gerados por ela.

Videoaula: Arquitetura de Business Intelligence

Para visualizar o objeto, acesse seu material digital.

PRINCIPAIS TENDÊNCIAS PARA O BUSINESS INTELLIGENCE

Por estarem sempre acompanhando os avanços tecnológicos e trabalhando cada vez mais com o feedback em
tempo real de seus clientes, as empresas buscam constantemente estarem atualizadas em relação às

inovações tecnológicas para prover de forma mais imediata os produtos ou serviços adequados às
preferências de seus usuários. Essa veri�cação em tempo real também serve como um mecanismo para
favorecer a lei da oferta e da demanda, como é visto em muitas empresas no setor de produtos e serviços,

portanto trabalhando diretamente com os clientes �nais.

Como apresentado em Schaedler e Mendes (2021), entre as tendências modernas do BI, a preci�cação em

tempo real talvez seja uma das mais presentes, essa estratégia se popularizou principalmente com a chegada,
nos últimos anos, das empresas que oferecem serviços de carona. Esse setor de empresas tem uma forma de
operar que depende da demanda em dadas localidades, portanto onde está ocorrendo maior concentração
de pessoas utilizando esse tipo de serviço, a demanda por motoristas nessa área é maior, com isso, essa área

passa a ser classi�cada como uma área de maior intensidade naquele momento, até que a demanda reduza.

Esse fenômeno faz com que as corridas que são iniciadas nessas áreas de maior intensidade sejam mais caras
do que em momentos de menor movimentação, isso ocorre devido ao aumento no coe�ciente de preci�cação
daquela área. A visualização dessas áreas é ilustrada na Figura 1.

Figura 1 | Áreas de intensidade

Fonte: Uber (2021 ).

Essa prática permite que a empresa maximize seu lucro com base na quantidade de pessoas utilizando seus

serviços naquele instante, além de compensar o aumento de gastos da empresa com o aumento do �uxo de
dados processados pelos servidores da empresa nesse momento de maior intensidade.

Utilizar esse tipo de serviço, em tempo real, possibilita reconhecimentos diários dos �uxos de tráfego,
permitindo que as empresas possam realizar predições sobre o comportamento das vias de transporte com

base em seus históricos armazenados, além de identi�car eventos anômalos com base na percepção dos

hábitos regulares.

Outra prática muito comum é a montagem de per�s, em que com base em diversas características de

preferências do usuário, é possível estabelecer um per�l que relaciona atributos de um indivíduo, como faixa

de idade, estilo musical e nível de educação. Essa elaboração de per�s é decorrente da colaboração entre
empresas de ramos distintos, como empresas que trabalham com streaming de música e empresas de moda,
em que elas começam a lançar linhas de roupas baseadas no estilo de preferência de uma dada faixa de
idade.

As aplicações de BI encontram-se presentes em diversas áreas, principalmente de empresas mais modernas,


pois elas fazem prática da �loso�a de administração voltada a dados, em que todas as decisões são tomadas
com base em evidências elaboradas pela análise de dados, focando na execução do planejamento estratégico.

Portanto, caso deseje aprender mais sobre as tendências de BI no mundo atual, busque compreender como
operam as principais empresas do mundo para se manter atualizado com o mercado.

VIDEOAULA: PRINCIPAIS TENDÊNCIAS PARA O BUSINESS INTELLIGENCE

No vídeo desta aula, é apresentado sobre o conceito das tendências nas empresas que seguem os caminhos
da área de Business Intelligence, apresentando o cenário que promove o surgimento de novas tendências, e

como alguns elementos possuem in�uência na demanda dessas novas tendências. Também são apresentados

alguns exemplos de tendências modernas e atuais focadas no setor de Business Intelligence.

Videoaula: Principais tendências para o Business Intelligence

Para visualizar o objeto, acesse seu material digital.

ESTUDO DE CASO
Neste estudo de caso, considere que você é o gerente da equipe analítica de uma empresa que precisa
aprimorar os meios e as técnicas utilizadas para a tomada de decisão. Para isso, é necessário que todos os

setores da empresa compreendam a forma como as decisões estão sendo executadas. Para realizar essa
harmonia entre equipe, é requerido que você proponha uma forma de aplicar os raciocínios de Business

Intelligence (BI), gerando soluções para permitir uma comunicação mais suave entre os membros de
diferentes áreas da empresa.

Você precisa relacionar tecnologias de BI com as atividades e os processos realizados pela empresa, gerando

produtos que possam exempli�car de forma �el as operações em questão. É necessário desenvolver formas
verbais e visuais de apresentar a metodologia desenvolvida, para que pessoas que não possuem
conhecimento técnico em Data Mining possam compreender a metodologia elaborada.

Você tem a liberdade de estabelecer o cenário em que este estudo de caso estará inserido, como a forma de

operação da empresa em questão, o setor em que ela opera e como ela realiza suas atividades. O foco desta
atividade é que você apresente quais tecnologias e técnicas da área de BI seriam recomendadas para esse
tipo de atividade, apresentando detalhes sobre essas tecnologias.

É importante descrever de forma clara como se estivesse apresentando para outros membros da sua

empresa, sendo esses indivíduos leigos no conteúdo de BI e Mineração de Dados, focando em apresentar

como a administração da empresa pode se bene�ciar por meio do gerenciamento adepto do BI.

RESOLUÇÃO DO ESTUDO DE CASO

Para solucionar este estudo de caso, elabore de forma coerente um cenário de atuação empresarial, de�nindo

um setor de atuação de sua empresa e detalhes de seu funcionamento.

Após a elaboração do cenário do estudo de caso, apresente um detalhamento das atividades realizadas,

declarando também as relações entre essas atividades, principalmente as que transcendem diferentes setores
e hierarquias da empresa.

A última etapa deste estudo de caso é responsável por apresentar possíveis produtos dessa relação das

atividades com as tecnologias disponíveis no campo de BI, portanto é de extrema importância que você de�na
quais ferramentas, sejam metodologias ou softwares, seriam recomendadas para aprimorar a compreensão

dos empregados quanto aos detalhes das atividades executadas pela empresa, que ocasionam certas

tomadas de decisão. Demonstre seus conhecimentos quanto aos conteúdos de BI apresentando o motivo da
utilização de cada ferramenta dessa área.

 Saiba mais

Na obra Business Intelligence, de Schaedler e Mender (2021), os autores apresentam desde origem e
conceitos básicos da área de BI até conceitos como Data Warehouse, que em tradução direta signi�ca
“armazém de dados”, é um termo que designa bancos de dados de grande utilidade, principalmente para

gestores, de diversos tipos de entidade.

É também abordada a origem e aplicação da Mineração de Dados, principalmente nos setores industriais

e comerciais, nutrindo a parte conceitual do tópico de Data Mining. No Capítulo 6 dessa obra são

apresentadas implementações de BI, esse conteúdo é de grande importância e valor, pois acrescenta

elementos no vocabulário de possibilidades para aplicações dessas técnicas, sendo uma ótima base para
a evolução nos estudos pro�ssionais dessa área.

Alguns termos importantes foram utilizados no desenvolvimento desta aula, dada suas importâncias, eles

serão revisados a seguir.

• Business Intelligence: trata-se de um conjunto de técnicas e processos que combina atividades de ambas
as áreas Mineração de Dados e Administração, buscando o aprimoramento da gestão via tomadas de decisão,
exigindo sempre o suporte computadorizado. Sharda, Delen e Turban (2019) apresentam a ilustração de uma
estrutura de BI na �gura a seguir.

Figura 2 | Arquitetura de BI

Fonte: Sharda, Delen e Turban (2019).

• Planejamento estratégico: é a de�nição de uma elaboração de atividades que serão adotadas por uma
instituição durante um intervalo de tempo. Usa como base para referência as análises de variáveis atuais,
além de comparar rendimentos proporcionados por dados do histórico de atividades da instituição em

questão. Maçães (2017) apresenta uma ilustração do planejamento estratégico de forma geral na �gura
abaixo.

Figura 3 | Ilustração de planejamento estratégico

Fonte: Maçães (2017).

Resolução do Estudo de Caso

Para visualizar o objeto, acesse seu material digital.

REFERÊNCIAS
7 minutos

Aula 1

AMARAL, F. Aprenda Mineração de Dados: Teoria e Prática. 1. ed. Rio de Janeiro: Alta Books, 2016.
(Disponível na biblioteca virtual em: Minha Biblioteca).

BOLISANI, E.; BRATIANU, C. Emergent Knowledge Strategies: Strategic Thinking in Knowledge Management.
Alemanha: Springer, 2018.

CASTRO, L. N.; FERRARI, D. G. Introdução à Mineração de Dados. 1. ed. São Paulo: Saraiva, 2016. (Disponível
na biblioteca virtual em: Minha Biblioteca).

COSTA, H.; GOMES, L.; COSTA, D. Genetic algorithm and particle swarm applied in electric system optimization.
Research, Society and Development, vol. 10, n. 10, p. 1-12, Ago., 2021.
MADDEN, A. A de�nition of information. Aslib Proceedings, Vol. 52, n. 9, pp. 343-349, 2000.

MYATT, G.; JOHNSON, W. Making Sense of Data II: A Practical Guide to Data Visualization, Advanced Data

Mining Methods, and Applications. 1. ed. Hoboken: John Wiley & Sons, 2009.

SHARDA, R.; DELEN, D.; TURBAN, E. Business intelligence e análise de dados para gestão do negócio. 4. ed.

Porto Alegre: Bookman, 2019. (Disponível na biblioteca virtual em: Minha Biblioteca).

SILVA, F. Gestão de Dados Cientí�cos. 1. ed. Rio de Janeiro: Editora Interciência, 2019. (Disponível na
biblioteca virtual em: Minha Biblioteca).

SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à Mineração de Dados: Com aplicações em R. 1. ed. Rio
de Janeiro: Elsevier, 2016. (Disponível na biblioteca virtual em: Minha Biblioteca).

Aula 2

CORREIA NETO, J. F.; MARQUES, É. V.; Tomada de Decisões Gerenciais com Analítica de Dados, 1. Ed. Rio de

Janeiro: Alta Books, 2020. (Disponível na biblioteca virtual em: Minha Biblioteca).

COSTA, D. C. L. et al. The dimensions of Mathematical and Computational Modeling prescribed to

Environmental Management. Research, Society and Development, v. 9, n. 10, p. e6939109013, 2020. DOI:
10.33448/rsd-v9i10.9013.

MU, E.; PEREYRA-ROJAS, M. Practical Decision Making: An Introduction to the Analytic Hierarchy Process
(AHP) Using Super Decisions V2, EUA: Springer, 2017.

MARCHISOTTI, G.; DOMINGOS, M.; ALMEIDA, R. Decision-Making at the �rst management level: The

interference of the organizational culture. Revista de Administração Mackenzie, 2018.

PALM III, W. Introdução ao MATLAB para Engenheiros. 3. ed. Porto Alegre: AMGH, 2013. (Disponível na

biblioteca virtual em: Minha Biblioteca).

PERKOVIC, L. Introdução à computação usando Python: um foco no desenvolvimento de aplicações. 1. ed.

Rio de Janeiro: LTC, 2016. (Disponível na biblioteca virtual em: Minha Biblioteca).

SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à Mineração de Dados: com aplicações em R. 1. ed. Rio

de Janeiro: Elsevier, 2016.

SHARDA, R.; DELEN, D.; TURBAN, E. Business Intelligence e análise de dados para gestão do negócio. 4. ed. Rio
de Janeiro: Bookman, 2019. (Disponível na biblioteca virtual em: Minha Biblioteca).

YU, A. Tomada de decisão nas organizações: uma visão multidisciplinar. 1. ed. São Paulo: Saraiva, 2011.
(Disponível na biblioteca virtual em: Minha Biblioteca).

Aula 3

AMARAL, F.; Big Data: Um Visão Gerencial. 1. ed. São Paulo: PoloBooks, 2016. (Disponível na biblioteca virtual
em: Minha Biblioteca).

CASTRO, L. N.; FERRARI, D. G. Introdução à Mineração de Dados: conceitos básicos, algoritmos e aplicações. 1.
ed. São Paulo: Saraiva, 2016. (Disponível na biblioteca virtual em: Minha Biblioteca).

DATE, C. Introdução a Sistemas de Banco de Dados. 1. ed. Rio de Janeiro: Elsevier, 2003. (Disponível na
biblioteca virtual em: Minha Biblioteca).

Relational Database. IBM’s 100 Icons of Progress, 30 de Agosto de 2011. Disponível em: https://www.ibm.com
/ibm/history/ibm100/us/en/icons/reldb/

SHARDA, R.; DELEN, D.; TURBAN, E. Business intelligence e análise de dados para gestão do negócio. 4. ed.
Porto Alegre: Bookman, 2019. (Disponível na biblioteca virtual em: Minha Biblioteca).
Aula 4

FRESE, M.; KEITH, N. Action Errors, Error Management, and Learning in Organizations, Annual Review of
Psychology. 2015. DOI: 10.1146/annurev-psych-010814-015205.

MAÇÃES, M. A.; Biblioteca do Gestor: Empreendedorismo, Inovação e Mudança Organizacional. 1. ed. Lisboa:

Actual, 2017. (Disponível na biblioteca virtual em: Minha Biblioteca).

OLIVEIRA, D. P. R. de. Administração: evolução do pensamento administrativo, instrumentos e aplicações

práticas. 1. ed. São Paulo: Atlas, 2019. (Disponível na biblioteca virtual em: Minha Biblioteca).

SCHAEDLER, A.; MENDES, G. S. Business Intelligence. 1. ed. Curitiba: Intersaberes, 2021. (Disponível na
biblioteca virtual em: Minha Biblioteca).

SHARDA, R.; DELEN, D.; TURBAN, E. Business Intelligence e análise de dados para gestão do negócio. 4. ed. Rio

de Janeiro: Bookman, 2019. (Disponível na biblioteca virtual em: Minha Biblioteca).

Você também pode gostar