Escolar Documentos
Profissional Documentos
Cultura Documentos
Jorge Caldeira
2023
JORGE CALDEIRA
JORGE CALDEIRA
o 52 anos.
o 7 livros publicados.
1. Elevada incerteza.
2. Volatilidade.
3. Dimensão dos problemas.
4. Escassez de recursos (solução ótima).
Mitigar…
5. Pressão por resultados (GPO, Outputs & Outcomes). (Data Scientist)
6. Excesso de informação.
7. Urgência na decisão.
8. Informação/objetivos conflituantes.
9. Necessidade de alinhamento na decisão.
10.Escassez de oportunidades.
JORGE CALDEIRA DATA SCIENTIST 7
1. CONCEITOS INTRODUTÓRIOS
1.1. DESAFIOS DA DECISÃO
Os decisores públicos pretendem respostas para várias questões:
O que é BI?
R: Processo de recolha de dados,
armazenamento e gestão do conhecimento
com vista a fornecer inputs para a tomada
de decisão
(Negash & Gray, 2014)
Anos 80 | | USA
JORGE CALDEIRA DATA SCIENTIST 10
1. CONCEITOS INTRODUTÓRIOS
1.2. CONCEITOS DE BUSINESS INTELLIGENCE (BI)
Dataset Unstructured data
Dados sem nenhum
Conjunto de dados
Big data modelo de organização
normalmente definido
Conjuntos de dados tabulados
muito grandes
Data warehouse Online analytical
Metadata processing (OLAP)
Armazém de dados
Informação sobre Análise de um grande
os dados. volume de dados sob
Data mart múltiplas perspetivas
É um subconjunto de Extract Transform
dados de um Data Load (ETL) Machine Learning
Warehouse
Ferramentas para Construção de Modelos
extração, transformação que “aprendem”
e carregamento de dados
Data mining
Analytics no DW Deep learning
Exploração de dados
Análise de dados para Nova área do Machine
apoio à decisão Learning ligada à
Inteligência Artificial
JORGE CALDEIRA DATA SCIENTIST 11
1. CONCEITOS INTRODUTÓRIOS
1.3. PRINCIPAIS TENDÊNCIA DO BI
#1
Exemplos de dados: áudio (mp3), email (txt), vídeos (mp4), imagens (jpg), etc.
Surgimento: Surgiu nos anos 60s/70s com o aparecimento dos primeiros data centers e o
desenvolvimento das bases dados relacionais.
Ganhos: Mais informação faz com seja possível obter mais respostas.
Tendência: Com a Cloud, o Machine Learning e a IoT, o Big Data irá continuar a aumentar.
#2 https://dados.gov.pt/en/
https://lisboaaberta.cm-
lisboa.pt/index.php/pt/
JORGE CALDEIRA DATA SCIENTIST 19
1. CONCEITOS INTRODUTÓRIOS
1.3. Principais tendências do BI
Tendências
#2
https://data.europa.eu/en/dashboar
d/2021#country-overview
#3 DATA SCIENTIST
#3
https://www.glassdoor.com/List/Best-Jobs-in-America-
LST_KQ0,20.htm
#3
#3
#3
#3
#5 IA
#5 IA
Data Science?
Extrair conhecimento dos dados com objetivo de
melhorar a tomada de decisão.
https://worlddatasummit.com/
• = Cientista
• Padrões, tendências,
conhecimento, previsão…
• ≠ IT
• ↗Outcomes
• DS = Função!
• Novas “posições”
• Tecnologia↔Dados
https://www.sas.com/en_si/insights/analytics/
what-is-a-data-scientist.html
https://rstudio.com/products/rstudi https://www.python.org/downloads/
o/download/
Registo, Análise e
Definição Visualização
Recolha e Interpretação
do projeto
Tratamento
Registo, Análise e
Definição Visualização
Recolha e Interpretação
do projeto
Tratamento
Registo, Análise e
Definição Visualização
Recolha e Interpretação
do projeto
Tratamento
1. Localizar BD.
2. Estudar BD
3. Limpeza de dados e Transformação.
4. Relacionar modelo de dados (conectar BD).
Registo, Análise e
Definição Visualização
Recolha e Interpretação
do projeto
Tratamento
1. Desenvolver o projeto.
2. Testar e verificar os resultados. Reajustar.
Registo, Análise e
Definição Visualização
Recolha e Interpretação
do projeto
Tratamento
1. Selecionar a visualização.
2. Preparar a apresentação.
3. Apresentar.
4. Reajustar
https://www.tableau.com/pt-br/products/desktop
https://www.qlik.com/us/products/qlikview
Potencialidades:
1. Rápida ligação a múltiplas origens de dados e
possibilidade de combiná-las.
2. Facilidade na limpeza e transformação de dados.
3. Familiaridade com o Excel.
4. Facilidade na construção dos Dashboards.
5. Visualizações de dados interativos e dinâmicos.
Bases de dados na
Fonte: Jorge Caldeira (2022) Criar organização
Etapas:
1. Identificação e ligação a uma base de dados.
2. Limpeza dos dados.
3. Estruturação do modelo de dados.
4. Construção dos visuais (ex. gráficos).
5. Publicação (partilha) do dashboard.
50
53
42
45
8. Selecionar gráfico.
Latvia
Lithuania
49
51
50
52
48
55
43
56 9. Filtros.
Luxembourg 86 86 85 65
Hungary
Malta
50
53
51
50
50
57
49
56
10. Etiquetas, Cores, Título e Fundo.
Netherlands 72 77 79 79
Austria
Poland
64
40
65
44
67
46
66
44
11. Linha média
Portugal 48 48 50 52
Romania 26 28 29 31
Slovenia 51 53 54 55
Slovakia 53 55 59 54
Finland 74 73 76 76
Sweden 72 69 77 72
Iceland : : 85 85
Norway 80 75 77 83
Switzerland : : 76 77
United Kingdom 67 69 71 74
Montenegro : : 50 :
North Macedonia 37 34 32 32
Serbia 32 : 39 46
Turkey 23 28 34 36
1. Abrir datastudio
2. Importar ficheiro CSV.
O que é o Python?
Open Source! 1ª Linguagem de projetos data science. Grande comunidade. +250 mil
bibliotecas.
>>> a = 5
>>> b = 7
>>> print(a + b)
>>>a=“Data”
>>>b=“Scientist”
>>>a+b
>>> x=a+b
>>> len(x)
>>>input(“nome?”)
https://docs.python.org/pt-br/3/tutorial/
O que é a Linguagem R?
R é uma linguagem de programação para manipulação, análise e visualização de dados.
Script
Output
Consola
Na consola:
1. Operações: 4*2
2. Variáveis: [guardar dados; case-sensitive]
x<-4
y<-2
Gerar nºs
x*y aleatórios
Arredondar
3. sqrt(4)
4. Gerar números aleatórios: aleatorios <- floor(runif(1000, min=100, max=5000))
5. max(aleatórios)
6. Histograma: hist(aleatorios)
7. Help: ? hist
8. Gráfico circular: pie(c(1,5,7,10))
“Área de estudos em que o analista ajuda o “Área de estudos que dá aos computadores a
computador, através de exemplos, a determinar capacidade de aprender sem serem
regras.” explicitamente programados . Através da
observação e descoberta, reconhece padrões,
relações e categorias por si próprio.”
Exemplo: Prever a probabilidade de uma Exemplo: Muito útil para abordar problemas
pessoa ter um ataque cardíaco no prazo de 1 com pouca ou nenhuma ideia sobre quais
ano (Idade, Peso, Altura e Pressão Sanguínea) poderão ser os resultados.
Média Móvel Simples - Todas as observações usadas têm um peso igual no calculo da previsão.
Nota: Não há tendência ou sazonalidade.
Média Móvel Ponderada - As observações usadas têm pesos diferentes no calculo da previsão.
Nota: Períodos específicos podem explicar melhor a tendência.
Média Móvel Exponencial - As observações usadas têm pesos maiores nos dados mais recentes.
Nota: Períodos recentes explicam melhor.
Variável
dependente
Variável
independente
Exemplos de aplicação:
• Diagnóstico médico.
• Atribuição de crédito
• Etc.
Cabeçalhos (campos)
Tabela
i. Mais comum.
ii. Menos complexo → + fácil de perceber Dim Dim
Facto Facto
2. Slowly changing: Mudam lentamente ou não mudam (ex. Produtos, Data de nascimentos).
Restrições:
1. Tipo ex. data, número, lógico, etc.
2. Intervalo. ex. NPS = [0; 10], só pode ser decimal, etc.
3. Obrigatória ex. campos que não podem estar vazios
4. Única ex. NIF
5. Chave-estrangeira ex. não pode ter um valor que não existe na chave-primária
6. Campo cruzado ex. Data fim do processo inferior a data entrada do processo
300 reclamações
(Ackoff, 1989)
Fonte: Gartner
JORGE CALDEIRA DATA SCIENTIST 94
3. TRANSFORMAÇÃO DE DADOS EM CONHECIMENTO
3.1. CONHECER OS DECISORES
Gartner Analytic Ascendancy Model
https://docs.google.com/forms/d/e/1F
AIpQLSdT_0nK-
EoZSzIbuz4PrQ14bl47xIFAdz9rnEWxBfK
BeDKb7A/viewform?usp=sf_link
Fonte: Gartner
JORGE CALDEIRA DATA SCIENTIST 95
3. TRANSFORMAÇÃO DE DADOS EM CONHECIMENTO
3.2. CALCULO, INTERPRETAÇÃO E COMUNICAÇÃO DA PERFORMANCE
Cálculo do desempenho?
Performance = ? Performance = ?
(Resultado – Meta)
Performance (P+) = +1
(Meta)
(Meta – Resultado)
Performance (P-) = +1
(Meta)
100%
90%
125%
0%
Diretor Técnico
APRENDIZAGEM
Como é que estamos? (P+1)
Resultados
*10% € - Servidor
https://docs.google.com/forms/d/e/1FAIpQLSdbm2x6BHt40dRz-
ZiuefrsHwpAoxl1XE0SQ5otsQIhSBwE3A/viewform?usp=sf_link
https://www.ft.com/content/c7bb24c9- https://www.tableau.com/solutions/gallery
964d-479f-ba24-03a2b2df6e85 /visual-vocabulary
http://www.youtube.com/watch?v=
WjVHvC9EeB4
https://www.youtube.com/ https://www.youtube.co
https://youtu.be/d7riL6IXi5o watch?v=sd m/watch?v=6
L278bS5t0 dDD2tHWWnU
Real
Planeado
https://atlas.cid.harvard.edu/explore/stack?country=203&year=2019&
startYear=1995&productClass=HS&tradeDirection=import&product=u
ndefined&target=Product&partner=undefined
Doutorando em Gestão | Diretor Geral da empresa Estratégia Elementar, atuando nas áreas de Estratégia e
Business Intelligence | Autor de 7 livros na área de Gestão:
* *