Você está na página 1de 3157

Introdução à Estatística

Prof. Dr. Wilson Tarantin Jr.


Tipos de variáveis
• As variáveis podem ser classificadas em:

• Qualitativas: são variáveis não métricas, atribuem categorias ou classificações


• Podem atribuir duas ou mais categorias
• A análise descritiva de variáveis qualitativas é feita por meio de tabelas de frequência e
gráficos, pois tais variáveis não permitem o cálculo de medidas de posição e dispersão

• Quantitativas: são variáveis métricas, atribuem contagem ou mensuração


• Podem ser discretas ou contínuas
• A análise descritiva de variáveis quantitativas pode ser feita por diversas ferramentas
estatísticas, incluindo as medidas de posição e dispersão
Tipos de variáveis
• Qualitativas: exemplos

• Escalas Likert
• Faixa de renda
• Nacionalidade
• Estado civil
• Escolaridade
• Tipo de solo
• Vacinado ou não
• Tipos de comorbidades
Tipos de variáveis
• Quantitativas: exemplos

• Idade
• Renda (em R$)
• Quantidade de filhos
• Altura da pessoa (em cm)
• Peso (em kg)
• Retorno de ações na bolsa
• Temperatura do ambiente
• Lucro/prejuízo da empresa
Estatísticas Descritivas
1. Tabela de frequências
• Quantidade de ocorrências por categoria

• Qualitativas
• De forma direta, apresenta a quantidade de ocorrências para cada categoria

• Quantitativas
• Variável discreta: a análise assemelha-se ao caso da variável qualitativa, ou seja, mostra
a quantidade de ocorrências para cada valor discreto da variável
• Variável contínua: é necessária uma categorização inicial por classes ou faixas para, em
seguida, apresentar a quantidade de ocorrências em cada categoria gerada
1. Tabela de frequências
• Elaborando uma tabela de frequências

• Os tipos de frequências reportados são:


• Frequência absoluta: contagem de ocorrências em cada categoria
• Frequência relativa: percentual de cada categoria em relação ao total de observações
• Frequência acumulada: soma da frequência absoluta a cada nova categoria
• Frequência relativa acumulada: soma da frequência relativa a cada nova categoria

• Exemplo: Foram coletados dados sobre o país de origem de 300 pessoas que
estavam em uma palestra. A tabela de frequências para a variável “país de
origem” está disponível na planilha de suporte na aba Tabela de Frequências.
2. Medidas de posição
• Média
• Mediana
• Moda
• Percentis
• Quartis
• Decis
2. Medidas de posição
• Média

• É média aritmética simples para a variável, ou seja, é a soma dos valores (Xi)
contidos na variável dividido pela quantidade total de observações (n)

σ𝒏
𝒊=𝟏 𝑿𝒊
ഥ =
•𝑿
𝒏
2. Medidas de posição
• Mediana

• É o elemento central da distribuição da variável, considerando que a variável


esteja com seus n valores organizados de forma crescente

• Metade dos valores da variável são maiores ou iguais ao valor da mediana e


metade dos valores são menores ou iguais ao valor da mediana

𝑿𝒏 + 𝑿 𝒏
𝟐 +𝟏
𝟐
, 𝒔𝒆 𝒏 𝒇𝒐𝒓 𝒑𝒂𝒓
• 𝑴𝒅 𝑿 = ൞ 𝟐
𝑿 𝒏+𝟏 , 𝒔𝒆 𝒏 𝒇𝒐𝒓 𝒊𝒎𝒑𝒂𝒓
𝟐
2. Medidas de posição
• Moda

• É o valor que aparece com maior frequência nas observações de uma variável

• A moda também pode ser calculada para dados qualitativos

• É possível que não exista a moda de uma variável (especialmente, se for uma
variável contínua)

• Ocorre quando nenhum valor se repete


2. Medidas de posição
• Percentis

• São os elementos da distribuição da variável que dividem as observações em


cem partes iguais, considerando que a variável esteja com seus valores
organizados de forma crescente

• 14º Percentil
• 42º Percentil
• 60º Percentil ...

𝑷𝒊
• 𝑷𝒐𝒔 𝑷𝒊 = 𝒏−𝟏 . +𝟏
𝟏𝟎𝟎
2. Medidas de posição
• Quartis

• São os elementos da distribuição da variável que dividem as observações em


quatro partes iguais, considerando que a variável esteja com seus valores
organizados de forma crescente
• 1º Quartil: 25% das observações são menores do que o 1º quartil
• 2º Quartil: trata-se da mediana
• 3º Quartil: 25% das observações são maiores do que o 3º quartil

• 1º Quartil = 25º Percentil


• 2º Quartil = 50º Percentil
• 3º Quartil = 75º Percentil
2. Medidas de posição
• Decis

• São os elementos da distribuição da variável que dividem as observações em


dez partes iguais, considerando que a variável esteja com seus valores
organizados de forma crescente
• 1º Decil
• 3º Decil
• 8º Decil ...

• 1º Decil = 10º Percentil


• 3º Decil = 30º Percentil
• 8º Decil = 80º Percentil
3. Medidas de dispersão
• Amplitude
• Variância
• Desvio padrão
• Erro padrão
• Coeficiente de variação
3. Medidas de dispersão
• Amplitude

• Apresenta a diferença entre o valor máximo e o valor mínimo de uma variável

• 𝑨 = 𝑿𝒎á𝒙 − 𝑿𝒎í𝒏

• Valor máximo: maior valor da variável


• Valor mínimo: menor valor da variável
3. Medidas de dispersão
• Variância

• Mostra a dispersão das observações de uma variável em torno de sua média

σ𝒏 ഥ
𝒊=𝟏(𝑿𝒊 − 𝑿)²
• 𝑺𝟐 =
𝒏−𝟏

• Neste caso, trata-se da variância amostral


3. Medidas de dispersão
• Desvio padrão

• É uma medida derivada da variância, tornando mais simples a interpretação


da dispersão em torno da média

• A variância é definida em termos quadrados, o que dificulta a interpretação

• O desvio padrão é a raiz quadrada da variância

• 𝑺= 𝑺²
3. Medidas de dispersão
• Erro padrão

• É o desvio padrão da média da variável

𝑺
• 𝑺𝑿ഥ =
𝒏

• Sendo que S é o desvio padrão da variável e n o tamanho da amostra

• Quanto maior o tamanho da amostra, menor o erro padrão na estimativa da


média da variável → mais precisa é a média estimada
3. Medidas de dispersão
• Coeficiente de variação (CV)

• É uma medida de dispersão relativa, pois relaciona o desvio padrão e a média


de uma variável

• Pode ser utilizada para realizar comparações entre amostras, por exemplo

• Quanto menor o CV, mais homogêneos são os valores da variável e mais


concentrados estão os valores em torno da média

𝑺
• 𝑪𝑽 = ഥ
. 𝟏𝟎𝟎
𝑿
4. Medidas de forma
• Assimetria e Curtose

• Assimetria: local de concentração da distribuição


• Curva Simétrica: Média = Mediana = Moda
• Curvas Assimétricas – Direta: tem cauda mais longa à direita → Média > Mediana
• Curvas Assimétricas – Esquerda: tem cauda mais longa à esquerda → Média < Mediana

• Coeficiente de Assimetria de Fisher:

𝒏𝟐 . 𝑴𝟑 σ𝒏 ഥ
𝒊=𝟏(𝑿𝒊 − 𝑿)³
• 𝒈𝟏 = em que 𝑴𝟑 =
𝒏−𝟏 . 𝒏−𝟐 .𝑺𝟑 𝒏
4. Medidas de forma
• Assimetria e Curtose

• Curtose: achatamento da curva de distribuição


• Com a curva normal como referência, é possível observar se as curvas têm menor
dispersão em torno da média ou maior dispersão em torno da média

• Coeficiente de curtose de Fisher:

𝒏𝟐 . 𝒏+𝟏 . 𝑴𝟒 (𝒏−𝟏)𝟐 σ𝒏 ഥ 𝟒
𝒊=𝟏(𝑿𝒊 − 𝑿)
• 𝒈𝟐 = −𝟑. em que 𝑴𝟒 =
𝒏−𝟏 . 𝒏−𝟐 . 𝒏−𝟑 .𝑺𝟒 𝒏−𝟐 .(𝒏−𝟑) 𝒏
4. Medidas de forma
• Assimetria e Curtose

• Assimetria
• g1 = 0 indica curva simétrica
• g1 > 0 indica curva assimétrica positiva (à direita)
• g1 < 0 indica curva assimétrica negativa (à esquerda)

• Curtose
• g2 = 0 indica curva com distribuição normal
• g2 > 0 indica curva com distribuição alongada
• g2 < 0 indica curva com distribuição achatada
Posição, dispersão e forma
• Aplicação conjunta das medidas

• Exemplo: Um consumidor está analisando o preço de um produto que deseja


comprar. Para gerar mais informações para sua tomada de decisão, ele coleta
100 preços praticados para o produto. Como o “preço” é variável quantitativa,
serão realizadas as análises por meio das medidas de posição, dispersão e
forma abordadas anteriormente.

• O banco de dados com as 100 observações de preço está na planilha suporte na aba
Descritivas – Quantitativa.
5. Relação entre variáveis
• Medidas de análises bivariadas

• Muitas vezes, o interesse pode estar na relação entre duas variáveis. Nestes
casos, antes, é importante conhecer o tipo de variável:
• Variáveis qualitativas: análise da associação pelo teste qui-quadrado (χ2)

• Variáveis quantitativas: análise da correlação por meio da covariância e coeficiente de


correlação de Pearson
5. Relação entre variáveis
• Teste qui-quadrado: variáveis qualitativas

• Inicia-se por meio de uma tabela de distribuição conjunta de frequências, a


tabela de contingência (ou tabela de classificação cruzada) que apresenta as
frequências absolutas observadas para cada par de categorias das variáveis
Variável B
Categoria 1 Categoria 2 Categoria 3 ... Categoria J Total
Categoria 1 n11 n12 n13 ... n1J ΣL1
Categoria 2 n21 n22 n23 ... n2J ΣL2
Categoria 3 n31 n32 n33 ... n3J ΣL3
Variável A
... ... ... ... ... ... ...
Categoria I nI1 nI2 nI3 ... nIJ ΣLl
Total ΣC1 ΣC2 ΣC3 ... ΣCJ N
5. Relação entre variáveis
• Teste qui-quadrado: variáveis qualitativas

• Em seguida, são identificadas as frequências absolutas esperadas para cada


par de categorias das variáveis

σ 𝑳𝟏 . σ 𝑪𝟏
• 𝒇𝒓𝒆𝒒. 𝒂𝒃𝒔𝒐𝒍𝒖𝒕𝒂 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒂𝟏𝟏 =
𝑵

• O mesmo cálculo é realizado para cada par de categorias da tabela de contingência,


mantendo-se as respectivas correspondências de linha e coluna no numerador
5. Relação entre variáveis
• Teste qui-quadrado: variáveis qualitativas

• Posteriormente, são identificados os resíduos para cada par de categorias das


variáveis

• 𝒓𝒆𝒔í𝒅𝒖𝒐𝟏𝟏 = 𝒇𝒓𝒆𝒒. 𝒂𝒃𝒔𝒐𝒍𝒖𝒕𝒂 𝒐𝒃𝒔𝒆𝒓𝒗𝒂𝒅𝒂𝟏𝟏 − 𝒇𝒓𝒆𝒒. 𝒂𝒃𝒔𝒐𝒍𝒖𝒕𝒂 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒂𝟏𝟏

• Os resíduos são identificados para cada par de categorias da tabela de contingência


5. Relação entre variáveis
• Teste qui-quadrado: variáveis qualitativas

• Por fim, são calculados os valores χ2 individuais de cada par de categorias

(𝒓𝒆𝒔í𝒅𝒖𝒐)²
• 𝝌² =
(𝒇𝒓𝒆𝒒. 𝒂𝒃𝒔𝒐𝒍𝒖𝒕𝒂 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒂)

• E são somados valores χ2 individuais para obter o valor χ2 total da análise


5. Relação entre variáveis
• Teste qui-quadrado: variáveis qualitativas

• Com base no valor χ2 total, realiza-se o seguinte teste:

• H0: as variáveis se associam de forma aleatória.


• H1: a associação entre as variáveis não se dá de forma aleatória.

• Dados o nível de significância e os graus de liberdade, se o valor da estatística


χ2 for maior do que seu valor crítico, há associação significante entre as duas
variáveis (H1)

• Valor crítico da distribuição χ2 com (I – 1) . (J – 1) graus de liberdade


5. Relação entre variáveis
• Teste qui-quadrado: variáveis qualitativas

• Exemplo: Um estudo foi realizado com 200 pessoas com o intuito de analisar
o comportamento conjunto da variável “operadora de plano de saúde” com a
variável “nível de satisfação” do consumidor. O objetivo é analisar se existe a
associação estatisticamente significativa entre tais variáveis. (Fonte: Fávero e
Belfiore, 2017, Cap. 8)

• Os dados da tabela de contingência obtida a partir da amostra está na planilha suporte


na aba Associação – Qui².
5. Relação entre variáveis
• Coeficiente de correlação de Pearson

• É utilizado para identificar a correlação entre duas varáveis quantitativas

• Inicia-se pelo cálculo da covariância entre as duas variáveis e, posteriormente,


obtém-se o coeficiente de correlação de Pearson

σ𝒏 ഥ ഥ
𝒊=𝟏 𝑿𝒊 − 𝑿 . (𝒀𝒊 − 𝒀)
• 𝒄𝒐𝒗(𝑿, 𝒀) =
𝒏−𝟏
𝜌𝑋𝑌 = -1 (perfeita negativa)
𝜌𝑋𝑌 = 0 (sem correlação)
𝒄𝒐𝒗(𝑿,𝒀)
• 𝝆𝑿𝒀 = , sendo que 𝝆𝑿𝒀 varia entre -1 e 1 𝜌𝑋𝑌 = 1 (perfeita positiva)
𝑺𝑿 . 𝑺𝒀
5. Relação entre variáveis
• Coeficiente de correlação de Pearson

• Exemplo: O coordenador de um curso deseja analisar se existe correlação


entre as notas dos alunos em diferentes matérias. Para tanto, montou um
banco de dados com as notas de 30 alunos para as disciplinas de matemática,
física e literatura. Em seguida, deseja calcular os pares de correlações entre as
notas de matemática – física, matemática – literatura e física – literatura.
Quais são as correlações de Pearson obtidas?

• Os dados estão na planilha suporte na aba Correlação de Pearson.


Distribuições de Probabilidades
Variáveis e as distribuições
• Característica primordial

• Variável aleatória discreta: é aquela que não assume valores decimais, ou


seja, é composta exclusivamente de valores inteiros
• Exemplos: número de filhos; quantidade de pacientes por dia; quantidade de mudas por
hectare; quantidade de casos da doença por dia...

• Variável aleatória contínua: é aquela que pode assumir quaisquer valores


contidos nos números reais
• Exemplos: distância ente cidades; salário mensal; altura da pessoa; retorno da ação...
Variáveis discretas
• Distribuições de probabilidade:

• Uniforme
• Bernoulli
• Binomial
• Binomial negativa
• Poisson
Variáveis discretas
• Distribuição uniforme discreta

• Todos os possíveis valores têm a mesma probabilidade de ocorrência

𝟏
• 𝑷 𝑿 = 𝒙𝒊 =
𝒏

• O parâmetro n representa a quantidade de possíveis valores


Variáveis discretas
• Distribuição uniforme discreta

• Exemplo: As probabilidades dos resultados possíveis ao lançar um dado são:

• P(X=1) = 1/6
• P(X=2) = 1/6
• P(X=3) = 1/6
• P(X=4) = 1/6
• P(X=5) = 1/6
• P(X=6) = 1/6
Variáveis discretas
• Distribuição de Bernoulli

• Os valores da variável podem assumir apenas dois resultados possíveis, sendo


que tais resultados são chamados de sucesso (x=1) ou fracasso (x=0)

• A distribuição de Bernoulli apresenta a probabilidade de sucesso (p) ou de


fracasso (1 – p) quando ocorre apenas um experimento

• 𝑷 𝑿 = 𝒙 = 𝒑𝒙 . (𝟏 − 𝒑)𝟏−𝒙 Logística
binária!
Variáveis discretas
• Distribuição de Bernoulli

• Exemplo: A probabilidade (p) de que um candidato seja aprovado (x=1) em


um exame para um conselho de classes é de 48%. Se cada candidato só pode
realizar o exame uma vez, analise as probabilidades possíveis por meio da
distribuição de Bernoulli.

• P(X=1) = (0,48)¹ . (1 – 0,48)0 = 0,48 ou 48%


• P(X=0) = (0,48)0 . (1 – 0,48)¹ = 0,52 ou 52%

• Sendo que X=1 é aprovação e X=0 é a reprovação no exame.


Variáveis discretas
• Distribuição binomial

• A distribuição binomial ocorre quando há (n) repetições independentes do


experimento de Bernoulli e a probabilidade de sucesso (p) é constante em
todas as repetições

• A variável no modelo binomial indica a quantidade de sucessos (k) nas (n)


repetições do experimento

𝒏 𝒏 𝒏! Logística
• 𝑷 𝑿=𝒌 = 𝒌
. 𝒑𝒌 . (𝟏 − 𝒑)𝒏−𝒌 em que 𝒌
= multinomial!
𝒌! 𝒏−𝒌 !
Variáveis discretas
• Distribuição binomial

• Exemplo: Em uma indústria, sabe-se que a probabilidade (p) de encontrar


peças defeituosas em cada lote produzido é 6,50%. São produzidos 12 lotes
(n) da peça por mês. Analise as seguintes probabilidades (k):

a) Qual a probabilidade de encontrar peças defeituosas em 2 lotes no mês?


b) Qual a probabilidade de encontrar peças defeituosas em 4 lotes no mês?
c) Qual a probabilidade de encontrar peças defeituosas em no máximo 2 lotes?

• A planilha para auxílio está na planilha de suporte na aba Distribuição Binomial.


Variáveis discretas
• Distribuição binomial negativa

• Na distribuição binomial negativa, são realizados (x) ensaios independentes


de Bernoulli até que sejam obtidos (k) sucessos

• A probabilidade de sucesso (p) é constante em todos os ensaios realizados

• A variável no modelo binomial negativa indica a quantidade de ensaios (x)

𝒙−𝟏 𝒙−𝟏 (𝒙−𝟏)!


• 𝑷 𝑿=𝒙 = 𝒌−𝟏
. 𝒑𝒌 . (𝟏 − 𝒑)𝒙−𝒌 em que 𝒌−𝟏
=
𝒌−𝟏 ![ 𝒙−𝟏 − 𝒌−𝟏 ]!
Variáveis discretas
• Distribuição binomial negativa

• Exemplo: Em um parque de diversões, existe uma máquina em que o jogador


deve capturar algum item utilizando os comandos de um braço mecânico.
Considere que a probabilidade (p) de que o jogador consiga capturar algum
item em cada jogada é 11%. Identifique as seguintes probabilidades:

a) De que o jogador necessite de 10 jogadas para capturar 3 itens.


b) De que o jogador necessite de 20 jogadas para capturar 3 itens.
c) De que o jogador necessite de 5 jogadas para capturar 1 item.

• A planilha para auxílio está na planilha de suporte na aba Distribuição Binomial Negativa
Variáveis discretas
• Distribuição Poisson

• A distribuição Poisson indica a probabilidade do número de sucessos (k) em


uma determinada exposição contínua

• Exemplos de exposição: tempo e área

𝒆−𝝀 . 𝝀𝒌
• 𝑷 𝑿=𝒌 =
𝒌!

• Em que 𝝀 é a taxa média estimada de ocorrência do evento (sucesso) em dada exposição


Variáveis discretas
• Distribuição Poisson

• Exemplo: Um médico notou que a taxa média de ocorrência (𝝀) de pacientes


com certa doença rara em seu consultório é de 2 por ano. Aceitando que esta
variável tenha distribuição Poisson, estime:

a) A probabilidade de que o médico receba 1 paciente com a doença em um ano.


b) A probabilidade de que o médico receba 3 pacientes com a doença em um ano.
c) A probabilidade de que o médico não receba pacientes com a doença em um ano.
d) A probabilidade de que o médico receba 10 pacientes com a doença nos próximos 2
anos.
• A planilha para auxílio está na planilha de suporte na aba Distribuição Poisson.
Variáveis contínuas
• Distribuições de probabilidade:

• Normal (Normal Padrão)


• Qui-quadrado
• t de Student
• F de Snedecor
Variáveis contínuas
• Distribuição normal

• É a distribuição Gaussiana, com curva em forma de sino

• Os parâmetros relevantes da distribuição normal são a média (μ) e o desvio


padrão (σ) da variável

(𝒙 − 𝝁)²
𝟏 −
•𝒇 𝒙 = .𝒆 𝟐 . 𝝈²
𝝈 . 𝟐𝝅
Variáveis contínuas
• Distribuição normal

Fonte: Fávero e Belfiore (2017, Cap. 5)


Variáveis contínuas
• Distribuição normal padrão

• Para obter a normal padrão, transforma-se a variável por meio do Z-score

• A transformação pelo Z-score faz com que a variável passe a ter média = 0 e
desvio padrão = 1 e não altera a distribuição original

(𝑿− 𝝁)
• 𝒁=
𝝈

• Exemplo: valores críticos em uma tabela normal padrão e no Excel


Variáveis contínuas
• Distribuição normal padrão

Fonte: Fávero e Belfiore (2017, Cap. 5)


Variáveis contínuas
• Distribuição normal padrão

• Exemplo: Um investidor calculou que o retorno médio mensal de uma ação


na bolsa de valores foi 2,80%. No mesmo período, o desvio padrão dos
retornos da ação foi de 1,20%. Com base na distribuição normal, calcule:

a) A probabilidade de que o retorno da ação seja maior do que 4% ao mês.


b) A probabilidade de que o retorno da ação seja menor do que 3% ao mês.
c) A probabilidade de que o retorno da ação seja negativo.
d) A probabilidade de que o retorno da ação seja maior que 1% e menor que 5% ao mês.

• A planilha para auxílio está na planilha de suporte na aba Distribuição Normal.


Variáveis contínuas
• Distribuição qui-quadrado (χ2)

• A distribuição χ2 apresenta curva assimétrica e positiva

• É formada a partir da soma dos quadrados de v variáveis aleatórias


independentes com distribuição normal padrão

• Exemplo: valores críticos em uma tabela qui-quadrado e no Excel


Variáveis contínuas
• Distribuição qui-quadrado (χ2)

Fonte: Fávero e Belfiore (2017, Cap. 5)


Variáveis contínuas
• Distribuição qui-quadrado (χ2)

• Exemplo: Um pesquisador em botânica identificou que uma variável de seu


estudo segue uma distribuição qui-quadrado e tem 7 graus de liberdade. Com
base nestas informações, o pesquisador calculou:

a) A probabilidade de que encontre um valor X>6.


b) A probabilidade de que encontre um valor X<8.
c) O valor de X que faz com que a P(X>x) seja 5%.
d) O valor de X que faz com que a P(X<x) seja 90%.

• A planilha para auxílio está na planilha de suporte na aba Distribuição Qui-Quadrado


Variáveis contínuas
• Distribuição t de Student

• A distribuição t de Student é parecida com a distribuição normal padrão, ou


seja, tem formato de sino e é simétrica em torno da média

• Por outro lado, a distribuição t de Student tem caudas mais longas e isso
permite valores mais extremos

• Uma aplicação da distribuição t de Student é o teste de hipóteses para médias

• Exemplo: valores críticos em uma tabela t de Student e no Excel


Variáveis contínuas
• Distribuição t de Student

Fonte: Fávero e Belfiore (2017, Cap. 5)


Variáveis contínuas
• Distribuição t de Student

• Exemplo: O gestor do controle de qualidade de uma empresa identificou que


uma variável relevante para seu controle apresenta distribuição t de Student
e tem 7 graus de liberdade. Quais são suas análises nas situações:

a) A probabilidade de que encontre T > 2,5.


b) A probabilidade de que encontre T < - 2,5.
c) A probabilidade de que encontre T>-1 e T<2.
d) O valor de T para que P(T>t) = 5%.

• A planilha para auxílio está na planilha de suporte na aba Distribuição t Student.


Variáveis contínuas
• Distribuição F de Snedecor

• Uma aplicação comum da distribuição F (distribuição de Fischer) é a análise


de variâncias

• Tem distribuição de probabilidades assimétrica e positiva quando os graus de


liberdade v1 e v2 são pequenos

• Exemplo: valores críticos em uma tabela F de Snedecor e no Excel


Variáveis contínuas
• Distribuição F de Snedecor

Fonte: Fávero e Belfiore (2017, Cap. 5)


Variáveis contínuas
• Distribuição F de Snedecor

• Exemplo: Um cientista de dados está avaliando uma variável com distribuição


F de Snedecor. Tal variável apresenta 17 graus de liberdade no numerador e
28 graus de liberdade no denominador. Determine:

a) A probabilidade de que encontre X > 1,5.


b) A probabilidade de que encontre X < 1,0.
c) A probabilidade de que encontre 2<X<3.
d) O valor de F para que P(X>x) = 5%.

• A planilha para auxílio está na planilha de suporte na aba Distribuição F de Snedecor.


Testes de Hipóteses
Testes de hipóteses
• Finalidade

• Em certos casos, podemos estar interessados em testar características sobre


parâmetros populacionais como a média e o desvio padrão (variância)

• Dada a impossibilidade de obter os dados sobre a população, utilizamos as


amostras da população

• Para testar o parâmetro de interesse por meio de amostras, utilizamos os


testes de hipóteses estatísticas
Tipos de testes
• Teste bilateral (bicaudal)

• No teste bilateral, para um parâmetro θ, o interesse é testar:

• H0: θ = θ0 (hipótese nula)


• H1: θ ≠ θ0 (hipótese alternativa)

• O objetivo é verificar se o parâmetro é estatisticamente diferente de certo


valor de interesse

• É necessário definir o nível de significância (α) desejada para a análise


Tipos de testes
• Teste bilateral (bicaudal)

Região Não Rejeição (RN): se


Região Crítica (RC): se a
a estatística do teste cair em
estatística do teste cair em
RN, a hipótese nula não é
RC, a hipótese nula é rejeitada
rejeitada

Fonte: Fávero e Belfiore (2017, Cap. 7)


Tipos de testes
• Teste unilateral à esquerda

• No teste unilateral à esquerda, para um parâmetro θ, o interesse é testar:

• H0: θ = θ0 (hipótese nula)


• H1: θ < θ0 (hipótese alternativa)

• O objetivo é analisar se o parâmetro é estatisticamente menor do que certo


valor de interesse
Tipos de testes
• Teste unilateral à esquerda

Fonte: Fávero e Belfiore (2017, Cap. 7)


Tipos de testes
• Teste unilateral à direita

• No teste unilateral à direita, para um parâmetro θ, o interesse é testar:

• H0: θ = θ0 (hipótese nula)


• H1: θ > θ0 (hipótese alternativa)

• O objetivo é verificar se o parâmetro é estatisticamente maior do que certo


valor de interesse
Tipos de testes
• Teste unilateral à direita

Fonte: Fávero e Belfiore (2017, Cap. 7)


Tipos de erros
• Possíveis erros na tomada de decisão

• Erro tipo I: rejeitar a hipótese nula (H0) quando ela é verdadeira

• Erro tipo II: não rejeitar a hipótese nula (H0) quando ela é falsa

• As decisões corretas são:

• Rejeitar H0 quando ela é falsa


• Não rejeitar H0 quando ela é verdadeira
Significância do teste
• Nível de significância do teste

• O nível de significância (α) indica a probabilidade de rejeitar H0 quando ela é


verdadeira, ou seja, a probabilidade de cometer o erro tipo I

• Alguns níveis de significância recorrentemente utilizados:


• α = 1%
• α = 5%
• α = 10%

• O nível de confiança do teste é definido como 1 – α


P-valor e teste de hipótese
• P-valor e nível de significância

• Uma forma de testar estatisticamente a hipótese é comparando o valor da


estatística calculada nos dados com o valor crítico para o nível de significância

• Também é possível obter o p-valor para a estatística calculada e, em seguida,


compará-lo ao nível de significância escolhido
• Se p-valor < nível de significância (α) → rejeita-se H0
• Se p-valor > nível de significância (α) → não rejeita H0

• O p-valor é a probabilidade associada ao valor da estatística calculada


Testes de hipóteses
• Teste Z para médias de uma amostra

• Aplicado quando o desvio padrão populacional é conhecido e a distribuição


da variável é normal (ou utilizando grandes amostras)

• A estatística do teste é:

ഥ − 𝝁𝟎
𝑿
• 𝒁=
𝝈Τ 𝒏

• A distribuição relevante para os valores críticos é a normal padrão


Testes de hipóteses
• Teste Z para médias de uma amostra

• Exemplo: Um fabricante de caixas de papelão deseja verificar se a quantidade


de papelão que está sendo utilizada em cada caixa do tipo 1 está de acordo
com seu padrão histórico, pois existem indícios de que o consumo aumentou.
Historicamente, são utilizados, em média, 100 g de papelão em cada caixa e o
desvio padrão é de 12g. Coletou-se uma amostra para verificar se a média
atual é maior do que a média histórica.

• A amostra coletada está na planilha suporte na aba Teste Z médias.


Testes de hipóteses
• Teste t para médias de uma amostra

• Aplicado quando o desvio padrão populacional não é conhecido e, assim, é


utilizado o desvio padrão amostral

• Estatística do teste é semelhante ao Z, porém com desvio padrão amostral:

ഥ − 𝝁𝟎
𝑿
• 𝑻=
𝑺Τ 𝒏

• A distribuição relevante é a t de student com n-1 graus de liberdade


Testes de hipóteses
• Teste t para médias de uma amostra

• Exemplo: O tempo médio de processamento de determinada tarefa em uma


máquina tem sido de 18 minutos. Foram introduzidos novos conceitos para
reduzir o tempo médio de processamento. Desta forma, após certo período,
coletou-se uma amostra de 25 elementos, obtendo-se o tempo médio de
16,808 minutos com desvio-padrão de 2,733 minutos. Verifique se esse
resultado evidencia uma melhora no tempo médio de processamento.
Considere α = 1%. (Fonte: Fávero e Belfiore, 2017, Cap. 7)

• Os dados estão na planilha suporte na aba Teste t médias.


Testes de hipóteses
• Teste t para correlações

• Após estimado o coeficiente de correlação (r) entre as variáveis quantitativas,


é possível testar a significância do parâmetro estimado

• Estatística do teste:

𝒓
• 𝒕=
(𝟏−𝒓²)
(𝒏−𝟐)

• A distribuição relevante é a t de student com n-2 graus de liberdade


Testes de hipóteses
• Teste t para correlações

• Exemplo: Voltando ao exemplo da correlação entre as notas dos alunos, agora


o objetivo é avaliar se as correlações obtidas para as amostras de notas são
significantes. O coordenador utilizou o nível de significância de 5% para suas
análises.

• Os dados estão na planilha suporte na aba Correlação de Pearson.


Testes de hipóteses
• Teste qui-quadrado para uma amostra

• Aplicado quando a variável assume duas ou mais categorias (K) e o objetivo é


verificar se há diferenças entre as frequências observada (O) e esperada (E)

• A estatística do teste é:

𝒌 (𝑶𝒊 − 𝑬𝒊 )𝟐
• 𝝌𝟐 = σ𝒊=𝟏
𝑬 𝒊

• A distribuição relevante é a qui-quadrado com k-1 graus de liberdade


Testes de hipóteses
• Teste qui-quadrado para uma amostra

• Exemplo: Uma loja deseja verificar se a quantidade vendida em cada dia da


semana varia em função do dia da semana. Os dados para as vendas em cada
dia de uma semana escolhida aleatoriamente foram tabulados. Neste caso, o
objetivo é testar se a frequência observada e esperada são iguais ou se são
diferentes. (Fonte: Fávero e Belfiore, 2017, Cap. 8)

• Os dados tabulados estão na planilha de suporte na aba Teste Qui² Uma Amostra.
Testes de hipóteses
• Teste F para comparação de variâncias

• Aplicado para comparar as variâncias de duas amostras independentes

• A estatística do teste é:

𝑺𝟐𝒎𝒂𝒊𝒐𝒓
• 𝑭=
𝑺𝟐𝒎𝒆𝒏𝒐𝒓

• A distribuição relevante é a F de Snedecor, com n-1 graus de liberdade no


numerador e n-1 graus de liberdade no denominador
Testes de hipóteses
• Teste F para comparação de variâncias

• Exemplo: Uma empresa de logística está analisando qual entre duas rotas
oferece a melhor previsibilidade para o horário de entrega ao seu maior
cliente. Foram coletados dados sobre o tempo de entrega durante 35 dias
para cada rota. O diretor de logística deseja testar a hipótese que a rota B tem
maior variabilidade no tempo de entrega, comparativamente à rota A.

• Os dados estão na planilha suporte na aba Teste F Variâncias.


Intervalo de confiança
• Intervalo de confiança para a média

• Quando obtemos a estimativa para a média populacional a partir de uma


amostra, também podemos construir seu intervalo de confiança, isto é, um
intervalo de valores possíveis para o parâmetro populacional

• É necessário estabelecer o nível de confiança da análise (por exemplo, 95%)

𝒔 𝒔 𝒔 𝒔
• 𝑰𝑪 = (ഥ
𝒙−𝒁. ഥ+𝒁.
, 𝒙 ) ou ഥ−𝒕.
𝑰𝑪 = 𝒙 ഥ+𝒕.
, 𝒙
𝒏 𝒏 𝒏 𝒏

Grandes amostras / Variância conhecida Pequenas amostras / Variância desconhecida

• Z e t são os valores bicaudais; na distribuição t utiliza-se n-1 graus de liberdade


Intervalo de confiança
• Intervalo de confiança para a média

• Exemplo: Um engenheiro coletou uma amostra de 25 peças saídas da linha de


montagem e encontrou que o tamanho médio foi de 47cm e o desvio padrão
foi 1cm. Qual é o intervalo de confiança com 95% para esta média estimada?

• Os dados estão na planilha de suporte na aba Intervalo de Confiança – Média.


Testes de hipóteses
• Teste t para comparação de médias em
duas amostras independentes

• Para comparar as médias de duas amostras independentes de uma mesma


população por meio do teste t, antes é necessário comparar as variâncias
populacionais dos dois grupos

• Por exemplo, antes pode ser feito um teste F para comparação das variâncias

• O cálculo da estatística t e graus de liberdade depende: se as variâncias


populacionais forem diferentes ou se são homogêneas
Testes de hipóteses
• Teste t para comparação de médias em
duas amostras independentes

• Estatística T para variâncias populacionais diferentes

(𝑿𝟏 −𝑿𝟐 )
• 𝑻= 𝑺²𝟏 𝑺²𝟐
+
𝒏𝟏 𝒏𝟐
𝑺²𝟏 𝑺²𝟐
+
𝒏 𝟏 𝒏𝟐
²
• Os graus de liberdade são 𝒗 = 𝑺²𝟏൘ 𝑺²𝟐൘
𝒏𝟏 ² 𝒏𝟐 ²
(𝒏𝟏 −𝟏)
+ (𝒏 −𝟏)
𝟐
Testes de hipóteses
• Teste t para comparação de médias em
duas amostras independentes

• Estatística T para variâncias populacionais homogêneas

(𝑿𝟏 −𝑿𝟐 )
• 𝑻= 𝟏 𝟏
𝑺𝒑 . 𝒏 +𝒏
𝟏 𝟐

𝒏𝟏 −𝟏 .𝑺²𝟏 + 𝒏𝟐 −𝟏 .𝑺²𝟐
• Em que 𝑺𝒑 = e os graus de liberdade são n1+n2-2
𝒏𝟏 +𝒏𝟐 −𝟐
Testes de hipóteses
• Teste t para comparação de médias em
duas amostras independentes

• Exemplo: Em uma indústria, o gerente de produção fez um levantamento com


30 medições da temperatura (em °C) dos dois principais fornos da linha de
produção que produzem os produtos do mesmo tipo. Destas, 15 medições
foram do forno A e 15 medições foram para o forno B. O objetivo é verificar
se a temperatura média está consideravelmente diferente entre os fornos.

• Os dados estão na planilha suporte na aba Teste t Duas Amostras Indep.


Referência

Fávero, Luiz Paulo; Belfiore, Patrícia. (2017). Manual de análise de dados: estatística
e modelagem multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier
Estruturas de Bancos de Dados,
Tipos de Variáveis e Escalas de
Mensuração
Conjunto de técnicas de programação voltadas à
coleta, ao tratamento, à manipulação, à organização,
à análise, à extração de informação e à apresentação
Data Science de dados, na forma de relatórios ou gráficos, visando
subsidiar o processo de tomada de decisão.
O que são algoritmos?
Algoritmos – um conceito:

Algoritmos são sequências explícitas, literais,


limitadas e sistêmicas de instruções e de
operações direcionadas à consecução de um
dado objetivo pré-definido.

Basicamente, qualquer verbo conhecido, desde


que denote uma ação destinada a humanos, pode
ser considerado um algoritmo.
Link: https://www.youtube.com/watch?v=pdhqwbUWf4U
Taxonomia Básica de Espécies
de Algoritmos de Machine
Learning

NÃO SUPERVISIONADOS SUPERVISIONADOS

Técnicas de machine learning assentadas com Técnicas de machine learning assentadas com
algoritmos não supervisionados (unsupervised algoritmos supervisionados (supervised learning)
learning) não possuem capacidade de inferência. possuem capacidade de inferência. Dedicam-se,
Dedicam-se, portanto, a uma análise portanto, a uma análise confirmatória, preditiva,
exploratória, diagnóstica, de dado fenômeno de dado fenômeno estudado. Exemplos comuns:
estudado. Exemplos comuns: Análise de Clusters, Regressões Lineares, Regressões Logísticas,
Análise Fatorial de Componentes Principais, Árvores de Decisão, Random Forests, Redes
Análises de Correspondências Simples e Neurais, etc.
Múltiplas, etc.
Como escolher os algoritmos?
Passo 1: Algoritmos Não Supervisionados
ou Algoritmos Supervisionados?

O primeiro passo é a definição do problema que se


quer resolver, seja ele acadêmico ou não.
▪ Se há objetivos de fazer inferências para observações
não presentes na amostra que foi utilizada para o
treino do algoritmo, o ideal é a utilização de
algoritmos supervisionados;
▪ Se há objetivos de fazer diagnósticos, sem a intenção
de fazer inferências para observações não presentes
na amostra que foi utilizada para o treino do
algoritmo, o ideal é a utilização de algoritmos não
supervisionados.
Passo 2: A Construção e a Estruturação
de uma Base de Dados

Regra geral, as bases de dados são estruturadas da seguinte maneira: variáveis em colunas e observações
em linhas.
Colunas: variáveis
Linhas: observações

id palavras suspeitas remetente desconhecido presença de imagens classificação


1 sim não sim spam
2 sim sim não spam
3 sim sim não spam
4 não sim sim genuíno
5 não não não genuíno
6 não não não genuíno
Passo 3: Quais as Escalas de Mensuração
de suas Variáveis?

A definição incorreta das escalas de mensuração das variáveis da base de dados é um dos principais erros
na aplicação das técnicas de machine learning. Tal erro é irreparável, implicando no reinício de todo o
processo de modelagem, em razão dos vieses criados (e.g.: a ponderação arbitrária).

Em suma: suas variáveis são apenas quantitativas, apenas qualitativas ou há a presença


dos dois tipos?
O que é uma variável?
O que é uma variável?

Variáveis podem ser entendidas como uma característica de dada amostra ou população, que pode ser medida, ou
contada ou categorizada.

São bons exemplos introdutórios, a altura e/ou o peso das pessoas, suas faixas de renda, a cor e/ou o modelo de
carros que dirigem.

Os indivíduos de uma dada amostra ou população, não necessariamente, precisam ser pessoas em seu sentido
físico. Podem ser objetos, distritos, municípios, organizações, grupos, células, moléculas, astros, etc. Dessa forma,
as características dos indivíduos mencionados, seriam consideradas suas variáveis.

Para o curso, estabeleceremos a escala de mensuração das variáveis em duas: i) variáveis qualitativas; e ii) variáveis
quantitativas.
Variáveis Qualitativas

▪ Também são conhecidas como variáveis latentes ou variáveis categóricas. São


variáveis que não podem ser medidas; tão somente, categorizadas ou contadas.
▪ Por não poderem ser medidas, não permitem o cálculo de estatísticas
descritivas de posição – e.g.: a media e a mediana.
▪ Por outro lado, podemos estabelecer tabelas de frequências para as suas
categorias.
▪ Dividem-se em categóricas nominais e categóricas ordinais.
Variáveis Quantitativas

▪ Também conhecidas como variáveis métricas, ao contrário das variáveis


qualitativas, as variáveis quantitativas podem ser mensuradas, possuindo, por
óbvio, uma respective unidade de medida.

▪ Permitem o cálculo da média e da mediana, por exemplo.

▪ Dividem-se em variáveis contínuas e variáveis discretas.


5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
Ats
elo Rafael de Freitas Souza

ar c Linkedin
M
Introdução à Linguagem R
Por Que Aprender uma
Linguagem de Programação?
▪ Aprender a programar é muito importante quando desejamos entender os
dados! Mais: é importante para que possamos interpretar esses dados; para
que possamos transformá-los em informação!
▪Se você trabalha ou deseja trabalhar com dados, programar é uma skill de
extrema relevância.

Uma pergunta justa seria:


“Eu já trabalho ou desejo trabalhar com dados, e já possuo acesso a eles
via Windows, OSx, Android, iOS, Chrome, Mozilla, Edge, Safari... Ainda
assim, eu preciso aprender a programar?”
As Limitações de uma Graphic
User Interface (GUI)
5 1
0 9 8-
73 .
5 .2
Reprodutibilidade a 31
h i d
s
i Yo
Automação u sh
Ats
elo
ar c
Comunicação
M
Por Que o R?
Sobre o R

▪ A linguagem R surgiu em 1995, derivada da linguagem S, e é orientada a objetos.


▪ Possui inúmeros pacotes (mais de 17 mil), com vantagem para a aplicação da Estatística
Avançada e uma vasta comunidade de suporte, além de fortes capacidades voltadas ao Data
Science.
▪ Comprehensive R Archive Network (CRAN) é o repositório da linguagem R em que cada usuário
pode contribuir com novos pacotes (coleções de funções em R com código compilado). Esses
pacotes podem ser facilmente instalados com uma linha de código.
▪ Leituras recomendadas para quem não ainda não conhece a linguagem R e deseja se
aprofundar:
• Hands-On Programming with R (Grolemund, 2014);
• R for Data Science (Wickham & Grolemund, 2016);
• Ciência de Dados com R (Oliveira, Guerra & McDonnell, 2018).
5 1
0 9 8-
73 .
5 .2 C
A i d a 31
sh
i Yo
u sh
Ats
lo
ar c e D
B
M
Objetos, Funções e Argumentos

Há autores que definem os objetos do R como sendo uma variável. Para o curso, entenderemos que
variáveis correspondem a características de uma dada amostra ou população.

▪ Objetos são maneiras simples de se acessar algo que foi salvo na memória da máquina. Pode ser um valor,
uma palavra, uma ou mais variáveis, uma URL, uma base de dados amostral ou populacional, uma lista de
coisas distintas contendo informações e tamanhos distintos, um gráfico, um mapa, uma imagem, um novo
comando, etc. No R TUDO é um objeto! Cada um desses objetos possui uma classe!
▪ Funções correspondem a ações, a ordens direcionadas à máquina;
▪ Argumentos correspondem a um refinamento ou um melhor direcionamento das ações ou ordens
propostas pelas funções.
Criando um Objeto no R
▪ Há duas formas de se criar um objeto na linguagem R:
▪ Utilizando-se o símbolo =; ou
▪ Utilizando-se o símbolo <- chamado operador de atribuição (prefira essa forma, reservando o símbolo
= para as atribuições de valor dos argumentos das funções ou para operações matemáticas). O sinal de
atribuição pode ser rapidamente declarado ao se pressionar conjuntamente as teclas ‘Alt’ e ‘-’.

▪ Os nomes dos objetos estabelecidos em R devem seguir certas regras:


1. Não devem começar por números e nem por pontos;
2. Não é desejável que contenham espaços, muito embora a situação seja possível com o uso dos
símbolos ``;
3. Suas nomenclaturas também não aceitam caracteres especiais, como: !, ~, $, @, +, -, /, *.
4. Recomenda-se evitar nomear os objetos com os mesmos nomes de funções já estabelecidas;
5. Recomenda-se não utilizar acentos e, sempre que possível, evitar as letras maiúsculas, visto que a
linguagem é case sensitive.
Principais Funções Introdutórias do Curso
- 5 1
Função
9
Serve
0 8para:
args()
7 3 .
Verificar os argumentos de uma dada função no R
round()
5
Arredondar números .2
Criar amostras1
sample()
3
aas classes dos objetos do R
class()
h i d
Verificar
View()
osVisualizar objetos em forma de planilha

i Y Visualizar as primeiras observações de uma base de dados


h
head()

s u s
t
tail() Visualizar as últimas observações de uma base de dados
str()
o A Observar a estrutura de uma base de dados
length()
c el Observar o comprimento de um vetor ou de uma lista de dados
dim()
ar Descobrir as dimensões de um objeto
nrow() M Contar o número de linhas de uma base de dados
ncol() Contar o número de colunas de uma base de dados
rm() Remover um objeto do ambiente de trabalho
install.packages() Instalar pacotes
library() Carregar pacotes
Utilizando funções no R

Para utilizar uma função no R, devemos conhecer sua forma funcional, isto é, devemos, em regra, declarar
os argumentos inerentes a ela. Exemplo de utilização da função round():

Argumentos da função

round (x, digits)


No caso, um número
Função, propriamente dita inteiro definidor da
quantidade de casas
No caso, um vetor a decimais a ser
ser afetado pela utilizada
função declarada
Pacotes na Linguagem R
▪ A linguagem R possui milhares de pacotes
direcionados às mais diversas áreas do
conhecimento, e a maioria não está instalada em
nossos computadores. Para instalar um pacote,
devemos comandar:
install.packages("nome do pacote aqui")

▪ A instalação de um pacote não basta para sua utilização. Assim, a cada nova seção aberta do
RStudio, devemos chamá-los da seguinte maneira:

library(nome do pacote aqui)


Criando e Excluindo Variáveis em
um Dataset

▪ Criando uma variável:


basededados$nova_variável <- NA

ou

mtcars[“nova_variável"] <- NA

▪ Excluindo uma variável:


basededados$nova_variável <- NULL
Extraindo Valores de um
Dataset

▪Para extrair uma coluna de um dataset, utilize o operador $:


basededados$nova_variável

▪De maneira mais precisa, também se pode extrair valores do dataset com o operador [ , ]:
basededados[ , ]
Declaração de Declaração de
qual linha se qual coluna se
quer acessar quer acessar
Funções if, else e
ifelse:

if(teste lógico){
caso a resposta do teste lógico seja TRUE, faça isso
} else {
caso a resposta do teste lógico seja FALSE, faça essa outra coisa
}

ifelse(teste lógico,
yes = caso a resposta do teste lógico seja TRUE, faça isso,
no = caso a resposta do teste lógico seja FALSE, faça essa outra coisa)
Funções for, while e
repeat
y <- 10

for(i in 1:5){
print(y + i) Para cada i (poderia ser qualquer
} símbolo ou palavra), presente na
sequência de 1 a 5, imprima o valor
da soma entre y e i
Funções for, while e
repeat
z <- 0

while(z < 10){


print(z) Enquanto z for menor do que 10,
z <- z + 1 imprima z e, depois, atualize o valor
} de z acrescendo o seu valor em uma
unidade
Funções for, while e
repeat
w <- 3

repeat{
Repita os passos a seguir:
print(w)
w <- w + 2 - Imprima o valor de w;
if(w > 18) break() - Atualize o valor de w, acrescendo-
o em duas unidades;
}
- Se w passar a ser maior do que
18, pare tudo.
Visualização de Dados com o
ggplot2

▪ A sintaxe mais básica do pacote ggplot2, para a criação de um gráfico a partir de um data
frame, é a seguinte:

ggplot(data = base de dados aqui) +


geom_geometria escolhida aqui(aes(principais elementos do gráfico aqui))
5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
Ats
elo Rafael de Freitas Souza

ar c Linkedin
M
INTRODUÇÃO AO SOFTWARE R E
INTRODUÇÃO AO MACHINE
LEARNING

Prof. Dr. Wilson Tarantin Jr.

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Introdução ao Machine Learning

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Machine learning
• Definição

• Podem ser encontradas muitas definições para o conceito machine learning

• Porém, de forma geral, pode-se entender como a utilização dos dados e de


algoritmos (que contêm também métodos estatísticos) para a produção de
informações que serão relevantes para a tomada de decisão

• Por exemplo: criando modelos preditivos ou mesmo classificando dados

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Banco de dados
• Definição e composição

• O banco de dados é o objeto onde estão armazenadas as informações de


interesse para a análise ou estudo em questão

• Em muitos casos, o banco de dados contém uma amostra, que nada mais é do
que um subconjunto extraído da população

• O banco de dados é composto por variáveis e por observações

• Variáveis: características/atributos observados, medidos ou categorizados


• Observações: as unidades que têm suas características e atributos medidos
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Banco de dados
• Estrutura para uso

• Normalmente, o banco de dados é estruturado com as variáveis em colunas e


as observações em linhas
Idade Altura Cidade Profissão Renda ...
Pessoa 1
Pessoa 2
Pessoa 3
Pessoa 4
Pessoa 5
Pessoa 6
Pessoa 7
Pessoa 8
Pessoa 9
Pessoa 10
...
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Tipos de variáveis
• As variáveis podem ser divididas em

• Métricas: são as variáveis quantitativas, isto é, apresentam características


que podem ser mensuradas ou contadas

• Não métricas: são as variáveis qualitativas, sendo que indicam características


que não podem ser medidas. Tais variáveis contêm categorias, por isto,
muitas vezes, são chamadas de variáveis categóricas

• A identificação do tipo de variável é fundamental para a escolha do método


estatístico que será utilizado na análise dos dados

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Variáveis qualitativas
• Características principais

• As variáveis qualitativas têm sua representação feita por meio de tabelas de


distribuição de frequências ou gráficos

• Também é possível calcular a moda de uma variável qualitativa, definida


como a categoria que mais repete na distribuição da variável

• Não é possível calcular outras medidas de resumo como média ou desvio padrão para
variáveis qualitativas

• Exemplos: escalas likert, nacionalidade, cor do veículo, profissão...


*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Variáveis quantitativas
• Características principais

• As variáveis quantitativas podem ser representadas por diversas ferramentas,


como gráficos, medidas de posição ou localização, dispersão e de forma. A
seguir, alguns exemplos:

• Medidas de posição ou localização: média, mediana, percentis


• Medidas de dispersão: desvio padrão
• Medidas de forma: assimetria e curtose

• Exemplos: idade, renda em Reais, número de habitantes no município,


distância em metros, rentabilidade percentual de uma empresa....
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Detalhando as variáveis
• Outras características relevantes

• Variáveis qualitativas: dicotômica ou policotômica; nominal ou ordinal

• Dicotômica: duas categorias (binária); Policotômica: mais de duas categorias


• Nominal: não estabelece relação de grandeza/ordem; Ordinal: estabelece uma ordem

• Variáveis quantitativas: discretas ou contínuas

• Discretas: possuem conjunto finito e numerável de valores, em geral, são obtidas a partir
de dados de contagem (0, 1, 2, 3, 4, 5...)
• Contínuas: assumem valores pertencentes ao intervalo de números reais

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Variáveis e técnicas
• Como identificar a técnica adequada

• Modelos não supervisionados de machine learning

• Também são conhecidos como modelos exploratórios ou técnicas de interdependência


• Estudo da relação entre variáveis, mas sem a intenção de criar modelos confirmatórios
• Não há inferência dos resultados encontrados para observações fora da amostra
• Objetivos: redução dos dados, classificação ou agrupamento de observações e variáveis,
correlação ou associação entre variáveis

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Variáveis e técnicas
• Como identificar a técnica adequada

• Modelos supervisionados de machine learning

• Conhecidos como modelos confirmatórios ou técnicas de dependência


• O objetivo é estimar modelos, equações, com o intuito de elaborar previsões
• Portanto, há inferência dos resultados para outras observações fora da amostra

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Classificação de algoritmos
Hierarchical
Classification Trees GLM
Clustering

Regression Trees K-Means Clustering GLMM

Bagging e Regressões Lineares e


PCA
Random Forests Não Lineares

Modelos Logísticos
Boosting ANACOR e MCA
Binários e Multinomiais

Modelos para Dados de


Redes Neurais NÃO SUPERVISIONADOS Contagem e Zero-Inflated

SUPERVISIONADOS

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Classificação de algoritmos
VARIÁVEIS QUANTITATIVAS

Hierarchical
Classification Trees GLM
Clustering

Regression Trees K-Means Clustering GLMM

Bagging e Regressões Lineares e


PCA
Random Forests Não Lineares

Modelos Logísticos
Boosting ANACOR e MCA
Binários e Multinomiais

Modelos para Dados de


Redes Neurais NÃO SUPERVISIONADOS Contagem e Zero-Inflated

VARIÁVEIS QUALITATIVAS

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Classificação de algoritmos
Hierarchical
Classification Trees GLM
Clustering

Regression Trees K-Means Clustering GLMM

Bagging e Regressões Lineares e


PCA
Random Forests Não Lineares

Modelos Logísticos
Boosting ANACOR e MCA
Binários e Multinomiais

Modelos para Dados de


Redes Neurais Contagem e Zero-Inflated
OUTCOME QUANTITATIVO
SUPERVISIONADOS OUTCOME QUALITATIVO

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Referências

Fávero, Luiz Paulo; Belfiore, Patrícia. (2017). Manual de análise de dados:


estatística e modelagem multivariada com Excel®, SPSS® e Stata®. Rio de
Janeiro: Elsevier

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
a 31
i d
Introdução oao shSoftware R
i Y
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Software R e RStudio
• Apresentação

• Vamos direto ao RStudio e ao script de aula para conhecermos e aplicarmos


os conceitos fundamentais sobre o R!

• A introdução e apresentação constam no próprio script

• Lembrando: primeiramente, sempre vamos descompactar o arquivo (caso


esteja compactado) e sempre vamos abrir por meio do arquivo de R Project

• Nos materiais complementares, há um tutorial de instalação dos programas

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Indicações
• Leituras para desenvolvimento no R

• Hands-On Programming with R (Grolemund, 2014)


• R for Data Science (Wickham & Grolemund, 2016)
• Ciência de Dados com R (Guerra, Oliveira, McDonnell & Gonzaga, 2020)

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
AULA INAUGURAL:
O CATALISADOR EM UM
MUNDO DE DADOS
Maira Roversi

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.
Proibida a reprodução total ou parcial, sem
autorização. Lei nº 9610/98

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 2
Fonte: Brasscom

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
3
Distribuição dos Empregos de TI

Fonte: Brasscom

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 4
Remuneração em TI

Fonte: Brasscom

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 5
Principais Geradores de Empregos de TI
em 5 anos

Fonte: Brasscom

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 6
Desafios
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 7
Déficit de mão de obra

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 8
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
9
Diversidade

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 10
Diversidade

51% 49%

População Nacional

Dados: Brasscom

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 11
Diversidade

49% 44%
51%
56%

População Nacional Empregos Nacionais

Dados: Brasscom

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 12
Diversidade

24%

49% 44%
51%
56%
76%

População Nacional Empregos Nacionais Empregos em


Funções Técnicas

Dados: Brasscom

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 13
Oportunidades
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 14
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
15
Perspectiva de Investimento 2022-2025
(R$ bilhões)

Taxa de câmbio R$/US$5,40 (2021)

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. Fonte: Brasscom
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 16
Tendências

Fonte: Brasscom

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 17
Ciência de Dados

é uma área interdisciplinar,


que localiza-se em uma interface entre a
estatística e a ciência da computação,
que utiliza o método científico, processos,
algoritmos e sistemas, para extrair
conhecimento e tomar decisões a partir de
dados dos diversos tipos
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
18
Ciência de Dados

é uma área interdisciplinar,


que localiza-se em uma interface entre a
estatística e a ciência da computação,
que utiliza o método científico, processos,
algoritmos e sistemas, para extrair
conhecimento e tomar decisões a partir de
dados dos diversos tipos
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
19
Empresa regida por dados
(Data-driven organization)

É uma organização que aproveita os dados


como um ativo,
para impulsionar a inovação sustentada
e criar insights acionáveis
para turbinar
a experiência do cliente

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
20
Empresa regida por dados
(Data-driven organization)

É uma organização que aproveita os dados


como um ativo,
para impulsionar a inovação sustentada
e criar insights acionáveis
para turbinar
a experiência do cliente

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
21
Tornar-se Data-Driven
requer um foco organizacional
na mudança cultural…

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
22
Tornar-se Data-Driven
requer um foco organizacional
na mudança cultural…

…pelo 4º ano consecutivo,


mais de 90% dos executivos,
apontam a cultura como o maior
impedimento para alcançar esse objetivo
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Fonte: New Vantage 23
Cultura

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
24
Passos que contribuem
para uma cultura data-driven
1. A cultura de dados começa no topo
2. Atenção e cuidado na escolha das métricas
3. Nao isole os cientistas de dados
4. Corrija problemas básicos de acesso a dados rapidamente
5. Quantifique a incerteza
6. Faça provas de conceito simples e robustas
7. Ofereça treinamento especializado no momento certo
8. Use análises para ajudar os funcionários, não apenas os clientes
9. Esteja disposto a trocar, eventualmente, flexibilidade por consistência
10.Adquira o hábito de explicar as escolhas analíticas
Fonte: HBR data-driven culture
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
25
Impacto dos dados bem gerenciados

Otimização do Negócio Decisões mais Novas funcionalidades em Inventando produtos


com novas eficiências rápidas produtos existentes totalmente novos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
26
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 27
DBA Engenheiro de ML Esp em Marketing Digital

Arquiteto de Dados DPO Gerente de Produto

Analista de Dados Esp em Qualidade de Dados Esp Inteligencia Artificial Analista de Negócio

Engenheiro de Dados Data Steward Data Modeler Estatístico

Cientista de Dados Esp em Integração de Dados Inteligência de Negócio Esp de Operações de ML

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 28
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 29
Para tomar as melhores decisões,
primeiro nós precisamos…

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 30
Para tomar as melhores decisões,
primeiro nós precisamos…

… fazer as
perguntas corretas!!

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 31
5 1
0 9 8-
73 .
5 .2
Intervaloida 31
osh
i Y
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
32
Para tomar as melhores decisões,
primeiro nós precisamos…

… fazer as
perguntas corretas!!

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 33
Maturidade
Perguntas dos Dados

Corretas
Interlocutores

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
34
Modelos de Maturidade dos Dados

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 35
Modelos de Maturidade dos Dados
Estágio Descritivo Estágio Preditivo Estágio Prescritivo

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 36
Modelos de Maturidade dos Dados
Estágio Descritivo Estágio Preditivo Estágio Prescritivo

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 37
Modelos de Maturidade dos Dados
Estágio Descritivo Estágio Preditivo Estágio Prescritivo

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 38
Modelos de Maturidade dos Dados
Estágio Descritivo Estágio Preditivo Estágio Prescritivo

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 39
Exemplo de Perguntas para
Redução de Evasão

Pergunta sobre o Negócio Por que?


Eu quero diminuir a taxa de evasão da nossa empresa Quais KPIs estão sendo impactados?
Pergunta Descritiva
Todos os clientes são iguais?
Quantos clientes estamos perdendo? Quem são?

Pergunta Preditiva Quais características tornam alguns


Posso saber com antecedência quais clientes deixarão a empresa? clientes mais propensos a abandonar?
Pergunta Prescritiva Qual KPI vou impactar? Lucro de curto/longo
Se eu puder antecipar quais clientes deixarão, quais políticas de prazo? Quais os custos de cada ação de
retençao eu deveria utilizar? retenção?

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 40
Banco de Perguntas

Qual é o problema que queremos resolver?

Por que estamos tomando a decisão em primeiro lugar?

Por que nos preocupamos com esse problema e quais são os resultados com os quais nos preocupamos?

Quais são as ações que podemos tomar para alcançar esses resultados?

Como estivemos no passado?

Qual é o conjunto de dados ideal que precisamos para ter uma imagem granular de nossas ações e sua relação com os
resultados?

Quais são as consequências de nossas ações e do que elas dependem?

Qual é a incerteza subjacente e como faríamos para tomar essa decisão sem incerteza?

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 41
Maturidade
Perguntas dos Dados

Corretas
Interlocutores

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
42
Interlocutores
BDM
Business Decision Makers
Tomadores de decisão de negócio
CEO, COO, CMO, CFO, CHRO, CXO

Donos das linhas de negócios (LoBs)

Responsabilidades: Objetivos:
- Impulsionar mudança para uma cultura orientada - Tomar decisões de negócio baseadas em dados
por dados - Resolver problemas de negócio envolvendo dados
- Ser dono da função - Adotar insights rápidos e acionáveis a partir dos dados
- Usar dados para tomar decisões melhores, mais - Criar vantagem competitiva com tecnologias inovadoras
rápidas e mais embasadas

Função no ciclo de vendas:


- Influenciar e apadrinhar
- Aprovador final em mudanças de larga escala
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
43
Interlocutores
TDM
Technical Decision Makers
Executivos/ Diretores: CIO, CTO, Chief Enterprise Architecture

Responsabilidades: Objetivos:
- Liderar a transformação de TI - Inovação rápida de forma econômica
- Construir e manter um sistema de dados que produza um - Centralizacao das compras de TI e do gerenciamento de TI
vasto volume de dados - Garantir que os novos sitemas se integrem com os
- Rodar o processo de compras e gerenciar os vendors ambientes antigos

Função no ciclo de vendas:


- Comprador Técnico

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
44
Interlocutores

CDO
Chief Data Office
Executivos: Chief Data Officer, Chief Analytics Officer (CAO)

Responsabilidades: Objetivos:
- Impulsionar a transformação digital e cultural em torno de dados - Centralizar dados e reduzir os custos
- Centralizar os dados e melhorar a acessibilidade dos dados operacionais de trabalhar com dados
- Utilizar os dados para dirigir os imperativos de negócio - Pessoas, Processos e Tecnologias em
- Melhorar governança, segurança e compliance torno de dados
- Governança de dados

Função no ciclo de vendas:


- Comprador econômico e tomador de decisão
- Detentor do poder de veto
- Agente de mudança

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
45
Interlocutores

Business
DevOps e Sponsor
Segurança “Eu tenho 3 estratégias críticas CDO
para executar este ano”
“Como eu evito um desvio de segurança ?”
“Como eu entrego valor com meus
dados?”

Engenheiro
de Dados Cientista de
“Eu preciso criar pipeline de dados”
Dados
“Eu preciso encontrar dados para
rodar meus experimentos

Data
LOB User
Steward Analista de
“Como eu tenho visibilidade se meu “Como eu encontro quem Negócio
negócio está caminhando bem ou criou este dado?”
não? “Eu preciso dessa análise
em 20 minutos”

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
46
Características de um caso de uso atraente

Ser Ser
Relevante Viável

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
47
Casos de uso comuns de Dados/ ML

Melhorar a experiência
Otimizar o negócio Acelerar Inovação
do cliente

Personalização Contact Mídia Busca Processamento Detecção Análise de Modernização Próxima geração
Center Inteligente Inteligente de documento de métricas de de ML de devops
Inteligente Inteligente fraudes negócio

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
48
Casos de uso de Dados/ Machine Learning
nos diversos setores da economia

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
49
Casos de uso de Dados/ Machine Learning

5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s
l o Mídia e
c e
M ar Entretenimento

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
50
WB Games:
A Arte do Data-Driven
Storytelling

https://www.youtube.com/watch?v=irpuUQWAIyU

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
51
Casos de uso de Dados/ Machine Learning

5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s Industrial e
el o
ar c Manufatura
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
52
“Quando nossos cientistas de materiais
lideram novas pesquisas, eles precisam de
acesso às informações relevantes de
pesquisas anteriores – informações que
estão enterradas nas muitas patentes que
mantemos em nossa enorme base de
conhecimento. Kendra permite que nossos
cientistas encontrem as informações de que
precisam ao lidar com consultas de
linguagem natural com rapidez e precisão”

David Frazee
Diretor Técnico, Corporate Research Systems Lab, 3M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
53
Casos de uso de Dados/ Machine Learning

5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s
l o Saúde
c e
M ar

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
54
O Contador de Vidas de Laura já registra
12 mil vidas salvas com ajuda da tecnologia todos os dias

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
55
Casos de uso de Dados/ Machine Learning

5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s Varejo
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
56
“Nós usamos ML para melhorar a
experiência do cliente e do
restaurante. Nós pudemos criar
recomendação de pratos
personalizados. Em logística, o time
de delivery encurtou sua distância
de viagem em 15%, graças a
otimização de rotas”

Sandor Caetano
Chief Data Scientist, iFood

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
MORE INFO: CASE STUDY 57
“Clientes estão recebendo as
pizzas de maneira mais rápida,
quente e fresca em função da
solução de pedidos preditivos“

Michael Gillespie
Chief Digital and Technology Officer,
Domino’s Pizza Enterprises Limited

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
FONTE: CASE STUDY 58
https://www.youtube.com/watch?v=8nKPC-WmLjU

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Fonte: Caso de uso Amazon
59
Intervalo

60
O catalizador em um mundo de dados

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 61
O catalizador em um mundo de dados

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 62
O catalizador em um mundo de dados

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 63
Talentos

Distribuição de Talentos

# Pessoas

Habilidades Físicas

Os melhores são 20%


melhores que a média

Nível de Talento/ Contribuições

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 64
Talentos

Distribuição de Talentos

# Pessoas

Habilidades Intelectuais

Os melhores chegam a ser


10x superiores a média

Nível de Talento/ Contribuições

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 65
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
66
Se você não consegue
explicar de forma
simples, você não
entendeu bem o
suficiente!
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 67
Obrigada!
Vagas na
Maira’s Linkedin Amazon Brasil

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98 68
Perguntas

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
69
METODOLOGIAS ÁGEIS
Prof. Gino Terentim

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.
Proibida a reprodução total ou parcial, sem
autorização. Lei nº 9610/98

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. 2
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PROJETOS PROMOVEM MAS, O QUE DEFINIMOS
COMO MUDANÇA?
MUDANÇAS
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PROBLEMAS E SOLUÇÕES

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PASSADO CONHECIDOS

5 1
0 9 8-
73 .
5 .2
a 31
PRESENTE
h i d
CONHECÍVEIS
s
i Yo
u sh
At s
el o
ar c
FUTURO M INCOGNOSCÍVEIS

5
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PASSADO ORDENADOS

5 1
0 9 8-
73 .
5 .2
a 31
PRESENTE
h i d
COMPLEXOS
s
i Yo
u sh
At s
el o
ar c
FUTURO M CAÓTICOS

6
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
…MAS QUAL A FORMA DE OBTER CONHECIMENTO
PARA RESOLVER UM PROBLEMA?

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PDCA E DCAP!

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PDCA E DCAP!

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PDCA E DCAP!

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Empírico x Adaptativo
5 1
PREDITIVO
0 9 8-
3
7 do .
Escopo fixo. Os requisitos são

5 .2
detalhados no começo
projeto.
3 1
i d a
sh
i Yo
ESCOPO

u sh
At s
el o
ar c QUALIDADE

M Incertezas serão
acomodadas aqui: no prazo,
PRAZO CUSTO nos custos ou em ambos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Empírico x Adaptativo
5 1
8-
ADAPTATIVO OU EMPÍRICO
. 0 9
PRAZO 5.2
73
Tolerância zero é criada
parar prazo e custos.
CUSTO
3 1
i d a
sh
i Yo
u sh QUALIDADE

At s
el o
ar c ESCOPO As incertezas serão

M acomodadas no escopo. O
escopo precisará ser flexível.

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
LEAN STARTUP
5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
Yo
Medir
sh i
t s u Aprender
o A
c el
M ar

Construir
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
4 5 .2 5
1 3
a 31
h i d
s
i Yo
u sh
At s
elo
ar c
M
2 6
1
5 PORQUÊS

POR QUÊ?

POR QUÊ?

POR QUÊ?

POR QUÊ?

POR QUÊ?
DECLARAÇÃO CAUSA
DO PROBLEMA RAIZ

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PRODUCT->MARKET FIT

PROBLEM->SOLUTION FIT SCALE


5 1
0 9 8-
73 .
5 .2
31
CYNEFIN
sh i Yo
sh i d a

t s u
el oA
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework Cynefin

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
31
a
h i d
s
CONFUSO
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
31
a
h i d
s
CONFUSO
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
31
a
h i d
s
CONFUSO
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
31
a
h i d
s
CONFUSO
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
31
a
h i d
s
CONFUSO
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
… MAS QUAL A FORMA DE OBTER
CONHECIMENTO PARA TOMARMOS UMA DECISÃO?

5 1
0 9 8-
73 .
Conhecimento
5 .2
a 31
h i d
s
Yo
A posteriori
A priori
ou empírico
sh i
t s u
o A
c el
Algo é conhecidora posteriori Algo é conhecido a priori quando é
M a
quando é conhecido através da conhecido independentemente da
experiência (sensorial ou experiência e através do pensamento
introspectiva), da experimentação. apenas, da razão, dedução e
reminiscência.
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
DETERMINÍSTICO
EMPÍRICO 8- 5 1
. 0 9
.2 73
31 5
i d a
sh
CONFUSO
i Yo
u sh
At s
l
SOBREVIVÊ
e o
ar c
M NCIA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
SUGESTÃO DE ATIVIDADE
Escolham um dos problemas apresentados. Em seguida, UTILIZEM
o método CAF (consider all factors) para gerar decisões.
PRODUCT->MARKET FIT
O MERCADOPRODUCT->MARKET
ESTÁ RESPONDENDO
FIT AO
PRODUTO COM ENTUSIASMO E A DIFUSÃO
ESTÁ AUMENTANDO?

HÁ UMA SOLUÇÃO CONHECIDA E


APLCÁVEL PARA O PROBLEMA?
PROBLEM->SOLUTION FIT SCALE
PROBLEM->SOLUTION FIT SCALE

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5
4 6

3 PRODUCT->MARKET FIT 7

2 8

PROBLEM->SOLUTION FIT SCALE

1 9
5
4 6
PRODUCT->MARKET FIT

3 SCRUM
7

2 8

PROBLEM->SOLUTION FIT SCALE

DESIGN THINKING LEAN


1 9
PROJECT MANAGEMENT READINESS LEVEL

PRIMEIRO ABISMO: VALIDAR O PRODUTO À LUZ DO MERCADO


MORREM POR FAZER PRODUTOS TECNICAMENTE EFICAZES, MAS, QUE NÃO SÃO BEM RECEBIDOS
PELO MERCADO

SEGUNDO ABISMO: VALIDAR O PRODUTO À LUZ DO PROCESSO


MORREM POR ESCALAR PROCESSOS RUINS

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
10

7
PROBLEM->SOLUTION FIT SCALE
6

4
PRODUCT->MARKET FIT

0
Exploração do Geração de Protótipo MVP Versão Beta Versão Versão Final Consolidação Escala
Problema Ideias Candidata no Mercado

1 2 3 4 5 6 7 8 9
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS 4 ESTÁGIOS

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS 4 ESTÁGIOS

LEAN, E
DESIGN PROCESSOS
ABORDAGENS
THINKING E ENXUTOS, 6 SIGMA E
ÁGEIS,
ABORDAGENS COM A CONTROLE DE
VOLTADAS À
DE FINALIDADE QUALIDADE
ENTREGA
DESCOBERTA DE RIGOROSO
(DELIVERY)
(DISCOVERY) MELHORAR A
EFICIÊNCIA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS 4 ESTÁGIOS

LEAN, E
DESIGN PROCESSOS 6 SIGMA E
ABORDAGENS
THINKING E ENXUTOS, CONTROLE DE
ÁGEIS,
ABORDAGENS COM A QUALIDADE
VOLTADAS À
DE FINALIDADE RIGOROSO
ENTREGA
DESCOBERTA DE BUSCANDO
(DELIVERY)
(DISCOVERY) MELHORAR A ESCALAR
EFICIÊNCIA

1 2 3 4 5 6 7 8 9
OS 4 ESTÁGIOS

LEAN, E
DESIGN PROCESSOS
ABORDAGENS
THINKING E ENXUTOS, 6 SIGMA E
ÁGEIS,
ABORDAGENS COM A CONTROLE DE
VOLTADAS À
DE FINALIDADE QUALIDADE
ENTREGA
DESCOBERTA DE RIGOROSO
(DELIVERY)
(DISCOVERY) MELHORAR A
ADAPTATIVO
EFICIÊNCIA

1 2 3 4 5 6 7 8 9
OS 4 ESTÁGIOS

LEAN, E
DESIGN
ABORDAGENS
PREDITIVO
PROCESSOS
THINKING E ENXUTOS, 6 SIGMA E
ÁGEIS,
ABORDAGENS COM A CONTROLE DE
VOLTADAS À
DE FINALIDADE QUALIDADE
ENTREGA
DESCOBERTA DE RIGOROSO
(DELIVERY)
(DISCOVERY) MELHORAR A
EFICIÊNCIA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS 4 ESTÁGIOS

LEAN, E
DESIGN PROCESSOS
ABORDAGENS
THINKING E ENXUTOS, 6 SIGMA E
ÁGEIS,
ABORDAGENS COM A CONTROLE DE
VOLTADASHÍBRIDO
À
DE FINALIDADE QUALIDADE
ENTREGA
DESCOBERTA DE RIGOROSO
(DELIVERY)
(DISCOVERY) MELHORAR A
EFICIÊNCIA

1 2 3 4 5 6 7 8 9
PROJECT MANAGEMENT READINESS LEVEL

PRIMEIRO ABISMO: VALIDAR O PRODUTO À LUZ DO MERCADO:


MORREM POR FAZER PRODUTOS TECNICAMENTE EFICAZES, MAS, QUE NÃO SÃO BEM RECEBIDOS
PELO MERCADO

SEGUNDO ABISMO: VALIDAR O PRODUTO À LUZ DO PROCESSO: MORREM POR ESCALAR PROCESSOS RUINS.

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
10

7
PROBLEM->SOLUTION FIT SCALE
6

4 PRODUCT->MARKET FIT

0
Exploração do Geração de Protótipo MVP Versão Beta Versão Versão Final Consolidação Padronização
Problema Ideias Candidata no Mercado

1 2 3 4 5 6 7 8 9
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
10
1
2
9
3
4
8
5
6
7
PROBLEM->SOLUTION FIT 7 SCALE
8
6
9

5
9

4 PRODUCT->MARKET FIT 8
7
6
3
5
4
2
3
2
1
1

0
P&D, Mapa do Design Thinking Prototipagem, Lean Startup Scrum Agile GP GP - Híbrido Lean Thinking 6 Sigma
Problema Storyboarding

1 2 3 4 5 6 7 8 9
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
O CONTEXTO DETERMINA A ABORDAGEM

PROJETO X

Parte 1 Parte 2 Parte 3

Parte 1.1 Parte 1.2

Estágio 1 Estágio 2 Estágio 3 Estágio 4


Gênesis Custom Built Product Commodity
Práticas Inéditas Práticas Emegentes Boas Práticas Melhores Práticas

1 2 3 4 5 6 7 8 9
LEAN, AGILE E SCRUM

Lean - 5 1
0 9 8
Proveniente do Lean manufacturing, Toyota

7 3 .
5 .2
Agile a 31
h i d
s
i Yo Um conjunto de valores e princípios

u sh
At s
el o
c
SCRUM
M ar Um Framework, assim como outros

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS 4 P’s DO “JEITO TOYOTA”

Problem Solving

People and Partners

Process

Philosophy

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
UM SISTEMA RUIM VENCERÁ UMA BOA PESSOA, SEMPRE.

”As pessoas já estão fazendo o seu melhor; os problemas


estão com o sistema.
Somente a gestão pode mudar o sistema.”
W. Edwards Deming

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
ELIMINAR DESPERDÍCIOS

DESPERDÍCIO

VARIAÇÃO

SOBRECARGA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS SETE DESPERDÍCIOS DO LEAN

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
DESPERDÍCIOS EM PROCESSOS ORGANIZACIONAIS

1. INFORMAÇÕES INÚTEIS
2. ESPERA POR DECISÕES, REPOSTAS, ASSINATURAS, ETC...
3. PROCESSO DE DELEGAÇÃO INEXISTENTE OU DEFICIENTE
4. CONTROLES REDUNDANTES E DESNECESSÁRIOS
5. HORAS-EXTRAS
6. MÉTRICAS INDIVIDUAIS GERANDO SUBOTIMIZAÇÃO
7. SISTEMAS DE AVALIAÇÃO CALCADOS EM QUANTIDADES
8. PROJETOS E PROCESSOS DUPLICADOS
9. RETRABALHOS, FALTA DE INFORMAÇÕES E INFORMAÇÕES AMBÍGUAS
10. FALTA DE EQUILÍBRIO DO TRABALHO (LONGOS PERÍODOS DE OCIOSIDADE E LONGOS PERÍODOS DE
SUPERALOCAÇÃO
11. INTERRUPÇÕES CONSTANTES
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
VAMOS TESTAR?

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Dinâmica multitarefa – Aguarde o sinal para
começar!
Aqui escrevemos números múltiplos de 4

Trabalharemos de
forma alternada
(primeiro em cima e
depois embaixo.
As consoantes do alfabeto
Teremos 2 minutos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Dinâmica multitarefa – Aguarde o sinal para
começar!
Aqui escrevemos números múltiplos de 4

Trabalharemos em uma única


atividade e, quando terminar o
Timebox (60 segundos),
partimos para a outra.
As consoantes do alfabeto
Teremos 60 segundos para cada
metade da folha

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
A CIÊNCIA MULTITAREFA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PERDAS CAUSADAS PELA MULTITAREFA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
LEAN e AGILE

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
DEPOIS:

UMA HISTÓRIA SOBRE AGILE…

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Um grupo de desenvolvedores de software percebeu que a forma de resolver
problemas e desenvolver produtos precisava ser diferente e, juntos, criaram o
Manifesto Ágil
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Indivíduos e Software Colaboração com o Responder a
Interações Funcionando Cliente Mudanças

Processos e Documentação Negociação de


Seguir um Plano
Ferramentas Extensa Contratos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Indivíduos e Software Colaboração com o Responder a
Interações Funcionando Cliente Mudanças

Processos e Documentação Negociação de


Seguir um Plano
Ferramentas Extensa Contratos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Indivíduos e Software Colaboração com o Responder a
Interações Funcionando Cliente Mudanças

Processos e Documentação Negociação de


Seguir um Plano
Ferramentas Extensa Contratos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Indivíduos e Software Colaboração com o Responder a
Interações Funcionando Cliente Mudanças

Processos e Documentação Negociação de


Seguir um Plano
Ferramentas Extensa Contratos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
ÁGIL = ADAPTATIVO 5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
O SCRUM

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
TRANSPARÊNCIA

INSPEÇÃO

ADAPTAÇÃO
PILARES DO SCRUM

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. GERENCIAMENTO DE PROJETOS
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
SCR PAPEIS, EVENTOS E ARTEFATOS
UM

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
SCRUM Papéis
Representa o interesse dos clientes, assegura que as entregas adicionem
valor e que o backlog esteja sempre priorizado, atualizado e que reflita
Product Owner aquilo que é mais importante para os usuários, clientes e para a empresa.

Foco prioridades para o negócio, adição de


valor • Líder de uma equipe autogerenciável.
• Tem um papel de mentor, que remove impedimentos e desenvolve
SCRUM Master constantemente as pessoas.
• Tem perguntas, não respostas. Caminha com a equipe num constante
processo que busca identificar o que não está funcionando e o que deve ser
Foco nos processos e no desenvolvimento das mudado.
pessoas

• Time auto-organizado, autogerenciável, empoderado e independente.


Desenvolvedores Possuem autoridade para tomar decisões, assumir riscos e
responsabilidades.
• Equipe multidisciplinar e com profundos conhecimentos sobre sua área de
Foco nas entregas, valor adicionado e em atuação.
uso
Conceitos do SCRUM
Timebox É A DURAÇÃO MÁXIMA
Timebox é um conceito que diz que a quantidade DE UM EVENTO.
de tempo (horas ou dias, o que depende das
unidades sendo utilizadas para um
determinado evento) é imutável, ou seja, a
quantidade de tempo não poderá aumentar
caso algum problema ou novo requisito seja
identificado.

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. GERENCIAMENTO DE PROJETOS
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Conceitos do SCRUM
sprint
Um evento que contém todos os outros eventos do SCRUM.
Uma SPRINT representa um período de 30 dias (ou menos).

O Sprint pode ser considerado o principal evento do SCRUM,


porque é nele que serão aplicados os demais eventos.

É aqui que ocorre a produção de um produto ou parte dele. Sprint

Todos os Sprints devem possuir uma estrutura exatamente


igual. As funcionalidades construídas no Sprint são
provenientes dos IBLs (itens de backlog) selecionados.
Daily

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. GERENCIAMENTO DE PROJETOS
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
SCR
UM Sprint - x
Até 30 dias
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
Planejamento – Sprint X

Sprint X
Revisão
Retrospectiva
Reunião diária Reunião diária Reunião diária Reunião diária Reunião diária Reunião diária Reunião diária Reunião diária

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. GERENCIAMENTO DE PROJETOS
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
CONCEITOS DO SCRUM
Backlog do Produto Alta Histórias
• Criado a partir da Visão do Produto
A
• Geralmente composto por Histórias de Usuário
B
(User Stories)
C
• É uma lista ordenada de tudo aquilo que é

Prioridade
necessário para criar o produto. D

• Constituído e priorizado pelo Product Owner E

• O que estiver fora desta lista não será feito. F

• O Backlog do Produto contém requisitos de G


negócio, não funcionais, melhorias, correções,
H
testes de arquitetura, etc.
I

Baixa

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
BACKLOG E NÍVEL DE ENTENDIMENTO
FRAMEWORK SCRUM

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM
5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s
el o
ar c
M Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM
5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s
el o
ar c
M Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM

Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM

Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Conceitos do SCRUM
DAILY SCRUM
O objetivo do Daily Scrum é inspecionar o progresso em
direção à Meta da Sprint e adaptar o Sprint Backlog
conforme necessário, ajustando o próximo trabalho
planejado.

O Daily Scrum é um evento de 15 minutos para os


Desenvolvedores do Time Scrum. Para reduzir a
complexidade, ela é realizada no mesmo horário e local
todos os dias úteis da Sprint

As Daily Scrums melhoram a comunicação, identificam


impedimentos, promovem a agilidade na tomada de decisões
e, consequentemente, eliminam a necessidade de outras Daily
reuniões.

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. GERENCIAMENTO DE PROJETOS
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM

Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM

Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
GINO TERENTIM
linkedin.com/in/ginoterentim

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
METODOLOGIAS ÁGEIS
Prof. Gino Terentim

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.
Proibida a reprodução total ou parcial, sem
autorização. Lei nº 9610/98

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. 2
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PROJETOS PROMOVEM MUDANÇAS MAS, O QUE DEFINIMOS
COMO MUDANÇA?

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PROBLEMAS E SOLUÇÕES

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PASSADO CONHECIDOS

5 1
0 9 8-
73 .
5 .2
31
aCONHECÍVEIS
PRESENTE
h i d
s
i Yo
u sh
At s
el o
ar c
FUTURO M INCOGNOSCÍVEIS

5
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PASSADO ORDENADOS

5 1
0 9 8-
73 .
5 .2
31
aCOMPLEXOS
PRESENTE
h i d
s
i Yo
u sh
At s
el o
ar c
FUTURO M CAÓTICOS

6
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
…MAS QUAL A FORMA DE OBTER CONHECIMENTO PARA RESOLVER UM PROBLEMA?

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PDCA E DCAP!

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PDCA E DCAP!

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PDCA E DCAP!

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Empírico xAdaptativo
PREDITIVO 5 1
0 9 8-
detalhados no começo 7
3
Escopo fixo. Os requisitossão .
5 .2 do projeto.

3 1
i d a
osh
i Y
ESCOPO

s u sh
t
eloA
ar c QUALIDADE

M Incertezas serão acomodadas aqui:


noprazo, nos custos ou emambos
PRAZO CUSTO
Empírico x Adaptativo
ADAPTATIVO OU EMPÍRICO 5 1
0 9 8-
73 .
Tolerância zero écriada parar

CUSTO PRAZO 5 .2 prazo ecustos.

a 31
h i d
s
i Yo
u sh
QUALIDADE

At s
elo
ar c ESCOPO As incertezas serão acomodadas no

M escopo. O escopo precisará ser


flexível.
LEAN STARTUP
5 1
0 9 8-
73 .
5 .2
a 31
h i d
Medir s
iYo
u sh
At s Aprender
el o
ar c
M
Construir
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
4 5 .2 5
1 3
a 31
h i d
s
i Yo
u sh
At s
elo
ar c
M
2 6
1
5 PORQUÊS

POR QUÊ?

POR QUÊ?

POR QUÊ?

POR QUÊ?

POR QUÊ?
DECLARAÇÃO DO CAUSA
PROBLEMA RAIZ

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PRODUCT->MARKET FIT

PROBLEM->SOLUTION FIT SCALE


5 1
0 9 8-
73 .
5 .2
31
CYNEFIN
Yo
hi
sh i d a

s u s
t
el oA
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework Cynefin

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
a 31
h i d
CONFUSO
s
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
a 31
h i d
CONFUSO
s
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
a 31
h i d
CONFUSO
s
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
a 31
h i d
CONFUSO
s
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5 1
0 9 8-
73 .
5 .2
a 31
h i d
CONFUSO
s
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
… MAS QUAL A FORMA DE OBTER CONHECIMENTO PARA TOMARMOS UMA DECISÃO?

5 1
0 9 8-
73 .
Conhecimento
5 .2
a 31
h i d
A posteriori s
i Yo Apriori
ou empírico
u sh
At s
el o
r c
Algo é conhecido a posteriori
a quando é Algo é conhecido a priori quando é conhecido
independentemente da experiência e através do
M
conhecido através da experiência (sensorial ou
introspectiva), da experimentação. pensamento apenas, da razão, dedução e
reminiscência.

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
EMPÍRICO 5 1
8-

DETERMINÍSTICO
. 0 9
.2 73
31 5
i d a
sh
CONFUSO
i Yo
u sh
At s
el o
c
aSOBREVIVÊNCIA
r
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
SUGESTÃO DE ATIVIDADE
Escolham um dos problemas apresentados. Em seguida, UTILIZEM
o método CAF (consider all factors) para gerar decisões.
PRODUCT->MARKET FIT
O MERCADOPRODUCT->MARKET
ESTÁ RESPONDENDO
FIT AO
PRODUTO COM ENTUSIASMO E A DIFUSÃO
ESTÁ AUMENTANDO?

HÁ UMA SOLUÇÃO CONHECIDA E


APLCÁVEL PARA O PROBLEMA?
PROBLEM->SOLUTION FIT SCALE
PROBLEM->SOLUTION FIT SCALE

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
5
4 6

3 PRODUCT->MARKET FIT 7

2 8

PROBLEM->SOLUTION FIT SCALE

1 9
5
4 6
PRODUCT->MARKET FIT

3 SCRUM
7

2 8

PROBLEM->SOLUTION FIT SCALE

DESIGN THINKING LEAN


1 9
PROJECT MANAGEMENT READINESS LEVEL

PRIMEIRO ABISMO: VALIDAR O PRODUTO À LUZ DO MERCADO


MORREM POR FAZER PRODUTOS TECNICAMENTE EFICAZES, MAS, QUE NÃO SÃO BEM RECEBIDOS
PELO MERCADO

SEGUNDO ABISMO: VALIDAR O PRODUTO À LUZ DO PROCESSO


MORREM POR ESCALAR PROCESSOS RUINS

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
10

7
PROBLEM->SOLUTION FIT SCALE
6

4
PRODUCT->MARKET FIT

0
Exploração do Geração de Protótipo MVP Versão Beta Versão Versão Final Consolidação Escala
Problema Ideias Candidata no Mercado

1 2 3 4 5 6 7 8 9
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS 4 ESTÁGIOS

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS 4 ESTÁGIOS

LEAN, E PROCESSOS
DESIGN THINKING E ABORDAGENS ÁGEIS, 6 SIGMA E
ENXUTOS, COM A
ABORDAGENS DE VOLTADAS À CONTROLE DE
FINALIDADE DE
DESCOBERTA ENTREGA QUALIDADE
MELHORAR A
(DISCOVERY) (DELIVERY) RIGOROSO
EFICIÊNCIA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS 4 ESTÁGIOS

LEAN, E PROCESSOS 6 SIGMA E


DESIGN THINKING E ABORDAGENS ÁGEIS,
ENXUTOS, COM A CONTROLE DE
ABORDAGENS DE VOLTADAS À
FINALIDADE DE QUALIDADE
DESCOBERTA ENTREGA
MELHORAR A RIGOROSO
(DISCOVERY) (DELIVERY)
EFICIÊNCIA BUSCANDO ESCALAR

1 2 3 4 5 6 7 8 9
OS 4 ESTÁGIOS

LEAN, E PROCESSOS
DESIGN THINKING E ABORDAGENS ÁGEIS, 6 SIGMA E
ENXUTOS, COM A
ABORDAGENS DE VOLTADAS À CONTROLE DE
FINALIDADE DE
DESCOBERTA ENTREGA QUALIDADE
MELHORAR A
(DISCOVERY) (DELIVERY) RIGOROSO
EFICIÊNCIA
ADAPTATIVO

1 2 3 4 5 6 7 8 9
4
OS ESTÁGIOS

PREDITIVO
LEAN, E PROCESSOS
DESIGN THINKING E ABORDAGENS ÁGEIS, 6 SIGMA E
ENXUTOS, COM A
ABORDAGENS DE VOLTADAS À CONTROLE DE
FINALIDADE DE
DESCOBERTA ENTREGA QUALIDADE
MELHORAR A
(DISCOVERY) (DELIVERY) RIGOROSO
EFICIÊNCIA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS 4 ESTÁGIOS

LEAN, E PROCESSOS
DESIGN THINKING E ABORDAGENS ÁGEIS, 6 SIGMA E
ENXUTOS, COM A
ABORDAGENS DE VOLTADAS À CONTROLE DE
DESCOBERTA ENTREGA
HÍBRIDO
FINALIDADE DE
QUALIDADE
MELHORAR A
(DISCOVERY) (DELIVERY) RIGOROSO
EFICIÊNCIA

1 2 3 4 5 6 7 8 9
PROJECT MANAGEMENT READINESS LEVEL

PRIMEIRO ABISMO: VALIDAR O PRODUTO À LUZ DO MERCADO:


MORREM POR FAZER PRODUTOS TECNICAMENTE EFICAZES, MAS, QUE NÃO SÃO BEM RECEBIDOS
PELO MERCADO

SEGUNDO ABISMO: VALIDAR O PRODUTO À LUZ DO PROCESSO: MORREM POR ESCALAR PROCESSOS RUINS.

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
10

7
PROBLEM->SOLUTION FIT SCALE
6

4 PRODUCT->MARKET FIT

0
Exploração do Geração de Protótipo MVP Versão Beta Versão Versão Final Consolidação Padronização
Problema Ideias Candidata no Mercado

1 2 3 4 5 6 7 8 9
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
10
1
2
9
3
4
8
5
6
7
PROBLEM->SOLUTION FIT 7 SCALE
8
6
9

5
9

4 PRODUCT->MARKET FIT 8
7
6
3
5
4
2
3
2
1
1

0
P&D, Mapa do Design Thinking Prototipagem, Lean Startup Scrum Agile GP GP - Híbrido Lean Thinking 6 Sigma
Problema Storyboarding

1 2 3 4 5 6 7 8 9
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
O CONTEXTO DETERMINA A ABORDAGEM

PROJETO X

Parte 1 Parte 2 Parte 3

Parte 1.1 Parte 1.2

Estágio 1 Estágio 2 Estágio 3 Estágio 4


Gênesis Custom Built Product Commodity
Práticas Inéditas Práticas Emegentes Boas Práticas Melhores Práticas

1 2 3 4 5 6 7 8 9
PAREI
AQUI!!!!
LEAN, AGILE E SCRUM

Lean - 5 1
0 9 8
Proveniente do Lean manufacturing, Toyota

7 3 .
5 .2
Agile a 31
h i d
s
i Yo Um conjunto de valores e princípios

u sh
At s
el o
c
SCRUM
M ar Um Framework, assim como outros

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS 4 P’s DO “JEITO TOYOTA”

Problem Solving

People and Partners

Process

Philosophy

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
UM SISTEMA RUIM VENCERÁ UMA BOA PESSOA, SEMPRE.

”As pessoas já estão fazendo o seu melhor; os problemas


estão com o sistema.
Somente a gestão pode mudar o sistema.”
W. Edwards Deming

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
ELIMINAR DESPERDÍCIOS

DESPERDÍCIO

VARIAÇÃO

SOBRECARGA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
OS SETE DESPERDÍCIOS DO LEAN

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
DESPERDÍCIOS EM PROCESSOS ORGANIZACIONAIS

1. INFORMAÇÕES INÚTEIS
2. ESPERA POR DECISÕES, REPOSTAS, ASSINATURAS, ETC...
3. PROCESSO DE DELEGAÇÃO INEXISTENTE OU DEFICIENTE
4. CONTROLES REDUNDANTES E DESNECESSÁRIOS
5. HORAS-EXTRAS
6. MÉTRICAS INDIVIDUAIS GERANDO SUBOTIMIZAÇÃO
7. SISTEMAS DE AVALIAÇÃO CALCADOS EM QUANTIDADES
8. PROJETOS E PROCESSOS DUPLICADOS
9. RETRABALHOS, FALTA DE INFORMAÇÕES E INFORMAÇÕES AMBÍGUAS
10. FALTA DE EQUILÍBRIO DO TRABALHO (LONGOS PERÍODOS DE OCIOSIDADE E LONGOS PERÍODOS DE
SUPERALOCAÇÃO
11. INTERRUPÇÕES CONSTANTES
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
A CIÊNCIA MULTITAREFA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
VAMOS TESTAR?

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Dinâmica multitarefa – Aguarde o sinal para
começar!
Aqui escrevemos números múltiplos de 4

Trabalharemos de
forma alternada
(primeiro em cima e
depois embaixo.
As consoantes do alfabeto
Teremos 2 minutos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Dinâmica multitarefa – Aguarde o sinal para
começar!
Aqui escrevemos números múltiplos de 4

Trabalharemos em uma única


atividade e, quando terminar o
Timebox (60 segundos),
partimos para a outra.
As consoantes do alfabeto
Teremos 60 segundos para cada
metade da folha

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
PERDAS CAUSADAS PELA MULTITAREFA

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
LEAN e AGILE

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
DEPOIS:

UMA HISTÓRIA SOBRE AGILE…

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Um grupo de desenvolvedores de software percebeu que a forma de resolver
problemas e desenvolver produtos precisava ser diferente e, juntos, criaram o
Manifesto Ágil
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Indivíduos e Software Colaboração com o Responder a
Interações Funcionando Cliente Mudanças

Processos e Documentação Negociação de


Seguir um Plano
Ferramentas Extensa Contratos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Indivíduos e Software Colaboração com o Responder a
Interações Funcionando Cliente Mudanças

Processos e Documentação Negociação de


Seguir um Plano
Ferramentas Extensa Contratos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Indivíduos e Software Colaboração com o Responder a
Interações Funcionando Cliente Mudanças

Processos e Documentação Negociação de


Seguir um Plano
Ferramentas Extensa Contratos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Indivíduos e Software Colaboração com o Responder a
Interações Funcionando Cliente Mudanças

Processos e Documentação Negociação de


Seguir um Plano
Ferramentas Extensa Contratos

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
ÁGIL = ADAPTATIVO 5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s
el o
ar c
M

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
CONCEITOS DO AGILE

Planning Onion
Visão Antes deiniciar o projeto

Roadmap
Oplano que desenvolveremospara alcançara Visão

Release
Oque validarmoscom o usuáriopor meio de um lançamento(release)

Sprint
Como, incrementalmente, construiremosnosso lançamento

Daily Diariamente, como acompanharemos nossoprogresso.

Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98


CONCEITOS DO AGILE

Visão do produto
Visão
• Aborda os problemas principais que o produto
Roadmap desejaresolver
• Éaconselhável, mas não é um pré- requisito, que
Release sejaelaboradaantes doiníciodoprojeto
• É a Visão do Produto que trará os insumos
necessários para criar e manter o Backlog do
Sprint Produto

Daily

Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98


A VISÃO DO PRODUTO

Visão

Roadmap

Release

Sprint

Daily

Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98


Sobre oRoadmap

Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98


DO PORQUÊ AO O QUÊ
Backlog do Produto Alta Histórias

A
• Criado a partir da Visão do Produto
B
• É uma lista ordenada de tudo aquilo que é
C
necessário para criar o produto.

Prioridade
D
• O que estiver fora desta lista não será feito.
E
• O Backlog do Produto contém requisitos de
F
negócio, não funcionais, melhorias,
G
correções, testes de arquitetura, etc.
H

Baixa
BACKLOG E NÍVEL DE ENTENDIMENTO
Planejamento da Sprint
Alt a Histórias

A
Sprint B

P r i or i da de
E

F
Daily
G

Baixa

Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98


Priorizando o Backlog
MOSCOW
M sein vmiávisso UST HAVE :
el.
o p rod ut o é
Odono do produto é livre para
determinar os critérios de valor
O para o negócio que utilizará para
definir as prioridades. Ex: roi,
S HOé UdLDHAVE :
e e xt re m a im p o rt ân c ia riscos, dependências, time to
C O U LD HAVE : market,etc...

O é D e se jáv e l
W seO N’riaT l eHgAValE: te r, ma s, não
f are m o s ag o ra.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Sprint Planning
5 1
Incrememento
0 9 8-
de produto
73 .
5 .2
a 31
h i d
Meta dosprint
o s
O planejamento é realizado de baixo para cima, enquanto a
i Y é realizada de cima para baixo.
sh
execução

t s u
Meta derelease
eloA
ar c
M
Visão doproduto

Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98


O SCRUM

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
TRANSPARÊNCIA

INSPEÇÃO

ADAPTAÇÃO
PILARES DO SCRUM

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. GERENCIAMENTO DE PROJETOS
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
SCR PAPEIS, EVENTOS E ARTEFATOS
UM

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
SCRUM Papéis
Representa o interesse dos clientes, assegura que as entregas adicionem
valor e que o backlog esteja sempre priorizado, atualizado e que reflita
Product Owner aquilo que é mais importante para os usuários, clientes e para a empresa.

Foco prioridades para o negócio, adição de


valor • Líder de uma equipe autogerenciável.
• Tem um papel de mentor, que remove impedimentos e desenvolve
SCRUM Master constantemente as pessoas.
• Tem perguntas, não respostas. Caminha com a equipe num constante
processo que busca identificar o que não está funcionando e o que deve ser
Foco nos processos e no desenvolvimento das mudado.
pessoas

• Time auto-organizado, autogerenciável, empoderado e independente.


Desenvolvedores Possuem autoridade para tomar decisões, assumir riscos e
responsabilidades.
• Equipe multidisciplinar e com profundos conhecimentos sobre sua área de
Foco nas entregas, valor adicionado e em atuação.
uso
Conceitos do SCRUM
Timebox É A DURAÇÃO MÁXIMA
Timebox é um conceito que diz que a quantidade DE UM EVENTO.
de tempo (horas ou dias, o que depende das
unidades sendo utilizadas para um
determinado evento) é imutável, ou seja, a
quantidade de tempo não poderá aumentar
caso algum problema ou novo requisito seja
identificado.

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. GERENCIAMENTO DE PROJETOS
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Conceitos do SCRUM
sprint
Um evento que contém todos os outros eventos do SCRUM.
Uma SPRINT representa um período de 30 dias (ou menos).

O Sprint pode ser considerado o principal evento do SCRUM,


porque é nele que serão aplicados os demais eventos.

É aqui que ocorre a produção de um produto ou parte dele. Sprint

Todos os Sprints devem possuir uma estrutura exatamente


igual. As funcionalidades construídas no Sprint são
provenientes dos IBLs (itens de backlog) selecionados.
Daily

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. GERENCIAMENTO DE PROJETOS
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
SCR
UM Sprint - x
Até 30 dias
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
Planejamento – Sprint X

Sprint X
Revisão
Retrospectiva
Reunião diária Reunião diária Reunião diária Reunião diária Reunião diária Reunião diária Reunião diária Reunião diária

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. GERENCIAMENTO DE PROJETOS
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
FRAMEWORK SCRUM

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM
5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s
el o
ar c
M Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM
5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s
el o
ar c
M Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM

Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM

Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Conceitos do SCRUM
DAILY SCRUM
O objetivo do Daily Scrum é inspecionar o progresso em
direção à Meta da Sprint e adaptar o Sprint Backlog
conforme necessário, ajustando o próximo trabalho
planejado.

O Daily Scrum é um evento de 15 minutos para os


Desenvolvedores do Time Scrum. Para reduzir a
complexidade, ela é realizada no mesmo horário e local
todos os dias úteis da Sprint

As Daily Scrums melhoram a comunicação, identificam


impedimentos, promovem a agilidade na tomada de decisões
e, consequentemente, eliminam a necessidade de outras Daily
reuniões.

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor. GERENCIAMENTO DE PROJETOS
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM

Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
Framework SCRUM

Backlog do Produto

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
GINO TERENTIM
linkedin.com/in/ginoterentim

*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem autorização. Lei nº 9610/98
BUSINESS INTELLIGENCE E
DATA VISUALIZATION
Prof. Helder Prado Santos
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.
Proibida a reprodução total ou parcial, sem
autorização. Lei nº 9610/98

2
O que é Business Intelligence?
Negócio

Dados Business Inteligente (BI) não é um software ou ferramenta!!!


Dados

Dados
Conversa diretamente com as necessidades do negócio

Informação
Objetivo de
negócio

Tomar decisões inteligentes

3
Como apresentar uma informação?

Conhecer os
CONCEITO:
dados

Refere-se ao processo de coleta, organização,


Definir o
objetivo análise, compartilhamento e monitoramento
de informações que oferecem suporte a
Organizar os
dados gestão de negócios

Aplicar
análises

Apresentar a
informação 87%

4
Informação vs storytelling

Tickets em dezembro:
• 177 tickets recebidos
• 140 tickets processados

Convence?
vs

Fonte: Cole Nussbaumer Knaflic, Storytelling com dados, 2016.

5
Como escolher a apresentação?

Conhecer os
Primeiro: Conheça sua variável (dado)
dados

Definir o
objetivo

Variáveis
Organizar os
dados

Aplicar
análises
Qualitativa Quantitativa
Apresentar a
informação

Nominal Ordinal Discreta Continua

6
Variáveis e seus tipos
Variáveis Qualitativas: Representam atributos que
podem ser divididas em dois grupos:

• Ordinais: quando existir uma ordem implícita

• Nominais: quando não existir uma ordem implícita

Ordinal
Nominal
Grande
Castanho Médio
Pequeno
Verde Azul Tamanho de camiseta

Cor dos
olhos Futebol Ordinal
Superior
Vôlei Basquete
Médio
Fundamental
Esporte Escolaridade
Nominal

7
Variáveis e seus tipos
Variáveis Quantitativas: Representam atributos que
podem ser divididas em dois grupos:

• Discretas: pertencem a intervalo de valores finitos


e enumerável, podendo ser contado. (Contagem)

• Contínuas: pertencem ao intervalo de números


reais.

Discretas: Contínuas:
• Número de filhos (1 filho) • Peso (88,6 kg)
• Quantidade de acidentes (2 acidentes) • Faturamento (R$ 12.599,90)
• Número de tickets abertos (20 tickets abertos) • Despesa (R$ 304,40)
• Quantidade de peças vendidas (14 peças • Altura (1,82 cm)
vendidas)

8
Gráficos adequados a cada tipo de variável

Gráfico de coluna agrupadas


Body mass from penguins

Gráfico de linha

Fonte: https://seaborn.pydata.org/examples/grouped_barplot.html

9
Gráficos adequados a cada tipo de variável
Gráfico de coluna e linha com eixo secundário

Gráfico de rosca (derivação do gráfico de pizza) Ponto de atenção!


Resultados do clube

10
Gráficos adequados a cada tipo de variável
Histograma

Gráfico de dispersão

Visualização de categoria

Fonte: https://seaborn.pydata.org/generated/seaborn.scatterplot.html?highlight=scatter#seaborn.scatterplot

11
Softwares de business intelligence no mercado

Muitos outros...

12
Projeto de business inteligence (BI)
Negócio

Negócio: Empresa de estatística de futebol


Dados
Dados Público: Gestores, técnicos e público em geral

Dados Objetivos:

Desenvolver dashboards onde o usuário possa:


• Verificar as estatísticas de um jogador por:
• Temporada
Informação • Competição
• Se joga fora ou dentro de casa
• Verificar as estatísticas de um clube por:
• Temporada
Tomar decisões inteligentes • Competição
• Se joga fora ou dentro de casa
13
Projeto de business inteligence (BI)
Marca do negócio fictício

42 campeonatos da Europa
55.000+ jogos de várias temporadas
400+ clubes dessas competições
Dados 20.000+ jogadores desses clubes
300.000+ valores de mercado dos jogadores ao longo do tempo
1.000.000+ aparições desses jogadores nos jogos dos campeonatos

Fonte: https://data.world/dcereijo/player-scores (Tratamento) https://www.transfermarkt.co.uk/ (Origem)

14
Projeto de business inteligence (BI)
Paleta de cores da empresa:

#f1c40f #666666 #ecf0f1 #f00000

Enriquece o branding da marca em diversos aspectos, tornando-se uma estratégia ligada ao design e ao marketing.

Ajuda o cliente memorizar a sua marca com maior facilidade.

Facilita a criação do relatório por limitar as opções

15
Quais decisões eu posso tomar com essas
informações?
Análise: Sou técnico de um time e vejo que a média de gols do meu
adversário é 2.8. Exemplo real:

Tomada de decisão: Problema:


Liverpool, da Inglaterra, passou vários anos gastando com jogadores de
Mudar a posição dos jogadores para ter um time mais defensivo.
ataque e tomando prejuízo porque o time nunca era campeão.
Análise: A quantidade de cartões amarelos de um atacante do meu Análise:
time aumentou muito de uma temporada para outra, foi de 12 para O departamento de estatística de futebol do clube sugeriu a contratação
21. de um zagueiro chamado Virgil Van Dijk, de um time pequeno, o
Southampton. Essa sugestão foi baseada no histórico de gols tomados
do Liverpool nos últimos anos, associado com o histórico de poucos gols
Tomada de decisão:
tomados do zagueiro no time pequeno que ele jogava.
Encaminhar o atacante para o psicólogo do clube.
Tomada de decisão:
Análise: Meu time termina a temporada com média de gols muito Contratou o jogador por 75 milhões de libras. (o zagueiro mais caro da
baixa (1,4 gols). história na época)
Resultado:
Tomada de decisão: O time não perdeu em nenhum jogo com ele em campo na temporada e
Dispensar do time os jogadores que marcam poucos gols e dão venceram o campeonato depois de mais de 20 anos.
pouca assistência e contrataria jogadores que possuem uma maior Fonte: https://oglobo.globo.com/esportes/torcida-do-liverpool-deve-
média de gols e assistência. esquecer-preco-de-van-dijk-afirma-klopp-22235031

16
Conhecendo os dados

Conhecer os
dados

Definir o
objetivo
Campeonatos Clubes
Organizar os
dados

Aplicar
análises Jogos Jogadores
Apresentar a
informação

Aparições de Valores de
Compartilhar
jogadores jogadores

17
Organizar os dados

Conhecer os
dados

Definir o
objetivo

Conectar as Ajustar e Estabelecer


Organizar os
dados fontes de padronizar relações entre
dados tipos dos dados as tabelas
Aplicar
análises

Apresentar a
informação

Compartilhar

18
Organizar os dados

Conhecer os
dados

Definir o
objetivo

Conectar as Ajustar e Estabelecer


Organizar os
dados fontes de padronizar relações entre
dados tipos dos dados as tabelas
Aplicar
análises

Fontes de dados: Tipo de conexão:


Apresentar a
• .csv • Importação
informação • .txt • DirectQuery
• .json
• .xlsx
Compartilhar
• Bancos de dados SQL
• Entre muitos outras

19
Organizar os dados

Conhecer os
dados

Definir o
objetivo

Conectar as Ajustar e Estabelecer


Organizar os
dados fontes de padronizar relações entre
dados tipos dos dados as tabelas
Aplicar
análises

Apresentar a
informação

Compartilhar

20
Organizar os dados

Conhecer os
dados

Definir o
objetivo
Conectar as Ajustar e Estabelecer
Organizar os
fontes de padronizar relações entre
dados dados tipos dos dados as tabelas

Aplicar
análises Editor Power Query dentro do Power BI

Interface de ETL do Power BI:


Apresentar a
informação • Extrair os dados Série de etapas
• Transformar os dados
• Carregar os dados
Compartilhar

21
Organizar os dados

Conhecer os
dados

Definir o
objetivo

Conectar as Ajustar e Estabelecer


Organizar os
dados
fontes de padronizar relações entre
dados tipos dos dados as tabelas
Aplicar
análises

Tipo de relação entre tabelas: (Cardinalidade)


Apresentar a • Um para muitos (1,*)
Ambas
informação
• Muitos para um (*,1)
• Um para um (1,1)
Compartilhar
• Muitos para muitos (*,*)

Único

22
Organizar os dados

Conhecer os
dados

Definir o
objetivo

Organizar os
dados Publicar Compartilhar
Aplicar
análises

Tipo de publicação:
Apresentar a • Site ou portal
informação
• Web (público)
• Sharepoint Online
Compartilhar • Outras opções para desenvolvedor

23
Organizar os dados

Conhecer os
dados

Definir o
objetivo

Organizar os
dados Publicar Compartilhar
Aplicar
análises

Tipo de compartilhamento:
Apresentar a • Público
informação
• Restrito

Compartilhar

24
Prof. Helder Prado Santos
https://www.linkedin.com/in/helderprado/
BUSINESS INTELLIGENCE E
DATA VISUALIZATION II
Prof. Helder Prado Santos
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem
autorização. Lei nº 9610/98
Agenda

- REVISÃO

- EXERCÍCIOS

- CONTINUAR PROJETO BI

- ATIVIDADE DINÂMICA

3
Organizar os dados

Conhecer os
dados

Definir o
objetivo

Organizar os
dados Publicar Compartilhar
Aplicar
análises

Tipo de publicação:
Apresentar a • Site ou portal
informação
• Web (público)
• Sharepoint Online
Compartilhar • Outras opções para desenvolvedor

4
Organizar os dados

Conhecer os
dados

Definir o
objetivo

Organizar os
dados Publicar Compartilhar
Aplicar
análises

Tipo de compartilhamento:
Apresentar a • Público
informação
• Restrito

Compartilhar

5
PROF. HELDER PRADO SANTOS
https://www.linkedin.com/in/helderprado/

6
ENGENHARIA DE
DADOS I
Prof. Dr. Jeronymo Marcondes
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98
Introdução

Por que estudar Engenharia de Dados x O que é Engenharia de


Engenharia de Dados? Ciência de Dados. Dados?

3
ETL

4
Requisitos em grandes
empresas

Um profissional de ciência de dados deve:


• Conhecer sobre estruturas de bancos de dados.
• Saber como funciona um processo de ETL.
• Entender sobre modelagem de bancos de dados.
• Compreender como funciona o uso de dados em produção.
• Saber SQL.

5
Nosso objetivo

Introdução à Banco de Modelo ERD – O modelo e a


estrutura de dados SQL. construção e álgebra
dados. relacional. interpretação. relacional.

6
Dados
• Dados x Informação.

• O que é um banco de dados?

É uma coleção de dados, que descreve, tipicamente, as atividades e


relacionamentos de uma ou mais organizações.

Exemplo: MBA USP.

7
SGBD

Sistema Gerenciador de Banco de Dados:

Software desenhado para auxiliar na manutenção, organização e coleta


dos dados existentes em um banco de dados.

Exemplo: MySQL.

8
Estruturas de Dados

Os dados que podemos utilizar dividem-se em:


• Dados Estruturados.
• Dados Semiestruturados.
• Dados não estruturados.

9
Fonte: https://www.astera.com/pt/tipo/blog/dados-semiestruturados-e-n%C3%A3o-estruturados-estruturados/

10
Semiestruturados – Semelhantes aos Não estruturados ou NoSQL - não
Estruturados - são os dados que
dados estruturados, mas não possuem um formato específico, são
detêm formatos bem definidos,
obedientes na totalidade quanto à os dados coletados na sua forma
como os extraídos de planilhas ou
forma. Nesta linha estão os registros original, como um texto, um vídeo,
bancos de dados relacionais no
de linguagens baseadas em HTML e um fragmento de e-mail, um log de
formato SQL.
XML. sistema ou ainda uma mera foto.

11
Dados Estruturados

CPF Nome Nota


x Zé das couves 10
y Maria das desgraças 2
h Silvio Santos 5

12
Dados Semiestruturados

13
Dados Não Estruturados

14
SGBD Relacional

Nosso foco será em SGBD relacional.

Vantagens no uso de um SGDB:


• Independência.
• Eficiência.
• Integridade e segurança.
• Administração simplificada dos dados.
• Controle de acesso.

15
Modelo de dados

• Dados “guardados” no banco de dados conforme modelo. O SGDB


nos permitirá olhar este modelo e fazer consultas conforme lógica
pré-estabelecida.
• A descrição dos dados em termos de modelos é o que chamamos de
esquema (SCHEMA). Conforme exemplo abaixo:

Estudantes(CPF: string, Nome: string, Nota: Integer)

16
Tipos de dados

• Os tipos de dados são classificados em diferentes categorias e permitem N


formatos. Aqui iremos apresentar somente os mais comuns.
• Integer ou inteiro. Exemplo: 1, 2, etc.
• Float. Exemplo: 0.10, 10.25, etc.
• String. Exemplo: “bom dia”, “meu nome é”, etc.
• Date. Exemplo: 2021-01-01.
• Caso do VARCHAR e CHAR.

17
Modelo de dados

Estudantes(CPF: string, Nome: string, Nota: Integer)

• Isso nos diz que trata-se de uma tabela com três


campos.
• Modelo relacional implica que cada registro é único.
• Restrições de integridade!

18
Níveis de Abstração

Modelo conceitual
• Mais alto nível.
• Mais próximo da realidade do negócio.
• Descreve os relacionamentos entre as
entidades presentes em um banco de dados.

19
20
Definições ERD

• Entidade: Algo que pode ser definido e que pode ter dados armazenados
sobre ele — como uma pessoa, um objeto, conceito ou evento. Pense em
entidades como substantivos. Exemplos: um cliente, estudante, carro ou
produto.

21
Definições ERD

• Relacionamento: Como entidades atuam umas sobre as outras ou estão


associadas uma com a outra. Pense em relacionamentos como verbos.
Por exemplo, o estudante pode se inscrever em um curso. As duas
entidades seriam o aluno e o curso, e o relacionamento descrito é o ato
de matricular-se, assim conectando as duas entidades.

22
Definições ERD

• Atributo: A propriedade ou característica de uma entidade, muitas vezes


representada por um oval ou círculo.

23
Exemplo ERD

24
Níveis de Abstração

Modelo Lógico
• Como efetivamente os dados estarão dispostos em
tabelas no banco de dados.
• Leva em conta limitações do banco e SGBD.
• Define chaves primárias, estrangeiras e restrições de
integridade.

25
Esquema Lógico

26
Níveis de Abstração

Modelo Físico
• Implementação própria dita. Como inserir os
dados e criar tabelas e todo o esquema.
• Mais baixo nível.
• Como serão armazenados os dados.
• Métodos de restauração, backup.

27
Query

Dada a existência de um banco de dados, podemos perguntar:


• Quantos estudantes estão matriculados em um curso?
• Quantos cursos estão ativos?
• Qual a idade média dos estudantes?
• Qual a idade média dos estudantes de um determinado curso?

Entra SQL.

28
SQL
• DML – data manipulation language.

• Universalmente aceita.

• Própria para usar álgebra relacional.

29
Introdução ao
SQL

30
SQL
• Structured Query Language.

• Origem – IBM.

• Não precisamos da forma como chegar no resultado – definimos o


resultado.

• Linguagem declarativa.

31
Aspectos Importantes
DML – manipulação de dados.

DDL – definição de dados.

Acesso remoto a bases de dados.

Gerenciamento de transações.

Segurança.

32
Forma básica de uma query

SELECT [DISTINCT] lista-seleção

FROM lista-origem

WHERE qualificação

33
Tabela: Alunos

CPF Nome Nota


x Zé das couves 10
y Maria das desgraças 2
h Silvio Santos 5

34
Componentes

lista-seleção – colunas lista-origem – quais as Qualificação – condições a


que devem aparecer no tabelas que serão serem impostas na
resultado. consultadas. consulta.

35
Exemplo 1

• Como obter uma tabela com CPF e notas?

SELECT CPF, Nota

FROM Alunos

36
Observações

• Nome do campo tem que ser exato.

• SQL é case insensitive.

• Separe o nome das colunas por vírgulas.

37
Lista- origem e Alias
• Alias é o “apelido”. Muito usado em SQL.

• Você pode utilizá-lo para facilitar o entendimento de sua query.

SELECT A.CPF, A.Nota

FROM Alunos A

38
Qualificação

• A qualificação são as famosas cláusulas “where”.

• Essas são uma combinação de expressões booleanas de condições na


forma de expressões.

• Em termos de álgebra, são definições de subconjuntos.

39
40
Operadores de Comparação

Operador Significado
= Igual a
> (Maior que) Maior que
< (Menor que) Menor que
>= (Maior ou igual a) Maior ou igual a
<= (Menor ou igual a) Menor que ou igual a
<> (Diferente de) É diferente de

41
Exemplo 2

• Como obter uma tabela com CPF e notas maiores do que 9?

SELECT CPF, Nota


FROM Alunos
WHERE Nota > 9

42
Mais de uma cláusula

• Neste caso, precisamos definir como é a relação entre as cláusulas.


• Suponha que tenhamos 2 condições: condição-1 e condição-2.
• AND => as duas tem de ser verdade ao mesmo tempo.
• OR => uma das duas tem de ser verdade.
Operador Significado Exemplo
AND e Condição-1 AND condição-2
OR ou Condiçao-1 OR condição-2

43
Exemplo 3
CPF NOME NOTA IDADE
XX JOÃO 10 20
YY PEDRO 7 30

• Como obter todos os registros com nota maior do que 6 E idade


maior do que 25?

SELECT *
FROM Alunos
WHERE Nota > 6 AND Idade > 25
44
Exemplo 4
CPF NOME NOTA IDADE
XX JOÃO 10 20
YY PEDRO 7 30

• Como obter todos os registros com nota maior do que 9 OU idade


maior do que 25?

SELECT *
FROM Alunos
WHERE Nota > 9 OR Idade > 25
45
Diagrama de Venn

46
Caso de linhas repetidas
PIS NOME
xxx Pedro
xxx Pedro
• Problema na hora de seleção quando ocorrem linhas com alguma
coluna de valores repetidos.
• Uso do DISTINCT.

SELECT DISTINCT NOME


FROM Alunos

47
Agregação

Como agregar valores por operações.

Operações de sumarização de dados:


• Média.
• Mínimo.
• Máximo.
• Etc.

48
COUNT

• Conta a quantidade de registros sob determinadas condições.


• Segue a seguinte lógica:

SELECT COUNT([Campo Contado]), Campos Agrupados


FROM Tabela
GROUP BY Campos Agrupados

49
Exemplo 5
CPF NOME ESTADO
XXX JOÃO SP
YYY PEDRO SP
HHH MARIANA AL
JJJ FLAVIA RJ

SELECT COUNT(CPF)
FROM Alunos

50
Exemplo 6
CPF NOME ESTADO
XXX JOÃO SP
YYY PEDRO SP
HHH MARIANA AL
JJJ FLAVIA RJ

SELECT COUNT(CPF), ESTADO


FROM Alunos
GROUP BY ESTADO
2 SP
1 AL
1 RJ

51
Exemplo 7
CPF NOME ESTADO
XXX JOÃO SP
YYY PEDRO SP
HHH MARIANA AL
JJJ FLAVIA RJ

SELECT COUNT(CPF) AS contagem, ESTADO


FROM Alunos
GROUP BY ESTADO
ORDER BY contagem
1 AL
1 RJ
2 SP

52
SUM

• Soma a quantidade de registros sob determinadas condições.


• Segue a seguinte lógica:

SELECT SUM([Campo Somado]), Campos Agrupados


FROM Tabela
GROUP BY Campos Agrupados

53
Exemplo 8
CPF NOME ESTADO IDADE
XXX JOÃO SP 20
YYY PEDRO SP 30
HHH MARIANA AL 30
JJJ FLAVIA RJ 40

SELECT SUM(IDADE)
FROM Alunos

120

54
Exemplo 9
CPF NOME ESTADO IDADE
XXX JOÃO SP 20
YYY PEDRO SP 30
HHH MARIANA AL 30
JJJ FLAVIA RJ 40

SELECT SUM(IDADE), ESTADO


FROM Alunos
GROUP BY ESTADO
50 SP
30 AL
40 RJ

55
AVERAGE (AVG)

• Tira a média aritmética dos registros sob determinadas condições.


• Segue a seguinte lógica:

SELECT AVG([Campo]), Campos Agrupados


FROM Tabela
GROUP BY Campos Agrupados

56
Exemplo 9
CPF NOME ESTADO IDADE
XXX JOÃO SP 20
YYY PEDRO SP 30
HHH MARIANA AL 30
JJJ FLAVIA RJ 40

SELECT AVG(IDADE), ESTADO


FROM Alunos
GROUP BY ESTADO
25 SP
30 AL
40 RJ

57
MIN e MAX

• Tira o menor ou o maior valor dos registros sob determinadas condições.


• Segue a seguinte lógica:
SELECT MIN([Campo]), Campos Agrupados
FROM Tabela
GROUP BY Campos Agrupados

SELECT MAX([Campo]), Campos Agrupados


FROM Tabela
GROUP BY Campos Agrupados

58
Exemplo 10
CPF NOME ESTADO IDADE
XXX JOÃO SP 20
YYY PEDRO SP 30
HHH MARIANA AL 30
JJJ FLAVIA RJ 40

SELECT MAX(IDADE), ESTADO


FROM Alunos
GROUP BY ESTADO
30 SP
30 AL
40 RJ

59
Exemplo 11
CPF NOME ESTADO IDADE
XXX JOÃO SP 20
YYY PEDRO SP 30
HHH MARIANA AL 30
JJJ FLAVIA RJ 40

SELECT MIN(IDADE), ESTADO


FROM Alunos
GROUP BY ESTADO
20 SP
30 AL
40 RJ

60
Introdução ao ETL

A integração de dados ETL é um processo de


três etapas em que os dados são extraídos de
Extract, Transformation and Load. uma ou mais fontes de dados, convertidos para
o estado necessário e carregados em um banco
de dados ou data warehouse em nuvem.

61
Estrutura de um ETL

62
Frameworks para ETL

63
Exemplo Pentaho

64
Create Table

• Cria uma Tabela com determinados campos.


• Segue a seguinte lógica:

CREATE TABLE ENDERECO


(
Id_Estudante INTEGER,
Endereco Varchar(50)
)
65
Insert

• Insere determinados campos.


• Segue a seguinte lógica:

INSERT INTO ENDERECO (Id_Estudante, Endereco)


VALUES (2, “RUA PEIXOTO DA SILVA”)

66
ENGENHARIA DE
DADOS II
Prof. Dr. Jeronymo Marcondes
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.
Proibida a reprodução total ou parcial, sem
autorização. Lei nº 9610/98

2
Introdução

3
Perguntas
• Como unir as informações das tabelas?

• Como obter informações de curso a partir de estudantes?

• Como realizar consultas bem performáticas com qualificações


inseridas?

• Como garantir que o modelo seja robusto a transações.

4
Transações
• Execução no banco de dados.

• Garante integridade – exemplo de compra de lugares no teatro.

• Sensação de execução local com isolamento e proteção contra


perdas.

• Conceito de lock.

5
Locking Protocol

• Regras que garantem que, mesmo que várias pessoas executem


querys ao mesmo tempo, o resultado líquido será o mesmo que teria
ocorrido se as mesmas tivessem sido executadas em fila.

• O lock irá garantir que o objeto consultado não possa ser acessado
por meio de outras transações.

• Exclusive Lock e Shared Lock.

6
Exemplo

7
Relacionamento

• Como garantir robustez ao modelo do negócio? Além da robustez de


transações -> restrições.

• O relacionamento entre entidades. Como se relacionam estudantes e


cursos?

• A tabela tem de ter consistência interna e os relacionamentos dela


com as demais também.

8
Restrições de Integridade

• Restrições de chave, de relacionamento e gerais.

• Restrições de chave: um subconjunto mínimo de campos de uma


relação que identifica tupla única.

• Ou seja, campo(s) definidos como chave devem garantir que a linha


selecionada seja única.

9
Exemplo
CPF Nome Curso
xxx João Ciência de Dados
yyy João Medicina
hhh Pedro Medicina

Nome Sobrenome Curso


João Silva Ciência de Dados
João Marinho Ciência de Dados
Pedro Guedes Ciência de Dados

10
Chave Primária

• Uma determinada tabela pode ter várias chaves = chaves candidatas

• Chave primária é definida pelo DBA de forma que o SGBD faça as


averiguações por meio da mesma.

• Chave primária bem definida é importante pois suscita a criação e


índices o que torna as consultas mais performáticas.
11
Formas Normais

• Série de regras que garantem se um BD foi bem projetado.


• Mostra a importância de uma chave primária bem definida.
• Objetivo:

1) Garantir informação sem redundância.

2) Garantir eficiência na obtenção dos dados.


12
Formas normais
• 1ª forma normal:

Cada linha é uma informação. Não podem existir grupos repetidos ou


atributos com mais de um valor.

PESSOAS = {ID+ NOME + ENDERECO + TELEFONES}

PESSOAS = { ID + NOME + ENDERECO }


TELEFONES = { PESSOA_ID + TELEFONE }

13
Formas normais
• 2ª forma normal:

Todas as colunas que não participam da chave primária são dependentes de


todas as colunas que compõem a chave primária.

ALUNOS_CURSOS = { ID_ALUNO + ID_CURSO + NOTA + DESCRICAO_CURSO }


ALUNOS_CURSOS = {ID_ALUNO + ID_CURSO + NOTA}
CURSOS = {ID_CURSO + DESCRICAO}

14
Restrições Gerais

• Restrições de , principalmente, de negócio.

• Exemplo: inserção de idade.

• Os modernos SGBD já tem ferramentas que permitem criar tais


restrições.

15
Como lidar com modelos com mais de uma
tabela?

16
Restrições Estrangeiras

• Restrições que permitem a ligação entre tabelas.

• Exemplo: inserção de idade.

• Os modernos SGBD já tem ferramentas que permitem criar tais


restrições.

17
Chave Estrangeiras

• Chave primária de outra tabela

• Essa chave nos permite ligar tabelas diferentes de forma a garantir a


unicidade da relação.

• O nome da chave estrangeira não precisa ser o mesmo da chave


primária = o que importa é o conteúdo!

18
19
Casos Específicos

• Inserir Tupla <55555, Art104, A> nos cursos com inscrição.

• Deletar tupla <53666, Jones, Jones@cs, 18, 3.4> de estudantes.

• Inserir tupla <55669, Margareth, MG@test, 21, 4> em estudantes.

20
Ideia de junção
Tabela 1 Tabela 2
CPF NOME CPF IDADE PIS
xxx ze das couves xxx 21 hhh
yyy maria das desgraças yyy 25 JJJ

Tabela Derivada
CPF NOME IDADE
xxx ze das couves 21
yyy maria das desgraças 25

21
ACID
• Atomicity, Consistency, Isolation, Durability

• Conjunto de propriedades em transações de bancos de dados que são


importantes para garantir a validade dos dados mesmo que ocorram
erros durante o armazenamento ou problemas mais graves no
sistema, como crashes ou problemas físicos em um servidor. As
propriedades ACID são fundamentais para o processamento de
transações em bancos de dados.

22
ACID

• Atomicidade: Garante que cada transação seja tratada como uma


entidade única, a qual deve ser executada por completo ou falhar
completamente.
• Consistência: Os dados que são gravados devem sempre ser válidos.
• Isolamento: Permite deixar o banco de dados no mesmo estado em
que ele estaria caso as transações fossem executadas em sequência.
• Durabilidade: A propriedade da durabilidade garante que uma
transação, uma vez executada (efetivada), permanecerá neste estado
mesmo que haja um problema grave no sistema
23
Cardinalidade

• Cardinalidade: indica quantas ocorrências de uma Entidade


participam no mínimo e no máximo do relacionamento.

Tipos de relacionamento:
1) Um para um;
2) Muitos para um;
3) Muitos para muitos.

24
Um para um

• Cardinalidade mínima: define se a relação é obrigatória.


• Cardinalidade máxima: define a quantidade máxima de ocorrências
da Entidade que pode participar do Relacionamento.

25
Muitos para um

26
Muitos para Muitos

27
Operando com SQL

28
JOIN

• Especifica como será feita a junção entre duas tabelas. Por exemplo:
Id_cliente Pedido Id_cliente Nome Endereço

Id_cliente Nome Endereço Pedido

29
LEFT JOIN

SELECT [DISTINCT] lista-seleção


FROM lista-origem-1
LEFT JOIN lista-origem-2
ON lista-origem-1. campo_em_comum = lista-origem-2. campo_em_comum
WHERE qualificação

30
LEFT JOIN
SELECT *
FROM pedidos
LEFT JOIN endereco
ON pedidos.Id_cliente = endereço.Id_cliente

31
Id_cliente Pedido Id_cliente Nome Endereço
xxx 1 xxx joao av joao
yyy 2 hhh pedro av pedro

Id_cliente Nome Endereço Pedido


xxx joao av joao 1
yyy NULL NULL 2

32
NULL
• Até agora somente valores conhecidos.

• Se desconhecido = NULL.

• Quando o valor é desconhecido ou não se aplica.

33
Exemplo com NULL
SELECT *
FROM pedidos_e_endereço
Id_cliente Nome Endereço Pedido
WHERE nome IS NOT NULL xxx joao av joao 1

SELECT * Id_cliente Nome Endereço Pedido


FROM pedidos_e_endereço yyy NULL NULL 2
WHERE nome IS NULL

34
RIGHT JOIN

SELECT [DISTINCT] lista-seleção


FROM lista-origem-1
RIGHT JOIN lista-origem-2
ON lista-origem-1. campo_em_comum = lista-origem-2. campo_em_comum
WHERE qualificação

35
RIGHT JOIN
SELECT *
FROM pedidos
RIGHT JOIN endereco
ON pedidos.Id_cliente = endereço.Id_cliente

36
Id_cliente Pedido Id_cliente Nome Endereço
xxx 1 xxx joao av joao
yyy 2 hhh pedro av pedro

Id_cliente Nome Endereço Pedido


xxx joao av joao 1
hhh pedro av pedro NULL

37
INNER JOIN

SELECT [DISTINCT] lista-seleção


FROM lista-origem-1
INNER JOIN lista-origem-2
ON lista-origem-1. campo_em_comum = lista-origem-2. campo_em_comum
WHERE qualificação

38
INNER JOIN
SELECT *
FROM pedidos
INNER JOIN endereco
ON pedidos.Id_cliente = endereço.Id_cliente

39
Id_cliente Pedido Id_cliente Nome Endereço
xxx 1 xxx joao av joao
yyy 2 hhh pedro av pedro

Id_cliente Nome Endereço Pedido


xxx joao av joao 1

40
UNION ALL

• Tabelas de mesma estrutura que serão “empilhadas”.

SELECT lista-seleção
FROM lista-origem-1
UNION ALL
SELECT lista-seleção
FROM lista-origem-2

41
UNION ALL
SELECT Id_cliente
FROM pedidos
UNION ALL
SELECT Id_cliente
FROM endereco

42
Id_cliente Pedido Id_cliente Nome Endereço
xxx 1 xxx joao av joao
yyy 2 hhh pedro av pedro
Id_cliente
xxx
yyy
xxx
hhh

43
UNION

• Tabelas de mesma estrutura que serão “empilhadas”.


• Diferencia-se por aplicar um DISTINCT.

SELECT lista-seleção
FROM lista-origem-1
UNION
SELECT lista-seleção
FROM lista-origem-2

44
UNION
SELECT Id_cliente
FROM pedidos
UNION
SELECT Id_cliente
FROM endereco

45
Id_cliente Pedido Id_cliente Nome Endereço
xxx 1 xxx joao av joao
yyy 2 hhh pedro av pedro

Id_cliente
xxx
yyy
hhh

46
Nested Queries
• Resultado de query anterior pode ser utilizada na
atual
• Forma mais comum:
SELECT lista-seleção-derivada
FROM lista-origem
WHERE coluna IN
(
SELECT lista-seleção-original
FROM lista-origem
)

47
Nested Queries

CPF NOME ENDERECO CPF PEDIDO VALOR (R$)


XXX JOAO AV JOAO XXX 10 500
YYY MARIA AV MARIA YYY 12 1000

48
Nested Queries
SELECT CPF, Nome, Endereco
FROM Consumidores
WHERE CPF IN
(
SELECT CPF
FROM Gastos
WHERE Valor > 500
)

49
ODBC e JDBC
• Java Database Connectivity – SUM

• Open Database Connectivity – Microsoft

• API – application programming interface

50
ODBC e JDBC

• Permite a execução de SQL dentro do banco a partir de


aplicações.

• Pode acessar diversos servidores de dados ao mesmo tempo.

• Todas as transações ocorrem por meio de um driver.

51
ODBC e JDBC

https://docs.oracle.com/

52
Exemplo no R Studio

53
ODBC e JDBC

• Ordem:
1. Seleciona origem de dados.

2. Carrega o respectivo driver.

3. Estabelece a conexão com a origem.

54
ODBC e JDBC

• Cada conexão tem suas características.


• Define-se a string de conexão com o banco.

55
Discussão – futuro dos bancos de dados
56
Prof. Dr. Jeronymo Marcondes
https://www.linkedin.com/in/jeronymo-marcondes-585a26186

57
ENGENHARIA DE
DADOS III
Prof. Dr. Jeronymo Marcondes
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados, é do professor.
Proibida a reprodução total ou parcial, sem
autorização. Lei nº 9610/98
ODBC e JDBC

• Foco da aula: ODBC

• Objetivo: utilizar as capacidades do banco de dados para


realizar nossas operações.

• Limitações das linguagens ao trabalhar com arquivos texto com


os dados necessários.

3
Exemplo no R Studio

4
ODBC e JDBC

• Abordagem da aula:
1. Executar as querys e trazer para o R.
2. Utilizar o dplyr para realizar as operações dentro do database.

• Tudo isso depende do entendimento dos pacotes DBI e DPLYR.

5
Pacote DBI

https://db.rstudio.com/r-packages/dbi/

6
DBI

• Permite a divisão da conexão em um front-end e um back-end

• Executa query no banco

• Permite fazer interação entre outros pacotes e o banco (dplyr)

Bases comerciais e open source

7
DBI

Fonte: https://db.rstudio.com/getting-started/

8
DBI - estrutura
Install.packages("DBI")

library("DBI")

9
DBI - execução de consultas

10
DBI - execução de consultas

11
DBI - boas práticas
• Fechar conexão após uso

• Atentar para drivers em ambientes corporativos:


https://db.rstudio.com/best-practices/drivers/

• Saber o que está ocorrendo quando criamos um dataframe local com


consulta.

12
DPLYR

• Principal pacote para Data Wrangling.

• Rápido e de fácil manipulação – resolve mais de 90% dos problemas de


estrutura que podem surgir.

• Trabalha com dataframes que seguem padrões de tidydata (tibble).

13
DPLYR

• Dplyr vai permitir a execução de algumas operações de wrangling


diretamente no banco e utilizando o poder computacional do banco
sem sobrecarregar o R.

14
TIbble

• Hadley Wickham:

1. Cada variável é uma coluna


2. Cada observação é uma linha
3. Cada unidade observacional é a tabela

15
DPLYR

• As principais funções do dplyr são:

1. Select()
2. Arrange()
3. Filter()
4. Mutate()
5. Group_by()
6. Summarise()
16
DPLYR - estrutura básica

• Uso básico do select – seleciona colunas de uma tabela

select(dataframe, campos_separados_por_virgula)

17
DPLYR - uso do pipe

• Uso do pipe – mais de uma operação do dplyr em uma única tabela

• Ideia de sequencial

dataframe %>% select(campos_separados_por_virgula)

18
DPLYR - exemplo de select

https://dplyr.tidyverse.org/articles/dplyr.html

19
DPLYR - exemplo de select

https://dplyr.tidyverse.org/articles/dplyr.html

20
DPLYR - exemplo de filter

dataframe %>% filter(campos == “determinado valor”)


dataframe %>% filter(campos > “determinado valor”)
dataframe %>% filter(campos < “determinado valor”)
dataframe %>% filter(campos <> “determinado valor”)

21
DPLYR - exemplo de filter

https://dplyr.tidyverse.org/articles/dplyr.html

22
DPLYR - exemplo de group_by e summarise

dataframe %>% summarise(nova_variável = função aplicada em


variável)

dataframe %>% group_by(variavel) %>% summarise(nova_variável =


função aplicada em variável)

23
DPLYR - exemplo de group_by e summarise
5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo
u sh
At s
e o
lhttps://dplyr.tidyverse.org/articles/dplyr.html
ar c
M

24
DPLYR - outros casos

• Amplitude de uso do dplyr

• Foco da aula

25
Prof. Dr. Jeronymo Marcondes
https://www.linkedin.com/in/jeronymo-marcondes-585a26186

26
INTRODUÇÃO AO
JAVASCRIPT

Prof. Marcelo Sabadini


Prof. Alexandre Castro Junior
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução total ou parcial, sem
autorização. Lei nº 9610/98

2
Prof. Marcelo Sabadini
Pai do Israel e Giovana
TI/DEV a 20 anos
Guitarrista (entusiasta)
IBM, Accenture, Avanade
Foco em WEB
Cervejeiro
On premise
Cloud
Techlead
Baterista (entusiasta 🤷‍♂️)
Fraude (anti-fraude 😉)
Análise de Crédito

3
Prof. Alexandre Castro Junior
Pai de outra Giovanna (mas com 2N)
Bacharel em Ciências Navais
Pós Lato Sensu em Gestão Pública
Maker
Pós Lato Sensu em Ciência de dados
Cientista de dados na auditoria
Professor (BD, SQL, Python, JAVASCRIPT, git...)
Entusiasta de Linux
Fanboy da Marvel

4
Objetivo da disciplina

• O que é JavaScript
• Por que JavaScript
• JavaScript e Data Science
• Como fazer (instalações)
• Conhecendo a linguagem JavaScript

5
O que é JavaScript

• JavaScript NÃO É JAVA!


• JavaScript NÃO É JAVA!
• JavaScript NÃO É JAVA!
• JavaScript NÃO É JAVA!
• JavaScript NÃO É JAVA!
• JavaScript NÃO É JAVA!
• JavaScript NÃO É JAVA!
• JavaScript NÃO É JAVA!

6
O que é JavaScript

• JavaScript NÃO É JAVA!


• Muito conhecida pela abreviação JS
• Linguagem interpretada
• Tipos dinâmicos
• Multiparadigma
• Uma das principais linguagens da WEB (1995)
• Client-side
• Server-side (2009)
• Node.js

7
Por que JavaScript?

• Popularidade*
• Versatilidade
• Facilidade
• Multiplataforma
• Adaptabilidade

* https://pypl.github.io/PYPL.html

8
JavaScript e Data Science?

Entendimento Aquisição dos Preparação Análise Criação do


Predição Visualização
do problema dados dos dados exploratória modelo

9
JavaScript e Data Science?

Entendimento Aquisição dos Preparação dos Análise Criação do


Predição Visualização
do problema dados dados exploratória modelo

Carregamento
CSV com
Descobrir se a da base, Verificaçãp de Criação do Submissão dos Exibição em
dados
transação tem criação de outliers, dados modelo de dados para um dashboard
históricos das
risco de fraude novas faltantes, etc… predição predição no Power BI
vendas
observações

Offline / sob demanda

10
JavaScript e Data Science?

Offline

Entendimento Aquisição dos Preparação dos Análise Criação do


Predição Visualização Implantação
do problema dados dados exploratória modelo

11
JavaScript e Data Science?

Offline

Entendimento Aquisição dos Preparação dos Análise Criação do


Predição Visualização Implantação
do problema dados dados exploratória modelo

Online

Submissão dos
Carregamento Tomadada da
dados para Retorno
da transação decisão
predição

Online 24/7

12
JavaScript e Data Science?

Offline Fontes

Entendimento Aquisição dos Preparação dos Análise Criação do


Predição Visualização Implantação
do problema dados dados exploratória modelo

Online

Submissão dos
Carregamento Tomadada da
da transação
dados para
decisão
Retorno API
predição

Online 24/7

13
Como fazer

• Download e instalação do Node.js


• Download e instalação da IDE – VSCode
• Conhecendo o Node.JS
• Conhecendo JS

14
Download e instalação
do Node.JS
• Acessar o site https://nodejs.org
• Clicar em Downloads
• Escolher a opção de acordo com o
sistema operacional
• Next, Next... Install.
Download e instalação
do VSCode
• Acessar o site
https://code.visualstudio.com/
• Clicar em Download
• Escolher a opção de acordo com o
sistema operacional
• Next, Next, Next..
Conhecendo a linguagem JavaScript
• Comentários
• Variáveis
• Operadores
• Condicional
• Loop
• Funções

17
INTRODUÇÃO AO
JAVASCRIPT II

Prof. Marcelo Sabadini


Prof. Alexandre Castro Junior
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
2
Agenda

Parte 1 – Professor Marcelo

• Revisão rápida
• Funções
• Objetos

Parte 2 – Professor Alexandre

• Introdução a módulos e npm


• Introdução ao protocolo HTTP
• Primeiras rotas em nodejs (express)

3
Revisão

• Popular / versátil / fácil / adaptabilidade


• Client-side / server-side
• // CURIOSIDADE: Se você usar um comando por linha, não precisa do ;
• var sem_comentario = true
• JS tipagem dinâmica / Tipos de variáveis
• console.log(“vimos algumas funções”.toUpperCase())
• If else if / > >= < <=
• Loops for, for in
// MAIS UMA CURIOSIDADE: Se o for ou o bloco só tem um comando, não precisa colocar { e }
for(var i = 1; i <= 10; i++)
• console.log(”JS não é JAVA! ”)

4
https://gifs.com/gif/vinheta-planto-da-globo-2014-vbpo5R
5
5
https://developer.mozilla.org/pt-BR/docs/Web/JavaScript

https://gifs.com/gif/vinheta-planto-da-globo-2014-vbpo5R

6
Revisão

Offline Fontes

Entendimento Aquisição dos Preparação dos Análise Criação do


Predição Visualização Implantação
do problema dados dados exploratória modelo

Online

Submissão dos
Carregamento Tomadada da
da transação
dados para
decisão
Retorno API
predição

Online 24/7

7
Agenda

• Parte 1 – Professor Marcelo


• Revisão rápida ✔
• Funções
• Objetos

8
Agenda

• Parte 1 – Professor Marcelo


• Revisão rápida ✔
• Funções ✔
• Objetos ✔
• Parte 2 – Professor Alexandre
• Introdução a módulos e npm
• Introdução ao protocolo HTTP
• Primeiras rotas em nodejs (express)

9
10
EU

VIDA

11
Introdução a módulos e npm
• Módulos são ferramentas escritas pelo desenvolvedor ou por
terceiros para facilitar determinadas implementações. São formas de
entregar funcionalidades sem que o desenvolvedor precise
“reinventar a roda”.

• O NPM (🥰) é o gerenciador de pacotes do node. É entregue junto


com ele e é um dos mais utilizados, apesar de existirem outros. O
NPM permite baixar e instalar módulos e pacotes para projetos node,
além de facilitar sua integração.
• O NPM também é um repositório onde qualquer pessoa pode publicar
ferramentas escritas em javascript

12
Exemplo prático.

13
Introdução ao protocolo HTTP

• Toda comunicação (entre máquinas ou pessoas) exige um protocolo


• Há diversos tipos de protocolos de comunicação, que podem ou não
ser baseados na web
• O HTTP (Hypertext Transfer Protocol) é um dos mais utilizados, sendo
baseado em requisições (pedidos e respostas)

14
Introdução ao protocolo HTTP

• Verbos HTTP:
Padronizam os tipos de requisição e a forma como são tratadas. Os mais
comuns são:
• GET
• POST
• PUT
• PATCH
• DELETE
Neste curso, utilizaremos os tipos GET e POST.
* É uma prática ruim utilizar um verbo quando se quer definir uma ação
diferente.

15
Introdução ao protocolo HTTP

• Rotas ou endpoints:
• Definem recursos que podem ser utilizados pelo cliente (usuário) para suas
requisições.
• Cada endpoint pode receber e encaminhar diversos tipos de verbos http.
• São definidos por URI (Uniform Resource Identifier) ou URL (Uniform Resource
Locator)

16
Primeiras rotas em node

• O node possui um módulo para criação de APIs web, contudo o


express é um dos mais utilizados no mercado.
• Instalação:
• Npm init
• Npm install –save express

17
OBRIGADO!

Prof. Marcelo Sabadini

Prof. Alexandre Castro Junior


INTRODUÇÃO AO
JAVASCRIPT III

Prof. Marcelo Sabadini


Prof. Alexandre Castro Junior
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
Agenda
• Utilizando a integração com o R
• Próximos passos com Javascript

3
Integração JS e R

• Instalação de dependências de um projeto existente (npm install)


• Variável de ambiente “PATH”?
• Instalação de pacotes com Rstudio (verificar versão do R 4.1.3)
• Instalação do módulo r-script
• Primeiro script integrado ao R
• Classificação utilizando JS e R
• Entregando a classificação via API web

4
Próximos passos com Javascript

• Tensorflowjs – Biblioteca de machine learning para Javascript


• Typescript – Super conjunto do Javascript, que adiciona uma série de
funcionalidades à linguagem
• Deno – alternativa ao nodejs

5
OBRIGADO!

Prof. Marcelo Sabadini

Prof. Alexandre Castro Junior


CLOUD COMPUTING I
Marcello Zillo Neto
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
Quem sou

in/mzillo/

3
Nossa Agenda
1 Introdução

2 SofA e Migração

3 Segurança DA Nuvem e NA Nuvem

4 Cloud Analytics Journey

4
Nossa Agenda
1 Introdução

2 SofA e Migração

3 Segurança DA Nuvem e NA Nuvem

4 Cloud Analytics Journey

5
10 Questões filosóficas na adoção de Nuvem

1. O que muda na gestão?


2. Usar a nuvem é seguro?
3. Como migrar?
4. O que migrar primeiro?
5. Quais os riscos?
6. Quais os mitos?
7. Isso é somente para startups?
8. Qual o grande desafio para implementar?
9. Quais os benefícios?
10. Qual o papel da nuvem na Transformação Digital?

6
Definição

7 7
8
Fail Fast

9
Novas tecnologias e a Cloud - IoT

10
Total IoT Devices

https://iot-analytics.com/state-of-the-iot-update-q1-q2-2018-number-of-iot-devices-now-7b/

11
Total IoT Devices

12
IoT cloud

https://iot-analytics.com/iot-cloud/

13
Analytics e a Cloud

14
Indústrias foram transformadas

15
Public Cloud

16
Public Cloud WW 2017 - 2023

https://www.statista.com/statistics/273818/global-revenue-generated-with-cloud-computing-since-2009/

17
Worldwide Market – Q1 2021

$150 Billion
Cloud Market

18
Worldwide Market – Q4 2021

$180 Billion
Cloud Market

https://www.statista.com/chart/18819/worldwide-market-share-of-leading-cloud-infrastructure-service-providers/

19
Democratização de
recursos tecnológicos

20
Hybrid Cloud

21
Cloud Service Models

22
FaaS – Function as a Service

https://medium.com/@oyetoketoby80/why-you-should-care-about-serverless-and-faas-6987c84eacb4

23
Gartner Magic Quadrant IaaS

24
Gartner Magic DB MS

25
Gartner Magic CIPS

26
Forester Wave Cloud DW

27
A Cloud e suas “camadas”

28
Public Cloud Services AWS

29
Public Cloud Services Azure

30
Must Read

https://hbr.org/resources/pdfs/comm/insight/HBRASHybridCloud.pdf

31
Business Drivers

32
SMBs x Enterprises

33
Business Drivers

34
SMBs x Enterprises

35
Barreiras

36
Quem decide ?

37
Drivers para adoção de nuvem
1. Maior agilidade.

2. Pare de adivinhar capacidade.

3. Mudança na estrutura de custos.

4. Fail Fast e inove mais.

5. Globalização dos negócios.


???
6. Acesse tecnologia e serviços inovadores.

38
Eficiência de Custo

39
Somente os Gringos ???
Ambiente altamente regulado

40
Qualquer indústria?
96% de produtividade

41
Entretenimento?

42
Entretenimento?

43
Os mais diversos segmentos

44
Nossa Agenda
1 Introdução

2 SofA e Migração

3 Segurança DA Nuvem e NA Nuvem

4 Cloud Analytics Journey

45
Cloud Adoption Framework Microsoft

46
Cloud Adoption Framework Microsoft

47
Well Architecture Framework

48
Well-Architected Review

https://aka.ms/architecture/review

49
Cloud Adoption Framework AWS

https://aws.amazon.com/pt/professional-services/CAF/
https://d1.awsstatic.com/whitepapers/pt_BR/aws-cloud-adoption-framework_pt-BR.pdf

50
CAF - AWS

https://d1.awsstatic.com/whitepapers/pt_BR/aws-cloud-adoption-framework_pt-BR.pdf
https://aws.amazon.com/pt/professional-services/CAF/

51
Cloud SofA – Stage of Adoption

https://aws.amazon.com/blogs/enterprise-strategy/capital-ones-cloud-journey-through-the-stages-of-adoption/

52
Estratégias de migração

53
Estratégias de migração

54
Gravidade dos dados

55
Migrar grandes volumes de dados ?

https://go.aws/2MJKgQu

56
Migrar grandes volumes de dados ?

57
Livro recomendado

58
Nossa Agenda
1 Introdução

2 SofA e Migração

3 Segurança DA Nuvem e NA Nuvem

4 Cloud Analytics Journey

59
Qual o papel da segurança?

“CIOs and CISOs need to stop obsessing over unsubstantiated cloud


security worries, and instead apply their imagination and energy to
developing new approaches to cloud control, allowing them to
securely, compliantly and reliably leverage the benefits of this
increasingly ubiquitous computing model.”
Jay Heiser

60
Não seja o Dr. NO

61
Não é mais uma escolha

62
Cyber Security na nuvem

63
Duas palavras chaves

64
Criptografia em Escala

65
Tecnologias disponíveis com um click
• WAF
• Firewall
• ML / AI
• IAM
• Full Logs
• MFA
• Criptografia em escala
• Automação de resposta a incidente
• …………

66
Segurança como código

67
Democratização da segurança

68
Posso estar mais Seguro, mas …
Modelo de responsabilidade compartilhada

69
Responsabilidade Compartilhada

70
Responsabilidade Compartilhada

71
Responsabilidade Compartilhada

72
Exemplo prático
DB em ambiente tradicional

73
Exemplo prático DB em IaaS

74
Exemplo prático DB em PaaS

75
Por onde começar?

76
Certificações relevantes
para a indústria

77
Certificações relevantes
para a indústria

78
Aspectos relevantes de
segurança DA nuvem

• Programas de Compliance.
• Certificações
• Controles que fazem sentido para seu negócio

79
AWS - Programas de Compliance

https://aws.amazon.com/pt/compliance/programs/

80
MS - Programas de Compliance

https://servicetrust.microsoft.com/

81
MS – STP Portal

82
Google - Programas de Compliance

https://cloud.google.com/security/compliance/#/

83
Validar a segurança DA nuvem

84
Como acessar os reports e controles

85
CSA – Cloud Security Alliance

86
CSA STAR - AWS

https://d0.awsstatic.com/whitepapers/compliance/CSA_Consensus_Assessments_Initiative_Questionnaire.pdf

87
CSA STAR - AWS

88
CSA STAR - MS

89
CSA STAR – exemplos de questões

90
OK mas como eu faço então
“a minha parte”

91
Security Foundations

“The time to repair the roof


is when the sun is shining.”
John F. Kennedy, State of the Union, 1962

92
Security Foundations to the Cloud

93
Estrutura de governança e perfis profissionais
1. Avalie questões de conformidade, contratuais e de
controles do provedor relevantes.

• Certificações relevantes e exigências de segurança que


devem estar em contrato
• Mecanismos de governança para avaliar
periodicamente se os níveis de segurança estão
alinhados com as expectativas e definições contratuais
• Locais no globo que podem ser limitadores por
questões regulatórias

94
Estrutura de governança e perfis profissionais
2. A equipe de Segurança precisa ter
novos perfis de profissionais
• Desenvolvedores para automatizar a segurança
• Conhecedores de segurança DA / NA Nuvem
• Responsabilidade compartilhada interna com os times de
Cloud, DevOps na medida que se adota nuvem
• Segurança passa a ter um papel além do normativo e
implementação de controles tecnológicos para ser
fornecedor de serviços de segurança Self Service que
aceleram a implementação de segurança.

95
Estrutura de governança e perfis profissionais

3. Revise seu BIA

96
Estrutura de governança e perfis profissionais
4. Teste e documente o plano (Continuidade e DR)
considerando os recursos e funcionalidades da
nuvem que podem inclusive melhorar o RTO e RPO,
com cópias em múltiplas Zonas.

97
98
Segurança em camadas
A identidade é o Control Plane

99
Gestão de Identidade e Acessos
1. You do what you need
• É a espinha dorsal para a criação de uma boa base de
segurança NA Nuvem

100
Gestão de Identidade e Acessos
2. You do ONLY what you need to do
• Mínimo privilégio possível, perfis de acesso

101
Gestão de Identidade e Acessos
2. Criando segregação de contas / subscrição / projetos

1 AWS Organizations Master

Core Accounts BU/ Product/ Resource Accounts

Securit y Billing

3 5 Tooling
Sandbox Prod
6 9
Shared
Services
Int ernal
Audit 2
Logging
4
Dev Pre-Prod

7 8
Net work Shared
Services
4 Data Center
Developer Accounts

Developer
Sandbox
6

102
103
Auditoria e Rastreabilidade
1. You do, I Know

• Centralize, monitore e gere alerta de ações e mudanças


executadas em seus ambientes em tempo real.

• Integre alertas e métricas para obter respostas


automáticas.

104
Auditoria e Rastreabilidade
2. You do, I Know

105
106
Segurança em camadas

• Isole servidores e aplicações

• Implemente mecanismos de micro


segmentação

• Limite a superfície de ataque

107
Segurança em camadas
Zero Trust

108
Segurança em camadas
A ideia de "Zero Trust" vem evoluindo há algum tempo

109
Segurança em camadas
Princípio central do Zero Trust

110
Segurança em camadas
Adote uma premissa que todos os recursos estão
conectados na Internet

111
112
Automação e Segurança
Humans don´t touch the data

113
Automação e Segurança
Humans don´t touch the data

114
Riscos no ambiente de desenvolvimento

115
Proteja seu DevOps
Defina os requisitos de
Segurança:
5 1
▪ Modelagem de ameaças em major
releases
0 9 8-
▪ Execute análise de segurança do Azure Monitor
73 .
código
5 .2
Secure DevOps

31
▪ Armazene segredos de forma segura Azure Policy Kit for Azure
utilizando o Azure Key Vault / AWS RBAC
i d a SDLC
KMS
Estabeleça um procedimento os h
Azure AD

i Y
padrão de resposta a incidentes
u sh Token/cred
ASC
scanning
▪ Microsoft Secure DevOps Toolkit –
At s WAF
Dependabot
https://azsk.azurewebsites.net/

el o
Proteja o desenvolvimento de
Apps ar c Azure Pipelines
GitHub
Advanced Security
M
▪ Organization for Web App Security Project
GitHub Actions

(OWASP) DevOps Pipeline security


https://www.owasp.org/index.php/OWASP_AppSec_Pipeline#tab=Main

116
117
Proteção de Dados
Humans don´t see the data

• Proteja os dados em trânsito

• Proteja os dados em repouso

• Use recursos de tokenização

• Políticas de backup

• Mascaramento e monitoramento de uso de dados

118
Proteção de Dados
Humans don´t see the data

119
120
Resposta a Incidentes
Se prepare para responder a incidentes de
segurança nuvem, em grande escala

121
Resposta a Incidentes

122
Resposta a Incidentes

123
124
Soluções Cloud Native
Entenda o potencial das soluções Cloud Native

125
Soluções Cloud Native
Identity and Access Managament

https://aws.amazon.com/products/security/

126
Soluções Cloud Native
Detection

https://aws.amazon.com/products/security/

127
Soluções Cloud Native
Network and application protection

https://aws.amazon.com/products/security/

128
Soluções Cloud Native
Network and application protection

https://aws.amazon.com/products/security/

129
Soluções Cloud Native
Incident Response

https://aws.amazon.com/products/security/

130
Soluções Cloud Native
Compliance

https://aws.amazon.com/products/security/

131
Soluções Cloud Native
Security, Identity and Compliance

132
Exemplo de Jornada de Segura

133
Nossa Agenda
1 Introdução

2 SofA e Migração

3 Segurança DA Nuvem e NA Nuvem

4 Cloud Analytics Journey

134
https://aws.amazon.com/blogs/big-data/enhancing-customer-safety-by-leveraging-the-scalable-secure-and-cost-optimized-toyota-connected-data-lake/

135
https://aws.amazon.com/pt/quickstart/architecture/data-lake-foundation-with-aws-services/

136
https://docs.aws.amazon.com/prescriptive-guidance/latest/data-lake-for-growth-scale/data-lake-for-growth-scale.pdf

137
Então como
criar a sua
jornada de
Analytics
NA nuvem

138
CLOUD COMPUTING
Marcello Zillo Neto
www.linkedin.com/in/mzillo/

OBRIGADO
ANALYTICAL HIERARCHY
PROCESS (AHP)

Prof. Dr. Marcos dos Santos


ESTRUTURAÇÃO E
MODELAGEM MATEMÁTICA
COM O MÉTODO AHP

Prof. Dr. Marcos dos Santos


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

3
AGRADECIMENTO

4
INTRODUÇÃO
(Tomada de Decisão)

5
O QUE É PESQUISA OPERACIONAL?

Operational research (OR) is a scientific approach to the solution of problems in the


management of complex systems that enables decision makers to make better decisions.

Most of the problems OR tackles are messy and complex, often involving considerable
uncertainty. OR uses advanced analytics, modelling, problem structuring, simulation,
optimization and data science to determine the best solution to the problem and the best
practical course of action.
6
AS ÁREAS DA PESQUISA OPERACIONAL

Apoio Análise
Ciência de Teoria das
Multicritério Envoltória
Dados Filas
à Decisão de Dados

P. Linear Simulação a
Programação Teoria dos
Eventos Estatística
Matemática Grafos
P. Inteira Discretos

7
TOMADA DE DECISÃO

Uma decisão precisa ser tomada sempre que


estamos diante de um problema que possui
mais de uma alternativa para sua solução.
Mesmo quando, para solucionar um problema,
possuímos uma única ação a tomar, temos as
alternativas de tomar ou não essa ação.

8
TOMADA DE DECISÃO

O processo de decisão requer a


existência de um conjunto de alternativas
factíveis para sua composição, em que
cada decisão tem associados um ganho e
uma perda.

9
MÉTODOS MULTICRITÉRIO

Critério 1

Alternativa 1

Critério 2

Alternativa 2

Solução do
Critério 3
Problema

Alternativa 3

Critério 4

Alternativa 4

Critério 5

10
MÉTODOS MULTICRITÉRIO
Problemas de tomada de decisão multicritério (do inglês, Multi-Criteria
Decision Making, abreviado por MCDM) são caracterizados por uma Matriz
de Decisão, que é composta de alternativas e critérios ponderados de
acordo com o tomador de decisão em questão. Métodos para solucionar
problemas MCDM têm sido amplamente utilizados para selecionar a
melhor alternativa entre um número finito de alternativas. Como
exemplo de métodos, podemos citar AHP, ANP, PROMETHEE, THOR,
SAPEVO e TOPSIS.

TOPSIS THOR SAPEVO-M

AHP PROMETHEE ELECTRE

11
MATRIZ DE DECISÃO

12
MÉTODO AHP
(Analytic Hierarchy Process)

13
MÉTODO AHP

O Analytic Hierarchy Process (AHP) é um método para auxiliar às


pessoas na tomada de decisões complexas. Mais do que determinar
qual a decisão correta, o AHP ajuda as pessoas a escolher e a
justificar a sua escolha. Baseado em matemática e psicologia, ele foi
desenvolvido na década de 1970 pelo Prof. Thomas Saaty, então na
Escola Wharton da Universidade da Pensilvânia.

14
MÉTODO AHP

O AHP é um método de tomada de decisão multicritério simples


de usar e flexível. Permite a avaliação de problemas complexos,
baseados em critérios conflitantes entre si. É adequado para
diferentes problemáticas, uma vez que a mesma dependa da
interação humana para conduzir o processo de comparação. Entre
as vantagens de usar AHP como modelo de análise decisória, é a
viabilização de considerar diferentes níveis de importâncias entre as
variáveis.

15
MÉTODO AHP NO MUNDO

16
MÉTODO AHP NO MUNDO

Ali Emrouznejad and Marianna Marra. The state of the art development of AHP (1979–2017): a literature review with a social network analysis.
International Journal of Production Research, 2017.
17
MÉTODO AHP

Objetivo
Baseando-se nos modelos de Apoio Estratégico

Multicritério à Decisão (AMD), o método


AHP baseia-se em uma análise hierárquica
das variáveis. Neste modelo, um conjunto
Critério 1 Critério 2 Critério 3 Critério n
de alternativas é avaliado segundo as
preferências do agente decisor quanto aos
critérios de influência, buscando uma
alternativa favorável para o alcance
eficiente do objetivo estratégico. Alternativa 1 Alternativa 2 Alternativa n

18
MÉTODO AHP

Objetivo
Baseando-se nos modelos de Apoio Estratégico

Multicritério à Decisão (AMD), o método


AHP baseia-se em uma análise hierárquica
das variáveis. Neste modelo, um conjunto
Critério 1 Critério 2 Critério 3 Critério n
de alternativas é avaliado segundo as
preferências do agente decisor quanto aos
critérios de influência, buscando uma
alternativa favorável para o alcance
eficiente do objetivo estratégico. Alternativa 1 Alternativa 2 Alternativa n

19
MÉTODO AHP

Uma das principais características do método é a


viabilização de trabalhar com questões subjetivas
quanto as atribuições de desempenho das variáveis do
Variável Variável Variável Variável
problema. Simplificando, na aplicação do método AHP,
Variável
não é necessário definir um número preciso quanto ao
Variável
desempenho de uma alternativa em um dado critério,
Variável
onde uma atribuição verbal já satisfaz o modelo. As
Variável
atribuições do método AHP são realizadas com base em
uma escala proposta por Thomas Saaty.

20
MÉTODO AHP

Escala de Saaty
Grau de
Relação de Importância Recíproca
Importância
Igualdade 1 1
Intermediário 2 1/2
Importância moderada 3 1/3
Intermediário 4 1/4
Mais importante 5 1/5
Intermediário 6 1/6
Muito mais importante 7 1/7
Intermediário 8 1/8
Extremamente mais importante 9 1/9
21
MÉTODO AHP

A B C

B
Grau de
Relação de Importância Recíproca
Importância
C
Igualdade 1 1
Intermediário 2 1/2
Importância moderada 3 1/3
A avaliação é realizada par a par entre Intermediário 4 1/4
as variáveis (critérios/alternativas) Mais importante 5 1/5
Intermediário 6 1/6
Muito mais importante 7 1/7
Intermediário 8 1/8
Extremamente mais importante 9 1/9

22
MÉTODO AHP

A B C

A 5
B
Grau de
Relação de Importância Recíproca
Importância
C
Igualdade 1 1
Intermediário 2 1/2
Importância moderada 3 1/3
A avaliação é realizada par a par entre Intermediário 4 1/4
as variáveis (critérios/alternativas) Mais importante 5 1/5
Intermediário 6 1/6
Muito mais importante 7 1/7
Intermediário 8 1/8
Neste caso A é mais importante que B Extremamente mais importante 9 1/9

23
MÉTODO AHP

A B C

A 5 7
B
Grau de
Relação de Importância Recíproca
Importância
C
Igualdade 1 1
Intermediário 2 1/2
Importância moderada 3 1/3
A avaliação é realizada par a par entre Intermediário 4 1/4
as variáveis (critérios/alternativas) Mais importante 5 1/5
Intermediário 6 1/6
Muito mais importante 7 1/7
Intermediário 8 1/8
Neste
Nestecaso A éAmuito
caso mais
é mais importante
importante queBC
que Extremamente mais importante 9 1/9

24
MÉTODO AHP

A B C

A 5 7
B 3 Grau de
Relação de Importância Recíproca
Importância
C
Igualdade 1 1
Intermediário 2 1/2
Importância moderada 3 1/3
A avaliação é realizada par a par entre
Intermediário 4 1/4
as variáveis (critérios/alternativas) Mais importante 5 1/5
Intermediário 6 1/6
Muito mais importante 7 1/7
Intermediário 8 1/8
Extremamente mais importante 9 1/9
Neste
Neste casocaso A é importância
B possui muito mais moderada
importantequanto
que Cà C

25
MÉTODO AHP

A B C

A 5 7
B 1/5 3 Grau de
Relação de Importância Recíproca
Importância
C 1/7 1/3
Igualdade 1 1
Intermediário 2 1/2
Importância moderada 3 1/3
A avaliação é realizada par a par entre Intermediário 4 1/4
as variáveis (critérios/alternativas) Mais importante 5 1/5
Intermediário 6 1/6
Muito mais importante 7 1/7
Intermediário 8 1/8
Extremamente mais importante 9 1/9

26
MÉTODO AHP
(Consistência das Atribuições)

27
MÉTODO AHP

A B C Transitividade:
A 5 7
B 1/5 3
C 1/7 1/3
Se A > B e B > C , então: A > C.

Para ∀ A, B e C ∈ R.

No método AHP, há uma pequena tolerância


para inconsistências.

28
MÉTODO AHP

A B C Transitividade:
A 5 7
B 1/5 3
C 1/7 1/3
Se A > B e B > C , então: A > C.

Para ∀ A, B e C ∈ R.

Mas como posso avaliar a


consistência das atribuições?

29
MÉTODO AHP

A B C

A 5 7 Teste de Consistência:

B 1/5 3
C 1/7 1/3 O AHP viabiliza calcular uma razão de
consistência (CR) mediante a comparação do
Índice de Consistência (CI) das atribuições do
decisor quanto a um índice de consistência de
uma matriz aleatória (RI).

Valores de RI: Saaty fornece os valores de RI conforme a


indicação abaixo:

Ordem da Matriz 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
RI 0 0 0,58 0,9 1,12 1,24 1,32 1,41 1,45 1,49 1,51 1,48 1,56 1,57 1,59

30
MÉTODO AHP

Onde:
Teste de Consistência:
(λ𝑚á𝑥 −𝑛)
𝐶. 𝐼. =
(𝑛−1)
O AHP viabiliza calcular uma razão de
𝐶.𝐼. consistência (CR) mediante a comparação do
𝐶. 𝑅. = Índice de Consistência (CI) das atribuições do
𝑅.𝐼.
decisor quanto a um índice de consistência de
uma matriz aleatória (RI).

Valores de RI: Saaty fornece os valores de RI conforme a


indicação abaixo:

Ordem da Matriz 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
RI 0 0 0,58 0,9 1,12 1,24 1,32 1,41 1,45 1,49 1,51 1,48 1,56 1,57 1,59

31
MÉTODO AHP
(Processo Geral do Modelo)

32
ESTRUTURA AXIOMÁTICA

Definição do conjunto de critérios e alternativas


Crit 1 Crit 2 ... Crit n
Alt 1 𝑎11 𝑎12 ... 𝑎1𝑛
Alt 2 𝑎21 𝑎22 ... 𝑎2𝑛
... ... ... ... ...
Alt n 𝑎𝑛1 𝑎𝑛2 ... 𝑎𝑛𝑛

Construção da matriz de avaliação


composta pelo conjunto de alternativas e
critérios em avaliação

33
ESTRUTURA AXIOMÁTICA

Definição do conjunto de critérios e alternativas


▪ Atribuição dos julgamentos de
importância entre os critérios;
Avaliação dos critérios
▪ Teste de consistência das atribuições;

▪ Procedimento algébrico para obtenção


do vetor prioridade e pesos dos
critérios (𝑤𝑗 ).

Obtenção das prioridades dos critérios

34
ESTRUTURA AXIOMÁTICA

Definição do conjunto de critérios e alternativas

▪ Atribuição dos julgamentos de


importância entre as alternativas em
Avaliação dos critérios cada critério;

▪ Teste de consistência das atribuições;


Avaliação das alternativas em cada critério
▪ Procedimento algébrico para obtenção
do vetor prioridade para cada
alternativa em cada critério (𝑎𝑖𝑗 ).

Obtenção das prioridades locais das


alternativas em cada critério
35
ESTRUTURA AXIOMÁTICA

Definição do conjunto de critérios e alternativas

▪ Ponderação dos vetores prioridades das


Avaliação dos critérios
alternativas pelos pesos dos respectivos
critérios (𝑤𝑗 𝑎𝑖𝑗 );

Avaliação das alternativas em cada critério ▪ Soma das prioridades (σ 𝑤𝑗 𝑎𝑖𝑗 ).

Processo de agregação das preferências

Obtenção das prioridades globais das


alternativas na problemática

36
AVALIAÇÃO AHP
(Modelo Clássico)

37
ESTRUTURAÇÃO DO PROBLEMA

Comprar um Objetivo Estratégico


Smartphone

Custo Câmera Armazenamento Bateria Critérios

Xiaomi Samsung Iphone Alternativas

38
AVALIAÇÃO DOS CRITÉRIOS

Custo Câmera Armazenamento Design

Primeiramente vamos analisar os


critérios, viabilizando a obtenção de suas
respectivas importâncias.

39
AVALIAÇÃO PAR A PAR DOS CRITÉRIOS

Custo Câmera Armaz. Bateria

Custo 1 ATRIBUIÇÃO

Câmera 1 Grau de
Relação de Importância Recíproca
Importância

Armaz. 1 Igualdade 1 1
Intermediário 2 1/2
Bateria RECÍPROCA 1 Importância moderada 3 1/3
Intermediário 4 1/4
Mais importante 5 1/5
Número de comparações par a Intermediário 6 1/6
par sempre será dada por:
Muito mais importante 7 1/7
𝑛(𝑛 − 1) Intermediário 8 1/8
2 Extremamente mais importante 9 1/9

40
AVALIAÇÃO PAR A PAR DOS CRITÉRIOS

Custo Câmera Armaz. Bateria

Custo

Câmera Grau de
Relação de Importância Recíproca
Importância

Armaz. Igualdade 1 1
Intermediário 2 1/2
Bateria Importância moderada 3 1/3
Intermediário 4 1/4
Mais importante 5 1/5
Intermediário 6 1/6
Muito mais importante 7 1/7
Intermediário 8 1/8
Extremamente mais importante 9 1/9

41
AVALIAÇÃO PAR A PAR DOS CRITÉRIOS

Custo Câmera Armaz. Bateria

Custo 1

Câmera 1 Grau de
Relação de Importância Recíproca
Importância

Armaz. 1 Igualdade 1 1
Intermediário 2 1/2
Bateria 1 Importância moderada 3 1/3
Intermediário 4 1/4
Mais importante 5 1/5
Intermediário 6 1/6
Muito mais importante 7 1/7
Intermediário 8 1/8
Extremamente mais importante 9 1/9

42
AVALIAÇÃO PAR A PAR DOS CRITÉRIOS

Custo Câmera Armaz. Bateria

Custo 1 3

Câmera 1/3 1 Grau de


Relação de Importância Recíproca
Importância

Armaz. 1 Igualdade 1 1
Intermediário 2 1/2
Bateria 1 Importância moderada 3 1/3
Intermediário 4 1/4
Mais importante 5 1/5
Intermediário 6 1/6

O Custo tem importância Muito mais importante 7 1/7


moderada quanto à câmera. Intermediário 8 1/8
Extremamente mais importante 9 1/9

43
AVALIAÇÃO PAR A PAR DOS CRITÉRIOS

Custo Câmera Armaz. Bateria

Custo 1 3 5

Grau de
Câmera 1/3 1 Relação de Importância Recíproca
Importância
Igualdade 1 1
Armaz. 1/5 1
Intermediário 2 1/2
Bateria 1 Importância moderada 3 1/3
Intermediário 4 1/4
Mais importante 5 1/5
Intermediário 6 1/6

O Custo é mais importante que o Muito mais importante 7 1/7


armazenamento. Intermediário 8 1/8
Extremamente mais importante 9 1/9

44
AVALIAÇÃO PAR A PAR DOS CRITÉRIOS

Custo Câmera Armaz. Bateria

Custo 1 3 5 7

Câmera 1/3 1 Grau de


Relação de Importância Recíproca
Importância

Armaz. 1/5 1 Igualdade 1 1


Intermediário 2 1/2
Bateria 1/7 1 Importância moderada 3 1/3
Intermediário 4 1/4
Mais importante 5 1/5
Intermediário 6 1/6

O Custo é muito mais importante Muito mais importante 7 1/7


que o design. Intermediário 8 1/8
Extremamente mais importante 9 1/9

45
AVALIAÇÃO PAR A PAR DOS CRITÉRIOS

Custo Câmera Armaz. Bateria

Custo 1 3 5 7

Câmera 1/3 1 3 Grau de


Relação de Importância Recíproca
Importância

Armaz. 1/5 1/3 1 Igualdade 1 1


Intermediário 2 1/2
Bateria 1/7 1 Importância moderada 3 1/3
Intermediário 4 1/4
Mais importante 5 1/5
Intermediário 6 1/6
A Câmera possui importância
Muito mais importante 7 1/7
moderada quanto ao
armazenamento. Intermediário 8 1/8
Extremamente mais importante 9 1/9

46
AVALIAÇÃO PAR A PAR DOS CRITÉRIOS

Custo Câmera Armaz. Bateria

Custo 1 3 5 7

Câmera 1/3 1 3 7 Grau de


Relação de Importância Recíproca
Importância

Armaz. 1/5 1/3 1 Igualdade 1 1


Intermediário 2 1/2
Bateria 1/7 1/7 1 Importância moderada 3 1/3
Intermediário 4 1/4
Mais importante 5 1/5
Intermediário 6 1/6

A câmera é muito mais Muito mais importante 7 1/7


importante que o design. Intermediário 8 1/8
Extremamente mais importante 9 1/9

47
AVALIAÇÃO PAR A PAR DOS CRITÉRIOS

Custo Câmera Armaz. Bateria

Custo 1 3 5 7

Câmera 1/3 1 3 7 Grau de


Relação de Importância Recíproca
Importância

Armaz. 1/5 1/3 1 3 Igualdade 1 1


Intermediário 2 1/2
Bateria 1/7 1/7 1/3 1 Importância moderada 3 1/3
Intermediário 4 1/4
Mais importante 5 1/5
Intermediário 6 1/6
O armazenamento possui importância Muito mais importante 7 1/7
moderada quanto ao design. Intermediário 8 1/8
Extremamente mais importante 9 1/9

48
NORMALIZAÇÃO DOS JULGAMENTOS

Custo Câmera Armaz. Bateria


Design

Custo 1 3 5 7
Custo Câmera Armaz. Bateria
Câmera 0,333
1/3 1 3 7
Custo
Armaz. 1/5
0,2 0,333
1/3 1 3
Câmera
Bateria
Design 0,143
1/7 0,143
1/7 0,333
1/3 1
Armaz.

Σ 1,676 4,476 9,333 18 Bateria

𝑎𝑖𝑗
σ 𝑎𝑖𝑗
49
NORMALIZAÇÃO DOS JULGAMENTOS

Custo Câmera Armaz. Bateria

Custo 1 3 5 7
Custo Câmera Armaz. Bateria
Câmera 0,333 1 3 7
Custo 0,597
Armaz. 0,2 0,333 1 3
Câmera
Bateria 0,143 0,143 0,333 1
Armaz.

Σ 1,676 4,476 9,333 18 Bateria

1 / 1,676 = 0,597
50
NORMALIZAÇÃO DOS JULGAMENTOS

Custo Câmera Armaz. Bateria

Custo 1 3 5 7
Custo Câmera Armaz. Bateria
Câmera 0,333 1 3 7
Custo 0,597
Armaz. 0,2 0,333 1 3
Câmera 0,199
Bateria 0,143 0,143 0,333 1
Armaz.

Σ 1,676 4,476 9,333 18 Bateria

0,333 / 1,676 = 0,199


51
NORMALIZAÇÃO DOS JULGAMENTOS

Custo Câmera Armaz. Bateria

Custo 1 3 5 7
Custo Câmera Armaz. Bateria
Câmera 0,333 1 3 7
Custo 0,597
Armaz. 0,2 0,333 1 3
Câmera 0,199
Bateria 0,143 0,143 0,333 1
Armaz. 0,119

Σ 1,676 4,476 9,333 18 Bateria

0,2 / 1,676 = 0,119


52
NORMALIZAÇÃO DOS JULGAMENTOS

Custo Câmera Armaz. Bateria

Custo 1 3 5 7
Custo Câmera Armaz. Bateria
Câmera 0,333 1 3 7
Custo 0,597
Armaz. 0,2 0,333 1 3
Câmera 0,199
Bateria 0,143 0,143 0,333 1
Armaz. 0,119

Σ 1,676 4,476 9,333 18 Bateria 0,085

0,143 / 1,676 = 0,085


53
NORMALIZAÇÃO DOS JULGAMENTOS

Custo Câmera Armaz. Bateria

Custo 1 3 5 7
Custo Câmera Armaz. Bateria
Câmera 0,333 1 3 7
Custo 0,597 0,670 0,536 0,389
Armaz. 0,2 0,333 1 3
Câmera 0,199 0,223 0,321 0,389
Bateria 0,143 0,143 0,333 1
Armaz. 0,119 0,075 0,107 0,167

Σ 1,676 4,476 9,333 18 Bateria 0,085 0,032 0,036 0,055

54
NORMALIZAÇÃO DOS JULGAMENTOS

Vetor
Custo Câmera Armaz. Bateria
Design Prioridade

Custo 0,597 0,670 0,535 0,389 0,548

Câmera 0,199 0,223 0,321 0,389 0,283

Armaz. 0,119 0,075 0,107 0,167


∴ 0,117 𝑉𝑒𝑡𝑜𝑟 =
σ 𝑎𝑖𝑗
𝑛
Bateria
Design 0,085 0,032 0,035 0,055 0,052

55
AVALIAÇÃO AHP
(Cálculo de Consistência)

56
ANÁLISE DE CONSISTÊNCIA

Custo Câmera Armaz. Bateria


Design

Custo 1 3 5 7

Câmera 0,333
1/3 1 3 7 Vetor Prioridade

Armaz. 1/5
0,2 0,333
1/3 1 3 Custo 0,548

Bateria
Design 0,143
1/7 0,143
1/7 0,333
1/3 1 Câmera 0,283

Armaz. 0,117

Bateria 0,052
Utilizando os vetores de
prioridade, vamos ponderar a
nossa matriz de julgamentos.

57
ANÁLISE DE CONSISTÊNCIA

Vetor
Custo Câmera Armaz. Bateria
Prioridade

Custo 0,548 Custo 1 3 5 7


Câmera 0,333 1 3 7
Câmera 0,283
Armaz. 0,2 0,333 1 3
Armaz. 0,117
Bateria 0,143 0,143 0,333 1
Bateria 0,052
Custo Câmera Armaz. Bateria
Custo 0,548
Câmera 0,182
Armaz. 0,110
Bateria 0,078
58
ANÁLISE DE CONSISTÊNCIA

Vetor Custo Câmera Armaz. Bateria


Prioridade
Custo 1 3 5 7
Custo 0,548
Câmera 0,333 1 3 7
Câmera 0,283 Armaz. 0,2 0,333 1 3
Armaz. 0,117 Bateria 0,143 0,143 0,333 1
Bateria 0,052 Custo Câmera Armaz. Bateria

Custo 0,548 0,849


Câmera 0,182 0,283
Armaz. 0,110 0,094
Bateria 0,078 0,040
59
ANÁLISE DE CONSISTÊNCIA

Vetor Custo Câmera Armaz. Bateria


Prioridade
Custo 1 3 5 7
Custo 0,548
Câmera 0,333 1 3 7
Câmera 0,283 Armaz. 0,2 0,333 1 3
Armaz. 0,117 Bateria 0,143 0,143 0,333 1
Bateria 0,052 Custo Câmera Armaz. Bateria

Custo 0,548 0,849 0,585

Câmera 0,182 0,283 0,351

Armaz. 0,110 0,094 0,117

Bateria 0,078 0,040 0,039


60
ANÁLISE DE CONSISTÊNCIA

Vetor Custo Câmera Armaz. Bateria


Prioridade
Custo 1 3 5 7
Custo 0,548
Câmera 0,333 1 3 7
Câmera 0,283 Armaz. 0,2 0,333 1 3
Armaz. 0,117 Bateria 0,143 0,143 0,333 1
Bateria 0,052 Custo Câmera Armaz. Bateria

Custo 0,548 0,849 0,585 0,364

Câmera 0,182 0,283 0,351 0,364

Armaz. 0,110 0,094 0,117 0,156

Bateria 0,078 0,040 0,039 0,052


61
ANÁLISE DE CONSISTÊNCIA Obtenção do lambda máximo:
"𝑆𝑜𝑚𝑎 𝑑𝑜𝑠 𝑃𝑒𝑠𝑜𝑠"
𝑉𝑒𝑡𝑜𝑟 𝑃𝑟𝑖𝑜𝑟𝑖𝑑𝑎𝑑𝑒

Custo Câmera Armaz. Bateria “Soma dos


Custo Câmera Armaz. Design Pesos”
Custo
Custo 0,548
0,548 0,849
0,849 0,585
0,585 0,364
0,362 2,346 2,346 / 0,548 = 4,281

Câmera
Câmera 0,182
0,182 0,283
0,283 0,351
0,351 0,364
0,362 1,180 1,180 / 0,283 = 4,166

Armaz.
Armaz. 0,110
0,110 0,094
0,094 0,117
0,117 0,156
0,155
Σ 0,477
∴ 0,477 / 0,117 = 4,077

Bateria
Design 0,078
0,078 0,040
0,040 0,039
0,039 0,052
0,052 0,209 0,209 / 0,052 = 4,038

Vetor Prioridade
෍ = 𝟏𝟔, 𝟓𝟔𝟐
Custo 0,548
Câmera 0,283 σ 𝑎𝑖 16,562
λ𝑚á𝑥 = λ𝑚á𝑥 =
4
Armaz. 0,117 𝑛
Bateria 0,052 λ𝑚á𝑥 = 4,14
62
ANÁLISE DE CONSISTÊNCIA

Valores obtidos até o momento:

λ𝑚á𝑥 = 4,14
(4,14 − 4)
R. 𝐼. = 0,9 (Valor indicado por Saaty para 4 variáveis) 𝐶. 𝐼. = = 0,046
(4 − 1)

Temos que obter agora: 0,046


𝐶. 𝑅. = = 0,052
0,9

(λ𝑚á𝑥 − 𝑛)
𝐶. 𝐼. =
(𝑛 − 1) A razão de consistência
manteve-se abaixo dos 10%,
𝐶.𝐼.
𝐶. 𝑅. = sendo favorável, conforme
𝑅.𝐼.
indicado por Saaty.
63
AVALIAÇÃO AHP
(Modelos com Dados Quantitativos)

64
AVALIAÇÃO COM DADOS QUANTITATIVOS

Em grande parte das análises baseadas em modelos


multicritério, é comum possuirmos dados numéricos que
já representam as importâncias relativas das alternativas
em cada critério.

65
AVALIAÇÃO COM DADOS QUANTITATIVOS

Em grande parte das análises baseadas em modelos


multicritério, é comum possuirmos dados numéricos que
já representam as importâncias relativas das alternativas
em cada critério.
Nesta situação, também é possível utilizar o
Método AHP!

66
AVALIAÇÃO COM DADOS QUANTITATIVOS

Custo Armazenamento

Xiaomi R$ 1500,00 Xiaomi 64 Gb

Samsung R$ 1800,00 Samsung 128 Gb

Iphone R$ 5000,00 Iphone 128 Gb

Câmera Duração de Bateria

Xiaomi 12 MP Xiaomi 24h

Samsung 12 MP Samsung 18h

Iphone 20 MP Iphone 10h

67
AVALIAÇÃO COM DADOS QUANTITATIVOS
Processo de normalização
Monotônico de
custo, ou seja,
quanto menor,
melhor!

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 1500 12 64 24h

Samsung 1800 12 128 18h

Iphone 5000 20 128 10h

68
AVALIAÇÃO COM DADOS QUANTITATIVOS
Processo de normalização
1 𝑎𝑖𝑗
Monotônico de 𝑥= υ=
σ 𝑎𝑖𝑗
custo, ou seja, 𝑎𝑖𝑗
quanto menor,
melhor!
Custo Custo Custo

Xiaomi 1500 Xiaomi 0,000667 Xiaomi 0,4687

Samsung 1800 Samsung 0,000556 Samsung 0,3906

Iphone 5000 Iphone 0,000200 Iphone 0,1406

1 Σ 0,001423 0,000667
𝑥𝑋𝑖𝑎𝑜𝑚𝑖 = = 0,000667 υ𝑋𝑖𝑎𝑜𝑚𝑖 = = 0,4687
1500 0,001423
1 0,000556
𝑥𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = = 0,000556 υ𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = = 0,3906
1800 0,001423
1 0,000200
𝑥𝐼𝑝ℎ𝑜𝑛𝑒 = = 0,000200 υ𝐼𝑝ℎ𝑜𝑛𝑒 = = 0,1406
5000 0,001423
69
AVALIAÇÃO COM DADOS QUANTITATIVOS
Processo de normalização
Monotônico de
lucro, ou seja,
quanto maior,
melhor!

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 0,468 12 64 24h

Samsung 0,390 12 128 18h

Iphone 0,140 20 128 10h

70
AVALIAÇÃO COM DADOS QUANTITATIVOS
Processo de normalização
Monotônico de
lucro, ou seja, 𝑎𝑖𝑗
quanto maior, υ=
σ 𝑎𝑖𝑗
melhor!

Câmera Câmera

Xiaomi 12 Xiaomi 0,273

Samsung 12 Samsung 0,273

Iphone 20 Iphone 0,454

Σ 44 12
υ𝑋𝑖𝑎𝑜𝑚𝑖 = = 0,273
44
12
υ𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = = 0,273
44
20
υ𝐼𝑝ℎ𝑜𝑛𝑒 = = 0,454
44
71
AVALIAÇÃO COM DADOS QUANTITATIVOS
Processo de normalização Monotônico de
lucro, ou seja,
quanto maior,
melhor!

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 0,468 0,273 64 24h

Samsung 0,390 0,273 128 18h

Iphone 0,140 0,454 128 10h

72
AVALIAÇÃO COM DADOS QUANTITATIVOS
Processo de normalização
Monotônico de
lucro, ou seja, 𝑎𝑖𝑗
υ=
quanto maior, σ 𝑎𝑖𝑗
melhor!

Armazenamento Armazenamento

Xiaomi 64 Xiaomi 0,2

Samsung 128 Samsung 0,4

Iphone 128 Iphone 0,4

Σ 320 64
υ𝑋𝑖𝑎𝑜𝑚𝑖 = = 0,2
320
128
υ𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = = 0,4
320
128
υ𝐼𝑝ℎ𝑜𝑛𝑒 = = 0,4
320
73
AVALIAÇÃO COM DADOS QUANTITATIVOS
Processo de normalização Monotônico de
lucro, ou seja,
quanto maior,
melhor!

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 0,468 0,273 0,2 24h

Samsung 0,390 0,273 0,4 18h

Iphone 0,140 0,454 0,4 10h

74
AVALIAÇÃO COM DADOS QUANTITATIVOS
Processo de normalização
Monotônico de
lucro, ou seja,
𝑎𝑖𝑗
υ=
quanto maior, σ 𝑎𝑖𝑗
melhor!

Duração de Bateria Duração de Bateria

Xiaomi 24h Xiaomi 0,462

Samsung 18h Samsung 0,346

Iphone 10h Iphone 0,192

Σ 52 24
υ𝑋𝑖𝑎𝑜𝑚𝑖 = = 0,462
52
18
υ𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = = 0,346
52
10
υ𝐼𝑝ℎ𝑜𝑛𝑒 = = 0,192
52
75
AVALIAÇÃO COM DADOS QUANTITATIVOS

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 0,468 0,273 0,2 0,462

Samsung 0,390 0,273 0,4 0,346

Iphone 0,140 0,454 0,4 0,192

76
AVALIAÇÃO COM DADOS QUANTITATIVOS
Processo de agregação

Pesos 0,548 0,283 0,117 0,052

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 0,468 . (0,548) 0,273 . (0,283) 0,200 . (0,117) 0,462 . (0,052)

Samsung 0,390 . (0,548) 0,273 . (0,283) 0,400 . (0,117) 0,346 . (0,052)

Iphone 0,140 . (0,548) 0,454 . (0,283) 0,400 . (0,117) 0,192. (0,052)

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 0,256 0,077 0,023 0,024

Samsung 0,214 0,077 0,047 0,018

Iphone 0,077 0,128 0,047 0,010

77
AVALIAÇÃO COM DADOS QUANTITATIVOS
Resultados

Custo Câmera Armazenamento Bateria Prioridade Final

Xiaomi 0,256 0,077 0,023 0,024 0,381 1º


Samsung 0,214 0,077 0,047 0,018
Σ 0,356 2º
Iphone 0,077 0,128 0,047 0,010 0,262 3º

78
MÉTODO
AHP-GAUSSIANO

79
PROBLEMA REAL DA MARINHA DO BRASIL

80
REFERÊNCIAS

81
REFERÊNCIAS

82
REFERÊNCIAS

83
MÉTODO AHP-GAUSSIANO

O que há de diferente
no AHP-Gaussiano?

84
MÉTODO AHP-GAUSSIANO

O Método AHP-Gaussiano apresenta uma nova


abordagem ao método original, baseada em uma
análise de sensibilidade proveniente do fator
gaussiano.

Com essa abordagem é possível obter os pesos dos


critérios mediante as entradas quantitativas das
alternativas em cada critério em análise, ou seja, a
partir dos dados da própria matriz de decisão.

85
MÉTODO AHP-GAUSSIANO

Um dos pontos de destaque do novo modelo


relaciona-se a redução do esforço cognitivo do decisor,
a partir do momento em que não é mais necessário a
avaliação par a par entre os critérios para obtenção de
seus respectivos pesos.

Entretanto, vale ressaltar, que a viabilidade do


modelo só é satisfeita em cenários em que as alternativas
possuam entradas cardinais nos critérios em análise.

86
...UTILIZANDO O EXEMPLO ANTERIOR

Custo Armazenamento

Xiaomi R$ 1500,00 Xiaomi 64 Gb

Samsung R$ 1800,00 Samsung 128 Gb

Iphone R$ 5000,00 Iphone 128 Gb

Câmera Duração de Bateria

Xiaomi 12 MP Xiaomi 24h

Samsung 12 MP Samsung 18h

Iphone 20 MP Iphone 10h

87
VAMOS CONSIDERAR VALORES JÁ NORMALIZADOS

Etapa 1 – Determinação da Matriz de Decisão

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 1200 12 64 24h

Samsung 1500 12 128 18h

Iphone 5000 20 128 10h

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 0,468 0,273 0,2 0,462

Samsung 0,390 0,273 0,4 0,346

Iphone 0,140 0,454 0,4 0,192


88
MÉTODO AHP-GAUSSIANO

Etapa 2 – Cálculo da média das alternativas em cada critério

Xiaomi Samsung Iphone Média

Custo 0,468 0,390 0,140 0,3333

Câmera 0,273 0,273 0,454 0,3333

Armazenamento 0,2 0,4 0,4 0,3333

Bateria 0,462 0,346 0,192 0,3333

89
MÉTODO AHP-GAUSSIANO

Etapa 3 – Cálculo do desvio padrão dos critérios


com base na amostra das alternativas

Xiaomi Samsung Iphone Desvio Padrão

Custo 0,468 0,390 0,140 0,1714

Câmera 0,273 0,273 0,454 0,1045

Armazenamento 0,2 0,4 0,4 0,1155

Bateria 0,462 0,346 0,192 0,1354

σ𝑛𝑖=1(𝑥𝑖 − 𝑥)²
ҧ Obs: vejam a importância da
𝜎= Estatística em todas as áreas da DS!
𝑛−1

90
MÉTODO AHP-GAUSSIANO

Etapa 4 – Cálculo do fator gaussiano para cada critério

Média Desvio Padrão Fator Gaussiano Fator Gaussiano


Normalizado
Custo 0,3333 0,1714 0,5142
0,3254
Câmera 0,3333 0,1045 0,3135
0,1984
Armazenamento 0,3333 0,1155 0,3465 0,2192
Bateria 0,3333 0,1354 0,4062 0,2570

𝜎
𝐹𝑎𝑡𝑜𝑟 𝐺𝑎𝑢𝑠𝑠𝑖𝑎𝑛𝑜 =
𝑥ҧ

91
MÉTODO AHP-GAUSSIANO

Etapa 5 – Ponderação da matriz de decisão

Pesos 0,3254 0,1984 0,2192 0,2570

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 0,468 . (0,3254) 0,273 . (0,1984) 0,200 . (0,2192) 0,462 . (0,2570)

Samsung 0,390 . (0,3254) 0,273 . (0,1984) 0,400 . (0,2192) 0,346 . (0,2570)

Iphone 0,140 . (0,3254) 0,454 . (0,1984) 0,400 . (0,2192) 0,192 . (0,2570)

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 0,152 0,054 0,044 0,119

Samsung 0,127 0,054 0,088 0,089

Iphone 0,046 0,090 0,088 0,049

92
MÉTODO AHP-GAUSSIANO

Etapa 6 – Obtenção do Ranking

Custo Câmera Armazenamento Duração de Bateria Soma das Ponderações

Xiaomi 0,152 0,054 0,044 0,119 0,369

Samsung 0,127 0,054 0,088 0,089 0,358

Iphone 0,046 0,090 0,088 0,049 0,273

93
MÉTODO AHP-GAUSSIANO

Etapa 7 – Obtenção do novo ranking

AHP-Gaussiano Ranking AHP

Xiaomi 0,369 1º 0,381

Samsung 0,358 2º 0,356

Iphone 0,273 3º 0,262

94
O MÉTODO ESTÁ SENDO UTILIZADO NO BRASIL E NO MUNDO

95
O MÉTODO ESTÁ SENDO UTILIZADO NO BRASIL E NO MUNDO

96
APLICAÇÃO DO MÉTODO EM PROBLEMAS REAIS

97
APLICAÇÃO DO MÉTODO EM PROBLEMAS REAIS

98
APLICAÇÃO DO MÉTODO EM PROBLEMAS REAIS

99
APLICAÇÃO DO MÉTODO EM PROBLEMAS REAIS

100
APLICAÇÃO DO MÉTODO EM PROBLEMAS REAIS

101
APLICAÇÃO DO MÉTODO EM PROBLEMAS REAIS

102
Mão na massa!
103
FERRAMENTA COMPUTACIONAL

Custo Câmera Armazenamento Duração de Bateria

Xiaomi 1200 12 64 24h

Samsung 1500 12 128 18h

Iphone 5000 20 128 10h

104
PROBLEMA: SELECIONAR UM INSTRUTOR

105
FERRAMENTA COMPUTACIONAL

106
FERRAMENTA COMPUTACIONAL

107
FERRAMENTA COMPUTACIONAL

https://marcosdossantos.shinyapps.io/gaussian_ahp/
108
MODELANDO UM PROBLEMA “DO ZERO”

109
APLICAÇÕES DA PESQUISA OPERACIONAL

110
APLICAÇÕES DA PESQUISA OPERACIONAL

111
STRENGTHS DO MÉTODO

1. Método novo (estado da arte);


2. Fácil de entender (distância da média);
3. Fácil de usar (só preencher a Matriz de Decisão);
4. Possibilidade de trabalhar com um grande volume de dados
(muitas alternativas e muitos critérios);
5. Exige menor esforço cognitivo por parte do decisor (não
trabalha com comparações paritárias);
6. Ferramenta computacional que realiza todos os cálculos do
método;
7. Aplicável em inúmeros problemas gerenciais do cotidiano, de
pequena, média e alta complexidade.
112
Aprendi o Método AHP de Thomas Saaty.

Aprendi o Método AHP-Gaussiano.

Aprendi os Métodos AHP e AHP-Gaussiano


Utilizando Excel e R.

113
OBRIGADO
https://www.linkedin.com/in/profmarcosdossantos/
SOCIAL NETWORK ANALYSIS
Prof.ª Adriana Silva

1
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
Conteúdo Programático
Tópicos:

• O que é SNA • Conceitos e teoria • Cálculos na mão para • Comunidade


• Para que serve sobre a técnica entendimento das • Resolution List
• métricas
• Como aplica Tipo de redes
• • Aplicação em Gephi,
• Estrutura de dados • Comunidades Métricas de
Centralidade
para entendimento
e compreensão
• Papéis • Degree • R para SNA
• Influence
• Exercícios
• Clustering
Coeficient
• Closeness
• Betweenness

3
Introdução ao SNA
• Social Network Analysis

• Customer Link Analysis

• O poder do conhecimento
dos relacionamentos...

4
• Não é referente ao Facebook ou mídias sociais

• É uma análise baseada em interações


(ligações, SMS, 3G, etc.)
• Diferenciadas pelo número e natureza das
ligações a outros.

5
Social Network Analysis

O SNA permite, por exemplo, aos analistas de marketing melhorarem a


visão do cliente, através da identificação e incorporação de relações de
consumo (e seus atributos) e sua força, em perfis e segmentação.
Os usuários podem:
• Usar em análises de clientes como Métricas da Rede, para melhorar a eficácia da campanha
• Churn detecção / prevenção
• Up-sell e cross-sell
• Entender melhor como os produtos / serviços são adotados dentro da rede (ou seja, o marketing
viral)

6
Grafo

7
O que é SNA?
• Social Network Analysis é o estudo das estruturas sociais compostas por:
• nós (geralmente indivíduos ou entidades) que são ligados
• (links) por um ou mais tipos de interdependência, como emails, contatos telefônicos, transações
financeiras, endereço, etc.

Area de influência do líder

Líder

Seguidor

Outlier

8
SNA: as origens

• Teoria dos “Seis Graus de


Separação”, Stanley Milgram

9
Laços Sociais:

• Os nós de uma Rede Social são os elementos que compõem uma dada população.
• O link entre dois nós define a interação entre eles, determinados através de “evidências”.
• O estudo de todos os links entre os nós nos permite medir a estrutura e nível de atividade de uma
população.
• Conhecendo-se a forma como os indivíduos estão inter-relacionados, nos propicia uma sólida base
analítica para compreensão de seus comportamentos, oportunidades, limitações, etc.

EXEMPLOS DE EVIDÊNCIAS DE LAÇOS SOCIAIS:


e-mails
A→B Contas de telefone (CDR) A B
directed undirected
Endereços
Transações financeiras

10
Aplicações do SNA

Aplicação 1– Segmentação
Funcionalidade: Ação de Marketing: Benefícios:

• Pontuar clientes segundo • Melhorar esquemas de • Estratégias de


seus status na rede e links segmentação além da “tratamento” mais
rentabilidade, ciclo de adequado a clientes
vida, demografia, etc) baseadas nas redes sociais

• Marketing mais eficiente

11
Aplicações do SNA

Aplicação 2a – Retenção de “Líderes”


Funcionalidade: Ação de Marketing: Benefícios:

• Indentificar “Líderes” • Estratégias de retenção para • Mais eficiência nos gastos


os líderes-chave de Marketing

• Redução do churn / maior


retenção

12
Aplicações do SNA

Aplicação 2b – Retenção de “Seguidores”


Funcionalidade: Ação de Marketing: Benefícios:

• Detectar quando um • Estratégias de retenção para • Eficiência nos gastos de


líder pode “abandonar” os seguidores em risco Marketing
• Redução do churn / maior
retenção

13
Aplicações do SNA

Aplicação 3 – Cross-sell em Líderes – Efeito Viral


Funcionalidade: Ações de Marketing: Benefícios:

• Identificar líderes e • Estratégias de cross / up-sell • Racionaliza gastos,


entender melhor a para os líderes primeiro, principalmente em
adoção de novidades alavancando a adoção viral subsídios

14
Aplicações do SNA

Aplicação 4 – Melhor seleção em Aquisição


Funcionalidade: Ações de Marketing: Benefícios:

• Determinar e • Estratégias de aquisição • Atrair líderes e


compreender o perfil dos alavancando o poder seguidores dentro de
líderes target influenciador dos líderes suas comunidades

15
Conceitos do SNA

Papéis dos
Tipos de redes Comunidades indivíduos
dentro da rede

16
Conceitos do SNA
Tipos de redes

As redes podem ser directed ou undirected


• Undirected links significa que não existe distinção entre dois vértices associados
com cada link, ou seja, não existe direção na relação do link que conecta dois
links.
• Directed link significa que existe direção mas relações entre os nós. Se o A liga 100
vezes para B

17
Conceitos do SNA
Comunidades

• Um dos objetivos mais importantes na análise de redes é a detecção de estruturas


conhecidas como Comunidades.
• Estas são definidas, de forma intuitiva, como grupos de nós que estão mais
fortemente ligados entre si do que são para o resto da rede.

Aplicação:
Comunidades Internas – quando a predominância é da minha marca.
Comunidade Externa – quando a predominância é de alguma concorrência.

18
Conceitos do SNA
Papéis e métricas individuais

Seguidores
Community

Marginais
Poucas conexões
Bridge Comunidade
Outlier conectores de
diferentes
Líder comunidades

• Cada nó desempenha um papel dentro de sua comunidade


• Cada nó tem diversas métricas de relacionamento, como centralidade, número
de conexões, etc.
19
Conceitos do SNA
Papeis e métricas individuais

Regra Descrição Visualização


É o número telefônico dentro de uma comunidade que possui
uma conectividade recíproca com outros números telefônicos
Líder dentro da mesma comunidade. É o nó por onde se percorre o
menor caminho dentro da comunidade (ponto central).

É o número telefônico que possui comportamento similar ao


Seguidor líder, mas de menor magnitude. Deve ter conexão direta com
o líder.

Marginal Indivíduo com um perfil similar ao seguidor, mas não é


1 próximo ao líder.

Marginal Mantém-se à margem da comunidade. Não possui nenhuma


característica dos outros papéis. Possui baixa proximidade e
2 escassas relações recíprocas.

20
Conceitos do SNA
Visão Estática versus Visão Dinâmica
As comunidades e seus membros podem mudar ao longo do tempo

t t+1

▪ SNA ajuda a direcionar estas mudanças:


▪ Ações em comunidades mudam comunidades
▪ Ações em papéis mudam papéis individualmente ou eventos de influência

21
Processo de SNA (sugestão):
“passo a passo”
Explorar
informação
existente 1
3 4
Extração de Determinar Detectar
dados A→B links e forças comunidades
▪ Rede inteira

2 ▪ Comunidades

6 Aplicar
5
Qualificar Estipular métricas ▪ Rede inteira
Comunidades “papéis” SNA ▪ Comunidades
▪ “Atores”

Results 7
22
Aplicações

23
Métricas de Centralidade

• Centralidade
• Medidas de centralidade fornecem métricas de importância de um nó em uma rede.
• Dentre elas estão:
• Degree (Grau)
• Degree Ponderado (Grau Ponderado)
• Clustering Coefficient
• Closeness (centralidade de proximidade)
• Betweenness (centralidade de intermediação)

24
Métricas de Centralidade
Degree - Centralidade

• Degree (Grau)
• Medida referente a quantidade de links que um determinado nó possui (para uma rede
undirected)
• Para uma rede Directed, out-degree refere-se a quantidade de links que saem de um determinado
nó, in-degree é o número de links que o mesmo nó recebe. E degree é a soma do in-degree com o
out-degree do referido nó.

25
Métricas de Centralidade
Grau Ponderado - Centralidade

• Degree Ponderado (Grau Ponderado)


• É uma generalização do degree que leva em conta o peso dos links (quando existente).

26
Métricas de Centralidade
Clustering Coefficient - Centralidade

• Clustering Coefficient
• O clustering coefficient para um nó é o número de ligações entre os seus nós vizinhos, dividido
pelo número de links que poderia existir entre eles.
• Medida que nos diz como os vizinhos estão conectados e não o próprio nó.

|{ 𝑢, 𝑣 ∈ 𝐴 ∶ 𝑢, 𝑣 ∈ 𝛿𝑖 |
𝐶 𝑖 =
|𝛿𝑖 |(|𝛿𝑖 | − 1)

27
Métricas de Centralidade
Clustering Coefficient – Centralidade
• Exemplo 𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙𝑒𝑠 3
𝐶 𝐴 = = =1
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 3

28
Métricas de Centralidade
5 1
8-
Clustering Coefficient – Centralidade
• Exemplo . 0 9
3
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠7𝑒𝑛𝑡𝑟𝑒
2
𝐶 𝐴 =
1 5 . 𝑒𝑙𝑒𝑠 3
= =1

a 3
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 3
𝐶 i𝐵d = = 1
3

osh 3
i Y
u sh
Ats
elo
ar c
M

29
Métricas de Centralidade
5 1
8-
Clustering Coefficient – Centralidade
• Exemplo . 0 9
.2 73
𝐶 𝐴 =
31 5
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙𝑒𝑠 3
= =1

i d a 3
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 3

osh𝐶 𝐵 = =1
i Y 3

u sh 𝐶 𝐶 =
3
=1
Ats 3

elo
ar c
M

30
Métricas de Centralidade
5 1
8-
Clustering Coefficient – Centralidade
• Exemplo . 0 9
.2 73
𝐶 𝐴 =
31 5
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙𝑒𝑠 3
= =1

i d a 3
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 3

osh𝐶 𝐵 = =1
i Y 3

u sh 𝐶 𝐶 =
3
=1
Ats 3
3
elo 𝐶 𝐷 = =1

ar c 3

31
Métricas de Centralidade
5 1
Clustering Coefficient – Centralidade
0 9 8-
• Exemplo 2 73 .
5 .2
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙𝑒𝑠 1

31
𝐶 𝐴 = = 3 =0,333
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠

i d a
sh
i Yo
u sh
Ats
elo
ar c
M

32
Métricas de Centralidade
5 1
Clustering Coefficient – Centralidade
0 9 8-
• Exemplo 2 73 .
5 .2
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙𝑒𝑠 1
= 3 =0,333
𝐶 𝐴 =
3 1
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠
𝐶 𝐵 =0
i d a
osh
i Y
u sh
Ats
elo
ar c
M

33
Métricas de Centralidade
Clustering Coefficient – Centralidade 5 1
• Exemplo 2 0 9 8-
73 .
.2
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙𝑒𝑠 1
5
31
𝐶 𝐴 = = = 0,333
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 3

i
𝐶 𝐵 =0d a
sh
Yo
𝐶 𝐶 =1

sh i
ts u
o A
c el
M ar

34
Métricas de Centralidade
Clustering Coefficient – Centralidade
5 1
• Exemplo 2 0 9 8-
73 .
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙𝑒𝑠 1
𝐶 𝐴 =
5 .2 = = 0,333
𝑞𝑢𝑎𝑛𝑡𝑎𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑙𝑖𝑔𝑎çõ𝑒𝑠 3
𝐶 𝐵 = 0 31
d
𝐶 𝐶 i=
a1
sh
i Yo𝐶 𝐷 = 1
u sh
Ats
elo
ar c
M

35
Métricas de Centralidade
Clustering Coefficient
5 1
• Exemplo 3 0 9 8-
73 .
5 .2
3𝐶1 𝐴 = 0
ida
𝐶 𝐵 =0
sh 𝐶 𝐶 =0

i Yo 𝐶 𝐷 =0

u sh
Ats
elo
ar c
M

36
Métricas de Centralidade
Closeness - Centralidade
• Closeness Centrality (Centralidade de Proximação)
• A métrica closeness é uma medida de proximidade. É a média de caminho mais curtos para
chegar em outro indivíduo. Proximidade pode ser considerada como uma medida do tempo que
seria necessário para difundir uma informação a partir de um dado nó para os outros nós na rede.
• Distância média do nó em questão para todos os demais nós

𝑁 −1
𝐶𝐶 𝑢 = 𝑁 𝑁
σ𝑣∈𝑁\𝑢 𝑑𝑢𝑣 + 𝑑𝑣𝑢 ൘
2
𝑁 =ቊ 𝑑𝑢𝑣 , 𝑠𝑒 𝑑𝑢𝑣 < ∞
sendo 𝑑𝑢𝑣
𝑁 , 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
onde 𝑑𝑢𝑣 é o caminho mais curto entre o nó 𝑢 e 𝑣.
37
Métricas de Centralidade
Betweenness - Centralidade

• Betweenness (Centralidade de Intermediação)


• A métrica Betweenness conta o número de vezes que um nó particular ocorre nos menores
caminhos entre outros nós. Nós com grandes betweenness são como os “porteiros” da
informação. Como estão nos caminhos mais curtos, são os “conduzintes” (ou “manipuladores”)
da informação.
• Betweenness mede a frequência com que o nó aparece nos caminhos mais curtos entre os nós.

𝜎𝑠𝑡 (𝑢)
𝐶𝑏 𝑢 = ෍
𝜎𝑠𝑡
𝑠≠𝑢≠𝑡∈𝑁
𝑠≠𝑡

onde 𝜎𝑠𝑡 é o número de caminhos


e 𝜎𝑠𝑡 (𝑢) é o número de caminhos curtos entre 𝑠 e 𝑡 passando por 𝑢
38
Métricas da Rede
Estatísticas Gerais

• Diversas estatísticas podem ser calculadas para as redes e para os nós das redes :
• Nós: número de nós no gráfico (|N|)
• Arestas: número de links no gráfico (|A|)
• Densidade do grafo: o número de links em um gráfico (|A|) dividido pelo número total de links no gráfico
completo (|N| (|N| - 1))
• Comprimento médio do caminho: soma dos menores caminhos dividido pela quantidade de menores
caminhos
• Excentricidade: distância do nó em questão até o nó mais distante dele na rede (dentre os menores
caminhos, o maior)
• Raio: menor excentricidade
• Diâmetro da Rede: maior excentricidade (maior peso dentre os menores caminhos)

39
Referências Bibliográficas

• PINHEIRO, C. A. R. Social Network Analysis in Telecommunications. USA: John Wiley, 2011, 284 p.

• NEWMAN, M. E. J. Networks: An Introduction. New York: Oxford, 2010, 772 p.

40
MUITO OBRIGADA!
Prof.ª Adriana Silva
linkedin.com/in/adrianamms

41
SOCIAL NETWORK
ANALYSIS

Profa. Adriana Silva


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98

2
Conteúdo Programático
Tópicos:

• O que é SNA • Conceitos e teoria • Cálculos na mão • Comunidade


• sobre a técnica para entendimento
Para que serve
das métricas • Resolution List
• Como aplica • Tipo de redes
• • Layouts
• Estrutura de • Comunidades Métricas de
Centralidade
dados • • Aplicação em Gephi,
Papéis • Degree para entendimento e
• Clustering compreensão
Coeficient
• R para SNA
• Closeness
• Exercícios
• Betweenness

3
Revisando

• Métricas
• Degree
• O que é? • Degree Ponderado

• Dados/informações •
Clustering Coefficient
Closeness
• Contexto / Exemplos • Betweenness
• Nós
• Tipos de Redes • Arestas

• Comunidades

Densidade do grafo
Comprimento médio do caminho
• Papéis • Excentricidade
• Raio
• Diâmetro da Rede

4
Processo de SNA (sugestão):
“passo a passo”
Explorar
informação
existente 1
3 4
Extração de Determinar Detectar
dados A→B links e forças comunidades

2 ▪ Rede inteira
▪ Comunidades

6 Aplicar
5
Qualificar Estipular métricas ▪ Rede inteira
Comunidades “papéis” SNA ▪ Comunidades
▪ “Atores”

Results 7
5
Gephi
Software Livre

• “Gephi é uma plataforma interativa de visualização e exploração de todos os


tipos de redes e sistemas complexos, grafos dinâmicos e hierárquicos.”
• É um software escrito em Java e roda tanto no Windows, Linux e Mac.

▪ Atividade:
▪ Inicializar o software
▪ Conhecer o software
▪ Construir a rede feita à mão
▪ Extrair os resultados

6
Software Gephi
Introdução

▪ O passo a passo a seguir detalha como utilizar o Gephi


a partir de bases csv, ou para criação de redes dentro
do próprio software.

7
Software Gephi
1

2 3 4

7 9

8
Software Gephi
Introdução

1. Tool Bar: atalhos para análises,


visualizações de janelas, configurações, salvar, ...
2. Visão Geral: onde visualiza-se o gráfico e as métricas que
podem ser calculadas
3. Laboratório de dados: onde visualiza-se as tabelas criadas
4. Visualização: onde visualiza-se o grafo para exportação
5. Partição ou Classificação: janela onde pode-se pintar ou
estipular tamanhos de nós ou links, a partir de alguma métrica
(como modularidade, degree, closeness,…)
6. Layout: janela para melhorar a forma de visualização do grafo
baseado em algum algorítimo
9
Software Gephi
Introdução

7. Grafo: janela para visualização da sua rede


8. Contexto: Informações sobre sua rede (número de nós e links)
9. Estatísticas: métricas disponíveis para cálculo da rede

10
Software Gephi

1 2 3

11
Software Gephi
Introdução

1. Aba Nós ou Arestas: Mostra a tabela de nós ou tabela de links,


conforme sua seleção
2. Adicionar nó ou Adicionar arestas: ícones utilizados para
construção da rede dentro do próprio software
3. Importar planilha ou Exportar tabela: ícones utilizados para
inserção ou extração das tabelas de nós ou links.
4. Atalhos para manipulação de dados: duplicar colunas, criar
novas variáveis, etc…

12
Software Gephi

• Para abrir uma base de links ou nós a partir de um csv, ir pelo atalho de “Novo projeto”
• Para abrir arquivos .net, .gdf, .gephi utilizar o atalho “Abrir arquivo”

13
Software Gephi

• Na aba “Laboratório de Dados” ir na opção “Importar planilha” para abrir um arquivo csv.
• O arquivo csv deve conter no mínimo os campos “Source” e “Target”. Pode conter o campo “weight” desde que
este seja um campo numérico dentro do csv.
14
Software Gephi

• O arquivo csv deve ser


selecionado pela elipse
(marcada nesta
imagem).

15
Software Gephi

• O separador deve ser


alterado quando
necessário (marcada
nesta imagem).

16
Software Gephi

• O tipo de tabela – se de
link ou de nó, - deve ser
descriminado (marcada
nesta imagem).

17
Software Gephi

• Ao finalizar a base é
inserida dentro do Gephi
e os pontos são criados
para visualização.

18
Exercício
Gephi
com Software Livre
professora
• “Gephi é uma plataforma interativa de visualização e exploração de todos os
tipos de redes e sistemas complexos, grafos dinâmicos e hierárquicos.”
• É um software escrito em Java e roda tanto no Windows, Linux e Mac.

▪ Atividade:
▪ Inicializar o software
▪ Conhecer o software
▪ Construir a rede feita à mão
▪ Extrair os resultados

19
Prática: Exercícios
Exercício Exemplo 1: SNA no RH
Individual

• Este exemplo olha para uma rede não direcionada que representa alguns dos
grupos de projetos de uma empresa XPTO. A ligação entre os nós A e B
significa que a pessoa A e B trabalham em conjunto (ou, que a pessoa A
reporta para a pessoa B). Esta rede representa seis projetos principais.

• Departamento de 1 (D1) - Snopp, Gukrishnan, Leon, Kabutz. Snopp reporta a Chapman.


• Departamento 2 (D2) - Oliver, Gotti, Patrick, Zhuo. Oliver reporta a Chapman.
• Departamento de 3 (D3) - Gotti, Leon, Kabutz. Gotti reporta a Chapman.
• Departamento 4 (D4). Yu reporta a Chapman neste projeto.
Dados:
rede_rh.xlsx
• Departamento 4a (D4a) - Polark, Chang, Weng, Angel. Polark reporta ao Yu.
• Departamento 4b (D4B) - Christoph, Nardo, Gotti, Zhuo. Christoph reporta ao Yu.
• Departamento 4c (D4C) - Graffe, Zhuo, Hund. Graffe reporta ao Yu.

20
Prática: Exercícios
Exemplo 1: SNA no RH
Exercício
Individual

Não esqueça de
importar como
uma tabela de
links!!!

21
Prática: Exercícios
Exercício Exemplo 1: SNA no RH
Individual

• Objetivo: fazer uma análise completa das medidas e detalhar insights que
possam ser interessantes, para apresentar pro diretor de RH. O Diretor está
muito preocupado com o Gotti e Chang, pois o mercado está de olho neles.

Não esqueça de
importar como
uma tabela de
links!!!

22
Exercício
Momento Zen
com
professora

23
Exercício
Gephi
com Software Livre
professora

• Comunidades

▪ Atividade:
▪ História Face
▪ Comunidades

24
Detecção de Comunidades
Comunidades - Modularidade
• Comunidades
• Community detection particiona uma rede em comunidades, onde os
links dentro da comunidade são mais fortes que os links entre
comunidades.

25
Detecção de Comunidades
Comunidades - Modularidade
• Como identificar uma comunidade
Primeira Interação Otimização da Modularidade

Cada nó é uma Ciclo


comunidade Avaliação do ganho na modularidade Interativo

▪ Modularidade
▪ É a métrica mais popular para detecção de comunidades. É uma
métrica sobre a qualidade da divisão.
▪ Modularidade é a fração entre os links que estão dentro da
comunidade menos a fração esperada se os links fossem dividos
aleatoriamente (se a comunidade fosse criada aleatoriamente).
26
Detecção de Comunidades
Comunidades - Modularidade
• Modularidade
1 𝑤𝑢 𝑤𝑣
𝑄= ෍ 𝑤𝑢𝑣 − ∆ 𝐶𝑢 , 𝐶𝑣
2𝑤 2𝑤
(𝑢,𝑣)∈𝐴

𝑤 = ෍ 𝑤𝑢𝑣
(𝑢,𝑣)∈𝐴

𝑤𝑢 = ෍ 𝑤𝑢𝑣
𝑣∈𝛿𝑢

onde 𝑄 é a modularidade
𝑤𝑢𝑣 é o peso do links entre os nós 𝑢 e 𝑣.
𝛿𝑢 é o universo de nós que contém o nó 𝑢.
𝑤𝑢 é a soma dos pesos dos links que tem 𝑢.
𝑤 é a soma dos links da rede.
𝐶𝑢 é a comunidade que tem 𝑢.

1, 𝑠𝑒 𝐶𝑢 = 𝐶𝑣
∆ 𝐶𝑢 , 𝐶𝑣 é o delta definido como: ∆ 𝐶𝑢 , 𝐶𝑣 = ቊ
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜

27
Detecção de Comunidades
Comunidades - Modularidade

• Tem sido frequentemente observado, na prática, que o


número de nós contidos em comunidades (produzido por
algoritmos de detecção de comunidade) geralmente segue
uma distribuição da lei de potência, isto é, algumas
comunidades contem um número muito grande de nós,
enquanto que a maioria das comunidades contém um
pequeno número de nós. Isto é especialmente verdadeiro
para redes de grandes dimensões.

28
Detecção de Comunidades
Comunidades - Modularidade
• Resolução
• O valor atribuído a esta opção pode ser interpretado da seguinte forma:
• Suponha que o valor do Resolução seja 𝑥. Duas comunidades são mescladas se a soma
dos pesos dos links inter-relações da comunidade é de pelo menos 𝑥 vezes o valor
esperado da mesma soma se o gráfico é reconfigurado de forma aleatória.
• Portanto, um valor menor de Resolução produzirá mais comunidades contendo
um número menor de nós. No entanto, não existe uma fórmula explícita
detalhando o número de nós nas comunidades com relação ao valor de resolução.
• Deve-se usar tentativa e erro para chegar ao tamanho da comunidade esperada.
• Utilize valores menores para gerar comunidades menores e valores maiores de 1 para
gerar menos comunidades maiores.

29
Referências Bibliográficas

• PINHEIRO, C. A. R. Social Network Analysis in Telecommunications.


USA: John Wiley, 2011, 284 p.

• NEWMAN, M. E. J. Networks: An Introduction. New York: Oxford, 2010,


772 p.

30
MUITO OBRIGADA!
Prof.ª Adriana Silva
linkedin.com/in/adrianamms

31
CLOUD COMPUTING

Marcello Zillo Neto


Hugo Rozestraten
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98
3
Estratégia de dados

Planejamento de capacidades técnicas, compartilhamento de dados e


processos que permitem atingir objetivos de negócios que
dependam de dados, criando ações direcionadas por dados.

4
Por que orientar a empresa por Dados ?

5
Melhores Responder ao Melhorar a experiência Descobrir Melhorar
decisões inesperado do cliente e oportunidades eficiência
engajamento

6
Jornada para estratégia
de dados
Working Backwards
(trabalhando de trás para frente)
Seleção de problemas de negócios para endereçar com iniciativas que
direcionadas por Dados

Definição dos benefícios para o negócio e visão de futuro - PR/FAQ


Benefícios para o
Priorização iniciativas que tenham impacto para o negócio e Negócio
projetos habilitadores
Desenvolver capacidades técnicas e de compartilhamento de dados
Compartilhamento de Dados Capacidades Técnicas

Definir papéis e responsabilidades para a cultura Data Driven


Pessoas

7
Estágio das Empresas

8
Tópicos habilitadores por estágio
Direcionado por Dados

Legenda

(Capacidades Técnicas)
(Compartilhamento dos Dados)
(Pessoas)
(Resultados para o Negócio)

9
Tópicos habilitadores por estágio
Baseado em Dados

Legenda

(Capacidades Técnicas)
(Compartilhamento dos Dados)
(Pessoas)
(Resultados para o Negócio)

10
Tópicos habilitadores por estágio
Conhecimento dos Dados

Legenda

(Capacidades Técnicas)
(Compartilhamento dos Dados)
(Pessoas)
(Resultados para o Negócio)

11
Tópicos habilitadores por estágio
Transacional

Legenda

(Capacidades Técnicas)
(Compartilhamento dos Dados)
(Pessoas)
(Resultados para o Negócio)

Estágios
12
Legenda : (Capacidades Técnicas) (Compartilhamento dos Dados) (Pessoas) (Resultados para o Negócio)
Democratização dos dados
Produtos de Dados

blog : https://aws.amazon.com/pt/blogs/big-data/how-jpmorgan-chase-built-a-data-mesh-architecture-to-drive-significant-value-to-enhance-their-enterprise-data-platform/

13
Visão 360 do cliente - Omnichannel

Adv. Analytics functions

Customer 360

https://catalog.us-east-1.prod.workshops.aws/workshops/e9762329-33b6-46c1-a413-0cdc1725b869/en-US/introduction

14
Melhoria da Experiência do Usuário
Planejamento
Análise de Crédito

Anti-fraude de transações

Contratos Digitais
Projetos Habilitadores
Comunicação Multicanal

Ações em Tempo Real

Pipelines de Ai/ML – Machine learning

Visão 360 do Cliente

Data Lake + Data Sharing

Governança de Dados

15
Estratégia de Dados
Cliente

? ( Serviços, Produtos) ?

Catálogo e Busca de
Gestão de Metadados Gestão de Acessos
Dados

Produtores Entrega de Produtos de Dados Consumidores


De Dados Armazenamento De Dados
Processos

Pessoas

Governança de Dados Privacidade de Dados Qualidade de Dados

Monitoramento & Observabilidade

DataOps MLOps

Infraestrutura, redes, SRE & Finops

16
AWS suporte à estratégia de dados
Fim-a-Fim

17
Ad hoc

18
VTEX Data Platform (AWS Summit SP 2022)

19
Estratégia de Dados – múltiplas unidades / empresas

Unidade A Unidade B Unidade C Unidade D

Produtos Produtos Produtos Produtos


Serviços Serviços Serviços Serviços

Produtos Produtos Produtos Produtos


de Dados de Dados de Dados de Dados

Produtos e Serviços
Cliente Catálogo unificado de Produtos de Dados
Integrados
( Data Mesh )

20
Arquitetura Data Mesh na AWS
Catálogo central

21
22
SOCIAL NETWORK
ANALYSIS III
Prof.ª Adriana Silva

1
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
Conteúdo Programático
Tópicos:

• O que é SNA • Conceitos e teoria • Cálculos na mão • Comunidade


• Para que serve sobre a técnica para entendimento • Resolution List
• das métricas
• Como aplica Tipo de redes
• • Recursive
• Estrutura de • Comunidades Métricas de
Centralidade • Aplicação em
dados • Papéis • Degree
Gephi, para
entendimento e
• Clustering compreensão
Coeficient
• R para SNA
• Closeness
• Betweenness
• Exercícios

3
Revisando

• Métricas
• Degree
• O que é? • Degree Ponderado

• Dados/informações •
Clustering Coefficient
Closeness
• Contexto/exemplos • Betweenness
• Nós
• Tipos de Redes • Arestas

• Comunidades

Densidade do grafo
Comprimento médio do caminho
• Papéis • Excentricidade
• Raio
• Diâmetro da Rede

4
Detecção de Comunidades
Comunidades - Modularidade
• Como identificar uma comunidade
Primeira Interação Otimização da Modularidade

Cada nó é uma Ciclo


comunidade Avaliação do ganho na modularidade Interativo

▪ Modularidade
▪ É a métrica mais popular para detecção de comunidades. É uma métrica sobre a qualidade da
divisão.
▪ Modularidade é a fração entre os links que estão dentro da comunidade menos a fração
esperada se os links fossem dividos aleatoriamente (se a comunidade fosse criada
aleatoriamente).
5
Prática
Exercício
Individual

Exemplo: Detecção de comunidade nos dados de um clube de Karatê


• Este exemplo usa os dados de uma escola de Karatê, que descreve a rede social entre 34
Dados: membros de um clube de karatê em uma universidade dos EUA na década de 1970. Este é
karate.xlsx um banco de dados público, muito usado para testes de detecção de comunidades. Ele
contém 34 nós e 78 ligações.

▪ Disponibilizado os dados,
execute a as comunidades
Não esqueça de no Gephi. Teste diferentes
importar como
uma tabela de
resolutions.
links!!!

6
Prática
Exercício
Individual Exemplo: Topologia das Redes em uma empresa
• Considere uma pequena rede de 10 computadores espalhados em um escritório. Cada nó
representa um computador, e cada link representa uma conexão direta entre as máquinas.
Para o propósito deste exemplo, considere os links como conexões que permitem a
Dados: transferência de dados entre computadores. Se dois computadores não estão conectados
karate.xlsx diretamente, a informação deve fluir através de outras máquinas conectadas.
• Quais insights você consegue extrair a partir das conexões?

Não esqueça de
importar como
uma tabela de
links!!!

7
Prática
Exercício
Individual Exemplo: Topologia das Redes em uma empresa

Abra o arquivo words no software Gephi. Você pode considerar útil colorir as palavras por
Dados: comunidade (depois de executar “modularidade”), a fim de responder a seguinte pergunta:
words.net
Com base na rede de pares de palavras traduzidas (do inglês para o alemão), que palavra
alemã (prefaciado com "g_") é mais provável que seja uma tradução da palavra "coil"?
( ) Sprung
( ) Quelle
Basta ir em Abrir
arquivo ( ) Feder
( ) Frühjahr

8
Prática
Exercício
Individual Exemplo: Topologia das Redes em uma empresa

Abra o arquivo ingredientes no software Gephi. Os nós são ingredientes e os links são a
ocorrência juntos em receitas. Executar "modularidade", um algoritmo de encontrar
Dados:
ingredientes
comunidade, mantendo as configurações default. Colorir os nós de acordo com a sua
.net comunidade atribuída e responder o seguinte:
Vanilla está na mesma comunidade que:
( ) parsley
( ) carrot
Basta ir em Abrir
arquivo ( ) potato
( ) walnut

9
R Studio
Software Livre

• A biblioteca mais comum e mais utilizada em grafos é a igraph

▪ Atividade:
▪ Explorar os códigos R
» 1_SNA_conhecendo_códigos_R_USP.R
» 2_SNA_exercício_na_mao.R

11
Comunidades – igraph

Algoritmos de detecção de comunidade


Uma lista de algoritmos disponíveis no IGraph inclui:
• Modularidade Ótima
• Edge Betweenness (2001)
• Fast Greedy (2004)
• Walktrap (2005)
• Eigenvectors (2006)
• Spinglass (2006)
• Propagação de rótulo (2007)
• Multi-nível (2008)
• Mapa de informações (2008)

12
Comunidades – igraph

Resumo
• Para gráfico direcionado: vá com Info Map.
• Se os recursos computacionais não forem um grande problema, e o gráfico for <700 vértices e
3500 arestas, escolha Edge Betweenness ; produz o melhor resultado.
• Caso se preocupe com a modularidade, qualquer um dos algoritmos restantes será aplicado;
• Se o gráfico for particularmente pequeno: <100 vértices, use optimal modularity;
• Se você quiser um algoritmo de primeira tentativa, use fast greedy ou walktrap
• Se o gráfico for maior que 100 vértices e você quiser algo mais preciso do que fast greedy ou walktrap, use
o leading eigenvectors
• Se você estiver procurando por uma solução semelhante ao agrupamento K-means, vá para o Spinglass

Fonte: https://yoyoinwanderland.github.io/2017/08/08/Community-Detection-in-Python/

13
R Studio
Software Livre

• A biblioteca mais comum e mais utilizada em grafos é a igraph

▪ Brincarmos com as comunidades


» 3_SNA_exemplo_comunidades_base.R

14
R Studio
Software Livre

• A biblioteca mais comum e mais utilizada em grafos é a igraph

▪ Como extrair métrica por comunidade?


» 4_SNA_exemplo_comunidades_base_karate.R

15
Prática: Exercícios
Exercício
Individual Exemplo 1: SNA no RH

• Este exemplo olha para uma rede não direcionada que representa alguns dos grupos de
projetos de uma empresa XPTO. A ligação entre os nós A e B significa que a pessoa A e B
trabalham em conjunto (ou, que a pessoa A reporta para a pessoa B). Esta rede representa
Dados: seis projetos principais.
rede_rh.xlsx

• Departamento de 1 (D1) - Snopp, Gukrishnan, Leon, Kabutz. Snopp reporta a Chapman.


• Departamento 2 (D2) - Oliver, Gotti, Patrick, Zhuo. Oliver reporta a Chapman.

Codigo:
• Departamento de 3 (D3) - Gotti, Leon, Kabutz. Gotti reporta a Chapman.
0_caminho_ • Departamento 4 (D4). Yu reporta a Chapman neste projeto.
pratico_rh.R • Departamento 4a (D4a) - Polark, Chang, Weng, Angel. Polark reporta ao Yu.
• Departamento 4b (D4B) - Christoph, Nardo, Gotti, Zhuo. Christoph reporta ao Yu.
• Departamento 4c (D4C) - Graffe, Zhuo, Hund. Graffe reporta ao Yu.
16
Prática: Exercícios
Exemplo 1: SNA no RH
Exercício
Individual

Você também
Agora vocês
pode calcular as
terão o poder de
medidas
pedir métricas
levando o peso
por
em
comunidades!!!
consideração!!!
Será que é uma
Será que é uma
boa?
boa?

17
Prática: Exercícios
Exercício
Individual Exemplo 1: SNA no RH

• Objetivo: fazer uma análise completa das medidas e detalhar insights que possam ser
interessantes, para apresentar para o diretor de RH. Ele está muito preocupado com o Gotti
e Chang, pois o mercado está de olho neles.

Mudou de
opinião?

18
Desafio Prático
Exercício
Individual Facebook

▪ Estudo de Caso
Dados:
adriana.gml ▪ O seu desafio é divulgar uma festa que você está organizando.
▪ Você possui capacidade de receber até 5 pessoas sem cobrar a entrada.
▪ Para quem você daria estes convides VIPs visando a divulgação da festa dentre sua
rede de amigos?
Codigo:
0_caminho_
pratico_face.
R

19
Desafio Prático
Exercício
Individual Facebook

• Estudo de Caso
Dados:
adriana.gml
• Abrir minha rede no R
• Aplicar a estratégia criada na experiência passada

Codigo:
0_caminho_ • Determinar quem são as pessoas VIPs que você convidaria
pratico_face.
R

20
Estudo de Caso
Telco

• Nós: número telefônico


• Link: contato com o outro número seja por ligação ou sms

21
Estudo de Caso
Dados

• O que é requerido?
• Normalmente trabalha-se com 3 meses do CDR (call detail records) sumarizado

• Flexibilidade dos dados é a chave que permite construir redes com diferentes
propósitos.

22
Estudo de Caso

Dados de Entrada

• O algorítimo de SNA necessita de uma simples estrutura de dados de entrada com


base em:
• Nós
• Links
• Link intensity (Intensidade do nó, peso – opcional)
• Coletados em um período de tempo pré-definido
• Todo link é definido como um “FROM” – “TO” (“DE” – “PARA”) entidades
• Intensidade representa o quão forte é a relação entre o “FROM” (“DE”) e “TO”
(“PARA”) entidades.
23
Estudo de Caso
Business Rules
Dados de Entrada

• Considerações:
• Só serão incluídos registros com 150 ou menos relações entre os nós (entidades).

• Sobre relações com o mesmo nó (Nó A com Nó B)


• Se o Nó A tem menos que 4 contatos com o nó B (chamadas, sms, ...) em 3 meses, essa relação será
excluída porque é algo muito casual.
• Se o Nó A tem mais de 20.000 contatos com o nó B, em 3 meses, essa relação será excluída porque não é
algo humano.
• A distribuição da quantidade de relações, contatos e pesos, deve ser analisada a fim de evitar
outliers.

24
Estudo de Caso

Resumo do Processo

Community Role Assignation


ETL Process Business Rules Reports
Detection By Community
- Carga de 3 - Criação dos pesos para cada relação - As quebras das - Cálculo das - Geração de
meses de CDR - Definição da população para a rede comunidades métricas por relatórios
(call detail (apenas rádio, apenas sms,...). serão testadas a comunidades gerenciais para
record). - Se o nó tem mais de 150 relações partir da - Serão identificados estudo das
- Sumarizar os com outros nós, não participará da definição de os papéis das comunidades e
3 meses em análise. modularidade. entidades, por perfis.
uma tabela. - Se o nó A tem mais de 20 mil comunidade:
contatos com o nó B, este nó não - Líder
participará da análise. - Seguidor
- Se a relação A – B tem menos de 4 - Marginal 1
contatos em 3 meses, não participará - Marginal 2
da análise.

25
Outras aplicações

• Telco
• Modelo de Churn

• Financeiro
• Detecção de quadrilhas
• Lava Jato
• Transações fraudulentas

26
Processo de SNA (sugestão):
“passo a passo”
Explorar
informação
existente 1
3 4
Extração de Determinar Detectar
dados A→B links e forças comunidades

2 ▪ Rede inteira
▪ Comunidades

Qualificar Estipular
6 Aplicar
5
“papéis”
métricas ▪ Rede inteira
Comunidades SNA ▪ Comunidades
▪ “Atores”
Results 7
27
Referências Bibliográficas

• PINHEIRO, C. A. R. Social Network Analysis in Telecommunications. USA: John Wiley, 2011, 284 p.

• NEWMAN, M. E. J. Networks: An Introduction. New York: Oxford, 2010, 772 p.

28
MUITO OBRIGADA!
Prof.ª Adriana Silva
linkedin.com/in/adrianamms

29
TECNOLOGIA DA INFORMAÇÃO (TI)
E INOVAÇÃO TECNOLÓGICA
Ildeberto Rodello (Beto)
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
About me, by myself
• Formação acadêmica

• Atuação profissional

3
About me, by myself
• Pesquisas e parcerias

move.fearp.usp.br

lepes.fearp.usp.br habeasdata.fearp.usp.br npt.com.br

4
Conteúdo

• O papel da Tecnologia da Informação (TI) na transformação digital;


• Reengenharia de processos de negócios;
• O uso do TI como arma competitiva e de alavancagem de negócios;
• O relacionamento do líder digital x CIO;
• Shadow IT;
• A mudança no ambiente de negócios: a Sociedade da Informação;
• Alinhamento estratégico de TI;
• Governança de TI e Planejamento Estratégico. Estruturação da área de TI

5
Bora pro jogo?

6
Inovação Tecnológica
Cenários futuros e novos modelos de negócios
Como obter ganhos a partir da adoção das novas tecnologias digitais?

7
Inovação

Em uma economia baseada no


conhecimento, a inovação
parece desempenhar um papel
central.

8
Empresas Inovadoras

• Competências estratégicas
• Visão de longo prazo, capacidade de identificar e, até, antecipar tendências de
mercado, disponibilidade e capacidade de coligir, processar e assimilar informações
tecnológicas e econômicas

• Competências organizacionais
• Disposição para o risco e capacidade de gerenciá-lo, cooperação interna entre os
vários departamentos operacionais e cooperação externa com consultorias, pesquisas
de público, clientes e fornecedores, envolvimento de toda a empresa no processo de
mudança e investimento em recursos humanos”.

9
Tecnologia – Exemplo (Vídeo 1)

www.youtube.com/watch?v=R3LsRl7iMos

• O que pode ter sido a maior inovação?


• Qual uma possível vantagem competitiva?

10
Tecnologia da Informação

Reengenharia de processos de negócios


Uso da TI como arma competitiva e de alavancagem de negócios
A mudança no ambiente de negócios: a Sociedade da Informação
O relacionamento do líder digital x CIO
Shadow IT

11
Tecnologia e Atualidade - (Vídeo 2)

www.youtube.com/watch?v=PK_qWEglRyc

Tecnologia é algo pelo qual as empresas de


hoje têm de dar o máximo de atenção para
sobreviver em um mercado cada vez
mais competitivo.

12
Tecnologia e Atualidade
• Reflexão
• Bancos
• Telecomunicações
• Supermercados
• Sua empresa ?

13
Emergência da Empresa Digital

• Alguns dados para se pensar:


• Em 2005 o número de celulares ultrapassou o de telefones fixo instalados.
• Em 2005, 40 milhões de empresas tinham site pontocom.
• Jornal impresso versus notícias online.
• Já comprou algo pela internet?
• Número de usuários internet?
• Propaganda? Marketing?

14
Emergência da Empresa Digital

• Alguns dados para se pensar:


• 5,473,055,736 1 (mais de 5 bilhões) de usuários da Internet – Junho 2022
• O usuário brasileiro da Internet gasta em média 10 horas online todos os dias.
• mais 1.74 bilhão de sites na Internet 2
• 56% de todo o tráfego da Internet é de uma fonte automatizada, como ferramentas
de hackers, spammers, bots, etc.

15
Transformação Digital

www.youtube.com/watch?v=2Qyd13E2jW0
www.youtube.com/watch?v=B7N5vcksW8s&t=43sh
www.youtube.com/watch?v=MbjLYXOHkD4

Uma nova era no mundo dos negócios já


começou. Revalidar modelos e produtos e
se antecipar aos movimentos do mercado
são as novas regras para ser parte da
transformação digital.

16
Transformação Digital

• É a mudança organizacional
(estratégia, modelo operacional,
financeiro, vendas, marketing,
recursos humanos, sustentabilidade,
etc.) para continuar a gerar valor
para seus clientes e manter-se
competitivo em um mundo digital.

17
Transformação Digital

• Os 4 pontos da transformação digital [HSM Experience]


• https://www.youtube.com/watch?v=ChUchicO2mg

• Inovação e Transformações Digitais [Silvio Meira]


• https://www.youtube.com/watch?v=DbmNbZbV_0A

• Transformação Digital no setor Financeiro


• https://www.youtube.com/watch?v=qnlEIBaFEto

18
Pontos Críticos para
Transformação Digital

Relacionamento Empoderamento Otimização de Transformar


com Clientes dos Funcionários operações produtos e serviços

19
Interação 1

• Tecnologia e Atualidade
• Como você vê a sua área de
atuação (ou empresa) em termos
de estar preparada para
proporcionar novas experiências ao
cliente?

20
Transformação da Empresa

• Tecnologia e Sistemas de Informação


• Componentes vitais quando se pretende alcançar o sucesso de empresas e
organizações.

• As empresas utilizam a tecnologia como ferramenta para:


• Resolução de problemas;
• Melhorar o controle;
• Melhorar o fluxo de informações;
• Melhorar o processo de tomada de decisões.

21
Empresas e Tecnologia

Fonte: http://www.portaldaindustria.com.br/agenciacni/noticias/2016/04/nova-era-industrial-transformara-produtividade-global/

22
Indústrias conectadas

Fonte: http://revistapesquisa.fapesp.br/2017/09/21/o-brasil-da-internet-das-coisas/

23
Indústria 4.0 – Exemplo (Vídeo 3)

• Vídeo Huawei

24
Administração e Tecnologia

2000 –
1970 – 1980
1950 – 1960 1960 – 1970 1990 – 2000 Mobilidade,
Apoio a 1980 – 1990
Processamento Relatórios Comércio Integração,
tomada de Uso estratégico
de dados administrativos Eletrônico Nuvem, IoT,
decisão
RA,...

25
Evolução da TI

Provedor tecnologia Provedor serviços


Era da automação Era do escalonamento

Parceiro estratégico
Era do alinhamento Uso da TI para potencializar inovação
estratégico

26
O valor dos SI e da TI

“The world’s most valuable resource is no longer oil, but data”


• https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-
resource-is-no-longer-oil-but-data

27
Tecnologia e Atualidade

• Como você vê a sua área de atuação


(ou empresa) em termos de estar
preparada para tomar decisões
baseadas em dados?

28
Ciclo da Gestão do Conhecimento

Figura extraída de: https://wholedata.wordpress.com/2016/04/15/diferenca-entre-dados-informacao-e-conhecimento/

29
Gestão da Tecnologia da Informação
Alinhamento estratégico de TI
Estruturação da área de TI

30
Interação 2
Gestão da TI

• Como são tomadas as decisões


relativas a TI na sua empresa?

31
Gestão da Tecnologia da Informação
• Não envolve somente questões técnicas!!!

32
CIO x Líder Digital

“O grande desafio dos líderes no mundo tem sido alinhar a estratégia de


crescimento das empresas aos projetos de TI, de forma eficaz, e que
realmente traga algum retorno para a organização que seja duradouro. Com
o avanço constante da tecnologia, muitas empresas de todos os setores
ainda estão tendo dificuldade em se posicionar com relação a isso. A área de
TI deve deixar de ser uma estratégia de negócio basicamente de
suporte e passar a ser uma parte integrante da empresa, proporcionando
aos CIOs a oportunidade de trabalhar em estreita colaboração com os
parceiros de negócio a fim de conduzir inovação por toda a organização”,

Claudio Soutto, analisa o sócio da KPMG no Brasil. https://www.vidamoderna.com.br/o-cio-e-um-lider-digital-nem-tanto/

33
Technology Organization Environment
Framework (TOE)
Alinhamento estratégico de TI

34
Definição

• Teoria usada para explicar o


contexto de uma organização na
tomada de decisões
• Composta por três elementos:
• Tecnológico
• Organizacional
• Ambiental.

35
Technology Organization
Environment Framework

36
Planejamento Estratégico de TI
PETI

37
PETI

• É um processo dinâmico e interativo que procura estruturar


estratégica, tática e operacionalmente os sistemas de informação
e a infraestrutura de TI necessários para o atendimento das
decisões, ações e respectivos processos da organização.

38
PETI - Metodologias

• As primeiras metodologias foram criadas no fim da década de 60.


• BSP (Business Systems Planning) – IBM - 1981
• SSP (Strategic Systems Planning)

• Modelo proposto por Rezende.

Rezende, D. A.; Planejamento de Sistemas de Informação e Informática. Atlas. ISBN: 9788597003475 . 2016

39
Por que planejar?
• Inteligência organizacional
• Sobrevivência e perenidade organizacional
• Maximizar os lucros (competitividade)
• Alternativas de rentabilidade ou de negócios
• Estabelecer premissas e prioridades
• Ações concentradas nos objetivos e negócios
• Contraponto para incertezas
• Determinar possíveis alternativas de ações
• Qualidade e produtividade
• Facilitar controles
Fonte: Rezende, D. A.; Planejamento de Sistemas de Informação e Informática. Atlas. ISBN: 9788597003475 . 2016

40
PE de Informações ou da TI

• Elaborar os Modelos de Informações e os


Mapas de Conhecimentos necessários à gestão do “negócio”, para
tomada de decisões em todos os níveis
• Elaborar plano de sistemas de informação
• Padronizar e adequar a TI e infraestrutura
• Planejar recursos humanos
• Identificar planos de ação (executar)

→ período de 1 a 3 anos, revisado de 2 a 6 meses

41
PLANEJAMENTO
ESTRATÉGICO
PLANEJAMENTO
DA ALINHAMENTO ESTRATÉGICO
TECNOLOGIA DA ESTRATÉGICO
INFORMAÇÃO (PE)
(PETI)

RECURSOS SUSTENTADORES DO ALINHAMENTO ESTRATÉGICO

TECNOLOGIA DA INFORMAÇÃO SISTEMAS DE INFORMAÇÃO


(TI) E DO CONHECIMENTO (SI)

PESSOAS OU RECURSOS CONTEXTO ORGANIZACIONAL


HUMANOS (RH) (CO)

Fonte: Rezende, D. A.; Planejamento de Sistemas de Informação e Informática. Atlas. ISBN: 9788597003475 . 2016

42
Infraestrutura de Tecnologia da Informação
Estruturação da área de TI

43
Infraestrutura de TI
• Hardware
• Software
• Meios de armazenamento
• Meios de Comunicação
• Pessoas

• Oferecem serviços de TI
• Servidores (email, web, dados, etc.)
• Backup
• Etc.

44
Gestão da TI
• Gerir os serviços de TI para prover:
• Disponibilidade
• Confiabilidade
• Segurança
• Contingência
• Atualização
• Etc.

45
Infraestrutura de TI

• Própria
• Segurança
• Redundância
• Etc.

• Terceirizada
• Nuvem
• Colocation/Housing

46
Abordagens de Instalação

Fonte: https://www.o3s.com.br/post/o-caminho-para-a-nuvem

47
Departamento de TI

Gestor de TI

Desenvolvimento Infraestrutura de Segurança da Gestão de


Metodologia
de Software TI Informação Projetos

Equipe Própria Terceirizado Aquisição

48
Shadow IT - (Vídeo 4)

https://www.youtube.com/watch?v=5a_3hBiO774

49
Modelos de Governança de TI

50
Diferença entre Gestão e
Governança de TI

• Gestão de TI é responsável por manter o desempenho de


serviços, promover a transformação digital na empresa, manter
a satisfação dos usuários e clientes dos serviços, além de fazer a
gestão da equipe de TI.
• Governança de TI é responsável por definir como a TI funciona e
verificar se as normas e políticas estão sendo seguidas
corretamente.

51
Governança de TI
Roadmap

• Onde estou (a TI)?


• Níveis de maturidade
• Estabelecer um plano
estratégico de TI
• Não pensar só tecnicamente
• Alinhamento com negócio
• Geração de valor
• Conhecer frameworks de apoio

52
Frameworks para
Governança de TI

53
Control Objectives for Information and Related Technologies

54
COBIT

• É um framework de boas práticas criado pela ISACA (Information


Systems Audit and Control Association) para a governança de
tecnologia de informação.

55
COBIT 2019 – Exemplo (Vídeo 5)

www.youtube.com/watch?v=KJLAJSZ
bfIM&feature=youtu.be

56
Maturidade

57
Information Technology Infrastructure Library

58
ITIL

• É um conjunto de boas práticas para o gerenciamento de serviços de


TI que se concentra no alinhamento de serviços de TI com as
necessidades dos negócios.
• Descreve processos, procedimentos, tarefas e listas de verificação que
não são específicos da organização nem específicos da tecnologia,
mas podem ser aplicados por uma organização para estabelecer a
integração com a estratégia da organização, entregando valor e
mantendo um nível mínimo de competência.

59
ITIL– (Vídeo 6)

www.youtube.com/watch?v=1ZqhiwEAtTA

60
No Brasil

• Norma NBR ISO/IEC 38500:2018


• Oferece princípios para orientar os dirigentes das organizações
(incluindo proprietários, membros do conselho de administração,
diretores, parceiros, executivos seniores ou similares) sobre o uso
eficaz, eficiente e aceitável da Tecnologia de Informação (TI) dentro
de suas organizações.

61
Para se aprofundar

62
- 5 1
OBRIGADO! 0 9 8
7 3 .
5 .2
TECNOLOGIA 3DA 1 INFORMAÇÃO (TI)
i d a
E INOVAÇÃO
o sh TECNOLÓGICA
i Y
u sh Ildeberto Rodello (Beto)
At s
el o www.linkedin.com/in/ildeberto-rodello-8509655/

ar c
M
ANÁLISE DA
CONJUNTURA
ECONÔMICA EM CENÁRIOS
DE TECNOLOGIAS
DISRUPTIVAS I
Prof. Dr. Fernando S. Coelho

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
2
Apresentação do Professor

Fernando de Souza Coelho


Professor da USP, ensinando e pesquisando nos cursos
de graduação e mestrado em Gestão de Políticas Públicas
da EACH-USP, e nas especializações e MBAs de diversas
unidades – como este da ESALQ-USP.

Economista pela USP, com extensão em Administração


no ITAM/México. Especialista em Desenvolvimento
Econômico pelo Weitz Center/Israel.

Mestre e Doutor em Administração Pública pela EAESP-


FGV, com estágio de pós-doutorado em Gestão Pública
pela LSE/Londres.

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
3
Módulo: Data Science e Big Data no Ambiente de Negócios

Tecnologia
AHP da
Informação
Gestão da Engenharia
Mudança de Dados

Metodologias
Ágeis

Análise de
Cloud Computing
Redes Socias Um Lego de disciplinas para
Business Conjuntura
compreender as organizações,
Intelligence Econômica
o ambiente de negócios e os
Java Script modelos de gestão.

Inovação
Tecnológica

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
4
Agenda e Objetivo da nossa Disciplina

• Agenda da disciplina: Princípios de análise econômica; principais agregados/variáveis


macroeconômicas e suas relações (PIB, inflação, desemprego, taxa de juros, déficit
público, taxa de câmbio e balanço de pagamentos). Papel da Política Econômica
(monetária, fiscal e cambial) e seus instrumentos. Sistema Financeiro e seus mercados; e
Análise de conjuntura econômica e dos cenários doméstico e internacional.

• Objetivo da disciplina: Oferecer a você, (futuro) gestor e especialista em análise e ciência


de dados, um instrumental para compreensão dos dados/informações econômicas e
interpretação do seu ambiente de negócios à luz da conjuntura e dos cenários
macroeconômicos.

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
5
Benefícios Esperados da Disciplina

Adquirir uma visão rápida do funcionamento da Economia;

Compreender de forma descomplicada algumas relações de causa e


efeito na conjuntura econômica e nas políticas econômicas; e

Pensar a relação entre ambiente econômico e o contexto da gestão


de negócios em diferentes mercados e organizações sujeitos às
tecnologias disruptivas.

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
6
Organização da nossa Disciplina em 3 Aulas

Sistema Financeiro, Mercados e Ambiente Econômico (27.09)


3 Análise da conjuntura econômica e projeção de cenários

2 Princípios de Política Econômica (27.09)


Fiscal, Monetária, Cambial e seus instrumentos

1 Fundamentos sobre Nível de Atividade (20.09)


PIB, Inflação, Desemprego e seus índices

Introdução à Análise Econômica


Preâmbulo e algumas definições usuais
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 7
Proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98
Antes do 1º degrau, nosso piso!

Introdução à Análise Econômica:


Preâmbulo e algumas definições usuais

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
8
O Macroambiente e a Economia

Macroambiente
Ambiente Político

Ambiente Econômico Ambiente Setorial

Ambiente Social
Organização
Ambiente Tecnológico

Ambiente Ecológico

Ambiente Legal

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
9
Análise do Macroambiente (Pestel)

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
10
Elementos de uma Análise Econômica

Análise Microeconômica: agentes e mercado


1. Ambiente Econômico
Análise Macroeconômica: agregados e políticas

Conjuntural: curto/médio prazo, oscilações no panorama


2. Tipo de Abordagem Estrutural: longo prazo, alterações na base da economia

Conceitos: definições usuais em economia


Modelos: operacionalização dos conceitos econômicos para análises.
3. Caixa de Ferramentas
Índices: expressões numéricas (taxas, indicadores etc.) que expressam a economia.

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
11
Dificuldades Iniciais da Análise Econômica

Desconhecimento do Complexidade das Aparência/percepção


relações de causa e efeito na de Complicação!
Economês economia.
+ =

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
12
Economês & Análise dos Negócios

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
13
(…) apesar da gradativa popularização da economia

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
14
A Complexidade das Relações de Causa-Efeito

Oportunidade de queda da (-------------) ?


taxa de juros
Substituição dos
produtos importados
pelos nacionais
Aumento das receitas Possível redução do
do governo déficit público
Impacto positivo na
balança comercial
Aumento do imposto Aumento do preço dos
de importação produtos estrangeiros
Aumento da inflação

Queda das vendas dos


Retaliações do setor Impacto negativo na
produtos nacionais no
externo balança comercial
exterior

Conhecer os termos e conhecer as duas ‘faces da moeda’, ou seja, o trade-off!

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
15
Ilustrando a Economia: o fluxo circular da renda – agentes e mercados
Salários, Juros
Renda e Aluguéis
Mercado de Fatores Produtivos
(Trabalho e Capital)

Contribuição Sindical
Sindicatos Aplicações

Aplicações e Empréstimos

Banco Central Bancos


Pessoas Open-Market Empresas
Redesconto
Títulos Compulsório Aplicações
Públicos e Captações
Empréstimos

Impostos Impostos
Governo

Gastos Públicos

Mercado de Bens e Serviços


Consumo Receita

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
16
Aula de hoje: o nosso 1º degrau!

Fundamentos sobre Nível de Atividade:


PIB, Inflação, Desemprego e seus índices

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
17
Economicamente, os países objetivam:

Crescimento do Produto Estabilidade de Preços Geração de Emprego

Nível de Atividade

Indicador: PIB Indicador: Taxa de Inflação Indicador: Taxa de Desemprego


MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
18
O que é PIB?

É a medida aproximada da geração de renda de uma


economia em um determinado período de tempo.

Expressa em valor monetário o total dos bens e serviços


finais produzidos dentro dos limites geográficos de um
território (país, região, estado ou município).

Indicador síntese de uma economia, tal como um


termômetro do fluxo de renda agregado (não confundir
com o estoque de riqueza).
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
19
PIB: operacionalizando o conceito em um modelo*

PIB = C + I + G + (Ex – Im)

Gastos do Governo

Exportação

Importação
Investimento
Consumo
*Ótica do PIB do dispêndio/despesa/demanda
Temos, igualmente, as ótica sda oferta/produção e da renda.
Para + informações: https://www.ibge.gov.br/explica/pib.php
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
20
PIB do Brasil: ótica do dispêndio/despesa/demanda
Exemplo: economia brasileira em um ano recente -2020.
(PIB em torno de R$ 7,5 trilhões)
0,1% -1,1%
16%

20% 65%

Fonte: IBGE (2021)


MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
21
Padrão do PIB em alguns países/regiões
pela ótica do dispêndio/despesa/demanda

Balança Comercial e Serviços Investimentos Gastos Públicos Consumo

0 0 3 0 2
15
23 24 21 21 24
20 45
14 12 14
20 20

15
65 63 66 68
55 56
39

-2 -3

Européia

China
Brasil

Estados
Chile

Japão
México

Unidos
União
Fonte: OECD(2020); IBGE (2020)
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
22
Componentes do PIB e seus fatores de impacto

Nível de renda disponível (poder de compra, tributação)


Consumo Expectativas (confiança, humor) das famílias
Distribuição de renda na economia

Ritmo das inovações tecnológicas


Investimento Taxa de Poupança (privada e pública)
Nível da taxa de juros (trade-off); taxa de retorno.

Controle da atividade econômica


Gastos do Governo Prestação de serviços públicos
Provisão das políticas sociais

Taxa de câmbio
Balança Comercial Competitividade internacional
Políticas de comércio exterior
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
23
Atenção 1 – Cálculo do PIB trimestral e resultado por diferentes óticas

Fonte: IBGE

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
24
Atenção 2 – Brasil: trajetória errática de crescimento do PIB (%)

Fonte: IBGE e FGV.


A Trajetória Stop and Go | Voo de Galinha!
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
25
Atenção 3 – Taxa de crescimento do PIB: países desenvolvidos versus emergentes
(uma amostra entre o boom e a crise: 2006-2008)

11,1%

9,7%
9,3%
2006 2007 2008
7,9%
7,4%
6,8%

5,4%

3,8%
2,9% 2,9% 2,9% 2,8%
2,4%
2,0% 1,8%
1,4% 1,4% 1,6% 1,4% 1,3%
0,5% 0,3%

EUA Japão Alemanha Reino França Canadá Itália Índia Brasil Rússia China
Unido
Fonte: FMI
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
26
Comportamento do PIB no Brasil nos últimos anos

Brasil
2015 2016 2017 2018 2019 2020 2021 2022P
PIB
Crescimento real do PIB - % -3,5 -3,3 1,3 1,8 1,2 -3,9 4,6 2,4
PIB nominal - BRL bi 5.996 6.269 6.585 7.004 7.389 7.468 8.679 9.727
PIB nominal - USD bi 1.800 1.798 2.063 1.916 1.872 1.447 1.609 1.875
População - Milhões 203,5 205,2 206,8 208,5 210,1 211,8 213,3 214,8
PIB per capita - USD 8.847 8.764 9.977 9.189 8.910 6.834 7.541 8.730

• Oscilações da taxa de crescimento real no período; ver como foi baixa, quando não ocorreu queda.
• Valor do PIB nominal em BRL aumentou ano a ano (uma vez que não é deflacionado).
• Valor do PIB nominal em USD variou de acordo com a taxa de câmbio
• O PIB per capita depende da estimativa da população

Fonte: IBGE e Boletim Focus

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
27
Atenção: crescimento ≠ desenvolvimento

• Crescimento econômico é necessário, mas não é suficiente para o


desenvolvimento socioeconômico;

• Logo, desenvolvimento não se restringe ao crescimento!

• Multidimensionalidade do desenvolvimento a partir do final do séc. XX.

• Vide, por exemplo, o conceito de desenvolvimento sustentável | ODS.

• Com indicadores de desenvolvimento, qualidade de vida e


distribuição de renda como IDH/PNUD, IPQV/IBGE e Índice de Gini.

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
28
Baixa
Eficiência
DESENVOLVIMENTO Econômica
SUSTENTÁVEL

Conservação
Equidade Ambiental
Social

Degradação Pobreza e
Eficiência desigualdade
ambiental Econômica social

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
29
Recapitulando: primeiros aprendizados desta aula:

● O que é análise de conjuntura macroeconômica


● O PIB como indicador de crescimento econômico
● A ótica do dispêndio | PIB = C + I + G + (Ex – Im)
● Os fatores de impacto de cada um dos componentes do PIB
● Diferença entre crescimento econômico e desenvolvimento
● IDH como indicador para pensar o desenvolvimento

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
30
Enquete 1: aplicando o conhecimento da aula

Qual dos fatores, abaixo, é plausível para explicar a taxa de crescimento


NEGATIVA do PIB brasileiro de -3,9% no ano de 2020?

(A) Diminuição da renda disponível das famílias


(B) Estabilização dos investimentos produtivos
(C) Incremento da desvalorização cambial
(D) Aumento dos gastos correntes do governo

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
31
Enquete 1: resposta e interpretação

Qual dos fatores, abaixo, é plausível para explicar a taxa de crescimento


NEGATIVA do PIB brasileiro de -3,9% no ano de 2020?
(A) Diminuição da renda disponível das famílias
(B) Estabilização dos investimentos produtivos
(C) Incremento da desvalorização cambial
(D) Aumento dos gastos correntes do governo

PIB = C + I + G + (Ex – Im)

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
32
O que é Inflação e quais são seus tipos?

Inflação: o aumento do nível de preços de uma economia.

Inflação de Demanda Inflação de Oferta Inflação Inercial


▪ Nível dos salários ▪ Choque de oferta (-) ▪ Memória inflacionária
▪ Disponibilidade de crédito ▪ Preços administrados ▪ Expectativa dos agentes
▪ Meios de Pagamento ▪ Custos de prod./adm. ▪ Indexação da economia

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
33
Inflação de Demanda: ilustração
Oferta Agregada
Preço

P2

P1

Demanda Agregada
Q
Quantidade
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
34
Inflação de Oferta: dois exemplos

Exemplo 1 Exemplo 2

Brasil (2019/2020), aumento do preço da carne. Brasil (2021), inflação oficial foi 10,06%.
Choque de oferta (-), pelo aumento das exportações.  dos preços administrados pelo governo

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
35
Inflação Inercial: explicação do fenômeno

Memória Inflacionária Indexação

Inflação Anterior Expectativa Contratos de Curto Prazo

Espiral Inflacionário

Inflação Inercial
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
36
Brasil Contemporâneo: da hiperinflação ao controle

100%

Collor 1
80%
Regime de Metas de Inflação

60%
Real
40% Verão
Bresser Collor 2
20% Cruzado

0,00%
1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1999
Fonte: IGPM / inflação mensal (%), 1985-2000

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
37
Brasil: principais índices de inflação ao consumidor

IPCA - IBGE
Utilização: Meta de Inflação

IGPM - FGV
Utilização: Contratos

IPC - FIPE
Para + informações: https://portal-da-inflacao-ibre.fgv.br/#!/ Utilização: Impostos de SP

ICV - DIEESE
Utilização: Acordos Salariais

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
38
Inflação no Brasil nos últimos anos

Brasil
2015 2016 2017 2018 2019 2020 2021 2022P
Inflação
IPCA - % 10,7 6,3 2,9 3,7 4,3 4,5 10,1 6,4
IGP–M - % 10,5 7,2 -0,5 7,5 7,3 23,1 17,8 9,6
• Diferença de metodologia entre IPCA e IGP-M
• Uso da inflação oficial alternativo ao IGP-M para revisão de contratos durante a pandemia
• Meta de inflação: foi de 4% em 2020, foi de 3,75% para 2021 e é de 3,5% para 2022.
• IPCA: 4,4% no ano (jan-ago); 8,7% nos últimos 12 meses.
• Deflação no último bimestre de 2022: julho: - 0,68% | agosto: -0,36%

Fonte: IBGE e Boletim Focus

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
39
Enquete 2: aplicando o conhecimento da aula

O que explica adequadamente a taxa de inflação dentro da meta de inflação


no quadriênio 2017-2020 (2,9%, 3,7%, 4,3% e 4,5%, respectivamente)?

(A) Redução da inflação inercial


(B) Diminuição da oferta de crédito para os consumidores
(C) Não reajuste dos preços administrados pelo governo
(D) Baixa demanda agregada das famílias por bens e serviços

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
40
Enquete 2: resposta e interpretação

O que explica adequadamente a taxa de inflação dentro da meta de inflação


no quadriênio 2017-2020 (2,9%, 3,7%, 4,3% e 4,5%, respectivamente)?

(A) Redução da inflação inercial


(B) Diminuição da oferta de crédito para os consumidores
(C) Não reajuste dos preços administrados pelo governo
(D) Baixa demanda agregada das famílias por bens e serviços
Como o Banco Central (Bacen) buscou estimular a economia na ocasião?

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
41
Mercado de Trabalho e Taxa de Desemprego

A partir da população total do país (214 milhões), calcula-se:

174,0 milhões

PIA ou PIT
108,6 milhões
Taxa de Desemprego = Nº. de Desempregados /PEA
Brasil (2°. tri. 2022): 9,1%, com 9,9 milhões de pessoas PEA ou PFT
desempregadas na PEA ; são 98,7 milhões ocupadas.
Para + informações: https://www.ipea.gov.br/cartadeconjuntura/index.php/category/mercado-de-trabalho/ 65,4 milhões

Inativos

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
42
Tipos de Desemprego: conceito e tipos

Friccional Conjuntural
▪ Incompatibilidades (...) ▪ Crise econômica
▪ Assimetria de Informação ▪ Sazonalidade
▪ Rotatividade ▪ Choque externo

Estrutural
▪ Mecanização agrícola
▪ Automação industrial
▪ Inteligência artificial

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
43
Brasil: índices de desemprego

PNAD contínua - IBGE PED – DIEESE/SEADE


Metodologia: Metodologia:
▪ Pop. Idade Ativa (PIA): 14 anos ▪ Pop. Idade Ativa (PIA): 10 anos
▪ Desocupado: sem ocupação, disponível ▪ Desemprego aberto
▪ 211 mil domicílios em 3500 municípios ▪ Desemprego oculto pelo trabalho precário
▪ Em torno de 2000 entrevistadores, por telefone ▪ Desemprego oculto pelo desalento
▪ Média trimestral (dados do mês com os dois ▪ RM de São Paulo, Distrito Federal e Salvador
meses imediatamente anteriores) ▪ Mensal, amostra domiciliar
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
44
Desemprego no Brasil nos últimos anos

Brasil
2015 2016 2017 2018 2019 2020 2021 2022P
Mercado de Trabalho
Taxa nacional de desemprego - média anual (*) 8,6 11,6 12,8 12,4 12,0 13,8 13,2 9,5
Taxa nacional de desemprego - fim do ano (*) 9,7 12,8 12,5 12,4 11,7 14,9 11,8 9,1

Além da taxa de desocupação (ou desemprego), é fundamental analisar:

• Taxa de Participação: 62 % da PIA, com taxa de desalento em torno de 4,2 milhões de pessoas
• Rendimento Médio: aprox. R$ 2.693,00 (aumento nominal de 6% e queda real de 5,1%) e perfil das vagas criadas.
• Taxa de Formalidade: 60% (43,4 milhões com carteira, 12 milhões de servidores públicos e 4,3 milhões de empregadores)
• Taxa de Informalidade: 40 % (13,1 milhões sem carteira e 25,9 milhões por conta própria)
• Subocupação da Força de Trabalho (por insuficiência de horas): 6,5 milhões de trabalhadores
• Taxa de Subutilização: 20,6 milhões (desempregados + subocupados + desalentados); + sem disponibilidade: 6,5 milhões.
Fonte: IBGE e PNAD Contínua (segundo trimestre de. 2022)

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
45
Em resumo: nível de atividade de uma economia

Objetivos Índices

▪ Crescimento Econômico ▪ PIB (% crescimento)


▪ Estabilidade de Preços ▪ Taxa de Inflação
▪ Geração de Emprego ▪ Taxa de Desemprego

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
46
Macroeconomia & Ambiente de Negócios

Macroeconomia: nível de atividade | políticas econômicas

Passado Recente Conjuntura Atual Cenários Futuros

Setor, Mercados e Organizações

Planejamento Objetivos Ações

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
47
Brasil: Nível de Atividade
projeção 2022 (base 31 ago.)

Projeção 2022 Pressupostos

PIB (% cres.)
2,4% (mercado); e 2,5% (governo)

Tx. de Desemprego (média) 9,5% (média); 9,0% (final do ano)

IPCA: 6,4% (meta de inflação do CMN de 3,5%);


Tx. de Inflação IGPM: 9,6%

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
48
Problemas Econômicos e seus trade-off !?

Como alavancar o crescimento econômico sem colocar em


risco a estabilidade de preços (vide inflação nos últimos 18
meses)?

Como determinar a taxa de juros do país em 2022/2,


considerando uma taxa neutra (ou taxa de equilíbrio)?

Como equilibrar receitas e despesas do governo diante das


demandas sociais pós-pandemia?

Enfim, essas são questões de política econômica, tema da nossa aula de hoje!
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
49
Muito obrigado pela atenção de vocês nesta aula 1!

www.facebook.com/fernandosouzacoelho

Vejo vocês, agora, no dia 27 de setembro na nossa aula 2.


MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas I Prof. Dr. Fernando de S. Coelho
50
ANÁLISE DA
CONJUNTURA ECONÔMICA
EM CENÁRIOS DE
TECNOLOGIAS
DISRUPTIVAS II
Prof. Dr. Fernando S. Coelho

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
2
Organização da nossa Disciplina em 2 Aulas

Sistema Financeiro, Mercados e Ambiente Econômico (27.09)


3 Análise da conjuntura econômica e projeção de cenários

2 Princípios de Política Econômica (27.09)


Fiscal, Monetária, Cambial e seus instrumentos

1 Fundamentos sobre Nível de Atividade (20.09)


PIB, Inflação, Desemprego e seus índices

0. Introdução à Análise Econômica


Preâmbulo e algumas definições usuais
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 3
Proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98
O que aprendemos na aula 1, na terça-feira (20 de setembro)?
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
4
O Macroambiente e a Economia

Macroambiente
Ambiente Político

Ambiente Econômico Ambiente Setorial

Ambiente Social
Organização
Ambiente Tecnológico

Ambiente Ecológico

Ambiente Legal

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
5
Elementos de uma Análise Econômica

Análise Microeconômica: agentes e mercado


1. Ambiente Econômico
Análise Macroeconômica: agregados e políticas

Conjuntural: curto/médio prazo, oscilações no panorama


2. Tipo de Abordagem Estrutural: longo prazo, alterações na base da economia

Conceitos: definições usuais em economia


Modelos: operacionalização dos conceitos econômicos para análises.
3. Caixa de Ferramentas
Índices: expressões numéricas (taxas, indicadores etc.) que expressam a economia.

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
6
Em resumo: nível de atividade de uma economia

Objetivos Econômicos Índices

▪ Crescimento Econômico ▪ PIB (% crescimento)


▪ Estabilidade de Preços ▪ Taxa de Inflação
▪ Geração de Emprego ▪ Taxa de Desemprego

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
7
PIB: operacionalizando o conceito em um modelo*

PIB = C + I + G + (Ex – Im)

Gastos do Governo

Exportação

Importação
Investimento
Consumo
*Ótica do PIB do dispêndio/despesa/demanda
Temos, igualmente, as ótica sda oferta/produção e da renda.
Para + informações: https://www.ibge.gov.br/explica/pib.php
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
8
Componentes do PIB e seus fatores de impacto

Nível de renda disponível (poder de compra, tributação)


Consumo Expectativas (confiança, humor) das famílias
Distribuição de renda na economia

Ritmo das inovações tecnológicas


Investimento Taxa de Poupança (privada e pública)
Nível da taxa de juros (trade-off); taxa de retorno.

Controle da atividade econômica


Gastos do Governo Prestação de serviços públicos
Provisão das políticas sociais

Taxa de câmbio
Balança Comercial Competitividade internacional
Políticas de comércio exterior
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
9
O que é Inflação e quais são seus tipos?

Inflação: o aumento do nível de preços de uma economia.

Inflação de Demanda Inflação de Oferta Inflação Inercial


▪ Nível dos salários ▪ Choque de oferta (-) ▪ Memória inflacionária
▪ Disponibilidade de crédito ▪ Preços administrados ▪ Expectativa dos agentes
▪ Meios de Pagamento ▪ Custos de prod./adm. ▪ Indexação da economia

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
10
Brasil: principais índices de inflação ao consumidor

IPCA - IBGE
Utilização: Meta de Inflação

IGPM - FGV
Utilização: Contratos

IPC - FIPE
Para + informações: https://portal-da-inflacao-ibre.fgv.br/#!/ Utilização: Impostos de SP

ICV - DIEESE
Utilização: Acordos Salariais

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
11
Mercado de Trabalho e Taxa de Desemprego

A partir da população total do país (214 milhões), calcula-se:

174,0 milhões

PIA ou PIT
108,6 milhões
Taxa de Desemprego = Nº. de Desempregados /PEA
Brasil (2°. tri. 2022): 9,1%, com 9,9 milhões de pessoas PEA ou PFT
desempregadas na PEA ; são 98,7 milhões ocupadas.
Para + informações: https://www.ipea.gov.br/cartadeconjuntura/index.php/category/mercado-de-trabalho/ 65,4 milhões

Inativos

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
12
Tipos de Desemprego & Taxa de Desemprego no Brasil
Friccional
▪ Incompatibilidades (...)
▪ Assimetria de Informação
▪ Rotatividade

Conjuntural
▪ Crise econômica
▪ Sazonalidade PNAD contínua - IBGE
▪ Choque externo
Metodologia:
▪ Pop. Idade Ativa (PIA): 14 anos
Estrutural ▪ Desocupado: sem ocupação, disponível
▪ 211 mil domicílios em 3500 municípios
▪ Mecanização agrícola
▪ Em torno de 2000 entrevistadores, por telefone
▪ Automação industrial
▪ Média trimestral (dados do mês com os dois
▪ Inteligência artificial
meses imediatamente anteriores)
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
13
Brasil: Nível de Atividade
projeção 2022 (base 31 ago.)

Projeção 2022 Pressupostos

PIB (% cres.)
2,4% (mercado); e 2,5% (governo)

Tx. de Desemprego (média) 9,5% (média); 9,0% (final do ano)

IPCA: 6,4% (meta de inflação do CMN de 3,5%);


Tx. de Inflação IGPM: 9,6%

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
14
Aula de hoje: o nosso 2º degrau!

Fundamentos sobre Nível de Atividade:


PIB, Inflação e Desemprego
Princípios de PolíticaeEconômica:
seus índices
Fiscal, Monetária, Cambial e seus instrumentos

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 15
Proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98
Macroeconomia & Ambiente de Negócios

Macroeconomia: nível de atividade | políticas econômicas

Passado Recente Conjuntura Atual Cenários Futuros

Setor, Mercados e Organizações

Planejamento Objetivos Ações

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
16
Problemas Econômicos e seus trade-off !?

Como alavancar o crescimento econômico sem colocar em


risco a estabilidade de preços (vide inflação nos últimos 18
meses)?

Como determinar a taxa de juros do país em 2022/2,


considerando uma taxa neutra (ou taxa de equilíbrio)?

Como equilibrar receitas e despesas do governo diante das


demandas sociais pós-pandemia?

Enfim, essas são questões de política econômica, tema da nossa de hoje!


MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
17
Problemas Econômicos requerem Políticas Econômicas!

Política Econômica: intervenção do governo na economia

Conjuntural Estrutural
▪ Política Fiscal ▪ Política Agrícola
▪ Política Monetária ▪ Política Industrial
▪ Política Cambial ▪ Política Previdenciária
▪ (...)

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
18
Funções do Governo na Economia

Função Alocativa Função Estabilizadora


Combate ao desemprego, manutenção da
Fornecimento de bens públicos,
estabilidade dos preços e busca pelo
financiado por impostos e avaliado pelos
crescimento econômico.
resultados eleitorais.
Ex.: Controle da Demanda Agregada
Ex.: Infraestrutura e políticas sociais.

Função Distributiva
Ajuste na distribuição de renda visando à
redução da desigualdade social
Ex.: Transferências e Impostos

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
19
O Problema Fiscal no Setor Público

Receitas
Despesas

Política Fiscal

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
20
Balancete Simplificado de um Governo

Receitas Despesas
Impostos Diretos Consumo do Governo
Dos indivíduos Bens e serviços nacionais
Das empresas Bens e serviços importados
Impostos Indiretos Salários pagos
Produção Transferências
Consumo A indivíduos
Contribuições A empresas
Fundos Ao exterior
Taxas Subsídios
Transferências Intergovernamentais Investimentos Públicos
Pagamentos de Juros

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
21
Tipos de Impostos e Política Tributária Regressiva no Brasil

Sobre renda e propriedade


(respeitando o princípio de
progressividade)
Ex.: IRPF, IPTU, IPVA

Sobre a venda de serviços e


bens (contrariando o
princípio de progressividade)
Ex.: ICMS, IPI, ISS

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
22
Impostos no Brasil por Nível de Governo & Divisão da Arrecadação

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
23
Resultado das Contas Públicas

Despesas
> Receitas

Receitas > Despesas não-financeiras (exceto juros da dívida)

Despesa Total > Receita Total

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
24
Resultado Primário & Nominal
Ilustrando as contas públicas de um país fictício

(R$ bilhões)

Receita 1.000.000

Despesa não-Financeira - 950.000

Resultado Primário 50.000

Despesa Financeira - 150.000

Resultado Nominal - 100.000

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
25
Como os governos podem financiar o déficit público?

NFSP = Emissão de Moeda e/ou Emissão de Títulos


(Banco Central, não usual) (Governo, tradicional)

▪ Pressão sobre a Demanda Agregada ▪ Impacto na Taxa de Juros


▪ Inflação ▪ Aumento da Dívida Pública
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
26
Contas Públicas no Brasil nos últimos anos

2015 2016 2017 2018 2019 2020 2021 2022P


Finanças Públicas
Resultado primário - % do PIB -1,9 -2,5 -1,7 -1,5 -0,8 -9,4 0,7 0,3
Resultado nominal - % do PIB -10,2 -9,0 -7,8 -7,0 -5,8 -13,6 -4,4 -7,0
Dívida pública bruta - % do PIB 65,5 69,9 73,7 75,3 74,3 88,8 80,3 78,9
Fonte: Tesouro Nacional

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
27
Visitem o site do Tesouro Direto

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
28
Vídeo: contextualizando a Política Monetária

Reportagem, TV Brasil, 22 de setembro de 2002.


https://www.youtube.com/watch?v=u8RU3sox3nc

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
29
O Problema Monetário na Economia
Para conciliar crescimento econômico com a
estabilidade de preços o Bacen deve:

▪ Administrar a taxa de juros básica


para investimentos < taxa de retorno de longo prazo
para capital de giro < margens
para consumo: não proibitivos
▪ Gerir o alcance da meta de inflação
Controlar a oferta monetária (meios de pagamento)

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
30
O BACEN determina a taxa de juros básica (SELIC); 13,75% (set. 2022).

Conjuntura Nacional Panorama Externo

(oito reuniões/ano)

Crescimento & Hiato do Produto Risco-país (EMBI, CDS)


Inflação: comportamento e meta Taxa de juros internacional (EUA)
Mercado financeiro doméstico Mercado financeiro internacional

2015 2016 2017 2018 2019 2020 2021 2022P


Taxa de Juros
Selic - final do ano - % 14,25 13,75 7,00 6,50 4,50 2,00 9,25 13,75
Fonte: Banco Central

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
31
Instrumentos de Política Monetária

Open Market Taxa Compulsório Taxa de Redesconto

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
32
O que são Operações de Open Market?

São operações de compra e venda de títulos no


mercado secundário (papéis emitidos anteriormente
pelo governo já em circulação). Essas operações são
realizadas pelo Banco Central com o objetivo de gerir
os meios de pagamento (e a liquidez da economia).

Obs: o Bacen utiliza exclusivamente títulos públicos federais nessas operações de open market.

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
33
Alguns instrumentos de Política Monetária
para o controle da oferta monetária do país

Open Market: operações com títulos


BANCO CENTRAL

Venda Títulos R$ < liquidez

Recompra R$ Títulos > liquidez

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
34
O que é o Compulsório?
Percentual dos depósitos bancários que são recolhidos
no Bacen para controle da oferta monetária.

Exemplo:

Brasil - 2022: dep. à vista: 25%; dep. à prazo: 20%; dep. poupança: 20%

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
35
Uma demonstração: sem e com taxa compulsório no depósito à vista

0%, 1000 de papel moeda 25%, 1000 de papel moeda


Banco 1 Banco 1
Empréstimos Depósitos à vista Compulsório Depósitos à vista
R$250
R$1.000 R$1.000
Empréstimos R$ 1.000
R$750

Banco 2 Banco 2
Empréstimos Depósitos à vista Compulsório Depósitos à vista
R$ 187,50
R$1.000 R$1.000
Empréstimos
R$750
R$ 562,50

Banco 3 Banco 3
Empréstimos Depósitos à vista Compulsório Depósitos à vista
R$ 140,62
R$1.000 R$1.000
Empréstimos R$ 562,50
R$ 421,88

MP = 4.000
MBA em Data Science e Analytics Meios Análise
Disciplina de Pagamento = Papel
da Conjuntura Moedaem
Econômica emCenários
Circulação + Depósitos
de Tecnologias à Vista II
Disruptivas MP = 3.312,50
Prof. Dr. Fernando de S. Coelho
36
Visitem o site do BACEN

Fonte: www.bcb.org.br
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
37
Vídeo: contextualizando a Política Cambial

Reportagem, Canal Rural, 3 de Janeiro de 2022.

Acessar o vídeo da reportagem pelo link:

https://www.canalrural.com.br/noticias/quais-as-projecoes-
do-dolar-para-2022-veja-analise-de-5-economistas/

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
38
As Transações Externas e a Taxa de Câmbio

• Exportações
• Remessa de Lucro
• Pagamento de Juros
R$ • Amortização da Dívida

Economia Doméstica Mercado Externo

• Importações US$
• Empréstimos
• Investimento Direto Tx Câmbio: R$/US$
• Capital de Curto Prazo

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
39
Quais são os regimes cambiais?

▪ Bacen estipula uma taxa de câmbio fixa


Câmbio Fixo ▪ Vantagem: Previsibilidade cambial
▪ Desvantagem: Perda de credibilidade do Bacen pela ausência de liberdade cambial

▪ Bacen define limites máximo e mínimo para o câmbio


Bandas Cambiais ▪ Vantagem: Certa previsibilidade cambial
▪ Desvantagem: Perda de credibilidade do Bacen no mercado pela interferência no mercado

▪ Bacen negocia títulos cambiais (swaps) em momentos de stress


Flutuação Suja ▪ Vantagem: Certo ganho de credibilidade
▪ Desvantagem: Incerteza quanto à atuação do Bacen

▪ Bacen não interfere no mercado de câmbio


Câmbio Flutuante ▪ Vantagem: Ganho de credibilidade
▪ Desvantagem: Imprevisibilidade cambial

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
40
Balanço de Pagamentos: registro das transações externas

Balança Comercial (I)


▪ Exportações
▪ Importações
Balança de Serviços e Rendas (II)
▪ Serviços (Juros, Remessas de Lucros, Aluguéis, Fretes,
Seguros, viagens Internacionais)
Transferências Unilaterais (III)

Saldo em Conta Corrente (IV = I + II + III)

Conta Capital e Financeira (V)


▪ Investimentos Diretos
▪ Empréstimos e Financiamentos Externos Saldo do Balanço de Pagamentos (VI = IV + V)
▪ Amortizações
▪ Capitais de Curto Prazo

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
41
Cálculo do Balanço de Pagamentos
Ilustrando o Balanço de Pagamentos de um país fictício

(R$ milhões)

Balança Comercial 1.736

Balança de Serviços e Rendas 5.470

Conta Corrente 7.206

Conta Capital e Financeira (4.132)

Balanço de Pagamentos 3.074 Qual a relação entre o BP e a taxa de câmbio?

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
42
Reservas Internacionais e Taxa de Câmbio Flutuante

Se o Saldo do Balanço de Pagamentos é positivo:

• Aumentam as Reservas Internacionais


• Valorização da Moeda Nacional Tx Câmbio: R$/US$
• Apreciação Cambial

Se o Saldo do Balanço de Pagamentos é negativo:

• Diminuem as Reservas Internacionais


• Desvalorização da Moeda Nacional Tx Câmbio: R$/US$
• Depreciação Cambial
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
43
Ilustrando o Balanço de Pagamentos do Brasil, didaticamente:
(em US$ bilhões, anos selecionados 2011-2014, fonte: Bacen)

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
44
Contas Externas no Brasil nos últimos anos

Brasil
2015 2016 2017 2018 2019 2020 2021
Contas Externas
Taxa de Câmbio (R$/US$) - final de período 3,96 3,26 3,31 3,88 4,03 5,19 5,57
Balança comercial - US$ bilhões 13,7 40,2 56,0 46,6 35,2 50,4 61,0
Conta corrente - % PIB -3,0 -1,4 -1,1 -2,7 -3,5 -1,7 -1,75
Investimento direto no país - % PIB 3,6 4,1 3,3 4,1 3,7 3,1 2,9
Reservas internacionais - US$ bilhões 369,0 372,2 381,6 387,0 366,9 355,6 362,2

Fonte: Bacen

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
45
Enquete 1: aplicando o conhecimento desta aula.

Suponha um país com exportações anuais de US$ 505 bilhões e


importações anuais equivalentes a US$ 495 bilhões. Além disso,
considere que a conta capital tenha um superávit anual de US$ 15
bilhões e que a balança de serviços apresente um déficit de US$ 15
bilhões. Qual é o saldo do Balanço de Pagamentos desse país?

(A) Positivo, em US$ 10 bilhões.


(B) Negativo, em US$ 10 bilhões.
(C) Positivo, em US$ 20 bilhões.
(D) Negativo, em US$ 20 bilhões.

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
46
Em síntese: políticas econômicas conjunturais

Política Fiscal Política Monetária Política Cambial

▪ Resultado Primário ▪ Taxa de Juros Básica ▪ Taxa de Câmbio


▪ Resultado Nominal ▪ Open Market e Compulsório ▪ Balanço de Pagamentos
▪ Meta: % superávit primário /PIB ▪ Meta: meta de inflação ▪ Meta: regime câmbio flutuante

Tripé Macroeconômico
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
47
Nosso 3º e último degrau!

Sistema Financeiro, Mercados e Ambiente Econômico


Análise da conjuntura econômica e projeção de cenários

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 48
Proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98
O Sistema Financeiro Nacional (SFN) e os seus Mercados

O SFN é composto pelas instituições responsáveis pela captação de recursos financeiros,


pela distribuição e circulação de valores e pela normatização e fiscalização do processo.
O conjunto dessas funções e suas organizações formam o Mercado Financeiro, subdivido
em:

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
49
Estrutura do Sistema Financeiro Nacional no Brasil

Órgãos Normativos Entidades Supervisoras Operadores

▪ Bancos, Cooperativas e Fintechs


▪ CMN ▪ BACEN ▪ Sociedades Seguradoras
(Conselho Monetário Nacional)
▪ CVM ▪ Resseguradores
▪ CNSP (Comissão de Valores Mobiliários)
▪ Demais Instituições Financeiras
(Conselho Nacional de Seguros Privados) ▪ SUSEP ▪ Bolsas de Valores
▪ CNPC (Superintendência de ▪ Bolsa de Mercadorias e Futuros
(Conselho Nacional de Previdência Seguros Privados)
Complementar) ▪ PREVI ▪ Outros Intermediários Financeiros e
Administradores de Recursos de Terceiros.
(Superintendência Nacional de Previdência
Complementar)
▪ Entidades Abertas de Previdência
Complementar.
▪ Fundos de Pensão

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
50
Brasil: Conjuntura Econômica,
projeção 2022 (base set./2022)
Projeção para 2022
Projetado (meados/2021) vs. Realizado 2021

2,5 % 4,0% – 4,6%


PIB (% cres.)

8,5% 13,5% – 11,8%


Tx. de Desemprego (dez.)

Tx. de Inflação (IPCA) 6,4% (meta de inflação do CMN de 3,5%); 6,5% – 10,1%

Tx. de Juros (final do ano) 13,75% 7,5% – 9,25%

Contas Públicas 0,3% (Primário) | 6,8% (Nominal) -1,0% – 0,8% (Primário)

Tx. de Câmbio (final do ano)


5,20 (R$/US$)
5,00 – 5,57
MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
51
Para finalizarmos nossa aula 3!

SAIBA MAIS: orientação para saber mais!

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 52
Proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98
Algumas indicações
Documentários e Filmes.

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
53
Algumas indicações
Livros

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
54
Para finalizarmos nossa disciplina!

SAIBAchecar
Vamos MAIS:se atingimos nossos
orientação para objetivos?
o pós-curso

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
*A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 55
Proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98
Recordando os objetivos dessa disciplina e refletindo:

Eu adquiri uma visão rápida do funcionamento da Economia?

Eu compreendi de forma descomplicada algumas relações de causa


e efeito na conjuntura econômica e a dinâmica das políticas
econômicas conjunturais?

Se sim, você está apto, portanto, a pensar a relação entre o


ambiente econômico e a sua organização, incluindo os seus
mercados e negócios.

MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
56
Muito obrigado, novamente, pela atenção de vocês,
na aula de hoje e durante toda a nossa disciplina.

www.facebook.com/fernandosouzacoelho

Sucesso na continuidade do MBA e na trajetória profissional pós-curso!


MBA em Data Science e Analytics Disciplina Análise da Conjuntura Econômica em Cenários de Tecnologias Disruptivas II Prof. Dr. Fernando de S. Coelho
57
TÓPICOS ESPECIAIS -
LIDERANÇA EM DATA SCIENCE

Mateus C. Gerolamo

1
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98

2
Liderança em Data Science

Prof. Mateus C. Gerolamo

MBA USP Data Science


ESALQ
04 de outubro de 2022

3
Agenda / Conteúdo

4
❖ Apresentação
❖ Introdução
Conteúdo do Material

❖ Liderança ✓ Ambientes de liderança


✓ Desenvolvimento Histórico
✓ Conceitos
❖ Tipos de liderança
✓ Gestão versus Liderança

❖ Liderança para o Futuro


✓ Teorias dos Traços
❖ Treinamento & Desenvolvimento de Líderes
✓ Modelo Big Five de Personalidade
❖ Inteligência Emocional ✓ Teorias Comportamentais (Universidade de Ohio
❖ Resumo e Implicações para os Gestores e Organizações e Universidade de Michigan)
✓ Teorias Contingenciais
❖ Recado Final ✓ Teoria de Troca entre Líderes e Liderados (LMX)
❖ Referências ✓ Liderança Transacional
✓ Liderança Carismática
✓ Liderança Transformacional
✓ Liderança Autêntica

5
Apresentação

6
GRUPO DE PESQUISA EM GESTÃO DA MUDANÇA E INOVAÇÃO
Mateus C. Gerolamo DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO
Professor Associado ESCOLA DE ENGENHARIA DE SÃO CARLOS
UNIVERSIDADE DE SÃO PAULO
❖ Professor da Universidade de São Paulo (USP).
❖ Área de atuação compreende Gestão da Qualidade, Mudança e Inovação.
❖ Livre-Docência pela USP e Pós-doutorado pelo Instituto de Tecnologia de Berlim (TUB).
❖ Doutor, Mestre e Engenheiro de Produção pela USP.
❖ Mais de 15 anos de experiência em pesquisa, docência e projetos de consultoria com ênfase em Gestão
de Mudanças e Cultura Organizacional.
❖ Experiências em diversos setores: alimentos, automobilístico, construção civil, cosméticos, educação,
saúde, serviços, têxtil, dentre outros, em pequenas, médias, grandes e empresas do terceiro setor.
❖ Responsável por aula na graduação, pós-graduação lato e stricto sensu, e MBA.
❖ Ministra cursos em MBAs da USP e UFSCar (Gestão da Mudança e da Inovação, Liderança, Balanced
Scorecard, Gestão da Qualidade).
❖ Autor de livros, artigos nacionais e internacionais; revisor de periódicos internacionais, dentre eles o
Journal of Organizational Change Management.
❖ Certificado CTT1 (Cultural Transformations Tools) – Richard Barrett Centre.
LinkedIn: https://www.linkedin.com/in/mateus-gerolamo-802b965/
Curriculum Vitae Lattes: http://lattes.cnpq.br/3002611390279533
Research team: http://change.prod.eesc.usp.br
Google Scholar: https://scholar.google.com.br/citations?user=t5efBTUAAAAJ
Facebook: https://www.facebook.com/groups/gestaodamudanca
ORCID: https://orcid.org/0000-0002-6535-0904
Curriculum Lattes: http://lattes.cnpq.br/3002611390279533
Scopus: https://www.scopus.com/authid/detail.uri?authorId=6504619454
EESC: https://eesc.usp.br/
Research ID: http://www.researcherid.com/rid/G-7182-2012
USP: https://www5.usp.br/ 7 7
Research Gate: https://www.researchgate.net/profile/Mateus_Gerolamo
Grupo de Pesquisa: http://change.prod.eesc.usp.br

8
Principais fontes de Inspiração para
BACKGROUND
Pesquisa, Aplicação e Ensino

Mateus C. Gerolamo, Engenharia de Produção, Escola de Engenharia de São Carlos (EESC), Universidade de São Paulo (USP), Gestão da Mudança

9
Leituras Recomendadas

10
Avaliação do Nível de Energia

11
Introdução
• Gerencie sua Energia, não o seu Tempo!

Você está próximo


de uma crise?
Como está a sua
energia?
Fonte: Schwartz and McCarthy (2007)

12
Exercício

8 minutos

Avaliação da sua Energia

• Responda as perguntas, colocando


um “x” em tantas alternativas
quanto achar que corresponde ao
seu dia a dia;

• Avalie as seguintes dimensões:


▪ Corporal,
▪ Emocional,
▪ Mental, e
▪ Espiritual;
Fonte: Schwartz and McCarthy (2007)

13
Exercício

8 minutos

Avaliação da sua Energia

• Resultado Geral:
0 – 3: Excelente habilidade de gerenciar energia
4 – 6: Habilidade de gerenciar energia razoável
7 – 10: Déficit significante na habilidade de gerenciar energia
11 – 16: Déficit grave na habilidade de gerenciar energia

• Resultado por Categoria:


0: Excelente habilidade de gerenciar energia
1: Forte habilidade de gerenciar energia
2: Déficit significante na habilidade de gerenciar energia
3: Pouca habilidade de gerenciar energia
4: Déficit grave na habilidade de gerenciar energia Fonte: Schwartz and McCarthy (2007)

14
Exercício

8 minutos

Avaliação da sua Energia

• Plano de ação
Documente o seu plano de ação para essa semana
para melhorar a sua gestão de energia.

• Resultado
Após uma semana, descreva o impacto da ação
escolhida na sua capacidade de exercer
autocontrole e na sua produtividade.
Fonte: Schwartz and McCarthy (2007)

15
Introdução

16
Introdução
• Por que falhamos?
Não executamos
completamente, e
Não definimos os nossos a tempo, os Planos
problemas de forma correta de Ação de forma
correta
Não colocamos as
metas certas Não fazemos
bons Planos de
Ação (falta de
conhecimento ou
de método) Podem ocorrer
circunstâncias fora
Fonte: Falconi (2009), O Verdadeiro Poder, pág. 3. de nosso controle
17
Introdução
• O que Precisamos Fazer para Não Falharmos?

Liderar!

Gerenciar! Executar!
O gerenciamento é focado nos fins e, portanto,
na missão geral de qualquer organização...
Fonte: Falconi (2009), O Verdadeiro Poder, pág. 3.

18
Introdução
“Satisfazer as
necessidades
Qual é a Missão dos seres
Geral de uma humanos”
Organização?

Fonte: Falconi (2009), O Verdadeiro Poder, pág. 3.

19
Introdução
Quem são os Seres Humanos em uma Organização?
Existem quatro tipos de seres humanos que estão nos objetivos de qualquer
organização e são chamados stakeholders ou “partes interessadas”:

Quem mais?
Colaboradores
Clientes

Acionistas

Fonte: Falconi (2009), O Verdadeiro Poder, pág. 3. Sociedade


20
Introdução
• Uma boa gestão
liderança deveria considerar todas essas
dimensões de métricas em todos os níveis de uma
organização:

Foco nos Colaboradores


Foco Financeiro Foco no Cliente Foco na Sociedade

“Isto é raro, mas é como deveria ser!”

Fonte: Falconi (2009), O Verdadeiro Poder, pág. 4.

21
Introdução
• É preciso atender aos requisitos (necessidades e/ou desejos) dos
principais stakeholders da organização! Uso de indicadores!

• Se os Clientes fossem os stakeholders mais importantes,


qual seria o principal indicador?
• Se os Empregados fossem os stakeholders mais
importantes, qual seria o principal indicador?
• Se a Sociedade fosse o stakeholder mais importante,
qual seria o principal indicador?
• Se os Acionistas fossem os stakeholders mais
importantes, qual seria o principal indicador?

Fonte: Falconi (2009), O Verdadeiro Poder, pág. 3.

22
Introdução
Sistema de Medição de Desempenho e
uso de Indicadores:
• A mensagem mais importante é que esses indicadores não podem ser
acompanhados apenas pela alta administração;
• Eles devem ser desdobrados por toda a organização de forma que possam ser
trabalhados continuamente;
• Indicadores estabelecidos em diferentes e importantes dimensões da organização
dão origem a vários outros, num processo de desdobramento e, se todos os
indicadores estiverem alinhados por meio de relacionamento de causa-efeito, a
empresa estará alinhada para garantir a sua própria sobrevivência.

Fonte: Falconi (2009), O Verdadeiro Poder, pág. 7.

23
Introdução
• Sistema de Medição de Desempenho e uso de Indicadores:
Balanced Scorecard (BSC) – Mapa Estratégico

Balanced Scorecard (BSC)

24
“Assim como a paternidade, provavelmente a
liderança nunca será uma ciência exata. Mas também
não precisa ser um completo mistério para aqueles
que a praticam... as pesquisas têm ajudado os pais a
entenderem os componentes genéticos, psicológicos
e comportamentais que afetam seus “desempenhos
no trabalho”.... Assim como os pais, os líderes
também podem obter uma clara fotografia daquilo
que precisam para liderar eficazmente. E talvez tão
importante, eles podem ver como fazer acontecer.”

“O ambiente de negócios está continuamente


mudando e um líder deve responder em qualidade.
Hora a hora, dia a dia, semana a semana, os
executivos devem desempenhar seus estilos de
liderança como um profissional, usando o que é
certo, no tempo certo e na medida certa. O retorno
será percebido por meio dos seus resultados.”
Fonte: Goleman, D. (2000), Leadership that Gets Results, p. 90. 25
Liderança

Dois Mapas Mentais


26
Liderança significa
apenas uma posição
de autoridade e Mapas Mentais
superioridade em Líderes apresentam
relação aos outros estilo único: ou
focados na tarefa ou
Motivação segue focados nas pessoas
instruções,
recompensas e
Pessoas recebem
punições
privilégios com base
Pessoas buscam em sua posição / seu
interesse status
próprio
Pessoas sentem medo

Pessoas
preferem o Pessoas competem por
status-quo recursos limitados

A organização foca
Pessoas limitam-se a em burocracias
suas responsabilidades desnecessárias

Mapa Mental # 1 Cultura baseada em


conflitos entre áreas
Fonte: Quinn, R. Positive Organization, 2015.

27
Mapas Mentais

(Source: Black and Gregersen, 2003, Leading Strategic Change, apud Robert Quinn)

“Se os líderes não podem


mudar seus mapas
mentais individuais, eles
não poderão mudar os
destinos que as pessoas
seguem, nem os caminhos
que as levarão até lá!”

Fonte: Quinn, R. Positive Organization, 2015. Source: greggfetter.blogspot.com

28
Mapas Mentais

(Source: Black and Gregersen, 2003, Leading Strategic Change, apud Robert Quinn)

“Se os líderes não podem


mudar seus mapas
ampliar
mentais individuais, eles
não poderão mudar os
destinos que as pessoas
seguem, nem os caminhos
que as levarão até lá!”

Fonte: Quinn, R. Positive Organization, 2015. Source: greggfetter.blogspot.com

29
Liderança significa
apenas uma posição
de autoridade e
Mapas Mentais
Liderança significa
superioridade em influência,
relação aos outros Líderes apresentam independentemente da
estilo único: ou autoridade ou posição
Motivação segue focados na tarefa ou formal
instruções, focados nas pessoas
recompensas e Líderes apresentam ambos
punições Pessoas recebem os estilos: focados na tarefa
Motivação segue
privilégios com base e focados nas pessoas
Pessoas buscam propósito, inspiração, e
em sua posição / seu recompensas intrínsecas
interesse
status Pessoas são valorizadas
próprio
independentemente de sua
Pessoas sentem medo posição hierárquica ou status Pessoas mostram
compaixão / respeito
Pessoas
preferem o Pessoas competem por Pessoas sentem-se confiantes
status-quo recursos limitados Pessoas
Pessoas expandem suas fontes
de recursos buscam
Pessoas limitam-se a A organização foca crescimento
suas responsabilidades em burocracias A organização tem agilidade
desnecessárias para agir e decidir Pessoas expandem
Cultura baseada seus papéis
Mapa Mental # 1
em conflitos Cultura Colaborativa
Fonte: Quinn, R. Positive Organization, 2015. Mapa Mental # 2
entre áreas 30
5 1
0 9 8-
73 .
5 .2
a 31
Liderança
u sh i Yo
sh i d

Ats
elo
ar c
M

Desenvolvimento Histórico e Conceitos


31
Introdução
• Linha do tempo do desenvolvimento do conceito de Liderança

Teoria dos traços Teorias de Contingência e


(até final dos anos 40) Teorias Interativas de
liderança

1900 1920 1940 1960 1980 2000 2020

Teorias comportamentais Abordagens contemporâneas:


(até final dos anos 60) Teorias de liderança carismática,
liderança transformacional,
liderança autêntica
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 358.

32
Introdução
Influência das Teorias de Psicologia no desenvolvimento do conceito

Fonte: Renner (2012), Psico, pág. 23.

33
Introdução
Influência das Teorias de Psicologia no desenvolvimento do conceito

Fonte: Renner (2012), Psico, pág. 25.

34
Introdução
Existem três fatores fundamentais para a obtenção
de resultados em qualquer iniciativa humana:

LIDERANÇA

CONHECIMENTO
MÉTODO
TÉCNICO
Fonte: Falconi (2009), O Verdadeiro Poder, pág. 13-19.

35
Introdução
Entre os três fatores
(liderança, De nada adianta
conhecimento técnico e método ou
método), a liderança é Sem ela nada acontece; conhecimento técnico
o que há de mais se não existe liderança
importante numa para fazer acontecer.
organização;

LIDERANÇA
Fonte: Falconi (2009), O Verdadeiro Poder, pág. 13-19.

36
Conceito de Liderança

Os líderes estabelecem direções


por meio do desenvolvimento de
Liderança é a capacidade de
uma visão de futuro; depois
influenciar um conjunto de A liderança diz respeito ao
engajam as pessoas,
pessoas para alcançar metas e gerenciamento do mudança;
comunicando-lhes essa visão e
objetivos;
inspirando-as a superar os
obstáculos.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 359.

37
Para desenvolver o conteúdo
Agenda de liderança, é preciso definir
“Liderar é bater a agenda do líder
do Líder metas ▪ Atribuir metas baseadas em lacunas
▪ Promover o domínio do método pela equipe
▪ Promover a aquisição de conhecimento
5 1
8-
Alcançar Metas
técnico do processo pela equipe
. 0 9
▪ Recrutar
.2 73
Consistentemente, ▪ Treinar
▪ Inspirar 31 5
com o time
i d
▪ Fazer Coaching a
sh
Yo
LIDERANÇA Com Time ▪ Promover a Meritocracia

sh i
▪ Desenvolver as pessoas de formas que “expandam” sua zona de conforto
▪ Fazer uma avaliação de desempenho honesta e construtiva
ts u▪ Demitir quando preciso

o A ▪ Ter um sistema de incentivos alinhados com metas

ce
e fazendo rcerto.”
l
M a ▪ Promover cultura única
▪ Cultura de alto desempenho
▪ Cultura de fatos e dados
Fazendo Certo ▪ Cultura de honestidade intelectual
▪ Cultura de enfrentamento dos fatos
▪ Alinhamento com valores da empresa
Fonte: Falconi (2009), O Verdadeiro Poder, pág. 14.

38
Liderança

Gestão (Gestores) versus Liderança (Líderes)


39
Gestores versus Líderes
As organizações precisam de:

Gestores capazes de Líderes que desafiem


elaborar planos o status quo, que
detalhados, criar Liderança e gestão criem visões de
estruturas fortes para atingir o futuro e sejam
organizacionais nível ótimo de capazes de inspirar
eficientes e gerenciar eficácia. os membros da
as operações do dia a organização a querer
dia. realizar essas visões.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 360.

40
Gestores versus Líderes
Organizações hoje em dia são super-gerenciadas e sub-lideradas;

Não é uma questão de ser líder ao invés de gestor;

Liderança complementa o gerenciamento; ela não o substitui;

Empresas inteligentes valorizam ambos os tipos de profissionais – gestores e


líderes – e trabalham duro para fazê-los parte do mesmo time;
Da mesma forma como as organizações precisam de bons gestores para lidar com
seus problemas de complexidade nos ambientes atuais de negócios, as
organizações também precisam desenvolver uma cultura para criar lideranças.
Fonte: Adaptado de Kotter, J. P. What Leaders Really Do; Harvard Business Review, May-Jun 1990, p. 102-111.

41
Gestores versus Líderes

Gestores Líderes
Complexidade Lidam com Desafios de transformação

Ordem e consistência Buscam Mudanças organizacionais

Objetivos e metas Estabelecem Direção, visão de futuro

A estrutura organizacional e as funções p/ A organização focando no alinhamento das


Desenvolvem
a realização dos planos estabelecidos pessoas em direção à visão estabelecida

Os planos para as pessoas delegando A visão para aqueles que podem criar
Comunicam
responsabilidades para a implementação coalizões comprometidas
Na motivação e inspiração, mantendo as
No monitoramento detalhado dos
Focam pessoas no caminho certo, apoiando as
resultados obtidos versus planejados
pessoas na superação das barreiras
Fonte: Adaptado de Kotter, J. P. What Leaders Really Do; Harvard Business Review, May-Jun 1990, p. 102-111.

42
Gestores versus Líderes

Gestores Líderes
Bons gestores lidam com a complexidade e trazem um grau de Líderes efetivos lidam com mudanças organizacionais.
ordem e consistência para o negócio.
Estabelecem objetivos e metas, desdobrando-os em passos Estabelecem uma direção, ou seja, uma visão de futuro para a
detalhados para alcançar seus objetivos, e alocando recursos para organização (normalmente um futuro mais distante).
realizar esses planos.
Criam uma estrutura organizacional e um conjunto de funções para a Desenvolvem a organização focando no alinhamento das pessoas –
realização dos planos estabelecidos, atribuindo às funções indivíduos comunicando a nova direção para aqueles que podem criar coalisões
qualificados, comunicando o plano para tais pessoas, delegando que entendam a visão e estejam comprometidas com seu alcance.
responsabilidade para realizar o plano, e desenvolvendo sistemas
para monitorar a implementação.
Monitoram em detalhes os resultados obtidos versus os resultados Buscam a motivação e inspiração – mantendo as pessoas no
planejados, tanto formalmente quanto informalmente, utilizando caminho certo, ainda que existam grandes barreiras para a mudança,
relatórios, reuniões e outras ferramentas; identificando desvios; e apelando para suas necessidades humanas básicas (um senso de
planejando e organizando a resolução de problemas. pertencimento, reconhecimento, autoestima, um sentimento de
controle sobre as próprias vidas, e a habilidade de cumprir com as
expectativas e ideais das pessoas), seus valores e suas emoções.
Fonte: Adaptado de Kotter, J. P. What Leaders Really Do; Harvard Business Review, May-Jun 1990, p. 102-111.

43
Gestores versus Líderes
5 1
0 9 8-
As empresas precisam e muitas
7 3 .
.2
tentam desenvolver “gestores-
5
líderes”;31
i d a
sh
Yo
Uma vez que as organizações
entendam as diferenças
sh i Segundo John Kotter, há uma
fundamentais entre liderança e
t s u teoria que argumenta que
gerenciamento, elas podem
o A
el
começar a tratar suas pessoas
c
pessoas não podem, ao

M ar
chave para promover ambas as
áreas de atuação: gerenciamento e
mesmo tempo, gerenciar e
liderar;
liderança!

Fonte: Adaptado de Kotter, J. P. What Leaders Really Do; Harvard Business Review, May-Jun 1990, p. 102-111.

44
Gestores versus Líderes

No entanto, quando as empresas começam a preparar as pessoas para seus


cargos executivos, elas normalmente ignoram a teoria que argumenta que
pessoas não podem, ao mesmo tempo, gerenciar e liderar. Elas tentam
desenvolver gestores-líderes. Uma vez que as organizações entendam as
diferenças fundamentais entre liderança e gerenciamento, elas podem
começar a tratar suas pessoas chave para promover ambas as áreas de
atuação: gerenciamento e liderança!

Fonte: Adaptado de Kotter, J. P. What Leaders Really Do; Harvard Business Review, May-Jun 1990, p. 102-111.

45
ESTUDO DE CASO EM LIDERANÇA

Caso: Sara e Davi

- Adaptado de ZF – Zenger Folkman –


Fonte: Fonte: ZF – Zenker Folgman Company, Leadership Case Study:
Inspires and Motivates Others to High Performance, 2012.

46 46
ESTUDO DE CASO EM LIDERANÇA
Caso: Sara e Davi

A ToU é uma empresa líder no desenvolvimento e fabricação de uma ampla gama de soluções
customizadas de hardware. A empresa se orgulha por ser reconhecidamente honesta e direta em seus A todo momento ela tinha certeza de que tudo estava no caminho certo. Essas foram falhas muito visíveis
negócios com clientes e funcionários, e em sua capacidade de entregar, no prazo acordado, difíceis que acabaram impactando o desempenho de toda a equipe de Sara. Os outros contratempos foram
projetos. Sara é uma gerente sênior do ToU há quatro anos e lidera uma equipe na área de serviços relacionados a confrontos no local de trabalho que ele teve em momentos diferentes com vários de seus
personalizados da empresa. Em uma recente pesquisa de avaliação 360 graus, Sara pontuou acima da companheiros de equipe após as tarefas perdidas.
média (no 70º percentil) quanto a suas habilidades de liderança, mais especificamente na competência
“inspira e motiva os outros para alta performance”. Seu relatório também indicava que seu gerente, Sara se encontrou frequentemente com Davi durante estes últimos meses. Ela se posicionou rapidamente
colegas e subordinados diretos consideravam essa competência crítica para alguém em seu cargo. para chamar a atenção para suas responsabilidades perdidas e comportamento impróprio, querendo ser
Alguns dos comentários escritos em sua pesquisa indicaram que, se ela demonstrasse e aplicasse essa clara para ele e para a equipe que ela o estava responsabilizando por suas ações. Ela entrevistou os
competência com mais frequência, teria um impacto positivo e significativo em seu sucesso no companheiros de equipe de Davi para entender o que aconteceu e o impacto que essas situações estavam
trabalho. Por esses motivos, ela está focando seu desenvolvimento de liderança pessoal no próximo causando nele e na equipe. Ela também passou muito tempo com Davi para obter a perspectiva dele,
ano nessa competência. tentando entender o que estava por trás do comportamento incomum de Davi e ajudá-lo a voltar aos trilhos.
Durante seus encontros com ele, ela às vezes minimizava a seriedade das situações para fazê-lo se sentir
Davi é um dos subordinados diretos de Sara, que trabalha na ToU por mais de nove anos e cujo melhor consigo mesmo.
desempenho histórico tem sido excelente. É geralmente conhecido entre a equipe que Davi não tem
um histórico técnico tão forte quanto a maioria de seus colegas. Ao mesmo tempo, todos reconhecem Durante as reuniões de coaching de Sara com Davi nas últimas duas semanas, ela aprendeu que há várias
que ele tem um estilo de trabalho muito eficiente e dedica-se a qualquer hora extra necessária para coisas que provavelmente contribuem para os problemas recentes de desempenho de Davi. Ele compartilhou
atender às metas pessoais e de equipe. Ele se transferiu de um grupo diferente e se juntou à equipe de alguns problemas pessoais (financeiros e familiares) que claramente o preocupavam. Ele também está
Sara há quase dois anos. preocupado com algumas mudanças de processo e papel na equipe que a Sara instituiu há alguns meses e
que causou mudanças em suas responsabilidades diárias de trabalho.
Infelizmente, Davi teve vários contratempos de desempenho no trabalho nos últimos três meses. Um
deles girava em torno de algumas tarefas críticas perdidas e entregas atrasadas. Sara atribuíra a ele dois Davi aceitou o feedback de Sara, reconheceu e assumiu a responsabilidade por suas ações. Embora seus
projetos com algumas metas adicionais que não seriam fáceis para Davi atingir, mas tinha feito essas problemas pessoais estejam melhorando, eles ainda são uma preocupação óbvia para ele. Ele também está
atribuições especificamente para lhe dar oportunidades de desenvolvimento que ele havia solicitado. claramente confuso em como lidar com as mudanças em seu trabalho. Uma das maiores preocupações de
Essa abordagem era típica para ela, já que ela geralmente tem uma abordagem positiva e demonstra Sara agora é como trazer de volta o excelente desempenho que Davi apresentara em projetos anteriores e
confiança nos membros de sua equipe. Ela havia trabalhado junto com ele em seus planos, e fez follow- fazê-lo contribuir mais à equipe, apesar do seu óbvio desânimo e falta de confiança atuais.
up regular com ele durante as semanas que antecederam as datas de entrega.

Fonte: adaptado de ZF – Zenker Folgman Company, Leadership Case Study: Inspires and Motivates Others to High Performance, 2012.

47
ESTUDO DE CASO EM LIDERANÇA
Reflexão sobre o caso

Após ler o caso, cite:


1. Ao menos uma característica positiva de liderança que a Sara apresenta.
2. Ao menos uma característica negativa que afeta o desempenho da Sara enquanto líder.
3. Ao menos uma característica importante de liderança que a Sara não demonstrou.

Fonte: adaptado de ZF – Zenker Folgman Company, Leadership Case Study: Inspires and Motivates Others to High Performance, 2012.

48
Tipos de Liderança
• Teorias dos Traços
• Teorias Comportamentais
• Teorias Contingenciais
• Teoria de Troca entre Líderes e
Liderados
• Liderança Transacional
• Liderança Carismática
• Liderança Transformacional
• Liderança Autêntica
49 49
Overview: Liderança Autêntica Teoria dos Traços

Principais Líderes autêntico agem conforme os seus


valores e suas crenças, de forma aberta e
honesta. São vistos como pessoas éticas e
Busca identificar as qualidades e
características pessoais, os traços de
personalidade, que diferenciam líderes de
Teorias de dignos de confiança. não líderes.

Liderança
Liderança Transformacional Teorias Comportamentais
Inspiração dos liderados a transcenderem Duas dimensões: Liderança orientada para a
seus próprios interesses pelo bem da Produção; e Liderança Orientada para as
organização ou do grupo, sendo capazes de Pessoas. As influências das teorias
causar um impacto profundo e extraordinário comportamentais sugerem que é possível
em seus liderados. treinar pessoas para serem líderes.

Teorias de
Liderança Carismática Liderança Teorias Contingenciais
Os líderes inspiram seus seguidores por meio As teorias contingenciais têm enfoque na
de palavras, ideias e comportamentos com influência da situação na qual a liderança é
uso de capacidade heroicas atribuídas pelos inserida (contexto). O desempenho depende
seguidores. do estilo do líder, mas também da situação.
Modelo de Contingência Teoria do Caminho-Meta
Teoria Situacional Teoria da Participação e Liderança

Liderança Transacional Teorias de Troca entre Líderes e Liderados


Os líderes transacionais conduzem ou É um teoria que propõe que os líderes criam
motivam seus seguidores em direção às grupos “de dentro” e “de fora”. Ou seja, os Fonte: Fonte: Robbins et al. (2010), Comportamento Organizacional.
metas estabelecidas por meio do líderes estabelecem um relacionamento
esclarecimento das funções e das exigências especial com um pequeno diferenciado de
das tarefas. liderados.
50
Tipos de Liderança

Teorias dos Traços; Modelo Big Five de Personalidade


51
Teoria dos Traços

Definições
52
Teorias dos Traços

As teorias dos traços


buscam identificar as Traços são Traços de
qualidades e Algumas pesquisas
características e personalidade são
características pessoais permitem sustentar
que diferenciam líderes comportamentos características
a ideia de que os
de não líderes. É um consistentes duradouras que
modelo da personalidade traços são fortes
exibidos em podem descrever o
que busca identificar os preditores de
traços básicos necessários diferentes comportamento de
liderança;
para descrever a situações; uma pessoa;
personalidade;

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 128; 360-361.


Fonte: Renner (2012), Psico, pág. 270; 276.

53
Teorias dos Traços

A personalidade é a soma das maneiras como uma pessoa reage e interage com as demais. É o padrão
de características duradouras que produzem consistência e individualidade em determinada pessoa;

Um traço de personalidade é um atributo ou uma característica particular da personalidade de um


indivíduo;

Origem do conceito: 1920

Grandes líderes como Buda, Napoleão, Churchill e Getúlio Vargas foram descritos com base em seus
traços de personalidade;
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 127; 360-361.
Fonte: Renner (2012), Psico, pág. 270; 276.
Fonte: Oxford Living Dictionaries <https://en.oxforddictionaries.com/definition/personality_trait>.

54
Teoria dos Traços

Modelo Big Five de Personalidade


(Cinco Grandes Fatores)
55
Influência dos Traços de Personalidade do Big Five no
Comportamento Organizacional

Teorias dos Traços


Traço do Modelo Big Five Por que é importante? O que afeta?

• Melhores habilidades interpessoais • Desempenho melhor (trabalho em equipe)


Extroversão • Maior dominância social • Liderança aumentada
• Maior expressão emocional • Maior satisfação na vida e no trabalho
• Melhor desempenho (trabalho em equipe)
Socialização / • Mais “amado”
• Níveis menores de desvios de
Amabilidade • Menos contestador e mais conformado
comportamento no trabalho
• Maior esforço e persistência • Melhor desempenho
Realização /
• Mais energia e disciplina • Liderança aumentada
Conscienciosidade
• Mais organizado e planejador • Maior longevidade
Estabilidade Emocional • Menos pensamentos e emoções negativos • Maior satisfação pessoal e no trabalho
(Neuroticismo) • Menor hipervigilância • Menores níveis de estresse
• Aumento do nível de aprendizagem • Desempenho no treinamento
Abertura para
• Mais criatividade • Liderança aumentada
Experiências
• Maior flexibilidade e autonomia • Mais adaptável a mudanças
56
56
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 132.
Teorias dos Traços
Fatores do Modelo Big Five (Cinco Grandes Fatores) de Personalidade
Nível de conforto de uma pessoa com seus relacionamentos
EXTROVERTIDO INTROVERTIDO
(agregador, assertivo, sociável, falador, expansivo) (reservado, tímido, quieto, sóbrio)
Propensão de um indivíduo em acatar as ideias dos outros
AMÁVEIS ANTAGONISTA
(cooperativo, receptivo, confiável, solidário, gentil, grato) (frio, desagradável, confrontador, crítico, frio, inamistoso)

Medida de confiabilidade
CONSCIENCIOSO DESORGANIZADO
(responsável, organizado, confiável, persistente, cuidadoso, disciplinado) (distraído, desorganizado, pouco confiável, descuidado, impulsivo)

Capacidade de uma pessoa em lidar com o estresse


ESTÁVEL EMOC. INSTÁVEL EMOC.
(calmo, autoconfiante, seguro, estável) (nervoso, ansioso, deprimido, inseguro, tenso)
Interesse de uma pessoa e seu fascínio por novidades
ABERTO A EXPER. CONVENCIONAL
(criativo, curioso, sensível artisticamente, independente, imaginativo) (convencional, conservador, prefere coisas familiares, conformista, prático)

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 130-133. 57


57
Fonte: Renner (2012), Psico, pág. 276; 277.
Teorias dos Traços

Fatores do Modelo Big Five (Cinco Grandes Fatores) de Personalidade

A maioria dos traços identificados nas pesquisas sobre liderança


pode ser incluída em uma das dimensões do modelo Big Five, o
que permite sustentar a ideia de que os traços são fortes
preditores de liderança.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 360-361.

58
Teorias dos Traços

Fatores do Modelo Big Five (Cinco Grandes Fatores) de Personalidade

A extroversão é o traço mais


importante do líder eficaz. No
A conscienciosidade e a abertura a
entanto, essa característica está mais
novas experiências também se
associada ao surgimento do líder do
mostram fortemente associadas à
que a sua eficácia. As pessoas mais
liderança.
sociáveis e dominantes costumam
impor-se em situações de grupo;

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 360-361.

59
Teorias dos Traços

Fatores do Modelo Big Five (Cinco Grandes Fatores) de Personalidade

De modo geral, os líderes que:


... realmente parecem levar vantagem
• gostam de estar rodeados por pessoas, quando a questão é liderança,
• são assertivos (extrovertidos), disciplinados,
sugerindo que os líderes eficazes de
• conseguem manter os compromissos que
assumem (conscienciosos), e fato possuem alguns traços em
• são criativos e flexíveis (abertos a mudanças) ... comum.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 360-361.

60
Teorias dos Traços

Os traços de personalidade podem auxiliar a


identificação da liderança;

Há duas conclusões em relação às teorias


dos traços:
Os traços funcionam melhor para prever o
surgimento da liderança do que para distinguir
entre líderes eficazes e ineficazes (o fato de um
indivíduo apresentar determinados traços e ser
considerado um líder pelos demais não significa,
necessariamente, que será bem-sucedido em
liderar seu grupo no alcance dos objetivos).
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 360-361.

61
Tipos de Liderança
Teorias Comportamentais
Universidade de Ohio e Universidade de Michigan
62
Teorias Comportamentais
• Teorias Comportamentais propõem que comportamentos específicos
diferenciam os líderes dos não líderes.

• As influências das teorias comportamentais sugerem que é possível treinar


pessoas para serem líderes.

• Duas dimensões:

• Dimensão Estrutura de Iniciação ou Liderança orientada para a Produção; e

• Dimensão Consideração ou Liderança Orientada para as Pessoas.


Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 361-363.

63
Teorias Comportamentais

Duas dimensões independentes do comportamento do líder


(Universidade de Ohio, década de 1940):
Consideração: é o grau em que uma
Estrutura de Iniciação: refere-se ao pessoa é capaz de manter
grau com que um líder é capaz de relacionamentos de trabalho
definir e estruturar o próprio papel e caracterizados por confiança mútua,
o dos funcionários na busca do respeito às ideias dos funcionários e
alcance dos objetivos. cuidado com seus sentimentos.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 361-363.

64
Teorias Comportamentais
5 1
0 9 8-
Duas dimensões comportamentais 7 3 .
5 .2
(Universidade de Michigan):
3 1
i d a
Líder orientado para a Produção: sh Líder Orientado para Pessoas:
enfatiza os aspectos técnicos ie Yo enfatiza relações interpessoais por
práticos do trabalho, ou seja, u sh
revela meio do interesse pessoal pelas
A t s
o
uma preocupação direcionada
el e ao
à necessidades do funcionários e
execução dasrctarefas aceitação das diferenças pessoais
cumprimentoM
a
das metas do grupo. entre os membros do grupo.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 361-363.

65
Teorias Comportamentais

A liderança orientada para as pessoas é semelhante à dimensão


consideração, ao passo que a liderança orientada para a
produção é semelhante à dimensão estrutura de iniciação.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 361-363.

66
Teorias Comportamentais (síntese)

✓ Refere-se ao grau com que um líder é capaz de definir e estruturar


Dimensão Estrutura de o próprio papel e o dos funcionários na busca do alcance dos
Iniciação | objetivos (fonte: Universidade de Ohio);
Liderança orientada ✓ Enfatiza os aspectos técnicos e práticos do trabalho, ou seja, revela
uma preocupação direcionada à execução das tarefas e ao
para a Produção cumprimento das metas do grupo (Universidade de Michigan);

✓ É o grau em que uma pessoa é capaz de manter relacionamentos


de trabalho caracterizados por confiança mútua, respeito às ideias
Dimensão Consideração | dos funcionários e cuidado com seus sentimentos (fonte:
Liderança Orientada Universidade de Ohio);
para as Pessoas ✓ Enfatiza relações interpessoais por meio do interesse pessoal pelas
necessidades do funcionários e aceitação das diferenças pessoais
entre os membros do grupo (Universidade de Michigan);
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 361-363.

67
Teorias Comportamentais
Dimensão Dimensão Estrutura de Iniciação | Liderança orientada para a Produção
✓ Aspectos técnicos e práticos do trabalho
✓ Capacidade de definir e estruturar o
✓ Preocupação direcionada à execução das
Características próprio papel e o dos funcionários
tarefas
✓ Busca do alcance dos objetivos
✓ Cumprimento das metas do grupo
Resultados ✓ Relacionada com níveis mais elevados de produtividade do grupo e da organização
Observados ✓ Avaliações de desempenho mais positivas
Dimensão Dimensão Consideração | Liderança Orientada para as Pessoas
✓ Relações interpessoais ✓ Relacionamentos de trabalho
✓ Interesse pessoal ✓ Confiança mútua
Características
✓ Necessidades do funcionários ✓ Respeito às ideias dos funcionários
✓ Aceitação das diferenças pessoais ✓ Cuidado com seus sentimentos
✓ Pessoas mais satisfeitas com os seus trabalhos
Resultados
✓ Pessoas mais motivadas
Observados
✓ Mais respeito demonstrado para com os seus líderes
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 361-363.

68
Teorias dos Traços & Teorias Comportamentais

Apesar de a teoria dos traços e as teorias comportamentais serem


importantes para a identificação dos líderes eficazes elas não
garantem que um líder tenha sucesso.

O contexto tem também muita relevância!

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 361-363.

69
Teorias dos Traços & Teorias Comportamentais

5 1
8-
Importantes para a
identificação dos líderes
Comporta- . 0 9
eficazes, mas não garantem 7 3
que um líder tenha sucesso mentos 15.2
a 3
h i d
Traços os Contexto
i Y
u sh
At s
el o O contexto tem

ar c Lide- também muita


M relevância
rança
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 361-363.

70
Tipos de Liderança

Teorias Contingenciais
71
Teorias Contingenciais

Prever o sucesso da liderança é muito mais complexo do que


identificar alguns traços ou comportamentos;

A impossibilidade de obter resultados consistentes levou os


pesquisadores, na segunda metade do século XX, a focar nas
influências da situação na qual a liderança é exercida.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

72
Teorias Contingenciais
• Quatro abordagens que buscaram identificar a influência
da situação na qual a liderança é exercida:

Teoria Situacional
Modelo de Contingência
de Paul Hersey e
de Fred Fiedler
Kenetth Blanchard

Teoria do Caminho-Meta Teoria da Participação e


(Path-Goal Theory) Liderança de Victor Vroom e
de Robert House Phillip Yetton

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

73
Teorias Contingenciais

Modelo de Contingência de Fred Fiedler


74
Teorias Contingenciais
Modelo de Contingência de Fred Fiedler

Modelo de Contingência
de Fred Fiedler

75
Teorias Contingenciais
Modelo de Contingência de Fred Fiedler

• Propõe que a eficácia do desempenho do grupo depende da


adequação entre o estilo do líder e o grau de controle que a
situação lhe proporciona;

• Ou seja, é uma teoria que sustenta que os grupos eficazes


dependem da adequação entre o estilo do líder na interação com
os liderados e o grau de controle que a situação lhe proporciona.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

76
Teorias Contingenciais
Modelo de Contingência de Fred Fiedler
Estilo do líder na
interação com os
liderados
Sucesso da
equipe
Grau de controle que a
situação lhe proporciona

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

77
Teorias Contingenciais

Modelo de Contingência de Fred Fiedler

Fiedler parte do princípio de que o estilo de liderança de uma


pessoa é fixo: Isso significa que, se uma situação requer um líder
orientado para a tarefa e a pessoa na posição de liderança é orientada
para o relacionamento, ou se modifica a situação ou se substitui o líder,
para que a liderança possa ser eficaz!

Há, no entanto, teóricos e praticantes que acreditam que uma


pessoa pode mudar seu estilo!

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

78
Teorias Contingenciais
Modelo de Contingência de Fred Fiedler

• Fiedler propõe três dimensões contingenciais ou situacionais que


determinam a eficácia da liderança:
Relação Líder- Estrutura da Tarefa Poder da Posição
Liderados
O grau de estruturação e O grau de influência que
O grau de confiança, formalização dos um líder tem sobre
credibilidade e respeito procedimentos e das variáveis como o poder de
que os membros do grupo tarefas no trabalho. contratar, demitir, tomar
têm pelo seu líder. ações disciplinares,
conceder promoções e
aumentos salariais.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

79
Teorias Contingenciais
Modelo de Contingência de Fred Fiedler

❑Qual a relação entre a preferência / orientação do líder e a


situação?
▪ Líderes orientados para a tarefa apresentam melhor
desempenho em situações mais extremas de alto e baixo
controle;
▪ Líderes orientados para o relacionamento têm melhor
desempenho nas situações de controle moderado.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

80
Teorias Contingenciais
Modelo de Contingência de Fred Fiedler

 Situação de Controle →

81
Teorias Contingenciais

Modelo de Contingência de Fred Fiedler

• Estudos que testaram a validade do


modelo de Fiedler encontraram
evidências consideráveis para sustentar
os componentes substanciais desse
modelo!

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

82
Teorias Contingenciais

Teoria Situacional de Paul Hersey e Kenetth Blanchard


83
Teorias Contingenciais

Teoria da Liderança Situacional de Paul Hersey e Kenneth Blanchard

Teoria Situacional
de Paul Hersey e
Kenetth Blanchard

84
Teorias Contingenciais

Teoria da Liderança Situacional de Paul Hersey e Kenneth Blanchard

Esta teoria diz que a liderança


bem-sucedida é adquirida por
meio da escolha do estilo de
Um líder deve escolher um dos
liderança correto dependendo
Enfoca no nível de prontidão quatro comportamentos de
do nível de prontidão
ou maturidade dos liderados. acordo com a prontidão (ou
(readiness) ou maturidade dos
maturidade) do liderado.
seguidores, ou seja, o nível de
desejo e habilidade para
cumprir determinada tarefa.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

85
Teorias Contingenciais
Teoria da Liderança Situacional de Paul Hersey e Kenneth Blanchard

Seguidores incapazes e/ou


Líder precisará dar orientações claras e precisas
desmotivados

Líder precisará oferecer orientação na execução da tarefa


Seguidores incapazes,
para compensar a lacuna de habilidade dos liderados, além
porém motivados
de demonstrar apoio para “conquista-lo”

Seguidores capazes, porém


Líder precisará usar um estilo apoiador e participativo
desmotivados

Seguidores capazes e
Líder não precisa se preocupar em fazer muita coisa
motivados

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

86
Teorias Contingenciais
Teoria da Liderança Situacional de Paul Hersey e Kenneth Blanchard
5 1
0 9 8-
.
73 “Deixar rolar”

alta
Comportamento de suporte / apoio
Matriz de Liderança “Dar orientação”
5 .2
31
Situacional (supporting – S3) (coaching – S2)

Foco no relacionamento
a

 Motivação →
Estilo participativo Estilo “vendedor”
h i d
(compartilha ideias) (explica decisões)
s
Yo
• Duas variáveis de
avaliação da
sh i
s u “Delegar”
At
prontidão ou (delegating – S4)
”Dar apoio”
maturidade dos
liderados e Quatro rc el o Estilo para delegar
(directing – S1)
Estilo esclarecedor
a (emite decisões)
baixa

(oferece instruções)
M
Estilos de Liderança
baixa  Capacidade → alta
Comportamento diretivo
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368. Foco na tarefa
87
Teorias Contingenciais
Teoria da Liderança Situacional de Paul Hersey e
Kenneth Blanchard

Apesar do apelo intuitivo e da grande


popularidade dessa teoria, devemos ter
cautela e consciência em sua aplicação.

Os resultados de pesquisa que buscam


testar e validar essa teoria ainda não
têm sido muito animadores.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

88
Teorias Contingenciais

Teoria do Caminho-Meta (Path-Goal Theory) de Robert House


89
Teorias Contingenciais
Teoria do Caminho-Meta (Path-Goal Theory) de Robert House

Teoria do Caminho-Meta
(Path-Goal Theory)
de Robert House

90
Teorias Contingenciais

Teoria do Caminho-Meta (Path-Goal Theory) de Robert House

• Teoria que sustenta que é função do líder ajudar os liderados no alcance


de suas metas, fornecendo orientação e apoio necessários para
assegurar que tais metas sejam compatíveis com os objetivos da
organização.

• Ou seja, é função do líder ajudar os liderados a alcançar suas metas,


fornecendo informações, apoio ou outros recursos necessários para tal.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

91
Teorias Contingenciais

Teoria do Caminho-Meta (Path-Goal Theory) de Robert House

• A expressão “caminho-meta” implica que o líder eficaz deve


esclarecer o caminho dos seguidores em direção aos objetivos de
trabalho, tornando essa jornada mais fácil ao reduzir os obstáculos e
barreiras.

• Um líder deverá ser diretivo ou apoiador, ou apresentar outro


comportamento, dependendo de uma análise complexa da situação.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

92
Teorias Contingenciais
Teoria do Caminho-Meta (Path-Goal Theory) de Robert House

• Premissas da teoria:

Natureza da Tarefa (Situação) Estilo de Liderança Resultados

Tarefas são ambíguas ou


Liderança Diretiva Melhor
estressantes
desempenho /
Maior
Tarefas altamente satisfação
Liderança Apoiadora
estruturadas e planejadas

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

93
Teorias Contingenciais
Teoria do Caminho-Meta (Path-Goal Theory) de Robert House

• Premissas da teoria:

• A liderança diretiva leva a uma maior satisfação quando as tarefas são


ambíguas ou estressantes do que quando são altamente estruturadas e
planejadas. A liderança diretiva pode ser percebida como redundante por
funcionários com elevada capacidade ou com experiência considerável;

• A liderança apoiadora leva a um melhor desempenho e a uma maior


satisfação quando os funcionários realizam tarefas estruturadas;
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

94
Teorias Contingenciais

Teoria do Caminho-Meta (Path-Goal Theory) de Robert House

• Testar a teoria do caminho-meta não tem sido algo fácil!

• É seguro dizer que ainda não foi decidida a validade da teoria


do caminho meta!

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

95
Teorias Contingenciais

Teoria da Participação e Liderança de Victor Vroom e Phillip Yetton


96
Teorias Contingenciais
Teoria da Participação e Liderança de Victor Vroom e Phillip Yetton

Teoria da Participação e
Liderança de Victor Vroom e
Phillip Yetton

97
Teorias Contingenciais

Teoria da Participação e Liderança de Victor Vroom e


Phillip Yetton
• Teoria que oferece uma sequência de regras que devem ser seguidas para
a determinação da forma e do volume de participação dos liderados no
processo decisório de acordo com diferentes situações.
• Ou seja, essa teoria relaciona o comportamento da liderança com a
participação dos liderados no processo decisório.
• Esse modelo sustenta que o comportamento do líder deve se ajustar à
estrutura da tarefa.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

98
Teorias Contingenciais

Teoria da Participação e Liderança de Victor Vroom e Phillip


Yetton
• Esse modelo é normativo. Ele oferece uma árvore decisória que incorpora:
• sete contingências, e
• cinco estilos alternativos de liderança

• para determinar a forma e o volume de participação dos liderados no


processo decisório.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

99
Teorias Contingenciais

Teoria da Participação e Liderança de Victor Vroom e


Phillip Yetton
• Sete contingências:
• A qualidade da decisão é importante? (sim / não)
• A equipe está compromissada com a decisão? (sim / não)
• Você tem informações suficientes para tomar a decisão sozinho? (sim /
não)
• O problema é bem estruturado? (sim / não)
• Se você decidir sozinho, terá o apoio da equipe? (sim / não)
• A equipe compartilha os mesmos objetivos organizacionais? (sim / não)
• A decisão provavelmente gerará conflito na equipe? (sim / não)

100
Teorias Contingenciais
Teoria da Participação e Liderança de Victor Vroom e Phillip Yetton

Cinco Estilos de Liderança:


Estilo Sigla Processo
Autocrático AI Você usa as informações que você já tem e toma a decisão.
você toma a decisão e informa os
Você consulta os membros da equipe sobre informações específicas e uma vez que
outros da mesma; existem duas formas AII
você as tem, você toma a decisão. Você não precisa se justificar.
Você informa os membros da equipe o que você está fazendo e pode,
Consultivo CI
individualmente, pedir opiniões, no entanto, o grupo não é reunido para discussão.
você coleta informações do time e
Você é responsável pela tomada de decisão, no entanto, vocês se reúnem como um
então toma a decisão; duas formas CII
grupo para discutir a situação, ouvir outras perspectivas, e solicitar sugestões.

Colaborativo
A equipe toma uma decisão em conjunto. O seu papel é principalmente facilitador e
você e sua equipe trabalham em GII
ajudar a equipe a chegar a uma decisão final que todos concordem.
conjunto para chegar a um consenso.

101
Teorias Contingenciais
Teoria da Participação e Liderança de Victor Vroom e Phillip Yetton

102
Teorias Contingenciais

Teoria da Participação e Liderança de Victor Vroom e


Phillip Yetton
• As críticas têm focado as variáveis omitidas e complexidade geral
do modelo.
• Não é muito realista esperar que um gestor, na prática, considere 7
variáveis contingenciais e 5 estilos de liderança antes de selecionar
o processo decisório mais adequado a determinado problema.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

103
Teorias Contingenciais

Conclusões
104
Teorias Contingenciais

A liderança é uma relação simbiótica entre líderes e liderados!

Essas teorias anteriores pressupõem, de certa forma, que os líderes usam um estilo
homogêneo com todos os seus seguidores.
Mas isso é razoável? Pense sobre suas experiências como grupo!

Os líderes costumam agir de maneira diferente com diversas pessoas?

É preciso também considerar as diferenças na forma como o líder se relacionado com seus
vários liderados.
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

105
Tipos de Liderança

Teoria de Troca entre Líderes e Liderados (LMX)


106
Teoria de Troca entre Líderes e Liderados (LMX)

5 1
8-
Leader Member Exchange (LMX) /
Relationship-Based Approach
. 0 9
.2 73
31 5
i d a
É um teoria que propõe que os líderes osh
i Y
criam grupos “de dentro” e “de fora”,
u sh e
Ou seja, os líderes estabelecem um
t s
os liderados do grupo “de dentro”
A relacionamento especial com um
el o menor
recebem avaliações de desempenho
pequeno diferenciado de liderados, o
a
rotatividade e maior
c
melhores, apresentam
r satisfação com o
grupo “de dentro”.
Mtrabalho.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 368-369.

107
Teoria de Troca entre Líderes e Liderados (LMX)

Grupo “de dentro” Grupo “de fora”

• Os indivíduos nesse grupo têm • Os demais membros


toda a confiança, recebem pertencentes a esse grupo
atenção desproporcional do líder recebem menos tempo do líder,
e costumam ser alvos de menos recompensas controladas
privilégios especiais. por eles (por exemplo: bônus,
promoções etc.) E seu
relacionamento baseia-se nas
interações formais de autoridade.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 368-369.

108
Teoria de Troca entre Líderes e Liderados (LMX)

5 1
Os líderes endossam a LMX quando:
0 9 8-
73 .
5 .2
31
apunem aqueles
recompensam aqueles i d
funcionários com os osh funcionários com os
i Y
u sh
quais querem manter quais não querem se
ts
maior contato, e/ou
A
relacionar;
el o
a r c
Para o relacionamento de troca entre líderes e liderados se manter intacto,
M líder e liderado, têm de investir no relacionamento.
ambos,

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 368-369.

109
Teoria de Troca entre Líderes e Liderados (LMX)

Evidências sugerem que os


membros “de dentro” são
escolhidos porque têm
atitudes e características de
personalidade semelhantes às
do líder e/ou por possuírem
um nível de competência
superior aos demais membros.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 368-369.

110
Teoria de Troca entre Líderes e Liderados (LMX)

Embora quem faça a


Os líderes acabam por
escolha seja o líder, são, na
investir recursos em quem
verdade, as características
acreditam que terá maior
dos liderados que
desempenho.
conduzem a essa decisão.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 368-369.

111
Teoria de Troca entre Líderes e Liderados (LMX)

Considerações Finais
• As pesquisas têm oferecido boa sustentação para essa teoria.
• Os líderes realmente parecem diferenciar seus liderados.
• Essas diferenciações não são aleatórias.
• Os membros do grupo “de dentro”, de maneira geral:
• recebem avaliações melhores,
• possuem um comportamento maior de cidadania organizacional, e
• mostram maior satisfação com seus superiores.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 368-369.

112
Tipos de Liderança
Liderança Transacional
(Estudos da Uni de Ohio, modelo de Fiedler, e teoria do caminho-meta)
113
Liderança Transacional

• A liderança transacional é um estilo de liderança que se concentra na


supervisão, organização e desempenho.
• Os líderes transacionais promovem o cumprimento dos seguidores
através de recompensas e punições.
• Esses líderes não estão olhando para mudar o futuro, ao contrário,
procuram manter as coisas iguais.
• Líderes que usam a liderança transacional como modelo prestam atenção
ao trabalho dos seguidores para encontrar falhas e desvios.

Fonte: https://en.wikipedia.org/wiki/Transactional_leadership

114
Liderança Transacional

• Os líderes transacionais conduzem ou motivam seus seguidores em


direção às metas estabelecidas por meio do esclarecimento das
funções e das exigências das tarefas.

• Os estudos das Universidades de Ohio e Michigan, o modelo de


Fiedler e a teoria do caminho-meta (path-goal theory) descrevem
líderes transacionais.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 374.

115
Liderança Transacional
Com base nas Teorias Comportamentais

• Estrutura de Iniciação: refere-se ao grau com que um líder é capaz


de definir e estruturar o próprio papel e o dos funcionários na busca
do alcance dos objetivos (Universidade de Ohio, década de 1940).

• Líder orientado para a Produção: enfatiza os aspectos técnicos e


práticos do trabalho, ou seja, revela uma preocupação direcionada à
execução das tarefas e ao cumprimento das metas do grupo
(Universidade de Michigan).
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 361-363.

116
Liderança Transacional
Com base nas Teorias Comportamentais

Liderança orientada para a Produção & Dimensão Estrutura de Iniciação


✓ aspectos técnicos e práticos do trabalho
✓ capacidade de definir e estruturar o
✓ preocupação direcionada à execução das
próprio papel e o dos funcionários
tarefas
✓ busca do alcance dos objetivos
✓ cumprimento das metas do grupo

Liderança orientada para a Produção & Dimensão Estrutura de Iniciação


✓ aspectos técnicos e práticos do trabalho
✓ capacidade de definir e estruturar o
Resultados observados:
✓ preocupação direcionada à execução das
✓ Relacionada com níveis mais elevados de produtividade
própriodopapel
grupoe oe dos
da organização
funcionários
tarefas
✓ Avaliações de desempenho mais positivas ✓ busca do alcance dos objetivos
✓ cumprimento das metas do grupo

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 361-363.

117
Liderança Transacional
Com base nas Teorias Contingenciais
Modelo de Contingência de Fred Fiedler

Relação Líder- Estrutura da Tarefa Poder da Posição


Liderados
O grau de estruturação e O grau de influência que
O grau de confiança, formalização dos um líder tem sobre
credibilidade e respeito procedimentos e das variáveis como o poder de
que os membros do grupo tarefas no trabalho. contratar, demitir, tomar
têm pelo seu líder. ações disciplinares,
conceder promoções e
aumentos salariais.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

118
Liderança Transacional
Com base nas Teorias Contingenciais
Teoria do Caminho-Meta (Path-Goal Theory) de Robert House

• A expressão “caminho-meta” implica que o líder eficaz deve


esclarecer o caminho dos seguidores em direção aos objetivos de
trabalho, tornando essa jornada mais fácil ao reduzir os obstáculos e
barreiras.

• Um líder deverá ser diretivo ou apoiador, ou apresentar outro


comportamento, dependendo de uma análise complexa da situação.
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 363-368.

119
Os líderes transacionais conduzem ou
motivam seus seguidores em direção às
Liderança Transacional metas estabelecidas por meio do
esclarecimento das funções e das
exigências das tarefas

Quatro características que definem a liderança transacional:


Recompensa Negocia a troca de recompensas por esforço, promete recompensas pelo bom
contingente desempenho, reconhece conquistas.

Administração por Procura e observa desvios das regras e padrões, tomando as atitudes corretivas
exceção (ativa) necessárias.

Administração por
Intervém apenas quando os padrões não são alcançados.
exceção (passiva)

Laissez-faire Abdica das responsabilidades, evita tomar decisões.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

120
Tipos de Liderança

Liderança Carismática e Liderança Transformacional


121
Liderança Carismática e Liderança Transformacional

Há duas teorias contemporâneas de liderança que compartilham de


um tema comum: elas veem os líderes como indivíduos que
inspiram seus seguidores por meio de palavras, ideias e
comportamentos.

• Teoria da Liderança Carismática, e


Essas duas teorias são:
• Teoria da Liderança Transformacional

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

122
Liderança Carismática e
Liderança Transformacional

Teoria da Liderança Carismática


123
Liderança Carismática e Liderança Transformacional

Teoria da Liderança Carismática

• O primeiro pesquisador a considerar a liderança carismática foi


Robert House, também conhecido pela teoria (contingencial) do
caminho-meta (path-goal theory).

• A teoria da Liderança Carismática defende que os seguidores


atribuem capacidades heróicas ou extraordinárias a seus líderes
quando observam determinados comportamentos.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

124
Liderança Carismática e Liderança Transformacional

Teoria da Liderança Carismática

• As organizações com CEOs carismáticos são mais rentáveis!

• Os professores de faculdade que são mais carismáticos recebem


melhores avaliações em seus cursos!

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

125
Liderança Carismática e Liderança Transformacional

Teoria da Liderança Carismática

• Diversos estudos tentaram identificar as características pessoais dos


líderes carismáticos. Ele têm:
1. visão,
2. estão dispostos a correr riscos pessoais por ela,
3. são sensíveis às necessidades de seis liderados, e
4. exibem comportamentos não convencionais.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

126
Liderança Carismática e Liderança Transformacional
A teoria da Liderança Carismática defende
que os seguidores atribuem capacidades
Teoria da Liderança Carismática heroicas ou extraordinárias a seus líderes
quando observam determinados
comportamentos

• Características-chave dos Líderes Carismáticos


Eles têm uma visão – expressa como uma meta idealizada – que propõe um futuro
1 Visão e Articulação melhor do que o status quo. São capazes de esclarecer a importância da visão em
termos compreensíveis para os demais.
Estão dispostos a correr riscos pessoais, assumem os cursos de suas atitudes e
2 Risco Pessoal
sacrificam-se para atingir sua visão.
Sensibilidade às
São perceptivos com relação às capacidades dos outros e sensíveis as suas
3 Necessidades dos
necessidades e sentimentos.
Liderados
Comportamentos
4 Apresentam comportamentos vistos como inovadores e que vão contra as normas.
não Convencionais
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

127
Liderança Carismática e Liderança Transformacional

Teoria da Liderança Carismática

• Os indivíduos nascem com traços. A personalidade também está


relacionada à liderança carismática: os líderes carismáticos são
descritos como extrovertidos, autoconfiantes e ambiciosos.

• A maioria dos especialistas também acredita que as pessoas podem


ser treinadas para exibir comportamentos carismáticos.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

128
Liderança Carismática e Liderança Transformacional

Teoria da Liderança Carismática

• Então, como é possível se tornar mais carismático?

Processo de três etapas:


1 2 3
Desenvolver uma aura de carisma, mantendo- Deve-se trazer à tona o
Deve-se rodear
se uma visão otimista, usando a paixão como potencial dos demais
de pessoas,
um catalisador para gerar entusiasmo e seguidores, mexendo com
criando vínculos
utilizando todo o corpo no processo de seus sentimentos e
que as inspirem.
comunicação, não apenas palavras. emoções.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

129
Liderança Carismática e Liderança Transformacional

Teoria da Liderança Carismática

• Como os líderes carismáticos influenciam seus liderados?

Processo de quatro etapas:


1 2 3 Transmissão de um 4 Preocupação em
Articulação de uma Formalização e
novo conjunto de influenciar as
visão atraente, uma comunicação da visão
valores e exemplos emoções,
estratégia de longo para imprimir aos
para que os demonstrando
prazo (visão tão seguidores uma meta
seguidores os imitem, coragem e sendo
desafiadora quanto ou um objetivo
incluindo cooperação convincentes sobre
realizável). abrangente.
e apoio mútuo. sua visão.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

130
Liderança Carismática e Liderança Transformacional

Teoria da Liderança Carismática

• A liderança carismática eficaz depende da situação?


• O carisma não funciona de modo generalizado: sua eficácia pode depender as
situação.
• O carisma parece ser mais apropriado quando a tarefa dos liderados possui
um componente ideológico ou quando o ambiente envolve certo grau de
incerteza ou tensão.
• Em geral, o líder carismático surge na política, na religião, em tempos de
guerra ou quando uma empresa está iniciando ou enfrentando uma crise.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

131
Liderança Carismática e Liderança Transformacional

Teoria da Liderança Carismática

• De fato, as pessoas são especialmente receptivas à liderança


carismática quando percebem a existência de uma crise, quando
estão sob estresse ou quando temem por sua vida.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

132
Liderança Carismática e Liderança Transformacional

Teoria da Liderança Carismática

O lado obscuro da liderança carismática

• Nem sempre líderes carismáticos agem visando o melhor para suas


organizações.
• Líderes carismáticos (CEOs) podem usar seu carisma para alavancar
melhores salários, mesmo quando seu desempenho é medíocre.
• Alguns podem ser demasiadamente bem-sucedidos em convencer seus
seguidores a perseguir uma visão que pode ser desastrosa (ex.: Hitler).

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

133
Liderança Carismática e
Liderança Transformacional

Teoria da Liderança Transformacional


134
Liderança Carismática e Liderança Transformacional

Liderança Transformacional

• Os líderes transformacionais
inspiram seus liderados a
transcenderem seus próprios
interesses pelo bem da organização
ou do grupo, sendo capazes de
causar um impacto profundo e
extraordinário em seus liderados.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

135
Liderança Carismática e Liderança Transformacional

Liderança Transformacional

• Os líderes transformacionais:
• prestam atenção às preocupações e às necessidades de seus liderados;
• modificam a maneira de seus seguidores verem as coisas, ajudando-os a
pensar nos velhos problemas de uma nova forma; e
• são capazes de entusiasmar, incitar e inspirar as pessoas a darem o máximo
de si na busca dos objetivos do grupo.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

136
Liderança Carismática e Liderança Transformacional

Liderança Transformacional

• Quatro características que definem a liderança transformacional:


Oferece uma visão de sentido da missão, estimula o orgulho, ganha respeito e
Influência idealizada
confiança.

Motivação Comunica suas altas expectativas, utiliza símbolos para focar os esforços, expressa
inspiracional propósitos importantes de maneira simples.

Estímulo intelectual Promove a inteligência, a racionalidade e a cuidados na resolução de problemas.

Consideração Dá atenção personalizada, trata cada funcionários individualmente, aconselha,


individualizada orienta.
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

137
Liderança Carismática e Liderança Transformacional
Liderança Transformacional

• Algumas caraterísticas que destacam empresas com líderes


transformacionais:
Líderes e
seguidores são
mais criativos Recompensas
Maior por resultados
descentralização de longo-prazo
Maior Menor aversão
em assumir Maior confiança
alinhamento da Maior
Buscas por riscos nos líderes
alta gestão compromissos
metas mais
por parte dos
audaciosas Alinhamento Articulação dos seguidores
pessoal c/ as seguidores
Fonte: Robbins et al. (2010), metas da org. rumo à visão
Comportamento Organizacional, pág. 369-377.

138
Liderança Carismática e Liderança Transformacional

Liderança Transformacional

• A validade da teoria da liderança transformacional tem sido


impressionantemente corroborada em diferentes níveis
organizacionais e em diversas profissões (diretores de escola,
professores, presidentes de empresas, representante de vendas, etc.).
• Empresas com lideranças transformacionais produzem bens / serviços
de melhor qualidade e são mais lucrativas.
• Relação direta com a motivação e com a satisfação dos seguidores e
ao melhor desempenho e maior eficácia dos líderes.
Fonte: Robbins et al. (2010),
Comportamento Organizacional, pág. 369-377.

139
Liderança Carismática e Liderança Transformacional

Liderança Transformacional

• A liderança transformacional está mais fortemente associada a


menores taxas de rotatividade, maior produtividade, menor estresse
e maior satisfação do empregado do que a liderança transacional.

• A liderança transformacional pode ser aprendida! Pessoas que


passam por treinamentos em liderança transformacional tendem a
apresentar melhor desempenho do que aqueles membros da
organização que não passam por esse treinamento.
Fonte: Robbins et al. (2010),
Comportamento Organizacional, pág. 369-377.

140
Liderança Carismática e Liderança Transformacional

Liderança Transformacional

Implicações Globais
• Os resultados de um projeto de pesquisa internacional (Projeto
GLOBE – Liderança Global e Eficácia no Comportamento
Organizacional) feito com 18 mil líderes de 825 organizações em 62
países revela que há alguns aspectos universais da liderança.
• E a Liderança Transformacional aparece associada à liderança eficaz,
independente do país.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 381-382.

141
Liderança Carismática e Liderança Transformacional

Liderança Transformacional
Implicações Globais

• Dentre os elementos da liderança transformacional que se apresentam


como universais estão: visão, confiabilidade, dinamismo, positividade e
pro-atividade, dentre outros

• Os pesquisadores do Projeto GLOBE concluíram que “os seguidores dos


líderes de negócios eficazes esperam que eles tenham visão proativa para
guiar a empresa para o futuro, fortes habilidades de motivação para
estimular todos os colaboradores a cumprir a visão, e excelente habilidade
de planejamento para implementá-la”.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 381-382.

142
Liderança Carismática e Liderança Transformacional

Liderança Transformacional

• A liderança transformacional não é eficaz em todas as situações.


• Parece ser mais eficaz quando os líderes interagem diretamente com
os trabalhadores do que quando se limitam a relatar suas ações a um
conselho de diretores externos ou quando lidam com uma estrutura
burocrática complexa.
• Quando os membros do grupo são muito individualistas e não
outorgam facilmente autoridade para a tomada de decisões, a
liderança transformacional pode não ter muito impacto.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

143
Liderança Carismática e
Liderança Transformacional
Liderança Transformacional versus Liderança Carismática
144
Liderança Carismática e Liderança Transformacional

Liderança Transformacional ‘versus’ Liderança Carismática

• Liderança transformacional e liderança carismática são a mesma coisa?


• Alguns especialistas e estudiosos argumentam que sim; outros discordam!
• Apesar de muitos pesquisadores acreditarem que a liderança transformacional
seja mais ampla que a carismática, um líder que obtém uma pontuação alta em
liderança transformacional provavelmente também a terá em carisma.
• Portanto, na prática da liderança, essas medidas podem ser consideradas quase
como equivalentes.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

145
Tipos de Liderança

Liderança Transacional e Liderança Transformacional


146
Liderança Transacional e Liderança Transformacional

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

147
Liderança Transacional e Liderança Transformacional

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 374;375.

148
Liderança Transacional e Liderança Transformacional

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 374;375.

149
Liderança Transacional e Liderança Transformacional

• O laissez-faire é o estilo de liderança mais passivo


e, portanto, o menos eficaz. Abdica das responsabilidades, evita tomar decisões (laissez-
faire).
• A administração por exceção (ativa ou passiva) é
um pouco melhor que o laissez-faire, mas ainda é Procura e observa desvios das regras e padrões, tomando as
considerada um estilo de liderança ineficaz. Esses atitudes corretivas necessárias (administração por exceção -
líderes tendem a estar disponíveis somente ativa).
quando acontece um problema, quando
geralmente já é tarde demais. Intervém apenas quando os padrões não são alcançados
(administração por exceção - passiva).
• A liderança por recompensa contingente costuma
ser um estilo eficaz de liderança, porém os líderes Negocia a troca de recompensas por esforço, promete
dificilmente conseguirão que seus liderados se recompensas pelo bom desempenho, reconhece conquistas
superem ao praticá-la. (recompensa contingente).

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

150
Liderança Transacional e Liderança Transformacional

É também necessário o uso dos quatro estilos da dimensão de


liderança transformacional para que os líderes possam
motivar os seus seguidores a ter um desempenho acima das
expectativas e transcender seus interesses pessoais em prol
da organização.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

151
Liderança Transacional e Liderança Transformacional

• A consideração individualizada, Dá atenção personalizada, trata cada funcionários


o estímulo intelectual, a individualmente, aconselha, orienta (consideração
individualizada).
motivação inspiracional, e a
influência idealizada resultam Promove a inteligência, a racionalidade e a cuidados
todos em esforço extra por resolução de problemas (estímulo intelectual).
parte dos seguidores, melhor
desempenho, maior motivação Comunica suas altas expectativas, utiliza símbolos para focar
os esforços, expressa propósitos importantes de maneira
e satisfação, maior eficácia simples (motivação inspiracional).
organizacional, menor
rotatividade e maior Oferece uma visão de sentido da missão, estimula o orgulho,
adaptabilidade organizacional. ganha respeito e confiança (influência idealizadal).
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

152
Liderança Transacional e Liderança Transformacional

Liderança Transformacional versus Liderança Transacional

• A liderança transformacional está mais fortemente associada a


menores taxas de rotatividade, maior produtividade, menor estresse
e maior satisfação do empregado do que a liderança transacional.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 369-377.

153
Liderança Transacional e Liderança Transformacional

Transacional Transformacional
❑ Determina as tarefas ❑ Inovação
❑ Inicia a estrutura ❑ Reconhece as necessidade
dos seguidores
❑ Promove recompensas
❑ Inspira os seguidores
❑ Melhora produtividade
❑ Cria um futuro melhor
❑ Valoriza o trabalho duro
❑ Promove mudança
❑ Tolerância e Justiça
significativa
❑ Foca no gerenciamento

154
Gestores versus Líderes
Gestores Líderes
Complexidade Lidam com Desafios de transformação

Ordem e consistência Buscam Mudanças organizacionais

Objetivos e metas Estabelecem Direção, visão de futuro

A estrutura organizacional e as funções p/ A organização focando no alinhamento das


Desenvolvem
a realização dos planos estabelecidos pessoas em direção à visão estabelecida

Os planos para as pessoas delegando A visão para aqueles que podem criar
Comunicam
responsabilidades para a implementação coalizões comprometidas
Na motivação e inspiração, mantendo as
No monitoramento detalhado dos
Focam pessoas no caminho certo, apoiando as
resultados obtidos versus planejados
pessoas na superação das barreiras
Fonte: Adaptado de Kotter, J. P. What Leaders Really Do; Harvard Business Review, May-Jun 1990, p. 102-111.

155
156
156
Tipos de Liderança
Liderança Autêntica:
A Ética e a Confiança como Fundamentos
157
Liderança Autêntica: Ética e Confiança
Embora as diferentes 5 1
teorias ajudem a entender
0 9 8-
o conceito de liderança,
73 .
elas não lidam 5 .2
explicitamente com o papel
a 31
da ética e da confiança h i d
s
i Yo
u sh
At (ética e s
el o
Esses dois conceitos

a c
confiança) podem
r dentro do ser
M
explorados
tópico Liderança Autêntica.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

158
Liderança Autêntica:
Ética e Confiança
O que é Liderança Autêntica?
159
Liderança Autêntica: O que é?

Líderes autênticos sabem quem são, no que acreditam e o que valorizam e


agem conforme os seus valores e suas crenças, de forma aberta e honesta.
Seus liderados os consideram pessoas éticas. A principal qualidade
produzida por uma liderança autêntica é, portanto, a confiança;

Os líderes autênticos compartilham informações, encorajam a


comunicação aberta e são fiéis a seus ideais. Espera-se que eles sejam
abnegados, bons ouvintes e honestos. Como resultado, as pessoas passam
a ter fé neles.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

160
Liderança Autêntica: O que é?

É importante pensar na ética e na confiança de um líder, pois esses conceitos focam em


seus aspectos morais;

Os líderes transformacionais ou carismáticos podem ter uma visão e comunicá-la


persuasivamente, mas essa visão pode estar errada (como no caso de Hitler) ou o líder na
verdade está mais preocupado com as próprias necessidades ou prazeres individuais / de
seu grupo íntimo (basta lembrar dos escândalos de corrupção recentes no Brasil).

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

161
Liderança Autêntica:
Ética e Confiança
Ética e Liderança
162
Liderança Autêntica: Ética e Liderança

É importante considerar as implicações éticas da liderança.

Alguns líderes transformacionais já foram acusados de enaltecer a virtude


moral ao mesmo tempo que tentam manipular as atitudes e o comportamento
de seus liderados.

O carisma também tem um forte componente ético: os líderes carismáticos


sem ética têm maior probabilidade de utilizar o carisma para aumentar o
poder sobre sues liderados em proveito próprio.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

163
Liderança Autêntica: Ética e Liderança

Os líderes éticos devem utilizar seu carisma de maneira


socialmente construtiva, para servir aos outros!

Os líderes que tratam seus liderados com imparcialidade,


principalmente fornecendo informações honestas,
regulares e corretas, são vistos como líderes mais eficazes.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

164
Liderança Autêntica: Ética e Liderança

“Pelo fato de os altos executivos (CEOs, Diretores, Empreendedores, etc.)


ditarem o tom moral de uma organização, eles precisam estabelecer altos
padrões éticos, demonstrar comprometimento com tais padrões em seu
próprio comportamento e estimular e recompensar a integridade de seus
subordinados ao mesmo tempo que evitam abusos de poder, como dar a si
mesmos grandes aumentos e bônus enquanto procuram cortar custos por
meio da demissão de funcionários mais antigos, por exemplo.”

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

165
Liderança Autêntica: Ética e Liderança

A ética não é desprovida de valores. Precisamos avaliar os meios (valores)


utilizados pelos líderes para atingir suas metas.

Os líderes devem ser modelos de conduta ética!

Devem ser capazes de transmitir valores aos funcionários de acordo com


os próprios valores, por meio de suas palavras e ações (walking the talk).

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

166
Liderança Autêntica:
Ética e Confiança
Confiança e Liderança
167
Liderança Autêntica: Confiança e Liderança

Quais são as principais características que nos levam a acreditar que um


líder é confiável?

Os estudos sobre
liderança e evidências • Integridade,
apontam três principais
elementos que • Benevolência, e
determinam a natureza • Capacidade.
da confiança:

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

168
Liderança Autêntica: Confiança e Liderança
A natureza da confiança
5 1
Confiabilidade do Líder 08-
9
7 3 .
Propensão à
5 .2confiança
Integridade (mais crítica)
3 1
Refere-se à honestidade e à sinceridade. Ter consistência
i da
entre o que se faz e o que se fala.
osh
Benevolência i Y Confiança
u s h
s
Considerar de verdade os interesses dos outros, mesmo
esses não estejam necessariamente alinhadostcom
A
que
os dela.

el o
Capacidade
a r c ▪ Assumir riscos
M
Conhecimentos e habilidades técnicos e interpessoais de um
indivíduo. A pessoa tem que saber o que está falando! ▪ Compartilhamento de informações
▪ Eficácia do Grupo
▪ Produtividade
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

169
Liderança Autêntica:
Ética e Confiança
Confiança como Processo
170
Liderança Autêntica: Confiança como Processo

A propensão à confiança refere-se à predisposição que determinado indivíduo tem


para confiar em outras pessoas.

Algumas pessoas simplesmente acreditam que os outros são dignos de confiança, ao


passo que outras desconfiam de todos os que as rodeiam.

A propensão à confiança está fortemente associada ao traço pessoal de amabilidade,


ao passo que a baixa autoestima está associada a uma baixa propensão à confiança.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

171
Liderança Autêntica: Confiança como Processo

O tempo é o último ingrediente na receita da confiança.

Os líderes precisam demonstrar que têm integridade, benevolência e capacidade em


situações em que a confiança é importante, ou seja, em situações em que poderiam se
comportar de maneira oportunista ou desapontar os funcionários, mas não o fizeram.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

172
Liderança Autêntica: Confiança como Processo

Líderes que rompem o contrato psicológico com


os trabalhadores, demonstrando que não são
dignos de confiança, encontrarão:

• funcionários menos satisfeitos e menos comprometidos,


• com intenções de deixar a empresa,
• menos envolvidos em um comportamento de cidadania
organizacional, e
• apresentando desempenho ruim.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

173
Liderança Autêntica: Confiança como Processo

Uma vez violada, a confiança pode ser readquirida, mas apenas em certas
situações, dependendo do tipo de violação.

Entretanto, se o transgressor enganou seus subordinados ou mentiu para eles, a


confiança nunca será totalmente restaurada, nem mesmo após pedidos de
desculpas, promessas ou um padrão consistente de ações que inspirem confiança.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

174
Liderança Autêntica:
Ética e Confiança
Consequências da Confiança
175
Liderança Autêntica: Consequências da Confiança

A confiança entre supervisores e funcionários, entre líderes e liderados,


está relacionada a vários resultados positivos no trabalho.

Quatro das mais


• A confiança encoraja a assumir riscos;
importantes
• A confiança facilita o compartilhamento de
consequências da informações;
confiança • Grupos confiáveis são mais eficazes; e
demonstradas em
• A confiança melhora a produtividade.
pesquisa são:

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

176
Liderança Autêntica: Consequências da Confiança
Quatro importantes consequências da confiança:
Por que Investir na Confiança?
Sempre que os funcionários decidem divergir do modo usual de fazer as coisas ou
A confiança encoraja a
as fazem de maneira diferente da orientação do supervisor, eles estão assumindo
assumir riscos riscos. Em ambos os casos, uma relação de confiança pode facilitar a ação.
Durante o
Processo A confiança facilita o É comum os funcionários não se sentirem psicologicamente seguros para revelar
seu ponto de vista. Quando os gerentes demonstram aos funcionários que suas
compartilhamento de ideias são ouvidas e mostram que têm bastante interesse em realizar a mudança,
informações os funcionários sentem-se mais dispostos a manifestar suas opiniões livremente.
Quando um líder estabelece um tom confiável dentro de um grupo, os membros
Grupos confiáveis são mais sentem-se mais motivados a ajudar uns aos outros e a realizar um esforço extra
eficazes nesse sentido, o que aumenta ainda mais a confiança. Essas ações tendem a
valorizar e aumentar o desempenho do grupo.
Resultados Funcionários que confiam em seus supervisores tendem a apresentar melhores
A confiança melhora a taxas de desempenho. A falta de confiança torna difícil para as pessoas
produtividade visualizarem objetivos em comum. Ficam suscetíveis a esconder informações e
buscar seus próprios interesses, gerando um clima de falta de confiança.
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 377-381.

177
Liderando para o Futuro
Desenvolvimento de Líderes; Mentoring; Coaching

178
Liderando para o Futuro

• Os líderes assumem (ou deveriam assumir) a responsabilidade pelo


desenvolvimento dos futuros líderes. Deveria ser, talvez, a principal tarefa de um
líder!

• O mentoring é uma prática que permite aos líderes o desenvolvimento de seus


liderados para desafios futuros em posições de liderança na organização.

• Como mentores, os líderes ajudam a preservar e a desenvolver a cultura da


organização ao mesmo tempo em que transmitem seus conhecimentos.
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 381-383.

179
Liderando para o Futuro

Mentoring é um programa de desenvolvimento de colaboradores sob o qual um indivíduo


sênior ou mais experiente (o mentor) é designado para atuar como um conselheiro,
orientador ou guia para um colaborador mais júnior (mentee / mentorado). O mentor é
responsável por fornecer suporte e feedback para seu mentee em temas que o ajudem em
seus desafios de desenvolvimento e crescimento na organização.

Portanto, um mentor é um colaborador sênior que patrocina e apoia um colaborador


menos experiente, seu “protegido”. Os mentores bem-sucedidos são bons professores. Eles
apresentam ideias com clareza, são bons ouvintes e demonstram empatia para com os
problemas e sentimentos de seus protegidos. Esses relacionamentos são válidos tanto para
as funções profissionais como psicossociais.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 381-383.

180
Liderando para o Futuro
Os relacionamentos mentor-mentorado abordam tanto as funções
profissionais como psicossociais, conforme quadro:
Funções da Relação de Mentoring (mentor→mentorado)
Funções Profissionais (do mentor) Funções Psicossociais (do mentor)
o Pressiona a organização para conseguir tarefas desafiantes e o Aconselha o “protegido” a respeito de ansiedades ou
com impacto para o seu “protegido”. incertezas para ajudar a melhorar sua autoconfiança.
o Prepara o “protegido” para desenvolver sua habilidades e o Age como modelo de conduta (ética).
atingir seus objetivos do trabalho. o Oferece amizade e aceitação.
o Dá assistência ao “protegido” ao fornecer-lhe exposição a o Compartilha experiências pessoais com o “protegido”.
pessoas influentes dentro da organização.
o Defende o “protegido” de possíveis riscos a sua reputação.
o Patrocina o “protegido” ao indicá-lo para possíveis contatos ou
promoções.
o Age como um propagador das ideias que o “protegido” hesita
em compartilhar com seu supervisor direto.
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 381-383.
181
Liderando para o Futuro

O mentor desenvolverá a relação, mostrando informalmente ao mentorado


como a organização de fato funciona fora dos procedimentos e estruturas
formais.
Muito mentores sentem a necessidade de compartilhar seus aprendizados
com as gerações mais jovens e querem deixar um legado. O programa de
mentoring é uma oportunidade.
O programa também proporciona acesso “sem filtros” a informações de
funcionários de níveis inferiores, permitindo a identificação de potenciais
problemas dentro da organização.
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 381-383.

182
Liderando para o Futuro

Os programas formais de mentoring têm mais chances de sucesso se


combinarem apropriadamente o estilo, as necessidades e a experiência
do mentor e do mentorado.
Os mentores podem ajudar muito no progresso do “protegido”, pois
podem obter recursos e acionar suas redes de relacionamentos.

Cuidado deve ser tomado com o risco de reforçar um estilo “preferido”


da organização, o que pode deixar pessoas de diferentes perfis isoladas
do processo de mentoring e das oportunidades na organização.
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 381-383.

183
Liderando para o Futuro
Diferença entre Mentoring e Coaching

• As duas abordagens possuem a mesma finalidade: ajudar pessoas a


conseguirem superar suas limitações e alcançarem os seus objetivos.
• Porém, possuem características que as tornam diferentes entre si.
• Combiná-las muitas vezes é a melhor forma de conseguir os melhores
resultados.
• Um líder poderia desenvolver as competências de Coaching e Mentoring.
• O domínio das duas abordagens permite que o Coach / Mentor consiga
fazer com que o coachee / mentee se desenvolva ainda mais, já que ele já
passou pelas mesmas situações que o seu “pupilo”.
Fonte: http://www.ibccoaching.com.br/portal/coaching/o-que-e-coaching-e-mentoring/

184
Liderando para o Futuro
Diferença entre Mentoring e Coaching
Mentoring Coaching
o É uma espécie de tutoria onde um profissional mais velho e o É um processo de aceleração de resultados que consiste no
mais experiente orienta e compartilha com profissionais mais desenvolvimento de competências e habilidades para o
jovens, que estão iniciando no mercado de trabalho ou numa alcance de resultados planejados, e para serem alcançados
empresa, experiências e conhecimentos no sentido de dar-lhes com êxito necessitam de: empenho, foco e ações efetivas por
orientações e conselhos para o desenvolvimento de suas parte do coachee. O responsável por conduzir um processo de
carreiras. O responsável por conduzir um processo de coaching é denominado Coach ou na tradução literal,
mentoring é denominado Mentor. “treinador”.
o Embora também possam ter um viés mais pessoal, esses o Um Coach apoia e auxilia através de perguntas e técnicas
ensinamentos vão ser focados na vida profissional do poderosas seu coachee a sair do estado atual para o estado
mentorado. desejado.
o O mentoring não possui qualquer artifício que limite o tempo o O processo é conduzido através de sessões que podem ser
em que as sessões serão realizadas. semanais, quinzenais ou mensais, com tarefas definidas para
que o coachee atue no sentido de alcançar as metas definidas,
dentro de seu prazo pré-determinado.
Fonte: http://www.ibccoaching.com.br/portal/coaching/o-que-e-coaching-e-mentoring/

185
Encontrar e Desenvolver Líderes
Seleção; Treinamento & Desenvolvimento

186
Encontrar e Desenvolver Líderes Eficazes
5 1
0 9 8-
Seleção
73 .
5 .2
• Identificar líderes eficazes é ao mesmo tempo 3 1 difícil e importante!
i d a
• Essa busca pode começar pela análise
osh de conhecimentos,
i
habilidades e capacidades necessáriosY para uma liderança de modo
u sh
eficaz. t s
A não investir tempo adequado na sucessão
l
• As organizações parecem
e o
da liderança ease c
r surpreendem quando sua seleção se mostra
M
ineficiente!

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 386-387.

187
Encontrar e Desenvolver Líderes Eficazes
5 1
Seleção 0 9 8-
73 .
5 .2
• Podem ser utilizados, por exemplo, testes 3de 1 personalidade para
detectar traços associados à liderançaid–aextroversão,
o
conscienciosidade, e abertura a novassh experiências (big five).
i Y
• Também é importante testarsho grau de automonitoramento
t s u
(autogerenciamento) do A candidato à líder. Quanto mais habilidade de
o indicado ele é, pois essa característica o torna
c
autogestão possuir, elmais
a r
capaz de compreender melhor as situações e de ajustar seu
M
comportamento a elas.
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 386-387.

188
Encontrar e Desenvolver Líderes Eficazes
Seleção

• Entrevistas também podem ser realizadas para


avaliar se experiências anteriores do candidato
podem ser úteis à situação em que ele terá
que agir e também para verificar se o
candidato possui determinados traços de
personalidade como extroversão,
autoconfiança, visão, oratória e carisma, por
exemplo.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 386-387.

189
Encontrar e Desenvolver Líderes Eficazes

Treinamento & Desenvolvimento (T&D)

• Empresas gastam milhões de dólares com programas de


treinamento e desenvolvimento de líderes.
• Para maximizar os resultados de tamanho investimento, as
organizações devem reconhecer que o treinamento de
liderança tende a ter mais sucesso se o indivíduo tiver um
elevado grau de autogerenciamento, pois esse tipo de pessoa
possui flexibilidade para mudar o próprio comportamento.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 386-387.

190
Encontrar e Desenvolver Líderes Eficazes

Potenciais Resultados de um Programa de T&D

• Desenvolvimento de uma compreensão sobre conteúdos críticos para


uma visão eficaz;
• Desenvolvimento de habilidades para a implementação de uma visão;
• Desenvolvimento de habilidades como a construção da confiança e a
função do mentor;
• As pessoas também podem aprender a avaliar melhor as situações,
modificá-las para que se ajustem melhor ao seu estilo e determinar
qual comportamento de liderança é mais eficaz para cada situação.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 386-387.

191
Inteligência Emocional
Conceitos e Definições; Componentes da I.E; Estilos de Liderança; Estágios de
Desenvolvimento para a I.E.

192
Conceitos e Definições
Inteligência Emocional

193
Inteligência Emocional (IE)

Uma pessoa pode ter uma educação notável,


um pensamento bastante analítico, uma visão Uma forma de avaliar se uma liderança é
convincente e uma fonte inesgotável de eficaz é por meio de sua inteligência
ideias geniais, mas, mesmo assim, pode ainda emocional (IE).
não ser necessariamente um grande líder.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 360-361.

194
Inteligência Emocional (IE)

• “A Inteligência Emocional inclui a capacidade de participar de um


processamento sofisticado de informações sobre as próprias emoções
e também sobre as emoções de outras pessoas e a capacidade de
usar essas informações como um guia para o pensamento e para o
comportamento. Ou seja, indivíduos com alto nível de inteligência
emocional prestam atenção, usam, compreendem e gerenciam suas
emoções, e essas habilidades servem a funções adaptativas que
potencialmente se beneficiam a si mesmas e aos outros.”

Fonte: Mayer; Salovey; Caruso. Emotional Intelligence: New Ability or Eclectic Traits? American Psychologist, 2008.

195
Inteligência Emocional (IE)

Como você pode dizer E como você pode


Daniel Goleman nos
para uma pessoa se ela reconhecer essa
apresenta os
tem alta Inteligência competência em você
componentes da IE...
Emocional? mesmo?

Fonte: Goleman, D. (1998), What Makes a Leader? p. 93-102.

196
Componentes da Inteligência
Emocional
Inteligência Emocional

197
Inteligência Emocional (IE)
Cinco Componentes da Inteligência Emocional (IE)
Componente Descrição Marca Grupos
Habilidade de reconhecer e entender seu ✓ Auto confiança
Autoconsciência temperamento, suas emoções e iniciativas, assim ✓ Autoavaliação realista
como seus efeitos nos outros. ✓ Senso de humor com próprios defeitos habilidades
de autoge-
Autodisciplina Habilidade de controlar ou redirecionar impulsos e ✓ Confiança e integridade
renciamento
temperamentos desordenados. A propensão a ✓ Conforto com a incerteza
Autogerenciamento /
protelar julgamentos, pensar antes de agir. ✓ Abertura para a mudança
automonito-
Uma paixão pelo trabalho por razões que vão além ✓ Motivação p/ execução de atividades ramento
Motivação do dinheiro ou posição. Uma propensão a ✓ Otimismo, mesmo com o fracasso
perseguir metas com energia e persistência. ✓ Compromisso organizacional

Empatia Capacidade de entender o modo de ser emocional ✓ Especialista em construir e reter talentos habilidades
das outras pessoas. Habilidade em treinar pessoas ✓ Sensibilidade a diferentes culturas em gerenciar
Consciência Social de acordo com suas reações emocionais. ✓ Serviço aos clientes sua relação
Capacidade de gerenciar relacionamentos e ✓ Eficácia em liderar mudanças com as
Habilidade Social demais
desenvolver networks. Habilidade para encontrar ✓ Persuasão
Gestão do Relacionamento fundamento comum e construir entendimento. ✓ Especialista em construir/liderar equipes pessoas

Fonte: Goleman, D. (1998), What Makes a Leader? p. 93-102. 198


Inteligência Emocional (IE)
(Classes, Capacidades Fundamentais e Grupos de Competências)

Habilidade de dirigir eficazmente Habilidade de dirigir eficazmente


a nós mesmos nossos relacionamentos
Autoconsciência Autogerenciamento Consciência Social Habilidades Sociais
Habilidade de controlar ou Capacidade de entender o Capacidade de gerenciar
Habilidade de reconhecer e redirecionar impulsos e modo de ser emocional das relacionamentos e
entender seu temperamento, temperamentos outras pessoas. Habilidade em desenvolver networks.
suas emoções e iniciativas, desordenados. A propensão a entender as pessoas de Habilidade para encontrar
assim como seus efeitos nos protelar julgamentos, pensar acordo com suas reações fundamento comum e
outros. antes de agir. emocionais. construir entendimento.

✓ Autoconsciência ✓ Autocontrole ✓ Empatia ✓ Liderança visionária


emocional ✓ Confiança ✓ Consciência ✓ Influência
✓ Auto avaliação ✓ Estado consciente Organizacional ✓ Desenvolver os outros
✓ Autoconfiança (consciensiosidade) ✓ Orientação a serviços ✓ Comunicação
✓ Adaptabilidade ✓ Mudança catalisadora
✓ Orientação a resultados ✓ Gerenciamento de conflitos
✓ Construção de laços
✓ Iniciativa
✓ Trabalho de equipe e
colaboração

Fonte: Goleman, D. (1998), What Makes a Leader? p. 93-102. / Goleman, D. (2000), Leadership that gets Results, p. 78-90 199
Inteligência Emocional (IE)
5 1
0 9 8-
73 .
.2
A característica de cuidar,
5
31
que é própria da empatia,

i d a
especialmente com relação

sh às pessoas com quem se

da IE é a empatia. Os líderes Yo
Um componente primordial trabalha, é o que as inspira a

que têm empatia podem


sh i permanecerem com um
líder quando surgem

sentimentos A t s u
perceber as necessidades
dos outros;
e problemas. O mero fato de
alguém se importar com
e l o você costuma ser

a r c frequentemente
M recompensado com
lealdade.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 360-361.

200
Inteligência Emocional (IE)

A empatia pode ser definida como:

• (PSICOL) Habilidade de imaginar-se no lugar de outra pessoa;


• (PSICOL) Compreensão dos sentimentos, desejos, ideias e ações
de outrem;
• Qualquer ato de envolvimento emocional em relação a uma
pessoa, a um grupo e a uma cultura;
• Capacidade de interpretar padrões não verbais de comunicação;
• Sentimento que objetos externos provocam em uma pessoa.

Fonte: http://michaelis.uol.com.br/busca?id=Oaje

201
Estilos de Liderança &
Inteligência Emocional
Inteligência Emocional

202
Inteligência Emocional (IE)

• Executivos, Diretores, Líderes em geral usam seis estilos de liderança.

• Cada um se originando dos componentes da Inteligência Emocional.

• Daniel Goleman e demais pesquisadores observaram que cada estilo


tem diferente impacto no clima organizacional (flexibilidade,
responsabilidade, padrões, recompensas, clareza, comprometimento).

Fonte: Goleman, D. (2000), Leadership that Gets Results, p. 78-90.

203
Inteligência Emocional (IE)
Seis Estilos de Liderança – Inteligência Emocional (IE)
Coercivo Agressivo Conselheiro Democrático Agregador Confiável
Estabelece altos Forja consenso Cria harmonia e Mobiliza pessoas em
Os modos de ação Exige imediata Desenvolve pessoas
padrões de através da constrói laços direção de uma
dos líderes obediência para o futuro
desempenho participação emocionais visão

O estilo em uma “faça o que eu “faça como eu “o que você “As pessoas vêm
“tente isso” “Venha comigo”
frase digo” faço, agora” pensa?” primeiro”

Implícita Conduzir à Consciência, Desenvolver os Colaboração, Empatia, construção Autoconfiança,


competência da execução, iniciativa, conduzir à execução, outros, empatia, liderança de equipe, de relacionamentos, empatia, mudança
Intel. Emocional autocontrole iniciativa autoconsciência comunicação comunicação estimulante
Na ajuda de um Na cura de rupturas em
Em uma crise e/ou no Na obtenção de Na consolidação ou no Quando as mudanças
funcionários a melhorar uma equipe ou na
Quando os estilos início dela, ou com resultados de uma consenso, ou para obter requerem nova visão ou
o desempenho ou motivação de pessoas
funcionam melhor problemas de equipe motivada e contribuição de quando é necessária
desenvolver força a durante circunstâncias
funcionários competente funcionários de valor uma clara direção
longo prazo de estresse
Impacto Negativo Negativo Positivo Positivo Positivo Muito Positivo
abrangente no
clima org. – 204 204
+
Fonte: Goleman, D. (2000), Leadership that Gets Results, p. 78-90.
Inteligência Emocional (IE)
Inteligência Emocional (IE)

Fonte: Goleman, D. (2000), Leadership that Gets Results, p. 78-90.

205
Inteligência Emocional (IE)

Poucos líderes têm todos os seis estilos em seu acervo e menos ainda sabem
quando e como usá-los.

Um líder pode construir uma equipe com membros que empregam estilos
diferentes.

Os líderes podem expandir seus próprios acervos de estilos. Para isso, devem
entender qual a competência de inteligência emocional que fundamenta os estilos
de liderança de que eles carecem. Podem então trabalhar assiduamente para
melhorar seus quocientes.
Fonte: Goleman, D. (2000), Leadership that Gets Results, p. 78-90.

206
Estágios de Desenvolvimento da
Inteligência Emocional
Inteligência Emocional

207
207
Inteligência Emocional (IE)

Processo de Cinco Etapas para Reprogramar o Cérebro e Obter + I.E.

• Um líder com Inteligência Emocional pode monitorar seu estado de humor por
meio de auto consciência, mudá-lo para melhor através de seu auto
gerenciamento, entender o impacto usando a empatia, e agir de forma a
influencia o estado de humor dos outros por meio do gerenciamento das
relações;

• Goleman, Boyatzis e McKee propõem um processo de cinco estágios projetado


para reprogramar o cérebro para mais comportamentos de inteligência
emocional.
Fonte: Goleman, et al. (2001), Primal Leadership, p. 42-51.

208
Inteligência Emocional (IE)
Processo de Cinco Etapas para Reprogramar o Cérebro e Obter + I.E.
1. Quem eu desejo ser?
2. Quem eu sou agora?
3. Como eu chego lá?
4. O que eu faço para que a mudança perdure?
5. Quem pode me ajudar?

Fonte: Goleman, et al. (2001), Primal Leadership, p. 42-51.

209
Inteligência Emocional (IE)
Processo de Cinco Etapas para Reprogramar o Cérebro e Obter + I.E.

4) O que
1) Quem 2) Quem 3) Como eu faço 5) Quem
eu desejo eu sou eu chego para que a pode me
ser? agora? lá? mudança ajudar?
perdure?

Fonte: Goleman, et al. (2001), Primal Leadership, p. 42-51.


210
Resumo e Implicações para os
Gestores e Organizações
Fechamento e Retomada das Teorias e Tipos de Liderança

211
211
Implicações para os Gestores e Organizações

A liderança tem um papel


Saber o que define um líder
central para a compreensão do E pode ter impactos em um
eficaz pode ser valioso para a
comportamento do grupo, pois melhor clima organizacional e
melhoria de desempenho do
é o líder quem, geralmente, na qualidade de vida dos
grupo e, consequentemente da
oferece a direção para alcançar colaboradores!
organização.
os objetivos.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 389.

212
Implicações para os Gestores e Organizações

Importância da Teoria dos


Traços

Estudos recentes e com validações têm mostrado resultados


animadores no que tange ao uso de dimensões de personalidade
(teoria dos traços), principalmente na aplicação do modelo Big Five. A
extroversão, a conscienciosidade, e a abertura a novas experiências
mostraram uma relação forte com a eficácia da liderança.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 389.

213
Implicações para os Gestores e Organizações

Importância da Abordagem Comportamental

• A principal contribuição da abordagem comportamental foi a


classificação da liderança em duas categorias:

• orientada para a tarefa (estrutura de iniciação), e

• orientada para as pessoas (consideração).

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 389.

214
Implicações para os Gestores e Organizações

Importância de Abordagens Contingenciais

• Ao considerar a situação na qual o líder está inserido, as teorias


contingenciais prometiam um avanço na compreensão da liderança.

• No entanto, apenas o modelo de Contingência de Fiedler


apresentaram resultados mais satisfatórios.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 389.

215
Implicações para os Gestores e Organizações

Importância de Abordagens Contingenciais

Modelo de Contingência de Fred Fiedler


três dimensões contingenciais ou situacionais que determinam a eficácia da liderança

Relação Líder- Estrutura da Tarefa Poder da Posição


Liderados
O grau de estruturação e O grau de influência que
O grau de confiança, formalização dos um líder tem sobre
credibilidade e respeito procedimentos e das variáveis como o poder de
que os membros do grupo tarefas no trabalho. contratar, demitir, tomar
têm pelo seu líder. Líderes orientados para a ações disciplinares,
tarefa apresentam melhor conceder promoções e
Líderes orientados para o
desempenho em situações aumentos salariais.
relacionamento têm melhor
mais extremas de alto e
desempenho nas situações
baixo controle.
de controle moderado.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 389.

216
Implicações para os Gestores e Organizações

Importância da Liderança Carismática e


Transformacional

• As organizações estão cada vez mais


procurando dirigentes que exibam qualidades
de liderança transformacional.
• Elas querem líderes com visão e com o carisma
necessário para implementá-la.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 389.

217
Implicações para os Gestores e Organizações

Importância da Liderança Autêntica

• Os líderes eficazes devem também ser autênticos e


desenvolver relacionamentos de confiança com aqueles
que desejam liderar.
• A confiança entre líderes e liderados pode ajudar na
redução de regras burocráticas quanto à definição de
expectativas e relacionamentos.
• Os gestores não confiáveis não são considerados líderes
eficazes!
Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 389.

218
Implicações para os Gestores e Organizações

Importância da Sucessão

• É fundamental a preocupação e o investimento de tempo e


recursos na identificação dos líderes do futuro (sucessão).
• A alta administração também deve considerar o
investimento em treinamento e desenvolvimento da
liderança por meio de cursos, workshops, rodízio de
responsabilidade (job rotation), treinamentos em
programas de mentoring e coaching, dentre outros.

Fonte: Robbins et al. (2010), Comportamento Organizacional, pág. 389.

219
Recado Final
Seja o Líder da Transformação

220
220
Você está no estado normal ou fundamental de liderança?
• Estou na minha “zona de conforto”? (prendendo-me aquilo que já conheço);
• Estou mais voltado ao que as pessoas pensam ou querem de mim? (atendendo
aos desejos dos outros no esforço de ‘manter a paz’);
• Estou mais fechado no meu próprio mundo, no meu ego? (colocando meus
interesses próprios acima dos interesses do coletivo);
• Estou internamente fechado, sem ouvir os sinais do ambiente externo?
(bloqueando os estímulos externos, concentrando-me mais nas tarefas e assim
evitando riscos).
Fonte: Robert E. Quinn (2005). Moments of greatness - fundamental state of leadership, HBR, Jul-Aug_2005.
221
221
Estado Fundamental da Liderança
Ficar no zona de conforto Orientado ao que os outros
(mesmos resultados) querem ou esperam de mim.
Estou focado no bem coletivo, nas
necessidades da minha organização, Eu estou aberto aos estímulos
dos stakeholders, da minha externos que me permitem aprender
comunidade? continuamente?

Eu estou orientado aos meus valores Eu estou orientado a resultados (que


internos, por aquilo que me pauta façam sentido para mim, conectados
(conectados com quem Eu sou, com com quem Eu sou, com qual é o meu
qual é o meu Trabalho)? Trabalho)?
Fechado no próprio mundo, sem ouvir Foco nos próprios interesses,
os sinais do ambiente externo. no próprio ego.
Fonte: Robert E. Quinn (2005). Moments of greatness - fundamental state of leadership, HBR, Jul-Aug_2005.
222
222
“Pessoas ‘normais’ que acham sua vida entediante, ou sem inspiração, são
assim, pois nunca tentaram ganhar conhecimento que as inspirassem. Estão
tão hipnotizadas pelos seus ambientes, pela mídia, pela televisão, por
pessoas que ditam ideias e parâmetros que todos lutam para imitar, mas que
ninguém consegue alcançar em termos de aparência física, definições de
beleza e valor que são ilusões pelas quais as pessoas se rendem e vivem
mediocremente. E vivendo essa ilusão suas almas podem nunca aparecer
para que possam mudar. Mas se alma vier à tona, a pessoa passa a se
perguntar se existe algo além disso, ou por que estamos aqui, qual é o
propósito da vida, para onde iremos, o que acontece quando morremos. Se
começarem a fazer tais perguntas, podem começar a flertar e interagir com a
percepção de que estão tendo um colapso nervoso. Mas na verdade são os
seus velhos conceitos que estão começando a desmoronar.”

DR. Joe Dispenza, D.C


Doctor of Chiropractic Medicine, Life
University, Atlanta Georgia
Formado em bioquímica, Pós-graduação
em anatomia e fisiologia, neuroquímica,
neurofisiologia e genética
Extraído do Documentário: Quem Somos Nós? (What the Bleep Do We Know!?) 223
Why good leaders make you feel safe
• March 2014 | TED2014 (12 minutes)
• This talk was presented at an official TED conference, and was
featured by our editors on the home page

• What makes a great leader? Management theorist


Simon Sinek suggests, it’s someone who makes
their employees feel secure, who draws staffers
into a circle of trust. But creating trust and safety
— especially in an uneven economy — means
taking on big responsibility.

• Simon Sinek – Leadership expert – explores how


leaders can inspire cooperation, trust and change.
He's the author of the classic “Start With Why”; his
latest book is “Leaders Eat Last.”
Fonte: https://www.ted.com/talks/simon_sinek_why_good_leaders_make_you_feel_safe
224
224
Referências
Referências Principais
Dicas de Livros em Liderança e Educação
Vídeos

225
225
Referências Utilizadas
Falconi, V. O Verdadeiro Poder: práticas de gestão que conduzem a resultados revolucionários, Nova Lima: INDG Tecnologia e
Serviços Ltda, 2009.
Goleman, D. Inteligência Emocional: a teoria revolucionária que redefine o que é ser inteligente, Rio de Janeiro: Editora
Objetiva Ltda. 35ª Edição, 1995.
Goleman, D. Leadership that Gets Results, Harvard Business Review, Mar-Apr, 2000, p. 78-90.

Goleman, D. Liderança: a inteligência emocional na formação de um líder de sucesso, Rio de Janeiro: Editora Objetiva Ltda.
1ª Edição, 2015.
Goleman, D. What Makes a Leader? Harvard Business Review, Nov-Dec, 1998, p. 93-102.

Goleman, D.; Boyatzis, R. E.; McKee, A. Primal Leadership: The Hidden Driver of Great Performance, Harvard Business
Review, Dec, 2001, p. 42-51.
Herzberg, F. One more time: how do you motivate employees? Harvard Business Review, vol.46, no.1, 1968, pp.53–62.

Hitt, M. A.; Miller, C. C.; Colella, A. Comportamento Organizacional, [tradução e revisão técnica Teresa Cristina Padilha de
Souza], 3ª Edição, Rio de Janeiro: LTC, 2016.

226
Referências Utilizadas
Kotter, J. P. What Leaders Really Do, Harvard Business Review, May-June, 1990, p. 103-111.

Mayer, J. D.; Salovey, P.; Caruso, D. R. Emotional Intelligence: New Ability or Eclectic Traits? American
Psychologist, September 2008, Vol. 63, No. 6, pages 503 - 517.
Oxford Living Dictionaries, https://en.oxforddictionaries.com/definition/personality_trait.

Renner, T. Psico, [tradução Marcelo de Abreu; revisão técnica Silvia H. Koller], Porto Alegre: AMGH, 2012.

Robbins, S. P.; Judge, T. A.; SOBRAL, F. Comportamento Organizacional: teoria e prática no contexto brasileiro,
[tradução Rita de Cássia Gomes], 14ª Edição, São Paulo: Pearson Prentice Hall, 2010.
Schwartz, T.; McCarthy, C. Manage Your Energy, Not Your Time, Harvard Business Review, October, 2007.

Associação Brasileira de Normas Técnicas (ABNT). ABNT NBR 15.419:2006 – Sistemas de Gestão da Qualidade –
diretrizes para a aplicação da ABNT NBR ISO 9001:2000 nas organizações educacionais, 1ª edição, 2006.

227
Livros Recomendados – Comportamento Organizacional

228
Livros Recomendados - Educação

229
Livros Recomendados
• Inovação Na Sala De Aula -
Como A Inovação Disruptiva
Muda A Forma De Aprender.
• Por Clayton M. Christensen,
Michael B. Horn, Curtis W.
Johnson.
• Bookman, Edição: 1, 2012.

230
Livros Recomendados
• O Foco Triplo.
• Por Daniel Goleman e Peter
Senge.
• Objetiva, Edição: 1ª, 2016.

231
Livros Recomendados
• The Best Teacher in You: How to
Accelerate Learning and Change
Lives.
• Por Robert Quinn, Kate Heynoski,
Michael Thomas, Gretchen Spreitzer.
• Berrett-Koehler Publishers, 1 edition,
2014.

232
Livros Recomendados - Liderança

233
Livros Recomendados
• Como Avaliar Sua Vida?
• por Clayton Christensen, James
Allworth, Karen Dillon.
• Alta Books, Edição: 1ª, 2012.

234
Vídeos Recomendados

• TED palestra de Simon Sinek “Why good leaders make you feel safe” (12 minutos)
✓ https://www.ted.com/talks/simon_sinek_why_good_leaders_make_you_feel_safe

• TED palestra de Simon Sinek “Como os grandes líderes inspiram a ação” Legendado em Português Tav (18 minutos)
https://www.youtube.com/watch?v=1mQieoaZVu8&feature=youtu.be

• TED palestra de Roselinde Torres “What it takes to be a great leader” (9 minutos)


✓ https://www.ted.com/talks/roselinde_torres_what_it_takes_to_be_a_great_leader?utm_content=awesm-
publisher&utm_campaign=&awesm=on.ted.com_Torres&utm_source=linkedin.com&utm_medium=on.ted.com-static

235
Liderança em Data Science
Prof. Mateus C. Gerolamo
linkedin.com/in/mateus-gerolamo-802b965/

Muito Obrigado
236
ANALYTICS E GESTÃO DE
RISCOS
Prof. Fabiano Guasti Lima
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98
Programa
Modelos de gestão de risco de mercado, operacional e compliance; Basiléia III;
modelos de risco de crédito; modelos para demais tipos de riscos aplicáveis (risco
legal e regulamentar; risco social e ambiental; reputacionais); casos reais e
práticos.

Referências bibliográficas
LIMA, Fabiano Guasti.
Análise de Riscos. 2. ed.
FAVERO, Luiz Paulo, BELFIORE,
São Paulo: Atlas, 2018.
Patrícia. Análise de dados:
estatística e modelagem
multivariada com Excel, SPSS e
Stata. Gen, LTC, 2017.

3
Agenda

Analytics para avaliação de Modelos de Risco:


• Mercado
• Crédito
• Operacional
Scripts em R

4
Modelos de Riscos
para
Ativos Individuais
Risco e Retorno de Ativos Individuais

PETR4 Ibovespa Café Arábica


Junho/22 R$ 22,74 98.542 R$ 1.361,20
Julho/22 R$ 27,80 103.165 R$ 1.300,89
Agosto/22 R$ 33,23 109.523 R$ 1.344,20
Setembro/22 R$ 29,80 110.037 R$ 1.286,80
Fontes: PETR4 e Ibovespa: B3; Café Arábica – CEPEA/Esalq – Imagens: google imagens – Acesso em 05/10/2022

Quem
oscilou
mais?

6
Buscando dados

7
Risco e Retorno de Ativos Individuais
• Retorno
• Discreto

• Contínuo

8
Risco no Contexto de
Carteiras

9
Risco e Retorno no contexto de carteiras
Ativo A Ativo B
Ano 1 13,41% 26,62%
Ano 2 0,94% 45,13%
Ano 3 10,21% 20,21%
Ano 4 4,91% 17,37%
Ano 5 10,53% 15,67%

Ativo A Ativo B
RETORNO MÉDIO 8% 25%
RISCO 5% 12%

10
Harry Markowitz
(1927-)

Fonte: Google Imagens

The Journal of Finance – Portfolio Selection - Harry Markowtiz (1952), v.7, n.1, p. 77-91
https://www.math.ust.hk/~maykwok/courses/ma362/07F/markowitz_JF.pdf

11
Risco e Retorno no contexto de carteiras
Ativo A Ativo B
RETORNO 8% 25%
RISCO 5% 12%
Investimento R$ 5.000,00 R$ 5.000,00
Percentual 50% 50%

12
Risco e Retorno no contexto de carteiras
Ativo Part. % Retorno Risco
A Wa Ra Sa
B Wb Rb Sb
Carteira 100% RC = Wa  Ra + Wb  Rb expressão abaixo

SC = W S + W S + 2WaWb corr ( Ra , Rb ) S a Sb
a
2 2
a b
2 2
b

ou Covariância (Ra , Rb)

SC = Wa2 S a2 + Wb2 Sb2 + 2WaWb cov( Ra , Rb )

13
Harry Markowitz (1927-)
Sugestão de Vídeo:

Fonte: Google Imagens

1990 – Prêmio Nobel de Economia

Hear What Dr. Harry Markowitz, A Superhero Of Modern


Economics, Has To Say About Investing – Entrevista 21/03/2019
https://www.youtube.com/watch?v=os0B1oQfNdo

14
Harry Markowitz (1927-)
Sugestão de Vídeo:

Fonte: Google Imagens

1990 – Prêmio Nobel


de Economia

IFA.com with Mark Hebner - An Hour with Harry Markowitz, Father


of Modern Portfolio Theory – Entrevista - 19/06/2020
https://www.youtube.com/watch?v=lq2PL-Hxmio

15
Efeito da Correlação correl = - 0,627
Ibovespa X Dólar
120000 4,5

4
100000
3,5

80000 3

2,5
60000 Ibovespa
2 Dólar

40000 1,5

1
20000
0,5

0 0
jul/09 nov/10 abr/12 ago/13 dez/14 mai/16 set/17 fev/19 jun/20

Fonte: Economática – Cotações de jan/2010 a set/2019

16
Efeito da Correlação correl = 0,532
PETR4 X VALE3
70 30

60
25

50
20

40

15 VALE3
PETR4
30

10
20

5
10

0 0
jul/09 nov/10 abr/12 ago/13 dez/14 mai/16 set/17 fev/19 jun/20

Fonte: Economática – Cotações de jan/2010 a set/2019

17
Risco e Retorno no contexto de carteiras
Ativo A Ativo B
RETORNO 8% 25%
RISCO 5% 12%
Investimento R$ 5.000,00 R$ 5.000,00 correl = - 0,60
Percentual 50% 50%

18
Carteira com mais de dois ativos

𝑅𝑒𝑡𝐶𝑎𝑟𝑡 = ෍ 𝑊𝑖 × 𝑅𝑒𝑡_𝑎𝑡𝑖𝑣𝑜𝑖
𝑖=1

𝑐𝑜𝑣𝑎𝑟11 ⋯ 𝑐𝑜𝑣𝑎𝑟1𝑛 𝑊1
𝑅𝑖𝑠𝑐𝑜𝐶𝑎𝑟𝑡 = 𝑊1 ⋯ 𝑊𝑛 × ⋮ ⋱ ⋮ × ⋮
𝑐𝑜𝑣𝑎𝑟𝑛1 ⋯ 𝑐𝑜𝑣𝑎𝑟𝑛𝑛 𝑊𝑛

19
Modelos de
Risco de Crédito

20
Risco de Crédito

O risco de crédito é o risco de perda


econômica decorrente do não
cumprimento de obrigações
contratuais por uma contraparte

21
Risco de Crédito
• História recente mostrou que os problemas de crédito são
fundamentais para a economia, empresas e instituições
financeiras e não financeiras.....

Crises da Ásia, Rússia, subprime....

Risco de pré-liquidação (presettlement risk)

• Contábil • Prudencial/Gestão
• Perda Incorrida – IAS 39 • Perda Esperada (Expected Loss – EL)
• Perda Provável – COSIF • Perda Não Esperada (Unexpected
• Perda Esperada – IFRS9 Loss – UL)

• Provisão: suporta as perdas esperadas


• Capital: suporta as perdas não esperadas

22
Risco de Crédito

23
Risco de Crédito
Direcionadores do risco de crédito

Inadimplência (default) (b)


• Uma contraparte está ou não em default (inadimplente)
• Este evento envolve uma probabilidade de default
Exposição a crédito no default (EC)
• Incerteza quanto ao valor da exposição do crédito no momento do default

Perda dado default (condicionada ao evento)- PDF


• Incerteza quanto ao valor que pode ser recuperado após o default
• 1 menos a taxa de recuperação do credor

24
Risco de Crédito
Perda de Crédito = b  EC  PD

Negociação com devedor com o intuito de recuperar


uma parte ou a totalidade do valor devido.
• Chamaremos de t a taxa de recuperação
• Logo, 1 – t é a perda percentual condicionada no
evento de default

Perda de Crédito = b  EC  (1-t)

25
Risco de Crédito

Considere uma carteira com exposição total a crédito de R$100 mil


investida em três créditos.

• Crédito A: EC = R$ 10 mil; p = 0,02


• Crédito B: EC = R$ 20 mil; p = 0,05
• Crédito C: EC = R$ 70 mil; p = 0,10

Suposições: exposições constantes; taxa de recuperação = 0; defaults


independentes

26
Risco de Crédito

DISTRIBUIÇÃO DAS PERDAS


90,00% 100,00%
80,00%
70,00% 95,00%

60,00%
90,00%
50,00%
40,00%
85,00%
30,00%
20,00% 80,00%
10,00%
0,00% 75,00%
- 10.000,00 20.000,00 70.000,00 30.000,00 80.000,00 90.000,00 100.000,00

Perda Esperada Perda Não


Esperada Perda Excepcional
R$ 8.200
R$ 61.800

27
Gestão de Riscos

Comitê de Basiléia – localiza-se na cidade de Basiléia I, II e III – outra denominação para o


Basiléia (Suíça) formado por membros de Acordo de Capitais, que estabelece
Bancos Centrais de países desenvolvidos que indicadores de solvência e alavancagem para
debatem e formalizam estudos e documentos. IFs.

Novo Acordo de Capital – trata-se de um novo


compêndio de melhores práticas para gestão BIS – é uma instituição financeira denominada
de riscos mundial (conhecido também por o banco central dos bancos centrais ou em
Basiléia II). inglês: Bank for International Settlements

28
Gestão de Riscos

BIS – Bank for International Settlements -


Banco de Compensação Internacional

Ele visa "promover a


cooperação entre os
Fundado em 1930, é
bancos centrais e Sediado em Basiléia
uma organização
outras agências na na Suíça, reúne 55
internacional
busca de bancos centrais de
responsável pela
estabilidade todo o mundo.
supervisão bancária.
monetária e
financeira".

29
Gestão de Riscos
▪ Bank for Internacional Settlements (BIS):
• Fortalecer a cooperação financeira internacional

▪ Comitê da Basiléia sobre Supervisão Bancária (BCBS):


• Solvência, liquidez e estabilidade do sistema bancário internacional

▪ Acordo da Basileia:
• 1988: Basiléia 1 – requerimento de capital para risco de crédito
• 1996: Requerimento de capital para risco de mercado
• 2004: Basiléia 2 – requerimento de capital para risco operacional
• 2007: Patrimônio de Referência (PR) e Patrimônio de Referência Exigido (PRE)
• 2009: Basileia 2,5 – securitizações
• 2010: Basiléia 3

30
Gestão de Riscos

O foco do Primeiro Acordo está no crédito, ou seja, as instituições


tinham de ter capital próprio suficiente para garantir as operações
realizadas, com limite mínimo foi definido em 8%.

O Acordo Atual estabelece que o Capital do Banco deve


ser maior ou igual à 8% da soma dos riscos incorridos:

Capital
 8%
Risco de Mercado + Risco de Crédito

31
Gestão de Riscos
Critério de Ponderação do Basiléia I
A ponderação dos ativos de crédito ao risco é principalmente função do
tipo da exposição:
PONDERAÇÃO ATIVO
Caixa
0% Solicitações de créditos relacionadas à países e seus
bancos centrais
0%, 20% ou 50%
Solicitações de créditos relacionadas à empresas do
(à critério do Banco
setor público não - federais
Central Local)
Solicitações de crédito relacionadas aos bancos
20%
multilaterais de desenvolvimento (MDBs)
Solicitações de crédito garantidas por propriedade
50% residencial
Solicitações de crédito relacionadas à bancos
100% Solicitações de crédito relacionadas à empresas
Todos os demais ativos

32
Gestão de Riscos
Índice da Basiléia
Ativo Ponderado Pelo Risco

Exemplo:
Ativos $
Caixa 1.000
Aplicações 50.000
Financiamento Imobiliário 200.000
Empréstimos 300.000

33
Gestão de Riscos
Índice da Basiléia
Ativo Ponderado Pelo Risco

Exemplo:
Ativos $ Pesos APR - $
Caixa 1.000 0% 0
Aplicações 50.000 20% 10.000
Financiamento Imobiliário 200.000 50% 100.000
Empréstimos 300.000 100% 300.000
TOTAL 551.000 410.000

34
Gestão de Riscos
Índice da Basiléia
Ativo Ponderado Pelo Risco
Nível 1: Capital Social + Reservas de Capital + Reservas de Lucros
+/- Lucros ou (Prejuízos) Acumulados + Participações
Nível 2: Reservas de Reavaliação + Reservas de Contingência +
Dívidas Subordinadas + Instrumentos Híbridos de Capital
Exemplo:
Patrimônio $
Nível 1 40.000
Nível 2 30.000
TOTAL 70.000

35
Gestão de Riscos

Índice da Basiléia
Exemplo:
Índice
APR 410.000
PR 70.000
PR/APR 17,1%

Instituição Adequada

36
Basiléia III

Fonte: Bacen – apresentação do Basiléia III - 2013

37
Modelos de
Risco Operacional

38
Mensuração do Risco Operacional

• Baseada na distribuição de perdas (frequência e severidade).


• Utilizar dados históricos de frequência e valores de perdas
operacionais.
• Utilizar estimativas subjetivas de probabilidades e/ou valores relativos
às frequências e severidades.
• Utilizar distribuições teóricas feitas com base em dados históricos ou
expertise do gestor.

39
Risco Operacional
Seja n o número de eventos relacionados ao risco operacional
dentro de um intervalo de tempo arbitrado. (EX. 1 ano)

Seja S a severidade (magnitude) de cada perda considerando


que ela ocorreu.

Considere também as Probabilidades associadas a cada um


dos valores de n e S.

Tabula-se os resultados elaborando uma distribuição empírica


das combinações dos eventos com as respectivas magnitudes.

40
Exemplo:

Número de Perdas Probabilidade


Nenhuma 70%
1 20%
2 10%

Magnitude da Perda Probabilidade


$ 500 60%
$ 10.000 30%
$ 50.000 10%

41
Exemplo:

Próximos passos:
• Combinar as possibilidades para gerar uma distribuição empírica
para as perdas potenciais operacionais

• VaR Operacional
• Calcular o VALOR EM RISCO para o nível de confiança
desejado

• VaR Operacional = PIOR PERDA – perda esperada média

42
Fluxos de Caixa
E SEUS RISCOS

43
FLUXOS DE CAIXA E ANÁLISE
DE INVESTIMENTOS

Investimento é avaliado com base nos benefícios esperados


futuros: FLUXOS DE CAIXA

Distribuição TEMPORAL dos fluxos de caixa

Movimentações operacionais efetivas de caixa, líquidas do IR.


Despesas não desembolsáveis

44
PRINCIPAIS COMPONENTES
DO FLUXO DE CAIXA

Investimento inicial

Entradas de caixa operacionais

Fluxo de caixa residual

45
CÁLCULO DAS ENTRADAS DE CAIXA
OPERACIONAIS

RECEITAS
- DESPESAS OPERACIONAIS
= EBITDA
- DEPRECIAÇÃO
= LUCRO ANTES DO IMPOSTO DE RENDA = EBIT
- IMPOSTO DE RENDA
= LUCRO APÓS I.R. = NOPAT
+ DEPRECIAÇÃO
= ENTRADA DE CAIXA OPERACIONAL

46
Exemplo

• Investimento: 200 mil


• Receitas: (mil) Ano 1 Ano 2 Ano 3 Ano 4
Receita 170 145 125 100
• Despesas Operacionais:
(mil) Ano 1 Ano 2 Ano 3 Ano 4
Desp. Op. 23 23 20 20
• Depreciação Anual: 50,0 mil
• Alíquota do IR = 40%
•Taxa de Retorno Espertada = 14% a.a

47
Sugestão para Simulações:

A sugestão do @ RISK como


ferramenta de análise nesta aula
não tem qualquer vínculo
financeiro com a PALISADE.
Sugerimos a sua utilização
apenas pela qualidade da
ferramenta e sua capacidade
avançada de análise.

https://www.palisade-br.com/

48
Fonte: Imagem da Planilha feita em aula

49
Fonte: Imagem da Planilha feita em aula

50
51
Tipos de Distribuição

52
OBRIGADO!

Prof. Fabiano Guasti Lima

/fabiano-guasti-lima-b9830282/

53
ANALYTICS E GESTÃO DE
RISCOS
Prof. Fabiano Guasti Lima
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98
Programa
Modelos de gestão de risco de mercado, operacional e compliance; Basiléia III;
modelos de risco de crédito; modelos para demais tipos de riscos aplicáveis (risco
legal e regulamentar; risco social e ambiental; reputacionais); casos reais e
práticos.

Referências bibliográficas
LIMA, Fabiano Guasti.
Análise de Riscos. 2. ed.
FAVERO, Luiz Paulo, BELFIORE,
São Paulo: Atlas, 2018.
Patrícia. Análise de dados:
estatística e modelagem
multivariada com Excel, SPSS e
Stata. Gen, LTC, 2017.

3
Agenda

Analytics para avaliação de Modelos de Risco:


• Mercado
• Crédito
• Operacional
Scripts em R

4
Modelos de Riscos
para
Ativos Individuais
Risco e Retorno de Ativos Individuais

PETR4 Ibovespa Café Arábica


Junho/22 R$ 22,74 98.542 R$ 1.361,20
Julho/22 R$ 27,80 103.165 R$ 1.300,89
Agosto/22 R$ 33,23 109.523 R$ 1.344,20
Setembro/22 R$ 29,80 110.037 R$ 1.286,80
Fontes: PETR4 e Ibovespa: B3; Café Arábica – CEPEA/Esalq – Imagens: google imagens – Acesso em 05/10/2022

Quem
oscilou
mais?

6
Buscando dados

7
Risco e Retorno de Ativos Individuais
• Retorno
• Discreto

• Contínuo

8
Risco no Contexto de
Carteiras

9
Risco e Retorno no contexto de carteiras
Ativo A Ativo B
Ano 1 13,41% 26,62%
Ano 2 0,94% 45,13%
Ano 3 10,21% 20,21%
Ano 4 4,91% 17,37%
Ano 5 10,53% 15,67%

Ativo A Ativo B
RETORNO MÉDIO 8% 25%
RISCO 5% 12%

10
Harry Markowitz
(1927-)

Fonte: Google Imagens

The Journal of Finance – Portfolio Selection - Harry Markowtiz (1952), v.7, n.1, p. 77-91
https://www.math.ust.hk/~maykwok/courses/ma362/07F/markowitz_JF.pdf

11
Risco e Retorno no contexto de carteiras
Ativo A Ativo B
RETORNO 8% 25%
RISCO 5% 12%
Investimento R$ 5.000,00 R$ 5.000,00
Percentual 50% 50%

12
Risco e Retorno no contexto de carteiras
Ativo Part. % Retorno Risco
A Wa Ra Sa
B Wb Rb Sb
Carteira 100% RC = Wa  Ra + Wb  Rb expressão abaixo

SC = W S + W S + 2WaWb corr ( Ra , Rb ) S a Sb
a
2 2
a b
2 2
b

ou Covariância (Ra , Rb)

SC = Wa2 S a2 + Wb2 Sb2 + 2WaWb cov( Ra , Rb )

13
Harry Markowitz (1927-)
Sugestão de Vídeo:

Fonte: Google Imagens

1990 – Prêmio Nobel de Economia

Hear What Dr. Harry Markowitz, A Superhero Of Modern


Economics, Has To Say About Investing – Entrevista 21/03/2019
https://www.youtube.com/watch?v=os0B1oQfNdo

14
Harry Markowitz (1927-)
Sugestão de Vídeo:

Fonte: Google Imagens

1990 – Prêmio Nobel


de Economia

IFA.com with Mark Hebner - An Hour with Harry Markowitz, Father


of Modern Portfolio Theory – Entrevista - 19/06/2020
https://www.youtube.com/watch?v=lq2PL-Hxmio

15
Efeito da Correlação correl = - 0,627
Ibovespa X Dólar
120000 4,5

4
100000
3,5

80000 3

2,5
60000 Ibovespa
2 Dólar

40000 1,5

1
20000
0,5

0 0
jul/09 nov/10 abr/12 ago/13 dez/14 mai/16 set/17 fev/19 jun/20

Fonte: Economática – Cotações de jan/2010 a set/2019

16
Efeito da Correlação correl = 0,532
PETR4 X VALE3
70 30

60
25

50
20

40

15 VALE3
PETR4
30

10
20

5
10

0 0
jul/09 nov/10 abr/12 ago/13 dez/14 mai/16 set/17 fev/19 jun/20

Fonte: Economática – Cotações de jan/2010 a set/2019

17
Risco e Retorno no contexto de carteiras
Ativo A Ativo B
RETORNO 8% 25%
RISCO 5% 12%
Investimento R$ 5.000,00 R$ 5.000,00 correl = - 0,60
Percentual 50% 50%

18
Carteira com mais de dois ativos

𝑅𝑒𝑡𝐶𝑎𝑟𝑡 = ෍ 𝑊𝑖 × 𝑅𝑒𝑡_𝑎𝑡𝑖𝑣𝑜𝑖
𝑖=1

𝑐𝑜𝑣𝑎𝑟11 ⋯ 𝑐𝑜𝑣𝑎𝑟1𝑛 𝑊1
𝑅𝑖𝑠𝑐𝑜𝐶𝑎𝑟𝑡 = 𝑊1 ⋯ 𝑊𝑛 × ⋮ ⋱ ⋮ × ⋮
𝑐𝑜𝑣𝑎𝑟𝑛1 ⋯ 𝑐𝑜𝑣𝑎𝑟𝑛𝑛 𝑊𝑛

19
Modelos de
Risco de Crédito

20
Risco de Crédito

O risco de crédito é o risco de perda


econômica decorrente do não
cumprimento de obrigações
contratuais por uma contraparte

21
Risco de Crédito
• História recente mostrou que os problemas de crédito são
fundamentais para a economia, empresas e instituições
financeiras e não financeiras.....

Crises da Ásia, Rússia, subprime....

Risco de pré-liquidação (presettlement risk)

• Contábil • Prudencial/Gestão
• Perda Incorrida – IAS 39 • Perda Esperada (Expected Loss – EL)
• Perda Provável – COSIF • Perda Não Esperada (Unexpected
• Perda Esperada – IFRS9 Loss – UL)

• Provisão: suporta as perdas esperadas


• Capital: suporta as perdas não esperadas

22
Risco de Crédito

23
Risco de Crédito
Direcionadores do risco de crédito

Inadimplência (default) (b)


• Uma contraparte está ou não em default (inadimplente)
• Este evento envolve uma probabilidade de default
Exposição a crédito no default (EC)
• Incerteza quanto ao valor da exposição do crédito no momento do default

Perda dado default (condicionada ao evento)- PDF


• Incerteza quanto ao valor que pode ser recuperado após o default
• 1 menos a taxa de recuperação do credor

24
Risco de Crédito
Perda de Crédito = b  EC  PD

Negociação com devedor com o intuito de recuperar


uma parte ou a totalidade do valor devido.
• Chamaremos de t a taxa de recuperação
• Logo, 1 – t é a perda percentual condicionada no
evento de default

Perda de Crédito = b  EC  (1-t)

25
Risco de Crédito

Considere uma carteira com exposição total a crédito de R$100 mil


investida em três créditos.

• Crédito A: EC = R$ 10 mil; p = 0,02


• Crédito B: EC = R$ 20 mil; p = 0,05
• Crédito C: EC = R$ 70 mil; p = 0,10

Suposições: exposições constantes; taxa de recuperação = 0; defaults


independentes

26
Risco de Crédito

DISTRIBUIÇÃO DAS PERDAS


90,00% 100,00%
80,00%
70,00% 95,00%

60,00%
90,00%
50,00%
40,00%
85,00%
30,00%
20,00% 80,00%
10,00%
0,00% 75,00%
- 10.000,00 20.000,00 70.000,00 30.000,00 80.000,00 90.000,00 100.000,00

Perda Esperada Perda Não


Esperada Perda Excepcional
R$ 8.200
R$ 61.800

27
Gestão de Riscos

Comitê de Basiléia – localiza-se na cidade de Basiléia I, II e III – outra denominação para o


Basiléia (Suíça) formado por membros de Acordo de Capitais, que estabelece
Bancos Centrais de países desenvolvidos que indicadores de solvência e alavancagem para
debatem e formalizam estudos e documentos. IFs.

Novo Acordo de Capital – trata-se de um novo


compêndio de melhores práticas para gestão BIS – é uma instituição financeira denominada
de riscos mundial (conhecido também por o banco central dos bancos centrais ou em
Basiléia II). inglês: Bank for International Settlements

28
Gestão de Riscos

BIS – Bank for International Settlements -


Banco de Compensação Internacional

Ele visa "promover a


cooperação entre os
Fundado em 1930, é
bancos centrais e Sediado em Basiléia
uma organização
outras agências na na Suíça, reúne 55
internacional
busca de bancos centrais de
responsável pela
estabilidade todo o mundo.
supervisão bancária.
monetária e
financeira".

29
Gestão de Riscos
▪ Bank for Internacional Settlements (BIS):
• Fortalecer a cooperação financeira internacional

▪ Comitê da Basiléia sobre Supervisão Bancária (BCBS):


• Solvência, liquidez e estabilidade do sistema bancário internacional

▪ Acordo da Basileia:
• 1988: Basiléia 1 – requerimento de capital para risco de crédito
• 1996: Requerimento de capital para risco de mercado
• 2004: Basiléia 2 – requerimento de capital para risco operacional
• 2007: Patrimônio de Referência (PR) e Patrimônio de Referência Exigido (PRE)
• 2009: Basileia 2,5 – securitizações
• 2010: Basiléia 3

30
Gestão de Riscos

O foco do Primeiro Acordo está no crédito, ou seja, as instituições


tinham de ter capital próprio suficiente para garantir as operações
realizadas, com limite mínimo foi definido em 8%.

O Acordo Atual estabelece que o Capital do Banco deve


ser maior ou igual à 8% da soma dos riscos incorridos:

Capital
 8%
Risco de Mercado + Risco de Crédito

31
Gestão de Riscos
Critério de Ponderação do Basiléia I
A ponderação dos ativos de crédito ao risco é principalmente função do
tipo da exposição:
PONDERAÇÃO ATIVO
Caixa
0% Solicitações de créditos relacionadas à países e seus
bancos centrais
0%, 20% ou 50%
Solicitações de créditos relacionadas à empresas do
(à critério do Banco
setor público não - federais
Central Local)
Solicitações de crédito relacionadas aos bancos
20%
multilaterais de desenvolvimento (MDBs)
Solicitações de crédito garantidas por propriedade
50% residencial
Solicitações de crédito relacionadas à bancos
100% Solicitações de crédito relacionadas à empresas
Todos os demais ativos

32
Gestão de Riscos
Índice da Basiléia
Ativo Ponderado Pelo Risco

Exemplo:
Ativos $
Caixa 1.000
Aplicações 50.000
Financiamento Imobiliário 200.000
Empréstimos 300.000

33
Gestão de Riscos
Índice da Basiléia
Ativo Ponderado Pelo Risco

Exemplo:
Ativos $ Pesos APR - $
Caixa 1.000 0% 0
Aplicações 50.000 20% 10.000
Financiamento Imobiliário 200.000 50% 100.000
Empréstimos 300.000 100% 300.000
TOTAL 551.000 410.000

34
Gestão de Riscos
Índice da Basiléia
Ativo Ponderado Pelo Risco
Nível 1: Capital Social + Reservas de Capital + Reservas de Lucros
+/- Lucros ou (Prejuízos) Acumulados + Participações
Nível 2: Reservas de Reavaliação + Reservas de Contingência +
Dívidas Subordinadas + Instrumentos Híbridos de Capital
Exemplo:
Patrimônio $
Nível 1 40.000
Nível 2 30.000
TOTAL 70.000

35
Gestão de Riscos

Índice da Basiléia
Exemplo:
Índice
APR 410.000
PR 70.000
PR/APR 17,1%

Instituição Adequada

36
Basiléia III

Fonte: Bacen – apresentação do Basiléia III - 2013

37
Modelos de
Risco Operacional

38
Mensuração do Risco Operacional

• Baseada na distribuição de perdas (frequência e severidade).


• Utilizar dados históricos de frequência e valores de perdas
operacionais.
• Utilizar estimativas subjetivas de probabilidades e/ou valores relativos
às frequências e severidades.
• Utilizar distribuições teóricas feitas com base em dados históricos ou
expertise do gestor.

39
Risco Operacional
Seja n o número de eventos relacionados ao risco operacional
dentro de um intervalo de tempo arbitrado. (EX. 1 ano)

Seja S a severidade (magnitude) de cada perda considerando


que ela ocorreu.

Considere também as Probabilidades associadas a cada um


dos valores de n e S.

Tabula-se os resultados elaborando uma distribuição empírica


das combinações dos eventos com as respectivas magnitudes.

40
Exemplo:

Número de Perdas Probabilidade


Nenhuma 70%
1 20%
2 10%

Magnitude da Perda Probabilidade


$ 500 60%
$ 10.000 30%
$ 50.000 10%

41
Exemplo:

Próximos passos:
• Combinar as possibilidades para gerar uma distribuição empírica
para as perdas potenciais operacionais

• VaR Operacional
• Calcular o VALOR EM RISCO para o nível de confiança
desejado

• VaR Operacional = PIOR PERDA – perda esperada média

42
Fluxos de Caixa
E SEUS RISCOS

43
FLUXOS DE CAIXA E ANÁLISE
DE INVESTIMENTOS

Investimento é avaliado com base nos benefícios esperados


futuros: FLUXOS DE CAIXA

Distribuição TEMPORAL dos fluxos de caixa

Movimentações operacionais efetivas de caixa, líquidas do IR.


Despesas não desembolsáveis

44
PRINCIPAIS COMPONENTES
DO FLUXO DE CAIXA

Investimento inicial

Entradas de caixa operacionais

Fluxo de caixa residual

45
CÁLCULO DAS ENTRADAS DE CAIXA
OPERACIONAIS

RECEITAS
- DESPESAS OPERACIONAIS
= EBITDA
- DEPRECIAÇÃO
= LUCRO ANTES DO IMPOSTO DE RENDA = EBIT
- IMPOSTO DE RENDA
= LUCRO APÓS I.R. = NOPAT
+ DEPRECIAÇÃO
= ENTRADA DE CAIXA OPERACIONAL

46
Exemplo

• Investimento: 200 mil


• Receitas: (mil) Ano 1 Ano 2 Ano 3 Ano 4
Receita 170 145 125 100
• Despesas Operacionais:
(mil) Ano 1 Ano 2 Ano 3 Ano 4
Desp. Op. 23 23 20 20
• Depreciação Anual: 50,0 mil
• Alíquota do IR = 40%
•Taxa de Retorno Espertada = 14% a.a

47
Sugestão para Simulações:

A sugestão do @ RISK como


ferramenta de análise nesta aula
não tem qualquer vínculo
financeiro com a PALISADE.
Sugerimos a sua utilização
apenas pela qualidade da
ferramenta e sua capacidade
avançada de análise.

https://www.palisade-br.com/

48
Fonte: Imagem da Planilha feita em aula

49
Fonte: Imagem da Planilha feita em aula

50
51
Tipos de Distribuição

52
OBRIGADO!

Prof. Fabiano Guasti Lima

/fabiano-guasti-lima-b9830282/

53
UNSUPERVISED MACHINE
LEARNING: CLUSTERING
Prof. Dr. Wilson Tarantin Junior
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98
Contextualização

• Quando aplicar a análise de cluster?

• O objetivo for agrupar as observações em grupos homogêneos internamente e


heterogêneos entre si

• Dentro do grupo: observações semelhantes com base nas variáveis utilizadas na análise

• Entre grupos distintos: observações diferentes com base nas variáveis utilizadas na análise

3
Contextualização

• Técnica exploratória (não supervisionada)

• A análise de agrupamentos caracteriza-se por ser uma técnica exploratória, de


modo que não tem caráter preditivo para observações de fora da amostra

• Se novas observações forem adicionadas à amostra, novos agrupamentos devem


ser realizados, pois a inclusão de novas observações pode alterar a composição
dos grupos

• Se forem alteradas variáveis da análise, novos agrupamentos devem ser realizados,


pois a inclusão/retirada de uma variável pode alterar os grupos

4
Métodos

• Analisaremos dois métodos para a obtenção de agrupamentos

1. Método Hierárquico Aglomerativo

• A quantidade de clusters é definida ao longo da análise (passo a passo)

2. Método Não Hierárquico K-means

• Define-se a priori quantos cluster serão formados

5
Implementação do Método
Hierárquico Aglomerativo

6
Tratamento inicial

• Análise das variáveis que serão estudadas

• Antes de iniciar os procedimentos, é importante realizar uma análise das unidades


de medidas das variáveis

• Se estiverem em unidades de medidas distintas, é importante realizar a padronização das


variáveis antes de iniciar a análise de cluster

• Comumente, aplica-se o ZScore (torna variáveis com média = 0 e desvio padrão = 1)

ഥ𝒋
𝑿𝒋𝒊 − 𝑿
𝒁𝑿𝒋𝒊 =
𝒔𝒋

7
Escolhas

• A análise de cluster hierárquica depende de escolhas

• Escolha da medida de dissimilaridade (distância)

• Refere-se à distância entre as observações, com base nas variáveis escolhidas


• Portanto, indica o quanto as observações são diferentes entre si

• Escolha do método de encadeamento das observações

• Refere-se à especificação da medida de distância quando houver cluster formados

8
Esquemas de aglomeração

• Hierárquico aglomerativo: observações separadas → um único cluster

• Considerando n observações, inicia-se com n clusters (estágio 0)


• Na sequência, une-se as duas observações com menor distância (n-1 clusters)
• Em seguida, um novo grupo é formado pela união de duas novas observações ou
pela inclusão de uma observação ao cluster formado na etapa anterior (sempre
pela menor distância). O método de encadeamento indica qual é a distância
• Repete-se a etapa anterior n-1 vezes, ou seja, até restar somente 1 cluster
• O dendrograma é um gráfico que permite visualizar a formação dos clusters

9
Medidas de dissimilaridade

• Identifica a distância entre observações

𝟏
• Distância de Minkowski: 𝒅𝒑𝒒 = σ𝒌𝒋=𝟏(|𝒁𝑿𝒋𝒑 − 𝒁𝑿𝒋𝒒 |)𝒎 𝒎
→ É o caso geral, varia o m

• Distância euclidiana: 𝒅𝒑𝒒 = σ𝒌𝒋=𝟏(𝒁𝑿𝒋𝒑 − 𝒁𝑿𝒋𝒒 )𝟐

• Distância euclidiana quadrática: 𝒅𝒑𝒒 = σ𝒌𝒋=𝟏(𝒁𝑿𝒋𝒑 − 𝒁𝑿𝒋𝒒 )𝟐

10
Medidas de dissimilaridade

• Identifica a distância entre observações

• Distância de Manhattan: 𝒅𝒑𝒒 = σ𝒌𝒋=𝟏 |𝒁𝑿𝒋𝒑 − 𝒁𝑿𝒋𝒒 |

• Distância de Chebychev: 𝒅𝒑𝒒 = 𝒎á𝒙 |𝒁𝑿𝒋𝒑 − 𝒁𝑿𝒋𝒒 |

|𝒁𝑿𝒋𝒑 −𝒁𝑿𝒋𝒒 |
• Distância de Canberra: 𝒅𝒑𝒒 = σ𝒌𝒋=𝟏 → quando as variáveis só têm valores positivos
(𝒁𝑿𝒋𝒑 +𝒁𝑿𝒋𝒒 )

• A correlação de Pearson entre as observações também pode ser utilizada (medida de semelhança)

11
Medida de similaridade

• Para variáveis binárias, identifica semelhança entre observações

a, b, c e d são as frequências absolutas de respostas 0 e 1 para as observações

𝒂+𝒅
• Medida de emparelhamento simples: 𝒔𝒑𝒒 =
𝒂+𝒃+𝒄+𝒅

12
Métodos de encadeamento

• Esquemas hierárquicos aglomerativos

• Método de encadeamento: indica qual distância utilizar quando já existem clusters


formados durante os estágios aglomerativos

• Nearest neighbor (single linkage): privilegia menores distâncias, recomendável em casos de


observações distintas

• Furthest neigbor (complete linkage): privilegia maiores distâncias, recomendável em casos de


observações parecidas

• Between groups (average linkage): junção de grupos pela distância média entre todos os pares
de observações do grupo em análise (consistente com single ou complete)

13
Métodos de encadeamento

Fonte: Fávero & Belfiore (2017, Capítulo 9)

14
Métodos de encadeamento

• Esquemas hierárquicos aglomerativos

• Nearest neighbor (vizinho mais próximo): single linkage

• d(MN)W = mín{dMW ; dNW}


• dMW e dNW são distâncias entre as observações mais próximas

• Furthest neighbor (vizinho mais distante): complete linkage

• d(MN)W = máx{dMW ; dNW}


• dMW e dNW são distâncias entre as observações mais distantes

15
Métodos de encadeamento

• Esquemas hierárquicos aglomerativos

• Between groups (média das distâncias): average linkage


σ𝒎+𝒏 𝒘
𝒑=𝟏 σ𝒒=𝟏 𝒅𝒑𝒒
• d(MN)W =
𝒎+𝒏 .(𝒘)
• Trata-se da média de todas as distâncias entre pares de observações

16
Quantos agrupamentos?

• Esquemas hierárquicos aglomerativos

• Como critério para a escolha do número final de clusters em uma análise, pode-se
adotar o tamanho dos saltos para a incorporação seguinte

• Saltos muito elevados podem indicar o agrupamento de observações com


características mais distintas, isto é, há a união de observações mais distintas

• Comparar dendrogramas obtidos por diferentes métodos de encadeamento

17
Análise dos agrupamentos

• Quais variáveis contribuem?

• Após a finalização da análise, é importante comparar, para as variáveis métricas, se


a variabilidade dentro do grupo é menor do que a variabilidade entre grupos

𝑽𝒂𝒓𝒊𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅𝒆 𝒆𝒏𝒕𝒓𝒆 𝒈𝒓𝒖𝒑𝒐𝒔


• Aplica-se um teste F para análise de variância → 𝑭 =
𝑽𝒂𝒓𝒊𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅𝒆 𝒅𝒆𝒏𝒕𝒓𝒐 𝒅𝒐𝒔 𝒈𝒓𝒖𝒑𝒐𝒔

• Graus de liberdade no numerador: K – 1 K = nº de clusters


• Graus de liberdade no denominador: n – K n = tamanho da amostra

• É possível analisar quais variáveis mais contribuíram para a formação de pelo menos um dos
clusters → maiores valores da estatística F (em conjunto com sua significância)

18
Implementação do Método
Não Hierárquico K-means

19
Tratamento inicial

• Análise das variáveis que serão estudadas

• No K-means, também é importante realizar uma análise das unidades de medidas


das variáveis

• Se estiverem em unidades de medidas distintas, é importante realizar a padronização das


variáveis antes de iniciar a análise

• ZScore (variáveis com média = 0 e desvio padrão = 1)

ഥ𝒋
𝑿𝒋𝒊 − 𝑿
𝒁𝑿𝒋𝒊 =
𝒔𝒋

20
Esquemas de aglomeração

• Esquemas não hierárquicos: K-means

• A quantidade K de clusters escolhida a priori é usada de base para a identificação


dos centros de aglomeração, de modo que as observações são arbitrariamente
alocadas aos K clusters para o cálculo dos centroides iniciais

• Nas etapas seguintes, as observações vão sendo comparadas pela proximidade aos
centroides dos outros clusters. Se houver realocação a outro cluster por estar mais
próxima, os centroides devem ser recalculados (em ambos os clusters)

• Trata-se de um processo iterativo

21
Esquemas de aglomeração

• Esquemas não hierárquicos: K-means

• O procedimento K-means encerra-se quando não for possível realocar qualquer


observação por estar mais próxima do centroide de outro cluster: indica que a
soma dos quadrados de cada ponto até o centro do cluster alocado foi minimizada

• A soma total dos quadrados dentro dos clusters pode ser representada por:

22
Esquemas de aglomeração

Representa a solução do K-means

Não há outras realocações, pois não


há observações que estejam mais
próximas dos centroides de outros clusters

Fonte: Fávero & Belfiore (2017, Capítulo 9)

23
Considerações

• Alguns aspectos relevantes

• A análise de cluster é bastante sensível à presença de outliers

• Quando há variáveis binárias, pode ser aplicada a Análise de Correspondência

• O output do método hierárquico pode ser utilizado como input no método não
hierárquico para a identificação inicial da quantidade de clusters

• O método não hierárquico k-means pode ser aplicado em amostras maiores

24
Referência

Fávero, Luiz Paulo; Belfiore, Patrícia. (2017). Manual de análise de dados: estatística e
modelagem multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier

25
UNSUPERVISED MACHINE
LEARNING: Análise Fatorial
e PCA

Prof. Dr. Wilson Tarantin Junior


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98
Contextualização

• Quando aplicar a análise fatorial?

• Quando as variáveis forem métricas: depende das correlações entre variáveis

• Trata-se do agrupamento das variáveis em fatores. Os objetivos podem ser:

• Obter o comportamento conjunto de variáveis, combinando-as para redução estrutural


• Análise da validade de construtos pela identificação das variáveis alocadas aos fatores
• Elaboração de rankings para classificação de desempenho por meio dos fatores
• Criação de fatores ortogonais entre eles e posterior uso em modelos supervisionados

3
Contextualização

• Análise fatorial por componentes principais

• Componentes principais: método de determinação dos fatores que se baseia


na criação de fatores não correlacionados a partir da combinação linear das
variáveis originais

• Análise fatorial PCA: modelo não supervisionado de machine learning

• Portanto, a técnica não tem um caráter preditivo para observações que não
estejam presentes na amostra. Se surgirem novas observações, novos fatores
atualizados devem ser gerados

4
5 1
0 9 8-
73 .
5 .2
31 a
i d
Implementaçãoi Y osh
u sh
At s
el o
ar c
M
Matriz de correlações

• Procedimento inicial

• A PCA fundamenta-se na existência de correlações entre variáveis originais


para a criação dos fatores

• Coeficiente de correlação de Pearson: relação linear entre duas variáveis métricas

• Coeficientes de correlação mais próximos dos valores extremos (-1; +1) propiciam a
extração de um único fator → indicam existência de relação entre as variáveis

• Coeficientes de correlação mais próximos de zero propiciam a extração de diferentes


fatores → indicam que a relação entre as variáveis é (praticamente) inexistente

6
Matriz de correlações

• Procedimento inicial

• A seguir, tem-se a representação da matriz de correlações para K variáveis e a


expressão de cálculo do coeficiente de correlação de Pearson

Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

7
Adequação global

• A extração de fatores é adequada?

• Para que que a análise fatorial seja adequada, devem existir valores elevados
(-1; +1) e estatisticamente significantes na matriz de correlações

• Para investigar a adequação global da análise fatorial, vamos utilizar o teste


de esfericidade de Bartlett

• Os coeficientes de correlação de Pearson são estatisticamente diferentes de zero?

8
Adequação global

• Teste de esfericidade de Bartlett

• Compara a matriz de correlações com a matriz identidade de mesma dimensão


e espera-se que tais matrizes sejam diferentes para que a análise seja aplicável

com graus de liberdade

Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

9
Autovalores e autovetores

• Autovalores

• A matriz de correlações de dimensão K x K possui K autovalores (λ²) e podem


ser obtidos da seguinte forma:

• Solução de equivalente a

• Os autovalores indicam o percentual da variância compartilhada pelas


variáveis originais para a formação de cada fator
Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

10
Autovalores e autovetores

• Autovetores

• Os autovetores da matriz de correlações são obtidos com base em cada um


dos autovalores

• v1k, v2k, ... , vkk são os autovetores para o K-ésimo autovalor (λ²) em análise

• Solução de ou

Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

11
Obtenção dos fatores

• Identificação dos scores fatoriais

• Após a análise fatorial ser considerada adequada pelos testes anteriores, será
necessário criar os scores que geram os fatores propriamente ditos

• Scores fatoriais: são os parâmetros que relacionam o fator com as variáveis


originais, representados em um modelo linear

• Para K variáveis originais, existem, no máximo, K fatores (F1, F2, ... , Fk)

• Os scores vêm a partir dos autovalores e autovetores da matriz de correlações

12
Scores fatoriais

• Definindo os scores

• A partir dos autovalores e autovetores, obtém-se os scores fatoriais s1, s2, ... , sk
São gerados K grupos de scores (é o limite máximo de K fatores possíveis)

Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

13
Fatores

• Definindo os K fatores

• O valor do fator F é obtido com as variáveis X transformadas pelo Z-Score (ZX)


• Tais fatores são ortogonais entre si, ou seja, não são correlacionados

Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

14
Escolha dos fatores

• Todos os K fatores serão utilizados?

• Embora seja possível estabelecer a priori quantos fatores são desejados, é de


fundamental importância realizar uma análise por meio dos autovalores

• Lembrando: os autovalores indicam o percentual da variância compartilhada


pelas variáveis originais para a formação de cada fator

• Neste sentido, fatores formados a partir de autovalores menores do que 1


podem não ter representatividade. O critério de Kaiser (ou critério da raiz
latente) indica que sejam considerados apenas fatores correspondentes a
autovalores > 1
15
Cargas fatoriais

• Análise da composição dos fatores

• As cargas fatoriais representam as correlações de Pearson entre os fatores e


as variáveis originais

• Pode ser interpretada como a importância de cada variável na constituição


daquele fator em particular

• Quanto maior a carga fatorial, mais aquele fator é influenciado pela variável

16
Comunalidades

• Composição dos fatores selecionados

• Ao utilizar o critério da raiz latente, somente os fatores que são derivados de


autovalores maiores que 1 serão considerados

• Portanto, as comunalidades mostram a variância total compartilhada, para


cada variável, em todos os fatores extraídos e selecionados com base no
critério da raiz latente

• É possível analisar se houve perda de variância, por variável, após a exclusão


de fatores por meio do critério da raiz latente

17
Criação de rankings

• Soma ponderada e ordenamento

• Para criar rankings a partir dos fatores obtidos utilizando o critério da soma
ponderada e ordenamento, para cada observação da amostra, calcula-se:

• Resultadoi = (F1i * % var. comp. F1) + (F2i * % var. comp. F2) + ... + (Fki * % var. comp. Fk)

• Em resumo, multiplica-se o resultado obtido de cada fator por seu percentual


de variância compartilhada e depois é realizado o ordenamento do resultado

18
Referência

Fávero, Luiz Paulo; Belfiore, Patrícia. (2017). Manual de análise de dados: estatística e
modelagem multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier

19
UNSUPERVISED MACHINE
LEARNING: Análise Fatorial
e PCA

Prof. Dr. Wilson Tarantin Junior


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98
Contextualização

• Quando aplicar a análise fatorial?

• Quando as variáveis forem métricas: depende das correlações entre variáveis

• Trata-se do agrupamento das variáveis em fatores. Os objetivos podem ser:

• Obter o comportamento conjunto de variáveis, combinando-as para redução estrutural


• Análise da validade de construtos pela identificação das variáveis alocadas aos fatores
• Elaboração de rankings para classificação de desempenho por meio dos fatores
• Criação de fatores ortogonais entre eles e posterior uso em modelos supervisionados

3
Contextualização

• Análise fatorial por componentes principais

• Componentes principais: método de determinação dos fatores que se baseia


na criação de fatores não correlacionados a partir da combinação linear das
variáveis originais

• Análise fatorial PCA: modelo não supervisionado de machine learning

• Portanto, a técnica não tem um caráter preditivo para observações que não
estejam presentes na amostra. Se surgirem novas observações, novos fatores
atualizados devem ser gerados

4
5 1
0 9 8-
73 .
5 .2
31 a
i d
Implementaçãoi Y osh
u sh
At s
el o
ar c
M
Matriz de correlações

• Procedimento inicial

• A PCA fundamenta-se na existência de correlações entre variáveis originais


para a criação dos fatores

• Coeficiente de correlação de Pearson: relação linear entre duas variáveis métricas

• Coeficientes de correlação mais próximos dos valores extremos (-1; +1) propiciam a
extração de um único fator → indicam existência de relação entre as variáveis

• Coeficientes de correlação mais próximos de zero propiciam a extração de diferentes


fatores → indicam que a relação entre as variáveis é (praticamente) inexistente

6
Matriz de correlações

• Procedimento inicial

• A seguir, tem-se a representação da matriz de correlações para K variáveis e a


expressão de cálculo do coeficiente de correlação de Pearson

Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

7
Adequação global

• A extração de fatores é adequada?

• Para que que a análise fatorial seja adequada, devem existir valores elevados
(-1; +1) e estatisticamente significantes na matriz de correlações

• Para investigar a adequação global da análise fatorial, vamos utilizar o teste


de esfericidade de Bartlett

• Os coeficientes de correlação de Pearson são estatisticamente diferentes de zero?

8
Adequação global

• Teste de esfericidade de Bartlett

• Compara a matriz de correlações com a matriz identidade de mesma dimensão


e espera-se que tais matrizes sejam diferentes para que a análise seja aplicável

com graus de liberdade

Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

9
Autovalores e autovetores

• Autovalores

• A matriz de correlações de dimensão K x K possui K autovalores (λ²) e podem


ser obtidos da seguinte forma:

• Solução de equivalente a

• Os autovalores indicam o percentual da variância compartilhada pelas


variáveis originais para a formação de cada fator
Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

10
Autovalores e autovetores

• Autovetores

• Os autovetores da matriz de correlações são obtidos com base em cada um


dos autovalores

• v1k, v2k, ... , vkk são os autovetores para o K-ésimo autovalor (λ²) em análise

• Solução de ou

Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

11
Obtenção dos fatores

• Identificação dos scores fatoriais

• Após a análise fatorial ser considerada adequada pelos testes anteriores, será
necessário criar os scores que geram os fatores propriamente ditos

• Scores fatoriais: são os parâmetros que relacionam o fator com as variáveis


originais, representados em um modelo linear

• Para K variáveis originais, existem, no máximo, K fatores (F1, F2, ... , Fk)

• Os scores vêm a partir dos autovalores e autovetores da matriz de correlações

12
Scores fatoriais

• Definindo os scores

• A partir dos autovalores e autovetores, obtém-se os scores fatoriais s1, s2, ... , sk
São gerados K grupos de scores (é o limite máximo de K fatores possíveis)

Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

13
Fatores

• Definindo os K fatores

• O valor do fator F é obtido com as variáveis X transformadas pelo Z-Score (ZX)


• Tais fatores são ortogonais entre si, ou seja, não são correlacionados

Fonte das equações: Fávero & Belfiore (2017, Capítulo 10)

14
Escolha dos fatores

• Todos os K fatores serão utilizados?

• Embora seja possível estabelecer a priori quantos fatores são desejados, é de


fundamental importância realizar uma análise por meio dos autovalores

• Lembrando: os autovalores indicam o percentual da variância compartilhada


pelas variáveis originais para a formação de cada fator

• Neste sentido, fatores formados a partir de autovalores menores do que 1


podem não ter representatividade. O critério de Kaiser (ou critério da raiz
latente) indica que sejam considerados apenas fatores correspondentes a
autovalores > 1
15
Cargas fatoriais

• Análise da composição dos fatores

• As cargas fatoriais representam as correlações de Pearson entre os fatores e


as variáveis originais

• Pode ser interpretada como a importância de cada variável na constituição


daquele fator em particular

• Quanto maior a carga fatorial, mais aquele fator é influenciado pela variável

16
Comunalidades

• Composição dos fatores selecionados

• Ao utilizar o critério da raiz latente, somente os fatores que são derivados de


autovalores maiores que 1 serão considerados

• Portanto, as comunalidades mostram a variância total compartilhada, para


cada variável, em todos os fatores extraídos e selecionados com base no
critério da raiz latente

• É possível analisar se houve perda de variância, por variável, após a exclusão


de fatores por meio do critério da raiz latente

17
Criação de rankings

• Soma ponderada e ordenamento

• Para criar rankings a partir dos fatores obtidos utilizando o critério da soma
ponderada e ordenamento, para cada observação da amostra, calcula-se:

• Resultadoi = (F1i * % var. comp. F1) + (F2i * % var. comp. F2) + ... + (Fki * % var. comp. Fk)

• Em resumo, multiplica-se o resultado obtido de cada fator por seu percentual


de variância compartilhada e depois é realizado o ordenamento do resultado

18
Referência

Fávero, Luiz Paulo; Belfiore, Patrícia. (2017). Manual de análise de dados: estatística e
modelagem multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier

19
UNSUPERVISED MACHINE
LEARNING: Análise de
Correspondência
Simples e Múltipla

Prof. Dr. Wilson Tarantin Junior


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98
Contextualização

• Quando aplicar a análise de correspondência?

• Técnica adequada para a análise de variáveis categóricas (qualitativas)

• O objetivo é verificar se existe associação estatisticamente significativa entre as


variáveis e suas categorias, criando o mapa perceptual para visualizar as associações

• Caso exista uma variável quantitativa, é necessário que ela passe por um processo de
categorização previamente

• Por exemplo: a idade é uma variável quantitativa (25, 42, 73, 81 anos) e poderia ser categorizada
como: 0-30 anos é a categoria 1, 31-60 anos é categoria 2, 61-90 anos é categoria 3...

3
Contextualização

• Trata-se de técnica exploratória (não supervisionada)

• Para avaliar a relação conjunta entre as variáveis

• Não há modelos do tipo “yi = x1i + x2i + ... + ui”

• Não são adequadas para fins de inferência

• Se novas observações forem adicionadas ao banco de dados, é adequado refazer a


análise

4
Contextualização

• Exemplos de aplicação

• Faixa de renda e status na aprovação de crédito

• Nível de escolaridade e cargo ocupado em empresas

• Tipo de solo e cultura implementada

• Gravidade dos sintomas da doença e comorbidades

• Outros...

5
Contextualização

• Análise de variáveis geradas por escala Likert

• Exemplos: concordo plenamente; concordo parcialmente; não concordo, nem


discordo; discordo parcialmente; discordo plenamente

• Evita o problema da ponderação arbitrária

• Cada ponto da escala Likert torna-se uma categoria da variável na análise de


correspondência simples ou múltipla

6
Implementação
Análise de Correspondência Simples

7
Análise de Correspondência Simples

• Também conhecida como Anacor

• Quando o objetivo é estudar a associação entre duas variáveis e suas categorias

• É possível separar a Anacor em duas partes:

1. Análise da significância estatística da associação entre as variáveis e suas categorias


por meio do teste qui-quadrado (χ2)

2. Elaboração e interpretação do mapa perceptual

8
1. Análise da significância estatística
(teste qui-quadrado)

9
Análise de Correspondência Simples

1. Tabela de contingência

• Contém as frequências absolutas observadas para cada par de categorias das variáveis
• Trata-se de uma tabela de classificação cruzada (cross-tabulation)
Variável B

Categoria 1 Categoria 2 Categoria 3 ... Categoria J Total


Categoria 1 n11 n12 n13 ... n1J ΣL1
Categoria 2 n21 n22 n23 ... n2J ΣL2
Categoria 3 n31 n32 n33 ... n3J ΣL3
Variável A
... ... ... ... ... ... ...
Categoria I nI1 nI2 nI3 ... nIJ ΣLl
Total ΣC1 ΣC2 ΣC3 ... ΣCJ N

10
Análise de Correspondência Simples

2. Tabela de frequências absolutas esperadas

• Para a célula referente às categorias 1 das duas variáveis, a frequência absoluta


esperada é:

( ΣL1 x ΣC1 )
Freq. absoluta esperada =
N

• Este mesmo cálculo deve ser realizado para cada par de categorias das variáveis, alterando-se
apenas o numerador

11
Análise de Correspondência Simples

3. Tabela de resíduos

• Para a célula referente às categorias 1 das duas variáveis, o valor do resíduo é:

( ΣL1 x ΣC1 )
Resíduo = n11 –
N

• Ou seja, resíduo = frequência absoluta observada – frequência absoluta esperada


• O mesmo cálculo é realizado para cada par de categorias

12
Análise de Correspondência Simples

4. Tabela com os valores χ2

• Para a célula referente às categorias 1 das duas variáveis, o valor da estatística χ2 é:

( resíduo11 ) 2
χ2 =
( freq. absoluta esperada11 )

• O mesmo cálculo é realizado para cada par de categorias e, em seguida, os valores de todas as
células são somados

13
Análise de Correspondência Simples

4. Tabela com os valores χ2

• O objetivo é verificar se há associação estatisticamente significante entre as variáveis


(utilizando a soma do χ2)

• H0: as variáveis se associam de forma aleatória.


• H1: a associação entre as variáveis não se dá de forma aleatória.

• Dados o nível de significância e os graus de liberdade, se o valor da estatística χ2 for


maior do que seu valor crítico, há associação significante entre as duas variáveis (H1)

• Graus de liberdade = (I – 1) x (J – 1)

14
Análise de Correspondência Simples

5. Tabela de resíduos padronizados (e padronizados ajustados)

• Enquanto a análise do χ2 permite verificar se há ou não a dependência entre as duas


variáveis, a análise de resíduos padronizados ajustados permite aprofundar a análise
com foco nas categorias das variáveis

• Como as categorias de uma variável se relacionam com as categorias da outra


variável?

• Para tanto, observa-se o excesso ou falta de ocorrência de casos nas categorias das duas variáveis

15
Análise de Correspondência Simples

5. Tabela de resíduos padronizados

• Para a célula referente às categorias 1 das duas variáveis, o valor do resíduo


padronizado é:

resíduo11
Resíduopadronizado =
√(freq. absoluta esperada11)

• O mesmo cálculo é realizado para cada par de categorias

16
Análise de Correspondência Simples

5. Tabela de resíduos padronizados ajustados

• Para a célula referente às categorias 1 das duas variáveis, o valor do resíduo


padronizado ajustado é:

resíduo padronizado11
Resíduopadronizado ajustado =
ΣC1 Σ
√[(1- ) x (1- L1 )]
N N

• O mesmo cálculo é realizado para cada par de categorias

17
Análise de Correspondência Simples

5. Tabela de resíduos padronizados ajustados

• Se o valor do resíduo padronizado ajustado em certa célula for maior do que 1,96,
interpreta-se que existe associação significativa, ao nível de significância de 5%, entre
as duas categorias que interagem na célula; se for menor do que 1,96, não há
associação estatisticamente significativa

• A referência de 1,96 é o valor crítico da normal padrão para o nível de significância de 5%

18
2. Elaboração e interpretação
do mapa perceptual

19
Análise de Correspondência Simples

1. Determinar os autovalores (λ²)

• A quantidade (m) de autovalores depende da quantidade de categorias nas variáveis:


m = mín(I – 1, J – 1)

• Na Anacor, os autovalores referem-se às inércias principais parciais e são base para


determinar a inércia principal total e o percentual da inércia principal total em cada
dimensão do mapa perceptual

20
Análise de Correspondência Simples

1. Determinar os autovalores (λ²)

• Como base para o cálculo dos autovalores, inicialmente, define-se uma matriz A

• Um modo de obter a matiz A, baseando-se nas etapas anteriores, é fazer para cada célula da
matriz de resíduos padronizados o seguinte cálculo:

( Resíduopadronizado )
√N
• Com base na matriz A, obtém-se a matriz W: W = A' . A

21
Análise de Correspondência Simples

1. Determinar os autovalores (λ²)

• Identificando W, os autovalores são obtidos pela solução da seguinte expressão:


det(λ² . I – W) = 0

λ² - w11 - w12 - w13


- w21 λ² - w22 - w23 = 0
- w31 - w32 λ² - w33

• I é a matriz identidade

22
Análise de Correspondência Simples

1. Determinar os autovalores (λ²)

• Com base nos autovalores (λ²), encontra-se o percentual da inércia principal total
de cada dimensão
2
λdimensão
% da Inércia Principal Total =
2
(para cada dimensão) λ total
• Quanto maior a inércia principal total (e o χ2), mais forte será a associação entre
as variáveis em análise
χ2
Inércia Principal Total =
N
23
Análise de Correspondência Simples

2. Determinar as massas em linha e coluna

• As massas representam a influência que cada categoria exerce sobre as demais


categorias de sua variável, seja na coluna (column profiles) ou linha (row profiles)

• Com base nos “totais” da tabela de contingência, para a categoria 1 das variáveis,
obtém-se as massas médias:

ΣL1 ΣC1
Massa na coluna = Massa na linha =
N N
• O mesmo cálculo é realizado para as demais categorias

24
Análise de Correspondência Simples

3. Determinar os autovetores

• Para a matriz W, é possível encontrar os autovetores a partir dos autovalores (λ²)


já calculados

• Substituindo os autovalores de cada dimensão na matriz definida como det(λ² . I – W) = 0 e


resolvendo o sistema de equações que parte dela, é possível encontrar os autovetores da
coluna (V) e, com base neles, encontrar os autovetores da linha (U)

u'k = [ Dl-1/2 . (P – lc') . Dc-1/2] . v'k . λk-1

Trata-se da matriz A

25
Análise de Correspondência Simples

4. Determinar as coordenadas das categorias

• Variável em linha na tabela de contingência

• Coordenadas das abscissas (X)


Xl = √λ1 . Dl-1/2 . u1
• Coordenadas das ordenadas (Y)
Yl = √λ2 . Dl-1/2 . u2
• Coordenadas da K-ésima dimensão (k = quantidade de λ)
Zl = √λk . Dl-1/2 . uk
26
Análise de Correspondência Simples

4. Determinar as coordenadas das categorias

• Variável em coluna na tabela de contingência

• Coordenadas das abscissas (X)

Xc = √λ1 . Dc-1/2 . v1
• Coordenadas das ordenadas (Y)
Yc = √λ2 . Dc-1/2 . v2
• Coordenadas da K-ésima dimensão (k = quantidade de λ)
Zc = √λk . Dc-1/2 . vk
27
Análise de Correspondência Múltipla (MCA)

28
Análise de Correspondência Múltipla

• Associação entre mais de duas variáveis

• Só participam da ACM as variáveis que apresentam associação estatisticamente


significativa com pelo menos uma outra variável contida na análise

• Antes de elaborar a ACM, é importante realizar um teste χ2 para cada par de variáveis

• Se alguma delas não apresentar associação com outras, não é incluída na análise de
correspondência

29
Análise de Correspondência Múltipla

1º método: utilizando a Matriz Binária

• A matriz binária é obtida pela transformação das variáveis qualitativas em variáveis


binárias, ou seja, valores 0 ou 1

• Com base na matriz binária (Z), pode ser obtida a inércia principal total na ACM

• Supondo que a matriz binária (Z) seja semelhante a uma tabela de contingência da
Anacor, é possível obter a inércia principal parcial das dimensões, autovalores,
autovetores e coordenadas dessa matriz

30
Análise de Correspondência Múltipla

1º método: utilizando a Matriz Binária

• Um exemplo de matriz binária (Z) é:


Variável A Variável B Variável C
Obs.
Categ. 1 Categ. 2 Categ. 1 Categ. 2 Categ. 3 Categ. 1 Categ. 2 Categ. 3 Categ. 4

1 1 0 0 1 0 1 0 0 0
2 0 1 0 0 1 0 1 0 0
3 0 1 1 0 0 0 0 1 0
N 1 0 1 0 0 0 0 0 1

• Quantidade de dimensões (λ²) = J – Q = (9 – 3) = 6, em que “J” é a quantidade total de


categorias e “Q” a quantidade de variáveis

31
Análise de Correspondência Múltipla

2º método: utilizando a Matriz de Burt

• A matriz de Burt é definida como: B = Z' . Z

• É possível combinar em uma única matriz as tabelas de contingência com o cruzamento de todos
os pares variáveis

• Ao considerar a matriz de Burt uma tabela de contingência, é possível realizar uma Anacor e obter
as coordenadas das categorias

32
Referência

Fávero, Luiz Paulo; Belfiore, Patrícia. (2017). Manual de análise de dados: estatística e
modelagem multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier

33
UNSUPERVISED MACHINE
LEARNING: Análise de
Correspondência
Simples e Múltipla

Prof. Dr. Wilson Tarantin Junior


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98
Contextualização

• Quando aplicar a análise de correspondência?

• Técnica adequada para a análise de variáveis categóricas (qualitativas)

• O objetivo é verificar se existe associação estatisticamente significativa entre as


variáveis e suas categorias, criando o mapa perceptual para visualizar as associações

• Caso exista uma variável quantitativa, é necessário que ela passe por um processo de
categorização previamente

• Por exemplo: a idade é uma variável quantitativa (25, 42, 73, 81 anos) e poderia ser categorizada
como: 0-30 anos é a categoria 1, 31-60 anos é categoria 2, 61-90 anos é categoria 3...

3
Contextualização

• Trata-se de técnica exploratória (não supervisionada)

• Para avaliar a relação conjunta entre as variáveis

• Não há modelos do tipo “yi = x1i + x2i + ... + ui”

• Não são adequadas para fins de inferência

• Se novas observações forem adicionadas ao banco de dados, é adequado refazer a


análise

4
Contextualização

• Exemplos de aplicação

• Faixa de renda e status na aprovação de crédito

• Nível de escolaridade e cargo ocupado em empresas

• Tipo de solo e cultura implementada

• Gravidade dos sintomas da doença e comorbidades

• Outros...

5
Contextualização

• Análise de variáveis geradas por escala Likert

• Exemplos: concordo plenamente; concordo parcialmente; não concordo, nem


discordo; discordo parcialmente; discordo plenamente

• Evita o problema da ponderação arbitrária

• Cada ponto da escala Likert torna-se uma categoria da variável na análise de


correspondência simples ou múltipla

6
Implementação
Análise de Correspondência Simples

7
Análise de Correspondência Simples

• Também conhecida como Anacor

• Quando o objetivo é estudar a associação entre duas variáveis e suas categorias

• É possível separar a Anacor em duas partes:

1. Análise da significância estatística da associação entre as variáveis e suas categorias


por meio do teste qui-quadrado (χ2)

2. Elaboração e interpretação do mapa perceptual

8
1. Análise da significância estatística
(teste qui-quadrado)

9
Análise de Correspondência Simples

1. Tabela de contingência

• Contém as frequências absolutas observadas para cada par de categorias das variáveis
• Trata-se de uma tabela de classificação cruzada (cross-tabulation)
Variável B

Categoria 1 Categoria 2 Categoria 3 ... Categoria J Total


Categoria 1 n11 n12 n13 ... n1J ΣL1
Categoria 2 n21 n22 n23 ... n2J ΣL2
Categoria 3 n31 n32 n33 ... n3J ΣL3
Variável A
... ... ... ... ... ... ...
Categoria I nI1 nI2 nI3 ... nIJ ΣLl
Total ΣC1 ΣC2 ΣC3 ... ΣCJ N

10
Análise de Correspondência Simples

2. Tabela de frequências absolutas esperadas

• Para a célula referente às categorias 1 das duas variáveis, a frequência absoluta


esperada é:

( ΣL1 x ΣC1 )
Freq. absoluta esperada =
N

• Este mesmo cálculo deve ser realizado para cada par de categorias das variáveis, alterando-se
apenas o numerador

11
Análise de Correspondência Simples

3. Tabela de resíduos

• Para a célula referente às categorias 1 das duas variáveis, o valor do resíduo é:

( ΣL1 x ΣC1 )
Resíduo = n11 –
N

• Ou seja, resíduo = frequência absoluta observada – frequência absoluta esperada


• O mesmo cálculo é realizado para cada par de categorias

12
Análise de Correspondência Simples

4. Tabela com os valores χ2

• Para a célula referente às categorias 1 das duas variáveis, o valor da estatística χ2 é:

( resíduo11 ) 2
χ2 =
( freq. absoluta esperada11 )

• O mesmo cálculo é realizado para cada par de categorias e, em seguida, os valores de todas as
células são somados

13
Análise de Correspondência Simples

4. Tabela com os valores χ2

• O objetivo é verificar se há associação estatisticamente significante entre as variáveis


(utilizando a soma do χ2)

• H0: as variáveis se associam de forma aleatória.


• H1: a associação entre as variáveis não se dá de forma aleatória.

• Dados o nível de significância e os graus de liberdade, se o valor da estatística χ2 for


maior do que seu valor crítico, há associação significante entre as duas variáveis (H1)

• Graus de liberdade = (I – 1) x (J – 1)

14
Análise de Correspondência Simples

5. Tabela de resíduos padronizados (e padronizados ajustados)

• Enquanto a análise do χ2 permite verificar se há ou não a dependência entre as duas


variáveis, a análise de resíduos padronizados ajustados permite aprofundar a análise
com foco nas categorias das variáveis

• Como as categorias de uma variável se relacionam com as categorias da outra


variável?

• Para tanto, observa-se o excesso ou falta de ocorrência de casos nas categorias das duas variáveis

15
Análise de Correspondência Simples

5. Tabela de resíduos padronizados

• Para a célula referente às categorias 1 das duas variáveis, o valor do resíduo


padronizado é:

resíduo11
Resíduopadronizado =
√(freq. absoluta esperada11)

• O mesmo cálculo é realizado para cada par de categorias

16
Análise de Correspondência Simples

5. Tabela de resíduos padronizados ajustados

• Para a célula referente às categorias 1 das duas variáveis, o valor do resíduo


padronizado ajustado é:

resíduo padronizado11
Resíduopadronizado ajustado =
ΣC1 Σ
√[(1- ) x (1- L1 )]
N N

• O mesmo cálculo é realizado para cada par de categorias

17
Análise de Correspondência Simples

5. Tabela de resíduos padronizados ajustados

• Se o valor do resíduo padronizado ajustado em certa célula for maior do que 1,96,
interpreta-se que existe associação significativa, ao nível de significância de 5%, entre
as duas categorias que interagem na célula; se for menor do que 1,96, não há
associação estatisticamente significativa

• A referência de 1,96 é o valor crítico da normal padrão para o nível de significância de 5%

18
2. Elaboração e interpretação
do mapa perceptual

19
Análise de Correspondência Simples

1. Determinar os autovalores (λ²)

• A quantidade (m) de autovalores depende da quantidade de categorias nas variáveis:


m = mín(I – 1, J – 1)

• Na Anacor, os autovalores referem-se às inércias principais parciais e são base para


determinar a inércia principal total e o percentual da inércia principal total em cada
dimensão do mapa perceptual

20
Análise de Correspondência Simples

1. Determinar os autovalores (λ²)

• Como base para o cálculo dos autovalores, inicialmente, define-se uma matriz A

• Um modo de obter a matiz A, baseando-se nas etapas anteriores, é fazer para cada célula da
matriz de resíduos padronizados o seguinte cálculo:

( Resíduopadronizado )
√N
• Com base na matriz A, obtém-se a matriz W: W = A' . A

21
Análise de Correspondência Simples

1. Determinar os autovalores (λ²)

• Identificando W, os autovalores são obtidos pela solução da seguinte expressão:


det(λ² . I – W) = 0

λ² - w11 - w12 - w13


- w21 λ² - w22 - w23 = 0
- w31 - w32 λ² - w33

• I é a matriz identidade

22
Análise de Correspondência Simples

1. Determinar os autovalores (λ²)

• Com base nos autovalores (λ²), encontra-se o percentual da inércia principal total
de cada dimensão
2
λdimensão
% da Inércia Principal Total =
2
(para cada dimensão) λ total
• Quanto maior a inércia principal total (e o χ2), mais forte será a associação entre
as variáveis em análise
χ2
Inércia Principal Total =
N
23
Análise de Correspondência Simples

2. Determinar as massas em linha e coluna

• As massas representam a influência que cada categoria exerce sobre as demais


categorias de sua variável, seja na coluna (column profiles) ou linha (row profiles)

• Com base nos “totais” da tabela de contingência, para a categoria 1 das variáveis,
obtém-se as massas médias:

ΣL1 ΣC1
Massa na coluna = Massa na linha =
N N
• O mesmo cálculo é realizado para as demais categorias

24
Análise de Correspondência Simples

3. Determinar os autovetores

• Para a matriz W, é possível encontrar os autovetores a partir dos autovalores (λ²)


já calculados

• Substituindo os autovalores de cada dimensão na matriz definida como det(λ² . I – W) = 0 e


resolvendo o sistema de equações que parte dela, é possível encontrar os autovetores da
coluna (V) e, com base neles, encontrar os autovetores da linha (U)

u'k = [ Dl-1/2 . (P – lc') . Dc-1/2] . v'k . λk-1

Trata-se da matriz A

25
Análise de Correspondência Simples

4. Determinar as coordenadas das categorias

• Variável em linha na tabela de contingência

• Coordenadas das abscissas (X)


Xl = √λ1 . Dl-1/2 . u1
• Coordenadas das ordenadas (Y)
Yl = √λ2 . Dl-1/2 . u2
• Coordenadas da K-ésima dimensão (k = quantidade de λ)
Zl = √λk . Dl-1/2 . uk
26
Análise de Correspondência Simples

4. Determinar as coordenadas das categorias

• Variável em coluna na tabela de contingência

• Coordenadas das abscissas (X)

Xc = √λ1 . Dc-1/2 . v1
• Coordenadas das ordenadas (Y)
Yc = √λ2 . Dc-1/2 . v2
• Coordenadas da K-ésima dimensão (k = quantidade de λ)
Zc = √λk . Dc-1/2 . vk
27
Análise de Correspondência Múltipla (MCA)

28
Análise de Correspondência Múltipla

• Associação entre mais de duas variáveis

• Só participam da ACM as variáveis que apresentam associação estatisticamente


significativa com pelo menos uma outra variável contida na análise

• Antes de elaborar a ACM, é importante realizar um teste χ2 para cada par de variáveis

• Se alguma delas não apresentar associação com outras, não é incluída na análise de
correspondência

29
Análise de Correspondência Múltipla

1º método: utilizando a Matriz Binária

• A matriz binária é obtida pela transformação das variáveis qualitativas em variáveis


binárias, ou seja, valores 0 ou 1

• Com base na matriz binária (Z), pode ser obtida a inércia principal total na ACM

• Supondo que a matriz binária (Z) seja semelhante a uma tabela de contingência da
Anacor, é possível obter a inércia principal parcial das dimensões, autovalores,
autovetores e coordenadas dessa matriz

30
Análise de Correspondência Múltipla

1º método: utilizando a Matriz Binária

• Um exemplo de matriz binária (Z) é:


Variável A Variável B Variável C
Obs.
Categ. 1 Categ. 2 Categ. 1 Categ. 2 Categ. 3 Categ. 1 Categ. 2 Categ. 3 Categ. 4

1 1 0 0 1 0 1 0 0 0
2 0 1 0 0 1 0 1 0 0
3 0 1 1 0 0 0 0 1 0
N 1 0 1 0 0 0 0 0 1

• Quantidade de dimensões (λ²) = J – Q = (9 – 3) = 6, em que “J” é a quantidade total de


categorias e “Q” a quantidade de variáveis

31
Análise de Correspondência Múltipla

2º método: utilizando a Matriz de Burt

• A matriz de Burt é definida como: B = Z' . Z

• É possível combinar em uma única matriz as tabelas de contingência com o cruzamento de todos
os pares variáveis

• Ao considerar a matriz de Burt uma tabela de contingência, é possível realizar uma Anacor e obter
as coordenadas das categorias

32
Referência

Fávero, Luiz Paulo; Belfiore, Patrícia. (2017). Manual de análise de dados: estatística e
modelagem multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier

33
Unsupervised Machine
Learning: Exercícios
Aplicados

Prof. Dr. Wilson Tarantin Junior


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos
didáticos apresentados é do professor.
Proibida a reprodução, total ou parcial, sem
autorização. Lei nº 9610/98
Introdução

• Técnicas exploratórias (não supervisionadas)

• Para avaliar a relação conjunta entre as variáveis (interdependência)

• Não há modelos do tipo “yi = x1i + x2i + ... + ui”

• Não são adequadas para fins de inferência, ou seja, não têm caráter preditivo para
observações de fora da amostra

• Se novas observações forem adicionadas ao banco de dados, é adequado refazer a


análise; o mesmo é válido se variáveis forem adicionadas ou retiradas

3
Objetivo – Análise de Cluster

• Agrupamento de observações do banco de dados

• O objetivo é agrupar as observações em grupos homogêneos internamente e


heterogêneos entre si

• Dentro do grupo: observações semelhantes com base nas variáveis utilizadas na análise

• Entre grupos distintos: observações diferentes com base nas variáveis utilizadas na análise

4
Objetivo – Análise Fatorial PCA

• Agrupamento das variáveis métricas em fatores

• O objetivo é o agrupamento das variáveis em fatores

• A técnica depende das correlações entre variáveis

• Algumas possíveis finalidades:

• Obter o comportamento conjunto de variáveis, combinando-as para redução estrutural


• Análise da validade de construtos pela identificação das variáveis alocadas aos fatores
• Elaboração de rankings para classificação de desempenho por meio dos fatores
• Criação de fatores ortogonais entre eles e posterior uso em modelos supervisionados

5
Objetivo – Anacor e ACM

• Análise de associação entre variáveis categóricas

• O objetivo é verificar se existe associação estatisticamente significativa entre as


variáveis qualitativas (duas ou mais de duas variáveis)

• Como estão associadas as categorias das variáveis?

• Busca-se criar o mapa perceptual para visualizar tais associações

• Qual a proximidade das categorias no mapa perceptual?

6
Referência

Fávero, Luiz Paulo; Belfiore, Patrícia. (2017). Manual de análise de dados: estatística
e modelagem multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier

7
SUPERVISED MACHINE LEARNING:
ANÁLISE DE REGRESSÃO SIMPLES E
MÚLTIPLA
Prof. Dr. Luiz Paulo Fávero
5 1
0 9 8-
3. 27
*A responsabilidade pela idoneidade,
15.
originalidade e licitude dos a 3 conteúdos
h i d é do professor.
didáticos apresentados
o s
i
Proibida a reprodução, Y total ou parcial, sem
s h
tsu
autorização.
A
Lei nº 9610/98
el o
ar c
M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 3
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Reflexão
Modelos Supervisionados

“Diferentes pesquisadores, a partir de uma mesma base


de dados, podem estimar diferentes modelos e,
consequentemente, obter diferentes valores previstos do
fenômeno em estudo. O objetivo é estimar modelos que,
embora simplificações da realidade, apresentem a melhor
aderência possível entre os valores reais e os valores
previstos”.

Silberzahn, R.; Uhlmann, E. L. Many hands make tight work.


Nature, v. 526, p. 189-191, Out 2015.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 4
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Reflexão
Modelos Supervisionados

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 5
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Reflexão
Modelos Supervisionados

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 6
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Reflexão
Modelos Supervisionados

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 7
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Reflexão
Modelos Supervisionados

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 8
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Supervisionados de
Machine Learning:
5 1
Modelos Lineares Generalizados (GLM)
0 9 8-
X1 27 3.
15.
a 3
i d
Y Xo2 sh
i Y
s h
A t su
Xk cel o X3
ar X
M 4
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 9
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Lineares Generalizados (GLM)

𝜼𝒊 = 𝜶 + 𝜷𝟏 . 𝑿𝟏𝒊 + 𝜷𝟐 . 𝑿𝟐𝒊 +... 𝜷𝒌 . 𝑿𝒌𝒊

ln (  poisson )

ln ( bneg )

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 10
10
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Supervisionados:
Modelos Lineares Generalizados (GLM)

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 11
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Fundamentação teórica e conceitos em modelos de regressão
Especificação dos modelos GLM e funções de ligação canônica
Estimação dos parâmetros
Variáveis dummy
Procedimento Stepwise
Teste de normalidade dos resíduos
Modelos não lineares e transformações de Box-Cox
Diagnósticos de multicolinearidade e heterocedasticidade
Estimações em R

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 12
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Regressão Linear Simples

Objetivo:
Desenvolver uma equação linear que apresente a relação entre uma variável dependente e
uma variável explicativa.

Equação linear de uma reta num plano cartesiano:

𝒀𝒊 = 𝜶 + 𝜷. 𝑿𝒊 + 𝒖𝒊

em que temos um intercepto (𝛼), um coeficiente de inclinação da reta (𝛽), uma variável
explicativa X e um termo de erro u.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 13
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
ARQUIVO
“tempodist.xls”

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 14
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 15
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Análise de Regressão:
Coeficiente de Ajuste do Modelo (R²)

Indica o percentual de variância da variável Y que é devido ao


comportamento de variação conjunta da(s) variável(is) explicativa(s)
X. Varia de 0 a 1 e, quanto maior o coeficiente, maior o poder
preditivo do modelo de regressão, ou seja, maior o poder de
explicação do comportamento da variável dependente frente ao
comportamento da(s) variável(is) explicativa(s).

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 16
16
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Análise de Regressão:
Coeficiente de Ajuste do Modelo (R²)

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 17
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Análise de Regressão:
Estimação dos Parâmetros

Critérios:
n
1 – Soma dos erros igual a zero:  ui = 0
i =1 n
2 – Soma dos erros ao quadrado sendo a mínima possível:  ui2 = mín
i =1

Parâmetros a e b podem ser estimados por meio do método dos mínimos


quadrados ordinários (MQO), em que a somatória dos quadrados dos
termos de erro é minimizada.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 18
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 19
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Análise de Regressão:
Cálculo do R²

n
( )
2
ˆ
Yi − Y
R2 = n i =1
n
( )
2
Yˆi − Y +  ( ui )
2

i =1 i =1

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 20
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Apenas Parâmetros e R² ?

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 21
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Apenas Parâmetros e R² ?

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 22
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
0 9 8-
27 3.
15.
a 3
i d
o sh
i Y
s h
A tsuModelos de Regressão
o
cel
no

ar
M
Significância Estatística
do Modelo

▪ Teste F: Permite analisar se pelo menos um dos b’s é estatisticamente


significante para a explicação do comportamento de Y.

▪ Hipóteses: H0: 𝛽1 = 𝛽2 = 𝛽3 = ⋯ = 𝛽𝑘 = 0 H1: pelo menos um 𝛽 ≠ 0

Na rejeição da hipótese nula, pelo menos um dos b’s será estatisticamente


diferente de zero para explicar o comportamento de Y -> p-valor abaixo do
nível crítico (0,05, usualmente).

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 24
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Significância Estatística
dos Parâmetros do Modelo

▪ Teste t: Permite analisar se cada um dos parâmetros, individualmente, é


estatisticamente diferente de zero (no caso de regressão simples, apresenta a
mesma significância da estatística F).

▪ Hipóteses: H0: 𝛽 = 0 H1: 𝛽 ≠ 0

Avalia-se a significância estatística de cada parâmetro do modelo, para


determinado nível de significância (0,05, usualmente).

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 25
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Comparação entre Modelos

Quando houver o intuito de se compararem os resultados das


estimações de dois modelos com quantidades distintas de parâmetros
e/ou obtidos a partir de amostras com tamanhos diferentes, faz-se
necessário o uso do R² ajustado.

2
R ajust. = 1 −
n −1
n −1 − k
 1− R 2
( )
n: tamanho da amostra;
k: quantidade de variáveis X explicativas.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 26
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Regressão Múltipla

Qual a diferença entre um modelo de regressão simples para um


modelo de regressão múltipla?

A inclusão de novas variáveis explicativas no modelo!

A forma funcional passa a ser a seguinte:

𝒀𝒊 = 𝜶 + 𝜷𝟏 . 𝑿𝟏𝒊 + 𝜷𝟐 . 𝑿𝟐𝒊 + 𝜷𝟑 . 𝑿𝟑𝒊 … + 𝜷𝒌 . 𝑿𝒌𝒊 + 𝒖𝒊

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 27
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Variáveis Explicativas (X) Qualitativas

▪ Modelando com variáveis explicativas (X) qualitativas.

▪ É muito comum observar que diversas variáveis


explicativas podem se apresentar de maneira
qualitativa (exemplo: rating de crédito, setor de
atuação, etc.).

▪ Dado que tais características não possuem média e


nem variância, como incorporá-las ao modelo de
regressão?

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 28
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Variáveis Explicativas (X) Qualitativas

Variáveis dummy
São variáveis categóricas que representam um atributo por meio de
combinação binária (0 para a ausência ou 1 para presença).

E quando tivermos uma variável categórica com mais de uma categoria?


Neste caso, devemos incluir n – 1 dummies, em que n é a quantidade de
categorias existentes na variável original.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 29
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Não Lineares

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 30
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Não Lineares e
Transformações de Box-Cox

* Y  −1
YBox −Cox =

Qual o valor de  ( varia entre –∞ e +∞) que maximiza a aderência da
distribuição da nova variável Y* à normalidade?

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 31
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Não Lineares e
5 1
Transformações de Box-Cox
0 9 8-
2 7 3.
Yi = a + b1. X1 + b 2 . X 2 + ... + b k . X k
1 5 . Especificação Linear ( = 1)

Yi = a + b1. X1 + b 2 . X 2 + ... + b k . X k
2
a 3
Especificação Quadrática ( = 2)

Yi3 = a + b1. X1 + b 2 . X 2 + ... + b k . X k h i d


o s Especificação Cúbica ( = 3)

Yi = a + b1. X1 + b 2 . X 2 + ... + b k . XY
s h i k Especificação de Raiz ( = 0,5)

1 u
= a + b1. X1 + b 2 . X 2 t+s... + b k . X k
o A Especificação Inversa ( = -1)
Yi
c e l
a r
ln (Yi ) = a + b1. X1 + b 2 . X 2 + ... + b k . X k Especificação Semilogarítmica ( = 0)

M Expansão de Taylor

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 32
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Não Lineares e
Transformações de Box-Cox

Yi  − 1
= a + b1. X1 + b 2 . X 2 + ... + b k . X k + ui

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 33
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Diagnóstico de
Multicolinearidade

• Multicolinearidade: consequência da existência de alta correlação entre duas ou mais


variáveis explicativas (preditoras).

• Possibilidade de interpretações erradas pela eventual distorção dos sinais dos


parâmetros.

• Erros nas predições.

• Como detectar a multicolinearidade?


◦ Sinais inesperados dos coeficientes.
◦ Testes t não significantes e teste F significante.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 34
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Diagnóstico de
Multicolinearidade

Yi = a + b1. X 1i + b 2 . X 2i + ... + b k . X ki + ui

Y = X.b + U

Y1   1 X 11 X 12 ... X 1k  a  u1 


Y  1 X X 22 ... X 2 k  b  u 
  2  21   1  2
Y3  =  1 X 31 X 32 ... X 3k  .b2  +  u3 
       
...
  ... ... ... ... ...  ...
   ... 
Yn   1 X n1 X n2 ... X nk  nxk +1 bk  k +1x1 un  nx1
nx1

b = (X’X)-1(X’Y)

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 35
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Fontes Geradoras da
Multicolinearidade

1 - Existência de variáveis que apresentam a mesma tendência durante


alguns períodos, em decorrência da seleção de uma amostra que inclua
apenas observações referentes a estes períodos.

2 - Utilização de amostras com reduzido número de observações.

3 - Utilização de valores defasados em algumas das variáveis explicativas


como “novas” explicativas.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 36
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Consequências da
Multicolinearidade

𝒀𝒊 = 𝜶 + 𝜷𝟏 . 𝑿𝟏𝒊 + 𝜷𝟐 . 𝑿𝟐𝒊

(a) Correlação Perfeita:


1 4
X= 
2 8 

 5 20
X' X =  
20 80

e, portanto, det(X’X) = 0, ou seja, (X’X)-1 não pode ser definida.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 37
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Consequências da
Multicolinearidade

(b) Correlação Muito Alta, porém Não Perfeita:


1 4 
X= 
2 7 ,9

 5 19,8 
X' X =  
19,8 78,41

de onde vem que det(X’X) = 0,01 e, portanto:


7.841 − 1.980
(X' X )−1 = 
− 1.980 500 

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 38
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Consequências da
Multicolinearidade

(c) Correlação Baixa:


1 4 
X= 
 2 3

 5 10
X' X =  
10 25

de onde vem que det(X’X) = 25 e, portanto:


− 0,4
(X' X)−1 = 
1

− 0,4 0,2 

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 39
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Consequências da
Multicolinearidade

1 – As significâncias estatísticas dos parâmetros b = (X’X)-1X’Y são


sensíveis às correlações entre as variáveis explicativas.

2 – Os elementos da diagonal principal da matriz (X’X)-1 aparecem


no denominador da estatística t. Como a presença da
multicolinearidade gera valores muito altos na diagonal da
referida matriz, como vimos, ocorre a redução no valor da
estatística t, sem alteração no cálculo da estatística F.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 40
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Identificação da
Multicolinearidade

Regressões auxiliares entre cada uma das explicativas e as demais explicativas:


X2 = b1 + b2.X3 + ... + bk-1.Xk
X3 = b1 + b2.X2 + ... + bk-1.Xk
...
Xk = b1 + b2.X2 + ... + bk-1.Xk-1

Estatísticas VIF (Variance Inflation Factor) e Tolerance:


Tolerance = 1 – Rp²
VIF = 1 / Tolerance
em que o Rp² é o coeficiente de ajuste da regressão da variável explicativa Xp
(p = 2, 3, ..., k) com as demais variáveis explicativas.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 41
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Diagnóstico de
Heterocedasticidade

Variável
Variável Variável
Variável
dependente
explicada dependente
explicada

Variável
Variável Variável
Variável
explicativa
explicativa explicativa
explicativa

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 42
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 43
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
SUPERVISED MACHINE LEARNING:
MODELOS LOGÍSTICOS
BINÁRIOS E MULTINOMIAIS
Prof. Dr. Luiz Paulo Fávero
5 1
8-
0 9
*A responsabilidade pela idoneidade,
7 3 .
originalidade e licitude dos conteúdos 5. 2 didáticos
3 1
apresentados é do
i daprofessor.
o sh
i Y
Proibida a reproduçãou s h total ou parcial, sem
A t s
e l o
autorização. Lei nº 9610/98
ar c
M
MODELOS LOGÍSTICOS

Fundamentação teórica e conceitos


Especificação do modelo e funções de ligação canônica
Modelos logísticos binários e multinomiais
Estimação dos parâmetros por máxima verossimilhança
Cutoff, sensitividade, especificidade, curva ROC e índice GINI
Estimações em R

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 3
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Lineares Generalizados (GLM)

𝜼𝒊 = 𝜶 + 𝜷𝟏 . 𝑿𝟏𝒊 + 𝜷𝟐 . 𝑿𝟐𝒊 +... 𝜷𝒌 . 𝑿𝒌𝒊

ln (  poisson )

ln ( bneg )

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 4
4
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
0 9 8-
27 3.
15.
a 3
i d
o sh
i Y
s h
A t su
e l o
ar c Binária
M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 5
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Regressão Logística Binária

▪ Técnica supervisionada de machine learning utilizada para explicar


ou predizer a probabilidade de ocorrência de determinado evento
em função de uma ou mais variáveis explicativas.

▪ Variável dependente: binária.


→ Resultados interpretados em termos de probabilidades.

▪ Variáveis preditoras X: métricas ou não métricas.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 6
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Objetivos da Técnica

▪ Atribuição de Probabilidades:
Estimar a probabilidade de ocorrência de determinando evento
ou de que uma observação venha a se enquadrar nessa ou
naquela categoria.

▪ Classificação em categorias:
Classificar indivíduos ou observações em categorias específicas.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 7
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Conceitos:
Probabilidade
Chance (odds)
Logito

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 8
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
▪ Conceito de Probabilidade

Seja Y a resposta a um estímulo (sim ou não) - pode ser a


preferência por um produto, adimplência, aprovação em um
curso, etc.

▪ p: probabilidade da resposta “sim”.

▪ 1 – p: probabilidade da resposta “não”.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 9
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Conceito de Chance (Odds)

▪ Chance (odds) de ocorrência de um evento:


Exemplos: se p = 0,50; chance = 1 (1 para 1)
𝑝 (Evento) se p = 0,75; chance = 3 (3 para 1)
𝑐ℎ𝑎𝑛𝑐𝑒 =
1−𝑝 (Não Evento) se p = 0,25; chance = ⅓ (1 para 3)

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 10
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Conceito de Logito

▪ Logito: logaritmo natural da chance de ocorrência de uma


resposta do tipo “sim”.
E, a partir do logito, define-se a expressão da probabilidade
de ocorrência do evento em estudo, em função das
variáveis explicativas.
 p 
logito = Z = ln  
Vetor com
variáveis
 1− p 
explicativas p
elogito = e Z = = odds
1− p
eZ 1
p= =
1 + eZ 1 + e− Z
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 11
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
O Modelo de Regressão Logística
5 1
Binária
0 9 8-
7 3 .
. 2
A curva logística,
5
ou sigmóide,

3 1
descreve a relação entre a

a ocorrência de determinando
probabilidade associada à

h i d
o s evento e um conjunto de

i Y variáveis preditoras.

s u sh
A t A função logística

o
assume valores entre

ce l 0 e 1 para qualquer

1r
Z entre −∞ e +∞

pi = a
M −Z =
1
1+ e i
1 + e -( +  1 X 1 i +  2 X 2 i + .......+  k X ki )
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 12
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
Função Logística
0 9 8-
pi =
1
=
2 7 1 3.
1 5 .
1 + e − Z i 1 + e -( +  1 X 1 i +  2 X 2 i + .......+  k X ki )
Definida para que se estabeleça a probabilidade de 3

i d a ocorrência.
ocorrência de determinado evento

s h
e a importância das variáveis explicativas para esta

o iterativo para maximizar o acerto da



i
Estimação dos parâmetros: processo Y
s
probabilidade de ocorrência de
u h um evento à sua real ocorrência (Método de Máxima
Verossimilhança).
t s
A à variável dependente estarão entre 0 e 1.

e o
Os resultadoslatribuíveis

a r c

M
Análise do ajuste do modelo: testes de significância dos parâmetros e tabela de
classificação (matriz de confusão).
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 13
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 14
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
0 9 8-
27 3.
15.
a 3
i d
o sh
i Y
s h
t
Regressão
A Logística su
e l o
ar c Multinomial
M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 15
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Regressão Logística Multinomial
▪ Variável dependente se apresenta na forma qualitativa com mais de duas categorias.

▪ Por exemplo, para três possíveis respostas (labels 0, 1 ou 2, por exemplo), e sendo 0 a
categoria de referência escolhida, teremos duas outras possibilidades de evento em
relação a esta categoria (1 ou 2).

▪ Dessa forma, são definidos dois vetores de variáveis explicativas, com os respectivos
parâmetros estimados (dois logitos):

Z1i = 1 + 11 X 1i ++  k1 X ki


Z 2i =  2 + 12 X 1i ++  k 2 X ki
▪ Logo, número de logitos estimados será (M – 1), sendo M o número de categorias de Y.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 16
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
Funções Logísticas Multinomiais
0 9 8-
𝑒 𝑍𝑖

27 3.
▪ Sendo 𝑝𝑖 =
1 + 𝑒 𝑍𝑖
a probabilidade de ocorrência do evento, temos que:
15.
a 3
i d 1
▪ Probabilidade de ocorrência da categoria 0 (referência):
sh
𝑃𝑖0 =
o
1 + 𝑒 𝑍1𝑖 + 𝑒 𝑍2𝑖

i Y
s h 𝑒 𝑍1𝑖

su
▪ Probabilidade de ocorrência da categoria 1: 𝑃𝑖1 =

A t 1 + 𝑒 𝑍1𝑖 + 𝑒 𝑍2𝑖

e l o 𝑒 𝑍2𝑖

ar c
▪ Probabilidade de ocorrência da categoria 2: 𝑃𝑖2 =
1 + 𝑒 𝑍1𝑖 + 𝑒 𝑍2𝑖

M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 17
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Interpretação e
Eficiência Global do Modelo Multinomial

▪ Como na regressão logística binária, deve-se avaliar o resultado do teste c² para o


modelo de regressão logística multinomial, bem como os resultados dos testes z para
os parâmetros estimados das variáveis preditoras.

▪ Interpretação: os parâmetros das variáveis devem ser analisados em relação à


categoria de referência da variável dependente.

▪ Eficiência do modelo: a classificação das observações deve ser realizada a partir da


maior probabilidade estimada para cada observação (aqui, ao contrário da regressão
logística binária, não faz sentido a definição de um cutoff).

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 18
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
0 9 8-
27 3.
15.
a 3
i d
EXCELo sh
i Y
u s h
A t s
o
M ar ce l
R
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 19
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
0 9 8-
27 3.
15.
3
ida
MUITO OBRIGADO!
sh
Prof. Dr.Y o Paulo Fávero
h i Luiz

t s us
o A
ce l
ar
M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 20
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
SUPERVISED MACHINE LEARNING:
MODELOS DE REGRESSÃO PARA
DADOS DE CONTAGEM
Prof. Dr. Luiz Paulo Fávero
5 1
8-
0 9
*A responsabilidade pela idoneidade,
7 3 .
originalidade e licitude dos conteúdos 5. 2 didáticos
3 1
apresentados é do
i daprofessor.
o sh
i Y
Proibida a reproduçãou s h total ou parcial, sem
A t s
e l o
autorização. Lei nº 9610/98
ar c
M
MODELOS PARA DADOS DE CONTAGEM

Fundamentação teórica, conceitos e aplicações


Especificação do modelo e funções de ligação canônica
Modelos dos tipos Poisson e binomial negativo
Estimação dos parâmetros por máxima verossimilhança
Identificação do fenômeno de superdispersão nos dados
Modelos inflacionados de zeros
Estimações em R
Modelos Lineares Generalizados (GLM)

𝜼𝒊 = 𝜶 + 𝜷𝟏 . 𝑿𝟏𝒊 + 𝜷𝟐 . 𝑿𝟐𝒊 +... 𝜷𝒌 . 𝑿𝒌𝒊

ln (  poisson )

ln ( bneg ) (1781-1840)

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 4
4
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos para Dados de Contagem

Os modelos de regressão Poisson e binomial negativo fazem parte do que é


conhecido por modelos de regressão para dados de contagem, e têm por
objetivo analisar o comportamento, em função de variáveis preditoras, de
determinada variável dependente que se apresenta na forma quantitativa, com
valores discretos e não negativos. Deve ser definida também a exposição
(unidade temporal, espacial, social, etc.).

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 5
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos para Dados de Contagem:
Exemplos e Aplicações

• Avaliação da quantidade de vezes que um grupo de pacientes idosos vai ao médico por ano, em
função da idade de cada um deles, do sexo e das características dos seus planos de saúde.

• Estudo sobre a quantidade de ofertas públicas de ações que são realizadas em uma amostra de
países desenvolvidos e emergentes em determinado ano, com base em seus desempenhos
econômicos, como inflação, taxa de juros, produto interno bruto e taxa de investimento
estrangeiro.

Note que a quantidade de visitas ao médico ou a quantidade de ofertas públicas de ações são as
variáveis dependentes nos dois casos, sendo representadas por dados quantitativos que assumem
valores discretos, não negativos, e com exposição anual. Ou seja, oferecem dados de contagem.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 6
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos para Dados de Contagem:
Exemplos e Aplicações
1 2 3 4 5 6 7 8 9 10

Ecologia Mercado Imobiliário


* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 7
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Distribuições Poisson e Binomial Negativa

( )
ln Yˆi =  + 1. X1i +  2 . X 2i + ... +  k . X ki

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 8
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
A Distribuição Poisson
Determinada observação i (i = 1, 2, ..., n, em que n é
o tamanho da amostra) possui a seguinte
probabilidade de ocorrência de uma contagem m
em uma determinada exposição (período, área,
região, entre outros exemplos):

e − i .im
p(Yi = m ) =
m!
em que  é o número esperado de ocorrências ou a
taxa média estimada de incidência do fenômeno em
estudo para uma dada exposição.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 9
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
A Distribuição Poisson e
o Modelo Poisson
∞ ∞
𝑒 −𝜆 . 𝜆𝑚 𝑒 −𝜆 . 𝜆𝑚−1
Média: 𝐸 𝑌 = ෍ 𝑚. = 𝜆. ෍ = 𝜆. 1 = 𝜆
𝑚! 𝑚 − 1!
𝑚=0 𝑚=1

𝑒 −𝜆 .𝜆𝑚 𝑒 −𝜆 .𝜆𝑚
𝑉𝑎𝑟 𝑌 = σ∞
𝑚=0 𝑚. . 𝑚−𝜆 2
= σ∞
𝑚=0 𝑚. . ሺ𝑚2 − 2. 𝑚. 𝜆 +
𝑚! 𝑚!
Variância: 𝑒 −𝜆 .𝜆𝑚−2 𝑒 −𝜆.𝜆𝑚−1
𝜆2 ሻ 𝜆2 . σ∞
𝑚=2 + 𝜆. σ∞
𝑚=1 − 𝜆2 = 𝜆
𝑚−2! 𝑚−1!

Modelo Geral:

( ) ( )
ln Yˆi = ln  poissoni =  + 1. X 1i +  2 . X 2i + ... +  k . X ki

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 10
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
0 9 8-
EXCEL 27 3.
15.
a 3
i d
o sh
Y
iR
s h
A t su
e l o
ar c
M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 11
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
Teste de Superdispersão
0 9 8-
27 3.
( ) 15

Y
 i −  . 2
− Y

i
3
poissoni
*  
Yi =
 poissonida
o sh i

Yi = h
* Y
 ipoisson
s u s i

t
Asalientam que, se ocorrer o fenômeno da superdispersão nos dados,
o
l  deste modelo auxiliar sem intercepto será estatisticamente diferente
Cameron e Trivedi (1990)
e
a c
o parâmetro estimado
r
de zero, a determinado nível de significância (5%, usualmente).
M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 12
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
A Distribuição Poisson-Gama ou
Binomial Negativa

Para uma determinada observação i (i = 1, 2, ..., n, em que n é o tamanho da amostra), a função


da distribuição de probabilidade da variável dependente Y será dada por:

d q .miq −1.e− m .d
p (Yi = m ) =
i

(q − 1)!

em que q é chamado de parâmetro de forma (q > 0) e d é chamado de parâmetro de taxa de


decaimento (d > 0).

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 13
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
A Distribuição Poisson-Gama ou
5 1
Binomial Negativa
0 9 8-
2 7 3.
15. • Média:

a 3 ( ) 
E Y = bneg

i d
sh • Variância:

i Yo (
Var (Y ) = bneg +   bneg )
2

us h 1

A t s =
q

l o
ar ce Modelos NB2

M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 14
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
O Modelo Poisson-Gama ou
Binomial Negativo

( ) ( )
ln Yˆi = ln bnegi =  + 1. X1i +  2 . X 2i + ... +  k . X ki

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 15
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
0 9 8-
27 3.
15.
a 3
d
EXCEL i Yo
s h
sh i
R
A t su
e l o
ar c
M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 16
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Inflacionados de Zeros

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 17
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Escolha do Modelo

Modelo de Regressão para Dados de Contagem


Verificação Poisson Binomial Negativo
Poisson Binomial Negativo Inflacionado de Inflacionado de
Zeros (ZIP) Zeros (ZINB)
Superdispersão nos Dados
Não Sim Não Sim
da Variável Dependente
Quantidade Excessiva de
Zeros na Variável Não Não Sim Sim
Dependente

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 18
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Inflacionados de Zeros

São considerados uma combinação entre um modelo para dados de contagem e um modelo para
dados binários, já que são utilizados para investigar as razões que levam a determinada quantidade de
ocorrências (contagens) de um fenômeno, bem como as razões que levam (ou não) à ocorrência
propriamente dita deste fenômeno, independentemente da quantidade de contagens observadas.

Enquanto um modelo Poisson inflacionado de zeros é estimado a partir da combinação de uma


distribuição Bernoulli com uma distribuição Poisson, um modelo binomial negativo inflacionado de
zeros é estimado por meio da combinação de uma distribuição Bernoulli com uma distribuição
Poisson-Gama.

LAMBERT, D. Zero-inflated Poisson regression, with an application to defects in manufacturing.


Technometrics, v. 34, n. 1, p. 1-14, 1992.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 19
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Inflacionados de Zeros

A definição sobre a existência ou não de uma quantidade excessiva de zeros na variável


dependente Y é elaborada por meio de um teste específico, conhecido por teste de
Vuong (1989), que representará um importante output a ser analisado na estimação de
modelos de regressão para dados de contagem, quando houver a suspeita de existência
de inflação de zeros.

VUONG, Q. H. Likelihood ratio tests for model selection and non-nested hypotheses. Econometrica, v.
57, n. 2, p. 307-333, 1989.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 20
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Inflacionados de Zeros
do Tipo Poisson (ZIP)

Em relação especificamente aos modelos de regressão Poisson inflacionados de zeros,


podemos definir que, enquanto a probabilidade p de ocorrência de nenhuma contagem
para dada observação i (i = 1, 2, ..., n, em que n é o tamanho da amostra), ou seja, p(Yi =
0), é calculada levando-se em consideração a soma de um componente dicotômico com
um componente de contagem e, portanto, deve-se definir a probabilidade plogit de não
ocorrer nenhuma contagem devido exclusivamente ao componente dicotômico, a
probabilidade p de ocorrência de determinada contagem m (m = 1, 2, ...), ou seja, p(Yi =
m), segue a própria expressão da probabilidade da distribuição Poisson, multiplicada por
(1 – plogit).

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 21
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Inflacionados de Zeros
do Tipo Poisson (ZIP)
 p (Y = 0 ) = p
 i (
logiti + 1 − plogiti .e
−i
)
 −i m
 p (Yi = m ) = 1 − plogit . e .i ,
( ) m = 1, 2, ...
 i
m!
1
plogiti =
−(  +d1 .W1i +d 2 .W2 i +...+d q .Wqi )
1+ e

 poisson = e(
 + .X + 1 1i 2
. X 2 i +...+  k . X ki )
i

Os modelos de regressão Poisson inflacionados de zeros apresentam dois processos geradores de


zeros, sendo um devido à distribuição binária (neste caso, são gerados os chamados zeros
estruturais) e outro devido à distribuição Poisson (nesta situação, são gerados dados de contagem,
entre os quais os chamados zeros amostrais).
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 22
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Inflacionados de Zeros
do Tipo Binomial Negativo (ZINB)

Já em relação aos modelos de regressão do tipo binomial negativo inflacionados de


zeros, podemos definir que, enquanto a probabilidade p de ocorrência de nenhuma
contagem para dada observação i, ou seja, p(Yi = 0), é também calculada levando-se em
consideração a soma de um componente dicotômico com um componente de contagem,
a probabilidade p de ocorrência de determinada contagem m (m = 1, 2, ...), ou seja, p(Yi
= m), segue agora a expressão da probabilidade da distribuição Poisson-Gama.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 23
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelos Inflacionados de Zeros
do Tipo Binomial Negativo (ZINB)

 q
 



p ( Yi = 0 ) = plogiti + 1 − p logiti (.  1
 1 + q −1.bneg
) 

  i 
  d q .m q −1.e− mi .d 

(
 p (Yi = m ) = 1 − plogit . 
i
 (
i
q − 1 )
)!
,

m = 1, 2, ...

1
plogiti =
−(  +d1 .W1i +d 2 .W2 i +...+d q .Wqi )
1+ e

bneg = e(
 + .X + 1 1i 2
. X 2 i +...+  k . X ki )
i

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 24
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 25
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
0 9 8-
27 3.
MUITO OBRIGADO!
15.
a 3
Prof. Dr. Luiz Paulo Fávero
i d
o sh
i Y
s h
A t su
e l o
ar c
M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 26
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
SUPERVISED MACHINE LEARNING:
MODELAGEM MULTINÍVEL I

Prof. Dr. Luiz Paulo Fávero


5 1
8-
0 9
*A responsabilidade pela idoneidade,
3 .
7 didáticos
5. 2
originalidade e licitude dos conteúdos
3 1
apresentados é do da
h
professor.
i
Y os
sh i
s u
Proibida a reprodução
t total ou parcial, sem
o A
autorização. Lei nº 9610/98
cle
ar
M
MODELAGEM MULTINÍVEL
Fundamentação teórica dos modelos multinível

Conceitos para a estimação de


modelos multinível

Modelagem multinível no R
Reflexão

100
Valores Previstos (Fitted Values)

80
60
40
20
0

0 20 40 60 80 100
Valores Reais

45º Modelo 1 Modelo 2 Modelo 3

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 4
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Contexto

Unsupervised Supervised
Análise de Modelos Lineares
Conglomerados Generalizados (GLM)
Machine Learning
Componentes Modelos Lineares
Principais Generalizados
Multinível (GLMM)
Análise de
Correspondência

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 5
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
O que são Modelos Multinível?

São modelos que reconhecem a existência de


estrutura multinível ou hierárquica nos dados.

Hierarchical linear models: applications and data analysis


methods. 2. ed. Thousand Oaks: Sage Publications, 2002.

Stephen W. Raudenbush Anthony S. Bryk


University of Chicago Stanford University

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 6
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor.
7
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor.
7
8
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Estrutura Multinível

100.0
80.0
Desempenho

60.0
40.0
20.0
0.0

5 10 15 20 25 30
Variável de
Variável deFirma
Indivíduo

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 9
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Estrutura Multinível
5 1
0 9 8-
3.
100.0
. 27
80.0
3 15
i da
Desempenho

60.0

o sh
i Y
40.0

s h
t su
20.0

o A
c e l
0.0

M ar 5 10 15
Variável de
Variável
20
deFirma
Indivíduo
25 30

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 10
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Estrutura Multinível

100.0
80.0
Desempenho

60.0
40.0
20.0
0.0

5 10 15 20 25 30
Variável de
Variável deFirma
Indivíduo

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 11
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 12
12
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 13
12
13
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 14
14
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 15
15
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Variância dos Termos Aleatórios

Se as variâncias dos termos aleatórios n0j e n1j forem


estatisticamente diferentes de zero, procedimentos
tradicionais de estimação dos parâmetros do modelo, como
mínimos quadrados ordinários, não serão adequados.

Using multivariate statistics. 6. ed. Boston: Pearson,


2013.

Barbara G. Tabachnick Linda S. Fidell


California State University California State University

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 16
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Dummies?

Apenas a inserção de dummies de grupo não capturaria os


efeitos contextuais, visto que não permitiria que se separassem os
efeitos observáveis dos não observáveis sobre a variável
dependente.

Multilevel and longitudinal modeling using Stata. 3. ed.


College Station: Stata Press, 2012.

Sophia Rabe-Hesketh Anders Skrondal


U. C. Berkeley Norwegian Institute of Public Health
University of Oslo
U. C. Berkeley

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 17
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Por que Utilizar?

Os modelos multinível permitem, portanto, o desenvolvimento de novos e


mais bem elaborados constructos para predição e tomada de decisão.
“Dentro de uma estrutura de modelo com equação única, parece não haver uma
conexão entre indivíduos e a sociedade em que vivem. Neste sentido, o uso de
equações em níveis permite que o pesquisador ‘pule’ de uma ciência a outra:
alunos e escolas, famílias e bairros, firmas e países. Ignorar esta relação significa
elaborar análises incorretas sobre o comportamento dos indivíduos e, igualmente,
sobre os comportamentos dos grupos. Somente o reconhecimento destas
recíprocas influências permite a análise correta dos fenômenos.”

Methodology and epistemology of multilevel analysis. Daniel Courgeau


Institut National D´Études
London: Kluwer Academic Publishers, 2003.
Démographiques

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 18
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Aplicações
Business, Economics & Management

Índice h5 % / Modelos
Periódico
(Google Scholar) Supervisionados
American Economic Review 158 10,78%
Journal of Business Research 140 12,71%
Tourism Management 118 14,04%
Journal of Business Ethics 117 12,15%
Journal of Financial Economics 116 11,83%
The Quarterly Journal of Economics 110 3,75%
The Review of Financial Studies 108 6,88%
Technological Forecasting and Social Change 106 4,59%
International Journal of Information Management 105 8,15%
Management Science 103 8,57%
9,26%

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor.
20
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Aplicações
Enginering & Computer Science
Índice h5 % / Modelos
Periódico
(Google Scholar) Supervisionados
IEEE/CVF Conference on Computer Vision and
356 4,78%
Pattern Recognition
Advanced Materials 294 3,56%
International Conference on Learning
253 6,22%
Representations
Neural Information Processing Systems 245 4,83%
Renewable and Sustainable Energy Reviews 225 3,42%
Advanced Energy Materials 206 2,53%
International Conference on Machine Learning 204 8,24%
Energy & Environmental Science 202 3,54%
ACS Nano 202 2,89%
European Conference on Computer Vision 197 3,38%
4,28%
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor.
21
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Aplicações
Health & Medical Sciences

Índice h5 % / Modelos
Periódico
(Google Scholar) Supervisionados
The New England Journal of Medicine 410 1,97%
The Lancet 345 2,34%
Cell 288 2,41%
Journal of the American Medical Association 253 2,75%
Proceedings of the National Academy of Sciences 245 0,98%
Journal of Clinical Oncology 213 1,75%
Nature Medicine 205 0,73%
The Lancet Oncology 196 0,45%
PLoS ONE 185 0,43%
Nature Genetics 184 2,34%
1,70%

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor.
22
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Aplicações
Social Sciences

Índice h5 % / Modelos
Periódico
(Google Scholar) Supervisionados
Journal of Business Ethics 117 0,97%
Computers & Education 109 0,34%
Research Policy 95 0,41%
New Media & Society 93 0,75%
American Journal of Public Health 90 0,98%
Global Environmental Change 86 0,75%
Nature Human Behaviour 84 0,73%
Health Affairs 84 0,45%
Social Science & Medicine 83 0,43%
Teaching and Teacher Education 83 0,97%
0,64%

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor.
23
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Pouca Utilização: Qual a Razão?
5 1
- Estrutura dos dados.
0 9 8-
27 3.
- Não consideração de natureza multinível nos dados.
15.
a 3
- Capacidade computacional por vezes insuficiente,
i d
principalmente quando da existência de interações profundas. o sh
i Y
s h
t su
Multilevel network analysis for the social sciences: theory,
A
o
methods and applications. New York: Springer, 2016.

c e l
M ar Emmanuel Lazega Tom Snijders
Institut d’Études Politiques de Paris University of Oxford

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 24
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Aplicação
RAJAN, R.G.; ZINGALES, L.
What do we know about capital structure? Some evidence from international data.
Journal of Finance, v. 50-5, p. 1421-1460, 1995.

- Compustat Global e Country Local Market Index Number of Firms


MSCI; United States S&P 500 2.583
Japan Nikkei 500 514
- 4.557 empresas; Germany FAZ Share Index 191
France CAC General Index 225
- 7 países; Italy MIB Current Index 118
United Kingdom FT 500 608
- período: 1987-1991. Canada TSE 300 318

Leveragei =  0 + 1. (Tangible Assets )i +  2 . ( Market to Book )i


+ 3. ( Log Sales )i +  4 . ( ROA )i +  i
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 25
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Aplicação
5 1
0 9 8-
Leveragei =  0 + 1. (Tangible Assets )i +  2 . ( Market to Book )i
27 3.
+ 3. ( Log Sales )i +  4 . ( ROA )i +  i
15.
a 3
h i d
Leverageij =  0 j + 1 j . (Tangible
o s Assets )ij +  2 j . ( Market to Book )ij
Nível 1
i Y ) +  .( ROA) + 
u s h
+ 3 j . ( Log Sales ij 4j ij ij
t s
0 j = γ00A+n 0 j
e l o 1 j = γ10 +n1 j  2 j = γ20 +n 2 j
Nível 2
ar c 3 j = γ30 +n 3 j  4 j = γ40 +n 4 j
M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 26
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
------------------------------------------------------------------------------
leverage | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
tang_assets | .3462677 .049087 7.05 0.000 .2500589 .4424765
market_book | -.0641481 .0143289 -4.48 0.000 -.0922322 -.036064
logsale | .0353799 .0098784 3.58 0.000 .0160185 .0547413
roa | -.7729998 .2071899 -3.73 0.000 -1.179085 -.366915
_cons | -.6153343 .795045 -0.77 0.439 -2.173594 .9429252
------------------------------------------------------------------------------

------------------------------------------------------------------------------
Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval]
-----------------------------+------------------------------------------------
country: |
var(tang_a~s) | 4.33e-13 7.82e-14 1.83e-28 1021.785
var(market~k) | .0087904 .0030879 .002262 .0341598
var(logsale) | 7.67e-06 33%
5.33e-09 1.96e-06 .00003
var(roa) | 10.84124 4.462827 3.37015 34.87456
var(_cons) | 3.811897 0.733678 1.036019 14.02538
-----------------------------+------------------------------------------------
var(Residual) | 29.18282 67%
.6058274 28.01925 30.39471
------------------------------------------------------------------------------
LR test vs. linear regression: chi2(5) = 1047.68 Prob > chi2 = 0.0000

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 27
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Aplicação
RAJAN, R.G.; ZINGALES, L.
What do we know about capital structure? Some evidence from international data.
Journal of Finance, v. 50-5, p. 1421-1460, 1995.

5.5
5
Fitted Values

4.5
4
3.5

3.5 4 4.5 5 5.5


Return on Assets (ROA)

OLS Multilevel 45º

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 28
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Aplicação
5 1
0 9 8-
3.
United States United States United States

7
Japan Japan Japan
Germany Germany

5. 2 Germany

1
France France France
Italy Italy

a 3 Italy

d
UK UK UK
Canada Canada

sh i Canada

o
-4.0e-11 -2.0e-11 0 2.0e-11 4.0e-11 -.1 -.05 0 .05 .1 .15 -.002 0 .002 .004 .006

Y
Interceptos Aleatórios por País Inclinação Aleatória - Tangible Assets Inclinação Aleatória - Market to Book

s h i
su
United States United States

At
Japan Japan
Germany Germany

l o
France

e
France

c
Italy Italy

ar UK UK

M
Canada Canada
-4 -2 0 2 4 -3 -2 -1 0 1 2
Inclinação Aleatória - Log Sales Inclinação Aleatória - ROA

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 29
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Desafios em Modelagem Multinível
5 1
0 9 8-
23.
7
Interações Profundas e
15 .
Capacidade de Processamento
a 3Estimação de
i d modelos com a
Métodos de Estimação dos
o sh melhor aderência
Parâmetros
i Y possível entre os
s h valores reais e
t
Clusterização da Amostra

A su previstos

e l o
ar c
M Andrew Gelman
Multilevel Conference, 31 Out 2015, Columbia University, NYC.

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 30
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
MODELAGEM MULTINÍVEL
- 5 1
NO 0 9 8
7 3 .
5. 2
3 1
i da
o sh
i Y
u s h
A t s
e l o
ar c
M
32
Modelagem HLM2
5 1
Modelo Nulo
0 9 8-
2 7 3.
15 .
𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜 = 𝛽 + 𝜀 3
Nível
Nível1 1
i da 𝑖𝑗 0𝑗 𝑖𝑗

o sh Substituindo...
LINHA 390

𝛽 = 𝛾 +Y𝜈
DO SCRIPT
Nível 2
s h i 0𝑗 00 0𝑗

t s u
o A
c e
Substituindo...l 𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜 = 𝛾 + 𝑣 + 𝜀
a r 𝑖𝑗 00 0𝑗 𝑖𝑗

M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor.
33
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelagem HLM2
5 1
Modelo com Interceptos Aleatórios
0 9 8-
27 3.
1 5.
a 3
𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜 = 𝛽 + 𝛽 . horas +𝜀
Nível 1
h i d 𝑖𝑗 0𝑗 1𝑗 𝑖𝑗 𝑖𝑗

𝛽 = 𝛾 + 𝜈 Yo
s LINHA 441
Nível 2
𝛽 =𝛾 s
0𝑗
h i 00 0𝑗
DO SCRIPT

t s u 1𝑗 10

o A
r c el 𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜 = 𝛾 + 𝛾 . horas + 𝜈 + 𝜀𝑖𝑗
M a
Substituindo... 𝑖𝑗 00 10 𝑖𝑗 0𝑗

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor.
34
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelagem HLM2
- 5 1
0
Modelo com Interceptos e Inclinações Aleatórios 9 8
7 3 .
5 . 2
𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜 = 𝛽 + 𝛽 . horas3 1
Nível 1
i da +𝜀 𝑖𝑗 0𝑗 1𝑗 𝑖𝑗 𝑖𝑗

o sh LINHA 480
Nível 2 𝛽 =𝛾 +𝜈
i Y 0𝑗 00
DO SCRIPT
0𝑗

𝛽 = 𝛾 s+
u h𝜈
s
1𝑗 10 1𝑗

A t
l o
Substituindo...ce 𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜 = 𝛾 + 𝛾 . horas + 𝜈 + 𝜈 . ℎ𝑜𝑟𝑎𝑠 + 𝜀
a r 𝑖𝑗 00 10 𝑖𝑗 0𝑗 1𝑗 𝑖𝑗 𝑖𝑗

M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor.
35
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelagem HLM2
5 1
Modelo Final HLM2
0 9 8-
27 3.
15 .
Nível 1
a 3
𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜 = 𝛽 + 𝛽 . horas +𝜀 𝑖𝑗 0𝑗 1𝑗 𝑖𝑗 𝑖𝑗

i d
𝛽 = 𝛾 + 𝛾 .texpsh
LINHA 521
Nível 2 0𝑗
Y o +ν 00 01 𝑗 0𝑗 DO SCRIPT
𝛽 = 𝛾 +h𝛾i .texp + v
s u
1𝑗
s 10 11 𝑗 1𝑗

A t
o
el 𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜 = 𝛾 + 𝛾 . horas + 𝛾 .texp
Substituindo...
ar c 𝑖𝑗 00 10
+ 𝜈0𝑗 + v1𝑗 . horas𝑖𝑗 + 𝜀𝑖𝑗
𝑖𝑗 01 𝑗 +γ11 .texp𝑗 . horas𝑖𝑗

M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor.
36
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
HLM2 x OLS

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 37
37
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
MUITO Prof. Dr. Luiz Paulo Fávero
Professor Titular de Data Science & Analytics da USP
OBRIGADO!

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 38
38
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
SUPERVISED MACHINE LEARNING:
MODELAGEM MULTINÍVEL II

Prof. Dr. Luiz Paulo Fávero


5 1
8-
0 9
*A responsabilidade pela idoneidade,
3 .
7 didáticos
5. 2
originalidade e licitude dos conteúdos
3 1
apresentados é do da
h
professor.
i
Y os
sh i
s u
Proibida a reprodução
t total ou parcial, sem
o A
autorização. Lei nº 9610/98
cle
ar
M
Modelagem HLM3 com
Medidas Repetidas
3
Modelagem HLM3 com Medidas Repetidas
5 1
0 9 8-
3.
Período
Período tt

7
1 2 ... T1 1 2 ... T2 ... 1 2 ... TJ

2
Nível
(Nível 11)

15.
a 3
i d
sh
Yo
Indivíduo
Indivíduo j ..........
1 2 J
Nível
(Nível22)

h i
t s us
o A
ce l
Grupo
Grupo kk
Nível
(Nível 33)
ar 1 ................. K

M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 4
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelagem HLM3 com Medidas Repetidas
5 1
Modelo Nulo
0 9 8-
27 3.
15.
Nível 1 𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜tjk = 𝛽 jk + 𝜀tjk
a 3 0
i d LINHA 307
+ 𝜈 jksh
Nível 2 𝛽 jk = 𝛾0
Y o 00𝑘 0
DO SCRIPT

h i
𝛿s + 𝜏
Nível 3 𝛾
t s=u00𝑘 000 00𝑘

e l oA
Substituindo...
ar c 𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜tjk = 𝛿000 + 𝜈0jk + 𝜏00𝑘 + 𝜀tjk

M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 5
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelagem HLM3 com Medidas Repetidas

Modelo de Tendência Linear com Interceptos e Inclinações Aleatórios

Nível 1 𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜tjk = 𝛽0jk + 𝛽1jk . 𝑚𝑒𝑠jk + 𝜀tjk

Nível 2 𝛽0jk = 𝛾00𝑘 + 𝜈0jk


𝛽1𝑗𝑘 = 𝛾10𝑘 + 𝜈1jk
LINHA 359
Nível 3 γ00𝑘 = δ000 + 𝜏00𝑘 DO SCRIPT
𝛾10𝑘 = 𝛿100 + 𝜏10𝑘

Substituindo... desempenhotjk = 𝛿000 + 𝛿100 . 𝑚𝑒𝑠jk +


𝜈0𝑗𝑘 + 𝜈1jk . 𝑚𝑒𝑠jk + 𝜏00𝑘 + 𝜏10𝑘 . 𝑚𝑒𝑠jk + 𝜀tjk
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 6
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Modelagem HLM3 com Medidas Repetidas
Modelo de Tendência Linear com Interceptos e Inclinações Aleatórios e as
Variáveis ativ de Nível 2 e texp de Nível 3 (Modelo Completo)
Nível 1 𝑑𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜tjk = 𝛽0jk + 𝛽1jk . 𝑚𝑒𝑠jk + 𝜀tjk

Nível 2 𝛽0jk = 𝛾00𝑘 + 𝛾01𝑘 .𝑎𝑡𝑖𝑣jk + 𝜈0jk


𝛽1𝑗𝑘 = 𝛾10𝑘 + 𝛾11𝑘 .𝑎𝑡𝑖𝑣jk + 𝜈1jk
LINHA 404
Nível 3
γ00k = δ000 + δ001 .texp𝑘 + 𝜏00k DO SCRIPT
𝛾01𝑘 = 𝛿010
𝛾10𝑘 = 𝛿100 + 𝛿101 .texp𝑘 + 𝜏10𝑘
𝛾11𝑘 = 𝛿110

Substituindo... desempenhotjk = 𝛿000 + 𝛿100 . 𝑚𝑒𝑠jk + 𝛿010 .𝑎𝑡𝑖𝑣jk + 𝛿001 .texp𝑘 +δ110 . ati𝑣jk . 𝑚𝑒𝑠jk +
𝛿101 .texp𝑘 . 𝑚𝑒𝑠jk + 𝜈0jk + 𝜈1jk . 𝑚𝑒𝑠jk +𝜏00𝑘 +𝜏10𝑘 . 𝑚𝑒𝑠jk + 𝜀tjk

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 7
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
HLM3 com Medidas Repetidas x OLS

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 8
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
FINALIZANDO...
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 9
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
Reflexão Multinível
5 1
“Devemos expandir o círculo do nosso amor até que
0 9 8-
ele englobe todo o nosso bairro; do bairro, por sua vez,
27 3.
15.
deve desdobrar-se para toda a cidade; da cidade para
a 3
o estado, e assim, sucessivamente, até que o objeto do i d
o sh
nosso amor inclua todo o universo.”
i Y
s h
A t su
e l o
ar c Mahatma Gandhi
(1869 – 1948)

M
* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 10
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
5 1
0 9 8-
“Nada na vida deve ser temido, apenas
27 3.
compreendido. Entretanto, ninguém disse que o
15.
caminho do progresso seria rápido e fácil. Agora é
a 3
hora de compreendermos mais, temermos
i d
menos, e trabalharmos para nosso próprio
o sh
aperfeiçoamento, com responsabilidade coletiva
i Y
s h
su
por toda a humanidade.”

A t
e l o Marie Curie

ar c (1867-1934)
Nobel de Física – 1903
M Nobel de Química – 1911

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 11
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
MUITO Prof. Dr. Luiz Paulo Fávero
Professor Titular de Data Science & Analytics da USP
OBRIGADO!

* A responsabilidade pela idoneidade, originalidade e licitude dos conteúdos didáticos apresentados é do professor. 12
É proibida a reprodução, total ou parcial, sem autorização. Lei nº 9610/98.
BIG DATA E DEPLOYMENT DE
MODELOS

Helder Prado Santos


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
Vamos desenvolver um modelo

Código do
modelo
Banco de
dados
Fit do modelo

Deploy do
modelo

3
E se?
Organização/Empresa

Código do
modelo
Banco de
dados
Fit do
modelo

Deploy do
modelo

4
E se?
Organização/Empresa

Código do
modelo

Fit do
Banco de dados modelo

Deploy do
modelo

5
E se?
Organização/Empresa

Código do
Banco de
dados
modelo

Fit do
Banco de
dados modelo

Banco de Deploy do
dados
modelo

6
E se?
Organização/Empresa

Código do
Banco de
dados
modelo

Fit do
Banco de
dados modelo

Banco de Deploy do
dados
modelo

7
E se?
Organização/Empresa

Código do
Novos dados Banco de
dados
modelo

Fit do
Novos dados Banco de
dados modelo

Novos dados
Banco de Deploy do
dados
modelo

8
Alguns problemas encontrados...

1. E se tivermos dentro de uma organização?


2. E se nosso banco de dados crescer?
3. E se tivermos vários bancos de dados?
4. E se eu quiser que um cliente externo use o modelo?
5. E se novos dados chegarem ao longo do tempo?

9
Pensando nos problemas 1,2 e 3

Possibilidades
E... Custo...

Complexidade

Migrar para computação em nuvem?

10
Entrando no mundo do Big Data

• É uma ferramenta?
• É só ter grandes volumes de dados?
• Eu já tenho isso na minha organização/empresa?

11
Big Data: Os 5V

Fonte: https://www.cortex-intelligence.com/blog/os-5-vs-do-big-data

12
Por onde começar?

... Implementar um Data Lake?

13
Implementando um Data Lake

Arquitetura básica de um Datalake


Dados A

Dados B Dados Dados


Dados brutos
consolidados prontos

Dados C Extract Ttransform Landing

14
Estratégias e boas práticas
5 1
0 9 8-
73 .
Performance 5 .2
31
a 1. Usar um framework de big data
h i d
s
i Yo 2. Comprimir os dados
u sh
Ats 3. Particionar os dados
oel
c
ar Custos
M

15
Usar um framework de big data
• Spark
• Processamento distribuído em memória
• Ferramenta open source
• Possui biblioteca built-in de Machine Learning

Fonte: https://spark.apache.org/docs/1.1.0/cluster-overview.html

16
Compressão de dados

... Até 87% de redução de tamanho

... Até 34x mais rápido para carregar os dados

Fonte: https://www.databricks.com/glossary/what-is-parquet
... Até 99% de redução de custos
17
Particionar os dados
.../tabela_de_vendas/
Tempo de consulta

.../tabela_de_vendas/ano=2022

.../tabela_de_vendas/ano=2022/mes=8

Drasticamente!!!! ... E em 15 anos?

18
Pensando no quarto problema...

• E se eu quiser que um cliente externo use o modelo?


Deploy

Modelo API
Aplicação

19
O que é uma API?
(Application Programming Interface)

Fonte: https://www.manutan.com/blog/en/glossary/api-definition-and-application-in-procurement

20
Na prática...

Utilizando um modelo de predição de atrasos de voo...

Requisição - Usuário
https://dominio/api/v1/modelo_atrasos/origem=Brazil/destino=Canada

Resposta - Servidor
{
“origem": “Brazil",
“destino": “Canadá",
“atraso": 420,
}

21
E o modelo?

• Como validar o modelo antes de dar acesso aos clientes?


• Quem tem permissão de acesso?
• Onde eles devem ficar armazenados?
• Qual o modelo que deve ser utilizado internamente e externamente?

... Precisamos antes entender sobre ciclo de vida dos


modelos
22
Ciclo de vida dos modelos
5 1
0 9 8-
Preparação
73 .
dos dados
5 .2
a 31
h i d
s
i Yo ...até
Dados
brutos
u sh
Fit do
modelo

Ats
el o
ar c
M
Deploy

23
Voltando para o nosso ambiente

Arquitetura básica de um Datalake

Dados

Dados Dados Dados Dados


Modelos
brutos consolidados prontos

Dados
ETL

24
Entendendo o MLFlow
Organização

API

Modelos

Fonte: https://bytepawn.com/getting-started-with-mlflow.html

25
E os novos dados que chegam ao
longo do tempo?
• Orquestração de tarefas

26
E os novos dados ao longo do
tempo?

https://airflow.apache.org/docs/apache-airflow/stable/concepts/dags.html

27
E os novos dados ao longo do
tempo?
5 1
Agendado para todo dia às 2 da manhã
0 9 8-
73 .
5 .2
a 31
h i d
s
i YoDados consolidados
Dados brutos
u sh
At s
el o
ar c ETL
M
https://airflow.apache.org/docs/apache-airflow/stable/concepts/dags.html

28
E a atualização dos modelos com
os novos dados?

Todo início de mês às 1 da manhã

Dados prontos Modelos

https://airflow.apache.org/docs/apache-airflow/stable/concepts/dags.html

29
Lembram da antiga consulta ao
modelo via API?
Utilizando um modelo de predição de atrasos de voo...

Requisição - Usuário
https://dominio/api/v1/modelo_atrasos/origem=Brazil/destino=Canada

Resposta - Servidor
{
“origem": “Brazil",
“destino": “Canadá",
“atraso": 420,
}

30
... Mesma consulta um mês
depois
Utilizando um modelo de predição de atrasos de vôo...

Requisição - Usuário
https://dominio/api/v1/modelo_atrasos/origem=Brazil/destino=Canada

Resposta - Servidor
{
“origem": “Brazil",
“destino": “Canadá",
“atraso": 360,
}

31
Revisitando nosso cenário inicial

Código do
modelo
Banco de
dados
Fit do modelo

Deploy do
modelo

32
Possível cenário com suporte a
Big Data e Deployment de
modelos
Arquitetura básica de um Datalake

Dados

API
Dados Dados Dados Dados
Modelos
brutos consolidados prontos

Dados
ETL

33
Mãos à obra!

34
5 1
0 9 8-
73 .
5 .2
31
OBRIGADO!
h i d a
os
i Y
linkedin.com/in/helderprado
u sh
At s
e l o
ar c
M

35
BIG DATA E DEPLOYMENT DE
MODELOS II

Helder Prado Santos


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Voltando ao nosso cenário

Código do
modelo
Banco de
dados
Fit do modelo

Deploy do
modelo

3
Como disponibilizar modelos?
5 1
0 9 8-
Código do
7 3 .
modelo 15.2
Banco de dados 3 a
h i d
s
YFito do
i
u sh
Ats modelo
elo
ar c Deploy do
M
modelo

4
CRISP-DM
Metodologia de processo

Fonte: https://www.escoladnc.com.br/blog/data-science/metodologia-crisp-dm/

5
E o modelo?

• Como validar o modelo antes de dar acesso aos clientes?


• Quem tem permissão de acesso?
• Onde eles devem ficar armazenados?
• Qual o modelo que deve ser utilizado internamente e externamente?

6
Ciclo de vida dos modelos
5 1
Versão81-
Fit do
. 0 9 - Arquivado
modelo
2 7 3
1 5 .
a 3
h i d
os
Preparação
i Y
h
Deploy Versão 2 - Arquivado
dos dados
s u s
t
el oA
ar c
M Dados Versão 3 - Em produção

brutos

7
Conhecendo o MLFlow

API

Modelos

Fonte: https://bytepawn.com/getting-started-with-mlflow.html

8
Pensando em disponibilizar
o modelo...
• E se eu quiser que alguém use meu modelo?
Deploy

Modelo API
Aplicação

9
O que é uma API?
(Application Programming Interface)

Fonte: https://www.manutan.com/blog/en/glossary/api-definition-and-application-in-procurement

10
Na prática...

Utilizando um modelo de predição de atrasos de voo...

Requisição - Usuário
https://dominio/api/v1/modelo_atrasos/origem=Brazil/destino=Canada

Resposta - Servidor
{
“origem": “Brazil",
“destino": “Canadá",
“atraso": 420,
}

11
Mãos à obra!

12
5 1
0 9 8-
73 .
5 .2
31
OBRIGADO!
h i d a
os
i Y
linkedin.com/in/helderprado
u sh
At s
e l o
ar c
M

13
SÉRIES TEMPORAIS
Prof. Fabiano Guasti Lima
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
SÉRIES TEMPORAIS

Leitura de dados em série temporal; Plotagem e decomposição de


séries temporais; Método de Holt-Winters; Decomposição de
séries não sazonais; Alisamento exponencial (exponential
Tópicos smoothing); Decomposição de séries sazonais e ajustamento
sazonal; Forecast; Modelos ARIMA; Diferenciação de séries
temporais; Seleção de modelos ARIMA; Forecast para modelos
ARIMA; Exemplos e exercícios adicionais dos modelos estudados.

3
Referências

https://www.msperlin.com/adfeR/ https://otexts.com/fpp3/

4
Referências

5
SÉRIES TEMPORAIS
Conjunto de observações ordenadas no tempo.
Xt tn=1 = X1, X 2,, X n 
Se n>=50, chama-se sucessão cronológica.
- Ordem: dependência de ordem!

• Índice IBOVESPA diário;


• Retorno das ações da Petrobrás mensal;
• Índices Mensais da Inflação no Brasil;
• Taxas de Câmbio Real/US$ diário

6
ELEMENTOS DE UMA SÉRIE TEMPORAL

Índice IBOVESPA (B3) diário

Unidade
MEDIDA FATO
de tempo

Fonte: B3, abril,2023 – Acesso em 05/04/2023


7
Univariadas e Multivariadas
• Univariadas: apenas uma variável conectada ao tempo
• Multivariadas: duas ou mais variáveis conectadas ao tempo

Fonte: googlefinance, abril/2023

8
Exemplos Séries Temporais

Fonte: https://www.gov.br/anac/pt-br/assuntos/dados-e-estatisticas/dados-estatisticos/dados-estatisticos

9
Exemplos Séries Temporais

Fonte: CVM, dez/2022


10
Exemplos Séries Temporais

Fonte: http://sidc.be/silso/infosnmtot

11
Exemplo Séries Temporais

12
Exemplos Séries Temporais

13
Exemplos Séries Temporais

14
Objetivos do Estudo de Séries de Tempo
Investigação do
Fazer previsões de
mecanismo que gera a
valores futuros da série
série temporal

Objetivos das
análises de
séries temporais

Descrever apenas o
Procurar periodicidades
comportamento da
relevantes nos dados
série

15
Histórico...

• Stigler (1699) – primeiro esquema “empírico” da demanda publicado por


Charles Davenant;
• Rodulfo Enini (1907) – primeiros estudos;
• 1930 – Econometric Society;
• Antes de 1955 – Modelos Clássicos de Decomposição;
• 1957 – 1962 – Modelos de Alisamento Exponencial (Holt-Winters e
Brown);
• Décadas de 60/70 – Modelos de Box-Jenskins (ARIMA);
• Década de 80 – Modelos estruturais clássicos e bayesianos (Filtro de
Kalman);
• Década de 80/90 – Cointegração e econometria de Séries Temporais.

16
Séries Temporais

George Box (1919-2013) Gwilym Jenkins (1932-1982)


Fonte: Google Imagens

Todos os modelos
estão errados, mas
alguns são úteis.

17
Classificação das Séries Temporais

• Discretas: são séries em que o intervalo de observações


(t) pertence a um conjunto discreto. Ou seja, as
observações são feitas em intervalos de tempo fixos.

• Contínuas: são séries em que as observações são


obtidas continuamente através de algum intervalo no
tempo.

18
Classificação das Séries Temporais

• Determinística: quando pode ser descrita por uma


função matemática para estabelecer exatamente os
valores futuros da série.

• Estocástica: quando os valores futuros da série


somente podem ser estabelecidos em termos
probabilísticos, pois o modelo compõe-se também de
um termo aleatório.

19
Métodos Estudados

SIMPLES CLÁSSICA OUTRAS


Naive Suavização Regressão
Exponencial

Mean Redes Neurais

ARIMA
Drift Decomposição

20
Métodos SIMPLES

• NAIVE: Projeta o último valor para o futuro


• NAIVE SAZONAL: Considera o último valor no mesmo período de tempo (para
séries com sazonalidade)
• Média: usa a média histórica como previsão para o futuro
• Drift: faz uma previsão que acompanha a tendência da série (equivale a traçar
uma renta entre o primeiro e o último ponto)

21
Métodos SIMPLES
• NAIVE: Projeta o último valor para o futuro

Xt tn=1 = X1, X 2,, X n 

22
Métodos SIMPLES
• NAIVE SAZONAL: Projeta o último período sazonal

Xt tn=1 = X1, X 2,, X n 

23
Métodos SIMPLES
• MÉDIA: média de toda a série

Xt tn=1 = X1, X 2,, X n 

24
Métodos SIMPLES
• DRIFT: equivale a traçar uma reta entre o primeiro e o último ponto

Xt tn=1 = X1, X 2,, X n 

25
Estatísticas de Erro das Previsões
• ME: Mean Error – É a média da diferença entre realizado
e o previsto.

𝑒𝑟𝑟𝑜𝑡 = 𝑋𝑡 − 𝑋෠𝑡
σℎ𝑡=1 𝑒𝑟𝑟𝑜𝑡
𝑀𝐸 =

• MAE: Mean Absolute Error – É a média da diferença
absoluta entre realizado e previsto

σℎ𝑡=1 𝑒𝑟𝑟𝑜𝑡
𝑀𝐴𝐸 =

26
Estatísticas de Erro das Previsões

• RMSE: Root Mean Square Error – É o desvio padrão total


da amostra da diferença entre o previsto e o realizado.

σℎ𝑡=1 𝑒𝑟𝑟𝑜𝑡 2
𝑅𝑀𝑆𝐸 =

27
Estatísticas de Erro das Previsões
• MPE: Mean Percentage Error – É a diferença percentual
do erro.

ℎ 𝑒𝑟𝑟𝑜𝑡
σ𝑡=1
𝑋𝑡
𝑀𝑃𝐸 = × 100%

• MAPE: Mean Absolute Percentage Error – É a diferença


absoluta percentual do erro.
𝑒𝑟𝑟𝑜𝑡
σℎ𝑡=1
𝑋𝑡
𝑀𝐴𝑃𝐸 = × 100%

28
Estatísticas de Erro das Previsões
• TIC: Theil Inequality Coefficient – Theil´s U
É o grau de ajuste da previsão. Quanto menor, melhor. Zero
ideal.

2
𝑋෠𝑡+1 − 𝑋𝑡+1
σℎ𝑡=1
𝑋𝑡
𝑇ℎ𝑒𝑖𝑙´𝑠 𝑈 = 2
𝑋𝑡+1 − 𝑋𝑡
σℎ𝑡=1
𝑋𝑡

29
Estatísticas de Erro das Previsões
• ACF1: First-Order Autocorrelation Function –
Aucorrelação dos resíduos.

𝑐𝑜𝑣(𝑅𝑖𝑡 , 𝑅𝑖,𝑡−𝑘 )
𝐴𝐶𝐹𝑘 =
𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎(𝑅𝑖𝑡 )

30
Métodos CLÁSSICOS

• DECOMPOSIÇÃO: projeções por decomposição da série


• SUAVIZAÇÃO EXPONENCIAL: método de amortecimento (suavização), ideal para
tendências e inclui variação sazonal
• Aditivo: para variação sazonal constante
• Multiplicativo: variação sazonal varia na série

31
Médias Móveis

Fonte: https://covid.saude.gov.br/
32
Componentes de uma série temporal

Movimento oculto no dados, seguindo uma


direção - crescente, decrescente ou
estacionária

Flutuações regulares dentro de um período


completo de tempo(dia, semana, mês, etc.)
- Representam um tipo de padrão que se repete.
(picos, depressões) normalmente dentro de um
ano

Flutuações de longo prazo nos dados e são


similares aos fatores sazonais. Padrão que se
repete com regularidade mas sem período fixo

33
Série com tendência e sazonalidade

Sazonalidade são as flutuações regulares dentro de um período


completo de tempo (um dia, uma semana, um mês, etc).
O importante sobre fatores sazonais é que eles representam um
tipo de padrão que se repete.

Sazonais

2004
Tendência
2005

2006

34
Série com ciclo

Ciclos São flutuações a longo prazo nos dados e são similares


aos fatores sazonais. Eles podem ser difíceis de serem identificados
a menos que uma série de dados longa esteja disponível.

Ciclos

35
Série com tendência, sazonalidade
e variações cíclicas

• Muitas séries apresentam junto a uma tendência


variações cíclicas e sazonais;
• Estas variações aparecem devido a clima, fatores
econômicos, hora, etc;
• Se estas variações podem ser observadas, a sua
consideração pode ajudar a melhorar as previsões.
• São usados o método da decomposição:

• MULTIPLICATIVO
• ADITIVO

36
Aditivo

Y = T+C+S+E
• Y - valor da série no instante t
• T - componente de tendência para o instante t
• C - componente cíclica para o instante t
• S - componente sazonal para o instante t
• E - componente aleatória para o instante t

37
Multiplicativo

Y = T*C*S*E
• Y - valor da série no instante t
• T - componente de tendência para o instante t
• C - componente cíclica para o instante t
• S - componente sazonal para o instante t
• E - componente aleatória para o instante t

38
Modelo Multiplicativo

700
600
500
400
300
200
100
0
0 10 20 30 40 50 60

O modelo multiplicativo é normalmente aplicado a dados em


que o tamanho dos efeitos sazonais aumentam.

39
Modelo Aditivo

10000

8000
6000

4000
2000

0
0 10 20 30 40 50 60

O modelo aditivo geralmente é considerado mais adequado


para dados em que as flutuações sazonais permanecem
aproximadamente do mesmo tamanho com o tempo.

40
Modelos de Suavização
Exponencial (SES)

• Série temporal que não apresenta tendência e nem sazonalidade;


• Série temporal com Tendência mas sem sazonalidade – Suavização
Exponencial de Holt (SEH)
• Série temporal com Tendência e Sazonalidade – Suavização
Exponencial de Holt-Winters

41
Suavização Exponencial Simples (SES)

• Dá pesos maiores às observações mais recentes


captando melhor as mudanças de comportamento.
• Previsão é igual ao último valor exponencial suavizado.

Xt tn=1 = X1, X 2,, X n 

42
Suavização Exponencial Simples
(SES) – Previsão

Erro para h = 1

𝑆𝐸ℎ = 𝑆𝐸 × 1 + ℎ − 1 . 𝛼 2
43
Suavização Exponencial de Holt (SEH)
• Para Séries temporais com tendência linear

Xt tn=1 = X1, X 2,, X n 

44
Suavização Exponencial de Holt
(SEH) – Previsão

45
Suavização Exponencial de Holt
(SEH) – Previsão
𝑋෠𝑡 ℎ = 𝑋෠𝑡 ± 𝑍𝛼Τ2 . 𝑆𝐸(ℎ)

𝑆𝐸 ℎ = SE. 1 + 𝑘. 𝛼 2

2
𝑘 = ෍ 1 + 𝛽. (𝑖 − 1)
𝑖=2

46
Suavização Exponencial de
Holt-Winters (HW - Aditivo)
• Para Séries temporais com comportamento sazonal (c=período sazonal).
• Modelo Aditivo

𝑋෠𝑡 =𝐿෠ 𝑡−1 + 𝑇෠𝑡−1 +𝑆መ𝑡−𝑐   n


X t t =1 = X1, X 2,, X n 

𝐿෠ 𝑡 = 𝛼 𝑋෠𝑡 − 𝑆መ𝑡−𝑐 + 1 − 𝛼 . (𝐿𝑡−1 + 𝑇𝑡−1 )


𝑇෠𝑡 = 𝛽 𝐿෠ 𝑡 − 𝐿෠ 𝑡−1 + 1 − 𝛽 . 𝑇𝑡−1
𝑆መ𝑡 = 𝛾 𝑋෠𝑡 − 𝐿෠ 𝑡−1 + 1 − 𝛾 . 𝑆𝑡−𝑐
0≤𝛼≤1 𝑋෠𝑡+ℎ =𝐿෠ 𝑡 + ℎ𝑇෠𝑡 +𝑆መ𝑡+ℎ−𝑐ℎ´
0≤𝛽≤1
0≤𝛾 ≤1−𝛼 ℎ´ = 𝐼𝑁𝑇 ℎ−1 ൗ +1
𝑐
47
Suavização Exponencial de Holt-
Winters (HW - Aditivo) – Previsão

𝑋෠𝑡 ℎ = 𝑋෠𝑡 ± 𝑍𝛼Τ2 . 𝑆𝐸(ℎ)

ℎ−1

𝑆𝐸 ℎ = SE. 1 + ෍ 𝜑𝑖2
𝑖=1

𝛼 1 + 𝛽𝑖 , 𝑐 ≠ 𝑖 − 1
𝜑𝑖 = ቊ
𝛼 1 + 𝛽𝑖 + 𝛾 1 − 𝛼 , 𝑐 = 𝑖 − 1
48
Suavização Exponencial de Holt-
Winters (HW - Multiplicativo)
• Para Séries temporais com comportamento sazonal (c=período sazonal).
• Modelo Multiplicativo

𝑋෠𝑡 =(𝐿෠ 𝑡−1 + 𝑇෠𝑡−1 ). 𝑆መ𝑡−𝑐   n


X t t =1 = X1, X 2,, X n 
𝐿෠ 𝑡 = 𝛼 𝑋෠𝑡 /𝑆መ𝑡−𝑐 + 1 − 𝛼 . (𝐿𝑡−1 + 𝑇𝑡−1 )
𝑇෠𝑡 = 𝛽 𝐿෠ 𝑡 − 𝐿෠ 𝑡−1 + 1 − 𝛽 . 𝑇𝑡−1
𝑆መ𝑡 = 𝛾 𝑋෠𝑡 /𝐿෠ 𝑡−1 + 1 − 𝛾 . 𝑆𝑡−𝑐
0≤𝛼≤1
𝑋෠𝑡+ℎ =(𝐿෠ 𝑡 +𝑇෠𝑡 ). 𝑆መ𝑡+ℎ−𝑐ℎ´
0≤𝛽≤1
0≤𝛾 ≤1−𝛼 ℎ−1 ൗ +1
ℎ´ = 𝐼𝑁𝑇 𝑐
49
Previsão
Modelo ETS (Error, Trend, Seasonal)
Legenda
• Definirá o melhor modelo
Erro Tendência Sazonalidade A Aditivo
A N N
M Multiplicativo
M A A
N Nenhum
Z M M
Z Z Z Automático

model = “AAA” Tendência

Ad Aditivo Amortecido

Md Multiplicativo Amortecido

50
Modelos de Séries Temporais
• Série Estacionária: movimento de tendência não é
significativo ao longo do tempo.

Série Estacionária Série Não-Estacionária


 Média móvel  Tendência linear
 Média móvel  Método de Holt
ponderada
 Alisamento
exponencial

51
MODELOS A R I M A

George Box (1919-2013) Gwilym Jenkins (1932-1982)


Fonte: Google Imagens

“ Nos modelos ARIMA os dados falam por si


mesmo”
52
Modelos ARIMA (Box-Jenkins)
• Robusto: pode ser aplicado em praticamente qualquer tipo de série temporal
• Funciona melhor com dados estáveis, com poucos outliers (embora podemos removê-los) -
tsclean
• Requer dados estacionários
• Pode ser transformada usando diferenciação: remove tendências
• Diferenciação: subtrai a observação atual da anterior
• Diferenciação pode ser feita 1x: diferenciação de primeira ordem
• Diferenciação 2x: diferenciação de segunda ordem (mais raro)

53
Tipos de Modelos – ARIMA
não Sazonal

• Modelos auto-regressivos (AR): avalia a relação entre os períodos (lags):


autocorrelação – extrai a influência;
• Integrado (I): Aplicado à diferenciação, quando necessário
• Modelos médias móveis (MA): avalia erros entre períodos e extrai esses erros;
• Modelos auto-regressivos e de médias móveis (ARMA)
• Modelos auto-regressivos integrados e de médias móveis (ARIMA)

54
Modelos ARIMA

ARIMA

(p,d,q)
q: ordem da média móvel
d: grau de diferenciação
p: ordem da parte autorregressiva

55
Modelos ARIMA
• p = 1, significa que uma determinada observação pode ser explicada pela
observação prévio + erro
• p = 2, significa que uma determinada observação pode ser explicada por duas
observação prévias + erro

• d = 0, significa que não é aplicada diferenciação


• d = 1, significa que será aplicada diferenciação de primeira ordem
• d = 2, significa que será aplicada diferenciação de segunda ordem

• q = 1, significa que uma determinada observação pode ser explicada pelo erro da
observação prévia
• q = 2, significa que uma determinada observação pode ser explicada pelo erro de
duas observações prévias.

56
Modelos ARIMA
• AR(1) ou ARIMA(1,0,0) – Apenas elemento auto-regressivo de 1ª ordem
• AR(2) ou ARIMA(2,0,0) – Apenas elemento auto-regressivo de 2ª ordem

• MA(1) ou ARIMA(0,0,1) – Apenas média móvel

• ARMA(1,1) ou ARIMA(1,0,1) – Auto-regressão e média móvel de 1ª ordem

57
Modelos ARIMA – Como definir
os valores de p, d, e q
• p: ordem da parte autorregressiva: PACF
• d: grau de diferenciação – Teste de Estacionariedade
• q: ordem da média móvel: ACF

58
Escolha dos Modelos
• Critério de AIC – Critério de Informação de Akaike
• O AIC estima a quantidade relativa de informações perdidas por um determinado modelo:
quanto menos informações um modelo perde, maior a qualidade desse modelo e menor a
pontuação AIC.

• Critério de BIC – Critério de Informação Bayesiano


• BIC mais baixo implica em melhor ajuste.

59
Modelos ARIMA
• Série Estacionária: média e a autocovariância são constantes no tempo.
• Formas detectar estacionariedade:
• Gráfico ACF da série (processo não estacionário apresenta lento decaimento da sua função
de autocorrelação.
• Série com tendência é o motivo mais comum para não estacionariedade

60
Modelos Simulados
AR ( 1)
X t = 0,8 X t −1 + t

MA ( 1)
X t = −0,3 t −1 +  t

ARMA ( 1,1)
X t = −0,8 X t −1 − 0,3t −1 + t

61
Exemplo: Processo AR(1) de baixa frequência

Yt = 0,95 Yt −1 + ut , Y0 = 100, ut ~ N (0,1)


120

100
Y(t) = 0,95 x Y(t-1) + u(t)
80

60

40

20

-20
Sorteios i.i.d. N(0,1)

-40

62
Exemplo: Processo AR(1) de baixa frequência

Yt = −0,95  Yt −1 + ut , Y0 = 100, ut ~ N (0,1)


20 130
Y(t) = - 0,95 x Y(t-1) + u(t)

80
15
30

10
-20

Sorteios i.i.d. N(0,1)


-70
5

-120
0
-170

-5 -220

63
Exemplo: Processo AR(12):

Yt = 1,1 Yt −12 + ut , Y0 = 10, ut ~ N (0,1)


45

40 Y(t) = 1,1 x Y(t-12) + u(t)

35

30

25

20

15

10
Sorteios i.i.d. N(0,1)
5

-5

64
Modelos Auto-regressivos (AR)
• Os valores correntes de uma série Yt dependem apenas
de seus valores passados e dos erros aleatórios.

• Exemplo AR(p): p é o número de defasagens

Modelo AR(1)
Yt = φ1Yt-1 + εt

65
Teste de Estacionariedade
[...] um processo estocástico é estacionário se suas média e
variância forem constantes ao longo do tempo e o valor da
covariância entre dois períodos de tempo depender apenas da
distância ou defasagem entre os dois períodos, e não do
período de tempo efetivo em que a covariância é calculada
(ENDERS, 2003).

Teste KPSS – Kwiatkowski-Phillps-Schmidt - Shin

H 0 : a série é estacionária (Não apresenta raiz unitária)


H1 : a série Não é estacionária (Possui raiz unitária)

66
Teste de Estacionariedade
Teste de Dickey-Fuller
Teste feito porque não se sabe se a série temporal possui mais de
uma raiz unitária, pois o número de termos de diferenças defasadas
é, muitas vezes, determinado empiricamente.

H 0 : a série não é estacionária (apresenta raiz unitária)


H1 : a série é estacionária (sem raiz unitária)

Teste PP – Phillips-Perron
H 0 : a série não é estacionária (apresenta raiz unitária)
H1 : a série é estacionária (sem raiz unitária)

67
Autocorrelação

68
Autocorrelação
É o coeficiente de correlação entre observações
defasadas no tempo:
n −1

 ( x − x )( x
t 1 t +1 − x2 )
r1 = t =1
n −1

 t 1 t +1 2
( x
t =1
− x ) 2
( x − x ) 2

onde as médias amostrais são:


n −1
x1 =  xt (n − 1)
n
e x2 =  xt (n − 1)
i =1 i =2

69
Função de Autocorrelação FAC(k)

A expressão anterior pode ser generalizada para k períodos


de tempo (defasagem):
n−k

 ( x − x )( x
t t +k − x)
rk = FAC (k ) = t =1
n −1

 t
( x
t =1
− x ) 2

Como, tanto a covariância como a variância apresentam


as mesmas unidades, não tem unidade. Oscila entre –1 e
1 e o gráfico feito colocando contra k é chamado de
correlograma amostral da FAC.

70
Correlogramas
• FAC (ACF) – Função de Autocorrelação
• Mostra as autocorrelações em uma série temporal
• Linhas mostram significância (intervalo de confiança)
• A 1ª autocorrelação é igual a 1. Cada traço do gráfico mostra uma defasagem e uma
correlação (autocorrelação).
• FACP (PACF) – Função de Autocorrelação Parcial
• Mede a autocorrelação não entre lags mas entre diferentes intervalos.

71
FAC dos Modelos Simulados

72
Características da FAC
Padrão típico da FAC Padrão típico da FACP
AR(p) Decai exponencialmente Valores significativos, ou
para zero seja, não nulos, até a
ou com padrão de onda defasagem p
senoidal amortecida, ou
ambos.

MA(q) Valores significativos, Decai exponencialmente


ou seja, não nulos, até para zero.
a defasagem q

ARMA(p,q) Decai exponencialmente Decai exponencialmente


para zero. para zero.

73
Metodologia de Box-Jenkins
Etapas Processo

Identificação descobrir os valores apropriados de p e q. Para isso usamos


o correlograma e o correlograma parcial para perceber em que
períodos de defasagem existe mais correlação com a variável
dependente ou de correlação entre as observações com k
períodos de defasagem.
Estimação estimar os parâmetros dos termos auto-regressivo e de média
móvel incluídos no modelo
Checagem Um teste simples do modelo escolhido é ver se os resíduos
estimados desse modelo são ruídos brancos; se são, podemos
aceitar o ajuste específico; se não são, devemos começar tudo de
novo.

74
Modelo ARIMA(p,d,q)
Pode-se pensar num modelo ARIMA como uma função de regressão
populacional para Yt em que há apenas 2 tipos de “variáveis
explicativas”:
(1) Valores passados de Yt → A parte “autorregressiva”.
(2) Valores presente e passados do distúrbio normal ut (ou
“inovação”) → A parte de “médias móveis”.

Yt = 1Yt −1 + ... +  pYt − p + ut − 1ut −1 − ... −  qut −q

▪ Hiperparâmetro p: a defasagem máxima de Yt presente na equação.


▪ Hiperparâmetro q: a defasagem máxima de ut presente na equação.
▪ Hiperparâmetro d: ordem de integração, se o processo for não-estacionário

75
Modelo AR(p) - Fundamentos
• Um processo linear estacionário auto-regressivo de ordem p, ou simplesmente AR(p),
é definido como:

Yt = Yt −1 + Yt − 2 +  + Yt − p + t


Ruído Branco

Uma sequência t é um processo ruído branco se, para qualquer t:

1)E(t) = 0 → média constante e nula


2)Var ( t) = E ( t2) → variância constante
3)Cov ( t,  t-1) = E ( t  t-1) = 0 → ausência de autocorrelação

Se  t ~ N, então será Ruído Branco Gaussiano


76
Classes de modelos
Exemplos de modelos da classe ARIMA:

· Modelo AR(1): Yt = 1Yt −1 + ut


· Modelo AR(2): Yt = 1Yt −1 +  2 Yt − 2 + u t

· Modelo MA(1): Yt = u t −  1u t −1
· Modelo ARMA(1,1): Yt = 1Yt −1 + u t −  1u t −1
77
Modelo ARIMA SAZONAL
Modelo SARIMA(p,d,q)(P,D,Q)
• Notação: SARIMA (0,0,0) (1,0,0)12

t=
Y a+
1Y
2 t−
12+e
t

• Notação: SARIMA (0,0,0) (0,0,1)12


t=
Y 
a+1e
2 t−
12+e
t

• Generalizando: SARIMA(p,d,q)(P,D,Q)s
• P - número de termos auto regressivos sazonais (defasagens
no lado direito da equação)
• d – número de diferenças sazonais
• q – número de médias móveis sazonais (erros defasados no
lado direito da equação)
• s – ciclo sazonal
78
Teste de Normalidade
( X −  ) 3 
Assimetria A( X ) = E  
 
3


( X −  ) 4 
Curtose K(X ) = E  
 
4


Normal: A = 0 e K = 3

n  2  n 
Teste de Jarque Bera (1981) JB =   A +  ( K − 3) 2
6  24 
H 0 : série é normal JB ~  2 ( 2)
79
OBRIGADO!
linkedin.com/in/fabiano-guasti-lima-b9830282

80
DATA WRANGLING

Prof. Dr. Wilson Tarantin Junior


No Zoom – a imagem do
professor será exibida nesta
área. Por favor, deixar esse
espaço sem conteúdo em
todos os slides.
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
Preparação de Dados no R

3
Data wrangling

• O que é data wrangling?

• É o processo de transformar a base de dados de sua estrutura original para a


nova estrutura que permitirá a extração de informações

• Portanto, dado que há uma ou mais bases de dados em mãos, é uma etapa de
preparação, organização, manipulação do banco de dados

• É o processo que ocorre antes da extração de estatísticas descritivas, criação de gráficos


e estimação de modelos, por exemplo

• Dificilmente, as bases de dados estão disponíveis na estrutura mais adequada


4
Data wrangling

• Utilizaremos, principalmente, o dplyr

• O dplyr é um pacote contido no tidyverse

• Contém funções úteis para a manipulação/preparação de bancos de dados

• Materiais para referência:

• https://dplyr.tidyverse.org/
• https://github.com/rstudio/cheatsheets/blob/master/data-transformation.pdf
• Wickham, H. & Grolemund, G. R for Data Science: https://r4ds.had.co.nz/index.html

5
Data wrangling

• Funções frequentemente utilizadas no software R

• Pipe: encadeamento de diversas funções em sequência


• Rename: alteração de nomes de variáveis
• Mutate: alteração de conteúdo das variáveis e criação de novas variáveis
• Filter: seleção de observações com base em critérios lógicos
• Select: seleção de variáveis
• Summarise: criação de tabelas com medidas resumo (estatísticas descritivas)
• Group by: agrupamento das observações com base em critérios
• Join: junção (merge) de bancos de dados

6
Iterações com Pacote “purrr”

7
purrr (tidyverse)

• Pacote purrr: funções map

• Funções que facilitam a aplicação de processos iterativos por meio de códigos


que são mais simples de escrever e ler, além de serem sucintos

• Para simplificar operações que precisam ser repetidas muitas vezes, como a
aplicação de certa função em diversas variáveis do banco de dados

• Materiais para consulta:

• Wickham, H. & Grolemund, G. R for Data Science: https://r4ds.had.co.nz/index.html


• https://github.com/rstudio/cheatsheets/blob/master/purrr.pdf
8
Criação de Projects e Scripts R Markdown

9
R Markdown

• Introdução ao R Markdown
• Formatação básica do texto
• Inserção de fórmulas
• Chunks
• Gerando outputs (HTML; PDF, DOC)

• Material para referência:

• https://rmarkdown.rstudio.com/index.html

10
Referências

Wickham, H. & Grolemund, G. (2017) R for Data Science. O’Reilly

11
OBRIGADO!
linkedin.com/in/wilson-tarantin-junior-359476190/

12
DATA WRANGLING

Prof. Dr. Wilson Tarantin Junior


No Zoom – a imagem do
professor será exibida nesta
área. Por favor, deixar esse
espaço sem conteúdo em
todos os slides.
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
Projetos de Data Science & Analytics no GitHub

3
Git

• Software utilizado para o controle de versões

• Registra as alterações feitas nos arquivos

• Vamos utilizá-lo em conjunto com o Github

• Para instalar o Git no computador, siga o tutorial disponibilizado

4
Github

• Site utilizado para hospedar os arquivos

• Organizado em repositórios (pastas) que podem ser compartilhados


e, inclusive, podem ser publicados

• Útil para armazenar e compartilhar seu portfólio de projetos

• Os arquivos do computador podem ser enviados ao Github (pelo Git)

5
Git: configuração inicial

• Na primeira vez em que utiliza o Git, há um cadastro inicial

• Crie uma pasta na área de trabalho de seu computador


• Dentro da pasta, com o botão direito do mouse, acesse Git Bash Here

• Faça o seguinte comando e clique enter


• git config --global user.email “seu email”

• Na sequência, faça o seguinte comando e clique enter


• git config --global user.name “seu nome”

6
Git e Github

• Add e Commit

• Abra o RStudio, crie um novo script e escreva apenas # Versão 1


• Salve este arquivo na pasta com o nome Exemplo.R
• Dentro da pasta, com o botão direito do mouse, acesse Git Bash Here
• No Git, escreva git init (inicializa o Git na pasta selecionada)
• Na sequência, troque para a seguinte branch: git branch -M main
• Escreva git add 'Exemplo.R' (adiciona o arquivo para o índice)
• Para gerar versões utilize o comando git commit -m 'título' (são as versões)
O nome do commit, exemplo: 'Primeira_Versão'

7
Git e Github

• Push

• Em seu Github, crie um novo repositório e nomeie como preferir


• Copie o link do repositório criado
• No Git, escreva git remote add origin link de sua pasta
• Por fim, digite git push -u origin main (envia o arquivo para o repositório,
ficando na ramificação principal)

• Na primeira vez que for feito, solicitará a conexão inicial com o Github!

• Após atualizar, é possível verificar que o arquivo já está em seu Github!

8
Git e Github: conexão inicial

• Caso seja a primeira vez que utiliza o Git, há um login

9
Git e Github: conexão inicial

• Opção 1: Autenticando por meio do browser

10
Git e Github: conexão inicial

• Opção 2: Autenticando por meio de código

Insira o código Autorize e, na


fornecido neste link sequência, informe
e avance a senha do GitHub

11
Git e Github

• Criando e comparando versões

• Abra o arquivo Exemplo.R e escreva mais uma linha: # Versão 2


• Após salvar, feche e com o botão direito abra Git Bash Here na pasta
• Utilize os mesmos procedimentos:

• git add 'Exemplo.R' Note que não foi


necessário informar
• git commit -m 'Segunda_Versão' novamente o endereço
• git push -u origin main

• No Github, a nova versão já está disponível e podemos compará-las!


12
Git e Github

• Criando ramificações no repositório

• Nos comandos anteriores, alteramos a ramificação principal do repositório


• Poderíamos criar ramificações novas no Github
nova é o nome
• git checkout -b 'nova' que demos para
• No Git, já há a indicação de mudança da “main” para a “nova” a branch

• Abra o arquivo Exemplo.R e escreva mais uma linha: # Versão 3


• git add 'Exemplo.R'
• git commit -m 'Terceira_Versão'
• git push -u origin nova
13
Git e Github

• Importando repositórios (Clone e Pull)

• Pode ser útil trazer para seu computador arquivos que estão no Github
• Uma forma de “baixar” tais arquivos é por meio da função clone

• Crie uma pasta em seu computador


• Dentro da pasta, com o botão direito do mouse, abra o Git Bash Here
• No Github, no repositório de interesse, clique em code e copie o link
• No Git, digite git clone link do repositório
• Para baixar novamente, após alterações no Github, indique cd 'repositório'
• Na sequência, digite git pull (o arquivo foi atualizado no computador)
14
Git e Github

• Importando repositórios (Clone e Pull)

• Também podemos fazer o pull de outras branches

• Digite: git branch -a (mostra as branches disponíveis)


• Na sequência: git checkout 'nome da outra branch'
• Para realizar o pull da outra branch: git pull

• Note que os arquivos mudaram na pasta em seu computador

15
Git e Github

• Copiando repositórios públicos (Fork)

• É possível copiar repositórios que estão publicados no Github

• Procure por algum tema de interesse


• Acesse o repositório
• No canto superior direito, existe o botão Fork
• Após clicar, poderá ver o repositório em sua lista (em seu perfil)

16
Git, Github e RStudio

• É possível integrar o Git, Github e RStudio

• No RStudio, clique em File → New Project → Version Control → Git

• Em “Repository URL” basta indicar o link do repositório no Github

• Após criar um documento (R Script, R Markdown), clique em Git e


faça o commit e, em seguida, o push

• Também é possível fazer o pull dos arquivos do repositório que foi indicado
17
Criação de Projects e Scripts R Markdown

18
R Markdown

• Introdução ao R Markdown
• Formatação básica do texto
• Inserção de fórmulas
• Chunks
• Gerando outputs (HTML; PDF, DOC)

• Material para referência:

• https://rmarkdown.rstudio.com/index.html

19
OBRIGADO!
linkedin.com/in/wilson-tarantin-junior-359476190/

20
ÁRVORES, REDES E ENSEMBLE
MODELS I
João F. Serrajordia R. de Mello
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Apresentação
João Fernando Serrajordia Rocha de Mello – (Juka)

Trajetória profissional

Modelagem de crédito em grandes bancos Docência em ciência de dados


Telecom Consultoria em ciência de dados
Desenvolvimento de modelos / Validação de modelos Outsourcing executivo

Acadêmico

IME

3
O que vamos
aprender?
• Árvores de decisão
• Ensemble
• Bagging (Random Forest)
• Boosting (Gradient Boosting)
• Princípios de validação
cruzada
• Introdução a Redes Neurais

4
Agenda de
hoje
• Conceituação
• Árvores de decisão
• Aplicações
• O que é, como roda etc...
• Detalhes operacionais (base etc.)
• Algoritmo
• Como avaliar?
• Problemas comuns

5
Vamos discutir...
O que é aprendizado de máquina
(o machine learning)?

6
O que é Machine
Learning?
• É um ramo da Inteligência Artificial?
• Calma... O que é Inteligência Artificial
afinal de contas?

7
Definição mais ‘mundana’

Senso comum:
Inteligência artificial é a área que estuda a implementação de atividades realizadas
por máquinas, que anteriormente eram realizadas por humanos.

Dicionário Oxford:
“the theory and development of computer systems able to perform tasks that
“a teoria
normally e o desenvolvimento
require de sistemas
human intelligence, computacionais
such as visual perception,capazes de executar
speech recognition,
tarefas que normalmente
decision-making, requerem
and translation betweeninteligência humana, como percepção visual,
languages.”
reconhecimento de fala, tomada de decisão e tradução entre idiomas.”

8
Definição do MIT
• “A inteligência artificial é a capacidade dos
computadores de imitar funções cognitivas
humanas, como aprendizado e solução de
problemas. Por meio da IA, um sistema de
computador usa matemática e lógica para simular
o raciocínio que as pessoas usam para aprender
com novas informações e tomar decisões.”
https://mitsloan.mit.edu/

9
Definição acadêmica

• “We define AI as the study of agents


that receive percepts from the
environment and perform actions.”
Artificial Intelligence: a modern
approach, de Stuart Russell e Peter
Norvig

“Definimos IA como o estudo de


agentes que recebem percepções do
ambiente e realizam ações.”
http://aima.cs.berkeley.edu/

10
Vamos discutir...
E o que é aprendizado de máquina…?

11
11
Aprendizado de
máquina
• Jake Van Der Plas:
• Ajuda mais pensar no machine learning
como uma forma de construir modelos
sobre dados.
• Envolve a construção de modelos
matemáticos para entender dados.
• O “aprendizado” entra na possibilidade de
se obter parâmetros reguláveis que podem
ser adequados aos dados observados.

https://jakevdp.github.io/PythonDataScience
Handbook/05.01-what-is-machine-
learning.html

12
Você vai precisar de...

Preparativos

• Abrir o R
• Importar as bibliotecas
• Planilha eletrônica
• Algo para fazer suas anotações

13
Árvores de
decisão

14
Árvores de decisão:

Onde vivem?

O que são?

O que comem?

Predadores naturais

15
Aplicações

Qual a eficácia de uma vacina? O cliente vai pagar o empréstimo? Quanto de petróleo tem no poço?

O cliente vai comprar meu produto? O que a pessoa está fazendo? Quão ecológico esse veículo é?

16
CRISP-DM

Fonte: https://www.the-modeling-agency.com/crisp-dm.pdf
17
Modelos preditivos

Como é isso?

18
Desenho de safra (ou coorte)
Ponto de observação
(data de referência)

tempo

Período de coleta Período de performance

Exemplo de desenho amostral para modelo preditivo

19
Estrutura da base de dados

Cada coluna é uma variável

ID_cliente Idade Renda Tempo de emprego Negativado_Bureau ... Inadimplente_em_12m


2914901 60 75579 10 0 ... 0
Cada linha
5003858 25 33495 2 0 ... 1
representa uma
8309347 51 59908 9 0 ... 1
observação
4637814 46 53470 10 0 ... 0
7203409 65 69822 1 0 ... 1

20
Desenho amostral

Informações disponíveis ANTES da decisão.

tempo

ID_cliente Idade Renda Tempo de emprego Negativado_Bureau ... Inadimplente_em_12m


2914901 60 75579 10 0 ... 0
5003858 25 33495 2 0 ... 1
8309347 51 59908 9 0 ... 1
4637814 46 53470 10 0 ... 0
7203409 65 69822 1 0 ... 1

21
Desenho amostral

Informação disponível DEPOIS da decisão

tempo

ID_cliente Idade Renda Tempo de emprego Negativado_Bureau ... Inadimplente_em_12m


2914901 60 75579 10 0 ... 0
5003858 25 33495 2 0 ... 1
8309347 51 59908 9 0 ... 1
4637814 46 53470 10 0 ... 0
7203409 65 69822 1 0 ... 1

22
Previsão do modelo - treinamento

𝑃𝐷 = 𝐹(𝑋1, 𝑋2, … 𝑋𝑛)


Previsão – probabilidade
de inadimplência
ID_cliente Idade Renda Tempo de emprego Negativado_Bureau ... Inadimplente_em_12m Prob(Inad_12)
6046023 63 44095 7 1 ... 1 64,2%
6953168 45 47550 8 1 ... 1 63,3%
8529261 58 89313 7 1 ... 1 71,3%
1281888 42 58532 7 0 ... 0 15,3%
4540759 37 80840 2 0 ... 1 86,7%

23
Previsão do modelo - aplicação

Informação disponível DEPOIS da decisão

tempo
Hoje
ID_cliente Idade Renda Tempo de emprego Negativado_Bureau ... Inadimplente_em_12m Prob(Inad_12)
2064492 57 78774 10 0 ... 0 26,4%
8858083 63 99559 4 1 ... 0 39,4%
6937124 41 49791 2 0 ... 1 93,6%
7352807 42 15314 8 0 ... 0 34,1%
5088775 31 73199 4 0 ... 1 97,4%

Na aplicação, não temos a marcação de inadimplência, mas temos a probabilidade dada pelo modelo.
Essa é a PREVISÃO do modelo.

24
Desenho clássico

• E se o mês de observação sofre


algum efeito sazonal como final de
ano etc?
• Para isto, se faz de observar 12
meses de referência diferentes
(chamados de “safras” ou “coortes”)

25
Desenho do modelo

Desenho clássico:

12 a 15 safras / coortes
12 meses de desempenho

26
Árvores de decisão:

Onde vivem?

O que são?

O que comem?

Predadores naturais

27
Classificação dos algoritmos

Paradigma Paradigma
Machinelârnico Estatístico
- Árvores de decisão
- Regressão
- Bagging
- GLM
- Boosting
- GLMM
- K-NN
- ANOVA
- Redes Neurais
- Support Vector Machines

Estamos aqui!

28
Machine • Machine learning • Paradigma
• Apenas busca padrões estatístico
learning vs nos dados • Supõe estrutura
• Busca que sejam probabilística
estatística generalizáveis • Avalia as suposições
• Mede o erro de forma • Faz inferência
pragmática

29
Classificação dos algoritmos

Supervisionados Não supervisionados


- Regressão
- K-Means
- GLM
- Métodos hierárquicos
- GLMM
- Mistura Gaussiana
- Support vector machines
- DBScan
- Naive Bayes
- Mini-Batch-K-Means
- K-nearest neighbors
- Redes Neurais
- Decision Trees

Estamos aqui!

30
Classificação dos algoritmos

Resposta contínua Resposta discreta


- Regressão
- Regressão logística
- GLM
- Classification trees
- GLMM
- Redes Neurais
- Support vector machines
- GLM
- K-nearest neighbors
- GLMM
- Redes Neurais
- Regression Trees

Estamos aqui!

31
Nosso problema: classificar sobreviventes
Imagem: https://commons.wikimedia.org/wiki/File:Sea_Trials_of_RMS_Titanic,_2nd_of_April_1912.jpg
32
32
Reflexões sobre a base de dados

População Amostra

• ~ 2.200 pessoas • 891 pessoas


• ~ 1.300 passageiros • 549 não sobreviventes
• Mais de 1.500 mortos • 342 sobreviventes

33
Objetivos do algoritmo
de Machine Learning
• Classificar da melhor forma possível a variável
resposta
• ... Através de segmentações
• ... Usando as variáveis explicativas
• Obter insights
• ... Das relações entre a variável resposta e as
explicativas
• ... Explorar interações
34
OMML1_script01-Primeiro_contato_com_arvores.R

35
O que é uma árvore de decisão?

A árvore de decisão é:

Uma sequência de segmentações binárias Taxa de sobreviventes


Que visa homogeneidade da variável resposta
% da amostra

36
O que é uma árvore de decisão?

Inicialmente temos 891 passageiros dos quais


342 sobreviveram (38%)
549 não sobreviveram

37
O que é uma árvore de decisão?

Dos 891, podemos segmenta-los em:

577 homens (65%) dos quais


109 sobreviveram (19%)
468 não sobreviveram

314 mulheres (35%) das quais


233 sobreviveram (74%)
81 não sobreviveram

38
O que é uma árvore de decisão?

Dos 891, podemos segmenta-los em:

577 homens que por sua vez segmentamos em:

24 crianças (< 6,5 anos) das quais


16 sobreviveram (67%)
8 não sobreviveram

533 adultos (>=6,5 anos) dos quais


93 sobreviveram (17%)
553 não sobreviveram

39
O que é uma árvore de decisão?

E assim continuamos a “requebrar” a amostra


até ”não valer a pena” fazer mais quebras.

40
Vamos experimentar??

Vamos classificar este garoto:

41
Vamos experimentar??

Vamos classificar este pobre homem:

42
Vamos experimentar??

Vamos classificar este rico senhor:

Taxa de sobreviventes

% da amostra

43
Vamos experimentar??

Vamos classificar este rica senhora:

Taxa de sobreviventes

% da amostra

44
Vamos experimentar??

Vamos classificar esta pobre moça:

Taxa de sobreviventes

% da amostra

45
Árvores de decisão:

Onde vivem?

O que são?

O que comem?

Predadores naturais

46
Qual é ‘melhor’?

47
E agora?

48
Medida de “informação”
• Precisamos de uma métrica para ajudar a decidir qual variável agrega
mais informação.
• Vamos dizer que se todas as observações são idênticas em um grupo,
esse grupo tem “pureza” total.
• Quanto mais heterogêneo o grupo, maior será a “impureza”.
• Vamos então definir quantitativamente o que é “impureza”:

49
Definições de impureza

• Gini

• Entropia de Shannon

Como a árvore encontra a melhor quebra?


Com uma métrica de ‘impureza'

50
Índice de Gini
𝐽

𝐼𝑔 𝑝 = 1 − ෍ 𝑝𝑖2
𝑖=1

- Impureza máxima com distribuição uniforme


- Impureza mínima na concentração total

51
Entropia
𝐽

𝐻 = − ෍ 𝑝𝑖 log 2 (𝑝𝑖 )
𝑖=1

Ganho de informação:

𝐺𝐼(𝑇, 𝑎) = 𝐻(𝑇) − 𝐻(𝑇|𝑎)

- Impureza máxima com distribuição uniforme


- Impureza mínima na concentração total

52
Algoritmo básico
1. Para cada variável, buscar a melhor regra binária
2. Escolher aplicar melhor segmentação dentre todas as variáveis
3. Recursivamente, para cada folha, repetir os passos 1 e 2 até que
uma regra de parada seja atingida

Implementação web interativa:

https://rawgit.com/longhowlam/titanicTree/master/tree.html

53
Hiperparâmetros
São parâmetros que controlam o algoritmo como:
1. Número mínimo de observações por folha
2. Profundidade máxima
3. CP – Custo de complexidade

54
Custo de complexidade

Custo de
Baixo Médio Alto
Complexidade
Complexidade
Alta Média Baixa
resultante
55
Over fitting / Under fitting

http://mlwiki.org/index.php/Overfitting

56
Cross validation
Amostra total disponível Amostra
de treino
O modelo é desenvolvido aqui

Amostra de Teste O modelo é avaliado aqui

A estratégia mais simples é dividir a base em treino e teste.


Desenvolvemos o modelo na base de treino e avaliamos na base de teste.

57
Árvores de decisão:
5 1
0 9 8-
Onde vivem? 73 .
5 .2
31
sh ida
O que são?
Yoi
u shO que comem?
Ats
elo
ar c Predadores naturais
M

58
O que é
Como evitar

59
Overfitting
• Overfitting é o fenômeno do
modelo se ajustando a
características muito particulares
de amostra que não se repetirão
em outras amostras.

• Isso implica que a qualidade do


modelo poderá ser bem menor na
aplicação do modelo.

60
A árvore como um classificador

Requisitos:
Ter todas as variáveis.

61
A árvore como um classificador

Probabilidade de evento da folha F:

𝑁𝑓𝑠
𝑃 𝑆|𝐹 =
𝑁𝑓

P(S|F) - probabilidade de sucesso da folha F

𝑁𝑓 - é o número de indivíduos na folha F


𝑁𝑓𝑠 - é o número de sobreviventes na folha F

62
A árvore como um classificador
Classificação:
Classificação padrão:

Sobrevivente: 𝑃 𝑆 𝐹 ≥ 50% ⟹ 𝐶 𝐹 = “𝑌”


Não sobreviventes: 𝑃 𝑆 𝐹 < 50% ⟹ 𝐶 𝐹 = “𝑁”

Valor Valor Verdadeiro


predito 0 1

0 484 96
1 65 246

63
Avaliação do modelo

• Acurácia:

Acertos sobre tentativas

Valor Valor Verdadeiro


predito 0 1

0 484 96
1 65 246

No exemplo:
484 + 246
= 82%
891

64
Árvore como diagnóstico
𝑇𝑃 246
Sensitividade: 𝐹𝑁+𝑇𝑃 = 246+96 = 72%

𝑇𝑁 484
Especificidade: 𝑇𝑁+𝐹𝑃 = 484+65 = 72%

Valor Valor Verdadeiro Valor Valor Verdadeiro


predito 0 1 predito 0 1

0 484 96 0 TN FN
1 65 246 1 FP TP

65
Diagnóstico e pontos de corte

Corte TP FP TN FN Acurácia Especificidade 1-Especificidade Sensibilidade


0% - 11,1% 342 549 0 0 38% 0% 100% 100%
11,1% - 11,5% 339 525 24 3 41% 4% 96% 99%
11,5% - 35,8% 289 142 407 53 78% 74% 26% 85%
35,8% - 58,9% 246 65 484 96 82% 88% 12% 72%
58,9% - 66,7% 177 17 532 165 80% 97% 3% 52%
66,7% - 94,7% 161 9 540 181 79% 98% 2% 47%
94,7% - 100% 0 0 549 342 62% 100% 0% 0%

Para cada ponto de corte, temos uma matriz de confusão.


No caso, temos 8 possíveis matrizes com a árvore treinada.

66
Curva ROC
Corte 1-Especificidade Sensibilidade 120%

0% - 11,1% 100% 100% 100%

Sensitividade
11,1% - 11,5% 96% 99% 80%
11,5% - 35,8% 26% 85% 60%
35,8% - 58,9% 12% 72% 40%
58,9% - 66,7% 3% 52% 20%
66,7% - 94,7% 2% 47%
0%
94,7% - 100% 0% 0% 0% 20% 40% 60% 80% 100% 120%
1-Especificidade

A curva ROC é um gráfico de dispersão de 1-Especificidade no eixo x por Sensibilidade no eixo y, obtidos
para cada possível ponto de corte do classificador.

67
OMML1 _script02-Algoritmo_avaliacao_overfitting

68
Exercício para casa
script03

69
OMML1_script03_Exercício para casa

70
Conclusão

• Robustas, interpretáveis, flexíveis


• Sem suposições probabilísticas
• Necessário cross-validation

71
72
linkedin.com/in/joao-serrajordia

73
Algoritmos famosos
• CART
• CHAID
• ID3
• C4.5
• C5.0

Stack overflow interessante sobre isso:


https://stackoverflow.com/questions/9979461/different-decision-tree-algorithms-with-comparison-of-complexity-or-performance

74
Na próxima aula...
Técnicas de validação cruzada

75
Extras
76
OMML1 _script02-Algoritmo_avaliacao_overfitting

77
Poda da árvore (Prunning)

78
Estratégias de cross validation

79
K-fold Remove da amostra de treino

Classifica o elemento removido inicialmente

Desenvolve o modelo com os demais

- Dividimos a base em k sub-amostras


- Para cada sub-amostra:
- Removemos a sub-amostra como validação
- Treinamos o modelo com as observações restantes
- Utilizamos este modelo para classificar a sub-amostra removida
- Avaliamos a métrica de desempenho do modelo
- Calculamos a média das métricas de desempenho do modelo
80
K-fold

81
Post-prunning com crossvalidation

printcp(arvore)

O R faz a poda da árvore realizando um k-fold para otimizar o CP (complexity path), um parâmetro que
sumariza a complexidade da árvore. Isso é feito com um k-fold.

82
OBRIGADO!
linkedin.com/in/joao-serrajordia/

83
ÁRVORES, REDES E ENSEMBLE
MODELS II
João F. Serrajordia R. de Mello
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Você vai precisar de... Preparativos

• Abrir o R
• Importar as bibliotecas
• Algo para fazer suas anotações

3
Recapitulando
rapidamente

4
Vimos conceitos...

• Machine learning

• IA

• Paradigma machinelârnico

• Nomenclaturas
5
Vimos o conceito de árvores

Vamos classificar este rico senhor:

Taxa de sobreviventes

% da amostra

6
Falamos sobre overfitting

http://mlwiki.org/index.php/Overfitting

7
Vimos Cross validation
Amostra total disponível Amostra
de treino
O modelo é desenvolvido aqui

Amostra de Teste O modelo é avaliado aqui

A estratégia mais simples é dividir a base em treino e teste.


Desenvolvemos o modelo na base de treino e avaliamos na base de teste.

8
Avaliamos a árvore
Corte 1-Especificidade Sensibilidade 120%

0% - 11,1% 100% 100% 100%

Sensitividade
11,1% - 11,5% 96% 99% 80%
11,5% - 35,8% 26% 85% 60%
35,8% - 58,9% 12% 72% 40%
58,9% - 66,7% 3% 52% 20%
66,7% - 94,7% 2% 47%
0%
94,7% - 100% 0% 0% 0% 20% 40% 60% 80% 100% 120%
1-Especificidade

A curva ROC é um gráfico de dispersão de 1-Especificidade no eixo x por Sensibilidade no eixo y, obtidos
para cada possível ponto de corte do classificador.

9
Exercício

AREM2_exercicios_para_casa_da_aula_anterior.R
10
Agenda Exercícios

Árvores de regressão

Técnicas de validação cruzada

Bagging – Random Forest

Boosting – Gradient Boosting

Grid Search CV

11
Árvores de regressão
12
São muito semelhantes a
árvores de classificação

Árvores de O que muda é o critério de


impureza
regressão
𝑵

𝑺𝑸𝑬 = ෍ 𝒚𝒊 − 𝒚ෝ𝒊 𝟐

𝒊=𝟏

13
Árvores de regressão

14
E a impureza?

15
AREM2_script01_Regression_Tree.R

16
Cross validation

17
Objetivos

Escolher valores Ter expectativa


para os melhor da
hiperparâmetros qualidade (e.g. AUC)
(tunning) em outras bases

18
Ideia básica
1. Dividir a base em treino e teste
2. Rodar o modelo com uma configuração de hiperparâmetros na base
de treino
3. Avaliar o modelo na base de testes
4. Alterar a configuração e repetir os passos 2 e 3

Será que uma escolha particular da base de treino e teste pode


favorecer uma determinada configuração?

19
Poda da árvore (Prunning)

20
Estratégias de cross validation

21
K-fold Remove da amostra de treino

Classifica o elemento removido inicialmente

Desenvolve o modelo com os demais

- Dividimos a base em k sub-amostras


- Para cada sub-amostra:
- Removemos a sub-amostra como validação
- Treinamos o modelo com as observações restantes
- Utilizamos este modelo para classificar a sub-amostra removida
- Avaliamos a métrica de desempenho do modelo
- Calculamos a média das métricas de desempenho do modelo

22
K-fold

23
Post-prunning com crossvalidation

printcp(arvore)

O pacote rpart faz a poda da árvore realizando um k-fold para otimizar o CP (complexity path), um
parâmetro que sumariza a complexidade da árvore. Isso é feito com um k-fold.

24
K-fold no rpart

O “K” do K-fold

25
Modelos Ensemble:

Onde vivem? O que são?

O que comem?

Predadores naturais

26
Problemas de preditivos e de classificação

Qual a eficácia de uma vacina? O cliente vai pagar o empréstimo? Quanto de petróleo tem no poço?

O cliente vai comprar meu produto? O que a pessoa está fazendo? Quão ecológico esse veículo é?

27
CRISP-DM

Fonte: https://www.the-modeling-agency.com/crisp-dm.pdf
28
Classificação dos algoritmos

Supervisionados
- Regressão
- GLM Não supervisionados
- GLMM
- Support vector machines - K-Means
- Naive Bayes - Métodos hierárquicos
- K-nearest neighbors - Mistura Gaussiana
- Redes Neurais - DBScan
- Decision Trees - Mini-Batch-K-Means

Estamos aqui!

29
Classificação dos algoritmos

Algoritmos de regressão
Algoritmos de classificação
- Regressão
- GLM - Regressão logística
- GLMM - Classification trees
- Support vector machines - Redes Neurais
- K-nearest neighbors - GLM
- Redes Neurais - GLMM
- Regression Trees

Estamos aqui!

30
Classificação dos algoritmos

Paradigma Paradigma
machine learning estatístico
- Árvores de decisão
- Regressão
- Bagging
- GLM
- Boosting
- GLMM
- K-NN
- ANOVA
- Redes Neurais
- Support Vector Machines

Estamos aqui!

31
Ensemble
Um ensemble é qualquer mistura de modelos já existentes.
Os principais tipos são:

Bagging

Boosting

Stacking

32
Bagging é um aggregation
Mas o que é um agregation oras...

33
Ensemble - aggregation
Modelo 1 Modelo 2 Modelo 3

Um aggregation consiste em uma combinação (em geral uma média simples) das previsões de dois ou
mais modelos previamente construídos.

Objetivo: ainda que cada modelo seja um “weak learner”, a combinação pode ser um “Strong learner” ou
um preditor melhor que cada um dos integrantes.

34
Ensemble – Hard Voting
Modelo 1 Modelo 2 Modelo 3

Classificação mais ‘votada’


35
Ensemble - aggregation
Modelo 1 Modelo 2 Modelo 3

P( | ) = 3% P( | ) = 7% P( | ) = 2%

P( | ) = 4%

Um método de agregação simples mas poderoso consiste em obter a média de várias previsões.

36
Ensemble - aggregation

Queremos agregar modelos que sejam:

Úteis

Mirem no mesmo alvo

Diferentes

Queremos preditores diferentes, mas que “apontem” para a mesma variável resposta. Uma ideia seria
gerar preditores com alguma ‘perturbação’ aleatória.

37
Bootstrapping para avaliar a média

E se ao invés de alterar o algoritmo, alterarmos a base usando o mesmo algoritmo?

38
Bootstrapping para avaliar a média

𝑋ത1

Temos um conjunto de dados de tamanho N

Queremos estimar o erro padrão de um


parâmetro, por exemplo, a média.

1) Retirar uma amostra aleatória de tamanho N da base


2) Calcular o parâmetro, armazenar a informação

39
Bootstrapping para avaliar a média

𝑋ത1
𝑋ത2 𝑋ത
... ത
𝐷𝑒𝑠𝑣𝑃𝑎𝑑(𝑋)
𝑋ത𝑀

3) Repetimos isso M vezes (digamos... M=10.000 vezes)


4) Podemos calcular a média e o erro padrão do estimador

40
AREM2_script02_bootstrapping.R

41
Bootstrap – aggregation (bagging)
Modelo 1
𝑃෠1
Modelo 2
𝑃෠2
...
𝑃ത෠
Modelo M
𝑃෠𝑀

Bagging é um agregation do mesmo algoritmo em amostras bootstrap

42
Bootstrap – aggregation (bagging)
Árvore 1
𝑃෠1
Árvore 2
𝑃෠2
...
𝑃ത෠
Árvore M
𝑃෠𝑀

O bagging com árvores é o famoso Random Forest

43
Random Forest

44
OMML2_script03_bagging_v2.R

45
Bagging e Pasting
Bagging Pasting
1. Retirar uma amostra aleatória com 1. Retirar uma amostra aleatória SEM
reposição de tamanho N reposição de tamanho Q<N
2. Construir o modelo nessa amostra 2. Construir o modelo nessa amostra
3. Repetir 1 e 2 M vezes 3. Repetir 1 e 2 M vezes

O bagging mais famoso é Random Forest, que é feito com árvores, daí o nome.

46
Características
Bagging
1. Roda em paralelo
2. Também classifica em paralelo
3. Costuma ter bom desempenho sem grandes ajustes

Se ele fosse um carro, eu diria que é um GMC Hummer H3.

47
Perguntas que eu tinha quando aprendi
Random Forest
1. O default é fazer 500 árvores?
2. Demora muito para treinar?
3. E para aplicar a regra? Tenho que aplicar tudo isso de regra?
Demora?
4. O algoritmo guarda tudo isso de árvore?

Se ele fosse um carro, eu diria que é um GMC Hummer H3.

48
Boosting
Correção sequencial de erros

49
A variável resposta de A variável resposta de
uma iteração é o ’erro’ da uma iteração é o ’erro’ da
anterior. anterior.

• Os métodos de boosting são modelos sequenciais


Boosting que tentam melhorar o erro do modelo anterior

50
Gradient • O Gradiente Boosting é uma variação baseada em árvores
com alguns hiperparâmetros que controlam o algoritmo
Boosting

51
52
“Estique a corda demais e

Learning rate ela arrebenta, deixe-a


muito frouxa, e o
instrumento não toca"
53
Learning rate

O Learning Rate diminui o impacto de cada iteração


costuma demandar mais iterações,
mas ajuda a alcançar melhores resultados

54
Nome curto para Extreme
Gradient Boosting

É uma implementação do
Gradient Boosting

Possui interfaces para R e Python


XGBoosting
Ficou famosa por ser usada por
vencedores de competições

Criado por Tianqi Chen

55
56
O que fazer com meus
novos superpoderes?
• Sugestões de prática além da aula:
• Tentar classificar atividade humana
por acelerômetro e giroscópio de
celular
https://archive.ics.uci.edu/ml/datas
ets/human+activity+recognition+usi
ng+smartphones
• Identificar doença cardíaca
https://archive.ics.uci.edu/ml/datas
ets/Heart+Disease

57
Conclusões

• Árvores são só o começo


• Há INFINITAS formas de combinar
modelos, essas são as mais famosas
• Esses modelos são difíceis de se
interpretar
• O cross-validation ‘entra no lugar’ do
stepwise
• PRATIQUE!

58
linkedin.com/in/joao-serrajordia

59
OBRIGADO!
linkedin.com/in/joao-serrajordia/

60
ÁRVORES, REDES E ENSEMBLE
MODELS III
João F. Serrajordia R. de Mello
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Você vai precisar de... Preparativos

• Abrir o R
• Importar as bibliotecas
• Algo para fazer suas anotações

3
Agenda Exercício I (gorjetas)

Exercício II (Imóveis)

Boosting

Grid Search CV

4
Introdução
Wrap-up

5
K-fold no rpart
Essa é a variável
resposta, é ela que
queremos “prever”

6
K-fold no rpart
Essas são as
variáveis
explicativas. É com
elas que vamos
Fazer as
“previsões”

7
K-fold no rpart
O Data Frame de
treino é indicado
aqui

8
K-fold no rpart
Esse método indica
que a nossa variável
é qualitativa (no
caso, as opções são
sobreviveu = SIM ou
NÃO)

9
K-fold no rpart O RPART tem
implementado o K-fold
como método de
validação cruzada.

Esse parâmetro é o “K”


do k-fold.

10
K-fold no rpart Este parâmetro espera
um objeto especial,
definido pela função
rpart.control. Esse
objeto especial define
algumas opções do
algoritmo.

11
Esta função é do
K-fold no rpart pacote rpart. Há outros
hiperparâmetros
parametrizados. Para
mais informações,
consulte o help
rodando ?rpart.control
no console.

12
K-fold no rpart
Este é o custo de
complexidade. Quanto
maior for esse valor,
mais simples será a
árvore.

13
Este hiperparâmetro
K-fold no rpart indica quantas
observações devem
haver como mínimo
para se procurar uma
quebra. Ele é um
critério de parada do
algoritmo.

14
K-fold no rpart
Este hiperparâmetro
indica a profundidade
máxima que a árvore
pode ter. Outro critério
de parada.

15
Introdução
Caso Cambridge Analytica

16
Cambridge Analytica

Dados de 50.000
Faça seu teste de usuários “voluntários” Algoritmo de
personalidade! ☺ classificação de
personalidades

Influência de 87 milhões de
comportamento usuários

17
Exercício
TIPS

18
Exercício

AREM3_script01_Ex1_aula_anterior.R
19
Exercício I – comportamento de gorjeta

Queremos entender o
comportamento de
pagamento de gorjetas em
mesas de restaurante.

Será que há uma


estratégia ótima na
escolha do atendimento
de mesas/turnos?

20
A base
Total_bill: Total da conta
Time: Dia da semana
Tip: Gorjeta
Day: Almoço ou jantar
Sex: Sexo da pessoa que atende a mesa
Size: Quantidade de pessoas na mesa
Smoker: Indica se há fumantes na mesa

21
Primeira inspeção na variável resposta
O percentual da gorjeta
parece se concentrar entre 10
e 25%.

Há um valor discrepante na
casa dos 250%.

22
O problema com o outlier
𝑛
𝑆𝑆𝐸 = ෍ 𝑦𝑖 − 𝑦ො𝑖 2
𝑖=1

Como a nossa métrica de


impureza tem um termo ao
quadrado, valores
discrepantes podem ter
impacto muito grande.

23
O problema com o outlier

Eliminando o outlier:

tips <- tips[tips$pct_tip<1,]

Ainda restam pontos


afastados, mas não são tão
aberrantes, vamos mantê-los
na base.

24
Etapa descritiva

Aparentemente garçonetes
ganham mais gorjeta que
garçons, mas a diferença é
pequena se considerarmos a
variabilidade.

25
Etapa descritiva

No geral, mesas de fumantes e


não fumantes parecem pagar
gorjeta igualmente

26
Etapa descritiva

A maioria das mesas está entre


2 e 4.

As diferenças não são muito


grandes considerando a
variabilidade.

27
Etapa descritiva

O valor da conta é uma variável


contínua. Para analisar as
médias, vamos dividi-la em
faixas com a função quantcut.

O percentual da gorjeta parece


cair quanto maior o valor da
conta.

28
Etapa 2: treinar o modelo
# 2) treinar a árvore (não incluir o valor da gorjeta como explicativa)
arvore_reg <- rpart::rpart(pct_tip ~ sex
+ smoker
+ day
+ time
+ size,
data=tips,
xval=10,
control = rpart.control(cp = 0,
minsplit = 2,
maxdepth = 2)
)

29
Etapa 2: treinar o modelo
• Ao treinar o modelo, o R define as regras da árvore conforme o
algoritmo.
• Todas as informações da árvore, regras, valores de CP,
hiperparâmetros e outras informações são guardados no objeto
retornado
• Usaremos esse objeto retornado para realizar ações como calcular
previsões, e análises como plotar a árvore.

30
Visualizando a árvore
paleta <- scales::viridis_pal(begin=.75, end=1)(20)
#Visualizar a árvore
plot <- rpart.plot::rpart.plot(arvore_reg,
box.palette = paleta)

R-quadrado = 6,8%

A árvore que estamos


plotando está neste
objeto

31
Etapa 3: Tunando a árvore
• Vamos fazer uma árvore grande com o rpart
• O rpart já implementa pra nós um cross validation (k-fold)
• A função cptable do rpart nos dá os valores de cp (complexidade do
caminho) para todos os nós da árvore
• Vamos escolher o cp que minimiza o erro na validação cruzada e
treinar a árvore novamente.

32
Etapa 3: treinar uma árvore grande
Não vamos
arvore_grande <- rpart::rpart(pct_tip ~ sex restringir o
+ smoker tamanho da
árvore nesse
+ day passo
+ time
+ size,
data=tips,
xval=10,
control = rpart.control(cp = 0,
minsplit = 2,
maxdepth = 30)
)

33
Etapa 3: obtendo o CP ótimo
# Calcular o R-quadrado
metricas(predict(arvore_grande, tips), tips$pct_tip)

# Vamos achar o hiperparâmetro ótimo para o CP:


# Esta linha guarda todos os valores de CP para cada folha da árvore grande
tab_cp <- rpart::printcp(arvore_grande)
# Aqui uma visualização gráfica do CP vs erro em validação cruzada
rpart::plotcp(arvore_grande)
# Com esse comando vamos pegar o melhor CP na validação cruzada
cp_min <- tab_cp[which.min(tab_cp[,'xerror']),'CP']

34
Etapa 3: obtendo o CP ótimo

Neste problema, o erro


começa a aumentar logo
conforme aumentamos a
complexidade da árvore.

35
Etapa 3: Treinar a árvore tunada
arvore_tunada <- rpart::rpart(pct_tip ~ sex
+ smoker Cp_min é a variável que
+ day contém o menor valor
para o CP obtido no
+ time passo anterior
+ size,
data=tips,
xval=20,
control = rpart.control(cp = cp_min,
minsplit = 2,
maxdepth = 30)
)

36
Queremos ‘prever’ o valor médio de residências em
O problema Boston, de acordo com características da região

37
A base

Cada linha corresponde a uma região de Boston, cada coluna traz uma característica como índice de criminalidade,
percentual da região residencial, percentual industrial, média do número de quartos, etc.

38
As variáveis
• # CRIM: Taxa de criminalidade per capita por região.
• # ZN: Proporção de terrenos residenciais divididos em lotes com mais de 25.000 pés quadrados (cerca de 2.322 metros
quadrados).
• # INDUS: Proporção de acres não comerciais por cidade.
• # CHAS: indica se o imóvel faz fronteira com o rio Charles (1 se faz fronteira, 0 caso contrário).
• # NOX: Concentração de óxidos nítricos (partes por 10 milhões).
• # RM: Média de número de quartos por habitação.
• # AGE: Proporção de unidades ocupadas pelos proprietários construídas antes de 1940.
• # DIS: Distância ponderada até cinco centros de emprego em Boston.
• # RAD: Índice de acessibilidade a rodovias radiais.
• # TAX: Taxa de imposto sobre propriedades de valor total por $10.000.
• # PTRATIO: Razão aluno-professor por cidade.
• # B: 1000(Bk - 0.63)^2, onde Bk é a proporção de pessoas de origem afro-americana por cidade.
• # LSTAT: Porcentagem de status inferior da população.
• # MEDV: Valor mediano das residências ocupadas pelos proprietários em milhares de dólares. (variável de interesse)

39
Estratégia
• Neste exercício, vamos construir uma árvore, explorando o algoritmo
e depois vamos fazer o tunning da árvore
• Em seguida vamos fazer um Random Forest, e comparar os resultados

40
AREM3_script02_ex2_aula_anterior_RandomForest.R

41
Modelos Ensemble:

Onde vivem? O que são?

O que comem?

Predadores naturais

42
Ensemble
Um ensemble é qualquer mistura de modelos já existentes.
Os principais tipos são:

Bagging

Boosting

Stacking

43
Bagging
Características (revisão)

44
Ensemble - aggregation
Modelo 1 Modelo 2 Modelo 3

P( | ) = 3% P( | ) = 7% P( | ) = 2%

P( | ) = (3%+ 7%+ 2%)/3 = 4%

Vimos que o aggregation é um ensemble de modelos através da média das previsões.

45
Bootstrap – aggregation (bagging)
Modelo 1
𝑃෠1
Modelo 2
𝑃෠2
...
𝑃ത෠
Modelo M
𝑃෠𝑀

Vimos que o Bagging é um agregation do mesmo algoritmo em amostras bootstrap

46
Bootstrap – aggregation (bagging)
Árvore 1
𝑃෠1
Árvore 2
𝑃෠2
...
𝑃ത෠
Árvore M
𝑃෠𝑀

E que o Random Forest é um bagging com árvores

47
Random Forest – histórico
• Desenvolvido por Leo Breiman
• Surpreendeu ao próprio autor pela eficácia
• Possui versões posteriores com alterações
e hiperparâmetros novos

48
Random Forest hiperparâmetros
• Mtry – o número de variáveis sorteadas a cada passo
• Controla o número de id
1
x1
0,9
x2
0,9
x3
0,3
x4
0,1
x5
0
id
1
x1 x3 x5
0,6 0,8 0,5
colunas sorteadas 2 0,3 0,7 0,3 0,3 0,8 2 0,7 0,4 0,1

a cada passo. 3
4
0,5
0,6
0,3
0,4
0,1
0,8
0
0,6
0,3
0,9
3
4
0,4 0 0,6
0,6 0,9 0,1
5 0,5 0,1 0,1 0,7 0,1 5 1 0,4 0,3
6 0,8 0,4 0,1 0,7 0,9 6 0,9 0,4 0,9

• Subsample (variação) – o percentual da amostra no bootstrap


• Controla o número de id x1 x2 x3 x4 x5
linhas sorteadas a cada 1
2
0,7
0,8
0,1
0,8
0,8
0,8
0,1
0,9
0,1
0,8
id x1 x2 x3 x4 x5
1 0,7 0,1 0,8 0,1 0,1
passo. 3 0 0,8 0 0,7 0,3
3 0 0,8 0 0,7 0,3
4 0,6 0,1 1 0 0,6
6 0,5 0,2 0,7 0,4 0,7
5 0,2 0,3 0,6 0,5 0,6
6 0,5 0,2 0,7 0,4 0,7

49
Random Forest hiperparâmetros
• ntree – o número de árvores utilizadas

• Parâmetros de árvore
• Maxdepth, minsplit etc.

50
Stacking
Do que se trata?

51
Stacking
Modelo 1 Modelo 2 Modelo 3

O Stacking consiste na inserção de previsões de modelos diferentes como variáveis explicativas em um


novo modelo de Machine Learning. (não vamos aprofundar o stacking)

52
Boosting
Correção sequencial de erros

53
A variável resposta de A variável resposta de
uma iteração é o ’erro’ da uma iteração é o ’erro’ da
anterior. anterior.

• Os métodos de boosting são modelos sequenciais


Boosting que tentam melhorar o erro do modelo anterior

54
Gradient
Boosting

• O Gradiente Boosting um boosting baseado em árvores com


alguns hiperparâmetros que controlam o algoritmo

55
AREM3_script03_boosting_manual.R

56
“Estique a corda demais e
Tunnning ela arrebenta, deixe-a
muito frouxa, e o
instrumento não toca"
57
Nome curto para Extreme
Gradient Boosting

É uma implementação do
Gradient Boosting

Possui interfaces para R e Python


XGBoosting
Ficou famosa por ser usada por
vencedores de competições

Criado por Tianqi Chen

58
Gradient Boosting - variações
• Extreme Gradient Boosting (XGBoost)
• Uma variação do gradiente boosting
• Implementação de Tianqi Chen
• Ficou famosa por seu desempenho em
compedições

59
XGBoost - hiperparâmetros
• Nrounds – o número de árvores sequenciais

60
XGBoost - hiperparâmetros
• Gamma – redução mínima de perda
PERDA

Redução = 0,2

0,8

Se usa em geral valores de gamma entre 0 e 10.


O valor ótimo pode variar muito de um problema para outro.

61
XGBoost - eta

O Learning Rate diminui o impacto de cada iteração


costuma demandar mais iterações,
mas ajuda a alcançar melhores resultados

62
XGBoost - hiperparâmetros
• Colsample_bytree – o número de variáveis sorteadas a cada passo
• Controla o número de id
1
x1
0,9
x2
0,9
x3
0,3
x4
0,1
x5
0
id
1
x1 x3 x5
0,6 0,8 0,5
colunas sorteadas 2 0,3 0,7 0,3 0,3 0,8 2 0,7 0,4 0,1

a cada passo. 3
4
0,5
0,6
0,3
0,4
0,1
0,8
0
0,6
0,3
0,9
3
4
0,4 0 0,6
0,6 0,9 0,1
5 0,5 0,1 0,1 0,7 0,1 5 1 0,4 0,3
6 0,8 0,4 0,1 0,7 0,9 6 0,9 0,4 0,9

• Subsample (variação) – o percentual da amostra no bootstrap


• Controla o número de id x1 x2 x3 x4 x5
linhas sorteadas a cada 1
2
0,7
0,8
0,1
0,8
0,8
0,8
0,1
0,9
0,1
0,8
id x1 x2 x3 x4 x5
1 0,7 0,1 0,8 0,1 0,1
passo. 3 0 0,8 0 0,7 0,3
3 0 0,8 0 0,7 0,3
4 0,6 0,1 1 0 0,6
6 0,5 0,2 0,7 0,4 0,7
5 0,2 0,3 0,6 0,5 0,6
6 0,5 0,2 0,7 0,4 0,7

63
XGBoosting - hiperparâmetros
• Nrounds – número de árvores sequenciais
• Max_depth – profundidade máxima de cada árvore
• Gamma – redução mínima de perda necessária para realizar uma
quebra
• Eta – Taxa de aprendizado. Uma penalização no ‘totozinho’ a cada
passo.
• Colsample_bytree – número de colunas sorteadas por ‘round’
• Min_child_weight – número mínimo de observações por folha
• Subsample – percentual de amostragem para o bootstrap

64
AREM3_script04_XGBoost.R

65
HAR
• Identificação de atividade humana por acelerômetro e
giroscópio do celular
• Dados originais captados com frequencia de 40 Hz
• Dados sumarizados em 1 medida a cada 1,4 segundos
• Medidas de translação e rotação nos eixos X, Y e Z
• Derivações como aceleração, jerk, médias, máximos,
mínimos, desvios etc dentro das janelas.

https://archive.ics.uci.edu/dataset/240/human+activity+recognition+using+smartphones

66
HAR
1 - andando 2 – subindo escada 3 – descendo escada

4 - sentado 5 – em pé 6 – deitado

67
HAR - Variáveis
Medidas Resumos
tBodyGyroMag Média
tBodyAcc-XYZ
tBodyGyroJerkMag Desvio padrão
tGravityAcc-XYZ
fBodyAcc-XYZ Mediana
tBodyAccJerk-XYZ
fBodyAccJerk-XYZ Mínimo Total
tBodyGyro-XYZ
fBodyGyro-XYZ Máximo 561 atributos
tBodyGyroJerk-XYZ
fBodyAccMag SMA
tBodyAccMag
fBodyAccJerkMag Energia
tGravityAccMag
fBodyGyroMag IQR
tBodyAccJerkMag
fBodyGyroJerkMag Entropia
etc
68
HAR - base

• Cada linha é uma medida


• Há várias medidas por pessoa
69
AREM3_script04_XGBoost.R

70
O que fazer com meus
novos superpoderes?
• Exercícios para a próxima:
• Melhorar o fit na base HAR

71
Conclusões

• Árvores são só o começo... Ou UM


começo
• Há INFINITAS formas de combinar
modelos, essas são as mais famosas
• Esses modelos são difíceis de se
interpretar
• XGB é um modelo delicado que toma
tempo de tunning
• PRATIQUE!

72
linkedin.com/in/joao-serrajordia

73
OBRIGADO!
linkedin.com/in/joao-serrajordia/

74
ÁRVORES, REDES E ENSEMBLE
MODELS IV
João F. Serrajordia R. de Mello
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Você vai precisar de... Preparativos

• Abrir o R
• Importar as bibliotecas
• Algo para fazer suas anotações

3
Revisão

Histórico

Agenda
Ideias básicas

Usos

4
CRISP-DM

Fonte: https://www.the-modeling-agency.com/crisp-dm.pdf
5
Ensemble
Um ensemble é qualquer mistura de modelos já existentes.
Os principais tipos são:

Bagging

Boosting

Stacking

6
Classificação

7
Classificação dos algoritmos

Supervisionados Não supervisionados


- Regressão
- K-Means
- GLM
- Métodos hierárquicos
- GLMM
- Mistura Gaussiana
- Support vector machines
- DBScan
- Naive Bayes
- Mini-Batch-K-Means
- K-nearest neighbors
- Redes Neurais
- Decision Trees

Estamos aqui!

8
Classificação dos algoritmos

Resposta contínua Resposta discreta


- Regressão
- Regressão logística
- GLM
- Classification trees
- GLMM
- Redes Neurais
- Support vector machines
- GLM
- K-nearest neighbors
- GLMM
- Redes Neurais
- Regression Trees

Estamos aqui!

9
Classificação dos algoritmos

Métodos Métodos
Machinelârnicos Machinelârnico-
- Árvores de decisão estatísticos
- Bagging
- Boosting - Regressão
- K-NN - GLM
- Redes Neurais - GLMM
- Support Vector Machines - ANOVA

Estamos aqui!

10
Redes Neurais Artificiais
Metáfora

Neurônio
biológico

https://en.wikipedia.org/wiki/Myelin
12
Exemplo biológico

• Nematelminto: 302 neurônios

13
Rede Neural Humana • Homo sapiens: 100.000.000.000 de neurônios

14
Onde vivem?

Redes Neurais Artificiais têm tido muito sucesso em problemas com dados
pouco estruturados como imagens, áudios, textos e vídeos.

15
Neurônio de McCulloch-Pitts
É um modelo da década de
60/70, mas com muita x1
influência nos mais modernos.

O perceptron consolida x2
informações de estímulos
𝑝
iniciais, das variáveis x1, x2, ...
Xp através de uma combinação x3 𝑓 ෍ 𝑤𝑖 𝑥𝑖 y
linear (soma ponderada). 𝑖=1

Devolve uma ‘decisão’ binária, x4


de sim ou não, caso a
...

combinação dos estímulos f(.)


supere um certo valor limite xp
(treshold).
treshold
16
Exemplo de funcionamento
Vou no jogo do Bragantino?
Considere três fatores para
esta decisão, cada fator é
binário, 0=não, 1=sim:

1) Se está chovendo x1
2) Se vai ser televisionado
3) Se é final do campeonato 𝑝

x2 𝑓 ෍ 𝑤𝑖 𝑥𝑖 y
Cada fator tem uma 𝑖=1
ponderação, digamos: 3, -1 e 6
respectivamente. x3
Se a soma desses fatores
f(.)
passar de um valor limite
(digamos 3), então a decisão é
ir no jogo.
treshold
17
Perceptron binário?

Mas a condição do tempo é


mesmo binária? Ou é uma
coisa mais contínua, passando
de um céu azul limpinho, por x1
um dia nublado ou um
𝑝
chuvisquinho a uma
tempestade com direito a x2 𝑓 ෍ 𝑤𝑖 𝑥𝑖 y
relâmpagos? 𝑖=1

A decisão igualmente pode ser x3


convicta para o sim ou para o
não, ou pode estar mais numa f(.)
zona de indecisão.

treshold
18
Funções de ativação

Cada neurônio da RNA é uma


função não linear de uma
combinação linear dos elementos
da camada anterior.

Essa função é chamada de função


de ativação.

Na analogia com a rede neural


natural, ele visa identificar a
presença ou não de um estímulo
específico.

19
Perceptron

x1

O perceptron é um tipo de
neurônio bastante comum nas x2
RNAs.
𝑝
Eles podem ainda ser x3 𝑓 ෍ 𝑤𝑖 𝑥𝑖 y
combinados de formas 𝑖=1
diferentes formando diferentes
arquiteturas de RNAs. x4
...

xp

20
Redes Neurais Artificiais
Combinações de perceptrons

Deep learning with R - Abhijit Ghatak, ed. Springer, 2019

21
Como roda no R?
• Há várias implementações de RNA disponíveis.
• Vamos utilizar o pacote ‘neuralnet’ do R

22
Como roda no R?
rn0 <- neuralnet::neuralnet(y ~ x,
data=df1,
threshold = 0.01, O pacote neuralnet
act.fct = 'logistic' permite inserir o
modelo com a notação
) básica de modelos do
R.
plot(rn0)

df1['pred0'] <- predict(rn0, df1)

23
Como roda no R?
rn0 <- neuralnet::neuralnet(y ~ x,
data=df1,
threshold = 0.01,
act.fct = 'logistic' Aqui indicamos o data
) frame de entrada.

plot(rn0)

df1['pred0'] <- predict(rn0, df1)

24
Como roda no R?
rn0 <- neuralnet::neuralnet(y ~ x,
data=df1, Este é um
threshold = 0.01, hiperparâmetro de
act.fct = 'logistic' ‘parcimônia’ da rede.
) Ele tem o papel de
limitar o overfitting do
plot(rn0) modelo.

df1['pred0'] <- predict(rn0, df1)

25
Como roda no R?
rn0 <- neuralnet::neuralnet(y ~ x,
data=df1,
threshold = 0.01,
act.fct = 'logistic' Esta é a função de
) ativação do modelo.

plot(rn0)

df1['pred0'] <- predict(rn0, df1)

26
Como roda no R?
rn0 <- neuralnet::neuralnet(y ~ x,
data=df1, O pacote neuralnet é
threshold = 0.01, compatível com a
act.fct = 'logistic' função plot. Ele mostra
um grafo
) representando a rede,
com pesos etc.
plot(rn0)
Cuidado com redes
muito grandes.
df1['pred0'] <- predict(rn0, df1)

27
Como roda no R?
rn0 <- neuralnet::neuralnet(y ~ x,
data=df1,
threshold = 0.01, Para fazer previsões,
act.fct = 'logistic' usamos o predict
igualzinho, da mesma
) forma que os modelos
baseados em árvores
plot(rn0) que vimos nas aulas
anteriores.

df1['pred0'] <- predict(rn0, df1)

28
AREM4_script01_RNA_ilustracao.R

29
OCR – Optical Character Recognition

Vamos pensar em uma versão bem simples do


problema. Dígitos de um rádio relógio antigo
possuem uma estrutura bem simples.

30
OCR – Optical Character Recognition
1

Há 7 regiões básicas, que podem estar ativas ou inativas, e


2 3 definem um dígito.
4
Por exemplo, se somente as regiões 1, 3 e 6 estão
ativadas, temos o número 7.
5 6
7 É relativamente fácil imaginar um modelo ou uma regra,
que toma essas 7 variáveis como entrada, e retorna que
número está sendo mostrado. Aliás, essa tecnologia foi
desenvolvida com o exato raciocínio oposto.

31
Perceptron de Rosenblatt

• O Perceptron de Rosenblatt (~1950-


1960) tem essa ideia, só que com
propósito mais geral

• foi construído para fazer OCR


(optical character recognition)

• Para isso, mapeia regiões de uma


imagem “ativadas” e “não ativadas”

• Cada unidade é um neurônio de


McCullogh-Pitt

32
Previsão de
consumo de
veículo
• Tamanho do motor
• Combustível
• Número de cilindros
• Marca
• Potência
• Tração

https://www.fueleconomy.gov/feg/download.shtml 33
Perceptron
Linear
• Possui a mesma estrutura
de uma regressão linear
com a função de ativação
indicada.

34
Limitações do perceptron linear
• O perceptron linear só
captura padrões lineares

35
Perceptron
multi-camada
• Possui camadas
“escondidas”
intermediárias
• Captura padrões não
lineares
• Pode se aproveitar do
processamento paralelo
de GPUs
• Não é “interpretável”
como a regressão

36
AREM4_script02_neural_networks.R

37
Funções de perda
𝑵
Variáveis Contínuas 𝟐
𝑺𝑸𝑬 = ෍ 𝒚𝒊 − 𝒚ෝ𝒊
SQE
𝒊=𝟏

Variáveis binárias
𝑳 = 𝒚𝒊 𝒍𝒐𝒈 𝒚ෝ𝒊 + (𝟏 − 𝒚𝒊 )𝒍𝒐𝒈(𝟏 − 𝒚ෝ𝒊 )
Cross-Entropy

38
Redes Neurais
Artificiais

Deep learning with R - Abhijit Ghatak, ed. Springer, 2019

39
Redes Neurais Artificiais

Deep learning with R - Abhijit Ghatak, ed. Springer, 2019

40
Exemplo em OCR (MNIST)
Pixel 1
Pixel 2
Pixel 3

Pixel 1
Pixel 2
Pixel 3

Rótulo
Pixel 784
...

60.000 dessas
Imagem 1 0 0 0... 0 4
Imagem 2 0 0 0... 0 3
Viram uma Imagem 3 0 0 0... 0 9
tabela assim

...
...
...
...
...
...

...
Imagem 60.000 0 0 0... 0 5

Pixel 784

41
Rede Neural MNIST

Com apenas uma camada já temos 784 x 10 = 7.840 parâmetros!

42
Rede Neural MNIST

3blue1brown - https://www.youtube.com/watch?v=aircAruvnKk
43
Gradiente descendente
É o algoritmo mais popular para se treinar redes neurais artificiais por
apresentar algumas características:

• Pode alterar as estimativas com pequenos subconjuntos de pontos a


cada iteração (no limite 1 único ponto)
• Não depende de inverter matriz
• Funciona com uma base de dados bem grande
• Pode ser processado em paralelo com GPU
• Permite interromper o algoritmo a certo ponto e continuar mais tarde
ou em outro problema semelhante (transfer learning)

44
Redes Gradiente Descendente

Deep learning with python – François Chollet

45
Gradiente
descedente

Deep learning with R - Abhijit Ghatak, ed. Springer, 2019


46
Demora pra rodar?
Uma breve história

47
game
A contribuição da indústria do Game nas Redes Neurais

48
• Distância entre transístores: 14 nm
Processadores • Fio de cabelo humano: 80.000 nm
• Diâmetro do átomo de ouro: 0,3 nm

49
GPU

50
Processamento com GPU

51
TPU

52
Regularização L2
𝑵
Variáveis Contínuas 𝑺𝑸𝑬 = ෍ 𝒚𝒊 − 𝒚ෝ𝒊 𝟐 + 𝝀 ෍ 𝜷𝟐𝒊
SQE 𝒊=𝟏

Variáveis binárias 𝑳 = ෍ 𝒚𝒊 𝒍𝒐𝒈 𝒚ෝ𝒊 + 𝝀 ෍ 𝜷𝟐𝒊


Cross-Entropy

53
Reconhecimento
de atividade
humana com
smartphone

54
AREM4_script03_rna_har.R

55
Conclusões

• Redes Neurais são a introdução ao Deep


Learning (que é um ramo muito
promissor)
• São poderosas e flexíveis
• Requerem poder computacional
especial (GPU / TPU)
• São famosas em dados menos
estruturados (ex: imagens, áudio)

56
“Me enganei apenas uma
vez, quando pensei estar
enganado”

Prof. Girafales

57
linkedin.com/in/joao-serrajordia

58
5 1
0 9 8-
73 .
5 .2
a 31
OBRIGADO h i d
os
i Y
u sh
linkedin.com/in/joao-serrajordia

t s
eloA
ar c
M

59
INTRODUÇÃO AO DEEP
LEARNING
Prof. Dr. Jeronymo Marcondes
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Introdução

• Plano de ataque:
1) Explicar o conceito
2) Como os dados fluem
3) Como é o processo de otimização
4) Função custo e descida do gradiente
5) Parte prática

3
Introdução

• Problema de classificação e regressão

𝑦 = 𝑓(𝑋1, 𝑋2, … 𝑋3)

• Machine Learning é uma tecnologia onde os computadores tem a


capacidade de aprender de acordo com as respostas esperadas por
meio associações de diferentes dados, os quais podem ser imagens,
números e tudo que essa tecnologia possa identificar.

4
Exemplos
É possível fazer modelos para:

classificar clientes reduzir um


prever o valor de
por chance de conjunto de
uma ação;
não pagar; dados.

5
Morettin e Singer – Introdução à Ciência de Dados

6
AE Supervisionado
• Problema supervisionado
• Regressão:

𝑦 =𝑓 𝑋 +𝑒

𝑦 = 𝑎 + 𝑏𝑋 + 𝑒

𝑦 = 0,2 + 0,1𝑋

7
Problema Supervisionado

8
AE Não Supervisionado

• Temos apenas um conjunto de variáveis preditoras (inputs) e o


objetivo e descrever associações e padrões entre essas variáveis.
Nesse caso, não ha uma variável resposta.

• Análise de Cluster e Análise de Componentes Principais.

9
Classificação

• Resposta do modelo é uma variável qualitativa.

• Exemplo do risco de default.


𝐷𝑒𝑓𝑎𝑢𝑙𝑡 = 𝑓(𝑅𝑖𝑠𝑐𝑜 𝑑𝑜 𝐼𝑛𝑑𝑖𝑣í𝑑𝑢𝑜)

10
Regressão como ANN

11
Redes Neurais Artificiais
• Deep learning – conceito

• Nessa aula começaremos com a rede neural “rasa”.

• As contribuições pioneiras para a área de Redes Neurais (RN) foram as


de McCulloch e Pitts (1943), que introduziram a ideia de RN como
maquinas computacionais e de Hebb (1949), por postular a primeira
regra para aprendizado organizado.

12
Redes Neurais Artificiais

13
Redes Neurais Artificiais
• A ideia do perceptron de Rosenblatt.
• Aprende respostas binárias
• Pesos treinados para produzir vetor alvo

Shiffman (2012) demonstra o Perceptron como um modelo


computacional de um simples neurônio, o qual consiste em possuir
diversas entradas de dados, um núcleo de processamento e uma saída,
o qual o possibilita apenas a saída de valores lógicos.

14
Redes Neurais Artificiais

15
Redes Neurais Artificiais
• Rede neural do tipo feedforward.

• Neurônios não se interconectam.

• Camadas de entrada não pode ser menor do que a quantidade de


variáveis que estamos usando para explicar Y.

16
Como funciona

• Cada Neurônio recebe dados de entrada ou da camada anterior.

• Diferente do caso de regressão – só tinha uma camada de entrada e


saída.

• Cada Neurônio ao enviar informação para o próximo multiplica a


informação por pesos.

17
Matemática
• Dado o valor de n entradas:

𝑋1 = [𝑋11 , 𝑋12 … 𝑋1𝑛 ]

Essas são nossas variáveis explicativas! Por exemplo, o risco de default


do cliente:

𝑋 = [𝑃𝑎𝑔𝑜𝑢 𝑛𝑜 𝑝𝑎𝑠𝑠𝑎𝑑𝑜? , 𝑅𝑒𝑛𝑑𝑎 𝐴𝑡𝑢𝑎𝑙, 𝑒𝑡𝑐]

18
Matemática
• Dado o valor de saídas para t clientes:

𝑌 = [𝑌1 , 𝑌2 , … , 𝑌𝑡 ]

Essas são nossas variáveis explicadas. Ou seja, se um determinado


cliente efetivamente pagou.

19
Matemática

• Dado o valor de pesos para h neurônios da próxima camada:

𝑤 = [𝑤11 , 𝑤12 , … , 𝑤𝑛ℎ ]

Esses são os valores que serão multiplicados por cada variável de


entrada até a próxima camada escondida.

20
Visualização

21
Matemática
• Para cada uma dos neurônios:

𝑧 = 𝑏 + ෍ 𝑤𝑖 𝑋𝑖
𝑖

O que é equivalente, no caso do primeiro neurônio, a:

𝑧1 = 𝑏 + 𝑤11 𝑋1 + 𝑤21 𝑋2

22
Função de ativação

• Suponha que estejamos em problema de classificação de default com


resultados possíveis 1 ou 0.

• 1 vai dar calote e 0 não.

• Nossa variável explicada é dicotômica e trata-se de um problema de


classificação.

23
Função de ativação
A função de ativação é aquela que processa o sinal gerado pela
combinação linear das entradas e dos pesos das sinapses, para gerar o
sinal de saída do neurônio.

Ou seja, ela que faz o “processamento” da informação.

Podemos ter respostas lineares e não lineares.

24
Função de ativação

• Para decidir o resultado advindo do neurônio anterior temos (ReLU):

1 𝑠𝑒 𝑧 ≥ 0
𝑓 𝑧 =
0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜

Qual a diferença para um regressão?

25
Função de ativação

26
Função de ativação

𝑧1 = 𝑤11 𝑋1 + 𝑤21 𝑋2 = 1.2

𝑅𝑒𝑙𝑢 𝑧1 = 1

Comprando com a tabela:


𝑦 − 𝑅𝑒𝑙𝑢 𝑧1

O que fazer se deu errado??

27
Função de ativação
• Um outro exemplo:

• Função Sigmoide:

𝑒𝑧
𝑔 𝑧 = 𝑧
𝑒 +1

E se fosse uma função linear?

28
Como funciona

• Peso a ser multiplicada a informação depende do par origem\destino.

• Resultado é inserido dentro de uma função de ativação.

• A depender do resultado, tal como em neurônio, o sinal é disparado


para o próximo neurônio.

29
Como funciona

• Como determinar os pesos?

• Iniciado de forma randômica ou com alguma regra pré-especificada.

• Caso do chute de valores das compras.

30
Explicação
• Você sabe a quantidade que comprou.

• Você não sabe o preço por kg.

• Você sabe o total que gastou.

𝑔𝑎𝑠𝑡𝑜 = 𝑝𝑝𝑘𝑢𝑣𝑎 𝑞𝑢𝑣𝑎 + 𝑝𝑝𝑘𝑚𝑎ç𝑎 𝑞𝑚𝑎ç𝑎

31
Explicação
• Suponha que você gastou 10.

• Recebeu 1 kg de cada.

• Você tinha chutado que o ppk da uva é de R$ 4.00 e o da maçã é de


R$ R$ 5.00. Você chuta antes de saber o valor total.

• Você errou por 10-9 = R$1.00. Erro residual!

32
Ajuste dos Pesos

• 𝑒𝑟𝑟𝑜 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙𝑗 = 𝑣𝑎𝑙𝑜𝑟 𝑟𝑒𝑎𝑙𝑗 − 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 𝑗

• ∆𝑤𝑗 = 𝜂∇𝐸

33
Função Custo

• Função que mensura o quanto estamos acertando.

• Por exemplo: erro quadrático médio.

1
𝐸= ෍ 𝑦𝑛 − 𝑡𝑛 ²
2
𝑡𝑟𝑒𝑖𝑛𝑎𝑚𝑒𝑛𝑡𝑜

34
Função Custo
valor estimado valor real Erro Quadrado do erro
preço 1 2 2 0 0
preço 2 3 5 -2 4
preço 3 2 4 -2 4
preço 4 5 1 4 16
Soma 24
6

35
Como é feito o ajuste?

Fonte: Deep Learning book


36
Como é feito o ajuste?
• Chute um valor inicial para o peso

• Calcule os valores de saída para esses pesos

• Use a fórmula de ajuste para obter os novos pesos:

𝑛𝑜𝑣𝑜 𝑝𝑒𝑠𝑜 = 𝑝𝑒𝑠𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 − 𝜂∇𝐸

37
Descida do gradiente

• Processo utilizado para encontrar o mínimo da função custo com base


em variação nos pesos.

• Através do processo de backpropagation os erros obtidos após os


cálculos dos pesos são retroalimentados na rede até otimizarmos o
resultado.

38
Descida do gradiente
• Matematicamente: qual a variação nos pesos que mais reduz minha
diferença entre o valor estimado e o valor real?

Fonte: https://matheusfacure.github.io/2017/02/20/MQO-Gradiente-Descendente/
39
Descida do gradiente
• Uso do cálculo diferencial:

O gradiente vai nos dar as variações na função perda para pequenas


alterações nos parâmetros:

𝜕𝐿 𝜕𝐿
∇ 𝐿 = ,
𝜕𝑤 𝜕𝑏

40
Parte Prática

41
OBRIGADO!
http://lattes.cnpq.br/9163660479128394

42
DEEP LEARNING
Prof. Dr. Jeronymo Marcondes
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Introdução

• Plano de ataque:
1. O papel das redes neurais multicamadas
2. O problema do overfitting.
3. O problema de definição de hiperparâmetros
4. O problema de encontrar solução ótima

3
Introdução

4
Introdução

• Era negra das redes neurais artificiais.

5
Introdução

https://automaticaddison.com/linear-separability-and-the-xor-problem/

6
XoR
• Exclusive Or

7
https://automaticaddison.com/linear-separability-and-the-xor-problem/

8
Rede Neural Multicamada

• Muitas camadas permitem identificar relações não lineares.


• No caso de termos varias camadas intermediarias obtém-se o que é
chamado aprendizado profundo (deep learning).

9
Estrutura da Rede

• Camadas – grupo de neurônios em um estágio do processo.


• Camada Densa – Conecta cada neurônio em uma camada com todos
os neurônios da camada anterior. Por exemplo, se a camada atual tem
5 neurônios e a camada anterior tem 3, o total de conexões é de 15.
10
Camada Densa

11
Função Perda

• Função que permite verificar o quão assertivo é determinada


previsão.

• Predicted x Actual

• São diferentes para variáveis contínuas e categóricas

12
Função Perda
• As variáveis categóricas contêm um número finito de categorias ou grupos distintos.
Os dados categóricos podem não ter uma ordem lógica. Por exemplo, os preditores
categóricos incluem gênero, tipo de material e método de pagamento.
• Variáveis contínuas são variáveis numéricas que têm um número infinito de valores
entre dois valores quaisquer. Uma variável contínua pode ser numérica ou de
data/hora. Por exemplo, o comprimento de uma peça ou a data e hora em que um
pagamento é recebido.
• Variáveis discretas são variáveis numéricas que têm um número contável de valores
entre quaisquer dois valores. Uma variável discreta é sempre numérica. Por
exemplo, o número de reclamações de clientes ou o número de falhas ou defeitos.
https://support.minitab.com/
13
Algumas funções de erro
• Erro quadrático Médio:

𝑘
2
𝐸𝑄𝑀 = ෍ 𝐴𝑐𝑡𝑢𝑎𝑙 − 𝑃𝑟𝑒𝑑𝑖𝑐𝑡𝑒𝑑
𝑛=1
Nota
Actual Predicted
A 7 8
B 10 9
C 5 10
D 8 8

14
Algumas funções de erro
• Erro Absoluto Médio

𝐸𝑄𝑀 = ෍ 𝐴𝑐𝑡𝑢𝑎𝑙 − 𝑃𝑟𝑒𝑑𝑖𝑐𝑡𝑒𝑑


𝑛=1
Nota
Actual Predicted
A 7 8
B 10 9
C 5 10
D 8 8

15
Algumas funções de erro
• Funções para output contínuo.

• Há necessidade de outras métricas para classificação, como 1 e 0.

• Binary cross-entropy

• Categorical cross-entropy

16
Viés x Variância

• O que estamos buscando?

• O que pode ocorrer?

• Importância da Generalização – teoria do mapa.

17
Viés x Variância

• Ausência de Viés - na média você acerta.

• Redução de Variância – tiro ao alvo.

18
Viés x Variância
• Preocupação com a variância.

https://www.baeldung.com/cs/epoch-neural-networks

19
Fitting

• UnderFitting - Seu modelo está subjugando os dados de treinamento


quando o modelo tem um desempenho insatisfatório nos dados de
treinamento. Isso ocorre porque o modelo é incapaz de capturar a
relação entre os exemplos de entrada (geralmente chamados de X) e
os valores de destino (geralmente chamados de Y).

20
Fitting

• OverFitting - Seu modelo está super ajustando seus dados de


treinamento quando você vê que o modelo tem um bom
desempenho nos dados de treinamento, mas não nos dados de
avaliação. Isso ocorre porque o modelo está memorizando os dados
que viu e é incapaz de generalizar para exemplos não vistos. Muito
comum em Redes Neurais.

21
Fitting

22
Redução do overfitting

• Como reduzir overfitting?

• Reduzir número de camadas

• Mais parâmetros = + capacidade de memorização

• Regularização

23
Regularização
• Introdução de “barulho”.
• Dropout
O modelo descarta ou desativa arbitrariamente alguns neurônios para uma
camada durante cada iteração. Em cada iteração, o modelo olha para uma
estrutura ligeiramente diferente de si mesma para otimizar (como um casal
de neurônios e as conexões seriam desativadas). Diga que temos duas
camadas sucessivas, H1 e H2, com 15 e 20 neurônios, respectivamente. A
aplicação da técnica de eliminação entre essas duas camadas resultaria em
descartar aleatoriamente alguns neurônios (com base em uma porcentagem
definida) para H1, o que, portanto, reduz as conexões entre H1 e H2. Esse
processo se repete para cada iteração com aleatoriedade, portanto, se o
modelo tiver que aprender para um lote e atualizou os pesos, o próximo lote
pode ter um conjunto bastante diferente de pesos e conexões para treinar.

24
Dropout

25
L1

• Ajuste dos pesos feito por meio da regularização.

• O foco não é mais no neurônio, mas no valor do peso.

• O peso é ajustado até o valor de zero dependendo da sua


importância.

26
L2

• Ajuste dos pesos feito por meio da regularização.

• O foco não é mais no neurônio, mas no valor do peso.

• O peso é ajustado até valor próximo de zero dependendo da sua


importância.

27
Early Stopping
• Final de cada época – verificar melhoria.

• Melhoria não está mais ocorrendo? Pare!

• Isso evita o overfitting.

28
Épocas

• Como verificar se temos overffitting?

• Quantas vezes os dados passam pela rede.

• Cada época é um passo em direção ao resultado “ótimo”.

• Convergência.

29
Épocas

https://www.baeldung.com/cs/epoch-neural-networks

30
Batch
• Como realizar o treinamento?

• Técnicas que podem ajudar no processo de otimização.

• Uso de batch (lotes).

31
Batch

Normalmente, o treinamento seria feito em lotes devido a restrições de memória no sistema. Um lote é uma
coleção de amostras de treinamento de toda a entrada. A rede atualiza seus pesos depois de processar todas
as amostras em um lote. Isso é chamado de iteração (ou seja, uma passagem bem-sucedida de todas as
amostras em um lote, seguido por uma atualização de peso na rede). A computação de todas as amostras de
treinamento fornecidas nos dados de entrada com atualizações de peso lote por lote é chamado de época.
Em cada iteração, a rede aproveita a função do otimizador para fazer uma pequena mudança para seus
parâmetros de peso (que foram inicializados aleatoriamente no início) para melhorar a previsão final,
reduzindo a função de perda. Passo a passo, com várias iterações e, em seguida, várias épocas, a rede atualiza
seu pondera e aprende a fazer uma previsão correta para o treinamento dado amostras.

32
Hiperparâmetros
• O que são?

• Qualquer número utilizado pela rede que não é aprendido.

• Como determinar esses valores?

• Cross validation? Grid Search?

33
Hiperparâmetros
• Vamos lembrar de alguns?

1. Learning rate
2. Batch size
3. Epochs
4. Função de ativação

34
AUTOML
• Vamos discutir um pouco sobre isso.

• AutoKeras, H20.

• Transfer Learning.

• Grid Search

35
Cross validation
• Como funciona?
• Conjunto de treinamento, teste e validação

Deep Learning with R

36
Cross validation
• K fold cross validation

Deep Learning with R

37
Mínimo local e ponto de sela

https://blog.paperspace.com/intro-to-optimization-in-deep-learning-gradient-descent/

38
Mínimo local e ponto de sela

https://www.analyticsvidhya.com/blog/2021/05/tuning-the-hyperparameters-and-layers-of-neural-network-deep-learning/

39
Otimizadores

• Ou seja, dada a função perda, como atualizar os pesos?

• Qual a regra?

• Nós usamos o modelo clássico de descida do gradiente, mas há


outras.

40
Otimizadores

• ADAGRAD

• ADAM

• RMSPROP

41
Momentun

• Também chamada de inércia

• Conceito próximo à de inércia = atrito

• Figura acima – a bolinha com velocidade poderia passar o ponto de


sela e chegar no mínimo.

42
Momentun

Introduction to deep Learning

43
OBRIGADO!
https://www.linkedin.com/in/jeronymo-marcondes-585a26186

44
DEEP LEARNING
Prof. Dr. Jeronymo Marcondes

1
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

22
Introdução

3
Introdução

• Alguns problemas importantes:

1. Dados de texto

2. Séries Temporais

3. Assistir um filme

4
RNN
• Exemplo de uma série temporal.

5
Introdução

• Qual é a característica desses dados? Sequência.

• FNN pode ser usada para reproduzir esse processo, mas não é a melhor
escolha.

“O gato perseguiu o rato”


“O rato perseguiu o gato”

6
RNN
• O que ocorreria se usássemos uma FNN?

7
RNN

Fonte: Introduction to Deep Learning from Logical Calculus to Artificial Intelligence

8
RNN
• RNN constrói distribuição de probabilidade

• Exemplo

Fonte: Introduction to Deep Learning from Logical Calculus to Artificial Intelligence

9
RNN
• Objetivo: rede neural com “memória”.

• Recorrente: realiza a mesma tarefa para todos os elementos e sua


saída depende dos cálculos anteriores.

Fonte: Neural Networks and Deep Learning

10
RNN
• Podemos visualizar a RNN de outra forma:

Fonte: Introduction to Deep Learning from Logical Calculus to Artificial Intelligence

11
RNN

A camada de entrada 'x' recebe a entrada para a rede neural e a


processa e a passa para a camada intermediária.
A camada intermediária 'h' pode consistir em várias camadas ocultas,
cada uma com suas próprias funções de ativação e pesos e vieses.
Fonte: https://www.simplilearn.com/tutorials/deep-learning-tutorial/rnn

12
RNN

Fonte: https://www.simplilearn.com/tutorials/deep-learning-tutorial/rnn

13
RNN
• Podemos visualizar a RNN de outra forma:
• The cat chased the mouse

Fonte: Neural Networks and Deep Learning

14
RNN

• Isso significa que temos uma rede que “guarda” todo o passado
• Explicar crescimento econômico com base em nível de confiança.
• Simple Recurrent Neural Network

15
RNN
• Rede de Elman

• Tenho resultado que os valores da camada escondida estarão multiplicados


por valores de pesos elevados a potencias maiores quanto mais antiga for
essa informação

16
Backpropagation
• Tudo se afeta ao mesmo tempo!

• Backpropagation Through Time

17
Backpropagation
• Como é feito o cálculo do gradiente?

• O quanto varia o erro para uma dada variação do peso?

• Surge um problema: passado multiplicado por pesos elevados a


potencias maiores quanto mais antigo for.

• Intuição: quanto mais longe no passado, mais difícil ver a influência,


pois muita coisa aconteceu.

18
Dissipação do Gradiente
• Intuição

• Multiplicação de números menores do que 1

• Multiplicação de números maiores do que 1

19
Problemas com Gradiente

• “Sumiço” (Dissipação) e Explosão do Gradiente

• w>1 ou w<1

20
Dissipação do Gradiente

21
Problemas com Gradiente

• Ocorre em qualquer rede – mais comum em RNN

• RNN é mais profunda?

• Como resolver?

22
Backpropagation Truncada

• O processo de backpropagation truncada consiste em parar a


avaliação de mudanças de pesos até certo ponto. A atualização não
levará em conta todo o passado, mas só até certo limite.

• Custo computacional

• Solução Arbitrária

23
Resolver Vanishing Gradient
• Inicialização de matriz de peso

• Função de ativação ReLU:

𝑓 𝑥 = max(0, 𝑥)

24
Clipping do Gradiente

• Solução possível para Dissipação e Explosão


O clipping define um valor limite definido nos gradientes, o que
significa que, mesmo se um gradiente aumentar além do valor
predefinido durante o treinamento, seu valor ainda será limitado ao
limite definido. Dessa forma, a direção do gradiente permanece
inalterada e apenas a magnitude do gradiente é alterada.
(deeplearningbook.com).

25
LSTM
• Long Short-Term Memory

• Mesma coisa que na RNN – mas temos o “estado da célula”

• Com base em “portões” – gates

• Será que devemos manter ou guardar uma informação?

26
LSTM - intuição

Fonte: https://www.analyticsvidhya.com/

27
LSTM
• Algumas funções importantes

• TANH – tangente hiperbólica

• Resultado entre -1 e 1 => “negativo”, “neutro” e “positivo”

𝑠𝑒𝑛ℎ(𝑡)
tanh =
cosh(𝑡)

28
LSTM
• Sigmoide
• Resultado entre 0 e 1 => “sim” ou “não”

Fonte: Research Gate

29
LSTM

• Ligação da entrada com cada escondida – igual

• Estado da célula – memória longa

30
LSTM
• Forget Gate – Quanto lembrar?

• Input Gate – Quanto manter dos inputs? O que adicionar ao estado


da célula?

• Output Gate – O que do estado da célula e do hidden state será


utilizado como resultado?

31
LSTM

32
LSTM

É possível observar que dado um instante no tempo t, a célula LSTM possui


como entradas o instante atual de alimentação de informação da rede,
identificado como xt , o estado oculto (hidden state) ht-1 e o estado da
célula (cell state) ct-1, ambos estados provindos da recorrência do instante
de tempo passado t-1. As saídas da célula são o cell state ct do instante
atual, o hidden state ht e a saída de informação yt .Para o caso da célula
pertencer a última camada da rede, o ht é entendido como a saída final yt ,
para o caso da camada ser interna a rede, o ht servirá como o ht-1 para a
próxima camada adiante na rede.

33
LSTM

Além das entradas e saídas, uma célula LSTM é composta internamente por
combinações entre funções de ativação, adições e produtos. Estas operações
internas da célula LSTM se denominam de gates, sendo eles, forget gate,
input gate, cell gate e output gate. Além destes gates, a célula LSTM possui
uma região responsável por agrupar a saída de alguns destes gates para
produzir o ct , que é uma das saídas da célula. (OLIVEIRA, E.V., 2020)

34
LSTM – Forget Gate

35
LSTM

36
Animação LSTM

37
GRU – Gate Recurrent Unit

• Resolve problema da dissipação do gradiente

• Baseada em portões: reinicialização e atualização

• Apenas 1 estado oculto

38
GRU
• Guarda dependências longas

• Reset Gate: Quanto de informação anterior iremos ignorar

• Update Gate: Quanto de informação anterior iremos manter

39
GRU

Fonte: https://www.analyticsvidhya.com/

40
Extra: Transformadores

• Maior parte de PLN era feito com RNN

• Attention is alll you need

• Uso de RNN => perde informação conforme se distância do início de


uma série

• Contexto é essencial em PLN

41
Extra: Transformadores
• Codificador – decodificador

• Codificador – processa informações sobre a entrada e


relacionamentos entre si

• Decodificador - faz o oposto, pegando todas as codificações e as


processando, usando suas informações contextuais
incorporadas para gerar uma sequência de saída.

42
Extra: Transformadores

• A lógica: o que é mais rápido para achar uma solução, ler um livro
inteiro ou procurar no índice?

• Vetor de contexto – guarda posição dentro da sequência

• Solução: passar todos estados ocultos

43
OBRIGADO!
https://www.linkedin.com/in/jeronymo-marcondes-585a26186

44
DEEP LEARNING
Prof. Dr. Jeronymo Marcondes
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Introdução

3
Introdução

4
Introdução

• Deep Learning não supervisionado

• O que é não supervisionado?

• Qual a diferença com relação aos modelos de FNN?

5
Introdução

• Modelos Baseados em Energia

• Objetivo: Reduzir a energia

• Similar ao problema com nossa função custo

6
Máquinas de Boltzmann

• A máquina de Boltzmann é uma FNN de uma camada

• Nosso objetivo: aprender a distribuição de probabilidades dos inputs

• Ajustar pesos para ser possível reconstruir os inputs (entradas)

• Máquina Restrita de Boltzmann

7
Máquinas de Boltzmann

8
Máquinas de Boltzmann

Fonte: https://wiki.pathmind.com/restricted-boltzmann-machine

9
Máquinas de Boltzmann
Características:

• Não possui camada de saída

• Entradas são passadas para a camada escondida

• Por que é máquina “restrita”?

10
Máquinas de Boltzmann

11
Máquinas de Boltzmann
Funcionamento:

• Inicia camada interna randomicamente.

• Recebe insumo x.

• Calcula (probabilidade condicional que o neurônio seja ativado):

𝑦 = 𝜎 𝑥𝑤 + 𝑏ℎ

12
Máquinas de Boltzmann
Funcionamento:

• Y é devolvido para a camada interna para reconstrução.

• Calcula:
𝑟 = 𝜎 𝑦𝑤 + 𝑏𝑣

• Intuição: varável latente

13
Máquinas de Boltzmann

Aprendizado pela Divergência Contrastiva

A divergência contrastiva é uma técnica de treinamento alternativa


para aproximar a inclinação gráfica que representa a relação entre os
pesos de uma rede e seu erro, chamada de gradiente. Como a maioria
dos algoritmos de aprendizado probabilístico tenta otimizar o valor da
probabilidade logarítmica, esse gradiente representa a direção
desejada de mudança, de aprendizado, para os parâmetros da rede.

14
Máquinas de Boltzmann
Funcionamento:

• A diferença entre entrada e r é verificada pela divergência de


Kullback-Leibler.

• Fase negativa e positiva

15
Máquinas de Boltzmann

16
Máquinas de Boltzmann
Aplicações:

• Redução de Dimensionalidade

• Exemplo: problema com muitas variáveis.

17
Máquinas de Boltzmann
Aplicações:
• Sistemas de recomendação
• Reconstrução de imagem

18
Máquinas de Boltzmann
Exemplo: caso da NETFLIX

• Recomendação baseada em conteúdo – escolha semelhante ao que


você já faz

• Recomendação baseada em filtragem colaborativa – perfis


semelhantes

https://tecnetit.com.br/como-a-netflix-usou-a-data-science-para-melhorar-seu-sistema-de-
recomendacao/#:~:text=Para%20sua%20solu%C3%A7%C3%A3o%20eles%20usaram,dimensional%20ideal%20para%20seus%20usu%C3%A1rios.

19
DBN
Deep Belief Networks

• Caso mais generalizado da Máquina restrita de Boltzmann.

• Empilhar máquinas restritas de Bolztamnn

20
DBN

Fonte: https://www.deeplearningbook.com.br/

21
Autoencoder

• Objetivos muito semelhantes à Máquina de Boltzmann

• Reconstrução de input

• Redução de dimensionalidade

22
Autoencoder

23
Autoencoder

• Autoencoder é como um funil

• Passa a informação e a restringe em um número menor de camadas

• Após isso tentamos reconstruir a informação

24
Autoencoder

• Etapa de “encode” – codifica a imagem em uma dimensionalidade


menor:
ℎ = 𝑓(𝑥)
• Etapa de “decode” – decodifica a imagem de forma a reconstruir o
input.
r = 𝑓(ℎ)
• Diferença com relação à máquina restrita de boltzmann

25
Autoencoder

26
Autoencoder

https://douglasduhaime.com/posts/visualizing-latent-spaces.html

27
Tipos de Autoencoder
• Deep Autoencoder

28
Tipos de Autoencoder
• Autoencoder Esparso
• Aplica-se termo de regularização

29
Tipos de Autoencoder
• Autoencoder Denoising

30
Tipos de Autoencoder
• Autoencoder Contrativo

• Diferença com relação ao denoising – inclui penalidade na função


custo

• Denoising inclui nos dados de treinamento

• Obtem resultados mais interessantes que o denoising

31
GAN
• Redes Adversárias Generativas

• “a ideia mais interessante nos últimos 10 anos em Machine


Learning”

• Duas redes competindo

• Modelo Generativo

32
GAN

33
GAN

• Como obter y dado x?

• Modelos generativos modelam a distribuição de classes individuais.

• Modelos discriminativos aprendem a fronteira entre classes.

34
GAN

35
GAN
• Exemplo MNIST

• Gerador irá gerar imagens “fake”

• Passaremos imagens reais junto com as geradas

• O discriminador deve reconhecer as imagens e fazer a diferença

36
Parte prática

37
GAN
• Realizamos o backpropagation

• O gerador irá gerar imagens cada vez melhores

• O discriminador deverá ficar cada vez melhor em discriminar

• O discriminador obtém imagens reais e falsas e retorna


probabilidades, um número entre 0 e 1, com 1 representando uma
previsão de imagem autêntica e 0 representando previsão de imagens
falsas (geradas pela rede generativa).

38
Discussão

39
OBRIGADO!
https://www.linkedin.com/in/jeronymo-marcondes-585a26186

40
Webinar MBA DSA
18/08/2023
Professores

Helder Prado
Renato Máximo
Wilson Tarantin Jr.
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
2
Modelos de classificação ou regressão?

• Depende do tipo da variável dependente (Y)

• Modelos de machine learning com a finalidade de classificação ou regressão

• Quando Y for qualitativa → classificação


• Quando Y for quantitativa → regressão

• As árvores de decisão servem de base para as Random Forests e também servem


como base para métodos de boosting

• Podem apresentar boa capacidade preditiva, mesmo em bancos de dados complexos

3
Uso de dados de treino e teste

• Treinamento e avaliação do modelo

• Ao utilizar dados de treino e teste, o objetivo é desenvolver o modelo na amostra de


treino e, em seguida, avaliar sua capacidade preditiva na amostra de teste

• É fundamental quando os modelos de machine learning têm propensão ao overfitting


• Amostra de teste: para avaliar a capacidade preditiva em dados não conhecidos pelo modelo

• Algumas características importantes nos dados de treinamento

• Quantidade suficiente de dados: amostras muito pequenas podem prejudicar a generalização


• Dados representativos da população que deseja estudar e generalizar
• Dados de qualidade (sem erros de mensuração, outliers, ruídos) e com variáveis relevantes
4
Overfitting

• Ajuste excessivo aos dados de treino

• Se for deixado sem restrições, o modelo fica livre e pode se aderir aos dados de treino

• Na amostra de treinamento, a capacidade preditiva torna-se bastante elevada


• No entanto, na amostra de teste a capacidade preditiva fica bastante reduzida
• Quando ocorre overfitting, não há generalização dos resultados e o modelo não consegue fazer
boas previsões para novas observações (aquelas que não foram usadas para treinar o modelo)

• Uma solução para evitar o overfitting é reduzir a liberdade do modelo na amostra de


treinamento. É comum utilizar hiperparâmetros que regulam o modelo treinado

5
Critérios de avaliação – classificação

• Como identificar a qualidade das estimativas?

• Acurácia: percentual de classificações corretas em relação ao total de observações analisadas, isto é,


trata-se da eficiência geral do modelo

• Sensibilidade: percentual de classificações corretas considerando apenas as observações que são


evento. Esta medida também é chamada de Recall

• Especificidade: percentual de classificações corretas considerado apenas as observações que não são
evento

• Para uma variável Y com 2 categorias, estabelece-se um cutoff para classificação, isto é, um ponto de
corte acima do qual a observação é classificada como “evento“ e abaixo do qual é “não evento”

6
Critérios de avaliação – classificação

• Analisando uma matriz de confusão

𝑽𝑷 + 𝑽𝑵
𝑨𝒄𝒖𝒓𝒂𝒄𝒊𝒂 =
Sensibilidade Especificidade (𝑽𝑷 + 𝑭𝑵 + 𝑽𝑵 + 𝑭𝑷)

𝑽𝑷
𝑺𝒆𝒏𝒔𝒊𝒃𝒊𝒍𝒊𝒅𝒂𝒅𝒆 =
(𝑽𝑷 + 𝑭𝑵)
Observado (Real)
𝑽𝑵
𝑬𝒔𝒑𝒆𝒄𝒊𝒇𝒊𝒄𝒊𝒅𝒂𝒅𝒆 =
Sim Não (𝑽𝑵 + 𝑭𝑷)

Sim VP FP 𝑽𝑷
Predito (Modelo) 𝑷𝒓𝒆𝒄𝒊𝒔𝒊𝒐𝒏 =
(𝑽𝑷 + 𝑭𝑷)
Não FN VN
𝑷𝒓𝒆𝒄𝒊𝒔𝒊𝒐𝒏 𝒙 𝑹𝒆𝒄𝒂𝒍𝒍
𝑭𝟏 𝑺𝒄𝒐𝒓𝒆 = 𝟐𝒙
𝑷𝒓𝒆𝒄𝒊𝒔𝒊𝒐𝒏 + 𝑹𝒆𝒄𝒂𝒍𝒍

7
Critérios de avaliação – classificação

• Como identificar a qualidade das estimativas?

• Curva ROC

• É um gráfico que mostra a variação da sensibilidade em função de 1 – especificidade

• Independe da escolha de um cutoff para a classificação

• Pode-se avaliar um modelo com base na área abaixo da curva ROC (AUC):

• Quanto maior a AUC, melhor a capacidade preditiva do modelo na amostra em análise


• Maiores AUC indicam maiores sensibilidade e especificidade

8
Critérios de avaliação – classificação

• Como identificar a qualidade das estimativas?

Classificador Ideal:

• Sensibilidade = 100%
• 1 – Especificidade = 0%

Fonte: Fávero e Belfiore (2017, Capítulo 13)


9
Critérios de avaliação – regressão

• Como identificar a qualidade das estimativas?

• Um parâmetro analisado é o erro de predição. Calcula-se um erro que fundamenta-se


na diferença entre os valores observados e previstos para as observações em estudo

𝟏
• É comum usar o Erro Quadrático Médio: MSE = σ𝒏𝒊=𝟏(𝒚𝒊 − 𝒚
ෝ𝒊 )²
𝒏

• Quanto menor o erro, melhor a capacidade preditiva do modelo

• Também é comum avaliar por meio do R²: mostra o percentual da variância da variável
Y observada que é explicada pelo modelo
• Quanto maior o R², melhor. Mais o modelo captura a variabilidade em Y observado
10
Hiperparâmetros

• Elementos responsáveis pelo ajuste do modelo

• Os ajustes de hiperparâmetros são responsáveis por reduzir o overfitting e também


por melhorar a qualidade das estimativas e capacidade preditiva

• Cada modelo de machine learning tem seus hiperparâmetros específicos, mas os


modelos baseados em árvores de decisão têm como mais comuns:

• Profundidade máxima das árvores, número mínimo de observações em dado nó para que seja
realizada sua divisão, número mínimo de observações em um nó folha, a própria quantidade de
árvores estimadas (se não for um modelo de árvore única), taxa de aprendizagem nos modelos
boosting, dentre outros...

11
Grid Search

• Escolha de hiperparâmetros

• Os hiperparâmetros podem ser selecionados por meio de diversas simulações para


encontrar uma combinação ótima para seus valores

• Um passo a passo para a realização do Grid Search pode ser o seguinte:

• Escolher os hiperparâmetros que serão ajustados e seus possíveis valores


• Criar uma lista com as diversas combinações de valores dos hiperparâmetros
• Rodar os modelos com cada uma das combinações de hiperparâmetros
• Obter uma medida de avaliação para cada modelo (por exemplo: erro de classificação ou MSE)
• Atribui-se a melhor combinação de hiperparâmetros ao modelo com a melhor avaliação

12
Validação Cruzada

• O intuito é evitar (ou reduzir) o overfitting

• A validação cruzada (cross-validation) é um método em que a amostra disponível é


dividida em partes. Algumas partes são utilizadas para treino, ou seja, estimação e
ajuste de hiperparâmetros, e outra parte fica para teste

• Por exemplo, divide-se a amostra em 5 partes iguais:

• 4 partes são utilizada no treinamento do modelo e 1 parte é utilizada para teste


• Como há 5 iterações, a cada iteração do modelo as partes treino e teste mudam de status

• A validação cruzada pode ser aplicada mesmo que exista a divisão inicial treino/teste

13
Referências

Fávero, Luiz Paulo; Belfiore, Patrícia. (2017). Manual de análise de dados: estatística
e modelagem multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier

Therneau, Terry M.; Atkinson, Elizabeth J. An Introduction to Recursive Partitioning


Using the RPART Routines. Mayo Foundation. October 21, 2022.

14
OBRIGADO!

15
15
COLETA DE DADOS:
CRAWLERS E WEB
SCRAPING
Prof. Dr. Jeronymo Marcondes
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Introdução

3
Introdução

• Plano de ataque:

1. Entendimento básico de como funciona a web.


2. Entendimento básico de HTML.
3. Entendimento básico de XML e JSON.
4. web scraping e o foco do curso.
5. Uso do R e de pacotes para realizar a operação.
Necessidade de Dados

• Muitos dados importantes = espalhados na web

• Locais mais comuns: webpages e APIs.

• Outras possibilidades: Servidores de FTP, por exemplo.

• Como recuperar dados da web e tratar a informação de forma a podermos


utilizá-la e modelos e análises?
Estruturas de Dados
5 1
Os dados que podemos utilizar dividem-se em:
0 9 8-
73 .
5 .2
• Dados Estruturados. a 31
h i d
s
i Yo
• Dados Semiestruturados. u sh
Ats
eo
l
ar c
• Dados não estruturados.
M
Fonte: https://universidadedatecnologia.com.br/
• Estruturados - são os dados que detêm formatos bem definidos, como os
extraídos de planilhas ou bancos de dados relacionais no formato SQL.
• Semiestruturados – Semelhantes aos dados estruturados, mas não
obedientes na totalidade quanto à forma. Nesta linha estão os registros de
linguagens baseadas em HTML e XML.
• Não estruturados ou NoSQL - não possuem um formato específico, são os
dados coletados na sua forma original, como um texto, um vídeo, um
fragmento de email, um log de sistema ou ainda uma mera foto.
Estruturas de Dados

• Como utilizar informação semiestruturada ou não estruturada que


está na web, captá-la e armazená-la?

• WebScraping:
Introdução à web

• HTTP

HTTP é um protocolo que permite a obtenção de recursos, como


documentos HTML. É a base de qualquer troca de dados na Web e um
protocolo cliente-servidor, o que significa que as requisições são iniciadas
pelo destinatário, geralmente um navegador da Web.
Introdução à web

Fonte: https://developer.mozilla.org/pt-BR/docs/Web/HTTP/Overview
Introdução à web

Clientes e servidores se comunicam trocando mensagens individuais. As


mensagens enviadas pelo cliente, geralmente um navegador da Web, são
chamadas de solicitações (requests), ou também requisições, e as
mensagens enviadas pelo servidor como resposta são chamadas
de respostas (responses).
Métodos de requisição
5 1
0 9 8-
73 .
5 .2
• Conjunto de tipos de requisição que indicam 3 1 o que fazer
i d a
osh
• HTTP verbs i Y
u sh
At s
e o
ltodos
• Não vamos estudar
ar c
M
Métodos de requisição

GET
O método GET solicita a representação de um recurso específico.
Requisições utilizando o método GET devem retornar apenas dados.

POST
O método POST é utilizado para submeter uma entidade a um recurso
específico, frequentemente causando uma mudança no estado do recurso
ou efeitos colaterais no servidor.
Métodos de requisição
5 1
0 9 8-
73 .
5 .2
DELETE
a 31
i d
sh específico.
O método DELETE remove um recurso
o
i Y
sh
CONNECT su
At
el o
O método CONNECT
ar c estabelece um túnel para o servidor identificado pelo
M
recurso de destino.
HTML
5 1
0 9 8-
73 .
5 .2
• HTML
a 31
h i d
s
• HyperText Markup Languagehi Yo
s u s
t
loA
e
a r c
• Linguagem posicional
M
HTML

http://www.r-datacollection.com/materials/html/OurFirstHTML.html
HTML

• Mais informações do que aparecem

• Etiquetas que mostram onde vai o conteúdo

• Explicam a estrutura do documento – sem layout

https://www.w3schools.com/html/html_basic.asp
HTML básico

Exemplo simples:

<!DOCTYPE html>
<html>
<body>
<h1>My First Heading</h1>
<p>My first paragraph.</p>
</body>
</html>
HTML - elementos

• Um elemento inicia com uma start tag <“nome da tag”> e finaliza com
end tag <\”nome da tag”>

• Tags aninhadas – exemplo anterior


HTML

• Doctype

• <html> e </html>

• <body> e </body> - todos elementos em uma página, como os headings,


parágrafos, imagens, hiperlinks, etc
HTML
5 1
0 9 8-
73 .
5 .2
• Heading (h1, h2, h3, h4, h5 e h6)
a 31
h i d
s
• Parágrafos <p> e </p> i Yo
u sh
Ats
elo
ar c
M
HTML

• Hiperlink: <a> e </a>:


HTML

• div: <div> e </div>: define uma divisão ou seção de uma página HTML
• Container para um conjunto de tags HTML – características específicas de
uma parte específica da página.

Fonte: https://www.geeksforgeeks.org/
HTML

• Atributos: informação adicional sobre os elementos

• Id e Class
HTML
API

• Novas formas de compartilhar dados na web

• Crescente o uso de APIs: Application Programming Interface

• Conjunto de definições, protocolos e regras para criar integrações entre


sistemas.
API
5 1
0 9 8-
73 .
• Como ela funciona: 5 .2
3 1
i
1. Aplicação cliente envia requisição para d a API
osh
Y
2. API verifica se a requisição é válida
i
sh
3. Se for válida processa osunecessário para resposta
A t
4. A API transfere oslodados para a aplicação cliente
c e
M ar
• Exemplo: IBGE
API
5 1
0 9 8-
73 .
• Arquitetura REST 5 .2
31 a
h i d
s
oas características do mesmo, como por
• Mesmos verbos do HTTP – utiliza i Y
u sh
exemplo:
At s
l o
1. Protocolo cliente-servidor
e
ar c
2. Mensagens MHTTP
API

• Vantagens para as empresas – microserviços

• Retorno dos dados: maior parte das vezes JSON

• Mas, tipo de retorno pode ser variado


XML

• Uma das formas mais populares de trafegar dados na web


• Mesma base markup do HTML, mas ao invés de mostrar informação, o
objetivo é guardar dados.
• Dados guardado em um texto puro – qualquer navegador ou sistema
operacional consegue entender
• Tags auto descritivas
XML
XML

• Características:
1. Versão do XML
2. Tags de início e fim
3. Elementos
4. Atributos
5. Dados
6. Estrutura em árvore – nós pais e filhos
XML
JSON
JSON

• Características:
1. Baseada em objetos (semelhante aos elementos do XML)
2. Baseada na divisão de pares key\value
3. Keys estão sob aspas duplas
4. Valores são precedidos de dois pontos
5. Valores estarão sob aspas duplas se forem campos de texto
6. Array são definidos por colchetes
Web Scraping
5 1
0 9 8-
73 .
• Como buscar a informação? 5 .2
31 a
h i d
s
oem HTTP, como GET
• Pacotes que executam os verbos i Y
u sh
At s
• Pacotes httr e rvestel o
ar c
M
Web Scraping

• Retorno como texto

• PARSE

• Busca a informação em determinado ponto


Web Scraping

Discussão: web scraping é ilegal?


OBRIGADO!
linkedin.com/in/jeronymo-marcondes-585a26186

40
TEXT MINING,
SENTIMENT ANALYSIS E
NLP
Prof. Dr. Jeronymo Marcondes
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Introdução

3
Plano de ataque

1. Conceitos básicos de text mining:


• Técnicas de extração do texto;
• Uso do Tidytext;
• Bag of words
• Conceitos importantes: stop words, stemming, etc
• N gramas
• Modelo em tópicos
2. TF-IDF e Análise de sentimentos
4
Introdução

• Do que estamos falando?

• O que é PLN?

• Por que PLN? Diferença com relação à Linguagem de Computação

• Qual a ideia do funcionamento?

5
Fontes para PLN

Fonte: https://medium.com/swlh/nlp-text-preprocessing-techniques-ea34d3f84de4

6
Introdução

7
Introdução

• Dificuldades com NLP:

1. Sarcasmo

2. Conhecimento de domínio comum

3. Ambiguidade

8
Introdução

• Abordagens:

1. Heurística

2. Machine Learning e Deep Learning

9
Introdução

10
Origem

• Alan Turing

• Como identificar uma máquina?

• Até os anos 80 – várias regras

• Início do Machine Learning

11
Usos

• Mecanismos de busca na internet


• Chatbots
• Assistentes virtuais
• Análise de texto – exemplo de artigo
• Spam filter

12
PLN Pipeline

13
Text Mining
• O que é text mining?

Fonte: https://www.javatpoint.com/text-data-mining

14
Tidytext e Tidydata

• Hadley Wickham:

1. Cada variável é uma coluna


2. Cada observação é uma linha
3. Cada unidade observacional é a tabela

• Um token por linha!

15
Token

TOKEN = Para mineração de texto organizada, o token armazenado em


cada linha geralmente é uma única palavra, mas também pode ser um n-
grama, frase ou parágrafo.

Menor unidade que importa do texto!

16
Tokenização

Fonte: https://aiplusinfo.com/

17
Token
• “Eu serei um cientista de dados”

1 Eu
2 serei
3 um
4 cientista
5 de
6 dados

• O R tem funções muito boas para esse processo no pacote tidytext

18
Unnest Token

text <- c("Because I could not stop for Death -",


"He kindly stopped for me -",
"The Carriage held but just Ourselves -",
"and Immortality")

text_df <- tibble(line = 1:4, text = text)

text_df %>% unnest_tokens(word, text)

19
Unnest Token

• Perceba como a função é útil:

1. Transforma todas as letras em minúscula;


2. Tira pontuação;

• Outros pacotes – tem que fazer manualmente.

20
Unnest Token

21
Bag of Words

• Muito interessante para compreender o texto

• Verifica a frequência dos termos e conta os mesmos ou variável binária que indica
presença ou não

• Não é a abordagem em questão – podemos chegar em algo semelhante com dplyr

Bag-of-words (BoW) é um modelo de linguagem estatística usado para analisar texto e


documentos com base na contagem de palavras. O modelo não leva em conta a ordem
das palavras em um documento.

22
Bag of Words

https://www.medium.com/

23
Bag of Words

• Essa contagem é muito útil para diversos problemas:


1. Verificar termos mais comuns;
2. Verificar termos menos comuns;
3. Verificar similaridade entre termos e sua quantidade no texto.
• Bag – desconsidera qualquer ordem
• Próxima aula iremos mostrar o TF-IDF

24
Data Cleaning

• Muitas palavras devem ser retiradas do texto a depender do que se está


extraindo (data cleaning):
1. Números;
2. Emoji;
3. Caracteres especiais
4. Espaço em branco
5. etc

25
Stop Words

• Todas as palavras carregam sentido? Algumas carregam pouco ou


nenhum: stop words

• https://gist.github.com/alopes/5358189

• De, para, que, etc

26
Stop Words

• Grande quantidade de listas disponíveis: usar listas pré prontas

27
Stop Words

• Aceitável: lista pronta com ajustes

• Toda stop word tem de ser retirada?

• Anti join

Data_frame %>% anti_join(get_stopwords(source = "snowball"))

28
Stemming

• Stemming é o processo de reduzir palavras flexionadas (ou às vezes


derivadas) ao seu tronco (stem), base ou raiz, geralmente uma forma da
palavra escrita.

Fonte: https://www.alura.com.br

29
Stemming
• Diferença com lematização

https://www.computersciencemaster.com.br/como-reduzir-uma-palavra-ao-seu-radical-em-python-stemming/

30
Stemming

• Diferentes abordagens

• Devemos fazer stemização?

31
Token n-gram

• O que é bigrama e n-grama?

https://devopedia.org/n-gram-model

32
Token n-gram
• Qual a importância?

33
Correlação

• Há como medir se duas palavras tendem a ocorrer simultaneamente em um


documento?

• Tidytext é muito útil para isso

• Correlação de pares – pairwise correlation

• Valor de phi – correlação de Pearson

34
Token n-gram – Correlação

https://www.spss-tutorials.com/pearson-correlation-coefficient/

35
Topic Modelling

• Modelo não supervisionado que permite aproximar partes de


documentos por tópicos semelhantes.

• Utilidade prática

• Método LDA

36
Final

• Parte prática

• Próxima aula

37
OBRIGADO!
https://www.linkedin.com/in/jeronymo-marcondes-585a26186

38
TEXT MINING, SENTIMENT
ANALYSIS E NLP
Prof. Dr. Jeronymo Marcondes
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Plano de ataque

• TF-IDF

• Análise de sentimentos palavra a palavra

• Análise de sentimentos com algoritmo supervisionado

3
Plano de ataque

4
TF-IDF

• 3 formas de se representar um conjunto de textos (nessa aula):

1. Bag of words
2. Bag of n-grams
3. TF-IDF

5
TF-IDF

• Qual a importância de uma palavra em um texto?

• A depender da escolha anterior – resposta diferente

• Alguns exemplos para bag of words: “para”, “com”, “nome”, etc

6
TF-IDF

• Stop words ou não, algumas palavras são mais comuns – nem sempre a
melhor forma

• Bag of words escolhe a palavra mais comum no word count

• Isso faz com que percamos informação relevante

7
TF-IDF

• Não podemos levar em conta apenas a frequência (tf), mas também o


comportamento das palavras ao longo de um conjunto de documentos:
“corpus”

• Outra abordagem é observar a frequência de documento inversa (idf) de


um termo, o que diminui o peso de palavras comumente usadas e
aumenta o peso de palavras que não são muito usadas em uma coleção
de documentos.

8
TF-IDF

• Lei de ZIPF:

A lei de Zipf afirma que no conjunto de dados de uma linguagem, a


frequência de uma palavra é inversamente proporcional a sua posição na
lista global de palavras depois de classificadas por sua frequência de
forma descendente.

Fonte: https://www.wolfram.com/

9
TF-IDF

• TF-IDF visa verificar o quanto uma palavra é importante em um


documento

• Intuitivamente, a palavra tem que aparecer muito em um determinado


documento, mas sua frequência nos demais documentos não pode ser
tão grande

10
TF-IDF

Fonte: Text Mining with R: a tidy approach

11
Classificação de texto

• Um dos objetivos mais comuns de NLP

• Colocar um texto em uma categoria.

• O desafio da classificação de textos é “aprender” essa categorização a


partir de uma coleção de exemplos para cada uma dessas categorias e
prever as categorias para novos.

12
Classificação de texto

• A classificação de texto é uma técnica de aprendizado de máquina que


atribui um conjunto de categorias predefinidas ao texto aberto.
• Exemplos:
1. Detecção de falas abusivas
2. Spam Filter
3. Label em tópicos

13
Análise de Sentimentos

• Uma das principais formas de categorização: Análise de Sentimentos

• Qual o sentimento envolvido em um texto?

• Exemplo: Críticas de um produto em um site.

14
Análise de Sentimentos

• Abordagens de análise de sentimentos

• Análise de Sentimentos baseada em palavras

• Abordagem baseada em Machine Learning.

15
Abordagem Heurística

16
Datasets de Sentimentos

• AFINN, bing, nrc.

• Baseados em definição de sentimentos por palavras = unigramas.

• Contém as palavras e os respectivos “scores” de cada uma.

17
Datasets de Sentimentos

• Métodos baseados em dicionário, como os que estamos discutindo,


encontram o sentimento total de um pedaço de texto somando as
pontuações de sentimento individuais para cada palavra no texto.

• Sentimento de um texto = valor líquido da soma dos sentimentos de cada


palavra.

18
Procedimento

1. Unnest tokens

2. Datasets de Sentimentos

3. Inner Join

19
Procedimento

20
Limitações

• Falta de contexto

• Ordem não importa

• Dificuldade de generalização – não há “aprendizado”

21
Pipeline NLP

• Construir modelo de ML

• Diferentes modelos

• Iremos abordar: Naive Bayes e Support Vector Machine

22
Métodos ML para NLP

• Qual o objetivo?

• O que procuramos fazer?

• Usos

23
Naive Bayes

• Baseado no teorema de Bayes

• Suponha dois eventos A e B.

𝑃(𝐵|𝐴)×𝑃(𝐴)
•𝑃 𝐴𝐵 =
𝑃(𝐵)

24
Naive Bayes

• Naive Bayes é um modelo probabilístico baseado no Teorema de Bayes


que pode ser utilizado para classificar texto com base nos dados de
treinamento.

• Ele estima a probabilidade condicional de uma determinada label ser


gerada por uma feature: calcula a probabilidade de ocorrência de cada
label sozinha e depois avalia como cada feature pode contribuir para
determinados valores.

25
Naive Bayes

Fonte: Natural Language Processing with Python

O mais comum são labels de automobilismo, portanto começa ali.


Aparecem as palavras “dark” (indicador fraco de mistério) e “football”
(indicador forte de esportes).

26
Naive Bayes

https://www.statlearning.com/

27
Support Vector Machine

• Busca encontrar o melhor hiperplano separado entre duas classes

• 3 possibilidades: classificador de margem máxima, classificador de


margem flexível e classificador de margem não linear.

28
Support Vector Machine

Fonte: Ciência de Dados - Morettin

29
Support Vector Machine

Fonte: Ciência de Dados - Morettin

30
Support Vector Machine

Fonte: https://researchgate.com/

Fonte: Elements of Statistical Learning

31
Margem Flexível

Fonte: https://scikit-learn.org/

32
Support Vector Machine

• Objetivo: separar as classes = classificar os textos

• Função objetivo:

1. Maximizar a margem.
2. Sujeito ao fato de que cada ponto deve ser maior que a margem.
3. E sujeito a um possível termo de erro nos modelos de margem flexível.

33
Performance
• Nem sempre a melhor solução de primeira.

34
Discussão
Futuro de NLP e tendências.

35
OBRIGADO!
linkedin.com/in/jeronymo-marcondes-585a26186

36
INTRODUÇÃO AO
BLOCKCHAIN E SUAS
APLICAÇÕES

Prof. Fabio Junges

1
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
2
3
4
5
Por que estas plataformas falharam: Centralização -
Centralização -
Gasto duplo -
Gasto duplo - Regulamentação -
Regulamentação -
Uso para fins ilícitos - Uso para fins ilícitos -

6
1 ) O problem a do g a sto duplo

Solução tradicional:

O problema do utilizar um intermediário


gasto duplo garantidor

Elimina o gasto duplo


sem a necessidade
de um intermediário
7
2 ) A desinterm edia çã o

Antes Intermediário
Ana Beto

Depois
More secure, reliable
Ana Beto

Transações entre duas partes (P2P)


sem o intermediário garantidor
8
3 ) Ba se de da dos distribuída (ledg er distribuído)

Ledger Ledger
centralizado

Ledger

Ledger
Ledger

Banco Bitcoin

9
10
http:/ / historyofbitcoin.org/
Artigo seminal publicado
por Satoshi Nakamoto
31/out/2008

Satoshi 1BTC = US$ 1.242


Market cap
Nakamoto 19/ nov/ 2013
Famosa compra das US$ 1 bilhão
2 pizzas por 10.000 BTC 28/mar/2013
22/ mai/ 2010
(Hoje = R$ 560 milhões)

Primeira transação London BTC


entre Nakamoto e Finney 1 BTC = US$ 1 Conference 1 BTC = US$ 266
12/jan/2009 9/ fev/ 2011 15/set/2012 10/ abr/ 2013

Primeiro
FBI fecha Silk Road
bloco da
2/out/2013
Blockchain Market cap 1BTC = US$ 10
3/ jan/ 2009 US$ 1 milhão 2/jun/2011
bitcoin.org 6/nov/2010
foi registrado
18/ago/2008 1BTC = US$ 30 1BTC = US$ 74,90
1 US$ = 1.309,03 BTC 22/ fev/ 2013 21/mar/2013
5/ out/ 2009

Fonte: History of Bitcoin

11
Econômica É uma nova forma de dinheiro, e pode se
manifestar de duas formas:

- Moeda, como o Real, Dólar ou Euro

- Ativo financeiro (investimento), como o


Ouro, Ações ou Commodities

global
livre mercado

Uma nova forma de puramente digital


dinheiro: digital, global e divisível por 100 milhões
distribuído não governamental
limitado a 21 milhões de unidades

12
Blockchain
Blockchain é uma é uma
basebase de dados
de dados
distribuída
stribuída (DLT)(DLT)
digital
digital
registro
egistro
que torna
que torna possível
possível
de transações
de transações
criarcriar
um um
que podem
que podem Tecnológica
Tecnológica
ser compartilhadas,
ser compartilhadas, monitoradas
monitoradas e e
mantidas
mantidas por uma
por uma rederede distribuída
distribuída de de
computadores.
computadores. UmaUma cadeia
cadeia de blocos
de blocos
onectados
conectadossequencialmente,
sequencialmente,cadacada
blocobloco
com com
um conjunto
um conjuntode transações
de transações

segurança
segurança
imutável
imutável Uma nova
Uma camada
nova camada
desintermediação
desintermediação tecnológica no no
tecnológica mundo
mundo
nãonão
falsificável
falsificável Blockchain
Blockchain
ledger distribuído
ledger distribuído Internet
Internet
Energia elétrica
Energia elétrica
resolve o gasto
resolve duplo
o gasto duplo
13
Econômica Tecnológica

Econômica Tecnológica
Uma nova forma Uma nova camada
de dinheiro tecnológica no mundo
Digital Blockchain
Global Internet
Distribuído Energia elétrica
Uma nova forma Uma nova camada
de dinheiro tecnológica no mundo
Digital Blockchain
Global Internet
Distribuído Energia elétrica

14
Arquitetura e fundamentos

15
Um protocolo
Uma linguagem

16
https://bitbonkers.netlify.app
17
Cha ve pública e cha ve priva da

Chave Chave
pública privada

A chave pública representa A chave privada serve para


o endereço deste cofre assinar/autorizar transações

18
Cha ve pública e cha ve priva da

A chave privada é um número escolhido aleatoriamente


No Bitcoin é número de chaves privadas possíveis é de:
160
2 = 1.461.501.637.330.902.918.203.684.832.716.283.019.655.932.542

19
Cria ndo nossa s prim eira s ca r teira s
Single Wallet
Paper Wallet
Brain Wallet

20
utilizada para g
chave privada qu
para “assinar" as
No Bitcoin, uma carteira é
utilizada para gerenciar a
chave privada que é utilizada
para “assinar" as transações

O seu bitcoin nunca está na carteira. Ele é representado como


um saldo lá na blockchain, no endereço da sua chave pública
O seu bitcoin nunca está na carteira. Ele é representado como
um saldo lá na blockchain, no endereço da sua chave pública

21
# 1 Ativo Fina nceiro
Como ativo financeiro, BTC pode ser
comprado ou vendido (semelhante a ações)

Funciona como reserva de valor (expectativa


de valorização futura)

Muitas vezes comparado ao ouro, fazendo


emergir a expressão “Ouro Digital"

É um ativo de risco, alto risco (embora tenha


mostrado bons retornos no longo prazo)

22
23
Abrir conta em uma corretora Realizar uma transferência (em R$) Escolher entre as (muitas) opções de moedas
para a sua nova conta na corretora digitais disponíveis e efetivar a compra
de criptomoedas 100% online

Saldo:
R$ 250,00

Agora você já possui Bitcoins em Para aumentar a segurança, transfira Defina onde você vai armazenar
sua carteira digital na corretora seu saldo para uma carteira mais segura as informações das suas moedas

Saldo: Saldo:
0,042 BTC 0,042 BTC

E acompanhe a cotação da moeda


em sites como o
www.coinmarketcap.com

24
25
Ex cha ng es e os seus Bitcoins
Uma ou mais wallets?
Como é a segurança?
A wallet com as chaves privadas
Quais procedimentos de backup?
é gerenciada pela exchange
Quem tem acesso?
Como são os registros?

Cada cliente vê
apenas o seu BTC = 0,003 BTC = 1,04 BTC = 10 BTC = 0,0002 BTC = 3

saldo na sua conta

26
27
Ca r teira s e os seus Bitcoins

BTC = 3

BTC = 10

BTC = 0,003

BTC = 0,0002

BTC = 1,04

Cada um gerenciando a sua carteira: segurança, backup, devices, acessos, etc

28
29
REASONS TO

BELIEVE
30
31
2 A criação de um

Hoje Amanhã
Sistemas para pagamentos (Visa, Master, Paypal) Bitcoin é um sistema que pode unificar TODAS
Sistemas para transações entre bancos estas transações entre diferentes partes
Sistemas para transações entre países
Sistemas para transações entre empresas Além de criar o primeiro sistema para transações
Sistemas para transações com governo P2P em escala global

32
33
34
4 Restrições
Restrições do
do sistema sistema
atual e as atual e as
4
crianças entrando nesse mercado
crianças entrando
Restrições nesse
do sistema atualmercado
e as
4
crianças entrando nesse mercado

As crianças de hoje jamais terão uma conta bancária


ou uma carteira de motorista
ou transações em papel

(você ainda tem fax, vídeo cassete ou walkman em casa?)


As crianças de hoje jamais terão uma conta bancária
ou uma carteira de motorista
ou transações em papel
As crianças de hoje jamais terão uma conta bancária
(você ainda tem fax, vídeo cassete ou walkman em casa?)
ou uma carteira de motorista
ou transações em papel
35
(você ainda tem fax, vídeo cassete ou walkman em casa?)
36
36
6 Bitcoin foi criado para um mundo com
internet, os outros sistemas não
6 Bitcoin foi criado para um mundo com
internet, os outros sistemas não

37
38
38
39
8 Inversão de infraestrutura já ocorreu várias
vezes na sociedade moderna

40
41
42
43
44
45
46
47
48
49
50
51
52
https://mittechreview.com.br/muito-alem-do-nft-metaversos-web3-e-o-futuro-digital/?share=whatsapp

53
54
55
| Possíveis implementações
PÚBLICA

Leitura pública e acesso Leitura pública e acesso


restrito para escrita público para escrita

FECHADA ABERTA
(permissioned) (permissionless)

Leitura restrita e acesso Leitura restrita e acesso


restrito para escrita público para escrita

PRIVADA

56
Smart Contracts Tokens

Vitalik
2015 Buterin

57 57
58
| Tokenização de ativos

Tokens são a representação digital única de um ativo


qualquer, devidamente registrados em uma blockchain

| Tokens utilitários (utility)


| São os próprios ativos, representam eles mesmos

RMG | Tokens representativos (security)


EOS | Representam algum outro ativo, um bem subjacente
Equities
(Há um debate sobre o enquadramento destes tokens como valores mobiliários)

Tokens fungíveis

59
Tokens não fungíveis

60
61
62
63
NBA Top Shot

https://www.businessinsider.com/most-expensive-nft-list-top-selling-nfts-crypto-art-sales-2021-3

64 64
https://www.theverge.com/2021/3/11/22325054/beeple-
christies-nft-sale-cost-everydays-69-million

65
https://thenextweb.com/news/nike-blockchain-sneakers-cryptokick-patent

66
67
68
Tokens fungíveis

Tokens (fungíveis) que representam créditos de carbono

69
70
71
72
73
74
Bases distribuídas
para armazenar
dados estatísticos

• Registro de terras,
nascimentos, posse
•Registros acadêmicos
e de patentes
•Origem de alimentos

•Regras de negócio
pré-definidas com
cláusulas de auto
execução

A Universidade Comunitária da Região de Diversos registros precisam se tornar imutáveis


Chapecó – Unochapecó, é uma instituição depois da sua geração, como por exemplo os
comunitária, profundamente identificada com o fechamentos de diário de classe das disciplinas
desenvolvimento regional e muito atenta às (frequência, notas e conteúdos). Essa é uma das •Indústria da música
necessidades da população e das organizações mais importantes informações no transcorrer da •Automatização de
situadas em sua região de abrangência. Nascida vida acadêmica do aluno, e geralmente alvo de processos
da iniciativa de lideranças locais com o intuito de muitas tentativas de fraudes. •Aluguéis

75
Rede Ethereum
Virtual
privada Machine
Registro de cada evento que agregue valor na rede blockchain

Informações disponíveis para os atores interessados

Uso de sensores específicos em cada ponto da cadeia

Qualidade da soja influenciando o preço de venda

Novos mercados: contratos de venda futura (tokens)

Cadeia
de valor

Origem e Histórico climático Condições da Condições de Condições de Temperatura


qualidade da Pesticidas colheita armazenamento armazenamento Umidade
semente Processos Maquinário, Período Qualidade dos Período de
Data e condições operacionais pessoal, tempos estocagem grãos estocagem
climática Qualidade do grão Qualidade dos
Espaçamento das grãos
fileiras de soja

76
Rastreabilidade de qualquer
produto, insumo, equipamento,
etapa, serviços, etc

77
DeFi - Fina nça s decentra liza da s

Substituição do modelo baseada em entidades centralizadas pelo modelo baseado em blockchain

Mudança significativa no papel do usuário: CUSTÓDIA

78
79
80
81
82
83
84
85
Obrigado!

Prof. Fabio Junges


linkedin.com/in/fabiomjunges
ANÁLISE ESTATÍSTICA
ESPACIAL
Ana Cláudia S. Luciano
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
Introdução a Cartografia
Cartografia Básica

• Definição e Conceitos
• Representações Cartográficas
• Projeções Cartográficas
• Sistemas de coordenadas
• Sistemas de coordenadas geográficas
• Sistemas de coordenadas UTM

Cartografia Digital

Cartografia Temática

3
Histórico da Cartografia

• O conceito da Cartografia foi estabelecido em 1966


pela Associação Cartográfica Internacional e,
posteriormente, ratificado pela UNESCO, no
mesmo ano.
IBGE. Noções Básicas de Cartografia; Rio de Janeiro, 1998

4
Definição

• “Conjunto de estudos e operações científicas, técnicas e


artísticas que, tendo por base os resultados de observações
diretas ou da análise de documentação, se voltam para a
elaboração de mapas, cartas e outras formas de expressão ou
representação de objetos, elementos, fenômenos e ambientes
físicos e socioeconômicos, bem como a sua utilização."
IBGE. Noções Básicas de Cartografia; Rio de Janeiro, 1998

5
Definição

CARTOGRAFIA é a área do conhecimento que estuda, analisa e produz


mapas, cartas, plantas e demais tipos de representações gráficas do
espaço.

6
Contextualização

Geotecnologias •SIG
•Topografia e Geodésia
• Coletar •GNSS
Aplicações
• Processar •Sensoriamento
remoto •Agronegócio
• Analisar
•Fotogrametria •Meio Ambiente
• Disponibilizar •Cartografia •Obras de saneamento
•Governo e educação
Informação com
referência
geográfica

7
Conceitos

→Determinação da posição relativa a uma origem comum

→Para localização de pontos no plano ou no espaço usa-se sistemas para definir a


posição dos pontos em relação a uma origem.

→A escolha do sistema de coordenadas para registrar a feições geográfica depende


da forma como as feições foram coletadas e da finalidade de representação.

8
Conceitos

• Forma da Terra: A forma do planeta, é o GEÓIDE.

• A forma da Terra não é geometricamente regular;


• Geóide: é a superfície equipotencial (com potencial gravitacional constante ao longo de sua
superfície) que mais se aproxima da superfície formada pelo prolongamento dos oceanos (nível
médio dos mares);
• Modelo esférico: quando tal representação não requer tanta precisão geométrica;
• Modelo elipsoidal: quando a precisão geométrica é um fator importante para a representação.

9
Conceitos
• Modelo mais simples de representar a terra: Elipsóide

• Cada país adotou um elipsóide como referência para os trabalhos geodésicos e


topográficos, que mais se aproximasse do geóide na região considerada

Superfície de referência utilizada nos cálculos que fornecem subsídios para


a elaboração de uma representação cartográfica.

10
Representações Cartográficas

• Mapa: “representação no plano, normalmente em escala pequena,


dos aspectos geográficos, naturais, culturais e artificiais de uma área
tomada na superfície, delimitada por elementos físicos, político
administrativos, destinada aos mais variados usos, temáticos,
culturais e ilustrativos.”

IBGE. Noções Básicas de Cartografia; Rio de Janeiro, 1998

11
Representações Cartográficas

• Carta: “representação no plano, em escala média ou grande, dos


aspectos artificiais e naturais de uma superfície, subdividida em folhas
delimitadas por linhas convencionais - paralelos e meridianos - com a
finalidade de possibilitar a avaliação de pormenores, com grau de
precisão compatível com a escala”
IBGE. Noções Básicas de Cartografia; Rio de Janeiro, 1998

12
Representações Cartográficas

• Planta: Carta que representa uma área de extensão suficientemente


restrita para que a sua curvatura não precise ser levada em
consideração, e que, em consequência, a escala possa ser considerada
constante.

IBGE. Noções Básicas de Cartografia; Rio de Janeiro, 1998

13
MAPA X CARTA X PLANTA

Escala pequena Escala Média Escala Grande


Áreas Grandes Áreas Específicas Áreas específicas e
detalhadas

14
ESCALA

Distância prática e/ou gráfica.

Distância real e/ou natural

Escala é a relação entre a medida de um objeto


ou lugar representado no papel e sua medida
real.

15
ESCALA

Distância prática e/ou gráfica.

Distância real e/ou natural

16
EXERCÍCIO PRÁTICO

1) (UNICAMP) Escala, em cartografia, é a relação matemática entre as dimensões


reais do objeto e a sua representação no mapa. Assim, em um mapa de escala
1:50.000, uma cidade que tem 4,5 Km de extensão entre seus extremos será
representada com

17
EXERCÍCIO PRÁTICO

2) (UNESP) A escala cartográfica define a proporcionalidade entre a


superfície do terreno e sua representação no mapa, podendo ser
apresentada de modo gráfico ou numérico. A escala numérica
correspondente à escala gráfica apresentada é:

18
Projeções Cartográficas
• A confecção de uma carta exige, antes de tudo, o
estabelecimento de um método, segundo o qual, a cada
ponto da superfície da Terra corresponda um ponto da
carta e vice-versa.

• Para se obter essa correspondência de pontos utiliza-


se os “sistemas de projeções”.

Deformações!

19
Projeções Cartográficas

• As representações cartográficas são efetuadas, na sua maioria, sobre


uma superfície plana (p.e., MAPA). Isto compreende as seguintes
etapas:

• Adoção de um modelo matemático da terra simplificado: ELIPSÓIDE.

20
Projeções Cartográficas

• Projetar todos os elementos da superfície terrestre sobre o modelo


escolhido;

• Relacionar por processo projetivo ou analítico pontos do modelo


matemático com o plano de representação escolhendo-se uma escala
e sistema de coordenadas.

21
Projeções Cartográficas

22
Classificação das Projeções
Cartográficas

Projeções
Cartográficas

Superfície de Contatos entre


Método Propriedades
Projeção superfícies

23
Classificação das Projeções
Cartográficas

Tem base os
princípios
Geométricas
geométricos
projetivos
Método
Tem base a
Analíticas formulação
matemática

24
Classificação das Projeções
Cartográficas
Superfície
de
Projeção

Planas Cônicas

polar equatorial Oblíqua normal transversal oblíqua

25
Classificação das Projeções
Cartográficas

Superfície de
Projeção

Cilíndricas Polisuperficiais

plano- cone- cilindropolicil


equatorial transversal oblíqua
poliédrica policônica índrica

26
Classificação das Projeções
Cartográficas

Propriedades

Equidistante Conformes Equivalentes Afiláticas

27
Classificação das Projeções
Cartográficas

Contato
entre as
superfícies

Tangente Secante

28
Sistemas de Coordenadas

• Os sistemas de coordenadas expressam a posição de pontos sobre


uma superfície, seja ela um elipsóide, esfera ou um plano.

• Sistema de coordenadas plano: Determina a posição de pontos do


terreno projetados em um plano horizontal que coincide com o plano
do papel (mapa) – Bidimensional

• Sistema de coordenadas geográficas

29
Sistemas de Coordenadas
Geográficas
• O sistema de coordenadas geográficas é um sistema global
empregado na localização de pontos sobre a superfície
Terrestre.

• MERIDIANOS - São círculos máximos que, em conseqüência,


cortam a TERRA em duas partes iguais de pólo a pólo. Sendo
assim, todos os meridianos se cruzam entre si, em ambos os
polos. O meridiano de origem é o de GREENWICH (0º).

https://www.educamaisbrasil.com.br/enem/geografia/latitude-e-longitude

30
Sistemas de Coordenadas
Geográficas
• O sistema de coordenadas geográficas é um sistema global
empregado na localização de pontos sobre a superfície
Terrestre.

• PARALELOS - São círculos que cruzam os meridianos


perpendicularmente, isto é, em ângulos retos. Apenas um é
um círculo máximo, o Equador (0º). Os outros, tanto no
hemisfério Norte quanto no hemisfério Sul, vão diminuindo de
tamanho à proporção que se afastam do Equador, até se
transformarem em cada pólo, num ponto (90º).

https://www.educamaisbrasil.com.br/enem/geografia/latitude-e-longitude

31
Sistemas de Coordenadas UTM

• A projeção UTM – Universal Transversa de Mercator compreende a adoção de um cilindro transverso ao eixo
de rotação da Terra e secante a esta superfície, sendo a Terra definida matematicamente por um elipsoide de
revolução.

• Compreende a representação de feições geográficas sobre um cilindro transverso secante à superfície


terrestre modelada a partir de um elipsoide de revolução.

• Tipo conforme, ou seja, preserva as direções e, consequentemente, a forma das feições mapeadas.

• Está associada um sistema plano de coordenadas, denominado sistema de coordenadas UTM.

32
Sistemas de Coordenadas UTM

• Neste sistema, o modelo terrestre (elipsoide de revolução) é dividido em 60 fusos de 6° de amplitude


longitudinal cada.

• Estes são numerados a partir do antimeridiano de Greenwich (180°W), da esquerda para a direita (sentido
oeste-leste), iniciando em 01 e terminando em 60.

33
Cartografia Digital

• Dados Geoespaciais: Dados geoespaciais vetoriais e matriciais. São essencialmente dados


cartográficos !
• Dados geoespaciais devem possuir, para cada camada, um pacote de informações que
possibilitem sua identificação e a análise da adequação de seu uso.

• Dado cartográfico (digital ou não) apresenta três atributos básicos: escala, referência
cartográfica e data. A escala define as relações com as dimensões reais e os elementos
representados no mapa.

• A localização e as dimensões espaciais dependem do referencial cartográfico adotado e


demandam informações sobre o elipsoide, Datum, modelo de projeção, sistema de coordenadas,
etc

34
Cartografia Temática

• Cartografia temática são as cartas, mapas ou plantas em qualquer escala, destinadas a um tema
específico.

• A representação temática exprime conhecimentos específicos de um tema (geologia, solos,


vegetação, etc.) para uso geral.

• “O objetivo dos mapas temáticos é o de fornecer, com o auxílio de símbolos qualitativos e/ou
quantitativos dispostos sobre uma base de referência, geralmente extraída dos mapas e cartas
topográficas, as informações referentes a um determinado tema ou fenômeno que está presente ou age
no território mapeado.”

• Exemplos: Mapas e cartas geológicas, geomorfológicas, de uso da terra e outras.

35
Cartografia Temática

Mapa
Pedológico

https://brasil.mapbiomas.org/

https://www.embrapa.br

36
Referências

Mapa
• IBGE. Noções Básicas de Cartografia; Rio de Janeiro, 1998
• Pedológico
Introdução à Cartografia / por Argentino José Aguirre, José Américo de Mello Filho. – Santa
Maria: UFSM / CCR / Departamento de Engenharia Rural, 2009, 2.ed. 80 p. : il. (Caderno Didático)

37
Introdução ao Geoprocessamento

Contextualização

• Definição e Conceitos

Histórico

Ferramentas de Sistemas de Informação


Geográfica

38
Contextualização - Geotecnologias

Coletar Processar Analisar Disponibilizar

39
Contextualização - Geotecnologias

• Sistemas de Informação Geográfica


- SIGs
• Sensoriamento Remoto
Geotecnologias • Topografia
• Fotogrametria
• Geodésia
• GNSS

40
Geoprocessamento

Área do conhecimento que utiliza técnicas matemáticas e


computacionais para o tratamento da informação geográfica. O
geoprocessamento é uma tecnologia que influencia diversas áreas:
Cartografia, Geografia, Recursos Naturais, Planejamento Urbano,
Agricultura, possibilitando a compreensão de fenômenos sociais,
ambientais e econômicos, por meio da representação espacial.

41
Histórico Geoprocessamento

• Século XIX Jon Snow

• 1854 epidemia de cólera em Londres

• Mapa localiza as residências dos


óbitos e as bombas de água que
abasteciam a cidade

42
Exemplos de Aplicação

• Monitoramento de animais – mudanças da dinâmica florestal e o


impacto no habitat

https://earthengine.google.com/case_studies/

43
Monitoramento de florestas –
manejo e conservação

https://earthengine.google.com/case_studies/

44
Monitoramento de florestas-
desmatamento

https://earthengine.google.com/case_studies/

45
Monitoramento de espécies

https://earthengine.google.com/case_studies/

46
Monitoramento de doenças -
malária

https://earthengine.google.com/case_studies/

47
Sistemas de Informação Geográfica

SIG é um sistema de suporte à decisão que integra dados


referenciados espacialmente num determinado ambiente de
respostas a problemas (Cowen, 1988).

“Conjunto de funções/procedimentos automatizados para


adquirir, armazenar e manipular dados georreferenciados”

48
Conceitos

FUNÇÕES DO SIG ...

→Integrar informações geoespaciais numa base única (dados cartográficos, censitários e de


cadastramento, imagens de satélite, redes e modelos de elevação digital);

→ Cruzar informações através de algoritmos de manipulação para gerar mapeamentos derivados;

→Consultar, recuperar, visualizar e permitir saídas gráficas para o conteúdo da base de dados
geocodificados.

49
Histórico dos SIGs

»Antes dos anos 60:


»Primeiras tentativas de definição dos conceitos (Inglaterra e Estados Unidos).

»Entre 1960 e 1975:


»Pioneirismo no desenvolvimento de SIGs;
»Geração de saídas gráficas (mapas), avanços na estrutura de armazenamento de dados (hardware e
software), etc;
»Inventário de recursos naturais do Canadá.

50
Histórico dos SIGs
»Entre 1975 e 1990:
»Microinformática;
»Desenvolvimento de softwares e aplicações;
»Comercialização de soluções.
»Entre 1990 e 2010:
»Computadores mais rápidos, mais potentes e mais baratos;
»Popularização dos SIGs;
»Considerada a fase em que os SIGs “decolaram”.
»A partir de 2010:
»Explosão dos dados abertos;
»Desenvolvimentos de soluções “open source”;
»Computação em nuvem “Cloud computing”.

51
CARACTERÍSTICAS

Os SIGs englobam hardware, software e procedimentos integrados e projetados


para dar suporte ao armazenamento, processamento, análise, modelagem e
exibição de dados e/ou informações espacialmente referenciadas, constituídas
numa única base de dados.

52
COMPONENTES DO SIG

HARDWARE Equipamentos

SOFTWARE Aplicativos

DATAWARE Banco de dados

PESSOAS Pessoal especializado

MÉTODOS Procedimentos utilizados

53
ESTRUTURA DO SIG

Interface com
usuário

Entrada e Integração Funções de Processamento: Visualização


de Dados Consulta e Análise Espacial Plotagem

Gerência de Dados Espaciais:


Armazenamento e Recuperação

Banco de dados
Geográficos

54
ESTRUTURA DO SIG Linguagem de comandos
Interface com base em menus
Interface com
usuário

Funções de
Entrada e Integração Visualização
Processamento:
de Dados Plotagem
Consulta e Análise Espacial

Gerência de Dados Espaciais:


Armazenamento e Recuperação

Banco de dados
Geográficos

55
57
58
59
Linguagem de comandos – evolução: Big
data, séries temporais, espaço, funções...

60
ESTRUTURA DO SIG
Interface com
usuário

Entrada e Integração Funções de Processamento: Visualização


de Dados Consulta e Análise Espacial Plotagem

Gerência de Dados Espaciais:


Armazenamento e Recuperação

• Digitalização em mesa ou ótica


• Cadernetas de campo
• Dados digitais Banco de dados
Geográficos
Cartografia: importante!!

61
ESTRUTURA DO SIG
Interface com
usuário

Entrada e Integração Funções de Processamento: Visualização


de Dados Consulta e Análise Espacial Plotagem

• Plotagem
• Legenda
Gerência de Dados Espaciais: • Layout
Armazenamento e Recuperação

Banco de dados
Geográficos

62
63
ESTRUTURA DO SIG
Interface com
usuário

Funções de
Entrada e Integração Processamento: Visualização
de Dados Consulta e Análise Plotagem
Espacial

Gerência de Dados Espaciais:


Armazenamento e Recuperação

Banco de dados • Repositório


Geográficos

64
O que é o BD?
Um banco de dados pode ser
simples ou complexo (nuvem)!
Tabela (ângulos, azimutes, distâncias)
1

Registro das informações de talhões no


2 tempo e no espaço

Combinação de dados topográficos,


3 climáticos, remotos, agronômicos e etc…

BIG DATA

65
Qual é o seu objetivo?

→ Os dados serão analisados para


responderem a uma pergunta.

→ Compreenda e busque entender


onde você quer chegar.

66
O BD DEVE SER
ADEQUADO
PARA O SEU
OBJETIVO

67
Construindo um Banco de Dados

68
DADO E INFORMAÇÃO

• Fenômenos relacionados ao mundo real:

• Dado: Conjunto de valores numéricos ou não, que corresponde a descrição


de fatos no mundo real.

• Informação: Conjunto de dados que possui um determinado significado para


um uso ou aplicação.

69
DADOS

• Gráficos, espaciais ou geográficos:

• Descrevem características geográficas da superfície

• Não gráficos, alfanuméricos ou descritivos:

• Descrevem atributos das características

70
ESTRUTURA DO SIG

71
ESTRUTURA DO SIG

72
DADOS ESPACIAIS

Representação
• Matricial ou Raster
• Vetorial

Mundo real

Vetorial Matricial
73
BASE DE DADOS GEOESPACIAIS

Abrangênci
Entidade a Rural/Urbano Tipo Site Descrição
Consulta ao cadastro imobiliário rural no sistema de gestão
Sigef (INCRA) Federal Rural Vetorial https://sigef.incra.gov.br/ fundiária do INCRA
Ministério da Agricultura Cadastro Ambiental Rural do Ministério do Ministério do Meio
(CAR) Estadual Rural Vetorial https://www.car.gov.br/publico/imoveis/index Ambiente
GeoSampa (Prefeitura de Cadastro imobiliário urbano de loteamentos, quadras e lotes do
São Paulo) Municipal Urbano Vetorial http://geosampa.prefeitura.sp.gov.br/ município de São Paulo
Zoneamento e cadastro imobiliário urbano de loteamentos, quadras
Zoneamento Campinas Municipal Urbano Vetorial https://zoneamento.campinas.sp.gov.br/ e lotes do município de Campinas
Cadastro de plantas do município de Fortaleza (Pesquisar na
Prefeitura de Fortaleza Municipal Urbano Outros https://acervo.fortaleza.ce.gov.br categoria Cartografia o tema Cadastro Urbano)
INCRA Federal Rural Vetorial https://acervofundiario.incra.gov.br/acervo/acv.php Acervo de arquivos shapefile do INCRA com Sigef e SNCI
Ferramenta de visualização de perfis temporais dos índices
Rural e https://www.satveg.cnptia.embrapa.br/satveg/login.ht vegetativos NDVI e EVI do sensor MODIS em qualquer local da
Embrapa Mundial Urbano Dados ml América do Sul.
Rural e
Exército Brasileiro (BDGEx) Federal Urbano Raster https://bdgex.eb.mil.br/ Cartas topográficas do IBGE (diversas escalas)
Rural e
Exército Brasileiro (BDGEx) Federal Urbano Raster https://bdgex.eb.mil.br/bdgexapp/mobile Cartas topográficas do IBGE (acesso online)
Rural e
Inmet Federal Urbano Dados https://portal.inmet.gov.br/dadoshistoricos Dados meteorológicos horários de diversas estações automáticas

74
BASE DE DADOS GEOESPACIAIS

Entidade AbrangênciaRural/Urbano Tipo Site Descrição

INFRAESTRUTURA DE DADOS ESPACIAIS AMBIENTAIS DO ESTADO DE


DATAGEO-SP Estadual Rural e Urbano Dados https://datageo.ambiente.sp.gov.br SÃO PAULO - IDEA-SP

http://www.cprm.gov.br/publique/Gestao-Territorial/Prevencao-
Serviço Geológico do Brasil - de-Desastres/Cartas-de-Suscetibilidade-a-Movimentos- Cartas de suscetibilidade a movimentos gravitacionais de massa e
CPRM Federal Rural e Urbano Vetorial Gravitacionais-de-Massa-e-Inundacoes-5379.html inundações

INFRAESTRUTURA DE DADOS ESPACIAIS DA SECRETARIA DO MEIO


IDESISEMA-MG Estadual Rural e Urbano Vetorial http://idesisema.meioambiente.mg.gov.br/ AMBIENTE DE MINAS GERAIS

Limites territoriais diversos dos estados, municípios e setores


censitários. Base cartográfica contínua do IBGE com mais de 40 temas
IBGE (limites territoriais) Federal Rural e Urbano Vetorial https://portaldemapas.ibge.gov.br/portal.php#homepage diferentes

Banco de informações ambientais do IBGE: geologia, geomorfologia,


IBGE (dados ambientais) Federal Rural e Urbano Vetorial https://bdiaweb.ibge.gov.br/#/home pedologia e vegetação

75
BASE DE DADOS GEOESPACIAIS

Entidade Abrangência Rural/Urbano Tipo Site Descrição


TerraClass Cerrado Estadual Rural e Urbano Dados https://www.terraclass.gov.br/webgis-cerrado/ mapeamento e monitoramento para do bioma cerrrado
TerraClass Amazônia Estadual Rural e Urbano Dados https://www.terraclass.gov.br/geoportal-aml/ mapeamento e monitoramento do bioma amazônia
sistema para mapeamento digital global de solos que usa
métodos de aprendizado de máquina de última geração para
mapear a distribuição espacial das propriedades do solo em
SoilGrids Mundial Outros Dados https://www.isric.org/explore/soilgrids todo o mundo
https://metadados.snirh.gov.br/geonetwork/srv/por/cat
alog.search#/metadata/28fe4baa-66f3-4f6b-b0d2-
Agência Nacional de Águas (ANA) Federal Rural e Urbano Vetorial 890abf5910c4 Capacidade de armazenamento de água dos solos do Brasil
https://metadados.snirh.gov.br/geonetwork/srv/por/cat
alog.search#/metadata/28fe4baa-66f3-4f6b-b0d2- Catálogo de estudos, mapas e dados referêntes da ANA e
Agência Nacional de Águas (ANA) Federal Rural e Urbano Outros 890abf5910c4 parceiros em diversas áreas
Download de dados geográficos como UCs, bacias
hidrográficas, áreas prioritárias para conservação da
MMA Federal Rural e Urbano Vetorial http://mapas.mma.gov.br/i3geo/datadownload.htm biodiversidade, etc.
BDQUEIMADAS Federal Rural e Urbano Raster https://queimadas.dgi.inpe.br/queimadas/bdqueimadas Série histórica de focos de calor
INPE Mundial Rural e Urbano Raster http://www.dgi.inpe.br/catalogo/ Catálogo de imagens de satélite CBERS, Landsat 8, etc.
Catálogo de imagens de satélite da série Landsat, Sentinel 2,
Serviço Geológico dos EUA Mundial Rural e Urbano Raster https://earthexplorer.usgs.gov/ SRTM, etc.
Agência Espacial Europeia Mundial Rural e Urbano Raster https://cophub.copernicus.eu/dhus/#/home Catálogo de imagens de satélite da série Sentinel
Plataforma online que fornece dados e ferramentas para o
Global Forest Watch Mundial Rural e Urbano Outros https://www.globalforestwatch.org/ monitoramento de florestas e ocupação e uso do solo.
Conjunto de camadas climáticas globais (dados climáticos em
WORLDCLIM Mundial Rural e Urbano Raster https://www.worldclim.org/ grade)

76
SOFTWARES
→ArcGIS – vetor e raster
→ENVI – raster
→QGIS – vetor e raster (gratuito)
→TERRSET– raster
→SPRING - raster e vetor (gratuito)
→R - raster e vetor
→Processamentos em nuvem - Google e Amazon – vetor e raster

77
EXERCÍCIO PRÁTICO

• Fazer um mapa no QGIS de área agrícola para o estado


de São Paulo.

• https://download.qgis.org/downloads/windows/3/3.16/

78
EXERCÍCIO PRÁTICO

ETAPA 1

a) Abrir um projeto novo (Projeto - Novo)


b) Salvar o projeto (Projeto – Salvar como)
c) Analisar os principais comandos na barra de ferramentas (Visão- Painéis,
Processar – Caixa de Ferramentas)
d) Instalar complementos (Complementos)

79
EXERCÍCIO PRÁTICO

ETAPA 2

a) O QGIS inicia cada novo projeto usando a projeção global pré-definida. O SC


global por omissão é o EPSG:4326 - WGS 84 (proj=longlat +ellps=WGS84
+datum=WGS84 +no_defs), e vem pré-definido no QGIS.
b) Configurações – Opções - SRC
c) Alterar para SIRGAS 2000

80
EXERCÍCIO PRÁTICO

ETAPA 3

a) Camada - Adicionar camada – Adicionar camada vetorial


b) Vetor – Arquivo – Selecionar o arquivo de interesse (.shp) - Adicionar
c) Para alterar o layout da camada (cor, preenchimento e espessura das linhas):
Clicar com o botão direito sobre a camada – propriedades – selecionar a cor de
interesse
d) Consultar a informação: Selecione o ícone e clique sobre a área de interesse.
e) Reprojetar o dado vetorial (Geográficas - WGS-84): Vetor - Gerenciar dados –
Reprojetar camada

81
EXERCÍCIO PRÁTICO

ETAPA 4
a) Adicionar a tabela .csv obtida do IBGE para a área e/ou produção agrícola (Escolha
AREA_AGRICOLA ou QuantidadeProduzida). Camada- Adicionar camada – Adicionar
Camada de Texto Delimitado.

82
EXERCÍCIO PRÁTICO

ETAPA 5

a) Adicionar o dado vetorial dos municípios de SP Estado de São Paulo (Sao_Paulo.shp).


b) Clicar com o botão direito do mouse sobre a camada vetorial municípios e selecionar a
opção Uniões/Junções. Em seguida, clicar na opção “+” e unir os campos de interesse.
c) Na opção simbologia alterar o layout do mapa – Clicar com botão direito sobre o dado
vetorial municípios – Simbologia - Graduado

83
EXERCÍCIO PRÁTICO

ETAPA 6

a) Projeto – Novo Layout de Impressão – “Definir Nome” - ok


b) Adicionar Item – Adicionar Mapa
c) Visão – Painéis – Propriedades do item
d) Grades- Adicionar (+) – Modificar Grade- Defina a moldura- Desenhar
Coordenadas
e) Adicionar Item- Adicionar Legenda
f) Adicionar Item – Adicionar Barra de Escala
g) Adicionar Item – Adicionar Seta norte

84
OBRIGADA!
https://www.linkedin.com/in/ana-cl%C3%A1udia-dos-santos-luciano-a785b654/

85
ANÁLISE ESTATÍSTICA
ESPACIAL
Ana Cláudia S. Luciano
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados, é do professor.

Proibida a reprodução total ou parcial, sem


autorização. Lei nº 9610/98

2
Introdução ao Geoprocessamento e SIGs

Contextualização

• Definição e Conceitos

Histórico

Ferramentas de Sistemas de Informação


Geográfica

3
Contextualização - Geotecnologias

Coletar Processar Analisar Disponibilizar

4
Contextualização - Geotecnologias

• Sistemas de Informação Geográfica


- SIGs
• Sensoriamento Remoto
Geotecnologias • Topografia
• Fotogrametria
• Geodésia
• GNSS

5
Geoprocessamento

Área do conhecimento que utiliza técnicas matemáticas e


computacionais para o tratamento da informação geográfica. O
geoprocessamento é uma tecnologia que influencia diversas áreas:
Cartografia, Geografia, Recursos Naturais, Planejamento Urbano,
Agricultura, possibilitando a compreensão de fenômenos sociais,
ambientais e econômicos, por meio da representação espacial.

6
Sistemas de Informação Geográfica

SIG é um sistema de suporte à decisão que integra dados


referenciados espacialmente num determinado ambiente de
respostas a problemas (Cowen, 1988).

“Conjunto de funções/procedimentos automatizados para


adquirir, armazenar e manipular dados georreferenciados”

7
Conceitos

FUNÇÕES DO SIG ...

→Integrar informações geoespaciais numa base única (dados cartográficos, censitários e de


cadastramento, imagens de satélite, redes e modelos de elevação digital);

→ Cruzar informações através de algoritmos de manipulação para gerar mapeamentos derivados;

→Consultar, recuperar, visualizar e permitir saídas gráficas para o conteúdo da base de dados
geocodificados.

8
CARACTERÍSTICAS

Os SIGs englobam hardware, software e procedimentos integrados e projetados


para dar suporte ao armazenamento, processamento, análise, modelagem e
exibição de dados e/ou informações espacialmente referenciadas, constituídas
numa única base de dados.

9
COMPONENTES DO SIG

HARDWARE Equipamentos

SOFTWARE Aplicativos

DATAWARE Banco de dados

PESSOAS Pessoal especializado

MÉTODOS Procedimentos utilizados

10
ESTRUTURA DO SIG

Interface com
usuário

Entrada e Integração Funções de Processamento: Visualização


de Dados Consulta e Análise Espacial Plotagem

Gerência de Dados Espaciais:


Armazenamento e Recuperação

Banco de dados
Geográficos

11
ESTRUTURA DO SIG

12
DADOS ESPACIAIS

Representação
• Matricial ou Raster
• Vetorial

Mundo real

Vetorial Matricial
13
RASTER
i1,j1
Tamanho da célula

Número de
Linhas

(X,Y)
Número de Colunas

14
RASTER
→ Células ou elementos: Pixels;
→ A cada pixel é associado um valor de atributo;
→ Valores atribuídos:

→ Inteiros, reais e alfanuméricos.

→ Representações de feições ou fenômenos contínuos:


→Elevação, precipitação, declividade.
→Análise de informação: superposições de camadas - camadas com mesmo
tamanho de matriz.

15
RASTER
→ Cada pixel é associado a uma porção do terreno;
→ Tamanho do pixel afeta propriedades de áreas;
→ O número de pixels aumenta quando há redução da dimensão do mesmo (mais
memória computacional)

Mesma área representada em diferentes resoluções

16
RASTER: VANTAGENS

→ Estrutura de dados simples;

→ Operações algébricas e de superposição são facilmente


implementadas;

→ Operações de modelagem e simulação são simples, pois cada


unidade espacial tem mesma forma e tamanho;

17
RASTER: DESVANTAGENS
→ Estrutura de dados ocupa mais espaço de memória;

→ O uso de grandes células para reduzir o volume de dados pode


resultar em perda de informação;

→ Produto final nem sempre é esteticamente agradável.

18
RASTER: EXEMPLOS
→Imagens digitalizadas e georreferenciadas;

→Imagens geradas por sensoriamento orbital e não orbital;

→Modelos gerados por interpolação de dados geográficos.

19
Sentinel 2 - 2019 Landsat 8 - 2019
30 metros
Piracicaba - SP

20
Landsat 8 – 2019
30 metros
Piracicaba - SP

21
Sentinel 2 – 2019
10 metros
Piracicaba - SP

22
Sentinel 2 – 2019
10 metros
Piracicaba - SP

23
24
Planet– 2014
0.8 metros
EUA

25
Planet– 2014
0.8 metros
EUA

26
Planet– 2014
0.8 metros
EUA

27
Definição do Sensoriamento Remoto
máxima Sensoriamento Remoto “é a aquisição de dados sobre um objeto
sem tocá-lo”.

“É o registro da informação das regiões do ultravioleta, visível, infravermelho


e micro-ondas do espectro eletromagnético, sem contato, por meio de
instrumentos tais como câmeras, escâneres, lasers, dispositivos lineares e/ou
matriciais localizados em plataformas tais como aeronaves ou satélite, e a
análise da informação adquirida por meio visual ou processamento digital de
mínima imagens”.
Jensen (2011)

28
CONCEITOS

Sensoriamento Remoto
29 - Passivo
VETOR
→ Todo elemento espacial é representado por uma série de vetores com
coordenadas;

→ Cada elemento é representado por pontos, linhas ou polígonos;

→ Permitem a estrutura vetorial a representar os dados de forma mais precisa;

→ Descrição exata de posição, tamanho e dimensão.

30
VETOR
→ Entidade geográfica posicionada por coordenadas X e Y;

→ Dados não espaciais ou atributos podem ser arquivados, indicando que tipo
de ponto se trata.

31
VETOR – PONTOS

32
VETOR – LINHAS

→ Pontos conectados com no mínimo dois pares de coordenadas X e Y;

→ Ponto inicial e final são denominados nós e os pontos intermediários vértices;

→ Representam feições lineares.

Vetorial Matricial

33
VETOR – POLÍGONOS
→ Definidos por uma série de pontos com coordenadas X e Y formando linhas
que fecham uma determinada área;

→ Atributos que podem ser associados aos polígonos: área, perímetro etc.

Vetorial Matricial

34
VETOR – VANTAGENS
→ Estrutura de dados compacta;

→ Permite relacionamento espacial entre objetos;

→ Recuperação, atualização e generalização de gráficos e atributos são


realizadas de forma eficiente.

35
VETOR – DESVANTAGENS
→ Estrutura de dados complexa;

→ Operações de superposição são difíceis de serem implementadas;

→ Ineficácia na representação de regiões com alta variabilidade;

→ Operações de modelagem e simulação são difíceis devido a cada unidade


espacial ter forma topológica (geométrica) diferente.

36
VETOR – EXEMPLOS
→ Pontos, linhas e polígonos por GPS;

→ Malhas políticas (IBGE);

→ Malhas hidrográficas (ANA);

→ Limites geográficos de fazendas (CAR);

→ Dados pontuais de estações meteorológicas.

37
DADOS ALFANUMÉRICOS

→ Atributos de dados espaciais


→ Informação descritiva
→ Geocódigos
→ Feições espaciais

https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/15774-malhas.html?edicao=24048&t=sobre

38
FONTE DE ERROS DOS DADOS

Cuidados na entrada de dados em um SIG:

→Utilizar fontes confiáveis;


→Adotar sistema de referência padrão;
→Verificar a qualidade do georreferenciamento dos dados;
→Conhecer a precisão dos dados a serem utilizados

39
ESTRUTURA DO SIG

40
ANÁLISE DE DADOS
Grande volume
de dados
Estruturados!

Informação!
Mapa
Operações Tabela
Lógica Matemática Trigonométricas Gráfico
Estatísticas Multivariadas
41
ANÁLISE DE DADOS

Grande volume
de dados
Ruins!

Informação
Ruim!
Operações Mapa
Lógica Matemática Trigonométricas Tabela
Gráfico
Estatísticas Multivariadas
42
ANÁLISE ESPACIAL

→ Aspecto importante dos dados geográficos;


→ Representar as relações entre os diversos dados;
→ Permite ir além dos meros mapas coloridos, e estabelecer uma
quantificação explícita da variabilidade espacial dos fenômenos em
estudo;
→ Permite modelar a distribuição dos dados, por meio de técnicas de
Estatística Espacial.

43
OPERAÇÕES EM ANÁLISE ESPACIAL

→ Operações lógicas;

→ Operações matemáticas;

→ Operações trigonométricas;

→ Operações estatísticas;

→ Operações multivariadas.

44
EXEMPLOS DE ANÁLISE ESPACIAL

Consulta Interpolação

Exemplos: Declividade, mapa de solos, zonas de manejo

45
EXEMPLOS DE ANÁLISE ESPACIAL

Sobreposição Reclassificação Proximidade

46
EXEMPLOS DE ANÁLISE ESPACIAL

Imagem

47
EXEMPLOS DE ANÁLISE ESPACIAL

Vetor

48
EXEMPLOS DE ANÁLISE ESPACIAL

SOBREPOSIÇÃO
VETOR

Imagem

49
EXEMPLOS DE ANÁLISE ESPACIAL

CONSULTA

50
EXEMPLOS DE ANÁLISE ESPACIAL

BUFFER

51
APLICAÇÕES AGRÍCOLAS

52
https://experience.arcgis.com/experience/d33299b0b0224b37897c1b1ab88c8103 53
→ Representação da variação contínua do
relevo sobre o espaço.

→ Pode ser considerado uma representação da


superfície real, sendo construído através de
MODELO um modelo matemático que efetua uma
NUMÉRICO DO aproximação da realidade do terreno por
meio de um algoritmo e um conjunto de
TERRENO - MNT dados x,y.

→ Cada coordenada x,y possui um atributo z,


que descreverá a variação da superfície.

→ Modelo Digital do Terreno (MDT) ou Modelo


Digital de Elevação(MDE)

54
CONTEXTUALIZAÇÃO

→ Relevo
→ Informação geológicas
→ Levantamentos de profundidades do
mar
→ Informação meteorológicas

55
FASES DA
MODELAGEM
Taborda, C., Oka-fiori, C., José, L., Santos, C., Evaristo, A., 2013. Soil
prediction using arti fi cial neural networks and topographic
attributes. Geoderma 165–

Aquisição de 172.https://doi.org/http://dx.doi.org/10.1016/j.geoderma.20
12.11.016

dados

Geração de
grades

Elaboração de
produtos
56
AQUISIÇÃO DE DADOS - AMOSTRAGEM

Aquisição de um conjunto de amostras representativas do fenômeno de


interesse.

Fase muito importante em todo o processo de modelagem.

A amostragem deve ser representativa! Não pode ser insuficiente e nem


redundante!

57
AQUISIÇÃO DE DADOS - AMOSTRAGEM

✓ A amostragem tem que considerar quantidade e posicionamento das


amostras em relação ao comportamento do fenômeno.

(x, y) ---- z

Subamostragem: Exemplos áreas acidentadas


Superamostragem : Exemplos áreas planas

58
• Grades:
PROCESSO DE • Irregular triangular: é uma estrutura poliédrica cujos elementos básicos
MODELAGEM DO TERRENO: são triângulos. Os vértices dos triângulos pertencem ao conjunto de amostras
do modelo.
Interpolação de dados
• Regular retangular: é uma estrutura matricial que contém pontos3D
regularmente espaçados no plano xy.

59
Regular Retangular

• Regularidade na distribuição espacial


• Vértices dos retângulos estimados a partir de amostras
• Representa melhor superfícies sem variações locais acentuadas

Características de • Estrutura de dados simples


• Aplicações qualitativas e análises rasters
Grades Regulares
Retangulares e Irregular Triangular

Irregular Triangular
• Sem regularidade na distribuição espacial
• Vértices dos triângulos consistem no conjunto amostral
• Representa bem superfícies não homogêneas com variações locais
acentuadas
• Estrutura de dados mais complexa
• Aplicações quantitativas

60
VIZINHO MAIS
PRÓXIMO

• Escolha de apenas uma amostra


vizinha para cada ponto da grade;

• O interpolador tem por


características manter os valores de
cotas das amostras na grande;

• O interpolador não gera valores


intermediários.

61
MÉDIA SIMPLES

• O interpolador considera o valor de


cota z do elemento da grade igual a
média aritmética dos valores de cota
das amostras vizinhas. Fator de
ponderação = 1/n para qualquer
amostra.

62
MÉDIA
PONDERADA

• O valor de cota de cada elemento


da grade é definido pela média
ponderada dos valores de cota das
amostras vizinhas.
• A ponderação mais usada é o
inverso da distância euclidiana do
ponto da grade à amostra
considerada ou inverso do quadrado
da distância.

63
Vizinho + próximo Média simples Inverso do quadro da distância

Fonte: Druck, S.; Carvalho, M.S.; Câmara, G.; Monteiro, A.V.M. (eds) "Análise Espacial de Dados Geográficos". Brasília,
EMBRAPA, 2004 (ISBN: 85-7383-260-6).

64
EXERCÍCIO PRÁTICO - QGIS
ETAPA 1 – Sobreposição de dados
a) Adicionar a imagem no QGIS. Para isso: Camada- Adicionar camada – Adicionar
camada raster

65
EXERCÍCIO PRÁTICO - QGIS
ETAPA 1 – Sobreposição de dados
b) Adicionar o Limite.

66
EXERCÍCIO PRÁTICO - QGIS
ETAPA 2 – Realizar o buffer (Proximidade)
Aplicar buffer de 30, 100, 200 m

67
EXERCÍCIO PRÁTICO - QGIS
ETAPA 3 – Recortar a Imagem com base no Limite

68
EXERCÍCIO PRÁTICO - QGIS
ETAPA 4 – Alterar composição colorida da imagem

69
EXERCÍCIO PRÁTICO - QGIS
ETAPA 5 – Interpolação de dados
Adicionar dados de centróides

70
EXERCÍCIO PRÁTICO - QGIS
ETAPA 5 – Interpolação de dados
Gerar a interpolação pelo inverso da distância à potência e vizinho mais próximo

71
OBRIGADA!
https://www.linkedin.com/in/ana-cl%C3%A1udia-dos-santos-luciano-a785b654/

72
Gestão da Mudança na Era
Digital
(Change Management)

Prof. Mateus C. Gerolamo


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Gestão da Mudança

Prof. Mateus C. Gerolamo

MBA em Data Science & Analytics


ESALQ - USP

Outubro de 2023

3
Apresentação

4
GRUPO DE PESQUISA EM GESTÃO DA MUDANÇA E DA INOVAÇÃO
Mateus C. Gerolamo DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO
Professor Associado ESCOLA DE ENGENHARIA DE SÃO CARLOS
UNIVERSIDADE DE SÃO PAULO
❖ Professor da Universidade de São Paulo (USP).
❖ Área de atuação compreende Gestão da Qualidade, Projetos, Mudança e Inovação.
❖ Livre-Docência pela USP e Pós-doutorado pelo Instituto de Tecnologia de Berlim (TUB).
❖ Doutor, Mestre e Engenheiro de Produção pela USP.
❖ 20 anos de experiência em pesquisa, docência e projetos de consultoria com ênfase em Gestão de
Mudanças e Cultura Organizacional.
❖ Experiências em diversos setores: alimentos, automobilístico, construção civil, cosméticos, educação,
financeiro, saúde, serviços, têxtil, etc. em pequenas, médias, grandes e empresas do terceiro setor.
❖ Responsável por aula na graduação, pós-graduação lato e stricto sensu, e MBA.
❖ Ministra cursos em MBAs da USP e UFSCar (Gestão da Mudança e da Inovação, Liderança, Balanced
Scorecard, Gestão da Qualidade).
❖ Autor de livros, artigos nacionais e internacionais; revisor de periódicos internacionais, dentre eles o
Journal of Organizational Change Management.
❖ Certificado CTT1 (Cultural Transformations Tools) – Richard Barrett Centre.
Instagram: @mateusgerolamo
LinkedIn Pessoal: https://www.linkedin.com/in/mateus-gerolamo-802b965/ Grupo de Pesquisa:
Curriculum Vitae Lattes: http://lattes.cnpq.br/3002611390279533 Research team: http://change.prod.eesc.usp.br
Google Scholar: https://scholar.google.com.br/citations?user=t5efBTUAAAAJ LinkedIn Grupo Pesquisa: https://www.linkedin.com/in/change-eesc-usp-565668251/
ORCID: https://orcid.org/0000-0002-6535-0904 Facebook: https://www.facebook.com/groups/gestaodamudanca
Scopus: https://www.scopus.com/authid/detail.uri?authorId=6504619454 Engenharia de Produção: https://prod.eesc.usp.br/
Research ID: http://www.researcherid.com/rid/G-7182-2012 EESC: https://eesc.usp.br/
Research Gate: https://www.researchgate.net/profile/Mateus_Gerolamo USP: https://www5.usp.br/ 5
Grupo de Pesquisa: http://change.prod.eesc.usp.br

6
Inspiração Acadêmica

7
Principais fontes de Inspiração para
Pesquisa, Aplicação e Ensino BACKGROUND

Mateus C. Gerolamo, Engenharia de Produção, Escola de Engenharia de São Carlos (EESC), Universidade de São Paulo (USP), Gestão da Mudança

8
E-Book (in Portuguese) BACKGROUND

• Introdução à Gestão da Mudança em Organizações


• Livro e-book (2023)
• Data de Publicação: 07 de março de 2023
• Autores: Mateus Cecilio Gerolamo, Ana Carolina
Bertassini; Lilian G. Ponce
• Acesso gratuito a todo conteúdo:
https://doi.org/10.11606/9788592582524
• Mais de 1,5k downloads
desde março de 2023

GEROLAMO, M. C.; BERTASSINI. A. C.; PONCE, L. G. Introdução à Gestão da Mudança em Organizações, 2023. Livro (e-book) – Editora Pecege. Apoio:
ONOVOLAB. 10.11606/9788592582524. Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.
Acesso em: 2023-03-27.

9
E-Book (in Portuguese)
• Introdução à Gestão da Mudança em Organizações
• Livro e-book (2023)
• Data de Publicação: 07 de março de 2023
• Autores: Mateus Cecilio Gerolamo, Ana Carolina
Bertassini; Lilian G. Ponce
• Acesso gratuito a todo conteúdo:
https://doi.org/10.11606/9788592582524
• Mais de 1,5k downloads
desde março de 2023

GEROLAMO, M. C.; BERTASSINI. A. C.; PONCE, L. G. Introdução à Gestão da Mudança em Organizações, 2023. Livro (e-book) – Editora Pecege. Apoio:
ONOVOLAB. 10.11606/9788592582524. Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.
Acesso em: 2023-03-27.
10
Thesis (in Portuguese) BACKGROUND

• Gestão da mudança na perspectiva do


comportamento organizacional e da liderança:
proposta de um framework teórico e avaliação de
iniciativas acadêmicas
• Tese de Livre Docência (2019)
• Data de Publicação: 11 de março de 2020
• Autor: Mateus Cecilio Gerolamo
• Acesso gratuito a todo conteúdo:
https://doi.org/10.11606/T.18.2020.tde-10032020-143539
• Mais de 4k downloads desde março de 2020

GEROLAMO, Mateus Cecilio. Gestão da mudança na perspectiva do comportamento organizacional e da liderança: proposta de um framework teórico e
avaliação de iniciativas acadêmicas. 2019. Tese (Livre Docência em Gestão da Qualidade e Mudança Organizacional) - Escola de Engenharia de São Carlos,
Universidade de São Paulo, São Carlos, 2019. doi:10.11606/T.18.2020.tde-10032020-143539. Acesso em: 2020-06-07.

11
Flex Method for Innovation (FlexM4i) (in Portuguese)
Professor Henrique Rozenfeld BACKGROUND
5 1
• Instrumento de Avaliação de Cultura de
0 9 8-
Inovação
27 3.
15.
• Autores: Cristhian Mafalda, Ricardo F.
a 3
Esposto e Mateus C. Gerolamo
i d
o sh
• Acesso gratuito a todo conteúdo:
i Y
s h
su
https://flexmethod4innovation.com/pratica/instrumento-
avaliacao-cultura-inovacao/
A t
e l o
a r c
• Conteúdo Completo (FlexM4i):
https://flexmethod4innovation.com/
M Rozenfeld, EESC-USP
Prof. Henrique

flexM4I > abordagens e práticas > Instrumento de Avaliação de Cultura de Inovação. Este instrumento foi criado por Cristhian
Mafalda<cristhianmafalda@gmail.com>, Ricardo Esposto<ricardoesposto@gmail.com> e Mateus Gerolamo <gerolamo@sc.usp.br>
Agenda / Conteúdo

13
▪ Contexto organizacional 4.0
▪ Capacidade de execução de mudanças
▪ Autoconhecimento (indivíduos e
Conteúdo grupos)
Geral do Curso / ▪ Visão sistêmica e alinhamento
organizacional
Material
▪ Organizações Positivas
▪ Ferramentas / Técnicas de Gestão da
Mudança
▪ Exercícios / cases / dinâmicas

14
Contexto Organizacional
Macro ambiente & Organizações
15
Estamos Vivendo em um Mundo VUCA

Fonte: Bennett e Lemoine (2014).

16
FRÁGIL ANSIOSO NÃO LINEAR INCOMPREENSÍVEL

Fonte: https://digitalleadership.com/blog/bani-world/ 17
Indústria 4.0 Economia 4.0

Contexto da
Quarta
Revolução
Industrial

Sociedade 4.0
Sociedade 5.0 18
Desafios
Entender como temáticas atuais se integram com a Gestão da
Mudança e Inovação:
Empresas Autogeridas / Organizações do Conhecimento
Capitalismo Consciente / Empresas Humanizadas / DEI
Economia Circular / Empresas Circulares / Sustentabilidade / ESG
Servitização / PSS / Empresas Focadas em Serviços
Indústria 4.0 / Transformação Digital
Cocriação / Coinovação / Inovação Disruptiva
Gestão da Mudança e Inovação / Change and Innovation Management

19
Contexto Organizacional
POR QUE ESSE CURSO É IMPORTANTE?
A cultura é um ativo que, se bem gerenciado, gera resultados duradouros.

Millenials Estratégia M&A


56% dizem que nunca trabalhariam em
84% dos executivos acredita que a Cultura seja A Cultura Organizacional está
uma empresa em que eles não acreditassem
nos valores [1] o fator crítico de sucesso entre as 3 principais
dos projetos e da operação [2] causas de insucesso; [3]
87% acreditam que o sucesso dos negócios 47% acreditam que a cultura não seja
não está associado apenas a questões 87% das empresas envolvidas em
financeiras [1] gerenciada de maneira efetiva [2] casos bem sucedidos de M&A consideram
93% acreditam que o impacto social 51% entendem que a organização precisa passar por a integração cultural como o fator crítico
é o fator crítico para investimentos [1] uma transformação cultural [2] de sucesso; [4]

Performance 60% da liderança acredita que a cultura seja mais


55% das empresas que investiram em
cultura tiveram um aumento de pelo menos 92% dos membros de conselho revelam importante que a estratégia ou modelo operacional
da empresa [5]
que o investimento em cultura melhorou
10% no lucro operacional [5] a performance financeira de sua empresa [5]

82% dos CEOS reconhecem a cultura como uma vantagem competitiva, e reconhecem que gerenciar a
cultura tem impacto positivo nos colaboradores e nos clientes [5]

Fonte: [1] The Economist (2016); [2] PwC (2013); [3] Delloite (2013); [4] AON Hewitt (2013); [5] EY (2016) 20
Contexto Organizacional
POR QUE ESSE CURSO É IMPORTANTE? 5 1
0
A cultura é um ativo que, se bem gerenciado, gera resultados duradouros.
9 8-
27 3.
.
95% dos empregados reclamam
5
67% das áreas de RH e TI não

1
que eles não possuem ciência ou

3
estão alinhadas com as
não compreendem a estratégia
unidades de negócio e as
estratégias corporativas.
i da da companhia.

o sh
60% das organizações não
i Y
h
50% indicam que, na verdade,
integram seus orçamentos

su s não investem tempo nenhum na

A t
financeiros com suas
prioridades estratégicas.
discussão da estratégia.

e l o
ar c
70% dos gerentes de nível intermediário e
85% das lideranças executivas
reportam que eles gastam menos
Mmais de 90% dos funcionários de linha de
frente não possuem incentivos amarrados
de uma hora por mês discutindo
suas estratégias.
ao sucesso da implementação da estratégia.
21 Fonte: Kaplan e Norton (2005)
Contexto, Justificativa & Objetivo
Gestão da Mudança
22
A Linha do Tempo da Gestão da Mudança
hoje

Pré-1990’s 1990’s 2000’s Futuro é agora

Formalização Desenvolvimento
Fundação No radar de Profissionais e
Da Disciplina
Organizações na
Disciplina

Pré-1990’s – Fundação: 1990’s – No radar: “Gestão da 2000’s – Formalização:


acadêmicos começam a entender Mudança” ou “Change Estrutura adicional e Futuro: Desenvolvimento de
como as pessoas e os sistemas Management” entra no vernáculo mais rigor codificam a profissionais e melhoria da
humanos experimentam a do mundo dos negócios. Gestão da Mudança maturidade organizacional no
mudança como uma Disciplina. tema Gestão da Mudança.
Fonte: Adaptado de PROSCI. The History and Future of Change Management. Prosci: People, Change, Results, Thought Leadership Article, 2016.
Disponível em: <https://www.prosci.com/resources/articles/change-management-history-and-future>.

23
Contextualização
Não está faltando um modelo
de gestão da mudança

O foco deve estar na O foco deveria estar na


construção do capacidade ou competência
comprometimento coletivo
(buy-in) para tornar o esforço
de mudança bem-sucedido
Capacidade de em Gestão da Mudança
(em ser capaz de se fazer a
mudança)
Mudança
A liderança capaz deve Uma Liderança Capaz em
estabelecer uma direção Mudança, com
comum quanto à mudança, e comportamentos e mindsets
alinhar as pessoas e os necessários para liderar a
recursos nessa mesma direção mudança de maneira efetiva
Fonte: Bendixten et al., (2016).

24
Contextualização

Capacidade (Capability) de Mudança é a capacidade duradoura que reflete


um processo dinâmico de aprendizado contínuo e de ajustes, permitindo à
organização desenvolver-se em meio à ambiguidade e à incerteza;

Capacidade de
Mudança
Reflete também a habilidade de implementar
as mudanças que se façam necessárias.

25
Contextualização
• A construção de uma capacidade de mudança organizacional envolve três áreas
principais: um contexto
organizacional
que sustente a
mudança

uma cultura
a implementação organizacional
da mudança que facilite o
aprendizado

• Construir essa capacidade (ou essa competência) requer intervenções focadas nos
membros, na estrutura e na cultura da organização.
26
Contextualização
Quem influencia a capacidade de mudança da organização?
Os stakeholders da mudança:

estrategistas da
mudança

capacidade de
implementadores Influenciam mudança da
organização

receptores
Fonte: Buono e Kerber (2010); Kerber e Buono (2005).

27
Sete Razões para o Desdobramento da Gestão da Mudança nas Organizações

3. Dar a devida
2. Saber lidar
1. Conduzir mais atenção aos
com o número
mudanças bem- custos da
de mudanças em
sucedidas mudança mal
andamento
gerenciada

4. Alinhar
6. Criar uma 7. Desenvolver
práticas 5. Preparar a
abordagem com as capacidades
organizacionais organização para
consistência e internas
com os valores o futuro
eficiência necessárias
organizacionais
Fonte: Adaptado de PROSCI. 7 Compeling Reasons for Change Management Deployment. Prosci: People, Change, Results, Thought Leadership Article, 2017.
Disponível em: <https://www.prosci.com/resources/articles/7-reasons-for-change-management-deployment>.

28
O Gap Futuro da Liderança
Excessos Adequados

Alto • Respeito às diferenças • Ser um rápido aprendiz


• Autocontrole (compostura) • Construção de relações colaborativas
• Adaptação cultural • Iniciativa
Nível de desempenho atual

• Compaixão e sensibilidade • Gestão participativa


• Deixar pessoas à vontade • Perspectiva estratégica

Reservas Gaps Cruciais

• Confronto de problemas dos colaboradores • Comprometimento inspirador


• Gestão de carreiras • Liderança de pessoas
• Balanço entre vida pessoal e profissional • Planejamento estratégico
• Determinação • Gestão da mudança
• Desenvolvimento de pessoas
Baixo
• Autoconsciência

Baixa Nível de importância no futuro Alta


Fonte: LESLIE, J. B., The Leadership Gap – what you need, and still don’t have, when it comes to leadership talent, Center for Creative Leadership, White Paper, 2015.
Disponível em: <https://www.ccl.org/articles/white-papers/leadership-gap-what-you-still-need/>, página 11. 29
Justificativa para o Curso

As organizações (privadas, públicas e não-governamentais) são submetidas a inúmeros projetos


decorrentes das necessidades de mudanças, sejam elas pequenas alterações até grandes
transformações organizacionais.

Juntamente com as novas tecnologias e processos implementados, muitas vezes há a


necessidade de se mudar também as competências das pessoas, seus comportamentos e, de
forma geral, a cultura organizacional vigente na organização de forma que ela se prepare aos
desafios presentes e futuros.

O aprendizado dos conhecimentos fundamentais em Gestão da Mudança e de suas principais


práticas deve ser visto, portanto, como relevante aos profissionais que almejam liderar suas
empresas e implementar inovações e melhorias, em produtos, processos, tecnologia, estrutura e
gestão. Isso vale para atuação no mercado profissional, em pesquisa ou mesmo na docência.

30
Justificativa para o Curso

As decisões sobre a alocação de recursos, sejam eles o tempo, a energia, o uso dos talentos,
dentre outros, definem, em última instância, a estratégia a ser executada pela sua
organização, independentemente da estratégia planejada / desejada, que teoricamente
deveriam ser alinhadas.

As decisões sobre as alocações de recursos podem tornar a vida das organizações muito
diferente da sua missão, da visão, e da estratégia planejada.

Se investir mal seus recursos, os resultados podem ser ruins.

Adaptado de: Christensen, C. M. Que critérios pautarão sua vida? Harvard Business Review, Brasil, Julho, 2010, pp. 80-85.

31
Justificativa para o Curso

A cultura da organização define a prioridade dada a cada tipo de problema,


sendo por isso uma poderosa ferramenta de gestão. A cultura alinhada à
estratégia irá ajudar a organização a alocar os recursos na implementação da
sua estratégia, na busca de sua visão, e no cumprimento de sua missão.

Adaptado de: Christensen, C. M. Que critérios pautarão sua vida? Harvard Business Review, Brasil, Julho, 2010, pp. 80-85.

32
Objetivos da aula

Apresentar conceitos, princípios,


técnicas e ferramentas fundamentais
para a gestão da mudança Desenvolver competências de
organizacional liderança aplicadas ao processo de
gestão da mudança, transformação e
evolução organizacional no contexto
da Quarta Revolução Industrial.

Contribuir para a atuação


profissional e social do(a) estudante
de MBA (negócios (digitais) / gestão
estratégica / operações / projetos /
ciência de dados / varejo / pessoas /
escolas / etc.

33
34
Lógica RPV (Recursos, Processos, Valores)
Cultura
Organiza-
cional

V
Desempenho no Mercado principal
Evolução / Crescimento

Valores

Inovação Disruptiva /
Mudança Radical

Capacidade p/
Processos

sim
Sucesso

R
Recursos
Fonte: CHRISTENSEN, C. M.; OVERDORF, M. Meeting the Challenge of
Disruptive Change, Harvard Business Review, Mar-Apr, 2000.
Fundador não
Tempo / Maturidade
35
Resultados para
Iceberg da Mudança e Inovação Stakeholders / Sociedade
Principais dimensões e
variáveis do
comportamento Retorno ($)
Resultados Mercado
organizacional para o (não funcionam bem / Clientes Resultados
gerenciamento de o bastante ou
(funcionam
mudança e inovação precisam ser
Ações / Práticas para bem o
diferentes)
resolução de Problemas bastante)
Invenção,
Descoberta, Experiências
Desenvolvimento Execução da
Recursos (R)
Estratégia Ensinar a novos
Estratégia
Processos (P) membros
Ambiente
Estruturas Capabilidades Competências Teoria E
Externo & Comportamentos Gestão Hard Nível dos Artefatos Visíveis
Sistemas / Reações
Nível dos Valores
Cultura Liderança Soft
Aprendizagem Teoria O
Organizacional Normas
&
Crescimento Valores
Problemas: Forma correta
Cultura &
o Adaptação Externa
Liderança
de perceber,
Mindset
o Integração interna Valores (V) pensar e sentir
Indivíduo
Propósito
Crenças
Pressupostos Básicos / Crenças
(dados como certo) Nível dos Pressupostos Básicos
Fonte: adaptado de GEROLAMO, 2019 36
Conceito
Change Management

37
Estágios da Mudança

Três Estágios do Processo de Mudança (Kurt Lewin)

ESTÁGIO 1 ESTÁGIO 2 ESTÁGIO 3

DESCONGELAR MUDAR RECONGELAR

Aprendendo novos conceitos,


Criando a motivação / urgência Internalizando novos conceitos,
novos significados, e novos
para a mudança significados e padrões
padrões

Fonte: Lewin (1952) citado por Schein (2002).

38
Definição

O QUE É CHANGE MANAGEMENT?

39
Gestão da Mudança Definição
“O gerenciamento de mudanças é um termo coletivo para todas as
[1] A gestão da mudança e A Gestão de abordagens para preparar e apoiar indivíduos, equipes e organizações
desenvolvimento dentro de um negócio na realização de mudanças organizacionais. Inclui métodos que
Mudanças redirecionam ou redefinem o uso de recursos, processos de negócios,
ou de uma organização similar. refere-se aos alocações de orçamento ou outros modos de operação que alteram
“processos, significativamente uma empresa ou organização. O Gerenciamento de
[2] A identificação e implementação ferramentas e Mudança Organizacional considera a organização completa e o que
controlada de mudanças necessárias técnicas para precisa mudar[1], enquanto o gerenciamento de mudanças pode ser
dentro de um sistema de informação. gerenciar o lado usado somente para se referir a como as pessoas e equipes são
afetadas por essa transição organizacional. Ele lida com muitas
Oxford Living Dictionaries, das pessoas em disciplinas diferentes, desde ciências comportamentais e sociais até
https://en.oxforddictionaries.com/definition/change_management uma mudança soluções de tecnologia da informação e negócios[2].
para alcançar
um resultado Em um contexto de gerenciamento de projetos, o termo
Gestão da Mudança ‘gerenciamento de mudanças’ pode ser usado como uma alternativa
necessário para
para o processo de controle de mudanças, no qual mudanças no
o negócio”. escopo de um projeto são formalmente introduzidas e aprovadas [3] [4].”
O planejamento e a introdução de
novos processos, métodos de trabalho, Prosci, Wikipedia, https://en.wikipedia.org/wiki/Change_management
https://www.prosci.com/ch
etc. em uma empresa ou organização. ange-management/thought-
[1] "Home". International Organizational Change Management Institute. Retrieved 2015-12-08.
[2] https://www.prosci.com/change-management/what-is-change-management
leadership-library/change- [3] Filicetti, John (August 20, 2007). "Project Management Dictionary". PM Hut. Retrieved November 16,
management-definition
Cambridge Dictionary, 2009.
https://dictionary.cambridge.org/dictionary/english/change- [4] Levin, Ginger (2012). "Embrace and Exploit Change as a Program Manager: Guidelines for Success".
management Project Management Institute. Retrieved August 10, 2013.

40
John P. Kotter

“um conjunto de ferramentas e de estruturas


básicas que buscam manter sob controle
qualquer esforço de mudança”

41
John P. Kotter
▪ Leading Change
▪ by John P. Kotter (Author)
▪ Hardcover: 197 pages
▪ Publisher: Harvard Business School Press; 1st
edition (January 15, 1996)

Kotter, John P (1996). Leading Change, Harvard Business School Press, 1st Edition, p. 197.

42
Conceitos: Os Erros da Gestão da Mudança

Os 8 Erros do Processo de Mudança (John P. Kotter)


1. Não estabelecer um senso de urgência
2. Não formar uma poderosa coalizão de liderança
3. Não criar uma visão
4. Não comunicar a visão
5. Não remover os obstáculos para a nova visão
6. Não planejar e criar vitórias de curto prazo
7. Declarar a vitória cedo demais
8. Não institucionalizar a mudança na cultura da organização Fonte: Kotter (1995; 1996).

43
Conceitos: Os Passos da Mudança

Os 8 Passos do Processo de Mudança (John P. Kotter)


1. Estabelecer um senso de urgência
2. Formar uma poderosa coalizão de liderança
3. Criar uma visão
4. Comunicar a visão
5. Empoderar as pessoas para trabalharem na visão
6. Planejar e obter os objetivos e metas de curto prazo
7. Consolidar as melhorias e produzir mais mudanças
8. Institucionalizar as mudanças na cultura organizacional
Fonte: Kotter (1995; 1996).

44
Os 8 Passos 8.
1. Senso de
Institucionalizar
Processo de Mudança as mudanças
urgência
(John P. Kotter)

2. Poderosa
7. Consolidar
coalizão de
as melhorias
liderança

6. Objetivos
3. Criar uma
e metas de
visão
curto prazo

5. Empoderar 4. Comunicar
as pessoas a visão
45
Definindo Gestão da Mudança

Uma definição* mais ampla de Gestão da Mudança

Gestão da Mudança é “... um processo contínuo de aprendizagem,


individual e organizacional, que visa à implementação de esforços temporários de
mudança para atingir uma grande transformação centrada nas pessoas (incluindo
usuário), com foco em resultados alinhados com o propósito evolutivo da
organização, cuja liderança deve considerar a cultura organizacional, para a
redução do nível de resistência e aumento do comprometimento, garantindo a
sua longevidade em um mundo em constante evolução”.

*Nota: Esta definição é fruto de um trabalho em equipe desenvolvido por estudantes de pós-graduação na disciplina SEP5835 – Gestão da Mudança
oferecida pelo professor Mateus C. Gerolamo, na aula de Conceitos de Gestão da Mudança, em 23 de março de 2018. Os integrantes da equipe e os
autores da frase são, em ordem alfabética: Jeanne L. M. Michel, Júlio C. Natalense, Valter Yogui, Welington J. R. dos Santos, e Willian Rossini. Em
2023 Anna Carolina Maccarone e Maiara Rosa Cencic agregaram mais elementos à esta definição. Revisada e adaptada por Mateus C. Gerolamo.

46
Cinco Principais Segredos do Sucesso para a Integração entre
Gestão de Projetos e Gestão da Mudança

1. Apoio e 4. Direção 5.
2. Apoio 3. Escopo,
adesão e formas Definição e
da tempo e
dos times de clareza nos
liderança priorização
de projeto integração papeis

Fonte: Adaptado de PROSCI. Change Management & Project Management: 5 Keys to Effective Integration. Prosci: People, Change, Results, Thought Leadership Article, 2017.
Disponível em: <https://www.prosci.com/resources/articles/integrating-change-and-project-management>.

47
Atividades de Gestão de Projetos versus Atividades de Gestão da Mudança

ATIVIDADES DE GESTÃO DE PROJETOS ATIVIDADES DE GESTÃO DA MUDANÇA


Iniciar projeto
Definir escopo do projeto Conduzir avaliação de prontidão e análise de impacto
Identificar e iniciar coalizão para construção de apoio
Selecionar e preparar o time de gestão da mudança
Planejar projeto
Estabelecer objetivo Identificar e endereçar resistências prematuras
Documentar abordagem
Definir time e requisitos do orçamento Comunicar o porquê da mudança estar acontecendo (sponsors)

Projetar solução Preparar e equipar gestores e supervisores


Realizar benchmarking e colher dados Continuar comunicação e atividades de apoio dos sponsors
Gerar ideias e selecionar conceitos Lançar sessões de grupos e de coaching
Modelar soluções Reforçar as mensagens principais (sponsors)
Documentar requisitos
Continuar comunicação e atividades de apoio dos sponsors
Desenvolver solução Identificar necessidades de treinamento e desenvolver o
Avaliar alternativas treinamento
Arquitetar soluções Continuar comunicação, atividades de apoio dos sponsors, e
atividades de coaching
Fonte: PROSCI. Change Management & Project Management: 5 Keys to Effective Integration. Prosci: People, Change, Results, Thought Leadership Article, 2017.
Disponível em: <https://www.prosci.com/resources/articles/integrating-change-and-project-management>. Página 4.
48
ESTUDO DE CASO - CHANGE

Desafios de Mudanças em Negócios

49
49
Desafios de Mudanças em Negócios

CASES

50
Desafios de Mudanças nos Negócios
Caso 1: Uma nova iniciativa

Como um administrador corporativo liderando uma área funcional chave em uma


empresa do setor de energia, a avaliação de Olavo foi que os processos eram
intensivamente burocráticos, e os funcionários eram reativos às necessidades dos
clientes ao invés de serem proativos na busca de novas oportunidades. Ele queria criar
um ambiente estratégico, melhorando os sistemas para alavancar o conhecimento de
mercado. Então, ele queria usar esse conhecimento para trabalhar em colaboração
com os clientes e antecipar as necessidades deles.

51
Desafios de Mudanças nos Negócios
Caso 2: Uma aquisição

Como um presidente e diretora executiva de um banco de sucesso, a organização de


Solange adquiriu uma empresa de serviços financeiros com cerca de 500 funcionários e
55 escritórios. Foi uma grande aquisição estratégica com muita oportunidade e risco. A
aquisição iria posicionar o banco para criar um modelo de negócio inovador que
poderia revolucionar o setor. Solange queria integrar as duas organizações fazendo que
as equipes de gerenciamento seniores trabalhassem juntas e pudessem tirar o melhor
da cultura de cada empresa.

52
Principais Desafios de Negócios

O que você acha que aconteceu nessas histórias?

Qual esforço de mudança foi bem-sucedido e qual


foi malsucedido?
Você acha que a “nova iniciativa” levou a maior
eficiência e clientes mais satisfeitos?
E o processo de aquisição? Entrou em colapso
mediante o confronto de duas culturas diferentes?
53 53
Ferramenta para gestão da mudança em projetos

D.I.C.E.

54 54
The Hard Side of Change Management

The Hard Side of Change Management, by Harold L. Sirkin , Perry Keenan and Alan Jackson, Harvard Business Review
From the October 2005 Issue, Available at: https://hbr.org/2005/10/the-hard-side-of-change-management
DICE® BCG: https://www.bcg.com/en-br/capabilities/change-management/dice.aspx

55
The Hard Side of Change Management51
8 -
3 . 09
5. 27
a 31
i d
o sh
i Y
s h
A t su
e l o
ar c
M
The Hard Side of Change Management, by Harold L. Sirkin , Perry Keenan and Alan Jackson, Harvard Business Review
From the October 2005 Issue, Available at: https://hbr.org/2005/10/the-hard-side-of-change-management
DICE® BCG: https://www.bcg.com/en-br/capabilities/change-management/dice.aspx 56
Os Quatro Fatores D.I.C.E. (Duração, Integridade, Comprometimento, Esforço)

Fatores DICE Descrição

O tempo percorrido até que a mudança seja finalizada em caso de


Duração (Duration) projeto com tempo curto, ou então o espaço de tempo entre
revisões dos marcos do projeto.

A integridade do time de projeto relacionada ao seu desempenho,


Integridade (Integrity) que é a habilidade do time em completar a atividade no tempo.
(Competência da Isso depende das competências dos membros do time e
Equipe) características relativas aos requisitos do projeto.

O comprometimento demonstrado com relação à mudança tanto


Comprometimento pelos representantes da alta administração (C1) quanto dos demais
(Commitment) colaboradores afetados com a mudança (C2).

O nível de esforço que deverá empreendido além das tarefas usuais


das pessoas que as iniciativas de mudança irão demandar dos
Esforço (Effort) participantes, diretamente ou indiretamente envolvidos com o
projeto.
Fonte: SIRKIN, H. L.; KEENAN, P.; JACKSON, A. The Hard Side of Change Management, Harvard Business Review, October, 2005, pp. 108-114.

57
Cálculo da Pontuação D.I.C.E.
Fatores DICE Questões e Pontuação
A equipe costuma fazer acompanhamento e revisões do projeto de forma regular.

D As revisões acontecem numa frequência coerente com o tempo total do projeto (por exemplo de 2 em 2
meses).
(Pontuação: concordo totalmente = 1; concordo = 2; discordo = 3; discordo totalmente = 4)

A liderança da equipe tem se mostrado capaz de garantir a realização do projeto.

I Os membros da equipe possuem competência adequada para concluir a iniciativa de mudança no prazo.
(Pontuação: concordo totalmente = 1; concordo = 2; discordo = 3; discordo totalmente = 4)

A alta liderança comunica com frequência a razão da mudança e a importância do sucesso.

C1 A mensagem é consistente e convincente. A alta liderança tem direcionado recursos suficientes para a
mudança.
(Pontuação: concordo totalmente = 1; concordo = 2; discordo = 3; discordo totalmente = 4)
Os colaboradores que impactam ou são impactados pela mudança entendem as razões e acreditam na

C2 necessidade da transformação. Eles dão apoio e estão motivados. Não estão aflitos nem demonstrando
sinais de resistência.
(Pontuação: concordo totalmente = 1; concordo = 2; discordo = 3; discordo totalmente = 4)
O projeto demanda uma quantidade de esforço compatível com as atividades do dia-a-dia dos membros da

E equipe. A equipe prioriza seu tempo para empregar o esforço na mudança. Não se percebe resistência
quando necessário aumentar o esforço demandado para a equipe. (Pontuação: concordo totalmente = 1;
concordo = 2; discordo = 3; discordo totalmente = 4)
Fonte: SIRKIN, H. L.; KEENAN, P.; JACKSON, A. The Hard Side of Change Management, Harvard Business Review, October, 2005, pp. 108-114, p. 109.
58
D.I.C.E.

BEM-SUCEDIDO
Duration / Integrity / Commitment / Effort

Resultado Provável do Projeto


[D] [I] [C1] [C2] [E]

Calcular

MAL SUCEDIDO
PONTUAÇÃO DICE = D + 2*I + 2*C1 + C2 + E

Plotar WIN (Zona da Vitória)


WORRY WOE (Zona das Dificuldades)
(preocupação))

7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Pontuação DICE
Fonte: SIRKIN, H. L.; KEENAN, P.; JACKSON, A. The Hard Side of Change Management, Harvard Business Review, October, 2005, pp. 108-114, p. 110.
Pontuação
DICE

7
8 Zona
9 Sucesso
10 Meta = 10
11
12,7
12
13 13,0
14,3
14
Zona
15
14,9 14,9 Preocupação
16
17
18
19
20
21
22
23 Zona
24 Fracasso
25
26
27
28
Linha de
Kick-off Ga te 1 Ga te 2 Ga te 3 Ga te 4 Ga te 5
05/03/2018 12/04/2018 17/05/2018 14/06/2018 18/09/2018 06/06/2019 Tempo do
Projeto
Ga te 6
16/09/2019

60
Alinhamento Organizacional
Visão Sistêmica da Cadeia de Valor

61
Importância da Cadeia de Valor
Além de operar a organização, as pessoas também são
responsáveis pelas inovações e por sua evolução;

É preciso manter e melhorar sempre o valor do


negócio;

Para isso, precisamos enxergar a(s) cadeia(s) de


valor de nossa organização!

62
Importância da Cadeia de Valor
O que é uma cadeia de valor?

... uma cadeia de valor é qualquer combinação de processos, funções, atividades,


relacionamentos e caminhos, ao longo dos quais produtos, serviços, informações e
transações financeiras movimentam-se internamente e entre empresas. Isso inclui todas e
quaisquer atividades, começando com a extração de matérias-primas e terminando com o
consumo final, sendo que todos na empresa estão envolvidos em fazer que isso aconteça.
Fonte: Gattorna, 2006, p. 2

63
Cadeias de Valor são Complexas

A maioria das empresas


contém literalmente centenas
de cadeias de valor.

Muitas pessoas praticamente não têm visão


dessas cadeias de valor. Elas podem apenas ver o
movimento rastreável dos produtos e/ou a
posição dos ativos físicos. Complexidade torna a
verdadeira cadeia de valor invisível.

64
Cadeias de Valor são Complexas

Percebe-se uma preocupação gerencial doentia com a


utilização da infraestrutura e dos ativos, movida
principalmente pelo desejo obsessivo de cortar custos.

Cortar custos, realizar reengenharia,


benchmarking, lean e melhoria contínua podem ter
seus lugares no arsenal corporativo, mas não são as
únicas respostas para a complexidade na cadeia de
valor.

65
Como manter a coerência da(s)
sua(s) cadeia(s) de valor e obter
resultados positivos para os
diversos stakeholders do negócio?

66
Alinhamento
• O alinhamento é uma idéia que captura o conceito
de dinamismo, ou vida, na organização;

• Buscar o alinhamento significa tratar a organização


como um ser vivo e não como uma entidade
mecânica;

• Isso tem tudo a ver com a energia, a realização e o


dinamismo de pessoas e movimentos.
67
Alinhamento
• Organizações bem-sucedidas geralmente têm uma liderança que está
claramente em contato íntimo e que tem empatia pelos seus
stakeholders.

• Líderes empáticos tendem a formular estratégias relevantes e a moldar


as capacidades culturais mais adequadas visando a fundamentar e a
direcionar essas estratégias no mercado.

• Todos os tipos de organizações têm uma coisa em comum: as pessoas e


seu comportamento. De fato, assumir uma posição de liderança hoje em
dia é muito mais ‘arriscado’ do que no passado, pois o tempo para
aprender a função é pouco ou inexistente.

68
Se pudermos entender e
aplicar corretamente uma
abordagem efetiva para
gestão do ‘fator humano’
...

... descobriremos um
recurso primordial para a
melhoria do desempenho
no futuro próximo.
69
Observe seus Stakeholders ...
A menos que toda a nossa energia e recursos
estejam focados em melhorar o ‘alinhamento’
entre a nossa organização e todos os seus
stakeholders, estaremos provavelmente
desperdiçando o tempo de todos e
enfraquecendo a organização nesse processo.

70
Em Busca do
Alinhamento Organizacional
Visão Sistêmica da Cadeia de Valor

71
Como Buscar o Alinhamento?
Resultado para Hard
os Stakeholders Estratégia
Para promover o de Negócio
Execução
Alinhamento
da Estratégia
Organizacional,
diferentes dimensões Cultura
Organizacional
organizacionais
Liderança
devem ser
consideradas. Soft

Propósito
73
Desafios para a Liderança

▪ Alinhar a organização,
▪ Alinhar as pessoas,
▪ Alinhar os comportamentos,
▪ Definir uma estratégia,
▪ Executar a estratégia, e
▪ Obter os resultados.
Fazer de forma certa as coisas certas
74
Antes de alinhar as
pessoas é preciso
Desafios para conhecê-las, bem como as
a Liderança razões pelas quais se
comportam de uma
determinada forma!
75
Forças Comportamentais
Desafios do Alinhamento Organizacional

76
Forças Comportamentais
A força que representa cooperação, A força voltada para criatividade,
coesão, participação e mudança, inovação e flexibilidade
harmonia

A força que representa estabilidade, A força voltada para energia, ação,


controle, confiabilidade, resultados, velocidade e foco
medição, lógica e
eficiência

As raízes desse sistema estão firmemente estabelecidas na teoria dos tipos psicológicos de
Carl G. Jung. Esta teoria diz que toda atividade mental consciente ocorre em:
▪ dois processos perceptivos: ▪ e em dois processos de decisão:
✓ sensação, e ✓ pensamento, e
✓ intuição; ✓ sentimento
77
Alinhamento organizacional
e da Cadeia de Valor
Integrando Modelos

78
Alinhamento Organizacional e da Cadeia de Valor

Para promover o
Alinhamento
Organizacional, diferentes
dimensões organizacionais
devem ser consideradas.

79
Alinhamento Organizacional e da Cadeia de Valor

Para promover o
Alinhamento
Organizacional,
diferentes forças
comportamentais
devem ser
consideradas.

80
Alinhamento Organizacional e da Cadeia de Valor
O desafio é compreender o papel
das forças comportamentais no
alinhamento e desalinhamento
de suas cadeias de valor

81
Alinhamento Organizacional e da Cadeia de Valor
O desafio é compreender o papel
das forças comportamentais no
alinhamento e desalinhamento
de suas cadeias de valor

82
Instrumento de Avaliação do Alinhamento Organizacional

O desafio é compreender o papel das


forças comportamentais no
alinhamento e desalinhamento de
suas cadeias de valor
Instrumento de Avaliação do Alinhamento Organizacional

O desafio é compreender o papel das


forças comportamentais no
alinhamento e desalinhamento de
suas cadeias de valor
Instrumento de Avaliação do Alinhamento Organizacional

O desafio é compreender o papel das


forças comportamentais no
alinhamento e desalinhamento de
suas cadeias de valor
Framework de Tensões
Organizacionais
A Importância dos Valores

86
A importância dos Valores

FRAMEWORK DE TENSÕES
ORGANIZACIONAIS
87
Figura:
Um Framework de
Tensões Organizacionais
5 1
• Valores
0 9 8-
3.
• Indicadores
• Comportamentos
. 27
(positivos e negativos)
3 15
i da
sh
Framework de

o
Tensões

Y
Organizacionais

s hi
A t su
e l o
ar c
Fonte: M
Quinn, R. E. The Positive Organization: Breaking Free from
Zona Positiva
Conventional Cultures, Constraints, and Beliefs, Berrett-Koehler
Publisher, Inc. 2015. Chapter 1, pages 11-17. Zona Negativa
88
TIPOLOGIA DE CULTURA
ORGANIZACIONAL
89
Competing Values Framework (CVF)
Estrutura / Ambiente

1
Orientado à Flexibilidade e Mudança
COLABORAÇÃO
A organização é um lugar aberto e amigável
CRIAÇÃO
Lugar dinâmico, empreendedor e criativo.
8- 5
para se trabalhar, onde as pessoas Inovação e tomadas de risco são praticadas

0 9
3.
• Modelo: Relações Humanas compartilham muito de si mesmas. Líderes pelos indivíduos. O comprometimento em • Modelo: Sistemas Abertos
• Estratégia: Inovação em Produto-

7
• Estratégia: Cooperação / são considerados mentores ou mesmo, testar e refletir sobre aspectos distintos

2
figuras familiares. Lealdade entre grupos e unifica a organização. Esforço para estar “on Serviço / Adaptação / diferenciação

.
Relacionamento / Intimidade c/
senso de tradição são fortes. Enfatiza-se the leading edge”. O objetivo a longo-prazo

5
clientes • Cultura: Adocracia / Criação /

1
benefícios de longo-prazo obtidos através é o crescimento e a aquisição de novos Desenvolvim.
• Cultura: Clã / Colaboração

3
do desenvolvimento de recursos humanos . recursos. Sucesso significa obter • Líderes: inovadores,
• Líderes: considerados mentores

a
Grande importância é dada à coesão dos exclusividade e novos produtos e serviços. É
• Exemplo: Harley-Davidson empreendedores

d
grupos. Existe um forte interesse das importante ser líder do setor. Iniciativas

i
pessoas. A organização premia o trabalho individuais e liberdade são encorajadas. • Exemplo: Apple

sh
em equipe, a participação e o consenso.

Yo
Foco Interno Foco Externo
Orientado a Pessoas CONTROLE COMPETIÇÃO Orientado a Organização

• Modelo: Processos Internos


s h i
Lugar altamente estruturado e formal.
Procedimentos e regras governam
A realização do trabalho é o foco do
direcionamento de resultados da • Modelo: Metas Racionais

u
• Estratégia: Excelência Operacional / comportamentos. Líderes buscam eficiência organização. As pessoas são competitivas e • Estratégia: Excelência Operacional /
Eficiência / Consolidação
• Cultura: ‘Hierarquia’ / Estruturação /
A t s
e esforçam-se para ser bons coordenadores.
Manter um funcionamento sem problemas é
o mais crítico. Políticas formais mantém os
orientadas a objetivos. Líderes são
exigentes, produtivos e “durões”. A ênfase
em vencer é o que unifica a organização.
Eficácia / Crescimento e Maxim. de
Resultados

o
• Cultura: Mercado / Realização /

l
Excelência / Controle grupos unidos. Estabilidade, desempenho e Reputação e sucesso são preocupações

ce
• Líderes: bons coordenadores eficiência são metas de longo-prazo. Sucesso comuns. O foco a longo-prazo é obter Agilidade / Competição

r
• Exemplo: McDonalds significa entregas confiáveis, planejamento competitividade e resultados mensuráveis. • Líderes: exigentes, produtivos e

a
executável e baixo custo. A gestão requer Sucesso significa obter inserção e posição “durões”
• Exemplo: AMBEV

M
segurança e previsibilidade. de mercado. Preços competitivos e
liderança de mercado são importantes.

Estrutura / Ambiente
Orientado à Estabilidade e Controle

Fonte: Cameron Kim S.; Quinn, Robert E. (2011). Diagnosing and Changing Organizational Culture:
Based on the Competing Values Framework. San Francisco: Jossey-Bass, 3rd Edition.
90
Exemplo de Mapeamento de Cultura em uma Organização

• Colaboradores: atual x desejada • Diretoria: atual x desejada

91
Exemplo de Mapeamento de Cultura em uma Organização

• Colaboradores: atual x desejada • Diretoria: atual x desejada

92
Case: Cultura Organizacional

93
Exemplo de Mapeamento de Cultura em uma Organização

94
94
Exemplo de Culturas nas Indústrias

95
Onde precisamos focar para
melhorar a cultura da nossa
organização para o novo contexto?

96
The Positive Organization
• Quando um propósito claro e
significativo é dado às pessoas unidas,
elas são capazes de se moverem adiante
de forma mais rápida e persistirem
mesmo quando os líderes estiverem
ausentes.

• Os líderes devem desenvolver um zelo


pela velocidade, propósito e unidade.

• Ao fazerem isso, como resultados, os líderes começam a enfatizar cinco princípios


para tornar-se uma organização mais positiva.
Fonte: Quinn (2015, p. 22-26).

97
The Positive Organization
• Robert E. Quinn, em seu livro “The Positive Organization” apresenta um
conjunto de 5 princípios para a construção de uma organização mais positiva.

• É necessário que aprendamos mais sobre cultura e como criar engajamento.


É preciso considerar a ideia de que é possível criar uma organização mais
positiva.

• Algumas organizações crescem e se tornam bem-sucedidas por causa do tipo


de cultura que elas desenvolvem. A ideologia ou cultura positiva é vitalizada
pela liderança. Os líderes incorporam o propósito e os valores dessas
companhias extraordinárias.

• As pessoas são inspiradas pela busca de seu propósito. As pessoas possuem


uma orientação positiva e criativa conforme elas experimentam, aprendem e
mudam. É um movimento contínuo em busca do propósito coletivo Fonte: Quinn (2015, p. 22-26).

98
The Positive Organization
5 princípios para a construção de uma organização positiva:

Criar um Senso Visualizar Confiar no


de Propósito Possibilidades Processo Emergente

Nutrir Diálogos Abraçar o


Autênticos Bem Comum

As organizações crescem e se A ideologia ou cultura positiva As pessoas possuem uma


tornam bem-sucedidas por é vitalizada pela liderança, que orientação positiva e criativa
causa do tipo de cultura que incorpora o propósito e os conforme elas experimentam,
elas desenvolvem valores dessas companhias. aprendem e mudam. Fonte: Quinn (2015, p. 22-26).

99
The Positive Organization
1. Criar um Senso de Propósito: O sucesso ou o fracasso
sempre terão um grande impacto no futuro da humanidade.
Dentro de uma empresa, as pessoas levam isso a sério e isso
se torna uma fonte de inspiração. Para que se possa gerenciar
tal crescimento, uma companhia necessita de consistência,
um conjunto de valores, e princípios operacionais. Em
conjunto, o propósito, os valores e os procedimentos
operacionais se tornam um framework de muito significado. O
propósito não é uma estratégia e não se preocupe caso ele
não seja uma estratégia.
Criar um Senso
Fonte: Quinn (2015, p. 22-26). de Propósito
100
The Positive Organization
2. Nutrir Diálogos Autênticos: Geralmente não são as palavras que
fazem uma companhia se mover, mas sim a pessoa dizendo aquelas
palavras e sobre o como essa pessoa as diz. Propósito é inseparável de
integridade e autenticidade. Sem um líder autêntico se engajando com
um comportamento autêntico, as palavras por si só não carregam
nenhum poder. Quando um líder fala sobre o propósito da companhia,
é preciso que ele demostre paixão. As pessoas podem sentir se aquela
paixão manifestada é autêntica. Então elas aceitam e agem de acordo
com suas palavras, e assim a companhia se torna mais alinhada.

Nutrir Diálogos
Autênticos
Fonte: Quinn (2015, p. 22-26).

101
The Positive Organization
3. Visualizar Possibilidades: É preciso compreendermos que nós aprendemos
com os nossos erros e seguimos adiante. Muitas vezes, tais aprendizados vêm
com ideias que não se acreditava anteriormente, mas temos que confiar
nesse processo. Uma vez que nosso propósito esteja claro, uma vez que
tenhamos um conceito robusto para se embasar, então há coesão. Líderes
que visualizam possibilidades dão suporte a ideias nas quais eles mesmos não
acreditavam anteriormente porque eles estão no negócio de ajudar as
pessoas a enxergarem e acreditarem em suas próprias possibilidades
individuais e coletivas. Assim, os líderes empoderam as pessoas a enxergarem
e buscarem possibilidades. Tanto quanto as pessoas aprendam a fazer isso,
elas começam a ajudar seus líderes a enxergarem que era possível.

Visualizar
Possibilidades
Fonte: Quinn (2015, p. 22-26).

102
The Positive Organization
4. Abraçar o Bem Comum: Ao se trabalhar e operar com os princípios
anteriormente mencionados, pode-se fazer as pessoas, os colaboradores se
sentirem bem com aquilo que eles estão fazendo. Sentimentos positivos são
um reflexo de uma energia positiva. Manter a integridade e agir em busca de
um bem maior é importante porque isso eleva a energia positiva. Isso faz as
pessoas orgulhosas de suas empresas. Assim, elas não abandonam. Elas
possuem um senso de direção e energia.

Abraçar o
Bem Comum
Fonte: Quinn (2015, p. 22-26).

103
The Positive Organization
5. Confiar no Processo Emergente: Esse princípio significa que alguma coisa acontece, aparece,
ocorre, ou se materializa sem uma direção e controle top-down. Um líder deve se tornar um
facilitador e desenvolvedor. É necessário proporcionar um propósito e confiar em sua equipe. De
fato, um líder precisa dar suporte às ideias dos seus liderados mesmo quando ele está em
dúvidas sobre elas. Isso acontece não apenas para iniciativas individuais, mas também para a
emergência do aprendizado coletivo e colaboração criativa. E quando ocorrem falhas, elas não
serão motivos de punições, mas serão tratadas como pontos de aprendizado. A chave é continuar
seguindo adiante e manter o aprendizado constante. Agindo dessa forma, as pessoas estarão
cocriando a organização. A organização emerge em tempo real. E ela não emerge apenas da
mente de uma pessoa da alta administração. Ela emerge pela interação de todas as pessoas
conectadas com o negócio, seu propósito, seus valores, seus princípios operacionais e seus
líderes. Este último princípio em particular, a noção de confiança no processo emergente, está
muito longe do mapa mental convencional existente na maioria das empresas. Ele pode ser
considerado um dos mais difíceis conceitos para os executivos entenderes, aceitarem e agirem de
acordo.

Confiar no
Processo Emergente
Fonte: Quinn (2015, p. 22-26).

104
5 1
0 9 8-
3. 27
15.
Em que Ambiente a 3
h i d
Operamos?Y o s
s h i
t
Avaliação do Mapa s u Mental Predominante em Minha
o A
c e l Organização
a r
M
105
Mapa Mental Organizacional
▪ Leia o instrumento de Avaliação do
Mapa Mental da Organização.

▪ Responda cada questão com base


em sua percepção.

▪ Atribua uma nota de 01 a 10 para


cada questão e calcule a média final
(em valor percentual).

▪ Posicione sua organização na matriz


de Mapas Mentais Organizacionais.

106
Mapa Mental Organizacional
5 1
0 9 8-
27 3.
15.
a 3
i d
o sh
i Y
s h
A t su
e l o
ar c
M
𝑴é𝒅𝒊𝒂 𝑨 + 𝑴é𝒅𝒊𝒂 𝑩 + 𝑴é𝒅𝒊𝒂 𝑪 + 𝑴é𝒅𝒊𝒂 𝑫 + 𝑴é𝒅𝒊𝒂 𝑬
𝑴é𝒅𝒊𝒂 𝑻𝒐𝒕𝒂𝒍 = = _________
𝟓

107
Mapa Mental Organizacional

Com base no radar acima, qual seria o principal ponto a ser atacado?
Declare seu desafio:

108
Mapa Mental Organizacional

Após responder as questões anteriores e compilar os resultados no gráfico


radar, reflita sobre os resultados e responda as seguintes questões:

Quais novas características eu gostaria que


minha organização tivesse daqui a um ano?

Quais ideias eu já tenho para tornar a


minha organização mais positiva?

109
Mudanças de Mindset
para a Transformação
Organizacional

110
A organização é
uma pirâmide, uma
hierarquia de
Mapas Mentais
posições A unidade de
trabalho é o
Pessoas limitam-se departamento
a suas
responsabilidades Indicadores são
limitados /
Pessoas recusam e
estreitos
não emitem
feedback
Pessoas Pessoas focam no “chefe”
desempenham
abaixo do As recompensas são
esperado baseadas em atividades
A organização é A organização foca
baseada em cargos em burocracias
desnecessárias
Mapa Mental # 1 Cultura baseada
Fonte: Quinn, R. Positive Organization, 2015.
em conflitos entre
áreas 111
Mudanças de Mindset para a Transformação Organizacional
5 1
0 9 8-
3.
De Para

Lucro
. 27 Propósito
Estruturas, Especialização
3 15
Valor para o Cliente, Adaptabilidade
(chefias, silos e feudos)
Hierarquia
i da
sh
Redes

Yo
Isolamento
Controle excessivo (microgestão) e Autonomia, Empowerment,
Burocracias desnecessárias
h i Accountability, Ownership

us
Plataformas colaborativas
s
Competição (externa e interna)
Planejamento
A t Melhores resultados para stakeholders

e l o
Foco no curto prazo
Experimentação

ar c Privacidade
Retenção de informações
Transparência
Compartilhamento de informações
M Medo, Sentimento de Culpa,
Vitimismo
Confiança, Tomada de risco
Defesa de ideias e opiniões
Fonte: Adaptado de Andrew Chakhoyan, Is the era of management over?, World Economic Forum, 07 Dec
2017 112
Ampliação de Mindset para o Desenvolvimento Organizacional
5 1
0 9 8-
3.
De Para

Lucro
. 27 Propósito
Estruturas, Especialização
3 15
Valor para o Cliente, Adaptabilidade
(chefias, silos e feudos)
Hierarquia
i da
sh
Redes

Yo
Isolamento
Controle excessivo (microgestão) e Autonomia, Empowerment,
Burocracias desnecessárias
h i Accountability, Ownership

us
Plataformas colaborativas
s
Competição (externa e interna)
Planejamento
A t Melhores resultados para stakeholders

e l o
Foco no curto prazo
Experimentação

ar c Privacidade
Retenção de informações
Transparência
Compartilhamento de informações
M Medo, Sentimento de Culpa,
Vitimismo
Confiança, Tomada de risco
Defesa de ideias e opiniões
Fonte: Adaptado de Andrew Chakhoyan, Is the era of management over?, World Economic Forum, 07 Dec
2017 113
Uma cultura focada em processos internos, com excesso
de hierarquia e burocracias desnecessárias, de silos e
feudos, apegada a normas, perfeccionista, que foca
excessivamente no curto prazo, leva a características
como medo de errar, retenção de informações,
isolamento, resistência a mudanças, competição interna,
sentimento de culpa, e vitimismo. A consequência é uma
dificuldade de enxergar tendências de mercado e
vislumbrar oportunidades de inovação.

114
A organização é A organização é uma
uma pirâmide, uma
hierarquia de
Mapas Mentais rede
relacionamentos
posições A unidade de
A unidade de
trabalho é o
trabalho é o time
Pessoas limitam-se departamento Pessoas expandem
a suas seus papeis
responsabilidades Indicadores são
Indicadores são cross
limitados /
Pessoas recusam e / end-to-end Pessoas aceitam e
estreitos
não emitem emitem feedback
feedback
Pessoas Pessoas focam no “chefe” Pessoas focam no “cliente”
desempenham Pessoas
abaixo do As recompensas são As recompensas são superam
esperado baseadas em atividades baseadas em resultados expectativas

A organização é A organização foca A organização tem A organização é


baseada em cargos em burocracias agilidade para agir e baseada em
desnecessárias decidir processos
Mapa Mental # 1 Cultura baseada Cultura Mapa Mental # 2
Fonte: Quinn, R. Positive Organization, 2015.
em conflitos entre Colaborativa
áreas 115
Mudanças de Mindset
para a Transformação
Pessoal

116
Mudanças de Mindset para a Transformação Pessoal
Um enfoque para o Profissional da era Digital (4.0) 1
8 - 5
3 . 09
27
De Para

5.
31
Eu estou orientado a resultados (que
façam sentido para mim, conectados

a
Situado na ‘zona de conforto' Foco em Resultados

d
com quem Eu sou, com qual é o meu

i
Trabalho)?

sh
Cultura adequada para metas e competição

Yo
Estou focado no bem coletivo, nas
necessidades da minha organização,
Foco no próprio ego Bem comum
i
dos stakeholders, da minha

h
comunidade?

s
Cultura voltada para stakeholders

Preocupado com o que os outros


t s u Eu estou orientado aos meus valores
internos, por aquilo que me pauta

A
Orientado a Valores Internos (conectados com quem Eu sou, com
esperam de mim

l o
qual é o meu Trabalho)?
Cultura volta para pessoas e ambiente de trabalho

r c e
a
Eu estou aberto aos estímulos
Interesses próprios Atento aos sinais externos externos que me permitem aprender

M
continuamente?
Cultura adequada para criação, inovação e tendências

Fonte: Robert E. Quinn (2005). Moments of greatness - fundamental state of leadership, HBR, Jul-Aug_2005.

117
Ampliação de Mindset para o Desenvolvimento Pessoal
Um enfoque para o Profissional da era Digital (4.0) 1
8 - 5
3 . 09
27
De Para

5.
31
Eu estou orientado a resultados (que
façam sentido para mim, conectados

a
Situado na ‘zona de conforto' Foco em Resultados

d
com quem Eu sou, com qual é o meu

i
Trabalho)?

sh
Cultura adequada para metas e competição

Yo
Estou focado no bem coletivo, nas
necessidades da minha organização,
Foco no próprio ego Bem comum
i
dos stakeholders, da minha

h
comunidade?

s
Cultura voltada para stakeholders

Preocupado com o que os outros


t s u Eu estou orientado aos meus valores
internos, por aquilo que me pauta

A
Orientado a Valores Internos (conectados com quem Eu sou, com
esperam de mim

l o
qual é o meu Trabalho)?
Cultura volta para pessoas e ambiente de trabalho

r c e
a
Eu estou aberto aos estímulos
Interesses próprios Atento aos sinais externos externos que me permitem aprender

M
continuamente?
Cultura adequada para criação, inovação e tendências

Fonte: Robert E. Quinn (2005). Moments of greatness - fundamental state of leadership, HBR, Jul-Aug_2005.

118
Mapas Mentais
Se os líderes não ampliarem
seus mapas mentais
individuais, eles não poderão
mudar os destinos que as
pessoas seguem, nem os
caminhos que as levarão até lá!

(Fonte adaptado de Black and Gregersen, 2003, Leading Strategic Change,


apud Robert Quinn)

Fonte: Quinn, R. Positive Organizations, 2015. Source: greggfetter.blogspot.com

119
“A genuine change must
first come from within the
individual, only then can
he or she attempt to make
a significant contribution
to humanity.”
Dalai Lama

120
Referências
Principais referências e fontes de motivação indicadas para leitura no tema

121

Referências
BENDIXEN, S. M.; CAMPBELL, M.; CRISWELL, C.; SMITH, R. Change-capable leadership: • MCGUIRE, J. B.; PALUS, C. J.; PASMORE, W.; RHODES, G. B. transforming your
the real power propelling successful change. Seattle: Center for Creative Leadership, organization. Seatle: Center for Creative Leadership, 2015. White Paper. Disponível
2016. (White Paper). Disponível em: <https://www.ccl.org/wp- em: <https://www.ccl.org/wp-content/uploads/2015/04/TYO.pdf> . Acesso em: 16
content/uploads/2016/04/Change-Capable-Leadership.pdf>. Acesso em: 6 fev. 2017. mar. 2017.
• BENNET, N.; LEMOINE, G, J. What VUCA really means for you. Harvard Business • MILES, R. E.; SNOW, C. C.; MEYER, A. D.; COLEMAN JR., H. J. Organization strategy,
Review, p.27, Jan./Feb. 2014. structure and process. The Academy of Management Review, v.3, n.3, p.546-562,
1978.
• BUONO, A. F.; KERBER, K. Creating a sustainable approach to change: building
organizational change capacity. S.A.M. Advanced Management Journal, v.75, n.2, • PORTER, M. E. Vantagem competitiva: criando e sustentando um desempenho
p.4-21, Spring, 2010. superior. Tradução de Elisabeth Maria de Pinho Braga; revisão técnica de Jorge A.
Garcia Gomez. Rio de Janeiro: Campus, 1992.
• CAMERON, K. S.; QUINN, R. E. Diagnosing and changing organizational culture: based
on the competing values framework. 3rded. San Francisco: Jossey-Bass, 2011. • PORTER M. E. What is strategy?. Harvard Business Review, p.61-78, Nov./Dec. 1996.
• CAMERON, K. S.; QUINN, R. E.; DEGRAFF, J.; THAKOR, A. V. Competing values • PROSCI. The History and future of change management. Fort Collins: PROSCI: people,
leadership: creating value in organizations. Cheltenham: Edward Elgar, 2006. change, results, 2016. Thought Leadership Article. Disponível em:
<https://www.prosci.com/resources/articles/change-management-history-and-
• FISHER, M. L. What is the right supply chain for your product?. Harvard Business future>. Acesso em: 29 jan. 2016.
Review, p.105-116, Mar./Apr. 1997.
• QUINN, R. E. Beyond rational management: mastering the paradoxes and competing
• GATTORNA, J. Living supply chains: how to mobilize the enterprise around delivering demands of high performance. San Francisco: Jossey Bass, 1988.
what your customer want. Harlow: Pearson Educated, 2006.
• QUINN, R. E. Moments of greatness: entering the fundamental state of leadership.
• GOLEMAN, D. Leadership that gets results. Harvard Business Review, p.78-90, Harvard Business Review, p.74-83, July-Aug. 2005.
Mar./Apr. 2000.
• QUINN, R. E. The Positive organization: breaking free from conventional cultures,
• GROYSBERG, B.; LEE, J.; PRICE, J.; CHENG, Y-J. The Leaders guide to corporate culture. constraints, and beliefs. Oakland: Berrett-Koehler, 2015.
Harvard Business Review, p.44-52, Jan./Feb. 2018.
• QUINN, R. E.; ROHRBAUGH, J. A Competing values approach to organizational
• KERBER, K.; BUONO, A. F. Rethinking organizational change: reframing the challenge effectiveness. Public Productivity Review, v.5, n.2, p.122-140, June 1981.
of change management. Organizational Development Journal, v.23, n.3, p.23-38,
2005. • QUINN, R. E.; ROHRBAUGH, J. A Spatial model of effectiveness criteria: towards a
competing values approach to organizational analysis. Management Science, v.29,
• KOTTER, J. P. Leading change: why transformation efforts fail. Harvard Business p.363-377, 1983.
Review, p.59-67, Mar./Apr. 1995.
• SCHEIN, E. H. Models and tolls for stability and change in human systems. Reflections,
• KOTTER, J. P. Leading change. Boston: Harvard Business School Press, 1996. v.4, n.2, p.34-46, 2002.
• LESLIE, J. B. The Leadership gap – what you need, and still don’t have, when it comes • TREACY, M.; WIERSEMA, F. Customer intimacy and other value disciplines. Harvard
to leadership talent. Seattle: Center for Creative Leadership, 2015. (White Paper). Business Review, p.84-93, Jan./Feb. 1993.
Disponível em: <https://www.ccl.org/articles/white-papers/leadership-gap-what-you-
still-need/>. Acesso em: 15 fev. 2016.
Referências completas (principais e complementares disponíveis no capítulo de Referência da Tese de Livre-Docência (Gerolamo, 2019).

122
“In a time of drastic change it is the
learners who inherit the future. The
learned usually find themselves
equipped to live in a world that no
longer exists.”

“Em uma época de


mudanças drásticas, são
os que têm capacidade de
aprender que herdam o
futuro. Quanto aos que já
aprenderam, estes
descobrem-se equipados
para viver em um mundo
que não existe mais.”

Eric Hoffer (July 15, 1902 – May 21, 1983)


was an American moral and social philosopher
123
“Não seja o líder que tira as pessoas de suas ‘zonas de conforto’. A zona de conforto
existe por um motivo - ela oferece uma rede de segurança psicológica para viver,
trabalhar, aprender e criar. É onde nos sentimos confiantes o suficiente para tentar,
falhar, aprender e, então, ter sucesso. Tirar as pessoas de suas zonas de conforto é
fácil, basta exercer o poder, é coercitivo. Mas é uma abordagem covarde.

Então, qual é o seu verdadeiro desafio? Trata-se de expandir as zonas de conforto


dos membros de sua equipe. O resultado permanece o mesmo, mas o ambiente se
torna significativamente mais positivo. Indivíduos vão operar fora de suas zonas de
conforto originais, prontos para inovar, criar e impulsionar a organização para a
frente. Por quê? Porque você fez o mesmo por eles.”
Mateus C. Gerolamo

124
Grupo de Pesquisa: http://change.prod.eesc.usp.br

Muito Obrigado

125
5 1
0 9 8-
27 3.
15.
a 3
OBRIGADO
h i d(A)!
o s
Y
https://www.linkedin.com/in/mateus-gerolamo-802b965/
i
us h
A t s
l o
arce
M
126
Pesquisa Operacional e
Modelos de Otimização
e Simulação I

Prof. Dr. Marcos dos Santos


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
BACKGROUND
Oficial Superior, com 30 anos de serviço na Marinha do Brasil;
Colégio Naval;
Escola Naval;
Viagem de instrução de Guardas-Marinha (VIGM) em 2001;
10 anos embarcado em navios de guerra;
12 anos como Pesquisador e Gerente de Projetos na Divisão
de Pesquisa Operacional (Marinha do Brasil);
Especialização em Instrumentação Matemática (UFF);
Aperfeiçoamento em Matemática (IMPA);
Governança em TI (FGV-RJ);
Mestrado em Engenharia de Produção - Pesquisa Operacional (COPPE/UFRJ);
Doutorado e pós-doutorado em Sistemas, Apoio à Decisão e Logística (UFF);
Pós-doutorado em Ciências e Tecnologias Espaciais (ITA);
Diretoria da Sociedade Brasileira de Pesquisa Operacional (SOBRAPO);
Professor do MBA em Data Science e Analytics da USP;
Professor do Mestrado e Doutorado em Engenharia de Produção da UFF;
Professor da Graduação, Mestrado e Doutorado em Computação do IME;
Mais de 800 pesquisas publicadas e/ou apresentadas em mais de 20 países.
REFERÊNCIAS

4
THE O.R. SOCIETY

5
DINÂMICA DAS AULAS

6
77
OBJETIVO DA DISCIPLINA

Construir modelos de otimização e implementá-


los computacionalmente.

8
OBJETIVO DA DISCIPLINA

9
OBJETIVO DA AULA DE HOJE

Explicar os conceitos basilares da Pesquisa


Operacional e do Processo de Tomada de Decisão.

10
INTRODUÇÃO

“Nada é mais difícil, e portanto mais precioso, do que


ser capaz de tomar decisões.”

11
O QUE É PESQUISA OPERACIONAL?

Operational Research (O.R.) is a scientific approach to the solution of problems in the management of
complex systems that enables decision makers to make better decisions.

Most of the problems O.R. tackles are messy and complex, often involving considerable uncertainty. O.R.
uses advanced analytics, modelling, problem structuring, simulation, optimization and data science to
determine the best solution to the problem and the best practical course of action.

12
O QUE É PESQUISA OPERACIONAL?

13
AS ÁREAS DA P.O.

Apoio Análise
Machine
Multicritério Lógica Fuzzy Envoltória
Learning
à Decisão de Dados

P. Linear Simulação a
Programação Teoria dos
Eventos Estatística
Matemática Grafos
P. Inteira Discretos

14
EXPANSÃO DA P.O.

Dois fatores foram responsáveis pelo


rápido crescimento da P.O. no Século XX:

- Novos modelos matemáticos;

- Evolução dos computadores.

15
QUEM PODE ESTUDAR P.O.?

16
O QUE É UM SISTEMA?

5 1
0 9 8-
É um conjunto de elementos interdependentes
73 .
5 .2
que interagem com objetivos comuns. Normalmente, 3 1
i d a
o resultado gerado pelo sistema é maiorosdo h que o
i Y
somatório dos resultados isolados u shdas partes que
At s
compõem o sistema.
el o
ar c
M

17
REPRESENTAÇÃO MATEMÁTICA DE UM SISTEMA

18
MEDIDA DE EFICÁCIA OPERACIONAL

É uma medida, quantificável, que procura


representar o grau com que dado sistema, em
condições de operação tão reais quanto possível,
atinge sua finalidade. A MEO permite quantificar
aspectos pertinentes a requisitos operacionais
específicos.

19
MEDIDA DE EFICÁCIA OPERACIONAL

Abraham Wald (matemático romeno) chegou a


seguinte conclusão: os pontos vermelhos
representavam apenas os danos nos aviões que
conseguiam voltar, que chegaram em casa. As áreas
que realmente deveriam ser reforçadas, eram os
lugares onde não havia pontos, pois esses são os
lugares onde o avião não sobreviveria ao ser
atingido.

20
MEDIDA DE EFICÁCIA OPERACIONAL
(três atributos de uma boa MEO)

Quantificável

Mensurável

“Closely Related”

Fonte: Rockower (1985)

21
O PROCESSO DE MODELAGEM MATEMÁTICA

5 1
MUNDO REAL
0 9 8-
73 .
UNIVERSO SIMBÓLICO
5 .2
a 31
h i d
s
CONTEXTO
i Yo
GERENCIAL
ush
MODELO RESULTADO Decisão

t s
eloA
ar c
M
PERCEPÇÃO

22
MODELO
É uma representação simplificada da realidade, destinada a facilitar o
entendimento e, consequentemente, a manipulação de um fenômeno
complexo.

23
MODELO

24
MODELO

“All models are wrong, some models are quite useful”


(George P. Box)

25
A P.O. NA II GUERRA MUNDIAL

Muitas aplicações práticas da otimização foram desenvolvidas


durante a Segunda Guerra Mundial (1939 – 1945).

26
A P.O. NA II GUERRA MUNDIAL
(sugestão de filme)

27
A P.O. NA II GUERRA MUNDIAL

Durante a Segunda Guerra Mundial, os grupos originais de P.O. usavam


o pensamento imaginativo para resolver problemas que envolviam
homens, máquinas, materiais e dinheiro. Alguns exemplos de problemas de
elevada complexidade:

- Como fazer uso eficiente da então recente tecnologia do radar.

- Como reduzir o número de navios afundados por submarinos alemães.

- Como maximizar o uso das esquadrilhas.

- Como maximizar a acurácia dos bombardeiros.


28
PRIMEIRAS REFERÊNCIAS

29
A P.O. MIGROU PARA OUTRAS ÁREAS

30
ETAPAS PARA SOLUÇÃO DE PROBLEMAS
1. Entender o sistema (objetivo); PSM

2. Definir as MEO;

3. Construir o Modelo; P.O.

4. Obter uma massa de dados; D.S.

5. Melhorar o modelo;

6. Validar o modelo;

7. Reportar, explicar, comunicar e auxiliar na STORYTELLING


implementação do modelo.
ENTENDIMENTO DO PROBLEMA
O que você vê na figura?

Entender o problema é uma


questão de PERCEPÇÃO!
32
ENTENDIMENTO DO PROBLEMA
O que você vê na figura?

Entender o problema é uma


questão de PERCEPÇÃO!
33
ENTENDIMENTO DO PROBLEMA
O que você vê na figura?

Entender o problema é uma


questão de PERCEPÇÃO!
34
ENTENDIMENTO DO PROBLEMA
Que animal você encontra no desenho abaixo?

Entender o problema é uma


questão de PERCEPÇÃO!
35
ENTENDIMENTO DO PROBLEMA
Que animal você encontra no desenho abaixo?

Entender o problema é uma


questão de PERCEPÇÃO!
36
ENTENDIMENTO DO PROBLEMA

Entender o problema é uma


questão de PERCEPÇÃO!

37
ENTENDIMENTO DO PROBLEMA

Muitas vezes, cada indivíduo tem uma


percepção diferente com relação ao
mesmo problema. O que acaba
acarretando numa modelagem
matemática equivocada do problema.

38
ENTENDIMENTO DO PROBLEMA

"Eu acredito que esta nação deve


comprometer-se em alcançar a meta,
antes do final desta década, de
pousar um homem na Lua e trazê-lo
de volta à Terra em segurança"

39
CUIDADO NA HORA DA ESCOLHA DO MODELO

40
LITERATURA SOBRE O TEMA

41
NAVALHA DE OCCAM

"Se em tudo o mais forem idênticas as várias explicações de um


fenômeno, a mais simples é a melhor”

1) Alcançar o que se quer com o mínimo esforço e dispêndio de recursos; ou

2) A partir do que se tem, obter-se o máximo retorno.

Guilherme de Occam Século XIV

42
P.O. NA PRÁTICA
A P.O. pode ser aplicada em várias áreas de
conhecimento. E essa é uma das suas principais
características. A P.O. é uma ciência
INTERDISCIPLINAR.
Manufatura Construção Civil

Logística Finanças

Educação Agricultura

Saúde …

43
P.O. NA PRÁTICA
Manufatura
A otimização dos processos de produção permite a redução
do tempo de produção, aumentando assim a produtividade.

▪ Dimensionamento de lotes;

▪ Otimização de layouts;

▪ Formação de células de fabricação;

▪ Identificação de gargalos.

44
P.O. NA PRÁTICA

Logística

Escolha do melhor modelo de transporte, aproveitando


ao máximo os pontos fortes de cada modal.

▪ Roteirização de veículos;

▪ Otimização de tabela de horários;

▪ Programação de tripulações.

45
P.O. NA PRÁTICA

Educação

Aproveitamento da disponibilidade de cada recurso, como


professores, salas de aula, equipamentos etc.

▪ Programação de horários em escolas;

▪ Alocação de salas de aula;

▪ Construção de cenários.

46
P.O. NA PRÁTICA

Saúde

Dimensionamento de serviços de saúde, tanto


ambulatorial quanto de emergência.

▪ Programação de horários de enfermeiras;

▪ Programação de horários dos médicos;

▪ Simulação de atendimentos de emergência.

47
P.O. NA PRÁTICA

Construção Civil

Com a otimização dos recursos e o gerenciamento


do risco:

▪ Otimização de estruturas metálicas;


▪ Distribuição do uso de equipamentos;
▪ Distribuição da carga de trabalho;
▪ Sequenciamento de atividades;
▪ Gerenciamento de Riscos.
48
P.O. NA PRÁTICA

Finanças

Modelagem do mercado financeiro na busca de


melhores carteiras de investimento.

▪ Análise de risco;

▪ Portfólio de investimentos.

49
P.O. NA PRÁTICA

Agricultura

Planejamento dos processos agrícolas desde o


planejamento do plantio, passando pela colheita, pela
armazenagem e distribuição.

▪ Planejamento da produção agrícola;


▪ Planejamento da armazenagem;
▪ Planejamento da distribuição.

50
P.O. NA PRÁTICA

51
P.O. NA PRÁTICA

52
P.O. NA PRÁTICA

53
P.O. NA PRÁTICA

54
P.O. NA PRÁTICA

55
P.O. NA PRÁTICA

56
P.O. NA PRÁTICA

57
P.O. NA PRÁTICA

58
P.O. NA PRÁTICA

59
P.O. NA PRÁTICA

60
P.O. NA PRÁTICA

61
P.O. NA PRÁTICA

62
P.O. NA PRÁTICA

63
P.O. NA PRÁTICA

64
P.O. NA PRÁTICA

65
P.O. NA PRÁTICA

5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo TCC do MBA DSA:

u sh
Ats - Nota 10,
- Indicado para o prêmio de melhor trabalho;
elo
ar c - Apresentado em simpósio nacional;
- Apresentado em congresso internacional;
M - Código subiu para o CRAN;
- Inovação depositada no INPI;
- Publicado em periódico internacional qualis A.

66
P.O. NA PRÁTICA

5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
i Yo TCC do MBA DSA:

u sh
Ats - Nota 10,
- Indicado para o prêmio de melhor trabalho;
elo
ar c - Apresentado em simpósio nacional;
- Apresentado em congresso internacional;
M - Código subiu para o CRAN;
- Inovação depositada no INPI;
- Publicado em periódico internacional qualis A.

67
MAIS DE 800 PESQUISAS PUBLICADAS

68
UM DOS MAIORES GRUPOS DE PESQUISA DO
BRASIL E DO MUNDO

69
SEM P.O. VOCÊ E SUA ORGANIZAÇÃO ESTÃO
PERDENDO MUITO DINHEIRO

70
PRECISAMOS COMEÇAR A ENCHER A NOSSA CESTA

Observaram a quantidade de métodos


diferentes que foram utilizados nos
trabalhos apresentados?

O pesquisador que trabalha com P.O.


não pode se “apaixonar” por este ou
aquele método.

71
P.O. E A CIÊNCIA DE DADOS

Pesquisa Operacional e Ciência de Dados estão


intimamente relacionadas. Os modelos da P.O.
precisam dos dados para que esses dados sejam
processados e possam gerar um resultado útil para o
tomador de decisão. Por outro lado, de nada adianta
dispor de um conjunto de dados, em quantidade e com
qualidade, se não houver um modelo matemático que
possa dar forma a esses dados, de maneira a apoiar
adequadamente o processo de tomada de decisão.

Fonte: Fávero e Belfiore (2017)

72
FECHANDO NOSSO ENCONTRO DE HOJE

“Without data you are just another


person with an opinion”.

W. Edwards Deming

73
PARA A PRÓXIMA AULA

74
5 1
0 9 8-
73 .
5 .2
a 31
h i d
s
Yo i
u sh
Explicar os conceitos basilares da Pesquisa
t s
OperacionalAe do Processo de Tomada de Decisão.
el o
ar c
M

75
OBRIGADO
researchgate.net/profile/Marcos_Dos_Santos6

76
OBRIGADO!
https://www.linkedin.com/in/profmarcosdossantos/

77
Pesquisa Operacional e
Modelos de Otimização e
Simulação II

Prof. Dr. Marcos dos Santos

1
Pesquisa Operacional

Prof. Dr. Marcos dos Santos

Módulo 2 2
*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

33
BACKGROUND
Oficial Superior, com 30 anos de serviço na Marinha do Brasil;
Colégio Naval;
Escola Naval;
Viagem de instrução de Guardas-Marinha (VIGM) em 2001;
10 anos embarcado em navios de guerra;
12 anos como Pesquisador e Gerente de Projetos na Divisão
de Pesquisa Operacional (Marinha do Brasil);
Especialização em Instrumentação Matemática (UFF);
Aperfeiçoamento em Matemática (IMPA);
Governança em TI (FGV-RJ);
Mestrado em Engenharia de Produção - Pesquisa Operacional (COPPE/UFRJ);
Doutorado e pós-doutorado em Sistemas, Apoio à Decisão e Logística (UFF);
Pós-doutorado em Ciências e Tecnologias Espaciais (ITA);
Diretoria da Sociedade Brasileira de Pesquisa Operacional (SOBRAPO);
Professor do MBA em Data Science e Analytics da USP;
Professor do Mestrado e Doutorado em Engenharia de Produção da UFF;
Professor da Graduação, Mestrado e Doutorado em Computação do IME;
Mais de 800 pesquisas publicadas e/ou apresentadas em mais de 20 países.

4
REFERÊNCIAS

5
5 1
0 9 8-
73 .
5 .2
a 31
Compreender como se dá a estruturação matemática de um
h i d
os Linear (PPL); e
Problema de Programação
i Y
u sh
At s
e o
lmodelagem matemática de alguns PPLs clássicos.
r
Realizar
a c a
M

6
77
INTRODUÇÃO: ABSTRAÇÃO DO PROBLEMA

A grande dificuldade na modelagem dos


problemas reside na abstração do cenário,
justamente a etapa que não exige
conhecimentos matemáticos ou estatísticos,
nem sequer o uso de uma lógica
formalizada, ao contrário do que imaginam
muitos iniciantes em Pesquisa Operacional.

8
INTRODUÇÃO: ABSTRAÇÃO DO PROBLEMA

O processo de abstração pode ser resumido na


capacidade do praticante da Pesquisa
Operacional de mapear determinada situação,
estabelecer as relações existentes nela e converter
essas relações em expressões matemáticas.

9
BRAINSTORMING
Uma das ferramentas mais utilizadas para a abstração de cenário é o
brainstorming. Expressão idiomática da língua inglesa que, traduzida para o português,
significa “tempestade de ideias”.

A técnica do brainstorming surgiu em 1953, quando Alex Faickney Osborn


publicou o livro Applied Imagination, no qual abordava a utilização do processo criativo
para a solução de problemas. De acordo com Osborn, as pessoas não expõem suas
ideias por medo das críticas e de uma possível avaliação negativa, bem como da não
aceitação por outras pessoas. Isso acaba por inibir o processo criativo e a capacidade
apreciativa do indivíduos.

Mesmo lidando com modelos matemáticos, precisamos descobrir quais são


os processos críticos, os dados relevantes, como conseguir esses dados, onde
armazená-los etc.
10
MAPA MENTAL

Um mapa mental é uma ferramenta simples utilizada para


organizar o pensamento. Um mapa mental é uma maneira fácil de extrair
informações do cérebro humano.

Todos os mapas mentais tem certas características em comum:


usam cores; todos tem uma estrutura natural que parte do centro; todos
utilizam linhas, símbolos, palavras e imagens de acordo com um conjunto
de regras simples, básicas, naturais e familiares ao nosso cérebro. Com um
mapa mental, uma longa lista de informações pode se transformar num
diagrama colorido, fácil de lembrar, intuitivo e bem organizado que opera
em harmonia com o funcionamento natural do cérebro.

11
MAPA MENTAL

12
A HISTÓRIA DA PROGRAMAÇÃO LINEAR

Em 1939 Kantorovich formulou rigorosamente um problema de


Programação Linear no trabalho “Métodos Matemáticos de
Organização e Planejamento da Produção”, mas não apresentou um
algoritmo de resolução.

O grande salto da Programação Linear foi dado por meio das


aplicações em problemas de transportes na década de 1940,
em particular pelas Forças Armadas durante a Segunda Guerra
Mundial.

13
A HISTÓRIA DA PROGRAMAÇÃO LINEAR

Dantzig trabalhou no Pentágono como conselheiro matemático,


onde era frequentemente chamado para resolver problemas de
planejamento.

No entanto, contrariamente ao que Dantzig pensou, os


economistas ainda não tinham métodos de resolução para tais
problemas.

Foi então que Dantzig propôs o Método Simplex, que tornou


possível a solução de problemas de otimização de vários tipos.

14
MODELAGENS BÁSICAS

Todo mundo sabe trabalhar com EQUAÇÕES LINEARES.


Veja como é fácil:

15
MODELAGENS BÁSICAS

Todo mundo sabe trabalhar com EQUAÇÕES LINEARES.


Veja como é fácil:

16
MODELAGENS BÁSICAS

✓ O sêxtuplo de um número;

✓ O óctuplo de um número;

✓ O décuplo de um número;

✓ A quinta parte de um número;

✓ A sexta parte de um número;

17
MODELAGENS BÁSICAS
✓ Os três oitavos de um número;

✓ Os sete décimos de um número;

✓ Os quatro dezessete avos de um número;

✓ O quádruplo de um número, mais sete unidades;

✓ Um terço de um número, menos um meio de unidades;

✓ Nove doze avos de um número, mais oito unidades.


18
MODELAGENS BÁSICAS

✓ O dobro de um número, mais 5 unidades é igual a 27.

✓ A quinta parte de um número, menos 3 unidades é igual a 2.

✓ Um número somado ao seu triplo é igual a 68.

✓ Um número somado ao seu dobro é igual a 57.

19
MODELAGENS BÁSICAS

✓ A soma de três números consecutivos é 93.

✓ A diferença entre dois números é 240. Um dos números é o sêxtuplo do outro.

✓ O dobro de um número, somado a sua metade é igual a 65.

✓ A soma de dois números é 115. Um dos números é o quádruplo do outro.

20
PROGRAMAÇÃO LINEAR

Maximização ou Minimização de uma Função Objetivo (F.O.) linear com relação às


Variáveis de Decisão (V.D.) do modelo.

Respeitando-se as restrições do problema expressas por um sistema de equações e/ou


inequações lineares associadas com as Variáveis de Decisão do modelo.

21
VARIÁVEIS DE DECISÃO

x1 , x2,...,xn , são as chamadas Variáveis de Decisão.

As Variáveis de Decisão são aqueles valores que representam o cerne do problema. São as
quantidades pelas quais devemos decidir.

As Variáveis de Decisão representam as opções que um gestor tem para atingir um objetivo.

 Quantas unidades de um determinado produto devemos produzir para maximizar o lucro?

 Quanto devemos comprar de cada ação para minimizar o risco de uma carteira?

22
SUPOSIÇÕES DA PROGRAMAÇÃO LINEAR

23
VANTAGENS DOS MODELOS DE PL

1. Muitos problemas reais podem ser aproximados para modelos lineares;

2. Existência de técnicas eficientes para a solução de modelos lineares;

3. Possibilidade de realização de análise de sensibilidade nos dados do modelo;

4. Elevada capacidade de processamento dos computadores atuais.

24
Mão na massa !
2525
EXERCÍCIO 1

O custo do metro quadrado de certo azulejo para


uma loja de materiais de construção é R$15,27.
Expresse o custo C em função da quantidade pedida
em metros quadrados (x).

26
EXERCÍCIO 2
Numa mercearia, o preço de venda de um
refrigerante A é igual a R$ 1,20 enquanto que o de
outro refrigerante B é igual a R$ 1,40. Qual a receita
obtida (R) com a venda de certa quantidade x1 de um
refrigerante A e quantidade x2 de um refrigerante B?

27
EXERCÍCIO 3

Um artesão lucra R$16,00 por cada cinzeiro que


vende e lucra R$32,00 por cada abajur. Qual o lucro
obtido com a venda desses produtos?

28
EXERCÍCIO 4

Um operador cuida da manutenção de três máquinas:


A, B e C. Para cada assistência prestada à máquina A,
gasta-se 10 min. Para cada assistência à máquina B,
gasta-se 15 min e para cada assistência à máquina C,
gasta-se 18 min. Qual o tempo total de assistências às
máquinas, se cada uma delas requer números diferentes
de reparos x1, x2 e x3 ?

29
EXERCÍCIO 5
Numa livraria, com os livros da área jurídica, obtém-
se um lucro de R$ 30,00/livro. Com os livros da área
médica, obtém-se um lucro de R$ 48,00/livro e com os
livros da área gerencial, obtém-se um lucro de
R$ 25,00/livro. Qual a função lucro com a venda de
livros destas três áreas?

30
EXERCÍCIO 6

O custo do metro quadrado de certo azulejo para


uma loja de materiais de construção é R$15,27.
Expresse o custo C em função da quantidade pedida
em metros quadrados (x).

Agora, as acomodações para estoque permitem alojar até 500𝒎𝟐 de tal azulejo. Exprima
tal condição em linguagem matemática.

31
EXERCÍCIO 7
Numa mercearia, o preço de venda de um refrigerante A é igual a
R$ 1,20, enquanto que o de outro refrigerante B é igual a R$ 1,40.
Qual a receita obtida (R) com a venda de certa quantidade x1 de um
refrigerante A e quantidade x2 de um refrigerante B?

O refrigerador da mercearia comporta no máximo 60 unidades de refrigerantes. Exprima


esta condição matematicamente.

32
EXERCÍCIO 8
Numa livraria, com os livros da área jurídica, obtém-se um lucro de
R$30,00/livro. Com os livros da área médica, obtém-se um lucro de
R$48,00/livro e com os livros da área gerencial, obtém-se um lucro de
R$25,00/livro. Qual a função lucro com a venda de livros destas três áreas?

Considerando que as estantes da livraria comportam 400 livros jurídicos, 300 livros médicos e 250 livros
gerenciais, represente essas restrições matematicamente.

33
EXERCÍCIO 9
Uma indústria de sabonetes fabrica 2
tipos de sabonetes A e B. O tipo A gera um
lucro de R$0,10 por unidade e com o tipo B
lucra R$0,15 por unidade. A empresa gasta
2 segundos para fabricar o tipo A e 3
segundos para o tipo B, que devem ser
fabricados em um total de 2h. Segundo as
demandas anteriores, deve-se fabricar um
máximo de 2400 unidades do sabonete A e
1800 unidades do sabonete B. Modele o
problema matematicamente, com o objetivo
de se alcançar o máximo lucro.

34
EXERCÍCIO 9
Uma indústria de sabonetes fabrica 2
tipos de sabonetes A e B. O tipo A gera um
lucro de R$0,10 por unidade e com o tipo B
lucra R$0,15 por unidade. A empresa gasta
2 segundos para fabricar o tipo A e 3
segundos para o tipo B, que devem ser
fabricados em um total de 2h. Segundo as
demandas anteriores, deve-se fabricar um
máximo de 2400 unidades do sabonete A e
1800 unidades do sabonete B. Modele o
problema matematicamente, com o objetivo
de se alcançar o máximo lucro.

35
FORMALIZAÇÃO DE UM PPL
PPL da Indústria de Sabonetes

MODELO REDUZIDO
𝑀𝑎𝑥 , 𝑜𝑢 𝑀𝑖𝑛.
𝑛
𝑍 = 𝑐1 𝑥1 + 𝑐2 𝑥2 + … + 𝑐𝑛 𝑥𝑛
𝑀𝑎𝑥 𝐿 = ෍ 𝑐𝑖 𝑥𝑖
𝑥1 ,𝑥2 ,....,𝑥𝑛
𝑎11 𝑥1 + 𝑎12 𝑥2 + … + 𝑎1𝑛 𝑥𝑛 ≤ 𝑏1 𝑖=1
𝑠. 𝑎
𝑎21 𝑥1 + 𝑎22 𝑥2 + … + 𝑎2𝑛 𝑥𝑛 ≤ 𝑏2 𝑛
… ෍ 𝑎𝑗𝑖 𝑥𝑖 ≤ 𝑏𝑗 𝑗 = 1, . . . , 𝑝
𝑎𝑚1 𝑥1 + 𝑎𝑚2 𝑥2 + … + 𝑎𝑚𝑛 𝑥𝑛 ≤ 𝑏𝑚 𝑖=1
𝑥𝑖 ≥ 0 ∀𝑖

36
PASSO A PASSO PARA MODELAR UM PPL

37
PROBLEMAS CLÁSSICOS – PPL MIX DE PRODUÇÃO

Fabricação de dois modelos de brinquedos: B1 e B2.

Lucros unitários: R$8,00 para B1 e R$5,00 para B2

Recursos disponíveis:
1000 kg de plástico especial.
40 horas para produção semanal.

Requisitos do Departamento de Marketing:


Produção total não pode exceder 700 unidades;
A quantidade produzida de B1 não pode exceder em 350 unidades a quantidade produzida de B2.

Dados técnicos:
B1 requer 2 kg de plástico e 3 minutos por unidade.
B2 requer 1 kg de plástico e 4 minutos por unidade.

38
PROBLEMAS CLÁSSICOS – PPL DO MIX DE PRODUÇÃO

A Gerência está procurando um programa de


produção que maximize o lucro da Companhia.

39
PROBLEMAS CLÁSSICOS – PPL DO MIX DE PRODUÇÃO

40
PROBLEMAS CLÁSSICOS - PPL DAS LIGAS METÁLICAS

• Fundições produzem diversos tipos de aço a partir de vários insumos, tais

como: lingotes de ferro, grafite, sucatas industriais de diversos tipos de aço,

dentre outros.

• Esses insumos são colocados em um forno de alta temperatura, onde, em

estado líquido, fundem-se para formar uma liga metálica, isto é, uma mistura.

• A composição da liga a ser produzida, em termos de carbono, silício,

manganês, entre outros, é determinada por normas técnicas da metalurgia.

41
PROBLEMAS CLÁSSICOS - PPL DAS LIGAS METÁLICAS

• Os preços de compra dos insumos e os preços de venda das ligas

podem variar e são conhecidos.

• O problema consiste em determinar as quantidades de cada insumo a

fundir, de modo que a composição da liga obtida satisfaça às normas

técnicas da metalurgia, de maneira a maximizar o lucro com as vendas.

42
PROBLEMAS CLÁSSICOS - PPL DAS LIGAS METÁLICAS

• Uma metalúrgica produz ligas metálicas de dois tipos, Liga 1 e Liga 2, a


partir de uma mistura de três matérias-primas: cobre, zinco e chumbo.

• A tabela a seguir ilustra a proporção de cada matéria-prima na mistura para


a obtenção de cada tipo de liga, assim como a disponibilidade em estoque
de cada matéria-prima (em toneladas) e os preços de venda (por tonelada)
de cada tipo de liga.

• Qual deve ser a quantidade a produzir de cada tipo de liga, respeitando as


restrições de estoque de cada matéria-prima, de modo a maximizar o
lucro da metalúrgica?

43
PROBLEMAS CLÁSSICOS - PPL DAS LIGAS METÁLICAS

Liga 1 Liga 2 Disponibilidade


Cobre 0,5 0,2 16 ton.
Zinco 0,25 0,3 11 ton.
Chumbo 0,25 0,5 15 ton.
Lucro 3.000 5.000

44
PROBLEMAS CLÁSSICOS – PPL DA DIETA

• A elaboração de uma dieta balanceada, de acordo com o paladar do


paciente e atendendo todas as necessidades diárias de nutrientes, é um
problema de difícil manipulação quando não se dispõem de técnicas
adequadas de programação matemática.

• As informações pessoais, como sexo, idade, peso e altura, conduzem a


restrições de exigências diárias mínimas e máximas de nutrientes
necessários a cada pessoa.

• Sabe-se que existem casos especiais que podem modificar tais exigências,
como na recuperação de alguma doença ou no caso de atletas, que, em
geral, consomem mais proteínas e mais carboidratos.

45
PROBLEMAS CLÁSSICOS – PPL DA DIETA

• Os preços de compra dos alimentos podem variar e são conhecidos. As


quantidades médias de cada tipo de nutriente em cada alimento também são
conhecidas.

• O problema consiste em determinar as quantidades de cada alimento a

ingerir, de modo a satisfazer as necessidades mínimas e máximas diárias de

consumo de nutrientes, de maneira a minimizar o custo total da dieta.

• Os requisitos nutricionais diários são expressos em função das quantidades

mínimas (em mg) de vitaminas A, C e D que devem ser ingeridas.

46
PROBLEMAS CLÁSSICOS – PPL DA DIETA

• A tabela a seguir apresenta a quantidade disponível de cada vitamina em

cada um dos alimentos permitidos na dieta, a necessidade diária de cada

vitamina e o custo (em reais) de cada alimento.

• Qual deve ser a dieta de custo mínimo que satisfaça as necessidades

alimentares?
Leite Carne Peixe Salada Requisito
Vitamina
(litro) (kg) (kg) (100g) Mínimo
A 2 mg 2 mg 10 mg 20 mg 11 mg
C 50 mg 20 mg 10 mg 30 mg 70 mg
D 80 mg 70 mg 10 mg 80 mg 250 mg
Custo 6,70 46,00 28,00 4,10

47
PROBLEMAS CLÁSSICOS – PPL DA DIETA

Leite Carne Peixe Salada Requisito


Vitamina
(litro) (kg) (kg) (100g) Mínimo
A 2 mg 2 mg 10 mg 20 mg 11 mg
5 1
C 50 mg 20 mg 10 mg 30 mg 70 mg
0 9 8-
250 mg73
.
D 80 mg 70 mg 10 mg 80 mg
5 .2
Custo 6,70 46,00 28,00 4,10
a 31
h i d
s
i Yo
u sh
Ats
el o
ar c
M

48
PROBLEMAS CLÁSSICOS – PPL DO TRANSPORTE

• O problema do transporte consiste no transporte de produtos dos centros de

produção até os mercados consumidores, de modo que o custo total de

transporte seja o menor possível.

• Admite-se, geralmente, que as quantidades de produzidas ou ofertadas em

cada centro de produção e as quantidades demandadas em cada mercado

consumidor são conhecidas.

• O transporte deve ser efetuado respeitando-se as limitações de oferta e

atendendo à demanda.

49
PROBLEMAS CLÁSSICOS – PPL DO TRANSPORTE
• Uma fábrica de refrigerante possui três centros produtores na baixada

fluminense, e três mercados principais na região serrana do estado.

• A figura a seguir ilustra os custos de transporte de cada centro produtor a cada

centro consumidor, bem como as demandas (em caixas de refrigerante) de cada

mercado consumidor, além da quantidade máxima de produção (em caixas de

refrigerante) em cada centro produtor.

• O problema de transporte associado a este exemplo consiste em transportar os

produtos dos centros de produção até os mercados consumidores, de modo que

o custo total de transporte seja o menor possível.

50
PROBLEMAS CLÁSSICOS – PPL DO TRANSPORTE

ESQUEMATICAMENTE:

51
PROBLEMAS CLÁSSICOS – PPL DO TRANSPORTE

52
PROBLEMAS CLÁSSICOS – PPL DO TRANSPORTE

53
PRA FINALIZAR

1) Um modelo não pode ser melhor do que as


informações contidas nele. Para ilustrar esse princípio, é
preciso citar uma máxima utilizada por programadores
de computadores: “Lixo que entra é igual a lixo que sai"
(GIGO - abreviatura em inglês para Garbage In, Garbage
Out). Se as informações contidas no modelo forem
incertas e/ou imprecisas, não há como esperar
resultados que sejam capazes de apoiar adequadamente
a decisão.

54
PRA FINALIZAR

2) Modelos não podem substituir decisores. Um modelo, por


mais elaborado que seja, representa tão somente o
equacionamento lógico de uma situação problemática. Ele
nunca sobreporá a capacidade humana de percepção e análise
das coisas e fatos. Devemos, portanto, manter os modelos na
condição de boas ferramentas que proporcionam auxílio na
tomada de decisão. Não se esqueça de que, no final das contas,
quem vai decidir é uma pessoa ou um grupo de pessoas.

55
Compreender como se dá a estruturação matemática de um
Problema de Programação Linear (PPL); e

Realizar a modelagem de alguns PPLs clássicos.

56
Solução Gráfica de um PPL

Prof. Dr. Marcos dos Santos

Módulo 3 57
OBJETIVO

Determinar graficamente a “Solução Ótima” de um


PPL com duas Variáveis de Decisão.

58
58
59
SOLUÇÃO DE UM PPL

Qualquer especificação de valores para as


variáveis de decisão (x1, xi, ... , xn) é chamada
solução, independentemente de ela ser desejável
ou não.

Uma solução
pode ser:

60
SOLUÇÃO INVIÁVEL DE UM PPL
Uma solução inviável é aquela para a qual pelo
menos uma das restrições não é satisfeita.

Maximizar Z = 3x1 + 5x2


S = (x1, x2)
Sujeito às restrições x1 ≤ 4
S1 =(4, 4)
2x2 ≤ 12
3x1 + 2x2 ≤ 18
x1 ≥ 0, x2 ≥ 0

61
SOLUÇÃO VIÁVEL DE UM PPL
Uma solução viável é aquela para a qual todas as
restrições são satisfeitas.

Maximizar Z = 3x1 + 5x2 S = (x1, x2)

Sujeito às restrições x1 ≤ 4 S1 =(4, 1)


2x2 ≤ 12
3x1 + 2x2 ≤ 18

x1 ≥ 0, x2 ≥ 0

62
SOLUÇÃO ÓTIMA DE UM PPL
Uma solução ótima é aquela em que todas as restrições
são atendidas, otimizando-se o valor da função objetivo.

Maximizar Z = 3x1 + 5x2 S1 =(2, 6)


Sujeito às restrições x1 ≤ 4
2x2 ≤ 12
3x1 + 2x2 ≤ 18
x1 ≥ 0, x2 ≥ 0

63
SOLUÇÃO ÓTIMA DE UM PPL
Uma solução ótima é aquela em que todas as restrições
são atendidas, otimizando-se o valor da função objetivo.
Observe que qualquer outro
valor para x1 e x2 não nos levará
à Solução Ótima.
Maximizar Z = 3x1 + 5x2
Sujeito às restrições x1 ≤ 4
2x2 ≤ 12
3x1 + 2x2 ≤ 18
x1 ≥ 0, x2 ≥ 0

64
REVISÃO DE GEOMETRIA ANALÍTICA
(Equação da Reta)

65
REVISÃO DE GEOMETRIA ANALÍTICA
(Equação da Reta)

66
REVISÃO DE GEOMETRIA ANALÍTICA
(Semiplanos)

67
REVISÃO DE GEOMETRIA ANALÍTICA
(Semiplanos)

68
SOLUÇÃO GRÁFICA DE UM PPL
Na resolução gráfica de um modelo de Programação Linear,
primeiramente, determina-se o espaço de soluções viáveis ou
região factível.

Uma solução viável ou factível é aquela que satisfaz todas as


restrições do modelo, inclusive as de não negatividade.

Se determinada solução viola pelo menos uma das restrições do


modelo, ela é chamada solução inviável ou infactível.

69
SOLUÇÃO GRÁFICA DE UM PPL
O passo seguinte consiste em determinar a solução ótima do
modelo, isto é, a solução factível que apresente o melhor valor da
função objetivo.

Para um problema de maximização, determinado o conjunto de


soluções viáveis, a solução ótima é aquela que fornece o maior
valor à função objetivo dentro desse conjunto.

Já para um problema de minimização, a solução ótima é aquela


que minimiza a função objetivo.
70
SOLUÇÃO GRÁFICA DE UM PPL
Tipos de Restrições

Maximizar Z = 3x1 + 5x2


Sujeito às restrições x1 ≤ 4
2x2 ≤ 12 Restrições Funcionais

3x1 + 2x2 ≤ 18

x1 ≥ 0, x2 ≥ 0 Restrições de não-negatividade

71
SOLUÇÃO GRÁFICA DE UM PPL
Tipos de Restrições

72
SOLUÇÃO GRÁFICA DE UM PPL
Quando o problema envolve apenas duas variáveis de decisão, a solução

5 1
8-
ótima de um problema de programação linear pode ser encontrada

. 0 9
73
graficamente.

5 .2
ax 31
Max Z = 5 x1s+ h i2d
Y o 2
s. r . h i x1  3 (a)
s u s
At x2  4 (b)
el o
ar c x1 + 2 x 2  9 (c)
M x1  0 , x 2  0 (d)

73
SOLUÇÃO GRÁFICA DE UM PPL
Passo a passo...

74
SOLUÇÃO GRÁFICA DE UM PPL

x2 x1  3
4
x2  4
3

x 2 0 1 2 3 4 x1
x 1 0

75
SOLUÇÃO GRÁFICA DE UM PPL

5 1
x1 + 2 x 2  9 0 9 8-
.
x 33
x1 + 2 x 2 = 9 17
x2
.2
3 15
(1,4)
i da (3,4)
(0,4)
osh x 4
2
Y
(3,3)

sh i
t s u
o A
c el
ar
x  0
2
M (0,0) (3,0) x1
x  0
1

Prof. Dr. Marcos dos Santos 76


SOLUÇÃO GRÁFICA DE UM PPL

x2 Z = 21 = 5x1 + 2 x 2

(1,4)
(0,4)
(3,3) = Solução
Z = 0 = 5x 1 + 2 x 2 Ótima
Solução
Viável

(0,0) (3,0) x1
Z = 10 = 5 x1 + 2 x2

77
SOLUÇÃO GRÁFICA DE UM PPL
Exercício:
Considere o seguinte o problema de PL

Max 3 x1 + 3 x2
s.r. 2 x1 + 4 x2  12
6 x1 + 4 x2  24
x1 , x2  0

Encontre a solução ótima utilizando o método gráfico.

78
SOLUÇÃO GRÁFICA DE UM PPL
Max 3 x1 + 3 x2
s.r. 2 x1 + 4 x2  12
6 x1 + 4 x2  24
x1 , x2  0

79
SOLUÇÃO GRÁFICA DE UM PPL

x2 7

(0,6) 6

5 6 x1 + 4 x2  24
4

(0,3) 3

1 2 x1 + 4 x2  12
x2  0 (6,0)
(0,0) 0 1 2 3 4 (4,0) 5 6
x1
x1  0

80
SOLUÇÃO GRÁFICA DE UM PPL

x2 7
Z = 0 = 3 x1 + 3 x2
6

5
Z = 6 = 3 x1 + 3 x2
4 Z = 13,5 = 3 x1 + 3 x2
3

2 Observe que uma solução ótima de um


problema de programação linear está
1 sempre associada a um vértice ou
ponto extremo do espaço de soluções.
0 1 2 3 4 5 6
x1

81
Mão na massa !
82
EXERCÍCIO

Obtenha a solução gráfica para o seguinte programa de PL:

Maximizar Z = 3x1 + 5x2


Sujeito às restrições x1 ≤ 4
2x2 ≤ 12
3x1 + 2x2 ≤ 18
x1 ≥ 0, x2 ≥ 0

83
EXERCÍCIO
Max Z = 3x1 + 5x2
s.a.
x1 ≤ 4
2x2 ≤ 12
3x1 + 2x2 ≤ 18
x1 ≥ 0, x2 ≥ 0

84
LIMITAÇÃO DA SOLUÇÃO GRÁFICA

Conforme os problemas apresentados, a solução


gráfica de um PPL tem a grande limitação de resolver
problemas com apenas duas variáveis de decisão.

Para problemas com três ou mais variáveis de


decisão, utilizaremos o Método Simplex, que será
trabalhado nas próximas aulas.

85
LIMITAÇÃO DA SOLUÇÃO GRÁFICA

86
LIMITAÇÃO DA SOLUÇÃO GRÁFICA

87
OBJETIVO

Determinar graficamente a “Solução Ótima” de um


PPL com duas Variáveis de Decisão.

88
OBRIGADO

researchgate.net/profile/Marcos_Dos_Santos6

89
5 1
0 9 8-
73 .
5 .2
a31
OBRIGADO! h i d
os
i Y
u sh
https://www.linkedin.com/in/profmarcosdossantos/

A t s
el o
ar c
M

90
Pesquisa Operacional e
Modelos de Otimização
e Simulação III

Prof. Dr. Marcos dos Santos


*A responsabilidade pela idoneidade,
originalidade e licitude dos conteúdos didáticos
apresentados é do professor.

Proibida a reprodução, total ou parcial, sem


autorização. Lei nº 9610/98

2
Solução Gráfica de um PPL

Prof. Dr. Marcos dos Santos

Módulo 3
OBJETIVO

Determinar graficamente a “Solução Ótima” de um


PPL com duas Variáveis de Decisão.

4
5
SOLUÇÃO DE UM PPL

Qualquer especificação de valores para as


variáveis de decisão (x1, xi, ... , xn) é chamada
solução, independentemente de ela ser desejável
ou não.

Uma solução
pode ser:

6
SOLUÇÃO INVIÁVEL DE UM PPL
Uma solução inviável é aquela para a qual pelo
menos uma das restrições não é satisfeita.

Maximizar Z = 3x1 + 5x2


S = (x1, x2)
Sujeito às restrições x1 ≤ 4
S1 =(4, 4)
2x2 ≤ 12
3x1 + 2x2 ≤ 18
x1 ≥ 0, x2 ≥ 0

7
SOLUÇÃO VIÁVEL DE UM PPL
Uma solução viável é aquela para a qual todas as
restrições são satisfeitas.

Maximizar Z = 3x1 + 5x2 S = (x1, x2)

Sujeito às restrições x1 ≤ 4 S1 =(4, 1)


2x2 ≤ 12
3x1 + 2x2 ≤ 18

x1 ≥ 0, x2 ≥ 0

8
SOLUÇÃO ÓTIMA DE UM PPL
Uma solução ótima é aquela em que todas as restrições
são atendidas, otimizando-se o valor da função objetivo.

Maximizar Z = 3x1 + 5x2 S1 =(2, 6)


Sujeito às restrições x1 ≤ 4
2x2 ≤ 12
3x1 + 2x2 ≤ 18
x1 ≥ 0, x2 ≥ 0

9
SOLUÇÃO ÓTIMA DE UM PPL
Uma solução ótima é aquela em que todas as restrições
são atendidas, otimizando-se o valor da função objetivo.
Observe que qualquer outro
valor para x1 e x2 não nos levará
à Solução Ótima.
Maximizar Z = 3x1 + 5x2
Sujeito às restrições x1 ≤ 4
2x2 ≤ 12
3x1 + 2x2 ≤ 18
x1 ≥ 0, x2 ≥ 0

10
REVISÃO DE GEOMETRIA ANALÍTICA
(Equação da Reta)

11
REVISÃO DE GEOMETRIA ANALÍTICA
(Equação da Reta)

12
REVISÃO DE GEOMETRIA ANALÍTICA
(Semiplanos)

13
REVISÃO DE GEOMETRIA ANALÍTICA
(Semiplanos)

14
SOLUÇÃO GRÁFICA DE UM PPL
Na resolução gráfica de um modelo de Programação Linear,
primeiramente, determina-se o espaço de soluções viáveis ou
região factível.

Uma solução viável ou factível é aquela que satisfaz todas as


restrições do modelo, inclusive as de não negatividade.

Se determinada solução viola pelo menos uma das restrições do


modelo, ela é chamada solução inviável ou infactível.

15
SOLUÇÃO GRÁFICA DE UM PPL
O passo seguinte consiste em determinar a solução ótima do
modelo, isto é, a solução factível que apresente o melhor valor da
função objetivo.

Para um problema de maximização, determinado o conjunto de


soluções viáveis, a solução ótima é aquela que fornece o maior
valor à função objetivo dentro desse conjunto.

Já para um problema de minimização, a solução ótima é aquela


que minimiza a função objetivo.

16
SOLUÇÃO GRÁFICA DE UM PPL
Tipos de Restrições

Maximizar Z = 3x1 + 5x2


Sujeito às restrições x1 ≤ 4
2x2 ≤ 12 Restrições Funcionais

3x1 + 2x2 ≤ 18

x1 ≥ 0, x2 ≥ 0 Restrições de não-negatividade

17
SOLUÇÃO GRÁFICA DE UM PPL
Tipos de Restrições

18
SOLUÇÃO GRÁFICA DE UM PPL
Quando o problema envolve apenas duas variáveis de decisão, a solução
ótima de um problema de programação linear pode ser encontrada
graficamente.

Max Z = 5 x1 + 2 x 2
s. r . x1  3 (a)
x2  4 (b)
x1 + 2 x 2  9 (c)
x1  0 , x 2  0 (d)

19
SOLUÇÃO GRÁFICA DE UM PPL
Passo a passo...

20
SOLUÇÃO GRÁFICA DE UM PPL

x2 x1  3
4
x2  4
3

x 2 0 1 2 3 4 x1
x 1 0

21
SOLUÇÃO GRÁFICA DE UM PPL

x1 + 2 x 2  9
x  3
x1 + 2 x 2 = 9
x2
1

(1,4) (3,4)
(0,4) x 4
(3,3) 2

x  0
2
(0,0) (3,0) x1
x  0
1

Prof. Dr. Marcos dos Santos 22


SOLUÇÃO GRÁFICA DE UM PPL

x2 Z = 21 = 5x1 + 2 x 2

(1,4)
(0,4)
(3,3) = Solução
Z = 0 = 5x 1 + 2 x 2 Ótima
Solução
Viável

(0,0) (3,0) x1
Z = 10 = 5 x1 + 2 x2

23
SOLUÇÃO GRÁFICA DE UM PPL
Exercício:
Considere o seguinte o problema de PL

Max 3 x1 + 3 x2
s.r. 2 x1 + 4 x2  12
6 x1 + 4 x2  24
x1 , x2  0

Encontre a solução ótima utilizando o método gráfico.

24
SOLUÇÃO GRÁFICA DE UM PPL
Max 3 x1 + 3 x2
s.r. 2 x1 + 4 x2  12
6 x1 + 4 x2  24
x1 , x2  0

25
SOLUÇÃO GRÁFICA DE UM PPL

x2 7

(0,6) 6

5 6 x1 + 4 x2  24
4

(0,3) 3

1 2 x1 + 4 x2  12
x2  0 (6,0)
(0,0) 0 1 2 3 4 (4,0) 5 6
x1
x1  0

26
SOLUÇÃO GRÁFICA DE UM PPL

x2 7
Z = 0 = 3 x1 + 3 x2
6

5
Z = 6 = 3 x1 + 3 x2
4 Z = 13,5 = 3 x1 + 3 x2
3

2 Observe que uma solução ótima de um


problema de programação linear está
1 sempre associada a um vértice ou
ponto extremo do espaço de soluções.
0 1 2 3 4 5 6
x1

27
Mão na massa !
EXERCÍCIO

Obtenha a solução gráfica para o seguinte programa de PL:

Maximizar Z = 3x1 + 5x2


Sujeito às restrições x1 ≤ 4
2x2 ≤ 12
3x1 + 2x2 ≤ 18
x1 ≥ 0, x2 ≥ 0

29
EXERCÍCIO
Max Z = 3x1 + 5x2
s.a.
x1 ≤ 4
2x2 ≤ 12
3x1 + 2x2 ≤ 18
x1 ≥ 0, x2 ≥ 0

30
LIMITAÇÃO DA SOLUÇÃO GRÁFICA

Conforme os problemas apresentados, a solução


gráfica de um PPL tem a grande limitação de resolver
problemas com apenas duas variáveis de decisão.

Para problemas com três ou mais variáveis de


decisão, utilizaremos o Método Simplex, que será
trabalhado nas próximas aulas.

31
LIMITAÇÃO DA SOLUÇÃO GRÁFICA

32
LIMITAÇÃO DA SOLUÇÃO GRÁFICA

33
OBJETIVO

Determinar graficamente a “Solução Ótima” de um


PPL com duas Variáveis de Decisão.

34
Método Simplex
Prof. Dr. Marcos dos Santos

MÓDULO 4
BACKGROUND
Oficial Superior, com 30 anos de serviço na Marinha do Brasil;
Colégio Naval;
Escola Naval;
Viagem de instrução de Guardas-Marinha (VIGM) em 2001;
10 anos embarcado em navios de guerra;
12 anos como Pesquisador e Gerente de Projetos na Divisão
de Pesquisa Operacional (Marinha do Brasil);
Especialização em Instrumentação Matemática (UFF);
Aperfeiçoamento em Matemática (IMPA);
Governança em TI (FGV-RJ);
Mestrado em Engenharia de Produção - Pesquisa Operacional (COPPE/UFRJ);
Doutorado e pós-doutorado em Sistemas, Apoio à Decisão e Logística (UFF);
Pós-doutorado em Ciências e Tecnologias Espaciais (ITA);
Diretoria da Sociedade Brasileira de Pesquisa Operacional (SOBRAPO);
Professor do MBA em Data Science e Analytics da USP;
Professor do Mestrado e Doutorado em Engenharia de Produção da UFF;
Professor da Graduação, Mestrado e Doutorado em Computação do IME;
Mais de 800 pesquisas publicadas e/ou apresentadas em mais de 20 países.
REFERÊNCIAS

37
OBJETIVO

Determinar a “Solução Ótima” de um PPL por meio


do Método Simplex, especialmente adequado para
problemas com duas ou mais V.D.

38
3939
OVERVIEW

Não podemos perder de vista que a P.O. é uma ciência


multidisciplinar que lança mão de várias técnicas de
estruturação de problemas e de modelos matemáticos que
buscam se adequar ao contexto gerencial que estamos lidando.
A P.O. está muito longe de ser uma
panaceia de algoritmos matemáticos a
serem decorados!

40
TIPOS DE MÉTODOS

A PL utiliza métodos
determinísticos.

41
MÉTODOS ALGÉBRICOS
Na aula anterior pudemos resolver um modelo de PL
empregando o método gráfico. Agora será possível aprender os
procedimentos para determinação da solução utilizando os
métodos algébricos.

Os métodos algébricos de resolução de problemas de


Programação Linear são mais robustos do que o método gráfico.
Isso porque sua utilização não implica a limitação em relação ao
número de variáveis.

42
ALGORITMO

O desenvolvimento do Método SIMPLEX se dá por meio de um


conjunto padronizado de rotinas ou instruções que executam o
cálculo matemático (algoritmo).

Desse modo, nem mesmo aquele leitor menos familiarizado com


a matemática vetorial e com a resolução de sistemas de
equações e inequações lineares deverá encontrar maiores
dificuldades na utilização do SIMPLEX.

43
CONVEXIDADE
Um conjunto é dito convexo quando contém todos os segmentos
que unem quaisquer dois pontos desse conjunto.

44
CRIAÇÃO DO MÉTODO SIMPLEX
O Método SIMPLEX para resolução de PPLs foi
desenvolvido e aperfeiçoado pelo matemático norte-
americano George Dantzig (1914 – 2005). Por seu
trabalho, que foi publicado no ano de 1947 e
apresentou à comunidade matemática mundial o
algoritmo do SIMPLEX, Dantzig ficou conhecido como
o “Pai da Programação Linear”.

45
ITERAÇÃO
1) Iteração = repetição.

2) Processo de resolução de uma equação mediante


operações em que sucessivamente o objeto de cada
uma é o resultado da que a precede.

46
ETAPAS DO MÉTODO SIMPLEX
De modo geral, o SIMPLEX busca, a partir de uma primeira
solução básica viável, percorrer de forma iterativa os vértices
de um polígono até alcançar uma solução considerada ótima
para o problema.

47
ETAPAS DO MÉTODO SIMPLEX

Na prática, a utilização do SIMPLEX se dá mediante uma sequência de etapas.


São elas:

(1) Redução do sistema linear à forma canônica;


(2) Construção do Tableau SIMPLEX;
(3) Determinação da Solução Básica Inicial;
(4) Escolha das variáveis que entram e das variáveis que saem da base;
(5) Cálculo da nova solução básica e
(6) Teste dessa nova solução.

48
PPL NA FORMA PADRÃO

1. A Função-Objetivo é de Maximização;

2. As restrições têm sinal de menor ou igual;

3. As constantes de todas as restrições são não-negativas;

4. As variáveis de decisão só podem assumir valores não-negativos.

49
PPL NA FORMA PADRÃO

5 1
Maximizar Z = c1x1 + c 2 x 2 + ... + c n x n
0 9 8-
73 .
Sujeito a :
5 .2
a 11x1 + a 12 x 2 + ... + a 1n x n  bd1a 31
h i
a 21x1 + a 22 x 2 + ... + a 2 n x nYos b 2
sh i Não negativos
ts u
o A
l + a mn x n  b m
a m1x1 + a m 2 x 2 +ce...
ar
M
x1 , x 2 , x 3 ,...x n  0

50
PPL NA FORMA PADRÃO

Forma Padrão Forma Não Padrão

max x1 + x 2 min x1 + 2 x2
s.r. s.r.
2 x1 + 4 x 2  20 2 x1 + 3 x2  20
180 x1 + 20 x 2  600 180 x1 + 20 x2 = 600
x1 , x 2  0 x1 , x2  0

51
TRANSFORMANDO UM SISTEMA DE INEQUAÇÕES EM
UM SISTEMA DE EQUAÇÕES

VARIÁVEL DE FOLGA:

Atenção: Variáveis de Folga.

Dado um Problema de Programação


Linear, precisamos inserir as variáveis
de folga para que as desigualdades
tornem-se igualdades.

52
Mão na massa!
TRANSFORMANDO UM SISTEMA DE INEQUAÇÕES EM
UM SISTEMA DE EQUAÇÕES

Exercício
Introduza as variáveis de folga no PPL a seguir:

54
TABLEAU SIMPLEX

55
TABLEAU SIMPLEX

56
Mão na massa!
TABLEAU SIMPLEX
Exercício
Construa o Tableau Simplex do seguinte PPL:

58
TABLEAU SIMPLEX
Exercício
Construa o Tableau Simplex do seguinte PPL:

59
MÉTODO SIMPLEX
Passo a passo...

60
MÉTODO SIMPLEX
Passo a passo...

61
MÉTODO SIMPLEX
Passo a passo...

62
MÉTODO SIMPLEX
Passo a passo...

63
MÉTODO SIMPLEX
Passo a passo...

64
MÉTODO SIMPLEX
Passo a passo...

65
MÉTODO SIMPLEX
Passo a passo...

66
MÉTODO SIMPLEX
Passo a passo...

67
PROBLEMAS REAIS UTILIZANDO O MÉTODO SIMPLEX

68
PROBLEMAS REAIS UTILIZANDO O MÉTODO SIMPLEX

69
MÉTODO SIMPLEX UTILIZANDO R

https://marcosdossantos.shinyapps.io/pl_shiny/

70
MÉTODO SIMPLEX UTILIZANDO R

71
MÉTODO SIMPLEX UTILIZANDO R

72
MÉTODO SIMPLEX UTILIZANDO R

73
OUTROS SOFTWARES

E fica a pergunta: qual deles é


o melhor?

74
FINALIZANDO

Não importa o software que você irá utilizar. Isso é


uma mera questão de preferência pessoal. O foco
deve estar em resolver o problema da sua
organização. E para isso você deve conhecer os
métodos.

Os softwares são meros facilitadores!

75
Aprendi a resolver um PPL utilizando
a Solução Gráfica.

Aprendi a resolver um PPL utilizando


o Método Simplex.

Aprendi a resolver um PPL utilizando o R.

76
OBJETIVO

Determinar a “Solução Ótima” de um PPL por meio


do Método Simplex, especialmente adequado para
problemas com duas ou mais V.D.

77
Introdução à Simulação
Prof. Dr. Marcos dos Santos

MÓDULO 5
BACKGROUND
Oficial Superior, com 30 anos de serviço na Marinha do Brasil;
Colégio Naval;
Escola Naval;
Viagem de instrução de Guardas-Marinha (VIGM) em 2001;
10 anos embarcado em navios de guerra;
12 anos como Pesquisador e Gerente de Projetos na Divisão
de Pesquisa Operacional (Marinha do Brasil);
Especialização em Instrumentação Matemática (UFF);
Aperfeiçoamento em Matemática (IMPA);
Governança em TI (FGV-RJ);
Mestrado em Engenharia de Produção - Pesquisa Operacional (COPPE/UFRJ);
Doutorado e pós-doutorado em Sistemas, Apoio à Decisão e Logística (UFF);
Pós-doutorado em Ciências e Tecnologias Espaciais (ITA);
Diretoria da Sociedade Brasileira de Pesquisa Operacional (SOBRAPO);
Professor do MBA em Data Science e Analytics da USP;
Professor do Mestrado e Doutorado em Engenharia de Produção da UFF;
Professor da Graduação, Mestrado e Doutorado em Computação do IME;
Mais de 800 pesquisas publicadas e/ou apresentadas em mais de 20 países.
REFERÊNCIAS

80
OBJETIVO

Apresentar o conceito de Simulação, em que tipos de


problema ela deve ser utilizada e o que é um Gerador
de Números Aleatórios.

81
8282
TIPOS DE MÉTODOS

83
SIMULAÇÃO
O termo “Simulação” pode ser classificado em duas grandes
categorias: a simulação computacional e a simulação não
computacional.

A simulação computacional é aquela que necessita de um


computador para ser realizada. Já a simulação não
computacional é aquela que não necessita de um computador
para ser realizada. Por exemplo, um projetista utilizando um
protótipo em escala reduzida de uma aeronave em um túnel de
vento.
84
SIMULAÇÃO COMPUTACIONAL
A Simulação é um processo estocástico que utiliza
modelos que imitam ou simulam a realidade por meio de
valores probabilísticos ou aleatórios que alimentam esses
modelos.

Os modelos utilizados pela Simulação são algoritmos que


geram, a partir de valores aleatórios ou valores sorteados,
uma grande quantidade de resultados do problema. O
conjunto de resultados obtidos possibilita calcular os
valores médios, os desvios, os valores máximo ou mínimo
das variáveis do problema simulado.

85
TIPOS DE SIMULAÇÃO COMPUTACIONAL
1. Simulação por Eventos Discretos:
É aquela em que as mudanças de estado do sistema ocorrem instantaneamente em
pontos aleatórios do tempo como resultado da ocorrência de eventos discretos.

2. Simulação Contínua:
É aquela na qual as mudanças no estado do sistema ocorrem continuamente ao longo
do tempo.

3. Simulação de Monte Carlo:


É aquela que cria um modelo de resultados possíveis, usando uma distribuição de
probabilidade, como uma distribuição uniforme ou normal, para qualquer variável que
tenha algum grau de incerteza. Ela então recalcula os resultados sucessivamente, cada
vez usando um conjunto diferente de números aleatórios entre os valores mínimo e
máximo.
86
TIPOS DE SIMULAÇÃO COMPUTACIONAL

Chwif e Medina (2007)


87
SIMULAÇÃO COMPUTACIONAL
Lei dos Grandes Números
A lei dos grandes números (LGN) é um teorema fundamental da teoria da
probabilidade, que descreve o resultado da realização da mesma
experiência repetidas vezes. De acordo com a LGN, a média aritmética dos
resultados da realização da mesma experiência repetidas vezes tende a se Valor Esperado:
aproximar do valor esperado à medida que mais tentativas se sucederem.
P (cara) =

Ex: Jogando-se uma moeda N vezes:


P(coroa) =
N = 10 lançamentos
N = 100 lançamentos
N = 1000 lançamentos

88
SIMULAÇÃO DE MONTE CARLO
Durante a II Guerra Mundial, o matemático húngaro John Von
Neumann, eu seu trabalho no Projeto Manhattan, criou o conceito
denominado “Simulação de Monte Carlo”.

Cada átomo é uma variável aleatória. O efeito gerado por um conjunto


de átomos é a composição de várias variáveis aleatórias.

O nome originou-se da aleatoriedade e da natureza repetitiva das


atividades realizadas em cassinos de Monte Carlo. A roleta de um
cassino desempenha o papel de um Gerador de Números Aleatórios
(GNA).
89
SIMULAÇÃO DE MONTE CARLO

90
SIMULAÇÃO DE MONTE CARLO

Obra no valor de R$18.800.000,00

91
NÚMEROS ALEATÓRIOS

Um número aleatório pode representar decisões arbitrárias ou


servir como entrada para geração de tempos segundo várias
distribuições.

Para produzir números aleatórios:


- Dispositivos físicos (Ex: dados, roletas, moedas etc.);
- Tabela de números aleatórios;
- Processos matemáticos.

92
NÚMEROS ALEATÓRIOS
Métodos Matemáticos
Método do Meio-Quadrado (Von Neumann – 1946)

93
NÚMEROS ALEATÓRIOS
Métodos Matemáticos
Método do Meio-Quadrado (Von Neumann – 1946)

A partir de uma “semente” de 2 dígitos, temos:

𝑟0 = Observações:

1. Quando resultar em 0, devemos


atribuir outra semente.

2. Esses métodos são chamados de


“pseudoaleatórios”.

94
Mão na massa!
Exercício:
Pelo Método do Meio-Quadrado, gerar os 6 primeiros números
aleatórios a partir de uma semente de 2 dígitos.

96
NÚMEROS ALEATÓRIOS
Método da Congruência

Thomson, W. E. (1958). "A


Modified Congruence Method
of Generating Pseudo-random
Numbers". The Computer
Journal. 1 (2): 83.

97
NÚMEROS ALEATÓRIOS
Método da Congruência

Primeiro vamos entender o que é a operação de congruência:

x mod y = r

Ex1: 20 mod 7 =

Ex2: 115 mod 4 =

98
NÚMEROS ALEATÓRIOS
Método da Congruência
Um dos métodos mais populares para a geração de números
aleatórios é o Método da Congruência. Este método trabalha a
partir de quatro parâmetros, quais sejam:

1. O multiplicador a;
2. A constante aditiva c;
3. O módulo M;
4. A semente inicial 𝑟0 .

99
NÚMEROS ALEATÓRIOS
Método da Congruência
Passo 1: Escolha os valores a, c e M.

Passo 2: Escolha a semente 𝑟0 , tal que 1 ≤ 𝑟0 ≤ M.

Passo 3: Calcule o próximo número aleatório pela expressão: 𝑟1 = 𝑎. 𝑟0 + 𝑐 𝑚𝑜𝑑 𝑀.

Passo 4: Substitua 𝑟0 por 𝑟1 e volte ao passo anterior, de modo a construir a sequência


de números aleatórios desejada.

100
Exercício:
Pelo Método da Congruência, gerar os 5 primeiros números
aleatórios utilizando os valores: a = 9; c = 3; M = 17 e 𝑟0 = 8.

101
Mão na massa!
Exercício:
Pelo Método da Congruência, gerar os 5 primeiros números
aleatórios utilizando os valores: a = 13; c = 9; M = 15 e 𝑟0 = 10.

103
NÚMEROS ALEATÓRIOS

No Excel temos as funções:

1. = ALEATÓRIO( ): gera números aleatórios entre 0 e 1.

2. = ALEATÓRIOENTRE( ): gera números aleatórios num


determinado intervalo.

104
VANTAGENS E DESVANTAGENS DA SIMULAÇÃO
Embora seja uma das ferramentas mais utilizadas no mundo da Pesquisa
Operacional, a Simulação possui algumas vantagens e desvantagens. Dentre
elas:

Vantagens:
1. A maioria dos sistemas reais não pode ser avaliado analiticamente com
acurácia. Sendo a Simulação a única forma possível.
2. Permite estimar o desempenho de um sistema sob condições de operação
projetadas.
3. Permite a compressão do tempo em operações de curta, média e longa
duração.

105
VANTAGENS E DESVANTAGENS DA SIMULAÇÃO

Embora seja uma das ferramentas mais utilizadas no mundo da Pesquisa


Operacional, a Simulação possui algumas vantagens e desvantagens. Dentre
elas:

Desvantagens:
1. Simulação estocástica produz estimativas e dependem de diversas rodadas
(replicações). Se as características de um problemas podem ser estimadas por
parâmetros exatos, a otimização é preferível.
2. Softwares podem ser caros.
3. Animações realísticas podem impressionar, mas se corre o risco do modelo
não ser válido.

106
OBJETIVO

Apresentar o conceito de Simulação, em que tipos de


problema ela deve ser utilizada e o que é um Gerador
de Números Aleatórios.

107
OBRIGADO

researchgate.net/profile/Marcos_Dos_Santos6

108
OBRIGADO!
https://www.linkedin.com/in/profmarcosdossantos/

109

Você também pode gostar