Você está na página 1de 148

Sumário

Políticas Públicas..............................................................................................3
Desafios do Estado de Direito: Democracia e Cidadania.........................4
Ética e Integridade............................................................................................5
Diversidade e Inclusão na Sociedade...........................................................6
Administração Pública na Sociedade...........................................................7
Finanças Públicas.............................................................................................8
Eixo 1: Gestão Governamental e Governança Pública..............................9
Eixo 2: Políticas Públicas...............................................................................10
Eixo 3: Gerência e Suporte da Tecnologia da Informação.....................11
Eixo 4: Desenvolvimento de Software.......................................................12
Eixo 5: Apoio à Decisão, Inteligência Artificial e Métodos
Quantitativos....................................................................................................13
Políticas Públicas
A implementação se refere à execução das políticas decididas.

A construção da agenda envolve identificar e priorizar os problemas que necessitam de atenção.


Decisão é a etapa em que se escolhe entre diferentes alternativas de políticas.
Implementação se refere à execução das políticas decididas.
Monitoramento é uma etapa contínua e se relaciona com a implementação e a avaliação.
Avaliação é uma etapa posterior, na qual se analisa o impacto das políticas.

Problema --> Agenda --> Formulação --> implementação+ acompanhamento --> avaliação --> e possível exclusão
Desafios do Estado de Direito:
Democracia e Cidadania
Ética e Integridade
Aula 1 - AVISO! Assunto abordado em Administração Pública Federal - Aula 1
Diversidade e Inclusão na Sociedade
Administração Pública na Sociedade
RESPONSABILIDADE CIVIL DO ESTADO
10. RESPONSABILIDADE CIVIL DO ESTADO
Tema campeão nas provas, podendo ser perguntado em constitucional ou
administrativo. Vou traçar um panorama geral sobre a responsabilidade civil do Estado:
Finanças Públicas
6.1 Atribuições econômicas do Estado.
A Tributação (T) compreende:

Impostos Indiretos: aqueles que incidem sobre as transações econômicas de bens


eserviços, a exemplo do Imposto sobre Circulação de Mercadorias e Serviços (ICMS), do
Imposto sobre Produtos Industrializados (IPI) e do Imposto sobre Serviços de Qualquer
Natureza (ISS);
Impostos Diretos: aqueles que incidem sobre o patrimônio e a renda das pessoas,
físicas e jurídicas, como o Imposto de Renda (IR), o Imposto sobre a Propriedade Predial e
Territorial Urbana (IPTU), o Imposto sobre a Propriedade de Veículos Automotores (IPVA);
Contribuições à Previdência Social: aqui devem ser computadas tanto a parte do
empregador quanto a do empregado.
Outras receitas de governo: aqui entrariam, por exemplo, receitas com taxas e
multas diversas.
Eixo 1: Gestão Governamental e
Governança Pública
FERRAMENTAS
BSC
− PERT, invertido fica TREp = TRÊs estimativas de tempo: média otimista, pessimista e a mais
provável.
− CPM, única estimativa de tempo: mais provável.

PROCESSO DE PLANEJAMENTO
Os OBJETIVOS mantêm uma importância na função de planejar. Nesse sentido, existe,
naturalmente, uma hierarquia de objetivos, pois alguns deles são mais importantes e
predominam sobre outros:

Os objetivos organizacionais, além de hierárquicos, devem ser específicos, mensuráveis,


atingíveis, relevantes e temporais. Essas características “volta e meia” aparecem em
provas:
CARACTERÍSTICAS DO PLANEJAMENTO
PLANEJAMENTO ESTRATÉGICO
As expressões “estratégia”, “administração estratégica” e “planejamento estratégico” são conceitos
relacionados, mas apresentam diferenças em termos de abrangência e foco

CARACTERÍSTICAS
As principais características do planejamento estratégico são as seguintes:

MATRIZ SWOT
A MATRIZ SWOT permite montar, de forma esquemática, uma tabela de quatro

quadrantes, onde devemos listar as forças, as fraquezas, as oportunidades e as ameaças

que podem se abater sobre uma organização.


NEGÓCIO, MISSÃO E VISÃO

MATRIZ GUT

A MATRIZ GUT nada mais é que uma técnica de priorização de problemas. A sigla GUT

refere-se, respectivamente, à:

Em suma, os gestores atribuem notas a cada problema relacionado, seguindo uma


escala crescente, ou seja, nota 5 para os maiores valores e nota 1 para os menores valores.
Ao final dessa atribuição de notas, é preciso chegar-se a um valor resultado de toda a
análise que definirá qual o grau de prioridade para cada um dos problemas listado. O cálculo
é feito da seguinte forma:
• (G) x (U) x (T).
Ou seja, o valor máximo para um problema será de 125. Vejamos o quadro a seguir:

FERRAMENTA 5W2H
A MATRIZ ou PLANO DE AÇÃO 5W2H constitui uma espécie de catálogo que enumera
todas as atividades que devem ser realizadas, assegurando uma execução precisa e
regularmdos objetivos traçados. É elaborada em resposta às seguintes questões:

• O QUE: (What) Qual ação vai ser desenvolvida?


• QUANDO: (When) Quando a ação será realizada?
• POR QUE: (Why) Por que foi definida esta solução (resultado esperado)?
• ONDE: (Where) Onde a ação será desenvolvida (abrangência)?
• COMO: (How) Como a ação vai ser implementada (passos da ação)?
• QUEM: (Who) Quem será o responsável pela sua implantação?
• QUANTO: (How Much) Quanto será gasto?

BALANCED SCORECARD (BSC)


O BSC – BALANCED SCORECARD (Indicadores Balanceados de Desempenho) é um
conjunto de objetivos que proporciona a todos os colaboradores uma visão rápida e
abrangente da estratégia da organização, avaliando tanto perspectivas financeiras
como perspectivas não financeiras.

O Balanced Scorecard possui quatro perspectivas amplas, que focam naquilo que
realmente cria valor para a organização:

PERFORMANCE PRISM
É um sistema de avaliação inovador em comparação aos mais tradicionais, como o
Balanced Scorecard, por exemplo.
O método também considera a relação recíproca entre a organização e seus
stakeholders, que é o público estratégico de uma organização, em oposição às
necessidades apenas de partes diretamente interessadas. Esse sistema possui cinco
facetas ou perspectivas:

Mnemônico do Performance Prism (PP)

PLANEJAMENTO BASEADO EM CENÁRIOS


O PLANEJAMENTO BASEADO EM CENÁRIOS visa estabelecer objetivos e metas de
forma aberta e flexível, buscando sempre a aprendizagem sobre o futuro.
Temos duas abordagens básicas de se prever cenários:

CICLO PDCA
O CICLO PDCA (Plan-Do-Check-Act), também conhecido como ciclo de melhoria
contínua ou ciclo de Deming, é uma abordagem amplamente utilizada para alcançar
melhorias contínuas nos processos e resultados de uma organização.
Ele é composto por quatro etapas interligadas e cíclicas:

MATRIZ BCG
Criada pela Boston Consulting Group (BCG), a matriz BCG pressupõe uma matriz de
crescimento e participação, em que a principal abordagem é como alocar fundos para
diferentes negócios de uma empresa diversificada:
Eixo 2: Políticas Públicas
Todas as vezes em que se fala em INSTITUIÇÕES, a tendência é pensar nelas como
ORGANIZAÇÕES.

I. Institucionalismo, preocupava-se apenas em analisar as instituições políticas.


II. Comportamentalismo, traçava suas análises em função do comportamento dos atores políticos.
III. Neoinstitucionalismo, crítica ao comportamentalismo. cuja centralidade estudava as influências bilaterais
entre instituições e atores políticos.

De acordo com a teoria do NEOINSTITUCIONALISMO, as instituições desempenham um papel fundamental no


controle das políticas públicas. Elas não apenas implementam essas políticas, mas também reforçam o poder de ação e
a autoridade do Estado, moldando a maneira como as políticas são formuladas e implementadas.
racional.

O NEO-INSTITUCIONALISMO HISTÓRICO enfatiza a importância do contexto histórico e da evolução das


instituições ao longo do tempo.
O NEO-INSTITUCIONALISMO SOCIOLÓGICO, por outro lado, enfatiza a influência das normas sociais e dos
valores culturais na formação das instituições.
A teoria da ESCOLHA RACIONAL enfatiza a importância da análise dos incentivos e das preferências dos
atores envolvidos na tomada de decisão institucional.

Burocracia e política
Eixo 3: Gerência e Suporte da
Tecnologia da Informação
1 - ISO/IEC 27001:2013 explicação resumida da ISO 27001/2013
Eixo 4: Desenvolvimento de Software
ENTIDADES
O objeto básico tratado pelo modelo ER é a entidade, que pode ser definida como um
objeto do mundo real, concreto

ATRIBUTOS
Os atributos são propriedades particulares que descrevem uma entidade, ou mesmo
características de um relacionamento.
Por exemplo, uma entidade Carro pode ter como atributos: Marca, Modelo, Cor,
Fabricante, Ano de fabricação, Chassi e, assim, sucessivamente.

RELACIONAMENTOS
Um relacionamento pode ser entendido como uma associação entre instâncias
de entidades devido a regras de negócio. São relações entre duas ou mais entidades,
determinando uma associação entre as mesmas

GRAU DE UM RELACIONAMENTO ( CARDINALIDADE)


A primeira característica de um relacionamento é que este tem um grau.
E o que é o grau de um relacionamento? É simplesmente o número de entidades que
fazem parte desse relacionamento, guarde isso!
Inicialmente, entendam também grau do relacionamento como cardinalidade do mesmo,
ok? Isso já foi cobrado em prova ☺!

Relacionamentos Binários: com duas entidades, temos relacionamentos binários,


como o listado a seguir.
Relacionamentos N-ários: acima de duas entidades, esses relacionamentos
normalmentemsão denominados n-ários (Podemos ter relacionamentos ternários - com
três entidades, quaternário – com quatro entidades, e assim por diante).
A seguir, tem-se um relacionamento ternário

CARDINALIDADE DE RELACIONAMENTO
Para definir o número de ocorrências de uma entidade usamos o conceito de
Cardinalidade, que indica quantas ocorrências de uma entidade participam no mínimo e
no máximo do relacionamento. Em outras palavras, a cardinalidade de um
relacionamento expressa quantas entidades de um grupo se relacionam com uma
entidade do outro.

A cardinalidade, então, representa o número máximo de elementos de uma entidade


que se relacionam com elementos da outra entidade. Assim, é definida como:
• 0:N (uma entidade pode ter nenhum ou vários participantes);
• 1:1 (Um para um);
• 1:N (Um para muitos);
• N:1 (Muitos para um);
• N:N (Muitos para muitos) (observe que N é um número arbitrário que representa
qualquer valor maior que 1)
CARDINALIDADE DE ATRIBUTOS
Um atributo pode possuir uma cardinalidade, de maneira análoga a uma entidade
num relacionamento e essa cardinalidade irá definir quantos valores desse atributo
podem estar associados com uma ocorrência da entidade ou relacionamento ao qual
ele pertence.
Alguns exemplos:
• Cardinalidade (1,1): obrigatória, mas não precisa ser representada no diagrama;
• Cardinalidade (0,1): opcional;
• Cardinalidade (0,n): opcional e multivalorada;

GENERALIZAÇÃO/ESPECIALIZAÇÃO
É possível incluir nos modelos entidade-relacionamento (MER) conjuntos de entidades
com diversas características em comum, diferenciando apenas em algumas
características.
Nesse caso, pode-se usar o conceito de generalização, em que se cria um conjunto de
entidades genérico contendo as características em comum, e de especialização em que
se especializam (apresentam diferenças) nas características que são distintas.
ENTIDADE FRACA

Uma entidade fraca é uma entidade que tem uma relação de dependência com outra
entidade. Isto quer dizer que a entidade fraca só existe se existir a entidade com a qual
está relacionada.

As entidades fracas são representadas por retângulos duplos, e seus relacionamentos


também podem ser representados por losangos duplos.

Chamamos o tipo relacionamento entre a entidade fraca e seu tipo proprietário de


relacionamento identificador.

ENTIDADE ASSOCIATIVA
Por definição um relacionamento é uma associação entre entidades.
Na modelagem ER não é prevista a possibilidade de associar uma entidade a um
relacionamento, ou de associar dois relacionamentos entre si. Mas, em certas
oportunidades, durante a modelagem surgem situações nas quais é desejável permitir
uma associação entre uma entidade e um relacionamento, gerando aí uma Entidade
Associativa.
DIAGRAMA ENTIDADE – RELACIONAMENTO (DER)
O DER é composto por um conjunto de objetos gráficos que visa representar todos os
objetos do modelo ER tais como entidades, atributos, atributos chaves, relacionamentos
etc.
O DER fornece uma visão lógica do banco de dados, proporcionando um conceito mais
generalizado de como estão estruturados os dados de um sistema.
Obs.: No Modelo Relacional utilizamos a terminologia relação, atributo e tupla. Esses
elementos correspondem no modelo físico aos termos: tabela, campo e registro,
respectivamente.
DDL - Data Definition Language - Linguagem de Definição de Dados

• São os comandos que interagem com os objetos do banco.


• São comandos DDL : CREATE, ALTER e DROP

DML - Data Manipulation Language - Linguagem de Manipulação de Dados.


• São os comandos que interagem com os dados dentro das tabelas.
• São comandos DML : INSERT, DELETE e UPDATE

DQL - Data Query Language - Linguagem de Consulta de dados.


• São os comandos de consulta.
• São comandos DQL : SELECT (é o comando de consulta)
• Aqui cabe um parenteses. Em alguns livros o SELECT fica na DML em outros tem esse grupo próprio.

DTL - Data Transaction Language - Linguagem de Transação de Dados.


• São os comandos para controle de transação.
• São comandos DTL : BEGIN TRANSACTION, COMMIT E ROLLBACK

DCL - Data Control Language - Linguagem de Controle de Dados.


• São os comandos para controlar a parte de segurança do banco de dados.
• São comandos DCL : GRANT, REVOKE E DENY.

Álgebra Relacional
• A álgebra relacional é uma linguagem de consulta formal, porém procedimental, em que o
usuário dá as instruções ao sistema para que o mesmo realize uma sequência de operações na base
de dados para calcular o resultado desejado.

Veja que a álgebra relacional é o conjunto de operações presentes no modelo relacional. Você
verá essas operações na SQL (Structured Query Language ou Linguagem de Consulta
Estruturada).
Logo, não se preocupe com detalhes da notação. As principais operações (mais cobradas em prova)
são: a projeção, a seleção e o produto cartesiano.
Dependência Funcional
Dependência funcional nada mais é do que um relacionamento que existe entre atributos de
uma relação.

Uma chave primária SEMPRE determina os demais atributos de uma relação.

A dependência funcional pode ser classificada em:


• Total: um atributo é totalmente dependente de outro se ele for funcionalmente dependente do
outro e não dependente de um subconjunto de outro;
• Parcial: um atributo é parcialmente dependente de outro se ele for funcionalmente dependente de
um subconjunto de outro.

Normalização de Dados
O principal objetivo da normalização de dados em banco de dados é minimizar a redundância e a
anomalia dos dados, garantindo que as informações sejam armazenadas de forma eficiente e que
possam ser atualizadas sem introduzir inconsistências.

Em suma, a normalização de dados é uma série de passos que se segue no projeto de um banco de
dados que permite um armazenamento consistente e um eficiente acesso aos dados em um
banco de dados relacional. Esses passos reduzem a redundância de dados e as chances dos dados
se tornarem inconsistentes.

As primeiras formas normais foram criadas na década de 1970 por Codd, e persistem até hoje. Elas
são importantes para verificar se seu Banco de Dados está bem projetado.

• 1NF (Primeira Forma Normal): Cada atributo de uma tabela deve conter apenas valores
atômicos, ou seja, valores indivisíveis.
• 2NF (Segunda Forma Normal): Deve estar na 1NF e todos os atributos não chave devem
depender completamente da chave primária.
• 3NF (Terceira Forma Normal): Deve estar na 2NF e os atributos não chave não devem ter
dependências transitivas da chave primária

• Primeira Forma Normal (1FN)


1a Forma Normal prega que todos os atributos de uma tabela devem ser atômicos (indivisíveis),
ou seja, NÃO são permitidos atributos multivalorados, atributos compostos ou atributos
multivalorados compostos.

• Segunda Forma Normal (2FN)


Uma relação estará na 2FN, se e somente se, estiver na 1FN e os seus atributos não chaves
forem dependentes funcionais completos da chave primária.
Em outras palavras, se algum atributo da tabela depender funcionalmente apenas de parte da
chave primária, então este atributo deverá migrar para outra tabela

• Terceira Forma Normal (3FN)


Uma relação estará na 3FN, se e somente se, estiver na 2FN e todos os seus atributos não
chaves forem dependentes não transitivos da chave primária.
Assim, a 3 Forma Normal prega o conceito de dependência transitiva. Uma tabela está na 3ª
Forma Normal se estiver na 2ª Forma Normal e não houver dependência transitiva entre
atributos não chave.
SQL

− Chave Primária: PRIMARY KEY;


− Chave Estrangeira: FOREIGN KEY;
− Chave Alternativa (ou alternada): UNIQUE;
− Restrição de Domínio: CHECK. CHECK é utilizado para restringir os valores de domínio,
verificando se eles estão contidos no conjunto de valores especificados

• Pode-se atribuir nomes às restrições de integridade:


− CONSTRAINT NOME_RESTRIÇÃO TIPO RESTRIÇÃO.
Criação de um Índice
Os índices aceleram a recuperação dos dados
Os índices são utilizados, principalmente, para melhorar o desempenho do banco de dados

Excesso de índices pode ser tão prejudicial quanto sua falta!

Alteração de Tabelas
A sintaxe para INCLUIR uma coluna é:
ALTER TABLE nome_da_tabela
ADD nome_da_coluna tipo_do_dado;

A sintaxe para ALTERAR A LARGURA de uma coluna já existente é:


ALTER TABLE nome_da_tabela
MODIFY nome_da_coluna tipo_do_dado
nova_largura;

Exclusão de Tabelas
Para excluir uma tabela de um banco de dados, use o comando
DROP TABLE seguido do nome da tabela:
DROP TABLE nomedatabela;

Obs.: O comando DROP remove a tabela inteira da base de dados que inclui a sua estrutura e
registros. Remove, portanto, não somente os dados da tabela, mas também a própria definição
do objeto. A tabela, seus dados e restrições deixam de existir no banco de dados.

Exclusão de Índices
Para EXCLUIR um índice, use o comando SQL DROP INDEX seguido do nome do índice:
DROP INDEX nome_do_índice
ON nome_da_tabela;

Obs.: A eliminação de um índice não elimina as tabelas ou visões relacionadas com o índice.

Inserção
A maioria dos sistemas trata a carga inicial no banco de dados de um grande conjunto de dados
numa operação genérica de carga. O comando SQL INSERT geralmente é usado para inserir linhas
individuais de dados num banco de dados já existente.

A sintaxe desse comando é:


INSERT INTO nome_da_tabela (nome_da_coluna1,
nome_da_coluna2,...)
VALUES (‘valor1’, ‘valor2’, ...);
Atualização
O comando UPDATE é usado para alterar valores em linhas já existentes.
Sua forma geral é:
UPDATE nome_da_tabela
SET coluna1=novo_valor,
coluna2=novo_valor,
...
colunaN=novo_valor,
WHERE condição;

A cláusula SET do comando UPDATE indica as colunas a serem alteradas e quais os novos valores.
O comando UPDATE atua em todas as linhas que satisfazem a condição especificada pela cláusula
WHERE. A cláusula WHERE é opcional, mas, se for omitida, todas as linhas serão atualizadas.
Você pode atualizar várias colunas em cada linha com um único comando UPDATE listando as
várias colunas após a cláusula SET, conforme visto acima.
A cláusula WHERE no comando UPDATE pode conter uma subconsulta.
Exemplo:
UPDATE PESSOA
SET idade = 20
WHERE nome = ‘Maria’;

Exclusão
O comando DELETE é usado para remover linhas de uma tabela. Sua forma geral:
DELETE
FROM nome_da_tabela
WHERE condição;

Você não pode excluir parcialmente uma linha, portanto não precisa especificar os nomes das
colunas no comando DELETE.

A cláusula WHERE determina que linhas serão eliminadas. Ela pode ser complexa e incluir várias
condições, conectores e/ou subconsultas.

Se você deseja excluir todas as linhas de uma tabela, omita a cláusula WHERE, como listado a
seguir:
DELETE
FROM nome_da_tabela;

Recuperação Usando SELECT


A estrutura básica de uma consulta em SQL consiste em TRÊS cláusulas: SELECT,
FROM e WHERE.
Uma sintaxe básica de uma consulta SQL é esquematizada a seguir:
Tipos de Domínio na SQL
Domínio: conjunto de valores válidos para uma determinada coluna.
Alguns exemplos:

Linguagens
de Banco
de Dados
DDL –
Data Definition Language ou Linguagem de Definição de Dados

DML –
Data Manipulation Language ou Linguagem de Manipulação
de Dados
A DML visa à manipulação de dados (incluir, alterar, excluir e consultar) por meio do usuário.
Principais comandos:
• select: seleção de registros;
• insert: inserção de registros;
• update: atualização de registros;
• delete: deleção de registros

DQL – Data Query Language ou Linguagem de Consulta de Dados


A linguagem de consulta de dados é um subconjunto da DML que possui apenas a instrução de
SELECT.

DCL – Data Control Language ou Linguagem de Controle de Dados


Permite controlar o acesso dos usuários aos dados em um banco de dados.
Principais comandos:
• GRANT: concessão de privilégios a tabelas e visões.
• REVOKE: revogação de privilégios a tabelas e visões.

DTL – Data Transaction Language ou Linguagem de Transação de


Dados
Faz controle de transações no banco de dados. Principais comandos:

COMMIT Efetiva alterações feitas na base de dados.


ROLLBACK Desfaz alterações na base de dados.
SAVEPOINT Estabelece pontos de retorno dentro de uma transação
algebra relacional
Eixo 5: Apoio à Decisão, Inteligência
Artificial e Métodos Quantitativos

Big Data é uma coleção de conjuntos de dados, grandes e complexos, que não podem
ser processados por bancos de dados ou aplicações de processamento tradicionais

Obs.: Big Data tem dados estruturados e não estruturados!


Big Data é o termo que descreve o imenso volume de dados – estruturados e não estruturados – que
impactam os negócios no dia a dia.
O objetivo do Big Data é propiciar dados e informações que possam ser analisados
visando subsidiar tomadas de decisão (

• Dados não estruturados: são aqueles que existem em seu estado original (bruto),
ou seja, no formato em que foram coletados. Portanto, estão em um formato que
não possibilita o processamento que produz informações.

• Dados estruturados: são o resultado da obtenção de dados 1não


estruturados e de sua formatação (estruturação) visando facilitar o
armazenamento, a utilização e a geração de informações. A
estrutura (formato) é aplicada com base no
tipo de processamento que se deseja executar nos dados.

• Dados semiestruturados
são aqueles que já foram parcialmente processados.
Como o nome pode indicar, são dados que contêm parte de sua estrutura rígida
e outra parte não rígida. Possuem uma representação estrutural heterogênea,
não sendo nem completamente não estruturados e nem estritamente tipados. Por
exemplo, olhando-se uma página comum da web, os dados são apresentados em um
formato pré-organizado para transmitir alguma informação.
DATA WAREHOUSE
Um Data Warehouse (DW) é um sistema de armazenamento que conecta e harmoniza
grandes quantidades de dados de muitas formas diferentes.

Obs.: O Data Warehouse pode ser considerado como uma coleção de dados orientada
por assunto, integrada, não volátil, variante no tempo, que dá apoio às decisões
da administração.

DATA LAKE
O Data Lake é um repositório centralizado que permite armazenar TODOS os dados
estruturados e não estruturados em qualquer escala. Pode-se armazenar os dados
como estão na fonte, sem ter que primeiro estruturá-los e executar diferentes tipos de
análises – de painéis e visualizações a processamento de Big Data, análises em tempo real
e aprendizado de máquina para orientar melhores decisões.
Para o DW normalmente utilizamos ETL (Extração, Transformação e Carga).
Para o Data Lake normalmente usamos ELT (Extração, Carga e Transformação).

DATA STORE
Um Data Store é um repositório para armazenar e gerenciar de forma persistente
coleções de dados que incluem não apenas dados estruturados, mas também tipos
de armazenamento variado, como documentos, dados no formato chave-valor, filas de
mensagens e outros formatos de arquivo (DATASCIENCEACADEMY, 2022).
DATA LAKEHOUSE
Cada vez mais vemos a evolução de uma arquitetura híbrida que está sendo chamada de Data
Lakehouse (DATASCIENCEACADEMY, 2022).

A ideia fundamental dessa arquitetura é pegar os melhores conceitos dos modelos de Data
Warehouse e Data Lake e juntá-los enquanto tenta eliminar os piores conceitos de ambos os
modelos (DATASCIENCEACADEMY, 2022)!

Os Data Lakehouses permitem que estruturas e esquemas como os usados em um Data Warehouse
sejam aplicados aos dados não estruturados do tipo que normalmente seria armazenado em um Data
Lake. Isso significa que os usuários de dados podem acessar as informações mais rapidamente e
começar a colocá-las em prática

BIG DATA ANALYTICS


• É o trabalho analítico e inteligente de grandes volumes de dados, estruturados ou não estruturados,
que são coletados, armazenados e interpretados por softwares de altíssimo desempenho
• É um termo que se refere à análise desses conjuntos grandes e complexos de dados
estruturados e não estruturados. São utilizados ferramentas e equipamentos de alta performance,
muitas vezes com o auxílio de computação distribuída (utilizando várias máquinas em um trabalho
coordenado).
• Trata-se do cruzamento de uma infinidade de dados do ambiente interno e externo, gerando uma
espécie de “bússola gerencial” para tomadores de decisão. Tudo isso, é claro, em um tempo de
processamento extremamente reduzido
Obs.: O termo Big Data Analytics refere-se aos poderosos softwares que tratam dados
estruturados e não estruturados para transformá-los em informações úteis
às organizações, permitindo-lhes analisar dados, como registros de call center,
postagens de redes sociais, de blogs, dados de CRM e demonstrativos de resultados.

TIPOS DE ANÁLISE NO BIG DATA

5 V’s do Big Data


APACHE SPARK
Estatística

• população: Uma POPULAÇÃO é um conjunto que contém TODOS OS INDIVÍDUOS,


OBJETOS OU ELEMENTOS a serem estudados, que apresentam uma ou mais
características em comum.

• Amostra: Uma AMOSTRA é um SUBCONJUNTO EXTRAÍDO DA POPULAÇÃO para


análise, devendo ser representativo daquele grupo.

• Unidade amostral: é cada elemento pertencente à amostra.

• Censo: O CENSO, ou recenseamento, é um estudo dos dados relativos a TODOS os


elementos de uma população

• Amostragem: A AMOSTRAGEM é um processo que consiste na SELEÇÃO CRITERIOSA


dos elementos a serem submetidos à investigação.

•Estatística (ou estimador): As ESTATÍSTICAS são MEDIDAS NUMÉRICAS OBTIDAS DE


AMOSTRAS representativas extraídas da população.

Existem dois ramos importantes da estatística, conhecidos como Estatística Descritiva e


Estatística Inferencial.

A Estatística Descritiva tem por objetivo extrair uma amostra da população por meio das
técnicas de amostragem.

A Estatística Inferencial, por sua vez, tem o objetivo contrário: ela busca utilizar uma amostra
representativa de uma população para inferir sobre as características da população inteira.
MÉTODO EXPERIMENTAL X MÉTODO ESTATÍSTICO
MÉTODO EXPERIMENTAL consiste em manter constantes as causas (fatores), com exceção
de uma, que é variada para que seus efeitos sejam descobertos
MÉTODO ESTATÍSTICO admite e registra todas as possíveis variações das causas
presentes, procurando determinar a influência de cada fator no resultado final

DA
DO
S
ESTATÍSTICOS
a) dados univariados: quando uma única observação de cada indivíduo é registrada. Por exemplo:
peso;
b) dados bivariados: quando duas observações de cada indivíduo são registradas. Por exemplo:
peso e altura;
c) dados multivariados: quando mais duas observações acerca de cada indivíduo são registradas.

Por exemplo: peso, altura, sexo e idade.


Quanto à forma de apresentação, os dados podem ser classificados em dados brutos ou rol.

VARIÁVEIS ESTATÍSTICAS
As variáveis estatísticas podem ser classificadas, inicialmente, em duas categorias:
qualitativas e quantitativas.
Variáveis Estatísticas
• variáveis qualitativas: não podem ser mensuradas numericamente e se baseiam em
qualidades.
• ordinais: podem ser ordenadas.
• Nominativas: não podem ser hierarquizadas ou ordenadas, não admitindo, portanto,
nenhuma comparação do tipo menor ou maior. Podem ser comparadas apenas por igualdade
ou diferença.

• Variáveis quantitativas: são aquelas que podem ser mensuradas numericamente.


• discretas: o conjunto de possíveis resultados é enumerável.
• Contínuas: podem assumir qualquer número real, inclusive, números fracionais e
irracionais.
Escala de Mensuração (prof Jhon Zini)

Dados Brutos
Os dados brutos são aqueles que não foram numericamente organizados em ordem crescente
ou
decrescente, ou seja, estão na forma como foram coletados

Rol
O rol é a organização dos dados brutos em ordem de grandeza crescente ou decrescente
Dados Categorizados x Dados em Tabela
Um dado em categoria quando os valores da variável aleatória são fornecidos na forma de
uma faixa de valores, não na forma de um valor específico. Por exemplo, o salário é de 1 a 3
salários mínimos.

No caso de dados em categorias, deve-se utilizar:

• média aritmética: técnica do ponto médio;


• mediana: interpolação linear;
• moda: fórmula da Moda Bruta, de Czuber, de King ou de Pearson

Você também pode gostar