Escolar Documentos
Profissional Documentos
Cultura Documentos
Embora haja uma enorme variedade de fontes para conjuntos de dados, em muitos
casos, principalmente em empresas, os dados serão armazenados em um banco de dados
relacional.
Observe que cada RDBMS usa um tipo de SQL ligeiramente diferente, portanto, o
código SQL escrito para um, geralmente não funcionará em outro sem modificações,
como sintaxes de busca ou limitação.
Os conceitos, estruturas e operações são, em grande parte, idênticos. Normalmente
os comandos como: SELECT, JOIN e afins costumam ser os mesmos.
Isso significa que, para um analista de dados ativo, um forte entendimento do SQL é
extremamente importante.
Saber usar Python e SQL juntos lhe dará ainda mais vantagens quando se trata de
trabalhar com seus dados.
Primitivos
Caracterizam-se por serem indivisíveis.
Temos exemplos nos inteiros, nos tipos reais, caracteres e nos tipos booleanos;
Isso significa que esse tipo de dado apresenta alguma forma de organização,
estrutura; portanto, é chamado de dado estruturado, pois faz parte de uma estrutura
de dados.
Dados estruturados estão presentes nos bancos de dados, no padrão que estabelece um
grupo de regras para a codificação de documentos chamado de XML (eXtensible Markup
Language),
no sistema CVS (Concurrent Version System), nas formatações JSON (Javascript Object
Notation), entre outros.
Outros tipos de dados chamados de tipos abstratos de dados ou TADs têm estrutura
capaz de representar tipos de dados que não foram previamente estabelecidos no core
das linguagens de programação.
O elemento software atua entre o lado físico do banco e o lado dos usuários. A
camada de software é muitas vezes chamada de SGBD (Database Management System), que
além de gerenciar as solicitações de acesso dos usuários ao banco, os isola de
aspectos da camada de hardware, ou seja,
o SGBD fornece abstração ao usuário com acesso a um nível superior, acima da camada
física.
Na prática, o SGBD é um conjunto de componentes de software que possibilitam aos
usuários interagir com o banco de dados.
- Atomicidade: Todas as operações em um banco de dados devem ser tratadas como uma
única unidade indivisível. Ou seja, todas as alterações em uma transação devem ser
executadas com sucesso ou nenhuma delas deve ser executada.
- Consistência: O banco de dados deve garantir que apenas transações válidas sejam
aceitas. Isso significa que todas as regras e restrições definidas no esquema do
banco de dados devem ser aplicadas corretamente.
Agora que você conheceu o modelo de dados relacional, vamos apresentar os bancos de
dados NoSQL, ou banco de dados não-relacional.
Esse tipo de banco utiliza diversos modelos de dados para interagir e acessar seus
dados. São bancos que trabalham com aplicações que exigem modelos com grande número
de dados, como nos Big Data.
Flexibilidade
Escalabilidade
Alta performance
Elevada funcionalidade
Podem prover tanto APIs quanto tipos de dados com alto grau de funcionalidade,
concebidos especificamente para se relacionar com cada um de seus modelos de dados.
Bancos não relacionais são vantajosos nos seguintes aspectos:
Graph stores
São bancos que possibilitam manter um tamanho mínimo para o armazenamento, com
maior profundidade de dados se comparado a outros tipos de bancos.
Column stores
São tipos de bancos de dados que funcionam com o conceito de keyspace, que pode ser
entendido como uma estrutura no modelo relacional.
Document stores
Os documentos se caracterizam por meio de uma organização sem esquemas, ou seja, os
registros não necessitam de uma estrutura uniforme.
O SQL (Structured Query Language) pode ser definido, de modo genérico, como um
artefato de software utilizado para armazenar, organizar, gerenciar e recuperar
dados ou informações contidas em um banco de dados.
Este comando requer cuidado, pois vai consumir muitos recursos no sistema, podendo
prejudicar outras aplicações. O administrador deverá agendar este tipo de checagem
para um momento oportuno (madrugadas, finais de semana), evitando executá-lo
comando durante os períodos de produção.
Para uma checagem mais rápida, que vai verificar somente a estrutura física do
banco de dados:
Os bancos SQLite são gravados em seu computador ou em sua rede em um único arquivo
de disco, e a biblioteca SQLite manipula esses arquivos diretamente no arquivo do
banco de dados gravado no disco.
C1 → C3
C3 → C4
C2 → C5
De fato, se C1 determina C3, temos então uma dependência parcial da chave primária,
o que é proibido na 2FN. Como cada FN, a partir da segunda, depende da anterior, a
relação R atende à 1FN.