Você está na página 1de 8

Joelan Vieira Moreira ¹

Nilvan da Cruz santos ²


Carlos Manoel da Cruz Santos ³
Francisco Figueiredo de Lima Filho 4
Élvis da Silva Steinbach 5

BANCO DE DADOS: A normalização em análise


de dados

Centro Universitário Leonardo da Vinci – UNIASSELVI

Análise e desenvolvimento de sistemas (FLC15241ADS) – 07/12/23

1. INTRODUÇÃO

Este trabalho científico tem como objetivo explorar o conceito de normalização em


análise de dados no contexto de bancos de dados, demonstrando sua importância na
organização e estruturação dos dados para a tomada de decisões informadas e a eficiência de
sistemas de informação baseados em bancos de dados. Este estudo aprofundará os princípios
da normalização e sua aplicação prática em bancos de dados, destacando sua relevância na
obtenção de resultados precisos e na melhoria da qualidade dos dados armazenados e
processados em sistemas de gerenciamento de bancos de dados.

2. FUNDAMENTAÇÃO TEÓRICA

De acordo com Carlos A. Heuser (1985), a normalização de dados é um


procedimento cuja finalidade é agrupar informações de modo a eliminar possíveis
redundâncias de dados que podem existir nos arquivos, desempenhando um papel
fundamental na otimização da gestão de informações e na garantia de que as informações
sejam armazenadas de maneira mais eficaz e organizada.

Através da normalização, é possível construir uma base sólida, removendo


redundâncias de dados em um banco de dados. Isso é essencial para manter a integridade,
consistência e eficiência ao lidar com dados. Além disso, a organização resultante desse
processo simplifica a escalabilidade para a adição de novos dados e facilita a atualização
desses registros.

Na literatura, o tópico normalização também é conhecido como formas normais. A


normalização apresenta diversos níveis, que variam em uma escala numérica. No
mundo dos concursos, a cobrança varia da 1ª. até a 5ª. forma normal. Quando
menor o nível, menos normalizado o modelo está (NEVES, 2022).

Embora Edgar F. Codd tenha proposto cinco formas normais, as três primeiras (1NF, 2NF e
3NF) são mais comumente aplicadas na prática, pois geralmente são suficientes para garantir
a eficiência e a integridade dos bancos de dados relacionais. As formas normais superiores,
como a 4ª e a 5ª forma normal, podem exigir um esforço adicional de complexidade no
projeto do banco de dados, e sua aplicação nem sempre resulta em benefícios claros que
justifiquem essa complexidade extra.

Segundo Romano (2011), às etapas de normalização em bancos de dados seguem uma


abordagem sequencial verificando a conformidade com as Formas Normais de maneira
progressiva, começando pela Primeira Forma Normal (1FN) e avançando para a Segunda
Forma Normal (2FN), e assim sucessivamente.

"1ª Forma Normal (1FN): toda relação deve ter uma chave primária e deve-se garantir que
todo atributo seja atômico."(ARAUJO, 2008, p. 37).
Figura 1- Tabela na primeira forma.

FONTE: Elaborada pelo autor.

Foi estabelecida uma chave única "id" para identificação exclusiva de cada funcionário. Em
vez de armazenar tanto a idade quanto a data de nascimento, optou-se por manter apenas a
"idade" ,eliminando a redundância de dados.
Além disso, o campo "endereço", que era composto por múltiplas informações, foi dividido
em novas colunas separadas para facilitar a gestão de dados individuais, como bairro, cidade
e estado.
Essas mudanças buscam simplificar a estrutura do banco de dados, tornando-a mais eficiente
e organizada, seguindo as diretrizes da Forma 1.

"Diz-se que uma tabela está na segunda forma normal se estiver


na primeira forma normal e TODOS os atributos dependerem da chave por
completo."(FERRY, 2013, p. 44)

Figura 2- Tabela na segunda forma.


FONTE: Elaborada pelo autor

A tabela atual apresenta um erro de dependencia parcial, onde a maioria das informações
está devidamente associada a chave composta,sendo às identificações 'ID_EMPREGADO' e
'ID_PROJETO' parte desta chave. O campo 'VERBA' está ligado apenas a 'ID_PROJETO',
violando os padrões de normalização de banco de dados, uma vez que 'VERBA' deveria se
relacionar tanto com 'ID_PROJETO' quanto com 'ID_EMPREGADO'.

A solução proposta envolve a segmentação da tabela em duas entidades diferentes. Uma


delas conteria dados referentes aos empregados e aos projetos, excluindo, no entanto, o
campo 'VERBA'. A segunda entidade seria especificamente dedicada ao campo 'VERBA',
assegurando sua conexão correta com ambas as identificações, ID_PROJETO e
'ID_EMPREGADO'. Essa abordagem alinha os dados de maneira consistente, garantindo sua
integridade e conformidade com as práticas de normalização de bancos de dados.

“Uma tabela está na 3FN (Terceira Forma Normal) quando, além de estar na 2FN
(Segunda Forma Normal), não contém dependências transitivas."(ALEXANDRUK, 2011, p.
39)

.
Figura 3- Tabela na terceira forma

FONTE: Elaborada pelo autor

O erro identificado é uma questão de dependência transitiva na estrutura da tabela. No


exemplo acima, a coluna ‘ID_EMPREGADO’ é uma chave primária. De acordo com os
princípios normais de estruturação de bancos de dados, todos os elementos que não são
chaves primárias devem ser dependentes das chaves primárias. No entanto, nesta situação,
todos os campos, exceto o atributo ‘VERBA’, estão dependentes da chave primária
‘ID_EMPREGADO’, o que está correto. O problema surge porque o atributo ‘VERBA’ está
dependente somente da ‘ID_PROJETO’,que por sua vez depende do ‘ID_EMPREGADO’
criando uma situação de dependência transitiva.

A dependência transitiva acontece quando um pedaço de informação (um atributo que não é
a chave principal) está ligado a uma parte da identificação única de um registro (a chave
primária) em vez de estar diretamente ligado ao conjunto completo dessa identificação.

Para resolver essa questão, é recomendável criar outra tabela na qual o atributo 'VERBA' e
sua dependência, ou seja, o relacionamento com ‘ID_PROJETO’, sejam armazenados
separadamente. Isso resultaria na divisão da tabela atual em duas.

A normalização vem assumindo uma importância crescente para a


competitividade das empresas, levantando novos desafios para a atividade (CNI,
2002).

A normalização proporciona uma série de vantagens essenciais, incluindo a redução de


redundâncias de dados, garantia de integridade e consistência, facilitação na manutenção e
melhoria no desempenho das consultas. Além disso, ela simplifica a análise de dados,
promovendo uma estrutura organizada e eficiente para armazenar informações, tornando
mais fácil o gerenciamento e uso dos dados ao longo do tempo.

"Todavia, nem tudo é vantagem. Ao adotar a redundância controlada, troca-se a agilidade na


escrita pela agilidade na leitura."(ROB; CORONE, 2010)

Segundo Rezende (2012), a situação em que uma tabela demanda a junção excessiva de
outras para recuperar informações simples é denominada de "normalização em excesso".
Nesses casos, a desnormalização é uma alternativa viável, especialmente quando a
fragmentação extrema dos dados compromete a eficiência no acesso às informações.

“O processo de desnormalização de banco de dados nada mais é do que o processo contrário


da normalização.” (FELIPE; LOPES, 2013, p. 28)

A desnormalização é comumente aplicada em cenários onde a velocidade de acesso aos


dados é mais prioritária do que a economia de espaço de armazenamento. Essa prática pode
incluir a fusão de tabelas, a inserção de informações duplicadas ou a adoção de estruturas
menos normalizadas para simplificar as consultas, visando aprimorar o desempenho do
banco de dados durante operações de leitura.

Há momentos em que se considera a desnormalização das tabelas como uma estratégia para
reduzir as operações de entrada e saída, enquanto se busca aumentar a eficiência no
processamento de dados (CENGAGE, 2011, p. 194).

3. RESULTADOS E DISCUSSÕES

Como resultado final deste trabalho podemos entender que a normalização desempenha um
papel crucial na redução da redundância dos dados em bancos de dados. Isso pode levar a
uma economia significativa de espaço de armazenamento e à melhoria da consistência dos
dados.

Além da economia de espaço e da melhoria da consistência dos dados, a normalização


desempenha um papel fundamental na simplificação da manutenção e da atualização do
banco de dados. A estruturação adequada dos dados, por meio de níveis de normalização,
permite que as alterações sejam realizadas com mais eficiência e com menor impacto em
toda a base de dados. Isso é particularmente relevante em ambientes de TI em constante
evolução, onde os requisitos do sistema e as demandas dos usuários podem mudar com o
tempo. Ao garantir que os dados estejam organizados e relacionados de maneira lógica, a
normalização ajuda a manter a agilidade do sistema, tornando-o mais adaptável às
necessidades em constante mudança.

Em casos onde a obtenção de respostas mais rápidas é prioritária, a desnormalização pode


ser uma estratégia viável. Ela proporciona um aumento significativo na velocidade de acesso
aos dados. Isso ocorre ao introduzir uma quantidade controlada de redundância nos dados,
simplificando a estrutura do banco de dados e reduzindo a complexidade das consultas.

3. METODOLOGIA

Este trabalho científico adota uma abordagem qualitativa, com a pesquisa bibliográfica como
o método principal de coleta de dados. A pesquisa concentra-se na análise crítica e na
consulta de uma ampla gama de livros e fontes bibliográficas relevantes. Através da revisão
e síntese dessas fontes, nosso objetivo é adquirir informações substanciais que sustentem
nossas pesquisas e análises. Assim, a ênfase deste estudo está na pesquisa bibliográfica como
a principal fonte de informação e embasamento teórico.

5. REFERÊNCIAS

ALEXANDRUK, Marcos. Modelagem de banco de dados - Normalização:formas normais.


WordPress, 2013. Disponível em:
https://profandreagarcia.files.wordpress.com/2018/06/banco_de_dados_-_normalizac3a7c3a
3o.pdf. Acesso em: 16 nov. 2023.

ARAÚJO, M. A. P. Modelagem de dados - teoria e prática. Saber Digital: Revista


Eletrônica CESVA, Valença, v. 1, n. 1, p. 33-69, mar./ago. 2008

CNI, Normalização: Conhecendo e aplicando na sua empresa. 2. ed. Brasília, 2002. 71 p.

FERRY, F. O. M. Fundamentos de banco de dados Edição . Teresina : EDUFPI/CEAD, 2013.

HEUSER, C. A. Projeto de banco de dados : Volume 4 da Série Livros didáticos informática


UFRGS. 3 ed. Sagra Luzzatto, v. 4, 1998. 216 p.

NEVES, C. S. F. Banco de Dados descomplicado: Resumo de normalização ou formas


normais. São Paulo, 2022. Disponível em:
https://www.estrategiaconcursos.com.br/blog/banco-dados-forma-normal/. Acesso em: 16
nov.2023.

REZENDE, Ricardo. Normalização e desnormalização de dados - Parte 1: Conhecendo as


formas normais. SQL Magazine: Desnormalizar para Otimizar, Rio de Janeiro: DevMedia,
v.9, n. 99, p. 14-19, abr.2012.

ROB, Peter; CORONEL, Carlo. Sistemas de banco de dados: Projeto, implementação e


administração. Normalização das tabelas do banco de dados. 1° edição. Cengage Learning,
26 fev. 2010.

ROMANO, S. M. V. Banco de dados I. São Paulo: FATEC, 2013. 154 p.

ZUCOLOTO, F. L.; LOPES, W. P. Avaliação de desempenho de bancos de dados


utilizando práticas de normalização e desnormalização. Orientador: Alexandre
Romanelli. 2013. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de
Informação) - Faculdade do Espírito Santo, Cachoeiro de Itapemirim, 2013. 67p.

Você também pode gostar