Você está na página 1de 4

O que é um arquivo?

Um arquivo é, de forma genérica, um conjunto de dados relacionados entre si. Juntos descrevem
uma informação ou um conjunto de informações.
Arquivos são sempre formados por dados digitais, organizados seguindo algum tipo de estrutura
(ou formato). Arquivos podem representar informações das mais diversas naturezas, como
imagens, áudio, texto, instruções para processadores e programas, podendo inclusive representar
uma combinação desses tipos, como por exemplo um vídeo, que contém informações gráficas (a
imagem), sonoras (o áudio) e textuais (a legenda).
Os arquivos estão disponíveis para um ou mais programas de computador, sendo essa relação
estabelecida pelo tipo de arquivo, identificado pela extensão recebida no ato de sua criação ou
alteração.
Objetivamente, um arquivo possui então pelo menos três características que as definem: nome
(nome é o rótulo do arquivo, ao se escolher um nome para o arquivo é recomendável evitar o
uso de caracteres especiais), tipo (extensão) e tamanho. Há outras referências e atributos, como
momento da criação e identificação do criador.
Diretórios (ou Pastas)
São locais em mídias de armazenamento de dados, não consomem espaço físico apenas por sua
existência, seu tamanho é a soma de seus arquivos contidos. Um diretório contém informações
que permitem acessar ao arquivo. Um sistema computacional precisa lidar com milhares de
arquivos. Desta forma, existem centenas de diretórios para organizar esses arquivos. Assim os
próprios diretórios são também organizados em grupos, numa estrutura hierárquica, facilitando
a recuperação de diretórios por usuários.

Organização hierárquica significa que diretórios também são organizados em conjuntos por
meio de outros diretórios.

Tipos de Arquivos – Extensão


A extensão de um arquivo é composta por um conjunto de três a quatro letras precedias por um
ponto final. Esse conjunto de letras identifica a natureza de tal arquivo, assim o Sistema
Operacional sabe qual o software adequado para fazer a edição ou leitura dos dados
armazenados. Dependendo do tipo de arquivo, a edição pode ser feita por mais de um software,
ao se clicar duas vezes sobre o ícone do arquivo o Sistema Operacional escolhe a partir da
definição de software padrão para determinada aplicação, como por exemplo em
“MeuTexto.txt” (txt é uma extensão para arquivos de texto sem formatação).
Considerando o ambiente Windows, o software padrão para a edição e leitura de arquivos txt é o
Bloco de Notas, mas poderia ser facilmente lido e editado pelo Microsoft Word. Para que essa
edição fosse possível pelo word, basta utilizar o comando “Abrir” e fazer acesso ao arquivo.
Além de textos, diferentes tipos de informação podem ser armazenados em um arquivo:
programas fonte e objeto, dados números, registros, som, imagem, etc. Cada arquivo possui uma
estrutura interna, conforme sua aplicação. O arquivo texto é uma sequência de caracteres
organizados em linhas e parágrafos, um arquivo executável é uma sequência de bytes
representando comandos de uma linguagem de programação.
Uma questão importante é até que ponto o SO deve conhecer a estrutura interna dos arquivos.
Para ter esse conhecimento, o SO vai ser maior e mais complexo. Além disso, para evoluir,
deverá permitir a definição de novos tipos de arquivos, uma vez que novas aplicações podem
expor novas demandas, e com elas, tipos de arquivos diferentes. Isto inviabiliza a pretensão de
conhecer a estrutura interna dos arquivos na prática. Em geral, o conhecimento do SO se limita
às informações contidas no registro descritos do arquivo. Isto já lhe permite bloquear algumas
operações inválidas. Por exemplo, pode recusar-se a imprimir um programa executável.
O ponto como separador entre nome e extensão era padrão no Sistema Operacional MS DOS. O
ponto era um caractere especial que separava o nome da extensão. Hoje em dia, essa limitação
não existe mais nos sistemas da MicroSoft, porém todas as variantes de Windows ainda
procuram manter o conceito de extensão de nome. Hoje a extensão não é limitada a três
caracteres e o ponto não é mais um caractere especial, o que gera alguns problemas.
Em outros sistemas operacionais, como o Linux, o ponto nunca teve significado especial e as
extensões de nomes não são incentivadas (apesar de serem quase sempre usadas).

Sistemas Baseados em Fita


Os primeiros sistemas eram baseados em fita magnética. No início, cada arquivo era mapeado
para uma única fita. Isso ocasionava um enorme desperdício de espaço, porque cada fita (de
2400 pés, cerca de 750m) era capaz de armazenar 5 gigabytes, mas a maioria dos arquivos era
pequena (alguns Kb). Por outro lado, havia o problema dos arquivos muito grandes, que
poderiam superar a capacidade de uma única fita.
O problema dos arquivos grandes foi resolvido com o sistema de armazenamento multi-volume.
O desperdício de espaço foi resolvido permitindo a gravação de diversos arquivos em uma única
fita. Como resultado, passou a ser necessário saber em que posição da fita cada arquivo estava
armazenado. A solução foi adicionar à fita um diretório, onde cada entrada continha um nome
de arquivo e sua posição na fita. Tais diretórios também armazenavam informações adicionais
sobre os arquivos.
Sistemas Baseados em Disco
Muitos dos problemas dos sistemas de fita foram resolvidos com os sistemas baseados em
discos. Um disco é dividido em trilhas, sendo o número de trilhas uma característica particular
de cada dispositivo. Cada trilha é dividida em setores, sendo o setor a menor unidade de
informação que pode ser lida ou escrita no disco. Unidades de disco fixo usualmente possuem
diversos discos superpostos, cada um com duas faces magnetizadas, o que corresponde a
diversas superfícies de gravação (a tecnologia atual permite sobrepor até 8 discos). Para acessar
um determinado setor do disco é necessário informar: face, trilha e setor. As cabeças de leitura e
gravação são deslocadas até a trilha correta (tempo de seek), chaveadas eletronicamente para a
face correta e então esperam até que o setor solicitado passe por baixo (tempo de latência). Um
cilindro é o conjunto de trilhas que estão na mesma posição, porém em diferentes faces. Não é
necessário deslocar as cabeças para acessar trilhas de um mesmo cilindro.
Usualmente, o SO trata o disco como um grande vetor unidimensional de blocos, cada bloco
correspondendo a um setor. Esses blocos são numerados desde 0 até N-1, onde N é o número de
setores do disco.
A vantagem do disco em relação as fitas é a possibilidade de acessar facilmente qualquer setor
a qualquer momento. A fita impõe um acesso estritamente sequencial. O acesso também é mais
rápido no disco.
Assim como nas fitas, e por mais forte razão, os discos também possuem um diretório,
indicando em que posições se encontram os arquivos. O diretório é armazenado no próprio
disco, permitindo que o disco seja removido e utilizado mais tarde, sem que os nomes dos
arquivos sejam perdidos. Na verdade, cada entrada de diretório contém todas as informações
necessárias sobre o arquivo, constituindo o que se denomina registro descritor de arquivo.
Operações em arquivos
O sistema de arquivos é uma abstração para as memórias secundárias do computador: discos,
fitas, CDs. Há uma hierarquia de diretórios e cada diretório pode conter arquivos.
Há o sistema de ficheiros, frequentemente feito em HDD’S e SSD’S. Essa organização é um
sistema operativo que guarda os dados nos espaços vazios do disco, etiquetando-os com um
FCB (File Control Block) e ainda cria uma lista com a posição deste dado, chamada de MFT
(Master File Table). Sabendo a posição do ficheiro a ser aberto/gravado, o sistema operativo
solicita a leitura deste, decodifica/codifica e realiza a abertura/gravação do dado.
Um sistema de ficheiro é uma forma de criar uma estrutura lógica de acesso a dados numa
partição. Sendo assim, também é importante referir que nunca poderá ter dois ou mais tipos de
sistemas ficheiros numa mesma partição.
A seguir é considerado o que o SO deve fazer para realizar as diversas operações sobre arquivos
(supondo um sistema baseado em disco):
- Criar um arquivo: dois passos são necessários, (a) encontrar e alocar espaço suficiente no disco
para conter o arquivo (isto é, os dados do arquivo) e (b) adicionar uma entrada no diretório para
conter os atributos do arquivo (nome, tamanho, localização, etc.).
- Escrever registro no arquivo: para escrever em um arquivo, o usuário executa uma chamada de
sistema fornecendo o nome do arquivo e o bloco com a informação a ser escrita. O sistema
procura no diretório, através do nome, a localização do arquivo no disco e a posição do ponteiro
que indica o final do arquivo (onde deve ser escrito o próximo bloco).
- Ler próximo registro do arquivo: o usuário executa uma chamada de sistema passando como
parâmetros o nome do arquivo e a posição na memória principal para onde as informações lidas
devem ser copiadas. Novamente, o sistema procura no diretório a entrada correspondente, lê do
disco e atualiza o ponteiro indicador de próximo registro a ser lido.
- Remover o arquivo: para remover o arquivo, primeiramente o diretório é pesquisado. A seguir,
o espaço alocado é liberado e a entrada correspondente é removida do diretório.
- Reposicionar o arquivo: esta operação não envolve I/O de fato, pois consiste em localizar a
entrada no diretório correspondente ao arquivo e modificar o valor do ponteiro indicador do
próximo registro a ser acessado.
Todas as operações mencionadas acima envolvem uma pesquisa no diretório em busca
da entrada correspondente ao arquivo desejado. Para evitar esta pesquisa constante no disco,
muitos sistemas abrem o arquivo quando ele começa a ser utilizado. Abrir o arquivo significa
trazer para a memória o seu registro descritor.
Referencias Bibliográficas

https://infomatao.wordpress.com/2011/03/03/o-que-sao-arquivos-de-computador/

Oliveira, Rômulo Silva de, Carissimi, Alexandre da Silva e Toscani, Simão Sirineo. Sistemas
Operacionais. Editora SagraLuzzatto, ISBN 85-241-0643-3, Santa Catarina -SC 2001.

https://www.portaleducacao.com.br/conteudo/artigos/esporte/arquivo-de-computador/17715

http://algol.dcc.ufla.br/~bruno/aulas/arquivos-e-diretorios.html

https://www.inf.pucrs.br/~emoreno/undergraduate/CC/sisop/class_files/Aula13.pdf

http://www.clickti.com.br/blog/backup-em-fita-ou-backup-em-disco.html
https://pt.wikipedia.org/wiki/Sistema_de_ficheiros
http://www.facom.ufu.br/~madriana/EBD/slide-arquivos.pdf
http://gigacom.servehttp.com/gct/index.php/2017/11/07/sistemas-de-ficheiros/