Você está na página 1de 36

Los datos:

conceptos
introductorios
Rafael Camps Par
PID_00171666

FUOC PID_00171666

Ninguna parte de esta publicacin, incluido el diseo general y la cubierta, puede ser copiada,
reproducida, almacenada o transmitida de ninguna forma, ni por ningn medio, sea ste elctrico,
qumico, mecnico, ptico, grabacin, fotocopia, o cualquier otro, sin la previa autorizacin escrita
de los titulares del copyright.

Los datos: conceptos introductorios

Los datos: conceptos introductorios

FUOC PID_00171666

ndice

Introduccin...............................................................................................

Objetivos.......................................................................................................

1.

Los tres mundos: el real, el conceptual y el de las


representaciones.................................................................................

1.1.

La realidad: los objetos ...............................................................

1.2.

Las concepciones: la informacin ..............................................

1.3.

Las representaciones: los datos ...................................................

1.4.

La interpretacin .........................................................................

10

El mundo conceptual: entidades y atributos.............................

11

2.1.

La informacin: expresin lingstica ........................................

11

2.2.

Entidades, atributos y valores .....................................................

11

2.3.

El tiempo .....................................................................................

13

2.4.

Dominios y valores nulos ...........................................................

15

2.5.

Identificadores y claves ...............................................................

15

2.6.

Atributos multivalor ....................................................................

16

2.7.

La entidad: instancia y tipo ........................................................

17

El mundo de las representaciones.................................................

19

3.1.

La representacin tabular ...........................................................

19

3.2.

Ficheros, registros y campos .......................................................

20

3.3.

Bases de datos .............................................................................

21

3.4.

El registro fsico y los soportes ...................................................

23

3.5.

Organizacin ...............................................................................

24

3.6.

Acceso a los datos .......................................................................

25

3.7.

Nivel lgico y nivel fsico ...........................................................

26

La memoria persistente....................................................................

28

4.1.

Justificacin de la utilizacin de la memoria persistente ............

28

4.2.

Esquema de la E/S .......................................................................

28

4.3.

Tiempo de acceso ........................................................................

29

4.4.

Caractersticas bsicas de los soportes ........................................

31

Resumen.......................................................................................................

32

Ejercicios de autoevaluacin..................................................................

33

Solucionario................................................................................................

34

2.

3.

4.

Los datos: conceptos introductorios

FUOC PID_00171666

Glosario........................................................................................................

35

Bibliografa.................................................................................................

36

FUOC PID_00171666

Introduccin

Los datos que se utilizan en los sistemas de informacin (SI) se acostumbran


a almacenar en bases de datos (BD). Para poder hablar y razonar con cierta propiedad sobre las BD, nos convendr tener claro qu son los datos y la
informacin, abstracciones que los informticos representamos fsicamente
sobre dispositivos de almacenamiento externo no voltil. Con este objetivo,
tendremos que adquirir algunas nociones tericas fundamentales y disponer
de herramientas formales en las que basarnos.
En este mdulo didctico estudiaremos los elementos bsicos del mundo de las
representaciones informticas, y su correspondencia con el mundo real y con
el mundo de las abstracciones. Introduciremos los trminos ms habituales y
los conceptos fundamentales sobre datos e informacin, que utilizaremos en
el resto de la asignatura para estudiar las BD.

Los datos: conceptos introductorios

FUOC PID_00171666

Objetivos

En los materiales didcticos de este mdulo, el estudiante encontrar las herramientas indispensables para alcanzar los siguientes objetivos:

1. Saber situar los trminos bsicos ms habituales en el campo de los datos


y la informacin (atributo, clave, entidad, fichero, base de datos, soporte,
etc.) en el marco terico construido en la asignatura.
2. Saber distinguir claramente el mundo de las representaciones sobre soportes fsicos informticos del mundo de las concepciones o abstracciones.
3. Poder enumerar los tipos bsicos de acceso a los datos y ver los sistemas
de organizacin como medios para hacerlos eficientes.
4. Entender que las representaciones informticas se pueden estudiar desde
un nivel o punto de vista puramente lgico, alejado de la realizacin fsica
(implementacin), o bien desde un nivel fsico. En esta asignatura adoptaremos bsicamente un punto de vista lgico.
5. Ser capaz de describir y evaluar las caractersticas bsicas de los soportes
de las memorias persistentes para el almacenamiento de datos.

Los datos: conceptos introductorios

FUOC PID_00171666

Los datos: conceptos introductorios

1. Los tres mundos: el real, el conceptual y el de las


representaciones

Para tener un marco donde situar los trminos y los conceptos que explicaremos en la asignatura, distinguiremos tres mbitos diferentes:

El mundo real con los objetos de nuestro inters.

El mundo de las conceptualizaciones lgicas.

El mundo de las representaciones informticas.

Figura 1.

1.1. La realidad: los objetos


Para analizar o construir un sistema de informacin (SI)1 determinado, necesitamos conocer el mundo real al que este SI debe hacer referencia o modelizar; as, nuestro mundo real podr ser un hospital, una empresa distribuidora
de productos alimenticios, la matriculacin de los estudiantes de una universidad, etc.

(1)

Un SI recoge, almacena y distribuye informacin sobre el estado


de un dominio.

FUOC PID_00171666

Ejemplos de objetos concretos


El enfermo Juan Garca,la cama 34 de la segundaplanta, el almacn de Soria,el camin B
3452 AG, la alumna Mara Pi, la asignatura Qumica I, la enfermedad meningitis, la
devolucin de un pedido concreto, un determinado accidente de trfico, etc. son algunos
ejemplos de objetos que pertenecen al mundo real.

El mundoreal, la parte de la realidad que nos interesa, es lo que percibimos con nuestros sentidos y est compuesto por objetos concretos,
fsicos o no.

1.2. Las concepciones: la informacin


A partir de la observacin del mundo real, los humanos somos capaces de deducir conocimientos e informacin. La observacin de los objetos del mundo
real nos conduce a su anlisis y su sntesis; despus, obtenemos abstracciones
de ello, hacemos clasificaciones (podemos saber que dos objetos son de la misma clase a pesar de que sean diferentes), deducimos propiedades e interrelaciones, etc.
De la observacin obtenemos la informacin
La observacin del campo de la matriculacin en una universidad nos permitereconocer
diferentes claseso tipos de objetos, como por ejemplo el estudiante o la asignatura. Deducimos que todo estudiante tendr las propiedades (son abstracciones) fecha de nacimiento,
DNI, nombre, etc., y de este modo obtenemos informaciones como las siguientes: el estudiante de nombre Juan Garca tiene el DNI 34.567.854 y su ao de nacimiento es 1979.

El conjunto de los conocimientos obtenidos a partir de la observacin


de un mundo real se denomina mundoconceptual o mundodelas
concepciones. En la esfera de las concepciones construimos un modelo
abstracto, conceptual, del mundo real, y esto nos ayuda a razonar y a
expresarnos.
El procesodeobservacin/abstraccin es bsicamente un proceso para modelizar la estructura, las propiedades y el funcionamiento de la
realidad.

De hecho, existen diferencias entre conocimiento e informacin. La informacin es un conocimiento transmisible, es decir, que se puede representar. Los
nicos conocimientos que nos interesarn aqu son, por lo tanto, las informaciones.
Un mismo mundo real puede ser visto, concebido y modelizado de distintas
formas por diferentes observadores (incluso por un mismo observador) segn
su entorno o marco de referencia. Por ejemplo, un profesor no ve del mismo
modo el mbito de la gestin de un centro universitario que un administrativo
de secretara. Tienen marcos de referencia diferentes. No estn interesados en
los mismos conceptos. El profesor, a diferencia del administrativo, no necesitar conocer el importe de la matrcula, no querr distinguir las abstracciones

Los datos: conceptos introductorios

FUOC PID_00171666

Los datos: conceptos introductorios

estudiante con beca y estudiante sin beca. Los profesores estarn interesados en
la calificacin numrica, mientras que el servicio administrativo tal vez slo
tendr en cuenta la forma textual de la calificacin.
As, en el paso del mundo real al de las concepciones encontramos pluralismo.
Es posible que la observacin y el anlisis de una misma parte de una organizacin o empresa lleven a concepciones diferentes, todas igualmente vlidas,
y que pueden tener que coexistir.
1.3. Las representaciones: los datos

El mundo de las concepciones o de los conocimientos es un mundo


mental. Sin embargo, para trabajar con estos conocimientos y comunicarlos, necesitamos proyectar los pensamientos al exterior, representndolos fsicamente de alguna manera. ste es el mundodelasrepresentaciones.

Representacin de
conocimientos
Podemos representar conocimientos escribiendo a mano
sobre un papel, grabando bytes en un disco magntico segn un formato y una codificacin determinados, etc.

Nosotros aqu nos ocuparemos de las representaciones informticas, y hablaremos de datos, ficheros, bases de datos, registros, campos, bytes, discos, etc.

Damos el nombre de datos a las representaciones fsicas de los conocimientos que tenemos de los objetos del mundo real. El paso de los
conocimientos a los datos, o de una concepcin a una representacin
informtica, no es automtico. Es un proceso humano: un proceso de
diseo.

Obviamente, en este caso como en el caso del paso del mundo real al de las
concepciones, tambin hay pluralismo. Un mismo conjunto de conocimientos se puede representar de muchas formas; por ejemplo, en forma de base de
datos relacional o como ficheros tradicionales, con vectores o sin ellos, con
longitud fija o variable, con codificacin ASCII o EBCDIC, etc. Una visin o
concepcin del mundo real de un hospital, de una universidad o de una distribuidora de productos se podr representar de muchas formas sobre soportes
fsicos informticos.
Sin ningn tipo de duda, las tareas ms importantes del analista/diseador de
SI o de aplicaciones informticas son las siguientes:
1) Analizar los objetos del mundo real, y hacer abstracciones y obtener una
concepcin lgica de ellos.
2) Disear una representacin informtica concreta que se pueda tratar eficientemente.

Diseos diferentes
Se pueden hacer muchos diseos diferentes de representacin informtica que correspondan a un nico modelo
conceptual de una realidad.
Todos pueden representar la
misma realidad, pero tendrn
una eficiencia diferente segn
la utilizacin que se haga de
ellos.

FUOC PID_00171666

10

Los datos: conceptos introductorios

El hecho de saber observar la realidad y hacer de ella las abstracciones lgicas


ms adecuadas, as como la habilidad para el anlisis y la sntesis, llegan a
ser cualidades fundamentales que debe tener el desarrollador de SI. Y estas
cualidades se deben educar y cultivar.
Evolucin del diseo de aplicaciones
El paso de un mundo conceptual a un mundo de representaciones informticas se hizo
ms sencillo a medida que la tecnologa informtica avanzaba y se simplificaba su utilizacin. En los aos sesenta y setenta, el desarrollador de aplicaciones se vea obligado a
tener en cuenta una multitud de detalles fsicos de la representacin informtica. Actualmente, la simplificacin del proceso de diseo de la representacin hace que el proceso
de observacin/abstraccin se convierta en la tarea principal del desarrollador de SI.

1.4. La interpretacin

Acabamos de ver el camino que nos conduce de la realidad a los conocimientos, y de stos a los datos o las representaciones. Sin embargo,
nos har falta interpretar la representacin. El proceso inverso al de representacin se denomina interpretacin.

Si consideramos un dato, una representacin que consta de la serie de smbolos


1 9 9 9, y que est extrada de una base de datos relativa a la matriculacin de
estudiantes, no podremos obtener ninguna informacin de ella si no sabemos
si hace referencia al ao de matriculacin, al ao de nacimiento, al importe
de la matrcula, al nmero de la matrcula, etc.; adems, no sabremos de qu
estudiante concreto (de qu objeto del mundo real) se trata. Vemos, entonces,
que para poder interpretar los datos se debe saber adems a quin y a qu (a
qu conceptos) hacen referencia.
Hemos dicho que una informacin es un conocimiento que se puede representar, pero ahora, teniendo en cuenta el camino inverso, podremos decir que
la informacin es el significado que le damos a los datos.

Para reflexionar
Cmo se puede obtener conocimientos e informacin de
una representacin?

FUOC PID_00171666

11

Los datos: conceptos introductorios

2. El mundo conceptual: entidades y atributos

Como ya hemos visto, el mundo conceptual es el mundo de las abstracciones


lgicas y el dominio de la informacin. Este campo es fundamental para concebir (analizar y disear) el SI.
2.1. La informacin: expresin lingstica
Cuando hablamos de informacin, nos movemos en el mbito de las concepciones. Toda informacin se refiere a un objeto y nos describe una propiedad.
Por ejemplo, una informacin sobre un estudiante (el objeto) podra ser la
propiedad "naci en 1979".

En trminos lingsticos, una informacin (un conocimiento elemental) se puede expresar con un sujeto (el estudiante concreto) y un predicado ("naci en 1979"). El predicado est formado por el verbo y el
complemento.

Con conectores lgicos (o, y, no) podemos expresar conocimientos ms complejos. Por ejemplo, "este estudiante concreto se llama Juan Garca y naci en
1979".
2.2. Entidades, atributos y valores
Desde un punto de vista informtico utilizamos unos trminos diferentes de
los que se emplean en lingstica.

Se denominan entidades los objetos que conceptualizamos como distinguibles unos de otros (es decir, que son identificables), y de los que
nos interesan algunas propiedades. El trmino entidad se corresponde
con el trmino sujeto del campo de la lingstica. Es la conceptualizacin del objeto al que hace referencia la informacin.
El predicado es la propiedad descrita, y sus dos partes, verbo y complemento, las denominamos atributo (ao de nacimiento) y valor (1979),
respectivamente.

Ved tambin
Para ampliar la informacin sobre el mundo conceptual, consultad el subapartado 1.2 de
este mdulo didctico.

FUOC PID_00171666

12

Figura 2

Toda informacin se caracteriza por los tres elementos siguientes: entidad, atributo y valor. Si slo conocemos el atributo (ao de nacimiento) y el valor (1979),
no tenemos informacin, ya que no sabemos a qu entidad (estudiante) hace
referencia. Si no conocemos el atributo, no sabremos a qu hace referencia el
valor (el nmero 1979 es el ao de nacimiento?, o tal vez se trata del nmero
de matrcula o de la altura en milmetros?).
Para aclarar y precisar el significado de estos tres trminos, entidad, atributo y
valor, utilizaremos conceptos elementales de la teora de conjuntos.
Situados en este marco de la teora de conjuntos, podemos considerar el atributo ao de nacimiento como una correspondencia entre los estudiantes y los
aos del calendario. Cada estudiante tiene un solo ao de nacimiento, y diferentes estudiantes pueden tener el mismo ao de nacimiento. Es decir, la
correspondencia entre los estudiantes y los aos puede ser vista como una
aplicacin (en el sentido de las matemticas) del conjunto de los estudiantes
sobre el conjunto de los aos.
Figura 3

Los datos: conceptos introductorios

13

FUOC PID_00171666

Si E es un conjunto de entidades individuales (conceptualizaciones de


los objetos del mundo real) y V es un conjunto de valores, podemos
definir el atributoA como la aplicacin de E sobre V. Si expresamos la
aplicacin en trminos de una funcin, diremos que V = A(E).
{Entidad} {Valor}
Atributo

Figura 4.

Para un mismo conjunto origen podemos definir diferentes aplicaciones sobre


diversos conjuntos imagen. Dicho de otro modo, una entidad puede tener ms
de un atributo.
Ejemplodeentidadmultiatributo
Supongamos que lo que hay que saber de los estudiantes es el nmero de
matrcula, el nmero de DNI, el nombre y el ao de nacimiento.
Las entidades tendrn cuatro atributos y un valor para cada atributo. Representamos ahora, en la figura 5 de la pgina siguiente, los atributos como aplicaciones.
2.3. El tiempo
Realmente, la informacin no es independiente del tiempo. El sueldo de un
empleado, la altura de un estudiante, el nmero de hijos, etc., varan con el
tiempo. En un SI nos puede interesar mantener el valor actual de los atributos,

Los datos: conceptos introductorios

FUOC PID_00171666

14

pero tal vez tambin queremos incluir valores anteriores. As, de este modo, el
valor 3 del atributo nmero de hijos de Juan Garca no constituye una informacin suficientemente completa, si no sabemos a qu momento corresponde.
Incluso los atributos estables, como por ejemplo el DNI de un estudiante, pueden cambiar en el mundo real. Sin embargo, aunque no sea as, en un SI todo
atributo puede cambiar de valor en el tiempo. Por ejemplo, hemos introducido
un DNI errneo, y lo detectamos y lo cambiamos al cabo de unos meses. Dado
que durante estos meses hemos podido comunicar el DNI errneo al mundo
exterior, nos convendra tener registrado en el SI los dos nmero de DNI y la
fecha del cambio.

En general, para tener bien caracterizada una informacin no es suficiente con los tres elementos entidad, atributo y valor, sino que nos
har falta el tiempo.

Figura 5

Y tal vez no tendremos suficiente con slo un tiempo, sino que nos harn
falta varios: el momento en que se produjo el cambio en el mundo real, el
momento en que se introdujo en el SI, etc.

Los datos: conceptos introductorios

FUOC PID_00171666

15

Los datos: conceptos introductorios

Tanto las tcnicas de modelizacin conceptual que se utilizan en el mbito


profesional, como las bases de datos y los ficheros actuales, no dan demasiadas facilidades para considerar el tiempo como un elemento caracterizador de
la informacin. En los prximos aos esto cambiar, pero mientras tanto, la
responsabilidad de incluir el tiempo en los SI corresponde al diseador. Por
ejemplo, se podra disear un fichero que contuviese los datos actuales, sin
ningn atributo que hiciera referencia al tiempo, y un fichero histrico en el
que cada registro de informacin fuese acompaado de una fecha y una hora.
2.4. Dominios y valores nulos

El conjunto de todos los valores vlidos, o legales, que puede llegar a


tener un atributo, recibe el nombre de dominiodelatributo.
Puede ocurrir que el valor de un atributo determinado de alguna entidad individual sea desconocido o no exista. Entonces diremos que el

Ejemplo
El nmero entero 981 o la serie de smbolos A 321.6, por
ejemplo, no forman parte del
dominio del atributo ao de
nacimiento de los estudiantes
de nuestro mundo real.

dominiodeeseatributoaceptaelvalornulo.
Nota

Podemos desconocer el nombre o el ao de nacimiento de un determinado estudiante. Tambin puede suceder que algn estudiante no tenga DNI. Cuando
esto ocurre, al definir el dominio del atributo deberemos indicar si aceptamos
o no el valor nulo.
2.5. Identificadores y claves
Recordemos que en la teora de conjuntos se denomina aplicacininyectiva
aquella aplicacin en la que a cada elemento del conjunto imagen le corresponde un elemento del conjunto origen origen como mximo. De este modo,
el atributo ao de nacimiento no es una aplicacin inyectiva, porque varios estudiantes pueden haber nacido el mismo ao.
Sin embargo, el atributo nmero de matrcula s es una aplicacin inyectiva, ya
que en nuestro mundo real, en el mbito de la matriculacin de estudiantes,
no se acepta que dos de ellos tengan el mismo nmero de matrcula. Precisamente, este nmero se utiliza para distinguir unos de otros; es decir, para
identificarlos.

Los atributos que concebimos como aplicaciones inyectivas se denominan identificadores.

Los atributos son identificadores o no, segn los objetos que nos interesa modelar. Si nos referimos a las personas, el DNI de una persona es un identificador. Sin embargo, si el mundo real que consideramos se refiere a seguros de

No se debe confundir el valor


nulo con un cero o con los espacios en blanco. Por ejemplo,
el color de un importe desconocido no es cero.

FUOC PID_00171666

16

Los datos: conceptos introductorios

accidentes, los objetos de nuestro inters sern los accidentes de trfico, y entonces el atributo DNI (el DNI del conductor), no ser un atributo identificador, ya que dos accidentes podran ser del mismo conductor.
Una entidad puede tener ms de un identificador, o incluso no tener ninguno.
Los estudiantes pueden quedar identificados tanto por el nmero de matrcula
como por el DNI. Sin embargo, puede ocurrir que la entidad no tenga ningn
atributo identificador. Por ejemplo, si consideramos los objetos ciudad con los
atributos nombre ciudad, nmero de habitantes, pas y superficie de arbolado, nos
encontramos con que el nombre ciudad no identifica una ciudad, ya que pue-

Nombres de ciudades
El nombre de las ciudades no
es suficiente para identificarlas,
porque un solo nombre puede
hacer referencia a varias ciudades; por ejemplo, en Venezuela hay una ciudad que tiene
por nombre Barcelona.

den existir ciudades con el mismo nombre en diferentes pases. Entonces, para identificar las ciudades tendremos que utilizar conjuntamente la pareja de
atributos pas y nombre ciudad.
Conjuntos de atributos
Como ya hemos visto anteriormente, las entidades corresponden a objetos que podemos
identificar o distinguir. Para distinguir a los estudiantes, podemos utilizar el atributo nmero de matrcula, ya que se trata de un atributo identificador. Sin embargo, en el caso de
los accidentes de trfico, el DNI del conductor no nos identifica el accidente. Ya que no
hay un atributo identificador, podramos identificar los accidentes con el par DNI del conductor y fecha y hora, o tal vez el conjunto de atributos pas, nombre ciudad, calle, nmero,
fecha y hora, o cualquier otro conjunto de atributos que nos diferenciase los accidentes.

Ved tambin
Consultad el concepto de entidad en el subapartado 2.2 de
este mdulo didctico.

Todo atributo o conjunto de atributos que permite identificar las entidades individuales recibe el nombre de clave.

En el caso de los estudiantes, tanto el atributo nmero de matrcula como el DNI


son claves, y cada uno es un atributo identificador. En el caso de las ciudades,
el par de atributos pas y nombre ciudad constituye una clave, pero ninguno de
los dos es identificador.
Otros significados del trmino clave
En el campo de los ficheros y las bases de datos (BD), el trmino clave se utiliza tambin
con otros significados. Por ejemplo, se acostumbra a denominar clave el atributo o conjunto de atributos que se utiliza para efectuar una bsqueda en un fichero.
Podemos buscar dentro de un fichero a los estudiantes que tienen el atributo nota igual
a 8,5; es decir, utilizando como "clave" de bsqueda la nota. Sin embargo, obviamente,
la nota no es una clave en el sentido que aqu damos a este trmino.

2.6. Atributos multivalor

Dado que el atributo es una aplicacin entre conjuntos, a cada entidad


le puede corresponder como mximo un solo valor. En consecuencia,
un atributo no podr ser multivalor (o multivaluado).

Nota
Todo atributo identificador
esuna clave, pero no toda clavees un atributo identificador.

FUOC PID_00171666

17

Por ejemplo, no ser posible un atributo nota tal que cada estudiantes pueda
tener ms de una nota, ya que entonces no sera una aplicacin, sino una
correspondencia.
Figura 6.

Esta restriccin es propia del modelo relacional y ha sido seguida al pie de la


letra por la mayora de los sistemas de gestin de BD del mercado. Dado que
aqu nos moveremos dentro del mbito del modelo relacional, no aceptaremos los atributos multivalor. En la prctica stos se utilizan con frecuencia,
especialmente en los ficheros clsicos.
2.7. La entidad: instancia y tipo
Hasta aqu hemos utilizado el trmino entidad para denominar la conceptualizacin de un objeto del mundo real (una instancia): un estudiante concreto,
un accidente concreto, etc. Sin embargo, tambin lo utilizaremos para denominar la entidad genrica, el tipo, la abstraccin estudiante o accidente (no un
alumno o un accidente concreto, ni el conjunto de los estudiantes o de los
accidentes). Todas las entidades estudiantes son elementos del conjunto de estudiantes. Todos los estudiantes son individuos o instancias del mismo tipo
(son instancias del tipo de entidad estudiante).

Los datos: conceptos introductorios

FUOC PID_00171666

18

Los datos: conceptos introductorios


(2)

As pues, el trmino entidad tendr dos acepciones :


1) La entidad como individuo o instancia.
2) La entidad como clase, o tipo.
Todas las instancias de un mismo tipo (todas las entidades individuales
de una misma entidad genrica) tienen los mismos atributos.

Todos los estudiantes tienen nmero de matrcula, DNI, nombre y fecha de


nacimiento, y por este motivo los consideramos de la misma entidad tipo estudiante.
Habitualmente slo concretaremos cul de las dos acepciones del trmino entidad utilizamos instancia o tipo cuando no quede suficientemente claro por
el contexto.

Algunos autores tambin incluyen una tercera acepcin y consideran una entidad como el conjunto de instancias de una entidad
tipo.

FUOC PID_00171666

19

Los datos: conceptos introductorios

3. El mundo de las representaciones

Ahora veremos los principales conceptos y trminos que se utilizan en el campo de las representaciones informticas, el mundo de los datos.
3.1. La representacin tabular
La informacin pertenece al dominio conceptual o mental. Sin embargo, para
transmitirla y procesarla necesitamos representarla fsicamente. La representacin informtica de una informacin elemental se denomina dato. El mundo
de las representaciones ser el mundo de los datos, y para describirlo hablaremos de ficheros, registros, campos, BD, soportes, etc.
La figura 5 es, en realidad, una representacin grfica, no informatizada, de la
informacin de los estudiantes. Se ha hecho utilizando este papel como soporte. Sin embargo, como hemos podido observar, con tantas flechas y conjuntos, no resulta demasiado cmoda para procesarla o transmitirla; esto sucede
especialmente en un caso real, en el que habra decenas de atributos y miles
de estudiantes. Resulta mucho ms sencillo llevar a cabo una representacin
tabular con una fila para cada entidad individual y una columna para cada
atributo.
Figura 7

La tabla anterior es una representacin tabular, formalmente muy similar a la


representacin tpica en ficheros informticos. Es como un fichero de datos
de estudiantes que tiene un registro para cada estudiante (en estos momentos
slo tiene tres) con cuatro campos para cada registro.

Ved tambin
Podis ver la figura 5 en el
subapartado 2.2 de este mdulo didctico.

FUOC PID_00171666

20

Una representacintabular de un conjunto de n entidades e i donde


cada una de ellas tiene m atributos aj es, de hecho, un conjunto de n
tuplas de grado m formadas por los valores vij.

El esquema (formato o cabecera) de esta tabla se podra escribir de la siguiente forma: E(a1, a2, ..., aj, ..., am). Podramos considerarlo una representacin de la entidad tipo E, es decir, el tipo de las entidades instancia
ei, i = 1 a n. Todas las ei tienen la misma estructura; en otros trminos,
tienen los mismos atributos aj, donde j = 1 a m.

3.2. Ficheros, registros y campos


Tradicionalmente, los datos han sido almacenados en ficheros sobre soportes
magnticos. El trmino fichero se emplea en el mbito de los sistemas operativos (SO) en un sentido mucho ms genrico que aqu. Evidentemente, en
esta asignatura no hablaremos de ficheros de programas, pero tampoco lo haremos de ficheros de texto libre, ficheros de grficos, etc. Slo hablaremos de
ficheros de datos estructurados en registros y de bases de datos, que es lo que
normalmente se utiliza en los SI.

Los datos: conceptos introductorios

FUOC PID_00171666

21

Un ficherodedatos es una representacin informtica equivalente a


la representacin tabular:
a)La representacin de una entidad (el equivalente a una fila de la tabla)
recibe el nombre de registro.
b) La representacin del valor de un atributo de una entidad se denomina campo.
El conjunto de campos constituye el registro, y el conjunto de registros
constituye el fichero.

Podemos considerar que en el mundo de los ficheros tradicionales de datos,


el equivalente de los atributos son las cabeceras de los campos.
Los datos (las informaciones elementales) de cada uno de nuestros estudiantes estarn almacenados en una estructura de cuatro campos, uno para cada
atributo. Cada campo contendr un valor (un dato). El conjunto de los datos
de un estudiante forma el registro la "ficha" del estudiante, y el conjunto de
los registros de los estudiantes forma el fichero de estudiantes.
Figura 8

Campo: un trmino polivalente


El trmino campo se utiliza, en la prctica, en varios sentidos parecidos, circunstancia que
puede conducir a confusin. Es frecuente utilizarlo en el sentido de la representacin de
un valor, pero con frecuencia se utiliza con el significado del continente, es decir, el lugar
donde se almacena el valor; tambin es frecuente utilizarlo para denominar la cabecera.
De este modo, se habla del dominio de un campo, de campos identificadores, de claves
formadas por un campo identificador o distintos campos no identificadores, de campos
multivalores, etc.

3.3. Bases de datos


Consideremos ahora un mundo conceptual formado por diferentes entidades
tipo. Su representacin informtica podra hacerse mediante un conjunto de
ficheros.

Los datos: conceptos introductorios

FUOC PID_00171666

22

Los datos: conceptos introductorios

De momento, en este mdulo introductorio daremos el nombre de base


dedatos (BD) a un conjunto de ficheros de datos interrelacionados.

Supongamos que los tipos de objetos de nuestro inters son estudiantes, asignaturas y profesores, y que los atributos de las tres entidades son los siguientes:
a)Estudiante: nmero de matrcula, DNI del estudiante, ao de nacimiento, nombre del estudiante.
b)Asignatura: cdigo, nombre de la asignatura, crditos.
c)Profesor: DNI del profesor, nombre del profesor, despacho.
Podremos representar estas entidades mediante tres ficheros, uno para cada
entidad, con los campos correspondientes a los atributos. Sin embargo, falta la
informacin que permite interrelacionar las entidades entre s. Supongamos
que estas interrelaciones son las siguientes:
1) Cualquier estudiante puede cursar ms de una asignatura y, evidentemente,
cualquier asignatura puede ser cursada por muchos estudiantes.
2) Toda asignatura viene dada por un solo profesor, pero cada profesor puede
impartir varias asignaturas.
3) Supongamos tambin que nos interesa la nota que el estudiante tiene de
cada asignatura. Se trata de un atributo, nota, que no es propiamente del estudiante (ya que tiene una por asignatura) ni de la asignatura (ya que tiene tantas como estudiantes la cursan). Equivaldra a un atributo de la interrelacin
entre asignatura y estudiante.
Figura 9

Fijmonos ahora en los problemas que plantea la representacin informtica


de estas interrelaciones:
a) La interrelacinentreasignaturasyprofesores se podra representar aadiendo a los registros de las asignaturas un campo DNI del profesor con el valor
del DNI del profesor que la da. De este modo, una asignatura tendra un solo
profesor, y un mismo profesor podra aparecer en diferentes asignaturas.

Actividad
Cules son las interrelacionesentre alumnos, asignaturas y
profesores?

FUOC PID_00171666

23

b) La interrelacin entre asignaturas y estudiantes es ms compleja y se


podra representar mediante campos complejos de tipo vector; de este modo,
se imitaran los atributos multivalor, aqu prohibidos. Sin embargo, podramos
optar por tener otro fichero (una nueva entidad especfica para describir esta
interrelacin), que tendra los siguientes campos, todos monovalor: cdigo,
nmero de matrcula, nota. Este nuevo fichero tendra un registro para cada par
de estudiante-asignatura que realmente exista.
Hemos representado la informacin de nuestro mundo real con cuatro ficheros de datos. Si tuvisemos que escribir un programa para mostrar una lista de
notas acompaadas del nombre del estudiante, el nombre de la asignatura y
el nombre del profesor, tendramos que hacer que leyese e interrelacionase los
cuatro ficheros. Los programas que crean o actualizan estos ficheros no pueden
ser demasiado sencillos, ya que deben mantener la coherencia del conjunto.
Por ejemplo, al suprimir a un profesor del fichero de profesores, se debe eliminar tambin de las asignaturas que daba; al incluir la nota de un estudiante no se debe poner un cdigo de asignatura que no exista en el fichero de
asignaturas, etc.
Vemos, pues, que los conjuntosdeficherosinterrelacionados nos plantean
ciertas dificultades. El software tradicional de gestin de ficheros, los File Management Systems, no se ocupan de las posibles interrelaciones entre ficheros, y
las dejan en manos de los usuarios informticos. A finales de los aos setenta
empez a salir al mercado software especializado en estos conjuntos complejos de bases de datos bajo el nombre de Database Management Systems o Sistemas de Gestin de BD (SGBD). Los SGBD son bastante ms sofisticados que
los sistemas de gestin de ficheros, y su objetivo es facilitar el uso de las BD,
el diseo, la programacin, el mantenimiento, la utilizacin simultnea por
muchos usuarios, etc.
3.4. El registro fsico y los soportes
La memoriainterna (RAM) de los ordenadores es voltil. De este modo, los
datos que almacena un programa desaparecen cuando termina su ejecucin.
Para almacenar los datos de forma persistente, hacen falta memorias externas
perifricos de almacenamiento que sean soportes fsicos permanentes.

Los datos: conceptos introductorios

FUOC PID_00171666

24

Tal vez nuestros nietos o biznietos no llegarn a recordar cmo se almacenaban


y se gestionaban los datos permanentes sin los ordenadores, pero para nosotros
todava son habituales las representaciones fsicas sobre papel o cartulinas, en
las que los datos estn escritos con un formato determinado, con un cierto
lenguaje, un tipo de letra, tinta, etc.
Sobre los soportes informticos, los programas escriben registros de datos. El
programa graba los datos de un registro en un cierto formato y con una codificacin; por ejemplo, el campo nombre podra ser de longitud variable con
un prefijo que indicase su longitud, y su codificacin podra ser ASCII; el DNI

Los datos: conceptos introductorios

Ejemplo
Un libro de registro de movimientos bancarios, que
tiene una lnea (un registro)
para cada movimiento.
En la secretara de una escuela hay un archivador
con cajones llenos de fichas, donde se registra la
informacin de los estudiantes (una ficha por estudiante). Es el fichero de los
estudiantes.

podra estar en binario puro y ocupara tres octetos, etc.


Generalmente, el diseador de los ficheros o la BD para un SI concreto puede
decidir detalles sobre el registro de los datos. Es parte del denominado diseo
fsico.
3.5. Organizacin
Las fichas de cartn de los estudiantes de la secretara no informatizada tal
vez estn organizadas o colocadas por orden alfabtico segn el nombre. Para
facilitar el acceso a las mismas, tal vez haya pestaas separadoras para las dos
primeras letras del nombre. Para buscar una ficha sabiendo slo el nmero
de matrcula, sin tener que mirar secuencialmente todas las fichas de los estudiantes anteriores (estn por orden alfabtico), se podra disponer de una lista
ordenada por el nmero de matrcula que nos diese el nombre del estudiante.
Esta lista actuara, pues, como un ndice que nos ayudara a hacer ms rpidas
las bsquedas.

El software de ficheros y el de BD nos dan unas posibilidadesdeorganizacin parecidas a las del mundo no informtico, y otras mucho ms
sofisticadas. Son similares a las que el estudiante conoce como estructuras de datos en memoria interna. Son las secuencias, listas encadenadas, vectores, ndices en forma de rbol equilibrado, hashing, etc. Sin
embargo, se tendrn en cuenta las caractersticas propias de los soportes
persistentes.

El diseador de un SI, cuando realiza el diseo fsico de los ficheros o de la BD,


debe tomar decisiones respecto a qu sistemas de organizacin se utilizarn.

Actividad
Cul ser la estructura u organizacin que daremos a los datos en un soporte informtico?
Cmo las colocaremos?

FUOC PID_00171666

25

Los datos: conceptos introductorios

3.6. Acceso a los datos


Una cosa es cmo estn organizados los datos (la colocacin) y otra cmo se
accede a ellos (la obtencin). Todas las organizaciones aceptan varias formas
de acceder a los datos, y es el propio usuario, o tal vez el software, el que elige
cmo lo hace.

Hay dos formas bsicas de acceso a los datos: el acceso secuencial y


el accesodirecto. La diferencia esencial es que el acceso secuencial a
un registro presupone el acceso previo a todos los registros anteriores,
mientras que el acceso directo, no. El acceso secuencial es un acceso "al
siguiente"; en cambio, el acceso directo es un acceso "al deseado".
Otra dicotoma habitual en las formas de acceso es el accesoporvalor y
el accesoporposicin. El acceso por valor nos lleva al registro en funcin del valor de alguno de sus atributos, sin tener en cuenta la posicin
que ocupa el registro. El acceso por posicin, en cambio, nos lleva a un
lugar una posicin donde encontramos un registro de datos, sin tener
en cuenta el contenido.

Combinando las dos clasificaciones anteriores, tenemos las cuatro formas de


acceso ms habituales:
1)Accesosecuencialporposicin(SP): despus de haber accedido a un registro que ocupa una posicin, se pide acceder al registro que ocupa la posicin
siguiente. Este tipo de acceso era el natural en el caso de datos almacenados en
cintas magnticas, pero tambin es muy utilizado en soportes fsicos de acceso
directo como los discos.
Por ejemplo, para construir un cuadro resumen del fichero de estudiantes, se
podra usar el acceso SP, ya que debe ser posible leer a todos los estudiantes sin
que tenga importancia su orden lgico.
2)Accesodirectoporposicin(DP): se pide acceder al registro que ocupa
la posicin p.
Por ejemplo, utilizaramos accesos directos por posicin en el caso de que quisiramos programar una bsqueda dicotmica o una bsqueda hashing.
3)Accesosecuencialporvalor(SV): despus de haber accedido a un registro,
se pide acceder al siguiente respecto al orden de un atributo (campo) determinado.
Por ejemplo, en un acceso SV por nmero de matrcula, una vez encontrado el
estudiante que tiene el 2.418 de nmero de matrcula (consultad la figura 7),
encontraremos al estudiante 3.782. ste sera el tipo de acceso que utilizara-

La posicin p
Cuando aqu hablamos de una
posicin p, no nos referimosa una posicin byte (el byte
nmero p dentro del fichero),
sino a una posicin registro.
Cada registro ocupa unaposicin y en cada posicin puede haber un registro.Recordad
que aqu slohablamos de ficheros de datos estructurados
en registros.

26

FUOC PID_00171666

Los datos: conceptos introductorios

mos en un programa que suministrase una lista de estudiantes ordenada por


nmero de matrcula, a pesar de que el fichero fuese una secuencia ordenada
por nombre, pero que estuviese equipado de un ndice por nmero de matrcula
(precisamente, ste era el caso de la secretara no informatizada).
4)Accesodirectoporvalor(DV): se pide acceder al registro que tiene, para
un atributo (campo) determinado, un valor dado.
Por ejemplo, queremos acceder a los datos del estudiante Juan Garca (el registro donde el campo nombre vale Juan Garca).
De este modo, podemos hacer un cuadro resumen de las diferentes formas de
acceso:
Figura 10
Cuatro formas de acceso

Por posicin

Por valor

Secuencial

SP

SV

Directo

DP

DV

3.7. Nivel lgico y nivel fsico


El registro de los datos, la organizacin y los accesos, se puede considerar desde
un punto de vista ms o menos alejado de la realizacin fsica.

En el mundo de las representaciones informticas, se acostumbran a


distinguir dos puntos de vista o niveles: el nivelfsico, cuando es necesario considerar la realizacin fsica, y el nivellgico, cuando no hace
falta conocerla.

Los programadores trabajan a niveles diferentes en funcin de sus necesidades:


1)Nivellgico: por ejemplo, el programador de aplicaciones que trabaja con
un lenguaje de alto nivel como el C, el C++, el Java, etc. puede ver o imaginar
que los ficheros estn formados simplemente por registros, uno detrs del otro,
y que contienen campos con letras y nmeros. No ve, ni le hace falta conocer,
la realizacin fsica que tal vez constar de encadenamientos de registros fsicos
(cada uno con distintos registros lgicos), marcas separadoras entre campos,
compresin de datos, ndices, etc. El programador de aplicaciones trabajar a
nivel lgico.

Aos sesenta y setenta


El actual software especializado en ficheros y BD nos proporciona la separacin de niveles deseada (si bien no del
todo completa). Sin embargo,
en los aos sesenta y setenta
esta separacin casi no exista.
Los programadores de aplicaciones tenan que incluir en sus
programas consideraciones relativas a ndices, controles de
paridad, tamao de la pista del
disco, etc.

FUOC PID_00171666

27

2) Nivel fsico: entramos en el nivel fsico cuando tenemos que considerar


la realizacin fsica. Un programador de software bsico (SGBD, SO, etc.), un
diseador fsico de una BD, un tcnico de sistemas que administra una BD,
etc. deben entrar en el nivel fsico.
Figura 11.

Para hacer la programacin sencilla e independiente de las realizaciones, interesa que los programas no tengan que gestionar la organizacin
y los accesos en el nivel fsico, sino slo el nivel lgico.

En esta asignatura haremos referencia casi exclusivamente al nivel lgico.

Los datos: conceptos introductorios

FUOC PID_00171666

28

Los datos: conceptos introductorios

4. La memoria persistente

Antes de acabar este primer mdulo haremos una pequea incursin en un


tema de nivel muy fsico: las memorias externas con soportes permanentes.
4.1. Justificacin de la utilizacin de la memoria persistente
La necesidad de almacenar los datos nos obliga a utilizar memorias externas
con soportes permanentes, como por ejemplo los discos magnticos, los discos
pticos, memorias flash, cintas, etc. Sin embargo, la no-volatilidad no es la
nica razn que justifica su utilizacin, sino tambin su grancapacidad y el
preciobajo por byte.
El principalinconveniente de estos perifricos de almacenamiento persistente es el tiempodeacceso, que es significativamente ms lento que el de la
memoria interna.
4.2. Esquema de la E/S
El estudiante ya conoce el funcionamiento de la comunicacin fsica entre los
perifricos de almacenamiento y la memoria interna. Sabemos que la unidad
de transferencia entre la memoria externa (permanente) y la interna (no permanente) es el bloque. El bloque es aquello que se lee o se escribe de una vez
en una sola operacin fsica de E/S (entrada/salida).
Por ejemplo, en el caso de los discos, el bloque mnimo ser un sector, pero se
acostumbra a leer de una vez toda una serie de sectores.
En ocasiones se da el nombre de registro fsico al bloque, y el de registro
3

lgico a lo que aqu denominamos simplemente registro . Dado que el tamao


de un registro suele ser mucho menor que el de un bloque, se agrupan los
registros (lgicos) en bloques (registros fsicos). En el mundo de las BD se utiliza
con frecuencia el trmino pgina como sinnimo de bloque.
Sabemos que la entrada (o la salida) delosbloques se hace hacia (o desde)
los buffers en la memoria interna. Actualmente, es habitual que en un sistema
informtico que sirve a un SI multiusuario se ejecuten muchos procesos de
forma simultnea. Cada proceso puede trabajar con ms de un fichero de datos; es decir, le puede convenir tener unos cuantos bloques en los buffers. El
tamao de los bloques est muy condicionado por el espacio disponible en la
memoria interna para todo este gran conjunto de buffers.

(3)

Por ejemplo, los datos de un estudiante.

FUOC PID_00171666

29

El sistema de ficheros del SO, y eventualmente, el SGBD, se encargan de las


operaciones de E/S de bloques y de gestionar el espacio dedicado a los buffers. Sin embargo, los programas de usuario (los que escribe el programador de
aplicaciones) no entran en este nivel fsico, sino que permanecen en un nivel
lgico. De este modo, las operaciones que se realizan son lecturas/escrituras
de registros lgicos4. El software se encarga de pasar registros entre los programas de usuario y los buffers. El programa de usuario pide/enva un registro y
el software (SO/SGBD) lo sirve/acepta desde/en los buffers de bloques.
Operaciones lgicas y fsicas
Si en un bloque caben 100 registros, y se est trabajando secuencialmente, cada 100 lecturas o escrituras efectuadas por el programa se ejecutar una lectura o una escritura de
un bloque. El software ser el encargado de llevar a cabo, mediante los buffers, la adaptacin entre las operacioneslgicas y las fsicas.

Del mismo modo que la unidad de transferencia entre la memoria persistente y los buffers es el bloque, la unidad de transferencia entre los
buffers y el programa de usuario es el registro.

Figura 12.

4.3. Tiempo de acceso


Las memorias persistentes pueden tener partes mviles. Esto hace que su tiempo de acceso sea mucho mayor que el de la memoria interna. ste es su inconveniente principal y la causa por la que las estructuras de datos para la
memoria persistente tienen particularidades diferentes de las que se utilizan
para las memorias internas.

Los datos: conceptos introductorios


(4)

Leer o escribir los datosde un estudiante.

FUOC PID_00171666

30

El tiempo necesario para completar una operacin fsica de lectura o


escritura de un bloque en una memoria permanente mvil consta de
dos partes (tiempo de acceso + tiempo de transferencia):
a) El tiempodeacceso es el tiempo necesario para que el mecanismo
se coloque en el inicio del bloque que se debe leer o escribir.
b) El tiempodetransferencia es el tiempo necesario para leer o escribir
el bloque.

Con el fin de aclarar estos conceptos, a continuacin los explicaremos con


ms detenimiento para el caso de los discos magnticos.
1) El tiempodeaccesoenelcasodelosdiscosmagnticos consta de dos
partes: tiempo de bsqueda (seek) + tiempo de espera (latency o rotational delay).
a) En el tiempodebsqueda, el brazo portador de los cabezales se coloca en
el cilindro seleccionado.
b) Despus, en el tiempo de espera, se aguarda a que la rotacin del disco
(que no se detiene nunca) haga pasar por delante del cabezal el sector donde
se inicia la operacin. As pues, este tiempo depende de la velocidad de la
rotacin. De este modo, si el disco gira a 7.200 r.p.m., el tiempo de espera
mximo ser de 8,3 ms (es decir, 7.200/60) y el medio, de 4,2 ms (tiempo de
espera medio = tiempo de espera mximo/2).
Figura 13.

2) El tiempodetransferencia ser el tiempo que se tarde en leer o escribir todo


el conjunto de sectores que intervienen en la operacin; es decir, el tiempo
que tarde en pasar el bloque por delante del cabezal. Fijmonos en que este
tiempo depende del tamao del bloque y de la velocidad de rotacin.

Los datos: conceptos introductorios

FUOC PID_00171666

31

Los dispositivos de disco suelen ir equipados con un buffer local para poder
realizar la transferencia a la memoria interna asncronamente y a gran velocidad, aprovechando el ancho de banda del canal.
4.4. Caractersticas bsicas de los soportes
Acabamos de recordar una caracterstica bsica de los soportes: el tiempo de
acceso. Del resto de caractersticas que nos pueden interesar haremos un breve
recordatorio.
En la figura siguiente representamos un tringulo con los tipos de perifricos
ms utilizados actualmente para almacenar datos. Las memorias que aparecen
en niveles ms altos corresponden a aquellas que permiten mejor tiempo de
acceso y en consecuencia tienen un precio ms elevado. Hay otro mecanismo de almacenamiento bastante utilizado durante los ltimos aos que no se
acostumbra a incluir en la jerarqua de memorias externas: el almacenamiento en red. El almacenamiento en red permite almacenar datos remotamente
utilizando una red de computadores.

Es interesante hacer notar que por norma general cuanto ms arriba de la


pirmide est un dispositivo, con ms frecuencia cambian los datos que se
almacenan. As pues, los datos almacenados en memorias Flash, USB y discos
duros acostumbran a ser actualizados muy frecuentemente, mientras que los
datos almacenados en cintas o libreras robotizadas pueden no cambiar nunca.
Las principales caractersticasdelossoportes a tener en cuenta son las siguientes: capacidad, tiempo de acceso, velocidad de transferencia, precio por
megabyte, fiabilidad (hay muchos tipos de medidas, como por ejemplo errores/hora, tiempo media entre dos fallidas, etc.), vida til, utilidad, transportabilidad (si es extrable/intercambiable) y comparticin (si es de uso exclusivo
o bien lo pueden utilizar simultneamente varios procesos).

Los datos: conceptos introductorios

FUOC PID_00171666

32

Resumen

En este primer mdulo hemos hecho una introduccin a los conceptos bsicos
que fundamentan el resto de la asignatura.
Hemos explicado que los conocimientos que obtenemos observando los objetos del mundo real son abstracciones que denominamos informacin. Una
informacin expresa el valordeunatributo (propiedad) para una entidad
determinada (objeto). Hemos formalizado algunos de estos conceptos utilizando la teora de conjuntos.
A continuacin se ha distinguido entre entidadgenrica (o tipo) y entidad
instancia. Las entidades instancia se debern diferenciar unas de otras mediante un atributo (identificador) o un conjunto de atributos, que denominamos clave.
La representacin informtica de una informacin recibe el nombre de dato.
Los datos de cada objeto se agrupan en registros y los registros se estructuran
en ficheros o BD (conjuntos de ficheros interrelacionados). Estos ficheros o
BD se almacenan en memoriasexternas permanentes, cuyo tiempo de acceso
es mucho ms elevado que el de las memorias internas, que son voltiles.

Los datos: conceptos introductorios

FUOC PID_00171666

33

Ejercicios de autoevaluacin
1. Cules son los tres elementos que determinan una informacin?
2. Indicad a qu podran corresponder en el mundo de nuestra secretara no informatizada
los siguientes conceptos:

Entidad instancia
Entidad tipo
Base de datos
Soporte permanente

3. Los valores de los datos son suficientes por s solos para ser interpretados y obtener informacin de ellos?

Los datos: conceptos introductorios

FUOC PID_00171666

34

Solucionario
Ejercicios de autoevaluacin
1. Entidad, atributo y valor (podramos aadir el tiempo).
2.

Entidad instancia: ficha de un estudiante.


Entidad tipo: tipo (formato) de la ficha de los estudiantes.
Base de datos: conjunto de ficheros, libretas, papeles, etc. que contiene la informacin
relativa a los estudiantes, las asignaturas, los profesores y sus interrelaciones.
Soporte permanente: cartn o papel.

3. El valor "1988", por ejemplo, no es suficiente por s solo para saber si se trata de la fecha
de nacimiento, de la fecha de matrcula, de un importe de un pago, etc. Si sabemos que
el atributo se denomina DAT4, todava no sabremos gran cosa. Debemos averiguar a qu
atributo pertenece el valor y, adems, qu semntica tiene el atributo.

Los datos: conceptos introductorios

FUOC PID_00171666

35

Glosario
atributo m Propiedad de una entidad.
base de datos f Conjunto de ficheros interrelacionados.
campo m Representacin del valor de un atributo.
clave f Atributo o conjunto de atributos que permite identificar los objetos (distinguirlos
unos de otros).
dato m Nombre que recibe la informacin en el mundo de las representaciones informticas.
entidad f Conceptualizacin de un objeto del mundo real. El concepto del cual la entidad
es una instancia, se denomina tambin tipo de entidad.
fichero m Conjunto de registros relativos a un mismo tipo de entidad.
identificador m Un atributo es un identificador, si es una clave (monoatributo).
memoria permanente f Memoria auxiliar externa con soporte persistente que se utiliza
para mantener almacenados los datos permanentemente.
organizacin f Forma en la que se colocan o se estructuran los datos para facilitar su
posterior uso.
registro m Conjunto de datos relativos a un objeto.
sistema de informacin (SI) m Sistema que recoge, almacena y distribuye informacin
sobre el estado de un dominio.

Los datos: conceptos introductorios

FUOC PID_00171666

36

Bibliografa
Bibliografa bsica
Falkenberg, E.D. (1996). "A Framework of Information System Concepts. The FRISCO Report". IFIP WG 8.1 Task Group FRISCO. Desde el ao 1998 tambin est disponible en Internet.
Es conocido como informe FRISCO. Muy interesante para aquellos que queris profundizar
en marcos conceptuales del tipo de los "tres mundos" que hemos utilizado aqu.
Silberschatz, A.; Korth, H. F.; Sudarshan, S. (2006). Fundamentos de diseo de bases de
datos (5. ed.). Madrid: McGraw Hill.
Bibliografa complementaria
Para ampliar vuestros conocimientos sobre las memorias persistentes, los documentos tcnicos y comerciales de los fabricantes o los distribuidores pueden ser una buena fuente de
informacin. Una va de acceso a estos documentos puede ser Internet.

Los datos: conceptos introductorios

Você também pode gostar