Escolar Documentos
Profissional Documentos
Cultura Documentos
conceptos
introductorios
Rafael Camps Par
PID_00171666
FUOC PID_00171666
Ninguna parte de esta publicacin, incluido el diseo general y la cubierta, puede ser copiada,
reproducida, almacenada o transmitida de ninguna forma, ni por ningn medio, sea ste elctrico,
qumico, mecnico, ptico, grabacin, fotocopia, o cualquier otro, sin la previa autorizacin escrita
de los titulares del copyright.
FUOC PID_00171666
ndice
Introduccin...............................................................................................
Objetivos.......................................................................................................
1.
1.1.
1.2.
1.3.
1.4.
La interpretacin .........................................................................
10
11
2.1.
11
2.2.
11
2.3.
El tiempo .....................................................................................
13
2.4.
15
2.5.
15
2.6.
16
2.7.
17
19
3.1.
19
3.2.
20
3.3.
21
3.4.
23
3.5.
Organizacin ...............................................................................
24
3.6.
25
3.7.
26
La memoria persistente....................................................................
28
4.1.
28
4.2.
28
4.3.
29
4.4.
31
Resumen.......................................................................................................
32
Ejercicios de autoevaluacin..................................................................
33
Solucionario................................................................................................
34
2.
3.
4.
FUOC PID_00171666
Glosario........................................................................................................
35
Bibliografa.................................................................................................
36
FUOC PID_00171666
Introduccin
FUOC PID_00171666
Objetivos
En los materiales didcticos de este mdulo, el estudiante encontrar las herramientas indispensables para alcanzar los siguientes objetivos:
FUOC PID_00171666
Para tener un marco donde situar los trminos y los conceptos que explicaremos en la asignatura, distinguiremos tres mbitos diferentes:
Figura 1.
(1)
FUOC PID_00171666
El mundoreal, la parte de la realidad que nos interesa, es lo que percibimos con nuestros sentidos y est compuesto por objetos concretos,
fsicos o no.
De hecho, existen diferencias entre conocimiento e informacin. La informacin es un conocimiento transmisible, es decir, que se puede representar. Los
nicos conocimientos que nos interesarn aqu son, por lo tanto, las informaciones.
Un mismo mundo real puede ser visto, concebido y modelizado de distintas
formas por diferentes observadores (incluso por un mismo observador) segn
su entorno o marco de referencia. Por ejemplo, un profesor no ve del mismo
modo el mbito de la gestin de un centro universitario que un administrativo
de secretara. Tienen marcos de referencia diferentes. No estn interesados en
los mismos conceptos. El profesor, a diferencia del administrativo, no necesitar conocer el importe de la matrcula, no querr distinguir las abstracciones
FUOC PID_00171666
estudiante con beca y estudiante sin beca. Los profesores estarn interesados en
la calificacin numrica, mientras que el servicio administrativo tal vez slo
tendr en cuenta la forma textual de la calificacin.
As, en el paso del mundo real al de las concepciones encontramos pluralismo.
Es posible que la observacin y el anlisis de una misma parte de una organizacin o empresa lleven a concepciones diferentes, todas igualmente vlidas,
y que pueden tener que coexistir.
1.3. Las representaciones: los datos
Representacin de
conocimientos
Podemos representar conocimientos escribiendo a mano
sobre un papel, grabando bytes en un disco magntico segn un formato y una codificacin determinados, etc.
Nosotros aqu nos ocuparemos de las representaciones informticas, y hablaremos de datos, ficheros, bases de datos, registros, campos, bytes, discos, etc.
Damos el nombre de datos a las representaciones fsicas de los conocimientos que tenemos de los objetos del mundo real. El paso de los
conocimientos a los datos, o de una concepcin a una representacin
informtica, no es automtico. Es un proceso humano: un proceso de
diseo.
Obviamente, en este caso como en el caso del paso del mundo real al de las
concepciones, tambin hay pluralismo. Un mismo conjunto de conocimientos se puede representar de muchas formas; por ejemplo, en forma de base de
datos relacional o como ficheros tradicionales, con vectores o sin ellos, con
longitud fija o variable, con codificacin ASCII o EBCDIC, etc. Una visin o
concepcin del mundo real de un hospital, de una universidad o de una distribuidora de productos se podr representar de muchas formas sobre soportes
fsicos informticos.
Sin ningn tipo de duda, las tareas ms importantes del analista/diseador de
SI o de aplicaciones informticas son las siguientes:
1) Analizar los objetos del mundo real, y hacer abstracciones y obtener una
concepcin lgica de ellos.
2) Disear una representacin informtica concreta que se pueda tratar eficientemente.
Diseos diferentes
Se pueden hacer muchos diseos diferentes de representacin informtica que correspondan a un nico modelo
conceptual de una realidad.
Todos pueden representar la
misma realidad, pero tendrn
una eficiencia diferente segn
la utilizacin que se haga de
ellos.
FUOC PID_00171666
10
1.4. La interpretacin
Acabamos de ver el camino que nos conduce de la realidad a los conocimientos, y de stos a los datos o las representaciones. Sin embargo,
nos har falta interpretar la representacin. El proceso inverso al de representacin se denomina interpretacin.
Para reflexionar
Cmo se puede obtener conocimientos e informacin de
una representacin?
FUOC PID_00171666
11
En trminos lingsticos, una informacin (un conocimiento elemental) se puede expresar con un sujeto (el estudiante concreto) y un predicado ("naci en 1979"). El predicado est formado por el verbo y el
complemento.
Con conectores lgicos (o, y, no) podemos expresar conocimientos ms complejos. Por ejemplo, "este estudiante concreto se llama Juan Garca y naci en
1979".
2.2. Entidades, atributos y valores
Desde un punto de vista informtico utilizamos unos trminos diferentes de
los que se emplean en lingstica.
Se denominan entidades los objetos que conceptualizamos como distinguibles unos de otros (es decir, que son identificables), y de los que
nos interesan algunas propiedades. El trmino entidad se corresponde
con el trmino sujeto del campo de la lingstica. Es la conceptualizacin del objeto al que hace referencia la informacin.
El predicado es la propiedad descrita, y sus dos partes, verbo y complemento, las denominamos atributo (ao de nacimiento) y valor (1979),
respectivamente.
Ved tambin
Para ampliar la informacin sobre el mundo conceptual, consultad el subapartado 1.2 de
este mdulo didctico.
FUOC PID_00171666
12
Figura 2
Toda informacin se caracteriza por los tres elementos siguientes: entidad, atributo y valor. Si slo conocemos el atributo (ao de nacimiento) y el valor (1979),
no tenemos informacin, ya que no sabemos a qu entidad (estudiante) hace
referencia. Si no conocemos el atributo, no sabremos a qu hace referencia el
valor (el nmero 1979 es el ao de nacimiento?, o tal vez se trata del nmero
de matrcula o de la altura en milmetros?).
Para aclarar y precisar el significado de estos tres trminos, entidad, atributo y
valor, utilizaremos conceptos elementales de la teora de conjuntos.
Situados en este marco de la teora de conjuntos, podemos considerar el atributo ao de nacimiento como una correspondencia entre los estudiantes y los
aos del calendario. Cada estudiante tiene un solo ao de nacimiento, y diferentes estudiantes pueden tener el mismo ao de nacimiento. Es decir, la
correspondencia entre los estudiantes y los aos puede ser vista como una
aplicacin (en el sentido de las matemticas) del conjunto de los estudiantes
sobre el conjunto de los aos.
Figura 3
13
FUOC PID_00171666
Figura 4.
FUOC PID_00171666
14
pero tal vez tambin queremos incluir valores anteriores. As, de este modo, el
valor 3 del atributo nmero de hijos de Juan Garca no constituye una informacin suficientemente completa, si no sabemos a qu momento corresponde.
Incluso los atributos estables, como por ejemplo el DNI de un estudiante, pueden cambiar en el mundo real. Sin embargo, aunque no sea as, en un SI todo
atributo puede cambiar de valor en el tiempo. Por ejemplo, hemos introducido
un DNI errneo, y lo detectamos y lo cambiamos al cabo de unos meses. Dado
que durante estos meses hemos podido comunicar el DNI errneo al mundo
exterior, nos convendra tener registrado en el SI los dos nmero de DNI y la
fecha del cambio.
En general, para tener bien caracterizada una informacin no es suficiente con los tres elementos entidad, atributo y valor, sino que nos
har falta el tiempo.
Figura 5
Y tal vez no tendremos suficiente con slo un tiempo, sino que nos harn
falta varios: el momento en que se produjo el cambio en el mundo real, el
momento en que se introdujo en el SI, etc.
FUOC PID_00171666
15
Ejemplo
El nmero entero 981 o la serie de smbolos A 321.6, por
ejemplo, no forman parte del
dominio del atributo ao de
nacimiento de los estudiantes
de nuestro mundo real.
dominiodeeseatributoaceptaelvalornulo.
Nota
Podemos desconocer el nombre o el ao de nacimiento de un determinado estudiante. Tambin puede suceder que algn estudiante no tenga DNI. Cuando
esto ocurre, al definir el dominio del atributo deberemos indicar si aceptamos
o no el valor nulo.
2.5. Identificadores y claves
Recordemos que en la teora de conjuntos se denomina aplicacininyectiva
aquella aplicacin en la que a cada elemento del conjunto imagen le corresponde un elemento del conjunto origen origen como mximo. De este modo,
el atributo ao de nacimiento no es una aplicacin inyectiva, porque varios estudiantes pueden haber nacido el mismo ao.
Sin embargo, el atributo nmero de matrcula s es una aplicacin inyectiva, ya
que en nuestro mundo real, en el mbito de la matriculacin de estudiantes,
no se acepta que dos de ellos tengan el mismo nmero de matrcula. Precisamente, este nmero se utiliza para distinguir unos de otros; es decir, para
identificarlos.
Los atributos son identificadores o no, segn los objetos que nos interesa modelar. Si nos referimos a las personas, el DNI de una persona es un identificador. Sin embargo, si el mundo real que consideramos se refiere a seguros de
FUOC PID_00171666
16
accidentes, los objetos de nuestro inters sern los accidentes de trfico, y entonces el atributo DNI (el DNI del conductor), no ser un atributo identificador, ya que dos accidentes podran ser del mismo conductor.
Una entidad puede tener ms de un identificador, o incluso no tener ninguno.
Los estudiantes pueden quedar identificados tanto por el nmero de matrcula
como por el DNI. Sin embargo, puede ocurrir que la entidad no tenga ningn
atributo identificador. Por ejemplo, si consideramos los objetos ciudad con los
atributos nombre ciudad, nmero de habitantes, pas y superficie de arbolado, nos
encontramos con que el nombre ciudad no identifica una ciudad, ya que pue-
Nombres de ciudades
El nombre de las ciudades no
es suficiente para identificarlas,
porque un solo nombre puede
hacer referencia a varias ciudades; por ejemplo, en Venezuela hay una ciudad que tiene
por nombre Barcelona.
den existir ciudades con el mismo nombre en diferentes pases. Entonces, para identificar las ciudades tendremos que utilizar conjuntamente la pareja de
atributos pas y nombre ciudad.
Conjuntos de atributos
Como ya hemos visto anteriormente, las entidades corresponden a objetos que podemos
identificar o distinguir. Para distinguir a los estudiantes, podemos utilizar el atributo nmero de matrcula, ya que se trata de un atributo identificador. Sin embargo, en el caso de
los accidentes de trfico, el DNI del conductor no nos identifica el accidente. Ya que no
hay un atributo identificador, podramos identificar los accidentes con el par DNI del conductor y fecha y hora, o tal vez el conjunto de atributos pas, nombre ciudad, calle, nmero,
fecha y hora, o cualquier otro conjunto de atributos que nos diferenciase los accidentes.
Ved tambin
Consultad el concepto de entidad en el subapartado 2.2 de
este mdulo didctico.
Todo atributo o conjunto de atributos que permite identificar las entidades individuales recibe el nombre de clave.
Nota
Todo atributo identificador
esuna clave, pero no toda clavees un atributo identificador.
FUOC PID_00171666
17
Por ejemplo, no ser posible un atributo nota tal que cada estudiantes pueda
tener ms de una nota, ya que entonces no sera una aplicacin, sino una
correspondencia.
Figura 6.
FUOC PID_00171666
18
Algunos autores tambin incluyen una tercera acepcin y consideran una entidad como el conjunto de instancias de una entidad
tipo.
FUOC PID_00171666
19
Ahora veremos los principales conceptos y trminos que se utilizan en el campo de las representaciones informticas, el mundo de los datos.
3.1. La representacin tabular
La informacin pertenece al dominio conceptual o mental. Sin embargo, para
transmitirla y procesarla necesitamos representarla fsicamente. La representacin informtica de una informacin elemental se denomina dato. El mundo
de las representaciones ser el mundo de los datos, y para describirlo hablaremos de ficheros, registros, campos, BD, soportes, etc.
La figura 5 es, en realidad, una representacin grfica, no informatizada, de la
informacin de los estudiantes. Se ha hecho utilizando este papel como soporte. Sin embargo, como hemos podido observar, con tantas flechas y conjuntos, no resulta demasiado cmoda para procesarla o transmitirla; esto sucede
especialmente en un caso real, en el que habra decenas de atributos y miles
de estudiantes. Resulta mucho ms sencillo llevar a cabo una representacin
tabular con una fila para cada entidad individual y una columna para cada
atributo.
Figura 7
Ved tambin
Podis ver la figura 5 en el
subapartado 2.2 de este mdulo didctico.
FUOC PID_00171666
20
El esquema (formato o cabecera) de esta tabla se podra escribir de la siguiente forma: E(a1, a2, ..., aj, ..., am). Podramos considerarlo una representacin de la entidad tipo E, es decir, el tipo de las entidades instancia
ei, i = 1 a n. Todas las ei tienen la misma estructura; en otros trminos,
tienen los mismos atributos aj, donde j = 1 a m.
FUOC PID_00171666
21
FUOC PID_00171666
22
Supongamos que los tipos de objetos de nuestro inters son estudiantes, asignaturas y profesores, y que los atributos de las tres entidades son los siguientes:
a)Estudiante: nmero de matrcula, DNI del estudiante, ao de nacimiento, nombre del estudiante.
b)Asignatura: cdigo, nombre de la asignatura, crditos.
c)Profesor: DNI del profesor, nombre del profesor, despacho.
Podremos representar estas entidades mediante tres ficheros, uno para cada
entidad, con los campos correspondientes a los atributos. Sin embargo, falta la
informacin que permite interrelacionar las entidades entre s. Supongamos
que estas interrelaciones son las siguientes:
1) Cualquier estudiante puede cursar ms de una asignatura y, evidentemente,
cualquier asignatura puede ser cursada por muchos estudiantes.
2) Toda asignatura viene dada por un solo profesor, pero cada profesor puede
impartir varias asignaturas.
3) Supongamos tambin que nos interesa la nota que el estudiante tiene de
cada asignatura. Se trata de un atributo, nota, que no es propiamente del estudiante (ya que tiene una por asignatura) ni de la asignatura (ya que tiene tantas como estudiantes la cursan). Equivaldra a un atributo de la interrelacin
entre asignatura y estudiante.
Figura 9
Actividad
Cules son las interrelacionesentre alumnos, asignaturas y
profesores?
FUOC PID_00171666
23
FUOC PID_00171666
24
Ejemplo
Un libro de registro de movimientos bancarios, que
tiene una lnea (un registro)
para cada movimiento.
En la secretara de una escuela hay un archivador
con cajones llenos de fichas, donde se registra la
informacin de los estudiantes (una ficha por estudiante). Es el fichero de los
estudiantes.
El software de ficheros y el de BD nos dan unas posibilidadesdeorganizacin parecidas a las del mundo no informtico, y otras mucho ms
sofisticadas. Son similares a las que el estudiante conoce como estructuras de datos en memoria interna. Son las secuencias, listas encadenadas, vectores, ndices en forma de rbol equilibrado, hashing, etc. Sin
embargo, se tendrn en cuenta las caractersticas propias de los soportes
persistentes.
Actividad
Cul ser la estructura u organizacin que daremos a los datos en un soporte informtico?
Cmo las colocaremos?
FUOC PID_00171666
25
La posicin p
Cuando aqu hablamos de una
posicin p, no nos referimosa una posicin byte (el byte
nmero p dentro del fichero),
sino a una posicin registro.
Cada registro ocupa unaposicin y en cada posicin puede haber un registro.Recordad
que aqu slohablamos de ficheros de datos estructurados
en registros.
26
FUOC PID_00171666
Por posicin
Por valor
Secuencial
SP
SV
Directo
DP
DV
FUOC PID_00171666
27
Para hacer la programacin sencilla e independiente de las realizaciones, interesa que los programas no tengan que gestionar la organizacin
y los accesos en el nivel fsico, sino slo el nivel lgico.
FUOC PID_00171666
28
4. La memoria persistente
(3)
FUOC PID_00171666
29
Del mismo modo que la unidad de transferencia entre la memoria persistente y los buffers es el bloque, la unidad de transferencia entre los
buffers y el programa de usuario es el registro.
Figura 12.
FUOC PID_00171666
30
FUOC PID_00171666
31
Los dispositivos de disco suelen ir equipados con un buffer local para poder
realizar la transferencia a la memoria interna asncronamente y a gran velocidad, aprovechando el ancho de banda del canal.
4.4. Caractersticas bsicas de los soportes
Acabamos de recordar una caracterstica bsica de los soportes: el tiempo de
acceso. Del resto de caractersticas que nos pueden interesar haremos un breve
recordatorio.
En la figura siguiente representamos un tringulo con los tipos de perifricos
ms utilizados actualmente para almacenar datos. Las memorias que aparecen
en niveles ms altos corresponden a aquellas que permiten mejor tiempo de
acceso y en consecuencia tienen un precio ms elevado. Hay otro mecanismo de almacenamiento bastante utilizado durante los ltimos aos que no se
acostumbra a incluir en la jerarqua de memorias externas: el almacenamiento en red. El almacenamiento en red permite almacenar datos remotamente
utilizando una red de computadores.
FUOC PID_00171666
32
Resumen
En este primer mdulo hemos hecho una introduccin a los conceptos bsicos
que fundamentan el resto de la asignatura.
Hemos explicado que los conocimientos que obtenemos observando los objetos del mundo real son abstracciones que denominamos informacin. Una
informacin expresa el valordeunatributo (propiedad) para una entidad
determinada (objeto). Hemos formalizado algunos de estos conceptos utilizando la teora de conjuntos.
A continuacin se ha distinguido entre entidadgenrica (o tipo) y entidad
instancia. Las entidades instancia se debern diferenciar unas de otras mediante un atributo (identificador) o un conjunto de atributos, que denominamos clave.
La representacin informtica de una informacin recibe el nombre de dato.
Los datos de cada objeto se agrupan en registros y los registros se estructuran
en ficheros o BD (conjuntos de ficheros interrelacionados). Estos ficheros o
BD se almacenan en memoriasexternas permanentes, cuyo tiempo de acceso
es mucho ms elevado que el de las memorias internas, que son voltiles.
FUOC PID_00171666
33
Ejercicios de autoevaluacin
1. Cules son los tres elementos que determinan una informacin?
2. Indicad a qu podran corresponder en el mundo de nuestra secretara no informatizada
los siguientes conceptos:
Entidad instancia
Entidad tipo
Base de datos
Soporte permanente
3. Los valores de los datos son suficientes por s solos para ser interpretados y obtener informacin de ellos?
FUOC PID_00171666
34
Solucionario
Ejercicios de autoevaluacin
1. Entidad, atributo y valor (podramos aadir el tiempo).
2.
3. El valor "1988", por ejemplo, no es suficiente por s solo para saber si se trata de la fecha
de nacimiento, de la fecha de matrcula, de un importe de un pago, etc. Si sabemos que
el atributo se denomina DAT4, todava no sabremos gran cosa. Debemos averiguar a qu
atributo pertenece el valor y, adems, qu semntica tiene el atributo.
FUOC PID_00171666
35
Glosario
atributo m Propiedad de una entidad.
base de datos f Conjunto de ficheros interrelacionados.
campo m Representacin del valor de un atributo.
clave f Atributo o conjunto de atributos que permite identificar los objetos (distinguirlos
unos de otros).
dato m Nombre que recibe la informacin en el mundo de las representaciones informticas.
entidad f Conceptualizacin de un objeto del mundo real. El concepto del cual la entidad
es una instancia, se denomina tambin tipo de entidad.
fichero m Conjunto de registros relativos a un mismo tipo de entidad.
identificador m Un atributo es un identificador, si es una clave (monoatributo).
memoria permanente f Memoria auxiliar externa con soporte persistente que se utiliza
para mantener almacenados los datos permanentemente.
organizacin f Forma en la que se colocan o se estructuran los datos para facilitar su
posterior uso.
registro m Conjunto de datos relativos a un objeto.
sistema de informacin (SI) m Sistema que recoge, almacena y distribuye informacin
sobre el estado de un dominio.
FUOC PID_00171666
36
Bibliografa
Bibliografa bsica
Falkenberg, E.D. (1996). "A Framework of Information System Concepts. The FRISCO Report". IFIP WG 8.1 Task Group FRISCO. Desde el ao 1998 tambin est disponible en Internet.
Es conocido como informe FRISCO. Muy interesante para aquellos que queris profundizar
en marcos conceptuales del tipo de los "tres mundos" que hemos utilizado aqu.
Silberschatz, A.; Korth, H. F.; Sudarshan, S. (2006). Fundamentos de diseo de bases de
datos (5. ed.). Madrid: McGraw Hill.
Bibliografa complementaria
Para ampliar vuestros conocimientos sobre las memorias persistentes, los documentos tcnicos y comerciales de los fabricantes o los distribuidores pueden ser una buena fuente de
informacin. Una va de acceso a estos documentos puede ser Internet.