Você está na página 1de 20

Podaci i informacije

7.

PODACI I INFORMACIJE

7.1. 7.1.1.

PODACI Semiotika

Semiotika je znanstvena disciplina koja se bavi prouavanjem komunikacije pomou jezika ili drugih simbola. Takav oblik komunikacije postoji ne samo meu ljudima ve i meu ivotinjama i raunalima. Semiotika svoje temelje nalazi u podrujima filozofije i lingvistike, te je po svojoj prirodi interdisciplinarna. Na neki nain, semiotika je poznatija kroz svoja tri osnovna podruja, a to su:
q q q

Sintaktika. Semantika. Pragmatika.

Sintaktika se bavi nainima i pravilima konstrukcije reenica od manjih dijelova, kao to su rijei i fraze. Pri analizi sintakse neke reenice u prvom koraku se identificiraju osnovni elementi iji niz tvori reenicu. Kod prirodnih jezika to su prije svega rijei, dok kod umjetnih jezika ti elementi mogu biti leksemi, tokeni ili formule. U narednom koraku se analizira kako ti osnovni elementi tvore sloenije strukture. Ukratko, sintaksa se bavi formom jezika, odnosno formom elemenata koje koristi za izraavanje. Semantika se bavi prouavanjem znaenja jezika, odnosno prouavanjem odnosa jezinih izraza i stvarnosti. Najei pristup semantikim tumaenjima je taj da je smisao reenice potpuno odreen smislom njenih elemenata. Po tom principu najprije je potrebno odrediti znaenje pojedinih rijei, zatim njihovim kombiniranjem odrediti znaenje veih struktura i tako dalje dok se ne utvrdi potpuno znaenje reenice. Pragmatika se bavi konkretnom upotrebom jezika izmeu subjekata u komuniciranju. Kod prirodnih jezika se esto pokazuje da sintaksa i semantika nisu dovoljne za potpuno razumijevanje jezika. Ista reenica za razliite ljude ili u razliitim situacijama moe imati razliito znaenje. Kod umjetnih, posebice programskih jezika, pragmatika ne postoji. Izraavanje programskim jezicima mora biti nedvosmisleno, jednoznano i instruktivno, potujui na prvom mjestu pravila sintakse. Semantika i pragmatika postaju posebno vane u domeni umjetne inteligencije kod sustava za razumijevanje prirodnog jezika i govora.

121

Poslovna informatika

7.1.2.

Vrste podataka

Prije razmatranja vrsta podatka potrebno je razmotriti nekoliko bliskih pojmova koji se esto pogreno tretiraju kao sinonimi. Unato velikoj pojmovnoj slinosti, meu njima postoje i znaajne razlike bitne za razumijevanje informacijskih i komunikacijskih procesa. Osnovni pojmovi vezani za ove procese na semiotskoj razini su:
q q q q

Podatak. Poruka. Signal. Informacija.

Podatak je iskaz u nekom jeziku koji odraava stanje neega. Za analizu podatka su vana sva tri podruja semiotike. Pojedini jezici za tvorbu iskaza koriste ogranieni skup znakova koji se naziva alfabet. Kombiniranjem znakova u nizove i nizova u sloenije strukture prema pravilima sintakse jezika dobiva se formalno ispravan iskaz. Svakom nizu znakova u toj strukturi mora biti odreeno semantiko znaenje, te preko tih znaenja i ukupno znaenje iskaza. Ukoliko se takav iskaz tvori u prirodnom jeziku, pragmatika e se oitovati kroz iskustvo tvorca podatka. Poruka je podatak koji se razmjenjuje izmeu dva subjekta u procesu komunikacije. Oba subjekta komunikacije moraju poznavati jezik u kome je iskazan podatak koji se prenosi. Pri tome podatak moe biti razmijenjen na tri razine, na nain da svaka via razina ukljuuje one nie, a to su: Sintaktika razina, koja je uvijek nuna, a tipina je za razmjenu poruka izmeu ureaja. Ukoliko ova razina nije zadovoljena onda je vjerojatno nastupila greka u komunikaciji i smatra se da poruka nije korektna, te se obino trai provjera i ponovno slanje. Semantika razina, koja se uglavnom ostvaruje meu ljudima koji koriste neki jezik vieg stupnja formalizacije nego kod prirodnog jezika. Ova razina se ostvaruje i u komunikaciji ovjeka s raunalom uz koritenje produkata umjetne inteligencije. Pragmatika razina, koja se ostvaruje kada se komunikacija odvija meu ljudima. Osim poznavanja sintakse i semantike upotrijebljenog jezika sudionici komunikacije moraju imati i isti pragmatski odnos prema onome to podatak odraava.

Ukoliko sudionici komunikacije ne poznaju ili ne koriste isti jezik, mora u komunikacijski proces biti uveden posrednik, odnosno prevoditelj. To je tipi na situacija komunikacije izmeu ovjeka i raunala. Ovisno o razini komunikacije koriste se razliiti prevoditelji, od kodiranja na razini hardvera, preko programa

122

Podaci i informacije

prevoditelja, do raunalnih korisnikih suelja prirodnim jezikom. Posrednici u komunikaciji postoje i izmeu strojeva, odnosno raunala koja koriste razliite komunikacijske protokole. Signal je fiziki nositelj poruke pri komunikaciji izmeu prostorno ili vremenski udaljenih poiljatelja i primatelja poruka. Signal stvara poseban ure aj koji se naziva izvor signala, te sadraj poruke pretvara u: Prostorne signale, koji su statini, kao to su knjige, spomenici, prometni znakovi i slini zapisi koji koriste izvorne znakove i simbole. Vremenske signale, koji su dinamini, gdje se poruka prenosi slijedom razliitih stanja komunikacijskog medija, kao to su svjetlosne zrake ili elektromagnetski valovi i koriste kodirane znakove i simbole.

Informacija je novost ili vijest. U ovom kontekstu treba je tumaiti kao ovjekov spoznajni doivljaj poruke. Ako poruka za primatelja ima spoznajnu vrijednost, ona je informacija. Informacija ne moe postojati na sintakti koj razini poruke nego mora ukljuivati semantiku i gotovo redovito pragmatiku razinu, budui se pragmatsko iskustvo formira upravo na osnovu informacija. O pojmu i osobinama informacije vie e rijei biti u narednom poglavlju. Klasifikacija podataka moe se provesti po nizu razliitih kriterija. Ovdje se navode samo dva bitna za razumijevanje procesa obrade podataka. Prema kriteriju tko podatke koristi u komunikaciji, odnosno izmeu koga se razmjenjuju, razlikuju se semantike i fizike jedinice podataka. O njima e vie rijei biti u nastavku. Prema drugom kriteriju, kriteriju strukturiranosti, podaci mogu biti:
q

Formatizirani podaci imaju utvrenu strukturu, odnosno shemu kojom je odreeno koji se podaci u nju mogu uvrstiti, koja je njihova pozicija, tip i predviena duina, odnosno broj znakova i slino. Semantiko znaenje formatiziranih podataka mogue je ustanoviti tek ako je poznat toan opis njihove strukture. Upotreba formatiziranih podataka dominira u poslovnim informacijskim sustavima jer olakava i ubrzava raunalnu obradu podataka. Neformatizirani podaci nemaju utvrene strukture i najee se pojavljuju u formi slobodnog teksta. Multimedijski sadraji su suvremeni primjer neformatiziranih podataka. Semantiko znaenje tih podataka je oito na temelju samih podataka. To je velika prednost s pozicije korisnika, ali ni suvremeni sustavi za elektroniku obradu podataka nisu jo dovoljno uinkoviti pri obradi takvih podataka, te ih se koristi samo u nekim specifinim podrujima.

U nastavku je rije o formatiziranim jedinicama podataka koje tvore strukturu baza i skladita podataka suvremenih poslovnih informacijskih sustava.

123

Poslovna informatika

7.1.3.

Semantike jedinice podataka

Pod semantikim jedinicama podataka razumijevaju se jedinice podataka koje se koriste u komunikaciji izmeu ljudi. Semantike jedinice podataka se razlikuju po svojoj ulozi u komunikaciji, po svojoj sloenosti, veliini i organiziranosti. U skladu s njihovom meuovisnosti mogu biti hijerarhijski strukturirane na slijedei nain.
q

Znak je najmanja semantika jedinica podataka. Osim osnovnog skupa alfanumerikih znakova koji ine slova abecede i znamenke, u znakove ubrajamo i matematike i logike operatore, znakove interpunkcije te druge specijalne znakove. Pojmovi su smislene kombinacije fiziki susjednih znakova. Pojam je osnovna i ujedno najvanija semantika jedinica podataka upravo zbog smislenosti sadraja kojom se oznaavaju svi objekti koje poznajemo te njihova svojstava. Segment se u formalnom smislu sastoji od grupe fiziki susjednih pojmova koje moemo ujediniti u jednom nadreenom pojmu. Ovisno u semantikim uvjetima, segment se moe u nekim situacijama tretirati kao jedinstven pojam, a u drugim kao logiki povezan skup pojmova. Slog se sastoji od grupe meusobno logiki povezanih pojmova. Logika veza se temelji na tome da se svi pojmovi u slogu odnose na odreeni tip objekta i njegova svojstva. Na taj nain slog u semantikom smislu potpuno opisuje pojedini tip objekta. U sadrajnom smislu, vrijednost sloga, odnosno vrijednosti pojedinih pojmova, odnose se na vrijednosti pojedinih svojstava tono odreenog objekta. Datoteka je skup obino istovrsnih slogova. Kako se pojedini slog odnosi na tono odreenu jedinku nekog tipa objekata, svakoj jedinci tog tipa objekta pripada zaseban slog. Skup svih slogova koji se odnose na sve jedinke nekog tipa objekta ini datoteku. Baza podataka je sloena semantika jedinica podataka, a ini je skup datoteka koje se odnose na neko problemsko podruje. U okviru zadanog problemskog podruja postoji vie tipova objekata koji su od interesa. Za svaki tip objekta se tvori datoteka u skladu sa njegovim svojstvima, a sustav tih datoteka ini bazu podataka. Baza podataka nije jednostavni skup razliitih datoteka ve se spram njene organizacije postavlja itav niz uvjeta. Skladite podataka je novija najsloenija i najvea semantika jedinica podataka. To je zapravo poseban tip baze podataka prilagoen pretraivanju izuzetno velikih koliina podataka. Postojei podaci se ne mijenjaju ve samo nadopunjavaju novim. Pohranjeni podaci, kako tekui tako i podaci prethodnih razdoblja, objedinjeni su iz vie baza podataka i vanjskih izvora.

124

Podaci i informacije

7.1.4.

Fizike jedinice podataka

Fizike jedinice podataka u svom radu koriste raunala i drugi ureaji digitalne elektronike. One formiraju strukturu podataka na raunalnim memorijama. Znaajnije fizike jedinice podataka su:
q

Bit je osnovna fizika jedinica podataka. Ujedno je bit u teoriji informacija jedinica mjere za koliinu informacija. Bit moe poprimiti samo dvije vrijednosti koje se mogu razliito oznaavati, sa da i ne, T i F, ali zbog uske povezanosti sa binarnim brojevnim sustavom obino se koriste oznake 1 i 0, pogotovo kada se radi o fizikim jedinicama podataka unutar raunalnih sustava. No te fizike vrijednosti mogu, ali i ne moraju predstavljati i semantike odnosno brojane vrijednosti 1 i 0. Fizika realizacija bita unutar digitalnih ureaja je bistabil, elektroniki element koji moe imati samo dva stabilna stanja. Realizacija bistabila kao elektroni kog elementa je bitno jednostavnija u odnosu na elektronike elemente koji imaju vie stabilnih stanja, na primjer deset, pa je to i jedan od tehnolokih razloga za odabir bita kao najmanje fizike jedinice podataka. Tetrada je sloenija fizika jedinica podataka koja se sastoji od kombinacije etiri bita. Njena uloga kao fizike jedinice podataka je u svezi s heksadecimalnim brojevnim sustavom, odnosno fizikim predstavljanjem semantikih znamenaka tog brojevnog sustava. Bajt je naredna fizika jedinica podataka koja se sastoji od kombinacije osam bitova, odnosno dvije tetrade. Poseban znaaj bajt ima zbog veze sa najmanjom semantikom jedinicom, odnosno znakom. On se najee koristi za fiziko predstavljanje potpunog skupa semantikih znakova, uspostavljajui odnos jedan znak, jedan bajt. Rije je osnovna fizika jedinica podataka koju koristi raunalo na razini centralne jedinice, odnosno procesora. Obino se radi o kombinaciji etiri bajta, ali ovisno o vrsti procesora, mogue su kombinacije od dva bajta poznate kao polurije, ili kombinacije od osam bajtova koje ine dvostruku rije. Blok je fizika jedinica podataka koju raunalo koristi za razmjenu podataka izmeu centralne i perifernih jedinica. Tvori se kao kombinacija od N bajtova. Vrijednost broja N, odnosno veliina bloka ovisi uglavnom o performansama perifernih ureaja. to su ti ureaji bri, razumno je u jednom koraku prenijeti veu koliinu podataka da bi se bolje iskoristile mogunosti tih ureaja. Datoteka se moe smatrati i fizikom i semantikom jedinicom podataka. Kada je rije o datoteci kao fizikoj jedinici podataka, misli se na dio memorije na kome je pohranjena neka od veih semantikih jedinica.

125

Poslovna informatika

7.2. 7.2.1.

INFORMACIJE Podatak i informacija

Pojmovi podatak i informacija se esto koriste kao sinonimi, to nije tono. U prethodnom odjeljku je analiziran pojam i svojstva podatka, te je samo naznaeno u emu se informacija razlikuje od podatka. Reeno je da je informacija novost ili vijest i da je treba tumaiti kao ovjekov spoznajni doivljaj poruke, odnosno primljenih podataka. Ako poruka za primatelja ima spoznajnu vrijednost ona je informacija. U nastavku e razlika ova dva pojma biti dodatno razmatrana. S aspekta sustava za obradu podataka moe se rei da je informacija obraeni podatak, odnosno da je svrha obrade podataka pretvaranje podataka u informacije, ili da sustav za obradu podataka proizvodi informacije. To ne zna i da je svaki izlaz iz sustava za obradu podataka informacija. Mjera za to je korisnik izlaza sustava za obradu podataka. Na slici 7.01. ilustriran je osnovni koncept transformacije podataka u informacije.
Sustav za obradu podataka Podaci Ulaz Obrada Izlaz Informacije

Slika 7.01. Transformacija podataka u informacije Neobraeni podaci imaju malu informacijsku vrijednost. Oni predstavljaju tek osnovu za usporeivanje s drugim podacima, usporeivanje s podacima ranijih razdoblja, usporeivanje s podacima o slinim situacijama, ili su osnova za predvianje buduih vrijednosti atributa na koje se odnose. Relativni brojevi poveavaju informacijsku vrijednost podataka. Da bi podaci dobili informacijsku vrijednost, mora se izvriti njihova komparativna i strukturna analiza, vremenskim sljedovima podataka unijeti potrebnu dinamiku, odvojiti bitno od nebitnog i slino. Napomena s poetka ovog odjeljka, da se pojmovi podatak i informacija esto pogreno koriste kao sinonimi, moe se djelomino opravdati relativnou pojma informacije u odnosu na podatak. Nekoliko je razloga za to.
q

Da li e podatak biti informacija ili ne, ne ovisi primarno o njemu samom, ve o primatelju poruke. Za nekoga tko u podatku prepozna sadraj koji moe korisno upotrijebiti, podatak e postati informacija, a za nekog drugog nee.

126

Podaci i informacije

Ako je primatelj upotrijebio informaciju za neku smislenu aktivnost, ona obino time gubi svoju vrijednost i opet postaje podatak. I kada podatak ima informacijsku vrijednost, ona s vremenom slabi te ostaje samo podatak. Izlaz iz svakog sustava je ulaz u neki drugi sustav. Informacije koje su izlaz iz sustava za obradu podataka javljaju se kao ulazni podaci u nekom drugom sustavu za obradu podataka, kako je prikazano na slici 7.02. Pri tome treba ipak naglasiti da se to ne deava bez posredovanja korisnika informacija ili vremenskog pomaka, to i uvjetuje prelazak informacije ponovo u podatak.
Obrada Informacije podataka Podaci Obrada Informacije podataka Podaci Obrada Informacije podataka

Podaci

Slika 7.02. Relativni odnos podatka i informacije 7.2.2. Neka tumaenja pojma informacije

Informacija je postala kljuni pojam za sve znanosti koje se bave razliitim aspektima komunikacije simbolima, to je potaknuto tehnolokim razvojem i naglim porastom koliine znanja. Zbog svoje kompleksnosti, informacija je postala interdisciplinarni fenomen ije pojedine aspekte pokuavaju protumaiti razliite znanosti. Neka od interesantnih vienja informacije navedena su u nastavku. Informacija kao svojstvo materije je rairena interpretacija informacije, po kojoj je informacija odraz, odnosno sadraj odraza materije, pri emu se razlikuju dvije vrste informacija: Objektivna informacija koja je svojstvo materije. Subjektivna informacija koja je odraz individualne svijesti o objektivnoj informaciji.

Informacija kao znaenje je vienje koje naglaava semantika svojstva informacije, odnosno ono to primatelj moe nauiti iz poruke, te da informacija na temelju smislene i svrhovite komunikacije mora biti upotrebljiva. Informacija kao dogaaj u komunikacijskom procesu, kada se primanjem poruke mijenja odreena predodba primatelja. Informacija kao smanjena neizvjesnost, odnosno kao osnova za odluivanje, bilo da se radi o smanjenju neizvjesnosti samim komunikacijskim procesom ili o podacima vrijednim za odluivanje, odnosno sredstvu za rjeavanje neizvjesnosti.

127

Poslovna informatika

Informacija kao znanstvena injenica i to na nekoliko razina, odnosno informacija poimana kao: Zakon. Hipoteza ili teorija. Osnova neke znanosti.

Informacija kao struktura, odnosno kao rezultat nekog procesa koji se moe tumaiti i kao organizacija. Informacija kao znanje moe se tumaiti na vie naina, odnosno informaciju se moe promatrati kao: Izvor znanja, pri emu je informacija osnova za uenje. Formu znanja, pri emu se informacija javlja kao nova forma znanja paralelna s postojeim znanjima. Model znanja, to je poimanje informacije kao univerzalnog naina tumaenja realnosti, a ne samo neke konkretne situacije.

Informacija kao komunikacijski fenomen koji se ostvaruje tek u komunikacijskom procesu izmeu dva subjekta, inae je razbijena na dva dijela: Znanje poiljatelja. Znanje primatelja.

Znaenje informacije lei u tome to je ona veza izmeu razdvojenih znanja i poruka. Percepcija informacije iskljuuje pasivnog promatraa i trai aktivnog sudionika. Zato je svojstvo informacije neodreena sugestivnost. Svatko u poruci moe uoiti ono to mu mo imaginacije doputa da zamijeti. Razumijevanje informacije odvija se ne samo svjesnom ve i podsvjesnom aktivnou. Prema nekim istraivanjima, s izvjesnim kanjenjem u mozgu, postajemo svjesni neega to je podsvjesno samo ako je podsvijest odluila da je to neto bitno. Informacija kao sustav i proces pretpostavlja stanovitu stalnost koja informaciju ini informacijom, bez obzira o kojoj se vrsti informacije radi, neovisno o njenim razliitim manifestacijama. Ta se stalnost vidi kao sustav formalnih postavki neovisan o iskustvu. Takav sustav je informacijski sustav, ali ne u njegovom uobiajenom znaenju ve u znaenju da je informacija sama po sebi sustav, odnosno ureeni skup elemenata koji se promatra kao cjelina. Na temelju prethodno navedenih razliitih tumaenja pojma informacije, moglo bi se rei da su sva ona ipak temeljena na jednoj te istoj osnovi kojoj razne znanstvene discipline i razliiti pristupi pridaju razliita znaenja. Ta zajednika osnova predmet je razliitih semiotikih interpretacija. Razliite interpretacije informacije se temelje ovisno o tome kojoj se komponenti i u kojem trenutku komunikacijskog procesa pridaje vea ili manja vanost.

128

Podaci i informacije

7.2.3.

Neke osobine informacije

Kljuna osobina informacije je njena vrijednost i u tom kontekstu se tumae sve ostale osobine informacije. Vrijednost informacije utvr uje se prema stupnju smanjenja neizvjesnosti i neodreenosti nekog problema. Tu vrijednost praktino se ne moe izravno mjeriti, ali se moe openito rei da su vrjednije one informacije koje su raspoloive u pravo vrijeme, koje su vezane ili se odnose na aktualne probleme i koje su naravno tone i pouzdane. Na osnovu toga se moe rei da su ostale osobine informacije, odnosno osnovni kriteriji utvrivanja njene vrijednosti sljedei:
q q q

Pravovremenost i aktualnost. Relevantnost. Tonost i pouzdanost.

Pravovremenost i aktualnost su vremenske dimenzije informacije. Pravovremenost znai da je informacija raspoloiva onda kada je potrebna. Informacija ima najveu vrijednost ako je raspoloiva onda kada je potrebna za rjeavanje problema. Ako je informacija raspoloiva sa zakanjenjem, njena vrijednost se bitno umanjuje. Aktualnost informacije odreuje se u odnosu na vrijeme kada je podatak nastao, odnosno na vrijeme dogaaja na koji se odnosi. Na slici 7.03. ilustrirano je kretanje vrijednosti informacije spram njene aktualnosti u odnosu na neki dogaaj koji se zbiva u trenutku T.
Vrijednost informacije

Predvianje

Aktualnost

Zastara

Vrijeme

Slika 7.03. Vremensko gaenje vrijednosti informacije Informacija ima najveu vrijednost ako omoguava predvianje dogaaja. Njena vrijednost opada u vremenskom intervalu aktualnosti, odnosno istovremenosti s dogaajem. Govori se o intervalu, a ne o trenutku budui sam dogaaj ima odreenu dinamiku i trajanje. Informacija naglo gubi vrijednost u periodu nakon dogaaja, odnosno periodu zastare. Informacija mora zadovoljavati oba vremenska kriterija, jer na primjer pravovremena, ali zastarjela informacija moe uvjetovati potpuno krive odluke.

129

Poslovna informatika

Relevantnost Kao najvanija osobina informacija istie se njihova relevantnost, to se moe opisati kao pogodnost informacija korisnikim potrebama. Unato svojstva subjektivnosti, pojma relevantnosti koji proistie iz odnosa informacije, problema i korisnika, ipak je mogue odrediti neke objektivne kriterije koji odreuju relevantnost informacije, a to su: Veza s poslovnom strategijom. Veza s poslovnim aktivnostima. Mjera dobitka upotrebom informacije i obrnuto. Uklapanje u vaei koncept upravljanja.

Relevantnost informacija je u predispoziciji da omogue razumijevanje problema. Relevantnost informacija je vea ako omoguava viedimenzionalni pogled na aktualni problem, odnosno informacije trebaju omoguiti uoavanje i razumijevanje veza meu pojedinim dimenzijama problema. Informacije bez konteksta i veze s drugim relevantnim informacijama su manje vrijedne. Vrijednost informacije je neposredno ovisna o ostalim informacijama koje se odnose na odreeni problem. Ukupna vrijednost skupa povezanih informacija vea je od prostog zbroja njihovih pojedinanih vrijednosti. Tonost, preciznost i pouzdanost Meu bitna svojstva informacije spadaju preciznost, tonost i pouzdanost. Tonost informacije je odnos sadraja informacije spram dogaaja ili stanja na koje se odnosi. Informacija je tona ako nema odstupanja njena sadraja od stvarnih stanja. Preciznost informacije je mjera tonosti informacije, odnosno relativnog doputenog odstupanja od stvarnih vrijednosti. Ona ovisi o potrebnoj pouzdanosti znanja o relevantnom problemu. Pitanje preciznosti informacija treba sagledati kroz dva osnovna kriterija:
q

Osjetljivost na pogreku. Ukoliko je sustav odluivanja osjetljiviji na greku u ulaznim informacijama, potrebna je vea preciznost. Trokovi i koristi. Standardni kriterij za neku odluku je odnos trokova i koristi, pa to vrijedi i za odreivanje potrebne preciznosti informacija. Iako je teoretski ispravna samo ona odluka koja je temeljena na potpuno tonim informacijama, esto trokovi prikupljanja takvih informacija premauju koristi kojima takve informacije doprinose. Stoga se u pravilu ustanovljava prihvatljiva razina preciznosti koja nee ugroziti ispravnost odluka, u smislu da mogue tete pogrenih odluka budu manje od ostvarenih uteda u procesu prikupljanja informacija.

Pouzdanost informacija je mjera njihove istinitosti, koja se moe iskazati stupnjem vjerojatnosti njene tonosti.

130

Podaci i informacije

7.3. 7.3.1.

ORGANIZACIJA PODATAKA Pojam organizacije podataka

Organizacija podataka je nain na koji je osigurano fiziko pohranjivanje podataka na vanjskim memorijama raunala, te njihova logika manipulacija od strane korisnika, odnosno aplikacijskih programa. Organizacija podataka mora podrati slijedee aktivnosti: Osiguranje memorijskog prostora za fiziki smjetaj podataka. Kreiranje sheme strukture podataka. Dodavanje novog podatka. Pronalaenje postojeeg podatka. Izmjena vrijednosti postojeeg podatka. Brisanje postojeeg podatka.

Navedene aktivnosti su nune za sve tipove organizacije podataka, a dovoljni su za organizaciju podataka na razini datoteka. Kod organizacije podataka na razini baza podataka postavljaju se zahtjevi za dodatne aktivnosti koje taj oblik organizacije mora podrati, a neke vanije su: Osiguranje integriteta podataka. Osiguranje referencijalnog integriteta. Eliminiranje redundantnih podataka. Mogunost viekorisnikog pristupa. Jednostavnost pristupa.

Ovisno o tome kako i na koji nain ispunjavaju navedene uvjete, razlikuju se slijedee vrste organizacije podataka:
q q q q q q q q

Sekvencijalna organizacija podataka. Indeks-sekvencijalna organizacija podataka. Relativna organizacija podataka. Direktna organizacija podataka. Hijerarhijska organizacija baze podataka. Mrena organizacija baze podataka. Relacijska organizacija baze podataka. Objektna organizacija baze podataka.

Prve etiri nabrojane vrste se odnose na organizaciju podataka na razini datoteka, a preostale etiri na baze podataka. Njihov redoslijed ujedno pokazuje i priblian kronoloki slijed njihove najintenzivnije primjene.

131

Poslovna informatika

7.3.2.

Organizacije podataka na razini datoteka

Sekvencijalna organizacija Sekvencijalna organizacija podataka je najjednostavniji oblik organizacije podataka na razini datoteke. Podaci koji su u semantikom formatu sloga, pohranjuju se u memoriju na prvo slijedee slobodno mjesto u memorijskom prostoru, kronoloki, kako podaci pristiu u sustav. Primjenjiva je na svim vrstama vanjskih memorija. Ta jednostavnost kod pohranjivanja podataka stvara probleme kod svih ostalih aktivnosti koje podrava organizacija podataka, jer nema nikakvih pokazatelja gdje se odreeni podatak nalazi unutar memorijskog prostora. Prilikom pretraivanja podataka unutar datoteke potrebno je krenuti od poetka datoteke prema kraju dok se ne pronae eljeni podatak. Takvo pretraivanje vremenski je ovisno o broju slogova u datoteci, odnosno o veliini datoteke. Prosjeno vrijeme pretraivanja razmjerno je broju slogova u datoteci. Kod velikih datoteka to vrijeme moe biti tako dugo da ovaj oblik organizacije podataka ini neprihvatljivim za veinu suvremenih naina obrade podataka. Indeks-sekvencijalna organizacija U nastojanjima da se unaprijedi sekvencijalna organizacija podataka nastala je indeks-sekvencijalna organizacija, koja nad osnovnom sekvencijalnom strukturom ima zasebnu indeksnu strukturu. Omoguava vrlo neposredan pristup podacima u datoteci. Dva su osnovna preduvjeta za ovaj tip organizacije podataka: Vanjska memorija mora imati mogunost neposrednog pristupa. Slog podataka mora imati signifikantno obiljeje.

Signifikantno obiljeje sloga podataka je pojam po ijoj se vrijednosti odreeni slog razlikuje od svih ostalih slogova u datoteci. Takav pojam, odnosno atribut, naziva se klju ili ifra. Ako meu prirodnim atributima objekta na koji se datoteka odnosi ne postoji takav koji zadovoljava postavljeni kriterij, onda se dodaje poseban, umjetno stvoren atribut koji preuzima ulogu kljua. Vanjska memorija na kojoj se realizira ovaj oblik organizacije podataka je u pravilu magnetski disk. Kada slog podataka treba memorirati, podaci se zapisuju slino kao kod sekvencijalne organizacije na slobodno mjesto u predvienom memorijskom prostoru, ali se istovremeno u indeksne tablice zapisuje vrijednost pripadajueg kljua sloga i memorijska adresa gdje je slog memoriran. Indeksne tablice su relativno jednostavne strukture koja se sastoji od dva stupca, u prvome se zapisuju kljuevi, a u drugom pripadajue adrese. Tablice se

132

Podaci i informacije

dodatno ureuju obino na nain da se posloe po rastuoj vrijednosti kljua. Time se bitno ubrzava njihovo pretraivanje, a u kombinaciji sa binarnim pretraivanjem dodatno ubrzava. Ako se radi o velikim datotekama mogue su sloenije hijerarhijske strukture samih indeksnih tablica. Indeksne tablice se pohranjuju na vanjskoj memoriji u zasebnom memorijskom prostoru. Za pristup eljenim podacima potrebno je znati klju sloga. Sustav na temelju vrijednosti kljua pretrauje indeksnu tablicu dok ne pronae traenu vrijednost, te automatski pristupa podacima na memorijskoj adresi upisanoj u drugom stupcu indeksne tablice. Relativna organizacija Relativna organizacija je vrlo slina sekvencijalnoj organizaciji. Razlika se javlja pri koritenju vanjskih memorija s neposrednim pristupom. Kod relativne organizacije do nekog podatka je mogue doi direktno ako je poznat njegov relativni poloaj u odnosu na poetak datoteke, odnosno redni broj sloga. Direktna organizacija Direktna organizacija podataka omoguava stvarno neposredni ili direktni pristup podacima, a zahtijeva iste preduvjete kao i indeks-sekvencijalna organizacija. Razlika je u tome to se adresa memoriranja pojedinog sloga odreuje matematikim algoritmom iz vrijednosti kljua. Osnovni problem ovog oblika organizacije je efikasno koritenje memorije zbog potekoa u preraunavanju vrijednosti kljua pojedinog sloga u jedinstvenu adresu magnetskog diska, budui da ne smije doi do preklapanja adresa, pa pri tome dio memorije ostaje neiskoriten. 7.3.3. Baze podataka Za izgradnju baze podataka bitne su dvije komponente koje su u meusobnoj ovisnosti, a to su model podataka i sustav za upravljane bazom podataka, o kome je bilo rijei u prethodnim poglavljima. Model podataka predstavlja logiku osnovu za uspostavljane baze podataka, a ujedno i osnovu za razvoj sustava za upravljanje bazama podataka. Pod pojmom modela podataka podrazumijeva se nain predstavljanja podataka koji obuhvaa definiranje: Strukture podataka, odnosno osnovnih elemenata baze podataka. Pravila integriteta, koja ne smiju ovisiti o nainu fizike implementacije. Pravila manipulacije, odnosno skupa operacija koje se mogu izvoditi nad podacima, ukljuujui i definiranje jezika za manipulaciju podacima.

133

Poslovna informatika

Postoji definirano vie modela podataka, a etiri najznaajnija su:


q q q q

Hijerarhijski. Mreni. Relacijski. Objektni model podataka.

Navedeni redoslijed donekle odgovara kronolokom pojavljivanju i dominaciji pojedinih tipova modela. Hijerarhijski i mreni model nisu vie aktualni. Velika veina suvremenih baza podataka je realizirana na relacijskom modelu, a pred objektnim modelima je vjerojatno svijetla budunost. Stoga se mreni i hijerarhijski model nee posebno analizirati. Model podataka je neovisan o implementaciji, stoga bi pravila definirana za pojedini model trebala biti primjenjiva u svim sustavima za upravljanje bazama podataka baziranim na tom modelu. Odstupanja pojedinih sustava unutar modela postoje, ali su uglavnom nebitna za ovu razinu razmatranja.

Objektno orijentirane baze podataka


Objektno orijentirane (OO) baze podataka su odraz primjene objektne orijentacije na organizaciju baza podataka. Primjena objektne orijentacije kroz analizu i dizajn informacijskih sustava, posebice primjena OO programskih jezika pri izradi softvera, je ve potpuno afirmiran i gotovo dominantan koncept. No na podruju baza podataka situacija je neto drugaija. Iako je vrlo lako prihvatiti ideju OO baza podataka, postojea rjeenja sustava za njihovo upravljanje jo nisu dovoljno zrela. S druge strane postojei sustavi, posebice relacijske baze podataka, stalno se unaprjeuju i uvaju primat u primjeni. Narastajua koliina podataka koja karakterizira suvremene informacijske sustave uvjetuje da OO programski jezici nisu dovoljni, te se javlja potreba za razvojem objektno orijentiranih baza podataka i sustava za upravljanje tim bazama. OO baze podataka mogu biti preko sto puta bre i fleksibilnije za odreene tipove aplikacija u odnosu na relacijske baze podataka. Osnovne osobine sustava za upravljanje OO bazom podataka koje treba podravati su slijedee:

Postojanost objekta. Upravljanje velikom koliinom podataka. Integritet podataka i konkurentan viekorisniki pristup. Obnovljivost i sigurnost.

Postojanost objekta znai da objekt postoji i nakon to se proces u kome sudjeluje zavri, odnosno da je pohranjen u memoriji raunala. Ako objekt postoji, postoje dva naina da mu se pristupi. Objekt moe biti pohranjen u konvencionalnu bazu podataka, na primjer u relacijsku bazu, ili direktno kao

134

Podaci i informacije

objekt u OO bazi podataka. Ako se koristi konvencionalna baza podataka, objekt se pohranjuje rastavljen na niz komponenti. Te komponente prije koritenja treba sloiti u objekt to bitno naruava performanse sustava. Ako se koristi OO baza podataka traeni objekt se dobiva direktno i odmah se moe koristiti nakon dohvata iz baze podataka. Da bi mu se moglo pristupiti, objekt mora imati jednoznaan identitet, to se moe ostvariti pomou jednog od sljedeih naina: Fizike lokacije u memoriji (pointer). Primarnog kljua. Identifikatora.

Jedan od naina implementacije je sistemsko generiranje jedinstvenog identifikatora objekta. Na taj nain identitet objekta je neovisan o lokaciji ili o svojstvima objekta, to cijeli sustav ini fleksibilnijim. Konceptualno gledano, OO baze podataka pohranjuju cjelovite objekte, a to znai atribute i metode. Samo nekoliko komercijalno dostupnih OO baza podataka imaju mogunost pohranjivanja metoda u bazu podataka. Veina ih pohranjuje samo strukturu podataka, to je jedan od pokazatelja nedovoljne zrelosti ove tehnologije. Prednosti OO baza podataka ogledaju se u nekoliko kategorija, a osnovne su:
q

Prednosti koje proizlaze iz upotrebe objektno orijentiranog programiranja. OO baze podataka minimiziraju potrebu transfera objekata u i iz memorije pri OO programiranju. OO baze podataka smanjuju jaz izmeu objekata stvarnog svijeta i njihove reprezentacije u bazi podataka. Mogue je pohraniti veze izmeu objekata. OO baze podataka podravaju isto to i druge, uz bogatiju semantiku. OO baze podataka omoguavaju brze ad hoc upite. Bre pretraivanje i auriranje baze podataka. Podravanje dinamikog razvoja sheme podataka. Podravanje klijent/server arhitekture.

Prednosti koje proizlaze iz bogatstva semantikih mogunosti.

Prednosti OO baza podataka kao takvih. Samo neke od njih su:

Potekoe koje se javljaju kod razvoja i primjene OO baza podataka mogu se iskazati u nekoliko osnovnih vidova : Nepostojanje univerzalnog OO modela podataka. Ne postoji standard za OO pristupne jezike. OO baze podataka za sada jo nemaju stabilnu tehnologiju.

135

Poslovna informatika

7.4. 7.4.1.

RELACIJSKE BAZE PODATAKA Relacijski model podataka

Relacijski model podataka danas je dominantan u odnosu na ostale modele podataka, odnosno s vremenom je postao najprihvaeniji i u praksi najraireniji. Svoju veliku popularnost duguje prije svega strogoj matematikoj teoriji relacijske algebre na kojoj poiva, ime je njegova implementacija u praksi relativno jednostavna, uinkovita i pouzdana. Osnovne principe i strukturu relacijskog modela podataka postavio je matematiar E.F. Cood, pa se njegovo ime vrlo esto vee uz razne aspekte relacijskog modela podataka. Osnova relacijskog modela jest prikaz podataka pomou relacija. Uobiajen izraz u svakodnevnoj upotrebi za relaciju je tablica. Izraz je baziran na vizualnom izgledu relacije koja se najee prikazuje kao tablica kojoj stupci predstavljaju atribute, tj. njihove vrijednosti, a reci ili n-torke informacije o jednom entitetu relacije. Kao i ostali modeli podataka, i relacijski se bavi s tri osnovna aspekta modela podataka: definicijom, integritetom i manipulacijom. Zbog to boljeg razumijevanja modela, potrebno je najprije definirati neke vrlo vane pojmove: relacije, atributa, entiteta, primarnog kljua i domene. Relacija. Osnovni element relacijskog modela podataka jest relacija. Pojmovi relacija i tablica mogu se smatrati sinonimima, premda je relacija izvorni oblik povezan sa matematikim pojmom relacije kao neureene n-torke. Pod pojmom relacije smatra se pravokutno podruje koje se sastoji od stupaca, odnosno atributa, i redaka, odnosno n-torki, za koje vrijedi:
q q

Sve vrijednosti unutar jednog atributa su istog tipa podataka. Svaka vrijednost za sebe unutar n-torke predstavlja samo odreeni broj ili skup znakova i nita vie. Ako se promatra samo jedna vrijednost, ne moe se nita doznati o ostalim vrijednostima u relaciji.

Svaki stupac u relaciji ima naziv koji je naziv atributa u relaciji, a n-torka koja se sastoji od naziva svih atributa u matematikom smislu predstavlja relaciju, odnosno relacijsku shemu. Shema baze podataka je skup relacijskih shema svih relacija u bazi podataka. Baza podataka je skup relacija. Razliite relacije mogu imati ista imena atributa, ali u bazi ne mogu postojati dvije relacije s istim imenom. Imena relacija ne smiju biti kljune rijei koje su rezervirane za jezik za manipulaciju. Entitet je tip objekta realnog svijeta o ijim se jedinkama podaci pohranjuju u relacijskoj bazi podataka. Primjer entiteta neka bude student.

136

Podaci i informacije

Atribut je jedno od svojstava entiteta. Objekt, odnosno entitet student koji je u bazi podataka predstavljen relacijom, ima niz atributa kao to su broj indeksa, ime i prezime, spol, adresa stanovanja i slino. Pod pojmom atributa najee se misli na njegovu vrijednost. Domena podataka predstavlja skup vrijednosti koje odreeni atribut moe poprimiti. Domena se definira za jedan atribut, a mijeanje vie tipova podataka unutar jedne domene nije doputeno. Svrha definiranja domene jest da se sprijei pojavljivanje podataka u bazi podataka koji nemaju smisla. Jedna n-torka ili redak relacije opisuje jedinku entiteta, odnosno u ovom primjeru jednog odreenog studenta, i sadri vrijednosti svih atributa za tog studenta. Primarni klju je atribut ili skup atributa koji jednoznano identificiraju odreenu n-torku u relaciji. Ako se promatra jedan ili skup vie atributa, on je kandidat za klju onda i samo onda ako zadovoljava sljedee uvjete:
q

Identiteta. Jedinstvenost. U relaciji ne mogu niti u jednom trenutku postojati dvije n-torke s jednakim vrijednostima kljua. Minimalnost. Ako je klju kompozitan, tada se niti jedna njegova komponenta ne moe ukloniti, a da se ne narui pravilo jedinstvenosti.

Integriteta. Niti jedna komponenta primarnog kljua u baznoj relaciji ne smije imati null vrijednost.

Strani klju je atribut ili skup atributa neke relacije koji je ujedno primarni klju u nekoj drugoj relaciji. Osnovna je svrha stranih kljueva prikazati odnos izmeu relacija u bazi podataka. Nakon definiranja stranih kljueva, mogue je definirati drugo osnovno pravilo integriteta relacijskog modela podataka, a to je pravilo referencijalnog integriteta koje glasi: Baza podataka ne smije sadravati vrijednosti stranog kljua za kojeg ne postoje odgovarajue vrijednosti primarnog kljua u baznoj relaciji. Kardinalnost relacije je broj njezinih atributa. Integritet podataka je svojstvo baze podataka koje osigurava da svaki podatak u njoj ima potpuni smisao, odnosno da je uvijek mogue doznati njegovo puno semantiko znaenje. Ne smije se dopustiti nikakva aktivnost ili operacija nad podacima koja bi to dovela u pitanje. Da bi se to ostvarilo potrebno je uspostaviti odgovarajua pravila koja se nazivaju pravila integriteta. Ona ukljuuju pravila odreivanja primarnog kljua, referencijalnog integriteta, domene atributa, kontrole transakcija itd. Njihovo potivanje je od ogromne vanosti za ispravno funkcioniranje sustava baze podataka.

137

Poslovna informatika

Relacija se sastoji od dva dijela, koji se pohranjuju odvojeno u relacijskoj bazi podataka, a to su:
q

Zaglavlje (heading) relacije sadri imena svih atributa od kojih se relacija sastoji. Tijelo (body) relacije ine podaci, odnosno vrijednosti atributa prema nazivima u zaglavlju relacije.

Zaglavlje je zapravo redak relacije kojom je opisana shema baze podataka. Najee koritena notacija za definiranje relacije prikazana je na primjeru relacije STUDENT. STUDENT (BI# , IME, ADR_ST, DAT_R, GOD_ST) Za definiranje relacije navodi se ime relacije, a zatim u zagradi lista atributa. Primarni klju je obino podcrtan. U ovom primjeru je primarni klju broj indeksa, odnosno atribut s imenom BI#. Znak # sugerira da je domena atributa numerika. Na slici 7.04. prikazan je primjer sadraja relacije STUDENT. BI# 7030009 7975003 7980007 7960004 IME Goran Ana Petar Ante ADR_ST Meje Spinut Brda Duilovo DAT_R 02.01.1984 03.01.1978 01.03.1979 04.03.1977 GOD_ST 1 3 2 4

Slika 7.04. Tablini prikaz relacije STUDENT S obzirom na pravila o nepostojanju, odnosno irelevantnosti redoslijeda, kako n-torki tako i atributa u relaciji, slijedi da unutar odre ene relacije nije mogue pozicioniranje, pa pojmovi poput prve ili slijedee n-torke nemaju smisla. Ova tvrdnja dodue nije potpuno tona jer relacija u prethodnom primjeru ima i prvi stupac i prvi redak, ali to nije bitno za manipulaciju. Najea situacija u praksi jest da poredak ima veze sa spremanjem podataka, odnosno velika je vjerojatnost da e podaci iz susjednih n-torki u memoriji biti smjeteni jedni do drugih. Ali, taj poredak nema nikakav utjecaj na sustav i on je od korisnika u potpunosti skriven. Oito je da u pojedinim sluajevima ipak ima razlike izmeu relacije i tablice, no ona je formalne prirode. Relacijska baza podataka se sastoji od relacija, ali ne ukljuuje nikakve relacije izmeu tablica. Izmeu relacija ne postoje nikakve veze u fizikom smislu. Relacije se dinamiki povezuju preko vrijednosti atributa, a posebno stranih kljueva.

138

Podaci i informacije

Za postavljanje upita nad relacijskom bazom podataka koriste se relacijski jezici koji podravaju tri osnovne operacije relacijske algebre, a to su:
q

Operacija selekcije ili restrikcije je tabelarna operacija koja tvori novu tablicu iz postojee tablice na nain da uzima samo neke retke iz postojee tablice prema kriteriju zadovoljenja postavljenog uvjeta nad vrijednostima atributa. Operacija projekcije tvori novu tablicu iz postojee tablice uzimajui u obzir samo neke atribute. Operacija udruivanja tvori novu tablicu iz dvije ili vie postojeih tablica, odabiranjem atributa iz pojedinih tablica i stvaranjem redaka od vrijednosti atributa koji zadovoljavaju uvjet jednakosti kljunih atributa, obino stranih kljueva.

Dosadanje razmatranje se odnosi uglavnom na bazne relacije. Relacijska teorija definira est vrsta relacija: Bazna relacija. Podaci koje sadre relacije spremaju se u bazu podataka. Pod pojmom relacija obino se smatra upravo bazna relacija. Pogled (view, virtual relation) ili virtualna relacija je relacija izvedena pomou pretraivanja iz jedne ili vie baznih relacija. Snapshot ili izvedena relacija je slina pogledu, s tim da osim definicije u bazi podataka ima i svoje podatke. Rezultat pretraivanja. Pretraivanje relacijskim jezicima vraa rezultat pretraivanja u obliku relacije. Meurezultat pretraivanja (intermediate result). Ova relacija je rezultat pretraivanja koji je ugnijeen u neko drugo pretraivanje. Privremena relacija (temporary relation) je stvarna relacija koja se privremeno sprema u bazu podataka, te se obino na kraju odreene transakcije brie iz baze podataka. Pravila relacijskih sustava

7.4.2.

Codd je definirao 12 pravila od kojih sustav mora ispunjavati bar 6 da bi se smatrao relacijskim. Ta pravila nisu standard ve rezultat isto teorijskog pristupa toj problematici. Ona slue proizvoaima softvera kao smjernice za konstruiranje dobrih sustava za upravljanje relacijskim bazama podataka. Suvremeni sustavi za upravljanje relacijskim bazama podataka ispunjavaju sve navedene uvjete i pravila. No prije svega postoji nulto pravilo koje glasi:

139

Poslovna informatika

Sustav za upravljanje bazama podataka koji se smatra, ili koji jest relacijski, mora upravljati bazom podataka na potpuno relacijski nain i relacijskom metodom. Ostala pravila relacijskih sustava su:
q

Predstavljanje informacije. Sve informacije u relacijskoj bazi podataka logiki su predstavljene iskljuivo vrijednostima u tablicama, tj. relacijama. Obavezna logina dostupnost. Svaka vrijednost atributa u relacijskoj bazi podataka mora biti logiki dostupna preko kombinacije imena relacije, vrijednosti primarnog kljua i imena atributa. Prezentacija nepostojee informacije. Relacijska baza podataka mora podravati koncept null vrijednosti neovisno o tipu podataka. Pod pojmom null vrijednosti se podrazumijeva vrijednost koja u danom trenutku za odreeni atribut nije poznata. Dinamiki on-line katalog. Struktura baze podataka opisana je u samoj bazi podataka na isti nain kao i obini podaci, tako da autorizirani korisnici mogu isti relacijski jezik primijeniti na kataloge koji sadre opis baze podataka kao i na obine podatke. Sveobuhvatni jezik za manipulaciju podacima. Relacijski sustav mora podravati jezik za kreiranje aplikacija i manipulaciju podacima. Auriranje pogleda. Svi pogledi koje je po relacijskoj teoriji mogue aurirati, moraju se moi aurirati i u implementiranom modelu. Visok nivo unosa, auriranja i brisanja. Svojstvo manipulacije relacijom ili pogledom kao obinim operandom mora biti mogue ne samo pri pretraivanju podataka, ve i pri unosu, auriranju i brisanju podataka. Fizika neovisnost podataka. Aplikacije i aktivnosti koje korisnik poduzima prema bazi podataka potpuno su neovisne o metodi pristupa podacima ili o strukturi spremanja podataka. Logika neovisnost podataka. Aplikacije i aktivnosti koje korisnik poduzima prema bazi podataka ostaju nepromijenjene kada god je uinjena promjena na relacijama koja je po teoriji doputena. Neovisnost integriteta. Ogranienja na integritet podataka ne smiju biti dio aplikacije ve moraju biti sadrana u katalozima baze podataka. Neovisnost distribucije. Bez obzira na to podrava li sustav distribuciju baze podataka ili ne, jezik sustava mora biti takav da podrava distribuciju bez utjecaja na aplikativne programe. Pravilo o nesubverzivnosti. Ako sustav podrava jezik niskog nivoa, on ne smije biti koriten da bi se zaobila pravila o integritetu podataka.

140

Você também pode gostar