Prilikom pojave dva frekvencijski bliska audio signala dolazi do maskiranja slabijeg signala jaim signalom, te ne ujemo slabiji signal koji bismo inae uli u uslovima tihog okruenja. Sljedea slika prikazuje efekat frekvencijskog maskiranja. Jaki signal frekvencije !"z e maskirati sve audio signale koji su ispod granice na slici oznaene granicom maskiranja #$asking threshold%. & ovom primjeru, audio signali iz opsega '(( "z do ' k"z se nee uti, dok bi ih normalno uli u uslovima nepostojanja jakih, frekvencijski bliskih audio signala, kada je granica ujnosti prikazana na slici crtkanom linijom #)hreshold in *uiet%.
+sim frekvencijskog maskiranja, gdje se podrazumijeva istovremena pojava audio signala razliitih frekvencija pa se naziva i simultano maskiranje, neophodno je uzeti u obzir i vremensko maskiranje koje se de,ava kad se u kratkom vremenskom intervalu pojavljuje jaki i slabi audio signal. )rajanje maskiranja moe biti '( do -(( ms. Perceptualno kodovanje MPEG auda .fikasan algoritam za kodovanje audia treba da ispuni sljedee ciljeve/ uklanjanje statistike redundanse izme0u susjednih odmjeraka, uklanjanje nebitnih informacija koje ne moemo uti, zasnovano na perceptualnom modelu. 1lgoritam za alokaciju bita uzima u obzir perceptualne karakteristike i maskiranje. 2ad P3$ audiom se uradi 44) kako bi se dobio kompletan spektar signala iz kog je mogue odrediti maskirajue signale, na osnovu kojih se odre0uje globalna granica maskiranja. Princip je prikazan na sljedeoj slici. Primjenjuje se dinamika alokacija bita na osnovu razlike nivoa signala u odnosu na granicu maskiranja.
MPEG Audo 5a nekomprimovani stereo audio potrebna bitska brzina iznosi 6 bita7odmjerku 8 99(( odmjeraka7sekundi 8 - kanala : 9.- !b7s. !odovanje audio signala u $P.; standardu je kodovanje sa gubicima. 5asnovano je na podopsenom kodovanju i kori,tenju psihoakustikih modela pri odluivanju koje frekvencije treba potisnuti ili potpuno izbaciti iz signala, a da se i dalje ima zadovoljavajui kvalitet zvuka. Pri tome se ini kompromis izme0u veliine fajlova i kvaliteta. MPEG!" Audo $P.;< standard defini,e tri sloja #la=er%, odnosno nivoa sloenosti $P.; audio kodovanja/ . $P ili $P.;< >a=er #$P.;< 1udio >a=er % -. $P- ili $P.;< >a=er - #$P.;< 1udio >a=er -% ?. $P? ili $P.;< >a=er ? #$P.;< 1udio >a=er ?% @azlike izme0u slojeva su posljedica kori,tenja razliitih psihoakustikih modela. >a=er algoritam je najjednostavniji, ali zbog toga ima i najmanji stepen kompresije te je potrebna vea bitska brzina. 4raunhofer ;esellschaft #4h;%, koji je vlasnik patenta, publikovao je sljedee stepene kompresije koje je mogue postii pojedinim slojem/ >a=er / ?A9 kbit7s, kompresija 9/, >a=er -/ B-<-'6 kbit7s, kompresija A/...6/ , >a=er ?/ -<-A kbit7s, kompresija -/...(/. @ezultati istraivanja kod korisnika se ne,to razlikuju #pretpostavlja se da su ovo realniji rezultati%/ >a=er / odlian kvalitet pri ?A9 kbit7s, >a=er -/ odlian kvalitet pri -'6<?A9 kbit7s, veoma dobar kvalitet pri --9<-'6 kbit7s, dobar kvalitet pri B-<--9 kbit7s, >a=er ?/ odlian kvalitet pri --9<?-( kbit7s, veoma dobar kvalitet pri B-<--9 kbit7s, dobar kvalitet pri -A<B- kbit7s. MP# $MPEG!" Audo La%er II% je audio kodek. .kstenzija fajlova koji sadre audio podatke u ovom formatu je .mp2. Cako je u P3 i internet aplikacijama potisnut sa $P?, jo, uvijek je dominantni standard u oblasti radio<televizijskog emitovanja, kada se radi sa veim bitskim brzinama #-'6 do ?A9 kbit7s%. $P.; la=er - je standardni format za Dideo 3E. MP& $MPEG!" Audo La%er III% $P.;< 1udio >a=er ?, poznatiji kao $P?, je popularni digitalni audio koder sa gubicima, standardizovan BB. godine. 1lgoritam koji se koristi za kompresiju je slian JP.; algoritmu za kompresiju slika. MP& Surround je verzija $P?, uvedena u decembru -((9 godine koja podrava ' kanala. $P- razdvaja signal na ?- podopsega i ako se zakljui da je audio signal iz nekog podopsega neujan, taj podoseg se ne prenosi. S druge strane $P? transformi,e signal u 'F6 frekvencijskih komponenti, te ima veu frekvencijsku rezoluciju nego $P- ,to omoguava bolju primjenu psihoakustikog modela i veu kompresiju. Moderne 'etode audo ko'pre(je Postoji nekoliko algoritama moderne kompresije i metoda za skladi,tenje audio sadraja u kompjuterskoj tehnologiji/ G $P? #$P.;< >a=er<?% Sastoji se od psihoakustinog modela, 44) analiza, hibridnih filtera, nelinearne kvantizacije, "uffman<ovog kodovanja, - kanala sa konstantnim ili promjenjivim brzinama bita od ?- do -'6 kb7s i koji je uspje,no implementiran u moderne 3E7EDE i portabl plejere, mobilne telefone,... G $P? Pro !reiran od strane 3oding )echnologies >aborator=, zasniva se na principima formiranja $P? formata, sastoji se od SH@ #Spectral Hand @eplication% tehnologije koja koduje visoko frekventni opseg #od ( do ' k"z% sa veoma malom brzinom bita. G 113 #$P.;<- 1dvanced 1udio 3oding% !reiran od strane 1)I), Eolbija, 4raunhofer CCS i Sonija, je CS+ standard $P.;<- koji se sastoji od osnovnih principa $P? formata ukljuujui psihoakustini model, hibridne filtere, skalabilne brzine odmjeravanja, - kanala sa brzinama bita od 9A do 'F6 kbps. G 113 Plus Potie od 113 formata, sastoji se od SH@<a sa brzinom bita do (( kbps. G J$1 #JindoKs $edia 1udio% !reiran od strane $ikrosofta, sastoji se od E@$ #Eigital @ights $anagement%, 3H@ i DH@, J$1 kodovanja digitalnog audia bez gubitaka #brzine bita -/ do ?/%, J$1 profesionalno kodovanje vi,ekanalnog audia #-A do F6A kbps% i J$1 za kodovanje glasa #od 9 do -( kbps%. G DL4 #Dector Luantization 4ile% !reiran od strane 22) "uman Cnterface >aboratories i Mamaha, nastao je na osnovu $P? principa, kompleksnijeg kodovanja, -'<?'N bolja kompresija u odnosu na $P? kompresiju. Advanced Audo )odn* $AA)+ Advanced Audo )odn* #AA)% kao nasljednik $P? standarda za kodovanje digitalnog audio signala, generalno postie bolji kvalitet zvuka na istim bitskim brzinama. 113 primjenjuje dvije osnovne strategije kako bi redukovao koliinu podataka neophodnu za predstavu visokokvalitetnog digitalnog audia/ . !omponente signala koju su perceptualno beznaajne se odbacujuO -. .limini,e se redundansa u audio signalu. Signal se konvertuje iz vremenskog u domen modifikovane diskretne kosinusne transformacije $E3) koristei banku filtara. Signal se u frekvencijskom domenu kvantuje na osnovu psihoakustikog modela i koduje. &gra0eni su mehanizmi korekcije gre,aka. 113 je standardizovan kao Part F $P.;<- i Part ? $P.;<9. $P.;<- standard sadri vi,e metoda kodovanja audia, ukljuujui $P? kodnu ,emu. 113 postie dobar kvalitet pri brzini od ?-( kb7s za pet kanala #'.% a pri brzini od -A kb7s za stereo. ,*-!E..cenc% Advanced Audo )odn* #,E!AA)% je pro,irenje 113, optimizovano za male bitske brzine #streaming%, standardizovano po prvi put -((?. godine i publikovano kao dio $P.;<9 standarda. 113 je projektovan da popravi performanse $P? formata koji je specificiran u $P.;< i u $P.;<-. Pobolj,anja se ogledaju u sljedeem/ vei izbor frekvencija odmjeravanja #A<B6 k"z% nego $P? #6<9A k"z%, do 9A kanala #$P? podrava dva kanala u $P.;< i maksimalno '. kanal u $P.;<-%, promjenljiva bitska brzina, banka filtara sa visokim preformansama, 113 koristi modifikovanu E3) P $E3), velika efikasnost pri kodovanju stacionarnih signala #113 koristi veliinu bloka od (-9 odmjerka, a $P? od 'F6 odmjeraka%, kori,tenje posebno projektovanih prozorskih funkcija koje dobro elimini,u curenje spektra, bolji rad sa frekvencijama iznad 6 k"z, itd. MPEG ko'pre(ja vdeo audo (*nala 2astojana za standardizaciju u oblasti razmjene videa datiraju od ranih osamdesetih godina pro,log vijeka. Cnternational )elephone 3onsultative 3ommittee #33C))%, zajedno sa Cnternational @adio 3onsultative 3ommittee #33C@%, i Cnternational Standards +rganization 7 Cnternational .lectrotechnical 3ommission #CS+7C.3% su pokrenuli brojne inicijative za standardizaciju. Movn* Pcture E/pert( Group ili MPEG #pod oficijelnom oznakom CS+7C.3 J)37S3-B J;% je radna grupa koja je zaduena za razvoj standarda za video i audio kodovanje, te memorisanje i pretraivanje multimedijalnih sadraja. Prvi sastanak ove grupe odran je u "anoveru, BAA. godine. 2a svakom sastanku ove radne grupe uestvuje oko ?'( lanova iz razliitih oblasti industrije, sa univerziteta i istraivakih institucija. $P.; je do sada odobrila sljedee formate za kompresiju i standarde/ MPEG!"0 Prvi video i audio standard, kasnije kori,ten za Dideo 3E, koji ukljuuje i popularni $P? format kompresije audio signala. MPEG!#0 2amijenjen za transport, video i audio standard kojim se postie televizijski kvalitet. !oristi se u digitalnoj televiziji i #sa malim modifikacijama% za EDE video diskove. MPEG!&0 +riginalno namijenjen za televiziju visoke definicije, ali je povuen kad je otkriveno da je $P.;<- dovoljno efikasan i za "E)D. MPEG!10 Pro,irenje $P.;< u smislu podr,ke video7audio objektima, ?E sadrajima i malim brzinama prenosa. MPEG!20 4ormalni sistem za opis multimedijalnog sadraja. MPEG!#"/ $P.; opisuje ovaj standard kao multimedijalno okruenje. MPEG!" MPEG!" je standard iz BB(<tih godina, kori,ten za kompresiju audio i video digitalnih podataka. $P.;< video je D3@ kvaliteta i kori,ten je za video 3E format. +ptimalna brzina prenosa je .' $b7s. 5a video je rezervisano oko .- $b7s. 4ormat videa je/ slika formata ?'-Q-9( #etvrtina )D ekrana% sa ?( frejmova u sekundi. Primarna mu je namjena bila da poslui kao format za memorisanje, ali je pokazao veoma dobre rezultate i pri strimingu na brzinama prenosa koje podrava. &z to, podrane su sljedee opcije/ sluajni pristup frejmovima preko C<frejmova, brzo pretraivanje naprijed<nazad #fast<forKard i fast<reverse, 4474@ %, emitovanje videa unazad i mogunost editovanja uz prihvatljivo ka,njenje pri kodovanju i dekodovanju od oko sekunde. $P.;< audio la=er ? je puno ime popularnog $P? audio formata. !asnije je $P.;< 1D format unaprije0en i nastali su $P.;<- C $P.;<9 formati koji postiu vei nivo kompresije. $P.;< obuhvata vi,e dijelova/ . )ransportni sloj koji obuhvata dio za sinhronizaciju i multipleksiranje video i audio podatakaO -. 3odec #koder i dekoder% za kompresiju video signala bez preplitanja #progresivno skeniranje%O ?. 3odec za perceptualno kodovanje audio signalaO 9. Procedure za testiranje usagla,enosti. $P.;< video $P.;< je inicijalno bio projektovan za brzinu prenosa od .' $b7s i rezoluciju ?'-Q-'9 za 2)S3 i ?'-Q-AA za P1>. !asnije je prilago0en brzini prenosa od 9 $b7s, uz pobolj,anje kvaliteta video signala. 2a etiri bita luminanse dolazi po jedan bit hrominentnih komponenti. )renutno je $P.;< najkompatibilniji format i upotrebljiv je na skoro svim plejerima. $P.;<, slino kao ".-6, koristi i intra<frajm i inter<frajm kodovanje. $e0utim, inter< frejm kodovanje je ovdje puno sloenije jer omoguava bidirekcionalnu vremensku predikciju. Cdeja bidirekcionalnog kodovanja je prikazana na sljedeoj slici. $akrobloku tekueg frejma se trai najsliniji makroblok u prethodnom i sljedeem frejmu i odre0uju se dva vektora pomjeraja. $akroblok za kodovanje se formira kao razlika tekueg makrobloka i usrednjenih vrijednosti #na slici je usrednjavanje oznaeno sa N% najslinijih makroblokova iz susjednih frejmova, ukoliko se na0e dovoljno slian makroblok u oba frejma. &koliko se slian blok na0e samo u jednom frejmu, on se zadrava i ne radi se usrednjavanje. 4rejmovi za koje se radi bidirekcionalna predikcija su oznaeni kao H<frejmovi.
Potreba uvo0enja bidirekcionalne predikcije postaje jasna ako se pogleda sljedea slika.
>opta tekueg frejma je u prethodnom frejmu bila maskirana drugim objektom i sasvim je jasno da je predikcija makrobloka koji sadri loptu na osnovu sljedeeg frejma mnogo bolja #signal razlike nakon pomjeraja je manji% nego na osnovu prethodnog frejma. )ipian raspored frejmova u grupi slika #group of pictures < ;+P% kod $P.;< kodovanja je prikazan na sljedeoj slici. Prvi frejm u svakoj video sekvenci mora biti C< frejm. C<frejmovi se ponavljaju i na poetku svake grupe slika. Cako se kod C<frejmova postie mali stepen kompresije, njihovo kori,tenje je neophodno kako bi bio mogu sluajni pristup, 4474@ i oporavak od gre,aka. Prvi P<frejm se koduje N frejmova nakon C<frejma. N-1 frejmova izme0u C<frejma i P<frejma ili izme0u dva P<frejma se koduju kao H<frejmovi. Predikcija pri kodovanju P<frejma se vr,i na osnovu prethodnog P<frejma ili C<frejma. )reba napomenuti da redoslijed slanja frejmova nije isti kao redoslijed njihovog pojavljivanja u vremenu, jer je za rekonstrukciju H<frejmova neophodno poznavanje susjednih C<frejmova ili P<frejmova.
5a razliku od ".-6, vektor pomjeraja kod $P.;< je precizniji #do R piksela% i moe da poprimi vrijednost iz skupa S<'-, '.'T. $P.;< bitski tok dopu,ta sluajni pristup jer je svaka grupa slika #;+P% neovisno kodovana. )ipian broj bita neophodan za kodovanje C<slika je vei nego kod P<slika, dok je najmanji kod H<slika. Prosjean stepen kompresije C,P i H slika je dat sljedeom tabelom. Prosjean faktor kompresije video signala u $P.;< standardu iznosi -F/.
2a sljedeoj slici prikazana hijerarhijska struktura, odnosno nain formiranja sekvence bita kod $P.;< standarda. +va sekvenca bita je podijeljena na nekoliko slojeva. 2ajvi,i sloj je video sekvenca. +vaj sloj sadri informacije kao ,to su/ veliina frejmova, bitska brzina i uestanost frejmova. ;+P sloj sadri informacije o brzom pretraivanju i sluajnom pristupu video podacima. ;+P zaglavlje sadri podatke o pozicijama C, P H frejmova. Sloj slike sadri kodovane segmente #grupe makroblokova%. Segmenti jednog frejma mogu da sadre razliit broj makroblokova, te da startuju i zavr,e bilo gdje, i svaki segment se neovisno koduje. &vo0enje segmenata u $P.;< radi ponovnog uspostavljanja sinhronizacije u sluaju gubitka ili o,teenja dijela signala predstavlja jo, jednu od bitnih razlika u odnosu na ".-6. Ealje, sloj segmenta sadri makroblokove, sloj makrobloka blokove i konano, sloj bloka sadri intra<kodovane blokove.
Deliki nedostatak $P.;< je ,to podrava samo progresivno skeniranje videa, ,to je i bio osnovni razlog uvo0enja $P.;<-. MPEG!# $P.;<- #BB9% standard za kompresiju audio i video signala je projektovan za distribuciju digitalnog )D signala, ali se ,iroko koristi i za skladi,tenje videa na EDE. !valitet je uporediv sa D"S standardom. Hitska brzina iznosi izme0u 9 i B $b7s, ali se uz dodatna pobolj,anja moe koristiti i za "E)D do rezolucije od B-(Q(A( piksela i ?( frejmova u sekundi #,to znai brzinu prenosa od A( $b7s%. Eakle, $P.;<- omoguava visokokvalitetni video uz bitsku brzinu veu od 9 $b7s. +vo je prvi standard koji podrava video sa preplitanjem, sa moguno,u predikcije frejmova ili polja, kada se dva polja koduju zajedno kao jedan frejm. Snaga $P.;<- standarda je u njegovoj skalabilnosti, ,to e biti kasnije detaljnije prikazano. !odovanje video signala je slino kao kod $P.;<, ali je podran video signal sa preplitanjem. $P.; video kompresija tako0e defini,e E3 slike #E<slike%, koje su sline C<slikama, ali sadre samo E3 komponente svakog bloka i omoguavaju brzo pretraivanje. $P.;< nije optimizovan za male brzine prenosa #manje od $b7s% i nije pogodan kao internet sriming tehnologiju. Hitska brzina kod $P.;<- moe biti konstantna ili varijabilna. $aksimalna bitska brzina je odre0ena medijem koji se koristi za prikaz, npr. za EDE iznosi (.9 $bit7s. & cilju postizanja konstantne bitske brzine prilago0ava se nain kvantizacije. $P.;<- unosi nove metode kodovanja audio signala, tako da omogueno kodovanje do ' kanala. +snovne razlike u odnosu na $P.;< su/ Podrano je vi,e video formata EDE, 1)D, "E)D, te ,ema/ 9/-/- i 9/9/9 5bog uvo0enja polja kod skeniranja sa preplitanjem, $P.;<- moe da koristi ' naina predikcije, koristi se nelinearna kvantizacija, bolja otpornost na gre,ke u prenosu. Pojedinano za EDE, EDH #Eigital Dideo Hroadcasting% SE)D i "E)D se uvode dodatne restrikcije i modifikacije $P.;<-. MPEG!& $P.;<? je standard namijenjen za rad sa "E)D signalima u opsegu -( do 9( $bit7s. !ako je otkriveno da je sa $P.;<- uz male modifikacije mogue postii jednako dobre rezultate, ovaj standard se prestao koristiti. MPEG!1 $P.;<9 je uveden krajem devdesetih #BB9, a postao je standard -(((. godine%, za Keb striming i prenos mobilnom mreom, ali i za distribuciju )D signala i videotelefoniju. +n predstavlja pro,irenje prethodnih standarda u smislu podr,ke video7audio objektima, ?E sadrajima i malim brzinama prenosa. +ptimalna bitska brzina iznosi ?A' do F6A !b7sec. 5a razliku od svojih prethodnika, umjesto rada sa pravougaonim blokovima slike, $P.;<9 je objektno orijentisan. 1udio<vizuelni objekti video sekvence se odvojeno koduju i prenose zasebnim sekvencama bita. !orisniku se omoguava niz interaktivnih aplikacija sa videom. Standard pokriva ,irok opseg bitskih brzina, od veoma niskih #'<69 !b7s% do - $b7s za )D7film aplikacije. Cstraivanja u okviru ovog standarda su jo, uvijek aktuelna, posebno vezano za internet streaming, beini prenos videa i digitalne kamere u mobilnim ure0ajima. 3iljevi uvo0enja ovog standarda su bili/ manipulacija sadrajem i editovanje sekvence bita u komprimovanom domenu, mogunost kombinovanja sintetizovanih i prirodnih scena i objekata, sluajan pristup frejmovima i objektima, bolji vizuelni kvalitet na uporedivim bitskim brzinama, u odnosu na prethodne standarde, mogunost kodovanja vi,estrukih pogleda, npr. stereoskopski vid, otpornost na gre,ke, skalabilnost sa finom granularno,u u sadraju, kvalitetu i sloenosti. 1udio i video podaci su vezani za sadraj, ,to omoguava neovisan pristup i manipulaciju pojedinanim objektima u komprimovanom domenu/ transformaciju postojeih objekata #repozicioniranje, skaliranje, rotaciju%, dodavanje novih i uklanjanje postojeih objekata sa scene, a sve to jednostavnim operacijama nad komprimovanom sekvencom bita. 1udio<vizuelni objekti su slojeviti i svaki sloj se koduje u elementarnu sekvencu bita #elementar= stream < .S%. Eok su u prethodnim standardima standardizovani kompletni algoritmi, $P.;<9 slijedi princip toolboQ<eva. Dideo alati sadre kompletan algoritam ili individualne module, npr. kodovanje oblika, teksture, kompenzaciju pokreta, koji se povezuju pomou $P.;<9 S=stem Eescription >anguage #$SE>%. $SE> se ugra0uje u kodovanu sekvencu bita i prenosi, te tako odre0uje pravila dekodovanja.
!ako bi se postigla interaktivnost na nivou sadraja, sekvenca se posmatra kao kolekcija audio<vizuelnih objekata #1D+%, koji mogu biti govor, muzika, ili video objekti koji predstavljaju neki sadraj, npr. dijalog, portret #glavu i poprsje% osobe, objekat u pokretu ili statiku7promjenljivu pozadinu, itd... Czgled video objekta u jednom frejmu se defini,e kao jedna ravan video objekta #video object plane P D+P% i naje,e prestavlja elementarnu formu reprezentacije sadraja. &lazna video sekvenca se segmentira u niz regiona proizvoljnog oblika #D+P<ovi%. +blik i poloaj regiona variraju od frejma do frejma. Cnformacije o obliku, pokretu i teksturi D+P<ova koji pripadaju istom video objektu se koduju i prenose kao jedan sloj #Dideo +bject >a=er < D+>%. !ako postoji vi,e video objekata, sekvenca bita mora sadravati i informaciju o nainu kombinovanja D+><ova kako bi bila mogua rekonstrukcija videa. 2a sljedeoj slici je prikazan jedan frejm video sekvence. Cnformacija o nainu segmentiranja u D+P objekta i drugi D+P pozadine sadri binarna tzv. 1lfa<ravan, koja slui kao maska poloaja objekta.
Sljedea slika daje op,tu ,emu kodovanja i dekodovanja. Scena se prvo segmentira u niz D+P<ova. 2iz D+P<ova koji odre0uju jedan sadraj sekvence slika se grupi,u u D+>. +riginalnu video sekvencu je mogue rekonstruisati ukoliko se uzmu u obzir svi D+>< ovi. Cpak, sadraje je mogue dekodovati uzimajui u obzir samo podskupove D+><ova, dakle, omoguena je interaktivnost na nivou sadraja u komprimovanom domenu. $P.;<9 podrava prostornu, vremensku i tzv. sprite skalabilnost, koja se odnosi na pozadinu scene. Koncept digitalizacije video signala Slika koja se dobija na senzoru kamere #analizatorska cijev ili 33E ip% moe se posmatrati u prostoru i vremenu. Slika posmatrana u prostoru se definira kao pravilna matrica piQela #elemenata slike%, kao u primjeru datom na sljedeoj slici, gdje je prezentiran isjeak plohe senzora. Svaki od ovih elemenata slike ima odre0enu sjajnost koja je predstavljena analognim iznosom napona. +svjetljaji ovih piQela u jednoj liniji formiraju video signal jedne linije, ,to znai generisanje signala luminanse. Sve ,to smo rekli odnosi se ipak na analogni video signal. @azmotrimo sada kako e nastati digitalni signal. &zmimo kao primjer digitalizaciju analognog signala u domenu vremena samo za luminantni signal, ,to je ilustovano primjerom sa sljedee slike/ Eigitalizacija se sastoji u diskretizaciji po vremenu P to je proces uzorkovanja i diskretizaciji po amplitudi P to je proces kvantizacije. +itane vrijednosti uzoraka se u koderu pretvaraju u binarne cifre, nakon ega se formira digitalna transportna struja. Didimo da dobijeni digitalni video moemo prenositi serijski ili paralelno. $e0utim, za prenos kolor video signala potrebno je prenijeti podatke o dominantnoj talasnoj duini #"ue% i pobudnoj istoi #.Qitation purit=%. & analognom sistemu to se postie formiranjem ili primarnih komponentnih signala P @;H ili kombinovanjem signala razlike boje, tj. pomou signala Y, U'B-Y i U'R-Y. )o znai da emo formirati jo, dvije superponirane ravni digitalnih vrijednosti videa istih piQela, ali sada za signale razlike boja. & tom sluaju potrebna je trodimenzionalna memorijska matrica da bi se predstavio digitalni signal, ,to je ilustrovano na sljedeoj slici. .videntno je da u ovom sluaju nastaju pored struje digitalnih podataka o luminansi i struje podataka o krominantnim digitalnim signalima. Pretpostavili smo da se numerike vrijednosti luminanse i krominanse svakog piQela pohranjuju u trodimanzionalnu memorijsku matricu. 2a taj nain je pohranjena jedna slika. Sada se postavlja pitanje kako reproducirati pokretnu sliku u digitalnom domenu. )o emo postii tako ,to emo omoguiti periodino auriranje namerikih vrijednosti @;H ili Y, U'B-Y i U'R-Y svakog piQela. 2a ovaj nain se formira trodimenzionalna matrica, gdje dvije prostorne ose prikazuju raspored piQela u slici, dok trea prezentira tok promjene vrijednosti veliine lume i krome svakog piQela u vremenu. +vaj princip je ilustrovan na sljedeoj slici/
Didimo da se reprodukcija digitalnog signala svodi na cikliko oitavanje auriranih stanja iz trodimenzionalne matrice. +vim je prezentiran princip digitalne reprodukcije, sa napomenom da se sve ove digitalne vrijednosti prethodno pretvaraju u analogne veliine postupkom E71 konverzije, jer samo prezentiranje digitalnih vrijednosti signala ne bi imalo smisla za gledaoca. Formati digitalnih video signala @azlikujemo dvije kategorije video signala/ kompozitni i komponentni. Kompozitni signal P 33DS kombinuje luminansu M i kominansu 3 u jedinsvenu struju koja se pohranjuje i prenosi. Primjeri analognog kompozitnog signala su emitiranje )D signala i snimanje na D"S kasetu. @azmotrimo koncept digitalizacije P1> kompozitnog video signala. Polazno pitanje u digitalizaciji studijskog kompozitnog video signala je izbor frekvencije uzorkovanja. &svojeno je da ona iznosi multipl od frekvencije podnosioca boje fSC, tj. FS = fSC = !," #$% = 1&,&" #$% Erugo znaajno pitanje je izbor broja bita P n po uzorku, obzirom da ovaj izbor utie na kvalitet signala. 2a raspolaganju su uglavnom rezolucije kvantizacije sa A bita i sa ( bita. Sada emo prikazati numeraciju uzoraka u domenu vremena, za jednu kompletnu liniju, pomou primjera sa naredne slike.
Didimo da se numeracija uzoraka posebno vr,i za interval video signala i posebno za interval horizontalnog blanking intervala. Sada emo razmotriti i strukturu digitalnog rastera za jednu P1> liniju, uz pretpostavku da se posmatra color bar test signal tipa ((7(7((7(. 1mplitudni raster, odnosno P1>nivoi kompozitnog signala prikazani su na sljedeoj slici, za sluaj rezolucije kvantizacije od ( bita po uzorku.
)rajanje digitalne aktivne linije prema,uje trajanje aktivne analogne linije. Didimo da je najvi,i nivo kvantizacije ne,to nii od ((N nivoa krome za sluaj kolor bar testa tipa ((7(7((7(, tako da se pojavljuje negativni headroom. )o znai da ne postoji rezerva u preoptereenju 17E konvertora. Eigitalni nivoi od ((( do ((? su za,tieni i nisu dozvoljeni u struji podataka. Komponentni signal P sadri struje luminanse M i krominanse 3r i 3b. Pri tome postoje dvije varijacije komponentnih signala/ M73 komponentni i @;H komponentni. M73 koristi separatne kanale za transport informacija o luminansi i krominansi, dok @;H signal zahtjeva separatne kanale za svaki signal primarne boje. !omponentni signali imaju bolji kvalitet slike od kompozitnog videa. Eigitalizacija komponentnog videa znai digitalizaciju tri signala, ,to implicira sljedee karakteristike/ &tro,ak sklopova je znatno vei za tri lanca komponentnog signala, nego za jedan lanac kompozitnog video signala. Postupak digitalizacije je jednostavniji, jer nema podnosioca boje. !ljuno pitanje i u sluaju digitalizacije komponentnog signala je izbor frekvencije uzorkovanja. !od kompozitnog signala je uzeta samo jedna frekvencije fS = fSC. $e0utim za digitalizaciju tri komponentna signala moramo odabrati tri frekvencije uzorkovanja. & vezi frekvencije uzorkovanja, dogovorena je jedinstvena referentna frekvencija od/ fr = '1(!fl = '1(!1) (') $% = ","&) #$% 4rekvencije uzorkovanja luminanse i krominanse su stoga multipli ove referentne frekvencije. @azlikujemo vi,e sistema uzorkovanja, koji nose nazive prema faktorima multiplikacije referentne frekvencije/ S(te' u3orkovanja 10"0" znai da frekvencija uzorkovanja lume iznosi ?,' $"z #9 Q ?.?F'$"z%, dok su frekvencije uzorkovanja krome po ?,?F' $"z. +vaj sitem ima reduciranu horizontalnu kroma rezoluciju i koristi se u ure0ajima nieg kvaliteta. Podesan je za situacije gdje propusni opseg krominantnih signal ne prema,uje .' $"z. S(te' 10#04 ima reduciranu vertikalnu rezoluciju krome. & ovom sluaju kroma uzorci susjednih linija u poluslici su interpolirani u cilju produkcije jedinstvenog kroma uzorka, koji je prostorno lociran na pola razmaka jednog od originalnih uzoraka i lokacije iste linije, ali suprotne poluslike. S(te' 10#0# oznaava frekvencije uzorkovanja od ?.' $"z #9 Q ?.?F' $"z% za luminantni signal M i 6.F' $"z #- Q ?.?F' $"z% za krominantne signale &UH<M i &U@<M. +vaj sitem ima naj,iru primjenu, te je usvojen za digitalnu studijsku tehniku. S(te' 10101 znai da su frekvencije uzorkovanja svih komponentnih signala ?.' $"z. Sistem se koristi za opremu visokog nivoa studijskog kvaliteta. Primjena ovog sitema je ograniena obzirom da zahtjeva velike bitske brzine prenosa, odnosno enormno ,irok frekventni opseg.
Sistem 4:2:2 2a,u panju emo usmjeriti na sistem uzorkovanja 9/-/-. !ako je ve reeno, ovaj s=stem oznaava frekvencije uzorkovanja od ?.' $"z #9 Q ?.?F' $"z% za luminantni signal M i 6.F' $"z #- Q ?.?F' $"z% za krominantne signale &UH<M i &U@<M. Prikazaemo uporedo spektre uzorkovanih komponentnih video signala u sistemu kodiranja 9/-/-, pomou sljedee slike/
Didimo da izbor frekvencija uzorkovanja lume od ?.' $"z i krominantnih komponenata od 6.F' $"z eliminira mogunost nastanka sprezanja #aliasing% i intermodulacije spektara baseband luminantnog i krominantnih signala sa moduliranim uzorcima lume i krome. 2eki od osnovnih parametara sistema 9/-/- su/ Hroj uzoraka po totalnoj liniji/ M:A69, 3H:9?- i 3@:9?- Hroj uzoraka po digitalnoj aktivnoj liniji/ M:F-(, 3H:?6( i 3@:?6( 4rekvencija uzorkovanja/ M/ A69 Q fl : ?.' $"zO 3H i 3@/ 9?- Q fl : 6.F' $"z @ezolucija kvantizacije/ A ili ( bita po uzorku za svaki komponentni signal/ M, 3H i 3@. 2a osnovu pomenutih parametara vidimo da rezolucija kvantizacije moe biti A bita po uzorku, ,to znai raspon od -'6 nivoa, dok kvantizacija od ( bita po uzorku omoguava raspon od (-9 nivoa. Czraunaemo sada potrebnu brzinu digitalnog protoka za sluajeve rezolucije od A bita po uzorku i ( bita po uzorku/ @ezolucija A bita/ BR = (!"# $ 2 % &"'#( )*z % + = 2& ),it-s @ezolucija ( bita/ BR = (!"# $ 2 % &"'#( )*z % . = 2'. ),it-s & oba sluaja se radi o velikim brzinama prenosa, ali se one mogu koristiti za studijsku distribuciju pod uslovom da se radi o malim distancama prenosa. 5a distribuciju na druge sisteme, tj. za vee distance koriste se sistemi kompresije video signala, koji omoguuju znatno nie brzine H@. Kompresija video signala !ompresija digitalnog video signala zapoinje ve pri formiranju komponentnog video signala, jer su luminantna i dvije krominantne komponente predstavljene jednom transportnom strujom, unutar jedinstvenog propusnog opega od ' $"z. Pomou ovog signala se formiraju digitalni komponentni signali, ije transportne struje imaju veoma visok digitalni protok, tj. visok H@ #$bps%. 5a signal tipa 9/-/-, pri rezoluciji od A bita po uzorku nastaje digitalni protok od H@:-6 $bps, a pri rezoluciji od ( bita po uzorku nastaje transportna struje od -F( $bps, ,to zahtjeva velike propusne opsege, odnosno ograniava daljinu prenosa na primarnu distribuciju unutar prostora studija i reije. 5a potrebe sekundarne distribucije i zapisa neophodno je izvr,iti kompresiju video i audio signala, ,to praktino znai smanjivanje digitalnog protoka. @azmotrimo stoga najprije teorijsku podlogu na osnovu koje se koncipira postupak kompresije. +snovu ini utvr0ivanje neophodne koliine informacija iz izvora koju treba prenijeti kako bi se ista mogla reproducirati na strani prijema, kao i onog dijela informacije koja predstavlja vi,ak informacije. )o znai da u cilju kompresije video signala utvr0enu suvi,nu informaciju ne treba prenositi. Srednja koliina informacija skupa doga0aja predstavlja entropiju, a ona uzima maksimalnu vrijednost, ako svi doga0aji imaju jednaku vjerovatnou. +dstupanje entropije od njene maksimalne vrijednosti predstavlja redundancu. @edundanca je dakle onaj vi,ak informacije, koji generira izvor, koji nije neophodno prenijeti da bi se identifikovala izvorna informacija. Redundanca u slici 5a postizanje ekonominosti prenosa informacija potrebno je smanjiti redundanciju i svesti prenijetu informaciju na entropiju izvorne informacije. Prema Venonovoj teoremi prosjena duina kodne rijei izvora ne moe biti kraa od entropije izvora. $oemo prihvatiti interpretaciju po kojoj se kompresija zasniva na procesu redukcije informacija koje sadri slika ili grupa slika za iznos redundancije koje one sadre. Postupak utvr0ivanja i redukcije redunadancije se moe definisati analizom statistike prediktabilnosti, tj. predvidivosti video signala. Deina signala ima neki stepen prediktabilnosti. 2avedimo dva ekstremna primjera prediktabilnosti/ Sinusni signal je potpuno predvidiv, jer ima samo jednu frekvenciju, odnosno ne trai poseban propusni opseg. 2a drugoj krajnosti se nalazi ,um, koji je potpuno neprediktabilan. Signali u stvarnosti padaju negdje izme0u ove dvije ekstremne kategorije. @azlikuje dvije kategorije redunadancije/ psiho/izi0ka redundancija i statisti0ka redundancija podataka. 1siho/izi0ka redundancija Psihofizika redundancija oznaava injenicu da vrijednosti digitaliziranih uzoraka u slici nisu jednako percipirane od strane vizuelnog sistema ovjeka P "DS #"uman Disual S=stem%. )o znai da neke gre,ke "DS ne registrira, a ne registrira ni ako se neke vrijednosti uzoraka promjene ili ak i odstrane. @azlikuju se optika iluzija, prepoznavanje uzoraka i efekat nagnutosti. +ko ovjeka ima odre0enu osjetljivost na promjene u prostoru, pri emu moemo konstatirati da veliki objekti imaju nisku prostornu frekvenciju, a mali objekti visoku. )o praktino znai da zbog smanjenja osjetljivosti oka na visoke prostorne frekvencije moemo takve sadraje slike podvrgnuti grubljem stepenu kvantizacije, a gre,ke kodiranja u blizini granine frekvencije prostorne rezolucije oko nee ni zamjetiti. $ozak tako0e ima uticaja na vi0enje slike. )o znai da neke nekompletne structure registrira i automatski kompenzira stvarajui impresiju kompletne slike. +ko ovjeka se adaptira na okolinu, pri emu se fokusira na horizontalne i vertikalne oblike, dok slabije reagira na druge. )o oznaava efekat nagnutosti prikazan u gornjem primjeru/ paralelnost, razmje,taj i ,irinu pravougaonika oko jasno razaznaje, dok je kosa rezolucija slabija. )o praktino znai da dijagonalne prostorne frekvencije mogu biti grublje kvantizirane, ,to e znaiti dodjelu manjeg broja bita po uzorku, a time i smanjenje bitske brzine, ,to je krajnji efekat kompresije. Statisti0ka redundacija Statistika redundancija podataka znai da sve slike sadre veliki iznos identinih podataka, kao posljedica npr. identinih vrijednosti nekih oblasti piQela u slici. & pokretnom video signalu se razlikuju pro(torna i vre'en(ka redundancija. Prostorna redundancija postoji unutar pojedine slike, odnosno unutar jednog frame<a, a to moe biti velika oblast uzajamno slinih piQela, kao ,to je npr. vedro nebo ili slika sa jednom dominantnom prostornom frekvencijom, npr. zid od cigle. Prvi korak u veini sistema kompresije ovog tipa je identifikacija prostorne redundancije, koja je prisutna u svakoj poluslici #field% ili slici #frame%. !ompresija koja se ostvaruje na osnovu eliminacije prostorne redundance u frame<u se naziva 2ntra3/rame kompresija" Dremenska redundancija se pojavljuje izme0u slika u kojima postoji velika slinost susjednih slika. !ompresija koja se ostvaruje putem uklanjanja redundance izme0u frame<ova naziva se 2nter3/rame kompresija" Standardi video kompresije )145 @azlikujemo vi,e stepena kompresije u $P.; formatu, koji e biti prezentirani pojedinano, pri emu e posebna panja biti posveena $P.;<- formatu, kao za sada najra,irenijem formatu kompresije video signala. )1453 $P.;< dozvoljava dvosmjerno predvi0anje sa nadomje,tanjem pokreta, pri kojem se trenutno procesirana slika ne upore0uje samo s prethodno projeciranim slikama, nego i sa slikama koje se u izvornoj video sekvenci nalaze iza nje. Czvorni format slike za $P.;< standard je SC4 #Source Cnput 4ormat% koji ima rezoluciju luminantne komponente ?6(Q-9( elemenata slike za 2)S3 ili ?6(Q-AA elemenata slike za P1>, dok je rezolucija krominantne komponente jednaka polovici rezolucije luminantne komponente u horizontalnom i vertikalnom smjeru. $odel kodiranja video signala u $P.; postupku je organizovan u ,est slojeva prikazanih u tabeli/ H>+! je najmanja jedinica kodiranja sastavljena od 69 elementa slike. )o je osnovna jedinica za primjenu diskretne kosinusne transformacije P E3). Svaki luminantni element slike odgovara jednom elementu slike. !romatska informacija se poduzorkuje u omjeru -/ u horizontalnom i vertikalnom smjeru, tako da se jedna kromatska informacija sastavljena od dvije krominantne komponente izvodi za etiri elementa slike. $1!@+H>+! je osnovna jedinica za kodiranje sa nadomje,tanjem pokreta koja se sastoji od podruja 6 elemenata slike u 6 linija za luminantnu komponentu #9 bloka od AQA elemenata slike% i prostorno jednakog podruja sa A elemenata slike u A linija za svaku od krominantnih komponenata. )o znai da makroblok sadri 9 luminantna bloka i - krominantna bloka, pri emu je podruje slike pokriveno sa 9 luminantna bloka jednako podruju slike koje je pokriveno pojedinim krominantnim blokom. CSJ.W1! S>C!. #Slice% je horizontalni niz makroblokova koji je osnovna jedinica za uspostavljanje sinhronizacije izme0u postupaka kodiranja koji se provode na razini bloka i makrobloka. Prilikom pojave gre,ke unutar slike zbog gubitka u prenosu, nije potrebno odbaciti cijelu sliku, ve je iz postupka dekodiranja mogue izostaviti samo isjeak slike i nastaviti dekodiranje sa sljedeim ispravno primljenim isjekom slike. S>C!1 je osnavna jedinica u $P.; postupku kodiranja. Slike se dijele na/ C<slike #Cntra 3oded Pictures% koje su samostalno kodirane unutarnjim prostornim #ancore picture% kodiranjem, P<slike #Predictive 3oded Pictures% koje su direktno kodirane sa predvi0anjem, uz nadomje,tanje pokreta, pri emu se kao polazna slika u postupku predvi0anja koriste prethodne C<slike. H<slike #Hidirectionall 3oded Pictures% koje se dvosmjerno kodirane sa predvi0anjem, uz nadomje,tenje pokreta, a mogu se genirirati iz prethodne, ali i iz naredne C ili P<slike. +dnosi izme0u ovih slika su grafiki predstavljeni na sljedeoj slici.
Pri tome se kao polazne slike u postupku predvi0anja koriste i prethodne i budue C<slike ili P<slike i E<slike #E3 3oded Pictures% kod kojih se kodira samo istosmjerni #E3% koeficijent diskretne kosinusne transformacije. ;@&P1 S>C!1 #;+P, ;roup of Pictures% se sastoji od jedne ili vi,e slika, a predstavlja najmanju jedinicu koja moe biti neovisno dekodirana unutar video sekvence. S.!D.231 je najvi,i sloj u hijerarhijskoj strukturi kodiranja koja se sastoji od zaglavlja i odre0enog broja grupa slika. 5aglavlje sekvence uspostavlja poetno stanje dekodera kako prethodno dekodirane sekvence ne bi imale uticaja na trenutni proces dekodiranja. )14532 Potreba da se ogromna koliina podataka unutar digitalnog video signala smjesti u znatno manji prostor, stvorila je novu oblast kompresije u proizvodnji i emitovanju televizijskog signala/ $P.;<-. $P.;<- predstavlja grupu standarda sa razliitim profilima i nivoima. Profil moe biti razmatran kao podskup skupa parametara koji potpuno definiraju video sintaksu, dok je nivo skup ogranienja koja vrijede za parametre video sintakse. Dideo sintaksa moe biti podjeljena u dvije glavne kategorije/ slojevitu i cjelovitu sintaksu. 3jelovita sintaksa definira neophodne postupke za kompresiju izvornih formata video signala, ukljuujui i analiziranje s proredom. Slojevita sintaksa prua mogunosti rekonstrukcije slike iz dijelova ukupnog toka podataka, ,to je postignuto podjelom ukupnog toka podataka na dva ili vi,e slojeva poev,i od osnovnog sloja koji moe biti nadopunjen dodatnim slojevima. +snovni algoritam kodiranja predvi0en $P.;< standardom je zadran i u $P.;<- standardu, a manje izmjene su nastale zbog potrebe za prilago0avanjem $P.;<- standarda ulaznom formatu slike koji koristi analiziranje s proredom, gdje se jedna slika dijeli na dvije poluslike sastavljene od parnih i neparnih linija. $P.;< standard dopu,ta samo progresivno analiziranje, dok $P.;<- standard, kao opi standard, mora sadravati rje,enja i za progresivne formate izvorne slike i za formate izvorne slike s proredom, koji zahtjevaju sloenije naine predvi0anja. ;lavne osobine $P.;<- standarda su/ $P.;<- : $P.;< X alati inerlace X prifili i nivoi 2ova field7frame predikcija i E3) modovi za analizu s proredom #interlace% !vantizacija u veem podruju i adaptivnost 2ovi D>S #Dariable >ength 3odes% Pro,irena skalabilnost #prostorna, S2@, vremenska% Sistemski sloj za vi,estruke transportne struje 1udio pro,iren na multi<kanalni zvuk Slojevitost je kljuni koncept, ijom primjenom je mogue postii kompatibilnost $P.;<- postupka kodiranja sa postojeim algoritmima kao ,to su JP.;, $P.;<, ali je to i vrlo djelotvorna tehnika za rje,avanje op,tih problema vezanih za vi,erezolucijske ulazne formate, kodiranje sa promjenljivom brzinom prenosa i sueljavanje sa mreama zasnovanim na asinhronom nainu prenosa. $P.;<- standard predvi0a nekoliko razliitih oblika slojevitosti, kao ,to su odjeljivanje podataka, slojevitost u odnosu na omjer signal7,um, prostorna slojevitost i vremenska slojevitost. Podrane su i kombinacije ovih osnovnih oblika slojevitosti, koje daju hibridnu slojevitost. +snovna slojevitost dozvoljava podjelu video signala u dva sloja, dok hibridna slojevitost podrava podjelu u tri sloja. $P.;<-, kao op,ti standard za kodiranje video signala, mora biti prilago0en razliitim primjenama i formatima izvornih slika, ,to je postignuto primjenom strukture profila i nivoa. Profil je difiniran kao skup od jednog ili vi,e osnovnih standarda, dok je nivo definiran podrujem parametara kao ,to se veliina slike, frekvencija izmjene slika, brzina prenosa i dr. $P.;<- standard predvi0a pet razliitih profila/ +snovni profil, s najniom kvalitetom i bez mogunosti slojevitog kodiranja. ;lavni profil, istih svojstava kao i osnovni, ali bez mogunosti interpolacije slika. Profil sa slojevito,u u odnosu na omjer signal7,um, u kome su podrane razliite kvalitete slike iskazane preko omjera signal7,um. Profil sa prostornom slojevito,u, u kome su podrane razliite prostorne rezolucije slike. Dr,ni profil, koji podrava potpunu slojevitost. $P.;<- standardom su utvr0ena etiri nivoa/ 2iski nivo, koji odgovara 3C4 formatu slike iz ".-6 standarda ili SC4 formatu slike iz $P.;< standarda. ;lavni nivo, koji odgovara standardnim formatima )D slike #2)S3, P1>, S.31$%. Disoki 99( nivo, koji odgovara )D signalu visoke kvalitete sa 99( uzoraka po liniji. Disoki nivo, koji odgovara )D signalu visoke kvalitete sa B-( uzoraka po liniji. 2ivoi su pridrueni svakom profilu, ali nisu mogue sve kombinacije profila i nivoa. 5bog ovakve strukture $P.;<- standard podrava veliki raspon horizontalnih i vertikalnih rezolucija, formata slike i brzina prenosa. )14534 $P.;<9 ima za cilj osigurati op,ti i djelotvoran postupak kodiranja audiovizuelnih podataka u razliitim oblicima, koji se nazivaju audiovizuelni objekti. 3ilj $P.;<9 standarda je prikaz Ysvijeta koji nas okruujeY kao kompozicije audiovizuelnih objekata, koja je popraena tekstom koji opisuje njihove prostorne i vremenske odnose. $P.;<9 standard e omoguiti ineraktivnu mobilnu multimedijsku komunikaciju, video telefoniju, mobilnu audiovizuelnu komunikaciju, elektronsko novinarstvo, videotekst itd. $P.;<9 standardni postupak se sastoji od etiri osnovna dijela/ $SE> #$P.;<9 S=ntactic Eescription >anguage%, alati, algoritmi i profili. $SE> treba omoguiti odabir, opis i prenos alata, algoritama i profila, te opisivati na koji se nain analizira i procesira elementarni tok podataka. +snovna svojstva $P.;<9 standarda video kompresije moemo svrstati na sljedei nain/ Pobolj,ana kodna efikasnost na niskim brzinama digitalnog protoka #H@% < pobolj,ana kompenzacija kretanja < separatno kodiranje objekata < pozadina se rje0e kodira u odnosu na pokretne objekte < mogua primjena na niim $P.;<- bitskim brzinama 2ove funkcije zasnovane na interaktivnosti sadraja < separatno kodirani objekti se mogu koristiti za proizvodnju raznovrsnih rezultujuih programa zasnovanih na interakciji sa korisnikom