Você está na página 1de 12

Audio kompresija

Digitalna audio kompresija omoguava efikasno skladitenje i prenos audio sadraja. Audio kompresija se moe podijeliti u dvije grupe: kompresija bez gubitaka (lossless compression kompresija sa gubitkom (loss! compression

Kompresija bez gubitaka


"ompresija bez gubitaka kompresuje audio sadraj na takav na#in da se prilikom njegove dekompresije dobija signal koji je potpuno identi#an po#etnom signalu. $ako ima svoji% prednosti& ova vrsta kompresije nije postigla veu popularnost u digitalnoj audio kompresiji& prvenstveno zbog malog stepena kompresije koji se za zvuk 'D kvaliteta (() bita& **.( "+z kree izme,u -./ i 0./. 1e%nike kompresije bez gubitaka se uglavnom razlikuju po brzini audio kompresije i dekompresije dok kvalitet kompresovanog sadraja nema nikakvu ulogu.

Kompresija sa gubicima
2vuk koji se smatra 3manje vanim4 je kodiran sa smanjenom precizno#u ili nije u opte kodiran& zbog toga kompresija sa gubitkom smanjuje taj s%vatljivi viak. Da bi se odredilo koje informacije u audio signalu su 3manje vane4& veina algoritama kompresije sa gubitkom koriste transformacije kao to je modifikovana diskretna kosinusna transformacija (5D'1 da konvertuje vremenski domen semplovanog zvuka u domen frekvencije. "omponentama frekvencija mogu se alocirati bitovi na osnovu nji%ove zvu#nosti. 2vu#nost frekvencijske komponente se definie tako to se prvo izra#unava prag maskiranja ispod koje se pretpostavlja da je zvuk izvan limita ljudske percepcije (psi%o6akusti#ni model . 1ako,e neki algoritmi kompresije sa gubitkom koriste 78' (7inear 8erceptive 'oding da konvertuju vremenski domen semplovanog zvuka. 8oto kod kompresije sa gubitkom dolazi do opadanja kvaliteta audio zvuka& ova kompresija se smatra neodgovarajuom kod profesionalni% audio ininjerski% aplikacija kao to je editiranje zvuka i multitrack snimanja zvuka. 5e,utim& ova kompresija je veoma pogodna za prenos i skladitenje audio podataka.

%ttp:99:::.besplatniseminarskiradovi.com

Moderne metode audio kompresije


8ostoji nekoliko algoritama moderne kompresije i metoda za skladitenje audio sadraja u kompjuterskoj te%nologiji: 58- (58;<6( 7a!er6=astoji se od psi%oakusti#nog modela& >>1 analiza& %ibridni% filtera& nelinearne kvantizacije& +uffman6ovog kodovanja& ? kanala sa konstantnim ili promjenjivim brzinama bita od -? do ?0) kb9s i koji je uspjeno implementiran u moderne 'D9D@D i portabl plejere& mobilne telefone&... 58- 8ro "reiran od strane 'oding 1ec%nologies 7aborator!& zasniva se na principima formiranja 58- formata& sastoji se od =AB (=pectral Aand Beplication te%nologije koja koduje visoko frekventni opseg (od (. do (0 k+z sa veoma malom brzinom bita. AA' (58;<6? Advanced Audio 'oding "reiran od strane A1C1& Dolbija& >raun%ofer $$= i =onija& je $=D standard 58;<6? koji se sastoji od osnovni% principa 58- formata uklju#ujui psi%oakusti#ni model& %ibridne filtere& skalabilne brzine odmjeravanja& ? kanala sa brzinama bita od *E do 0F) kbps. AA' 8lus 8oti#e od AA' formata& sastoji se od =AB6a sa brzinom bita do (.. kbps. G5A (Gindo:s 5edia Audio "reiran od strane 5ikrosofta& sastoji se od DB5 (Digital Big%ts 5anagement & 'AB i @AB& G5A kodovanja digitalnog audia bez gubitaka (brzine bita ?:( do -:( & G5A profesionalno kodovanje viekanalnog audia ((?E do F)E kbps i G5A za kodovanje glasa (od * do ?. kbps . @H> (@ector Huantization >ile "reiran od strane II1 +uman $nterface 7aboratories i Jama%a& nastao je na osnovu 58- principa& kompleksnijeg kodovanja& ?06-0/ bolja kompresija u odnosu na 58- kompresiju.

MPEG audio kompresija / MPEG-1 Layer-3 MP3!

1%e 5otion 8icture ;Kperts <roup (58;< radna grupa je osnovana (LEE. godine i definisala je standarde za video i audio kompresiju. Dbjavljen (LL-. godine od strane $nternational =tandards Drganization 9 $nternational ;lectrotec%nical 'ommission ($=D9$;' & 58;<6(& $=D9$;' (((F? standard uklju#uje specifikacije za (6? 5bps video kompresiju i tri sloja za audio kompresiju. 1ermin 58- je obi#no koriten kao referenca za 58;<6( 7a!er6- specifikaciju za audio kodovanje. 58- standard definie procese dekodovanja& format niza bita i strategiju kodovanja audio sadraja. =amo jezgro algoritama i teoriju su prvobitno razvili na >raun%ofer $nstitutu& koji ima nekoliko patenata vezani% za ovaj metod kodovanja. 58;< audio istraiva#i su izvrili obiman subjektivan sluala#ki test kroz razvoj ovog standarda. 1est je pokazao da #ak pri kompresiji ):( i pri optimalnim uslovima za sluanje& sluala#ki eKperti nisu bili u stanju da razlikuju kodirani i originalni audio klip. ;mpirijski rezultati su tako,e pokazali da ljudsko u%o ima ograni#enu frekvencijsku selektivnost koja varira u otrini od neto manje od (..+z za najnie #ujne frekvencije do neto vie od *k+z za najvie. 8rema tome #ujni spektrum moe biti podeljen na kriti#ne opsege koji predstavljaju mo razlu#ivanja ljudskog u%a kao funkcija zavisna od frekvencije. 2bog toga to ljudsko u%o ima ograni#enu mo da razlikuje frekvencije& ta kriti#na ta#ka za maskiranje uma bilo koje frekvencije jedino zavisi od aktivnosti signala u kriti#nom opsegu te frekvencije. 2a audio kompresiju& ova osobina odnosno to pravilo se moe koristiti u transformisanju audio signala u domen frekvencija& zatim podeliti rezultajui spektrum u podopsege koji priblino odgovaraju kriti#nim opsezima i na kraju kvantifikovati svaki podopseg na osnovu #ujnosti kvantifikovanog uma koji se nalazi unutar tog opsega. 2a optimalnu kompresiju& svaki opseg bi trebao biti kvantifikovan sa ne veim brojem nivoa od potrebnog& da bi kvantifikovan um bio ne#ujan.

MPEG audio kodo"anje i dekodo"anje


Mlazni audio signal prolazi kroz filter bank ( dio za filtriranje signala koji djeli ulazni signal na vie razli#iti% podopsega. Mlazni audio signal simultativno prolazi kroz psi%oakusti#ni model koji odre,uje signal6maska odnos za svaki podopseg. Ait ili um blok za dodjeljivanje& koristi odnos signal6maska kako bi pravilno odmjerio i dodjelio broj kodirani% bitova potrebni% za kvantifikaciju svi% podopsega signala kako bi umanjio #ujnost kvantifikovanog uma. Ia kraju& poslednji blok uzima tu reprezentaciju kvantifikovanog audio sempla i formira bitove koje je mogue dekodirati. Dekoder jednostavno vri obrnuto formiranje& zatim rekonstruie kvantifikovane vrednosti svi% podopsega u vremenski domen audio signala. 58;< audio standard ima tri sloja (la!ers za kompresiju. 7a!er $ formira najednostavniji algoritam& a 7a!er $$ i 7a!er $$$ su nastavci koji koriste neke elemente iz 7a!er $. =vaki od ovi% slojeva pobojava perfomanse kompresije na utrb vee kompleksnosti kodera i dekodera.

LA#E$ %
7a!er $ algoritam koristi osnovni filter bank koji se moe nai u svim ostalim slojevima. Dvaj filter bank dijeli audio signal na -? jednaka frekvencijska opsega. 8rva& -? frekvencijska opsega ne reflektuju ta#no kriti#ne opsege kod ljudskog u%a. Dpseg je suvie irok za niske frekvencije tako da broj kvantifikovani% bitova ne moe biti posebno nameten na osetljivost na um u svakom kriti#nom opsegu. >ilter bank proizvodi -? frekvencijska sempla& jedan sempl po opsegu& za svaki od -? audio sempl ulaza. 7a!er $ algoritam zajedno grupie (? semplova za svaki od -? opsega. =vakoj grupi od (? semplova se dodjeljuje jedan bit i (ako bit nije nula faktor skaliranja. Dodjeljivanje bita odre,uje broj bitova koji predstavljaju svaki sempl. >aktor skaliranja je umnoak koji odre,uje veli#inu sempla da bi maksimizovao rezoluciju kvantifikatora. 7a!er $ koder formira -? grupe po (? semplova (ukupno -E* semplova u jedan frejm. 8ored audio podatka& svaki frejm sadri %eader i 'B' (eng. c!clic redundanc! code proveru i mogue dodatne podatke.

LA#E$ %%
7a!er $$ algoritam je jednostavno proirenje 7a!er $. 8oboljava perfomanse kompresije kodirajui podatke u vee grupe. 7a!er $ kodira podatke u pojedina#ne grupe po (? sempla za svaki podopseg& a 7a!er $$ kodira podatke u - grupe od (? seplova za svaki podopseg. "oder vri kodiranje sa jedinstvenim faktorom skaliranja za svaku grupu od (? seplova jedino ako je neop%odno da se izbegne audio distorzija. "oder dijeli vrednost faktora skaliranja izme,u dve ili tri grupe samo u dva slu#aja: (( kada su vrednosti faktor skaliranja dovoljno blizu (? kada koder o#ekuje da e privremeno maskiranje uma ljuskog uveta sakriti konsekventu diztorziju.7a!er $$ algoritam tako,e pobojava perfomanse 7a!er $ reprezentacijom alokacije bita& vrednostima faktora skaliranja i kodiranjem kvantifikacije semplova efikasnijim kodom.

LA#E$ %%%
7a!er $$$ algoritam je mnogo finiji pristup. $ako je zasnovan na istom filter bank6u kao i 7a!er $ i 7a!er $$& 7a!er $$$ vri kompenzaciju neki% nedostataka u filter bank6u tako to procesuira izlaze iz filter bank6a sa modifikovanom diskretnom kosinusnom transformacijom ( 5D'1 .

5D'1 dalje dijeli izlaze filter bank6a na frekvencije da bi obezbedio bolju spektralnu rezoluciju. 2bog neizbjenog 4trgovanja4 izme,u vremenske i frekvetne rezolucije& 7a!er $$$ specifira dvije razli#ite veli#ine 5D'1 bloka. Duga#ki blok od -) sempla i krai blok od (? sempla. "ratak blok poboljava vremensku rezoluciju da bi se bolje suo#io sa tranzientima. Alok kratke duine cini jednu treinu dugog bloka. 7a!er $$$ ima tri stanja blokiranja& dva stanja gde -? filter bank izlaza prolaze kroz 5D'1 sa istom duinom bloka i meoviti blok stanje gde se ? donja frekvetna opsega koriste duga#ke blokove& a -. gornji% koriste kratke blokove.

Karakteristike MP3 kompresije


58;< standard za audio kompresiju pri%vata audio sadraj snimljen na -? k+z& **.( k+z i *E k+z. =tandardni digitalni 'ompact Disk ('D sadri dva kanala nekompresovani% ()6bitni% 8'5 (8ulse 'ode 5odulation podataka odmjereni% na **.( k+z. M ovom formatu& svaki odmjerak predstavlja odre,eni napon u jednom trenutku vremena. Bezultujui niz bita za%tjeva prolaz podataka od (.*(( 5bps da bi se obavio prenos ovog audio sadraja. Dobro kodovan 58- sadraj moe dostii priblian 'D kvalitet audio reprodukcije pri brzini podataka od (?E "bps. Audui da su karakteristike ljudskog vida i slu%a veoma razli#ite& za kompresiju zvuka se koriste potpuno druga#iji algoritmi kompresije. M%o ima puno vei dinamiki opseg i rezoluciju ali je NsporijeN.

&%LE &ormat
58;< standard definie prezentaciju audio sadraja. Dsim toga& 58;< tako,er dobro definie kako pretvoriti kodovan audio sadraj u niz bita sa sin%ronizacijom i zaglavljem dovoljnim za normalno dekodovanje bez ikakvi% dodatni% informacija dodati% u dekoderu.

MPEG-1/' Layer-3 (ormat zag)a")ja


58;<6(9? definie format zaglavlja koji je sadran u svakom frejmu (svake ?* ms na frekvenciji odmjeravanja od *E k+z . 2aglavlje& pored ostalog sadri slijedee podatke: =!nc :ord 2a razliku od drugi% standarda& sync word moe tako,e da sadri audio podatke. Butina za sin%ronizaciju treba da provjeri prisustvo vie od jednog sync word na odre,enoj udaljenosti i u slu#aju da postoji vie od jednog s!nc :ord treba da izvri resin%ronizaciju. Ait6rate Bit-rate je uvijek zadat za cijeli audio sadraj a ne po kanalima. M slu#aju 7a!er6-& dozvoljeno je prebacivanje bit-rate u pokretu& pratei bit-rate kodovanje. =ampling freOuenc! Ia osnovu frekvencije odmjeravanja vri se prebacivanje %ard:are6skog ili soft:are6skog dekodera na razli#ite frekvencije odmjeravanja& kao npr. -? k+z& **.( k+z ili *E k+z u slu#aju 58;<6(. 7a!er 2aglavlje sadri informaciju koja upuuje na to o kojem sloju se radi 7a!er6(& 7a!er6? ili 7a!er6 - i da li je u pitanju 58;<6( ili 58;<6?. 'oding mode "ao fiksni parametar& mod kodovanja pravi razliku izme,u mono& dual mono& stereo ili join stereo kodovanja. 'op! protection =vako zaglavlje nosi dva bita za ='5= (=erial 'op! 5anagement =c%eme . Dd kada je omogueno laka manipulacija sa ovim bitima putem soft:are& prakti#na vanost ovog na#ina zatite od kopiranja je minimalna.

*izue)ni prikaz zag)a")ja MP3 (ormata

Pozicija A A ' D ; > < + $ P " 7 5

+pis >rame s!nc 58;< audio version (58;<6(& ?& etc. 58;< la!er (7a!er $& $$& $$$& etc. 8rotection (if on& t%en c%ecksum follo:s %eader Aitrate indeK (lookup table used to specif! bitrate for t%is 58;< version and la!er =ampling rate freOuenc! (**.(k+z& etc.& determined b! lookup table 8adding bit (on or off& compensates for unfilled frames 8rivate bit (on or off& allo:s for application6specific triggers '%annel mode (stereo& joint stereo& dual c%annel& single c%annel 5ode eKtension (used onl! :it% joint stereo& to conjoin c%annel data 'op!rig%t (on or off Driginal (off if cop! of original& on if original ;mp%asis (respects emp%asis bit in t%e original recordingQ no: largel! obsolete

,u-ina u bitima! (( ? ? ( * ? ( ( ? ? ( ( ?

.a/to MP3 kompresija 0


M potrazi za razlozima 3zato koristiti 58-4 a ne neku drugu te%nologiju za kompresiju& 58- se namee kao glavni alat za isporuku audio sadraja preko $nterneta i to iz sljedei% razloga: Dtvoreni standard 58;< je definisan kao otvoreni standard. =pecifikacija je na raspolaganju (besplatno svima koji su zainteresovani za implementaciju ovog standarda. $ako postoje brojni patenti koji pokrivaju 58;< audio kodovanje i dekodovanje& svi vlasnici patenata su se obavezali da ce dozvoliti upotrebu patenata svima pod razumnim uslovima. 8odravajue te%nologije Rim je audio kompresija uo#ena kao glavna te%nologija& dolo je do naglog irenja zvu#ni% kartica& ra#unari su postali dovoljno brzi da bi obavili kodovanje i dekodovanje& zvu#ni zapisi se naglo prebacuju sa normalnog audio formata na 58- (razlog za to je uteda memorije &... Mkratko& 58- je bila prava te%nologija u pravo vrijeme.

1kratko o MP3 kompresiji


58- (i slicne kompresije se zasnivaju na uklanjanju Nsuvini%N %armonika (poto #ovjek #uje samo odre,en mali broj . Ia osnovu toga& programi poput au'Dtect6a lako detektuju da li je pjesma Noriginal studio recordingN ili Ndecoded 58;<N. Algoritmi uklanjaju i suvine dijelove iz bu#niji% dionica koje #ovjek tako,e ne moe da utvrdi. 58- kompresija spada u grupu perceptualni% kodera i jedan od principa& ta#nije primarni princip na kome se zasniva su psi%oakusti#ni efekti. Pedan od nji% je maskiranje frekvencija. 5oe biti frekvencijsko i vremensko maskiranje. >rekvencijsko je kada postoje dva signala bliska po frekvenciji od koji% je jedan ja#i& tako da u%o ne moe da #uje ovaj slabiji& a to se ti#e vremenskog& stvar je u tome da #ak i kad taj ja#i signal prestane& treba da protekne jedan odre,eni dio vremena dok u%o ne Nu%vatiN taj slabiji signal. Mklanjanjem ti% Nnepotrebni%N signala (koje u%o ne #uje smanjuje se i veli#ina fajla. Dakle algoritam u enkoderu ima za cilj da napravi to bolji psi%oakusti#ni model& sa to manje gubitaka u kvalitetu zvuka i to primeni na sam zvu#ni zapis.

+k"irni prikaz kako kodiramo MPEG-1 Layer-3 MP3 !


fs S **(..Q fn!O S fs9?Q order S ?..Q BTdo:n S EQ BTup S EQ divisorT. S (Q divisorT( S *Q divisorT? S *Q divisorT- S EQ divisorT* S ?0)Q divisorT0 S ?0)Q / frekvencija / I!Ouistov odnos / stepen >$B filtera / do:nsampling stepen / upsampling stepen / djelitelj za svaki podopseg& koji nam simulira gubitak pri kompresiji

divisorT) S ?0)Q divisorTF S ?0)Q UzVS:avread(Wsound?.:avW Q G. S U.....(9fn!O ?F0).?09fn!OVQ / Bazbijemo spektar na E jednaki% delova irine ?F0).?0 +z A. S fir((order& G. Q G( S U?F0).?09fn!O 00(?.09fn!OVQ A( S fir((order& G( Q G? S U00(?.09fn!O E?)E.F09fn!OVQ A? S fir((order& G? Q G- S UE?)E.F09fn!O ((.?09fn!OVQ A- S fir((order& G- Q G* S U((.?09fn!O (-FE(.?09fn!OVQ A* S fir((order& G* Q G0 S U(-FE(.?09fn!O ()0-F.09fn!OVQ A0 S fir((order& G0 Q G) S U()0-F.09fn!O (L?L-.F09fn!OVQ A) S fir((order& G) Q GF S U(L?L-.F09fn!O ??.*L9fn!OVQ AF S fir((order& GF Q !. S conv(A.& z !( S conv(A(& z !? S conv(A?& z !- S conv(A-& z !* S conv(A*& z !0 S conv(A0& z !) S conv(A)& z !F S conv(AF& z Q Q Q Q Q Q Q Q / konvolucijska funkcija

/ Do:nsample t%e bands !. S !. X ?0)Q !( S !( X ?0)Q !? S !? X ?0)Q !- S !- X ?0)Q !* S !* X ?0)Q !0 S !0 X ?0)Q !) S !) X ?0)Q !F S !F X ?0)Q d. S round((do:nsample(!.& BTdo:n d( S round((do:nsample(!(& BTdo:n d? S round((do:nsample(!?& BTdo:n d- S round((do:nsample(!-& BTdo:n d* S round((do:nsample(!*& BTdo:n d0 S round((do:nsample(!0& BTdo:n d) S round((do:nsample(!)& BTdo:n dF S round((do:nsample(!F& BTdo:n / upsample t%e do:nsampled bands d. S d. 9 ?0)Q d( S d( 9 ?0)Q

9divisorT. 9divisorT( 9divisorT? 9divisorT9divisorT* 9divisorT0 9divisorT) 9divisorTF

Q Q Q Q Q Q Q Q

d? S d? 9 ?0)Q d- S d- 9 ?0)Q d* S d* 9 ?0)Q d0 S d0 9 ?0)Q d) S d) 9 ?0)Q dF S dF 9 ?0)Q u. S upsample(d.& BTup u( S upsample(d(& BTup u? S upsample(d?& BTup u- S upsample(d-& BTup u* S upsample(d*& BTup u0 S upsample(d0& BTup u) S upsample(d)& BTup uF S upsample(dF& BTup f. S conv(A.& u. f( S conv(A(& u( f? S conv(A?& u? f- S conv(A-& uf* S conv(A*& u* f0 S conv(A0& u0 f) S conv(A)& u) fF S conv(AF& uF Q Q Q Q Q Q Q Q

Q Q Q Q Q Q Q Q / upotreba anti6aliasing filtera

/ sabiramo rezultate da bi dobili originalni signal outputS EX(divisorT.Xf.YdivisorT(Xf(YdivisorT?Xf?YdivisorT-Xf-YdivisorT*Xf*YdivisorT0Xf0YdivisorT )Xf)YdivisorTFXfF Q :av:rite(output&fs&Woutput.:avW Q

Driginalni signal X.:av

Bezultat simulacije:

Ako pogledamo oba signala na gornjim slikama vidjeemo sljedee: 6 prva slika pokazuje originalni zvu#ni signal u GA@ formatu 6 druga slika pokazuje rezultat simulacije u 5atlab6u koji je snimljen u GA@ formatu jer 5atlab ne moe da radi sa 58- formatom. Ia drugoj slici moemo vidjeti simulaciju gubitaka prilikom 58- kompresije. 2vu#ni detalji koji su uo#ljivi na prvoj slici a koji vremenski kratko traju u toku kompresije su 3ispeglani4. 1o su detalji koje ljudsko u%o ne #uje ili #uje ali veoma slabo pa se ti detalji u toku kompresije gube.

Primjer programa za kon"erziju audio sadr-aja


Dvaj program ima mogunosti importovanja fajlova u GA@

Audacity

formatu i 58- formatu. 5oe da vri konverziju izme,u ova dva formata uz dodatno detaljno podeavanje parametara svakog od nji%. =adri brojne efekte za obradu zvuka i podrava snimanje materijala direktno sa mikrofona.

Dvaj program je namjenjen prvenstveno konverziji zvu#ni% fajlova iz jednog formata u drugi. 8odrava sljedee formate: :av& mp(& mp?& mp-& mp*& m*a& ogg& aac& ape& flac& :ma. Dmoguava dodavanje detalja uz svaki zvu#ni zapis kao to su autor& izvo,a#& anr& godina izdavanja& ... $ma mogunost ripovanja audio 'D6ova i kreiranja audio 'd6ova.

.ak)ju2ak
58- je zasluan za revoluciju u muzi#koj industriji na sli#an na#in na koji je po#etkom osamdeseti% tu revoluciju izazvao kompakt disk. 'D6ovi su doneli diskografskoj industriji odgroman profit& prodajui ljubiteljima muzike istu stvar po nekoliko puta& dok je nagla popularnost razmjene muzike preko $nterneta& za ta najvie moemo da za%valimo 58formatu& izazvala pravu paniku u muzi#kom svetu. 58-& naime& ne podrava nikakve me%anizme za kontrolu kopiranja& pa je razumljivo zato diskografska industrija eli da ovaj format zameni Nne#im sigurnijimN. $ dok kompanije 5icrosoft& Beal Iet:orks i Apple ve imaju svoje predloge reenja& audiofili i ljubitelji novi% te%nologija tako,e su se upustili u istraivanje alternativa& nezadovoljni ograni#enjima 58- formata.

Você também pode gostar