Escolar Documentos
Profissional Documentos
Cultura Documentos
RAUNARA
Dr. Velizar Pavlovi dipl. Ing.
Predavanje 11
Protoni sistemi
1000 = 10 * 10 * 10
Pretpostavimo da smo dobili zadatak da konstruiemo mainu koja e imati 1000 puta
bolje performanse u odnosu na neku sekvencijalnu koju tekue koristimo.
Pitanje se postavlja: Kako emo ostvariti taj cilj ?
Kao prvo, bolje performanse za 10 puta moemo ostvariti zahvaljujui prednostima
koje se nude od strane nove tehnologije (bra taktna frekvencija, nova tehnilogija
izrade tranzistora, ...)
jo 10 puta superiornije performanse mogu se ostvariti boljom arhitekturnom
organizacijom (ugradnjom ke memorije, ugradnjom akceleratora, protonom
obradom, ...)
konano, jo 10 puta bolje performanse mogu se postii korienjem paralelizma
2
Execution)
plitku od 5 do 6 stepeni
2.
10
Klase procesora
Postoje sledee klase procesora:
Mikrorontroleri
RISC procesori
CISC procesori
VLIW procesori
Digitalni Signal Procesori (DSP)
Multimedia procesori
Aplikaciono Specifini Instruction Set Processors (ASIP)
Druge klase
U daljem izlaganju ograniavamo se na izuavanje RISC i CISC procesora
11
Klasini CISC
procesori koriste
jedinstveni put za
pristup memoriji
podataka i memoriji
instrukcija. Ovakav
tip arhitekture se
naziva Princeton
arhitektura
14
16
17
18
20
RISC izazovi
Nakon tri decenije razvoja CISC arhitektura, korisnici raunara su poeli da
procenjuju odnos izmedju ISA i dostupnih hardversko/softverskih tehnologija.
Analizama programa (uglavnom sprovedenih trasiranjem) ustanovljeno je da:
25% od svih raspoloivih kompleksnih instrukcija troi 95% od ukupnog vremena
potrebnog za izvrenje programa
ostalih 75% hardversko-podr`avanih
programa (manje od 5%).
Klasino pitanje
Zbog ega troiti veliki deo povrine ipa na instrukcije koje se retko koriste ?
Odgovor
Kompleksne instrukcije, nakon procene njihovog pojavljivanja u programima, treba
kada je njihov procenat mali implementirati softverski (u vidu potprograma), a ne
hardverski kakva je bila dotada{nja praksa kod CISC procesora.
Implementacija retko korienih instrukcija u softveru omoguava da se skoro svi
gradivni blokovi procesora smeste na jedinstveni VLSI ip. ta vie, u okviru jednog
RISC procesorskog ipa, na dana{njem nivou tehnologije, mogue je ugraditi sada onchip ke kao i ve}i broj FP jedinica.
Skup instrukcija RISC procesora je manji od 100 instrukcija, pri emu su instrukcije
obima 32- ili 64- bita, ali ne oba formata istovremeno.
Koriste se od tri do pet adresnih naina rada. Arhitektura RISC-a je tipa Load/Store.
To znai da sve instrukcije pribavljaju operande iz registara i smetaju rezultate i registre
(register-based), a da su Load i Store jedine dve naredbe pomou kojih se procesor obraa
memoriji.
22
CISC
protiv
RISC
24
Ko je dobio, a ko izgubio ?
Debata izmedju projektanata RISC i CISC procesora, oko toga koji je
pristup bolji, po svemu izgleda je sada zavrena.
Obe strane u proteklom periodu nauile su i prihvatile jedna od druge puno
dobrih i korisnih sugestija i reenja.
Na dananjem nivou razvoja po svemu sude}i te granice su postale takorei
nevidljive.
Veliki broj procesora danas se implementira u istoj tehnologiji
ugradjivanjem hibridnih reenja koje uzimaju u obzir dobre osobine kako
RISC tako i CISC procesora.
Kada protoni sistem izvrava dve instrukcije izmedju kojih postoje zavisnosti tada
moe da dodje do zastoja ili nekorektnog rada sistema pa se takva situacija naziva
hazard (opasna situacija)
Zavisnosti po podacima
Ove zavisnosti se esto nazivaju i programske zavisnosti
30
Upravljake zavisnosti/hazardi
Primer
Ii
Ii+1
Procesor sa
estostepenom
protonom
obradom
Ii+2
;granaj se na Ij
Ii+3
.
.
.
Ij
Ij+1
.
.
niz instrukcija
31
ALU instrukcije
Analizira}emo prvo kakva treba da bude struktura 32-bitnog
procesora kada on izvrava aritmetike instrukcije tipa registar-u-registar.
U konkretnom sluaju analiziraemo etvoro-stepeni protoni sistem,
FX-4P, koga ine stepeni IF, ID, EX i WB, ispunjava postavljene zahteve.
Add R1,R2,R3
35
Potrebna
struktura
FX-4P za
ADD
memorija
za
instrukcije
adresa
(PC)
instrukcija
1. IF
32
PC
32
+4
Inc 4
(PC)+4
32
L1
Add
R2
R1
R3
5
5
6
2. ID
ostalo
RF
polje
(multiport
memory)
5
32
32
L2
Add R1,R2,R3
Add
R1
(R2)
(R3)
32
32
6
3. EX
dekoder
ALU op
add
ALU
(R2)+(R3)
32
L3
R1
(R2)+(R3)
4. WB
32
reg-write
data-in
RF polje
multi-port polje
36
37
38
Aktivnosti stepena od S1 do S5
39
40
Lw
R1,100(R2)
; (R1) M(100+R2)
41
Sw R4,200(R3)
(R4) M(200+R3)
42
Potrebna
struktura
FX-5P za
Store
memorija
za
instrukcije
adresa
(PC)
instrukcija
1. IF
32
PC
32
+4
Inc 4
(PC)+4
32
L1
Sw
R3
R4
200
reg_Read
reg_Read
data_out
6
2. ID
data_out
RF
polje
16
sign_ext
32
32
32
L2
Sw
(R4)
(R3)
200
32
32
Sw
R4,200(R3)
32
3. EX
dekoder
ALU_op
add
ALU
32
L3
(R4)
(R3)+200
32
32
data_in
4. MA
mem_Write_adr
memorija
podataka
L4
5. WB
RF polje
43
44
MIPS procesor
45