Lecture16 PDF

Computer Systems Architecture
Lecture 16
Mahadevan Gomathisankaran
March 30, 2010
03/30/2010
Lecture 16
CSCE 4610/5610
Term Project
Project abstract due on 03/30/2010 before class.

Project reports due on 04/29/2010 before class.
Project interviews for graduate students from 04/30.
03/30/2010
Lecture 16
CSCE 4610/5610
Final Exam
Take home (just like assignment).

Will be given in class on 05/04/2010 and will be due before class
on 05/06/2010.
Policies will be strictly enforced.
03/30/2010
Lecture 16
CSCE 4610/5610
Memory Hierarchy: Performance Metrics
Miss rate: NO
Average Memory Access Time: Hit Time + Miss rate Miss
Penalty
CPU Execution time
CPU Execution Time
(CPU Clock Cycles + Memory Stall Cycles)

Clock Cycle Time
Memory Stall Cycles
=
=
=
03/30/2010
Lecture 16
Number of Misses Miss Penalty

Misses
Miss Penalty
IC
Instruction
Mem Access
IC
Miss Rate Miss Penalty
Instruction
CSCE 4610/5610
Improving Cache Performance
Reduce AMAT
Three factors in the equation:
Miss Penalty
Miss Rate
Hit Time
03/30/2010
Lecture 16
CSCE 4610/5610
Miss Penalty Reduction Techniques

Multi-level caches
Smaller cache is faster (reducing hit time)
03/30/2010
Lecture 16
CSCE 4610/5610

Multi-level caches
Larger cache has lower miss rate (reducing memory stalls)
03/30/2010
Lecture 16
CSCE 4610/5610

Multi-level caches
Solution: Use both, multiple level of caches
03/30/2010
Lecture 16
CSCE 4610/5610

Multi-level caches
Measuring performance of multi-level cache
AMAT = Hit timeL1 + (Miss rateL1 Miss penaltyL1 )
Miss penaltyL1 = Hit timeL2 + (Miss rateL2 Miss penaltyL2 )
Memory Stalls
= Misses per Ins.L1 Hit TimeL2 +
Instruction
Misses per Ins.L2 Miss PenaltyL2
03/30/2010
Lecture 16
CSCE 4610/5610

Multi-level caches
Memory Stalls
Instruction
Issues:
03/30/2010
Lecture 16
CSCE 4610/5610

Multi-level caches
Memory Stalls
Instruction
Issues:
How to compare second level caches ?
03/30/2010
Lecture 16
CSCE 4610/5610

Multi-level caches
Memory Stalls
Instruction
Issues:
How to compare second level caches ? global miss rate
03/30/2010
Lecture 16
CSCE 4610/5610

Multi-level caches
Memory Stalls
Instruction
Issues:
What is more important for second level cache? speed or miss rate
03/30/2010
Lecture 16
CSCE 4610/5610

Multi-level caches
Memory Stalls
Instruction
Issues:
What is more important for second level cache? speed or miss rate
How data should be placed in multiple levels? inclusion or exclusion
03/30/2010
Lecture 16
CSCE 4610/5610

Example
(Page 414, 3rd Ed)
For every 1000 memory references MissesL1 = 40 and MissesL2 = 20.
Hit TimeL1 = 1 clock cycle, Hit TimeL2 = 10 clock cycles, and
Miss penaltyL2 = 100 clock cycles. There are 1.5 memory references per
instruction. Find various miss rates, AMAT and memory stalls per instruction.
03/30/2010
Lecture 16
CSCE 4610/5610

Example
Miss rateL1 =
Local miss rateL2 =
Global miss rateL2 =
AMAT =
=
Misses
Instruction
Misses
L1
Instruction
Misses
L2
Instruction
Memory Stalls
Instruction
=
=
=
=
=
03/30/2010
40
= 4%
1000
20
= 50%
40
20
= 2%
1000

4
20
1+
10 +
100
100
40
3.4 clock cycles
Misses
Mem. Reference
Mem. Reference
Instruction
40
1.5 = 6%
1000
20
1.5 = 3%
1000
6
3
10 +
100
100
100
3.6 clock cycles
Lecture 16
CSCE 4610/5610
Reduce block latency

Miss penalty includes the latency to get the whole cache block
from next level
03/30/2010
Lecture 16
CSCE 4610/5610

from next level
Larger the block size larger the latency
03/30/2010
Lecture 16
CSCE 4610/5610

from next level
Small the block size higher the miss rate
03/30/2010
Lecture 16
CSCE 4610/5610

from next level
Why not have a cache of larger blocks but simulate the effect of
having smaller blocks ?
03/30/2010
Lecture 16
CSCE 4610/5610

from next level
Two approaches
03/30/2010
Lecture 16
CSCE 4610/5610

from next level
Two approaches
Critical word first
03/30/2010
Lecture 16
CSCE 4610/5610

from next level
Two approaches
Critical word first
Early restart
03/30/2010
Lecture 16
CSCE 4610/5610
Improve read performance over write

Use Amdahls law, read is more common than write
03/30/2010
Lecture 16
CSCE 4610/5610

wrie-through cache: check for conflicts in the write buffer
03/30/2010
Lecture 16
CSCE 4610/5610

wrie-through cache: check for conflicts in the write buffer
write-back cache: write a dirty block to a buffer instead of the
next level
03/30/2010
Lecture 16
CSCE 4610/5610

Reduce the bus traffic
Merge multiple writes
03/30/2010
Lecture 16
CSCE 4610/5610
10
Recycle the victims

There may be some conflict misses
Instead of increasing the associativity to reduce the miss add a
smaller fully associative cache to store the conflicts or victims
03/30/2010
Lecture 16
CSCE 4610/5610
11

Lecture16 PDF

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Lecture16 PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Computer Systems Architecture

March 30, 2010

Project abstract due on 03/30/2010 before class.

Take home (just like assignment).

Memory Hierarchy: Performance Metrics

(CPU Clock Cycles + Memory Stall Cycles)

Memory Stall Cycles

Number of Misses Miss Penalty

Improving Cache Performance

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Reduce block latency

Miss Penalty Reduction Techniques

Reduce block latency

Miss Penalty Reduction Techniques

Reduce block latency

Miss Penalty Reduction Techniques

Reduce block latency

Miss Penalty Reduction Techniques

Reduce block latency

Miss Penalty Reduction Techniques

Reduce block latency

Miss Penalty Reduction Techniques

Reduce block latency

Miss Penalty Reduction Techniques

Improve read performance over write

Miss Penalty Reduction Techniques

Improve read performance over write

Miss Penalty Reduction Techniques

Improve read performance over write

Miss Penalty Reduction Techniques

Miss Penalty Reduction Techniques

Recycle the victims

Você também pode gostar