Escolar Documentos
Profissional Documentos
Cultura Documentos
Histrico
Antes do CUDA 6.5...
Clculo da ocupncia era
complicado.
Leva em considerao as
capacidades da GPU.
Uso da planilha calculadora de
ocupncia em vez da
implementao.
Cenrio atual
Cuda 6.5 oferece funes em tempo de execuo para
calcular a ocupncia.
A
API
ncleo
da
calculadora
de
ocupncia:
cudaOccupancyMaxActiveBlocksPerMultiprocessor.
Prediz a ocupncia em termos do tamanho do bloco e uso de
memria compartilhada de um kernel.
Multiplicando-a pelo nmero de warps por bloco produz o
nmero de warps por multiprocessador simultneos; Alm
disso dividindo os warps simultneos pelo mximo de warps
por multiprocessador temos a ocupancia como uma
porcentagem.
Fonte: http://devblogs.nvidia.com/parallelforall/cuda-pro-tipoccupancy-api-simplifies-launch-configuration/
Parmetros
numBlocks- Ocupncia retornada;
func- Kernel para qual a ocupncia ser calculada;
blockSize- Tamanho do bloco o qual o kernel est tentado ser lanado;
dynamicSMemSize- Memria dinmica compartilhada por bloco usada, em
bytes.
Fonte: http://docs.nvidia.com/cuda/cuda-driverapi/index.html#ixzz3oDWa7dlZ