Você está na página 1de 5

Trabalho 2

Aluno: Jos Bonifacio da Silva


Jnior
Professor: Marco Tlio Chella

Histrico
Antes do CUDA 6.5...
Clculo da ocupncia era
complicado.
Leva em considerao as
capacidades da GPU.
Uso da planilha calculadora de
ocupncia em vez da
implementao.

Cenrio atual
Cuda 6.5 oferece funes em tempo de execuo para
calcular a ocupncia.
A
API
ncleo
da
calculadora
de
ocupncia:
cudaOccupancyMaxActiveBlocksPerMultiprocessor.
Prediz a ocupncia em termos do tamanho do bloco e uso de
memria compartilhada de um kernel.
Multiplicando-a pelo nmero de warps por bloco produz o
nmero de warps por multiprocessador simultneos; Alm
disso dividindo os warps simultneos pelo mximo de warps
por multiprocessador temos a ocupancia como uma
porcentagem.
Fonte: http://devblogs.nvidia.com/parallelforall/cuda-pro-tipoccupancy-api-simplifies-launch-configuration/

Documentao do CUDA 7.5


Assinatura:
CUresultcuOccupancyMaxActiveBlocksPerMultiprocessor ( int*numBlocks,CUfunctionfunc, intblockSize, size_tdynamicSMemSize)

Retorna a ocupncia de uma funo.

Parmetros
numBlocks- Ocupncia retornada;
func- Kernel para qual a ocupncia ser calculada;
blockSize- Tamanho do bloco o qual o kernel est tentado ser lanado;
dynamicSMemSize- Memria dinmica compartilhada por bloco usada, em
bytes.
Fonte: http://docs.nvidia.com/cuda/cuda-driverapi/index.html#ixzz3oDWa7dlZ

Alm disso disponibiliza as APIs


cudaOccupancyMaxPotentialBlockSize e
cudaOccupancyMaxPotentialBlockSizeVvariable
SMem para calcular dinamicamente tamanhos
de blocos que atinjam teoricamente uma
ocupncia mxima.
Fonte:
http://devblogs.nvidia.com/parallelforall/cudapro-tip-occupancy-api-simplifies-launchconfiguration/

Você também pode gostar

  • Atividade 1
    Atividade 1
    Documento4 páginas
    Atividade 1
    boni14_gto
    Ainda não há avaliações
  • Metodologia Ocupância
    Metodologia Ocupância
    Documento2 páginas
    Metodologia Ocupância
    boni14_gto
    Ainda não há avaliações
  • ApresentaçãoTCC v01
    ApresentaçãoTCC v01
    Documento2 páginas
    ApresentaçãoTCC v01
    boni14_gto
    Ainda não há avaliações
  • Comandos Linux
    Comandos Linux
    Documento1 página
    Comandos Linux
    boni14_gto
    Ainda não há avaliações
  • MPU13 031 60-Ingles Superior
    MPU13 031 60-Ingles Superior
    Documento8 páginas
    MPU13 031 60-Ingles Superior
    boni14_gto
    Ainda não há avaliações
  • Redes
    Redes
    Documento1 página
    Redes
    boni14_gto
    Ainda não há avaliações
  • Aula 36
    Aula 36
    Documento1 página
    Aula 36
    boni14_gto
    Ainda não há avaliações
  • Curso Python
    Curso Python
    Documento45 páginas
    Curso Python
    Fabio França Barroso
    100% (1)
  • Computacao 2008
    Computacao 2008
    Documento185 páginas
    Computacao 2008
    quelqune
    Ainda não há avaliações
  • Aula 16
    Aula 16
    Documento1 página
    Aula 16
    boni14_gto
    Ainda não há avaliações
  • LXGIWYL
    LXGIWYL
    Documento1 página
    LXGIWYL
    Paulo Cézar
    Ainda não há avaliações
  • Modelo Relatorio Semestral PIIC5
    Modelo Relatorio Semestral PIIC5
    Documento20 páginas
    Modelo Relatorio Semestral PIIC5
    boni14_gto
    Ainda não há avaliações
  • Computacao 2008
    Computacao 2008
    Documento185 páginas
    Computacao 2008
    quelqune
    Ainda não há avaliações