Você está na página 1de 2

1

Introduo

Antes do CUDA 6.5 o clculo da ocupncia de um determinado kernel da


GPU era complexo e por isso muitos programadores optavam por usar a
planilha calculadora de ocupncia, disponibilizada pela NVIDIA, em vez de
fazer a implementao do clculo. A partir do CUDA 6.5 foi disponibilizada
uma API que oferece funes em tempo de execuo calcular a ocupncia.
Fonte: http://devblogs.nvidia.com/parallelforall/cuda-pro-tip-occupancy-apisimplifies-launch-configuration
2

Objetivo

Definir uma metodologia para medio de desempenho para


determinado algoritmo executado no kernel que relacione a ocupncia
com a utilizao de recursos.
3

Metodologia
A
princpio,
a
funo
cudaOccupancyMaxActiveBlocksPerMultiprocessor que o ncleo da
calculadora da NVIDIA e prediz a ocupncia em termos do tamanho
do bloco e uso de memria compartilhada de um kernel, foi usada
para calcular a ocupncia.
A figura 1 mostra a funo de acordo com a documentao da NVIDIA
para o CUDA 7.5.

Fonte:
http://docs.nvidia.com/cuda/cuda-driverapi/index.html#ixzz3oDWa7dlZ
EXPLICAR O CLCULO...
4

Resultados
Usamos a funo cudaOccupancyMaxPotentialBlockSize para calcular
dinamicamente tamanhos de blocos que atinjam na toria uma
ocupncia mxima.

5
5 - Concluso

Você também pode gostar

  • Comandos Linux
    Comandos Linux
    Documento1 página
    Comandos Linux
    boni14_gto
    Ainda não há avaliações
  • Atividade 1
    Atividade 1
    Documento4 páginas
    Atividade 1
    boni14_gto
    Ainda não há avaliações
  • CUDA - Programação Paralela
    CUDA - Programação Paralela
    Documento5 páginas
    CUDA - Programação Paralela
    boni14_gto
    Ainda não há avaliações
  • MPU13 031 60-Ingles Superior
    MPU13 031 60-Ingles Superior
    Documento8 páginas
    MPU13 031 60-Ingles Superior
    boni14_gto
    Ainda não há avaliações
  • ApresentaçãoTCC v01
    ApresentaçãoTCC v01
    Documento2 páginas
    ApresentaçãoTCC v01
    boni14_gto
    Ainda não há avaliações
  • Aula 36
    Aula 36
    Documento1 página
    Aula 36
    boni14_gto
    Ainda não há avaliações
  • Redes
    Redes
    Documento1 página
    Redes
    boni14_gto
    Ainda não há avaliações
  • Aula 16
    Aula 16
    Documento1 página
    Aula 16
    boni14_gto
    Ainda não há avaliações
  • Curso Python
    Curso Python
    Documento45 páginas
    Curso Python
    Fabio França Barroso
    100% (1)
  • Modelo Relatorio Semestral PIIC5
    Modelo Relatorio Semestral PIIC5
    Documento20 páginas
    Modelo Relatorio Semestral PIIC5
    boni14_gto
    Ainda não há avaliações
  • Computacao 2008
    Computacao 2008
    Documento185 páginas
    Computacao 2008
    quelqune
    Ainda não há avaliações
  • Computacao 2008
    Computacao 2008
    Documento185 páginas
    Computacao 2008
    quelqune
    Ainda não há avaliações
  • LXGIWYL
    LXGIWYL
    Documento1 página
    LXGIWYL
    Paulo Cézar
    Ainda não há avaliações