Escolar Documentos
Profissional Documentos
Cultura Documentos
Figura 3.1
Abordagens de hardware e software.
Sequência de
funções
Dados Resultados
aritméticas
e lógicas
Códigos de Interpretador
instrução de instrução
Sinais de
controle
Funções
aritméticas
Dados Resultados
e lógicas de
propósito geral
são necessários para resultar em um computador funcionando. Dados e instruções precisam ser colocados no
sistema. Para isso, precisamos de algum tipo de módulo de entrada. Esse módulo contém componentes básicos
para aceitar dados e instruções em alguma forma e convertê-los para uma forma interna de sinais que possam ser
usados pelo sistema. Também é necessário um meio de informar resultados, e este tem a forma de um módulo de
saída. Juntos, estes são chamados de componentes de E/S.
Mais um componente é necessário: um dispositivo de entrada que trará dados e instruções sequencial-
mente. Mas um programa não é invariavelmente executado de forma sequencial; ele pode saltar (por exemplo,
a instrução jump do IAS). De modo semelhante, as operações sobre dados podem exigir acesso a mais do que
apenas um elemento de cada vez em uma sequência predeterminada. Assim, deverá haver um lugar para arma-
zenar instruções e dados temporariamente. Esse módulo é chamado de memória, ou memória principal, para
distingui-la do armazenamento externo, ou dispositivos periféricos. Von Neumann indicou que a mesma memó-
ria poderia ser usada para armazenar tanto instruções quanto dados.
A Figura 3.2 ilustra esses componentes de alto nível e sugere as interações entre eles. A CPU troca dados
com a memória. Para essa finalidade, ela normalmente utiliza dois registradores internos (à CPU): um registra-
dor de endereço de memória (MAR), que especifica o endereço na memória para a próxima leitura ou escrita,
e um registrador de buffer de memória (MBR), que contém os dados a serem escritos na memória ou recebe
os dados lidos da memória. De modo semelhante, um registrador de endereço de E/S (I/O AR) especifica um
dispositivo de E/S em particular. Um registrador de buffer de E/S (I/O BR) é usado para a troca de dados entre
um módulo de E/S e a CPU.
Um módulo de memória consiste em um conjunto de locais, definidos por endereços numerados de ma-
neira sequencial. Cada local contém um número binário que pode ser interpretado como uma instrução ou um
dado. Um módulo de E/S transfere dados dos dispositivos externos para a CPU e a memória, e vice-versa. Ele
contém buffers internos para manter esses dados temporariamente, até que possam ser enviados.
Tendo examinado rapidamente esses principais componentes, agora, vamos passar a uma visão geral de
como esses componentes funcionam juntos para executar programas.
Figura 3.2
Componentes do computador: vista de nível superior.
I/O AR
Dados
Unidade de
Execução Dados
I/O BR
Dados
Dados
PC = Contador de programa
IR = Registrador de instrução
MAR = Registrador de endereço de memória
MBR = Registrador de buffer de memória
Buffers I/O AR = Registrador de endereço de entrada/saída
I/O BR = Registrador de buffer de entrada/saída
3.2 FUNÇÃO DO COMPUTADOR
A função básica realizada por um computador é a execução de um programa, que consiste em um conjunto
de instruções armazenadas na memória. O processador faz o trabalho real executando instruções especificadas
no programa. Esta seção oferece uma visão geral dos principais elementos da execução do programa. Em sua
forma mais simples, o processamento de instrução consiste em duas etapas: o processador lê (busca) instruções
da memória, uma de cada vez, e executa cada instrução. A execução do programa consiste em repetir o processo
de busca e execução de instrução. A execução da instrução pode envolver diversas operações e depende da
natureza da instrução (ver, por exemplo, a parte inferior da Figura 2.4).
O processamento exigido para uma única instrução é chamado de ciclo de instrução. Usando a descrição
simplificada em duas etapas dada anteriormente, o ciclo de instrução é representado na Figura 3.3. As duas
etapas são conhecidas como ciclo de busca (fetch) e ciclo de execução. A execução do programa só termina
se a máquina for desligada, se houver algum tipo de erro irrecuperável ou se for encontrada uma instrução do
programa que interrompa o computador.
Figura 3.3
Ciclo de instrução básico.
Figura 3.4
Características de uma máquina hipotética.
0 3 4 15
Opcode Endereço
15
0 1
Magnitude
A Figura 3.5 ilustra uma execução parcial de programa, mostrando as partes relevantes dos registradores
de memória e processador.1 O fragmento de programa mostrado soma o conteúdo da palavra de memória no
endereço 940 ao conteúdo da palavra de memória no endereço 941 e armazena o resultado no segundo local.
Três instruções, que podem ser descritas como três ciclos de busca e três de execução, são necessárias:
1. O PC contém 300, o endereço da primeira instrução. Essa instrução (o valor 1940 em hexadecimal) é
carregada no registrador de instrução IR, e o PC é incrementado. Observe que esse processo envolve o
uso do registrador de endereço de memória (MAR) e o registrador de buffer de memória (MBR). Para
simplificar, esses registradores intermediários são ignorados.
2. Os 4 primeiros bits (primeiro dígito hexadecimal) no IR indicam que o AC deve ser carregado. Os 12
bits restantes (três dígitos hexadecimais) especificam o endereço (940) de onde os dados devem ser
carregados.
3. A próxima instrução (5941) é buscada do local 301, e o PC é incrementado.
4. O conteúdo antigo do AC e o conteúdo do local 941 são somados, e o resultado é armazenado no AC.
5. A próxima instrução (2941) é buscada do local 302, e o PC é incrementado.
6. O conteúdo do AC é armazenado no local 941.
Neste exemplo, três ciclos de instrução, cada um consistindo em um ciclo de busca e um ciclo de execução,
são necessários para somar o conteúdo do local 940 ao conteúdo de 941. Com um conjunto de instruções mais
complexo, menos ciclos seriam necessários. Alguns processadores mais antigos, por exemplo, incluíam instru-
ções contendo mais de um endereço de memória. Assim, o ciclo de execução para determinada instrução em
tais processadores poderia envolver mais de uma referência à memória. Além disso, em vez de referências à
memória, uma instrução pode especificar uma operação de E/S.
Por exemplo, o processador PDP-11 inclui uma instrução, expressa simbolicamente como ADD B,A, que
armazena a soma do conteúdo dos locais de memória B e A ao local de memória A. Ocorre um único ciclo de
instrução com as seguintes etapas:
Figura 3.5
Exemplo da execução do programa (conteúdos da memória e registradores em hexadecimal).
Etapa 1 Etapa 2
Etapa 3 Etapa 4
Etapa 5 Etapa 6
1 A notação hexadecimal é usada, na qual cada dígito representa 4 bits. Essa é a notação mais conveniente para representar os
conteúdos da memória e registradores quando a extensão da palavra é múltipla de 4. Veja o Capítulo 9 para revisar brevemente
os sistemas e números (decimais, binários e hexadecimais).
Figura 3.6
Diagrama de estado de ciclo de instrução.
Armaze-
Busca da Busca de
namento
instrução operando
de operando
Operandos Resultados
múltiplos múltiplos
Observe também que o diagrama possibilita múltiplos operandos e resultados, pois algumas instruções em
algumas máquinas exigem isso. Por exemplo, a instrução ADD A,B do PDP-11 resulta na seguinte sequência de
estados: iac, if, iod, oac, of, oac, of, do, oac, os.
Finalmente, em algumas máquinas, uma única instrução pode especificar uma operação a ser realizada
sobre um vetor (array unidimensional) de números ou uma string (array unidimensional) de caracteres. Como a
Figura 3.6 indica, isso envolveria operações repetitivas de busca e/ou armazenamento de operando.
Interrupções
Praticamente todos os computadores oferecem um mecanismo por meio do qual outros módulos (E/S,
memória) podem interromper o processamento normal do processador. A Tabela 3.1 lista as classes mais co-
muns de interrupções. A natureza específica dessas interrupções será examinada mais adiante neste livro, em
especial nos capítulos 7 e 14. Contudo, é preciso introduzir o conceito agora, para se entender mais claramente a
natureza do ciclo de instrução e as implicações das interrupções sobre a estrutura de interconexão. O leitor não
precisa se preocupar neste estágio com os detalhes da geração e processamento de interrupções, mas apenas se
concentrar na comunicação entre os módulos, resultante das interrupções.
As interrupções são fornecidas em primeiro lugar como um modo de melhorar a eficiência do processa-
mento. Por exemplo, a maioria dos dispositivos externos é muito mais lenta do que o processador. Suponha que
o processador esteja transferindo dados a uma impressora usando o esquema de ciclo de instrução da Figura
3.3. Após cada operação de escrita, o processador deve parar e permanecer ocioso até que a impressora o al-
cance. A extensão dessa pausa pode estar na ordem de muitas centenas ou mesmo milhares de ciclos de instru-
ção que não envolvem memória. Claramente, esse é um grande desperdício de uso do processador.
A Figura 3.7a ilustra esse estado de coisas. O programa do usuário realiza uma série de chamadas WRITE
intercaladas com processamento. Os segmentos de código 1, 2 e 3 referem-se às sequências de instruções que
não envolvem E/S. As chamadas WRITE são para um programa de E/S que é um utilitário do sistema e que
realizará a operação de E/S real. O programa de E/S consiste em três seções:
Uma sequência de instruções, rotuladas como 4 na figura, para preparar para a operação de E/S real. Isso
}}
pode incluir a cópia dos dados para a saída em um buffer especial e a preparação dos parâmetros para um
comando de dispositivo.
O comando de E/S real. Sem o uso de interrupções, quando esse comando é emitido o programa pre-
}}
cisa esperar pelo dispositivo de E/S para realizar a função solicitada (ou sondar o dispositivo periodi-
camente). O programa poderia esperar simplesmente realizando uma operação de teste repetidamente,
para determinar se a operação de E/S terminou.
Uma sequência de instruções, rotulada como 5 na figura, para completar a operação. Isso pode incluir a
}}
marcação de um flag, indicando o sucesso ou a falha da operação.
Tabela 3.1
Classes de interrupções.
Gerada por alguma condição que ocorre como resultado da execução de uma instrução,
Programa como o overflow aritmético, divisão por zero, tentativa de executar uma instrução de
máquina ilegal ou referência fora do espaço de memória permitido para o usuário.
Gerada por um timer dentro do processo. Isso permite que o sistema operacional
Timer
realize certas funções regularmente.
Gerada por um controlador de E/S para sinalizar o término normal de uma operação ou
E/S
para sinalizar uma série de condições de erro.
Falha de hardware Gerada por uma falha como falta de energia ou erro de paridade de memória.
Como a operação de E/S pode levar um tempo relativamente longo para terminar, o programa de E/S
fica preso, esperando que a operação termine; daí o programa de E/S ser interrompido no ponto da chamada
WRITE por algum período considerável.
Questões DE revisão
3.1. Que categorias gerais de funções são especificadas pelas instruções do computador?
3.2. Liste e defina resumidamente os estados possíveis que definem a execução de uma instrução.
3.3. Liste e defina resumidamente duas técnicas para lidar com múltiplas interrupções.
3.4. Que tipos de transferências a estrutura de interconexão de um computador (por exemplo, barramento)
precisa aceitar?
3.5. Liste e defina brevemente as camadas de protocolo de QPI.
3.6. Liste e defina brevemente as camadas de protocolo de PCIe.
PROGRAMA DO USUÁRIO
comando
comando Segmento de
PROGRAMA DE E/S
código 1
comando comando
comando Segmento de
código 4
comando
comando
comando Segmento de
Comando de E/S
código 2
comando comando
comando Segmento de
código 5
comando
comando
comando Segmento de
código 3
comando
Do ponto de vista do programa do usuário, uma interrupção é apenas isto: uma interrupção da sequência
de execução normal. Quando o processamento da interrupção termina, a execução é retomada (Figura 3.8).
Assim, o programa do usuário não precisa conter qualquer código especial para acomodar as interrupções; o
processador e o sistema operacional são responsáveis por suspender o programa do usuário e depois retomá-lo
no mesmo ponto.
Para acomodar as interrupções, um ciclo de interrupções é acrescentado ao ciclo de instrução, como mostra
a Figura 3.9. No ciclo de interrupção, o processador verifica se houve alguma interrupção, que é indicada pela
presença de um sinal de interrupção. Se nenhuma interrupção estiver pendente, o processador prossegue para
o ciclo de busca, lendo a próxima instrução do programa atual. Se uma interrupção estiver pendente, o proces-
sador faz o seguinte:
Suspende a execução do programa que está sendo executado e salva seu contexto. Isso significa salvar o
}}
endereço da próxima instrução a ser executada (conteúdo atual do contador de programa) e quaisquer
outros dados relevantes à atividade atual do processador.
Armazena no contador do programa o endereço inicial de uma rotina de tratamento de interrupções.
}}
Figura 3.8
Transferência de controle via interrupções.
• •
• •
• •
i
Interrupção
ocorre aqui
i+1
•
•
•
Figura 3.9
Ciclo de instruções com interrupção.
PARAR
O processador, agora, continua com o ciclo de busca, obtendo a primeira instrução da rotina de tratamento
de interrupção, que tratará a interrupção. É comum o programa tratador de interrupção fazer parte do sistema
operacional. Normalmente, esse programa determina a natureza da interrupção e realiza quaisquer ações ne-
cessárias. No exemplo que usamos, o tratador determina qual módulo de E/S gerou a interrupção e pode des-
viar-se para um programa que escreverá mais dados nesse módulo de E/S. Quando a rotina de tratamento de in-
terrupção terminar, o processador poderá retomar a execução do programa do usuário no ponto da interrupção.
É evidente que existe algum overhead envolvido nesse processo. Instruções extras precisam ser executadas
(no tratador de interrupção) para se determinar a natureza da interrupção e se decidir sobre a ação apropriada.
Apesar disso, em razão do tempo relativamente grande que seria desperdiçado pela simples espera por uma
operação de E/S, o processador pode ser empregado de modo muito mais eficiente com o uso de interrupções.
Para apreciar o ganho na eficiência, considere a Figura 3.10, que é um diagrama de tempo baseado no fluxo
de controle nas figuras 3.7a e 3.7b. Nessa figura, os segmentos do código de programa do usuário estão destaca-
dos em cinza escuro, e os segmentos do código de programa de E/S estão destacados em cinza claro. A Figura
3.10a mostra o caso em que as interrupções são empregadas. O processador deve esperar enquanto a operação
de E/S é realizada.
Figura 3.10
Temporização do programa: curta espera de E/S.
Tempo
1 1
4 4
Operação de E/S
Operação de E/S;
2a concorrente com
o processador espera
processador executando
5 5
2b
2
4
Operação de E/S
4 3a concorrente com
processador executando
Operação de E/S;
o processador espera 5
5 3b
As figuras 3.7b e 3.10b consideram que o tempo exigido para a operação de E/S é relativamente curto:
menos do que para completar a execução das instruções entre as operações de escrita no programa do usuário.
Nesse caso, o segmento do código etiquetado 2 é interrompido. Uma porção do código (2a) executa (enquanto
a operação de E/S é realizada) e, então, a interrupção ocorre (após a conclusão da operação de E/S). Após a
interrupção ser atendida, a execução é retomada com o restante do segmento de código 2 (2b).
O caso mais típico, sobretudo para um dispositivo lento como uma impressora, é a operação de E/S levar
muito mais tempo do que a execução de uma sequência de instruções do usuário. A Figura 3.7c indica esse es-
tado de coisas. Nesse caso, o programa do usuário alcança a segunda chamada WRITE antes que a operação de
E/S gerada pela primeira chamada termine. O resultado é que o programa do usuário está travado nesse ponto.
Quando a operação de E/S anterior terminar, essa nova chamada WRITE poderá ser processada, e uma nova
operação de E/S poderá ser iniciada. A Figura 3.11 mostra a temporização para essa situação com e sem o uso
de interrupções. Podemos ver que ainda existe um ganho na eficiência, pois parte do tempo durante o qual a
operação de E/S está sendo realizada se sobrepõe à execução das instruções do usuário.
A Figura 3.12 mostra um diagrama de estado do ciclo de instruções revisado, que inclui o processamento
do ciclo de interrupção.
INTERRUPÇÕES MÚLTIPLAS A discussão até aqui focou apenas a ocorrência de uma única interrupção.
Suponha, porém, que ocorram múltiplas interrupções. Por exemplo, um programa pode estar recebendo
dados de uma linha de comunicações e imprimindo resultados. A impressora gerará uma interrupção toda
vez que completar uma operação de impressão. O controlador da linha de comunicação gerará uma inter-
rupção toda vez que uma unidade de dados chegar. A unidade poderia ser um único caractere ou um bloco,
dependendo da natureza do controle das comunicações. De qualquer forma, é possível que uma interrup-
ção de comunicações ocorra enquanto uma interrupção de impressora esteja sendo processada.
Figura 3.11
Temporização de programa: longa espera de E/S.
Tempo
1 1
4 4
5
2
4
3 A operação de E/S
concorre com o processador
Operação de E/S; em execução; então,
o processador espera o processador espera
5
5
Figura 3.12
Diagrama do estado de ciclo de instruções, com interrupções.
Armaze-
Busca da Busca de namento
instrução operando de operando
Resultados Resultados
múltiplos múltiplos
Retorna uma
cadeia de
Fim da execução da instrução e caracteres ou Sem
busca da instrução seguinte dados de vetor interrupção
Duas técnicas podem ser utilizadas para lidar com múltiplas interrupções. A primeira é desativar as inter-
rupções enquanto uma interrupção estiver sendo processada. Uma interrupção desabilitada significa simples-
mente que o processador pode ignorar e ignorará esse sinal de requisição de interrupção. Se uma interrupção
ocorrer durante esse tempo, ela, de modo geral, permanecerá pendente e será verificada pelo processador de-
pois que ele tiver habilitado as interrupções. Assim, quando um programa do usuário estiver sendo executado e
houver uma interrupção, as interrupções serão imediatamente desabilitadas. Depois que a rotina de tratamento
de interrupção terminar, as interrupções serão habilitadas antes que o programa do usuário retome, e o proces-
sador verificará se houve interrupções adicionais. Essa técnica é boa e simples, pois as interrupções são tratadas
em ordem estritamente sequencial (Figura 3.13a).
A desvantagem da técnica mencionada é que ela não leva em consideração a prioridade relativa ou neces-
sidades de tempo crítico. Por exemplo, quando a entrada chega da linha de comunicações, ela pode precisar ser
absorvida rapidamente, para dar espaço para mais entrada. Se o primeiro lote de entrada não for processado
antes que o segundo lote chegue, dados poderão ser perdidos.
Uma segunda técnica é definir prioridades para interrupções e permitir que uma interrupção de maior
prioridade faça com que um tratamento de interrupção com menor prioridade seja interrompido (Figura 3.13b).
Como um exemplo dessa segunda técnica, considere um sistema com três dispositivos de E/S: uma impressora,
um disco e uma linha de comunicações, com prioridades cada vez maiores de 2, 4 e 5, respectivamente. A Figura
3.14 ilustra uma possível sequência. Um usuário começa em t = 0. Em t = 10, ocorre uma interrupção da im-
pressora; a informação do usuário é colocada na pilha do sistema, e a execução continua na rotina de serviço de
interrupção (ISR — do inglês, Interrupt Service Routine). Enquanto essa rotina ainda está sendo executada,
em t = 15, ocorre uma interrupção de comunicação. Como a linha de comunicações tem prioridade mais alta
que a impressora, a interrupção é considerada. A ISR da impressora é interrompida, seu estado é colocado na
pilha, e a execução continua na ISR de comunicação. Enquanto essa rotina está sendo executada, ocorre uma
interrupção de disco (t = 20). Como essa interrupção tem prioridade menor, ela é simplesmente retida, e a ISR
de comunicação é executada até o final.
Quando a ISR de comunicação termina (t = 25), o estado anterior do processador, que é a execução da ISR
de impressora, é restaurado. Porém, antes mesmo que uma única instrução nessa rotina possa ser executada,
o processador aceita a interrupção de disco de maior prioridade e transfere o controle para a ISR de disco.
Somente quando essa rotina termina (t = 35) é que a ISR de impressora é retomada. Quando a última rotina
termina (t = 40), o controle finalmente retorna ao programa do usuário.
Figura 3.13
Transferência de controle com múltiplas interrupções.
Programa Tratador de
do usuário interrupção X
Tratador de
interrupção Y
Programa Tratador de
do usuário interrupção X
Tratador de
interrupção Y
Figura 3.14
Exemplo de sequência de tempo de múltiplas interrupções.
Rotina de serviço
Programa Rotina de serviço de de interrupção
do usuário interrupção de impressora de comunicação
t=0
15
10 t=
t=
t = 25 Rotina de
Serviço de
t= interrupção
40 t=2 de disco
5
t=
35
Função de E/S
Até aqui, discutimos a operação do computador de acordo com o controle do processador e vimos princi-
palmente a interação entre processador e memória. A discussão apenas aludiu ao papel do componente de E/S.
Esse papel é discutido com detalhes no Capítulo 7, mas apresentamos um rápido resumo aqui.
Um módulo de E/S (por exemplo, um controlador de disco) pode trocar dados diretamente com o proces-
sador. Assim como o processador pode iniciar uma leitura ou escrita com a memória, designando o endereço
de um local específico, o processador também pode ler ou escrever dados em um módulo de E/S. Neste último
caso, o processador identifica um dispositivo específico que é controlado por um módulo de E/S em particular.
Assim, poderia ocorrer uma sequência de instruções semelhante em formato à da Figura 3.5, com instruções de
E/S em vez de instruções de referência à memória.
Em alguns casos, é desejável permitir que as trocas de E/S ocorram diretamente com a memória. Nesse
caso, o processador concede a um módulo de E/S a autoridade de ler ou escrever na memória, de modo que a
transferência entre E/S e memória pode ocorrer sem que o processador fique preso à operação de E/S. Durante
essa transferência, o módulo de E/S emite comandos de leitura ou escrita à memória, tirando do processador a
responsabilidade pela troca. Essa operação é conhecida como acesso direto à memória (DMA, do inglês Direct
Memory Access) e é examinada no Capítulo 7.
3.3 ESTRUTURAS DE INTERCONEXÃO
Um computador consiste em um conjunto de componentes ou módulos de três tipos básicos (processador,
memória e E/S) que se comunicam entre si. Com efeito, um computador é uma rede de módulos básicos. Assim,
é preciso haver caminhos para a conexão dos módulos.
O conjunto de caminhos conectando os diversos módulos é chamado de estrutura de interconexão. O pro-
jeto dessa estrutura depende das trocas que precisam ser feitas entre os módulos.
A Figura 3.15 sugere os tipos de trocas que são necessárias, indicando as principais formas de entrada e
saída para cada tipo de módulo:2
Memória: normalmente, um módulo de memória consiste em N palavras de mesmo tamanho. Cada pala-
}}
vra recebe um endereço numérico exclusivo (0, 1, ..., N – 1). Uma palavra de dados pode ser lida ou escrita
na memória. A natureza da operação é indicada por sinais de controle de leitura e escrita. O local para a
operação é especificado por um endereço.
Módulo de E/S: partindo de um ponto de vista interno (ao sistema de computação), a E/S é funcio-
}}
nalmente semelhante à memória. Existem duas operações, leitura e escrita. Além disso, um módulo
de E/S pode controlar mais de um dispositivo externo. Podemos nos referir a cada uma das interfaces
para um dispositivo externo como uma porta dando a cada uma um endereço exclusivo (por exem-
plo, 0, 1, ..., M – 1). Além disso, existem caminhos de dados externos para entrada e saída de dados
com um dispositivo externo. Por fim, um módulo de E/S pode ser capaz de enviar sinais de interrup-
ção ao processador.
Processador: o processador lê instruções e dados, escreve dados após o processamento e usa sinais de
}}
controle para controlar a operação geral do sistema. Ele também recebe sinais de interrupção.
A lista anterior define os dados a serem trocados. A estrutura de interconexão deve admitir os seguintes
tipos de transferências:
Memória para processador: o processador lê uma instrução ou uma unidade de dados da memória.
}}
Processador para memória: o processador escreve uma unidade de dados na memória.
}}
E/S para processador: o processador lê dados de um dispositivo de E/S por meio de um módulo de E/S.
}}
Processador para E/S: o processador envia dados para o dispositivo de E/S.
}}
E/S de ou para a memória: para esses dois casos, um módulo de E/S tem permissão para trocar dados
}}
diretamente com a memória, sem passar pelo processador, usando o DMA.
2 As setas grossas representam múltiplas linhas de sinal transportando múltiplos bits de informação em paralelo. Cada seta estreita
representa uma única linha de sinal.
Figura 3.15
Módulos do computador.
LEITURA
Memória
ESCRITA
N palavras
Endereço 0 Dados
•
•
•
Dados N 1
LEITURA
Módulo de E/S Dados
ESCRITA internos
Dados
Endereço Portas M externos
Dados
internos
Sinais de
Dados
interrupção
externos
Instruções Endereço
Sinais de
Dados CPU controle
Sinais de Dados
interrupção
Com o passar dos anos, diversas estruturas de interconexão foram experimentadas. De longe, a mais comum é
(1) o barramento e diversas estruturas de barramento múltiplo, e (2) as estruturas de interconexão ponto a ponto
com transferência de dados em pacotes. O restante deste capítulo é dedicado a uma discussão sobre essas estruturas.
3.4 INTERCONEXÃO DE BARRAMENTO
O barramento foi o meio dominante da interconexão de componentes de sistema computacional por dé-
cadas. Para computadores de propósito geral, ele deu lugar gradualmente a várias estruturas de interconexão
ponto a ponto, que agora dominam o desenvolvimento do sistema computacional. Contudo, as estruturas de
barramento ainda são comumente usadas para os sistemas embarcados, sobretudo os microcontroladores. Nesta
seção, damos uma visão geral da estrutura de barramento. O Apêndice C (disponível em inglês na Sala Virtual)
proporciona mais detalhes.
Um barramento é um caminho de comunicação que conecta dois ou mais dispositivos. Uma característica-
-chave de um barramento é que ele é um meio de transmissão compartilhado. Diversos dispositivos conectam-
-se ao barramento, e um sinal transmitido por qualquer um dos dispositivos está disponível para recepção por
todos os outros dispositivos conectados ao barramento. Se dois dispositivos transmitem durante o mesmo pe-
ríodo de tempo, seus sinais serão sobrepostos e ficarão distorcidos. Assim, somente um dispositivo de cada vez
pode transmitir com sucesso.
Tipicamente, um barramento consiste em múltiplos caminhos de comunicação, ou linhas. Cada linha é
capaz de transmitir sinais representando o binário 1 e o binário 0. Com o tempo, uma sequência de dígitos bi-
nários pode ser transmitida por uma única linha. Juntas, várias linhas de um barramento podem ser usadas para
transmitir dígitos binários simultaneamente (em paralelo). Por exemplo, uma unidade de dados de 8 bits pode
ser transmitida por oito linhas de barramento.
Os sistemas de computação contêm diversos barramentos diferentes, que oferecem caminhos entre os com-
ponentes em diversos níveis da hierarquia do sistema de computação. Um barramento que conecta os princi-
pais componentes do computador (processador, memória, E/S) é chamado de barramento do sistema. As estru-
turas de interconexão de computador mais comuns são baseadas no uso de um ou mais barramentos do sistema.
Um barramento do sistema consiste, normalmente, em cerca de 50 a centenas de linhas separadas. Cada
linha recebe um significado ou função em particular. Embora existam muitos projetos de barramento diferen-
tes, em qualquer barramento as linhas podem ser classificadas em três grupos funcionais (Figura 3.16): linhas
de dados, endereços e controle. Além disso, pode haver linhas de distribuição de tensão, que fornecem tensão
elétrica aos módulos conectados.
As linhas de dados oferecem um caminho para movimentação de dados entre os módulos do sistema. Essas
linhas, coletivamente, são chamadas de barramento de dados. O barramento de dados pode consistir em 32, 64,
128 ou ainda mais linhas separadas, sendo que o número de linhas é conhecido como a largura do barramento
de dados. Como cada linha só pode transportar 1 bit de cada vez, o número de linhas determina quantos bits
podem ser transferidos de uma só vez. A largura do barramento de dados é um fator-chave para determinar o
desempenho geral do sistema. Por exemplo, se o barramento de dados tiver 32 bits de largura e cada instrução
tiver um tamanho de 64 bits, então o processador precisará acessar o módulo de memória duas vezes durante
cada ciclo de instrução.
As linhas de endereço são usadas para designar a origem ou o destino dos dados no barramento de dados.
Por exemplo, se o processador deseja ler uma palavra (8, 16 ou 32 bits) de dado da memória, ele coloca o
endereço da palavra desejada nas linhas de endereço. Claramente, a largura do barramento de endereços de-
termina a capacidade de memória máxima possível do sistema. Além do mais, as linhas de endereço também
costumam ser usadas para endereçar portas de E/S. Normalmente, os bits de ordem mais alta são usados para
selecionar um módulo em particular no barramento, e os bits de ordem mais baixa selecionam um local de me-
mória ou porta de E/S dentro do módulo. Por exemplo, em um barramento de endereço de 8 bits, o endereço
01111111 e mais baixos poderiam referenciar locais em um módulo de memória (módulo 0) com 128 palavras
de memória, e o endereço 10000000 e mais altos poderiam referenciar dispositivos conectados a um módulo
de E/S (módulo 1).
As linhas de controle são usadas para controlar o acesso e o uso das linhas de dados e endereço. Como as
linhas de dados e endereço são compartilhadas por todos os componentes, é preciso haver um meio de contro-
lar seu uso. Os sinais de controle transmitem informações de comando e temporização entre os módulos do sis-
tema. Os sinais de temporização indicam a validade da informação de dados e endereço. Os sinais de comando
especificam operações a serem realizadas. As linhas de controle típicas incluem:
Escrita de memória: permite que os dados no barramento sejam escritos no local endereçado.
}}
Leitura de memória: permite que os dados do local endereçado sejam colocados no barramento.
}}
Escrita de E/S: permite que os dados no barramento sejam enviados para a porta de E/S endereçada.
}}
Leitura de E/S: permite que os dados da porta de E/S endereçada sejam colocados no barramento.
}}
ACK de transferência: indica que dados foram aceitos ou colocados no barramento.
}}
Solicitação de barramento (bus request): indica que um módulo precisa obter controle do barramento.
}}
Concessão de barramento (bus grant): indica que um módulo solicitante recebeu controle do barramento.
}}
Requisição de interrupção (interrupt request): indica que uma interrupção está pendente.
}}
Figura 3.16
Esquema de interconexão de barramento.
Linhas de controle
ACK de interrupção (interrupt acknowledge): confirma que a interrupção pendente foi reconhecida.
}}
Clock: é usado para operações de sincronização.
}}
Reset: inicializa todos os módulos.
}}
A operação do barramento é a seguinte. Se um módulo deseja enviar dados para outro, ele precisa fazer
duas coisas: (1) obter o uso do barramento e (2) transferir dados por meio do barramento. Se um módulo qui-
ser requisitar dados de outro módulo, ele deve (1) obter o uso do barramento e (2) transferir uma requisição
ao outro módulo pelas linhas de controle e endereço apropriadas. Depois, ele deve esperar que esse segundo
módulo envie os dados.
Figura 3.17
Configuração multicore usando QPI.
Dispositivo
Dispositivo
de E/S
de E/S
Plataforma de E/S
DRAM
DRAM
Core Core
A B
DRAM
DRAM
Core Core
C D
Dispositivo
Dispositivo
de E/S
de E/S
Plataforma de E/S
Define-se QPI como uma arquitetura de protocolo de quatro camadas,3 que abrange as seguintes camadas
(Figura 3.18):
Física: consiste em fios reais que carregam os sinais, bem como circuitos e lógica para suportar as caracte-
}}
rísticas necessárias para a transmissão e recepção de 1s e 0s. A unidade de transferência da camada física
é de 20 bits, que é chamada de Phit (unidade física [em inglês, physical unit]).
Ligação: responsável pela transmissão confiável e pelo controle de fluxo. A unidade de camada de ligação
}}
de transferência consiste em uma Flit (unidade de controle de fluxo [em inglês, flow control unit]) de 80 bits.
Roteamento:
}} proporciona a estrutura de redirecionamento dos pacotes através dos caminhos.
Protocolo: um conjunto de regras de alto nível para troca de pacotes de dados entre os dispositivos. Um
}}
pacote é compreendido por um número inteiro de Flits.
Figura 3.18
Camadas de QPI.
Pacotes
Protocolo Protocolo
Roteamento Roteamento
Flits
Ligação Ligação
3 O leitor não familiarizado com esse conceito de arquitetura de protocolo vai encontrar uma breve visão geral no Apêndice D
(disponível em inglês na Sala Virtual).
Figura 3.19
Interface física da interconexão da Intel QPI.
COMPONENTE A
COMPONENTE B
Figura 3.20
Distribuição multivia da QPI.
QPI
#2n+1 #n+1 #1
via 0
QPI
#3n #2n #n
via 19
dependendo de como (1) dispositivos são alocados na plataforma, (2) recursos do sistema são divididos e (3)
eventos de confiabilidade resultam no mapeamento em torno de um recurso de falha.
Figura 3.21
Configuração comum usando PCIe.
Core Core
Gigabit PCIe
ethernet Memória
Chipset
Ponte PCIe
PCIe–PCI Memória
PCIe
PCIe PCIe
Comutador
PCIe PCIe
Terminal legado: a categoria de terminal legado visa aos projetos existentes que migraram para a PCI
}}
Express, e isso permite comportamentos legado, como uso de espaço de E/S e transações bloqueadas.
Os terminais de PCI Express não têm permissão para solicitar o uso de espaço de E/S em um tempo de
execução e não devem usar transações bloqueadas. Ao distinguir essas categorias, não é possível para um
desenvolvedor de sistema restringir ou eliminar os comportamentos legado que têm impacto negativo na
robustez e no desempenho do sistema.
Ponte PCIe/PCI: permite que dispositivos antigos de PCI sejam conectados aos sistemas baseados em PCIe.
}}
Como na QPI, as interações de PCIe são definidas usando uma arquitetura de protocolo. A arquitetura de
protocolo de PCIe abrange as seguintes camadas (Figura 3.22):
Física: consiste em fios reais que carregam os sinais, bem como circuitos e lógica para suportar os requisi-
}}
tos para a transmissão e recepção de 1s e 0s.
Ligação de dados: é responsável pela transmissão confiável e pelo controle de fluxo. Pacotes de dados
}}
gerados e consumidos pela DLL são chamados de Pacotes de Camada de Ligação de Dados (DLLPs —
do inglês, Data Link Layer Packets).
Transação:
}} gera e consome pacotes de dados usados para implementar mecanismos de transferência de
dados de armazenamento de carga e também gerencia o controle de fluxo daqueles pacotes entre os dois
componentes em um link. Pacotes de dados gerados e consumidos pela TL são chamados de Pacotes de
Camada de Transação (TLPs — do inglês, Transaction Layer Packets).
Acima da TL estão camadas de software que geram pedidos de leitura e escrita que são transportados pela
camada de transação aos dispositivos de E/S usando protocolo de transação baseada em pacote.
Figura 3.22
Camadas de protocolo de PCIe.
Pacotes de camada
de transação (TLPs)
Transação Transação
Pacotes de camada
de ligação de dados
(DLLPs)
Ligação de dados Ligação de dados
Física Física
Figura 3.23
Técnica de distribuição multivia do PCIe.
128b/ PCIe
B4 B0
130b via 0
stream de byte
128b/ PCIe
B5 B1
130b via 1
B7 B6 B5 B4 B3 B2 B1 B0
128b/ PCIe
B6 B2
130b via 2
128b/ PCIe
B7 B3
130b via 3
Uma técnica comum, e a única usada na PCIe 3.0, para superar o problema de uma longa cadeia de bits de
um valor é a cifragem. A cifragem, que não aumenta o número de bits a serem transmitidos, é uma técnica
de mapeamento que tende a fazer os dados aparecerem de modo mais aleatório. A cifragem tende a distribuir
o número de transições de modo que apareçam no receptor espaçadas de modo mais uniforme, o que é bom
para a sincronização. Além disso, outras propriedades de transmissão, como propriedades de espectro, são me-
lhoradas se os dados forem mais próximos aleatoriamente do que constantes e repetitivos. Para mais discussão
sobre cifragem, veja o Apêndice E (disponível em inglês na Sala Virtual).
Outra técnica que pode auxiliar na sincronização é a codificação, em que bits adicionais são inseridos no
stream de bits para forçar transições. Para a PCIe 3.0, cada grupo de 128 bits de entrada é mapeado no bloco de
130 bits ao adicionar cabeçalho de sincronização de blocos. O valor de cabeçalho é 10 para bloco de dados e 01
para o que é chamado de bloco de conjunto solicitado, que se refere ao bloco de informação em nível de ligação.
A Figura 3.24 ilustra o uso da cifragem e da codificação. Os dados a serem transmitidos são supridos em
um cifrador. A saída cifrada é, então, suprida em um codificador de 128b/130b, que bufferiza 128 bits e, então,
mapeia o bloco de 128 bits em um bloco de 130 bits. Esse bloco, então, passa através de um conversor paralelo-
-série e transmite um bit por vez usando a sinalização diferenciada.
No receptor, um clock é sincronizado aos novos dados para recuperar o stream de bits. Então, passa pelo
conversor de série-paralelo para produzir um stream de blocos de 130 bit. Cada bloco é passado por um decodi-
ficador de 128b/130b para recuperar o padrão de bits cifrados original, que é, então, decodificado para produzir
o stream de bit original.
Ao usar essas técnicas, a taxa de dados de 16 GB/s pode ser atingida. Um detalhe final deve ser mencio-
nado: cada transmissão de um bloco de dados sobre uma ligação de PCI começa e termina com uma sequência
de estrutura de 8 bits para dar ao receptor tempo para sincronizar com a nova stream de bits da camada física.
Figura 3.24
Diagramas de bloco de transmissão e recepção da PCIe.
D+ D–
8b
Receptor
Cifrador
diferencial
Circuito de
8b 1b recuperação
de clock
Circuito de recuperação
Codificação de 128b/130b
de dados
1b
130b
130b
1b
128b
D+ D–
Decifrador
(a) Transmissor
8b
(b) Receptor
Tabela 3.2
Tipos de transação PCIe TLP.
(Continuação)
Pedido de leitura de tipo de configuração 0
Pedido de escrita de tipo de configuração 0 Transfere os dados para e a partir de um
Configuração local no espaço de configuração de um
Pedido de leitura de tipo de configuração 1 dispositivo PCIe
Pedido de escrita de tipo de configuração 1
Pedido de mensagem
Proporciona uma mensagem em banda e
Mensagem
Pedido de mensagem com dados um relato de evento
Finalização
Finalização com dados
Memória, E/S,
Retornado para certos pedidos
Configuração Finalização bloqueada
Para manter a compatibilidade com a PCI, a PCIe suporta tanto os ciclos de configuração do tipo 1 como
do tipo 2. O ciclo do tipo 1 propaga na direção oposta ao complexo root, até atingir a interface da ponte que
hospeda o barramento (ligação) em que o dispositivo visado reside. A transação de configuração é convertida
na ligação de destino a partir do tipo 0 da ponte.
Por fim, as mensagens de realização são usadas com transações divididas para memória, E/S e transações
de configuração.
MONTAGEM DE PACOTE TLP As transações de PCIe são transmitidas usando pacotes de camadas de transa-
ção que são ilustrados na Figura 3.25a. Um TLP origina-se na camada de transação do dispositivo de envio
e termina na camada de transação do dispositivo de recebimento.
Figura 3.25
Formato de unidade de dados de protocolo PCIe.
Número
de octetos
1 Estrutura de STP 1 Início
Anexado pela PL
2 Número de sequência pela DLL
4 DLLP
Criado
2 CRC
12 ou 16 Cabeçalho 1 Fim
Anexado pela camada de ligação de dados
de ligação de dados
Anexado pela camada física
0 a 4096 Dados
0 ou 4 ECRC
4 LCRC
1 Estrutura de STP
O software de camada superior envia à TL a informação necessária para que ela crie o core do TLP, que
consiste nos seguintes campos:
Cabeçalho: o cabeçalho descreve o tipo de pacote e inclui a informação necessária para que o receptor
}}
processe o pacote, inclusive quando for preciso uma informação de roteamento. O formato de cabeçalho
interno é discutido posteriormente.
Dados: um campo de dados de até 4096 bytes pode ser incluído no TLP. Alguns TLPs não contêm um
}}
campo de dados.
ECRC: um campo opcional de CRC ponta a ponta possibilita que a camada de destino TL verifique os
}}
erros no cabeçalho e as partes de dados de TLP.
PACOTES DE CAMADA DE LIGAÇÃO DE DADOS Os pacotes de camada de ligação de dados originam-se na ca-
mada de ligação de dados de um dispositivo de transmissão e terminam na DLL do dispositivo no outro final da
ligação. A Figura 3.25b mostra o formato do DLLP. Há três grupos importantes de DLLPs usados para gerenciar
a ligação: pacotes de controle de fluxo, pacotes de gerenciamento de potência e pacotes TLP ACK e NAK. Os
pacotes de gerenciamento de potência são usados no gerenciamento no planejamento da plataforma de energia.
Os pacotes de controle de fluxo regulam a taxa em que TLPs e DLLPs podem ser transmitidas pelas ligações. Os
pacotes de ACK e NAK são usados no processamento de TLP, que será discutido a seguir.
PROCESSAMENTO DE PACOTES DE CAMADA DE TRANSAÇÃO A DLL adiciona dois campos ao core do TLP,
criado pela TL (Figura 3.25a): um número de sequência de 16 bits e um CRC de 32 bits da camada de liga-
ção (LCRC). Enquanto os campos do core criados na TL são somente usados na TL de destino, os dois cam-
pos adicionados pela DLL são processados em cada nó intermediário na via a partir da fonte ao destino.
Quando um TLP chega ao dispositivo, a DLL descobre o número de sequência e os campos de LCRC, além
de verificar a LCRC. Existem duas possibilidades:
1. Se não forem detectados erros, a parte do core do TLP é levada até a camada de transação local. Se esse dis-
positivo de recebimento for o destino pretendido, então a TL processa o TLP. Por sua vez, a TL determina
uma rota para o TLP e a retorna para a DLL para transmissão durante a próxima ligação na via ao destino.
2. Se um erro for detectado, a DLL programa um pacote de NAK DLL para retornar ao transmissor re-
moto. O TLP é eliminado.
Quando a DLL transmite um TLP, ela retém uma cópia do TLP. Se recebe NAK para TLP com esse número
de sequência, retransmite o TLP. Quando recebe ACK, descarta o TLP bufferizado.
Questões DE revisão
3.1. Que categorias gerais de funções são especificadas pelas instruções do computador?
3.2. Liste e defina resumidamente os estados possíveis que definem a execução de uma instrução.
3.3. Liste e defina resumidamente duas técnicas para lidar com múltiplas interrupções.
3.4. Que tipos de transferências a estrutura de interconexão de um computador (por exemplo, barramento)
precisa aceitar?
3.5. Liste e defina brevemente as camadas de protocolo de QPI.
3.6. Liste e defina brevemente as camadas de protocolo de PCIe.