Arquitetura de Computadores
Arquitetura de Computadores
Aulas > Aula 2 - Estrutura da CPU - Conjunto de Instruções O Conceito de Instrução de Máquina
Antes de entender o conjunto de instruções de uma máquina vamos falar um pouco sobre o conceito de instrução de máquina. Todos sabemos que os computadores são máquinas capazes de realizar tarefas complexas com grande eficiência e rapidez. Os seres humanos também são capazes de realizar tarefas complexas com eficiência. Quando uma secretária recebe uma instrução para buscar a pasta do Sr. José, a secretária é capaz de ir até o arquivo de pastas, localizar a gaveta que contém a pasta, pesquisar a pasta do Sr. josé dentro da gaveta, retirar a pasta da gaveta e entregá-la a quem solicitou. Isto tudo é simples para um ser humano fazer.
Antes de entender o conjunto de instruções de uma máquina vamos falar um pouco sobre o conceito de instrução de máquina. Todos sabemos que os computadores são máquinas capazes de realizar tarefas complexas com grande eficiência e rapidez. Os seres humanos também são capazes de realizar tarefas complexas com eficiência. Quando uma secretária recebe uma instrução para buscar a pasta do Sr. José, a secretária é capaz de ir até o arquivo de pastas, localizar a gaveta que contém a pasta, pesquisar a pasta do Sr. josé dentro da gaveta, retirar a pasta da gaveta e entregá-la a quem solicitou. Isto tudo é simples para um ser humano fazer. Agora imagine para um computador cumprir esta simples atividade. Nesse caso teríamos que construir um programa contendo instruções passo a passo, em uma sequência lógica, que pudesse ser entendida e executada pelo computador. O computador nesse caso executaria instrução por instrução até que a atividade estivesse cumprida. Veja que uma atividade simples para humanos não é tão simples para o computador. Uma simples atividade que é executada por um humano, precisa ser decomposta em tarefas mais simples, que podem ser executadas por um computador.
Veja que uma tarefa assim é composta por tarefas menores e que são resolvidas facilmente por um computador . Para uma máquina esta simples tarefa teria que ser detalhada em pequenas instruções que são compreendidas pela máquina. Estas instruções devem ser expressas de forma que possam ser executadas pela máquina que só entende código binário ou seja zero e um. A máquina só é capaz de realizar pequenas operações simples baseadas em zero e um. As instruções são apenas uma simples sequencia de zero e um.
Uma instrução de máquina é a formalização de uma instrução primitiva que a máquina pode realizar diretamente.
Este processo de decomposição de instruções é necessário porque as instruções que são entendidas pela máquina são instruções bem mais simples do que as instruções que um humano pode realizar. Um cálculo que um humano poderia executar diretamente precisa ser decomposto em operações primitivas simples que realização operações aritméticas menores para que possa ser executada por um computador. Não existe no computador uma instrução que seja capaz de calcular em um único ciclo de instrução a expressão X = A + B * C. A expressão precisa ser decomposta em cálculos mais simples que possam ser mapeados para as instruções que a máquina entende. No caso a máquina irá primeiramente realizar o produto B * C e armazenar o resultado em uma área temporária. Depois irá somar A ao resultado armazenado na área temporária e por fim armazenar o resultado final na área de memória usada por X.
Por exemplo, não existe máquina que possua uma instrução que seja capaz de resolver a expressão matemática: X = A + B * C. No caso, esta expressão é resolvida pela máquina através da decomposição em partes menores e mais simples, usando uma abordagem top-down, onde a expressão matemática é decomposta em instruções primitivas simples e que combinadas em uma sequência lógica correta, produzem o resultado esperado.Um cálculo que um humano poderia executar diretamente precisa ser decomposto em operações primitivas simples que realização operações aritméticas menores para que possa ser executada por um computador. Não existe no computador uma instrução que seja capaz de calcular em um único ciclo de instrução a expressão X = A + B * C.No caso a máquina irá primeiramente realizar o produto B * C e armazenar o resultado em uma área temporária. Depois irá somar A ao resultado armazenado na área temporária e por fim armazenar o resultado final na área de memória usada por X. Talvez uma analogia para ilustrar este processo de decomposição seja a execução de um programa de computador implementado em uma LP de 4 geração. As LPs de 4 geração possuem instruções de alto nível, para que possam facilitar o programador e aumentar sua produtividade. Por exemplo, em uma LP antiga, caso seja necessário desenhar um gráfico na tela do computador será necessário, ao programador, implementar uma série de rotinas para desenho do gráfico, diretamente do zero. O mesmo não ocorre com programa implementado em uma LP de 4 geração que possui funções de alto nível para executar diversas tarefas complexas e com isso acelerar o desenvolvimento. Em uma LP de 4 bastaria ao programador usar a função correta, passando os parâmetros, e o gráfico seria desenhado na tela do computador. A diferença é que uma função de alto nível em uma LP de 4 geração corresponde a várias rotinas e funções implementadas do zero em uma LP antiga.
De uma forma geral, o mesmo ocorre com os computadores que são máquinas que possuem um conjunto de instruções primitivas bastante simples ao passo que as LPs atuais possuem instruções bastante sofisticadas e que portanto precisam ser decompostas em sequencias de instruções primitivas antes que possam ser executadas pelo computador.
O Conjunto de Instruções
O processador de uma máquina é o componente responsável por realizar as operações. Sendo assim, cada processador é projetado de forma a ser capaz de realizar um conjunto próprio de instruções. Durante o projeto do processador são considerados o tamanho e a complexidade do conjunto de instruções da máquina. Quanto menor e mais simples for o conjunto de instruções da máquina, mais rápido será o ciclo de tempo do processador e portando maior o desempenho da máquina.
O processador de uma máquina é o componente responsável por realizar as operações. Sendo assim,Durante o projeto do processador são considerados o tamanho e a complexidade do conjunto de instruções da máquina.
Assim, existem hoje duas tecnologias para projeto de processadores que são usadas pelos projetistas de computadores. Sistemas com conjunto de instruções complexo ( CISC - Complex Instruction Set Computers )
Sistemas com conjunto de instruções reduzido ( RISC - Reduced Instruction Set Computers ) Vamos estudar as arquiteturas desses sistemas em uma aula posterior.
O projeto do processador é realizado em duas etapas principais: O projeto do processador é realizado em duas etapas principais:
A definição do conjunto de instruções ( formato, tamanho e quantidade de instruções que podem ser executadas ) - Esta etapa trata de estabelecer quais instruções o processador é capaz de realizar, quais tipos de operações estas instruções vão ser capazes de processar diretamente. Este conjunto abrange todo o tipo de processamento que pode ser feito pelo processador incluindo cálculos, desvios de fluxo de execução, mover valores na memória, etc. A implementação dos componentes do processador em função do conjunto de instruções ( UAL, registradores, barramentos, etc. ) - Esta etapa trata da implementação de todos os componentes necessários para que o processador possa executar o conjunto de instruções definido. Estes componentes incluem registradores que são utilizados para armazenar os valores dos operandos de cada instrução, a UAL que cuida de todas as operações matemáticas e operações lógicas baseadas em verdadeiro ou falso e também os barramentos que são os canais pelos quais dados e instruções trafegam pela unidade central de processamento.
Fisicamente, cada instrução de máquina é um conjunto de bits que indica ao processador uma operação a realizar. Todo processador é projetado para ser capaz de realizar um conjunto de operações bem simples que são chamadas operações primitivas. Cada uma dessas operações está associada a uma instrução de máquina.
Funcionalmente um processador é capaz de realizar os seguintes tipos de operações:
Operações matemáticas ( aritméticas, lógicas, de complemento, de deslocamento );
Operações lógicas baseadas na lógica booleana de verdadeiro ou falso;
Movimentação de dados e endereços entre a memória e a CPU e vice-versa através dos barramentos;
Operações de Entrada e saída de dados em dispositivos de E/S para receber dados e enviar o resultado do processo para o ambiente externo.
Controle do fluxo de execução de instruções ( parar a sequência de instrução, provocar um desvio da sequência de instrução, o famoso 'GO TO', seguir para a próxima execução a ser executada, etc. ) O termo 'conjunto de instruções' se refere a todas as possíveis instruções que podem ser interpretadas e executadas por um processador. Este conjunto varia de processador para processador conforme mostra a tabela abaixo pode podemos ver que a quantidade de instruções varia de acordo com o processador. Note que à medida em que os processadores evoluíram a quantidade de instruções aumentou significativamente:
Processador
Número de Instruções
8080 78
8088
117
80486
286
Intel Pentium II
217
Este conjunto varia de processador para processador conforme mostra a tabela abaixo pode podemos ver que a quantidade de instruções varia de acordo com o processador. Note que à medida em que os processadores evoluíram a quantidade de instruções aumentou significativamente: O Formato da Instrução de Máquina
Se uma instrução de máquina é um conjunto de bits que descreve uma operação primitiva que o processador pode executar então deve haver alguma organização deste conjunto de bits para que o processador possa interpretá-lo corretamente. Assim toda instrução de máquina possui um formato que é dividido em duas partes. A primeira parte informa qual a instrução e como será executada. A segunda parte informa quais são os dados que serão manipulados na operação, também chamados de operandos . Podem haver mais de um operando para uma operação conforme a natureza do processamento. Por exemplo, para soma de dois números, teremos dois operandos, para o quadrado de um número temos apenas um operando mas também podemos ter instruções sem operandos, por exemplo, parar a execução do programa. Desta forma, temos os seguintes campos para uma instrução:
O código da operação a ser realizada - É o campo da instrução que contém a identificação da operação a ser realizada. Cada operação possui um código identificador único. O tamanho, em bits, deste campo determina o número de instruções que o processador pode executar. Por exemplo, para um código de operação com 8 bits temos então um processador que pode executar até 256 instruções de máquina.
O(s) operando(s) - são os campos que contém a localização, o endereço de memória, onde estão os dados a serem processados.
Como o processador pode realizar diferentes operações, pode-se ter diferentes formatos de instruções no conjunto de instruções de um processador.
Outra questão importante refere-se ao significado do valor do bit nos campos operandos. Ou seja, o modo de localizar o dado pode variar de instrução para instrução. Chama-se a isso de modo de endereçamento.
Considerações sobre o formato das instruções
Instruções com código de operação com tamanho fixo;
Instruções com código de operação com tamanho variável.
No que se refere ao formato do código da operação, existem duas possibilidades de formato das instruções: Conjuntos de instruções com códigos de operação com tamanho fixo são mais fáceis de implementar e de executar. Porém em sistemas com grande quantidade
de instruções, o tamanho do código de operação precisa ser ajustado para acomodar todas as instruções, precisa ser grande o suficiente para conter todos os códigos de instrução. Com isso, o consumo de memória principal para a armazenar as instruções do programa é muito maior o que é uma desvantagem em termos de consumo de recursos ( memória principal ).
Neste tipo de arquitetura, como o tamanho é fixo, pode-se calcular imediatamente o número de instruções que podem ser executadas pelo processador tendo como base o número de bits do campo código da operação. Por exemplo, se o campo código da instrução possui 6 bits então o processador poderá processar até 64 instruções.
Apesar do curso da memória ter baixado nos últimos anos, ela é um recurso muito valioso e é compartilhada por vários programas que executam no servidor. Portanto a memória nunca deve desperdiçada. Normalmente, um código de operação de tamanho fixo possui até 8 bits.
Conjuntos de instruções com códigos de operação com tamanho variável permitem um número maior de instruções com o aumento de tamanho do campo código de operação. Para que isso seja possível é necessário diminuir o tamanho dos campos operandos, o que reduz a capacidade de endereçamento de memória, ou aumentar o tamanho da instrução o que pode levar ao desperdício de memória já mencionado anteriormente.
Arquiteturas com código de operação de tamanho variável permitem maior versatilidade no número de bits do código de operação e no número de bits dos operandos, permitindo a criação de um conjunto de instruções que atenda a um requisito de mais instruções.
O mais comum é se ter arquiteturas que usam conjuntos de instruções com código de operação de tamanho variável, tendo também instruções de tamanho variável.
Chapter 14: Dentro do Computador
Introdução à Computação Tradução do capítulo 14 de
" A Balanced Introduction to Computer Science and Programming"
de David Reed , Creighton University , Prentice Hall
Capítulo 14: Dentro do Computador - A arquitetura de von Neumann
Como discutido no capítulo 1, virtualmente todos os computadores modernos tem o mesmo esquema básico, conhecido como arquitetura de von Neumann. Este esquema divide o hardware de um computador em três componentes principais: memória, Unidade Central de Processamento (UCP ou CPU) e dispositivos de entrada e saída. A memória armazena dados e instruçõesde programas. A CPU é encarregada de buscar as isntruções e dados da memória, executar as instruções e então armazenar os valores resultantes de volta na memória. Os dispositivos de entrada (tais como teclado, mouse e microfone) e dispositivos de saída (tais como a tela, altofalantes e impressora) possibilitam a interação com o usuário, permitindo que as pessoas forneçam entradas e exibindo dados, instruções e os resultados das computações.
Este capítulo explora os detalhes da arquitetura de von Neumann, descrevendo o funcionamento interno de um computador. As explicações são dadas de maneira incremental, partindo de um model simples de Parte Operativa de CPU e então acrescentando a memória principal e depois uma Unidade de Controle. Quando combinados com dispositivos de entrada e de saída, estes componentes representam um modelo preciso (apesar de simplificado) de um computor programável moderno. Para facilitar o aprendizado, são utilizados simuladores (desenvolvidos por Grant Braught do Dickinson College) para cada modelo.
Subunidades e Parte Operativa da CPU
Como visto no capítulo1, a CPU age como o cérebro do computador. Ela é responsável por obter dados e instruções a partir da memória, executar as instruções e armazernar os resultados de volta na memória. O conjunto de isntruções que uma dada CPU de um computador pode entender e executar é conhecido como a linguagem de máquina do computador. Os programadores podem controlar o comportamento de um computador definindo instruções para sua CPU - isto pode ser realizado seja escrevendo programas diretamente em linguagem de máquina ou escrevendo programas em uma linguagem de alto nível e então traduzindo para linguagem de máquina. Mesmo programas que exibem um comportamento complexo são especificados para a CPU como sequências de instruções simples de linguagem de máquina, cada uma executando uma tarefa que não é mais complexa do que somar dois números ou copiar dados para uma nova posição na memória. No entanto, A CPU pode executar estas instruções de maneira tão rápida que pode ser obtido um comportamento complexo do computador.
Subunidades da CPU
A CPU é composta de várias subunidades, cada uma com uma função específica na operação do processador como um todo. Estas subunidades são a Unidade Logico-Aritmética (ULA), registradores e Unidade de Controle.
A Unidade Logico-Aritmética é uma coleção de circuitos que realizam as operações sobre os dados. As operações básicas podem incluir adição, subtração e manipulações de bit (tais como deslocamento ou combinação de bits)
Registradores saão posições de memória construídas dentro da CPU. Como os registradores são integrados diretamente nos circuitos da CPU, os dados nos registradores podem ser acessados muito mais rapidamente (5 a 10 vezes mais rápido) do que dados na memória principal. No entanto, devido ao número limitado de registradores na CPU (usualmente 16 ou 32 registradores), estas posições de memória são reservadas para dados que a CPU está usando em um dado momento. Para funcionar de maneira efetiva, o computador deve copiar dados constantemente entre os registradores e a memória. Estas transferências ocorrem através de coleção de conexões chamadas barramentos, que conectam os registradores com a ULA e com a memória principal.
saão posições de memória construídas dentro da CPU. Como os registradores são integrados diretamente nos circuitos da CPU, os dados nos registradores podem ser acessados muito mais rapidamente (5 a 10 vezes mais rápido) do que dados na memória principal. No entanto, devido ao número limitado de registradores na CPU (usualmente 16 ou 32 registradores), estas posições de memória são reservadas para dados que a CPU está usando em um dado momento. Para funcionar de maneira efetiva, o computador deve copiar dados constantemente entre os registradores e a memória. Estas transferências ocorrem através de coleção de conexões chamadas barramentos, que conectam os registradores com a ULA e com a memória principal. A Unidade de Controle Unit pode ser vista como "o cérebro dentro do cérebro", pois ela controla as várias funções da CPU. A Unidade de Controle é formada de circuitos que realizam a busca de dados e instruções a partir da memória principal, bem como controla o fluxo de dados do registradores para a ULA e da ULA para os registradores.
Figure 14.1: Subunidades da Unidade Central de Processamento (CPU).
Ciclos da Parte Operativa da CPU
Os caminhos que os dados seguem dentro da CPU, viajando através de barramentos a partir dos registradores para a ULA e então de volta para os registradores é conhecido como Parte Operativa da CPU. Todas as tarefas realizadas por um computador, desde formatar um documento até exibir páginas em um navegador Web, são decompostas em sequências de operações imples; o computador executa cada operação individual movimentando dados dos registradores para a ULA, executando computações sobre estes dados na ULA e então armazenam o resultado nos registradores. Uma passagem completa pela Parte Operativa da CPU (dos resgistradores passando pelos barramentos e ULA e voltando aos registradores) é chamado de ciclo da Parte Operativa, ou ainda ciclo da CPU.
Relembrando o que vimos no capítulo 1, onde foi definida a velocidade da CPU como medida pelo número de instruções que a CPU pode executar em um segundo. Como cada instrução precisa de um ciclo de CPU para executar, a velocidade da CPU corresponde diretamente ao número de ciclos de CPU que ocorrem por segundo. Por exemplo, uma CPU de 800 MHz é capaz de executar 800 milhões de ciclos em um único segundo, enquanto uma CPU de 1,4 GHz é capaz de executar 1,4 bilhoes de ciclos de CPU em um segundo. No entanto, não se pode avaliar CPUs somente comparando a velocidade dos processadores, pois duas linguagens de máquina diferentes podem dividir a mesma tarefa em diferenets conjuntos de isntruções e um conjunto de instruções pode ser mais eficiente que o outro. Isto é, uma CPU pode ser capaz de completar uma dada tarefa em um único ciclo, enquanto outra pode precisar de vários ciclos para completar a mesma tarefa. Para comparar o desempenho de CPUs, deve-se considerar o conjunto de instruções de cada CPU, bem como fatores como o número de registradores e tamanho dos barramentos que transportam os dados entre os componentes.
Simulador de Parte Operativa
Para ajudar a visualizar o comportamento da parte operativa da CPU, vamos usar um simulador. O Simulador de Parte Operativa da CPU modela uma CPU simples contendo quatro registradores. Usando o simulador, você pode seguir o fluxo dos dados a medida que eles trafegam pela parte operativa da CPU, a partir dos registradores para a ULA e de volta para os registradores. Para deixar as coisas simples, não é incluida uma Unidade de Controle explícita neste simulador. Ao invés disto, o usuário deve agir como a Unidade de Controle, selecionando os registradores de entrada, a função da ULA e o registrador de saída clicando nos botões do simulador.
As figuras 14.2 até 14.5 demonstram o uso do simulador para somar dois números - uma tarefa que pode ser realizada em um único ciclo de CPU.
Este simulador usa caixas de texto para representar registradores, possibilitando ao usuário entrar com dados digitando nas caixas. Os botões, que permitem ao usuário especificar como os dados movem ao longo da parte operativa da CPU e que operações a ULA executa sobre os dados, são imagens que mudam quando o usuário clica nelas. Na figura 14.2, o usuário entrou os números 43 e 296 nos registradores R0 e R1, respectivamente. Depois de entrar estes valores, o usuário clicou no botão do barramento A para selecionar R0 e no botão do barramento B para selecionar R1. Isto fará com que os números armazenados nestes dois registradores sejam transferidos através dos barramentos indicados para a ULA, a qual executará uma operação sobre eles. Como o usuário posicionou o botão de operação da ULA para adição e o botão do barramento C para R2,a ULA fará a soma dos dois n;umero e o resultado será transferido através do barramento C para ser armzenado no registrador R2.
Depois de entrar com os ajustes desejados, o usuário inicia o ciclo de CPU no simulador clicando no botão rotulado Execute. A figura 14.3 mostra o estado da CPU a medida que os valores em R0 e R1 trafagam através dos barramentos A e B para a ULA. As setas que representam os barramentos piscam em vermelho e os números sendo transferidos são mostrados em caixas de texto próximas aos barrament
A figura 14.4 ilustra o estado da CPU depois que a ULA recebeu os números e executou a operação especificada. Como o usuário colocou o botão de operação da ULA na posição da soma, a ULA soma os dois números, 43 e -296. O resultado -253 é enviado para fora da ULA através do barramento C.
Finalmente, a figura 14.5 mostra o resultado final do ciclo de CPU. Como o usuário colocou o botão do barramento C para a posição do registrador R2, o valor -253 é enviado através do barramento C e é armazenado no registrador R2.
Figure 14.2: Configuração inicial do simulador.
Figura 14.3: Dados movendo dos registradores para a ULA.
Figura 14.4: Dados trafegando da ULA para os registradores.
Figura 14.5: Resultado final do ciclo de CPU.
CPU e Memória Principal
Apesar da Parte Operativa da CPU descrever como um computador executa computações sobre dados armazenados em registradores, nós ainda não explicamos como os dados entram nos registradores e como os resultados das operações da ULA são acessados fora da CPU. Estas duas tarefas envolvem conexões entre a CPU e a memória princiapl. Como visto no capítulo 1, todos os programas e dados ativos estão armazenados na memória principal de um computador. Nós podemos pensar da memória principal como uma grande coleção de posições de memória, na qual cada posição é acessível através de um endereço. De mesma maneira que os endereços de uma rua (por exemplo, tristão monteiro 590) permitem um carteiro encontrar um destinatário, um endereço de memória (por exemplo, posição de memória 31) permite a CPU encontrar e acessar um pedaço específico da memória principal. Um barramento conecta a memória principal com a CPU, permitindo ao computador copiar dados e instruções em registradores e então copiar os resultados das computações de volta para a memória principal. A figura 14.6 ilustra a interação entre a memória principal de um computador e a CPU; as setas escuras representam o fluxo de dados da parte operativa da CPU, enquanto as setas mais claras representam o barramento que conecta a memória principal aos registradores.
Figura 14.6: Um barramento conecta a memória principal à CPU
Transferindo dados para e a partir da memória principal
Enquanto um programa está sendo executado, a Unidade de Controle processa as instruções do programa e identifica que valores de dados serão necessários para realizar as tarefas especificadas. Os valores desejados são então buscados a partir da memória principal através do barramento da memória principal, carregados em registradores e utilizados pelas operações da ULA.
Como um exemplo concreto, imgine que você tem um arquivo contendo 1.000 números e precisa computar a soma destes números. O arquivo pode ser carregado na memória principal - por exemplo, nas posições de memória 500 até 1499. Então, a Unidade de Controle pode realizar os seguintes passos para somar estes números e armazenar a soma resultante de volta na memória.
Initializar um dos registradores, por exemplo R0, com o valor 0. Este registrador irá armazenar a soma total dos números Para cada número armazenado nos endereços de memória de 500 até 1499: Copiar o número da memória principal para outro registrador, por exemplo R1. Executar um ciclo através da parte operativa da CPU para somar R0 e R1 e armazenar o resultado de volta em R0. Quando todos os valores dos números no arquivo tiverem sido processados, o valor em R0 terá a soma total. Este valor pode então ser copiado de volta para uma posição na memória principal.
Note que cada número deve ser transferido em um registrador antes que ele possa ser acrescentado à soma total. Na prática, transferir dados entre a memória principal e a CPU ocorre em uma velocidade bem menor do que a de um ciclo de CPU. Isto é principalmente devido ao fato de que os sinais eletricos devem viajar por uma grande distância - por exemplo, a partir de um chip de RAM separado para o chip da CPU. No tempo que leva para os dados trafegarem pelo barramento da memória principal e alcançar os registradores, vários ciclos de CPU pode ocorrer. Os processadores modernos compensam este atraso com hardware especial que premite que várias instruções sejam buscadas ao mesmo tempo. Ao buscar várias instruções de antemão, o processador pode começar a lidar com uma próxima instrução e executar computações úteis enquanto uma transferência de dados anterior está ainda em andamento.
Parte Operativa com simulador de memória
Para ajudar a visualizar as relações entre a CPU e a memória principal, o simulador da parte operativa da CPU foi acrescido com uma memória principal. Este simulador estendido inclui uma memória principal que pode armazenar até 32 números, com endereços entre 0 e 31. Um novo barramento, rotulado Barramento da Memória Principal, conecta a memória principal com a CPU; este barramento permite que dados sejam copiados da memória principal para os registradores, bem como permite que os resultados da ULA possam ser armazenados na memória principal. Como no exemplo anterior, esta versão do simulador não possui uma Unidade de Controle explícita. O usuário deve trabalhar como se fosse a Unidade de Controle, selecionando os ajustes desejados no barramento da memória principal para controlar o fluxo de dados.
As figuras 14.7 até 14.9 demonstram o uso do simulador para somar dois números armazenados na memória.
Quando a CPU deve somar dois números armazenados na memória, o primeiro passo é copiar um dos números para um registrador. Na figura 14.7, o usuário selecionou o primeiro número a ser somado, naquele momento na posição de memória 0, clicando no botão R/W próximo àquela posição ( R/W se refere ao fato de que o botão seleciona que posição da memória será lida (Read) ou escrita (Written). O usuário também configurou as setas em torno do barramento da memória principal para que elas conectem a memória principal aos registradores. Note que este barramento pode mover dados entre a memória principal e os registradores ou a partir da ULA para a memória principal, dependendo como o usuário posiciona as chaves do barramento. O usuário pode abrir ou fechar estas chaves clicando nelas, efetivamente conectando ou desconenctando o barramento. Uma vez dentro da CPU, o barramento da memória principal conecta-se ao barramento C, o qual armazena o número no registrador R0 (pois o botão do barramento C está posicionado para R0).
próximo àquela posição ( se refere ao fato de que o botão seleciona que posição da memória será lida (Read) ou escrita (Written). O usuário também configurou as setas em torno do barramento da memória principal para que elas conectem a memória principal aos registradores. Note que este barramento pode mover dados entre a memória principal e os registradores ou a partir da ULA para a memória principal, dependendo como o usuário posiciona as chaves do barramento. O usuário pode abrir ou fechar estas chaves clicando nelas, efetivamente conectando ou desconenctando o barramento. Uma vez dentro da CPU, o barramento da memória principal conecta-se ao barramento C, o qual armazena o número no registrador R0 (pois o botão do barramento C está posicionado para R0). A figura 14.8 ilustra o próximo passo no nosso exemplo, o qual envolve copiar o segundo número para um registrador. Como o usuário escolheu o botão R/W próximo à posição de memória 1 e posicionou o botão do barramento C para R1, o conteúdo da posição 1 será buscado e armazenado no registrador R1.
próximo à posição de memória 1 e posicionou o botão do barramento C para R1, o conteúdo da posição 1 será buscado e armazenado no registrador R1. A figura 14.9 mostra o ciclo de CPU durante o qual a ULA soma os conteúdos de R0 e R1. Note que os botões de ajuste do barramento A, do barramento B e da operação da ULA são os mesmo como os das figuras 14.3 through 14.6; isto é por conta dos dois exemplo envolverem a mesma tarefa de somar os números em R0 e R1. Na figura 14.9, no entanto, as chaves do barramento da memória principal estão ajustadas para que o resultado da soma seja enviado para a memória principal, ao invés de que seja enviado para os registradores.
Figure 14.7: Primeiro, 43 é carregado a partir da memória em R0.
Figure 14.8: Segundo, -296 é carregado a partir da memória em R1.
Figure 14.9: Finalmente, os valores são somados e a soma é armazenada de volta na memória.
Duas obervações interessantes podem ser feitas em relação ao comportamento do simulador. Primeiro, o simulador precisa de mais tempo para copiar dados entre a memória e a CPU do que ele precisa para executar um ciclo de CPU. Este atraso simula o efeito do tempos de acesso lentos associados com a memória principal. Em um computador real, cerca de até 10 ciclos de CPU podem ocorrer no tempo que leva para uma transferência de dados entre a CPU e a memória principal. A segunda observação é que, mesmo enquanto os dados estão sendo buscados a partir da memória, as operações ainda estão sendo executadas na parte operativa da CPU. Por exemplo, na figura 14.8, o número em R0 (43) é enviado através dos barramentos A e B para a ULA, produzindo a soma 86. Isto pode parecer lixo, pois o resultado das operações da ULA é ignorado (devido ao barramento C está desconectado). De maneira surpreeendente, isto reflete precisamente o funcionamento interno da CPU. É mais eficiente para a CPU executar computações desnecessárias enquanto dados estão sendo transferidos para ou a partir da memória do que adicionar circuitos extras para reconhecer se o barramento C estava desconectado.
Computador com Programa Armazenado
Agora que discutimos sobre a memória principal, estamos prontos para lidar com o último componente da CPU: uma Unidade de Controle totalmente funcional e automática. Para entende o papel da Unidade de Controle, relembre as tarefas que você realizou enquanto usava os simuladores. Quando você experimentou com Simulador de Parte Operativa, você definiu a computação que um ciclo de CPU deveria executar através da seleção dos registradores e da operação da ULA via botões. No simulador da parte operativa e memória principal, você controlou o fluco de informação entre a parte operativa e memória através de chaves e botões. A principal idéia por trás de um computador com programa armazenado é que estas tarefas pode ser representadas por instruções, armazenada na memória principal junto com os dados e então executadas pela Unidade de Controle.
Linguagens de Máquina
Uma linguagem de máquina é um conjunto de instruções correspondendo às tarefas básicas que uma CPU pode realizar. Em essência, cada instrução de linguagem de máquina especifica a configuração dos componentes de hardware que define uma particular computação em um ciclo da CPU. Assim, nós devemos definir instruções em linguagem de máquina para nosso simulador, enumerando todos os ajustes físicos dos botões e chaves. Por exemplo,
Barramento A = R0 Chave da ULA = fechada Barramento B = R1 Chave MMIn = aberta ALU = A+B Chave MMOut = aberta Barramento C = R2 Chave C = fechada
definiria uma configuração na qual os conteúdos de R0 e R1 seriam somados e o resultado armazenado de volta em R2. Esta notação pode ser suficiente para controlar o comportamento de uma máquina muito simples, tal como uma representando nosso simulador; no entanto, CPUs nop mundo real possuem um grande número de componentes físicos e especificar o estado de todas estas partes durante cada ciclo de CPU seria impossível. Além disso, como as isntruções são armazenadas na memória junto com os dados, as instruções devem ser representadas como padrões de bits.
A figura 14.10 descreve uma linguagem de máquina simples que foi projetada para nosso simulador. Como as posições da memória principal em nosso simulador podem caber no máximo 16 bits, nossa linguagem representa cada isntrução como um padrão de 16 bits. Os primeiros bits de cada padrão indicam o tipo de tarefa que a CPU dem realizar, enquanto os bits seguintes indicam os registradores e/ou posições de memória envolvidas na tarefa. Por exemplo, todas as instruções que envolvem soma de conteúdo de dois registradores começam com o padrão de bits 1010000100. Os seis bits finais da isntrução representam o registrador destino em binário (isto é, o registrador onde o resultado será armazenado) e os registradores fonte (isto é, os registradores cujos conteúdos serão somados pela ULA), respectivamente. Por exemplo, suponha que você quer somar os conteúdos de R0 e R1 e então armazenar o resultado em R2 - isto é R2 = R0 + R1. Os padrões de bits para R2 (2 = 10 em binário), R0 (0 = 00 em binário) e R1 (1 = 01 em binário) devem ser acrescentados no final do padrão de bits, produzindo a instrução em linguagem de máquina 1010000100100001. De maneira semelhante, se a intenção é fazer R3 = R0 + R1, então o padrão de bits para R3 (3 = 11 em binário) deve substituir o de R2: 1010000100110001.
Operação Instrução em Linguagem de Máquina Exemplo somar conteúdo de dois registradores, armazenar resultado em outro regsitrador
R0 = R1 + R2 1010000100 RR RR RR 1010000100 00 01 10
somará os conteúdos de R1 (01) e R2 (10), armazenando resultado em R0 (00) subtrair conteúdo de dois registradores, armazenar resultado em outro regsitrador
R0 = R1 - R2 1010001000 RR RR RR 1010001000 00 01 10
pega o conteúdo de R1 (01), subtrai R2 (10), e aramzena resultado em R0 (00) carregar conteúdo da posição de memória em um registrador
R3 = M[5] 100000010 RR MMMMM 100000010 11 00101
carrega conteúdo da posição de memória 5 (00011) em R3 (11) armazena conteúdo de registrador em uma posição de memória
M[5] = R3 100000100 RR MMMMM 100000100 11 00101
armazena na posição de memória 7 (00101) o conteúdo de R3 (11) move conteúdo de um registrador para outro registrador
R1 = R0 100100010000 RR RR 100100010000 01 00
move conteúdo de R0 (00) para R1 (01) parar a máquina
1111111111111111
Figure 14.10: Linguagem de máquina para simulador de computador
As primeiras duas instruções da linguagem de máquina da figura 14.10 correspondem às tarefas que os usuários podem realizar com o simulador de parte operativa da CPU - isto é, selecionar uma operação da ULA e os registradores a serem operados no ciclo de CPU. As três instruções seguintes correspondem às tarefas que os usuários podem realizar com a versão do simulador para parte operativa com memória - isto é, controlar o fluxo de informação entre a memória principal e a parte operativa. A última instrução, parar (HALT), indica para a Unidade de Controle quando uma sequencia de isntruções termina. É claro que em uma CPU real se tem muito mais instruções do que estas. Por exemplo, se uma CPU executa um programa que inclui desvios condicionais (por exemplo, comandos se ... então e repetições), sua linguagem de máquina deve fornecer isntruções de desvio que permitam a CPU pular de uma instrução para outra. No entanto, o conjunto de instruções limitado da figura 14.10 é suficiente para demonstrar o funcionamento de uma CPU básica e sua Unidade de Controle.
Unidade de Controle
Uma vez que uma linguagem uniforme para uma dada CPU é estabelecida, as instruções podem ser armazenadas na memória juntamente com os dados. É então função da Unidade de Controle obter cada instrução em linguagem de máquina a partir da memória, interpretar seu significado, executar o ciclo de CPU correspondente e então passar para a próxima instrução. Como instruções e dados estão armazenados na mesma memória, a Unidade de Controle deve ser capaz de reconhecer onde uma sequência de instruções começa e termina. Em computadores reais, isto é usualmente controlado pelo sistema operacional, o qual mantém uma lista de cada programa em memória e sua localização. Por simplicidade, nosso simulador assume que a primeira instrução se encontra na posição 0 da memória. O final da sequência de instruções é definida explicitamente pelo padrão de bits "parar" (HALT).
Para ordenar a execução de uma sequência de isntruções, a Unidade de Controle mantém um Contador de Programa (Program Counter - PC) , que armazena o endereço da próxima instrução a ser executada. Como nós assumimos que todo programa começa no endereço 0, o valor do PC é inicializado com o valor 0 antes de começar a execução do programa. Quando a Unidade de Controle precisa buscar e executar uma instrução, ela acessa o PC e então obtém a instrução armazenada na correspondente posição de memória. Depois que a Unidade de Controle busca a instrução, o PC é automaticamente incrementado, assim ele identifica a próxima instrução na sequência.
Os passos realizados pela Unidade de Controle podem ser definidos com um algoritmo geral, no qual as instruções são repetidamente buscadas e executadas:
Algoritmo de busca e execução implementado pela Unidade de Controle: Inicializa PC = 0. Busca a instrução armazenada na posição de memória indicada pelo conteúdo do PC, e faz PC = PC + 1. Enquanto a instrução corrente não for a instrução "parar" (HALT): Decodifica a instrução - isto é, identifica a instrução e determina as configurações do hardware da CPU que devem ser usadas para executar a instrução. Configura o hardware da CPU para corresponderem ao indicado pela instrução. Executa um ciclo de parte operativa da CPU. Quando o ciclo se completa, busca a próxima instrução a partir da posição indicada pelo conteúdo do PC, e faz PC = PC + 1.
Por exemplo, suponha que a memória principal contém o programa e os dados mostrados na figura 14.11
0: 1000000100000101 // carrega posicao de memoria 5 em R0 1: 1000000100100110 // carrega posicao de memoria 6 em R1 2: 1010000100100001 // adiciona R0 e R1, armazena em R2 3: 1000001001000111 // armazena R2 na posicao de memoria 7 4: 1111111111111111 // parada 5: 0000000000001001 // dado a ser somado: 9 6: 0000000000000001 // dado a ser somado: 1 7: 0000000000000000 // posicao onde a soma eh armazenada
Figura 14.11: Programa em linguagem de máquina para somar dois números na memória.
As primeiras cinco posições de memória (endereços de 0 até 4) contém isntruções em linguagem de máquina para somar dois números e armazenar sua soma de volta na memória. Os números podem a serem somados são armazenados na posições de memória 5 e 6. Para executar este programa, a Unidade de Controle deve seguir os seguintes passos:
Primeiro, o contador de programa é inicializado: PC = 0. A instrução na posição de memória 0 (correspondente ao valor atual do PC) é buscada e o PC é incrementado: PC = 0 + 1 = 1. Como esta instrução (1000000100000101) não é uma instrução HALT, ela é decodificada: o hardware da CPU é configurado de modo que o conteúdo da posição de memória 5 seja carregado no registrador R0 e um ciclo de CPU é executado. A próxima instrução, na posição de memória 1 (correspondente ao valor atual do PC) é buscada e o PC é incrementado: PC = 1 + 1 = 2. Como esta instrução (1000000100100110) não é uma instrução HALT, ela é decodificada: o hardware da CPU é configurado de modo que o conteúdo da posição de memória 6 seja carregado no registrador R1 e um ciclo de CPU é executado.. A próxima instrução, na posição de memória 2 (correspondente ao valor atual do PC) é buscada e o PC é incremenetado: PC = 2 + 1 = 3. Como esta instrução (1010000100100001) não é uma instrução HALT, ela é decodificada: o hardware da CPU é configurado de modo que o conteúdo do registrador R0 é somado ao conteúdo do registrador R1 e o resultado é armazenado no registrador R2 e um ciclo de CPU é executado. A próxima instrução, na posição de memória 3 (correspondente ao valor atual do PC) é buscada e o PC é incrementado: PC = 3 + 1 = 4. Como esta instrução (1000001001000111) não é uma instrução HALT, ela é decodificada: o hardware da CPU é configurado de modo que o conteúdo do registrador R2 seja armazenado na posição de memória 7 e um ciclo de CPU é executado. A próxima instrução, na posição de memória 4 (correspondente ao valor atual do PC) é buscada e o PC é incrementado: PC = 4 + 1 = 5. Como esta instrução (1111111111111111) é uma instrução HALT, a Unidade de Controle reconhece o fim do programa e para a execução.
Simulador do computador com programa armazenado
O Simulador do computador com programa armazenado modela o comportamento de um computador com programa armazenado completo. Instruções e dados podem ser entrados na memória, assumindo-se que a primeira instrução deve ser sempre colocada na posição 0 da memória. A Unidade de Controle é responsável pela busca e interpretação de instruções em linguagem de máquina, bem como realizar as tarefas especificadas por estas isntruções.
O simulador contém várias caixas de exibição para ajudar os usuários a acompanhar o funcionamento interno da Unidade de Controle. Como descrito na seção anterior, o contador de programa indica o endereço da próxima instrução a executada. Além do PC, a CPU mantém um Registrador de Instrução (Instruction Register - RI) que sempre contém a instrução que está sendo executada no momento pela CPU. O registrador IR é mostrado pelo simulador como uma caixa de texto adicional. Acima destas caixas, o simulador mostra os botões e chaves definidos pela isntrução corrente - isto torna a correspondência entre a instrução em linguagem de máquina e os ajustes nos botões e chaves mais claro. Os valores dos botões são especificados em binário: 00 representa o botão posicionado para cima, 01 representa o botão posicionado para a direita, 10 representa o botão posicionado para baixo e 11 representa o botão posicionado para esquerda. Os valores da chaves também são escritos em binários, com um bit 1 representando a chave fechada e 0 indicando a chave aberta.
As figuras de 14.12 até 14.17 demonstram o uso do simulador para executar o exemplo do programa em linguagem de máquina da figura 14.11.
A figura 14.12 mostra o estado inicial do simulador. As instruções em linguagem de máquinas são carregadas na memória principal, começando do endereço 0. Os dados necessários para executar as instruções também são armazenados na memória, nos endereços 5 e 6, imediatamente depois da última instrução. Na Unidade de Controle, o contador de programa (PC) é inicializado com 0, assim a instrução 0 será a primeira a ser carregada e executada.
Figura 14.12: Estado inicial do simulador, com programa armazenado na memória principal.
Figure 14.13: Simulador depois da primeira instrução ter sido executada (R0 = MM5).
Figure 14.14: Simulador depois da segunda instrução ter sido executada (R1 = MM6).
Figure 14.15: Simulador depois da terceira instrução ter sido executada (R2 = R0 + R1).
Figure 14.16: Simulador depois do quarto comando ter sido executado (MM7 = R2).
Figure 14.17: Simulador depois do quinto comando ter sido executado (HALT).
O simulador é projetado de maneira que o usuário possa entrar valores na memória principal em decimal ou em binário. Por padrão, os valores entrados pelo usuário são assumidos estarem em decimal. No entanto, o usuário pode sempre selecionar 2 a partir da caixa View As a esquerda da posição de memória para ver o conteúdo em binário. Antes de entrar uma instrução em linguagem de máquina em uma célula de memória, o usuário deve primeiro selecionar 2 ta partir da caixa View As pois as instruções em linguagem de máquina são representadas em binário.
A função dos dispositivos de Entrada/Saída
Para completar nossa descrição do computador com programa armazenado, nós devemos pelo menos discutir brevemente a função dos dispositivos de entrada/saída. Os dispositivos de entrada tais como teclados, mouses e digitalizadores permitem o usuário entrar dados e instruções para o computador, que são então armazenados na memória e acessados pela CPU. Da mesma maneira, os dispositivos de saída tais como tela, altofalantes e impressoras permitem ao usuário acessar os resultados das computações que estão armazenados na memória.
Nos computadores projetados para executar um programa de cada vez, tais como os primeiros computadores programáveis da década de 1950 e mesmo os primeiros computadores pessoais da década de 1970, a interação com o usário era direta e sem muitas complicações. O usuário entra instruções de programas e dados diretamente nas posições da memória principal usando dispositivos de entrada tais como teclados ou leitores de fitas. Então apertando um botão, virando uma chave ou entrando um comando específico, o usuário mandava a CPU busca e executar as instruções do programa a partir da memória. O usário pode então observar os resultados da computação exibindo o conteúdo da memória em uma tela ou o enviando para uma impressora. Este processo é modelado por nosso simulador, no qual o usuário entra diretamente com isntruções e dados nas caixas da memória principal e então inicia a execução clicando em uma botão. Por outro lado, a maioria dos computadores modernos permitem que váriosprogramas sejam carregados na memória e sejam executados simultaneamente. Em tais computadores, o sistema operacional deve atuar, recebendo os dados e instruções do usuário, armazenando na memória e indicando suas posições na memória para a CPU.
Perguntas para revisão
Arquitetura de Computadores
Arquitetura de Computadores
Apresentação
Esta unidade curricular (UC) introduz conceitos de circuitos lógicos combinatórios e sequenciais. Os alunos aprendem a construir uma máquina sequencial e posteriormente um microprocessador. Como transformar uma operação numa instrução que possa ser interpretada e executada por um processador e¿ um dos objetivos principais desta UC.
Disciplina do Curso
Engenharia Informática
Grau|Semestres|ECTS
| Semestral | 5
Ano | Tipo de unidade curricular | Lingua
1 |Obrigatório |Português
Código
ULHT260-5857
Disciplinas complementares recomendadas
Sistemas Digitais
Pré-requisitos e co-requisitos
Não aplicável
Estágio profissional
Não
Conteúdos Programáticos
Aulas Teóricas Circuitos digitais MSI: Portas Lógicas, registos, contadores, memórias, multiplexers e descodificadores. Simulação. Arquitetura de um Microprocessador (CPU) genérico. Componentes básicos: ALU, Registos e Barramentos. Instruções e Microinstruções Memórias de Programa e Dados. Fluxo de informação num CPU: Operações Fetch e Execution Estudo de um Microcontrolador comercial de baixo custo. Ambiente de desenvolvimento, programação, simulação e teste. Aulas Práticas Componentes digitais típicos Simulação de componentes básicos da arquitetura interna de um CPU genérico Projeto simples com um microcontrolador comercial económico
Objetivos
Entender o funcionamento dos computadores, de uma perspetiva microscópica ate¿ uma perspetiva macroscópica. Reconhecimento das potencialidades e limitações de um computador. Entendimento da forma como interagem os diversos elementos da estrutura/arquitetura de um computador.
Metodologias de ensino e avaliação
Tendo em conta os objetivos, a metodologia utilizada deverá basear-se em dois aspetos fundamentais: Abordagem expositiva dos principais temas do programa, levando o aluno a entender os fundamentos da arquitetura de um processador. O aluno é encorajado a realizar o seu percurso formativo de forma autónoma, baseando-se nos conhecimentos já adquiridos, e completando-os com novos elementos adquiridos. Orientação para uma aprendizagem aberta, baseada no fazer e na pesquisa, através de conceção e programação de casos práticos concretos com base no microprocessador PIC16F. Requisitos para aprovação na UC: Parte Teórica (nota mínima de 9,5 valores) - 50% da nota Final: 2 Frequências (nota mínima de 8 valores) ou Frequência global ou Exame na Época de Recurso
Parte Prática (nota mínima de 9,5 valores e uma assiduidade mínima nas aulas de 75%) - 50% da nota Final: Trabalhos de laboratórios e sua defesa no final do semestre.
Nota Final: Me¿dia aritme¿tica de ambas as componentes.
Bibliografia principal
Mano, M. Morris, Kime, Charles R. - Logic and Computer Design Fundamentals. Prentice Hall, 1997.
Arroz, Guilherme, Monteiro, José e Oliveira, Arlindo - Arquitectura de Computadores: dos Sistemas Digitais aos Microprocessadores. 3a Edição. Lisboa, Portugal: IST Press, 2014.
Horário de Atendimento