Procesadores, Memoria y Redes
Los sistemas de memoria compartida y distribuida tienen:
procesadores: RISC procesadores
memoria: DRAM
red/interconexión: entre los procesadores y memoria (bus, crossbar, fat tree, torus, hypercube, etc.)
Estas piezas se tienen que describir en detalles, comenzando con definiciones de terminos.
Procesador-Términos Relacionados
Período de Reloj (cp): el mínimo intervalo de tiempo entre sucesivas acciones en el procesador. Fijo: depende del diseño del procesador. Medidas en nanosegundos (~1-5 para procesadores muy rápidos). Inverso de la frequencia (MHz).
Instrucción: una acción ejecutada por un procesador, tal como una operación matemática o una operación de memoria.
Registro: una pequeña y extremadamente rápida ubicación para almacenar datos o instrucciones en el procesador.
Procesador-Términos Relacionados
Unidad Funcional (FU): un elemento de hardware que ejecuta una operación sobre un operando o parejas de operaciones. Comúmente las FUs son ADD, MULT, INV, SQRT, etc.
Pipeline : técnica de solapar multiples instrucciones en ejecución.
Superscalar: multiples instrucciones son posibles por período de reloj.
Flops: operaciones de punto flotante por segundo.
Procesador-Términos Relacionados
Cache: memoria rápida (SRAM) cercana del procesador. Ayuda a mantener instrucciones y datos cercanos a las unidades funcionales, entonces el procesador puede ejecutar más instrucciones más rápidamente.
Translation-Lookaside Buffer (TLB): mantiene direcciones de páginas (bloques de memoria) en memoria principal que recientemente han sido accesados (una cache para direcciones de memoria)
Memoria-Términos Relacionados
SRAM: Static Random Access Memory (RAM). Muy rápida (~10 nanosegundos), hecha usando el mismo tipo de tecnología del procesador, entonces la velocidad es comparable.
DRAM: Dynamic RAM. El tiempo de acceso es más lento (~100 nanosegundos), pero mantiene más bits y es menos costosa (10x más barata).
Jerarquía de Memoria: la jerarquía de memoria en un sistema paralelo, desde registros a cache a memoria local a memoria remota. Luego….
Interconexión-Términos Relacionados
Latencia:
Redes: Cuanto tiempo se lleva incializar el envio de un "mensaje"? Medido en microsegundos.
Procesador: Cuanto tiempo se lleva la salida de resultados de algunas operaciones, tales como suma punto flotante, dividir etc., las cuales son hechas en pipelined?)
Ancho de Banda: Qué porcentaje de data puede ser sostenida una vez que el mensaje es inicializado? Medido en Mbytes/sec o Gbytes/sec
Interconexión-Términos Relacionados
Topología: la forma en la cual los nodos son conectados.
La mejor elección es conexión completa (cualquier procesador con cualquier otro). Infactible debido a razones de costo y escalamiento.
Por ejemplo, los procesadores son conectados en alguna variación de mallas, torus, o hypercube.
(Gp:) 3-d hypercube
(Gp:) 2-d mesh
(Gp:) 2-d torus
Página anterior | Volver al principio del trabajo | Página siguiente |