Monografias.com > Computación > Redes
Descargar Imprimir Comentar Ver trabajos relacionados

Arquitecturas paralelas




Enviado por Pablo Turmero



    Monografias.com

    QUEREMOS MÁS VELOCIDAD:
    A menor Grano, mayor Grado
    (Gp:) µP1

    (Gp:) TAREA

    (Gp:) µP2

    (Gp:) µP3

    (Gp:) µP4
    (Gp:) µP5

    ! AUMENTAN LAS NECESIDADES DE COMUNICACIÓN !

    Monografias.com

    Comunicación Hw < ===> Comunicación Sw
    Memoria Común (Load/Store)
    Comunicar µPi y Memoria
    Paso Mensajes (Send/Receive)
    Comunicar Pi con Pj
    (Gp:) µP1
    (Gp:) µP2
    (Gp:) µPi
    (Gp:) µPn
    (Gp:) R E D
    (Gp:) M1
    (Gp:) Mj
    (Gp:) Mk

    (Gp:) P1
    (Gp:) P2
    (Gp:) Pi
    (Gp:) Pn
    (Gp:)
    R E D

    Es muy importante la Latencia y el Ancho de banda

    Monografias.com

    ¡ LA RED TIENE UNA IMPORTANCIA VITAL !
    http://www.euroben.nl/reports/overview13.pdf
    (Gp:) Gigabit Ethernet
    (Gp:) 0,1
    (Gp:) 29..120

    (Gp:) Coste
    *
    50

    ¿Consumo?

    Monografias.com

    ¡ LA RED TIENE UNA IMPORTANCIA VITAL !
    (Gp:) 2005: 30% consumo energía dinámica del chip y subiendo
    (Gp:) 2010: 2,2 Km/cm2 de cables dentro de un MPSOC

    Monografias.com

    (Gp:) LAN
    (Gp:)
    WAN

    Sistema
    Placa
    ChipMulticore

    Monografias.com

    (Gp:) Sistema

    (Gp:) Placa

    (Gp:) Chip

    www.sicortex.com SC5832
    (Gp:) 27 nodos

    (Gp:) 36 placas

    (Gp:) 6
    núcleos

    Monografias.com

    72 núcleos 96GB 100GF => 19.000€
    27/Mayo/2009: Quiebra

    Monografias.com

    (Gp:) Tom Willis Sep/2007
    Intel Connects Cables

    (Gp:) IBM Sequoia
    #2 Nov/12
    1.572.864
    nodos

    Monografias.com

    (Gp:) LAN/WAN Internet
    (Gp:) Multiprocesadores …
    (Gp:) Millones de nodos Cientos .. Miles
    # Nodos dinámico Fijo
    Enlaces largos Cortos
    Red irregular Regular
    Latencia alta Baja

    Monografias.com

    CLASIFICACIÓN DE LAS REDES
    MEDIO DE TRANSMISIÓN COMPARTIDO
    DIRECTAS vs INDIRECTAS
    TOTAL vs PARCIALMENTE CONECTADAS
    PERFILES DE COMUNICACIÓN
    1 => 1; N => N; 1 => N; N => 1
    CARACTERIZACIÓN POR GRAFOS
    GRADO Y DIÁMETRO

    Monografias.com

    Medio de Transmisión Compartido: Ponerse de acuerdo en su uso (maestro/esclavo, …)
    Síncronos vs asíncronos
    Multiplexados
    Arbitraje del bus
    (Gp:) Redes locales
    (Gp:) Ethernet
    (Gp:) Token Ring

    (Gp:) µP2
    (Gp:) µPi
    (Gp:) µPn
    (Gp:) Mj
    (Gp:) Mk

    (Gp:) Buses (Backplane)
    (Gp:) µP1
    (Gp:) M1

    Redes inalámbricas

    Monografias.com

    Redes directas: Conexiones fijas entre los elementos (Pi, Pj) “invariables durante la ejecución”
    (Gp:) P1
    (Gp:) P4
    (Gp:) P2
    (Gp:) P3

    Acoplamiento débil
    Amplio uso en multicomputadores
    Los propios Nodos encaminan
    Los caminos del origen al
    destino pueden ser distintos

    Monografias.com

    (Gp:) Red Telefónica

    Redes indirectas: Conexiones varían entre los elementos (µPi, Mj) “variables durante la ejecución”
    Acoplamiento fuerte
    Amplio uso en multiprocesadores
    Encamina la propia red
    (Gp:) µP1
    (Gp:) µP2
    (Gp:) µPi
    (Gp:) µPn
    (Gp:) R E D
    (Gp:) M1
    (Gp:) Mj
    (Gp:) Mk

    Monografias.com

    Totalmente conectadas: “Cada elemento tiene conexión directa con los demás”
    (Gp:) Parcialmente conectadas:
    ¡ conexas !

    (Gp:) Jerarquizadas: Aislar tráfico por “localidades”

    (Gp:) Latencia mínima (Lm)

    (Gp:) Alto coste O(n2)

    (Gp:) No escalable

    (Gp:) Menor coste O(n)
    (Gp:) Mayor latencia (2Lm)
    (Gp:) Encaminar más
    complejo

    Monografias.com

    Nodos => µP y/o Bancos de Memoria
    Aristas => Enlaces de comunicación
    Grado de un nodo: Líneas incidentes (Si unidireccionales Ge + Gs)
    Relacionado con el número de puertos E/S
    y, por lo tanto, con el coste
    Deseable constante y pequeño
    Grado de la red: El del nodo con mayor grado (4)
    Deseable regularidad
    Compromiso en el Grado
    (Gp:) Más conectividad => Menor latencia
    Mayor coste

    (Gp:) Menor conectividad => Más latencia
    Menor coste

    (Gp:) 1
    (Gp:) 2
    (Gp:) 3
    (Gp:) 4
    (Gp:) 2
    (Gp:) A
    (Gp:) B
    (Gp:) C
    (Gp:) D
    (Gp:) E

    Monografias.com

    Diámetro de la red: Camino más distante de entre los mínimos que unen a dos nodos cualesquiera.
    Relación directa con la latencia
    (Gp:) ¿1, 2, 3, ……?

    Métrica => Número de saltos => 2
    (Gp:) 1
    (Gp:) 4
    (Gp:) 7
    (Gp:) 6
    (Gp:) 5
    (Gp:) 9
    (Gp:) 2
    (Gp:) 8
    (Gp:) 3

    (Gp:) ¿5? => 2, 5, 4, 8, 7, 6

    (Gp:) 4 => 2, 5, 4, 3, 6 más corto

    Monografias.com

    Enlaces de comunicación establecidos concurrentemente.
    (Gp:) 1 => 1
    (Gp:) Ventanilla única
    (Gp:) Bus Común

    (Gp:) N => N
    (Gp:) Varias Ventanillas

    (Gp:) T.V. News
    (Gp:) 1 => N
    (Gp:) Difusión, Broadcast, Multicast

    (Gp:) Reducción
    (Gp:) N => 1
    (Gp:) Máquinas CRCW

    Monografias.com

    (Gp:) µP1
    (Gp:) M1
    (Gp:) Mj
    (Gp:) Mk
    (Gp:) µP2
    (Gp:) µPi
    (Gp:) µPn

    ¿Cuántos Pi podré instalar?
    Pentium 4 a 3,8GHz
    Bus de 64 bits y 800MHz
    ¿Un único Pi satura el Bus?
    (Gp:) $
    (Gp:) $
    (Gp:) $
    (Gp:) $
    (Gp:) $
    (Gp:) ¡ Cachés !

    (Gp:) µP2
    (Gp:) µPn

    ¡ Algunos problemas !
    (Gp:) Fallo costoso

    (Gp:) µP1
    (Gp:) ? 98% Hit

    (Gp:) colisiones

    (Gp:) ¿ Niveles cache ?

    Monografias.com

    (Gp:) ¿ Cuánto hit en cache “ld” ?
    (Gp:) Simulación con:
    PTLsim/X arquitectura tipo x86-64
    L1D = 16KB [128 conjuntos, 4 vías]
    SPEC CPU2006
    400 millones de instrucciones simuladas
    (Gp:) Benchmark
    (Gp:) Benchmark

    (Gp:) L1D
    (Gp:) L2
    (Gp:) L3
    (Gp:) 88,3
    (Gp:) 65,2
    (Gp:) 22,7
    (Gp:) L*
    (Gp:) 98,0
    (Gp:) %Hit
    (Gp:) 16K
    (Gp:) 256K
    (Gp:) 4M
    (Gp:) L1I 32K => 99,5%

    Monografias.com

    (Gp:) µP1
    (Gp:) M1
    (Gp:) Mj
    (Gp:) Mk
    (Gp:) µP2
    (Gp:) µPi
    (Gp:) µPn
    (Gp:) L
    (Gp:) L
    (Gp:) L
    (Gp:) L

    (Gp:)
    Shared L3 cache
    (Gp:) L3 cache controler
    (Gp:) Shared Bus

    (Gp:)
    Shared L2 cache
    (Gp:) L2 cache controler
    (Gp:) Shared Bus

    ¿ Soluciones ?

    Monografias.com

    Bus pipelining
    (Gp:) Pedir bus
    Arbitrar
    Dar bus
    Usar bus
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) RQ
    (Gp:) ACK
    (Gp:) 1 2 3 4 5
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) RQ
    (Gp:) P
    (Gp:) 1 2 3 4 5 6
    (Gp:) RPLY
    (Gp:) Write
    (Gp:) Read

    ¿Cuántos ciclos 2W y 4R?
    (Gp:) read 1
    write 2
    write 3
    read 4
    read 5
    read 6
    bus ocupado
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) RQ
    (Gp:) RPL
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) Stall
    (Gp:) P
    (Gp:) Stall
    (Gp:) RQ
    (Gp:) ACK
    (Gp:) AR
    (Gp:) ARB
    (Gp:) Stall
    (Gp:) Stall
    (Gp:) AG
    (Gp:) Stall
    (Gp:) RQ
    (Gp:) ACK
    (Gp:) AR
    (Gp:) Stall
    (Gp:) Stall
    (Gp:) ARB
    (Gp:) Stall
    (Gp:) AG
    (Gp:) Stall
    (Gp:) RQ
    (Gp:) RPL
    (Gp:) P
    (Gp:) AR
    (Gp:) Stall
    (Gp:) ARB
    (Gp:) Stall
    (Gp:) AG
    (Gp:) RQ
    (Gp:) RPL
    (Gp:) P
    (Gp:) AR
    (Gp:) Stall
    (Gp:) ARB
    (Gp:) AG
    (Gp:) Stall
    (Gp:) Stall
    (Gp:) RQ
    (Gp:) RPL
    (Gp:) P
    (Gp:) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

    Con pipeline mejor
    ?

    Monografias.com

    Split transaction: Pipelining + Dividir la transacción en dos
    8 peticiones pendientes en SGI
    112 peticiones pendientes en SUN E 6000
    (Gp:) read 1
    resp 1
    write 2
    ack 2
    write 3
    ack 3
    read 4
    resp 4
    read 5
    resp 5
    read 6
    resp 6
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) RQ
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) Stall
    (Gp:) Stall
    (Gp:) RQ
    (Gp:) Stall
    (Gp:) Stall
    (Gp:) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
    (Gp:) RPL
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) RQ
    (Gp:) ACK
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) RQ
    (Gp:) ACK
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) RQ
    (Gp:) RPL
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) RPL
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG
    (Gp:) Stall
    (Gp:) Stall
    (Gp:) RQ
    (Gp:) Stall
    (Gp:) Stall
    (Gp:) RPL
    (Gp:) AR
    (Gp:) ARB
    (Gp:) AG

    (Gp:) RpA
    (Gp:) RqA
    (Gp:) RqB
    (Gp:) RqC
    (Gp:) RpB
    (Gp:) RpC

    ¿ Mejora ?
    (Gp:) RqA
    (Gp:) 1 2 3 4 5 6 7 8 9 10 11 12 13 14
    (Gp:) RpA
    (Gp:) RqB
    (Gp:) RpB
    (Gp:) RqC
    (Gp:) RpC
    (Gp:) Transacciones
    variables: 1..6 ciclos

    Monografias.com

    Modo ráfaga (Burst): Transacciones largas (línea de caché)
    (Gp:) Normal
    (Gp:) Arb
    (Gp:) 1 2 3 4 5 6 7 8 9 10 11 12 13 14
    (Gp:) Cmd
    (Gp:) Dir
    (Gp:) Dato
    (Gp:) Arb
    (Gp:) Cmd
    (Gp:) Dir
    (Gp:) Dato
    (Gp:) Arb
    (Gp:) Cmd
    (Gp:) Dir
    (Gp:) Dato
    (Gp:) Arb
    (Gp:) Cmd
    (Gp:) Dir
    (Gp:) Dato

    (Gp:) Arb
    (Gp:) Cmd
    (Gp:) Dir
    (Gp:) Dato
    (Gp:) Dato
    (Gp:) Dato
    (Gp:) Dato
    (Gp:) Ráfaga

    ¿ Inconveniente ?
    (Gp:) arbitraje
    mensaje A
    mensaje B
    (Gp:) GrA
    (Gp:) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
    (Gp:) Cmd
    (Gp:) Dir
    (Gp:) Dato
    (Gp:) Dato
    (Gp:) Dato
    (Gp:) Dato
    (Gp:) GrB
    (Gp:) Cmd
    (Gp:) Dir
    (Gp:) Dato
    (Gp:) ReA
    (Gp:) Eti
    (Gp:) Dato
    (Gp:) Dato
    (Gp:) Dato
    (Gp:) Dato
    (Gp:) Mensaje más prioritario
    (Gp:) Mensaje continuado

    Monografias.com

    Buses jerárquicos
    (Gp:) Buses múltiples

    Concluyendo
    Cachés (L1, L2 y L3)
    Pipelining
    Split Transaction
    Modo ráfaga
    Buses Jerárquicos
    Buses Múltiples
    Muy costoso + 32µP
    (Gp:) Difusión
    Serialización

    (Gp:) Frecuencia
    Secuencial

    Monografias.com

    (Gp:) Evolución FSB Intel

    Monografias.com

    Menor diámetro aumentando el grado
    Compromiso grado vs diámetro y muchos nodos
    Tabla de parámetros
    Encaminamiento
    Generalidades
    Array lineal
    Anillo simple y de grado “n”
    Conectividad total
    Árbol, Fat Tree y Estrella
    Mallas, Toroides y WK-rec
    Hipercubo con y sin ciclo

    Monografias.com

    (Gp:) P
    (Gp:) M
    (Gp:) IC
    (Gp:) Red con enlaces directos entre Pi
    (Gp:) P
    (Gp:) M
    (Gp:) IC
    (Gp:) P
    (Gp:) M
    (Gp:) IC

    Nodos => PC’s o similares
    (Gp:) Pn
    (Gp:) L2
    (Gp:) Switch
    (Gp:) MultiC más integrado
    (Gp:) De otros nodos
    (Gp:) A otros nodos

    Ejemplos: Alpha 21364, SiCortex, Intel Core i7 y SCC
    (Gp:) Buffers
    Arbitraje
    Encamina.

    Monografias.com

    Monografias.com

    .. 10GBseg
    15nseg Lat
    .. 128 nodos [8×16]
    .. 4 TB MP
    12 diámetro

    Monografias.com

    (Gp:) www.sicortex.com
    (Gp:) 500MHz
    (Gp:) 2007

    2GBseg
    1µseg Lat

    Monografias.com

    (Gp:) Kautz Graph

    Monografias.com

    (Gp:) www.intel.com/technology/quickpath/introduction.pdf
    (Gp:) 2008

    19,2..25,6 GBseg

    Monografias.com

    Monografias.com

    (Gp:) 2012

    Monografias.com

    Mayo 2010: Intel lanza de forma selectiva el SCC [prototipo]
    48 IA-32
    núcleos
    Memoria común sin coherencia ? Sw
    http://techresearch.intel.com/spaw2/uploads/files/SCC_Platform_Overview.pdf
    64 GBseg

    Monografias.com

    (Gp:) Nov 2012: Intel lanza el coprocesador Xeon Phi (60/61 núcleos)

    70 GBseg

    Monografias.com

    Jul 2014: Sale a la venta masiva la placa “Parallella Epiphany-16”
    (Gp:) onChip Write
    Network
    (Gp:) offChip Write
    Network
    (Gp:) Read Request
    Network

    (Gp:) 8B / ciclo
    (Gp:) 1B / ciclo
    (Gp:) 1R / 8 ciclos

    (Gp:) 38,4Gbps
    (Gp:) 4,8Gbps
    (Gp:) 2,4Gbps

    Monografias.com

    Jul 2014: Sale a la venta masiva la placa “Parallella Epiphany-16”

    Monografias.com

    Mecanismo Hw/Sw para que la información llegue del origen al
    destino.
    Hay que distinguir entre:
    Algoritmo: Elección del camino y gestión de conflictos
    Técnica: Modo de propagar la información
    (Gp:) 1
    (Gp:) 4
    (Gp:) 7
    (Gp:) 6
    (Gp:) 5
    (Gp:) 9
    (Gp:) 2
    (Gp:) 8
    (Gp:) 3
    (Gp:) Conmutación de paquetes
    (Gp:) Redes directas

    (Gp:) Conmutación de circuitos
    (Gp:) Redes indirectas

    Monografias.com

    8×8 = 64 nodos
    Diámetro = 7+7=14
    Numerar nodo 0..63
    (Gp:) fila
    (Gp:) col
    (Gp:) 0..7
    (Gp:) 0..7

    (Gp:) 0,0
    (Gp:) 0,1
    (Gp:) 0,2
    (Gp:) 0,7
    (Gp:) 0,3
    (Gp:) 0,4
    (Gp:) 0,5
    (Gp:) 0,6
    (Gp:) 1,0
    (Gp:) 2,0
    (Gp:) 7,0
    (Gp:) 3,0
    (Gp:) 4,0
    (Gp:) 5,0
    (Gp:) 6,0

    (Gp:) A
    (Gp:) B
    (Gp:) Dinámico: A[2,3] => B[5,1]
    (Gp:) E
    (Gp:) datos
    (Gp:) L
    (Gp:) 5,1

    Algo: MovCol+MovFila
    (Gp:) C
    (Gp:) D
    (Gp:) En origen: C[3,4] => D[1,6]

    (Gp:) E
    (Gp:) datos
    (Gp:) L
    (Gp:) 1,6
    (Gp:) ,N,N,E,E

    (Gp:) E
    (Gp:) datos
    (Gp:) L
    (Gp:) 1,6
    (Gp:) ,N,N,E

    N[00], E[01], S[10], O[11]
    (Gp:) SiCortex, Intel QuickPath, Epiphany …

    Monografias.com

    (Gp:) Epiphany-III
    (Gp:) Dir
    (Gp:) Dato
    (Gp:) Ctrl
    (Gp:) 32 64 8
    (Gp:) fila
    (Gp:) col
    (Gp:) dirMemLocal
    (Gp:) 6 6 20

    Arbitraje Round Robin
    Broadcast

    Monografias.com

    En conmutación de paquetes veremos dos técnicas:
    (Gp:) Buffer de
    paquete
    (Gp:) Los mensajes se
    dividen en paquetes (64..1024bits) y se envían paquete a paquete

    (Gp:) Origen
    (Gp:) Almacenamiento y reenvío
    (Gp:) Destino

    Elevada latencia (3*Tiempo trans. Paquete “Ttp”)
    (Gp:) Origen
    (Gp:) “Wormhole”
    (Gp:) Destino

    Mejora la latencia (2*Tiempo trans. Flit + Ttp)
    (Gp:) Buffer de
    flit
    (Gp:) Los paquetes se
    dividen en flits (2..64bits) y se envían flit a flit
    (Gp:) 2
    (Gp:) 1
    (Gp:) 0
    (Gp:) 0

    (Gp:) 0
    (Gp:) 0
    (Gp:) 1

    (Gp:) 1
    (Gp:) 0
    (Gp:) 1
    (Gp:) 2

    (Gp:) 2
    (Gp:) 0
    (Gp:) 1
    (Gp:) 2

    ¿Similar a
    IP/ATM
    MPLS?

    Monografias.com

    (Gp:) Header
    (Gp:) Payload
    (Gp:) CRC
    (Gp:) 8
    (Gp:) 8
    (Gp:) 64
    (Gp:) 20 | 10 | 5
    (Gp:) Flit
    (Gp:) Phit

    Monografias.com

    Distancia
    Latencia
    Almacena y
    Reenvío
    (Gp:) Wormhole

    Toro2D 8*16 Alpha 21364
    Diámetro = 12
    Flit = 39 b Paquete = 702b
    Ancho Banda = 3,2Gb*seg
    Tflit = 12,1875nseg
    Tpaq = 219,375nseg
    AlmaReen => 2.632,5 nseg
    Wormhole => 353,4 nseg
    (Gp:) + 7 veces
    mejor

    Monografias.com

    (Gp:) A
    (Gp:) B
    (Gp:) C
    (Gp:) D

    (Gp:) D
    (Gp:) C
    (Gp:) A
    (Gp:) B

    (Gp:) D
    (Gp:) C
    (Gp:) A
    (Gp:) B

    (Gp:) D
    (Gp:) C
    (Gp:) A
    (Gp:) B

    (Gp:) D
    (Gp:) C
    (Gp:) A
    (Gp:) B

    ¡ Interbloqueo !

    Monografias.com

    (Gp:) A
    (Gp:) D

    (Gp:) B
    (Gp:) A
    (Gp:) D

    (Gp:) B
    (Gp:) A
    (Gp:) D

    Una forma de evitar el interbloqueo

    Monografias.com

    (Gp:) ARRAY LINEAL
    (Gp:) 0
    (Gp:) 1
    (Gp:) 2
    (Gp:) 3
    (Gp:) 4
    (Gp:) 5
    (Gp:) 6
    (Gp:) 7

    (Gp:) ANILLO (DE GRADO 2)
    (Gp:) 0
    (Gp:) 1
    (Gp:) 2
    (Gp:) 3
    (Gp:) 4
    (Gp:) 5
    (Gp:) 6
    (Gp:) 7

    (Gp:) ANILLO (DE GRADO ‘n’ 3)
    (Gp:) 0
    (Gp:) 1
    (Gp:) 2
    (Gp:) 3
    (Gp:) 4
    (Gp:) 5
    (Gp:) 6
    (Gp:) 7

    Grado, diámetro, escalable, …

    Monografias.com

    “Navigation in a small world” – Jon M. Kleinberg
    Nature – 24 Agosto 2000

    Monografias.com

    N = 8 n = 3
    (Gp:) Salto 3

    (Gp:) 1
    (Gp:) 1
    (Gp:) 1

    (Gp:) 2
    (Gp:) 2
    (Gp:) 2

    (Gp:) 3

    (Gp:) d = 3, d = 1,71

    (Gp:) Salto 2

    (Gp:) 1
    (Gp:) 1
    (Gp:) 1
    (Gp:) 3
    (Gp:) 2
    (Gp:) 2
    (Gp:) 2

    (Gp:) d = 3, d = 1,71

    (Gp:) Salto 4

    (Gp:) 1
    (Gp:) 2
    (Gp:) 1
    (Gp:) 1
    (Gp:) 2
    (Gp:) 2
    (Gp:) 2

    (Gp:) d = 2, d = 1,57

    Monografias.com

    N = 16 n = 3
    (Gp:) Salto 2

    (Gp:) d = 6, d = 3,2
    (Gp:) 6

    (Gp:) Salto 3

    (Gp:) 5
    (Gp:) d = 5, d = 2,67

    (Gp:) Salto 4

    (Gp:) 4
    (Gp:) d = 4, d = 2,27

    Salto 5 iguala y 7 y 8 empeoran

    Monografias.com

    N = 16 n = 4
    (Gp:) d = 4, d = 2,13
    (Gp:) 4

    (Gp:) 3
    (Gp:) d = 3, d = 2

    (Gp:) Salto 5

    (Gp:) 4
    (Gp:) d = 4, d = 2,13

    ¿Cómo podría ser N=32 y n=5?
    (Gp:) Salto 3

    (Gp:) Salto 4

    Monografias.com

    N = 32 n = 5
    (Gp:) d = 4, d = ???

    4
    ¿ Escalable ?
    4

    Monografias.com

    (Gp:) 0
    (Gp:) 1
    (Gp:) 2
    (Gp:) 3
    (Gp:) 4
    (Gp:) 5
    (Gp:) 6
    (Gp:) 7

    Grado, diámetro, escalable, …

    Monografias.com

    (Gp:) Moverse por aquí
    con menor grado

    Monografias.com

    (Gp:) K=1
    (Gp:) K=2
    (Gp:) K=3
    (Gp:) K=4

    ÁRBOL BINARIO
    (Gp:) ÁRBOL BINARIO EQUILIBRADO
    “Fat Tree”
    (Gp:) 2
    (Gp:) 2
    (Gp:) 2
    (Gp:) 2
    (Gp:) 4
    (Gp:) 4

    Grado, diámetro, escalable, …
    Cuello de botella [tráfico aleatorio]
    (Gp:) ¿Cómo encaminar A ? B?

    (Gp:) ESTRELLA

    Monografias.com

    Fat Tree ¡Indirectas!
    ¿Más nodos más niveles? => más latencia
    (Gp:) 32
    (Gp:) 16
    (Gp:) 8
    (Gp:) 8

    Monografias.com

    Dragonfly “high radix routers”
    local channels
    (Gp:) 36, 100 .. 648
    56Gb/s

    Monografias.com

    (Gp:) K=3
    (Gp:) MALLA 3D

    MALLA 2D
    (Gp:) K=1
    (Gp:) K=2

    M3D 102410*10*10 => D=27
    ¿Escalabilidad cuadrática o cúbica?
    (Gp:) Encaminamiento ordenado por direcciones
    (Gp:) O(1,1,1)
    (Gp:) D(3,3,3)

    (Gp:) O(2,2,1)
    (Gp:) D(3,3,2)

    ¡Colisión!
    ¿ Interbloqueos ?
    Grado, diámetro, escalable, …
    ¿ Cuello de botella?

    Monografias.com

    ¿Cuello de botella tráfico N?N?
    (Gp:) 18
    (Gp:) 18
    (Gp:) 18
    (Gp:) 18
    (Gp:) 18
    (Gp:) 18
    (Gp:) 18
    (Gp:) 18
    (Gp:) 18
    (Gp:) 18
    (Gp:) 18
    (Gp:) 18

    ¡ 18 msj por todos los enlaces en cada sentido !

    Monografias.com

    TOROIDES (2D y 3D)
    K=1
    K=2
    T3D 102410*10*10 => D=15
    ¡ Anillo embebido !
    Grado, diámetro, escalable, …
    Cables largos vs cortos
    Muchos cruces

    Monografias.com

    Grado, diámetro, escalable, …
    ¿Grado 5?
    (Gp:) Grado 3
    (Gp:) (3,1)

    (3,2)
    (Gp:) (3,3)

    (Gp:) Grado 4
    (Gp:) (4,1)

    (Gp:) (4,2)

    (Gp:) (4,3)

    Monografias.com

    (5,1)
    (5,2)
    WK (4,5) 1024 => D=31

    Monografias.com

    ¿Cuello de botella tráfico N?N?
    (Gp:) 5
    (Gp:) 5
    (Gp:) 5
    (Gp:) 5
    (Gp:) 5
    (Gp:) 5
    (Gp:) 5
    (Gp:) 5
    (Gp:) 5
    (Gp:) 5
    (Gp:) 5
    (Gp:) 5

    (Gp:) 9
    (Gp:) 9
    (Gp:) 9
    (Gp:) 9
    (Gp:) 9
    (Gp:) 9
    (Gp:) 9
    (Gp:) 9
    (Gp:) 9
    (Gp:) 9
    (Gp:) 9
    (Gp:) 9

    (Gp:) 16
    (Gp:) 16
    (Gp:) 16
    (Gp:) 16
    (Gp:) 16
    (Gp:) 16

    Monografias.com

    HIPERCUBO
    (Gp:) Dim1

    Dim2
    Dim3
    Dim4
    (Gp:) Diámetro = log2 N
    (Gp:) Grado = log2 N
    (Gp:) Fácil encaminar

    ‘N=2k’ nodos, ‘k’ dimensiones = log2 N
    Escalable a costa de demasiado grado
    Topología cada vez menos utilizada

    Monografias.com

    Encaminamiento en HIPERCUBO (Sea N=16)
    (Gp:) 0001
    (Gp:) 0010
    (Gp:) 0100
    (Gp:) 1000

    (Gp:) 1
    (Gp:) 2
    (Gp:) 3
    (Gp:) 4
    (Gp:) 1. Numerar nodos en binario. Nodos adyacentes difieren en un bit (el asociado a la dirección que les une)
    (Gp:) 0000
    (Gp:) 4321

    (Gp:) 1010
    (Gp:) 1111
    (Gp:) 0101
    (Gp:) 0111
    (Gp:) 0110
    (Gp:) 0011

    2. Enviar mensaje por el enlace asociado a la menor dirección donde no coinciden bit del nodo actual y bit del nodo destino
    (Gp:) Nodo actual 0111
    Nodo destino 1010

    (Gp:) 0110
    1010

    (Gp:) 0010
    1010

    (Gp:) 1010
    1010

    ¿ Realizar ORX ?
    0111 ORX 1010 = 1101
    (Gp:) ¿Caminos distintos?

    Monografias.com

    HIPERCUBO CON CICLOS
    K=3
    (Gp:) 2
    (Gp:) 2
    (Gp:) 4
    (Gp:) 3
    (Gp:) 4
    (Gp:) 5
    (Gp:) 5
    (Gp:) 4
    (Gp:) 3
    (Gp:) 4
    (Gp:) 1
    (Gp:) 3
    (Gp:) 1
    (Gp:) 2
    (Gp:) 2
    (Gp:) 3
    (Gp:) 6
    (Gp:) 4
    (Gp:) 4
    (Gp:) 3
    (Gp:) 3
    (Gp:) 1
    (Gp:) 5
    (Gp:) 0

    Grado, diámetro, escalable, …
    ¿ Diámetro ?

    Monografias.com

    Monografias.com

    ¿Cómo conectar unos 1024 nodos?
    (Gp:) M3D 10*10*10
    (Gp:) 27
    (Gp:) 6*
    (Gp:) T3D 10*10*10
    (Gp:) 15
    (Gp:) 6

    (Gp:) Hipercubo 10
    (Gp:) 10
    (Gp:) 10
    (Gp:) HiperCiclo 7
    (Gp:) 3
    (Gp:) 896 N
    (Gp:) Grafo Kautz
    (Gp:) 6
    (Gp:) 3
    (Gp:) 972 N
    (Gp:) 16

    (Gp:) WK 4ary 5rec
    (Gp:) 31
    (Gp:) 4*
    (Gp:) M2D 32*32
    (Gp:) 62
    (Gp:) 4*
    (Gp:) Árbol
    (Gp:) 18
    (Gp:) 3*

    (Gp:) Topología
    (Gp:) Diámetro
    (Gp:) Grado
    (Gp:) Total
    (Gp:) 1
    (Gp:) 1023
    (Gp:) Anillo10
    (Gp:) 9
    (Gp:) 10
    (Gp:) Anillo2
    (Gp:) 512
    (Gp:) 2
    (Gp:) Array lineal
    (Gp:) 1023
    (Gp:) 2*

    Monografias.com

    (Gp:) Topología
    (Gp:) Grado
    (Gp:) Diámetro
    (Gp:) Nº de nodos
    (Gp:) Array lineal
    (Gp:) Anillo
    (Gp:) Anillo de grado ‘n’
    (Gp:) Árbol binario
    (Gp:) Árbol binario equilibrado
    (Gp:) Estrella
    (Gp:) Malla
    (Gp:) Toroide
    (Gp:) Hipercubo
    (Gp:) Hipercubo con ciclos
    (Gp:) N
    (Gp:) 2
    (Gp:) N-1
    (Gp:) N
    (Gp:) 2
    (Gp:) ?N/2?
    (Gp:) N
    (Gp:) n=log2N
    (Gp:) n-1
    (Gp:) 2K-1
    (Gp:) 3
    (Gp:) 2*(K-1)
    (Gp:) 2K-1
    (Gp:) 2K
    (Gp:) 2*(K-1)
    (Gp:) N
    (Gp:) N-1
    (Gp:) 2
    (Gp:) nK
    (Gp:) 2*K
    (Gp:) K*(n-1)
    (Gp:) nK
    (Gp:) 2*K
    (Gp:) K* ? n/2 ?
    (Gp:) 2K
    (Gp:) K
    (Gp:) K
    (Gp:) K*2K
    (Gp:) 3
    (Gp:) 2*K – 1 + ? K/2 ?

    Monografias.com

    MIMD
    HWANG (1993) IDENTIFICA TRES GENERACIONES:
    1983-1987 Hipercubo con Encaminamiento Sw
    1988-1992 Malla con Encaminamiento Hw (Sw de grano medio)
    1993-1997 µP y comunicaciones en el mismo chip (grano fino)
    (Gp:) Multiprocessor systems-on-chips (MPSoCs)
    (Gp:) Hoy 4..16 núcleos
    ¿Se llegará a 400 en 2020?

    (Gp:) 1983-1987

    (Gp:) 1988-1992

    (Gp:) 1993-1997

    Monografias.com

    M1
    M2
    M3
    Mm
    ?P1
    ?P2
    ?P3
    ?Pn
    “Crossbar”
    Funcionalidad de los conmutadores simples:
    colisión
    (Gp:) difusión

    (Gp:) Perfil N*M
    (Gp:) O (N2)
    (Gp:) Muchas patas

    8×8 OnChip
    mm2 => 5 núcleos
    W => 2 núcleos

    Monografias.com

    (Gp:) crossbar
    8*8
    (Gp:) O (64)
    Perfil 8*8
    Latencia 1

    ¿ Reducir O( N2) a costa de … ?
    (Gp:) Usar sólo crossbar 2*2

    (Gp:) directo

    (Gp:) cruce

    (Gp:) difusión

    (Gp:) colisión

    (Gp:) etapa 1
    (Gp:) etapa 2
    (Gp:) etapa m

    (Gp:) Red de interconexión
    (Gp:) Conjunto de crossbar 2*2

    ?

    Monografias.com

    (Gp:) a
    (Gp:) b
    (Gp:) c
    (Gp:) d
    (Gp:) e
    (Gp:) f
    (Gp:) g
    (Gp:) h

    Red de interconexión “perfect Suffle”
    Limitado a N = potencia de 2
    (Gp:) N = 2

    N = 4
    Viable: [a,f – b,e – c,h – d,g]
    NoViable: [a,f – c,e – …….]
    Crossbar ? 24
    Red ? ? 16

    Monografias.com

    Red de interconexión “perfect Suffle”
    Limitado a N = potencia de 2
    (Gp:) 000
    (Gp:) 001
    (Gp:) 010
    (Gp:) 011
    (Gp:) 100
    (Gp:) 101
    (Gp:) 110
    (Gp:) 111
    (Gp:) 000
    (Gp:) 001
    (Gp:) 010
    (Gp:) 011
    (Gp:) 100
    (Gp:) 101
    (Gp:) 110
    (Gp:) 111

    (Gp:) ¿Encaminamiento?
    Sea de 001 a 010
    (Gp:) 001
    (Gp:) 010

    (Gp:) 001
    (Gp:) 010

    (Gp:) Bit igual => directo
    Bit distinto => cruce

    (Gp:) 001
    (Gp:) 010

    (Gp:) 001
    (Gp:) 010

    (Gp:) 011
    (Gp:) 001

    (Gp:) 100
    (Gp:) 100

    (Gp:) 110
    (Gp:) 101

    Colisión
    ¿ Latencia
    y O( ) ?
    ¿Mejorable?

    Monografias.com

    (Gp:) 000
    (Gp:) 001
    (Gp:) 010
    (Gp:) 011
    (Gp:) 100
    (Gp:) 101
    (Gp:) 110
    (Gp:) 111
    (Gp:) 000
    (Gp:) 001
    (Gp:) 010
    (Gp:) 011
    (Gp:) 100
    (Gp:) 101
    (Gp:) 110
    (Gp:) 111

    (Gp:) 101
    (Gp:) 000
    (Gp:) 001
    (Gp:) 010
    (Gp:) 011
    (Gp:) 100
    (Gp:) 101
    (Gp:) 110
    (Gp:) 111

    ¡ Permite difusión !

    Monografias.com

    BUS Barato y limitado 2..32
    CROSSBAR Más caro. Bueno para N moderado
    Mayor ancho de banda y fácil encaminar
    MULTIETAPA Compromiso entre Bus y Crossbar

    Monografias.com

    #NODOS TIPO DE RED SUPERCOMPUTADOR
    ..N Configurable Bull systems
    >50.000 Dragonfly Cray Inc. XC30
    .. 1.152 Toro 2y3D Cray Inc. XE6/XE6m
    (96+96)*N Toro 3D Cray Inc. XK7
    .. 4.096 ..? Toro 3D + Árbol Eurotech Aurora
    .. 98.304 Toro 6D Fujitsu PRIMEHPC FX 10
    .. 512 Crossbar multidim. Hitachi SR 16000
    .. 1.572.864 Toro 5D IBM BlueGene/Q
    256 x 2.048 Variable IBM eServer p775
    .. 8.192 Crossbar multidim. NEC SX-9
    .. 4.096 Toro 2D .. ? SGI Altix UV
    intercluster

    Monografias.com

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter