Programación en Lenguaje Ensamblador Este material se
refiere al compilador gcc (GNU compiler collection) el cual corre
bajo ambiente Linux. El ensamblador de gcc se llama as y por
formar parte de gcc comúnmente se conoce como gas.
Programación en Lenguaje Ensamblador Plataforma: IA-32
IA-32 es la arquitectura de microprocesadores de 32 bits de Intel
(Intel Architecture 32). Son los microprocesadores más
usados en los ordenadores personales (PC). Esta gama de
microprocesadores comenzó con el Intel 80386 en 1985,
conocido luego popularmente como 386 o x86 para denominar a toda
la gama. Los procesadores de Intel que siguieron y mantuvieron la
compatibilidad son el 486, Pentium, Pentium II, Pentium III,
Pentium 4, y la línea Intel Core. La novedad de estos
procesadores con respecto a sus predecesores es que incluyen
gestión de memoria avanzada (segmentación,
paginación, soporte de memoria virtual), unidad de punto
flotante, y a partir del Pentium MMX, soporte para operaciones
matriciales complejas, muy usadas en aplicaciones gráficas
y multimedia.
Plataforma: IA-32 Tipos de datos La información se puede
accesar de diversas maneras. Se puede leer un sólo byte (8
bits) o un conjunto de bytes, en esta máquina en
particular se denomina palabra a dos bytes y doble palabra a 4
bytes. La notación puede ser en decimal o en
hexadecimal.
Plataforma: IA-32 Tamaños de los datos:
Plataforma: IA-32 Orden de los datos en memoria: En gas las
instrucciones utilizan un sufijo para indicar el tamaño de
los datos sobre los cuales operan. El sistema guarda los datos en
memoria en secuencia inversa de bytes (little endian) lo cual
trae como consecuencia que el byte menos significativo se ubica
en la posición de menor orden y el byte más
significativo en la posición de memoria de mayor orden.
Por ejemplo si se transfiere el dato 0x457A a las posiciones
consecutivas de memoria 0x100 y 0x101 se ubica el byte 7A en la
posición 0x100 y el byte 45 en la posición
0x101.
Plataforma: IA-32 Registros de propósito general Los
registros de propósito general se utilizan para almacenar
datos temporalmente, debido a que estos registros han
evolucionado desde una máquina de 8 bits (el 8080) un
grupo de registros aún se puede acceder de 8 bits para
mantener compatibilidad con toda la línea de procesadores.
Aún cuando estos registros pueden mantener cualquier tipo
de datos, algunos tienen cierta funcionalidad específica o
son usados de manera especial por algunas instrucciones.
Plataforma: IA-32 Registros de propósito general
Plataforma: IA-32 Registros de propósito general En gas
los registros se denotan usando el símbolo de porcentaje
antes del nombre del registro. Los registros %eax, %ebx, %ecx y
%edx pueden ser accesados con tamaños de 8, 16 o 32 bits
cambiando su nomenclatura de acuerdo al tamaño. Ejemplo
para %eax:
Plataforma: IA-32 Registros de propósito general Los
registros %edi, %esi, %ebp y %esp se pueden accesar como
registros de 16 o 32 bits. Ejemplo para %edi:
Plataforma: IA-32 Registro de instrucción: El registro de
instrucción o contador de programa contiene la
dirección de la próxima instrucción a
ejecutarse. Registros de punto flotante: Son 8 registros los
cuales son tratados como una pila. Se nombran %st(0), %st(1),
%st(2), etc. %st(0) se ubica en el tope de la pila. Banderas:
Proveen una manera de obtener información acerca del
estado actual de la máquina y el resultado de
procesamiento de una instrucción. La plataforma IA-32
utiliza un registro de 32 bits llamado EFLAGS que contiene las
banderas.
Plataforma: IA-32 Banderas: Estas son las banderas más
comunes:
Plataforma: IA-32 Banderas: La bandera de acarreo se activa
cuando se produce acarreo en una operación
matemática entre números sin signo. La bandera de
paridad se usa para indicar si el resultado, en un registro, de
una operación matemática es válido. La
bandera de ajuste se utiliza en operaciones matemáticas
con números decimales codificados en binario (BCD). Se
activa si hay acarreo presente. La bandera de cero se activa si
el resultado de una operación es cero. La bandera de signo
muestra el bit más significativo del resultado de una
operación, el cual denota el signo del
número.
Plataforma: IA-32 Banderas: La bandera de dirección
controla la selección de autoincremento o autodecremento
de los registros %edi o %esi durante las operaciones con cadenas
de caracteres. La bandera de dirección sólo se
utiliza con las instrucciones para el manejo de cadenas de
caracteres. La bandera de desbordamiento se utiliza en la
aritmética de enteros con signo cuando un número
sobrepasa la capacidad de representación del
registro.
Programación en ensamblador Un programa en lenguaje
ensamblador está orientado a líneas y cada
enunciado especifica una operación sencilla. Conceptos
básicos de los programas en lenguaje ensamblador: Espacio:
Un espacio es equivalente a cualquier número de espacios o
tabuladores. Los espacios no pueden aparecer en medio de un
número o identificador. Comentario: Texto que aparece
después de un carácter de inicio de comentario, el
ensamblador ignora los comentarios. Los comentarios comienzan con
el símbolo #.
Programación en ensamblador Conceptos básicos de
los programas en lenguaje ensamblador: Identificador: Es una
letra seguida de cualquier cantidad de letras o dígitos (y
en algunos casos caracteres especiales). Etiqueta: identificador
seguido de dos puntos. Instrucción: es una
operación seguida de una lista de operandos. Debe haber un
espacio entre el nombre de la operación y la lista de
operandos. Los operandos se separan por comas, el número
de operandos en la lista depende de la operación.
Programación en ensamblador Conceptos básicos de
los programas en lenguaje ensamblador: Directriz: consiste en un
nombre de directriz seguido de una lista de parámetros.
Los nombres de la directrices comienzan con un punto. Con las
directrices se especifica la forma en que el ensamblador traduce
las instrucciones, es decir, las directrices dirigen el proceso
de traducción.
Programación en ensamblador El programa escrito en
lenguaje ensamblador se compone de varias secciones. Las
secciones más comunes son: sección de texto
sección de datos sección bss. En la sección
de texto se escriben las instrucciones, en la sección de
datos los datos inicializados y en la sección bss las
variables sin inicializar. Cada una de las secciones se declara
por medio de una directiva.
Programación en ensamblador Para declarar las secciones
mencionadas se usan las siguientes directivas: .section .text
para la sección de texto .section .data para la
sección de datos .section .bss para la sección bss
Comúnmente las secciones se colocan en la siguiente
secuencia: .section .data .section .bss .section .text bss son
las siglas correspondientes a "block storage start", que
significa inicio de bloque de almacenaje.
Programación en ensamblador Punto de inicio de programa:
se define por medio de la declaración de una etiqueta:
_start la cual indica a partir de qué instrucción
se comienza a ejecutar el código. Esta etiqueta debe ser
declarada como global, es decir, que esté disponible para
aplicaciones externas; esto se logra utilizando la directiva
.globl.
Programación en ensamblador Finalización del
programa: Gas no provee una instrucción de fin de
ejecución, esto se logra mediante una llamada al sistema.
Para realizar esta llamada se pasa dos parámetros: El
valor 1 en el registro %eax indica el código de llamada a
exit (salida). El valor 0 en el registro %ebx indica la salida
normal del programa.
Programación en ensamblador Estructura general En general
la estructura de un programa en lenguaje ensamblador tiene la
siguiente forma:
Programación en ensamblador Los datos se definen en las
secciones .data y .bss. Para definir datos en la sección
.data se pueden utilizar las siguientes directivas:
Programación en ensamblador El formato para estas
directivas es el siguiente: etiqueta: directiva valor Ejemplo:
declaración de variables inicializadas Se pueden definir
múltiples valores en la misma línea. Cada uno de
ellos será guardado en memoria en el orden en el cual
fueron declarados.
Programación en ensamblador Declaración de
múltiples valores con una misma etiqueta En este caso
cuando se lee la variable var arroja el valor 10, para poder leer
el siguiente valor se debe incrementar la dirección de var
en 4 bytes (debido a que la variable está declarada como
long, es decir de 32 bits) de esta manera se usa la etiqueta var
como la dirección inicial de estos valores y su
tratamiento es el de un arreglo donde cada acceso se realiza
tomando var como posición inicial lo cual sería
equivalente a decir var[0] y las posiciones siguientes como un
desplazamiento de 4 bytes cada uno. Para leer por ejemplo el
valor 30 se accesaría var+8.
Programación en ensamblador Cuando se definen las
variables, el sistema las guarda en forma consecutiva en memoria.
Por ejemplo si se definen variables de 16 bits y luego se leen
usando instrucciones de 32 bits el sistema no produce un mensaje
de error y accesa los bytes consecutivos leyendo datos no
válidos. Aún cuando la sección .data se
utiliza principalmente para definir variables también
puede ser usada para definir constantes. Esto se hace usando la
directiva .equ, el formato para esta directiva es: directiva
símbolo, valor Ejemplo: definición de
constantes
Programación en ensamblador Para definir datos en la
sección bss se usan dos directivas: La directiva .lcomm se
usa para datos locales, que no serán usados fuera del
código local. El formato, para ambas directivas es el
siguiente: directiva símbolo, tamaño en bytes
Ejemplo : declaración de un área de memoria sin
inicializar Se declara una variable llamada area de 100 bytes de
tamaño.
Programación en ensamblador La ventaja de declarar
variables en la sección .bss es que esos datos no se
incluyen en el programa ejecutable y por lo tanto el
tamaño total del programa es menor al tamaño
generado por la declaración equivalente en la
sección .data.
Programación en ensamblador Instrucciones Las
instrucciones en gas tienen un sufijo que indica el tamaño
del dato sobre el cual actúa la instrucción. Las
instrucciones pueden no tener operandos, tener un sólo
operando o dos operandos; dependiendo de la instrucción en
particular. En general las instrucciones tienen la forma:
instrucción operando fuente, operando destino
Programación en ensamblador Los operandos se pueden
clasificar en tres tipos: Inmediato: para valores constantes.
Registro: denota el contenido de uno de los registros. Referencia
a memoria: denota el contenido de una posición de
memoria.
Programación en ensamblador Hay varias maneras de obtener
la información las cuales se pueden resumir en la
siguiente tabla: inm denota un inmediato reg denota un registro,
regb un registro base y regi un registro índice e es la
escala la cual puede ser 1, 2, 4 ó 8 R[reg] significa el
contenido del registro reg M[x] significa el contenido de la
posición de memoria con dirección x
Programación en ensamblador Ejemplo: valores para cada
modo de direccionamiento Asumiendo los contenidos de: %eax= 0x100
y %ecx= 0x10
Programación en ensamblador El valor inmediato se puede
expresar en decimal o en hexadecimal como se puede observar en el
siguiente ejemplo: Asumiendo el contenido de %eax=0x100
Programación en ensamblador La instrucción mov La
instrucción mov permite el movimiento de datos, ya que gas
utiliza un prefijo para señalar el tamaño de los
datos podemos tener tres opciones al momento de realizar una
transferencia de datos: movb mueve un byte movw mueve una palabra
(2 bytes) movl mueve dos palabras (4bytes) Usaremos la
nomenclatura F para denotar el operando fuente y D para denotar
el operando destino.
Programación en ensamblador La instrucción mov La
instrucción mov permite el movimiento de datos, ya que gas
utiliza un prefijo para señalar el tamaño de los
datos podemos tener tres opciones al momento de realizar una
transferencia de datos: movb mueve un byte movw mueve una palabra
(2 bytes) movl mueve dos palabras (4bytes) Usaremos la
nomenclatura F para denotar el operando fuente y D para denotar
el operando destino.
Programación en ensamblador Movimiento de datos inmediatos
a registro o a memoria Los datos inmediatos se especifican
directamente en la instrucción. Deben estar precedidos por
el símbolo dólar para indicar que son datos
inmediatos. Pueden estar expresados en decimal o hexadecimal.
Ejemplo:
Programación en ensamblador Movimiento de datos entre
registros Esta es la transferencia de datos que toma menor tiempo
dentro del sistema es buena práctica de
programación utilizar este tipo de transferencia en vez de
accesos a memoria ya que ello redunda en una mayor eficiencia.
Ejemplo:
Programación en ensamblador Movimiento de datos entre
memoria y registros Las direcciones de memoria usualmente se
expresan con etiquetas, cuando por ejemplo se escribe: a debe
haber sido declarado en la sección de datos. Como se
están transfiriendo 4 bytes éstos serán
guardados en memoria de manera consecutiva a partir de la
posición a.
Programación en ensamblador Movimiento de datos entre
memoria y registros Para mover la información de memoria a
un registro se escribe:
Programación en ensamblador Para leer o escribir en
arreglos se utiliza direccionamiento indexado. Hay que tomar en
cuenta la dirección inicial del arreglo y utilizar un
índice para ir recorriendo cada uno de sus elementos. El
tamaño de los datos representa el desplazamiento entre dos
posiciones del arreglo. La forma general de accesar un arreglo se
puede expresar como: dirección inicial (desplazamiento,
índice, escala) La dirección se calcula como:
dirección inicial + desplazamiento + índice *escala
Donde escala refleja el tamaño del tipo de dato del
arreglo.
ESTA PRESENTACIÓN CONTIENE MAS DIAPOSITIVAS DISPONIBLES EN
LA VERSIÓN DE DESCARGA