Запуск и особенности работы MAKE
Перед запуском MAKE должен быть создан специальный файл описаний MAKE, содержимое которого задает поставленную задачу и определяет требуемые для ее выполнения файлы.
Файл описаний состоит из одного или нескольких описаний цели/источника. Каждое описание задается в виде:
<имя исходного файла> : <имена требуемых файлов>
<команда>
...
Предполагается, что указанный исходный файл может быть преобразован, для чего могут понадобиться файлы со специфицированными после :именами.
Имена файлов при необходимости могут быть снабжены спецификациями путей поиска в подоглавлениях.
<Команда> рассматривается как имя исполнительного файла или команда MS-DOS.
Может быть задано любое число требуемых файлов, но только один исходный (целевой). Имена требуемых файлов должны разделяться хотя бы одним пробелом. Если они не помещаются на одной строке, может быть специфицирован признак продолжения — символ \.
Может быть задано любое число команд DOS и/или имен исполнительных файлов, но каждая команда или имя должны располагаться на отдельной строке и начинаться с символа TAB или хотя бы одного пробела. Команды или файлы выполняются лишь в том случае, если хотя бы один из требуемых файлов был модифицирован после создания или модификации целевого, то есть, должно выполняться одно из двух условий:
u целевой файл старше требуемого;
u целевой файл не существует.
Может быть задано любое число описаний цели/источника. Последняя строка предыдущего описания должна отделяться от первой строки следующего описания хотя бы одной строкой, содержащей все пробелы.
При появлении символа # остаток строки считается комментарием. В области команд символ # может находиться только в 1-й позиции строки.
Следует помнить, что порядок следования описаний крайне важен, так как в процессе их отработки могут меняться даты модификаций файлов, что оказывает влияние на дальнейшую работу MAKE.
Запуск MAKE осуществляется введением командной строки следующего вида:
MAKE [<опции>][<макроопределения>]<имя файла описаний>
Имя файла описаний MAKE обычно не имеет расширения и совпадает с базовыми именами используемых в описаниях файлов, но это не является обязательным.
Если MAKE обнаруживает, что очередное описание по каким-либо причинам не может быть отработано, осуществляется переход к следующему описанию.
Если в процессе работы выяснится, что целевой файл не существует, MAKE продолжает работу, так как этот файл может быть создан последующими командами. Если же не существует требуемый или командный файл или возникает ошибка при выполнении команды, MAKE прекращает свою работу, а на консоль выдается поясняющее сообщение.
Опции MAKE
Каждая опция MAKE в командной строке запуска MAKE обозначается предшествующим символом /.
Описание опций MAKE приведено ниже:
/D
Выдавать на консоль даты последних модификаций каждого сканируемого файла.
/I
Игнорировать коды возврата после вызываемых программ.
/N
Выдавать на консоль команды, выполнение которых не осуществляется.
/S
Не выдавать на консоль сообщений.
Макроопределения
Использование макроопределений позволяет отложить определение компонент описания работы MAKE до момента запуска. Они могут располагаться как в файле описаний, так и в командной строке.
Существуют две формы макроопределений:
<имя>=<значение>
или
$(<имя>)
Первая форма задает значение символическому параметру, который может использоваться для определения компонент описания. Допустимо любое число пробелов между элементом <имя> и символом = и между этим символом и элементом <значение>, которые игнорируются. Пробелы, специфицированные после <значение>, рассматриваются как часть значения. Пробелы как часть значения в командной строке должны заключаться в двойные апострофы ".
В файле описаний MAKE каждое макроопределение должно занимать отдельную строку.
Одно и то же имя может быть определено в нескольких местах. Подстановка значений осуществляется в соответствии со следующим списком (в порядке убывания приоритетов):
u Из командой строки.
u Из файла описаний MAKE.
u Из текущего окружения (например, ключевые слова DOS).
Вторая форма макроопределений использует значение, определенное в другом месте. Элемент <имя> приводится к изображению на регистре заглавных букв.
Допускается вложенность макроопределений, когда внутреннее макроопределение определяется через внешнее. При этом следует избегать рекурсии.
Пример рекурсивной вложенности макроопределений:
A=$(B)
B=$(A)
Существуют 3 специальные макропеременные, имеющие следующие фиксированные значения:
u $* — часть имени (без расширения) целевого файла;
u $@ — полное имя целевого файла;
u $** — полный список требуемых файлов.
Эти макропеременные не требуют предварительного описания и могут использоваться в файле описаний MAKE.
Правила вывода
MAKE обеспечивает возможность задания правил вывода, которые помогают правильно интерпретировать неполностью определенные конструкции.
Правила вывода могут находиться в файле описаний MAKE или в специальном файле с именем TOOLS.INI, поиск которого осуществляется на активном драйве в подоглавлениях, определенных командой DOSPATH. В файле TOOLS.INI правилам вывода должна предшествовать строка, первыми символами которой являются [make].
Поиск правила вывода осуществляется в следующей последовательности:
u В файле описаний MAKE.
u В файле TOOLS.INI.
Правила вывода задаются в виде:
.<расширение требуемого файла>.<расширение целевого файла>:
<команда>
<команда>
...
Пример: содержимое файла описаний MAKE:
.asm.obj:
MASM $*.asm,,,; test1.obj: test1.asm test2.obj: test2.asm
MASM test2.asm;
Правило вывода занимает первые 2 строки. Прочитав 3-ю строку, MAKE обнаруживает, что описание неполно, так как 4-я строка является уже началом следующего описания. Поиск нужного правила вывода ведется по совпадению расширений файлов строки 3 с указанными в правиле. После отыскания правила MAKE, обработав макропеременную $*, выполняет командную строку:
MASM test1.asm,,;
4-я и 5-я строки переставляют собой законченное описание, и для его интерпретации использования правил вывода не требуется.
Сегментация программы
Программа на языке Ассемблера состоит из последовательности программных сегментов, заканчивающейся директивой END. Начало каждого сегмента обозначается директивойSEGMENT, конец — директивой ENDS.
В каждом сегменте при помощи директивы ASSUMEмогут быть определены используемые по умолчанию для адресации элементов программы регистры сегмента.
В каждом сегменте могут быть выделены специальные программные единицы (процедуры), позволяющие использовать часть программного кода многократно без его дублирования в разных частях программы. Процедуры обычно включены в систему адресации сегмента. Начало и конец процедуры определяются директивами PROC и ENDP соответственно.
Сегменты могут быть объединены в группу при помощи директивы GROUP.
Директивы ORG и EVEN позволяют управлять адресами размещения инструкций процессора.
Директивы SEGMENT и ENDS
Синтаксис:
имя SEGMENT [[выравнивание]] [[комбинация]] [['класс']]
имя ENDS
Директивы SEGMENT и ENDS отмечают соответственно начало и конец программного сегмента и должны быть помечены одним и тем же именем, которое и считается именем сегмента. Программный сегмент представляет собой последовательность инструкций и/или полей данных, адресуемых относительно одного регистра сегмента. Имя сегмента должно быть уникальным и может появляться в поле метки только лишь в другом предложении SEGMENT. Все директивы SEGMENT с одним и тем же именем обозначают продолжение одного и того же сегмента. При этом следует помнить, что параметры всех директив SEGMENT, определяющих один и тот же программный сегмент, не должны противоречить друг другу.
Параметры выравнивания, комбинация и класс директивы SEGMENT задают информацию для линкера. Они должны кодироваться в указанной последовательности, но могут быть опущены в произвольной комбинации.
Выравнивание определяет границу адреса, начиная с которой сегмент будет загружаться в память. Могут быть заданы следующие значения:
u BYTE — использовать любую границу;
u WORD — граница слова (2 байта);
u PARA — граница параграфа (16 байтов);
u PAGE— граница страницы (256 байтов).
Если выравнивание не указано, предполагается PARA. Следует помнить, что точный адрес начала сегмента до его загрузки в память неизвестен. Тип выравнивания только накладывает на него ограничение.
Тип комбинации определяет возможность и способы объединения программных сегментов, имеющих одно имя. Могут быть указаны следующие значения:
u PUBLIC — все сегменты с одним и тем же именем объединяются в один непрерывный сегмент. Все инструкции и поля данных нового сегмента будут адресоваться относительно одного регистра сегмента, а все смещения будут вычисляться относительно начала этого сегмента.
u STACK — все сегменты с одним и тем же именем объединяются в один непрерывный сегмент. Этот тип комбинации отличается от PUBLIC лишь тем, что адресация в новом сегменте будет вестись относительно регистра SS; регистр SP при этом устанавливается на конец сегмента. Такой тип комбинации обычно имеют сегменты стека. Тип комбинации STACK автоматически обеспечивает инициализацию регистров SS и SP, и пользователю необязательно включать в свою программу инструкции для установки этих регистров.
u COMMON— все одноименные сегменты этого класса будут загружаться в память, начиная с одного адреса. Таким способом можно формировать оверлейные программы. Длина области загрузки равна длине максимального по объему сегмента. Все адреса в этих сегментах вычисляются относительно одного базового адреса. Если некоторые данные объявлены в более, чем одном сегменте с конкретным именем и типом комбинации COMMON, данные, объявленные последними, замещают все предыдущие.
u MEMORY — для Microsoft 8086 Object Linker (LINK) полностью совпадает с типом PUBLIC. MASM обеспечивает отдельный тип комбинации MEMORY для совместимости с программами LINK, различающими эти типы комбинации.
u AT адрес — все метки и адресные переменные сегмента должны быть вычислены относительно указанного адреса. Адрес может быть представлен любым допустимым выражением, не содержащим ссылок вперед. Сегмент с этим типом комбинации обычно не содержит программного кода или инициализируемых данных, а включает в себя адресные значения, фиксированные для вычислительной машины (например, адрес буфера экрана).
Если тип комбинации не указан, сегмент ни с чем не объединяется и рассматривается как отдельная программная единица.
Класс сегмента определяет порядок следования сегментов в памяти. Сегменты одного класса загружаются в память один после другого до того, как начнут загружаться сегменты другого класса.
В качестве класса сегмента может быть указан любой идентификатор, на который распространяются все требования и ограничения языка Ассемблера (в том числе условия чувствительности к регистру). Поскольку класс сегмента рассматривается как идентификатор, он не может быть определен где-либо еще в программе.
Если класс не указан, LINK копирует сегменты в исполнительный файл в той последовательности, в которой они расположены в объектном файле. Эта последовательность сохраняется до тех пор, пока LINK не обнаружит 2 или более сегмента одного класса, после чего LINKначинает объединение сегментов. Сегменты одного класса копируются в последовательные блоки исполнительного файла.
Все сегменты имеют класс. Сегменты, для которых класс не указан, считаются принадлежащими к классу с пустым именем и копируются в последовательные блоки памяти вместе с такими же сегментами.
Число сегментов, принадлежащих к одному классу, не ограничено, но их суммарный объем не должен превышать 64К.
Если на вход программы LINKподается несколько объектных файлов, правильное кодирование классов сегментов вообще говоря не обеспечивает правильную последовательность сегментов в исполнительном файле, так как эта последовательность в этом случае зависит еще и от последовательности объектных файлов в командной строке.
Пусть, например, LINK обрабатывает 2 объектных файла, 1-й из которых содержит 2 сегмента с классами CODE и STACK, а 2-й — один сегмент классаDATA.
В исполнительном файле сегменты всегда будут расположены в последовательности CODE, STACK, DATA. Если, например, программисту необходимо, чтобы сегменты располагались в последовательности CODE, DATA, STACK, ему следует создать объектный файл, содержащий фиктивные сегменты с теми же именами и теми же классами, но расположенные в нужном ему порядке, и в командной строке запуска LINK указать его первым.
Исходная программа, соответствующая такому объектному файлу, может иметь следующий вид:
code SEGMENT PARA PUBLIC 'CODE'
code ENDS
data SEGMENT PARA PUBLIC 'DATA'
data ENDS
stack SEGMENT PARA STACK 'STACK'
stack ENDS
Этот прием не может быть использован для программ на языках C, FORTRAN, PASCAL и BASIC, так как компиляторы этих языков следуют определенным соглашениям о порядке сегментов, который не следует нарушать.
Другим способом управления последовательностью сегментов является кодирование опции /A MASM, которая предписывает MASM располагать сегменты в объектном файле в алфавитном порядке. Сочетание опции /Aс формированием последовательности фиктивных сегментов позволяет реализовывать довольно сложные стратегии управления структурой исполнительного файла.
В некоторых ранних версиях MASM опция /A включена по умолчанию.
Директивы PROC и ENDP
Директивы PROC и ENDP служат для определения процедуры. Процедура представляет собой набор инструкций и директив, образующих некоторую подпрограмму в рамках какого-либо сегмента.
Процедура имеет следующий вид:
имя PROC [[расстояние]]
...
предложения
...
имя ENDP
Директивы PROC и ENDP обозначают соответственно начало и конец процедуры и должны быть помечены одним и тем же именем, которое считается именем процедуры.
Необязательное расстояние может принимать значения FAR и NEAR. Если этот параметр опущен, предполагается NEAR.
Имя процедуры имеет атрибуты метки и может быть использовано как операнд в инструкциях перехода, вызовах или циклах.
Возврат из процедуры должен быть выполнен инструкцией RET. При этом следует помнить, что адрес возврата выбирается из стека (в соответствии со значениями регистров SS и SP). Для процедур с расстоянием NEAR адрес возврата состоит только из смещения и занимает в стеке 2 байта. Для FAR-процедур он занимает 4 байта стека, включая в себя базовый адрес (содержимое регистра сегмента) и смещение.
Допускается вложенность процедур.
Процедуре могут быть переданы параметры. Вообще говоря, передача параметров и их распознавание в процедуре возлагается на программиста. Но при соблюдении стандартных соглашений, принятых в языках высокого уровня, параметры процедуры могут быть отслежены командой трассировки стека K SYMDEB.
Согласно стандартным соглашениям параметры размещаются в стеке, верх которого определяется содержимым регистров SP и SS.
Пример передачи параметров:
...
PUSH AX ; 2-й параметр
PUSH BX ; 1-й параметр
CALL addup
ADD SP,4 ; уничтожение параметров
...
addup PROC NEAR ; адрес возврата для NEAR - 2 байта
PUSH BP ; сохранение базового указателя
MOV BP,SP ; загрузка базового регистра
MOV BX,[BP+4] ; адрес 1-го параметра
MOV AX,[BP+6] ; адрес 2-го параметра
...
POP BP
RET addup ENDP
Из этого примера ясно, что адрес возврата запоминается в верхушке стека перед параметрами (стек «растет» от больших адресов к малым).
Если бы процедура специфицировала расстояние FAR, адрес возврата занял бы 4 байта, а смещение для 1-го параметра составило бы 6 байтов.
Директива ASSUME
Синтаксис:
ASSUME регистр-сегмента:имя-сегмента...
ASSUME NOTHING
Директива ASSUME устанавливает регистр сегмента в качестве умалчиваемого регистра сегмента для адресации меток и переменных в указанном сегменте или группе. Последующие ссылки к метке или переменной при отсутствии явных указаний разрешаются относительно данного регистра сегмента.
В качестве регистра сегмента могут быть указаны CS, DS, SS или ES.
В качестве имени сегмента может быть специфицировано:
u Имя сегмента, предварительно определенное директивой SEGMENT.
u Имя группы, предварительно определенное директивой GROUP.
u Ключевое слово NOTHING.
Наличие ключевого слова NOTHING отменяет текущий выбор конкретного регистра сегмента или текущий выбор всех регистров сегмента (для второй формы директивы).
Выбор регистра сегмента по умолчанию в отдельном предложении языка Ассемблера может быть отменен при помощи оператора переключения сегмента (:).
Директива GROUP
Синтаксис:
имя GROUP имя-сегмента,...
ДирективаGROUP обозначает, что один или несколько сегментов с указанными именами логически объединяются в группу с данным именем, что позволяет адресовать все метки и переменные в этих сегментах относительно начала группы, а не начала содержащего их сегмента. Имя-сегмента должно быть именем сегмента, определенного директивой SEGMENT, или SEG-выражением. Оно должно быть уникальным.
Директива GROUP не влияет на порядок загрузки сегментов, который зависит от классов сегментов и их расположения в объектном файле.
Сегменты одной группы не обязательно будут занимать непрерывную область памяти. Они могут быть перемешаны с сегментами, не принадлежащими этой группе. Однако, расстояние в байтах между первым байтом первого сегмента группы и последним байтом последнего сегмента группы не должно превышать 64К. Таким образом, если сегменты группы расположены последовательно, группа может занимать до 64К оперативной памяти.
Имена групп могут использоваться в директиве ASSUME и в качестве префикса операнда оператора переключения сегмента (:).
Имя группы может появиться только в одной директиве GROUP в исходном файле. Если к группе принадлежат несколько сегментов в исходном файле, все их имена должны быть указаны в одной директиве GROUP.
Директива END
Синтаксис:
END [[выражение]]
Директива END обозначает конец модуля. Ассемблер игнорирует все предложения, следующие в исходном файле за этой директивой.
Необязательное выражение определяет точку входа программы, в которую будет передано управление при запуске программы на счет. Значением этого выражения должен быть адрес в одном из программных сегментов данного исходного файла.
Если выражение опущено, точка входа не определяется.
При попытке выполнения программы с незаданной точкой входа могут возникать ошибки, поэтому директиву END без параметров рекомендуется кодировать лишь с сегментами, содержащими только поля данных.
В исходном файле может быть определена только одна точка входа.
Директивы ORG и EVEN
Директивы ORG и EVEN позволяют задавать адрес памяти, начиная с которого будут располагаться последующие инструкции процессора.
Директива ORG имеет следующий формат:
ORG выражение
Значение указанного выражения присваивается указателю позиции, и адреса последующих инструкций и данных будут начинаться с нового значения.
Значением выражения должно быть абсолютное число, точнее, все используемые в нем имена должны быть известны на 1-м проходе Ассемблера. В качестве элемента выражения может быть использован знак указателя позиции ($), обозначающий его текущее значение.
Пример:
ORG 120h
MOV AX,BX
В этом примере инструкция MOV будет начинаться с байта 120h текущего сегмента.
Директива EVEN имеет следующий формат:
EVEN
Директива EVEN выравнивает следующее за ней поле данных или инструкцию по границе слова, то есть, по четному адресу. Если текущее значение указателя позиции нечетно, директива увеличивает его значение на 1 и генерирует инструкциюNOP (нет операции). Если текущее значение указателя позиции уже четно, никаких действий не производится.
Директива EVEN не должна использоваться в сегментах с типом выравнивания BYTE.
Условные директивы
Язык ассемблера включает в себя условные директивы двух типов: директивы условного ассемблирования и директивы условной генерации ошибок.
Директива условного ассемблирования обеспечивает ассемблирование блока предложений лишь в том случае, если истинно заданное в директиве условие.
Директива условной генерации ошибки проверяет заданное в ней условие и генерирует ошибку, то есть, формирует сообщение в листинге программы и обеспечивает код возврата, соответствующий наличию ошибки в исходном тексте, если это условие истинно.
Директивы обоих типов проверяют условия времени ассемблирования. Они не могут анализировать условия времени выполнения, так как последние не могут быть вычислены до того, как программа начнет выполняться.
В условиях допустимы лишь выражения, преобразуемые в константы при ассемблировании.