Построение автомата с магазинной памятью по q-грамматике
Контекстно-свободная грамматика называется q-грамматикой тогда и только тогда, когда выполняются два условия:
1. Правая часть каждого правила либо представляет собой пустую цепочку e, либо начинается с терминального символа.
2. Множество выбора правил с одной и той же левой частью не пересекаются.
Второе условие следует рассмотреть подробнее, так как необходимо ввести ряд определений. Одно из них – множество выбора. Для демонстрации определений будем использовать пример q-грамматики G9.4(S):
1. S → aAS
2. S → b
3. A→cAS
4. A → e
О том, что это не S-грамматика говорит правая часть правила 4, которая не начинается с терминального символа. Однако, метод построения НАМП, изложенный для S-грамматики почти подходит и здесь.
Множество терминалов, следующих за данным нетерминалом X (Обозначим через СЛЕД(X)) – множество терминальных символов, которые могут следовать непосредственно за Х в какой-либо промежуточной цепочке, выводимой из S┤, включая и ┤.
Это множество символов называется также множеством следуемых за Х терминалов. Для приведенной грамматики можно определить следующие множества:
СЛЕД(А) = {a, b}
СЛЕД(S) = {a, b}
Терминалы, следующие за A, определяются исходя из того, что за A следует всегда нетерминал S, правая часть правила для которого начинается либо с a, либо с b. Терминалы, следующие за S, выводятся путем подстановки в правило 1 правила 3, которая показывает, что за S всегда следует S, начинающаяся либо с a, либо с b:
S Þ aAS Þ acASS.
Данное понятие используется для того, чтобы показать, когда следует применять правило с пустой правой частью A → e . Если входной символ Ti Ï {a, b}, то есть, является символом c или ┤, a на вершине магазина А, то бесполезно применять A → e . Если это правило будет применено, то А удаляется из стека, а так как за А символы c или ┤ следовать не могут, то в результате процесс останавливается. Представим, что у нас уже есть автомат, соответствующий грамматике G9.4, и очень похожий на АМП, распознающий S-грамматику. Тогда, применительно к цепочке аасbb, можно получить несколько решений. В начале рассмотрим стратегию, при которой в первую очередь применяется всегда пустое правило.
Номер шага | Содержимое стека | Остаток входной цепочки | Номер применяемого правила | Комментарий |
Ñ S | aacbb┤ | |||
Ñ SA | acbb┤ | Иначе, процесс разбора дальше не пойдет | ||
Ñ S | acbb┤ | |||
Ñ SA | cbb┤ | А здесь данный шаг ведет к отказу по отношению к правильной цепочке | ||
Ñ S | cbb┤ | Отвергнуть | Придется осуществлять возврат |
Правильным было бы применение на шаге 4 правила 3, в соответствии с ранее рассмотренными рекомендациями о месте и времени применения пустого правила.
Номер шага | Содержимое стека | Остаток входной цепочки | Номер применяемого правила | Комментарий |
Ñ S | aacbb┤ | |||
Ñ SA | acbb┤ | Иначе, процесс разбора дальше не пойдет | ||
Ñ S | acbb┤ | |||
Ñ SA | cbb┤ | Пойдем в соответствии с предложенными рекомендациями | ||
Ñ SSA | bb┤ | Иначе, процесс разбора дальше не пойдет | ||
Ñ SS | bb┤ | |||
Ñ S | b┤ | |||
Ñ | ┤ | Допустить |
Таким способом решается одна из задач детерминированного разбора, связанная с особенностями применения пустого правила. Однако, при разборе, построенном на основе q-грамматики возможна и такая ситуация, когда:
A → bα, A → e и b Î СЛЕД(A).
В этом случае стоит проблема выбора одного из правил с одинаковыми левыми частями. Для ее решения введем понятие множества выбора для данного правила.
Если правило грамматики имеет вид: A → bα, где b – терминал, а α– цепочка терминалов и нетерминалов, то определим множество выбора для правила A → bα равным b. Обозначим данную запись следующим образом:
ВЫБОР(A → bα) = b.
Если правило имеет вид: A → e, то определим:
ВЫБОР(A → e) = СЛЕД(A).
Если p – номер правила, то будем также писать «ВЫБОР(p)» вместо «ВЫБОР(правило)»
ВЫБОР(p) – множество выбора правила p.
Проиллюстрируем построение множества выбора на примере грамматики G9.4.
ВЫБОР(1) = ВЫБОР(S → aAS) = {a}
ВЫБОР(2) = ВЫБОР(S → b) = {b}
ВЫБОР(3) = ВЫБОР(A→cAS) = {c}
ВЫБОР(4) = ВЫБОР(A → e) = СЛЕД(A) = {a, b}
В соответствии с определением, рассмотренным в начале, имеем q-грамматику, так как:
ВЫБОР(1) È ВЫБОР(2) = Æ,
ВЫБОР(3) È ВЫБОР(4) = Æ.