Формальная грамматика

Формальная грамматика
Дерево составляющих
Генеративная лингвистика

Формальная грамматика или просто грамматика в теории формальных языков — способ описания формального языка, то есть выделения некоторого подмножества из множества всех слов некоторого конечного алфавита. Различают порождающие и распознающие (или аналитические) грамматики — первые задают правила, с помощью которых можно построить любое слово языка, а вторые позволяют по данному слову определить, входит оно в язык или нет.

Содержание

Термины

  • Терминал (терминальный символ) — объект, непосредственно присутствующий в словах языка, соответствующего грамматике, и имеющий конкретное, неизменяемое значение (обобщение понятия «буквы»). В формальных языках, используемых на компьютере, в качестве терминалов обычно берут все или часть стандартных символов ASCII — латинские буквы, цифры и спец. символы.
  • Нетерминал (нетерминальный символ) — объект, обозначающий какую-либо сущность языка (например: формула, арифметическое выражение, команда) и не имеющий конкретного символьного значения.

Порождающие грамматики

Словами языка, заданного грамматикой, являются все последовательности терминалов, выводимые (порождаемые) из начального нетерминала по правилам вывода.

Чтобы задать грамматику, требуется задать алфавиты терминалов и нетерминалов, набор правил вывода, а также выделить в множестве нетерминалов начальный.

Итак, грамматика определяется следующими характеристиками:

  • \Sigma — набор (алфавит) терминальных символов
  • N — набор (алфавит) нетерминальных символов
  • P — набор правил вида: «левая часть» \rightarrow «правая часть», где:
    • «левая часть» — непустая последовательность терминалов и нетерминалов, содержащая хотя бы один нетерминал
    • «правая часть» — любая последовательность терминалов и нетерминалов
  • S — стартовый (начальный) символ из набора нетерминалов.

Вывод

Выводом называется последовательность строк, состоящих из терминалов и нетерминалов, где первой идет строка, состоящая из одного стартового нетерминала, а каждая последующая строка получена из предыдущей путем замены некоторой подстроки по одному (любому) из правил. Конечной строкой является строка, полностью состоящая из терминалов, и следовательно являющаяся словом языка.

Существование вывода для некоторого слова является критерием его принадлежности к языку, определяемому данной грамматикой.

Типы грамматик

По иерархии Хомского, грамматики делятся на 4 типа, каждый последующий является более ограниченным подмножеством предыдущего (но и легче поддающимся анализу):

Применение

Пример — арифметические выражения

Рассмотрим простой язык, определяющий ограниченное подмножество арифметических формул, состоящих из натуральных чисел, скобок и знаков арифметических действий. Стоит заметить, что здесь в каждом правиле с левой стороны от стрелки \Rightarrow стоит только один нетерминальный символ. Такие грамматики называются контекстно-свободными.

Терминальный алфавит:

\Sigma={'0','1','2','3','4','5','6','7','8','9','+','-','*','/','(',')'}.

Нетерминальный алфавит:

  { ФОРМУЛА, ЗНАК, ЧИСЛО, ЦИФРА }

Правила:

1. ФОРМУЛА \Rightarrow\!\, ФОРМУЛА ЗНАК ФОРМУЛА                (формула есть две формулы, соединенные знаком)
2. ФОРМУЛА \Rightarrow\!\, ЧИСЛО                               (формула есть число)
3. ФОРМУЛА \Rightarrow\!\, ( ФОРМУЛА )                         (формула есть формула в скобках)
4. ЗНАК \Rightarrow\!\, + | - | * | /                          (знак есть плюс или минус или умножить или разделить)
5. ЧИСЛО \Rightarrow\!\, ЦИФРА                                 (число есть цифра)
6. ЧИСЛО \Rightarrow\!\, ЧИСЛО ЦИФРА                           (число есть число и цифра)
7. ЦИФРА \Rightarrow\!\, 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 (цифра есть 0 или 1 или ... 9 )

Начальный нетерминал:

ФОРМУЛА


Вывод:

Выведем формулу (12+5) с помощью перечисленных правил вывода. Для наглядности, стороны каждой замены показаны попарно, в каждой паре заменяемая часть подчеркнута.

ФОРМУЛА \Rightarrow_3\!\, (ФОРМУЛА)
(ФОРМУЛА) \Rightarrow_1\!\, (ФОРМУЛА ЗНАК ФОРМУЛА)
(ФОРМУЛА ЗНАК ФОРМУЛА) {\Rightarrow_4\!\,} (ФОРМУЛА + ФОРМУЛА)
(ФОРМУЛА + ФОРМУЛА) {\Rightarrow_2\!\,} (ФОРМУЛА + ЧИСЛО)
(ФОРМУЛА + ЧИСЛО) {\Rightarrow_5\!\,} (ФОРМУЛА + ЦИФРА)
(ФОРМУЛА + ЦИФРА) {\Rightarrow_7\!\,} (ФОРМУЛА + 5)
(ФОРМУЛА + 5) {\Rightarrow_2\!\,} (ЧИСЛО + 5)
(ЧИСЛО + 5) {\Rightarrow_6\!\,} (ЧИСЛО ЦИФРА + 5)
(ЧИСЛО ЦИФРА + 5) {\Rightarrow_5\!\,} (ЦИФРА ЦИФРА + 5)
(ЦИФРА ЦИФРА + 5) {\Rightarrow_7\!\,} (1 ЦИФРА + 5)
(1 ЦИФРА + 5) {\Rightarrow_7\!\,} (1 2 + 5)


Аналитические грамматики

Порождающие грамматики — не единственный вид грамматик, однако наиболее распространенный в приложениях к программированию. В отличие от порождающих грамматик, аналитическая (распознающая) грамматика задает алгоритм, позволяющий определить, принадлежит ли данное слово языку. Например, любой регулярный язык может быть распознан при помощи грамматики, задаваемой конечным автоматом, а любая контекстно-свободная грамматика — с помощью автомата со стековой памятью. Если слово принадлежит языку, то такой автомат строит его вывод в явном виде, что позволяет анализировать семантику этого слова.

См. также

Источники

  • Гладкий А. В. Формальные грамматики и языки. — М.: Наука, 1973.
  • Касьянов В. Н. Лекции по теории формальных языков, автоматов и сложности вычислений. — Новосибирск: НГУ. — 1995. — 112 с.
  • Хомский Н., Миллер Дж. Введение в формальный анализ естественных языков // Кибернетический сборник / Под ред. А.А.Ляпунова и О.Б.Лупанова. — М.: Мир, 1965.
  • Гросс М., Лантен А. Теория формальных грамматик/ Пер. с фр. — М.: Мир, 1971. — 296 с.



Wikimedia Foundation. 2010.

Смотреть что такое "Формальная грамматика" в других словарях:

  • Формальная грамматика — ФОРМАЛЬНАЯ ГРАММАТИКА. Грамматика, последовательно проводящая принцип изучения только форм языка и исключающая из своего состава все явления, не обозначенные формами языка. Ф. Г. противополагается т. н. логической (название неточное) грамматике,… …   Литературная энциклопедия

  • Формальная грамматика —     ФОРМАЛЬНАЯ ГРАММАТИКА. Грамматика, последовательно проводящая принцип изучения только форм языка и исключающая из своего состава все явления, не обозначенные формами языка. Ф. Г. противополагается т. н. логической (название неточное)… …   Словарь литературных терминов

  • формальная грамматика —    Грамматика, последовательно проводящая принцип изучения только форм языка и исключающая из своего состава все явления, не обозначенные формами языка. Ф. Г. противополагается т. н. логической (название неточное) грамматике, т. е. такой, в… …   Грамматический словарь: Грамматические и лингвистические термины

  • формальная грамматика — см. грамматика формальная (в статье грамматика) …   Словарь лингвистических терминов

  • Формальная грамматика —         в языкознании, одно из средств строгого описания естественных языков; один из разделов математической лингвистики (См. Математическая лингвистика) (см. Грамматика формальная) …   Большая советская энциклопедия

  • Формальная грамматика — Формальная грамматика  см. Математическая лингвистика …   Лингвистический энциклопедический словарь

  • Грамматика формальная — Формальная грамматика или просто грамматика в теории формальных языков способ описания формального языка, то есть выделения некоторого подмножества из множества всех слов некоторого конечного алфавитa. Различают порождающие и распознающие (или… …   Википедия

  • Грамматика (значения) — В Викисловаре есть статья «грамматика» Грамматика (от греч …   Википедия

  • Грамматика составляющих — Генеративная лингвистика …   Википедия

  • Грамматика с фразовой структурой — Эта статья или раздел нуждается в переработке. Пожалуйста, улучшите статью в соответствии с правилами написания статей …   Википедия

Книги

Другие книги по запросу «Формальная грамматика» >>


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»