Нормальная форма Хомского

Нормальная форма Хомского

Нормальная форма Хомского в информатике.

В информатике говорят, что формальная грамматика находится в нормальной форме Хомского, если все её продукции имеют вид

A\rightarrow\, BC или
A\rightarrow\, α или
S\rightarrow\, ε

где A, B и C — нетерминалы, α — терминальный символ (представляющий постоянное значение), S — начальный символ, и ε — пустая строка. Также ни B, ни C не может быть начальным символом.

Каждая грамматика в нормальной форме Хомского является контекстно-свободной, и наоборот, каждая контекстно-свободная грамматика может быть эффективно преобразована в эквивалентную грамматику в нормальной форме Хомского.

За исключением возможного правила S \rightarrow\, ε (используемого, когда грамматика может порождать пустую строку), все правила грамматики в нормальной форме Хомского неукорачивающие; то есть, в процессе вывода строки каждая цепочка из терминалов и нетерминалов всегда имеет либо ту же длину, что и предыдущая, либо на один элемент больше. Вывод строки длины n всегда занимает ровно 2n-1 шагов. Кроме того, так как все правила вывода нетерминалов переводят один нетерминал в ровно один терминал или в ровно два нетерминала, дерево разбора, основанное на грамматике в нормальной форме Хомского, составляет собой бинарное дерево, высота которого ограничена длиной строки.

Благодаря этим свойствам, многие доказательства в теории формальных языков и вычислимости используют нормальную форму Хомского. Эти свойства также служат основой различных эффективных алгоритмов — например, CYK-алгоритм, определяющий, может ли данная строка порождаться данной грамматикой, использует нормальную форму Хомского.

Нормальная форма Хомского названа по имени Ноама Хомского, американского лингвиста, предложившего иерархию Хомского.

Альтернативное определение

Некоторые источники определяют нормальную форму Хомского несколько иначе.

Формальная грамматика находится в нормальной форме Хомского, если все её продукции имеют вид

A \rightarrow\, BC или
A \rightarrow\, α

где A, B и C — нетерминалы, и α — терминальный символ. При использовании такого определения B и C могут быть начальными символами.

Это определение отличается от предыдущего, так как исключает возможность порождения пустой строки ε. По прежнему справедливо, что любая контекстно-свободная грамматика, порождающая язык L, может быть эффективно преобразована в нормальную форму Хомского, порождающую L-\{\epsilon\}. Принципиальное преимущество последнего определения в том, что доказательства в целом немного упрощаются, так как каждый шаг вывода никогда не уменьшает длину результирующей строки. Разумеется, его недостаток состоит в том, что требуется отдельное рассмотрение случая, когда грамматика порождает ε.

Список литературы

  • Michael Sipser Introduction to the Theory of Computation. — PWS Publishing, 1997. — ISBN 0-534-94728-X (Pages 98-101 of section 2.1: context-free grammars. Page 156.)
  • John Martin Introduction to Languages and the Theory of Computation. — McGraw Hill, 2003. — ISBN 0-07-232200-4 (Pages 237—240 of section 6.6: simplified forms and normal forms.)
  • John E. Hopcroft and Jeffrey D. Ullman, Introduction to Automata Theory, Languages and Computation, Addison-Wesley Publishing, Reading Massachusetts, 1979. ISBN 0-201-02988-X. (See chapter 4.)
  • Michael A. Harrison Introduction to Formal Language Theory. — Addison-Wesley, 1978. — ISBN 978-0201029550 (Pages 103—106.)

Wikimedia Foundation. 2010.

Игры ⚽ Нужна курсовая?

Полезное


Смотреть что такое "Нормальная форма Хомского" в других словарях:

  • нормальная форма Хомского — — [http://www.iks media.ru/glossary/index.html?glossid=2400324] Тематики электросвязь, основные понятия EN Chomsky normal form …   Справочник технического переводчика

  • Хомский, Ноам — В Википедии есть статьи о других людях с такой фамилией, см. Хомский. Ноам Хомский Noam Chomsky …   Википедия

  • КОГЕН — (Cohen) Герман (1842 1918) немецкий философ, основатель и виднейший представитель марбургской школы неокантианства. Основные работы: ‘Теория опыта Канта’ (1885), ‘Обоснование Кантом этики’ (1877), ‘Обоснование Кантом эстетики’ (1889), ‘Логика… …   История Философии: Энциклопедия

  • ПАРАДИГМА —         образец или модель. Как особый термин понятие П. введено амер. методологом науки Т. Куном в кн. “Структура научных революций” (1962) для обозначения преобладающих в деятельности опр. научного сооб ва проблем и решений.         П.… …   Энциклопедия культурологии

  • ЯЗЫК — сложная развивающаяся семиотическая система, являющаяся специфическим и универсальным средством объективации содержания как индивидуального сознания, так и культурной традиции, обеспечивая возможность его интерсубъективности, процессуального… …   История Философии: Энциклопедия

  • ЯЗЫК — сложная развивающаяся семиотическая система, являющаяся специфическим и универсальным средством объективации содержания как индивидуального сознания, так и культурной традиции, обеспечивая возможность его интерсубъективности, процессуального… …   История Философии: Энциклопедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»