МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА

математическая дисциплина, предметом к-рой является разработка и изучение понятий, образующих основу формального аппарата для описания строения естественных языков (т. е. метаязыка лингвистики). Возникновение М. л. можно отнести приблизительно к 50-м гг. 20 в.; она была вызвана к жизни прежде всего внутренними потребностями теоретич. лингвистики, в к-рой к этому времени назрела необходимость уточнения основных понятий, а также задачами, связанными с автоматизацией переработки языковой информации (см. Автоматический перевод). В М. л. широко используются методы теории алгоритмов, теории автоматов и алгебры. Сохраняя свое прикладное значение, М. л. постоянно эволюционирует по пути превращения в теоретическую математич. дисциплину, являющуюся по сути дела одним из ответвлений математич. логики. В то же время круг приложений М. л. расширился - ее методы нашли применение в теории программирования.

Лингвистич. концепции, лежащие в основе формальных методов описания строения языка, принадлежат структурной лингвистике. Главнейшая из этих концепций - представление о языке как о "системе чистых отношений", сближающее язык с абстрактными системами, изучаемыми в математике. Это представление конкретизируется в концепции функционирования языка как преобразования нек-рых абстрактных объектов - "смыслов" - в объекты другой природы - "тексты" и обратно. Такая концепция приводит к мысли об изучении указанного преобразования (после уточнения понятий "смысла" и "текста") математич. средствами. Использование этого подхода затруднительно, если пытаться рассматривать преобразование "в целом", ввиду его чрезвычайной сложности, а также ввиду трудности формализации понятия "смысла". Однако содержательные соображения подсказывают расчленение преобразования на этапы. Напр., при одном из наиболее грубых членений нек-рый этап может состоять в переходе от "смыслов" предложений к "синтаксическим структурам без линейного порядка" - наборам элементов предложений, соединенных "синтаксическими связями", но еще не расположенных в линейные последовательности; на следующем этапе получаются линейные последовательности слов, потом они превращаются в цепочки звуков. При более тонких членениях вводятся синтаксич. структуры нескольких уровней, все более отдаляющиеся от "смыслового" и приближающиеся к "текстовому"; "послесинтаксические" этапы также подвергаются дальнейшему расчленению. Такие этапы уже легче описывать математически, уточняя представления об объектах промежуточных уровней и моделируя переходы от одних уровней к другим эффективными отображениями. Правда, рассматриваемое преобразование неоднозначно, и таковы же все или почти все (в зависимости от способа членения) промежуточные этапы; это связано с одной из важнейших особенностей языка - наличием в нем явления синонимии, т. е. возможности выражать одно и то же содержание разными способами. Поэтому приходится строить не детерминированные эффективные системы (алгоритмы), а недетерминированные (исчисления), позволяющие либо для данного объекта нек-рого уровня перечислять отвечающие ему объекты соседнего уровня или объекты (того же уровня), ему синонимичные, либо перечислять множество "правильных" объектов заданного уровня (т. е. таких, к-рые известным регулярным способом сопоставляются объектам предыдущего уровня), либо перечислять множество пар отвечающих друг другу объектов двух заданных соседних уровней (напр., "предложение + его синтаксическая структура") и т. п. Такого рода исчисления известны как грамматики формальные. Одновременно с формальными грамматиками, моделирующими преобразования языковых объектов, возникают конструкции, предназначенные для формального описания самих этих объектов. Кроме того, на множествах объектов одного уровня возникают классификации и отношения, во многом сходные с категориями традиционной грамматики (такими, как часть речи, род, падеж и т. п.) и в ряде случаев совпадающие с ними; без введения таких классификаций и отношений реальное построение формальных грамматик для естественных языков фактически невозможно.

Таким образом, можно выделить три аспекта формального описания языка: описание строения языковых объектов различных уровней, описание нек-рых специальных отношений и классификаций на множествах этих объектов и описание преобразований одних объектов в другие, а также строения множеств "правильных" объектов. Этим аспектам отвечают три основных раздела М. л.: 1) разработка и изучение способов описания строения отрезков речи; 2) изучение лингвистически значимых отношений и классификаций на множествах языковых объектов (построенные для этой цели формальные системы обычно называют аналитическими моделями языка);3) теория формальных грамматик.

Для описания строения отрезков речи используются синтаксич. структуры, представляющие собой графы или биграфы специального вида, обычно с помеченными вершинами и/или дугами. Лучше всего разработана теория описания "поверхностных" уровней (т. е. наиболее далеких от "смыслового"); на этих уровнях структуры обычно являются деревьями. Интенсивно разрабатываются способы описания более "глубинных" уровней. Для этого, в частности, предложен аппарат т. н. лексических функций, играющих при описании смысловой сочетаемости слов роль, сходную с той, к-рую традиционные категории рода, падежа, числа и т. п. играют при описании синтаксич. сочетаемости. Средств строгого описания "смыслового" уровня пока нет, но многим исследователям представляется вероятным, что на таком пути "последовательного приближения" можно надеяться выработать подход к формальному описанию смысла. Это не исключает и иных подходов; в частности, много исследований посвящено способам выражения в естественных языках предикатов, пропозициональных связок, кванторов, "переводу" с формально-логич. языков на естественные и обратно. Сюда же примыкают работы по конструированию так наз. семантических языков, в к-рых смыслы сопоставляются текстам простыми и строго формальными способами.

Аналитич. модели языка важны, в частности, ввиду того, что они позволяют уточнить логич. природу многих понятий и категорий традиционного языковедения. Эти модели не всегда носят характер эффективных процедур, поскольку в них могут входить такие понятия, как (бесконечное) множество грамматически правильных предложений нек-рого языка, считающееся заданным. Однако в ряде моделей все исходные данные представляют собой конечные множества и финитные отношения; в этих случаях входящие в модель процедуры эффективны. К теории аналитич. моделей языка примыкает теория лингвистической д е ш и ф р о в к и: ее предметом является построение процедур, применяемых, подобно аналитич. моделям, к "неупорядоченным" эмпирич. данным о языке, но всегда эффективных и позволяющих получать не только абстрактные определения, но и конкретные сведения о строении конкретных языков (напр., алгоритмы, осуществляющие автоматич. разбиение множества фонем языка на классы гласных и согласных без использования каких-либо сведений о языке, кроме нек-рого достаточно длинного текста).

Теория формальных грамматик занимает в М. л. центральное место, т. к. она позволяет моделировать наиболее существенный аспект функционирования языка - переработку смыслов в тексты и обратно - и благодаря этому служит связующим звеном между остальными разделами М. л. По характеру своего аппарата теория формальных грамматик во многом близка к теории алгоритмов и теории автоматов. Более других разработаны те типы формальных грамматик, к-рые служат для характеризации множества грамматически правильных предложений языка и приписывания этим предложениям синтаксич. структур. Предложения при этом моделируются цепочками (словами) в конечном алфавите, элементы к-рого интерпретируются как слова естественного языка (поэтому в М. л. термин "цепочка" предпочитают термину "слово", а алфавит часто называют также словарем), и моделью множества грамматически правильных предложений служит нек-рый формальный язык. К этому типу относятся, в частности, грамматики порождающие. Порождающая грамматика представляет собой по существу частный случай исчисления Поста: она состоит из конечного алфавита, разделенного на две части - основной и вспомогательный алфавиты, конечного множества правил вывода, представляющих собой правила подстановки вида (- цепочки) и одной аксиомы (обычно состоящей из одного вспомогательного символа, называемого начальны м). (Формальный) язык, порождаемый такой грамматикой,- это множество цепочек в основном алфавите, выводимых из аксиомы. Наиболее важный для лингвистич. приложений класс порождающих грамматик - грамматики составляющих, у к-рых каждое правило имеет вид где - цепочки в объединении основного и вспомогательного алфавитов, А - вспомогательный символ и 6 непуста. Грамматика составляющих позволяет естественным образом сопоставлять цепочкам порождаемого ею языка размеченные системы составляющих. Этот класс грамматик наиболее важен и в чисто математич. отношении, т. к. языки, порождаемые грамматиками составляющих, представляют собой простой и весьма важный подкласс класса примитивно рекурсивных множеств. Среди грамматик составляющих в свою очередь особенно важны как в теоретическом, так и в прикладном аспектах грамматики бесконтекстные, у к-рых правила имеют вид где А - вспомогательный символ. К бесконтекстным грамматикам близки грамматики доминационные, также порождающие формальные языки, но сопоставляющие цепочкам этих языков деревья подчинения, и грамматики категориальные, характеризующиеся особым способом задания информации о синтаксич. свойствах слов. Принципиально иной тип формальных грамматик представляют собой грамматики трансформационные;. они служат для осуществления преобразований синтаксич. структур, не "привязанных", вообще говоря, К цепочкам; эти грамматики представляются наиболее перспективными для описания строения естественных языков, т. к. позволяют рассматривать синтаксические и линейные отношения между словами раздельно, что лучше отражает языковую реальность.

Теория формальных грамматик наряду с "традиционными" для нее лингвистич. приложениями нашла применение в теории программирования для описания языков программирования и трансляторов. Особенно широко применяются для этих целей бесконтекстные грамматики, но используются и грамматики более общего вида.

Лит.:[1] Xомский Н., в кн.: Новое в лингвистике, в. 2, М., 1962, с. 412-527; [2] Гладкий А. В., Мельчук И. А., Элементы математической лингвистики, М., 1969.

А. В. Гладкий.



Математическая энциклопедия. — М.: Советская энциклопедия. . 1977—1985.

Игры ⚽ Поможем сделать НИР

Полезное


Смотреть что такое "МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА" в других словарях:

  • Математическая лингвистика —         математическая дисциплина, разрабатывающая формальный аппарат для описания строения естественных и некоторых искусственных языков. Возникла в 50 х годах 20 века в связи с назревшей в языкознании потребностью уточнения его основных понятий …   Большая советская энциклопедия

  • МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА — математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков …   Большой Энциклопедический словарь

  • МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА — МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА. Смежная для методики обучения языкам наука; раздел лингвистики, использующий математические методы исследования языка и речи. Данные М. л. применяются для проведения экспериментов в методике …   Новый словарь методических терминов и понятий (теория и практика обучения языкам)

  • Математическая лингвистика — (также вычислительная лингвистика или компьютерная лингвистика)  направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков. Компьютерная лингвистика частично… …   Википедия

  • математическая лингвистика — математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков. * * * МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА, математическая дисциплина,… …   Энциклопедический словарь

  • математическая лингвистика — 1. Изучает особенности семиотического и математического моделирования естественного языка (и речи) с целью перевода информации, содержащейся в неформализованном виде в тексте, на формализованный искусственный язык (например, на некоторый… …   Толковый переводоведческий словарь

  • Математическая лингвистика — Математическая лингвистика  математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков. Возникла в 50‑х гг. 20 в.; одним из главных стимулов появления… …   Лингвистический энциклопедический словарь

  • МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА — матем. дисциплина, предметом к рой является разработка формального аппарата для описания строения естественных и нек рых искусств, языков …   Естествознание. Энциклопедический словарь

  • математическая лингвистика — Отрасль языкознания, занимающаяся изучением возможностей применения математических методов к изучений и описанию языка …   Словарь лингвистических терминов

  • математическая лингвистика — Направление, возникшее в XX в. на стыке языкознания, математики и математической логики и занимающееся разработкой формального аппарата описания языка, применяемого в частности, в диалоге человек – ЭВМ …   Словарь лингвистических терминов Т.В. Жеребило


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»