Метод Леска

Метод Леска

Алгоритм Леска — классический алгоритм разрешения многозначности, основанный на знаниях, предложенный Майклом Леском в 1986 году.

Содержание

Принцип работы

Для каждого значения рассматриваемого слова подсчитывается число слов упомянутых как в словарном определении данного значения, так и в ближайшем контексте рассматриваемого вхождения слова. В качестве наиболее вероятного значения выбирается то, для которого такое пересечение оказалось больше. В качестве слов Lesk рассматривал буквенные цепочки, что оправданно для английского языка.

В качестве примера можно рассмотреть два значения слова кошка:

  1. кошка1 — домашнее животное из породы кошачьих,
  2. кошка2 — предмет альпинистского снаряжения.

и текст «в Китае выведены новые породы кошек». С определением (1) у этого текста одно общее слово — породы, а с определением (2) ни одного. Следовательно, алгоритм Леска выберет значение кошка1.

Работы

В последнее время появилось большое количество работ, предлагающих использовать модификации алгоритма Леска. В этих работах выдвигаются идеи, связанные с дополнительным использованием различных словарей (тезаурусы, словари синонимов) или моделей (морфологические, синтаксические и т. п.), см., например[1]:

  • Kwong, 2001;
  • Nastase and Szpakowicz, 2001;
  • Wilks and Stevenson, 1998, 1999;
  • Mahesh et al., 1997;
  • Cowie et al., 1992;
  • Yarowsky, 1992;
  • Pook and Catlett, 1988;
  • Kilgarriff & Rosensweig, 2000,
  • Alexander Gelbukh, Grigori Sidorov, 2004.

Точность метода

Относительно больших экспериментов на проверку этого метода не проводилось, кроме как на корпусе книги «Гордость и предубеждение» и газеты Associated Press. Результат варьировался от 50 % до 70 %.

Примечания

  1. Необходимо заметить, что все эти работы, кроме (Nastase and Szpakowicz, 2001), ориентированы на обработку обычных текстов, а не словарей, и ни одна не использует в качестве материала для обработки именно толковый словарь. Кроме того, практически всегда дело ограничивается достаточно небольшими экспериментами и не производится обработка достаточно больших массивов данных.

Wikimedia Foundation. 2010.

Игры ⚽ Нужен реферат?

Полезное


Смотреть что такое "Метод Леска" в других словарях:

  • Разрешение лексической многозначности — Необходимо проверить качество перевода и привести статью в соответствие со стилистическими правилами Википедии. Вы можете помочь …   Википедия

  • Язь —         Leuciscus (L.)          Это, бесспорно, одна из наиболее известных рыб. Язь легко отличается своим толстым телом, довольно широкой, укороченной головой, маленьким косым ртом и цветом плавников. Всего более походит он на голавля, но у… …   Жизнь и ловля пресноводных рыб

  • Форель —         Salmo truta morpha fario L.          Эта рыба имеет в Европейской России гораздо большее распространение, нежели предыдущий вид. Впрочем, распространение форели заметно суживается: возрастающее население мало помалу вытесняет ее, и она… …   Жизнь и ловля пресноводных рыб

  • Мирон-усач —         Barbus barbus (L.)          Вероятно, весьма многие вовсе не слыхали об этой рыбе. Мирон встречается только в западной и южной России и вовсе не известен ни в бассейне Волги, а тем более в северных губерниях. Правда, с давнего времени… …   Жизнь и ловля пресноводных рыб

  • Щука —         Esox lucius L.          По своей хищности, повсеместному распространению и величине, в которой уступает только далеко не столь многочисленному сому, щука, несомненно, составляет одну из наиболее замечательных и наиболее известных… …   Жизнь и ловля пресноводных рыб

  • Карп —         Cyprinus carpio L.          По своей величине и значению для рыболовов и рыболовов охотников карп, бесспорно, занимает первое место между всеми рыбами своего семейства, которое получило от него название. Но в промысловом отношении,… …   Жизнь и ловля пресноводных рыб

  • Голавль —         Leuciscus cephalus (L.)          От других сродных с ним рыб голавль легко отличается своей толстой широколобой головой, почти цилиндрическим туловищем и крупной чешуей. Молодые голавлики, правда, часто смешиваются с ельцами, но их можно… …   Жизнь и ловля пресноводных рыб

  • Спиннинг — Спиннинговый заброс …   Википедия

  • Бомбарда (рыболовная) — Бомбарда или Сбирулино (от итал. Bombarda миномёт; бомбомёт или итал. Bombetta небольшая авиационная бомба) элемент рыболовной оснастки, утяжелитель оснастки для дальнего заброса легких приманок и метод ловли (т.н. ловля на бомбарду, бомбетту,… …   Википедия

  • Троллинг (рыбная ловля) — У этого термина существуют и другие значения, см. Троллинг (значения). Троллинг …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»