POS tagging

POS tagging

POS tagging (part-of-speech tagging, частеречная разметка) - этап автоматической обработки текста, задачей которого является определение части речи и грамматических характеристик слов в тексте (корпусе) с приписыванием им соответствующих тегов. POS tagging является одним из первых этапов компьютерного анализа текста.

Алгоритмы POS tagging делятся на две группы: основанные на правилах и вероятностные.

Использование скрытой марковской модели


Wikimedia Foundation. 2010.

Игры ⚽ Поможем написать курсовую

Полезное


Смотреть что такое "POS tagging" в других словарях:

  • pos tagger — noun a tagging program whose labels indicate a word s part of speech • Syn: ↑part of speech tagger • Hypernyms: ↑tagger, ↑tagging program …   Useful english dictionary

  • tagging program — noun a computer program that attaches labels to the grammatical constituents of textual matter • Syn: ↑tagger • Hypernyms: ↑program, ↑programme, ↑computer program, ↑computer programme • Hyponyms: ↑ …   Useful english dictionary

  • Part-of-speech tagging — (POS tagging or POST), also called grammatical tagging or word category disambiguation, is the process of marking up the words in a text as corresponding to a particular part of speech, based on both its definition, as well as its context i.e.,… …   Wikipedia

  • Part-of-speech tagging — (POS tagging o POST), también llamado etiquetado gramatical, es el proceso de asignar (o etiquetar) a cada una de las palabras de un texto su categoría gramatical. Este proceso se puede realizar en base a la definición de la palabra o el contexto …   Wikipedia Español

  • Word-sense disambiguation — Disambiguation redirects here. For other uses, see Disambiguation (disambiguation). In computational linguistics, word sense disambiguation (WSD) is an open problem of natural language processing, which governs the process of identifying which… …   Wikipedia

  • Text corpus — In linguistics, a corpus (plural corpora ) or text corpus is a large and structured set of texts (now usually electronically stored and processed). They are used to do statistical analysis and hypothesis testing, checking occurrences or… …   Wikipedia

  • Разрешение лексической многозначности — Необходимо проверить качество перевода и привести статью в соответствие со стилистическими правилами Википедии. Вы можете помочь …   Википедия

  • Grundformenreduktion — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf… …   Deutsch Wikipedia

  • Normalformenreduktion — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf… …   Deutsch Wikipedia

  • Stammformreduktion — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf… …   Deutsch Wikipedia


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»