Национальный корпус русского языка

Национальный корпус русского языка

Национа́льный ко́рпус ру́сского языка́ — общедоступный для поиска электронный онлайновый корпус русских текстов. Открыт 29 апреля 2004 в Интернете по адресу http://ruscorpora.ru/.

Содержание

[править] Составители

Работы по созданию Корпуса были начаты в 2001 году группой лингвистов из Москвы, Петербурга, Воронежа и других городов.

В программе по созданию Национального корпуса русского языка участвуют специалисты следующих организаций[1]:

Сайт Корпуса и поиск по нему поддерживаются компанией «Яндекс», сотрудники которой принимали участие также в разработке программного обеспечения Корпуса. Доступ к ресурсам НКРЯ бесплатен.

[править] Состав корпуса

В Корпус входят как письменные тексты (художественные, мемуары, публицистика, научная, религиозная литература, повседневная печатная продукция), так и записи устных текстов (публичной речи и частных бесед). В корпус также входят подкорпуса поэтических и диалектных текстов, а также русско-английский корпус параллельных текстов. Объём корпуса на январь 2007 года составил 140 млн словоупотреблений.

Тексты снабжены морфологической и семантической разметкой.

[править] См. также

[править] Примечания

[править] Литература

  • Национальный корпус русского языка: 2003—2005. Сборник статей. М.: Индрик, 2005. ISBN 5-85759-358-1

[править] Ссылки

Официальный сайт


Источник — «%D0%9D%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9 %D0%BA%D0%BE%D1%80%D0%BF%D1%83%D1%81 %D1%80%D1%83%D1%81%D1%81%D0%BA%D0%BE%D0%B3%D0%BE %D1%8F%D0%B7%D1%8B%D0%BA%D0%B0»

<< назад   вперед >>