- Национальный корпус русского языка
-
Национальный корпус русского языка URL: Коммерческий: нет
Тип сайта: образовательный/научный проект
Регистрация: Нет
Язык(и): русский/английский
Расположение сервера: Начало работы: Текущий статус: Работает
Национа́льный ко́рпус ру́сского языка́ — общедоступный для поиска электронный онлайновый корпус русских текстов. Открыт 29 апреля 2004 года в Интернете по адресу http://ruscorpora.ru/.
Содержание
Составители
Работы по созданию Корпуса были начаты в 2001 году группой лингвистов из Москвы, Санкт-Петербурга, Воронежа и других городов.
В программе по созданию Национального корпуса русского языка участвуют специалисты следующих организаций[1]:
- Институт русского языка имени В. В. Виноградова (ИРЯ РАН)
- Институт языкознания РАН (ИЯз РАН)
- Институт проблем передачи информации им. А. А. Харкевича РАН (ИППИ РАН),
- Институт лингвистических исследований РАН (ИЛИ РАН) в Санкт-Петербурге (совместно с Санкт-Петербургским государственным университетом (СПбГУ)).
- Воронежский государственный университет.[2].
Сайт Корпуса и поиск по нему поддерживаются компанией «Яндекс», сотрудники которой принимали участие также в разработке программного обеспечения Корпуса. Доступ к ресурсам НКРЯ бесплатен.
Состав корпуса
В Корпус входят как письменные тексты (художественные, мемуары, публицистика, научная, религиозная литература, повседневная печатная продукция), так и записи устных текстов (публичной речи и частных бесед).
В корпус также входят подкорпуса поэтических и диалектных текстов, корпуса параллельных текстов (для следующих языков доступны параллельные корпуса с русским: английский, немецкий, украинский, белорусский; размещены также 10 многоязычных текстов, переведённых на 10-20 языков каждый), отдельный газетный корпус (материалы СМИ начала XXI века), церковнославянский корпус (богослужебных тексты, современные (XIX-XX век) и более ранних периодов), синтаксический, акцентологический, мультимедийный и обучающий подкорпуса. Объём основного корпуса на январь 2012 года составляет 209 млн словоупотреблений, а общий объем корпусов – 364 млн словоупотреблений.
Тексты снабжены морфологической и семантической разметкой.
См. также
Примечания
Литература
- Национальный корпус русского языка: 2003—2005. Сборник статей. М.: Индрик, 2005. ISBN 5-85759-358-1
- Национальный корпус русского языка : 2006—2008. Новые результаты и перспективы. / Отв. ред. В. А. Плунгян. — СПб.: Нестор-История, 2009. — 502 с. ISBN 978-5-98187-327-0
- Плунгян В.А. Зачем мы делаем Национальный корпус русского языка? // Отечественные записки. 2005. № 2.
Ссылки
Категории:- Сайты по алфавиту
- Сайты, появившиеся в 2004 году
- Русский язык
- Корпусная лингвистика
- Лингвистические сайты
Wikimedia Foundation. 2010.