НКРЯ Национальный корпус русского языка @ruscorpora Channel on Telegram

НКРЯ Национальный корпус русского языка

@ruscorpora


Канал об обновлениях, пополнениях и советах по работе с НКРЯ не только для лингвистов, но и для всех интересующихся русским языком.
Сайт Корпуса http://ruscorpora.ru

НКРЯ Национальный корпус русского языка (Russian)

Добро пожаловать на официальный канал НКРЯ - Национального корпуса русского языка! Наш канал с названием "ruscorpora" предназначен для всех, кто интересуется русским языком - от студентов и преподавателей до профессиональных лингвистов. Здесь вы найдете информацию об обновлениях, пополнениях и советах по работе с НКРЯ, одним из самых авторитетных источников данных о русском языке. Подписывайтесь на наш канал, чтобы быть в курсе всех изменений и улучшений в работе с Национальным корпусом русского языка. Для дополнительной информации посетите наш сайт: http://ruscorpora.ru

НКРЯ Национальный корпус русского языка

10 Jan, 14:16


Первые рабочие дни этого года подходят к концу. Предлагаем провести выходные с пользой и погрузиться в мир новых знаний и исторических открытий. Мы подготовили для вас подборку увлекательных материалов о Корпусе и не только:

Берестяные грамоты — 2024: дело о похищенной невесте, вдова и ее друг, а также совет удавиться. Ежегодный репортаж Дмитрия Сичинавы об уникальных находках и исторических фактах, связанных с ними.

Разметка по правилам: как Национальный корпус русского языка помогает изучать орфографию. Эллина Куцевал, создательница алгоритма разметки сложных мест русской орфографии, рассказывает, как Национальный корпус русского языка помогает изучать орфографию.

Сборник материалов международной научной конференции, посвященной 20-летию Национального корпуса русского языка. В сборник включены материалы по самым разным темам – от обзоров актуального состояния отдельных корпусов НКРЯ и применения инструментов обработки естественного языка на базе машинного обучения при разработке корпусов до использования НКРЯ в преподавании и исследовательской деятельности в школе и университете.

НКРЯ Национальный корпус русского языка

31 Dec, 14:31


Поздравляем вас с наступающим Новым годом!

Пусть 2025 год принесёт вам как можно больше светлых и радостных событий!

НКРЯ Национальный корпус русского языка

28 Dec, 14:07


В последний рабочий день уходящего года по традиции команда Национального корпуса русского языка подводит итоги и вспоминает, что нового произошло за год.

В 2024 году Корпус увеличился более чем на 109 миллионов слов. Во многих корпусах появились поисковые и статистические инструменты, доступные ранее только в Основном, Газетном и других «передовых» корпусах.

Мы надеемся, что на этой картинке каждый найдет для себя инструменты, которые сделают работу с Корпусом ещё более продуктивной и приятной. Пусть Новый год принесёт вам множество интересных открытий и вдохновляющих находок!

Отдельную благодарность мы выражаем создателям Корпуса чувашского языка, Открытого корпуса вепсского и карельского языков (ВепКар), Электронного корпуса хакасского языка за плодотворное сотрудничество.

С самыми тёплыми пожеланиями в Новом году,
Команда Национального корпуса русского языка

НКРЯ Национальный корпус русского языка

25 Dec, 10:04


В Региональном корпусе обновлена разметка ключевых слов в текстах. Использование ключевых слов облегчает анализ узких тематических категорий и помогает ориентироваться в текстах разных тематик.

Для разметки использовалась модель T-lite-instruct-0.1, обученная на материалах корпуса. Новые ключевые слова содержат меньше ошибок нормализации и грамматических ошибок, а также более точно описывают тематику текста. Как и раньше, одно ключевое слово может состоять из однословного ключа (похолодание, гололед) либо из двусловного сочетания (таяние снега). По однословному запросу (община) находится как точное соответствие, так и двусловные сочетания с этим словом (сельская община). Для каждого текста сгенерировано от 5 до 10 ключевых слов, которые упорядочены по значимости.

НКРЯ Национальный корпус русского языка

25 Dec, 09:09


В Диалектный корпус добавлены новые тексты объемом примерно 100 тыс. словоупотреблений. Новые тексты представляют говоры севера (Архангельская область, Карелия, Коми), Поволжья (большая хрестоматия диалектов Нижегородской области) и юга (Смоленская, Калужская области, молокане Кавказа). В пополнение входят как записи дореволюционного времени и 30-х годов, так и материалы недавних экспедиций. Добавлено несколько сот аудио- и десять кинозаписей, на которых можно не только услышать диалект, но и увидеть, как на севере смолят лодку, а в Азербайджане разводят пчел.

НКРЯ Национальный корпус русского языка

19 Dec, 17:31


Уже завтра состоится открытие Конференции, посвященной 20-летию Национального корпуса русского языка!

В течение двух дней участники мероприятия обсудят широкий круг вопросов – от корпусных методов лингвистических исследований и достоверности корпусных данных до вопросов создания корпусов и разработки пользовательского интерфейса, от применения нейросетевых моделей в подготовке корпусных данных до использования НКРЯ в преподавании гуманитарных дисциплин в университете и в школе.

Мероприятия пройдут очно в Инстиуте русского языка РАН по адресу: ул. Волхонка, 18/2.

Программу конференции можно найти на сайте института.

Предусмотрена онлайн-трансляция пленарных докладов по ссылке.

НКРЯ Национальный корпус русского языка

05 Dec, 08:39


Чтобы лучше понять, как вы используете Национальный корпус русского языка для решения своих задач, и сделать Корпус еще удобнее и понятнее, мы запускаем исследование аудитории.

Первый этап исследования — это интервью с пользователями. Если вы применяете Корпус в работе, учебе или другой деятельности, мы будем рады услышать ваше мнение. Чтобы принять участие в интервью, заполните небольшую форму: https://forms.yandex.ru/u/675159c7f47e738d9a20e5fc/

После отправки формы наш менеджер свяжется с вами для согласования удобной даты и времени для интервью. Видеозвонок пройдет в Zoom и займет 30–40 минут.

Ваше мнение поможет нам улучшить сервис и лучше учитывать потребности наших пользователей!

НКРЯ Национальный корпус русского языка

03 Dec, 13:51


Рады сообщить о важном обновлении формы поиска на сайте Национального корпуса русского языка! Теперь пользователи могут добавлять слова перед Словом 1, что значительно упрощает составление и редактирование сложных запросов.

Ранее добавлять слова можно было только справа от Слова 1 и последующих слов. Например, если вы искали конструкцию вида «прилагательное + местоимение + дорога», задав синтаксические отношения между этими словами, но затем решили искать вариант «союз + прилагательное + местоимение + дорога», вам пришлось бы пересобирать запрос с нуля. Теперь всё проще: достаточно нажать кнопку «+» слева от Слова 1 и указать любой признак, например «союз».

Обратите внимание: принцип расчета расстояния между словами остался неизменным. Расстояние всегда задаётся слева направо: от нового Слова 1 до исходного Слова 1, а затем — к последующим словам.

НКРЯ Национальный корпус русского языка

03 Dec, 12:57


В Параллельном корпусе НКРЯ появились новые функции, которые сделают работу с ним более удобной.

В японском языке в форме поиска на двух языках появилось поисковое поле «‎Семантика»‎. Японский стал первым иностранным языком в НКРЯ, в котором размечена семантика.

В карельском, вепсском, чувашском, хакасском корпусах расширены возможности настройки подкорпуса. Пользователи смогут отбирать тексты по жанру и типу (для всех перечисленных языков), а также по теме текста (в чувашском корпусе). Для всех параллельных корпусов доступна возможность отбирать подкорпус по количеству словоформ, что полезно при анализе текстов разного объёма.

Результаты поиска теперь можно сортировать с помощью шести новых типов сортировки: по дате создания текста на русском или иностранном языке от старых текстов к новым и наоборот, при условии, что оригиналы и переводы рассматриваются вместе или отдельно. Новые сортировки помогут быстрее находить нужную информацию и лучше структурировать данные.

НКРЯ Национальный корпус русского языка

03 Dec, 11:54


В Поэтический корпус добавлены тексты четырех поэтов — Вадима Шефнера, Роберта Рождественского, Льва Лосева и Марии Степановой. Объем пополнения — 200 тысяч слов, 2 тысячи текстов, 44 тысячи стихотворных строк. А всего в корпусе строк почти 3 миллиона.

В корпусе появилась возможность искать слово в начале и конце строки. Так, можно определить, что характерные поэтизмы ужель или вотще чаще встречаются в начале строчки, чем в какой-то другой позиции стиха.

НКРЯ Национальный корпус русского языка

03 Dec, 10:58


Основной корпус НКРЯ пополнен на 15 млн слов, представляющих несколько тематических коллекций: это пьесы разных эпох, официально-деловые тексты, научные журналы, естественнонаучные справочники XVIII в., массовая литература — например, как дореволюционные, так и постсоветские любовные романы, — и многое другое.

Во всех текстах корпуса автоматически снята грамматическая омонимия и добавлена разметка синтаксических отношений. Для разметки была использована обновленная версия нейросетевой модели РуБик, что позволило существенно улучшить лемматизацию слов. На тестовом наборе данных процент ошибочных лемм в корпусе снизился с 4,24% до 1,39%. Пожалуйста, сообщайте нам о встречающихся ошибках в автоматической разметке слов. Чтобы сделать это, выделите слово и во всплывающем окне нажмите «Сообщить об ошибке».

Рядом с некоторыми примерами в Корпусе появились поля синего цвета с указанием имени субъекта прямой речи (персонажа пьес или говорящего в устном тексте). Если кликнуть по этому полю, доступна разметка пола, возраста, года рождения, профессии и/или амплуа персонажа или, соответственно, говорящего.

Приведены в соответствие морфемная разметка при поиске по словообразовательным признакам и в Портрете слова. Для слов, отсутствующих в Словаре морфемного анализа НКРЯ, морфемные разборы сгенерированы при помощи нейросетевой модели. Расширен словарь и улучшена его согласованность. Слова, разборы для которых сгенерированы нейросетью, теперь тоже участвуют в поиске по словообразовательной структуре, а морфемный разбор слова доступен и в карточке слова.

НКРЯ Национальный корпус русского языка

22 Nov, 09:38


С главной страницы Корпуса пользователи могут перейти в раздел «‎НКРЯ в школе»‎. В нём можно найти полезные материалы и инструменты, которые помогут разнообразить, а в чем-то и облегчить преподавание гуманитарных предметов:

🔹Обучающий корпус НКРЯ,
🔹готовые упражнения по различным темам для учащихся 5-11 классов,
🔹методические материалы, 
🔹конструктор исследовательских и творческих проектов и упражнений.

Подробнее об этих материалах – в карточках. Сохраняйте их и используйте НКРЯ в школе!

НКРЯ Национальный корпус русского языка

19 Nov, 11:44


Русский МультиПАРК пополнен почти до 300 тыс. словоформ. Добавлена пьеса А.П. Чехова «‎Три сестры»‎ в постановках четырех разных театров: Государственного академического Малого театра, МХАТа им. М. Горького, Московского театра «Мастерская П. Фоменко», театра «Современник».

Русский МультиПАРК дает возможность сопоставительного изучения одной и той же реплики, произнесенной разными говорящими в одинаковых обстоятельствах. Сопоставление разных произнесений одной и той же фразы позволяет определить, какие интонационные, структурные, фонетические, жестовые особенности этой фразы являются обязательными, воспроизводимыми всеми говорящими, а какие — уникальными или случайными.

C материалами о составе корпуса и возможностях, которые он предоставляет, вы можете ознакомиться на сайте.

НКРЯ Национальный корпус русского языка

18 Nov, 10:32


Занимательное явление в поэзии — совпадение строк у разных авторов. Иногда оно происходит случайно, иногда вызвано общими мотивами, образами или культурным контекстом, а порой является намеренным заимствованием. Одним из самых известных примеров такой переклички является сочетание «самых честных правил», которое открывает известный роман А.С. Пушкина.

По воспоминаниям А. П. Керн, Пушкин услышал эту фразу на одном из её приёмов, где присутствовал И. А. Крылов. Во время игры в фанты Крылову выпало задание сидеть под столом до тех пор, пока он не сочинит басню. Именно тогда, якобы, впервые прозвучала строка «‎Осел был самых честных правил!»‎. Она так понравилась Пушкину, что он решил включить её в своё произведение, намекая таким образом на характер дяди Онегина.

Хотите проверить свою эрудицию? Попробуйте угадать (или ответить наверняка, используя поиск точных форм в Поэтическом корпусе НКРЯ), у каких авторов встречаются одинаковые строки, и откройте для себя ещё больше поэтических пересечений.

НКРЯ Национальный корпус русского языка

15 Nov, 10:33


Справочно-информационному порталу «Грамота.ру» исполнилось 24 года!

Этот портал стал уникальным источником сведений о русском языке для самых разных пользователей. Его главная миссия — предоставлять актуальную и авторитетную информацию о современном русском языке, включая нормы и правила, стили и сферы использования.

Мы поздравляем коллег с этой важной датой и желаем дальнейшего развития и процветания!

На сайте «Грамота.ру» в разделе «Журнал» вы найдете новости, научно-популярные статьи, интервью с ведущими российскими лингвистами, обзоры книг, лекций и журналов, а также увлекательные тесты. Например, вы можете проверить свою грамотность и узнать, готовы ли вы к работе корректором. Задания для этого теста составлены на основе корпуса «Русская классика» НКРЯ.

Другие интересные тесты ждут вас в разделе «Публикации» на нашем сайте.

НКРЯ Национальный корпус русского языка

13 Nov, 13:13


Национальный корпус русского языка – не только незаменимый инструмент для научных исследований, но и полезный ресурс в школьном обучении.

Для учителей русского языка и литературы, школьников и их родителей Яндекс Образование совместно с Национальным корпусом русского языка разработали конструктор исследовательских и творческих проектов и упражнений.

Конструктор содержит как полностью разобранные примеры исследований, творческих проектов и упражнений, так и идеи для создания собственных:
— какие темы предложить ученикам,
— как внедрить исследовательскую работу в уроки,
— как собирать данные с помощью Корпуса.

Конструктор предполагает модульность: вы можете выбирать разные темы, формулировать исследовательские вопросы по-новому или менять формат представления результатов. В общей сложности конструктор включает более 45 идей и готовых проектов и заданий для уроков русского языка и литературы.

Глава об исследовательских проектах уже доступна. Главы, посвященные организации творческих проектов и составлению упражнений, будут открыты позже — мы обязательно сообщим об этом.

НКРЯ Национальный корпус русского языка

11 Nov, 10:08


13 ноября состоится пятая ежегодная конференция Яндекса о людях и технологиях в образовании

На сцене выступят исследователи, преподаватели и разработчики, которые обсудят будущее образовательной сферы.

Одной из тем обсуждения в Студии станет использование Национального корпуса русского языка в обучении. Мария Аристова — учитель русского языка, руководитель лингвистического профиля школы «Летово» и директор Летней лингвистической школы — расскажет, как НКРЯ может обогатить школьные занятия и помочь в освоении русского языка.

Регистрируйтесь по ссылке, чтобы не пропустить событие!

НКРЯ Национальный корпус русского языка

06 Nov, 10:30


Национальный корпус русского языка — это мощный инструмент для анализа и исследования языка. В нем собраны миллионы текстов, которые позволяют пользователям Корпуса лучше понять язык во всех его многообразных проявлениях. Один из важнейших аспектов работы с корпусом — анализ статистических данных.

Сводная статистика НКРЯ доступна с главной страницы сайта. В этом разделе содержится информация об объеме входящих в НКРЯ корпусов в текстах, предложениях и словоупотреблениях, а также таблицы с распределением текстов Основного корпуса по видам и другим метапризнакам.

Кликнув на название корпуса в таблице, вы можете перейти к статистике в Портрете выбранного корпуса. Перейти к статистике корпуса также можно из формы поиска по корпусу, кликнув на значок (i). Сейчас статистика корпуса доступна для Основного, Обучающего, Газетных корпусов, некоторых исторических корпусов, а также корпусов «‎Русская классика»‎ и «‎От 2 до 15».

В корпусах с расширенной статистикой также доступно сравнение пользовательского подкорпуса с целым корпусом. Для просмотра сравнительных данных нажмите на значок (i) в шапке подкорпуса.

НКРЯ Национальный корпус русского языка

06 Nov, 09:13


Параллельный корпус пополнен на 3 млн слов. Половина этого объема приходится на англоязычные нехудожественные (научно-популярные и публицистические) тексты. Кроме того, пополнены, в основном художественными произведениями, испанская и немецкая языковые пары.

В трех языковых парах, включающих записи устных текстов — вепсской, карельской и хакасской — доступен отбор подкорпуса по диалекту.

НКРЯ Национальный корпус русского языка

25 Oct, 13:20


21 декабря в рамках Конференции, посвященной 20-летию Национального корпуса русского языка, состоятся круглые столы и мастер-классы по следующим темам:

🔹НКРЯ в преподавании русского языка и литературы
🔹Корпусные платформы для корпусов разного типа
🔹Корпусные методы в исследовании языковых контактов
🔹Корпус как исследовательский инструмент: как его собрать и почему ему можно доверять?
🔹Новые инструменты НКРЯ: формат выдачи «Частотность» и новые графики диахронической статистики
🔹Новые инструменты НКРЯ: как использовать новые функции для популяризации корпуса

Подробнее ознакомиться с содержанием круглых столов и мастер-классов вы можете на сайте Института русского языка.

Зарегистрироваться на мероприятия в качестве слушателя можно по этой ссылке. Если вы хотите выступить на круглом столе или мастер-классе, оформите тезисы или аннотацию своего выступления в соответствии с требованиями, изложенными в информационном письме № 2, и отправьте их через общую регистрационную форму до 10 ноября.

НКРЯ Национальный корпус русского языка

15 Oct, 11:25


Для пользователей, которые только знакомятся с Корпусом, на главной странице доступен функционал «Обзор возможностей».

В октябре мы усовершенствовали его работу, добавив новые виджеты и сделав существующие виджеты более информативными. Теперь «‎Обзор возможностей»‎ общий для всех корпусов НКРЯ.

Появился новый текстовый виджет, с помощью которого пользователь познакомится с основными терминами, используемыми в интерфейсе НКРЯ, узнает как приступить к поиску, какие бывают виды поиска и где можно подробнее о них прочитать.

Лексико-грамматический поиск, поиск точных форм и коллокаций теперь выдают результаты только из Основного корпуса.

В виджете «‎Случайное стихотворение»‎ теперь видно не только само произведение, но и его название, автор и дата создания.

Названия корпусов в заголовках виджетов стали кликабельными – по ссылке пользователь перейдет в «‎Портрет корпуса»‎, где сможет ознакомиться с его структурой и составом, узнать больше о создателях корпуса и прочитать публикации о нем.

НКРЯ Национальный корпус русского языка

15 Oct, 10:31


В октябре были пополнены коллекции устной речи в Акцентологическом и Устном корпусах. Добавлены записи текстов устной профессиональной речи, монологов-воспоминаний, повседневной диалогической речи, записанной в разных регионах — Воронежской, Московской, Томской областях, Республике Бурятии, Марий Эл. За участие в сборе и подготовке текстов благодарим студентов и сотрудников Воронежского государственного университета, студентов МГУ им М.В. Ломоносова, Г.В. Коротких (АНО «Межэтническая ассоциация «Ильсат» («Душа»), г. Томск), Е.В. Кашкина (Группа по изучению контактного взаимодействия русского языка с языками коренных народов России, ИРЯ РАН).

Объем Устного корпуса теперь составляет 14,8 млн словоупотреблений, общий объем Акцентологического корпуса, вместе с наивной поэзией, — 135,5 млн словоупотреблений.

В обоих корпусах появилась возможность отбирать тексты по количеству словоформ. В форме отбора подкорпуса Устного корпуса регионы теперь сгруппированы по странам для удобства поиска.

НКРЯ Национальный корпус русского языка

15 Oct, 09:01


В корпус «‎Восточнославянская эпиграфика»‎ добавлено 86 разнообразных надписей – от XI до XV века, от Лукки, Вифлеема и Константинополя до Киева и Твери, от подписи на княжеском оружии до загадок и проклятий. Корпус достиг объема в 6 тысяч словоформ.

В корпусе появилась возможность отбирать тексты по количеству словоформ, а также задавать условия поиска только в переводах.

НКРЯ Национальный корпус русского языка

01 Oct, 14:01


Приглашаем на конференцию, посвященную 20-летию Национального корпуса русского языка!

20–21 декабря 2024 года в Институте русского языка им. В.В. Виноградова РАН состоится международная конференция, посвященная 20-летию Национального корпуса русского языка.

Тематика конференции охватывает широкий спектр проблем – от корпусных методов лингвистических исследований и достоверности корпусных данных до вопросов создания корпусов и разработки пользовательского интерфейса. Отдельное внимание будет уделено применению нейросетевых моделей в подготовке корпусных данных, а также использованию НКРЯ в преподавании гуманитарных дисциплин в университете и в школе.

На конференции можно выступить с докладом или принять участие в качестве слушателя очно или онлайн. Более подробная информация, а также все обновления публикуются на сайте Института.

Зарегистрироваться можно до 1 ноября.

НКРЯ Национальный корпус русского языка

01 Oct, 09:01


В Корпусе берестяных грамот появились 19 берестяных грамот из Новгорода и Старой Руссы, найденные в прошлом, 2023 году. Их объем — более 300 слов. Кроме того, внесены поправки в тексты и переводы ранее найденных берестяных грамот. В корпус попали такие новые слова, как ѣздець (‘ездок’), шида (‘шелк’), немочи (‘хворать’), крута (‘приданое’). Такие обычные слова, как огородъ, капуста, боꙗринъ тоже встретились впервые в новых грамотах.

Значительно улучшен поиск по корпусу, в форме запроса можно задавать новые пометы, связанные с грамматикой и интерпретацией слова.

НКРЯ Национальный корпус русского языка

23 Sep, 08:07


Приглашаем на вебинар с техническим директором Национального корпуса русского языка!

Завтра, 24 сентября, в 17:00 по московскому времени, технический директор НКРЯ, специалист в области компьютерной лингвистики Дмитрий Морозов проведёт вебинар, посвященный машинному обучению в Национальном корпусе русского языка.

Участники вебинара узнают:
- что такое Национальный корпус русского языка и как начать им пользоваться
- как и для чего применяется машинное обучение в НКРЯ
- чем НКРЯ может быть полезен переводчикам
- как НКРЯ помогает изучать языки народов России

Вебинар организует «Лаборатория перевода» совместно с магистерской программой МИСИС «Цифровая лингвистика и локализация».

Ссылка для подключения к вебинару будет опубликована в телеграм-канале @tradulab в день события. Не пропустите!

НКРЯ Национальный корпус русского языка

19 Sep, 04:02


Приглашаем на лекцию о Корпусе

19 сентября в рамках 48-й конференции «Информационные технологии и системы», организованной Институтом проблем передачи информации им. А.А. Харкевича Российской академии наук, пройдет лекция о Национальном корпусе русского языка.

Анастасия Козеренко, менеджер Национального корпуса русского языка и старший научный сотрудник Отдела экспериментальной лексикографии Института русского языка имени В. В. Виноградова Российской академии наук, расскажет о том, как устроен Корпус, об изменениях, произошедших в нем за последние четыре года, а также о том, как сделать индивидуальную работу с Корпусом еще удобнее и полезнее.

Лекция состоится сегодня, 19 сентября, в 14:00 по московскому времени. Вы можете принять участие в ней дистанционно по ссылке: https://telemost.yandex.ru/j/85045971393761

С подробной программой конференции и другими докладами можно ознакомиться на сайте конференции.

НКРЯ Национальный корпус русского языка

18 Sep, 17:30


Сегодня на 78-ом году жизни скончался выдающийся российский лингвист, специалист по современному синтаксису и семантике, компьютерной лингвистике и машинному переводу, ведущий научный сотрудник Института проблем передачи информации РАН Леонид Лейбович Иомдин.

Леонид Лейбович был активным участником проекта «Национальный корпус русского языка» и одним из создателей Синтаксического корпуса в составе НКРЯ.

Приносим искренние соболезнования родным и близким Леонида Лейбовича.

НКРЯ Национальный корпус русского языка

14 Sep, 10:18


На сайте Корпуса появился личный кабинет.

Его основная задача – сделать индивидуальную работу с сайтом удобнее. Теперь пользователи могут сохранять в личный кабинет интересующие их запросы (в любом корпусе) и сравнения запросов (в тех корпусах, где есть эта функция) и возвращаться к ним.

Чтобы сохранить запрос или сравнение, нужно нажать кнопку «‎Сохранить запрос»‎ в выдаче или «‎Сохранить сравнение» на странице сравнения запросов. В личном кабинете в соответствующих вкладках можно просматривать сохраненные запросы и сравнения, давать им названия, копировать короткие ссылки, чтобы поделиться с другими, и удалять сохраненное. Количество запросов и сравнений, которые можно сохранить, не ограничено.

Вместе с появлением личного кабинета расширились и настройки профиля. Пользователи могут заполнить информацию о себе (эти данные сможет видеть только сам пользователь), изменить пароль или удалить аккаунт. В будущем с согласия пользователя некоторые его данные, такие как имя и место работы, будут видны другим. 

Личный кабинет доступен на компьютере и в мобильной версии.

НКРЯ Национальный корпус русского языка

14 Sep, 09:00


Древнерусский корпус пополнился новыми текстами и вырос на 43 тысячи слов. С одной стороны, в него вошли поздние тексты XIV в. (например, украинские и московские деловые грамоты, псковская «Повесть о Довмонте»), с другой – расширена разметка ранних текстов (Повести временных лет по Лаврентьевскому списку или житий). В словарь корпуса теперь входят предки таких привычных слов, как напрасно, перемолвиться, шапка или разногласие.

В древнерусском корпусе теперь можно отбирать подкорпус и получать статистику по стандартным критериям (включая дату текста и списка, жанр текста, объем текста) и узнать, насколько персонажи летописей ходят чаще, чем фигуранты грамот и повестей. Появилась возможность поиска по греческим леммам и словоформам для переводных произведений. Греческие слова можно ввести на виртуальной клавиатуре. Например, слово δόγμα (догма) передавалось славянскими переводчиками не только через заимствование догмат, но и как повеление, учение или устав.

В Портрете слова доступен новый функционал – «Формы слова». Для древнерусских существительных даны все формы чисел и падежей в разных орфографиях, встретившиеся в корпусе. Можно узнать частотность этих форм и перейти по ссылкам на примеры в поиске. Например, можно узнать, какие формы в текстах имело слово друг. Некоторые формы редко употребляющегося двойственного числа пока в корпусе не встретились (такие формы можно найти в грамматиках, где даны полные стандартные таблицы – парадигмы).

НКРЯ Национальный корпус русского языка

12 Sep, 14:47


В период с 20:00 12 сентября до 18:00 13 сентября (по московскому времени) на наших серверах будут проводиться технические работы.

Из-за этого возможны перебои в работе сайта Корпуса.

НКРЯ Национальный корпус русского языка

06 Sep, 13:03


В некоторых корпусах на сайте НКРЯ в Портрете слова можно увидеть виджет «‎Похожие‎ слова». Обратите внимание, что похожие слова — это не синонимы, а такие слова, контексты употребления которых похожи на контексты употребления искомого слова.

Мы провели эксперимент на данных Основного корпуса и отследили, как похожие слова изменялись с течением времени. Попробуйте догадаться, для каких слов получился следующий перечень похожих слов в разные временные периоды.

НКРЯ Национальный корпус русского языка

02 Sep, 12:32


Современный пользовательский интерфейс Национального корпуса русского языка призван отвечать растущим потребностям интернет-аудитории.

Одна из таких потребностей – быстрое решение стандартных задач: получить информацию о составе и статистических характеристиках корпуса или пользовательского подкорпуса, изменить вид выдачи, получить короткую ссылку для обмена результатами исследований. Смотрите наш новый видеоролик о том, как пользоваться основными функциями НКРЯ и делиться своими результатами с другими.

Посмотреть другие полезные видеоролики о возможностях корпуса вы можете на нашем YouTube-канале и в группе корпуса в социальной сети «ВКонтакте».

НКРЯ Национальный корпус русского языка

28 Aug, 10:26


Поэтический корпус НКРЯ на сегодняшний день является одним из наиболее представительных поэтических корпусов в мире. В нем представлены все основные течения в русской поэзии XVIII-XX веков.

Уникальной особенностью Поэтического корпуса НКРЯ является его стиховедческая разметка. Она отражает как свойства поэтического текста, так и особенности структуры самого стиха и его отдельных строк.

Благодаря стиховедческой разметке можно решать самые разные задачи. Например, можно получить сведения о распространенности жанра «‎басня»‎ в русской поэзии: всего басен в корпусе 940 из 101 521 текста по данным на август 2024 г. Воспользовавшись инструментами сортировки, можно узнать, что первая басня в корпусе написана в 1731 году поэтом-сатириком и российским дипломатом А. Д. Кантемиром.

Для стиховедов более интересна разметка стиха. С ее помощью, например, можно исследовать историю русского ударения и историю русского произношения.

Подробнее о составе и возможностях использования Поэтического корпуса можно почитать в разделе «‎Публикации о корпусе»‎.