Микрофон - Sputnik Молдова
Культура
Все о культуре, музыке, театре, живописи и модных трендах в Молдове и в мире – читайте на Sputnik Молдова.

Какие тайны слов скрывает Национальный корпус русского языка

© Sputnik / Перейти в фотобанкРусское посольство в Западной Европе
Русское посольство в Западной Европе - Sputnik Молдова
Подписаться
Российские лингвисты рассказали студентам из Молдовы о том, какие научные секреты скрывает Национальный корпус русского языка.

КИШИНЕВ, 16 сен – Sputnik. В Кишиневе, в пресс-центре Международного информационного агентства и радио Sputnik Молдова, в среду состоялась мультимедийная лекция в формате видеомоста Москва — Кишинев — Ереван — Астана на тему: "Русский язык и новые технологии: корпуса и корпусная лингвистика".

Эта лекция продолжила серию мероприятий МИА "Россия сегодня" и Министерства образования и науки РФ для российских и зарубежных журналистов, работающих на русском языке.

Профессоры российского Национального исследовательского университета «Высшая школа экономики» Екатерина Рахилина и Нина Добрушина рассказали студентам в Ереване, Кишиневе и Астане о том, что представляет собой национальный корпус русского языка, одном из наиболее значительных электронных корпусов современных литературных языков. Ученые-филологи познакомили аудиторию с ролью корпуса русского языка в теоретических и прикладных исследованиях, расскажут о его практических возможностях для работы журналистов.

"Национальный корпус русского языка – это электронный ресурс, открытый в 2004 году. Его назначение – предоставлять пользователю ссылки на тексты различной направленности и эпохи создания. Первые попытки создать корпус русского языка принадлежат советскому ученому в области программирования Андрею Петровичу Ершову. Нынешний корпус русского языка сформирован на платформе системы Яндекс", — рассказала Рахилина.

Михай Волонтир в роли кузнеца Будулая в фильме Цыган - Sputnik Молдова
Волонтир благоволил к русской театральной школе

По ее словам, чаще всего поиск в корпусе задается по тем или иным словам. Наиболее часто встречаемые в письменных текстах на русском языке слова – это год, человек, время, дело, жизнь, день, рука, раз, работа и слово среди имен существительных и быть, мочь, сказать, говорить, знать, стать, хотеть, идти, иметь и видеть среди глаголов.

"Вычислить наиболее часто употребляемые слова в устной русской речи пока сложно, потому что для этого в корпус необходимо загрузить много устных текстов, а перед этим записать их на аудио-носитель и затем расшифровать. Мы приглашаем участников видеомоста внести свой вклад в эту работу", — сказала Рахилина.

По словам Добрушиной, среди наиболее часто встречаемых словосочетаний в письменном русском языке на первом месте – «отец и мать».

Специалисты привели несколько интересных примеров употребления слов в русском языке. Например такой распространенный в наше время жаргонизм как «клевый», кажется, вошел в обиход русской речи недавно – в ХХ веке. Однако, это слово встречается в тексте аж 1864 года. Это роман Всеволода Крестовского «Петербургские трущобы». А слово «мода» первый раз появляется в русском языке из-под пера Александра Сумарокова в XVIII веке.

"Всем интересно, какого рода слово «кофе» – мужского или среднего. Национальный корпус русского языка фиксирует изменения, произошедшие с родовой принадлежностью этого слова. Слово «кофе» происходит от голландского «koffie». Передавалось оно в русском языке изначально двумя способами – «кофий» мужского рода и «кофе» среднего. Обе формы сперва употреблялись параллельно. Уже в XIX веке побеждает мужской род. Но в ХХ веке мы уже встречаем «кофе» среднего рода у вполне авторитетных авторов – Набокова, Бунина и других", — рассказала Рахилина.

По ее словам, в советское время последнее слово было за редакторами, которые сводили весь процесс употребления слова «кофе» к мужскому роду. Но реальная, употребляемая форма отражена в книгах на русском языке, изданных вне Советского Союза. Так «кофе» чаще всего среднего рода.

"Это реальная история слов, ее нужно изучать и понимать", — сказала Рахилина.

Лента новостей
0