danuvius: (Default)
[personal profile] danuvius
Наконец-то проект Ин-та рус. языка сдвинулся с мертвой точки. Я в свое время критиковал этот проект Кравецкого и Ко (Людоговский и др.) на Богослове (http://www.bogoslov.ru/text/382356.html#comment2491485). Результаты примерно те, что и ожидались. См. тут: http://ruscorpora.ru/beta/search-orthlib.html С объяснениями (теоретическими и практическими) принципов у составителей полный швах. Использовать можно только как черновую подсобку. Но и за то спасибо.

Date: 2012-07-19 07:43 am (UTC)
From: [identity profile] grisha-fomenko.livejournal.com
В действительности, кроме Кравецкого, основным движителем проекта является Е.Р. Добрушина из ПСТГУ (почему-то задвинутая в тень). Все Ваши замечания я готов ей передать. Т.е. Вы можете изложить их у себя в ЖЖ, а я пошлю ссылку, заодно получится и открытое обсуждение. Что же касается Ваших старых замечаний на "Богослове", то сейчас они не совсем по адресу, т.к. на выходе имеется ни в коем случае не словарь, а всего лишь размеченный корпус, которому, конечно, сильно не хватает греческих параллелей и источников. Вот аннотация к нему с главной страницы НКРЯ (http://ruscorpora.ru/):
20 мая 2012 года
Для общего доступа открыт Церковнославянский корпус как первый из разделов Исторического корпуса. Основу церковнославянского корпуса составляют современные богослужебные тексты (XIX-XX век) (60%). Кроме того, в корпусе представлены тексты других периодов (XVII-XVIII век) и жанров: писание, святоотеческие и др. Общий объем корпуса – около 4,7 млн словоупотреблений. Тексты в корпусе снабжены морфологической разметкой, которая позволяет искать слова по лемме и грамматическим признакам. Пользователь может искать словоформы и леммы в трех орфографических системах: точной, упрощенной и модернизированной.

Date: 2012-07-19 07:52 am (UTC)
From: [identity profile] danuvius.livejournal.com
Спасибо! Замечаний у меня масса. Вот некоторые.
1) Где полный перечень вошедших текстов и библиограф. описания изданий, к-е были использованы? Если были использованы чужие наборы, то это вопросов не снимает. Какая система положена в основу отбора? Случайное наличие в сети цсл текстов (н-р, Добротолюбия)?
В TLG есть целая система обсуждения библиографии, н-р. И все тексты набирались 2-3 китайцами каждый (китайцы не знали греч.), а потом все эти наборы сверялись между собой для выявления опечаток. Тут же какая система подстраховки?
2) Почему дается ссылка Библия--Деяния--стих (без главы)?
3) Как искать слова с титлами? Всюду ли ставились титла? (Н-р, если использовались "зеленые минеи", то там гражданский шрифт; а если использовались старые минеи, значит, "новых" питиримовских текстов там нет?).
4) Почему нет удобной справки по пользованию, как во всех нормальных западных тезаурсах, а она дана лишь в отдельном пдфе, причем нет отдельно по цсл?
5) Почему в упрощенном варианте все равно требуется вводить "ять" вместо "е", нужно ставить еры на конце и т. п.?
В общем, полнейшее безобразие. И еще надо учесть, что если в TLG дается точная отсылка, так что легко проверить по бумажному изданию, то тут это, кажется, невозможно?

Date: 2012-07-19 07:55 am (UTC)
From: [identity profile] danuvius.livejournal.com
Я уже давно ратую за то, чтобы был аналог Slavonic Bible по богослужебным текстам. Это было бы гораздо проще и важнее сделать для начала. И, само собой, с греч. текстами, где они существуют, и можно рус. пер. добавить (напр., ловягинские и др.). И чтобы не только в Инете, но у себя на компе поставить.

Date: 2012-07-19 08:07 am (UTC)
From: [identity profile] danuvius.livejournal.com
Приглашаю Е. Р. Добрушину принять самой участие в обсуждении проекта, даже если у нее нет ЖЖ: у меня допускаются записи анонимов (с премодерацией).

January 2025

S M T W T F S
   1234
5 6 7891011
12131415161718
19202122232425
262728293031 

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 5th, 2026 08:55 am
Powered by Dreamwidth Studios