Корпус древнеславянского языка?
Mar. 21st, 2020 05:10 pmhttp://www.patriarchia.ru/db/text/5609725.html
+ Если анализировать и систематизировать человеческими ресурсами тот объем данных, который представляют собой древнеславянские рукописи, — это астрономическая работа, которая растянулась бы на века, учитывая, что профессионалов, которые способны делать эту работу, в принципе очень мало. Технологии распознавания и оцифровки текстов, машинного перевода и ИИ позволят провести это важную работу в обозримое время.+
Глупо рассчитывать на базы данных, отвлекаясь от людей. Между тем, один классный профи может сделать работу, которая оказалась не под силу нескольким институтам. Весь цимес - в первую очередь в правильной методологии, к-ю сам компьютер не в состоянии создать.
К тому же непонятно, почему акцент сделан именно на богослужебных текстах? И как будет проводиться анализ переводных текстов без учета греческих оригиналов? При отсутствии исчерпывающих словарей и конкордансов?
В общем, мне этот проект (по представлению Патриархии) кажется туфтой. Где можно подробнее почитать о проекте?
P. S. https://mpda.ru/news/kafedra-filologii-mda-prinjala-uchastie-v-seminare-sozdanie-korpusa-rukopisnyh-slavjanskih-tekstov-s-primeneniem-tehnologij-iskusstvennogo-intellekta/ Комментарий. +Ягич один издал три тома древней минеи, (редакция сер. XI в.), затем в Германии завершают это издание. Итак, остается только редакция XIV в. и затем русские ее "исправления". В чем здесь научная необходимость - непонятно (тексты состоят из множества "калек", не имеющих смысла).+
+ Если анализировать и систематизировать человеческими ресурсами тот объем данных, который представляют собой древнеславянские рукописи, — это астрономическая работа, которая растянулась бы на века, учитывая, что профессионалов, которые способны делать эту работу, в принципе очень мало. Технологии распознавания и оцифровки текстов, машинного перевода и ИИ позволят провести это важную работу в обозримое время.+
Глупо рассчитывать на базы данных, отвлекаясь от людей. Между тем, один классный профи может сделать работу, которая оказалась не под силу нескольким институтам. Весь цимес - в первую очередь в правильной методологии, к-ю сам компьютер не в состоянии создать.
К тому же непонятно, почему акцент сделан именно на богослужебных текстах? И как будет проводиться анализ переводных текстов без учета греческих оригиналов? При отсутствии исчерпывающих словарей и конкордансов?
В общем, мне этот проект (по представлению Патриархии) кажется туфтой. Где можно подробнее почитать о проекте?
P. S. https://mpda.ru/news/kafedra-filologii-mda-prinjala-uchastie-v-seminare-sozdanie-korpusa-rukopisnyh-slavjanskih-tekstov-s-primeneniem-tehnologij-iskusstvennogo-intellekta/ Комментарий. +Ягич один издал три тома древней минеи, (редакция сер. XI в.), затем в Германии завершают это издание. Итак, остается только редакция XIV в. и затем русские ее "исправления". В чем здесь научная необходимость - непонятно (тексты состоят из множества "калек", не имеющих смысла).+
no subject
Date: 2020-03-21 03:43 pm (UTC)Можно представить, какое количество ошибок наплодит искусственный интеллект при распознании рукописей, особенно поздних. Вычитывать придется так долго, что, думаю, овчинка выделки не стоит. Но большинство этого не понимает.
no subject
Date: 2020-03-22 09:58 am (UTC)