Предлагается концепция создания Центра лингвистических ресурсов РАН как организационно-технологической структуры, обеспечивающей агрегацию и интеграцию российских цифровых (электронных) лингвистических информационных ресурсов (ЛИР), реализующих различные задачи теоретической и прикладной лингвистики. Центр должен стать частью Цифровой системы управления сервисами научной инфраструктуры коллективного пользования, создание которой предусмотрено в Национальном проекте “Наука&8j1;. Описывается состояние ЛИР в РАН на основе проведенной инвентаризации и предлагается их типология. Формулируются задачи Центра ЛИР. Предлагаются способы действий Центра по отношению к различным типам ЛИР, как документным, так и структурированным. Особое внимание предлагается уделить корпусным и лексикографическим ресурсам. Кратко формулируются организационные, экономические и правовые аспекты функционирования Центра.
Предлагается создание информационно-справочной системы, содержащей полные и комплексные сведения о научных результатах учреждений РАН, научных подразделений и научных работников в области языкознания. Справочная система должна обеспечивать информационную поддержку качественного научно-методического руководства со стороны профильного отделения РАН. Приводится классификация информационных объектов, содержащих научные результаты – как традиционных (публикации, отчеты, диссертации), так и новых цифровых (лингвистические базы данных, сайты, корпуса, аккаунты и др.). Описываются предварительные результаты по созданию такой системы. Перечисляются функции справочной системы. Приводится модернизированный раздел “Языкознание” Государственного рубрикатора научно-технической информации.
Описываются основные проекты метаданных для лингвистических (языковых) ресурсов, реализованные за последние 20 лет. В их числе инициатива IMDI, система метаданных OLAC. метамодель META-SHARE, Международный стандартный номер языковых ресурсов, оценочная карта языковых ресурсов, а также компонентная модель метаданных CLARIN. Излагается содержание стандарта ИСО на метаданные. Описываются проекты создания словарей, онтологий и лексических баз для метаданных языковых ресурсов.
Предлагается разработка русскоязычной онтологии по цифровой гуманитаристике как части инфраструктуры этой дисциплины, которая получает организационное оформление как в мире, так и в России. Описываются основные зарубежные источники для такой онтологии. Также описываются российские проекты последних лет в области понятийного состава лингвистики и филологии в целом, которые целесообразно использовать. Кратко излагается формирование концептуальной модели онтологии. В качестве технологической основы предлагается модель проекта Ontolex-Lemon на платформе Семантической сети и лингвистических связанных открытых данных. Подчеркивается необходимость коллаборации различных специалистов и организаций.
Scopus
Crossref
Высшая аттестационная комиссия
При Министерстве образования и науки Российской Федерации
Научная электронная библиотека