Глобальный поиск Единое окно поиска по РИД и запросам

Программа реализации алгоритма выявления именованных сущностей типа "технология" в научно-технических текстах на русском языке

Наименование РИД Программа реализации алгоритма выявления именованных сущностей типа "технология" в научно-технических текстах на русском языке
Реферат Программа предназначена для извлечения информации из машиночитаемых текстов, выявления технологий, библиометрического и патентного анализа, научно-технологического прогнозирования, а также иных задач, связанных с поиском информации, и может использоваться для выявления NER типа "технология" из научно-технических текстов на русском языке. В основе алгоритма лежит мультиязычная модель BERT, предварительное обучение которой осуществлялось на данных на более чем 104 языках. Для извлечения именованных сущностей типа "технология" была проведена тонкая настройка (fine-tuning) мультиязычной модели на научно-техническом корпусе русскоязычных текстов, сформированном с помощью LLM. Программа содержит в том числе конфигурацию для русского языка
Возможные направления использования Автоматическое извлечение наименований технологий на русском языке в сфере науки и инноваций может быть использовано при провидении междисциплинарных исследований, формировании корпусов и датасетов, суммаризации и аннотировании технических статей, работе с технической документацией, а также внутри поисковых систем и компьютерных приложений
Количество опытных образцов 0
Количество просмотров 5
Наличие дополнительных файлов False
Использование РИД правообладателем False
Внешнее использование РИД False
НИОКТР (JSON) {}
ИКСИ (JSON) []
ИКСПО (JSON) [{"last_status": {"created_date": "2025-12-09T08:04:55.690818+00:00", "registration_number": "825120900062-3", "status": {"name": "Подтверждена"}}, "copyright_protections": [{"protection_way": {"name": "Осуществлена государственная регистрация"}}]}]
ОЭСР (JSON) []
Дата первого статуса 2025-10-31T09:05:34.912180+00:00
Предполагаемый тип результата Программа для ЭВМ
Ожидаемая роль Исполнитель
Заказчик Правительство Российской Федерации
Руководитель работы Проскурякова Лилиана Николаевна
Руководитель организации Соколов Игорь Владимирович
Регистрационный номер НИОКТР 125022803043-4
Последний статус Подтверждена, 625112000117-6, 2025-11-20 09:28:43 UTC
ОКПД Услуги, связанные с научными исследованиями и экспериментальными разработками в области компьютерных наук и информационных технологий
Ключевые слова Извлечение информации; Автоматическая обработка естественного языка; Русский язык; Именованные сущности
Исполнители ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ "ВЫСШАЯ ШКОЛА ЭКОНОМИКИ"
Авторы Соколов Александр Васильевич; Лобанова Полина Александровна; Сварчевская Мария Владимировна; Вишневский Константин Олегович; Валанкин Юрий Михайлович; Сурикова Евгения Владимировна; Клубова Марина Андреевна; Грачев Кирилл Юрьевич
Коды тематических рубрик 16.31.21 - Автоматическая обработка текста. Автоматический перевод. Автоматическое распознавание речи
OESR Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
Приоритеты научно-технического развития а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;