Глобальный поиск Единое окно поиска по РИД и запросам

Программа реализации алгоритма выявления именованных сущностей типа "технология" в научно-технических текстах на английском языке

Наименование РИД Программа реализации алгоритма выявления именованных сущностей типа "технология" в научно-технических текстах на английском языке
Реферат Программа предназначена для извлечения информации из машиночитаемых текстов, выявления технологий, библиометрического и патентного анализа, научно-технологического прогнозирования, а также иных задач, связанных с поиском информации, и может использоваться для выявления именованных сущностей (NER) типа "технология" из научно-технических текстов на английском языке. В основе алгоритма лежит мультиязычная модель BERT, предварительное обучение которой осуществлялось на данных на более чем 104 языках. Для извлечения именованных сущностей типа "технология" была проведена тонкая настройка (fine-tuning) мультиязычной модели на научно-техническом корпусе англоязычных текстов, сформированном с помощью большой языковой модели (LLM)
Возможные направления использования Автоматическое извлечение узкоспециализированной информации на английском языке по технологиям в сфере науки и инноваций без использования лексических шаблонов может быть использовано при провидении междисциплинарных исследований, формировании корпусов и датасетов, суммаризации и аннотировании технических статей, работе с технической документацией, а также внутри поисковых систем и компьютерных приложений
Количество опытных образцов 0
Количество просмотров 4
Наличие дополнительных файлов False
Использование РИД правообладателем False
Внешнее использование РИД False
НИОКТР (JSON) {}
ИКСИ (JSON) []
ИКСПО (JSON) [{"last_status": {"created_date": "2026-01-28T09:13:10.965051+00:00", "registration_number": "826012800077-5", "status": {"name": "Подтверждена"}}, "copyright_protections": [{"protection_way": {"name": "Осуществлена государственная регистрация"}}]}]
ОЭСР (JSON) []
Дата первого статуса 2025-10-30T10:36:06.268243+00:00
Предполагаемый тип результата Программа для ЭВМ
Ожидаемая роль Исполнитель
Заказчик Правительство Российской Федерации
Руководитель работы Проскурякова Лилиана Николаевна
Руководитель организации Соколов Игорь Владимирович
Регистрационный номер НИОКТР 125022803043-4
Последний статус Подтверждена, 625112000118-3, 2025-11-20 09:28:55 UTC
ОКПД Услуги, связанные с научными исследованиями и экспериментальными разработками в области компьютерных наук и информационных технологий
Ключевые слова BERT; именованные сущности; NER; английский язык
Исполнители ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ "ВЫСШАЯ ШКОЛА ЭКОНОМИКИ"
Авторы Соколов Александр Васильевич; Лобанова Полина Александровна; Сварчевская Мария Владимировна; Вишневский Константин Олегович; Валанкин Юрий Михайлович; Сурикова Евгения Владимировна; Клубова Марина Андреевна; Грачев Кирилл Юрьевич
Коды тематических рубрик 16.31.21 - Автоматическая обработка текста. Автоматический перевод. Автоматическое распознавание речи
OESR Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
Приоритеты научно-технического развития а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;