| Наименование РИД |
Программа реализации алгоритма выявления именованных сущностей типа "технология" в научно-технических текстах на русском языке
|
| Реферат |
Программа предназначена для извлечения информации из машиночитаемых текстов, выявления технологий, библиометрического и патентного анализа, научно-технологического прогнозирования, а также иных задач, связанных с поиском информации, и может использоваться для выявления NER типа "технология" из научно-технических текстов на русском языке. В основе алгоритма лежит мультиязычная модель BERT, предварительное обучение которой осуществлялось на данных на более чем 104 языках. Для извлечения именованных сущностей типа "технология" была проведена тонкая настройка (fine-tuning) мультиязычной модели на научно-техническом корпусе русскоязычных текстов, сформированном с помощью LLM. Программа содержит в том числе конфигурацию для русского языка
|
| Возможные направления использования |
Автоматическое извлечение наименований технологий на русском языке в сфере науки и инноваций может быть использовано при провидении междисциплинарных исследований, формировании корпусов и датасетов, суммаризации и аннотировании технических статей, работе с технической документацией, а также внутри поисковых систем и компьютерных приложений
|
| Количество опытных образцов |
0
|
| Количество просмотров |
5
|
| Наличие дополнительных файлов |
False
|
| Использование РИД правообладателем |
False
|
| Внешнее использование РИД |
False
|
| НИОКТР (JSON) |
{}
|
| ИКСИ (JSON) |
[]
|
| ИКСПО (JSON) |
[{"last_status": {"created_date": "2025-12-09T08:04:55.690818+00:00", "registration_number": "825120900062-3", "status": {"name": "Подтверждена"}}, "copyright_protections": [{"protection_way": {"name": "Осуществлена государственная регистрация"}}]}]
|
| ОЭСР (JSON) |
[]
|
| Дата первого статуса |
2025-10-31T09:05:34.912180+00:00
|
| Предполагаемый тип результата |
Программа для ЭВМ
|
| Ожидаемая роль |
Исполнитель
|
| Заказчик |
Правительство Российской Федерации
|
| Руководитель работы |
Проскурякова Лилиана Николаевна
|
| Руководитель организации |
Соколов Игорь Владимирович
|
| Регистрационный номер НИОКТР |
125022803043-4
|
| Последний статус |
Подтверждена, 625112000117-6, 2025-11-20 09:28:43 UTC
|
| ОКПД |
Услуги, связанные с научными исследованиями и экспериментальными разработками в области компьютерных наук и информационных технологий
|
| Ключевые слова |
Извлечение информации; Автоматическая обработка естественного языка; Русский язык; Именованные сущности
|
| Исполнители |
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ "ВЫСШАЯ ШКОЛА ЭКОНОМИКИ"
|
| Авторы |
Соколов Александр Васильевич; Лобанова Полина Александровна; Сварчевская Мария Владимировна; Вишневский Константин Олегович; Валанкин Юрий Михайлович; Сурикова Евгения Владимировна; Клубова Марина Андреевна; Грачев Кирилл Юрьевич
|
| Коды тематических рубрик |
16.31.21 - Автоматическая обработка текста. Автоматический перевод. Автоматическое распознавание речи
|
| OESR |
Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
|
| Приоритеты научно-технического развития |
а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
|