| Наименование РИД |
Программа реализации алгоритма выявления именованных сущностей типа "технология" в научно-технических текстах на английском языке
|
| Реферат |
Программа предназначена для извлечения информации из машиночитаемых текстов, выявления технологий, библиометрического и патентного анализа, научно-технологического прогнозирования, а также иных задач, связанных с поиском информации, и может использоваться для выявления именованных сущностей (NER) типа "технология" из научно-технических текстов на английском языке. В основе алгоритма лежит мультиязычная модель BERT, предварительное обучение которой осуществлялось на данных на более чем 104 языках. Для извлечения именованных сущностей типа "технология" была проведена тонкая настройка (fine-tuning) мультиязычной модели на научно-техническом корпусе англоязычных текстов, сформированном с помощью большой языковой модели (LLM)
|
| Возможные направления использования |
Автоматическое извлечение узкоспециализированной информации на английском языке по технологиям в сфере науки и инноваций без использования лексических шаблонов может быть использовано при провидении междисциплинарных исследований, формировании корпусов и датасетов, суммаризации и аннотировании технических статей, работе с технической документацией, а также внутри поисковых систем и компьютерных приложений
|
| Количество опытных образцов |
0
|
| Количество просмотров |
4
|
| Наличие дополнительных файлов |
False
|
| Использование РИД правообладателем |
False
|
| Внешнее использование РИД |
False
|
| НИОКТР (JSON) |
{}
|
| ИКСИ (JSON) |
[]
|
| ИКСПО (JSON) |
[{"last_status": {"created_date": "2026-01-28T09:13:10.965051+00:00", "registration_number": "826012800077-5", "status": {"name": "Подтверждена"}}, "copyright_protections": [{"protection_way": {"name": "Осуществлена государственная регистрация"}}]}]
|
| ОЭСР (JSON) |
[]
|
| Дата первого статуса |
2025-10-30T10:36:06.268243+00:00
|
| Предполагаемый тип результата |
Программа для ЭВМ
|
| Ожидаемая роль |
Исполнитель
|
| Заказчик |
Правительство Российской Федерации
|
| Руководитель работы |
Проскурякова Лилиана Николаевна
|
| Руководитель организации |
Соколов Игорь Владимирович
|
| Регистрационный номер НИОКТР |
125022803043-4
|
| Последний статус |
Подтверждена, 625112000118-3, 2025-11-20 09:28:55 UTC
|
| ОКПД |
Услуги, связанные с научными исследованиями и экспериментальными разработками в области компьютерных наук и информационных технологий
|
| Ключевые слова |
BERT; именованные сущности; NER; английский язык
|
| Исполнители |
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ "ВЫСШАЯ ШКОЛА ЭКОНОМИКИ"
|
| Авторы |
Соколов Александр Васильевич; Лобанова Полина Александровна; Сварчевская Мария Владимировна; Вишневский Константин Олегович; Валанкин Юрий Михайлович; Сурикова Евгения Владимировна; Клубова Марина Андреевна; Грачев Кирилл Юрьевич
|
| Коды тематических рубрик |
16.31.21 - Автоматическая обработка текста. Автоматический перевод. Автоматическое распознавание речи
|
| OESR |
Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
|
| Приоритеты научно-технического развития |
а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
|