| Наименование РИД |
Автоматизированное извлечение из международных БД генетических и таксономических данных с географической привязкой к черноморскому региону
|
| Реферат |
Назначение: Программа разработана для автоматизации процесса извлечения данных, относящихся к биоразнообразию исследуемого региона из глобальных баз данных NCBI GenBank (https://www.ncbi.nlm.nih.gov) и WoRMS (https://www.marinespecies.org/). Работа выполнена в рамках государственного задания ФИЦ ИнБЮМ (№ гос. регистрации темы 124022400148-4).
Компьютерная программа позволяет автоматизировать создание структуры БД для хранения данных о биоразнообразии исследуемого региона – «Biodiversity» (рисунок 1); подключение к внешним БД NCBI GenBank и WoRMS, MarineRegions (https://www.marineregions.org/); сформировать и выполнить запросы для получения данных, относящихся к биоразнообразию исследуемого региона, получение данных и их последующую загрузку в БД «Biodiversity».
Подключение к глобальным БД осуществляется при помощи: E-utilities —API для системы NCBI Entrez, SOAP service (Web Service Definition Language File).
БД «Biodiversity» работает с использованием СУБД Postgres 9.6 и выше. Модули программы разработаны с использованием языка программирования Python 3.12 и требуют подключения следующих библиотек sys, urllib.request, certify, ssl, Bio(Entrez), psycopg2, re, zeep.
Исходные данные, предопределённые в программном обеспечении:
1. слова и словосочетания описывающие принадлежность к исследуемому региону;
2. название видов, которые необходимо исключить;
3. максимальные и минимальные координаты, ограничивающие регион;
4. путь к файлу со списком id регионов по БД MarineRegions, относящихся к исследуемому региону;
5. данные для подключения к СУБД;
6. e-mail учетной записи для подключения к Entrez;
7. название или идентификатор основных таксонов, относительно которых, проводится загрузка данных.
По умолчанию исходные данные определены для исследуемого региона: Азово-Черноморского бассейна. Исходные данные могут быть переопределены для других регионов внесением соответствующих изменений в данные п.1-4.
Программа опробована для формирования набора данных о генетическом и таксономическом разнообразии Азово-Черноморского бассейна для таксонов Animalia (Metazoa) и Plants (по состоянию на 1.09.2024).
Работа выполнена в рамках госзадания ФИЦ ИнБЮМ (гос. рег. темы НИР № 124022400148-4).
Область применения: биология, гидробиология, экология.
Функциональные возможности программы ЭВМ:
По входным данным: отсутствуют.
Выдает следующие выходные данные: загруженные в БД «Biodiversity» существующие на текущий момент данные о биоразнообразии Азово-Черноморского бассейнa в соответствии со структурой БД (рисунок 1)
Тип ЭВМ IBM PC-совмест. ПК.
ОС Linux и macOS
Объём программы ЭВМ:
• файл «add_ncbi_db_sql.py» 4 кБ
• файл «add_worms_db_sql.py» 4 кБ
• файл «add_marineregion_db_sql.py» 4 кБ
• файл «marineregion.py » 12 кБ
• файл «ncbi.py» 12 кБ
• файл «worms.py» 12 кБ
|
| Возможные направления использования |
биология, гидробиология, экология
|
| Количество опытных образцов |
1
|
| Количество просмотров |
3
|
| Наличие дополнительных файлов |
True
|
| Использование РИД правообладателем |
False
|
| Внешнее использование РИД |
False
|
| НИОКТР (JSON) |
{}
|
| ИКСИ (JSON) |
[]
|
| ИКСПО (JSON) |
[]
|
| ОЭСР (JSON) |
[]
|
| Дата первого статуса |
2025-07-14T12:32:27.814889+00:00
|
| Предполагаемый тип результата |
Программа для ЭВМ
|
| Ожидаемая роль |
Исполнитель
|
| Заказчик |
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
|
| Руководитель работы |
Дмитриева Евгения Вениаминовна
|
| Руководитель организации |
Горбунов Роман Вячеславович
|
| Регистрационный номер НИОКТР |
124022400148-4
|
| Последний статус |
Подтверждена, 626011600238-7, 2026-01-16 13:13:42 UTC
|
| ОКПД |
Услуги, связанные с научными исследованиями и экспериментальными разработками в области биологических наук
|
| Ключевые слова |
автоматизированный сбор данных; таксономические данные; генетические данные; биоразнообразия
|
| Исполнители |
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР "ИНСТИТУТ БИОЛОГИИ ЮЖНЫХ МОРЕЙ ИМЕНИ А.О.КОВАЛЕВСКОГО РАН"
|
| Авторы |
Кулешова Ольга Николаевна
|
| Коды тематических рубрик |
34.03.23 - Математическая биология и теоретическое моделирование биологических процессов. Биоинформатика; 34.03.99 - Прочие общие проблемы биологии
|
| OESR |
Сохранение биологического разнообразия
|
| Приоритеты научно-технического развития |
—
|