Глобальный поиск Единое окно поиска по РИД и запросам

Автоматизированное извлечение из международных БД генетических и таксономических данных с географической привязкой к черноморскому региону

Наименование РИД Автоматизированное извлечение из международных БД генетических и таксономических данных с географической привязкой к черноморскому региону
Реферат Назначение: Программа разработана для автоматизации процесса извлечения данных, относящихся к биоразнообразию исследуемого региона из глобальных баз данных NCBI GenBank (https://www.ncbi.nlm.nih.gov) и WoRMS (https://www.marinespecies.org/). Работа выполнена в рамках государственного задания ФИЦ ИнБЮМ (№ гос. регистрации темы 124022400148-4). Компьютерная программа позволяет автоматизировать создание структуры БД для хранения данных о биоразнообразии исследуемого региона – «Biodiversity» (рисунок 1); подключение к внешним БД NCBI GenBank и WoRMS, MarineRegions (https://www.marineregions.org/); сформировать и выполнить запросы для получения данных, относящихся к биоразнообразию исследуемого региона, получение данных и их последующую загрузку в БД «Biodiversity». Подключение к глобальным БД осуществляется при помощи: E-utilities —API для системы NCBI Entrez, SOAP service (Web Service Definition Language File). БД «Biodiversity» работает с использованием СУБД Postgres 9.6 и выше. Модули программы разработаны с использованием языка программирования Python 3.12 и требуют подключения следующих библиотек sys, urllib.request, certify, ssl, Bio(Entrez), psycopg2, re, zeep. Исходные данные, предопределённые в программном обеспечении: 1. слова и словосочетания описывающие принадлежность к исследуемому региону; 2. название видов, которые необходимо исключить; 3. максимальные и минимальные координаты, ограничивающие регион; 4. путь к файлу со списком id регионов по БД MarineRegions, относящихся к исследуемому региону; 5. данные для подключения к СУБД; 6. e-mail учетной записи для подключения к Entrez; 7. название или идентификатор основных таксонов, относительно которых, проводится загрузка данных. По умолчанию исходные данные определены для исследуемого региона: Азово-Черноморского бассейна. Исходные данные могут быть переопределены для других регионов внесением соответствующих изменений в данные п.1-4. Программа опробована для формирования набора данных о генетическом и таксономическом разнообразии Азово-Черноморского бассейна для таксонов Animalia (Metazoa) и Plants (по состоянию на 1.09.2024). Работа выполнена в рамках госзадания ФИЦ ИнБЮМ (гос. рег. темы НИР № 124022400148-4). Область применения: биология, гидробиология, экология. Функциональные возможности программы ЭВМ: По входным данным: отсутствуют. Выдает следующие выходные данные: загруженные в БД «Biodiversity» существующие на текущий момент данные о биоразнообразии Азово-Черноморского бассейнa в соответствии со структурой БД (рисунок 1) Тип ЭВМ IBM PC-совмест. ПК. ОС Linux и macOS Объём программы ЭВМ: • файл «add_ncbi_db_sql.py» 4 кБ • файл «add_worms_db_sql.py» 4 кБ • файл «add_marineregion_db_sql.py» 4 кБ • файл «marineregion.py » 12 кБ • файл «ncbi.py» 12 кБ • файл «worms.py» 12 кБ
Возможные направления использования биология, гидробиология, экология
Количество опытных образцов 1
Количество просмотров 3
Наличие дополнительных файлов True
Использование РИД правообладателем False
Внешнее использование РИД False
НИОКТР (JSON) {}
ИКСИ (JSON) []
ИКСПО (JSON) []
ОЭСР (JSON) []
Дата первого статуса 2025-07-14T12:32:27.814889+00:00
Предполагаемый тип результата Программа для ЭВМ
Ожидаемая роль Исполнитель
Заказчик МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Руководитель работы Дмитриева Евгения Вениаминовна
Руководитель организации Горбунов Роман Вячеславович
Регистрационный номер НИОКТР 124022400148-4
Последний статус Подтверждена, 626011600238-7, 2026-01-16 13:13:42 UTC
ОКПД Услуги, связанные с научными исследованиями и экспериментальными разработками в области биологических наук
Ключевые слова автоматизированный сбор данных; таксономические данные; генетические данные; биоразнообразия
Исполнители ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР "ИНСТИТУТ БИОЛОГИИ ЮЖНЫХ МОРЕЙ ИМЕНИ А.О.КОВАЛЕВСКОГО РАН"
Авторы Кулешова Ольга Николаевна
Коды тематических рубрик 34.03.23 - Математическая биология и теоретическое моделирование биологических процессов. Биоинформатика; 34.03.99 - Прочие общие проблемы биологии
OESR Сохранение биологического разнообразия
Приоритеты научно-технического развития