РАЗРАБОТКА И ПРИМЕНЕНИЕ УНИФИЦИРОВАННОЙ БАЗЫ ДАННЫХ ПО КРОВОСОСУЩИМ НАСЕКОМЫМ
С.Г. Медведев
Зоологический институт РАН, Санкт-Петербург, 199034, Россия;
e-mail: fleas@zin.ru
Усилиями нескольких поколений исследователей к настоящему времени получена обширная информация, касающаяся таксономического положения, строения, распространения и экологии кровососущих насекомых. Вся эта информация нуждается в анализе, обобщении и использовании. В тоже время по-прежнему важной задачей остается оценка таксономического состава фауны России. Она является следствием большого практического значения различных групп кровососущих насекомых как компонентов гнуса, а также их ролью в качестве переносчиков возбудителей опасных для человека инфекций. Видовой состав ряда территорий России по-прежнему остается малоизученным. Необходимость дальнейшего изучения кровососущих насекомых усугубляется изменениями в окружающей среде, обусловленными глобальным потеплением и возрастающим антропогенным воздействием на ландшафты.
На современном этапе работы по уточнению таксономического состава региональных фаун, а также мониторингу численности, пространственного и временного распределения видов кровососущих насекомых должны решаться средствами специальных баз данных (БД) в форме информационно-аналитических систем (ИАС). ИАС не только многократно увеличивают информационную вооруженность, но и позволяют реализовать на практике комплексный подход в исследованиях. Применение ИАС в таксономических исследованиях обеспечивает их преемственность, возможности постоянного обновления, уточнения и последовательной детализации информации.
В систематике и фаунистике анализируются разноаспектные данные и широко применяются иерархические классификации различных групп организмов, географических объектов, регионов, выделов и т.д. Большой опыт структурирования исходной информации накоплен при разработке ИАС PARHOST1 по мировой фауне блох (Медведев, Лобанов, 1999; Медведев, 2001, 2004). Он состоит в опосредовании первичных неструктурированных данных средствами специальных таблиц-классификаторов, на основе которых создаются собственно сами фактографические таблицы ИАС. Фактографические таблицы ИАС PARHOST1 это, например, таблицы распределения видов и подвидов блох по зоогеографическим выделам, распределения видов и подвидов блох по видам хозяев, таблицы сложных (составных) признаков и их состояний, а также таблица распределения состояний признаков по видам и подвидам блох. Таблицы-классификаторы ИАС PARHOST1 представлены классификациями таксонов блох и их хозяев (млекопитающих и птиц) в объеме мировой фауны, зоогеографических выделов, физико-географических объектов и административных регионов, скелетных образований и элементарных (далее не разложимых на составные части) признаков блох. Процедура построения фактографических таблиц ИАС PARHOST1 позволяет формировать аналитические запросы не только по каждому из аспектов, касающихся таксономии, распространения, паразито-хозяинных связей, строения, как в отдельности, так и с учетом их взаимосвязей. Важным преимуществом является то, что все эти запросы могут быть сделаны для таксонов любого ранга.
В виду широко распространения среди пользователей приложений Microsoft Office, унифицированная ИАС по кровососущим насекомым создана в СУБД Access. Унифицированная ИАС по кровососущим насекомым в СУБД Access в настоящее время используется различными специалистами, занимающихся кровососущими насекомыми на Севере и Северо-Западе европейской части России. Таким образом, в условиях пока недостаточного развития Интернета в России можно будет обеспечить накопление данных в форме БД и стандартизацию первичных данных на унифицированной основе. ИАС в СУБД Access является промежуточным этапом для создания БД для удаленного сетевого пользования.
В разрабатываемой ИАС по кровососущим насекомым, реализован ряд методических подходов, направленных на всесторонне информационное обеспечение исследований в области систематики и фаунистики. В частности, в ИАС по кровососущим насекомым протоколируется авторство и время выполнения всех основных операций по вводу данных. Другой особенностью ИАС по кровососущим насекомым является возможность накопления и анализа как уже ранее обобщенных материалов, почерпнутых из научных публикаций, так и обработки единичных (необобщенных) данных, касающихся отдельных особей насекомых. В обоих случаях средства ИАС позволяют сохранять (архивировать) как сами первичные данные в аутентичной форме, так и их различные трактовки, осуществляемые отдельными исследователями-экспертами.
Средства обработки единичных данных в ИАС по кровососущим насекомым позволяют обрабатывать данные полевых сборов и материалов коллекционных фондов. Эти данные могут вводится из первичных источников полевых журналов и карточек коллекционной документации, могут быть также почерпнутыми из литературных источников. В виду этого в ИАС имеются необходимые инструменты для ведения библиографии данных литературных источников, возможности использования ключевых слов для поиска информации и т. д.
Существенной особенностью ИАС является возможность поэтапной обработки исходных данных. Необходимо исходить из того, что процесс обработки полевых и коллекционных материалов является практически бесконечным. Определение собранных в поле особей может откладываться на неопределенное время, например, из-за отсутствия эксперта-специалиста по той или иной группе насекомых, поэтому данный этап является “критическим” для судьбы первичных данных. Данные полевых журналов могут быть утрачены или же смысл их записей становится в той или иной мере неясным для последующих исследователей, однако даже при отсутствии таксономических определений в БД по кровососущим насекомым может быть внесена достаточная для анализа информация. Это, например, данные о названии и времени проведения экспедиции (группе сборов), имени коллектора, данные о месте проведения сборов (название и географические координаты точки привязки сборов, данные о биотопах конкретных пунктов сборов т.д.). Кроме того, на этом этапе в БД может быть произведена интерпретация сведений о месте сборов, т.е. их привязка к административному району, географическому объекту, климатической полосе и т.д. Все это позволяет использовать БД как аналитическое средство уже на этом этапе.
Другим примером поэтапной обработки данных может служить метод обработки текстового сообщения (например, абзаца публикации, тезы из определительной таблицы), содержащего обобщенные разноаспектные сведения. Такой фрагмент с неструктурированной информацией на первом этапе разбивается пользователем на части, каждая из которых относится к одному из аспектов, касающегося таксономического положения, географического распространения, паразито-хозяинных связей или строения описываемых организмов. Далее эти части фрагмента соотносятся с соответствующими классификаторами и вносятся в таблицу структурированных данных. На следующем этапе между этими записями БД задаются связи, которые описывают, например, приуроченность видов кровососов к прокормителю или географическому выделу. Таким образом, изначально недоступный компьютерному анализу фрагмент становится частью аналитической БД.
Работа выполнена на базе коллекции Зоологического института РАН (ЗИН РАН) (УФК ЗИН рег. № 2-2.20) и на основании контракта с Роснаукой «02.452.11.7031 (2006-РИ-26.0/001/070), при поддержке Российского фонда фундаментальных исследований (грант №05–04–48719) и гранта Президента РФ поддержки научных школ; НШ-1664.2003.4.