Main Page English Version  
Previous Up Deep Next

Определители жуков и биологическая диагностика

Андрей Лобанов

Страница в стадии редактирования...

Биологическая диагностика - прикладная ветвь систематики, занимающаяся теорией и практикой построения диагностических ключей, выделилась в самостоятельную научную дисциплину в начале 70-х годов XX века. Конечно, определители растений и животных создавались биологами более двух веков назад и способы их построения обсуждались гораздо раньше, но в отдельную отрасль систематики биологическая диагностика превратилась именно в указанный период и связано это с попыткми автоматизировать процесс использования ключей с помощью появившихся в 60-е годы компьютеров. Докомпьютерная история определительных ключей подробно рассмотрена в целом ряде работ (Лобанов, 1972; Morse, 1975; Свиридов, 1976, 1994; Pankhurst, 1978; Payne, Preece, 1980).

Все внешнее многообразие форм биологических определителей укладывается в сравнительно небольшое число принципиально отличающихся типов. Сохранившая до сих пор свою полноту классификация форм диагностических ключей была опубликована в "Энтомологическом обозрении" на заре компьютерной эпохи (Лобанов, 1972).


 

Вместо эпиграфа:
 
Ключи составляются теми, кому они не нужны,
для тех, кто не сможет ими пользоваться

Для обсуждения основных вопросов диагностики необходимо уточнить используемую терминологию.

Так как определители (особенно - компьютерные) являются достаточно сложными системами и имеют множество различных характеристик, то существует и множество различных классификаций ключей по разным аспектам. Однако две характеристики имеют особое значение и должны быть выделены в первую очередь.

Эти две характеристики ключа никак не связаны друг с другом (легко можно построить одновходовый политомический ключ и многовходовый дихотомический), но из-за того, что большинство традиционных текстовых (докомпьютерных) одновходовых ключей были строго дихотомическими, а появившиеся сравнительно недавно многовходовые ключи (табличные, перфокартные и компьютерные) обычно являются политомическими, произошло смешение понятий и до сих пор (несмотря на все усилия теоретиков биологической диагностки) многовходовые ключи многие называют просто политомическими, что абсолютно неверно.

Рекомендации по составлению традиционных текстовых одновходовых ключей публиковались неоднократно и здесь нет необходимости рассматривать этот аспект. Стоит только отметить различия в форме серийных (наиболее распространенных в отечественной энтомологической литературе - см. пример) и скобочных (почти всегда используемых за рубежом, но появляющихся все чаще и у нас - см. пример) текстовых определителей. При подготовке новых изданий нужно, конечно, отказываться от устаревшей традиции и публиковать более удобные для пользователей скобочные ключи, в которых теза и антитеза стоят рядом.

Важнее коснуться здесь более злободневных проблем создания компьютерных определителей. Во многом они превосходят традиционные печатные ключи и постепенно находят все большее применение даже у консервативно настроенных биологов. Главный их недостаток известен только составителям (а не пользователям) и заключается в гораздо большей трудоемкости создания хорошего ключа. С ростом числа включаемых в определитель таксонов затраты на создание одновходового текстового определителя растут в арифметической прогрессии, а на создание многовходового компьютерного - в геометрической.

Понятие "компьютерная идентификация" стало настолько широким, что необходимо четко ограничить ту область, о которой здесь и на других страницах нашего сайта идет речь. Во-первых, здесь рассматриваются только таксономические диагностические системы, которые предназначены для отнесения экземпляров животных к заранее установленным таксонам. Во-вторых, здесь не рассматриваются такие постановки этой задачи, в которых признаки таксонов не выделяются заранее в явной форме экспертом, а формируются самой программой. Такие системы известны в биологии (например - Katsimis, Poularikas, 1986; Draper, Keefe, 1989), но их разработкой занимается весьма специфичная отрасль кибернетики - теория распознавания образов. Наконец, существуют системы, в которых признаки таксонов выделяются экспертом, но считывание этих признаков с определяемого экземпляра производит не сам человек, а оптическое устройство и управляющая им программа. Такого рода системы разрабатываются специалистами по автоматической обработке изображений (Fdez-Valdivia J. et al., 1992), они используются и в нашем институте (Galtsova, Kulangieva, 1995; Galtsova, Starobogatov et al., 1995) для идентификации нематод и моллюсков, но их рассмотрение тоже лежит за пределами нашего обзора.

Подробнее об истории, современном состоянии и проблемах биологической диагностики можно прочесть на другом сайте этого же портала

Первые работы по использованию компьютеров для идентификации биологических объектов появились в конце 60-х годов (Кискин и др., 1965; Ladley, 1965; Goodall, 1968; Morse, 1968 и др.). Это вызвало интерес к истории и теории построения ключей и вскоре привело к выделению в самостоятельную научную дисциплину биологической диагностики - прикладной ветви систематики, занимающейся теорией и практикой построения диагностических ключей. В начале 70-х годов наблюдался первый пик активности в области разработки методов компьютерной идентификации. Именно в этот период состоялся исторический симпозиум в Кембридже в 1973 году и вышел сборник его трудов - "Biological Identification with Computers" (Pankhurst, 1975), ставший на многие годы библией для ученых, работающих в этой смежной области биологии и информатики. Но только с широким распространением персональных компьютеров стали появляться не только теоретические статьи, но и действительно удобные программы для диалогового определения и автоматизированного построения биологических ключей. Важной вехой в биологической диагностике стала недавняя конференция в Кентербери (декабрь 1996, Великобритания) - "Computer-based Species Identification", специально посвященная компьютерным аспектам идентификации и очередной годовщине симпозиума в Кембридже. Наблюдения за тридцатилетней эволюцией компьютерных ключей "изнутри" (в качестве участника этого процесса) дают повод для оценки ее результатов и дальнейших перспектив. В весьма обобщенном виде можно выделить 2 этапа этой эволюции: этап увеличения разнообразия компьютерных ключей и этап их последуующей конвергенции.

Первый этап был обусловлен очень различающимися возможностями биологов разных стран и разных учреждений в сфере hardware. Для опытов в области диагностики использовались тогда обычно большие ЭВМ с очень разной периферией и существенно разными способами доступа пользователя к ресурсам машины. Естественно, что это вызвало появление очень разных диагностических программ - от простейшего поиска в пачке машинных перфокарт до вполне приемлемых интерактивных ключей.

Вместе с выработкой теоретиками оптимальных способов построения ключей совершенствовались и компьютеры. Уже более десяти лет разработки ориентируются на персональные компьютеры, превосходящие по мощности гигантские ЭВМ 60-х и 70-х годов. И теперь центр разнообразия программ переместился в область их интерфейса и способов использования графических изображений. А внутреннее устройство компьютерных ключей испытало заметную конвергенцию и теперь почти все диагностические программы, претендующие на широкое использование биологами, пришли в своей сути к практически одинаковому оптимальному варианту, который можно сформулировать так: "многовходовый политомический диалоговый пошаговый компьютерный ключ, с широким использованием изображений таксонов и их признаков, с машинной оценкой и ранжированием признаков на каждом шаге определения и с набором приемов для повышения надежности определения". Особый интерес представляют появившиеся в последние годы ключи, которые используют возможности Internet.

Практически все современные компьютерные ключи являются пошаговыми - с использованием одного признака или нескольких признаков на каждом шаге и с циклическим повтором одних и тех же операций для этих шагов. И, конечно, все рассматриваемые программы являются диалоговыми или интерактивными, т.е. подразумевающими поочередные действия компьютера и пользователя (ранее, до появления персональных компьютеров, альтернативой был пакетный режим использования компьютера, когда пользователь сдавал оператору задание на обработку и через несколько минут или часов получал ответ - диалог при этом исключался).

Обобщенный сценарий работы диагностических программ можно представить в виде такого алгоритма:

1. Оценка всех возможных признаков для имеющегося множества возможных таксонов и выдача их пользователю для выбора.

2. Выбор пользователем наиболее удобного признака и ввод в компьютер сведений о состоянии этого признака у определяемого экземпляра.

3. Перебор программой всех возможных таксонов и редуцирование этого набора за счет таксонов, которые не имеют введенного состояния.

4. Если определение не закончено, то переход к пункту 1 - следующий шаг определения.

К наиболее современным и перспективным программам, реализующим компьютерные интерактивные многовходовые ключи, можно отнести:

Рассмотрение и обобщение положительных черт всех известных программ позволяет синтезировать описание "идеального" компьютерного определителя. Бесспорно, что им должен быть многовходовый политомический ключ. На каждом шаге программа должна создать пользователю наиболее благоприятные условия для выбора признака. Лучше всего предъявлять признаки не в стандартном порядке, а в порядке убывания их диагностической ценности - математической оценки потенциальной возможности разделить имеющийся набор таксонов на минимальные поднаборы (в идеале - ценность должна быть комплексной оценкой, одновременно оптимизирующей длину пути определения и надежность диагноза, особо оптимизируя эти параметры для наиболее обычных таксонов). Для правильного понимания сути признаков желательно делать упор не на их текстовые описания, а на выразительные поясняющие рисунки. При большом числе признаков имеет смысл разделять их на группы и давать пользователю возможность работы с признаками только одной группы. При переходе к выбору состояния внутри признака иллюстрации еще более необходимы. Дополнительными удобствами в этот момент являются возможность множественного выбора (указания сразу нескольких состояний, если нет уверенности в выборе только одного) и особые отметки у тех состояний, которые не могут иметь место у таксонов текущего набора (выбор таких состояний обычно является ошибкой и лучше пользователя об этом предупреждать).

На заключительном этапе шага программа обычно редуцирует текущий набор таксонов, оставляя в нем только те таксоны, у которых может быть заданное состояние признака. Если таких таксонов 2 или более, программа должна сделать переоценку доступных признаков и перейти к следующему шагу. Более перспективным является несколько другой подход, при котором исходный набор таксонов вообще не редуцируется, а на каждом шаге только пересчитываются вероятности принадлежности к каждому из таксонов накопленного за пройденные шаги "образа" определяемого экземпляра. Такой подход позволяет получить правильное определение даже при ошибке пользователя в части признаков. После завершения шага пользователь должен без дополнительных действий узнать его результат - увидеть число оставшихся в редуцированном наборе таксонов или список таксонов, имеющих наибольшую вероятность соответствия введенным признакам (при втором подходе). В последнем случае при работе с большими ключами (на десятки и сотни таксонов) надо создать возможность пользователю видеть не все таксоны, а только те, вероятность которых превышает некоторый порог. Желательно дать возможность просмотреть изображения таксонов из текущего набора - иногда это может существенно облегчить окончание диагноза. При обнаружении пользователем ошибки в уже введенных признаках программа должна давать возможность "отката" - возврата на один или несколько шагов для исправления ошибки. После окончания диагноза желательно выдать пользователю максимально полный набор сведений о таксоне, обязательно включающий дополнительные дифференцирующие признаки для проверки и рисунки (как тотальные, так и важнейших деталей строения).

Этот гипотетический оптимальный вариант можно сформулировать так: "многовходовый политомический диалоговый пошаговый компьютерный ключ, с широким использованием высококачественных цветных изображений таксонов и их признаков, с машинной оценкой и ранжированием признаков на каждом шаге определения и с набором приемов для повышения надежности определения".

Особый интерес представляют появившиеся в последние годы ключи, которые используют возможности, предоставляемые протоколами Internet. Наиболее просто конструируются при этом одновходовые ключи, легко реализуемые средствами гипертекста. Даже используя только минимальный набор тэгов языка HTML можно построить достаточно удобный и эффективный ключ. Использование Java-скриптов и апплетов позволяет дополнить такой ключ очень полезными возможностями. К сожалению еще мало попыток создать для использования в сети Internet настоящий многовходовый ключ, работающий со стандартной базой данных, например, через интерфейс CGI или ODBC. Но быстрое развитие инструментальных средств для этой глобальной сети позволяет надеяться на то, что в ближайшее время появятся и новые интересные реализации многовходовых ключей.

Анализ последних достижений компьютерной диагностики позволяет сделать вывод о том, что современные компьютерные интерактивные определители уже ни в чем не уступают даже самым лучшим традиционным бумажным изданиям, а преимуществ перед последними имеют столько, что по эффективности, доступности для неспециалистов в области систематики и надежности определения они уже примерно на порядок превосходят печатные ключи. Несомненно, что накопление диагностической информации в стандартных базах данных или в формате DELTA для последующего использования в интерактивных многовходовых ключах станет в ближайшее время стандартным приемом работы систематиков в ботанике и зоологии.

ЛИТЕРАТУРА

Бутаков Е.А., Лелеков С.Г. Диалоговая система определения объектов на основе графического интерфейса // Взаимодействие человека с компьютером. Доклады 1-го Московского Международного семинара, Москва, 5-9 августа 1991. - М.: ICSTI, 1991. С. 353-357.

Бутаков Е.А., Лелеков С.Г. и др. Компьютерное определение личинок рыб Черного моря // Вопросы ихтиологии. 1995. Т. 35, N 1. С. 43-47.

Dallwitz M.J., Paine T.A. User's Guide to DELTA System. A general system for coding taxonomic description // Division of Entomology. Report N 13 (Third Edition). 1986. Canberra: CSIRO. 80 p.

Дианов М.Б., Лобанов А.Л. PICKEY - program for identification of organisms by interactive use of images // Базы данных и компьютерная графика в зоологических исследованиях (Труды Зоологического института, т. 269). 1997. С. 35-39.

Draper S.R., Keefe P.D. Machine vision for the characterization and identification of cultivars // Plant Varieties and Seeds. 1989. Vol. 2, N 1. P. 52-62.

Estep K.W., Sluys R., Syvertsen E.E. "Linnaeus" and beyond: workshop report on multimedia tools for the identification and database storage of biodiversity // Hydrobiologia. 1993. Vol. 269/270. P. 519-525.

Fdez-Valdivia J. et al. Line detection and texture analysis for automatic nematode identification // J. Nematology. 1992. Vol. 24, N 4. P. 571-577.

Galtsova V.V., Kulangieva L.V. Expert system for identification of freeliving nematodes // 9-th International Meiofauna Conference. Perpignan, France. 1995. P. 62.

Galtsova V.V., Starobogatov Ya.I. et al. The conceptual scheme of expert system for taxonomy of invertebrates (with special reference to nematodes and mollusks // Towards a regional ETI Branch in St. Petersburg. 1995. P. 21-22.

Katsimis C., Poularikas A.D. Pattern recognition of zooplancton images using circular sampling technique // Proc. SPIE, 1986, vol. 596. P. 207-211.

Кискин П.Х., Печерская И.H., Печерский Ю.H. Автоматизация диагностического поиска сортов винограда на ЭВМ "Минск-1" // Виноделие и виноградарство СССР. 1965. N 1. С. 21-22.

Лобанов А.Л. Логический анализ и классификация существующих форм диагностических ключей // Энтомол. обозр. 1972. Т. 51, N 3. С. 668-681.

Лобанов А.Л. Оценка диагностической ценности рядов признаков в многовходовых определителях, рассчитанных на использование ЭВМ // Тезисы докладов VI Коми республиканской молодежной научной конф. Сыктывкар. 1974. С. 125-126.

Лобанов А.Л. Результаты экспериментов с биологическими диагностическими системами на базе ЭВМ "Hаири-С" // Биологические исследования на Северо-Востоке Европейской части СССР (Ежегодник Института биологии Коми филиала АH СССР). Сыктывкар. 1975а. С. 162-168.

Лобанов А.Л. Математический аппарат для расчета, оценки и сравнения конструктивных параметров диагностических ключей // Зоол. ж. 1975б. Т. 54, вып. 4. С. 485-497.

Лобанов А.Л. Принципы построения определителей насекомых с использованием электронных вычислительных машин. - Автореферат диссертации на соискание ученой степени канд. биол. наук. Л.: ЗИH АH СССР, 1983. 19 c.

Лобанов А.Л., Дианов М.Б. Диалоговая компьютерная диагностическая система BIKEY и возможности ее использования в энтомологии // Энтомол. обозр. 1994. Т. 73, вып. 2. С. 465-478.

Лобанов А.Л. Dialogue PC-based biological identification systems BIKEY5 and BIKEY6 // Базы данных и компьютерная графика в зоологических исследованиях (Труды Зоологического института, т. 269). 1997a. С. 61-65.

Лобанов А.Л. Biological identification with computers: 30 years of evolution // Компьютерные базы данных в ботанических исследованиях. Сборник научных трудов. 1997b. С. 51-55.

Лобанов А.Л., Степаньянц С.Д. Оптимизация определителя семейств медуз подотряда Filifera (Hydrozoa, Athecata) с помощью компьютерной диагностической системы. // Морской планктон. Систематика, экология, распределение. 2 (Исследования фауны морей. Вып. 45 (53)). 1993. С. 38-50.

Лобанов А.Л., Степаньянц С.Д., Дианов М.Б. BIKEY - диалоговая компьютерная программа для определения биологических объектов и ее использование в диагностике книдарий // Книдарии. Современное состояние и перспективы исследований. 2 (Труды Зоологического института. Т. 261). 1995. Т. 261. С. 20-70.

Lobanov A.L., Stepanjants S.D., Dianov M.B. Dialogue computer system BIKEY as applied to diagnostics of Cnidaria (illustrated an example of hydroids of the genus Symplectoscyphus) // Scientia Marina (Special volume: Advances in Hydrozoan Biology; S.Piraino, J.Bouillon et al. (eds.)). 1996. Vol. 60, N 1. P. 211-220.

Lobanov A.L., Schilow W.F., Nikritin L.M. Zur Anwendung von Computern fur die Determination in der Entomologie // Deutsch. Entomol. Z., 1981, N.F. 28, Heft 1-3. S. 29-43.

Miller M.G., Day E.R. Interactive taxonomy: name that bug in three touches or less // Amer. Entomol. 1990. Vol. 36, N 3. P. 219-224.

Morse L.E. Construction of identification keys by computer // Amer. J. of Botan. 1968. Vol. 55, N 6. P. 737.

Morse L.E. Computer programs for specimen identification, key construction and description printing using taxonomic data matrices // Publ. Mus. Michig. State Univ., Biol. Ser. 1974. Vol. 5, N 1. P. 1-128.

Morse L.E. Recent advances in the theory and practice of biological specimen identification // Biological Identification with Computers. London. 1975. P. 11-52.

Pankhurst R.J. A computer program for generating diagnostic keys // Computer J. 1970. Vol. 13, N 2. P. 145-151.

Pankhurst R.J. (ed.). Biological Identification with Computers. - London: Academic Press, 1975. 333 p.

Pankhurst R.J. Biological Identification. The principles and practice of identification methods in biology. - London: Edward Arnold, 1978. 104 p.

Pankhurst R.J. Practical taxonomic computing. - Cambridge: Cambridge University Press, 1991. 202 p.

Payne R.W., Preece D.A. Identification keys and diagnostic tables: a review // Journ. of the Royal Statist. Soc., Series A. 1980. Vol. 143, N 3. P. 253-292.

Свиридов А.В. Проблема соотношения биологической диагностики и систематики // Журн. общ. биол. 1973. Т. 34, N 6. С. 900-906.

Свиридов А.В. Материалы по истории методов диагностики биологических объектов // Hаучн. докл. высш. школы. Биол.науки. 1976. N 8. С. 7-22.

Свиридов А.В. О некоторых актуальных вопросах теории идентификации биологических объектов с помощью ключей // Научн. докл. высшей школы. Биол. науки. 1978. N 10. С. 15-28.

Свиридов А.В. Ключи в биологической систематике: теория и практика. - М.: Изд-во МГУ. 1994. 224 с.

Свиридов А.В. Типы биодиагностических ключей и их применение. - М. : Зоомузей МГУ, 1994. 1-112 с.

Sviridov A.V., Leuschner D. Optimization of taxonomic keys by means of probabilistic modelling // Biometr. Journal. 1986. Vol. 28, N 5. P. 609-616.

А.Л. Лобанов, 2003-2010 гг.


На нашем сайте вы можете воспользоваться довольно большим набором определителей (к сожалению - пока одновходовых и чисто текстовых) - такого же типа информация есть в разделе "Определители жуков":
 
Г.Г. Якобсон. Определитель жуков [европ. части СССР]. 1931. 2-е изд.
О.Н. Кабаков. Пластинчатоусые жуки подсем. Scarabaeinae фауны России и сопредельных стран (2006)
С.И. Медведев. Фауна СССР. Жесткокрылые. Т. X, вып. 4. Сем. Scarabaeidae (4 подсемейства). 1960.
В.Н. Старк. Короеды (Ipidae [ныне - Scolytidae]). Фауна СССР. Том 31. 1952.
Определитель семейств подотряда Archostemata (англ.)
Определитель семейств водных жуков России (по имаго)
Определитель семейств водных жуков России (по личинкам)
Определитель семейств водных жуков России (по куколкам)
Определитель водных жуков России (веб-версия книги)
Определитель водных жуков России: общая часть и определители семейств
Определитель водных жуков России: семейство Haliplidae
Определитель водных жуков России: семейство Noteridae
Определитель водных жуков России: семейство Gyrinidae
Определитель водных жуков России: семейство Dytiscidae (ключи для определения имаго)
Определитель водных жуков России: семейство Dytiscidae (ключи для определения личинок и куколок)
Определитель водных жуков России: семейства Hydraenidae, Hydrochidae, Helophoridae
Определитель водных жуков России: семейство Hydrophilidae
Определитель водных жуков России: семейство Scirtidae
Определитель водных жуков России: семейство Limnichidae
Определитель водных жуков России: семейство Dryopidae
Определитель водных жуков России: семейство Elmidae
Определитель водных жуков России: семейство Heteroceridae
Определитель водных жуков России: семейство Chrysomelidae
Определитель водных жуков России: семейство Curculionidae
Определитель сибирских подродов рода Pterostichus (Carabidae)
Определитель видов рода Pterostichus (Carabidae) острова Сахалин (англ.)
Определитель видов рода Pterostichus (Carabidae) Самарской области