В последнем случае используются представления, основанные на совершенно разных логиках (которые недопустимо перемешивать!), что в лингвистике, в отличие от других дисциплин, явно отрефлексировано.

Одна логика – логика реконструкции генезиса ностратических языков, основанная на панхронических законах диахронических изменений языковых явлений (диахронические универсалии). В этом случае классификация отображает логику генетической реконструкции. Другая логика – логика исторических реконструкций, например, романских языков, основанная на большом количестве письменных источников (относящимся к разным синхроническим срезам), ареальных и диалектных данных, так что их классификацию можно рассматривать как след истории. В том случае, если фиксируются не только определенные состояния языков, но и траектории их связывающие, речь идет о генеалогических классификациях. Подобное различение генетических и исторических классификаций четко осуществлено только в лингвистике, и отсутствует в естествознании (лишь намечено в почвоведении и геологии – Розова, 1986).

Лингвистика с 1930-ых годов стала областью, сыгравшей особую роль в переоценке правила соизмеримости объема таксонов. В работах Дж.Ципфа (Zipf, 1935, 1938) показана резкая неравночисленность вхождения репертуарных единиц (букв, лексем, словоформ и т.п.) в текст и дано аналитическое описание соответствующего распределения, чему была дана психолингвистическая интерпретация в духе принципа экономии усилий А.Мартине. С этого момента type-taken отношение становится предметом пристальных исследований (напр., Herdan, 1966). Тем самым оказывается привычной несоизмеримость объемов соответствующих таксонов. Аналогичные результаты были получены и в других областях (распределения Мандельброта, Лотки, Парето, Виллиса). При этом в биологии приближение распределения к идеальному распределению Виллиса с 1920-ых начинает рассматриваться как критерий качества классификации (Willis, 1922).

Новый всплеск интереса к этой проблематике относится к 1970-ым годам. Тогда на основе изучения распределения лексем в “Войне и мире” Ю.К.Орлов (1970) показывает, что ципфовское распределение выполняется не на выборках больших объемов, а на целостных компонентах крупных структур. С этого момента ципфовость начинает рассматриваться как критерий качества выделения классифицируемых элементов (т.е. решения мереологических задач – Мейен, 1977) и качества классификации (Мейен, Налимов, 1979, Meyen, Nalimov, 1979).

Такая модель подвергалась сомнениям в работах Г.Я.Мартыненко, который рассматривает эмпирические распределения данного типа как смесь двух идеальных распределений – ядерных и периферических элементов (Мартыненко, 1978, 1982; ср. саранчовая и ноева касты – Кудрин, 1996).Тем не менее, в последнее десятилетие интенсивно развивается теория распределений данного типа как альтернативы гауссоподобных распределений (Крылов, 1996, Кудрин, 1996), с точки зрения которой резкая неравночисленность классов как критерий качества классификации приобретает фундаментальное значение. При этом оказывается, что удовлетворение распределениям данного типа является необходимым условием выполнения закономерностей Сухоноса – Численко (Чебанов, 1996).

Сходство таксонов и архетипов

Достаточно часто сходство таксонов отождествляется со сходством архетипов. При этом сходство может пониматься как похожесть таксонов и архетипов (сходство в узком смысле) и как их порождение одним преобразованием (родство). Если это преобразование генетическое, то речь идет о генетическом родстве, на основе которого строятся так называемые типологические классификации, если историческое – то об историческом родстве и, соответственно, генеалогических классификациях. Разновидностью исторического родства будет заимствование (лексики, грамматики).

Степень сходства оценивается мерами сходства (см. напр., Иерархические классификационные построения…,1979, Шаталкин,1988). Обычно это меры сходства архетипов, представляемых как набор признаков. В зависимости от избранной математической модели вводятся различные критерии различения и сходства. Часто при различении таксонов придается значение наличию хиатуса, который трактуется по наличию границ или статистически. Набор используемых мер сходства при этом не отличается от используемых за пределами лингвистики.

Но существуют и характерные для лингвистики меры сходства. Так, в глоттохронологии различие таксонов рассчитываются как время, необходимое на расхождение по одному признаку (Арапов, Херц, 1974)[5]. Своеобразно и понятие рангового среднего (Мартыненко, 1988), введенного на лингвистическом материале, но имеющего потенциально более широкое применение.

Важным при вынесении суждений о сходстве является вопрос об источнике сведений о сходстве. Обычно таким источником являются наблюдения за конкретным языковым материалом и логика лингвистических классификаций строится на этом предположение. Однако, это не всегда справедливо – значительное количество лингвистической информации является результатом реконструкций. Последние же даже в случае абсолютной надежности обладают иным онтологическим статусом, чем статус наблюдаемого. В результате создаваемые классификации охватывают как эмпирически данные, так и реконструированные единицы, что затрудняет применение классификационных алгоритмов, а порой и чревато ошибками.

В указанном контексте весьма сложен вопрос об использовании в качестве источника суждений о сходстве экспертных оценок. Они могут быть результатом как чрезвычайно тонких наблюдений особо изощренных специалистов, так и гениальных прозрений лингвистически одаренных исследователей. При этом обоснование экспертных оценок не может быть дано в логике обычного научного исследования. Поэтому возникает вопрос об отношении к таким заключениям и возможности включения их данных либо в сферу наблюдения, либо реконструкции. В случае невозможности подобного различения пользоваться такими данными можно, но необходимо зафиксировать экспертный источник соответствующей информации. Другой путь привлечения экспертных оценок – обращение к лингвистическому эксперименту или экспериенциальным моделям американских психо-лингвистов.

С указанным вопросом связан вопрос об обосновании достоверности суждений о сходстве. Обычно предполагается, что источником достоверности является метод, но на деле оказывается, что метод далеко не всегда предъявлен. Еще меньшее количество материала действительно обработано исследователем с помощью заявленного метода, а не заимствовано из результатов предшествующих исследований. В итоге часто источником достоверности суждений о сходстве является профессиональное предание, которое может быть и неверным. В связи с этим возникает проблема того, нужно ли и можно ли подвергать каждую гипотезу о сходстве испытанию на верификацию или фальсификацию.

В том случае, если сходство вводится как отношение эквивалентности, таксоны оказываются изолированными и связанными между собой внешними отношениями (например, родства), представляемыми в виде деревьев. Если сходство задается отношением толерантности, то таксоны представляются в виде град или конгрегации. Таксоны одной конгрегации могут замыкаться в кольцо.

Такие таксономические структуры представляют собой не только экстенсиональное заполнение индивидами соответствующих таксонов, но и построение таксономических структур как системы связок таксонов и индивидов (например, связок генетических или по отношению тип-вариант). При этом оказывается возможным построение высоко экстенсиональной системой со сложной формой связи таксонов. Тогда таксономическое сходство может определяться положением в системе и быть относительно независимым от сходства архетипического (например, некоторые таксоны в генеалогической классификации языков – английский среди германских языков).

Идентификация

Под идентификацией понимается возможность отнесения произвольного, как ранее исследованного, так и вновь встреченного индивида из заведомо известного таксона к этому таксону. Главной проблемой идентификации является то, что среди встреченных индивидов могут быть не относящиеся ни к одному известному таксону, а принадлежащие новому таксону. Никакими регулярными процедурами эта проблема разрешена быть не может и установление нового таксона в такой ситуации всегда хотя бы маленькое открытие. )