// Общая и прикладная ценология. – 2007. – № 6.– С. 15-18.

 

О науке "Общая и прикладная ценология"

Б.А. Трубников1, О.Б. Трубникова2

1 Институт ядерного синтеза РНЦ "Курчатовский институт"

2 Институт биологии развития РАН им. Н.К. Кольцова

 

В статье обсуждаются общие проблемы ранговых и иных распределений.

The general problems of the range and other distributions are discussed in the paper.

 

 

 

Термин "общая ценология" предложил и ввёл в 1971 г. проф. Б. И. Кудрин* для обозначения совокупности наук, включающей науки о биоценозах (сообществах взаимозависимых живых организмов), о техноценозах (взаимодополняющих механизмов и машин) и о социальных и экономических сообществах людей. Все эти множества обладают многими общими чертами в структуре, поведении и развитии, что оправдывает необходимость и полезность их совместного рассмотрения, сопоставления и изучения. Основой их практического и теоретического анализа являются наука статистика и теория вероятностей.

 

В данной статье обсуждаются некоторые заблуждения и недоразумения в терминологии, используемой указанной наукой, и ряд общих проблем. В частности рассмотрены вопросы:

1) о правильном понимании "логнормального распределения";

2) о правильном выборе осей для ранговых распределений;

3) что считать "нормой";

4) можно ли считать, что галактики конкурируют;

5) о гамильтоновой форме теории конкуренции и "питающих потоках".

1. O правильном понимании "логнормального распределения"

Нормальным (гауссовым) распределением общего числа N некоторых объектов по характеризующему их параметру х (характеристике) называют экспоненциальную формулу Гаусса

dN=W(x)dx, где W(x)=A exp[,                              (1.1)

где <x> – среднее значение,  – среднеквадратичное отклонение от среднего, W(x) – вероятность того, что в линейный интервал dx попадут dN объектов; наконец, А – коэффициент нормировки, определяемый интегралом

, A=.                   (1.2)

Как видим, здесь под интегралом была сделана замена переменной (x –<x>)/. При этом новая переменная y меняется в тех же пределах , что и старая . Как известно, под интегралом можно делать любую замену переменной, руководствуясь лишь соображениями удобства и полноты описания всего массива данных. Рассмотрим, например, три возможных замены:

I)    (x - <x>)/  =ln (z) для интервала (0 < z < ;

II)   (x - <x>)/   =tg (z) для интервала ();

III)  (x - <x>)/  s=sh (z) для интервала .

Здесь =ln(z) – натуральный логарифм, =tg(z) – тангенс и s=sh(z) – гиперболический синус. Быть может, наиболее удобной здесь является вторая замена с тангенсом, поскольку для неё интервал переменной () конечен. Для них найдём три вида записи формулы (1.1):

I)         dN=w()d=(А)exp(-)d=W1(z)dz,

где W1(z)=(А)exp[-(lnz)];                                                                           (1.3)

II)      dN=w()d=(А)exp(-)d=W2(z)dz,

где W2(z)=(А)exp[-(tgz)](1+(tgz)];                                                    (1.4)

III) dN=w(s)ds=(А)exp(-s)ds=W3(z)dz,

где W3(z)=(А)exp[-(shz)]ch.                                                                     (1.5)

В "эквивалентных" безразмерных переменных (, , s) все три формулы (1.3–1.5) представляют собой просто тривиальное повторение формулы Гаусса. Формулу (1.3) с логарифмами часто называют "логнормальным" распределением; формулу (1.4) можно было бы назвать "тангенс-нормальным", а формулу (1.5) – "гипер-синус-нормальным" распределением. Игра в эти названия, строго говоря, не имеет большого смысла.

Однако, некоторые "упрямые практики от статистики" (термин взят нами из [10]) полагают, что если в формуле Гаусса произвести замену переменных типа "хlnx", то получится "логнормальное распределение" вида

dN=Аexp[-а(b-ln х*)],                                                                (1.6)

где (А, а, b) – параметры, находимые путём подбора для разных конкретных случаев.

При этом, по нашему мнению, допускается существенное искажение в интерпретации новой переменной х*, а именно: часто она ошибочно интерпретируется так же, как и исходная переменная х, несмотря на то, что её смысл оказывается совершенно иным. Например, исходная кривая Гаусса симметрична по отклонениям налево и направо от среднего значения <x>. Но теперь вся левая половинка кривой Гаусса с интервалом (в новой переменной оказывается сжатой в малом интервале . А бывшая ранее симметричной правая половинка кривой Гаусса с интервалом теперь располагается в бесконечной области . Введение такого отличия явно не имеет никакого наглядного смысла.

Так что "логнормальное распределение" с формулой (1.6) явно не является "нормальным", и его можно рассматривать лишь как одну из возможных полезных аппроксимаций, но не следует утверждать, что она является столь же строго обоснованной (в математическом смысле), как и формула Гаусса. Заметим, что часто предполагается использование логнормального распределения только для положительных величин, например, долей х полной вероятности, нормированной на единицу. Но тогда зачем же заранее вводить это распределение, имеющее область с отрицательными значениями логарифмов  в интервале

Итак, имеем две возможности:

• либо формула логнормального распределения используется исследователем только как понравившаяся ему аппроксимация, но тогда весьма неудобен её интегральный спектр, выражаемый неэлементарным интегралом ошибок (хотя для него имеются таблицы и компьютерные программы для вычисления);

• либо опытные статистические данные весьма хорошо ложатся на логнормальную кривую, но тогда это означает, что исследователь этого логнормального распределения не заметил сделанного им крупного открытия – а именно того факта, что логарифмы этих величин распределены точно по нормальному закону Гаусса, а это заслуживало бы всеобщего внимания как новый закон природы для рассмотренного им явления.

2. О правильном выборе осей для ранговых распределений

Распределения многих массивов статистических данных часто описывают интегральным так называемым "ранговым распределением" вида

N(R)=,                                                         (2.1)

где R=1; 2; 3; … – номер ранга,  "поправка Мандельброта",  показатель распределения, А – множитель нормировки, а N(R) – число особей или объектов во всех рангах с номерами меньше R. Первым рангом принято называть самый многочисленный (саранчёвые касты), а в более высоких рангах число особей убывает (ноевы касты) примерно по закону гиперболы. Поэтому наш отечественный замечательный энтузиаст и пропагандист подобных исследований проф. Б. И. Кудрин, собравший около 1000 примеров сходных распределений (в основном трав и "техноценозов"), назвал их Н-распределениями, т. е. гиперболическими распределениями. И применительно к травам и техноценозам формулу (2.1) с показателем  следовало бы называть "законом Ципфа–Кудрина".

Здесь, во-первых, полезно отметить, что ранги можно было бы перенумеровать и в обратном порядке ("капитанов первого ранга" мало, а "кавторангов" больше). Во-вторых, на соответствующих графиках обычно номер ранга откладывают по горизонтальной оси, а числа N(R) – по вертикали, и это, по нашему мнению, ведёт к неверному представлению о том, "кто от кого зависит" – число N(R) от ранга, или наоборот – ранг от числа N(R)?

На первый взгляд, этот вопрос может показаться несущественным. Особенно если учесть, что в логарифмических осях ранговое распределение с показателем  имеет вид прямой линии с наклоном 45о, которая не меняется при смене осей. Однако, полагая для простоты , перепишем формулу (2.1) в виде обратной зависимости:

R=R(N)=A(.                                                                                  (2.2)

Отсюда ясно виден простой смысл поправки Мандельброта, а именно, её следует положить равной , где  – число особей в самом многочисленном минимальном ранге. Тогда формула (2.2) принимает наглядный вид:

,                                                                              (2.3)

и если число особей заключено в пределах , то максимальный ранг (т. е. полное число рангов) должен равняться

А(.                                                                                 (2.4)

Более того, для сопоставления её с развитой нами в работах [1–8] "теорией конкуренции", здесь целесообразно ввести ещё один малый параметр а, и переписать выражение (2.3) в форме:

.                                         (2.5)

Именно такой интегральный спектр объектов и получен в наших работах [1–8]. Но только в них число N названо "массивностью" или "весомостью" объекта и обозначено m, а ранг R обозначен как N(m), так что формула (2.5) в наших работах имеет вид

N(m)=   ,                                                                    (2.6)

и производную dN/dm следует рассматривать как дифференциальный спектр распределения числа объектов (номера ранга) по "весомости" входящих в данный ранг особей. Таким образом, в общепринятой теории ранговых распределений следует исправить две ошибки: во-первых, поменять оси; во-вторых, сменить нумерацию рангов на обратную. Как видим, экспонента, естественным образом возникающая в нашей теории конкуренции, помогает устранить расходимость спектра в области малых значений m (в случае, если  (быть может, термин "теория конкуренции" лучше заменить на термин "теория негауссовых распределений". Отметим, однако, что в 1900 г. Л. Бар-шелье защитил в Сорбонне диссертацию с названием "теория спекуляции", что теперь рассматривается как начало математического подхода в экономике).

Важно отметить, что самой замечательной особенностью спектра (2.6) является отсутствие для него понятия "среднее". Например, в английском языке наиболее часто встречается комбинация "the", которая даже не является словом. А "средней по весу" рыбой океана, скорее всего, окажется либо "зоопланктончик", либо рачок криль, также не являющийся рыбой.

Аналогично этому, и понятие "средняя зарплата" имеет мало смысла, хотя довольно часто используется. Информативный смысл имеет лишь полный вид всего графика распределения людей по доходам. "В норме" этот график в логарифмических координатах должен иметь вид прямой линии с наклоном в 45о  ("закон Парето").

3. Что считать "нормой"

Интегральный спектр (2.5) с экспонентами удобно переписать в виде

.                                                               (3.1)

Как уже пояснялось, при  он переходит в гиперболическое распределение (2.4):

А(,                                                                                  (3.2)

которое договоримся чисто условно называть "нормой". Малый параметр  будем называть "параметром отклонения" от нормы. Он почти не влияет на вид правого края распределения (3.1) при больших значениях аргумента m<mmax в той области, где >>, но существенно влияет на поведение начального левого края спектра при малых значениях аргумента в той области, где . При отрицательных значениях <0 этот параметр поднимает вверх левый край спектра, что особенно хорошо видно по дифференциальному спектру (2.6); при положительных значениях  этот параметр понижает и выполаживает левый край спектра, полностью обрезая его в пределе малых

Как видим, этот параметр имеет существенное значение в проблемах статистики различных социальных показателей. Он играет ту же роль, что и вводимый социологами и экономистами так называемый параметр "джи-джи" в проблемах распределения доходов различных групп людей. Случай  можно назвать "шведской моделью" экономики (более равномерное распределение доходов и мало бедных людей), а случай  называют "бразильской моделью" экономики (много бедных).

Очевидно, разумно построенная экономика общества должна приводить к эволюционному изменению параметра  с течением времени, стремясь уменьшить его отрицательное значение и превратить его в нуль (как минимум), или даже сделать положительным. Как мы увидим далее, для этого нужно уметь регулировать "питающие потоки" системы.

В заключение данного раздела отметим, что естественное и органичное появление в нашей теории конкуренции "параметра отклонения"  удобным образом устраняет главный недостаток простых (степенных) ранговых распределений. Он состоит в том, что в логарифмических осях они имеют вид прямых линий с постоянным наклоном, определяемым показателем  Однако, многие практически наблюдаемые распределения оказываются либо вогнутыми, либо – чаще – выпуклыми, и их наклон (в логарифмических осях) не является постоянным, что требует введения дополнительных параметров для их аппроксимации.

4. Можно ли считать, что галактики конкурируют между собой

Как показывают наблюдения, галактики тоже фактически распределены по массам по формуле (2.6), но с несколько иной обрезающей экспонентой. Поэтому им также можно приписать свойство "конкуренции в борьбе" за обладание массами. Но здесь конкуренция проявляется не "как у людей", а в том, что возникновение крупной галактики в каком-либо месте в то же время устраняет возникновение в этом же месте двух более мелких галактик.

Теория рождения отдельных галактик из первично однородной материи строится следующим образом. Рассмотрим условную единицу объёма V c большими "метагалактическими" размерами, например, порядка 100 мегапарсек (в ней будет примерно 106 зародышей галактик). И будем предполагать, что вероятность дробления этого объёма (за счёт флуктуаций плотности ∂ρ) описывается квантовой "вероятностной пси-функцией" в виде суммы плоских волн r)=exp(ikr), где суммирование производится по состояниям со всеми возможными значениями волновых векторов k. Безразмерное число таких возможных состояний равно

=,                                                                 (4.1)

поэтому в среднем флуктуация плотности записывается как квадрат модуля пси-функции:

const,                                         (4.2)

где k=2π/λ и λ – длина волны. При исходно однородной плотности такой спектр принято называть "плоским". И можно считать, что масса рождающейся неоднородности (зародыша галактики) пропорциональна кубу размера длины волны, т. е. m3. Тогда распределение числа галактик в единице объёма по массам будет описываться функцией:

dN=const d(1/=Ad,                                                          (4.3)

почти совпадающей с общей "формулой конкурентов" (2.6), но без экспоненты.

Такова современная теория рождения галактик (см. [1]). А по поводу расходимости спектра (4.3) Я. Б. Зельдович замечает, что "здесь следовало бы учесть процессы диссипации и добавить обрезающую экспоненту, конкретный вид которой не столь важен, но она должна устранять галактики с малыми массами, порядка масс шаровых скоплений (с mшар солнечных масс)". Но такая экспонента вида как раз и содержится автоматически в нашей "теории конкуренции", хотя в ней не учитывается диссипация.

Поскольку спектр (4.3) рассчитан в пространстве волновых векторов k , то скорее всего обрезающая экспонента должна зависеть от квадрата этого вектора и иметь вид:

exp[-k2D2]=exp[-(mшар/m)2/3],                                                            (4.4)

где D – так называемый "радиус Джинса". Окончательно, спектр галактик следует принять равным

    ,                                                        (4.5)

и он хорошо согласуется со спектром "зародышей галактик", вычисляемым по наблюдениям "пятнистой картины" чернотельного реликтового фона.

Сходный пример "конкуренции" в неживой природе приведён также, в частности, у А. В. Бялко [9] для распределения землетрясений по поверхностной "балльности". Известный для них "закон Гутенберга–Рихтера" можно интерпретировать как проявление своеобразной конкуренции, при которой произошедшее землетрясение определённой балльности не позволяет в том же месте вскоре совершиться нескольким более слабым землетрясениям. Анализ показывает, что землетрясения "соревнуются" между собой за обладание именно площадью (а не объёмом) сдвигового разлома земной коры (примером является разлом Сан-Андреас в Калифорнии). Приводимые Б. И. Кудриным примеры рационально устроенных техноценозов также можно рассматривать как конкуренцию неживых "особей", хотя их формирование и контролируется человеком.

5. О гамильтоновой форме теории и "питающих" потоках

В наших работах [1–8] по теории конкуренции, в частности, рассмотрено распределениe всех жителей определённой страны по разным городам. При этом считались заданными и постоянными как полное население страны , так и суммарное число городов G=, различающихся индексом m, означающим число жителей данного города.

При этом в работе [4] была рассмотрена гидродинамическая модель, позволяющая вывести дифференциальный спектр распределения конкурентов вида . Продолжим далее этот гидродинамический анализ и попытаемся, по аналогии с теоретической механикой и гидродинамикой, рассматривать стационарную цифру N как гамильтониан вида

,                                                                            (5.1)

где  – "обобщённые координаты", а  – "обобщённые импульсы" системы;  некое "время эволюции системы". Тогда должны выполняться известные уравнения Гамильтона

                                                                     (5.2)

решая которые, найдём зависимости от времени для координат и импульсов:

,     .                                              (5.3)

При этом полное население страны – цифра N= действительно будет сохраняться во времени, но общее число городов G= должно сокращаться.

Эту ситуацию для наглядности можно интерпретировать по аналогии с гидродинамическим течением некоторой "жидкости", если рассматривать параметр  как "координату", отсчитываемую вдоль "оси масс", а величину  – как плотность "жидкости", т. е. число "частиц" (особей), приходящихся на единичный интервал "оси масс". Производную  следует считать скоростью "жидкости", а произведение  – плотностью потока особей вдоль "оси масс".

Из выражений (5.3) видно, что эта плотность "потока числа особей" равна  и не зависит от времени . Поскольку >0, то поток особей направлен от маленьких к большим особям, и его можно назвать потоком, "питающим" рассматриваемое множество. Так что все рассматриваемые нами системы не являются стационарными и должны эволюционировать во времени. Для каждой из них должен существовать обширный "источник пищи". Для рыб – это саморазмножающийся растительный фитопланктон, которым питается мелкий зоопланктон – первое звено в цепи живых организмов океана.

Ясно, что в системах, контролируемых человеком, задача управления этими "питающими" потоками является важнейшей проблемой сохранения цивилизации.

В заключение отметим, что найденный выше гамильтониан (5.1) можно использовать для построения "термодинамического аналога" рассматриваемых нами "сообществ конкурентов". Тогда для аналогии следует ввести условное понятие "квазитемпературы", которую обозначим θ, и построить так называемую "статистическую сумму" Гиббса:

,                                                         (5.4)

определяющую термодинамическую свободную энергию  Разумно считать произведение  в формуле (5.4) универсальной постоянной, и тогда повышение "квазитемпературы" должно уменьшать "время эволюции системы" , т. е. повышать темпы обмена веществ.

Литература

[1] Трубников Б. А. Слипание космической пыли // Природа. 1971. № 8. С. 76–77.

[2] Куснер Ю. С., Трубникова О. Б., Трубников Б. А. Распределение конкурентов // Наука и Жизнь. 1990.

[3] Трубников Б. А., Румынский И. А. Закон Ципфа–Крылова для распределения слов текста и возможность его комбинаторного вывода // Докл. АН СССР. 1991. Т. 321. № 2. С. 270.

[4] Трубников Б. А. Закон распределения конкурентов // Природа. 1993. № 11. С. 3–13.

[5] Трубников Б. А О законе распределения конкурентов // Природа. 1995. № 11. С. 48–50.

[6] Трубников Б. А., Трубникова О. Б. Пять великих распределений вероятностей // Природа. 2004. № 11. С. 13–20.

[7] Trubnikov B. A., Trubnikova O. B. Theory of Competition // Book of abstracts of 13th General Conference of the European Physical Society. EPS-13. Beyond Einstein – Physics for the 21st Centure. Bern, Switzerland, 11–15 July 2005. Invited report BR6-4-THU.

[8] Трубников Б. А., Трубникова О. Б. Пять великих распределений вероятностей и комментарии редактора к ним // Общая и прикладная ценология. 2007. № 1. С. 22–29.

[9] Бялко А. В. Конструктивность закона конкуренции // Природа. 1993. № 11. С. 14–19.

[10] Карасёв Б. В. Логарифмически-нормальное распределение // Природа. 1995. № 11. С. 41–48.

[11] Зельдович Я. Б., Новиков И. Н. Строение и эволюция Вселенной. М.: Изд-во "Наука", 1973.

 

 

Историческая справка

Ценологичность рассмотренных электродвигателей была статистически обнаружена в 1969 г., но не осознана как явление. Всё свелось к предложениям некоторых обобщающих средних (см. Промышленная энергетика. 1969. № 11), восходящих к Гауссу.

В 1971 г. получена собственно гиперболическая модель ωi=kai-b без осознания её общности.

В 1974 г. на примере сибирских заводов показана устойчивость гиперболического представления (b=1,3÷1,8), а сравнение с данными S. Garthside, A. S. Corbet, W. Kirbi, J. A. Waterhouse, Da Costa Lima and C. R. Hathaway, C. B. Williams (Lepidoptera за 1933–1936 гг., см. 1 стор. обложки) позволило высказать предположение, что "естественный отбор можно рассматривать как частный случай информационного отбора".

В 1976 г. показана применимость понятий биологии для описания и прогнозирования больших систем, формирующихся технологически; сформулирован закон информационного отбора, предложена, по Шмальгаузену, схема техноэволюции и названы три узловые точки научно-технического прогресса.

В 1981 г. показаны общность и специфика энергетического, естественного, документального, информационного отборов; приведены сравнение и интерпретация тихогенеза, номогенеза, техногенеза; описано свыше 40 законов и закономерностей эволюции биологической, которые сопоставимы с законами техноэволюции; заявлены структура и основания технетики как междисциплинарной науки о технической реальности.

 

По материалам "Сводной библиографии по технетике и электрике".

Вып. 26. "Ценологические исследования". М., 2004. Подготовила Г. А. Петрова



* Прим. ред. См. историческую справку (с….)