//Общая и прикладная ценология. – 2007. – № 4.– С. 20-24.

 

 

Эмпирический "закон Парето–Ципфа–Кудрина"

и общая теория конкуренции

А.В. Бялко1), Б.А. Трубников2), О.Б. Трубникова3)

1) Институт теоретической физики РАН им. Л. Д. Ландау,

2) Институт ядерного синтеза РНЦ "Курчатовский институт",

3) Институт биологии развития РАН им. Н. К. Кольцова

 

Вот уже 20 лет Россия осваивает законы рыночной экономики, и мы предполагаем, что читатель ознакомился с интересной предыдущей статьей Ричарда Коха "Закон Парето или Принцип 80/20".

В данной статье авторы показывают, что этот эмпирический "Закон Парето–Ципфа" можно теоретически обосновать на основе разработанной нами общей теории конкуренции. При этом оказывается, что математический вывод формулы закона Парето–Ципфа полностью аналогичен комбинаторному выводу известных Ферми–Дирака и Бозе–Эйнштейна распределений, которые для малой плотности газов переходят в распределение Максвелла–Больцмана.

1. О "законах больших чисел".

В 1900 г. французский экономист Луис Баршелье защитил в парижском университете Сорбонна диссертацию с названием "Теория спекуляции". В ней рассматривались закономерности колебаний курса биржевых акций различных компаний. Л. Баршелье заметил, что цена определённой акции длительное время поддерживается на некотором среднем уровне <x>, а отклонения цены (х-<x>) хорошо описываются известной математической формулой "нормального" распределения Гаусса. Это распределение называют также "центральной предельной теоремой математики" или "законом больших чисел". В 1997 г. Нобелевская Премия по экономике была присуждена Шоулзу и Мертону "за развитие теории Баршелье".

В ряде наших работ (см. список литературы) была предложена теория конкуренции, приводящая к формуле, которую также можно назвать "законом больших чисел", и ниже мы кратко изложим эту теорию.

В статистике часто встречаются множества однотипных объектов, состоящие из больших групп (подмножеств), характеризуемых некоторыми отличительными признаками. Если среди этих признаков условно можно выделить лишь один "главный признак отличия группы" (назовем его m), то теория вероятностей предсказывает некий вполне определённый "закон больших чисел", позволяющий определить распределение числа объектов по выбранному признаку.

Простейшим примером может служить распределение разных букв алфавита по частоте m их встречаемости в любом достаточно длинном тексте. И хотя число разных букв в алфавите вряд ли можно назвать "большим множеством конкурентов, претендующих на присутствие в тексте", тем не менее частота их встречаемости приближённо описывается гиперболой N~1/m.

Покажем полную аналогию "законов больших чисел" в термодинамике и в теории конкуренции. В обеих теориях используется принцип Больцмана о максимуме энтропии, понимаемой в обобщённом смысле как логарифм числа возможных способов распределения любых объектов по состояниям (по признаку отличия m). Отметим, что в "неживой" природе имеется всего лишь два "великих распределений вероятностей": распределения Ферми–Дирака и Бозе–Эйнштейна для квантовых микрочастиц (атомов, молекул, протонов, электронов, фотонов, фононов и др.). Распределение Максвелла–Больцмана является лишь их предельным случаем для высоких температур. Как и в двух указанных выше случаях, общая формула для распределения конкурентов содержит лишь два параметра, а для частных примеров даже один параметр (для спектра масс галактик). Отметим, что В. Парето (1848–1923) был первым, кто "экспериментально" подметил широкую применимость гиперболы для аппроксимации различных показателей в экономике (распределение доходов и др.).

2.    Введение в термодинамику

Слово термодинамика означает "движение тепла". Но что такое "тепло" и куда оно движется? Опыт показывает, что тепло самопроизвольно переходит от более горячего тела к более холодному. При этом суммарная энергия тел сохраняется, но "тепло" всё же не есть энергия, поскольку энергия может переходить и в обратном направлении – от холодного к горячему (например, просто при поднимании утюга над плитой).

Долгое время ученые думали, что тепло – это некая похожая на нагретый газ субстанция и называли её теплородом. Наш великий соотечественник – Михаил Ломоносов (1711–1765) считал, что тепло – это "коловратное движение корпускул" (и это почти правильно, но – каких корпускул, если, например, Солнце греет Землю своими лучами?).

Лишь в 1865 г. немецкий физик Рудольф Клаузиус понял, что порцию тепла следует считать равной , где – температура тела, а – введённая им новая термодинамическая функция состояния тела, которую он назвал энтропия (от греч. entropia – превращение). С тех пор закон сохранения энергии тела в термодинамике записывают в виде

    или  ,                           (1)

где  . Здесь – давление внутри тела, содержащего молекул. Величину называют химическим потенциалом одной молекулы. Некоторое время физический смысл энтропии оставался неясным, но вскоре австрийский физик Людвиг Больцман установил (1872), что энтропия равна логарифму вероятности состояния тела, что выражается знаменитой формулой Больцмана  Теперь нам осталось лишь посмотреть, как подсчитывается вероятность состояния тела.

3. Вероятность состояний частиц ферми-газа

Ясно, что в природе должны реализовываться наиболее вероятные состояния, энтропия которых максимальна, и поэтому они должны оставаться устойчивыми и стабильными. Законы квантовой микрофизики вводят в природу важнейшее понятие дискретности самых разнообразных величин, и в первую очередь – дискретности состояний, так что можно подсчитывать число возможных состояний микрочастиц.

Пусть, например, имеется  частиц, которые нужно разместить по состояниям. Задача упрощается тем, что, как оказывается, в неживой природе имеются микрочастицы лишь двух сортов – бозоны и фермионы (других не бывает). Бозоны имеют целый спин (квантовый момент вращения), и в одном состоянии может находиться любое число бозонов (они "не мешают" друг другу). Фермионы же могут "проживать" в одном состоянии только поодиночке, и для них подсчёт возможностей наиболее прост.

Нетрудно проверить, что число С возможных способов распределения фермионов по состояниям равно биномиальному коэффициенту С = Считая все числа большими, будем пользоваться для факториалов приближённой формулой Стирлинга . Тогда, обозначив <1, приближённо найдем, что

, где   .                                                     (2)

Далее, однако, следует учесть, что все квантовых частиц являются тождественно неразличимыми, тогда как состояний могут отличаться друг от друга каким-либо признаком (в частности, энергией). Чтобы учесть их отличия, присвоим им условный индекс , и тогда энтропия системы запишется в виде суммы логарифмов:

=            .         (3)

Её максимум следует вычислять при трёх дополнительных условиях:

,   ,   ,                                     (4)

считая заданными суммарное число частиц , их суммарную энергию  и суммарный занимаемый ими объём  (эти величины даны нами в относительных долях). Для этого, по методу неопределённых множителей Лагранжа, следует составить комбинацию

  .                                                           (5)

И условие её максимума  приводит к соотношению

m ,                                           (6)

которое и определяет относительные доли частиц в -состояниях. Для частиц-фермионов найдём

,        .                                          (7)

Нетрудно проверить, что для бозонов число С разных вариантов размещения частиц по состояниям равно (при >>1)

С.                                                                      (8)

И оно приводит к иному выражению для энтропии бозе-газа. Такие же расчёты, как и проделанные выше, дают почти такую же формулу (7), но только в знаменателе следует взять знак (-) вместо (+). Подчеркнём, что для бозе-газа множители  имеют тот же смысл, что и для ферми-газа. Обратимся теперь к теории конкуренции.

4. Обобщённая теория конкуренции

Теория, которую авторы назвали "теорией конкуренции", была предложена нами ранее в ряде работ [6, 11, 12], но здесь мы рассмотрим её "обобщённый" вариант. Он почти не отличается от проделанных выше расчётов, и энтропия системы определяется той же логарифмической формулой Больцмана . Но по-иному подсчитывается число С возможных случаев размещения объектов по состояниям. Число используемых параметров  также остается прежним – равным тройке, но, как мы увидим, отчасти изменяется их смысл.

А именно, условимся считать, что теперь мы рассматриваем не квантовые частицы, а множество  некоторых "объектов", которые нужно по определённым оптимальным правилам распределить по  группам (подмножествам), вводя определённую иерархию объектов по их свойствам.

Самым простым и наглядным примером такой вероятностной задачи является распределение населения какой-либо страны по городам. Вообразим некий город, в котором проживает  людей, и в стране имеется  городов с таким именно числом жителей. Кроме того, будем считать, что города различаются не только по числу жителей (т. е. по индексу  но также и по своей "комфортности", под которой мы условно будем подразумевать полный объём жилой площади, имеющейся в таком городе с индексом . С учётом указанных факторов максимум энтропии будем вычислять при трёх дополнительных  условиях:

    ,      ,    (9)

которые аналогичны трём условиям (9), используемым в обычной статистической термодинамике для частиц ферми-газа и бозе-газа (напомним, что других не бывает!).

Число С возможных способов размещения объектов (в данном случае – людей) по состояниям (в данном случае по городам), как и в термодинамике будем считать равным дроби , где числитель равен факториалу , т. е. числу всех возможных перестановок людей по месту проживания. Из этого числа следует исключить  перестановок людей внутри одного и того же города, Поскольку имеется  "эквивалентных" городов, то первый множитель в знаменателе мы будем считать равным произведению . Далее имеем  перестановок жителей городов одинакового -типа. Такие перестановки мы также исключим, полагая второй множитель в знаменателе равным произведению

Тогда, применяя формулу Стирлинга, найдём С и суммарную энтропию рассматриваемого множества "конкурентов":

,  .          (10)

Сравнивая чисто термодинамические дополнительные условия (4) с условиями (9), можно видеть, что они отличаются лишь заменой . Поэтому уравнение максимума энтропии для множества "конкурентов" запишется в виде

 .                                                      (11)

Подставляя сюда энтропию (10), после дифференцирования найдём интегральный и дифференциальный "законы распределения конкурентов по индексам ":

                                       (12)

где А – постоянная нормировки (в неё вошел и параметр a).

Авторы считают, что столь простой результат, полученный из весьма общих предположений о свойствах вероятностных множеств (для которых вводится иерархическое разбиение на подмножества, характеризуемые лишь одним индексом ), можно рассматривать как некий новый "закон больших чисел", который должен проявляться во многих примерах как живой, так и неживой природы. По существу, он содержит лишь два параметра  и некую функцию , значение которой мы уточним в дальнейшем. Сходство метода его вывода с методами расчёта обычных статистических распределений в термодинамике также является его достоинством. Параметр , эквивалентный химпотенциалу, следует считать отрицательным, и тогда он будет играть роль "обрезающего" фактора, устраняющего расходимость спектра при малых значениях индекса . Ниже даны наиболее характерные примеры полученных спектров.

5. Примеры распределений "конкурентов"

Отметим, что в случае пропорциональности функции индексу  параметр  фактически исчезает (его можно считать включённым в нормирующий множитель А), и формула (12) принимает вид:

,      G=   .           (13)

В такой "необобщённой" форме распределение конкурентов ранее было предложено нами в работах [6, 11, 12] (в них не учитывались параметр  и фактор ). В пределе  интегральный спектр (13) принимает форму

  ,                                                  (14)

при  превращаясь просто в гиперболу, которую часто называют "законом Д. К. Ципфа (1949)". Ранее он считался удивительным эмпирическим фактом, так же как и его многочисленные разновидности в форме "закона Парето", "закона Лотки»", "закона Бредфорда", "принципа 80/20", "принципа наименьшего усилия", "правила Юрана" и др. Однако, часто различные конкретные статистические данные (особенно при небольших массивах выборки данных) отклонялись от простой гиперболы, и в "закон Ципфа" вводились различные поправки либо на левом, либо на правом конце гиперболы ("поправка Мандельброта"). Полученная нами выше общая теоретическая формула (12) может рассматриваться как новый "закон больших чисел", частным случаем которого и является "закон Ципфа", получающий тем самым теоретическое обоснование.

В работах, приводимых в списке литературы, указаны собранные нами из разных источников многие примеры хорошей применимости формул (13) и (14) и наиболее примечательными примерами являются распределения:

• слов любого языка по частоте их встречаемости в тексте (Д. К. Ципф, 1949); • всех рыб Мирового Океана по их весу (по изысканиям О. Б. Трубниковой и Ю. С. Куснера, а также по статье [14] канадских океанологов, где прямо сказано, что "от бактерий планктона до китов»" применима гипербола); • книг в библиотеках по числу запросов читателей (Бредфорд);учёных по числу их публикаций (А. Лотка); • городов любой страны по числу жителей (Ф. Ауэрбах, 1913); • населения по доходам и состояниям (В. Парето, 1897); • числа землетрясений по мощности очага и поверхностной балльности (А. В. Бялко); • сортов трав по занимаемой площади (Б. И. Кудрин); • фирм по числу работников; • частиц вулканического пепла по их массе (Ю. Адамчук и Б. Трубников); • частиц выпадающих на Землю мелких космических тел (от пылинок до крупных метеоритов). В книге Б. И. Кудрина [10] собрано около 500 примеров подобных "гиперболических распределений". Недавно группа учёных из Института теоретической физики им. Л. Д. Ландау обнаружила, что распределение web-серверов Интернета по популярности (по посещаемости) также описывается гиперболическим "законом Ципфа", подобным "закону Бредфорда" для популярности разных книг в библиотеках.

По мнению авторов, самым впечатляющим примером является тесная аналогия структуры человеческого языка и "языка" молекул генома всех живых существ. В геноме, как известно, имеются гены 20 аминокислот, и почти столько же букв имеет и язык человека (в латинском языке – 24, в русском 33). В геноме имеются гены примерно 50 тыс. разных белков, и столько же разных слов имеется в человеческом языке (см. любой обширный словарь). Несомненно, что и белки генома по частоте их встречаемости в "тексте клеток организмов" должны описываться тем же гиперболическим законом Ципфа, что и слова человеческого языка в любом достаточно длинном тексте.

6. Применение распределения "конкурентов" к галактикам

Наблюдения показывают, что и распределение галактик по массам тоже приблизительно описывается распределением конкурентов с дифференциальным спектром . Следуя рецепту, изложенному в [16], можно считать, что масса галактики пропорциональна кубу длины волны первичных возмущений исходной материи Вселенной. В условной единице объёма Вселенной их число в представлении должно описываться формулой

 где ,                                        (15)

где  – число галактик в -состоянии. Поскольку , то рецепт [16] с заменой приводит а простейшему спектру при . Такой спектр принято называть "плоским", и считают, что наблюдаемый спектр галактик близок к плоскому, но он расходится в области больших , т. е. в области малых масс галактик.

Ситуация может быть исправлена, если считать, что и галактики в определённом смысле являются "конкурентами" (рождение в некотором месте большой галактики препятствует появлению в том же месте более мелких галактик). Если применить к галактикам формулу (12) общей теории конкуренции (ОТК), то удовлетворительный результат получится, если считать химпотенциал галактик равным нулю. Тогда  и спектр (12) принимает вид:

                                 (16)

Предполагая, что функция  пропорциональна , получим -спектр и -спектр вида

 ,    .                                   (17)

Таким образом, общая теория конкуренции позволяет вполне естественным образом приписать -спектру галактик гауссовскую экспоненту, "обрезающую" расходимость простого плоского спектра.

В книге [16] сходная экспонента вводится совершенно искусственно, и по этому (важному!) поводу на с. 395 в [16] сказано, что … "Обобщённо функцию затухания можно записать в виде exp[-(m, где m порядка 10 солнечных масс". И …"Точный вид функции не так важен – дело сводится к тому, что затухают волны, соответствующие m<m, и не изменяются волны с m>m".

По мнению авторов, экспонента, обрезающая плоский спектр галактик, возникает не в результате искусственного учёта затухания (как в [16]), а является естественным множителем (17) "закона больших чисел" даваемого общей теорией конкуренции, рассмотренной в данной работе.

Примечание

Многочисленные примеры "гиперболических распределений" указаны также в статьях [17, 18]. В частности, в [17] отмечается, что …. "Этот принцип (закон Парето) оказал огромное и незаметное широкой публике влияние на многих преуспевающих людей, но остаётся одной из величайших тайн нашего времени". Отмечается также, что ….. "К сожалению, хотя Парето и осознавал важность своего открытия, он не преуспел в объяснении его". Отмечается также, что ….. "американский инженер И. М. Юран, великий гуру качества, сделал принцип Парето синонимом изыскания путей повышения качества продукции".

По мнению авторов, аргументы, изложенные в данной статье, позволяют рассматривать все многочисленные примеры хорошей применимости формул "гиперболических распределений" как проявление своеобразного "закона больших чисел" в различных вероятностных множествах, к которым применима описанная выше общая теория конкуренции.

Литература

[1] Byalko A. V. Nuclear waste disposal: Geophysical savety. 1994, CRC-Press, N.Y., USA.

[2] Бялко А.В. Нелинейная геодинамика: физическая интерпретация// Природа. 1998. № 6. С. 23–26.

[3] Трубникова О. Б., Куснер Ю. А, Трубников Б. А. Закон распределения хищников// Наука и Жизнь. 1992. № 7. С. 116.

[4] Трубников Б. А. Слипание космической пыли// Природа. 1971. № 8. С. 76. (см. также ДАН СССР, 1971, т. 196, № 6, с. 13; ДАН СССР, 1971, т. 197, № 1, с. 50).

[5] Адамчук Ю. В., Трубников Б. А. Сопоставление спектра масс шлакопепловых выбросов вулканов со спектром метеоритных частиц … // Вулканология и сейсмология. 1982. № 2. С. 101–104 (см. также ж. Modern Geology (на англ.), 1979, т. 7, № 1).

[6] Трубников Б. А., Румынский И. А. Закон Ципфа распределения слов текста и возможность его комбинаторного вывода// ДАН СССР, 1991, т. 321, № 2, с. 270.

[7] Трубников Б. А. Закон распределения конкурентов// Природа. 1993. № 11. С. 3–13.

[8] Бялко А. В. Конструктивность закона конкуренции// Природа. 1993. № 11. С. 14–19.

[9] Трубников Б. А. О законе распределения конкурентов// Природа. 1995. № 11. С. 48–50.

[10] Бялко А. В. Распределение коэффициентов// Природа. 1995. № 11. С. 51–58.

[11] Трубников Б. А. Закон распределения конкурентов/ В кн. Математическое описание ценозов и закономерности технетики. Философия и становление технетики. Вып. 1. Доклады Первой Междунар. конф. (Новомосковск Тульской обл., 24–26 января 1996 г.) и вып. 2. Философия и становление технетики. Автореф. дисс. на соиск. уч. ст. докт. филос. наук. "Ценологические исследования". Абакан: Центр системных исследований, 1996. 452 с.

[12] Трубников Б. А., Трубникова О. Б. Пять великих распределений вероятностей// Природа. 2004. № 11. С. 13–20.

[13] Trubnikova O. B., Trubnikov B. A. Theory of competition/ in book of abstracts 13 General conference of the Europ Physical Sos. EPS-13 "Beyond Einstein – Physics of 21 Centure", 2005, July 11–15, Bern, Swizerland, oral report BR6-4-THU page 119.

[14] Sheldon R. W., Prakash A., Sulcliffe W. H. Limnology and Oceanography, 1972, v. 17, N 3, p. 327.

[15] Кудрин Б. И. Введение в технетику. Томск: Изд. Томского гос. ун-та, 1993.

[16] Зельдович Я. Б., Новиков И. Д. Строение и эволюция Вселенной. М.: "Наука", 1975.

[17] Кох Р. (Richard Koch) Закон Парето или Принцип 80/20. Интернет, Элитариум, 2005.

[18] Давыдов А. А. Убывающие числовые последовательности в социологии: факты, объяснения, прогнозы. Интернет, рефераты, 2005.