Черный лебедь. Под знаком непредсказуемости - Талеб Нассим Николас. Страница 88

начинал в экономике. Работа с таким изобилием данных сбивает с нас спесь; она вооружает нас интуитивным пониманием того, в каком направлении нужно совершать путь между представлением и реальностью.

Проблема зацикленности статистики (которую также можно назвать статистическим порочным кругом) состоит в следующем. Скажем, вам нужны прошлые данные, чтобы определить, является ли распределение вероятности нормальным, фрактальным или каким-то еще. Нужно установить, достаточно ли у вас данных, чтобы ваше утверждение было обоснованным. Как узнать, достаточно ли у нас данных? Из распределении вероятности. Оно покажет, хватает ли у тебя данных, чтобы то, что ты предполагаешь, «заслуживало доверия». Для кривой нормального распределения достаточно малого количества точек (опять закон больших чисел). А как узнать, что распределение нормальное? Вообще-то на основании данных. Итак, нам нужны данные, чтобы узнать, каково распределение вероятности, и распределение вероятности, чтобы узнать, сколько данных нам нужно. Это порочный крут.

Такого круга не возникает, если предположить заранее, что распределение нормальное. По определенной причине свойства нормального распределения довольно легко выявляются. В отличие от тех, что присущи распределению в Крайнестане. Поэтому выбор гауссианы для выведения некоего общего закона очень удобен мы используем его по умолчанию именно по этой причине. Я не устаю повторять, что априорная ставка на гауссиану допустима лишь в небольшом числе областей, таких как статистика преступности, уровни смертности, вопросы из Среднестана. Но только не там, где дело касается исторических данных с неизвестными свойствами и крайнестанских вопросов.

Но почему статистики, работающие с историческими данными, закрывают на это глаза? Во-первых, им не хочется признавать, что вся их деятельность перечеркивается проблемой индукции. Во-вторых, они не несут никакой ответственности за результаты своих предсказаний. Соревнование, устроенное Макридакисом, показало нам, что они во власти искажения нарратива и не хотят этого знать.

Еще раз: опасайтесь предсказателей

Поднимем проблему на уровень выше. Как я заметил ранее, существует много модных моделей, пытающихся объяснить происхождение Крайнестана. Вообще-то они группируются в два широких класса, но встречаются и другие подходы. Первый класс — это простые модели типа «деньги идут к деньгам» (или «успех тянет за собой успех»), объясняющие скопление людей в городах, доминирование на рынке компании «Майкрософт» (а не «Эппл») и формата VHS (а не Betamax), создание академических репутаций и т.д. Второй класс включает в себя так называемые «модели просачивания», в центре внимания которых — не поведение индивида, а среда его обитания. Когда льешь воду на пористую поверхность, структура поверхности оказывается важнее, чем свойства жидкости. Когда песчинка ударяется о кучу других песчинок, именно характер местности определяет, сойдет ли лавина.

Почти все модели, разумеется, претендуют на прогностическую точность, и это меня бесит. Они — хорошие инструменты для иллюстрации происхождения Крайнестана, но я настаиваю на том, что «генератор реальности» не подчинен им настолько, чтобы с их помощью можно было делать точные прогнозы. Все, что я нахожу в современной литературе на тему Крайнестана, свидетельствует именно об этом. Перед нами здесь снова встает серьезнейшая проблема калибровки, так что лучше бы нам избежать обычных ошибок, совершаемых при калибровке нелинейного процесса. Напомним, что у таких процессов больше степеней свободы, чем у линейных (как мы показали в главе и), а следовательно, чрезвычайно велик риск того, что модель окажется неправильной. Мне то и дело попадают в руки книги или статьи, которые ратуют за применение моделей статистической физики к реальности. Например, восхитительные книги Филипа Болла насыщены информацией и иллюстративным материалом, но это не основа для точных количественных моделей. Не встречайте их по одежке.

Однако посмотрим, что мы можем позаимствовать у этих моделей.

Снова счастливое решение

Во-первых, признавая масштабируемость, я соглашаюсь с тем, что любое самое большое число возможно. Другими словами, неравенство не должно прекращаться после достижения некоторой известной верхней границы.

Скажем, продано около 60 миллионов экземпляров книги «Код да Винчи». (Библии продано около миллиарда экземпляров, но вынесем ее за скобки, ограничившись светскими книгами, написанными отдельными авторами.) Хотя мы и не встречали светских книг, разошедшихся тиражом 200 миллионов экземпляров, можно считать, что вероятность этого не нулевая. Да, она мала, но не нулевая. На каждые три бестселлера в духе «Кода да Винчи» может найтись один супербестселлер, и, хотя до сих пор таких не появилось, исключить этого нельзя. А на каждые пятнадцать «Кодов да Винчи» — супербестселлер, который разойдется, например, тиражом 500 миллионов экземпляров.

Применим ту же логику к богатству. Допустим, самый богатый человек на Земле имеет капитал размером 50 миллиардов долларов. Есть вероятность, которой нельзя пренебречь, что в следующем году из ниоткуда выскочит кто-то, кто имеет 100 или более миллиардов. На каждых трех людей, имеющих более чем 50 миллиардов долларов, может найтись один со 100 миллиардами. Есть вероятность, хоть и гораздо меньшая, что найдется кто-то, владеющий более чем 200 миллиардов долларов — одна треть предыдущей вероятности, но все равно не нуль. Есть даже крошечная, но не нулевая вероятность того, что обнаружится кто-то, чье состояние превышает 500 миллиардов долларов.

Это подсказывает мне следующее: я могу строить предположения о вещах, существование которых свидетельствами не подтверждается, но они должны принадлежать царству возможного. Где-то там есть бестселлер, о каких прежде не слыхивали, но его следует принимать во внимание. Напомню основную мысль главы 13: благодаря этому отсутствию предела вложение денег в книгу или лекарство порой оказывается более выгодным, чем подсказывают статистика или прежние наблюдения. Но из-за него же потери на фондовом рынке часто превосходят те, что когда-либо имели место.

Войны фрактальны по своей природе. Война, которая убьет больше людей, чем опустошительная Вторая мировая, возможна. Она маловероятна, но не исключена, хотя такой войны никогда не случалось в прошлом.

Во-вторых, чтобы прояснить вопрос о точности, я приведу пример из природы. Гора чем-то похожа на камень, она сродни камню, у нее есть семейное сходство с камнем, но это не одно и то же. Для описания такого сходства есть замечательное слово — самоподобный, а уж никак не самоповторяющийся, но Мандельброт не потрудился тщательно разжевать то, что вкладывается им в понятие «подобие», и в обиход вошел термин «самоповторение», подразумевающий точное, а не семейное сходство. Как в случае с горой и камнем, распределение состояния выше миллиарда долларов не совсем таково, как распределение состояния менее миллиарда долларов, но эти распределения «подобны».

В-третьих, как я сказал раньше, в области эконофизики (являющейся приложением статистической физики к социальным и экономическим явлениям) было много статей, в которых предпринималась попытка такой «градуировки», то есть извлечения чисел из мира явлений. Многие порываются предсказывать. Увы,