Невероятно – не факт - Китайгородский Александр Исаакович. Страница 15
Зная гауссовы кривые для разных случайных событий, статистики отвергнут газетное сообщение о новорождённом весом в 6 килограммов, о том, что в городе Киеве 12-го числа рождались только мальчики, а 13-го только девочки, о том, что в Москве в мае месяце не было ни одного дня с температурой ниже 30 градусов, о том, что число автомобильных катастроф в декабре было в десять раз больше, чем в январе, что во вторник по всему городу не было продано ни одного куска мыла, а в среду никто не приобрёл в аптеке таблеток пирамидона и т.д.
И право же, такой скептицизм, базирующийся на хорошей статистике и знании закона вероятности, обоснован не хуже, чем расчёты траектории космического корабля. Словом, невероятно – не факт.
Если вероятности невелики…
Во время войны довольно часто стреляли из винтовок по вражеским самолётам. Может показаться, что это безнадёжное дело; о прицельной стрельбе здесь и речи быть не может, поскольку лишь пули, пробивающие бензобак или поражающие лётчика, приносят результат. Было установлено, что вероятность удачного выстрела равнялась 0,001. Действительно мало. Но если стреляет одновременно много бойцов, то картина меняется.
Примеров, в которых нас интересует вероятность многократно осуществлённого события, обладающего малой вероятностью, множество. Например, с задачей попадания в самолёт из винтовки полностью совпадает задача о выигрыше в лотерею по нескольким билетам.
Каждая серия «выстрелов» может быть как неудачной, так и закончиться одной удачей, а то и несколькими. Соответствующее распределение вероятностей было найдено французским математиком Пуассоном.
В любом математическом справочнике вы найдёте формулу Пуассона, а также таблицы, позволяющие найти интересующую вас вероятность без расчёта.
Средняя частота – это результат, идеально совпавший с предсказанием теории вероятностей. Если вероятность выигрыша равняется 0,01, то из ста билетов выиграет 1, а из тысячи – 10. Единица и десять это и есть средние частоты выигрыша для серий в сто и тысячу билетов. Конечно, средняя частота может быть и дробным числом. Так, для серий в десять билетов при том же значении вероятности средняя частота выигрыша равняется 0,1. Это значит, что в среднем одна из десяти серий по десяти билетов будет содержать один выигрыш.
В таблицах Пуассона приводятся цифровые данные для всевозможных значений средних частот. Чтобы было ясно, в каком виде нам сообщаются эти сведения и для общей ориентировки приведём несколько чисел характеризующих распределение вероятности при средней частоте, равной единице. Вот эти числа.
Ста выстрелами при вероятности попадания в 0,01 или тысячью выстрелами при вероятности попадания в 0,001, или миллионом при вероятности в 0,000001, мы поразим цель один раз в 37 процентах случая, 2 раза в 18 процентах, 3 раза в 6 процентах… 8 раз лишь в 0,001 процента. А промахнёмся сколько раз? Промахов точно столько же, сколько одноразовых попаданий, то есть 37 процентов.
Приведённые проценты, как и любые числа вероятностей, работают точно лишь для очень большого числа серий. Если миллион людей приобрёл лотерейные билеты, выигрывающие с вероятностью в 0,01, то 37 процентов из них не выиграют ни разу, а 37 процентов других лиц обязательно выиграют по одному билету и т.д. Если же мы заинтересуемся выигрышами только 100 человек, то должны считаться с вероятными отклонениями от среднего. В «среднем» 37 из них не выиграют ни разу. Отклонения здесь от «среднего» не превысят 6?sqrt(37). А с такими отклонениями, как мы уже знаем, следует считаться и помнить, что число неудачников будет находиться между 31 и 43. Конечно, не исключены и бо?льшие отклонения в обе стороны, но их вероятность совсем уж невелика.
Узнав из условий розыгрыша, что в среднем на сотню лотерейных билетов один выигрывает, владелец билетов будет считать себя несчастливым, если на его 100 билетов выигрыш не упадёт ни разу. Если же ему не повезёт несколько раз, то он, возможно, заподозрит устроителей лотереи в несправедливости. Однако сделаем простой расчёт. Если вероятность одного «промаха» равна 0,37 (37%), то вероятность двух «непопаданий» равна квадрату этого числа (0,14), а трех – кубу (0,05). А это не такие уж малые доли, чтобы делать столь решительные выводы.
Теория рекламы
Мой знакомый – американский математик мистер В., ранее занимавшийся достаточно успешно приложениями теории вероятностей к вопросам структуры жидкостей, переменил область своей деятельности.
– Я занимаюсь теорией рекламы, – сообщил он мне при последней нашей встрече.
– И это интересно?
– Бесспорно. Здесь много занятных тонкостей.
– А, собственно говоря, что же является конечной целью теории?
– Хотя бы получение ответа на вопрос, который интересует любого нашего промышленника: сколько денег имеет смысл потратить на рекламу?
– Но каковы же математические методы, которые вы используете?
– Да все те же, с которыми я имел дело до сих пор. Теория рекламы, теория популярности актёра, теория известности писателя, прогноз бестселлеров литературы – все это классический предмет теории вероятностей. Не я один, а много моих коллег заняты этим приложением теории вероятностей к проблемам нашей капиталистической действительности.
– Может быть, вы расскажете мне о наиболее интересных теоретических находках в этой области?
– С удовольствием. Надеюсь, мне не надо доказывать вам, что, прежде чем добиться того, чтобы вещь, или событие, или некая персона понравились, надо, чтобы они стали известными потребителю?
– Без сомнения.
– Поэтому не будем пока касаться проблемы «нравится», а остановимся на вероятности получения неким гражданином сведений о существовании сигарет Честерфилд, лезвий для бритья фирмы Вильсон, романа Агаты Кристи «Убийство по азбуке» или киноактрисы Бетти Симпсон. Мы оставим в стороне систематические знания, приобретаемые в результате обучения в школе или университете, и будем интересоваться лишь теми сведениями, которые люди приобретают «на ходу», не преследуя образовательных целей. На каждого из нас через разные каналы: радио, газеты, телевидение, болтовню с друзьями – обрушивается мощный поток информации, получаемой «по случаю». Фамилии актёров, названия книжных новинок, новых сортов сигарет, лезвий для бритья и многое другое мы узнаем большей частью случайно. В зависимости от размаха рекламы, от интереса, который общество проявляет к тому или иному «модному» предмету, имеется некоторая определённая вероятность о нём услышать. Эта вероятность более или менее одинакова для однородной группы населения – скажем, для жителей города, имеющих телевизоры и радиоприёмники и выписывающих две-три наиболее распространённые газеты.
Разумеется, равная вероятность получить информацию вовсе не означает, что по истечении какого-либо срока все люди окажутся одинаково сведущими. Случайное получение информации очень похоже на лотерейный выигрыш. Действительно, среди тысячи обладателей по десяти лотерейных билетов окажутся лица, которые не выиграют ни разу, которые выиграют один раз, найдутся обладатели двух счастливых билетов, будут и такие везучие игроки, у которых выигрыши выпадут на три, четыре и более билетов. Так что…
– Вы хотите сказать, что вероятность «столкновения» с рекламой, вернее, не с рекламой, а с упоминанием о предмете или лице, известность которого обсуждается, подчиняется распределению Пуассона?
– Совершенно верно. Если, скажем, вероятность натолкнуться на соответствующую информацию в течение одного дня равна одной сотой, то через сто дней 37 процентов населения, так сказать, омываемого этим потоком информации, так и не столкнётся с этой рекламой, другие 37 процентов встретятся с упоминанием о рекламируемом предмете 1 раз, 18 процентов – два раза, 6 процентов – три раза и т.д. Эти числа, как вы, конечно, помните, даёт закон Пуассона.