Общее знание и теорема Ауманна

В основном я работаю в области квантовых вычислений, а если брать более широкое определение — в области вычислений и физики. Но сейчас я хочу рассказать вам о том, что может пригодиться в обычной жизни, поэтому я подготовил историю, связанную с общим знанием.

Начнём с задачи о чумазых детях — одной из лучших логических задач, когда-либо придуманных. Знакомы ли вы с ней?

Итак, представьте: сто детей уселись кружком и играют в грязи. Естественно, лбы у всех перепачканы. В какой-то момент приходит их учитель и говорит: «Кто знает, что у него запачкан лоб, пусть встанет». Никто не встаёт. Да и откуда бы ребёнку знать, запачкался он или нет? Каждый из детей видит лбы остальных 99, но не собственный. (Мы предполагаем, что вокруг нет ни зеркал, ни телефонов с камерами, а также что грязь на лбу неощутима.)

Тогда учитель предпринимает вторую попытку: «Зная, что никто из вас не встал в прошлый раз, пусть теперь встанут те, кто знает, что у них грязный лоб». И опять никто не встаёт. С чего бы? Все остаются сидеть, сколько бы учитель ни повторял свою просьбу.

Затем в дело идёт новый подход: «Я утверждаю, что по меньшей мере у одного из вас лоб грязный», — говорит учитель. После этого он вновь просит: «Кто знает, что у него грязный лоб, пусть встанет», — и опять никто не встаёт. Снова, и снова, и снова; так повторяется 99 раз. Но стоит учителю произнести ту же фразу в сотый раз, и все дети мгновенно встают.

(Существует вариант этой задачи, в котором голубоглазые островитяне совершают коллективное самоубийство на сотый день, узнав, что у каждого из них глаза голубые; но я, сам будучи голубоглазым, поражаюсь подобной бессмысленной жестокости.)

Попробуем разобраться в происходящем. Очевидно, учитель, объявив детям, что хотя бы у одного из них испачкан лоб, запускает какой-то серьёзный процесс, на конечном этапе которого все разом поднимаются на ноги. Но при чём здесь слова учителя? В конце концов, каждый из детей уже знал, что по меньшей мере у 99 других детей лбы были грязными!

Как и в случае со многими другими задачами, путь к решению можно найти, взяв другие числа. Предположим, что детей с грязными лбами было двое и учитель сообщил, что хотя бы у одного из них лоб запачкан, а затем спросил у обоих, грязны ли их лбы. Ни один из детей не мог этого знать. Но каждый ребёнок мог рассуждать следующим образом: «Если бы мой лоб был чистым, другой увидел бы это. А ведь ещё ему известно, что по крайней мере у одного из нас лоб запачкан. В таком случае он бы точно знал, что грязен его собственный лоб. Но так как он этого не знает, то мой лоб — грязный». Так что оба ребёнка узнают, что у них грязные лбы, когда учитель задаёт свой вопрос вторично.

Это рассуждение можно обобщить для любого (конечного) числа детей. Ключевой элемент здесь — знание, которое также называют общим, или же общепринятым. Мы называем некий факт общим знанием, если о нём не только знают все, но всем также известно, что о нём знают все, и всем известно, что всем известно, что о нём знают все, и так далее. Верно, что вначале каждый ребёнок знал, что лбы других детей грязны, но то, что хотя бы у одного из них лоб был грязным, не было общим знанием. К примеру, если у вас и у меня лбы грязные, то я знаю, что хотя бы у одного из нас грязный лоб, и вы тоже знаете это, но вы не знаете, что я знаю это (а вдруг у вас лоб чистый?), и я тоже не знаю, что вы знаете (а вдруг у меня лоб чистый?).

Вот какую роль сыграло заявление учителя: то, что хотя бы у одного ребёнка испачкан лоб, стало общим знанием (мало того, что все слышали заявление — все также отметили, что все его слышали, и т.д.). Осознав это, дальше можно задействовать индукцию: когда учитель задаёт свой вопрос и никто из детей не встаёт (и все видят, что никто не встал), общим знанием становится то, что как минимум у двоих детей испачканы лбы (так как если бы лоб был грязным только у одного ребёнка, он бы понял это и встал). Затем общим знанием становится то, что как минимум у троих детей испачканы лбы, и так далее, пока после сотни повторов общим знанием не становится то, что лбы грязные у всех, — тогда-то все и встают.

Мораль заключается в следующем: сам по себе акт публичного заявления о чём-либо способен изменить мир, даже если всё, что вы сказали, уже было очевидно всем до единого слушателям. Поскольку возможно, что до вашего заявления не все знали, что всем это известно, или не все знали, что все знают, что всем это известно, и т.д., и это могло помешать людям предпринимать какие-либо действия.

Оказывается, последствия этой идеи для реальной жизни просто колоссальны, и они касаются отнюдь не только ситуаций с извозившимися в грязи детьми. Ведь это применимо и к детям с точками на лбах или надписями «пни меня» на спинах…

Если серьёзно, позвольте мне привести пример, позаимствованный мною из чудесной книги Стивена Пинкера «Субстанция мышления». Два человека — давайте не высказывать никаких предположений относительно их пола — отправляются на свидание. Под конец один из них говорит другому: «Не хотите ли вы посмотреть мои гравюры?» Второй отвечает: «Конечно, с удовольствием».

Если серьёзно, позвольте мне привести пример, позаимствованный мною из чудесной книги Стивена Пинкера «Субстанция мышления». Два человека — давайте не высказывать никаких предположений относительно их пола — отправляются на свидание. Под конец один из них говорит другому: «Хочешь зайти ко мне взглянуть на гравюры?» Второй отвечает: «Конечно, с удовольствием».

Это клише настолько банально, что мы можем не замечать в нём глубинного парадокса. В жизни подобное встречается сплошь и рядом: ещё тысячи лет назад люди знали, что клюв каждой птицы наилучшим образом приспособлен к её среде обитания, но до Дарвина и Уоллеса никто не мог внятно объяснить, почему это так (и лишь несколько людей до них вообще отдавали себе отчёт в том, что здесь прячется вопрос, не принимающий циклические аргументы в качестве ответа).

В нашем случае загадка заключается в следующем: на свидании оба прекрасно понимают, что идут к одному из них домой отнюдь не затем, чтобы смотреть на гравюры. Вероятно, каждый даже понимает, что другой это понимает. Но если в этом-то всё и дело, почему бы просто не сказать напрямик: «Хочешь зайти ко мне заняться сексом?» (Или «совершить обмен физиологическими жидкостями», как выразился Джон Нэш в фильме «Игры разума»?)

Вот какой ответ даёт Пинкер: да, оба знают, зачем идут домой к одному из них, но они при этом не хотят, чтобы это знание стало общим. Они хотят, чтобы у их действий была правдоподобная уважительная причина. Тому есть несколько возможных объяснений: например, чтобы поддержать романтическую фантазию о любви, которая вскружила им головы. Чтобы сохранить лицо, если кто-то из них передумает — от того, что не было сказано открытым текстом, не нужно в дальнейшем отрекаться. На самом деле, даже если это важно только для одного человека (назовём его А), то если другой (назовём его Б) считает, что есть хоть какая-то вероятность, что для А это важно, Б тоже будет заинтересован в том, чтобы избежать общности знания ради спокойствия А.

Иными словами, дело в том, что стоит вам вслух заявить об Х, другой человек не просто узнает об Х — он также узнает, что вы знаете об Х, что вы знаете, что он знает об Х, что вы хотите, чтобы он знал, что вы знаете об Х, и бесконечное множество других вещей, которые могут нарушить хрупкий эпистемический баланс. Сопоставьте это с ситуацией, в которой Х остаётся неозвученным: да, оба человека вполне уверены, что «гравюры» — это только предлог, и могут также с изрядной долей уверенности предположить, что некто третий знает, что они в этом уверены. Но стоит дойти до 3, 4, 5-го уровней косвенности — кто знает, что там? Может, вы и впрямь хотели всего лишь показать мне гравюры.

Философы любят обсуждать встречу Шерлока Холмса с профессором Мориарти на вокзале, когда Мориарти заявил: «Я знал, что ты придёшь», — и Холмс ответил: «Да, я знал, что ты знал, что я приду», — и Мориарти сказал: «Я знал, что ты знал, что я знал, что ты придёшь», — и т.д. Но реальные люди чаще всего неспособны выстраивать чёткие цепочки рассуждений, уже дойдя до третьего или четвёртого уровня иерархии знания. (Проиллюстрируем это примером: вероятно, вы слышали об игре, участники которой загадывают число между 0 и 100, а побеждает тот, чьё число окажется ближе всего к ⅔ от среднего арифметического всех загаданных чисел. Если бы игроки были совершенно рациональными людьми, которые знали, что все они совершенно рациональны, и знали, что все знают, и т.д., тогда они все должны были бы загадать 0 — вот вам упражнение: попробуйте определить, почему так. Но эксперименты показывают, что если вы действительно хотите победить, играя против обычных людей, то загадывать нужно число, близкое к 20. Люди, похоже, начинают с 50, повторяют операцию умножения на ⅔ несколько раз и на этом останавливаются.)

Философы любят обсуждать встречу Шерлока Холмса с профессором Мориарти на вокзале, когда Мориарти заявил: «Я знал, что ты придёшь», — и Холмс ответил: «Да, я знал, что ты знал, что я приду», — и Мориарти сказал: «Я знал, что ты знал, что я знал, что ты придёшь», —  и т.д. Но реальные люди чаще всего неспособны выстраивать чёткие цепочки рассуждений, уже дойдя до третьего или четвёртого уровня иерархии знания.

Между прочим, вы представляете, сколько бы я отдал за то, чтобы кто-нибудь объяснил мне всё это, когда я был студентом? Думаю, многие из пресловутых трудностей, с которыми заучки сталкиваются в общении с другими людьми, сводятся попросту к тому, что заучки проводят слишком много времени в областях (вроде математики и физики), где нужно до последнего нейрона сражаться за то, чтобы сделать всю информацию общим знанием, чтобы изложить всё максимально правдиво, открыто и недвусмысленно. В то время как в социальных контекстах очень часто нужно поддерживать хрупкий эпистемический баланс, при котором определённые вещи должны быть известны, но не должно быть известно, что они известны, и так далее — словом, нужно предотвращать воцарение общего знания хотя бы на некоторое время. У «нормальных» людей это получается интуитивно, им не нужно это объяснять. Заучкам же, в отличие от них, может требоваться именно объяснение на примере задачи о грязных детях. Как только заучек посвятят в правила игры, они тоже могут принять в ней участие! И могут оказаться неплохими игроками.

Теперь давайте рассмотрим более мрачный пример общего знания в действии. Читая о нацистской Германии, СССР, Северной Корее и прочих странах с деспотическим режимом правления, сложно избавиться от мысли: «Так почему все разумные люди попросту не восстали и не свергли этих монстров тоталитаризма? Ведь таких людей, конечно же, больше, чем злых безумцев. И, вероятно, разумные люди даже знали по собственному опыту, что многие их соседи также разумны — так откуда же эта трусость?» И снова можно сказать, что всё сводится к общему знанию. Даже если все знают, что король-то голый, и даже если все знают, что все знают, что король — голый, всё равно: если это не является общим знанием, то любой, заявивший, что король — голый, определённо подвергнется серьёзной опасности. Вот почему в сказке вывести систему из равновесия смог только ребёнок. Аналогична сказочной реальная ситуация, в которой вы знаете, что 90% населения поддержит ваше демократическое восстание при условии, что они сами знают, что 90% присоединятся к ним. Если у вас не выйдет вывести информацию о бунте на уровень общего знания, каждому придётся подозревать всех и вся, опасаясь, что стоит ему взбунтоваться, и он окажется в меньшинстве, которое легко сокрушить. И именно благодаря этому опасению каждый будет прав!

(Здесь я вспомню свой любимый советский анекдот. На вокзале в Москве стоит человек, раздавая всем прохожим листовки. В конце концов его арестовывают сотрудники КГБ и, к своему удивлению, обнаруживают, что его листовки пусты. «И в чём смысл?» — спрашивают у него. — «А что там писать? — отвечает человек. — Всё и так понятно!» Обратите внимание, что это и есть та ситуация, в которой человек пытается сделать общим знанием то, что, по его предположению, уже знают «читатели».)

Соль в том, что для того, чтобы помешать чему-либо стать общим знанием, достаточно при помощи цензуры ограничить механизмы создания общего знания в СМИ, в интернете, на общественных собраниях. Это хорошо объясняет, почему тираны всегда были так одержимы контролем над прессой, и объясняет также, как 10% населения могли убивать и порабощать оставшиеся 90% (что происходило не раз на протяжении всей печальной истории нашего вида) даже несмотря на то, что 90% могли легко одолеть эти 10%, действуя сообща. Наконец, это объясняет, почему сторонники просвещения так фанатично ратуют за свободу слова и почему отказываются «уравновешивать» её, делая скидку на межкультурную чувствительность, социальную гармонию или ещё что-нибудь, как того хотят многие наши современники, имеющие самые благие намерения.

А теперь я попробую рассказать вам кое-что неожиданное об общем знании. Вам, вероятно, известна теорема Байеса, согласно которой вероятности можно представлять себе условными числами, которые подчиняются правилам вычисления вероятностей и строгому закону, по которому они изменяются при появлении новых данных. Так вот, некий агент, который на ходу обновляет эти числа у себя в голове и предпринимает действия, которые максимизируют его ожидаемую полезность (рассчитанную с использованием этих чисел), является, вероятно, олицетворением современной ведущей концепции того, что значит быть «рациональным».

Теперь представьте, что у вас есть два агента, скажем, Алиса и Боб, с общим знанием о честности и рациональности друг друга и с одинаковыми оценками априорных вероятностей некоторого множества ожидаемых состояний окружающего мира. А теперь представьте, что они отправляются жить каждый своей жизнью, приобретая свой уникальный опыт и разные распределения апостериорных вероятностей. Затем они встречаются вновь и осознают, что их мнения по одному и тому же вопросу (к примеру, шансы Хиллари победить на выборах) являются общим знанием: они оба знают мнения друг друга и оба знают об этом знании и так далее. Так вот, шокирующий вывод, сделанный в 1976 году и получивший название теоремы Ауманна, гласит, что в таком случае их мнения должны совпасть. Если сформулировать это короче, «рациональные агенты с совпадающими оценками априорных вероятностей не могут согласиться не соглашаться по поводу чего бы то ни было».

Прежде чем продолжить, давайте докажем теорему Ауманна, так как она относится к категории вещей, которые кажутся ошибочными, когда вы впервые о них слышите, и становятся очевидными до банального, как только вы видите доказательство в три строчки длиной. (Впрочем, эта «банальность» принесла Ауманну Нобелевскую премию в области экономики.) Основная идея заключается в том, что знание вводит разбиение множества возможных состояний мира. Непонятно? Ладно, предположим, что некто является либо старым мужчиной, либо старой женщиной, либо молодым мужчиной, либо молодой женщиной. Мы с вами согласны, что априорная вероятность каждого варианта — 25%. Теперь представьте, что вы выясняете, мужчина это или женщина, а я выясняю, молод он или стар. Проиллюстрировать это можно следующим образом:

Основная идея заключается в том, что знание вводит разбиение множества возможных состояний мира. Непонятно? Ладно, предположим, что некто является либо старым мужчиной, либо старой женщиной, либо молодым мужчиной, либо молодой женщиной. Мы с вами согласны, что априорная вероятность каждого варианта — 25%. Теперь представьте, что вы выясняете, мужчина это или женщина, а я выясняю, молод он или стар.

Эта диаграмма говорит нам, например, что если контрольный объект — «старая женщина», то ваше знание описывается множеством {старая женщина, молодая женщина}, моё же знание описывается множеством {старая женщина, старый мужчина}. И эти различные данные приводят нас к различным убеждениям: например, если нас спросят, какова вероятность того, что эта личность — женщина, вы скажете, что 100%, а я скажу — 50%. Что же термин «общее знание» обозначает на практике? Он обозначает следущее: я знаю то же, что и вы, при этом вы знаете, что я это знаю, а я знаю, что вы это знаете, а также знаю о том, что вы знаете, что я это знаю. И так далее до бесконечности. Отсюда cледует, что если вы хотите найти общее знание для нас двоих, вам нужно найти, в какие подмножества знаний можно наименьшим образом объединить те подмножества, на которые множество событий разделено неосведомлённостью каждого из нас. Иначе говоря, взяв за данность некий мир w, мы будем по очереди отбрасывать те его состояния, который каждый из нас считает невозможными, сокращая множество состояний, оставшееся после предыдущей итерации. Мы будем передавать друг другу эстафету до тех пор, пока не получим такое множество миров S, что для любого мира w, в котором мы находимся, наше общее знание будет гласить, что этот мир принадлежит множеству S. Повторив процесс для всех возможных w, мы получим наименьшее общее объединение наших множеств знания. В приведённом выше примере это подразумевает тривиальное заключение, что все четыре мира принадлежат множеству S, но возможен и нетривиальный исход:

Мы будем передавать друг другу эстафету до тех пор, пока не получим такое множество миров S, что для любого мира w, в котором мы находимся, наше общее знание будет гласить, что этот мир принадлежит множеству S. Повторив процесс для всех возможных w, мы получим наименьшее общее объединение наших множеств знания. В приведённом выше примере это подразумевает тривиальное заключение, что все четыре мира принадлежат множеству S, но возможен и нетривиальный исход.

Итак, если у Алисы математическое ожидание случайной величины Х является общим знанием между ней и Бобом, это означает, что в любой точке S её ожидание должно быть постоянной величиной… и таким образом, одинаковой, вне зависимости от того, каково это ожидание, для всех миров множества S! Верно и обратное: если ожидание Боба — общее знание между ним и Алисой, то в любой точке S оно должно равняться ожиданию X по S. И это означает, что ожидания Алисы и Боба совпадают.

Из этого вытекает множество следствий. К примеру, рациональные агенты с совпадающими оценками априорных вероятностей и с общим знанием о рациональности друг друга никогда не должны одновременно участвовать в спекулятивных операциях (к примеру, покупать и продавать акции, если исходить из того, что им не нужны наличные деньги, они не получают комиссионных и т.д.). Почему так? В основном потому, что если я попытаюсь продать вам акцию за, скажем, $50, то вы рассудите, что сам факт того, что я предлагаю её, означает, что у меня есть информация, которой у вас нет, согласно которой акция не стоит этих $50, так что после этого вы соответствующим образом обновите свои знания и не захотите совершать покупку.

Вот другой пример: давайте снова предположим, что мы — байесианцы с совпадающими оценками априорных вероятностей. Мы ведём беседу, в которой я делюсь с вами своим мнением по какому-то вопросу (скажем, насчёт шансов Хиллари на победу на выборах). Ни слова о причинах или фактах, на которых основано это мнение, — только мнение само по себе. Затем вы, будучи байесианцем, обновляете свои данные о вероятностях с учётом моего мнения. Затем вы сообщаете мне своё мнение (которое могло измениться после того, как вы узнали моё), я вношу поправки и сообщаю вам своё новое мнение, затем вы сообщаете мне своё новое мнение, и так далее. Вы можете предположить, что так будет продолжаться до бесконечности! Но нет, Джинакоплос и Полемарчакис (Geanakoplos and Polemarchakis) показали, что так как число возможных состояний мира в наших общих априорных предположениях конечно, этот процесс должен сойтись после конечного числа шагов, приведя к тому, что наши мнения совпадут (и более того, знание о том, что мы пришли к этому общему мнению, будет общим). Почему так? Пока наши мнения различаются, вы, поделившись со мной своим мнением (или я, поделившись с вами своим), вызовете нетривиальное уточнение одного из разбиений нашего множества знаний, примерно так:

Джинакоплос и Полемарчакис (Geanakoplos and Polemarchakis) показали, что так как число возможных состояний мира в наших априорных предположениях конечно, этот процесс должен сойтись после конечного числа шагов, приведя к тому, что наши мнения совпадут (и более того, знание о том, что мы пришли к этому общему мнению, будет общим).

Иначе говоря, если вы узнаёте что-нибудь новое, по крайней мере одно из множеств ваших знаний должно подвергнуться разбиению на подмножества в соответствие с разными возможными состояниями, о которых вы узнали. Но так как количество базисных состояний конечно, количество подобных разбиений также не может быть бесконечным (стоит заметить, что так как байесианцы никогда ничего не забывают, разделившиеся множества со знаниями никогда не объединяются обратно).

И вот ещё что: предположим, ваш друг делится с вами мнением либерального характера, затем вы принимаете его во внимание, но отвечаете в более консервативном духе. Ваш друг принимает во внимание ваше мнение и отвечает своим, уточнённым. Вопрос: будет ли новое мнение вашего друга более либеральным или более консервативным, чем ваше?

Очевидно, более либеральным! Да, возможно, ваш друг теперь лучше понимает, что хотите сказать вы, а вы — что хочет сказать он; возможно, теперь ваши точки зрения ближе друг к другу (в идеале!), но один разговор не заставит вас резко изменить полярность своих убеждений.

Впрочем, если вы и ваш друг — байесианцы с совпадающими оценками априорных вероятностей, можно доказать, что подобная ситуация вообще не должна сложиться. И в самом деле, ваше ожидаемое будущее мнение должно совпадать с вашим текущим мнением, и ожидаемое вами следующее мнение вашего друга должно также совпадать с вашим нынешним мнением. Отсюда следует, что у вас не будет возможности спрогнозировать, в каком направлении изменится ваше мнение на следующем шаге и в какую сторону мнение друга будет отличаться от вашего. Почему нет? Говоря формальным языком, потому что все эти ожидания являются лишь разными способами вычисления ожидания по одному и тому же множеству, а именно вашему текущему множеству знаний (иными словами, множеству состояний мира, которые вы сейчас считаете возможными)! Можно дать более наглядное объяснение: если вы можете спрогнозировать, что при прочих равных следующая реплика вашего друга, вероятно, сместит ваши взгляды в сторону либерализма, тогда, будучи байесианцем, вы уже должны принять более либеральное мнение сейчас. (Связано это с тем, что называют «свойством мартингала»: конечно, случайная величина Х может в будущем изменяться различным образом, но среднее по всем возможным исходам будет её текущим математическим ожиданием М[X], исходя из самого определения математического ожидания.)

Итак, если мы сведём всё это воедино, то получим ясную картину того, как должно выглядеть рациональное расхождение во мнениях: они должны изменяться в процессе случайного несмещённого блуждания, пока рано или поздно не остановятся в точке общего знания о полном согласии. А это ставит нас перед задачей: едва ли подобные процессы когда-либо протекали в реальном мире, так что с этим делать?

Вариантов решения несколько:

  1. Вы можете заявить, что модель, предлагаемая теоремой Ауманна, нереалистична, потому что практически все люди — иррациональные кретины или лжецы (или, по крайней мере, не существует общего знания о том, что они не такие). Кроме вас, конечно, вы как раз идеально рациональны и честны. И если вы когда-нибудь встретите кого-то столь же рационального и честного, между вами, может быть, и получится полноценный диалог в духе Ауманна. Но так как подобного человека, вероятно, не существует, вы с чистой совестью можете отстаивать свою позицию, отвергать любое отличное от вашего мнение и т.д. Обратите внимание: даже если бы вы искренне верили в то, что на этом можно поставить точку, теорема Ауманна всё же сыграла бы для вас определённую вдохновляющую роль: вы должны были бы признать, что это — идеал, к которому должны стремиться все рационально мыслящие люди. А это уже во многом шло бы вразрез с традиционным опытом рационализма. К примеру, мы все знаем, что аргументы к авторитету не слишком весомы — на ваше мнение должен влиять не сам факт того, что кто-то излагает своё мнение, а аргументы и доказательства, которые он приводит в пользу своей точки зрения. Вот только мы уже увидели, что для байесианцев с совпадающими оценками априорных вероятностей это совершенно не так! Напротив, вам достаточно услышать мнение вашего друга, чтобы получить достаточную информацию о его знаниях в кратком изложении. И если вы узнаете, что ваш рациональный друг с вами не согласен, то вы, даже не зная причины, должны принять это с той же серьёзностью, с какой бы отнеслись к противоречию, на которое наткнулись в ходе собственных размышлений. Это связано с ещё более общим соображением: существует нормативное правило рациональности, согласно которому вы должны оценивать идеи только по их сути, — но если вы являетесь байесианцем, то вы, конечно, примете во внимание и то, от кого исходят эти идеи, и то, как много людей их разделяет! Аналогично, если вы — байесианский полицейский, или байесианский таможенник, или байесианский сотрудник отдела кадров, то вы, конечно, будете судить людей по внешним характеристикам, пусть это и несправедливо по отношению к конкретным людям. Так что результаты исследований, показывающие, что люди по-разному оценивают одно и то же резюме, если ставить разные имена в его заголовке, не должны нас удивлять. Мне кажется, что напряжённость между двумя различными взглядами на рациональность, нормативным и байесовским, порождает многие из самых трудноразрешимых конфликтов современности.
  2. Или — ну, это очевидный вариант — вы можете отвергнуть концепцию совпадающих оценок априорных вероятностей. В конце концов, разве основным доводом в пользу байесовского подхода не является его субъективный аспект, тот факт, что вы выбираете «то распределение априорных вероятностей, которое кажется вам верным», и вы ограничены лишь в том, как это распределение обновлять? Если у Алисы и Боба могут быть разные распределения априорных вероятностей, то вся цепочка рассуждений, выстроенная мной ранее, рушится. Так что несогласие с концепцией совпадающих оценок априорных вероятностей может показаться заманчивым. Но работа Тайлера Коуэна и Робина Хэнсона (Tyler Cowen and Robin Hanson) «Честны ли разногласия?», подрывающая основы привычного взгляда на жизнь едва ли не сильнее всех прочих работ, с которыми я знаком, ставит эту стратегию под вопрос. Основная её идея в следующем: если вы — бескомпромиссный байесианский рационалист, то ваши априорные предположения должны позволить представить, что вы — другой человек. Или, иными словами, утверждение «вы рождены быть собой», а не кем-либо иным, необходимо рассматривать как обычный случайный факт, который вы наблюдаете и обусловливаете им свои действия! И аналогичным образом другой человек должен исходить из наблюдения, что он — это он, а не вы. В таком случае абсолютно всё, что отличает вас от окружающих, может трактоваться как «информация о различии», и здесь мы возвращаемся прямиком к ситуации, описанной в теореме Ауманна. Представьте, если хотите, что мы все изначально находимся за некоторым ролзовским покровом неведения (veil of ignorance), так как чистые мыслящие разумы ещё не распределены между назначенными им телами. В этом исходном состоянии не существует ничего, что отличало бы нас друг от друга, — ничего, что могло бы послужить информацией, накладывающей условия, — так что у всех нас должны быть общие априорные предположения. Возможно, это звучит надуманно, но в некотором смысле это означает следующее: что наделяет вас привилегированным правом на результат наблюдения лишь потому, что его зафиксировали ваши глаза, или на мысль, поскольку она по чистой случайности возникла именно в вашей голове? Ну, если вы объективно умнее или наблюдательнее всех окружающих — пускай, но пока вы согласны, что это не так, у вашего мнения нет никакой особой эпистемической протекции лишь потому, что оно принадлежит вам.
  3. Если вас смущает стремление байесовского мышления к отказу от каких бы то ни было ограничений, к желанию расширяться до космических или метафизических масштабов («Мне необходимо принимать во внимание, что я был рождён собой, и никем иным») — ну что же, тогда вы можете не принимать байесовский подход в качестве своего представления о рациональности. И пока меня не изгнали из приличного общества за еретические высказывания, спешу добавить, что включил эту опцию в список лишь потому, что должен упомянуть все возможные варианты!
  4. Когда я впервые узнал обо всём этом 12 лет назад, мне казалось очевидным, что немалую часть этих умозаключений можно выбросить, поскольку они не имеют отношения к реальности из-за сложности последней. Иначе говоря, конечно, этот подход идеален для идеальных мыслителей с бесконечным запасом времени и вычислительной мощности, но как только вы вводите присущие реальности ограничения, весь этот ауманновский карточный домик должен рухнуть. Вот, например, если Алиса и Боб имеют совпадающие оценки априорных вероятностей, то они, конечно, должны соглашаться по всем вопросам, по которым предоставят друг другу всю имеющуюся у них информацию! Но на практике у нас нет времени для такого «слияния разумов», обмена всем жизненным опытом с каждым встречным. Таким образом, можно предположить, что соглашение в общем случае требует продолжительного общения. Вот я и попробовал доказать это утверждение как теорему. И знаете, что я обнаружил? Что моё предположение не было даже близко к верному!

Если конкретно, я доказал следующую теорему. Предположим, Алиса и Боб — байесианцы, чьи оценки априорных вероятностей совпадают, и предположим, что они спорят о, допустим, вероятности некоторого события в будущем — или, в общем варианте, о некоторой случайной величине Х из диапазона [0,1]. Итак, они ведут беседу, в которой Алиса первой называет своё ожидание Х, затем Боб называет своё новое ожидание, и так далее. Теорема гласит, что оценки Х у Алисы и Боба непременно совпадут с точностью до ±ε с вероятностью как минимум 1-δ в пределах их совпадающих оценок априорных вероятностей после того, как они обменяются лишь O(1/(δε2)) сообщениями. Отметим, что этот предел совершенно не зависит от того, каким объёмом знаний они обладают, он зависит лишь от точности, с которой они хотят согласиться! Более того, этот предел сохраняется, даже если Алиса и Боб с каждым сообщением выдают лишь несколько бит информации о своих вещественнозначных ожиданиях вместо самих ожиданий.

Доказательство включает в себя идею о том, что оценки Х Алисы и Боба, назовём их XA и XB соответственно, подчиняются «несмещённому случайному блужданию» (или, более формально, являются мартингалами). В общих чертах, если |XA-XB|≥ε с высокой вероятностью по совпадающим для Алисы и Боба оценкам априорных вероятностей, то из этого следует, что следующее сообщение с высокой вероятностью (опять же, по совпадающим априорным вероятностям) приведёт к скачку XA или XB приблизительно на ε в большую или меньшую сторону. Но XA и XB, будучи оценками Х, принадлежат диапазону от 0 до 1. Поэтому случайное блуждание с шагом в ε может длиться лишь около 1/ε2 шагов, прежде чем достигнет одного из «поглощающих барьеров».

Это можно формализовать, если посмотреть на дисперсии D[XA] и D[XB] с учётом общего априорного знания. Поскольку разбиения Алисы и Боба продолжают уточняться, дисперсии являются монотонно неубывающими. Они начинают расти с 0 и никогда не могут превысить 1 (на самом деле они никогда не могут превысить 1/4, но это сейчас не важно). Итак, ключевая лемма состоит в том, что если Pr[|XA-XB|≥ε]≥δ, то D[XB] должна вырасти как минимум на δε2, если Алиса отправит XA Бобу, и D[XA] должна вырасти как минимум на δε2, если Боб отправит XB Алисе. Вы можете найти доказательство в моей статье или вывести его самостоятельно. В любом случае, лемма подразумевает, что после O(1/(δε2)) раундов коммуникации должно произойти как минимум временное прекращение несогласия; должен быть раунд, на котором высока вероятность того, что Алиса и Боб приблизительно согласны друг с другом.

В своей работе я привожу и другие результаты, включая верхнюю границу количества запросов к «оракулу выборок» («sampling oracle»), необходимого Алисе и Бобу, чтобы реализовать подобный протокол в приближённом варианте, если предположить, что они не идеальные байесианцы, а агенты с ограниченной вычислительной мощностью. Однако позвольте мне отступить на шаг назад и рассмотреть более общий вопрос: какой вывод мы должны сделать из всего этого? Как нам жить с этим непомерным разрывом между тем, как должны выглядеть наши разногласия с точки зрения байесовской рациональности, и тем, как они выглядят на самом деле?

Мы можем просто заявить, что люди — существа, не соответствующие модели байесианцев с совпадающими оценками априорных вероятностей, что мы не сумели создать представление человеческого поведения, близкое к реальности, и на том и остановиться. Хорошо, но это по-прежнему оставит открытым вопрос о том, имеет ли вся эта математика нормативную ценность. Должна ли она оказывать влияние на наше поведение, если мы хотим считать себя честными и рациональными? Я бы сказал, что да.

Да, вы должны постоянно спрашивать себя: «Выступал бы я в защиту этого мнения, если бы я был не я, а кто-то другой?» (Хотя вы можете сказать, что эта идея возникла задолго до Ауманна — ещё у Спинозы, если не раньше.)

Да, если кто-то, кого вы уважаете за честность и рациональность, выражает своё несогласие с вами, вы должны отнестись к этому так же серьёзно, как если бы это разногласие возникло между двумя сторонами вашей личности.

И последнее: да, мы можем пытаться судить об эпистемических сообществах по тому, насколько они близки к ауманновскому идеалу. В математике и других точных науках, по моему опыту, часто можно увидеть страстный спор двух учёных у доски. Покиньте их на пять минут, и когда вы вернётесь, то увидите, что спор разгорелся ещё яростнее, но точки зрения спорщиков изменились. Как мы уже увидели, именно так с точки зрения математики должен выглядеть рациональный диалог. А вот если дискуссия ведётся вокруг политических или социальных вопросов, то, как правило, в лучшем случае собеседники изначально отстаивают диаметрально противоположные взгляды, и со временем один из них говорит: «Хорошо, я соглашусь с тобой в этом пункте», — а другой отвечает: «Ладно, а я соглашусь с тобой в том». Можно сказать, что это всё-таки намного лучше более распространённого сценария, когда по завершении дискуссии позиции спорщиков ещё сильнее отдаляются друг от друга! Но математика говорит, что даже первый случай, в котором мнения спорщиков становятся более сходными, ничем не походит на рациональный обмен информацией, при котором точки зрения оппонентов на обсуждаемый вопрос скачкообразно сближаются, полностью изменяясь на каждом ходу (а затем изменяясь обратно, вновь и вновь). Вы можете сказать, что первый случай больше напоминает торги — скорее «Я соглашусь с тобой, что верно Х, если ты согласишься со мной, что верно Y», чем спор наших идеальных дружелюбных математиков, которые принимают новые для себя истины без промедлений, без неохоты, без оглядки на то, соглашался ли оппонент с ними по каким-либо иным вопросам прежде.

Вооружившись этим пониманием, мы можем попытаться ранжировать области знания по тому, насколько сложно в этой сфере вести ауманновский диалог. В начале шкалы — простейший случай! — находится математика (или, скажем, шахматы, или процесс отладки программы, или области, изобилующие конкретными фактами, вроде лексикографии или географии). Важно иметь в виду, что я подразумеваю только те разделы этих предметов обсуждения, которые включают в себя общепринятые правила и однозначные ответы — как только разговор сворачивает на то, чьи теоремы комплекснее или кто допустил ошибку в программе, он может уйти сколь угодно далеко от ауманновского пути. За ними следуют разделы науки, включающие неупорядоченные исследования по изучению взаимосвязей (я имею в виду только, к примеру, обсуждения вида «что является фактором риска для чего», а не разговоры о политических последствиях решений). Затем идут политика и эстетика с их радиоактивными темами вроде «Израиль против Палестины». И в самом конце шкалы располагаются дебаты в области гендера и социальной справедливости, в которых все участники опираются на собственный опыт, сформировавший у них ту или иную точку зрения, и среди них нет незаинтересованных искателей правды, и вряд ли в этой области когда-либо за время существования мира могло состояться ауманновское обсуждение.

Я призываю вас разделить со мной убеждение в том, что даже в этой точке шкалы нашей обязанностью является хотя бы попытаться поступить по-ауманновски, спросить себя: «Что бы я думал по этому поводу, если бы я был кем-то иным? Если бы я был мужчиной, женщиной, чёрным, белым, геем, гетеросексуалом, ботаном, качком? Насколько мои рассуждения похожи на беспристрастные размышления в духе Спинозы, которые поддаются переносу в любое рациональное сознание, и много ли будет потеряно при переводе?»

Так или иначе, я уверен, что некоторые люди будут утверждать, что, в конце концов, всю эту структуру с байесианцами, совпадающими оценками априорных вероятностей, общим знанием и т.д. можно вычеркнуть из этого обсуждения как избыточные построения, а урок, который, с моей точки зрения, можно из него извлечь, сводится к тривиальному совету «попробуйте понять чужую точку зрения», что вы, разумеется, знали и без меня. Но в таком случае, даже если вы уже знали всё это, возможно, вы не знали, что вы все об этом знаете! Так что я надеюсь, что вы в любом случае получили какую-то новую информацию для размышлений.

Скотт Ааронсон (Scott Aaronson). «Common Knowledge and Aumann’s Agreement Theorem».

Перевела Дарина Чернышёва. За помощь в переводе спасибо Дмитрию Баюку, Александру Попову и Дарье Петровой, за корректуру — Надежде Верещагиной. Иллюстрации Антонины Евдокимовой, адаптация графиков — Радмир Абильев.

P.S. Если кого-то интересуют дополнительные материалы про общее знание и теорему Ауманна, то Скотт рекомендует статью Тайлера Коуэна и Робина Хэнсона (Tyler Cowen and Robin Hanson) «Честны ли разногласия?»

Получить ссылку на материал

Спасибо!

Также вы можете подписаться на обновления сайта:

Оставить комментарий

Добавить комментарий