Позвольте мне закончить предупреждением, что мы, социальные исследователи, очень хорошо сделаем, если будем сдерживать свое стремление контролировать мир, который так слабо понимаем. Нельзя позволить факту несовершенства нашего понимания питать нашу неуверенность и тем увеличивать потребность в контроле. Скорее, наши исследования могли бы вдохновляться более древним мотивом, который сейчас не в почете, - любопытством к миру, частью которого мы являемся. Вознаграждается такая работа не властью, а красотой.
Существует странный факт, что все великие научные прорывы - и не в последнюю очередь прорыв, достигнутый Ньютоном, - были элегантными.
"ДВОЙНОЕ ПОСЛАНИЕ", 1969*
* Bateson G. Double Bind, 1969. Данная статья была представлена в августе 1969 года на симпозиум по "двойному посланию".
Теория "двойного послания" (ДП-теория) стала для меня примером того, как следует думать о некоторых вещах, и хотя бы поэтому стоит вспомнить всю историю.
Случается - в науке часто, а в искусстве всегда - что, пока проблема не решена, непонятно, в чем она состоит. Поэтому, возможно, будет полезным отметить в ретроспективе, какие проблемы были решены для меня ДП-теорией.
Во-первых, это - проблема овеществления (reification).
Ясно, что в разуме (mind) нет объектов или событий - нет свиней, нет кокосовых пальм и нет матерей. Разум содержит только трансформы, перцепты, образы и т.д., а также правила создания этих трансформ и перцептов. Мы не знаем, в какой форме существуют эти правила, однако предположительно они включены в саму "машинерию", создающую эти трансформы. Мы далеко не всегда отдаем себе отчет в том, что эти правила и есть сознательные "мысли".
В любом случае, бессмысленно говорить, что человек испугался льва, поскольку лев - не идея. Человек создает идею льва.
Привлеченный для объяснения вещественный мир порождает ассоциации не с различиями и идеями, а только с силами и импульсами. Per contra, мир формы и коммуникации ассоциируется не с вещами, силами или импульсами, а только с различиями и идеями. (Различимое различие [a difference which makes a difference] есть идея. Это - "бит", единица информации.)
Но эти вещи я понял только позднее - с помощью ДП-теории. Тем не менее, они, конечно, имплицированы в теории, которая едва ли могла быть создана без них.
Наша первая статья о "двойном послании" содержит многочисленные ошибки, связанные просто с тем, что мы тогда еще не произвели членораздельного исследования проблемы овеществления. Мы говорили в той статье так, как будто "двойное послание" - это что-то такое, что может быть сосчитано.
Конечно, это чепуха. Нельзя сосчитать летучих мышей в кляксе, поскольку их там нет. Тем не менее некоторые "с мышами в голове" могут "увидеть" нескольких.
Однако есть ли в разуме "двойное послание"? Вопрос не тривиальный. Также, как в разуме нет кокосов, а есть только перцепты и трансформы кокосов, так и тогда, когда я воспринимаю (сознательно или бессознательно) "двойное послание" в поведении моего босса, в моем разуме возникает не оно само, а только его перцепт, или трансформа. Однако теория не об этом.
Мы говорим, следовательно, о некотором виде путаницы в правилах создания трансформ и о приобретении или культивировании такой путаницы. ДП-теория утверждает существование эмпирического компонента в становлении или этиологии шизофренических симптомов и связанных с ними паттернов поведения, таких как юмор, искусство, поэзия и т.д. Характерно, что теория не делает разницы между этими подвидами. Ее понятия никак не определяют, станет ли данный индивидуум клоуном, поэтом, шизофреником или какой-то их комбинацией. Мы имеем дело не с отдельным синдромом, а с семейством синдромов, большинство из которых обычно не считается патологическим.
Позвольте мне ввести слово "трансконтекстуальный" в качестве главного термина для этого семейства синдромов.
Кажется, что люди, чья жизнь обогащена дарами трансконтекстуальности, и люди, измученные трансконтекстуальным замешательством, в одном отношении похожи: для них всегда или часто существует возможность "двоякого прочтения" ("double take"). Падающий лист, приветствие друга, "дикий шиповник у реки" не есть "только это, и больше ничто". Внешний опыт может быть вставлен как кадр (framed) в контекст сна, внутренняя мысль может проецироваться в контексты внешнего мира. И так далее. Всем этим вещам мы ищем частичное объяснение в обучении и опыте.
Конечно, в этиологии трансконтекстуальных синдромов должны быть генетические компоненты. Ожидается, что они могли бы действовать на более абстрактных уровнях, нежели уровень опыта. Например, генетические компоненты могли бы определять способности в обучении трансконтекстуальности или (более абстрактно) потенцию к приобретению таких способностей. Либо, напротив, геном мог бы определять способность сопротивляться трансконтекстуальным обходным путям или потенцию к приобретению таких способностей. (Генетики уделяют очень мало внимания необходимости определения логической типизации сообщений, переносимых ДНК.)
В любом случае точка встречи генетически детерминированного с опытным весьма абстрактна, и это остается верным, даже если генетическое сообщение воплощается единственным геном. (Единственный бит информации - единственное различие - может быть ответом типа да/нет на вопрос любой степени сложности на любом уровне абстракции.)
Кажется, что нынешние теории, предлагающие для "шизофрении" единственный доминантный ген с "низкой проницаемостью", оставляют это поле открытым для любой эмпирической теории, которая указала бы, какой класс опыта может заставить латентный потенциал проявиться в фенотипе.
Я должен, однако, признаться, что эти теории кажутся мне малоинтересными, если только их сторонники не попытаются уточнить, какие компоненты сложного процесса определения "шизофрении" обеспечиваются гипотетическим геном. Идентификация этих компонентов должна быть процессом вычитания. Там, где вклад среды значителен, генетику нельзя исследовать, пока эффект среды не идентифицирован и не взят под контроль.
Но что верно для одного, то верно и для другого; и то, что было сказано выше о генетике, накладывает на меня обязательство прояснить, какие компоненты трансконтекстуального процесса могут быть обеспечены опытом "двойного послания". Следовательно, было бы уместно пересмотреть теорию вторичного обучения, на которой базируется ДП-теория.
Все биологические системы (организмы, а также социальные или экологические организации организмов) способны к адаптивным изменениям. Но адаптивные изменения принимают множество форм, таких как отклик, обучение, экологическое следование, биологическая эволюция, культурная эволюция и т.д., в соответствии с размером и сложностью системы, которую мы выбираем для рассмотрения.
Какой бы ни была система, адаптивные изменения зависят от контуров обратной связи, представленных либо процессом естественного отбора, либо индивидуальным подкреплением. Во всех случаях, однако, должны присутствовать процесс проб и ошибок и механизм сравнения.
Однако пробы и ошибки неизбежно предполагают ошибки, а ошибки имеют высокую биологическую и/или физиологическую цену. Из этого следует, что адаптивные изменения всегда должны быть иерархическими.
Здесь требуются не только изменения первого порядка, отвечающие непосредственным требованиям среды (или физиологии), но также изменения второго порядка, уменьшающие количество проб и ошибок, необходимых для достижения изменений первого порядка. И так далее. Посредством суперпозиции и перекрестных соединений многих контуров обратной связи мы (как и все прочие биологические системы) не только решаем частные проблемы, но также формируем привычки, которые применяем к решению классов проблем.
Мы действуем так, как будто целый класс проблем мог бы быть решен на основе предположений или предпосылок, количество которых меньше количества проблем в классе. Другими словами, мы (организмы) обучаемся обучаться или, в более технических терминах, мы проходим вторичное обучение (deutero-learning).
Однако привычки известны своей ригидностью, с необходимостью вытекающей из их статуса в иерархии адаптации. Та самая экономия проб и ошибок, которая достигается формированием привычек, возможна только потому, что привычки, как говорят инженеры, сравнительно "жестко запрограммированы". Экономия состоит именно в том, чтобы не перепроверять (не переоткрывать) предпосылки привычки в каждом случае ее использования. Мы можем сказать, что эти предпосылки являются "бессознательными", или, если хотите, что выработалась привычка не исследовать их.
Более того, нужно отметить, что предпосылки привычек с необходимостью абстрактны. Каждая проблема в той или иной степени отличается от любой другой, и ее описание или репрезентация в разуме будет, следовательно, содержать уникальные утверждения. Ясно, что было бы ошибкой позволить этим уникальным утверждениям снизиться до уровня предпосылок привычки. Привычка может успешно справляться только с теми утверждениями, которые содержат общие или повторяющиеся истины, а они обычно относятся к сравнительно высокому порядку абстракции [1].
1 3десь, однако, важнее, чтобы утверждение было постоянно верным, чем чтобы оно было абстрактным. Иногда случается (в силу совпадения), что хорошо выбранная абстракция имеет постоянство истины. Для человеческих существ скорее постоянно верно, что "вокруг носа всегда есть воздух"; поэтому рефлексы, управляющие дыханием, могут быть жестко запрограммированы в спинном мозгу. Для дельфина утверждение "вокруг дыхательного отверстия есть воздух" истинно только время от времени, поэтому его дыхание должно управляться более гибко из некоторого более высокого центра.
Специфические утверждения, которые, как я полагаю, важны при определении трансконтекстуальных синдромов, суть формальные абстракции, которые описывают и определяют межличностные отношения.
Я говорю "описывают и определяют", однако даже это не адекватно. Лучше было бы сказать, что отношения являются обменом этими сообщениями; либо что отношения имманентны этим сообщениям.
Психологи обычно говорят так, как если бы абстракции отношений ("зависимость", "враждебность", "любовь" и т.д.) были реальными вещами, которые должны описываться или "выражаться" сообщениями. Это эпистемология задом наперед: в действительности сообщения образуют отношения, а слова типа "зависимость" служат вербальным кодом для описания паттернов, имманентных комбинациям пересылаемых сообщений.
Как уже говорилось, в разуме нет "вещей", нет даже "зависимости".
Мы настолько одурманены языком, что не можем мыслить прямо; поэтому иногда полезно вспоминать, что на самом деле мы - млекопитающие. Кошка не говорит "молоко", она просто выражает поведением свою часть взаимообмена (или является ею); при помощи языка мы назвали бы паттерн этого взаимообмена "зависимостью".
Однако выражать или быть одной частью паттерна взаимодействия означает предполагать существование другой части. Так устанавливается контекст для определенного класса откликов.
Это переплетение контекстов и сообщений, подразумевающих контекст (которые, однако, подобно всем вообще сообщениям имеют "смысл" только благодаря контексту) есть предмет так называемой ДП-теории.
Предмет может быть проиллюстрирован знаменитой и формально корректной [2] аналогией из ботаники. Гёте заметил 150 лет назад, что в анатомии цветущих растений существует что-то вроде синтаксиса или грамматики. "Стебель" - это то, что несет "листья"; "лист" - это то, что имеет почку в своей пазухе (axil); почка - это стебель, который начинается в пазухе листа; и т.д. Формальная (т.е. коммуникативная) природа каждого органа определяется его контекстуальным статусом - контекстом, в котором он появляется, и контекстом, который он задает для других частей.
2 Формально корректной потому, что морфогенез, как и поведение, несомненно является предметом обмена сообщениями в контекстах (см.: Bateson, 1971).
Я сказал выше, что ДП-теория интересуется компонентой опыта в генезисе путаницы в правилах или предпосылках привычек. Теперь я перехожу к утверждению, что пережитые разрывы в ткани контекстуальной структуры фактически представляют из себя "двойные послания" и с необходимостью должны (если они вносят вклад во все иерархические процессы обучения и адаптации) содействовать тому, что я называю трансконтекстуальными синдромами.
Рассмотрим очень простую парадигму: самка дельфина (Steno brendanesis) обучена воспринимать звук свистка тренера как "вторичное подкрепление". За свистком ожидается получение пищи; и если она позднее повторит то, что делала, когда раздался свисток, то будет ожидать, что снова услышит свисток и снова получит пищу.
Далее тренеры используют эту самку дельфина для демонстрации публике "оперантного обусловливания". Попадая в демонстрационный бассейн, она поднимает голову над поверхностью, слышит свисток и получает пищу. Затем она снова поднимает голову и снова получает подкрепление. Трех повторений этой последовательности достаточно, и ее отсылают со сцены ждать два часа до следующего представления. Она научилась некоторым простым правилам, связывающим ее действия, свисток, демонстрационный бассейн и тренера в паттерн, т.е. в контекстуальную структуру, набор правил, по которым группируется информация.
Но этот паттерн годится только для единичного эпизода в демонстрационном бассейне. Для того чтобы справиться с классом таких эпизодов, она должна сломать этот паттерн. Существует больший контекст контекстов, который ставит ее в тупик.
На следующем представлении тренер снова хочет продемонстрировать "оперантное обусловливание", однако она должна выбрать другую ярко выраженную единицу поведения.
Появляясь на сцене, дельфин снова поднимает голову. Но свистка нет. Тренер ждет следующей ярко выраженной единицы поведения - вероятно, шлепка хвостом, обычно выражающего раздражение. Это поведение затем подкрепляется и повторяется.
Однако шлепок хвостом, конечно, не вознаграждается на третьем представлении. В конце концов дельфин научился справляться с контекстом контекстов, т.е. предлагать другую или новую ярко выраженную единицу поведения при появлении на сцене.
Все это случилось естественным образом в процессе свободного развития отношений между дельфином, тренером и аудиторией. Затем последовательность была экспериментально воспроизведена с новым дельфином и тщательно записана (Pryor, Haag, O'Rielly).
Приведу два пункта из этого экспериментального воспроизведения.
Во-первых, было необходимо (по мнению тренера) многократно нарушать правила эксперимента. Опыт переживания своей неправоты был для дельфина настолько тяжелым, что ради сохранения отношений дельфина и тренера (т.е. контекста контекстов контекстов) необходимо было давать множество подкреплений, на которые дельфин не имел права.
Во-вторых, каждая из первых четырнадцати сессий характеризовалась большим количеством бесполезных повторений тех видов поведения, которые подкреплялись на непосредственно предшествующих сессиях. Казалось, что животное выдавало единицу отличающегося поведения только "по случайности". В перерыве между четырнадцатой и пятнадцатой сессиями самка дельфина казалась очень возбужденной, и, когда она появилась на сцене в пятнадцатый раз, она устроила длительное представление, включающее восемь ярко выраженных единиц поведения, четыре из которых были совершенно новыми, т.е. никогда прежде не наблюдались у этого вида животных.
Я полагаю, что эта история иллюстрирует два аспекта генезиса трансконтекстуального синдрома:
Во-первых, ставя млекопитающее в положение неправоты согласно его собственным правилам осмысления важных отношений с другим млекопитающим, можно вызвать у него крайнюю боль и дезориентацию.
Во-вторых, если удается парировать или сопротивляться этой патологии, опыт такого рода, взятый в целом, может способствовать творчеству.
ЛОГИЧЕСКИЕ КАТЕГОРИИ ОБУЧЕНИЯ И КОММУНИКАЦИИ*
* Bateson G. The Logical Categories of Learning and Communication. Эта статья была написана в 1964 году, когда автор работал в Институте коммуникативных исследований по гранту Национального института психического здоровья. Она была предложена для "Conference on World Views", спонсируемой Фондом Веннера-Грена в августе 1968 года. Раздел "Обучение-III" добавлен в 1971 году.
Все ученые-бихевиористы интересуются "обучением" в том или ином смысле этого слова и, поскольку "обучение" - это коммуникативный феномен, все они затронуты той кибернетической революцией мышления, которая произошла за последние двадцать пять лет. Эта революция была начата инженерами и теоретиками коммуникации, однако она уходит корнями в физиологические работы Кэннона (Cannon) и Клода Бернара (Claude Bernard), в физику Кларка Максвелла (Clarke Maxwell) и в математическую философию Рассела и Уайтхеда (Russell, Whitehead, 1910-1913). Поскольку ученые-бихевиористы продолжают игнорировать проблемы Principia Mathematica, они могут претендовать приблизительно на шестидесятилетнее отставание.
Однако создается впечатление, что непонимания, разделяющие различные группы ученых-бихевиористов, могут быть прояснены (хотя и не устранены) приложением Теории Логических Типов Рассела к концепции "обучения", которая интересует их всех. Целью данной статьи и является попытка такого прояснения.
Теория Логических Типов
Во-первых, следует указать на субъекты Теории Логических Типов: теория утверждает, что никакой класс в формальном логическом или математическом рассуждении не может быть членом самого себя; что класс или классы не могут быть одним из классов, являющихся их членами; что имя не есть поименованная вещь; что "Джон Бейтсон" - это класс, единственным членом которого является тот мальчик; и т.д. Эти утверждения могут показаться тривиальными и даже очевидными, но мы увидим далее, что теоретики-бихевиори-сты не останавливаются перед совершением ошибок, в точности аналогичных ошибке классификации имени вместе с поименованной вещью, т.е. ошибок логической типизации. Это все равно, что съесть меню вместо обеда.
Несколько менее очевидно следующее теоретическое утверждение: класс не может быть одной из тех единиц, которые правильно классифицированы как его не-члены. Если мы классифицируем все стулья как класс стульев, мы можем далее заметить, что столы и лампы являются членами обширного класса "не-стульев", однако мы совершим ошибку в формальном дискурсе, если сочтем класс стульев единицей в классе не-стульев.
Поскольку никакой класс не может быть членом самого себя, класс не-стульев явно не может быть не-стулом. Простое рассмотрение симметрии может быть достаточно убедительным для читателя-нематематика:
a) класс стульев принадлежит к тому же порядку абстракции (т.е. логическому типу), что и класс не-стульев; b) раз класс стульев не является стулом, то, соответственно, класс не-стульев не является не-стулом.
И наконец, теория утверждает, что если эти простые правила формального дискурса нарушаются, то возникают парадоксы и дискурс становится недействительным.
Таким образом, теория имеет дело с весьма абстрактными материями и впервые возникла в абстрактном мире логики. Если в этом мире демонстрируется, что последовательность утверждений генерирует парадокс, то вся структура аксиом, теорем и т.д., причастная к генерированию этого парадокса, отрицается и уничтожается. Ее как будто никогда не существовало. Но в реальном мире (или, по крайней мере, в наших описаниях реального мира) всегда присутствует время, и что-то, что однажды существовало, уже нельзя тотально отрицать подобным образом. Компьютер, сталкивающийся с парадоксом из-за ошибок в программе, сам не исчезает.
В логических "если... то..." не содержится времени. В компьютере же причины и следствия используются для симуляции логических "если... то..."; причем сами последовательности причин и следствий с необходимостью включают время. И напротив, можно сказать, что при научных рассуждениях логические "если... то..." используются для симуляции "если... то..." причин и следствий.
Компьютер в действительности никогда не сталкивается с логическим парадоксом, а только с симуляцией парадокса посредством цепочек причин и следствий. Поэтому компьютер не исчезает. Он просто "зависает".
Фактически существуют важные различия между миром логики и феноменальным миром, и эти различия нужно принимать во внимание всегда, когда наши аргументы базируются на существующей между ними важной, но частичной аналогии.
Тезисом настоящей статьи является то, что эта частичная аналогия может дать ученым-бихевиористам важный ключ к классификации феноменов, связанных с обучением. Следовало бы применить что-то вроде теории типов именно в области коммуникации животных и механизмов.
К сожалению, подобные вопросы не слишком часто обсуждаются в зоологических лабораториях, антропологических полевых лагерях или на собраниях психиатров. Поэтому необходимо показать, что эти абстрактные рассуждения важны для ученых-бихевиористов.
Рассмотрим следующий силлогизм:
a) изменения в частоте наблюдаемых видов поведения млекопитающих могут быть описаны и предсказаны в терминах различных "законов" подкрепления; b) наблюдаемое у крыс явление "исследования" есть категория или класс поведения млекопитающих; c) следовательно, изменения в частоте явлений "исследования" должны поддаваться описанию в терминах тех же "законов" подкрепления.
Скажем сразу: во-первых, эмпирические данные показывают, что вывод (с) неверен; во-вторых, если бы удалось показать верность вывода (с), то либо (а), либо (b) было бы неверным [1].
1 Вполне понятно, что одни и те же слова могут использоваться при описании как класса, так и его членов, и могут быть верными в обоих случаях. Слово "волна" является именем класса движений частиц. Мы также можем сказать, что волна сама "движется", но при этом мы ссылаемся на движение класса движений. Из-за трения это метадвижение будет терять скорость, как и движение частицы.
И для логики, и для естествознания будет лучше, если вывод (с) будет расширен и подкорректирован примерно таким образом:
a) если, как сказано в (b), явление "исследования" есть не вид поведения млекопитающего, а категория таких видов, тогда никакое описательное утверждение, верное для видов поведения, не может быть верным для явления "исследования". Если, напротив, описательные утверждения, верные для видов поведения, верны также и для "исследования", то это "исследование" есть вид поведения, а не категория видов поведения.
Весь вопрос сводится к тому, является ли различие между классом и его членами упорядочивающим принципом для изучаемых нами феноменов поведения.
Говоря менее формальным языком: когда крыса изучает определенный незнакомый объект, ей можно создать подкрепление (позитивное или негативное), и она соответственно научится приближаться к объекту или избегать его. Но сама цель исследования заключается именно в получении информации о том, к каким объектам можно приближаться, а каких следует избегать. Следовательно, обнаружение того, что данный объект представляет опасность, является успехом в деле сбора информации. Этот успех не разочарует крысу в смысле дальнейшего исследования других незнакомых объектов.
Можно утверждать a priori, что все восприятие и все реакции, все поведение и все классы поведения, все обучение и всю генетику, всю нейрофизиологию и эндокринологию, всю организацию и всю эволюцию - вообще все это - следует рассматривать как предмет, коммуникативный по своей природе и потому имеющий отношение к тем крупным обобщениям или "законам", которые применяются к феноменам коммуникации. Следовательно, мы предупреждены о возможности найти в наших данных те принципы порядка, которые предлагает нам фундаментальная теория коммуникации. Мы ожидаем, что Теория Логических Типов, Теория Информации и другие будут нашими проводниками.
"Обучение" компьютеров, крыс и людей
Слово "обучение" несомненно указывает на изменение некоторого рода. Однако какого рода это изменение - это вопрос деликатный.
Тем не менее, такой обширный общий знаменатель, как "изменение" дает возможность заключить, что наши описания "обучения" должны опираться на те же допущения, что и переменные того логического типа, который стал обычным в физических науках со времен Ньютона. Простейшая и самая знакомая форма изменения - это движение, и, даже работая на очень простом физическом уровне, мы должны структурировать наши описания в таких терминах, как "положение или нулевое движение", "постоянная скорость", "ускорение", "скорость изменения ускорения" и т.д. [2]
2 Уравнения Ньютона, описывающие движение "частицы", останавливаются на уровне "ускорения". Изменение ускорения может произойти только при деформации движущегося тела, но ньютоновские "частицы" не состояли из "частей" и потому не были способны (логически) к деформации или другим внутренним изменениям. Следовательно, они не были подвержены изменению ускорения.
Изменение указывает на процесс. Но процессы сами подвержены "изменениям". Процесс может ускориться, замедлиться или подвергнуться другим типам изменений, которые позволят сказать, что теперь это "другой" процесс.
Эти соображения показывают, что нам следует начать организовывать свои идеи относительно "обучения" с самого простейшего уровня.
Рассмотрим случай специфического отклика, или нулевого обучения. В этом случае объект выказывает минимальные изменения своего отклика при повторяющемся типе сенсорного воздействия. Феномены, достигающие такого уровня простоты, возникают в различных контекстах:
a) при экспериментальных условиях, когда "обучение" завершено и животное дает приблизительно 100% правильных ответов на повторяющиеся стимулы; b) в случаях привыкания, когда животное перестает давать явный отклик на ранее беспокоивший стимул; c) в случаях, когда паттерн отклика минимально детерминирован опытом и максимально детерминирован генетическими факторами; d) в случаях, когда отклик становится высоко стереотипным; e) в простых электронных цепях, где структура цепи не может быть изменена в результате прохождения импульсов по этой цепи, т.е. когда каузальные цепи между "стимулом" и "откликом", как говорят инженеры, "запаяны".
В обычной нетехнической речи слово "обучение" часто применяется к тому, что здесь называется "нулевым обучением", т.е. к простому получению информации от внешнего события таким образом, что подобное же событие в соответствующее время в будущем передаст ту же информацию. Например: я "научился" узнавать по фабричному гудку, когда наступает двенадцать часов.
Также интересно отметить, что в рамках нашего определения многие очень простые механические устройства выказывают по меньшей мере феномен нулевого обучения. Вопрос, следовательно, не в том, "могут ли машины учиться", а в том, какого уровня обучения достигла данная машина. Стоит уделить внимание экстремальному, хотя и гипотетическому, случаю.
"Игрок" в игре фон Неймана есть математическая фикция, сравнимая с евклидовой прямой в геометрии или ньютоновской частицей в физике. По определению, "игрок" способен выполнить все вычисления, необходимые для решения любой проблемы, возникающей в игре; он не способен не выполнить эти вычисления там, где они необходимы; он всегда подчиняется результатам своих вычислений. Такой "игрок" получает информацию от событий игры и действует в соответствии с этой информацией. Но его обучение ограничено тем, что здесь называется нулевым обучением.
Исследование этой формальной фикции расширяет наше определение нулевого обучения.
(1) От событий игры "игрок" может получать информацию более высокого или более низкого логического типа и использовать эту информацию для принятия решений более высокого или более низкого уровня. То есть его решения могут быть либо стратегическими, либо тактическими, и он может идентифицировать и отвечать как на тактические, так и на стратегические действия своего противника. Однако верно, что в формальном определении игры фон Неймана все проблемы, предоставляемые игрой, считаются вычислимыми, т.е. хотя игра и может содержать проблемы и информацию многих различных логических типов, иерархия этих типов строго конечна.
Становится ясно, что определение нулевого обучения не зависит ни от логической типизации получаемой организмом информации, ни от логической типизации принимаемых организмом адаптивных решений. Очень высокий (однако конечный) порядок сложности может характеризовать адаптивное поведение, не базирующееся ни на чем, превышающем нулевое обучение.
(2) "Игрок" может вычислить ценность полезной для себя информации, а также вычислить, что эта информация стоит того, чтобы ее получить путем "разведывательных" ходов. Или же он может делать пустые и пробные ходы в ожидании нужной информации.
Из этого следует, что крыса, занятая исследовательским поведением, может делать это на базе нулевого обучения.
(3) "Игрок" может вычислить, что ему могут быть выгодны случайные ходы. При игре в монетку он может вычислить, что, выбирая "орел" или "решку" случайным образом, он будет иметь равный шанс на победу. Если он использует некоторый план, то этот план проявится как паттерн (избыточность) в последовательности его ходов и его противник получит таким образом информацию. Следовательно, "игрок" выберет случайную игру.
(4) "Игрок" не способен на "ошибку". Он может (по серьезным причинам) делать случайные либо разведывательные ходы, но он по определению не способен "учиться методом проб и ошибок".
Если мы полагаем, что в названии этого учебного процесса слово "ошибка" означает то же, что мы имели в виду, когда говорили, что "игрок" не способен на ошибку, тогда "пробы и ошибки" исключаются из репертуара "игрока" фон Неймана. Фактически "игрок" фон Неймана заставляет нас очень тщательно исследовать то, что мы имеем в виду под "обучением методом проб и ошибок", а также, разумеется, всего, что имеется в виду под обучением любого рода. Предположение, связанное со значением слова "ошибка", нетривиально и должно быть исследовано.
В определенном смысле "игрок" может ошибаться. Например, он может принять решение по вероятностным соображениям и затем сделать ход, который в свете ограниченной доступной информации является правильным с наибольшей вероятностью. Когда же становится доступно больше информации, он может обнаружить, что ход был ошибочным. Но это открытие ничего не может прибавить к его будущим навыкам. По определению, игрок правильно использовал всю доступную информацию. Он правильно оценил вероятности и сделал ход, который был правильным с наибольшей вероятностью. Открытие того, что в некоторый момент он ошибся, не может иметь отношения к будущим ситуациям. Если впоследствии возникнет та же проблема, он проделает те же вычисления, придет к тем же решениям и будет прав. Более того, набор альтернатив, из которого он будет делать свой выбор, будет все тем же набором. И это правильно.
|