Оглавление

 

 

2. Теоретическое обучение обучаемых систем управления

 

Положим в основу теоретического обучения математическую мо­дель (1.12)...(1.16). Целью обучения пусть будет выявление зако­номерностей обучения. При этом, может быть — самое главное, мы будем формировать у себя интуитивное восприятие обучаемых сис­тем управления: глубина понимания систем зависит от навыков общения с ними, в данном случае — от навыков теоретического обучения. Начнём о самых простых случаев.

 

 

2.1. Обучение в двух ситуациях

 

Пусть обучаемая выборка состоит всего из двух ситуаций А и В, в которых образы очувствления представляют собой наборы возбуждений рецепторов:

образ А: , , ..., ;

образ В: , , ..., ,

и пусть требуемые сигналы управления имеют следующие значения: в ситуации А , в ситуации В.

Разобьем весь процесс обучения на шаги и циклы. Примем исход­ное состояние мозга нулевым, т.е. все исходные проводимости си­напсов равны нулю: .

Ход обучения в двух ситуациях. Проведём теоретическое обуче­ние в двух ситуациях, повторив начало обучения, проведённое ранее.

1.1. (Цикл 1-ый, шаг 1-ый) Предъявим ситуацию А и определим не обучая фактический сигнал управления в ней в соответствии с выражением (1.12) (не трудно сообразить, что он будет равен нулю):

 

.

 

Погрешность сигнала управления согласно (1.13) составит

 

.

 

(И этот результат должен быть нам понятен.)

Теперь начнём систему обучать, т.е. будем изменять проводи­мость синапсов по закону обучения, отражённому в выражении (1.9). Если при этом принять, что на каждом шаге обучения удаётся свести выявленную погрешность к нулю, то поправки проводимостей, как было раньше доказано, будут изменяться по формуле (1.15). В на­шем случае поправка проводимости каждого i-го синапса опре­делится как

 

,

 

где  — удельное возбуждение  i-го рецептора в А-ситуации, определяемое выражением (2.8).

Сами проводимости после обучения на 1-ом шаге 1-го цикла мож­но выразить для каждого i-го синапса в соответствии с выраже­нием (1.16) в виде

 

;

 

На этом первый шаг обучения завершен.

1.2. (Цикл 1-ый, шаг 2-ой) Предъявим ситуацию В. Повторяя прежний ход обучения получим:

Фактический сигнал управления (после обучения в ситуации А и последующего предъявления ситуации В):

 

,

 

где  — коэффициент приведения образа А к образу В, опреде­ляемый выражением (2.11);

погрешность сигнала управления:

 

;

 

поправки проводимостей синапсов (после дополнительного обучения в ситуации В):

 

,

 

где  — удельное возбуждение i-го рецептора в В-ситуации, определяемое выражением (2.8);

проводимости синапсов:

 

.

 

На этом первый цикл обучения завершен.

2.1. (Цикл 2-ой, шаг 1-ый)

 

,

 

где  — коэффициент приведения образа В к образу А, определяемый выражением (2.11)

 

;

;

.

 

2.2. (Цикл 2-ой, шаг 2-ой).

 

,

 

где  — степень сходства образов А и В, определяемая выражением (2.12).

 

;

;

 

3.1.

 

;

;

;

 

3.2.

 

;

;

;

 

4.1.

 

;

;

;

 

4.2.

 

;

;

;

 

5.1.

 

.

 

И так далее.

Уточним обозначения: Е(АВАВАВАВ,А) — означает факти­ческий сигнал системы, обученной в четырёх циклах (АВАВАВАВ), при предъявлении очередной ситуации А;  — означает проводимость i-го синапса после обучения в четырёх циклах.

Закономерности обучения в двух ситуациях. Как видно из про­ведённого теоретического обучения, этих циклов достаточно для того, чтобы выявить вое закономерности обучения. Начнём с того, что погрешность сигнала управления в каждом последующем цикле обучения  определяется как погрешность в предыдущем цикле  , умноженная на степень сходства образов :

 

,                        (2.21)

 

— такое соотношение называется функцией последования.

А так как степень сходства двух образов  всегда меньше единицы, то выражение (2.21) свидетельствует о сходимости про­цесса обучения: каждая последующая погрешность будет меньше предыдущей. Исключение составляют только те образы, степень сходства которых равна единице, а такие образы (и их ситуации) мы уже охарактеризовали как противоречивые. Действительно, про­цесс обучения будет нескончаемым и бессмысленным, если обучатель будет требовать от обучаемых систем управления в одинаковых ситуациях разных сигналов управления.

Рис. 2.1. Зависимость погрешности сигнала управления на последую­щем цикле обучения  от погрешности на предыдущем цикле

Из выражения (2.21) следует и то, что, чем меньше степень сходства , тем стремительнее будет уменьшаться погрешность сигнала управления  и тем успешнее будет проходить обучение. Изменение погрешности  по ходу обучения можно продемонстрировать на графике функции последования (рис.2.1), где по оси абсцисс отложена погрешность предыдущего цик­ла , а по оси ординат — погрешность на последующем цикле .

Обучение завершается, оче­видно, тогда, когда погрешность сигнала управления окажется меньше допустимого отклонения .

Если обучаемая выборка вклю­чает только две ситуации А и В то после Т циклов обучения установятся следующие проводимости синапсов:

 

           (2.22)

 

Последние поправки проводимостей после завершающего обучения в последующей ситуации В составят

 

.            (2.23)

 

Фактический сигнал управления после Т циклов обучения и последующего предъявления ситуации А определится выражением

 

,          (2.24)

 

а погрешность сигнала управления в этой же ситуации составит

 

.             (2.25)

 

Выражения (2.24) и (2.25) получены на основании анализа те­оретического обучения, но их можно получить также путем под­становки выражения (2.14) в формулы (1.12) и (1.13):

 

;

.

 

Так как:

 

;   ;

;   ;

,

 

то результат окажется один и тот же.

Путём такой же подстановки можно определить фактический сигнал при предъявлении ситуации В:

Погрешность сигнала управления в этом случае оказывается равной нулю

 

 

В таком результате нет ничего удивительного, если вспомнить, что теоретическое обучение строится по принципу полного устра­нения погрешности сигнала управления на каждом шаге обучения. Это свойство может быть использовано при теоретическом обучении для самоконтроля: после завершения обучения в любой ситуации, т.е. после корректировки проводимостей синапсов в этой ситуа­ции, при предъявлении этой же ситуации погрешность сигнала уп­равления должна обязательно равняться нулю, а сам фактический сигнал — ничем не отличаться от требуемого.

Если обучение продолжить после Т циклов ещё на один шаг о предъявлением ситуации А, то после обучения в ней установятся следующие проводимости синапсов:

 

       (2.26)

 

Поправки проводимостей в этом случае будут такими:

 

.         (2.27)

 

При последующем предъявлении ситуации В фактический сигнал управления в ней и погрешность этого сигнала определятся как

 

;    (2.28)

.                (2.29)

 

Выражения (2.21)...(2.29) отражают закономерности обучения, если обучаемая выборка состоит всего из двух ситуаций.

Продолжительность обучения в двух ситуациях. Обучение системы управления осуществляет обучатель; он прекращает обучение тог­да, когда действия обучаемого объекта удовлетворят его требо­ваниям точности. В каких-то ситуациях, например в целевых, эти требования будут очень высокими, в других — не очень, а в не­которых — совсем незначительные. Тот же самый подход осущест­вляется и при самообучении системы, когда она руководствуется критериями «хорошо» и «плохо»: если действия объекта не «хоро­ши», а «плохи», но допустимы, то обучение приостанавливается.

Требуемую точность можно выразить через допустимые отклоне­ния сигналов управления. Обозначим в рассматриваемом обучении с двумя ситуациями через , допустимое отклонение в ситуации А, а через  допустимое отклонение в ситуации В. Для простоты условимся считать, что оба допустимых отклонения сигналов управления  и  симметричны относительно номинала, т.е. плюс- и минус-отклонения равны между собой, и все вели­чины представлены только в абсолютных значениях, без учёта их знака.

Из хода теоретического обучения следует, что обучение будет завершено за один шаг (с обучением только в ситуации А), если выполнятся условия

 

;

;

 

за один цикл ( с обучением последовательно в ситуациях А и В), если

 

;

;

 

за три шага (с обучением последовательно в ситуациях А, В и А), если

 

;

;

 

за два цикла (с обучением последовательно в ситуациях А, В, А и В), если

 

;

;

 

и так далее.

В каждом представленном частном случае рассматривалась по­грешность сигнала управления  только при предъявлении одной  какой-то ситуации; при предъявлении другой, той, в которой завершилось обучение, как было показано выше, погрешность будет равна нулю, например  всегда меньше допустимого отклонения , так как она равна нулю.

В общем случае обучение можно считать завершенным, если вы­полняется условие

 

.                                    (2.30)

 

После подстановки в это условие выражения (2.25) и некото­рых преобразований получим выражение для определения числа циклов обучения

 

.                (2.31)

 

Если после Т циклов проведено ещё обучение в ситуации А, то условием завершения обучения будет

 

,                                   (2.32)

 

а число полных циклов обучения определится как

 

.                         (2.33)

 

Так как каждый цикл состоит из двух шагов, то полное число шагов обучения в первом случае составит , а во вто­ром с учётом дополнительного обучения в ситуации А будет равно .

Порядок предъявления двух ситуаций. Порядок предъявления ситуаций существенно влияет на скорость обучения обучаемых систем управления; в этом легко убедиться на любом численном примере. В общем на скорость обучения влияют многие факторы: подбор ситуаций, соотношение сигналов управления, выразитель­ность, яркость и контрастность образов, соотношение образов между собой и др. Разобраться с влиянием на обучение всех этих факторов можно двояко: на основе опыта или путём выявления логики связи обучения с учитываемыми факторами. Первый путь требует времени общения с «живым» объектом, оснащенным обучае­мой системой управления, второй упирается в теоретическое обучение.

Рассмотрим влияние на скорость обучения порядка предъявления двух ситуаций А и В. Задача эта не может рассматриваться в качестве характерной, так как последовательность только двух ситуаций всегда одна и та же: после предъявления ситуации А следует предъявление ситуации В, а после неё снова А; других вариантов нет. Говорить можно лишь о предпочтении в выборе первой и последней ситуаций. Лучшей оценкой сходимости процесса обучения является зависимость величины погрешности сигнала управления от числа циклов обучения, отражённая в выра­жениях (2.25) и (2.29). Первая зависимость получена при усло­вии, что обучение начинается с ситуации А, а заканчивается в ситуации В. Вторая зависимость получена при другом условии: обучение начинается о той же ситуации А, и заканчивается в той же ситуации.

Если же теперь переставить ситуации местами, т.е. начать не с ситуации А, а с ситуации В, то соответствующие пог­решности сигналов управления после тех же Т циклов обучения определятся уже так:

 

;         (2.34)

 

.              (2.35)

 

Пусть первая последовательность  будет более продуктивной с точки зрения скорости обучения, чем вторая , т.е.

 

;                           (2.36)

 

.                       (2.37)

 

Примем знаки требуемых сигналов управления  и  одина­ковыми и избавимся в условиях (2.35) и (2.37) от оговаривания их абсолютных значений. После подстановки в условия (2.36) и (2.37) выражений (2.25), (2.29), (2.34) и (2.35) получим соответственно

 

;                                  (2.38)

 

.                                    (2.39)

 

Согласно условия (2.38) при предъявлении ситуации А первой — обучение будет более успешным в том случае, если >, а <. Условие же (2.39) при той же начальной ситуа­ции А требует совершенно противоположного: >. Другими словами, условия (2.38) и (2.39) — несовместимы. Вывод может быть только один: выбор в качестве первой — ситуации А или ситуации В на скорости обучения никак не оказывается.

Другое дело какая из ситуаций предъявлена последней. Условие (2.38), соответствующее условию (2.36), отдаёт пред­почтение в качестве последней ситуации А, а условие (2.39) соответствующее условию (2.37), — ситуации В. Итак, если последней предъявляется ситуация А, то желательно согласно условию (2.38), чтобы требуемый сигнал в ней  был меньше, чем , но коэффициент  должен быть больше коэффициента . Не противоречит этому и условие (2.39). Согласно ему лучше предъявлять последней — ситуацию В, если >, а <.

Рассмотрим в связи с этим более подробно соотношение коэф­фициентов  и . Если подставить в условие (>) выражения в соответствии с (2.11), то это условие приобретёт вид

 

.

 

Такое соотношение может возникнуть тогда, когда, во-первых, образ В более ярок, чем образ А. Это может быть в том слу­чае, если напряжение питания рецепторов по какой-то причине в ситуации В больше, чем в ситуации А или когда в образе В больше светлых пятен, если говорить о зрительных ситуациях. Во-вторых, такое может быть в том случае, если образ В более контрастен, чем образ А. Изменение контрастности образа мо­жет произойти от изменения освещённости сцены: чем ярче осве­щение, тем контрастнее образ, если фоторецепторы глаза парны. Снижение контрастности может произойти, в частности, и в том случае, если зрительная сцена смещена оптикой в сторону мень­шей резкости. И, наконец, в-третьих, указанное соотношение может возникнуть при появлении в образе В яркого пятна, кото­рого не было в образе А.

Остаётся уяснить, насколько справедливы вышеприведённые рассуждения, если требуемые сигналы управления  и  имеют противоположные знаки. Известно, что обучаемые системы управ­ления абсолютно симметричны с точки зрения знаков сигналов управления. Поэтому нет смысла уточнять, какой из сигналов  управления  или  положительный, а какой — отрицательный. Подход к порядку предъявления ситуаций остаётся прежним. Если допустимые отклонения сигналов управления  и , точнее говоря — их абсолютные значения, не равны между собой, то первой же­лательно предъявлять ситуацию, в которой допустимое отклонение больше, а последней —, в которой допустимое отклонение меньше. Если же = то последней ситуацией в процессе обучения следует выбирать ту, в которой абсолютное значение требуемого сигнала управления наибольшее.

Условия (2.38) и (2.39) можно получить путём сравнения чисел циклов обучения с использованием выражений (2.31) и (2.33), но ничего нового такое сравнение не даёт.

 

 

2.2. Обучение в трёх ситуациях

 

Пусть обучаемая выборка состоит из трёх ситуаций А, В, С, — в которых образы очувствления представляют собой наборы воз­буждений рецепторов:

образ А: ,  , ..., ;

образ В: ,  , ..., ;

образ С: ,  , ..., ,

и пусть требуемые сигналы управления имеют следующие значения: в ситуации А , в ситуации В , в ситуации С .

Разобьем опять весь процесс обучения на шаги и циклы. При­мем, как прежде, исходное состояние мозга нулевым, т.е. все исходные проводимости синапсов равны нулю: .

Ход обучения в трёх ситуациях. На первых двух шагах (1.1 и 1.2) с поочередным предъявлением ситуаций А и В обучение будет таким же, как и с двумя ситуациями в обучаемой выборке. Начнем рассмотрение с 3-го шага 1-го цикла.

1.3. (Цикл 1-ый, шаг 3-ий)

 

;

;

 

Очевидно, что при обучении в трех ситуациях все выражения становятся громоздкими. Поэтому перейдем от абсолютных параметров обучения к относительным. Для этого продолжим обучение не на 2-ом цикле, а спустя Т циклов обучения.

Т+1, 1. (Цикл Т+1, шаг 1-ый, ситуация А):

 

;

;

;

.

 

Т+1, 2. (Цикл Т+1, шаг 2-ой, ситуация В):

 

;

;

;

.

 

Т+1, 3. (Цикл Т+1, шаг 3-ий, ситуация С):

 

;

;

 

Т+2, 1. (Цикл Т+2, шаг 1-ый, ситуация А):

 

 

После подстановки в это выражение  из предыдущего цикла первого шага получим

 

;

;

.

 

Т+2, 2. (Цикл Т+2, шаг 2-ой, ситуация В):

 

;

 

Подставим сюда  из предыдущего цикла 2-го шага, получим

 

;

;

.

 

Т+2, 3. (Цикл Т+2, шаг 3-ий, ситуация С):

 

;

;

.

 

На этом обучение можно прекратить, так как выявились все основные закономерности.

Закономерности обучения в трёх ситуациях. Если ситуации в каждом цикле предъявляются в строгой последовательности, а именно: , то после (Т+1) циклов обучения на (Т+2)-ом цикле в ситуации А фактический сигнал управления, как следу­ет из анализа хода обучения, определится в виде

 

             (2.40)

 

Погрешность сигнала управления в этом случае выразится как

 

.  (2.41)

 

Проводимости синапсов после завершения обучения в (Т+1) циклах сформируются такими

 

   (2.42)

 

Ещё раз расшифруем обозначения, в частности: — погрешность сигнала управления после обучения в Т циклах, последующего обучения в ситуациях А и В и при предъявлении ситуации С;  — удельное возбуждение i-го рецептора в С-ситуации, определяемое выражением (2.9).

Простой анализ выражения (2.40) показывает, что фактический сигнал управления слагается из фактического сигнала, полученного циклом ранее, и добавок на каждом шаге последнего цикла, каж­дая из которых определяется произведением погрешности сигнала этого шага на коэффициент приведения образа соответствующей ситуации к последней предъявленной. Отсутствие коэффициента приведения в первой добавке  объясняется тем, что она соответствует предъявлению ситуации А и приведение осуществля­ется также к ситуации А; а так как коэффициент приведения образа к самому себе (в данном случае ) всегда равен еди­нице, то этот коэффициент в выражении (2.40) опущен.

Похоже формируются проводимости синапсов — выражение (2.42). Проводимость каждого i-го синапса наращивается в течение всего последнего цикла на каждом шаге в полном соответствии с законом обучения, согласно которому изменение проводимости на любом шаге обучения определяется произведением погрешности сигнала управле­ния на соответствующее удельное возбуждение рецептора.

Что касается величины погрешности сигнала управления  — вы­ражение (2.41), — то она зависит только от последних двух шагов обучения и имеет два соответствующих слагаемых, каждое из кото­рых определяется погрешностью  данного шага, умноженной на коэффициент приведения образа ситуации этого шага к образу по­следней ситуации. Особо следует подчеркнуть то, что в принципе погрешность сигнала управления меняет свой знак на каждом по­следующем шаге обучения, так что фактически она не складывается из погрешностей последних двух шагов обучения, а вычитается. Отсюда следует, что на каждом последующем цикле обучения абсо­лютная величина погрешности сигнала управления будет меньше предыдущей; и здесь нет исключений, если не принимать в расчёт противоречивые ситуации.

Обратим внимание на то, что все параметры обучения зависят только от погрешностей сигналов управления, а те, в свою оче­редь, — от коэффициентов приведения образов вовлечённых в обу­чение ситуаций и от требуемых сигналов управления. (Зависимость от требуемых сигналов выявляется при скольжении по процессу обучения назад вплоть до первого цикла.) Таким образом, обучение обучаемых систем управления определяют два фактора: требуемые сигналы управления и коэффициенты взаимного приведения образов используемых ситуаций, и если отнести требуемые сигналы управ­ления в субъективным факторам, то остаётся лишь одна зависимость хода обучения зависимость от коэффициентов приведения. Тем самым мы подтвердили значимость в общей теории обучаемых систем управления теории образов.

Если после завершения обучения в (Т+1) циклах о принятой последовательностью  предъявить ситуацию В, то фактический сигнал управления определится как

 

 

После подстановки в полученное выражение погрешности , определённой в предыдущем цикле, получим

 

,                    (2.43)

 

а погрешность сигнала управления в этой же ситуации примет вид

 

.                       (2.44)

 

Что же касается параметров  и , то их можно предсказать без выводов: если обучение на (Т+1)-ом цикле завершилось в ситуации С, то при последующем предъявлении этой же ситуации фактический сигнал управления будет равен : , — а его погрешность, естественно, будет равна нулю: . Это следует из того, что в основе обучения лежит идеальный закон, согласно которому, повторим, погрешность  на каждом шаге обучения устраняется полностью. Можно в качестве самопроверки доказать это в данном конкретном случае. Фактический сигнал управления после завершения обучения в (Т+1)-ом цикле, последней в котором была ситуация С, при предъявлении этой же ситуации определится как

 

 

Подставив в это выражение погрешность  из преды­дущего цикла, получим

 

,

 

и погрешность , разумеется, будет равна нулю.

Выражение (2.41) можно представить в более общей форме, если ввести вместо циклов шаги по нарастающей: 1-ый шаг 2-го цикла считать 4-ым шагом, 2-ой шаг 2-го цикла 5-ым шагом и т.д. Сохраняя, по-прежнему, строгую последовательность предъявления ситуаций, можно закон изменения погрешности сигнала управления при включении в обучаемую выборку трёх ситуаций представить в виде

 

,           (2.45)

 

где t — номер шага обучения;  — коэффициент приведения образа ситуации предыдущего шага к образу текущей;  —коэффициент приведения образа ситуации, предъявленной двумя шагами раньше, к образу текущей ситуации.

Выражение (2.45) даёт некоторую свободу в выборе последней ситуации обучения, которой может быть не только последняя ситу­ация цикла: приняв последовательность ситуаций , закончить обучение можно на любой из них. Выражение (2.45) подтверждает, что погрешность сигнала управления на последнем шаге обучения определяется погрешностями двух предыдущих шагов и соответствующими коэффициентами приведения.

Приведём выражение (2.45) к такому виду, когда погрешность будет зависеть от самой себя в той же ситуации, но циклом ранее; для этого сместим зависимость (2.45) на один шаг назад:

 

.

 

Подставляя полученное значение  в выражение (2.45), получим

 

                     (2.45а)

 

где  — степень сходства образов предыдущей и текущей ситуаций;  — коэффициент приведения образа ситуации, предъявленной двумя шагами раньше, к образу предыдущей ситуации.

Для наглядности изобразим выражение (2.45,а) применительно к каким-либо конкретным ситуациям, например:

 

.

 

Полученное выражение похоже на подобную зависимость в двух ситуациях (2.21) тем, что погрешность сигнала управления в каж­дом последующем цикле обучения определяется погрешностью в той же ситуации предыдущего цикла, умноженной на степень сходства образов текущей и предыдущей ситуаций, и отличается тем, что учитывается влияние третьей ситуации. В общем случае это вли­яние выражается в увеличении погрешности  и удлинении про­цесса обучения, но может быть и наоборот. Поясним сказанное. Коэффициенты приведения нормальных образов чаще всего бывают по величине близкими единице, так что произведение  вероятнее всего, меньше величины , а разность  имеет очень малое значение; отсюда влияние погрешности в третьей ситуации, в нашем случае — , незначительно. Что же касается знака указанного влияния: уменьшает ли оно погрешность  или увеличивает, — то выясним его путём анализа ситуаций. Доли требуемый сигнал в ситуации А меньше, чем в ситуации , но они имеют одинаковый знак, то, скорее всего, погрешности  и  находятся в одной знаковой полуплоскости; если же  или они имеют разные знаки, то и указанные погрешности — разного знака. При одина­ковости знаков третья ситуация (ситуация В) будет способство­вать уменьшению погрешности на каждом цикле и ускорению процесса обучения; при разных знаках — всё будет наоборот. Исходя из сказанного, можно утверждать, что сохранение каждой погреш­ностью своего знака при смещении на цикл наиболее вероятно, и только когда  окажется больше, чем  погрешность в ситуации А при смещении на цикл изменит свой знак, но это почти невероятно; последнее может возникнуть, в частности, при очень малом значении степени сходства .

Таким образом, выражения (2.40)...(2.45) отражают закономер­ности обучения, если обучаемая выборка состоит из трёх ситуаций.

Продолжительность обучения в трех ситуациях. Обозначим, по­-прежнему, через , ,  — допустимые отклонения сигналов управления соответственно в ситуациях А, В, С; примем, что все допустимые отклонения симметричны относительно номинала и будем рассматривать все величины как абсолютные, без учёта их знака, памятуя о том, что разные знаки свидетельствуют лишь о проти­востоянии, но не о соотношении.

Очевидно, обучение может завершиться за один шаг в ситуации А, если при последующих предъявлениях других ситуаций В и С  погрешности сигналов управления в них не будут превышать допустимых отклонений:

 

;        .

 

Погрешность  была определена на 2-ом шаге 1-го цикла при обучении в двух ситуациях: погрешность  может быть представлена в таком же виде с заменой ситуации В на ситуацию С; в результате получим:

 

;

.

 

Уточним: обучение может быть прекращено, если выполняются оба условия. В этих условиях главными параметрами, по-прежнему, являются коэффициенты приведения образов ситуаций  и , определяющие соотношения образа А с образами В и С.

Обучение может быть прекращено за два шага, если будут вы­полнены следующие условия:

 

;       .

 

Погрешность  была определена на 3-ем шаге 1-го цикла при обучении в трёх ситуациях; погрешность  была оп­ределена на 1-ом шаге 2-го никла при обучении в двух ситуациях; после уточнения получим условия прекращения обучения:

 

;

.

 

И, наконец, обучение завершается за (Т+1) цикл, если будут выполнены условия

 

;        .

 

Подставляя в эти условия выражения (2.41) и (2.44), получим:

 

             (2.46)

 

В более общем виде с использованием выражения (2.45), в ко­тором циклы Т заменены на шаги t по нарастающей, условия прекращения обучения (2.46) примут вид

 

;       ,

 

или

 

        (2.47)

 

где  и   допустимые отклонения сигналов управления в ситуациях, которые должны быть предъявлены по порядку соответственно на (t+2)-ом и на (t+1)-ом шагах.

Так как =0 то допустимое отклонение  не имеет никакого значения.

Полученные условия (2.46) и (2.47) определяют не количест­венные, а качественные соотношения, говорящие о том, что о учё­том коэффициентов приведения последние погрешности сигналов управления формируются на последнем предшествующем цикле обу­чения; это лишний раз подчёркивает глубокую закономерность обучения. Напомним ещё раз, что все величины условий приведены в абсолютных значениях без учёта их знака.

Порядок предъявления трёх ситуаций. Сохраним прежнее обоз­начение ситуаций А, В, С. Число вариантов порядка предъявле­ния их равно числу перестановок, т.е. шести; вот эти варианты: АВС, ВСА, САВ, АСВ, СВА, ВАС; однако в непрерывной че­реде предъявлений ситуаций выделяются уже только два порядка:

 

АВСАВСАВСА ...;                                        (2.48)

АСВАСВАСВА ...,                                        (2.49)

 

которые включают в себя все прежние шесть вариантов.

Попробуем выявить зависимость скорости обучения от порядка предъявления ситуаций (2.48) или (2.49). Определим с использо­ванием выражения (2.43) погрешность сигнала управления на том шаге обучения, на котором предъявляется ситуация А; и в первом порядке предъявлений (2.48), и во втором (2.49) это будет кроме первого — четвёртый, седьмой, десятый и т.д. шаги обучения. Но сами выражения для определения погрешностей  в разных порядках предъявлений будут разными; так в порядке (2.48):

 

,           (2.50)

 

а в порядке (2.49) — несколько иначе:

 

.        (2.51)

 

Будем считать, что порядок (2.48) более эффективен с точки зрения скорости обучения, чем порядок (2.49), т.е.:

 

.

 

Прежде чем подставить в это условие выражения (2.50) и (2.51), уточним знаки слагаемых в этих выражениях. Мы уже го­ворили о том, что в общем случае знак погрешности  на каж­дом последующем шаге обучения изменяется на обратный; и если он на t-ом шаге определён отрицательным, следовательно, на (t-1)-ом шаге он будет положительным, а на (t-2)-ом шаге снова отрицательным. (В действительности знак погрешности будет зависеть от соотношения величин слагаемых, но примем, что погрешность предыдущего шага больше погрешности последую­щего, хотя это иногда может не выполняться.) Тогда последнее условие можно представить в виде

 

 

Пренебрегая некоторой неточностью, получим: >, — а это означает, что порядок предъявления ситуаций (2.48) более предпочтителен, чем — (2.49) при условии, что коэффициент при­ведения образа В к образу А больше коэффициента приведения образа С к тому же образу А. Такое соотношение будет при > т.е. когда образ С более яркий и более кон­трастный, чем образ В, или когда в образе С присутствуют светлые пятна, которых нет в образе В. Следовательно, пос­ледней из двух последних в цикле обучения целесообразно ставить такую ситуацию, в которой зрительная сцена ярче освещена, а видимые предметы находятся в зоне наибольшей оптической резкости.

Интересно выявить также предпочтения в выборе в цикле первой ситуации. В порядке (2.48) такой ситуацией является А. Остав­ляя порядок предъявления ситуаций прежним, примем за начальную — ситуацию В. На основании выражения (2.45) при предъявлении на любом очередном цикле ситуации В получим

 

.

 

И пусть будет

 

.

 

После раскрытия содержания составляющих этого условия с учётом принятого сочетания знаков слагаемых погрешностей получим

 

.

 

Сосредоточим своё внимание на правой части полученного нера­венства: чем оно меньше, тем предпочтительнее в качестве первой ситуации цикла выбирать ситуацию А. Раскрывая содержание ко­эффициентов приведения и вводя некоторые допущения, получим условие:  >.

Значит, первой из двух начальных ситуаций в цикле обучения целесообразно ставить такую ситуацию, в которой зрительная сцена ярко освещена, а видимые предметы находятся в зоне наибольшей оптической резкости. Это условие похоже на условие выбора пос­ледней ситуации в цикле. Из этих двух условий извлекается один общий вывод о том, что средней ситуацией в трёхситуационном цикле лучше выбирать самую неяркую ситуацию. Что же касается того, какую из двух оставшихся ситуаций ставить первой, а какую — последней, то ответ на этот вопрос лучше искать не по соотно­шению образов, а по требуемым сигналам управления или, ещё лучше, по допустимым отклонениям этих сигналов. Разумеется, ситуацию с самым точным сигналом управления, имеющим наименьшее допустимое отклонение, лучше ставить в цикле последней, и на ней лучше завершать обучение.

 

 

2.3. Обучение с числом ситуаций более трёх

 

Рассмотренные выше примеры обучения робота поиску заданных предметов показали, что число ситуаций в обучаемой выборке может быть крайне малым: две, три, четыре, — но при усложнении задач число ситуаций, очевидно будет возрастать. Конечно, опыт­ный обучатель и в таких случаях сумеет обойтись самым малым числом ситуаций, но неопытный вынужден будет использовать чуть ли не все возможные ситуации. Поэтому необходимо продолжить начатое нами теоретическое обучение для большого количества ситуаций в обучаемой выборке.

Беспорядочное обучение. Беспорядочное обучение не предусматривает ни строгой очередности предъявления ситуаций, ни вообще набора определенных ситуаций в обучаемой выборке. По существу, может отсутствовать и сама предварительно составленная обучаемая выборка. На очередном шаге обучения рассматривают ту ситуацию, которая возникла в данный момент. Такое беспорядочное обучение похоже на обучение методом вождения «за руку» или «под уздцы» в реальной обстановке. При этом некоторые ситуации, разумеется, будут повторяться, но каждый раз такие ситуации должны восприниматься как новые, схожие с предыдущими и требующие таких же сигналов управления.

Рассмотрим беспорядочное обучение более подробно. Если даже процесс обучения будет происходить гладко, без ступенек, под которыми мы подразумеваем определенные ситуации, например при плавном вождении «за руку», то и в этом случае договоримся выделять ситуации, дискретизируя процесс либо по времени, либо по различимости ситуаций. И пусть непрерывная череда ситуаций выглядит как

Что касается теоретического обучения в последовательно предъявляемых ситуациях А, В и С, то оно уже было нами проведено ранее, и мы воспользуемся его результатами. Проследим сначала за изменением погрешностей сигналов управления в этих ситуациях и для наглядности выпишем их еще раз:

· из первого шага цикла с двумя ситуациями:

 

;

 

· из второго шага первого цикла с теми же двумя ситуациями:

 

;

 

· из третьего шага первого цикла с тремя ситуациями:

 

.

 

Закономерности беспорядочного обучения. Нас интересуют взаимозависимости погрешностей сигналов управления, т.е. как последующие погрешности зависят от предыдущих, поэтому подставим в выражения погрешностей последующих шагов погрешности предыдущих; получим:

 

;

;

.

 

Закономерность здесь настолько очевидна, что без боязни ошибиться можно предложить выражение для погрешности сигнала управления в следующей Д-ситуации:

 

 

 

Рис. 2.2. Формирование сигналов управления и их погрешностей при беспорядочном обучении

 

И так далее. Изобразим процесс формирования погрешностей сигналов управления графически (рис.2.2). Из графика видно, что составляющими частями фактического сигнала управления  на любом t-ом шаге обучения перед дообучением являются по­грешности сигналов управления  всех предыдущих шагов, при­ведённые к данному шагу с помощью коэффициентов приведения. Так, если погрешность  возникла, например, на р-ом шаге обучения, то она войдёт составляющей в фактический сигнал уп­равления на любом последующем  t-ом шаге обучения, помножен­ной на коэффициент приведения образа р-ой ситуации к образу t-ой ситуации:

 

.                                   (2.52)

 

Зависимость (2.52) похожа на зависимость (2.14) фактического сигнала управления в любой j-ой ситуации после обучения только в первой А-ситуации от соответствующего коэффициента приведения

Отметим, что простота графика (рис. 2.2) и очевидность, ко­торую он демонстрирует, были бы значительно нарушены, если бы были иными по величине требуемые сигналы управления , , , , например меньше или даже некоторые из них противопо­ложного знака, но это нисколько не изменило бы выявленную ма­тематическую             закономерность, которую можно харак­теризовать как суперпозицию и согласно которой каждая погреш­ность , входящая на своём р-ом шаге, создаёт составля­ющую фактической выходной величины  независимо от наличия и характера других величин. В результате можно предложить вы­ражения для определения параметров обучения на любом t-ом шаге при беспорядочном обучении:

· фактический сигнал управления:

 

;     (2.53)

 

· погрешность сигнала управления:

 

. (2.54)

 

В выражениях (2.53) и (2.54) буквенные обозначения ситуаций заменены числовыми, отражающими последовательные шаги обучения. Посмотрим теперь, как будут формироваться проводимости си­напсов при беспорядочном обучении. Для этого проследим за хо­дом обучения в ситуациях А, В, С и выпишем выражения для :

 

;

;

 

Заменим в этих выражениях требуемые сигналы управления погрешностями :

 

;

;

.

 

После обучения в следующей Д-ситуации проводимость i-го синапса определится, очевидно, как:

 

 

 

Рис. 2.3. Формирование проводимости синапса при беспорядочном обучении

 

Теоретическое формирование проводимости можно продолжать, таким образом, сколько угодно долго. Представим этот процесс в виде графика (рис.2.3). График отчетливо отражает идеальный закон обучения синапсов технического мозга обучаемых систем управления; поправка проводимости определяется двумя факторами: возбуждением самого рецептора и воздействием обучателя. Воздействие обучателя, равное погрешности сигнала управления в конкретной ситуации, очевидно, будет с каждым шагом уменьшаться; следовательно, также будет уменьшаться поправка проводимости.

Такое предельно простое представление изменения проводимостей синапсов необходимо нам для уяснения процессов обучения, хотя на самом деле всё несколько сложнее. Так при погрешностях обратного знака проводимости, очевидно, будут не наращиваться, а уменьшаться. Может оказаться даже так, что проводимость изме­нит свой первоначальный знак и будет выглядеть на графике сов­сем по иному, но это в принципе не изменяет выявленную матема­тическую закономерность формирования проводимостей синапсов при беспорядочном обучении. Закономерность эту можно представить в виде

 

.        (2.55)

 

В этом выражении буквенные обозначения ситуаций заменены также числовыми, отражающими последовательные шаги обучения.

Продолжительность беспорядочного обучения. До сих пор правило прекращения обучения звучало так: если в каждой ситуации обучаемой выборки погрешность сигнала управления мень­ше допустимого отклонения или равняется ему, то обучение пре­кращается. При беспорядочном обучении нет обучаемой выборки, т.е. нет конкретных ситуаций, в которых проводится обучение, поэтому данное правило не срабатывает. Нужны иные критерии пре­кращения обучения.

Нетрудно себе представить, как будет проходить беспорядочное обучение на самом деле; скорее всего обучатель не будет огова­ривать окончание обучения вообще, т.е. он всегда зарезервирует за собой право вмешиваться в работу обучаемого объекта в тех случаях, когда его действия покажутся ему не совсем соответ­ствующими требованиям и ситуациям; благо, что в принципе обуча­емые системы управления позволяют дообучать их во время работы. Поэтому можно утверждать, что чёткого конца обучения не будет; завершение обучения будет убывающим, но не окончательным. Реше­ние о каком-то разовом вмешательстве в работу объекта с целью его дообучения принимает обучатель на основе своего субъектив­ного мнения.

Тем не менее оно, это мнение, будет базироваться на некото­рых чётких положениях; выявим их. Все движения объекта можно разделить на движения общего направления и на целевые. Движе­нием общего направления, например робота при поиске, является продольное перемещение схвата с глазом, т.е. перемещение вдоль некоторой платформы; у стационарного поворачивающегося робота — поворот либо в одну сторону, либо в другую. Эти движения не связаны о целью, в данном случае — с искомым предметом. Целе­выми движениями в этом же примере являются поперечные движения, смещающие схват с глазом в сторону попавшего в поле зрения глаза искомого предмета; у поворачивающегося робота — приближение или удаление схвата. Очевидно, движения общего направления не нуждаются в задании определённой скорости; главное для них — направление: вперёд-назад, вправо-влево, вверх-вниз и т.д. Поэтому скорости движений общего направления (точнее говоря: сигналы управления) можно в принципе не ограничивать допустимыми откло­нениями, удовлетворяясь требованиями «больше нуля» или «меньше нуля», но можно и несколько конкретизировать: скорость малая, средняя или большая.

Целевые движения требуют уже согласования скоростей; скорость перемещения, допустим, в одном направлении должна быть больше  (меньше), чем в другом. Такое согласование возможно только при задании не только величин самих скоростей, но и их допус­тимых отклонений. Если требуется, чтобы одна скорость была больше другой, то, естественно, наименьшее значение первой должно быть больше наибольшего значения второй. Поэтому обучатель вынужден будет следить за этим. Соотношение скоростей может быть задано пропорцией, кратностью или своими предель­ными значениями: одна — наибольшая, другая наименьшая, — и т.д.

Особым должно быть отношение обучателя к позициям, т.е. си­туациям; их можно также разделить на безразличные и на целевые. Примером безразличной ситуации может быть выход схвата с гла­зом при поиске на посторонний предмет. Очевидно, схват в этой позиции не должен останавливаться, и робот должен продолжить поиск, должен продолжить  свои движения. Значит, и скорости, и их допустимые отклонения должны быть такими, чтобы исключить полную остановку схвата; требования к обучению, таким образом, ужесточаются.

И совсем высокими они должны быть в целевых позициях. Если схват о глазом вышел на искомый предмет, то он обязан остановиться в любом случае; скорости всех приводов робота должны быть равными нулю; это понятно, но с какой точностью? Прежде чем ответить на этот вопрос, выявим факторы, мешающие достиже­нию цели; ими являются:

· разброс сходства искомых предметов; внешне искомые пред­меты могут быть несколько непохожими друг на друга, и, тем не менее, их нужно все «узнавать»;

· похожие на искомые посторонние предметы; их нужно отсеивать;

· трения приводов, которые могут привести к ложным остановкам при наличии сигналов управления;

· несоответствие зева схвата конфигурации и относительному положению искомого предмета.

Обучатель должен, очевидно, задавать допустимые отклонения на скорости приводов объекта такими, чтобы в примере с роботом, осуществляющим поиск, обеспечить полную остановку при выходе на искомые предметы и хотя бы слабое «сползание» при выходе на посторонние. Всё внимание обучателя должно быть сосредото­чено именно на этом; и обучение он прекратит тогда, когда ого­ворённые условия будут выполняться. Добиваясь этого, он вы­нужден будет раз за разом повторять те движения и остановы, которые связаны с целевыми ситуациями и позициями.

Цикловое обучение. В упорядоченном обучении ситуации предъ­являют в строго определённой последовательности, и количество всех ситуаций в обучаемой выборке вполне определенно. Цикловым условимся называть такое упорядоченное обучение, при котором предъявление вех ситуаций выборки многократно повторяется с сохранением принятой последовательности. Цикл — это предъяв­ление всех ситуаций обучаемой выборки; шаг — предъявление оче­редной ситуации; в цикле, следовательно, столько шагов, сколько ситуаций в обучаемой выборке.

Ход циклового обучения. В принципе цикловое обучение можно считать тем же беспорядочным, если каждую повторную ситуацию расценивать как новую, образ которой схож о образом прежней. Поэтому общие закономерности процесса обучения, выявленные в беспорядочном обучении, сохраняются в полной мере в цикловом. Продемонстрируем это, продолжив проведённое обучение в четырёх ситуациях, приняв их за цикловую обучаемую выборку, так что в качестве очередной пятой ситуации рассмотрим снова первую.

Цикл 2-ой, шаг 5-ый (по нарастающей), ситуация А:

Определим фактический сигнал  и погрешность  перед дообучением и проводимости  после дообучения:

 

;

.

 

Принимая во внимание, что коэффициент приведения  образа самого к себе равен единице: =1, — и что =, получим

 

 

Цикл 2-ой, шаг 6-ой, ситуация В:

 

;

.

 

Учитывая, что =1, а , получим:

 

 

На этом теоретическое обучение можно прекратить, так как все закономерности обозначились полностью.

Закономерности и продолжительность циклового обучения. Как видно из проведённого обучения, принцип суперпозиции, отражён­ный на графике (рис.2.2) и выражением (2.5З), сохраняется при цикловом обучении. Отличие от беспорядочного обучения состоит лишь в том, что составляющие фактического сигнала управления формируются только на последних шагах при предъявлении ситуа­ций одного цикла. Заменив буквенное обозначение последовательно предъявляемых ситуаций шагами по нарастающей и обозначив через n — число шагов в цикле, получим выражения для определения фактического сигнала управления  и его погрешности  на любом t-ом цикле после завершения обучения на (t-1)-ом шаге:

 

          (2.56)

          (2.57)

 

Проводимость i-го синапса после Т циклов обучения опре­делится как

 

(2.58)

 

В выражении (2.58) погрешности  обозначены с указанием последнего шага, на котором было завершено обучение, и того шага, на котором эта погрешность определена. Например,  обозначает погрешность , определённую при предъявлении ситуации второго шага второго цикла после завершения обучения на (2n+1)-ом шаге, т.е. на первом шаге этого же цикла.

Продолжительность циклового обучения будет определяться условием (1.14) во всех ситуациях обучаемой выборки. Если обу­чение закончено на t-ом шаге и на нём же проведены последние корректировки проводимостей синапсов, то, очевидно, погрешность на этом шаге при предъявлении ситуации t-го шага будет равна нулю: =0, — поэтому необходимо проверить условие (1.14) только в прочих ситуациях выборки:

 

;      ;     ...

... ;     .

 

Раскрывая содержание погрешностей , получим:

 

    (2.59)

 

Порядок предъявления ситуаций при цикловом и беспорядочном обучении. Напомним, что в принципе возможны два типа технического мозга: а) с саморегулированием синапсов и б) с ручной настрой­кой их. В первом случае обучение ведётся методом «вождения за руку»; во втором случае проводимости синапсов определяют рас­чётом, и для этого предварительно замеряют возбуждения всех рецепторов во всех ситуациях выборки. Учитывая, что и замеры возбуждении рецепторов, и расчёты проводимостей синапсов, и даже сама настройка синапсов могут быть частично или полностью автоматизированы, будем считать, что оба типа мозга равноверо­ятны, и поэтому, говоря о выборе последовательности предъяв­ления ситуаций, будем иметь в виду все те методы обучения, ко­торые соответствуют обоим указанным типам мозга.

Начнём с назначения последней ситуации; ею должна стать та, в которой требуется самый точный сигнал управления; такую си­туацию мы называем целевой; в ней сигнал управления имеет на­именьшее допустимое отклонение. Такой критерий выбора послед­ней ситуации диктуется тем, что после обучения в ней погрешность сигнала управления теоретически сводится к нулю. Другим крите­рием выбора последней ситуации может быть её важность, хотя понятие это субъективное и не очень конкретное.

При ручной настройке мозга последняя ситуация является в то же время опорной, т.е. той, в которой производится регулировка синапсов. В связи с этим возникает ещё одно обстоятельство, которое нельзя не учитывать. Регулировка, как правило, сводится не к установке расчётных проводимостей синапсов (для этого при­шлось бы извлекать, выпаивать элементы из технического мозга), а к получению на выходе соответствующей расчётной добавки к сигналу управления, так называемой рецепторной доли сигнала управления, которая определяется как

 

,

 

где  — возбуждение i-го рецептора в опорной ситуации.

Так вот, какой бы ни была проводимость синапса , но, если возбуждение  ничтожно мало, то и рецепторная доля ока­жется также неуловимой: . Получается, что практи­чески указанный синапс отрегулировать по изменению сигнала уп­равления невозможно: как бы мы не изменяли проводимость синапса, сигнал Е на выходе системы изменяться не будет. Выход из по­ложения в этом случае видится в назначении в качестве последней и опорной ситуации такой, в которой все рецепторы должны быть возбуждены выше некоторого порога, т.е. образ этой ситуации не должен иметь тёмных пятен или, говоря про обозреваемую сцену: в ней не должны присутствовать тёмные предметы и не должен быть тёмным фон. Если даже рецепторы парны, т.е. на один рецептор «света» приходится один рецептор «темноты», то и тогда указан­ное требование сохраняется и даже расширяется: образ ситуации не должен иметь ни слишком тёмных, ни слишком светлых пятен. Остаётся только один вариант — «серый» образ, когда рецепторы полувозбуждены.

Новая «серая» опорная ситуация (а такой ситуацией может быть обозреваемый серый фон без линий и пятен) не является целевой и не требует высокой точности действий, поэтому она должна быть заполнена одной или несколькими контрольными ситуациями, в качестве которых, очевидно, должны быть использованы целевые. В контрольных ситуациях уточняются рецепторные доли сигнала управления и, самое главное, достигаются целевые сигналы управ­ления о допустимыми отклонениями.

Определив последнюю ситуацию, перейдём к исследованию крите­риев выбора первой ситуации. С самого начала исключаем из пре­тендентов ситуации с нулевыми сигналами управления: они не дадут никакого изменения проводимостей синапсов — первый шаг обучения оказался бы безрезультатным.

Дальнейшие рассуждения могут быть построены в зависимости от типа синапсов. Выделим два из них: 1) регулируемые в обе стороны на повышение и на понижение проводимости; 2) с постоянно растущей проводимостью. К первому типу синапса относится, в частности, регулируемый резистор с одним входом и двумя выходами, например, потенциометр; при увеличении проводимости одного плеча резис­тора проводимость другого будет уменьшаться. Ко второму типу синапса относится, например, резистор из аморфного полупроводник проводимость которого в процессе обучения может только нара­щиваться; сброс проводимости если и осуществляется, то только до нуля. Поэтому во втором случае всегда существует опасность «загнать» проводимость синапса до предела, после которого даль­нейшее регулирование его, а значит и обучение, невозможны.

Выбор первой ситуации для системы о регулируемыми в обе стороны синапсами предельно прост: требуемый сигнал управления в этой ситуации должен быть самым большим; знак сигнала при этой не имеет никакого значения. После первого же шага обуче­ния проводимости синапсов сильно возрастут; этим самым процессу обучения задаётся мощный первый толчок.

Сложнее обстоит дело с выбором первой ситуации в системе с постоянно растущими проводимостями синапсов. Можно, конечно, предложить ситуацию с большим требуемым сигналом управления, но только при условии, что эта ситуация является наиболее по­хожей на вое другие. Выделить её можно не только по видимой сцене, но и теоретически по степени сходства о другими ситуаци­ями: степень сходства образов похожих ситуаций близка единице. Ещё нужно учесть при этом и то, чтобы не было в выборке ситуа­ций с требуемыми сигналами противоположного знака. В общем случае остаётся вариант выбора в качестве первой ситуации за­урядной, похожей на другие, ситуации о умеренным требуемым сигналом управления. Исключительные ситуации с непохожими образы на роль первой не годятся. На этом выбор первой ситуации закончим.

Попытаемся теперь разобраться в последовательности предъяв­лений ситуаций в процессе обучения. Наибольшая скорость обуче­ния будет, очевидно, тогда, когда наибольшими будут коррекции проводимостей синапсов , а они, как известно, всегда прямо пропорциональны погрешности . Если выбирать вторую ситуацию загодя, до начала обучения, то можно воспользоваться вы­ражением для погрешности на втором шаге обучения , и перебором ситуаций выявить наибольшее её значение: > индексом j обозначена любая прочая ситуация.

Скорее всего у второй ситуации окажется противоположный знак требуемого сигнала управления, и абсолютная величина погреш­ности  в таком случае будет тем больше, чем больше коэффициент приведения . Если же знаки сигналов управления одинаковы и >, то коэффициент  должен быть наимень­шим. При практическом обучении методом «вождения за руку» пог­решность  может быть определена простым замером.

Третью ситуацию лучше выбирать после обучения во второй, когда можно определить погрешность

 

.

 

Эта погрешность должна быть наибольшей из всех возможных.

Соблюдая тот же принцип по максимуму погрешности — можно поочерёдно расположить в желаемой последовательности все прочие ситуации обучаемой выборки. На повторных циклах обучения выяв­ленную последовательность можно сохранить, и тогда обучение превратится в цикловое. Если же продолжать при повторных предъ­явлениях подбирать ситуации по наибольшей погрешности , то обучение будет носить беспорядочный характер, но при этом ско­рость обучения будет наивысшей. Такой подход легко реализуется также при компьютерных расчетах процесса обучения.

Из всего сказанного можно сделать выводы в отношении оценок ситуаций. Если ситуации похожи и приблизительно равны между собой сигналы управления в них, то обучение будет очень лёгким, т.е. быстрым. Относительно лёгким будет обучение и в том случае, если ситуации будут сильно отличаться и различными будут в них требуемые сигналы управления. Сложнее обучение будет при раз­личных ситуациях, но одинаковых сигналах. И совсем тяжёлым —продолжительным и не всегда успешным — будет обучение в том случае, когда ситуации окажутся очень похожими, а требуемые сигналы управления в них — совершенно различными; такие ситуации можно назвать частично противоречивыми. Напомним, что полностью противоречивыми являются абсолютно схожие ситуации с различными сигналами управления.