Оглавление

Часть III. Теоретические исследования обучаемых систем

управления

 

 

1. Нелинейности обучаемых систем управления

 

Линейная форма выражения для определения сигнала управления (1.12), согласно которому он равен сумме произведений возбужде­ний рецепторов на проводимости соответствующих синапсов, может ввести в заблуждение относительно применения обучаемых систем управления, если подходить к этому выражению формально. Получает­ся, якобы, так, что обучаемые системы относятся к классу линейных, пригодных только для простейших случаев, в то время как любое ре­альное управления, мало-мальски отвечающее средним требованиям, без сомнения может быть только нелинейным. На самом деле это не так; формальный подход в данном случае недопустим.

Прежде чем говорить о линейности-нелинейности обучаемых систем управления, рассмотрим этот критерий применительно к обычным логи­ческим системам управления, например к тем, которые действуют в автоматическом режиме на базе компьютеров. К ним относятся, в частности, системы управления металлорежущими станками, прокатны­ми станами и другие. Программированию таких систем предшествует разработка так называемого математического обеспечения, или дру­гими словами: разработка законов управления, то есть математической модели процессов. Что это такое? Математическая модель процесса управления определяет однозначную логическую зависимость сигнала управления от различных влияющих на процесс управления параметров, таких как перемещение узлов и инструментов, скорость  этого пере­мещения, масса перемещаемых грузов, температура в зоне обработки и прочих. Все эти параметры по отношению к системе управления (по отношению к компьютеру) являются внешними; они характеризуют состояние объекта управления, то есть ситуацию. Разработчик математической модели сначала умозрительно вникает в физический процесс управления, а потом в меру своего понимания его излагает этот процесс языком математических символов, получая таким обра­зом требуемую модель с той или иной мерой соответствия реальному процессу. При этом он оперирует понятиями параметров почти как зримыми, ощущаемыми вещами. На самом же деле их в природе нет; ощутимыми станут потом их проявления в виде электрических и иных сигналов соответствующих датчиков.

Весь процесс управления разбивается на несколько шагов. Опре­деляющей является ситуация. Но её, эту ситуацию, необходимо как-то представить; и одной из возможных форм представления в логических системах используется параметрическое пространство, в котором ситуация приобретает вид параметрического образа, характеризуемого параметрическим вектором состояния. Далее параметрический образ преобразуется в набор показаний датчиков. Под показаниями следует понимать электрические и иные сигналы этих датчиков. Перед тем, как поступить в процессорную часть системы управления, где выпол­няются математические действия, сигналы датчиков преобразуются в цифровую форму, и только в таком виде они перерабатываются сис­темой управления в строгом соответствии с математикой закона уп­равления. При этом система воспринимает цифровые сигналы датчиков не только как сами сигналы, но и как те параметры, которые были зафиксированы датчиками. Иногда первичные преобразования датчиков совмещают с цифровым преобразованием, но это не меняет сути дела.

Результатами вычислений являются численные значения сигналов управления по всем приводам; их в равной степени можно восприни­мать как соответствующие параметры управления. После преобразо­вания из цифровой формы в требуемую сигналы управления поступают непосредственно к приводам. Но на этом процесс управления, как правило, не заканчивается. Результат действий приводов фиксируется снова датчиками, их сигналы переводятся в цифровую форму, в таком виде они поступают в процессор, и тот, сравнивая показания датчи­ков с выданными ранее сигналами, определяет поправки в действиях приводов.

Такое подробное описание работы существующих логических систем управления потребовалось только для того, чтобы подчеркнуть, что в них постоянно осуществляется переход от параметров к сигналам датчиков и, наоборот, от сигналов датчиков к параметрам, и при этом подразумевается их полная эквивалентность; в противном слу­чае оказалась бы непригодной основа основ логических систем управ­ления их математический аппарат. Отсюда возникает требование строгой линейности датчиков, согласно которой сигнал датчика b всегда пропорционален внешнему воздействию: , где k — коэффициент пропорциональности. Можно даже считать, что сигнал есть внешнее воздействие в некотором масштабе. Отклонение от линейности рабочих характеристик датчиков строго контролируется и называется классом точности.

В принципе можно было бы отказаться от линейности датчиков вообще, но тогда разработчику математического закона управления пришлось бы иметь дело с фактическими экспериментальными рабочими характеристиками датчиков а они, надо полагать, были бы все раз­ными, и разработка математической модели зашла бы в тупик. Следо­вательно, критерий линейности-нелинейности возникает только и толь­ко тогда, когда создаётся математическая модель управления: есть модель нужен критерий, нет модели — и критерий не нужен.

После таких рассуждений обратимся снова к обучаемым системам управления. В отличие от логических систем они не базируются на математике и не требуют от человека разработки математического обеспечения они основываются исключительно на фактах: факт очувствления согласовывается в процессе обучения с фактом поведе­ния. И всё; здесь нет места той теории, в которой присутствовали бы элементы и понятия математических преобразований, в частности критерий линейности-нелинейности; он не нужен. Математика, как та­ковая, может иметь некоторое отношение к обучаемым системам, но -не внутри них, а как бы параллельно: системы — сами собой, матема­тика этих систем сама собой.

Нелинейность очувствления. После сделанных выводов начинать разговор о линейности-нелинейности очувствления обучаемых систем управления вроде бы ни к чему, но позволим себе это сделать, как было сказано, параллельным курсом. Если взять отдельный рецептор и исследовать его рабочую характеристику, то есть зависимость сиг­нала на выходе (возбуждения) от внешнего воздействия: , — то вне связи с обучаемой системой управления эту характеристику можно было бы признать либо линейной, либо нелинейной. Какой же она должна быть у рецепторов? Ответ можно дать очень простой: она может быть любой; если она линейная, то хорошо, если же нелиней­ная, то нисколько не хуже. Впрочем, на всём диапазоне изменения зависимости линейность может рассматриваться как частный случай, а наиболее общий случай нелинейность; пределом нелинейности, на­верное, можно считать двоичность (бинарность) рецептора, когда он имеет всего два состояния: покоя и возбуждения со ступенчатым пе­реходом от одного к другому. И такая крайняя форма нелинейности также приемлема. Правда, у зависимости, близкой к линейной, инфор­мативность больше, чем у двоичной, но этот недостаток двоичных рецепторов может быть легко компенсирован увеличением количества самих рецепторов.

Снимая всякие ограничения с рабочих характеристик с точки зре­ния линейности, нельзя в то же время допустить их нестабильность: какой бы ни была рабочая характеристика отдельного рецептора, но она должна оставаться неизменной после завершения обучения системы. Требование стабильности является важнейшим, и оно должно оговариваться допустимым отклонением. Очевидно, допустимая не­стабильность не должна выходить за пределы общего «шума» и не должна порождать отклонения сигналов управления системы, выходя­щие за пределы допустимого.

Вторым обязательным условием работоспособности очувствления является его достаточность. Словесно это условие выражается так: очувствление обучаемой системы управления должно быть таким, чтобы каждой отличительной ситуации, требующей отличительный сигнал управления, соответствовал отличительный образ очувствле-ния. Другими словами: если в любых двух ситуациях сигналы управ­ления должны быть различными, то и образы этих ситуаций, состо­ящие из возбуждений рецепторов, должны различаться.

Среди прочих особенностей рецепторов упомянем о такой, которую можно отнести к категории требований и, в равной степени, к кате­гории нетребовательности; речь идёт о желательном разбросе ра­бочих характеристик рецепторов, в частности о различном их быст­родействии, которые расширяют функциональные возможности системы в целом; об этом говорилось выше.

Критерий линейности-нелинейности можно с некоторой натяжкой применить и к образам очувствления. Представим его в виде вопроса: можно ли при плавном изменении ситуации добиться резкого изме­нения сигнала управления на выходе системы? Поясним вопрос: плав­ное изменение ситуации при большом количестве рецепторов может порождать только плавное изменение образа очувствления и, в ре­зультате, плавное изменение сигнала управления; это понятно, но можно ли при необходимости получить, например, ступенчатое изменение сигнала управления? Если рассуждать чисто теоретически, то обучаемые системы управления не имеют никаких ограни­чений в этом плане: они могут как угодно резко изменять сигнал на выходе, — но при этом проводимости отдельных наиболее весомых си­напсов должны возрасти до очень высоких значений. Ступенчатое изменение сигнала управления, например, при плавном изменении образа очувствления потребовало бы поднять некоторые проводимости чуть ли не до бесконечности. Реально ли это? нет, не реально.

Поэтому, если применить обучаемые системы управления,  до­пустим, токарным станком, то при обработке ступенчатого вала все резкие переходы окажутся скруглёнными, сами собой появятся галтели и скруглённые фаски. Для сравнения: логические системы числового программного управления те же округления сделают только в том случае, если их специально запрограммировать.

Не станем давать на этом основании сравнительные оценки тем и другим системам; подчеркнем лишь, что отмеченная особенность обучаемых систем управления свидетельствует о некоторой линейности связи её выходных сигналов с образами очувствления, точнее говоря о свойстве, похожем на линейность. В то же время можно отметить определённую нелинейность указанной связи, если обратить внима­ние на то, что продолжительным обучением можно довольно сущест­венно увеличивать резкость изменения выходного сигнала. Что же касается его ступенчатого изменения, то тут обучаемые системы должны быть дополнены такими конструктивными изменениями, которые позволили бы переключать её внимание и о которых пойдёт речь ниже. Достигается ступенчатое изменение сигнала управления в два хода: сначала система переключает себя с решения одной задачи на дру­гую, то есть переключает своё внимание, а затем уж выдаёт любой отличный от предыдущего сигнал.

Нелинейность работы. Представим, что зависимость сигнал управ­ления от возбуждений рецепторов, определённая ранее выражением (1.12), нелинейная. Как отразится эта нелинейность на работе сис­темы и не приведёт ли она к нарушению нормального процесса управ­ления?

Рассмотрим частный случай, когда рецепторная доля сигнала уп­равления  имеет квадратичную зависимость от возбуждения своего рецептора:

 

;        .                     (3.1)

 

В электрических обучаемых системах управления с синапсами в виде обычных резисторов такого быть не может: там всегда сохраня­ется линейность. Но если предположить, что синапсы могут представ­лять собой не только резисторы, но и более сложные схемы, то, до­пустим, там такое может быть. Квадратичная зависимость (3.1) поя­вится и тогда, когда мозг обучаемой системы будет не электрическим, а пневматическим или гидравлическим (принципиальных возражений против этого нет).

Определим в связи с указанной нелинейностью закон коррекции проводимостей синапсов, сохранив прежнюю линейную зависимость поправки проводимости  от возбуждения рецептора: , — и соблюдая условие, что погрешность сигнала управления  устра­няется на каждом шаге одним актом обучения:

 

.

 

Решая совместно эти уравнения, получим:

 

.                                       (3.2)

 

Выявим влияние квадратичной зависимости (3.1) и закона коррек­ции проводимостей синапсов (3.2) на ход обучения в двух ситуациях А и В.

Цикл 1-ый, шаг 1-ый, ситуация А:

 

; ;  .

 

Шаг 2-ой, ситуация В:

 

,

 

где

 

;                                     (3.3)

 

;

 

;

 

.

 

Цикл 2-ой, шаг 1-ый, ситуация А:

 

,

 

где

 

;                               (3.4)

 

;

 

;

 

.

 

Шаг 2-ой, ситуация В:

 

;

 

,

 

где

 

.                         (3.5)

 

На этом обучение можно закончить, так как определились все за­кономерности; все они сохранились такими же, какими были при обу­чении по линейному алгоритму; изменились лишь несколько выражения для определения коэффициентов приведения и степени сходства. Коэффициент приведения первого образа ко второму  (3.3) стал более чувствительным к контрастности второго образа, а встречный коэффициент  (3.4), наоборот, стал более чувствительным к контрастности первого образа. Степень сходства  (3.5) вместо квадратичной стала кубической и её численное значение уменьшилось. Это говорит о том, что обучение будет более стремительным, чем прежде; так что переход от линейной зависимости (1.1) к нелиней­ной квадратичной (3.1) ускоряет обучение. Нетрудно сообразить, что усугубление нелинейности (переход к кубической и так далее) ещё больше ускорит процесс обучения.

Такое заключение, однако, нельзя воспринимать как рекоменда­цию к отказу от линейности работы. Да, теоретическое обучение подтверждает, что степенная нелинейность работы не только не раз­рушает обучаемые системы управления и даже не ухудшает их, а, можно сказать, улучшает, имея в виду ускорение обучения. Но вник­нем в суть этого ускоренного обучения: оно происходит потому, что проводимости синапсов растут не столь значительно, как при линей­ном законе, и в обученном состоянии остаются на пониженном уровне; заниженные величины проводимостей компенсируются увеличенными (квадратичными) возбуждениями рецепторов. Следовательно, весомость проводимостей синапсов возрастает, а это приводит к тому, что даже небольшие погрешности проводимостей, возникающие как неизбежность в реальной обстановке, могут привести к существенным искажениям сигналов управления. Поэтому нет смысла стремиться переходить с линейного (1.1) закона работы обучаемых систем управления на не­линейные (3.1), тем более что на практике в электрическом вари­анте мозга не так-то легко реализовать любую нелинейность.

Нелинейность обучения. Нелинейность обучения, напротив, может возникать сама собой. Если иметь в виду пробойные синапсы, напри­мер из халькогенидного стекла, то есть те, у которых проходящий через них ток увеличивает сечение токопроводящего шнура, то, скорее всего, при слабых токах рост шнура будет отсутствовать, а при очень сильном токе возможен полный пробой. Трудно обеспечить линейное нарастание проводимостей синапсов и в других конструкциях.

Примем квадратичную зависимость саморегулирования синапса, вы­ражающегося в увеличении проводимостей синапсов, от возбуждений соответствующих рецепторов:

 

.                                        (3.6)

 

При идеальном обучении, когда на каждом шаге погрешность сиг­нала управления устраняется полностью:

 

, —

 

закон коррекции проводимостей синапсов примет вид

 

.                                          (3.7)

 

Теоретическое обучение в двух ситуациях А и В будет происходить следующим образом.

Цикл 1-ый, шаг 1-ый, ситуация А:

 

; ; .

 

Шаг 2-ой, ситуация В:

 

,

 

где

 

;                                      (3.8)

 

;

 

;

 

.

 

Цикл 2-ой, шаг 1-ый, ситуация А:

 

,

 

где

 

;                                     (3.9)

 

;

 

;

 

.

 

Шаг 2-ой, ситуация В:

 

;

 

,

 

где

 

.                  (3.10)

 

Ход обучения, как показали первые два цикла, в принципе сохра­няется неизменным; по-прежнему определяющими являются коэффици­енты приведения и степень сходства, хотя сами они несколько видо­изменились. Так коэффициент приведения  образа первой ситуации к образу второй, определяемый выражением (3.8), оказывается таким же, как коэффициент приведения  образа второй ситуации к образу первой при квадратичной зависимости (3.1), и, наоборот, встречный коэффициент  при квадратичной коррекции проводимостей синапсов (3.6) является одинаковым с коэффициентом , при зависимости (3.1). Такое перекрёстное равенство коэффициентов приведения приводит к тому, что степени сходства  и при зависимости (3.1), и при зависимости (3.6) оказываются одинаковыми и имеющими меньшее чис­ленное значение, чем в линейных случаях. Это говорит о том, что обучение при нелинейной квадратичной зависимости (З.6) будет происходить более ускоренно, чем при линейной. Очевидно, такая связь будет при любой другой степенной зависимости коррекции про­водимости синапса от возбуждения своего рецептора. Выявленное ус­коренное обучение не нарушает работу обучаемой системы управления, поэтому нет смысла бояться нелинейной коррекции синапсов, если она возникнет сама собой. Если же ставить вопрос: вводить или не вводить такую нелинейную коррекцию? — то следует учесть ускоренный рост проводимостей тех синапсов, чьи рецепторы оказываются сильно возбуж­дёнными. Может оказаться так, что некоторые из них выйдут на свой предел раньше завершения обучения и снизят эффективность дальней­шего обучения.

Нелинейность работы и обучения.  Допустим, нелинейный характер распространяется одновременно на работу и на обучение; в частности, работа системы определяется квадратичной зависимостью (3.1), а обу­чение — квадратичной зависимостью (3.6). Будет ли система обучаться и нормально работать? Для ответа снова проведём теоретическое обу­чение, но сначала определим закон коррекции проводимости синапса; он при прежних условиях примет вид

 

.                                  (3.11)

 

Цикл 1-ый, шаг 1-ый, ситуация А:

 

; ; .

 

Шаг 2-ой, ситуация В:

 

,

 

где

 

;                                 (3.12)

 

;

 

;

 

.

 

Цикл 2-ой, шаг 1-ый, ситуация А:

 

,

 

где

 

;                                     (3.13)

 

;

 

;

 

.

 

Шаг 2-ой, ситуация В:

 

;

 

,

 

где

 

.                            (3.14)

 

Проведенное теоретическое обучение не выявило ничего принципиально нового в действиях системы; несколько изменились лишь снова выражения для определения коэффициентов приведения (3.12) и (3.13) и степени сходства (3.14). И снова они свидетельствуют об ускорении процесса обучения.

Подводя итог, можно сказать, что те нелинейности, которые могут появляться в обучаемых системах управления, никоим образом не нарушают работу и не уменьшают их функциональных возможностей — это главный вывод. Ускорение хода обучения, вызываемое нелинейностями внутренних процессов, можно расценить как положительный момент, стремиться к которому, правда, не обязательно. И, наконец, законы управления обучаемых систем формируются автоматически по факту очувствления и по требуемым сигналам управления и не нуждаются в параметрическом представлении с анализом их линейности-нелиней­ности.

Если даже подходить к обучаемым системам управления как сугубо линейным, имея в виду зависимость (1.12), то и тогда нет основа­ний сомневаться в том, что они справятся с любыми задачами управ­ления без исключений. В тех же случаях, когда обучаемые системы всё-таки откажутся обучаться (обучение безрезультатное), причиной может быть либо недостаточность очувствления, либо противоречи­вость ситуаций обучаемой выборки. В противоречивости ситуаций обучаемые системы не виноваты: их подбирал обучатель. Что же ка­сается недостаточности очувствления, то она должна устраняться простым наращиванием рецепторов. При этом, правда, может возник­нуть сомнение такого плана: сколько ни наращивай рецепторов, всег­да теоретически можно найти тот случай, когда снова возникнет не­достаточность очувствления. Такую бесконечность рассуждений можно прервать введением понятия конечности обучаемых систем. Конечность означает то, что, с одной стороны, число контролируемых ситуаций в обучаемой выборке конечно и прочие рассматривать ни к чему, а, с другой стороны, точность сигналов управления, выдаваемых системой, тоже конечна и определяется допустимыми отклонениями сигналов управления.