Часть III. Теоретические исследования
обучаемых систем
управления
1. Нелинейности обучаемых
систем управления
Линейная форма выражения для определения сигнала управления (1.12), согласно которому он равен сумме произведений возбуждений рецепторов на проводимости соответствующих синапсов, может ввести в заблуждение относительно применения обучаемых систем управления, если подходить к этому выражению формально. Получается, якобы, так, что обучаемые системы относятся к классу линейных, пригодных только для простейших случаев, в то время как любое реальное управления, мало-мальски отвечающее средним требованиям, без сомнения может быть только нелинейным. На самом деле это не так; формальный подход в данном случае недопустим.
Прежде чем говорить о линейности-нелинейности обучаемых систем управления, рассмотрим этот критерий применительно к обычным логическим системам управления, например к тем, которые действуют в автоматическом режиме на базе компьютеров. К ним относятся, в частности, системы управления металлорежущими станками, прокатными станами и другие. Программированию таких систем предшествует разработка так называемого математического обеспечения, или другими словами: разработка законов управления, то есть математической модели процессов. Что это такое? Математическая модель процесса управления определяет однозначную логическую зависимость сигнала управления от различных влияющих на процесс управления параметров, таких как перемещение узлов и инструментов, скорость этого перемещения, масса перемещаемых грузов, температура в зоне обработки и прочих. Все эти параметры по отношению к системе управления (по отношению к компьютеру) являются внешними; они характеризуют состояние объекта управления, то есть ситуацию. Разработчик математической модели сначала умозрительно вникает в физический процесс управления, а потом в меру своего понимания его излагает этот процесс языком математических символов, получая таким образом требуемую модель с той или иной мерой соответствия реальному процессу. При этом он оперирует понятиями параметров почти как зримыми, ощущаемыми вещами. На самом же деле их в природе нет; ощутимыми станут потом их проявления в виде электрических и иных сигналов соответствующих датчиков.
Весь процесс управления разбивается на несколько шагов. Определяющей является ситуация. Но её, эту ситуацию, необходимо как-то представить; и одной из возможных форм представления в логических системах используется параметрическое пространство, в котором ситуация приобретает вид параметрического образа, характеризуемого параметрическим вектором состояния. Далее параметрический образ преобразуется в набор показаний датчиков. Под показаниями следует понимать электрические и иные сигналы этих датчиков. Перед тем, как поступить в процессорную часть системы управления, где выполняются математические действия, сигналы датчиков преобразуются в цифровую форму, и только в таком виде они перерабатываются системой управления в строгом соответствии с математикой закона управления. При этом система воспринимает цифровые сигналы датчиков не только как сами сигналы, но и как те параметры, которые были зафиксированы датчиками. Иногда первичные преобразования датчиков совмещают с цифровым преобразованием, но это не меняет сути дела.
Результатами вычислений являются численные значения сигналов управления по всем приводам; их в равной степени можно воспринимать как соответствующие параметры управления. После преобразования из цифровой формы в требуемую сигналы управления поступают непосредственно к приводам. Но на этом процесс управления, как правило, не заканчивается. Результат действий приводов фиксируется снова датчиками, их сигналы переводятся в цифровую форму, в таком виде они поступают в процессор, и тот, сравнивая показания датчиков с выданными ранее сигналами, определяет поправки в действиях приводов.
Такое подробное описание работы существующих логических систем управления потребовалось только для того, чтобы подчеркнуть, что в них постоянно осуществляется переход от параметров к сигналам датчиков и, наоборот, от сигналов датчиков к параметрам, и при этом подразумевается их полная эквивалентность; в противном случае оказалась бы непригодной основа основ логических систем управления — их математический аппарат. Отсюда возникает требование строгой линейности датчиков, согласно которой сигнал датчика b всегда пропорционален внешнему воздействию: , где k — коэффициент пропорциональности. Можно даже считать, что сигнал есть внешнее воздействие в некотором масштабе. Отклонение от линейности рабочих характеристик датчиков строго контролируется и называется классом точности.
В принципе можно было бы отказаться от линейности датчиков вообще, но тогда разработчику математического закона управления пришлось бы иметь дело с фактическими экспериментальными рабочими характеристиками датчиков а они, надо полагать, были бы все разными, и разработка математической модели зашла бы в тупик. Следовательно, критерий линейности-нелинейности возникает только и только тогда, когда создаётся математическая модель управления: есть модель — нужен критерий, нет модели — и критерий не нужен.
После таких рассуждений обратимся снова к обучаемым системам управления. В отличие от логических систем они не базируются на математике и не требуют от человека разработки математического обеспечения — они основываются исключительно на фактах: факт очувствления согласовывается в процессе обучения с фактом поведения. И всё; здесь нет места той теории, в которой присутствовали бы элементы и понятия математических преобразований, в частности критерий линейности-нелинейности; он не нужен. Математика, как таковая, может иметь некоторое отношение к обучаемым системам, но -не внутри них, а как бы параллельно: системы — сами собой, математика этих систем — сама собой.
Нелинейность очувствления. После сделанных выводов начинать разговор о линейности-нелинейности очувствления обучаемых систем управления вроде бы ни к чему, но позволим себе это сделать, как было сказано, параллельным курсом. Если взять отдельный рецептор и исследовать его рабочую характеристику, то есть зависимость сигнала на выходе (возбуждения) от внешнего воздействия: , — то вне связи с обучаемой системой управления эту характеристику можно было бы признать либо линейной, либо нелинейной. Какой же она должна быть у рецепторов? Ответ можно дать очень простой: она может быть любой; если она линейная, то хорошо, если же — нелинейная, то нисколько не хуже. Впрочем, на всём диапазоне изменения зависимости линейность может рассматриваться как частный случай, а наиболее общий случай — нелинейность; пределом нелинейности, наверное, можно считать двоичность (бинарность) рецептора, когда он имеет всего два состояния: покоя и возбуждения со ступенчатым переходом от одного к другому. И такая крайняя форма нелинейности также приемлема. Правда, у зависимости, близкой к линейной, информативность больше, чем у двоичной, но этот недостаток двоичных рецепторов может быть легко компенсирован увеличением количества самих рецепторов.
Снимая всякие ограничения с рабочих характеристик с точки зрения линейности, нельзя в то же время допустить их нестабильность: какой бы ни была рабочая характеристика отдельного рецептора, но она должна оставаться неизменной после завершения обучения системы. Требование стабильности является важнейшим, и оно должно оговариваться допустимым отклонением. Очевидно, допустимая нестабильность не должна выходить за пределы общего «шума» и не должна порождать отклонения сигналов управления системы, выходящие за пределы допустимого.
Вторым обязательным условием работоспособности очувствления является его достаточность. Словесно это условие выражается так: очувствление обучаемой системы управления должно быть таким, чтобы каждой отличительной ситуации, требующей отличительный сигнал управления, соответствовал отличительный образ очувствле-ния. Другими словами: если в любых двух ситуациях сигналы управления должны быть различными, то и образы этих ситуаций, состоящие из возбуждений рецепторов, должны различаться.
Среди прочих особенностей рецепторов упомянем о такой, которую можно отнести к категории требований и, в равной степени, к категории нетребовательности; речь идёт о желательном разбросе рабочих характеристик рецепторов, в частности о различном их быстродействии, которые расширяют функциональные возможности системы в целом; об этом говорилось выше.
Критерий линейности-нелинейности можно с некоторой натяжкой применить и к образам очувствления. Представим его в виде вопроса: можно ли при плавном изменении ситуации добиться резкого изменения сигнала управления на выходе системы? Поясним вопрос: плавное изменение ситуации при большом количестве рецепторов может порождать только плавное изменение образа очувствления и, в результате, — плавное изменение сигнала управления; это понятно, но можно ли при необходимости получить, например, ступенчатое изменение сигнала управления? Если рассуждать чисто теоретически, то обучаемые системы управления не имеют никаких ограничений в этом плане: они могут как угодно резко изменять сигнал на выходе, — но при этом проводимости отдельных наиболее весомых синапсов должны возрасти до очень высоких значений. Ступенчатое изменение сигнала управления, например, при плавном изменении образа очувствления потребовало бы поднять некоторые проводимости чуть ли не до бесконечности. Реально ли это? нет, не реально.
Поэтому, если применить обучаемые системы управления, допустим, токарным станком, то при обработке ступенчатого вала все резкие переходы окажутся скруглёнными, сами собой появятся галтели и скруглённые фаски. Для сравнения: логические системы числового программного управления те же округления сделают только в том случае, если их специально запрограммировать.
Не станем давать на этом основании сравнительные оценки тем и другим системам; подчеркнем лишь, что отмеченная особенность обучаемых систем управления свидетельствует о некоторой линейности связи её выходных сигналов с образами очувствления, точнее говоря — о свойстве, похожем на линейность. В то же время можно отметить определённую нелинейность указанной связи, если обратить внимание на то, что продолжительным обучением можно довольно существенно увеличивать резкость изменения выходного сигнала. Что же касается его ступенчатого изменения, то тут обучаемые системы должны быть дополнены такими конструктивными изменениями, которые позволили бы переключать её внимание и о которых пойдёт речь ниже. Достигается ступенчатое изменение сигнала управления в два хода: сначала система переключает себя с решения одной задачи на другую, то есть переключает своё внимание, а затем уж выдаёт любой отличный от предыдущего сигнал.
Нелинейность работы. Представим, что зависимость сигнал управления от возбуждений рецепторов, определённая ранее выражением (1.12), нелинейная. Как отразится эта нелинейность на работе системы и не приведёт ли она к нарушению нормального процесса управления?
Рассмотрим частный случай, когда рецепторная доля сигнала управления имеет квадратичную зависимость от возбуждения своего рецептора:
; . (3.1)
В электрических обучаемых системах управления с синапсами в виде обычных резисторов такого быть не может: там всегда сохраняется линейность. Но если предположить, что синапсы могут представлять собой не только резисторы, но и более сложные схемы, то, допустим, там такое может быть. Квадратичная зависимость (3.1) появится и тогда, когда мозг обучаемой системы будет не электрическим, а пневматическим или гидравлическим (принципиальных возражений против этого нет).
Определим в связи с указанной нелинейностью закон коррекции проводимостей синапсов, сохранив прежнюю линейную зависимость поправки проводимости от возбуждения рецептора: , — и соблюдая условие, что погрешность сигнала управления устраняется на каждом шаге одним актом обучения:
.
Решая совместно эти уравнения, получим:
. (3.2)
Выявим влияние
квадратичной зависимости (3.1) и закона
коррекции проводимостей синапсов (3.2) на ход обучения в двух ситуациях А и В.
Цикл 1-ый, шаг 1-ый, ситуация А:
; ; .
Шаг 2-ой, ситуация В:
,
где
; (3.3)
;
;
.
Цикл 2-ой, шаг 1-ый, ситуация А:
,
где
; (3.4)
;
;
.
Шаг 2-ой, ситуация В:
;
,
где
. (3.5)
На этом обучение можно закончить, так как определились все закономерности; все они сохранились такими же, какими были при обучении по линейному алгоритму; изменились лишь несколько выражения для определения коэффициентов приведения и степени сходства. Коэффициент приведения первого образа ко второму (3.3) стал более чувствительным к контрастности второго образа, а встречный коэффициент (3.4), наоборот, стал более чувствительным к контрастности первого образа. Степень сходства (3.5) вместо квадратичной стала кубической и её численное значение уменьшилось. Это говорит о том, что обучение будет более стремительным, чем прежде; так что переход от линейной зависимости (1.1) к нелинейной квадратичной (3.1) ускоряет обучение. Нетрудно сообразить, что усугубление нелинейности (переход к кубической и так далее) ещё больше ускорит процесс обучения.
Такое заключение, однако, нельзя воспринимать как рекомендацию к отказу от линейности работы. Да, теоретическое обучение подтверждает, что степенная нелинейность работы не только не разрушает обучаемые системы управления и даже не ухудшает их, а, можно сказать, улучшает, имея в виду ускорение обучения. Но вникнем в суть этого ускоренного обучения: оно происходит потому, что проводимости синапсов растут не столь значительно, как при линейном законе, и в обученном состоянии остаются на пониженном уровне; заниженные величины проводимостей компенсируются увеличенными (квадратичными) возбуждениями рецепторов. Следовательно, весомость проводимостей синапсов возрастает, а это приводит к тому, что даже небольшие погрешности проводимостей, возникающие как неизбежность в реальной обстановке, могут привести к существенным искажениям сигналов управления. Поэтому нет смысла стремиться переходить с линейного (1.1) закона работы обучаемых систем управления на нелинейные (3.1), тем более что на практике в электрическом варианте мозга не так-то легко реализовать любую нелинейность.
Нелинейность обучения. Нелинейность обучения, напротив, может возникать сама собой. Если иметь в виду пробойные синапсы, например из халькогенидного стекла, то есть те, у которых проходящий через них ток увеличивает сечение токопроводящего шнура, то, скорее всего, при слабых токах рост шнура будет отсутствовать, а при очень сильном токе возможен полный пробой. Трудно обеспечить линейное нарастание проводимостей синапсов и в других конструкциях.
Примем квадратичную зависимость саморегулирования синапса, выражающегося в увеличении проводимостей синапсов, от возбуждений соответствующих рецепторов:
. (3.6)
При идеальном обучении, когда на каждом шаге погрешность сигнала управления устраняется полностью:
, —
закон коррекции проводимостей синапсов примет вид
. (3.7)
Теоретическое
обучение в двух ситуациях А и В будет происходить следующим образом.
Цикл 1-ый, шаг 1-ый, ситуация А:
; ; .
Шаг 2-ой, ситуация В:
,
где
; (3.8)
;
;
.
Цикл 2-ой, шаг 1-ый, ситуация А:
,
где
; (3.9)
;
;
.
Шаг 2-ой,
ситуация В:
;
,
где
. (3.10)
Ход обучения, как показали первые два цикла, в принципе сохраняется неизменным; по-прежнему определяющими являются коэффициенты приведения и степень сходства, хотя сами они несколько видоизменились. Так коэффициент приведения образа первой ситуации к образу второй, определяемый выражением (3.8), оказывается таким же, как коэффициент приведения образа второй ситуации к образу первой при квадратичной зависимости (3.1), и, наоборот, встречный коэффициент при квадратичной коррекции проводимостей синапсов (3.6) является одинаковым с коэффициентом , при зависимости (3.1). Такое перекрёстное равенство коэффициентов приведения приводит к тому, что степени сходства и при зависимости (3.1), и при зависимости (3.6) оказываются одинаковыми и имеющими меньшее численное значение, чем в линейных случаях. Это говорит о том, что обучение при нелинейной квадратичной зависимости (З.6) будет происходить более ускоренно, чем при линейной. Очевидно, такая связь будет при любой другой степенной зависимости коррекции проводимости синапса от возбуждения своего рецептора. Выявленное ускоренное обучение не нарушает работу обучаемой системы управления, поэтому нет смысла бояться нелинейной коррекции синапсов, если она возникнет сама собой. Если же ставить вопрос: вводить или не вводить такую нелинейную коррекцию? — то следует учесть ускоренный рост проводимостей тех синапсов, чьи рецепторы оказываются сильно возбуждёнными. Может оказаться так, что некоторые из них выйдут на свой предел раньше завершения обучения и снизят эффективность дальнейшего обучения.
Нелинейность работы и обучения. Допустим, нелинейный характер распространяется одновременно на работу и на обучение; в частности, работа системы определяется квадратичной зависимостью (3.1), а обучение — квадратичной зависимостью (3.6). Будет ли система обучаться и нормально работать? Для ответа снова проведём теоретическое обучение, но сначала определим закон коррекции проводимости синапса; он при прежних условиях примет вид
. (3.11)
Цикл 1-ый, шаг
1-ый, ситуация А:
; ; .
Шаг 2-ой, ситуация В:
,
где
; (3.12)
;
;
.
Цикл 2-ой, шаг 1-ый, ситуация А:
,
где
; (3.13)
;
;
.
Шаг 2-ой, ситуация В:
;
,
где
. (3.14)
Проведенное теоретическое обучение не выявило ничего принципиально нового в действиях системы; несколько изменились лишь снова выражения для определения коэффициентов приведения (3.12) и (3.13) и степени сходства (3.14). И снова они свидетельствуют об ускорении процесса обучения.
Подводя итог, можно сказать, что те нелинейности, которые могут появляться в обучаемых системах управления, никоим образом не нарушают работу и не уменьшают их функциональных возможностей — это главный вывод. Ускорение хода обучения, вызываемое нелинейностями внутренних процессов, можно расценить как положительный момент, стремиться к которому, правда, не обязательно. И, наконец, законы управления обучаемых систем формируются автоматически по факту очувствления и по требуемым сигналам управления и не нуждаются в параметрическом представлении с анализом их линейности-нелинейности.
Если даже подходить к обучаемым системам управления как сугубо линейным, имея в виду зависимость (1.12), то и тогда нет оснований сомневаться в том, что они справятся с любыми задачами управления без исключений. В тех же случаях, когда обучаемые системы всё-таки откажутся обучаться (обучение безрезультатное), причиной может быть либо недостаточность очувствления, либо противоречивость ситуаций обучаемой выборки. В противоречивости ситуаций обучаемые системы не виноваты: их подбирал обучатель. Что же касается недостаточности очувствления, то она должна устраняться простым наращиванием рецепторов. При этом, правда, может возникнуть сомнение такого плана: сколько ни наращивай рецепторов, всегда теоретически можно найти тот случай, когда снова возникнет недостаточность очувствления. Такую бесконечность рассуждений можно прервать введением понятия конечности обучаемых систем. Конечность означает то, что, с одной стороны, число контролируемых ситуаций в обучаемой выборке конечно и прочие рассматривать ни к чему, а, с другой стороны, точность сигналов управления, выдаваемых системой, тоже конечна и определяется допустимыми отклонениями сигналов управления.