3. Динамика
образов
В реальной обстановке ситуация, с которыми приходится иметь дело обучаемым системам управления, постоянно изменяются; также постоянно видоизменяются, следовательно, образы их очувствления; эти изменения, как правило, носят непрерывный, плавный характер. Поставим перед собой задачу предложить способы оценки динамики образов для того, чтобы можно было судить о характере изменений ситуаций. Эти же способы можно было бы использовать для оценки и сравнения систем очувствления.
Оказывается, что коэффициенты приведения образов и степени их сходства могут характеризовать динамику любого образа, если сравнивать его сам с собой при изменении ситуации. При таком подходе сравниваются предыдущий образ с последующим, причём смещение их может быть во времени, по положению или в зависимости от внешних факторов. Рассмотрим некоторые случаи.
3.1. Динамика пропорционально
изменяющегося образа.
О пропорциональных образах говорилось выше; они определяются соотношением , где — пусть будет предыдущий образ, а — последующий, это соотношение определяет возбуждения однономерных рецепторов: . Коэффициенты приведения равны: ; , — степень сходства пропорциональных образов всегда равна единице.
Пропорциональные образы, как известно, отражают пропорциональные ситуации, а те, в свою очередь, возникают, в частности, при изменении напряжения питания рецепторов (у человека это — эмоции или тонус) или при изменении освещённости обозреваем сцены.
В отношении изменения освещённости необходимы некоторые уточнения и допущения. Прямая пропорциональная зависимость возбуждений рецепторов от изменения освещённости видимой сцены может быть только в том случае, если рецепторы не парны, т.е. среди них нет рецепторов «темноты», возбуждающихся при отсутствии внешнего воздействия на них. И ещё: считаем, что рабочие характеристики фоторецепторов — линейные: , где — освещённость чувствительного окна рецептора; - коэффициент пропорциональности, — и эта линейность сохраняется на всём диапазоне освещения. В действительности, мы знаем, эта зависимость — логарифмическая или экспоненциальная.
Рис.2.4. Динамика пропорционально изменяющегося образа |
Представляя
коэффициент k в общем как степень пропорционального
изменения образа, динамику этого образа можно изобразить в виде графика (рис.2.4), на котором в логарифмическом масштабе
представлены как сам коэффициент k, так и характеризующие динамику образа коэффициент приведения предыдущего образа к последующему , встречный коэффициент приведения и степень сходства
этих образов .
Пропорционально
изменяющиеся образы характерны тем, что их коэффициенты приведения, прямой и
встречный, соотносятся по величине как обратные: а это означает, что сигнал
управления в последующей ситуации с пропорционально изменяющимся образом
всегда однозначно определяется коэффициентом приведения :
, (2.60)
или
.
Выражение (2.60) имеет расширенную область применимости по сравнению с выражением (2.14); оно справедливо не только после первого шага обучения, но и после любого уровня обучения, включая полное его завершение. Последующий фактический сигнал управления однозначно определяется предыдущим сигналом и коэффициентом пропорциональности образов k; других вариантов нет: не может быть никаких надежд на то, что можно получить иной последующий сигнал управления, и не поможет здесь никакое дообучение.
Лишним подтверждением такого вывода является равенство единице степени сходства пропорциональных образов. Если потребовать в последующей ситуации с пропорциональным образом иной сигнал управления, то обучение окажется полностью безрезультатным, и об этом говорит зависимость (2.21), отражающая связь последующей погрешности с предыдущей: , — погрешность при =1 сохраняется неизменной, и процесс обучения стопорится полностью.
Графики зависимостей коэффициентов приведения , и степени сходства пропорциональных образов от коэффициента пропорциональности k (рис. 2.4) свидетельствуют о неизменности этих зависимостей при любом изменении k; практически такого быть не может. Очевидно, при сильном увеличении напряжения питания рецепторов и при большом увеличении освещения обозреваемой сцены часть рецепторов выйдет на предел своего возбуждения и дальше изменяться не будет, а это приведёт к существенному изменению образов. При малых изменениях напряжения питания и освещённости закономерности графика (рис. 2.4) сохранятся неизменными.
Выше говорилось, что в ситуациях с пропорциональными образами поведение объекта в целом не изменяется; изменяются лишь скорости его исполнительных органов. Действительно, выражение (2.60) оказывается справедливым для любой столбцовой пары технического мозга обучаемой системы управления, т.е. для каждого исполнительного органа, причем коэффициент пропорциональности k сохраняется для них для всех одинаковым. Поэтому фактически сигналы управления приводов объекта выразятся как
;
;
. . . . . . . . . . . . . . . . . .
,
где индексы 1, 2, ..., N - определяют номера приводов.
Если силовое управление приводами построено на регулировании скоростей: , — то получим:
;
;
. . . . . . . . . . . . . . . . . .
.
Скорость любого привода V определяет величину скорости и направление перемещения (вектор) исполнительного органа; поэтому скаляры , , ..., приводов можно заменить векторами исполнительных органов , , ..., , так что:
;
;
. . . . . . . . . . . . . . . . . .
.
Связь скалярной скорости привода с векторной скоростью исполнительного органа хорошо иллюстрируется на примере робота; так знак и частота вращения привода поворота определяют свой вектор скорости схвата; независимо от этого знак и частота вращения привода выдвижения руки робота определяют свой вектор скорости схвата, и т.д.
Сумма всех векторов исполнительных органов определит конечное, результирующее движение объекта; так что в предыдущей и последующей ситуациях будем иметь
;
.
По одному только результирующему вектору скорости можно судить о поведении объекта (робота) вообще. Учитывая отражённую выше связь векторов последующих скоростей от векторов предыдущих и вынося коэффициент k за скобки, получим
,
или
. (2.61)
Выражение (2.61) говорит о том, что результирующий вектор в последующей ситуации коллинеарен с результирующим вектором в предыдущей, если образы этих ситуаций пропорциональны. Таким образом мы доказали, что целевое поведение объекта при изменении напряжения питания рецепторов или при изменении освещённости обозреваемой сцены сохраняется в общем неизменным; изменяется лишь подвижность объекта: при k>1 объект становится более подвижным, а при k<1 - менее подвижным.
О неизменности целевого поведения говорит также и то, что степень сходства образов предыдущей и последующей ситуаций равна единице. Если рассматривать образы не ситуаций, а фактических сигналов управления в них:
образ : ; ; ...; ;
образ : ; ; ...; ,
то степень их сходства, определяемая выражением (2.12), оказывается также равна единице, т.е. образы эти неразличимы; иначе говоря, целевое поведение объекта сохраняется неизменным.
Кстати, степень сходства образов фактических сигналов управления может, оказывается, в общем случае характеризовать изменение поведение объекта, так как она выражает косинус угла между результирующими векторами. Если степень сходства равна единице, то векторы коллинеарны, и поведение неизменно; если степень сходства равна нулю, то векторы перпендикулярны, и поведение в сравниваемых ситуациях абсолютно не схоже; и, наконец, если степень сходства имеет промежуточное значение между единицей и нулём, то результирующие векторы будут иметь некоторую сонаправленность, выражаемую косинусом угла между ними, т.е. поведение будет изменяться пропорционально косинусу.