Оглавление

 

 

 

5. Закон обучения

 

Логика и интуиция. Обучение как способ формирования законов управления в технических системах, отличающийся в корне от математического моделирования, возникло в связи с появлением таких­ принципиально новых устройств, копирующих работу мозга, как перцептроны, нейронные сети и обучаемые системы управления. В основе обучения — опыт или интуиция, и оба этих направления противо­стоят друг другу на протяжении нескольких веков; история их про­тивостояния поучительна.

Логика, зародившаяся в Греции на заре европейской цивилизации, триумфально прошествовала по всему миру, порождая неслыханный научный и, самое главное, технический прогресс; она бук­вально перевернула мир. Интуиция, как антипод логики, властво­вавшая во всем мире тысячелетиями, начала сдавать свои позиции уже несколько веков назад, а в начале Двадцатого века практи­чески прекратила своё существование как декларируемый метод поз­нания. По крайней мере Анри Пуанкаре (1854-1913), великий французский математик, считал себя последним интуитивистом в науке /1.40/.

Отходя от общепринятого толкования логики как науки о спосо­бах доказательств, и интуиции как способности постижения истины без логических доказательств, вложим в эти понятия несколько иной, инженерный смысл: согласно ему пусть логика будет принятием решения на основе доказательств, а интуиция то же самое на основе опыта, приобретенного в процессе обучения. Интересно отметить, что кроме различий оба эти подхода имеют немало общего, что связывает их между собой. Как известно, любое доказатель­ство состоит из аксиом, то есть положений, принимаемых на веру без логических доказательств, и правил вывода, — которые также усваиваются как опыт в результате обучения, — другими словами: и аксиомы, и правила вывода — категория интуиции. Получается так, что логика является как бы дроблёной интуицией: можно при­нять решение в сложной ситуации на основе опыта, то есть инту­итивно, а можно разбить эту ситуацию на элементы, усвоить опытным путём зависимости общего решения от отдельных элементов и с помощью правил вывода, заученных в результате предыдущего обу­чения, получить то же самое искомое решение. В последнем случае действует логика.

Для иллюстрации соотношения логики и интуиции можно привести сравнение иероглифов и алфавита. Иероглиф человек воспринимает как сложный образ; тот же образ можно описать с помощью предложения, составленных из слов, а те — из  букв. Для того, что бы человек воспринял тот же образ через буквы, его нужно предварительно обучить воспринимать сами буквы, обучить воспринимать слова из букв и предложения из слов. А результат — почти один и тот же. Кстати, для того, чтобы читать китайские иероглифы, совершенно не обязательно знать китайский язык.

Реальный физический мир, и в том числе технический, можно вос­принимать интуитивно в целом, а можно через дробление его на элементы, то есть логически. Пройдя по второму пути, логицисты предложили в качестве элементов — параметры, которые можно пони­мать как физические величины внешнего по отношению к человеку  пространства, имеющие размерности, например масса в килограммах, расстояние в метрах, время в секундах. С появлением параметров мир стал, образно говоря, угловатым: его начали изображать в виде трёхмерного или даже многомерного гранёного пространства, а си­туации — в форме многомерного вектора в том же пространстве. Человек перестал доверять своим глазам, своим ушам и прочим органам чувств: всё вокруг он стал измерять о помощью приборов. Тогда и возникла наука математического моделирования, увязывающая состояния или процессы с параметрами. Выявление параметрических­ зависимостей в науке и технике приняло в Двадцатом столетии почти стихийный характер: математизировалось всё вокруг; логика торжествовала.

Но пришло время, и этот научный подход исчерпал себя; не по­могло ему даже появление такого мощного научного инструмента, как электронная вычислительная машина. Кажется, наоборот, эти маши­ны ускорили завершение математизации физического мира. Самым трудным моментом в математическом моделировании оказалось выявление логических зависимостей, формализовать которые человеку практически не удаётся; можно уловить связь состояния или про­цесса с одним параметром, труднее — с двумя, еще труднее — с тремя, а если число параметров превышает десяток, то решать такие задачи человеку оказывается не под силу. Усложняет дело и то, что в мире кроме параметров есть еще признаки и факторы, не имеющие размерностей: их математика сторонилась всегда. А когда появилась необходимость использовать для принятия решений ещё и образы, зрительные, слуховые и иные, то логика оказалась в еще большем затруднительном положении. Уклоняясь от решения сложных практических задач, наука математического моделирования посте­пенно сошла на искусство доказательств: логика стала работать сама на себя. Даже тогда, когда было осознано, что многопараметрическую, многопризнаковую, многофакторную и образную информации можно перерабатывать только такими способами, какими оперирует живой мозг, то и тогда наука не сразу взяла на вооружение обуче­ние, а по-прежнему пыталась найти выход в логике. Появилось даже целое направление в науке — теория распознавания образов, которая исходила из того, что мозг живых существ, прежде чем принять реше­ние в любой ситуации, распознает эту ситуацию логическим путем, либо сравнивая её с эталонными ситуациями, хранимыми в своей па­мяти, либо перерабатывая образную информацию по определённым законам — решающим правилам.

Скромные успехи теории распознавания образов вынудили науку искать иные пути переработки сложной информации, а точнее говоря, пришлось вернуться к той самой отвергнутой ранее интуиции, которая применительно к техническим системам представляет собой законы управления, формируемые автоматически в процессе обучения. Достоинство технической интуиции — в простоте её формирования: от человека требуется только поправлять действия обучаемого объекта, оценивая их по внешним признакам. Если, например, обучаемый робот со зрением не научился ещё поиску определённого предмета не стремится к нему, — то в задачу обучателя входит подталкивать его (буквально подталкивать!) к искомому предмету со всех сторон; делать это не сложно. После многократных повторов робот усвоит обучение и будет стремиться к искомому предмету, где бы тот не находился. При этом полностью исключаются такие логические операции, как анализ и синтез; обучение проводится по факту: каждая ситуация воспринимается как «так есть», а сигналы управления в этой ситуации задает обучатель по принципу «так надо». Согласование того и другого осуществляется в техническом мозгу автомати­чески. Объём перерабатываемой информации при этом может быть каким угодно большим, и, чем больше он, тем лучше: это, во-первых, не затруднит обучателя, а, во-вторых, ускорит обучение.

Ту интуицию, о которой идёт речь, нужно воспринимать сугубо в инженерном толковании; как однозначное принятие решения в конкретной ситуации, но не в бытовом смысле как некоторое неопреде­лённое чувство правильного решения и, тем более, не в научном как способность к постижению. Однозначность — главное свойство интуиции. Более привычны её синонимы: условные рефлексы, рефлекторность, навыки поведения, автоматизм действий, навыки действий и, просто, опыт. Внедряясь в техническую область, интуиция теснит, как говорилось выше, логику, но только такую логику, кото­рая использовалась обычно для определения законов управления; логика же исследований, и в том числе математический аппарат исследований, пока сохраняется и, более того, является единствен­ным средством исследований самой интуиции. Звучит это как парадокс: логика интуиции, — но иного подхода пока не существует, и­ можно надеяться, что очень скоро оформится целое новое направле­ние в науке — теория интуиции.

Обучаемость мозга. К сожалению, нейрофизиология не даёт ответа в настоящее время на вопросы: как физически происходит усвоение навыков действий животными и человеком? Что происходит при этом в нервной системе? Все рассуждения и догадки носят поверхностный неконкретный характер, и на их основе невозможно создать действующую техническую систему­ управления. Поэтому обратимся снова к той инженерной концепции нервных систем животных, которую мы наз­вали биогидравлической, и дополним её условиями обучаемости. Сог­ласно этой концепции кора головного мозга представляет собой матрицу со строками и столбцами: строки — нейроны, идущие от рецеп­торов, а столбцы мотонейроны, идущие к мышцам; на пересечении тех и других — синапсы; управляющие потоки — гидравлические; синапс дроссель. В соответствии с принципом независимости нейроны не пересекаются; не пересекаются и мотонейроны; следовательно, каждый в отдельности рецептор имеет независимый выход на отдельный мотонейрон, то есть — отдельный синапс. Раньше мы определили, что синапсы имеют регулируемую гидравлическую проводимость; изменение этой проводимости и есть акт обучения. Теперь надо ответить на вопрос: под действием чего, как и по какому закону изменяется гидравлическая проводимость отдельного синапса?

Не усложняя процесс и представляя его предельно простым, допустим, и это самое главное, что изменение проходного сечения синапса производит сам поток управляющей жидкости, проходящий через этот синапс, то есть происходит саморегулирование синапса: чем больше поток, тем сильнее изменяется проводимость. Именно такая аксиома положена в основу обучаемости обучаемых систем уп­равления, и она себя оправдала. Зная, что поток управляющей жидкости, проходящий через синапс, определяется возбуждением соот­ветствующего рецептора, и допуская, что течение жидкости в синапсе ламинарное, получим математическое выражение его обучаемости в виде

 

,                                            (1.9)

 

где  — изменение проводимости  i-го синапса;  k — коэффици­ент прямой зависимости.

Коэффициент k в выражении (1.9) характеризует очень многое в процессе обучения, поэтому нуждается в пояснениях. Прежде всего он может менять свой знак: при положительном его значении будет происходить увеличение проводимости синапса, и, наоборот, при отрицательном его значение будет уменьшаться проводимость синапса. Кроме того величина коэффициента k определяется тонусом обуче­ния или эмоциями; он также характеризует степень устранения ошибки в поведении на данном шаге обучения. И, наконец, ламинарность,­ которую он отражает, вовсе не обязательна, и об этом будет сказано ниже; тем не менее, выражение (1.9) можно воспринимать как строгое математическое выражение линейной зависимости и как  строгий идеальный закон обучения.

Рассмотрим процесс изменения проводимости синапса более под­робно, и начнем с формирования потока управляющей жидкости отдельного рецептора. Если этот рецептор — прямого действия, то есть рецептор света, то его возбуждение прямо зависит от степени внешнего воздействия на него; если же рецептор — обратного действия, то есть рецептор темноты, то его возбуждение имеет обратную зависимость от того же внешнего воздействия. Считаем, что все рецепторы — парные: на один рецептор света приходится один рецептор темноты. Объяснить образование парности можно, в частности, так: нейроны отходят не только от колбочек рецепторов, но и от пространства между ними, то есть каждое такое замкнутое промежуточное пространство тоже рецептор. При усилении внешнего воздействия на отдельный участок рецепторного поля колбочковые рецепторы этого участка увеличивают свои выходящие потоки, а промежуточные, следовательно, — уменьшат; и наоборот, при сни­жении внешнего воздействия колбочковые рецепторы уменьшат свои потоки, а промежуточные — ровно на столько же (или почти) увеличат.

На величину возбуждения  влияет тонус обучения; он может быть положительным, стимулирующим увеличение  проводимостей си­напсов, или отрицательным, вызывающим уменьшение этих проводи­мостей; первый можно назвать возбуждением, второй — торможением; первый возникает при поощрении действий объекта обучения, вто­рой — при наказании. Физически тонус может реализоваться в фор­ме выделения в поток управляющей жидкости тех или иных медиаторов — стимуляторов: одни из них способствуют увеличению проход­ных сечений синапсов (размывают их), а другие , наоборот, умень­шению (заращиванию их).

На величину возбуждения рецептора  влияет также изменение местного давления рецепторного поля, возникающее при переключении внимания. Все рецепторы встроены в какую-то среду: одни в кожу, другие — в мышцы, третьи, например фоторецепторы, — в среду сетчатки глаза. Среда эта может напрягаться и расслабляться; при напряжении давление внутри рецепторов будет увеличиваться, а при расслаблении уменьшаться; соответственно будут изменяться рецепторные потоки управляющей жидкости. Вся рецепторная среда (или рецепторное поле) разбита на отдельные участки, напряжения в которых могут изменяться независимо друг от друга: если мы сжимаем кулаки, то поднимаем давление только в тех рецепторах, которые оказались в зоне кулаков; если сжали зубы и напрягли кожу лица, то под воздействием оказались рецепторы лица и, может быть, глаз, и т.д. Такое переключение напряжения, как было сказано, необходимо для переключения внимания. Если собака крадется за во­роной, то из всего очувствления напряжены у неё более всего сет­чатка глаз; если же она прислушивается к подозрительным звукам, то напряжены будут, наверное, уши. У одних животных переключение внимания выражено отчётливо и легко осуществляется — к таким животным можно отнести лошадей, собак, у других — такое переключение выражено слабо, например у кошек. Первые поэтому обучаются значительно легче, чем вторые: или, точнее говоря, первых легче обучить выполнению различных заданий, вторых — с трудом. Отсюда можно сделать вывод о том, что отдельные независимые участки рецепторных сред представляют собой независимые органы управления с исполнителями в виде, например, мышечных волокон кожи и с управляющими мотонейронами, исходящими из коры головного мозга; поэтому их можно обучить переключаться с одной задачи на другую в зависимости от внешней ситуации или по команде. Если рецепторные участки не имеют мотонейронов, исходящих из коры головного мозга, то можно утверждать, что животных с такой особенностью почти невозможно обучить переключаться с задачи на задачу.

Обучение с обучателем. Рассматривая наиболее простой вариант обучения — обучения с обучателем, в обязанности которого входит определять ошибки в действиях объекта и подправлять эти действия простым физическим подталкиванием, — отметим, что, если в качестве обучателя выступает человек, то его действия не будут идеально точными ни в определении ошибки и ни в подталкивании. Поэтому вы­ражение (1.9) в общем случае можно представить уже так:

 

,

 

где  — погрешность сигнала управления, определяемая как разность между требуемым сигналом в j-ой ситуации  и фактическим ; k — коэффициент, характеризующий точность обучения.

Однако неточность эта не разрушает сам процесс обучения; она лишь приводит к снижению эффективности обучения и затягивает его.

Обучение на основе игры. В животном мире в основном распространено самообучение, и одной из его форм является игра, в основе которой лежат несколько (возможно, даже один) безусловных врождён­ных рефлексов; например, у кошек и собак врожденными являются простейшие действия: стремление поймать, укусить и уклониться. Другим условием возникновения игры является отсутствие у животного целевого сигнала, обязывающего его выполнять те или иные действия, направленные, например, на поиск пищи для своего потомства. Еще одним условием является избыток энергии управления, то есть повы­шенное давление питания рецепторов системы очувствления, которое может возникнуть в результате увеличения мощности источника, вызванного в основном ростом. В этом случае, несмотря даже на то, что одновременно увеличивается (растет) в объеме сама нейронная сеть, в силу того, что проводимости синапсов вначале ещё малы (они увеличиваются в процессе обучения), рост их пропускной способности или общей проводимости отстаёт от увеличения мощности ис­точника питания, и это порождает рост давления в сети. Сочетание перечисленных условий наиболее вероятно в раннем возрасте, хотя и тогда игра может не состояться, если по какой-либо причине упадёт давление в сети, например от действий, причиняющих боль, или в результате чрезмерно интенсивного обучения, вызывающего резкий рост проводимостей синапсов мозга и, как следствие, вялость в движениях и апатию.

В процессе игры те движения, которые не порождают отрицатель­ных эмоций, будут закрепляться в силу естественного поступления в нервную систему медиаторов-стимуляторов увеличения проводимостей синапсов. Те же движения, которые вызывают неприятные ощуще­ния, например боль, будут порождать выделение в систему стимуля­торов уменьшения проводимостей: эти движения будут забываться. Может оказаться даже так, что врождённый акт агрессии, например стремление укусить, породивший саму игру и лежащий в основе возникновения всех движений, в процессе игры будет подавлен партнёром, дающим «сдачу» при всякой попытке, укусить его. От акта агрессии может остаться только его внешняя безобидная форма: игра в агрессию, агрессия понарошке.

Запаздывающее обучение. При рассмотрении «технической» стороны самообучения возникает вопрос: каков механизм возникновения запаздывающих рефлексов, другими словами — упреждения событий? Согласно принятой концепции обучения, поправка проводимостей синапсов мозга порождается текущим состоянием очувствления, то есть­ текущей внешней ситуацией. Если, играя, котёнок наткнулся на го­рячий предмет и получил болевое ощущение , то, казалось бы, будут уменьшены проводимости синапсов только тех рецепторов, которые были возбуждены в момент натыкания; и при повторе движений котё­нок сможет удержать себя от неприятностей лишь в самый последний момент, когда коснётся горячего предмета. Но на практике, мы зна­ем, котёнок будет избегать столкновения намного раньше этого мо­мента, упреждая нежелательное развитие событий.

«Техническое» решение упреждения основывается на следующих свойствах рецепторов и системы очувствления в целом, всей нервной системы и самого объекта управления, то есть котёнка. Известно что рецепторы обладают временем последействия, величина которого у различных рецепторов колеблется в широких пределах. Благодаря этому в момент натыкания котёнка на горячий предмет некоторые рецепторы будут возбуждены теми внешними ситуациями, которые предшествовали данной и которые оказались как бы смещенными во времени назад. Кроме того внешние ситуации видоизменяются плавно, они похожи одна на другую; и та из них, которая была в момент натыкания, окажется во многом схожей с предшествующими. Одних только­ этих особенностей достаточно для того, чтобы возникло упреждение развития событий.

И ещё следует учесть то, что разовая поправка проводимостей синапсов при натыкании котёнка на горячит предмет могла оказать­ся настолько большой, что вызвала перерегулирование проводимостей, в результате чего сигналы управления могли измениться больше того, что требовалось, то есть перескочили нулевую отметку. Сле­довательно, при повторе движений нулевые значения сигналов управления, останавливающие котёнка, возникнут раньше момента наты­кания. Но если принять во внимание инерционность котёнка, то даже при нулевых значениях сигналов управления всеми мышцами движение в сторону горячего предмета будет продолжаться, и не исключено, что котёнок снова наткнётся на него, а это ещё дальше назад сдвинет во времени нулевые позиции. Таков механизм возникновения отставленных и запаздывающих условных рефлексов.

Обучение на основе подражания. Другой формой самообучения является подражание, свойственное некоторым животным. Отличительной особенностью нервных систем таких животных является ду­блирование очувствления. Так положение своего тела животное может фиксировать двояко: зрительно и с помощью внутримышечных­ и внутрисуставных рецепторов. В процессе обучения устанавлива­ется взаимосвязь между этими группами рецепторов. Если теперь исключить что-то одно, например зрение, то целенаправленные движения тела и конечностей животного будут сохранены, хотя точность их при этом пострадает. (Снижение точности происходит всякий раз, когда отказывают любые рецепторы, и, чем больше отказавших рецепторов, тем больше ошибка в движениях)  Следовательно, при наличии дублирования очувствления можно, во-первых, обучить объект подражанию, а, во-вторых, подражание может быть использовано при самообучении.

Этот процесс можно наблюдать даже у птиц, например у воробьев; в результате птенцы учатся клевать всё то, что клюют взрослые птицы. Обучение о подражанием выглядит так: взрослый воробей с кормом в клюве дразнит молодого птенца, недавно вывалившегося из своего гнезда, и делает такие движения, как будто желает положить корм на землю; птенец тянется за кормом и вынуж­ден повторять движения родителя. Таким образом у него вырабатывается связь между наклонами взрослого воробья и своими внутри­мышечными ощущениями; увидев впредь клюющего родителя, а потом и сородича, птенец будет испытывать влечение делать тоже самое. Это и есть подражание.

Говоря о самообучении, следует подчеркнуть, что оно возможно лишь тогда, когда положительные действия животного подкрепляются положительными эмоциями, которые заставляют вновь и вновь повто­рять приятные движения.

 Возбуждающие и тормозящие рецепторы. Теперь остановимся на таком интересной факте, известном в нейрофизиологии, как деление всех рецепторов на возбуждающие и тормозящие: при усилении внешнего воздействия на первые активность исполнительных мышц усили­вается, а при таком же воздействии на другие ослабляется. Попы­таемся разобраться в этом неоспоримом и интересном факте. Примем во внимание парность рецепторов и выберем одну какую-то пару, включающую рецептор света и расположенный рядом с ним рецептор темноты. Возбуждение рецептора света обозначим через , а рецептора темноты — через ; им соответствуют проводимости си­напсов ,  и рецепторные доли сигнала управления , . Парная суммарная рецепторная доля определится как

 

.                            (1.10)

 

Допустим, после обучения установится следущее соотношение проводимостей синапсов: , — и рассмотрим три состояния: среднее внешнее воздействие на рецепторы, усиленное воздействие и ослабленное. В первом случае суммарная парная рецепторная доля сигнала управления пусть будет равна . Тогда во втором слу­чае, когда на рецепторы будет оказано усиленное внешнее воздействие, например их осветили ярким светом, парная доля , сог­ласно (1.10), увеличится по сравнению с . В третьем случае — при затемнении рецепторов — парная доля  окажется меньше, чем . Налицо прямая зависимость между внешним воздействием на рецепторы и активностью мышц; такую пару рецепторов можно отнести к возбуждающим.­

И допустим, что после обучения установится обратное соотношение проводимостей синапсов одной пары рецепторов: Тогда, очевидно, при усилении внешнего воздействия на указанную пару рецепторов её рецепторная доля сигнала управления уменьшится, а при ослабленном воздействии — увеличится. Такая пара оказывается тормозящей.

Вывод такой: деление рецепторов на возбуждающие и тормозя­щие легко объяснить при условии, если рассматривать их парами, причем такое деление не врожденное, а возникает в результате обучения.

Память с позиции биогидравлической модели. После того, как мы разобрались с механизмом обучения (научения), можно дать соответствующее толкование такому явлению, как память. Нейрофизиологи определяют память как хранение и извлечение информации о прошлом опыте, и считают, что такое определение одинаково применимо как к электронным вычислительным машинам, так и к живим организмам /1.7/. Согласно изложенной выше модели нервных систем, память следует толковать иначе — как способность мозга усваивать навыки поведения и действий, как способность усваивать условные рефлексы: память может быть хорошей или плохой.­ Представлять мозг в виде пространственного накопителя докумен­тальной информации никак нельзя; он — не блок памяти, а актив­ный преобразователь. Его преобразующую функцию можно представить в виде выражения

 

,                                             (1.11)

 

где  — образ ощущений организма в  j-ой ситуации (образ возбуждений рецепторов);  — состояние синапсов n-го мотонейрона мозга (образ проводимостей синапсов этого мотонейрона);  — сигнал управления на соответствующую мышцу в той же ситуации.

Из выражения (1.11) следует простое объяснение тех общеиз­вестных фактов, что в мозгу нет ни энграмм, то есть локализированных следов документальной памяти, ни «бабушкиных» клеток, определяющих отдельные ассоциативные понятия; мозг животных только управляет и только управляет, причём в управлении то есть в формировании каждого отдельного сигнала управления, принимают участие все до единого синапсы соответствующего мотонейрона. Поэтому-то выход из строя отдельного рецептора или отдельного синапса не может привести к отказу в работе мозга и организма в целом: при этом лишь изменяются величины сигналов управления мышцами, то есть искажаются действия организма, и степень этого искажения пропорциональна рецепторной доли вышедшего из строя рецептора или синапса.

Физиология делит память на краткосрочную и долговременную; такое деление, согласно представленной выше концепции, необъяснимо. Можно отдельно говорить о последствии рецепторов и о временных характеристиках синапсов. Рецепторы, как известно, имеют определенную инерционность и изменяют свое возбуждение после изменения внешнего на них воздействия не мгновенно, а постепенно (говорят: по экспоненте), и эта задержка может восприниматься как очень кратковременная память: у человека она длится от сотых долей до нескольких секунд. Строго говоря, такое свойство рецепторов сохранять прежнее возбуждение не есть память мозга.

К памяти мозга имеют отношение способность органов секреции выделять стимуляторы увеличения или уменьшения проводимостей синапсов и способность синапсов изменять и сохранять свои состояния. Первую способность можно назвать эмоциональностью организма, характеризуемой его положительной и отрицательной реакциями на ситуации. Чем больше выделяется стимуляторов, тем лучше память. При этом нужно иметь в виду, что и стимуляторы увеличения проводимостей, и стимуляторы уменьшения проводимостей способствуют обучению: только при их совместном воздействии правильно формируется проводимость синапсов. Само собой разумеется, что положительные эмоции организма, заставляющие органы секреции выделять стимулятор увеличения проводимости, возникают только при правильных своих действиях, то есть в «хороших» ситуациях, а отрицательные — в «плохих». Следовательно, правильное деление ситуаций на «хорошие» и «плохие» улучшает память; а способность к такому делению в большей степени приобретается в процессе обучения, чем наследуется от рождения. Выходит: обучением память может быть улучшена, а может быть ухудшена.

Способность синапсов изменять свою проводимость под воздействием стимуляторов тоже характеризует память. Известно, что в молодости такая способность выше, на старости — хуже, и хорошо, что так: в молодости нужно интенсивно усваивать навыки, а в старости их желательно сохранять. Разбирая процесс изменения проводимости синапса более подробно, можно выделить две составляющие такого изменения: упругую деформацию и пластическую. Если изменение проходного сечения синапса незначительное, то оно может укладываться только в пределы упругой деформации, и такое запоминание будет кратковременным: угасание длится минуты и часы. Пластическая деформация синапсов в принципе могла бы оставаться навсегда, если бы не последующее обучение, изменяющее проводимость синапсов, и не естественное старение. У некоторых животных способность к обучению длится не очень долго, но зато выработанные в раннем возрасте навыки сохраняются на всю жизнь. У других — способность к изменению проводимостей синапсов мозга сохраняется почти до самой смерти, и их навыки постоянно видоизменяются. Говоря об этих двух типах памяти, нельзя делать заключение, что первая лучше, чем вторая, что первая более долговременна, чем вторая — они просто разные.

Если деление памяти на краткосрочную и долговременную бессмысленно, то это не значит, что способности к запоминанию, а точнее говоря — к обучению, никак нельзя оценивать. Лучшей с этой точки зрения можно считать такую нервную систему, которая имеет более богатое очувствление (имеет больше рецепторов), которая более эмоциональна (способна обильно выделять стимуляторы изменения проводимостей синапсов) и которая легко переключается с решения одной задачи на другую (имеет большее количество управляемых рецепторных участков).

Таким образом, подводя некоторый итог, можно сказать, что обучение животных (иногда говорят — научение) характеризуется тремя особенностями:

1.    обучение не выделяется в особый режим; оно дополняет обычное поведение и действия животного;

2.    обучение выражается в поощрении действий в одних ситуациях и в наказании — в других; механизм поощрения и наказания есть выделение стимуляторов соответственно увеличения и уменьшения проводимостей синапсов;

3.    обучение представляет собой саморегулирование синапсов; проводимость отдельного синапса изменяется под воздействием проходящего через него потока управляющей жидкости: чем больше этот поток, тем больше изменение. Саморегулирование синапсов можно считать основополагающим принципом обучения живых существ, то есть — законом обучения.

Математическая модель (алгоритм) обучения. Попытаемся изложенную словесную модель обучения представить в математической форме, постоянно помня о том, что и та, и другая модели отражают действительный процесс  в сильно искаженном виде. Однако это сознание не должно нас останавливать: если нам удастся отразить математическим языком основополагающую суть обучения, то есть такую ее плодотворную составляющую, которая позволит обучать аналогичным образом технические системы, то риск математизации будет оправдан. Искажения действительного процесса начинаются с самого начала — с упрощения условий обучения. Будем считать, что обучение объекта — животного — осуществляет обучатель, то есть внешнее по отношению к объекту существо, допустим — человек. Реально трудно из процесса обучения любого животного исключить элемент самообучения, но его тоже можно рассматривать как обучение с обучателем, если под этим понимать тот или иной стимул. Вторым исходным условием примем безошибочность обучения, заключающуюся в том, что в процесс будут включены все только нужные и полноценные ситуации и в каждой из них известно требуемое поведение объекта, а точнее — скорости движения всех исполнительных органов; другими словами: обучатель точно знает, что он хочет. Следующее допущение — четкость ситуаций и четкая реакция объекта на них; это значительно упрощает математику. И, наконец поверим в то, что обучатель способен точно оценивать действия объекта. Кроме отмеченных необходимы и другие допущения, но они будут подразумеваться сами собой.

Обучение можно начать с нуля, то есть с такого состояния мозга, при котором все проводимости синапсов равны нулю, — но мы рассмотрим не первый акт, а любой последующий, в котором предъявлена j-ая ситуация. Очевидно, исходные проводимости синапсов в ней не будут нулевыми: после корректировки в предыдущей  ситуации каждый i-ый синапс будет иметь  проводимость. Опираясь на принцип независимости исполнительных органов, рассмотрим действие не всех мышц одновременно, а только одной из них, может быть даже части мышцы — того мышечного волокна, который управляется отдельным мотонейроном. (Природа в целях повышения надежности и плавности регулирования составила мышцы из множества отдельных волокон с независимым управлением.) Оценку действий объекта обучатель пусть делает по скоростям ее исполнительных органов, имея ввиду соответствующие этим скоростям сигналы управления, так что выходным параметром рассматриваемого нами мотонейрона будет сигнал E.

Итак, в предъявленной j-ой ситуации фактический сигнал управления , определяемый выражением (1.2), будет иметь вид

 

,                               (1.12)

 

где — возбуждение i-го рецептора в j-ой ситуации; m — количество рецепторов.

Считаем, что обучателю известен требуемый в данной ситации сигнал управления ; по крайней мере, он может оценить ошибку в действиях рассматриваемого исполнительного органа как

 

.                                     (1.13)

 

Это оценивание может выражаться в той степени воздействия, допустим подталкиванием, которое оказывает обучатель на объект. По отношению к конкретному исполнительному органу воздействие может быть поощряющим, возбуждающим, то есть ускоряющим, когда  и . Воздействия может и не быть, если действия исполнительного органа устраивают обучателя с учетом допустимого отклонения в данной ситуации :

 

.                                         (1.14)

 

И в этом случае корректировка проводимостей синапсов не произойдет — в ней нет никакой необходимости; на очередь будет поставлена следующая ситуация.

Если же условие (1.14) не выполняется, то последует корректировка проводимостей всех синапсов, относящихся к выбранному мотонейрону, в соответствии с выражением (1.9):

 

.

 

Коэффициент пропорциональности k можно определить из условия идеально точного воздействия обучателя, в результате которого требуемая поправка сигнала управления  окажется равной сумме поправок рецепторных долей

 

.

 

Отдельно каждую из них на основании выражения (1.1) можно выразить как

 

.

 

Подставляя одно в другое, получим

 

.

 

Если теперь в это выражение подставить выражение для определения поправки проводимость i-го синапса, соответствующее (1.9), то после несложных преобразований будем иметь

 

,

 

и полное выражение для определения поправки проводимости  i-го

синапса в j-ой ситуации приобретёт следующий вид

 

                                      (1.15)

 

Знак погрешности  определит знак поправки : при , то есть при поощрении действий объекта (конкретного органа), поправки  будут положительными и проводимости будут нарастать, а при , то есть при торможении исполнительного органа, поправка  окажется отрицательной и проводимости синапсов уменьшатся. После завершения акта обучения в j-ой си­туации установятся следующие проводимость синапсов

 

,                                   (1,16)

 

и обучаталь сможет предъявить следующую ситуацию: цикл обучения повторится.

Таким образом, систему выражений (1.12)...(1.16) можно рас­сматривать как идеальную математическую модель обучения отдель­ного исполнительного органа. Выражения (1.15) и (1.16) этой сис­темы известны в математике как алгоритм Качмажа, используемый для итерационного решения систем линейных алгебраических урав­нений и говорящий о сходимости решения /1.3/. С формальной точки зрения обучение представляет собой также решение системы линейных алгебраических уравнений, в которой каждое уравнение отра­жает одну из ситуаций обучаемой выборки. Изображая выражение (1.12) в виде обычного алгебраического уравнения, для всей вы­борки получим:

 

1-ая ситуация: ;

2-ая ситуация: ;

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

n-ая ситуация: .

 

В данной системе уравнений неизвестными являются проводимости ; они-то и определяются алгоритмом Качмажа. Сходимость ре­шения подобных систем, как известно из математики, оговарива­ется целым рядом условий. В нашем случае условия сходимости сводятся в основном к двум факторам. Во-первых, система управления должна иметь достаточное очувствление, выражающееся в том, что общее количество рецепторов должно превосходить число контроллируемых ситуаций . Во-вторых, ситуации, входящие в обучаемую выборку, не должны быть противоречивыми. Поясним последнее условие. Если ситуации одинаковы, то есть возбуждения соответствующих рецепторов в них одинаковы, то и сигналы управ­ления в них должны быть одинаковыми; в противном случае эти си­туации будут противоречивыми. Если ситуации пропорциональны, то есть возбуждения соответствующих рецепторов в них пропорциональ­ны: , — то сигналы управления в них должны соотносить­ся в той же пропорции, так как

 

,

 

в противном случае эти ситуации будут также противоречивыми. Одинарные и пропорциональные ситуации являются сходными, и, если ситуации обучаемой выборки хотя и не сходны, но близки к этому, то решение, то-бишь обучение, может на практике затянуться нас­только, что создастся впечатление зацикленности, и в этом слу­чае укоротит обучение введение допустимых отклонений на сигналы управления .

Выражения (1.15) и (1.16) справедливы как для непрерывного процесса обучения, так и для дискретного. При непрерывном обу­чении погрешность  следует понижать как постоянное скользя­щее воздействие обучателя на объект обучения; такими же постоянными будут изменения проводимостей синапсов. А при дискретном обуче­нии и определение погрешности сигнала управления, и корректи­ровка проводимостей синапсов выполняются прерывисто в такт предъ­явления новых и новых ситуаций; каждый такой такт является очередным шагом обучения. Если обучение носит беспорядочный харак­тер, то каждую последующую ситуацию следует воспринимать как но­вую вне зависимости от того, встречалась она раньше или нет. При упорядоченном обучении составляется обучаемая выборка из конкрет­ных ситуаций и эти ситуации предъявляют в определённой последо­вательности одну за другой: на каждом шаге обучения — очередную ситуацию. После предъявления всех ситуаций всё начинают сначала, и таю: повторяют до тех пор, пока не завершится обучение.

Математизацию завершим определением числа различимых ситуаций. Термин «различимые» не совсем удачен, и поэтому нуждается в пояс­нении. Будем считать различимыми такие ситуации, на которые живот­ные реагируют соответствующим образом. (Говоря о животных, мы ни на минуту не должны забывать, что точно также ведут себя объекты с обучаемыми системами управления) Другими словами, если в какой-то ситуации требуется определённый сигнал управления отдельной мышцей и он в результате обучения, как угодно продолжительного, но не до бесконечности, получен, то такая ситуация попадает в число различимых. Чтобы исключить из данного определения случайные сов­падения ситуаций, уточним его: ситуация отличима от любой другой в том случае, если в ней можно получить требуемый сигнал управ­ления каким угодно продолжительны обучением, отличающийся от сиг­нала в сравниваемой ситуации. Конкретизируя определение, мы должны перейти от внешних ситуаций к тем внутренним ощущениям, которые они создают. Это можно сделать, заменив понятие ситуации спектром или набором возбуждении рецепторов в ней, то есть образом ситуации.

Представим теперь, что каждый рецептор может иметь только два состояния: либо он возбуждён, либо не возбуждён, — или в виде цифр: 1 и 0; назовем это градацией; в данном случае она равна двум: g=2. Отличительный образ ситуации определится отличитель­ным сочетанием состояний всех рецепторов. Так, например, очувствление всего из четырёх рецепторов с двухступенчатым возбуждением образует следующие сочетания:

 

 

0 0 0 0

0 0 0 1

0 0 1 0

0 0 1 1

 

0 1 0 0

0 1 0 1

0 1 1 0

0 1 1 1

 

1 0 0 0

1 0 0 1

1 0 1 0

1 0 1 1

 

1 1 0 0

1 1 0 1

1 1 1 0

1 1 1 1

 

Каждое такое сочетание представляет отдельную отличительную ситуацию. В результате общее число различимых ситуаций при двоичной градации рецепторов определится как  , где m количество рецепторов; в данном случае .

Если же принять во внимание, что рецепторы на самом деле не двоичные и каждый из них имеет свой диапазон непрерывно изме­няющихся возбуждении, то, очевидно, число различимых ситуаций будет увеличено. Чтобы его определить, представим плавное изменение возбуждений рецепторов в ступенчатой форме с конкретным чисом градаций. За ступеньку можно принять такое отклонение возбуждения, которое превышает естественный шум рецептора.

Допустим, обучаемая система управления оснащена зрением; в качестве фоторецепторов использованы фоторезисторы СФЗ-1 с такими параметрами: темновое сопротивление 30 МОм, рабочее на­пряжение 15 В, световой ток 750 мкА. Следовательно, общий диапа­зон возбуждения будет равен: 0,5...750 мкА, что в пересчёте на сопротивление составит ЗО МОм...20 Ком. На сколько ступенек можно разбить весь диапазон? Известно, что в силу ряда обстоятельств даже при неизменном освещении ток фоторезистора будет колебаться, и эти колебания определяют погрешность чувствительного элемента; она обычно задаётся в процентах. За ступень можно принять эту погрешность или несколько больший процент. Приняв в нашем примере за одну ступень изменение тока (или сопротив­ления) на 50 %, получим такой ряд: 0,5...0,75...1,125 ...1,7...2,5...3,8...5,7 и так далее вплоть до
750 мкА; число градация составит . При удвоении тока на каждой ступени число градаций будет равно . Таким образом, с учётом градаций рецепторов общее число различимых ситуаций определится как

 

.

 

Полученное выражение дает представление о возможностях нерв­ных систем животных и обучаемых систем управления. Если у послед­них очувствление будет насчитывать сотни, тысячи рецепторов и даже сотни тысяч, то при любых градациях рецепторов число раз­личимых ситуаций уходит в бесконечность. Такая характеристика делает системы несравнимыми с компьютерами. Если взять, например; по самому минимуму количество рецепторов равным 100, их возбуж­дение принять двоичным: , то и тогда число различимых си­туаций будет поистине астрономическим: .

О возможностях нервных систем животных и человека в этом плане и говорить не приходится; достаточно вспомнить, что только в одном глазу человека насчитывается более 100 млн. рецепторов.

Обобщённая модель нервной системы животных, после всех рассуж­дений можно предложить обобщённую модель устройство, работы и обучения нервной системы животных:

1. В основе функционирования нервной системы лежат гидраравлические процессы.

Рецептор очувствления при внешнем воздействии выдавливает в систему порциями управляющую жидкость; каждая такая порция порож­дает волну давления. Электрический потенциал действия — свидетель­ство движения волны давления внутри нейрона необходим для поддержания волны и для воздействия на мышцы положительно заряженной порцией управляющей жидкости.

2. Каналы, по которых управляющая жидкость передается от рецепторов к коре головного мозга и от неё к мышцам, независимы и нигде не пересекаются.

Таким каналом может быть микротрубочка или микрофиламента; связанные в пучок они образуют нейрон.

3. Кора головного мозга структурно представляет собой матрицу со строками и столбцами; управляющая жидкость от рецепторов поступает по строчных каналам, а по столбцовым она уходит к мышцам; соединяет отдельный строчный канал со столбцовым — синапс.

4. Синапс коры головного мозга представляет собой гидравличес­кий дроссель.

Проводимость синапса (обратная величина сопротивления) опреде­ляет величину проходящего через него потока управляющей жидкости; в сумме потоки всех синапсов (всех рецепторов), выходящих на один столбцовый канал мозга, определяют сигнал управления соответствующей мышцей.

5. Обучение нервной системы сводится к изменению проводимостей синапсов коры головного мозга.

6. Изменение проводимости синапса вызывает проходящий через него поток управляющей жидкости: чем больше поток, тем больше изменение; такое явление можно назвать саморегулированием синапса.

7. Изменение проводимостей синапсов в большую или меньшую сторо­ну определяют химические стимуляторы (медиаторы): стимулятор, вызы­ваемый поощрением, способствует увеличению проходного сечения синапса (назовем его медиатором удовольствия), а стимулятор, вызыва­емый наказанием, наоборот, способствует уменьшению проходного се­чения (его можно назвать медиатором огорчения).