Как ре­бё­нок

Оте­че­ствен­ные про­грам­ми­сты скон­стру­и­ро­ва­ли ро­бо­та, са­мо­сто­я­тель­но по­зна­ю­ще­го мир

Izvestia - - Первая страница - Ан­на Ур­ман­це­ва

Оте­че­ствен­ные про­грам­ми­сты скон­стру­и­ро­ва­ли ро­бо­та, са­мо­сто­я­тель­но по­зна­ю­ще­го мир

ВИн­сти­ту­те точ­ной ме­ха­ни­ки и вы­чис­ли­тель­ной тех­ни­ки им. С.А. Ле­бе­де­ва РАН при уча­стии АО «Ин­тел­лект» про­шел ис­пы­та­ния ро­бот, в ос­но­ву обу­че­ния ко­то­ро­го по­ло­жен аб­со­лют­но но­вый прин­цип, ко­пи­ру­ю­щий, по сло­вам уче­ных, ал­го­рит­мы по­зна­ния ми­ра мла­ден­цем. Про­грам­ма, фор­ми­ру­ю­щая ал­го­рит­мы обу­че­ния, вос­про­из­во­дит по­стро­ен­ную ими функ­ци­о­наль­ную мо­дель моз­га и ре­а­ли­зо­ва­на с ис­поль­зо­ва­ни­ем раз­ра­бо­тан­ных спе­ци­аль­но для этой це­ли мо­де­лей ней­ро­на. В этих мо­де­лях во­пло­ща­ет­ся ре­во­лю­ци­он­ное убеж­де­ние ав­то­ров в том, что сам по се­бе био­ло­ги­че­ский ней­рон — это уже неболь­шая са­мо­обу­ча­е­мая система рас­по­зна­ва­ния об­ра­зов.

По двум оди­на­ко­вым ла­би­рин­там пол­за­ют ро­бот и мы­шо­нок. И тот, и дру­гой де­мон­стри­ру­ют оди­на­ко­вое по­ве­де­ние. Мы­шо­нок ощу­пы­ва­ет сте­ны уса­ми-виб­рисса­ми, ро­бот за­ме­ча­ет пре­пят­ствия сво­и­ми ви­зу­аль­ны­ми и так­тиль­ны­ми дат­чи­ка­ми. Оба по­на­ча­лу то и де­ло на­ты­ка­ют­ся на пре­пят­ствия. Но про­хо­дит неко­то­рое вре­мя — и по­сте­пен­но и тот, и дру­гой на­чи­на­ют по­ни­мать, как им ве­сти се­бя, что­бы из­бе­жать столк­но­ве­ний со стен­ка­ми ла­би­рин­та. Ис­пы­ту­е­мые пе­ре­ста­ют на­ты­кать­ся на стен­ки, во­вре­мя по­во­ра­чи­вая в нуж­ную сто­ро­ну. Адап­тив­ное по­ве­де­ние ро­бо­та со­от­вет­ству­ет по­ве­де­нию но­во­рож­ден­но­го мы­шон­ка, как и спо­соб обу­че­ния.

Этот экс­пе­ри­мент был про­ве­ден в Ин­сти­ту­те нор­маль­ной фи­зио­ло­гии РАН под ру­ко­вод­ством рос­сий­ско­го ней­ро­фи­зио­ло­га Кон­стан­ти­на Ано­хи­на в со­труд­ни­че­стве с уче­ны­ми Ин­сти­ту­та точ­ной ме­ха­ни­ки и вы­чис­ли­тель­ной тех­ни­ки им. С.А. Ле­бе­де­ва РАН. По ре­зуль­та­там экс­пе­ри­мен­та на­пи­са­на сов­мест­ная ста­тья под на­зва­ни­ем «Ис­сле­до­ва­ние фор­ми­ро­ва­ния по­ве­ден­че­ских стра­те­гий в био­ло­го-ки­бер­не­ти­че­ских экс­пе­ри­мен­тах».

«НЕЙРОНЫ ЖДАНОВА»

Система управ­ле­ния ро­бо­та бы­ла ос­но­ва­на на прин­ци­пах док­то­ра фи­зи­ко-ма­те­ма­ти­че­ских на­ук Алек­сандра Жданова: им бы­ла пред­ло­же­на ори­ги­наль­ная кон­цеп­ция ра­бо­ты ки­бер­не­ти­че­ских устройств, на­зван­ная прин­ци­пом ав­то­ном­но­го адап­тив­но­го управ­ле­ния. Схе­ма ра­бо­ты опи­сы­ва­ет вза­и­мо­со­гла­со­ван­ное ре­ше­ние ря­да та­ких слож­ных за­дач, как самообучение рас­по­зна­ва­нию об­ра­зов, мо­де­ли­ро­ва­ние эмо­ций, по­иск и на­коп­ле­ние зна­ний, при­ня­тие ре­ше­ний.

Ре­а­ли­зо­вать та­кую схе­му мож­но раз­ны­ми спо­со­ба­ми, при­ме­няя под­хо­дя­щие ме­то­ды ре­ше­ния каж­дой из ука­зан­ных за­дач. Но по­сколь­ку в при­ро­де все эти за­да­чи ре­ша­ют­ся с по­мо­щью ней­ро­нов, то ав­то­рам при­шлось смо­де­ли­ро­вать но­вые мо­де­ли ней­ро­нов, со­от­вет­ству­ю­щие по сво­им свой­ствам био­ло­ги­че­ско­му ней­ро­ну.

— Био­ло­ги­че­ский ней­рон — это са­мо­сто­я­тель­ная са­мо­обу­ча­е­мая система рас­по­зна­ва­ния об­ра­зов, — по­яс­ня­ет Алек­сандр Жда­нов. — Ней­рон не тре­бу­ет ни­ка­ко­го внеш­не­го су­пер­ви­зо­ра, на­блю­да­ю­ще­го все вхо­ды и вы­хо­ды нерв­ной се­ти и на­стра­и­ва­ю­ще­го все ве­са ней­ро­нов ме­то­дом back propagation, как это де­ла­ет­ся в со­вре­мен­ных так на­зы­ва­е­мых ис­кус­ствен­ных ней­ро­се­тях, — это аб­со­лют­но нере­аль­но в при­ро­де. Био­ло­ги­че­ский ней­рон и на­ша мо­дель име­ют все необ­хо­ди­мое, что­бы са­мим об­на­ру­жи­вать кор­ре­ли­ру­ю­щие сиг­на­лы на сво­их вхо­дах.

Искус­ствен­ный «ней­рон Жданова» мо­жет иметь ты­ся­чи вхо­дов. Он на­блю­да­ет за вход­ны­ми сиг­на­ла­ми и по опре­де­лен­но­му ав­то­ном­но­му пра­ви­лу сам вы­ра­щи­ва­ет свои си­нап­сы.

ОДИН НЕЙ­РОН  ОДИН ОБРАЗ

— В ка­кой-то мо­мент ней­рон как бы го­во­рит се­бе: «Ага! Эта ком­би­на­ция сиг­на­лов по­вто­ря­лась уже 20 раз. Это не мо­жет быть слу­чай­но­стью. За­пом­ню-ка я ее и бу­ду на нее ре­а­ги­ро­вать», — го­во­рит Алек­сандр Жда­нов. — С это­го мо­мен­та он на­чи­на­ет со­об­щать вовне о рас­по­зна­ва­нии это­го об­ра­за.

Один ней­рон от­ве­ча­ет за один образ. По сло­вам уче­но­го, это бы­ло под­твер­жде­но в из­вест­ных опы­тах с «ней­ро­ном Джен­ни­фер Эни­стон», ко­гда бы­ло об­на­ру­же­но, что, ес­ли че­ло­век рас­по­зна­ет образ ак­три­сы, сра­ба­ты­ва­ет опре­де­лен­ный ней­рон.

Алек­сандр Жда­нов под­чер­ки­ва­ет: не­смот­ря на то что при узна­ва­нии Эни­стон сра­ба­ты­ва­ет мно­же­ство ней­ро­нов, от­ве­ча­ю­щих за раз­ные со­став­ля­ю­щие это­го об­ра­за, — есть один ней­рон, от­ве­ча­ю­щий за ито­го­вый образ. Так про­ис­хо­дит по­иск за­ко­но­мер­но­стей в по­то­ке ин­фор­ма­ции.

Схе­ма за­по­ми­на­ния об­ра­зов ана­ло­гич­на про­цес­су обу­че­ния че­ло­ве­ка: что­бы мы за­пом­ни­ли но­во­го со­се­да во дво­ре, нам на­до встре­тить его несколь­ко раз. Ли­бо он сра­зу дол­жен про­из­ве­сти на нас силь­ное впе­чат­ле­ние — это еще один ал­го­ритм обу­че­ния.

Ней­рон счи­та­ет­ся обу­чив­шим­ся, ко­гда си­ту­а­ция по­вто­ри­лась нуж­ное ко­ли­че­ство раз. Это ко­ли­че­ство уста­нав­ли­ва­ет­ся про­грам­ми­стом для каж­дой си­ту­а­ции ин­ди­ви­ду­аль­но. Ли­бо образ за­по­ми­на­ет­ся с пер­во­го ра­за, но то­гда его по­яв­ле­ние долж­но со­про­вож­дать­ся очень силь­ной эмо­ци­ей — по­ло­жи­тель­ной или от­ри­ца­тель­ной. Оцен­ка эмо­ций за­ло­же­на в ли­ней­ке ней­ро­нов. Ес­ли за­де­ва­ет­ся ней­рон с од­ной сто­ро­ны ли­ней­ки, ма­шин­ным моз­гом это вос­при­ни­ма­ет­ся как невы­но­си­мо пло­хо. С дру­гой сто­ро­ны ли­ней­ки — необык­но­вен­но хо­ро­шо.

Та­ким об­ра­зом, в слу­чае си­сте­мы управ­ле­ния, ос­но­ван­ной на «нейронах Жданова», про­ис­хо­дит самообучение ро­бо­та, а не обучение с учителем, как в слу­чае дру­гих ней­ро­се­тей. Там пред­ва­ри­тель­ное обучение обязательно.

ВТОРАЯ СИГНАЛЬНАЯ

Еще од­но от­ли­чие ней­ро­но­по­доб­ной мо­де­ли Жданова — спо­соб­ность по­рож­дать язы­ко­вое об­ще­ние, что в при­ро­де яв­ля­ет­ся пре­ро­га­ти­вой че­ло­ве­ка. Эту спо­соб­ность че­ло­ве­ка рус­ский фи­зио­лог Иван Пав­лов вы­де­лил в спе­ци­аль­ный тип выс­шей нерв­ной де­я­тель­но­сти, на­звав его вто­рой сиг­наль­ной си­сте­мой.

Управ­ля­ю­щая система ро­бо­та мо­жет ас­со­ци­и­ро­вать слы­ши­мые ею сло­ва с ре­аль­ны­ми си­ту­а­ци­я­ми. На­при­мер, ес­ли несколь­ко раз при по­яв­ле­нии пре­пят­ствия спра­ва го­во­рить вслух сло­ва: «пре­пят­ствие спра­ва», то ро­бот свя­жет эти сло­ва с си­ту­а­ци­ей и че­рез неко­то­рое вре­мя да­же нач­нет ре­а­ги­ро­вать на эти сло­ва так, как буд­то он дей­стви­тель­но уви­дел пре­пят­ствие. Это лиш­ний раз под­твер­жда­ет био­ло­гич­ность раз­ра­бо­тан­ной схе­мы ис­кус­ствен­но­го моз­га.

Схе­ма моз­га, раз­ра­бо­тан­ная Алек­сан­дром Жда­но­вым, вы­ве­де­на не из био­ло­гии, а из ки­бер­не­ти­че­ской по­ста­нов­ки за­да­чи. Уче­ный по­ста­вил цель со­здать ин­фор­ма­ци­он­ную управ­ля­ю­щую ма­ши­ну, ко­то­рая при рож­де­нии ока­зы­ва­ет­ся в сре­де с ма­ло­из­вест­ны­ми ей свой­ства­ми. Она долж­на уметь при­спо­саб­ли­вать­ся к ми­ру пря­мо в про­цес­се «жиз­ни», непре­рыв­но обу­ча­ясь, до­обу­ча­ясь и пе­ре­обу­ча­ясь. По­сколь­ку «вы­жи­вать» ей при­хо­дит­ся за счет пра­виль­но­го при­ня­тия ре­ше­ний, она вы­нуж­де­на все вре­мя ак­тив­но ис­кать зна­ния о свой­ствах это­го ми­ра, что­бы при­ни­ма­е­мые ею ре­ше­ния бы­ли пра­виль­ны­ми.

СХЕ­МА РА­БО­ТЫ МОЗ­ГА

В це­лом схе­ма моз­га та­ко­ва: в сво­ей аф­фе­рент­ной ча­сти мозг учит­ся рас­по­зна­вать в по­сту­па­ю­щей из ор­га­нов чувств ин­фор­ма­ции об­ра­зы неслу­чай­ных яв­ле­ний, ко­то­ры­ми он мо­жет опе­ри­ро­вать при управ­ле­нии. Со­по­став­ляя их со сво­и­ми со­вер­шен­ны­ми дей­стви­я­ми, мозг дол­жен по­нять, как он мо­жет вы­звать рас­по­зна­ва­ние из­вест­ных ему об­ра­зов. Но для управ­ле­ния это­го ма­ло, нуж­на еще це­ле­за­да­ю­щая система, ка­че­ствен­но оце­ни­ва­ю­щая со­сто­я­ния-об­ра­зы и ука­зы­ва­ю­щая, ка­кие из них пред­по­чти­тель­нее. Для это­го в каж­дом ор­га­низ­ме су­ще­ству­ет ап­па­рат эмо­ций, имен­но он оце­ни­ва­ет об­ра­зы, де­лит их на при­ят­ные и непри­ят­ные.

Для управ­ле­ния нуж­ны зна­ния о том, ку­да из те­ку­щей си­ту­а­ции мож­но пе­рей­ти до­ступ­ны­ми дей­стви­я­ми и хо­ро­ши или пло­хи эти воз­мож­ные ре­зуль­та­ты. Кол­лек­ция этих эм­пи­ри­че­ски до­бы­тых зна­ний и со­став­ля­ет «ба­зу зна­ний» жи­во­го ор­га­низ­ма.

— В моз­ге че­ло­ве­ка она ре­а­ли­зо­ва­на в ви­де со­во­куп­но­сти обу­чив­ших­ся ней­ро­нов, со­бран­ных в трех­мер­ные мат­ри­цы, — объ­яс­ня­ет Алек­сандр Жда­нов. — При­ни­мая каж­дое ре­ше­ние, мозг смот­рит в свою ба­зу зна­ний и вы­би­ра­ет то дей­ствие, ко­то­рое вы­зо­вет рас­по­зна­ва­ние об­ра­зов с мак­си­маль­но луч­ши­ми из воз­мож­ных в дан­ной си­ту­а­ции эмо­ци­о­наль­ны­ми оцен­ка­ми.

Кро­ме то­го, при­ни­мая ре­ше­ния, мозг по­сто­ян­но взве­ши­ва­ет: выбрать ли ре­ше­ние из уже из­вест­ных, что­бы по­лу­чить на­деж­ный ре­зуль­тат, или по­про­бо­вать что-то но­вое, неиз­вест­ное.

При­ня­тые моз­гом ре­ше­ния идут на ис­пол­ня­ю­щие устрой­ства, ко­то­рые пе­ре­во­дят би­нар­ные ко­ман­ды в со­кра­ще­ние или рас­слаб­ле­ние мышц. Так мы идем, ле­тим, плы­вем, управ­ля­ем ав­то­мо­би­лем, пи­шем сим­фо­нии, дви­га­ем шах­мат­ные фи­гу­ры.

СОМНЕНИЯ И ПЕРСПЕКТИВЫ

Весь этот ал­го­ритм ра­бо­ты моз­га ма­те­ма­ти­че­ски фор­ма­ли­зо­ван и по­дроб­но опи­сан в ста­тьях и мо­но­гра­фии Алек­сандра Жданова. Впро­чем, по мне­нию мно­гих ней­ро­фи­зио­ло­гов, об­щая схе­ма ма­ло что мо­жет ска­зать о том, как имен­но про­ис­хо­дит ра­бо­та био­ло­ги­че­ско­го моз­га.

— Нет со­мне­ний, что на со­вре­мен­ной про­цес­сор­ной ба­зе мож­но по­стро­ить са­мые раз­ные ал­го­рит­мы для ре­а­ли­за­ции про­стых и слож­ных са­мо­обу­ча­ю­щих­ся тех­ни­че­ских си­стем, — го­во­рит за­ве­ду­ю­щий ла­бо­ра­то­ри­ей ней­ро­фи­зио­ло­гии и ней­ро­ин­тер­фей­сов МГУ им. М.В. Ло­мо­но­со­ва Алек­сандр Ка­план. — Как пра­ви­ло, ин­тел­лект этих ро­бо­тов по­стро­ен на боль­ших се­тях ней­ро­по­доб­ных эле­мен­тов. Сей­час труд­но ска­зать, на­сколь­ко пер­спек­тив­ны си­сте­мы управ­ле­ния, ос­но­ван­ные на «нейронах Жданова», каж­дый из ко­то­рых пом­нит уни­каль­ную ком­би­на­цию сво­их эф­фек­тив­ных вхо­дов, то есть от­ве­ча­ет за кон­крет­ный образ или со­бы­тие. Мож­но толь­ко за­ме­тить, что ни один из ав­тор­ских коллективов, на­шед­ших зна­ме­ни­тые «нейроны Джен­ни­фер Эни­стон», «Мэ­ри­лин Мо­н­ро» и дру­гих из­вест­ных лич­но­стей, в сво­их ста­тьях не утвер­ждал, что система де­тек­ти­ро­ва­ния предъ­яв­ля­е­мых ис­пы­ту­е­мо­му кар­ти­нок со­сто­ит из од­но­го ней­ро­на. Ней­ро­фи­зио­ло­ги убеж­де­ны ско­рее в том, что эле­мен­тар­ные «вы­чис­ли­тель­ные» функ­ции вы­пол­ня­ют­ся в моз­ге груп­па­ми нерв­ных кле­ток. Это обес­пе­чи­ва­ет вы­со­кую на­деж­ность моз­го­вых опе­ра­ций и устой­чи­вость всей си­сте­мы управ­ле­ния к по­те­ре от­дель­ных нерв­ных кле­ток, что слу­ча­ет­ся по есте­ствен­ным при­чи­нам каж­дый день.

По мне­нию за­ве­ду­ю­ще­го ла­бо­ра­то­ри­ей ней­рон­ных си­стем и глу­бо­ко­го обу­че­ния МФТИ Ми­ха­и­ла Бур­це­ва, ней­ро­по­доб­ные се­ти Жданова дей­стви­тель­но уни­каль­ны по сво­е­му стро­е­нию, но по ре­ше­нию по­став­лен­ных пе­ред ИИ за­дач по­ка не по­ка­зы­ва­ют ре­зуль­та­тов, ко­то­рые мог­ли бы обес­пе­чить Рос­сии при­о­ри­тет в об­ла­сти раз­ви­тия обу­че­ния ро­бо­то­тех­ни­че­ских си­стем.

— Алек­сандр Жда­нов пред­ла­га­ет слож­ную мо­дель, ко­то­рая объ­еди­ня­ет раз­ные под­хо­ды, — го­во­рит Ми­ха­ил Бур­цев. — На­при­мер, его прин­цип обу­че­ния ней­ро­нов без учи­те­ля по­хож на тот, что есть в се­тях Хоп­фил­да. При этом точ­но его не по­вто­ря­ет, так как у Жданова обу­ча­ет­ся один ней­рон, а не сеть. В этом су­ще­ствен­ное от­ли­чие. Его оциф­ров­ка «ап­па­ра­та эмо­ций» по­хо­жа на «обучение с под­креп­ле­ни­ем» — это це­лый раз­дел в ма­шин­ном обу­че­нии, по ко­то­ро­му идут экс­пе­ри­мен­ты во всем ми­ре. Что­бы эти два под­хо­да бы­ли объ­еди­не­ны, я ни­где не встре­чал.

В СЛУ­ЧАЕ СИ­СТЕ­МЫ ” УПРАВ­ЛЕ­НИЯ, ОСНО ВАННОЙ НА «НЕЙРОНАХ ЖДАНОВА», ПРО­ИС­ХО­ДИТ САМООБУЧЕНИЕ РО­БО­ТА, А НЕ ОБУЧЕНИЕ С УЧИТЕЛЕМ, КАК В СЛУ­ЧАЕ ДРУ­ГИХ НЕЙРО СЕ­ТЕЙ. ТАМ ПРЕДВАРИТЕЛЬ НОЕ ОБУЧЕНИЕ ОБЯЗАТЕЛЬНО

Алек­сандр Жда­нов те­сти­ру­ет ней­ро­по­доб­ную сеть на уни­каль­ном ро­бо­те | Из лич­но­го ар­хи­ва

Newspapers in Russian

Newspapers from Russia

© PressReader. All rights reserved.