CPU для Google: ис­кус­ствен­ный ин­тел­лект Как тен­зор­ные про­цес­со­ры уско­ря­ют ИИ Google и вы­во­дят его на но­вый уро­вень

Ис­кус­ствен­ный ин­тел­лект ду­ма­ет не так, как че­ло­век, и вы­чис­ля­ет не так, как про­грам­ма. По­это­му ком­па­ния Google раз­ра­бо­та­ла тен­зор­ный про­цес­сор — эле­мент ап­па­рат­но­го обес­пе­че­ния, адап­ти­ро­ван­ный под ИИ.

Chip (Russia) - - Содержание -

Ис­кус­ствен­ный ин­тел­лект уже дав­но проч­но во­шел в на­шу жизнь. Ча­ще все­го мы да­же не за­ду­мы­ва­ем­ся над этим во­про­сом, когда при­выч­но поль­зу­ем­ся го­ло­со­вым по­мощ­ни­ком в смарт­фоне или ав­то­ма­ти­че­ским рас­по­зна­ва­ни­ем изоб­ра­же­ний в про­грам­ме. Да­же по­иск Google не об­хо­дит­ся без ма­шин­но­го обу­че­ния, об­ла­сти ис­кус­ствен­но­го ин­тел­лек­та. Уже око­ло двух лет ра­бо­та­ет тех­но­ло­гия под на­зва­ни­ем Rankbrain, ко­то­рая слу­жит для ум­ной сор­ти­ров­ки ре­зуль­та­тов по­ис­ка. Око­ло 15% еже­днев­ных за­про­сов яв­ля­ют­ся но­вы­ми для Google, то есть до это­го они не фор­му­ли­ро­ва­лись ни од­ним поль­зо­ва­те­лем. Ал­го­рит­мы Rankbrain ищут име­ю­щи­е­ся фор­мы в неиз­вест­ных по­ис­ко­вых за­про­сах и увя­зы­ва­ют их с се­ман­ти­че­ски схо­жи­ми по­ня­ти­я­ми. В ито­ге по­ис­ко­вая си­сте­ма долж­на самостоятельно обу­чать­ся и иметь воз­мож­ность да­вать со­от­вет­ству­ю­щие ответы на во­про­сы, ко­то­рые ра­нее не за­да­ва­лись. Google ис­поль­зу­ет в сво­их цен­трах об­ра­бот­ки дан­ных спе­ци­аль­но раз­ра­бо­тан­ные для это­го тен­зор­ные про­цес­со­ры — TPU.

Сверх­че­ло­ве­че­ский ин­тел­лект

Свое на­зва­ние про­цес­со­ры по­лу­чи­ли от библиотеки про­грамм­но­го обес­пе­че­ния Tensorflow. Ос­нов­ное пред­на­зна­че­ние TPU со­сто­ит в уско­ре­нии ал­го­рит­мов ис­кус­ствен­но­го ин­тел­лек­та, ко­то­рые де­ла­ют став­ку на библиотеки сво­бод­но­го про­грамм­но­го обес­пе­че­ния. Из­на­чаль­но TPU об­ре­ли по­пу­ляр­ность в ка­че­стве ап­па­рат­ной плат­фор­мы для Alphago — ис­кус­ствен­но­го ин­тел­лек­та, ко­то­рый по­бе­дил луч­ших в ми­ре игроков в ази­ат­скую иг­ру го. В от­ли­чие от шах­мат, раз­ра­бот­ка про­грамм­но­го обес­пе­че­ния для го на про­фес­си­о­наль­ном уровне на про­тя­же­нии мно­гих лет счи­та­лась невоз­мож­ной. По­сле­ду­ю­щая раз­ра­бот­ка Alphago Zero смог­ла самостоятельно обу­чить­ся иг­ре на ос­но­ве за­дан­ных ей пра­вил. Че­рез три дня она до­стиг­ла про­фес­си­о­наль­но­го уров­ня, че­рез три неде­ли — догнала пред­ше­ству­ю­щую вер­сию Alphago, обу­че­ние ко­то­рой сто­и­ло гро­мад­ных уси­лий и по­тре­бо­ва­ло про­ве­де­ния мил­ли­о­нов про­фес­си­о­наль­ных пар­тий. Вы­яс­ни­лось, что ис­кус­ствен­ный ин­тел­лект ра­нее огра­ни­чи­вал изу­че­ние хо­дов со сто­ро­ны че­ло­ве­ка. Еще че­рез шесть недель Alphago Zero уже невоз­мож­но бы­ло обыг­рать.

Уско­ри­тель для ней­рон­ных се­тей

По срав­не­нию с обыч­ны­ми про­цес­со­ра­ми тен­зор­ные спе­ци­а­ли­зи­ру­ют­ся на ис­поль­зо­ва­нии ис­кус­ствен­ных ней­рон­ных се­тей. Они со­сто­ят из мно­же­ства свя­зан­ных в сеть ма­те­ма­ти­че­ских функ­ций, ко­то­рые ими­ти­ру­ют че­ло­ве­че­ский мозг с его нерв­ны­ми клет­ка­ми и их свя­зя­ми. По­доб­но на­ше­му моз­гу, ней­рон­ная сеть тре­бу­ет со­от­вет­ству­ю­ще­го вво­да. Про­ис­хо­дит обу­че­ние, к при­ме­ру, рас­по­зна­ва­нию ре­чи, изоб­ра­же­ний — или пра­ви­лам иг­ры го.

Искус­ствен­ная ней­рон­ная сеть вклю­ча­ет несколь­ко уров­ней ней­ро­нов. Каж­дый ней­рон ис­поль­зу­ет взве­шен­ную сум­му вы­ход­ных зна­че­ний свя­зан­ных ней­ро­нов в предыдущем уровне. Пра­виль­ная срав­ни­тель­ная оцен­ка — ключ к успе­ху в Machine Learning, но ее сна­ча­ла надо сде­лать, что на прак­ти­ке ча­сто озна­ча­ет мно­же­ствен­ные опе­ра­ции с пла­ва­ю­щей точ­кой. В этой дис­ци­плине луч­шим вы­бо­ром на са­мом де­ле яв­ля­ют­ся гра­фи­че­ские про­цес­со­ры. Что­бы по­том от­сор­ти­ро­вать ре­зуль­та­ты по­ис­ка или преду­га­дать хо­ды, ней­рон­ной се­ти боль­ше не нуж­на вы­со­кая точ­ность вы­чис­ле­ний с пла­ва­ю­щей за­пя­той. Этот про­цесс тре­бу­ет вы­пол­не­ния очень боль­шо­го ко­ли­че­ства опе­ра­ций умно­же­ния и сло­же­ния це­лых чи­сел.

Тен­зор­ный про­цес­сор Google со­сто­ит в ос­нов­ном из вы­чис­ли­тель­но­го бло­ка, мат­ри­цы 256x256 еди­ниц. Он ра­бо­та­ет с вось­ми­бит­ны­ми це­лы­ми чис­ла­ми, до­сти­га­ет вы­чис­ли­тель­ной мощ­но­сти, со­став­ля­ю­щей 92 трил­ли­о­на опе­ра­ций в се­кун­ду, и хра­нит ре­зуль­та­ты в па­мя­ти. На диа­грам­ме по­ка­за­но, что мат­ри­ца за­ни­ма­ет лишь око­ло чет­вер­ти пло­ща­ди про­цес­со­ра. Осталь­ные ком­по­нен­ты от­ве­ча­ют за по­сто­ян­ное обес­пе­че­ние ядер но­вы­ми дан­ны­ми. Ко­ман­ды тен­зор­ные про­цес­со­ры са­ми се­бе не по­да­ют — они по­сту­па­ют с под­клю­чен­но­го сер­ве­ра че­рез PCI Express. Этим же пу­тем пе­ре­да­ют­ся в от­вет и ко­неч­ные ре­зуль­та­ты. Срав­ни­тель­ные оцен­ки, необ­хо­ди­мые для вы­чис­ле­ний ней­рон­ной се­ти, поставляет мо­дуль па­мя­ти FirstIn/first-out. Так как там ма­ло что ме­ня­ет­ся для кон­крет­но­го при­ло­же­ния, до­ста­точ­но под­клю­че­ния че­рез опе­ра­тив­ную па­мять DDR3. Про­ме­жу­точ­ные ре­зуль­та­ты по­ме­ща­ют­ся в бу­фер­ный на­ко­пи­тель объ­е­мом 24 Мбайт и сно­ва по­сту­па­ют в вы­чис­ли­тель­ный блок.

В 45 раз быст­рее обыч­но­го про­цес­со­ра

Хо­тя на­бор ко­манд CISC (ан­гл. Complex Instruction Set Computer — «ком­пью­тер с пол­ным на­бо­ром ко­манд») тен­зор­но­го про­цес­со­ра и мо­жет от­ра­бо­тать слож­ные ко­ман­ды, их су­ще­ству­ет все­го око­ло де­сят­ка. И для боль­шин­ства необ­хо­ди­мых опе­ра­ций тре­бу­ет­ся толь­ко пять ко­манд, в том чис­ле ко­ман­ды чте­ния, вы­пол­не­ния умно­же­ния мат­ри­цы или вы­чис­ле­ния функ­ции ак­ти­ва­ции. За счет оп­ти­ми­за­ции вы­чис­ле­ний ис­кус­ствен­но­го ин­тел­лек­та тен­зор­ные про­цес­со­ры ока­зы­ва­ют­ся зна­чи­тель­но быст­рее обыч­ных про­цес­со­ров (в 45 раз) или гра­фи­че­ских про­цес­со­ров (в 17 раз). В то же вре­мя они ра­бо­та­ют с большей энер­го­эф­фек­тив­но­стью. И Google при этом на­хо­дит­ся лишь в на­ча­ле пу­ти: с по­мо­щью про­стых мер про­из­во­ди­тель­ность тен­зор­ных про­цес­со­ров мож­но уве­ли­чи­вать и даль­ше. Од­на толь­ко уста­нов­ка опе­ра­тив­ной па­мя­ти GDDR5 мо­жет утро­ить ны­неш­нюю вы­чис­ли­тель­ную мощ­ность.

Newspapers in Russian

Newspapers from Russia

© PressReader. All rights reserved.