Машинное обу­че­ние: про­гно­зи­ро­ва­ние рис­ков гос­за­ку­пок

Otkrytye sistemy. SUBD. - - СОДЕРЖАНИЕ - Дмит­рий Ели­се­ев, Дмит­рий Ро­ма­нов

На при­об­ре­те­ние то­ва­ров и услуг че­рез си­сте­му го­су­дар­ствен­ных за­ку­пок еже­год­но рас­хо­ду­ют­ся трил­ли­о­ны руб­лей. Эф­фек­тив­ный кон­троль в этой об­ла­сти мо­жет быть, в част­но­сти, обес­пе­чен пу­тем ав­то­ма­ти­зи­ро­ван­ной оцен­ки рис­ко­ван­но­сти гос­кон­трак­тов ме­то­да­ми ма­шин­но­го обу­че­ния.

На при­об­ре­те­ние то­ва­ров и услуг че­рез си­сте­му го­су­дар­ствен­ных за­ку­пок еже­год­но рас­хо­ду­ют­ся трил­ли­о­ны руб­лей. Эф­фек­тив­ный кон­троль в этой об­ла­сти мо­жет быть, в част­но­сти, обес­пе­чен пу­тем ав­то­ма­ти­зи­ро­ван­ной оцен­ки рис­ко­ван­но­сти гос­кон­трак­тов ме­то­да­ми ма­шин­но­го обу­че­ния. Клю­че­вые сло­ва: машинное обу­че­ние, клас­си­фи­ка­ция, гос­за­куп­ки Keyworsds: machine learning, government procurement, classification

Си­сте­ма го­су­дар­ствен­ных за­ку­пок со­зда­на со­глас­но Ука­зу Пре­зи­ден­та РФ от 7 ав­гу­ста 1992 го­да № 826 «О ме­рах по фор­ми­ро­ва­нию Фе­де­раль­ной кон­тракт­ной си­сте­мы» и пе­ре­жи­ла че­ты­ре эта­па раз­ви­тия: 1992–1997 го­ды — ста­нов­ле­ние си­сте­мы гос­за­ку­пок на ос­но­ве ле­ги­ти­ма­ции ис­ход­ных фор­маль­ных ин­сти­ту­тов; 1998–2006 го­ды — пе­ре­ход к обя­за­тель­но­му ис­поль­зо­ва­нию ры­ноч­но­го ме­ха­низ­ма го­су­дар­ствен­ных за­ку­пок; 2006–2013 го­ды — ав­то­ма­ти­за­ция си­сте­мы го­су­дар­ствен­ных и му­ни­ци­паль­ных за­ку­пок; с 2014 го­да до на­сто­я­ще­го вре­ме­ни — фор­ми­ро­ва­ние це­лост­но­го за­ку­поч­но­го цик­ла, аг­ре­ги­ру­ю­ще­го все эта­пы за­куп­ки (пла­ни­ро­ва­ние, раз­ме­ще­ние за­куп­ки, за­клю­че­ние го­су­дар­ствен­но­го кон­трак­та и др.) на ба­зе офи­ци­аль­но­го все­рос­сий­ско­го сай­та го­су­дар­ствен­ных за­ку­пок (Еди­ная ин­фор­ма­ци­он­ная си­сте­ма в сфе­ре за­ку­пок, ЕИС, zakupki.gov. ru) [1]. Си­сте­ма гос­за­ку­пок по­сто­ян­но мо­дер­ни­зи­ру­ет­ся как с за­ко­но­да­тель­ной, так и с тех­ни­че­ской точ­ки зре­ния с це­лью по­вы­ше­ния эф­фек­тив­но­сти и ре­зуль­та­тив­но­сти за­ку­пок, обес­пе­че­ния их про­зрач­но­сти, предот­вра­ще­ния каз­но­крад­ства и дру­гих зло­упо­треб­ле­ний.

Ос­нов­ной офи­ци­аль­ный источ­ник дан­ных о го­су­дар­ствен­ных за­куп­ках — пор­тал ЕИС. Он со­дер­жит ин­фор­ма­цию о всех гос­за­куп­ках, ко­то­рые мо­гут осу­ществ­лять­ся в со­от­вет­ствии с за­ко­на­ми 44-ФЗ и 223-ФЗ. Пер­вый ре­гу­ли­ру­ет все де­та­ли про­цес­са за­ку­пок и при­ме­ня­ет­ся к го­су­дар­ствен­ным и му­ни­ци­паль­ным бюд­жет­ным учре­жде­ни­ям, а так­же к боль­шин­ству уни­тар­ных пред­при­я­тий. Вто­рой при­ме­ня­ет­ся к ор­га­ни­за­ци­ям с до­лей уча­стия го­су­дар­ства бо­лее 50%, ком­па­ни­ям, за­ни­ма­ю­щим­ся ре­гу­ли­ру­е­мы­ми ви­да­ми де­я­тель­но­сти (во­до­снаб­же­ние, энер­ге­ти­ка и т. д.), есте­ствен­ным мо­но­по­ли­ям; этот за­кон ре­гла­мен­ти­ру­ет толь­ко ос­нов­ные пра­ви­ла про­ве­де­ния за­ку­пок, а де­та­ли и по­ря­док про­це­дур про­пи­сы­ва­ют­ся ин­ди­ви­ду­аль­но для каж­дой за­куп­ки.

С це­лью ми­ни­ми­за­ции рис­ков осу­ществ­ля­ет­ся мо­ни­то­ринг кон­трак­тов, для че­го на фе­де­раль­ном уровне и в субъ­ек­тах РФ име­ют­ся кон­тро­ли­ру­ю­щие ор­га­ны, вы­пол­ня­ю­щие вы­бо­роч­ные про­вер­ки, од­на­ко, как пра­ви­ло, объ­ект кон­тро­ля (кон­тракт) вы­би­ра­ет­ся слу­чай­ным об­ра­зом, что неэф­фек­тив­но с точ­ки зре­ния над­зо­ра.

Од­но из ре­ше­ний, по­мо­га­ю­щих по­вы­сить ре­зуль­та­тив­ность про­ве­рок, — си­сте­ма СПАРК, на­це­лен­ная на сни­же­ние фи­нан­со­вых и ин­ве­сти­ци­он­ных рис­ков ор­га­ни­за­ций пу­тем пред­став­ле­ния ана­ли­ти­ки по контр­аген­там и оцен­ки их бла­го­на­деж­но­сти. СПАРК аг­ре­ги­ру­ет све­де­ния о ре­ги­стра­ции и струк­ту­ре ком­па­нии, ее фи­нан­со­вую от­чет­ность, мет­ри­ки для оцен­ки кре­дит­ных рис­ков и рис­ка небла­го­на­деж­но­сти, све­де­ния об ауди­тор­ских про­вер­ках, дан­ные по уча­стию в го­су­дар­ствен­ных и ком­мер­че­ских за­куп­ках, ин­фор­ма­цию о про­це­ду­ре банк­рот­ства, су­деб­ных спо­рах и ре­ше­ни­ях ар­бит­раж­ных су­дов и др. Дан­ные со­би­ра­ют­ся из де­сят­ка раз­лич­ных ис­точ­ни­ков, сре­ди ко­то­рых ФНС, Фе­де­раль­ное каз­на­чей­ство, ФССП и др. Функ­ци­о­нал си­сте­мы СПАРК «за­то­чен» под оцен­ку бла­го­на­деж­но­сти ком­па­нии, но не поз­во­ля­ет ве­сти мо­ни­то­ринг го­су­дар­ствен­ных за­ку­пок. Дру­гое ре­ше­ние пред­ла­га­ет ком­па­ния Fintender (fintender. ru/ok), ее си­сте­ма «О контр­аген­те» кон­со­ли­ди­ру­ет все до­ступ­ные дан­ные, но, как и СПАРК, на­це­ле­на на оцен­ку бла­го­на­деж­но­сти по­став­щи­ка, а не рис­ко­ван­но­сти кон­трак­та.

На раз­лич­ных тен­дер­ных плат­фор­мах ра­бо­та­ют соб­ствен­ные про­грамм­ные мо­ду­ли, поз­во­ля­ю­щие по­вы­сить про­зрач­ность за­ку­пок. На­при­мер, элек­трон­ная пло­щад­ка Ртс-тен­дер, на ко­то­рой про­из­во­дят­ся го­су­дар­ствен­ные и му­ни­ци­паль­ные за­куп­ки, име­ет «Мо­дуль ис­пол­не­ния кон­трак­тов», осу­ществ­ля­ю­щий: кон­троль ис­пол­не­ния кон­трак­та в фор­ме элек­трон­но­го пла­на гра­фи­ка ра­бот; ве­де­ние ста­ти­сти­ки и ав­то­ма­ти­че­скую вы­груз­ку дан­ных по ис­пол­не­нию кон­трак­тов по ре­ги­о­нам; предо­став­ле­ние до­сту­па кон­тро­ли­ру­ю­щим ор­га­нам для про­вер­ки и ве­де­ния ста­ти­сти­ки. Ана­ло­гич­ные мо­ду­ли на дру­гих тен­дер­ных пло­щад­ках поз­во­ля­ют упро­стить ра­бо­ту с контр­аген­та­ми и до­ку­мен­та­ци­ей, кос­вен­но умень­шая рис­ки, свя­зан­ные с управ­ле­ни­ем кон­трак­та­ми. Од­на­ко та­кие ре­ше­ния обыч­но предо­став­ля­ют сла­бые ана­ли­ти­че­ские сред­ства оцен­ки рис­ко­ван­но­сти кон­трак­тов ли­бо во­об­ще их не име­ют.

С по­мо­щью ме­то­дов ма­шин­но­го обу­че­ния мож­но по­стро­ить мо­дель клас­си­фи­ка­ции для оцен­ки рис­ко­ван­но­сти кон­трак­тов, ко­то­рая поз­во­лит кон­тро­ли­ру­ю­щим ор­га­нам про­ве­рять наи­ме­нее на­деж­ные кон­трак­ты, что, в от­ли­чие от слу­чай­ной

вы­бор­ки, мо­жет по­вы­сить эф­фек­тив­ность про­це­дур кон­тро­ля про­цес­са гос­за­ку­пок. При по­стро­е­нии мо­де­ли за ос­но­ву бы­ли взя­ты за­куп­ки, вы­пол­нен­ные в со­от­вет­ствии с 44-ФЗ, — дан­ные здесь по­тен­ци­аль­но бо­лее од­но­род­ны, чем в слу­чае 223-ФЗ, и име­ет­ся боль­ше воз­мож­но­стей для по­лу­че­ния до­сто­вер­ных ре­зуль­та­тов на неболь­шой вы­бор­ке. На вы­хо­де пред­по­ла­га­лось по­лу­чить мо­дель, спо­соб­ную клас­си­фи­ци­ро­вать кон­трак­ты с точ­но­стью бо­лее 90%, а так­же вы­де­лить клю­че­вые при­зна­ки, опре­де­ля­ю­щие тот или иной ис­ход.

Для про­вер­ки пред­ла­га­е­мо­го под­хо­да из за­пи­сей ЕИС бы­ла сфор­ми­ро­ва­на вы­бор­ка, вклю­ча­ю­щая 11926 кон­трак­тов для Яро­слав­ской об­ла­сти. На эта­пе сбо­ра дан­ных на ба­зе экс­перт­ных оце­нок бы­ло вы­де­ле­но 18 при­зна­ков, опи­сы­ва­ю­щих кон­тракт, по­став­щи­ка и за­каз­чи­ка (рис. 1).

На эта­пе пред­ва­ри­тель­ной об­ра­бот­ки из рас­смот­ре­ния бы­ли уда­ле­ны на­блю­де­ния, при­зна­ки ко­то­рых со­дер­жа­ли пу­стые зна­че­ния, вы­зван­ные на­ли­чи­ем оши­бок в ба­зе ЕИС. В ре­зуль­та­те раз­мер вы­бор­ки со­кра­тил­ся до 11 907 объ­ек­тов. За­тем бы­ла про­из­ве­де­на об­ра­бот­ка но­ми­наль­ных неби­нар­ных пе­ре­мен­ных. Пе­ре­мен­ная «сфе­ра кон­трак­та», опи­сы­ва­е­мая ОКПД2 (Об­ще­рос­сий­ский клас­си­фи­ка­тор про­дук­ции по ви­дам эко­но­ми­че­ской де­я­тель­но­сти, tender-rus.ru/okpd), на­счи­ты­ва­ет бо­лее 600 зна­че­ний. Бы­ли пред­при­ня­ты два ша­га: во-пер­вых, ее зна­че­ния бы­ли за­ме­не­ны пер­вы­ми дву­мя сим­во­ла­ми ОКПД2 (класс про­дук­ции), что поз­во­ли­ло умень­шить ко­ли­че­ство уни­каль­ных зна­че­ний до 64. Во-вто­рых, все зна­че­ния, встре­ча­ю­щи­е­ся ре­же чем в 5% слу­ча­ях, бы­ли сгруп­пи­ро­ва­ны. Ана­ло­гич­ный при­ем был при­ме­нен и к пе­ре­мен­ной «тип ор­га­ни­за­ции» за­каз­чи­ка. Та­ким об­ра­зом, ко­ли­че­ство зна­че­ний для пе­ре­мен­ных «сфе­ра кон­трак­та» и «тип ор­га­ни­за­ции» за­каз­чи­ка со­кра­ти­лось до трех (неука­зан­ное зна­че­ние, ис­кус­ствен­ный класс для груп­пи­ров­ки, пи­ще­вые про­дук­ты) и че­ты­рех (неука­зан­ное зна­че­ние, ООО, ис­кус­ствен­ный класс для груп­пи­ров­ки, ЗАО) со­от­вет­ствен­но. За­тем ко всем но­ми­наль­ным неби­нар­ным пе­ре­мен­ным был при­ме­нен ме­тод фик­тив­но­го ко­ди­ро­ва­ния (dummy encoding), по­сколь­ку боль­шин­ство ал­го­рит­мов ма­шин­но­го обу­че­ния не уме­ют ра­бо­тать с ни­ми непо­сред­ствен­но с ка­те­го­ри­аль­ны­ми пе­ре­мен­ны­ми. Фик­тив­ное ко­ди­ро­ва­ние вме­сто ис­ход­но­го при­зна­ка со­зда­ет N-1 пе­ре­мен­ную, где N — ко­ли­че­ство уни­каль­ных зна­че­ний при­зна­ка. Ито­го, ко­ли­че­ство ат­ри­бу­тов в мо­де­ли бы­ло уве­ли­че­но до 25. У та­ких пе­ре­мен­ных, как «ко­ли­че­ство за­вер­шен­ных кон­трак­тов», «сред­няя сум­ма кон­трак­та», «ко­ли­че­ство за­ка­зов», «це­на кон­трак­та» и «на­чаль­ная мак­си­маль­ная оцен­ка кон­трак­та», бы­ли об­ра­бо­та­ны вы­бро­сы, за­тем зна­че­ния пе­ре­мен­ных бы­ли ло­га­риф­ми­ро­ва­ны и стан­дар­ти­зи­ро­ва­ны.

Для ре­ше­ния за­да­чи оцен­ки рис­ка обыч­но при­ме­ня­ют ал­го­рит­мы клас­си­фи­ка­ции, а ве­ро­ят­ность от­не­се­ния на­блю­де­ния к «пло­хо­му» рас­смат­ри­ва­ют как оцен­ку рис­ка. Це­ле­вая би­нар­ная пе­ре­мен­ная мо­жет при­ни­мать зна­че­ния «1» — то есть «хо­ро­ший» кон­тракт, ко­то­рый был успеш­но за­вер­шен или рас­торг­нут по обо­юд­но­му со­гла­сию при ис­пол­не­нии бо­лее 60% обя­за­тельств, и «0» — во всех иных слу­ча­ях, обо­зна­чая «пло­хой» кон­тракт. Раз­рыв кон­трак­та до его за­вер­ше­ния вле­чет до­пол­ни­тель­ные из­держ­ки для за­каз­чи­ка, по­это­му не каж­дый кон­тракт с раз­ры­вом по обо­юд­но­му со­гла­сию яв­ля­ет­ся хо­ро­шим. Ис­пол­не­ние кон­трак­та опре­де­ля­ет­ся от­но­ше­ни­ем вы­пла­чен­ной ис­пол­ни­те­лю сум­мы к об­щей цене кон­трак­та.

За­да­ча оцен­ки рис­ко­ван­но­сти кон­трак­та близ­ка по смыс­лу к за­да­че оцен­ки бла­го­на­деж­но­сти за­ем­щи­ков бан­ка, для ко­то­рой су­ще­ству­ет про­ра­бо­тан­ная тео­ре­ти­че­ская и прак­ти­че­ская ба­за. По­это­му для мо­де­ли оцен­ки за­ку­пок при­год­ны ал­го­рит­мы, при­ме­ня­е­мые для ре­ше­ния за­да­чи кре­дит­но­го ско­рин­га: ло­ги­сти­че­ская ре­грес­сия, ма­ши­на опор­ных век­то­ров c гаус­со­вым яд­ром RBF (Gaussian RBF kernel), клас­си­че­ский гра­ди­ент­ный бу­стинг и ал­го­ритм гра­ди­ент­но­го бу­стин­га Catboost (tech.yandex.ru/catboost) [2–4]. Пер­вые три ча­сто при­ме­ня­ют­ся для оцен­ки за­ем­щи­ка, а их ком­по­зи­ция поз­во­ля­ет опи­сы­вать ши­ро­кий класс за­ко­но­мер­но­стей и вос­ста­нав­ли­вать слож­ные нели­ней­ные за­ви­си­мо­сти, с ко­то­ры­ми не мо­жет спра­вить­ся оди­ноч­ный ал­го­ритм [2]. Мо­де­ли на гра­ди­ент­ном бу­стин­ге (Xgboost, Lightgbm, Catboost) по­беж­да­ют в со­рев­но­ва­ни­ях по ма­шин­но­му обу­че­нию и ча­сто ис­поль­зу­ют­ся на прак­ти­ке и в ис­сле­до­ва­ни­ях. Сре­ди них мож­но вы­де­лить Catboost, ко­то­рый от­ли­ча­ет­ся от клас­си­че­ско­го гра­ди­ент­но­го бу­стин­га на­ли­чи­ем встро­ен­ной об­ра­бот­ки ка­те­го­ри­аль­ных пе­ре­мен­ных. Обу­че­ние пер­вых трех ал­го­рит­мов про­во­ди­лось на вы­бор­ке с осу­ществ­ле­ни­ем пол­ной пре­до­б­ра­бот­ки ка­те­го­ри­аль­ных пе­ре­мен­ных, а для обу­че­ния Catboost груп­пи­ров­ка зна­че­ний и фик­тив­ное ко­ди­ро­ва­ние ка­те­го­ри­аль­ных пе­ре­мен­ных не про­из­во­ди­лись. Все ал­го­рит­мы бы­ли обу­че­ны на сба­лан­си­ро­ван­ной вы­бор­ке с со­от­но­ше­ни­ем «пло­хих» и «хо­ро­ших» кон­трак­тов 1:1.

Для те­сти­ро­ва­ния ка­че­ства мо­де­ли ис­поль­зо­ва­лись де­ся­ти­крат­ная пе­ре­крест­ная про­вер­ка на пол­ной вы­бор­ке до под­бо­ра па­ра­мет­ров ал­го­рит­ма (Т1), а так­же

под­бор па­ра­мет­ров мо­де­ли во вре­мя де­ся­ти­крат­ной пе­ре­крест­ной про­вер­ки с по­сле­ду­ю­щим те­сти­ро­ва­ни­ем на ва­ли­да­ци­он­ной вы­бор­ке, со­став­ля­ю­щей 20% от всей вы­бор­ки (Т2).

В табл. 1 при­ве­де­ны ре­зуль­та­ты обу­че­ния мо­де­лей по че­ты­рем ал­го­рит­мам в раз­ре­зе трех па­ра­мет­ров: точ­ность (Acc), пол­но­та «пло­хо­го» (Rec0) и «хо­ро­ше­го» (Rec1) клас­сов.

Ал­го­ритм гра­ди­ент­но­го бу­стин­га Catboost по­ка­зал наи­луч­шую точ­ность как до под­бо­ра па­ра­мет­ров, так и по­сле, а при­рост в точ­но­сти по­сле под­бо­ра па­ра­мет­ров со­ста­вил все­го 0,2%. Для мо­де­ли Catboost бы­ло по­стро­е­но рас­пре­де­ле­ние кон­трак­тов по пред­ска­зы­ва­е­мой для нее ве­ро­ят­но­сти от­не­се­ния кон­трак­тов к груп­пе «пло­хих» (рис. 2). Вид­но, что ос­нов­ная часть «хо­ро­ших» кон­трак­тов скап­ли­ва­ет­ся в ле­вой по­ло­вине кри­вой, а пре­иму­ще­ствен­ная часть пло­хих — спра­ва. Это по­ка­зы­ва­ет, что по­стро­ен­ный клас­си­фи­ка­тор име­ет не толь­ко вы­со­кую точ­ность клас­си­фи­ка­ции кон­трак­тов, но и яв­ля­ет­ся хо­ро­шей ве­ро­ят­ност­ной мо­де­лью для оцен­ки кон­тракт­ных рис­ков.

Стан­дарт­ны­ми ме­то­да­ми оце­нить важ­ность при­зна­ков для ма­ши­ны опор­ных век­то­ров нель­зя, по­это­му этот ал­го­ритм был ис­клю­чен. В табл. 2 при­ве­де­ны пять наи­бо­лее важ­ных пе­ре­мен­ных для по­стро­ен­ных мо­де­лей на ба­зе ло­ги­сти­че­ской ре­грес­сии и клас­си­че­ско­го гра­ди­ент­но­го бу­стин­га.

Наи­бо­лее зна­чи­мы­ми пе­ре­мен­ны­ми, вли­я­ю­щи­ми на ре­зуль­тат ис­пол­не­ния кон­трак­та, яв­ля­ют­ся: опыт по­став­щи­ка; тип ор­га­ни­за­ции за­каз­чи­ка; сред­няя це­на кон­трак­та; тип ор­га­ни­за­ции по­став­щи­ка; опыт вы­пол­не­ния про­филь­ных кон­трак­тов. Имен­но эти пе­ре­мен­ные сле­ду­ет учи­ты­вать преж­де все­го при оцен­ке рис­ко­ван­но­сти кон­трак­та.

Не­смот­ря на до­сти­же­ние хо­ро­ше­го ре­зуль­та­та, при раз­ра­бот­ке мо­де­ли ав­то­ма­ти­че­ской оцен­ки рис­ко­ван­но­сти кон­трак­тов оста­ет­ся еще по­ле для даль­ней­ше­го ис­сле­до­ва­ния. В част­но­сти, мож­но уве­ли­чить вы­бор­ку и из­вле­кать до­пол­ни­тель­ные при­зна­ки, а по­сле уве­ли­че­ния вы­бор­ки име­ет смысл при­ме­нить бо­лее слож­ные ал­го­рит­мы. Кро­ме то­го, в пер­спек­ти­ве пла­ни­ру­ет­ся раз­ра­бо­тать мо­дель ав­то­ма­ти­че­ской оцен­ки рис­ко­ван­но­сти кон­трак­та для за­ку­пок, про­во­ди­мых в со­от­вет­ствии с 223-ФЗ. В сфе­ре гос­за­ку­пок об­ра­ща­ют­ся огром­ные де­неж­ные сред­ства, по­это­му се­год­ня при­кла­ды­ва­ют­ся боль­шие уси­лия для мо­ни­то­рин­га про­цес­са вы­пол­не­ния кон­трак­та — свое­вре­мен­ное управ­ле­ние рис­ка­ми по­мо­жет сэко­но­мить мил­ли­ар­ды руб­лей. По­стро­ен­ная мо­дель ав­то­ма­ти­зи­ро­ван­ной оцен­ки рис­ко­ван­но­сти го­су­дар­ствен­ных кон­трак­тов на ба­зе ал­го­рит­мов ма­шин­но­го обу­че­ния име­ет точ­ность 94,6%, и ее при­ме­не­ние мо­жет по­вы­сить эф­фек­тив­ность го­су­дар­ствен­ных за­ку­пок, а сле­до­ва­тель­но, и оп­ти­ми­зи­ро­вать бюд­жет­ные рас­хо­ды.

ЛИ­ТЕ­РА­ТУ­РА

1. Бе­ло­кры­ло­ва О. Ин­сти­ту­ци­о­наль­ная мо­дер­ни­за­ция си­сте­мы гос­за­ку­пок: зо­на рис­ка // Го­су­дар­ствен­ное и му­ни­ци­паль­ное управ­ле­ние. Уче­ные за­пис­ки СКАГС. — 2016. — № 4. — C. 21–29.

2. Вик­тор Ки­тов. Прак­ти­че­ские ас­пек­ты ма­шин­но­го обу­че­ния // Окры­тые си­сте­мы.субд. — 2016. — № 1. — С. 14–17. URL: https://www.osp.ru/os/2016/01/13048648/ (да­та об­ра­ще­ния: 23.04.2018).

3. Henly D., Hand W. Statistical Classification Methods in Consumer Credit Scoring: a Review // Royal Statistical Society. — 1997. — № 3 (160). — P. 523–541.

4. Huang C., Chen M., Wang C. Credit scoring with a data mining approach based on support vector machines // Expert Systems with Applications. — 2007. — № 33. — P. 847–856.

Рис. 1. Сфор­ми­ро­ван­ные при­зна­ки кон­трак­тов (FLOAT — ве­ще­ствен­ное зна­че­ние; INT — це­лое зна­че­ние; BOOL — 1 или 0); тип пе­ре­мен­ной (К — ко­ли­че­ствен­ная, Н — но­ми­наль­ная, НБ — би­нар­ная но­ми­наль­ная); НМЦК — на­чаль­ная (мак­си­маль­ная) це­на кон­трак­та

Рис. 2. Рас­пре­де­ле­ние кон­трак­тов по пред­ска­зы­ва­е­мой ве­ли­чине пло­хо­го ис­хо­да

Та­б­ли­ца 2. Клю­че­вые пе­ре­мен­ные для трех мо­де­лей

Та­б­ли­ца 1. Ре­зуль­та­ты обу­че­ния ал­го­рит­мов

Newspapers in Russian

Newspapers from Russia

© PressReader. All rights reserved.