Как биз­не­су из­вле­кать поль­зу из боль­ших дан­ных

Vedomosti - - КАРЬЕРА & МЕНЕДЖМЕНТ - * Де­нис Афа­на­сьев

Рас­ту­щий объ­ем ин­фор­ма­ции и од­но­вре­мен­ное уде­шев­ле­ние вы­чис­ле­ний и хра­не­ния дан­ных по­ро­ди­ли по­ня­тие боль­ших дан­ных (big data). Речь идет не только о круп­ных мас­си­вах дан­ных, но и о дан­ных, ко­то­рые об­ра­ба­ты­ва­ют­ся с вы­со­кой ско­ро­стью ли­бо об­ла­да­ют силь­ной ва­ри­а­тив­но­стью. Ва­ши биз­нес-про­цес­сы об­слу­жи­ва­ет ка­кая-ли­бо ин­фор­ма­ци­он­ная си­сте­ма, на­при­мер CRM. Или же у вас есть сайт, ра­бо­та­ет приложение для смарт­фо­нов, а че­рез элек­трон­ную по­чту, мес­сен­дже­ры, те­ле­фон в ва­шу служ­бу под­держ­ки по­сту­па­ют об­ра­ще­ния от кли­ен­тов. Это озна­ча­ет, что у вас уже есть дан­ные, ко­то­рые, на­ко­пив в до­ста­точ­ном объ­е­ме, мож­но ана­ли­зи­ро­вать. Ка­кие же дан­ные мо­гут при­не­сти биз­не­су поль­зу?

Тран­зак­ци­он­ные дан­ные – те дан­ные, ко­то­рые ис­то­ри­че­ски хра­нят­ся в учет­ных си­сте­мах и ре­ля­ци­он­ных клас­си­че­ских ба­зах дан­ных. Это дан­ные о тран­зак­ци­ях, про­да­жах, склад­ских остат­ках, из­ме­не­ни­ях фи­нан­со­во­го со­сто­я­ния ком­па­нии. Они наи­бо­лее уяз­ви­мы к угро­зам без­опас­но­сти и требуют со­блю­де­ния кон­фи­ден­ци­аль­но­сти. Из­на­чаль­но It-ин­ду­стрия бы­ла на­це­ле­на на ра­бо­ту имен­но с этим ти­пом дан­ных, ре­шая во­про­сы це­лост­но­сти, со­хран­но­сти, ко­пи­ро­ва­ния и за­щи­ты. Объ­ем дан­ных мо­жет быть не очень ве­лик, но из-за то­го, что эти дан­ные ско­пи­лись в про­цес­се раз­ви­тия биз­не­са и от­ра­жа­ют всю хо­зяй­ствен­ную де­я­тель­ность, они в первую оче­редь ис­поль­зу­ют­ся в ана­ли­ти­че­ских за­да­чах.

Жур­на­лы дей­ствий поль­зо­ва­те­ля (веб-ло­ги). Это дан­ные, ге­не­ри­ру­е­мые раз­лич­ны­ми сен­со­ра­ми, дат­чи­ка­ми It-си­стем, сер­ве­ра­ми, а так­же си­сте­ма­ми ста­ти­сти­ки веб-сай­тов и мо­биль­ных при­ло­же­ний. Ге­не­ра­ция веб-ло­гов про­ис­хо­дит быст­ро, и та­ких дан­ных мно­го. Ис­то­ри­че­ски эти дан­ные не об­ра­ба­ты­ва­лись, но сей­час бла­го­да­ря про­ник­но­ве­нию циф­ро­вых тех­но­ло­гий они по­все­мест­но ис­поль­зу­ют­ся в ана­ли­ти­че­ских за­да­чах.

Раз­лич­ные дан­ные из соц­се­тей, ча­тов, циф­ро­вых ка­на­лов ком­му­ни­ка­ций, интернета ве­щей (т. е. дан­ные с раз­лич­ных дат­чи­ков).

Ау­дио- и ви­део­дан­ные. Как пра­ви­ло, они сла­бо струк­ту­ри­ро­ва­ны и по­то­му с тру­дом под­да­ют­ся ана­ли­зу, од­на­ко об­ла­да­ют боль­шой цен­но­стью. На­при­мер, ви­део с ка­мер в аэро­пор­ту мож­но ис­поль­зо­вать для предот­вра­ще­ния тер­ро­ри­сти­че­ских ак­тов и дру­гих чрез­вы­чай­ных си­ту­а­ций, мож­но так­же про­ана­ли­зи­ро­вать по­ве­де­ние пас­са­жи­ров для улуч­ше­ния эр­го­но­ми­ки круп­ных транс­порт­ных уз­лов. Ме­то­ды ана­ли­за боль­ших дан­ных ос­но­ва­ны на по­стро­е­нии ав­то­ма­ти­зи­ро­ван­ных ана­ли­ти­че­ских мо­де­лей – ма­шин­ном обу­че­нии. С его помощью фор­ми­ру­ют­ся ал­го­рит­мы, ко­то­рые на­хо­дят скры­тые вза­и­мо­свя­зи, обу­ча­ют­ся, по­мо­га­ют стро­ить про­гно­зы, оп­ти­ми­зи­ру­ют раз­лич­ные биз­нес-про­цес­сы. Та­ким об­ра­зом мож­но от­ра­бо­тать го­раз­до боль­шее ко­ли­че­ство ги­по­тез, чем в со­сто­я­нии сде­лать че­ло­век. Мо­дель ана­ли­за дан­ных за­ви­сит от об­ла­сти при­ме­не­ния. Вот при­ме­ры.

Сеть Walmart, на­счи­ты­ва­ю­щая бо­лее 11 000 ма­га­зи­нов, име­ет ана­ли­ти­че­скую си­сте­му Data Café, об­ра­ба­ты­ва­ю­щую око­ло 24 000 за­про­сов в час от 1000 спе­ци­а­ли­стов ри­тей­ле­ра. Их за­да­ча – от­сле­жи­вать си­ту­а­цию в ма­га­зи­нах в ре­жи­ме ре­аль­но­го вре­ме­ни и быст­ро вли­ять на нее, в част­но­сти, опе­ра­тив­но кор­рек­ти­ро­вать це­ны в со­от­вет­ствии с ме­ня­ю­щим­ся по­ве­де­ни­ем кли­ен­тов. Кро­ме то­го, ком­па­ния Walmart од­ной из первых осна­сти­ла дат­чи­ка­ми ма­ши­ны, пе­ре­во­зя­щие гру­зы, и в ре­зуль­та­те ста­ла по­лу­чать всю ин­фор­ма­цию о дви­же­нии ав­то­пар­ка в ре­жи­ме ре­аль­но­го вре­ме­ни. Это поз­во­ли­ло ри­тей­ле­ру оп­ти­ми­зи­ро­вать по­став­ки и всю ло­ги­сти­ку.

Ги­пер­мар­кет ме­бе­ли и то­ва­ров для до­ма Hoff со­би­ра­ет дан­ные о по­ку­па­те­ле: о его по­куп­ках, дей­стви­ях на сай­те и др. Эта ин­фор­ма­ция ис­поль­зу­ет­ся для фор­ми­ро­ва­ния пер­со­наль­ных пред­ло­же­ний кли­ен­ту, на­чи­ная от ак­ций ко дню рож­де­ния до тар­ге­ти­ро­ван­ных пред­ло­же­ний на ос­но­ве ана­ли­за покупок и по­ве­де­ния на сай­те. В ло­ги­сти­ке ана­лиз по­сту­па­ю­щих от ав­то­пар­ка дан­ных по­мо­га­ет оп­ти­ми­зи­ро­вать про­цес­сы до­став­ки, в ме­ди­цине боль­шие дан­ные при­ме­ня­ют для опре­де­ле­ния оп­ти­маль­но­го со­ста­ва и до­зи­ров­ки ле­карств, в авиа­пе­ре­воз­ках – для про­фи­лак­ти­ки обо­ру­до­ва­ния и пре­ду­пре­жде­ния тех­ни­че­ских сбо­ев, в про­из­вод­стве – для мо­де­ли­ро­ва­ния усло­вий экс­плу­а­та­ции и те­сти­ро­ва­ния но­вых про­дук­тов, в мар­ке­тин­ге – для пер­со­на­ли­зи­ро­ван­ных ре­клам­ных ком­му­ни­ка­ций. В про­мыш­лен­но­сти тех­но­ло­гии ана­ли­за боль­ших дан­ных поз­во­ля­ют луч­ше от­сле­жи­вать по­ка­за­те­ли обо­ру­до­ва­ния (на ос­но­ве ин­фор­ма­ции с дат­чи­ков). Мно­гие ком­па­нии про­гно­зи­ру­ют по­лом­ку про­мыш­лен­но­го обо­ру­до­ва­ния или опре­де­ля­ют время тех­осмот­ра, про­ана­ли­зи­ро­вав син­хрон­ные дан­ные с раз­ных дат­чи­ков. Но как пра­виль­но по­ста­вить биз­нес­за­да­чу для ана­ли­за боль­ших дан­ных? Воз­мож­ны два под­хо­да.

Свер­ху вниз. В первую оче­редь фор­ми­ру­ет­ся за­да­ча: на­при­мер, ор­га­ни­за­ции нуж­но вы­явить кли­ен­тов, со­би­ра­ю­щих­ся уй­ти, и по­ста­рать­ся их удер­жать. То­гда за­да­ча для ана­ли­ти­ка за­клю­ча­ет­ся в том, что­бы по­стро­ить про­гноз от­то­ка кли­ен­тов. Ана­ли­тик стро­ит раз­лич­ные ги­по­те­зы, изу­ча­ет ис­точ­ни­ки и от­би­ра­ет нуж­ные. Прав­да, обыч­но ана­ли­ти­ку при­хо­дит­ся ис­поль­зо­вать те дан­ные, ко­то­рые есть, и изу­чать, на­сколь­ко они по­мо­га­ют ре­шить кон­крет­ную за­да­чу.

Снизу вверх. Аль­тер­на­тив­ный под­ход, при ко­то­ром вна­ча­ле изу­ча­ют­ся все дан­ные ис­точ­ни­ка (на­при­мер, сай­та), по­сле че­го стро­ят­ся ги­по­те­зы для по­сле­ду­ю­щей про­вер­ки. На­при­мер, дан­ные об ак­тив­но­сти по­се­ти­те­лей на сай­те лег­ко при­ме­нить для ана­ли­за от­то­ка кли­ен­тов и вы­яв­ле­ния об­щих черт аудитории, склон­ной по­ки­нуть ком­па­нию. Да­лее мож­но об­ра­тить вни­ма­ние на про­дук­ты, ко­то­рые по­се­ти­тель смот­рит на сай­те, что­бы вы­явить его по­тре­би­тель­скую кор­зи­ну для по­сле­ду­ю­щей ра­бо­ты с пе­ре­крест­ны­ми про­да­жа­ми. Уни­вер­саль­ных ал­го­рит­мов изу­че­ния дан­ных не су­ще­ству­ет. Клас­си­фи­ци­ро­вать все дан­ные и со­ста­вить спи­сок, ка­кие дан­ные ка­кой це­ли со­от­вет­ству­ют, по­ка невоз­мож­но. Ана­лиз дан­ных – по­ле для фан­та­зии, нуж­но ду­мать, стро­ить и про­ве­рять ги­по­те­зы с уче­том спе­ци­фи­ки от­рас­ли и ком­па­нии.

* Ав­тор – ге­не­раль­ный ди­рек­тор ком­па­нии Cleverdata (груп­па «Ла­нит»)

Newspapers in Russian

Newspapers from Russia

© PressReader. All rights reserved.