Уче­ные на­шли спо­соб ле­чить рак ней­тро­на­ми

Уче­ные узна­ют воз­раст по по­стам в соц­се­тях

Izvestia - - Первая страница - Дмит­рий Люд­мир­ский

Ин­тел­лек­ту­аль­ную ком­пью­тер­ную мо­дель для ана­ли­за тек­стов, пуб­ли­ку­е­мых в соц­се­тях, со­зда­ли в Кур­ча­тов­ском ин­сти­ту­те. Изу­че­ние на­пи­сан­но­го та­ким спо­со­бом поз­во­ля­ет до­ста­точ­но точ­но опре­де­лить воз­раст ав­то­ра, да­же ес­ли он пы­та­ет­ся его скрыть. Эта ра­бо­та — часть ши­ро­ко­го спек­тра ис­сле­до­ва­ний, ве­ду­щих­ся в Кур­ча­тов­ском ком­плек­се НБИКС-при­ро­до­по­доб­ных тех­но­ло­гий. Ра­нее уче­ные уже раз­ра­бо­та­ли ме­ха­низм опре­де­ле­ния по­ла ав­то­ра. На оче­ре­ди дру­гие со­став­ля­ю­щие ав­тор­ско­го про­фи­ля — об­ра­зо­ва­ние и про­фес­сия.

В на­у­ке сей­час ак­тив­но раз­ви­ва­ет­ся меж­дис­ци­пли­нар­ное на­прав­ле­ние под на­зва­ни­ем «ав­то­ро­ве­де­ние» (authorship profiling). Его пред­ста­ви­те­ли — спе­ци­а­ли­сты по ана­ли­зу дан­ных, линг­ви­сты, пси­хо­ло­ги — пы­та­ют­ся вы­чис­лить ин­ди­ви­ду­аль­но-лич­ност­ные ха­рак­те­ри­сти­ки ав­то­ра тек­ста. Для это­го уче­ные стро­ят ма­те­ма­ти­че­ские мо­де­ли на ос­но­ве кор­ре­ля­ций меж­ду чис­лен­ны­ми зна­че­ни­я­ми раз­лич­ных па­ра­мет­ров тек­ста и ха­рак­те­ри­стик ав­то­ра. Со­здать по­доб­ные мо­де­ли поз­во­ля­ет ма­шин­ный ана­лиз огром­но­го мас­си­ва тек­стов из ин­тер­не­та, снаб­жен­ных от­кры­ты­ми ав­тор­ски­ми про­фи­ля­ми. Но для рус­ско­языч­ных тек­стов это на­прав­ле­ние толь­ко со­зда­ет­ся.

— На­ша за­да­ча — раз­ра­бот­ка ме­то­ди­ки ди­а­гно­сти­ро­ва­ния воз­рас­та участ­ни­ка ин­тер­нет-ком­му­ни­ка­ции на ос­но­ве ана­ли­за ко­ли­че­ствен­ных па­ра­мет­ров его тек­стов, — по­яс­нил ве­ду­щий на­уч­ный со­труд­ник Кур­ча­тов­ско­го ин­сти­ту­та Алек­сандр Сбо­ев.

Раз­ра­бот­ки уче­ных в рам­ках про­ек­та поз­во­лят с вы­со­кой сте­пе­нью до­сто­вер­но­сти опре­де­лить де­мо­гра­фи­че­ские ха­рак­те­ри­сти­ки пи­шу­ще­го, ес­ли он за­ду­ма­ет под­де­лать свою пись­мен­ную речь, что­бы скрыть ис­тин­ный воз­раст.

— Раз­ви­тие ин­тер­нет-ком­му­ни­ка­ций неиз­беж­но со­про­вож­да­ет­ся ро­стом ки­бер­пре­ступ­но­сти, — от­ме­тил на­чаль­ник груп­пы ней­ро­морф­ных ал­го­рит­мов Кур­ча­тов­ско­го ин­сти­ту­та Ро­ман Рыб­ка. — Ин­тер­нет в ка­че­стве сред­ства для по­ис­ка жертв ис­поль­зу­ют мо­шен­ни­ки, лю­ди с рас­строй­ства­ми пси­хи­ки, вер­бов­щи­ки из тер­ро­ри­сти­че­ских ор­га­ни­за­ций.

Ко­неч­но, ки­бер­пре­ступ­ни­ки не за­ин­те­ре­со­ва­ны в рас­про­стра­не­нии дан­ных, ко­то­рые по­мог­ли бы их иден­ти­фи­ци­ро­вать, и в сво­их пер­со­наль­ных про­фи­лях и пе­ре­пис­ке ис­ка­жа­ют све­де­ния о се­бе, по­это­му очень важ­ным клю­чом к ин­фор­ма­ции о них ста­но­вит­ся ана­лиз тек­стов.

В Кур­ча­тов­ском ин­сти­ту­те был раз­ра­бо­тан и про­ана­ли­зи­ро­ван ши­ро­кий круг ма­те­ма­ти­че­ских мо­де­лей, по­стро­ен­ных на мно­же­стве ком­би­на­ций при­зна­ков и ис­поль­зу­ю­щих раз­лич­ные ва­ри­ан­ты обу­че­ния. Соз­дан­ные в ре­зуль­та­те ал­го­рит­мы поз­во­ля­ют с точ­но­стью око­ло 80% опре­де­лить воз­раст­ную груп­пу ав­то­ра, ко­то­рый пы­та­ет­ся вы­гля­деть стар­ше или мо­ло­же сво­их лет.

— Ре­ше­ние за­да­чи опре­де­ле­ния воз­рас­та ав­то­ра тек­ста ста­но­вит­ся все бо­лее ак­ту­аль­ным с ро­стом тра­фи­ка тек­сто­вых со­об­ще­ний в соц­се­тях и на фо­ру­мах, — счи­та­ет Алек­сандр Сбо­ев. — Си­сте­мы на ос­но­ве та­ких ме­то­дов смо­гут ре­шить мно­гие про­бле­мы со­ци­аль­но­го мо­ни­то­рин­га, про­во­дить ана­лиз ак­тив­но­сти раз­лич­ных воз­раст­ных групп граж­дан по ост­ро­со­ци­аль­ным те­мам в Се­ти.

По­лу­чен­ные уче­ны­ми ре­зуль­та­ты по­слу­жат ос­но­вой ра­бо­ты над бо­лее фун­да­мен­таль­ной про­бле­мой — оцен­кой ве­ро­ят­но­сти воз­ник­но­ве­ния со­ци­аль­но опас­ных со­бы­тий, на­при­мер тер­ак­тов.

Ис­сле­до­ва­ния в Кур­ча­тов­ском ин­сти­ту­те ве­дут­ся сов­мест­но с линг­ви­ста­ми Во­ро­неж­ско­го го­су­дар­ствен­но­го пе­да­го­ги­че­ско­го уни­вер­си­те­та. За­ве­ду­ю­щая уни­вер­си­тет­ской ла­бо­ра­то­ри­ей тео­ре­ти­че­ской и при­клад­ной иди­о­лек­то­ло­гии Та­тья­на Лит­ви­но­ва рас­ска­за­ла «Из­ве­сти­ям», что ба­зо­вым линг­ви­сти­че­ским ма­те­ри­а­лом для ис­сле­до­ва­ния по­слу­жил кор­пус бло­гов «Жи­во­го жур­на­ла».

— Этот ре­сурс был вы­бран на­ми по­то­му, что по­сты в ЖЖ, как пра­ви­ло, име­ют боль­ший объ­ем в срав­не­нии с дру­ги­ми элек­трон­ны­ми жан­ра­ми, та­ки­ми как тви­ты или по­сты в Facebook, а так­же из-за то­го, что в ЖЖ пи­шут лю­ди всех воз­мож­ных воз­рас­тов, — от­ме­ти­ла она.

Для со­став­ле­ния кор­пу­са тек­стов уче­ные от­би­ра­ли тех ав­то­ров, ко­то­рые ука­зы­ва­ли воз­раст в про­фи­ле. Ко­неч­но, кто-то из них мо­жет его ис­ка­зить, но ми­ро­вые стан­дар­ты ис­сле­до­ва­ний в об­ла­сти ди­а­гно­сти­ро­ва­ния лич­но­сти ав­то­ра тек­ста, по сло­вам Та­тья­ны Лит­ви­но­вой, ис­хо­дят из то­го, что по­дав­ля­ю­щее боль­шин­ство ав­то­ров ука­зы­ва­ет свой воз­раст в про­фи­ле все-та­ки вер­но.

Раз­ра­бо­тан­ные в хо­де ис­сле­до­ва­ний ме­то­ды и ин­стру­мен­ты при­ме­ни­мы и в си­сте­мах ана­ли­за про­фи­ля ав­то­ра тек­ста при су­деб­но-линг­ви­сти­че­ской экс­пер­ти­зе или фор­ми­ро­ва­нии порт­ре­та ав­то­ра ано­ним­ных пи­сем. Они мо­гут ис­поль­зо­вать­ся в ка­че­стве си­сте­мы опре­де­ле­ния на­ме­рен­но­го ис­ка­же­ния дан­ных в про­фи­лях поль­зо­ва­те­лей или до­пол­ни­тель­но­го ин­стру­мен­та при фор­ми­ро­ва­нии пси­хо­ло­ги­че­ско­го про­фи­ля ав­то­ра. По мне­нию Алек­сандра Сбо­е­ва, пред­ла­га­е­мые под­хо­ды мо­гут най­ти при­ме­не­ние и в си­сте­мах тар­ге­ти­ро­ван­ной ре­кла­мы — для бо­лее точ­но­го опре­де­ле­ния воз­раст­ных групп поль­зо­ва­те­лей.

Newspapers in Russian

Newspapers from Russia

© PressReader. All rights reserved.