Руски програмери против светских педофила

ShutterStock/Legion-Media
Стручњаци руског универзитета „Висока школа економије“ заједно са европским колегама израдили су програм који по чету открива педофиле на интернету.

Стручњаци Националног истраживачког универзитета „Висока школа економије“ (ВШЕ) у Москви су 2011. године заједно са европским научницима направили компјутерски програм за анализу масива неструктурисаних текстова. Софтвер се може користити за решавање различитих проблема, али је најзанимљивија сфера његове примене откривање педофила на интернету.

Данас тај програм успешно примењује полиција Амстердама. Није обелодањен назив програмског пакета, као ни појединости везане за његову примену.

Ко је „педофил“ по мишљењу компјутера?

Програм који су направили руски научници анализира садржај чета и открива честу употребу лексике сексуалног карактера. Тако службеници полиције добијају визуелну представу о везама између учесника у четовању, лексике која је коришћена и могућих дејстава сексуалног карактера. На основу тога криминолози затим изводе закључке.

Програм има најмање шест компонената. Руска компонента врши анализу масива текста на основу формалних појмова (Formal Concept Analysis). Помоћу ње се подаци ређају у такозвани дијаграм решетке појмова, који је визуелно веома прегледан. Сада је та компонента део аутоматизованог система научних истраживања Formal Concept Analysis Research Toolbox (FCART).

„База података са гледишта компјутерског програма формализује појмове као што су ’педофил’, ’злочин’, ’удварање’ или ’лични сусрет’“, објашњава старији научни сарадник Лабораторије софистицираних система и структурне анализе ВШЕ Алексеј Незнанов. „Тако смо ми помогли да се у компјутер пренесу знања експерата за криминалистику, тако да сада по дијаграмима могу визуелно да се дефинишу потребне карактеристике текстова. Раније су криминолози морали да прегледају и анализирају готово све текстове у четовима“.

И преступници користе LOL

Програм може да открије преступника чак и ако он користи различите надимке, и то на основу сличности лексике, анализом различитих чет сесија и редоследа настанка фрагмената текста, као и њихове временске повезаности. На развоју те функције радили су белгијски и холандски научници.

Програмери су морали да узму у обзир особеност четовања на интернету. „Било је неопходно да се у базу података унесу жаргонски називи делова тела и сленг у коме се фрагменти речи замењују цифрама, на пример, цифру 2 која значи „to“, 4 са значењем „for“, а такође стандардне скраћенице у чату као што су LOL и популарне варијанте писања речи са грешкама“, објаснио је Незнанов за „Руску реч“.

Поред тога, постојала је потреба да се осигура безбедност професионалних „причаоница”. „Класичан пример су четови фотографа који разговарају о групним снимцима деце у природи“, каже Алексеј Незнанов. „Специјално за такве случајеве смо морали да прецизирамо појам ’тражења фотографија или видео материјала’, полазећи од тога да фотографи већином свакако нису педофили.

Како открити руског или француског педофила?

Програм је тестиран на масиву текстова америчког друштва за борбу против педофила, као и на едукативном масиву података о стварним злочинима. Софтвер се може користити за чет сесије, али и за друге текстове на интернету, укључујући и социјалне мреже.

Он скенира отворене „причаонице”, али и затворене четове малолетних чланова друштва уз дозволу родитеља. Са затвореним четовима полицајци раде инкогнито, с тим што чет сесије после чувају у полицијским базама података.

У овом тренутку програм може да анализира енглески, холандски и немачки језик. Са другим језицима, укључујући и руски, научници нису радили. По њиховим речима, за руски, француски и неке друге језике засада не постоје доступни софтверски инструменти са довољно квалитетним лингвистичким алгоритмима.

Росијскаја газета. Сва права задржана.