Останнім часом багато держави різко перейнялися проблемою тунеядства. З цим, як відомо, боролися за часів пізнього СРСР, коли при владі був Юрій Андропов. Зараз же історія повторює виток вже в наш час.

У ЗМІ вже не раз дебатировались ініціативи в Білорусі і Росії щодо прийняття «антитунеядского» законодавства, а тепер фахівці з Telenor Group Research, MIT Media Lab, Flowminder Foundation і Стокгольмської школи економіки отримали зручний і досить точний інструмент для вивчення суспільства, який може з високою часткою ймовірності прогнозувати зайнятість населення.

Ця система працює на основі аналізу даних із соціальних мереж і метаданих мереж стільникового зв’язку. Як зазначається, це перше в світі дослідження, яке дозволяє обчислити безробітних на індивідуальному рівні за допомогою глибинного навчання по логам мережі. Причому мова йде про обчислення в тому числі професій.

Дослідники підкреслюють, наскільки важливо мати точну статистику безробітних в суспільстві. Це важливий економічний індикатор для вивчення ринку праці, який допомагає будувати економічні прогнози і управляти економікою. Хоча надлишок вільних трудових ресурсів приємний для роботодавців, але держава зазвичай ставить за мету знизити безробіття нижче певного рівня.

YURBNphFKu8

Зазвичай дізнатися інформацію про безробітних важко, адже далеко не всі люди без офіційного працевлаштування реєструються в органах служби зайнятості. Приміром, в Україні багато чоловіків шукають неофіційну роботу, щоб не потрапити в поле зору військкоматів. Соціальні ж опитування забирають чимало часу і ресурсів, при цьому не даючи чіткої картини.

Суть нового дослідження така: стільникові телефони зараз є навіть у бомжів, тому аналіз метаданих забезпечує практично повне охоплення працездатного населення в багатьох країнах (в цілому мобільники мають понад 50% населення Землі). Про таке охопленні соціологи можуть тільки мріяти. Інженери показали, що метадані мережі забезпечують достатній просторовий охоплення і точність у часі, щоб проводити ефективний дата майнінг.

Дослідниками була застосована модель глибинного навчання на масивному наборі даних, отриманих в одній бідній південноазіатської країні. Для навчання програми використовували результати опитування 200 тисяч чоловік в домогосподарствах, проведеного місцевим оператором стільникового зв’язку. Люди повідомляли про свій статус зайнятості та професії, вибираючи з 18 видів занять.

Також лля глибинного навчання взяли мобільні логи за термін шість місяців у 76 тисяч з вищевказаних 200 тисяч опитаних. Інформацію анонимизировали, програма не мала доступу до номерів телефонів, імена абонентів, змісту розмов і текстових повідомлень. Природно, маючи такий доступ в стилі СОРМ, можна профілювати людей практично зі стовідсотковою точністю. В даному випадку ставилося завдання провести наукове дослідження, не порушуючи права людини.

F6iRavZpwzM

З мобільних логів дослідники виділили змінні трьох типів: фінансові (сума поповнення рахунку, витрати на зв’язок, частота поповнення, співвідношення між максимальною і мінімальною сумою поповнення рахунку та ін), переміщення по місцевості (домашній район/сота, ентропія місць відвідування, радіус інерції перерізу, кількість відвіданих місць та ін) і соціальні функції (кількість розмов з контактом, ентропія контактів, тривалість розмови, кількість SMS, обсяг інтернет-трафіку, кількість MMS, кількість і тривалість відеодзвінків, частота використання додаткових послуг оператора та ін).

Модель з усіма змінними протестували на декількох алгоритмах, в тому числі GBM (gradient boosted machines), RF (random forest), SVM (support vector machines) і kNN (K-nearest сусідів). За підсумком була складена багатошарова нейромережа. Точніше, 18 моделей для кожного виду професії (включаючи безробітних). Навчання і тестування здійснювалися з розподілом даних 75% і 25%.

Як виявилося, нейромережа найкраще визначає офісних працівників (клерків). По використанню мобільного зв’язку вони видають себе з точністю 73,5%. Найскладніше визначити по метаданих мережі кваліфікованих співробітників (61,9%). Середній показник по всіх професійних групах становив 67,5%. Як і офісні працівники, безробітні визначаються теж дуже добре з імовірністю 70,4%.

Таким чином, система досить чітко може спрогнозувати діяльність безробітних і, фактично, виявити їх. При цьому, в країнах, де запровадили або збираються ввести податок на дармоїдів, така нейромережа допоможе поповнювати бюджет. Буде виявляти незареєстрованих безробітних, які переховуються від податкової інспекції. За передбачуваної професії людини можна ще таргетувати рекламу.

Нагадаємо, що раніше ми вже писали, як нейромережа навчили визначати злочинців по особам.