Сотрудники Пермского государственного национального исследовательского университета (ПГНИУ) запатентовали компьютерную программу, которая на основе текстов комментариев в социальных сетях составляет психологический и лингвистический портрет пользователей.
Лингвисты и математики из Перми совместно разработали программу BFI CNN Detector по заказу Минобрнауки России, которая определяет социальные и поведенческие параметры пользователей социальных сетей на основе текстов их комментариев. Новая платформа позволяет с точностью до 70% определять психологические параметры собеседника. Программа запатентована и зарегистрирована Федеральной службой по интеллектуальной собственности РФ.
Хотя исследования социальных сетей в России ведутся давно, обычно рассматриваются только лайки и репосты пользователей. Ученые ПГНИУ решили изучить, что именно и как пишут люди в комментариях. В базу данных разработанной программы они внесли 21 тыс. текстов пользователей, которые проанализировали по стилистике, жанрам, информативности — всего по более 150 категориям.
Кроме этого, в программу были внесены такие параметры пользователей, как возраст, пол, количество постов и психологические черты, которые исследователи собирали с помощью опросника TheBigFiveInventory. На основе полученных данных ученые составили психолингвистические портреты для каждого пользователя. Программа подойдет для всех операционных систем — Windows, Linux или Mac OS X.
«В ходе исследования мы смогли установить некоторые закономерности. К примеру, в текстах мужчин почти нет извинений, а у женщин они частотно присутствуют. Пользователи-мужчины, для которых характерна недобросовестность, часто в своих текстах используют сарказм и иронию. Пользователи, у которых в текстах присутствует сочувствие, чаще всего доброжелательны и консервативны», — отметил профессор кафедры теоретического и прикладного языкознания ПГНИУ Константин Белоусов.