Интересную разработку реализовали в Курчатовском институте — новая интеллектуальная компьютерная модель может анализировать публикуемые в социальных сетях тексты и определять возраст написавших их лиц.
Если присовокупить это нововведение к разработанной учеными ранее технологии определения пола по тексту — мы движемся к полной деанонимизации в Сети. Более того, на очереди у специалистов метод определения профессии и образования.
К работе над системой привлекли лингвистов, психологов и специалистов по анализу данных. На основе их заключений строилась специальная математическая модель, которая опирается на корреляцию между численными значениями различных параметров текста и характеристик автора.
Для создания этой модели потребовался машинный анализ огромного количества текстов, взятых в Сети, причем необходимым условием было наличие открытого профиля автора текста. Анализировать русскоязычные тексты таким образом стали сравнительно недавно.
«Наша задача — это разработка методики диагностирования возраста участника интернет-коммуникации на основе анализа количественных параметров его текстов», — цитируют «Известия» ведущего научного сотрудника Курчатовского комплекса НБИКС-природоподобных технологий Александра Сбоева.
«Эти исследования идут в рамках гранта Российского научного фонда».
По словам специалистов, эта модель поможет вычислить демографические характеристики автора текста даже в том случае, если он намеренно пытается свой возраст скрыть.