Стилометрия — поле невидимой войны лингвистов

Стилометрия — прикладная дисциплина лингвистики, изучающая стили письма.

В основном используется для установления авторства того или иного анонимного текста, но успешно применялась и в художественном искусстве, музыке и шахматах.

Каждый человек обладает уникальным стилем письма. Стиль отслеживается. Криминалисты, в т.ч. компьютерные, применяют судебную лингвистику. Так поймали и Унабомбера, и основателя Silk Road, попавшегося, в числе прочего, на слове «yea» вместо «yes»/«yeah».

Считается, что достаточно около 2000 слов автора для установления связи с вероятностью >90% между его публичными текстами и анонимными. В этой сфере на данный момент доминируют нейронные сети, развитие которых идёт крайне высокими темпами.

Меры противодействия называют негативной стилометрией или обфускацией авторства. Сюда входит устранение индивидуальных паттернов из текста, его перевод на другой язык и обратно, коррекция орфографии и пунктуации, упрощение лексики, разные гайды по стилю и т.д.

Ставя анонимность в ряд с преступностью, мы получаем продвинутые методы деанонимизации. С желанием правительств перевести таргетированные методы в массовые, людям придётся развивать меры противодействия для защиты своей приватности.

Сторонники массовой слежки косвенно оказывают негативное влияние на возможность реализации права на приватность того меньшинства, кто его ценит — вопрос требует большего внимания со стороны общества и, следом, закона.

ИМХО:  Избитый аргумент “мне нечего скрывать” ложен в своей основе (готовы жить с майором у окна 24/7?), а полагаться на “я никому не интересен” с биг датой уже не приходится. “Выбирайте выражения” — в новом контексте актуально как никогда.

Свежее