Кристофер Маккинли — дейтинг-хакер

В 2004 в Гарварде математики разработали прародителя всех приложений для свиданий (дейтингов), соединящих людей с помощью алгоритмов — OkCupid.

Люди выбирали ответы из нескольких вариантов на 350 вопросов из тысяч в среднем и получали список тех, кто отвечал на те же вопросы схожим образом с процентом “совместимости”.

8 лет вперед. Летом 2012 магистр математики в Лос-Анджелесском университете Кристофер Маккинли работал над кандидатской диссертацией, параллельно зависая на OkCupid. Алгоритмы сайта работали для него неэффективно ­— из десятков сообщений женщинам большая часть игнорировалась, а ответа и свидания дождались лишь шесть.

Имея удаленный доступ к универскому суперкомпьютеру, Крис решил создать идеальный профиль, протестировав алгоритмы OkCupid. Для этого он создал 12 фальшивых профилей и через них пускал на сайт ботов на Python, вытаскивавших данные со страниц указанной группы женщин возрастом 25-45 лет.

База данных профилей начала наполняться, но чтобы узнать ответы людей на вопросы, нужно было самому ответить на те же вопросы. Боты случайным образом отвечали все вопросы и могли соответственно видеть все чужие вопросы и ответы, которыми Крис дополнял профили этих людей в базе данных.

Как и любая крупная платформа, OkCupid имела защиту от ботов и один за другим скрипты Криса начали отлетать — пора учить ботов работать как человек. С этим Крису помог его репетитор музыкальной теории, которому он в ответ помогал с прикладной математикой. Тот добровольно поставил на свой комп шпионское ПО, позволявшее Крису наблюдать, как музыкант ведет себя на OkCupid.

С помощью полученных данных Крис настроил ботов на симуляцию скорости печатания и кликов пользователем-человеком. К этому времени он уже постоянно ночевал в своей кабинке в универе, спустив диссертацию ниже по приоритетам. Получив 6 миллионов ответов на вопросы от 20000 женщин по всем штатам.

Такой объем данных был бесполезен без группировки профилей по схожим признакам. В этом исследователю помог модифицированный им алгоритм от Bell Labs для анализа соевых бобов. Теперь у него осталась выборка в 5000 женщин из Лос-Анджелеса, разбитая на 7 категорий. Осталось отфильтровать неподходящих. В /dev/null улетели слишком молодые, слишком старые и “слишком христианские”.

В итоге осталось 2 категории: музыкантки и художницы возрастом около 25 лет и почти то же самое, только постарше и профессиональнее — женщины, работавшие редакторами и дизайнерами. На вопросы для своего профиля Крис отвечал честно, но выбор и определение приоритета самих вопросов оставил за машинным обучением.

Подстроив 2 своих профиля под эту базу, Крис запустил поиск. Отсортировав результаты по проценту совместимости, он пролистал уже 10к женщин, и все — с показателем не меньше 90%. Но это не всё. Пользователям приходило уведомление лишь когда кто-то заходил на их страницу. Крис настроил ботов на посещение тысячи профилей женщин каждый день, проходя по кругу (чтобы уж наверняка заметили).

Математику начали заваливать сообщениями. Женщины удивлялись таким цифрам совместимости (до 99%) и начинали писать сами. Пора переносить исследование в поле — Крис начал ходить на свидания, записывая свой опыт в дневник. Вторых свиданий не следовало, но 20 сообщений в день хакер получал стабильно.

Всего за месяц Крис поднял свои результаты практически с нуля до вторых и третих свиданий. Начали вырисовываться определенные закономерности среди его спутниц: минимум две татуировки у каждой из одной группы, и множество собак — из второй. С опытом свиданий Крис отказался и от походов в кино или на концерты — отвлекают внимание от человека.

В один день ему написала студентка того же университета, где он работал. Хоть с ней и был “жалкий” по меркам его списка 91% совместимости, но именно с ней он начал ходить на свидания одно за другим, таким образом выцепив из всех женщин платформы ту самую “иголку” в ближайшем к нему “стоге сена”.

Onion Persona | Onion Links

Свежее