Сетевая реальность: все под колпаком

Артур Хачуян руководит компанией SocialDataHub, занимающейся анализом данных из соцсетей, блогов и медиа. Именно благодаря SocialDataHub стало известно, что у террориста, совершившего теракт в метро в Санкт-Петербурге, с 2014 года было пять аккаунтов во «ВКонтакте», а последний был удален за неделю до теракта.

Среди его клиентов — коммерческие структуры, медиа и государство. Он считает, что мы сами виноваты в том, что из сети уходит анонимность, а близкие к государству структуры неправильно ищут террористов.

Почему ты вообще заинтересовался историей петербургского террориста?

У меня есть клиент — одно СМИ. Не буду говорить, какое, но оно любит чернуху всякую и считает себя федеральным СМИ. Посреди ночи мне [оттуда] позвонили и сказали: «Артур, мы прислали вам голову. Надо найти!» Я говорю: «Что? О чём речь?» А время — три часа ночи. Они говорят, что прислали своему менеджеру фотографию оторванной головы и что его [террориста — прим. ред.] нужно найти в социальных сетях.

К четырём утра мы нашли его профиль по фотографии этой головы. А потом мне самому стало интересно, какие связи у него были, потому что мне звонили и спрашивали: «Есть ли там украинский след?» В общем, я нашёл пять его аккаунтов и, самое главное, быстро определил, что в моей базе аккаунт был удалён за три-четыре дня до теракта.

А что за база?

У нас есть история ВК с 2010 года. Мы её выкачиваем постоянно, но без медиаконтента. Есть профили, люди. Там оказались пять связанных между собой аккаунтов этого товарища. В общем, мы начали крутить всё это, обнаружили много чего интересного. Например, есть связи с «хабаровским террористом», расстрелявшим приёмную ФСБ, а все они являются одной большой ячейкой ультраправых, которые группировались вокруг Максима «Т» М****кевича.

Как это возможно, если — националист, а петербургский террорист — мусульманин и выходец из Средней Азии?

Я не знаю, как они связаны в реальном мире. Но в соцсетях они единомышленники, террорист был его подписчиком, взаимодействовал с ультраправыми товарищами. Плюс к тому, по официальной версии, этот товарищ ездил в одно и то же время в один и тот же город с женщиной, которая на Октябрьском поле [в феврале 2016 года] отрезала голову ребёнку.

Как вы это вычислили?

Например, с помощью всяких слитых баз авиаперевозчиков, которые постоянно взламывают и выкидывают в Tor. У нас есть алгоритм, который ищет связи между людьми, авиаперелёты и так далее. Но доказательства связи косвенные. Они в промежутках примерно полгода были в одном месте. И его [террориста] друзья говорили, что он после того, как съездил к себе на родину, ******* [сошёл с ума]. И она вроде как была нормальная, но после поездки на родину тоже окочурилась.

Поясни для незнающих, что такое «сетевой анализ»

Это поиск взаимосвязей между людьми: друзьями, подписчиками. Это уже прошлый век. Им можно было удивить 10 лет назад. Сейчас более популярна история с моделями поведения: кто кого как лайкает, кто с кем взаимодействует. Но она всё равно не даёт 100-процентного результата. Тут нужно перейти из онлайна в офлайн. Если человек к чему-то призывает в сети, не означает, что он в реальной жизни такой «отбитый».

Как перейти из онлайна в офлайн? Например, есть несколько террористических группировок: правые, левые, исламисты, Энтео с дружками и так далее. Всех этих многочисленных людей в соцсетях объединяют два-три человека. В случае «левых»-«правых» это продавцы какой-нибудь атрибутики: файеров, балаклав и так далее. Соответственно, этих людей можно вычленить, к ним прийти, посмотреть чеки, паспортные данные. Вот как от аккаунта в социальной сети можно перейти к реальному человеку.

Второй вариант — отправить данные аккаунта соцсети провайдерам. Они, соответственно, могут сказать, с чьего айпишника, с чьих паспортных данных заходили на эту страницу. Проблема в том, что провайдеры — нищеброды, хранят информацию только за дней пять-семь. А человек может скрыть IP.

Мы работаем с теми историями, когда нет судебного решения. Моя любимая байка — о том, что якобы ФСБ читает все сообщения. Это, естественно, неправда. Рядовому московскому следователю очень сложно получить разрешение на чтение переписки.

Но можно же взломать.

Нифига они не взломают. Есть же двухфакторная аутентификация в ВК. К тому же «ВКонтакте» будет делать всё, чтобы не дать правоохранительным органам залезть в переписку, потому что для компании это репутационные издержки.

Мы же можем работать с теми данными, которые есть в открытом доступе. 90% подозреваемых — мимо кассы: они не были в нужных странах, взглядов соответствующих не разделяют. Смысла их проверять нет. С другой стороны, можно найти людей, которые могут быть потенциально причастны к какой-то истории.

Чем твоя организация занимается?

Анализом открытых источников данных: СМИ, соцсетей, блогов, форумов, сайтов, Tor — всего, до чего можно дотянуться без введения каких-либо паролей, без санкции суда.

Зачем?

Основной продукт, который мы продаём, — это технология распознавания изображений, это история государственная, про неё по понятным причинам рассказать я не могу. Кроме того, это коммерческий рынок. Например, для банков мы занимаемся скорингом профилей, анализом потенциальных клиентов.

Или поиском должников?

Да. Или поиском уклонистов от армии. Только когда у военкоматов недобор. Да и мне форсить эту тему особо не хочется. Коммерческий рынок — это рекламная история. Мы анализируем публичную аудиторию, таргетируем сегменты этой аудитории. Например, ищем всех женщин, владеющих красным БМВ, у которых муж работает в банковской сфере и есть двухлетняя беременная кошка.

Каким образом?

На основании анализа фотографии можно определить машины. На основании социальных связей можно найти мужа. На основании данных с HeadHunter или SuperJob можно понять, где он работает и сколько зарабатывает. На основании геочекинов можно понять, где они живут и работают. Узнав, куда они поедут за рубеж, можно понять, сколько примерно стоит билет. Они зачекались в отеле — через Booking можно узнать, сколько стоит номер в отеле. Так можно проанализировать хоть миллиард человек.

А это не затратно?

У нас есть копия всех социальных сетей. На каждого из этих людей все метрики рассчитаны. Мы можем проводить исследования очень быстро: утром пришёл запрос — вечером дали результат. Это наше конкурентное преимущество.

Третья история, которой мы занимаемся, — поиск лидеров мнений для маркетинга и рекламы. Бренды хотят работать с блогерами, блогеры стоят дорого, мы можем узнать, кто реально стоит своих денег. Это может быть политический и околополитический контент. Это может быть история типа «найти всех мам Москвы, узнать, кто имеет влияние на каком-нибудь Woman.Ru или в каком-нибудь паблике». Соответственно, бренды с ними связываются, что-то им дарят, устанавливают взаимодействие.

У тебя, значит, нет такой идеалистической задачи типа «очистить интернет от скверны»?

Нет. Боже, я не Дмитрий Энтео. Я считаю, что технологии — это хорошо. И если бы, скажем, технологии распознавания лиц были внедрены в том же условном питерском метро, всё было бы хорошо.

Моя любимая история — про «Спартан-300». Ребята получили кучу бабла, поставили «Майкрософт Кинект», заклеили надпись наклейкой «Спартан-300» и продали как ИИ, прогнозирующий терроризм. Их не смутило, что на «Кинекте» камера всего 0,3 МП и там лица в принципе видно быть не может.

Ты сам этой тотальной открытости и деанонимизации интернета, которая происходит в том числе с участием государства, не боишься?

Нет. К тому же «закону Яровой» я отношусь очень лояльно, потому что не считаю плохим лишение террористов гражданства. Тут я, впрочем, не рассматриваю вопрос, купленный наш суд или нет.

Что же касается требования о хранении данных — они ничего не реализуют. Это очень большой объём данных.

Но вы же храните эти данные, будучи при этом не крупной компанией типа МТС.

Мы храним. У нас есть куча ноу-хау. Например, ИИ определяет, что хранить, а что нет. Это важно: выигрывает не тот, кто все данные хранит, а кто понимает, что хранить.

Что же касается «закона Яровой», то вряд ли все эти компании типа «МегаФона» будут хранить данные, иначе жёсткими дисками придётся покрыть полстраны. Глупость всё это. Нет смысла бояться.

Можно ли вычислить потенциального террориста?

Да. По модели поведения, по людям, с которыми он взаимодействует.

Тебе такие прецеденты знакомы?

У нас есть такие алгоритмы, по которым мы людей определяем. Но после этого людей никогда в тюрьму не сажают. Есть просто список людей, которые рекомендуются для проверки. К кому-то участковый приходит, к кому-то — ещё кто-то.

Источник материала
Настоящий материал самостоятельно опубликован в нашем сообществе пользователем Proper на основании действующей редакции Пользовательского Соглашения. Если вы считаете, что такая публикация нарушает ваши авторские и/или смежные права, вам необходимо сообщить об этом администрации сайта на EMAIL abuse@proru.org с указанием адреса (URL) страницы, содержащей спорный материал. Нарушение будет в кратчайшие сроки устранено, виновные наказаны.

Читайте также:

Сортировать по:   новые | старые
Ванёк26
Ванёк26

Ну а что? Человек умеет. Шерлок современности.