Большой Брат следит за нами: по метаданным можно найти человека даже без имени

Большой Брат следит за нами: по метаданным можно найти человека даже без имени

30 января 2015, 16:42
Lesnik007
2
2 028

Новая аналитическая формула опознает людей без использования имен, фамилий и номеров счетов.

Ваши шопинговые повадки могут выдать вас, даже если вы — всего лишь один из миллиона анонимных клиентов в базе данных отчетов по кредитным картам. Это выясняется в новом исследовании, которое показывает как метаданные могут использоваться, чтобы заглянуть за завесу защиты частной жизни в правительственных и коммерческих базах данных.

Исследователи из Массачусетского Технологического института (MIT) выпустили статью в журнале Science, где рассказывается об анализе анонимных операций по кредиткам 1,1 млн человек. Исследовались трехмесячные отчеты о покупках в 10 000 магазинах, предоставленные анонимным банком в неназванной стране. Для использования новой аналитической формулы понадобились только четыре типа вторичной информации — метаданных — такие, как, например, местоположение или конечная стоимость покупки, чтобы определить уникальные профили 90% покупателей. При этом все очевидные идентификаторы — такие, как номера телефонов, имена, фамилии, номера карт и счетов — не учитывались. Обладая таким малым количеством данных, ученые могли с готовностью нарисовать уникальный покупательный профиль владельца 9 из 10 исследованных кредитных карт.

Каждый из них легко опознается по крохам информации. Фото: The Record of Bergen County/Associated Press


«Мы ищем способы стопроцентного опознания человека по данным, которые выделяют его из толпы», — говорит аналитик данных MIT, Ив-Александр де Монжуа, который руководит исследованием. — «Мы уже приблизились к фундаментальному пределу анонимизации данных: нам больше не нужны стандартные идентификаторы. Нам понятно, что нужно сделать, чтобы найти человека по крохотным крупицам данных».

После того, как определяется покупательский профиль, по словам исследователей, аналитик может вычислить и имя конкретного человека, соотнося информацию о его деятельности с общедоступной информацией — профилями на LinkedIn и Facebook, сообщениями в Твиттере (с метками времени и местоположения) и социальных медиа, таких, как Foursquare.

Опубликованная статья в очередной раз подтверждает, что мы публично рассказываем о себе гораздо больше, чем нам кажется — всего лишь используя цифровые сделки, платежи картами и мобильные приложения. Приблизительно 60% платежей в США сейчас проводятся через кредитки и мобильные платежи.

Новые технологии по определению личности и покупательского профиля определенно будут представлять интерес для многих исследовательских фирм, рекламодателей, ритейлеров, торговых ассоциаций, которые сейчас вплотную занимаются BigData и метаданными, чтобы лучше таргетировать рекламу и собирать информацию о клиентах.

Исследование MIT показало, что «очень, очень, очень трудно исключить любую возможность опознать человека в этих наборах данных, особенно если это финансовые данные», —говорит Джозеф Холл, главный технолог Центра Демократии и Технологии, некоммерческой организации, которая исследует приватность и массивы данных. — «У операторов данных, которые покупают и собирают в единое информационное пространство массу данных, есть способность одновременно анализировать тысячи единиц информации — и соотносить ее с конкретными людьми».

Многие американцы испытывают страх по поводу тотальной слежки со стороны правительства

Несколько экспертов по конфиденциальности данных уже высказались на тему того, что исследование подбросит дров в костер дебатов о сборе личных данных с помощью правительственных программ наблюдения. В этот пакет данных входят электронные базы данных (включая данные о кредитных картах), метаданные с мобильных телефонов и из соцсетей.

«Мы никогда не могли бы заподозрить метаданные в том, что это важнейший источник информации, а оказалось, они на диво много могут рассказать! — говорит Сьюзен Ландау, аналитик по вопросам кибернетической безопасности Вустерского политехнического института. — Небольшие крупицы данных, собранных в разных местах, действительно создают полный портрет человека».

К примеру, в 2013 году исследователи из Кембриджа выяснили, что по «лайкам» человека на фейсбуке легко вычисляются его политические взгляды, вероисповедание, отношение к наркотикам, семейное положение, сексуальные предпочтения. Буквально несколько недель назад психологи из Калифорнийского Университета добавили к этому исследованию, что «лайки» - более точная мера индивидуальности человека, нежели даже оценка его близких друзей.

В исследовании MIT исследователи могли определить пол человека уже по тому, сколько времени они задерживались в различных магазинах. Разумеется, очень легко люди делились по уровню доходов. К методу можно подключить абсолютно любой набор данных, который реально записать. «Каждый из нас имеет уникальные особенности поведения», - говорит программист MIT Алекс Пентлэнд, который работал над исследованием. — «И эти особенности обнаруживаются в любой информации о вашей деятельности, особенно собранной за определенный период времени. Ваш образец будет отличаться от остальных, и по нему вас можно будет опознать, даже не зная вашего имени».


Robert Lee Hotz, для Wall Street Journal. Адаптированный перевод - Lesnik007

Поделитесь с друзьями: