
Большой Брат следит за нами: по метаданным можно найти человека даже без имени

Новая аналитическая формула опознает людей без использования имен, фамилий и номеров счетов.
Ваши
шопинговые повадки могут выдать вас,
даже если вы — всего лишь один из миллиона
анонимных клиентов в базе данных отчетов
по кредитным картам. Это выясняется в
новом исследовании, которое показывает
как метаданные могут использоваться,
чтобы заглянуть за завесу защиты частной
жизни в правительственных и коммерческих
базах данных.
Исследователи
из Массачусетского Технологического
института (MIT) выпустили
статью в журнале Science, где
рассказывается об анализе анонимных
операций по кредиткам 1,1 млн человек.
Исследовались трехмесячные отчеты о
покупках в 10 000 магазинах, предоставленные
анонимным банком в неназванной стране. Для
использования новой аналитической
формулы понадобились только четыре
типа вторичной информации — метаданных
— такие, как, например, местоположение
или конечная стоимость покупки, чтобы
определить уникальные профили 90%
покупателей. При этом все очевидные
идентификаторы — такие, как номера
телефонов, имена, фамилии, номера карт
и счетов — не учитывались. Обладая таким
малым количеством данных, ученые могли
с готовностью нарисовать уникальный
покупательный профиль владельца 9 из
10 исследованных кредитных карт.
Каждый из них легко опознается по крохам информации. Фото: The Record of Bergen County/Associated Press
«Мы ищем способы стопроцентного опознания человека по данным, которые выделяют его из толпы», — говорит аналитик данных MIT, Ив-Александр де Монжуа, который руководит исследованием. — «Мы уже приблизились к фундаментальному пределу анонимизации данных: нам больше не нужны стандартные идентификаторы. Нам понятно, что нужно сделать, чтобы найти человека по крохотным крупицам данных».
После того, как определяется покупательский профиль, по словам исследователей, аналитик может вычислить и имя конкретного человека, соотнося информацию о его деятельности с общедоступной информацией — профилями на LinkedIn и Facebook, сообщениями в Твиттере (с метками времени и местоположения) и социальных медиа, таких, как Foursquare.
Опубликованная статья в очередной раз подтверждает, что мы публично рассказываем о себе гораздо больше, чем нам кажется — всего лишь используя цифровые сделки, платежи картами и мобильные приложения. Приблизительно 60% платежей в США сейчас проводятся через кредитки и мобильные платежи.
Новые технологии по определению личности и покупательского профиля определенно будут представлять интерес для многих исследовательских фирм, рекламодателей, ритейлеров, торговых ассоциаций, которые сейчас вплотную занимаются BigData и метаданными, чтобы лучше таргетировать рекламу и собирать информацию о клиентах.
Исследование
MIT показало, что «очень,
очень, очень трудно исключить любую
возможность опознать человека в этих
наборах данных, особенно если это
финансовые данные», —говорит Джозеф
Холл, главный технолог Центра Демократии
и Технологии, некоммерческой организации,
которая исследует приватность и массивы
данных. — «У операторов данных, которые
покупают и собирают в единое информационное
пространство массу данных, есть
способность одновременно анализировать
тысячи единиц информации — и соотносить
ее с конкретными людьми».
Многие американцы испытывают страх по поводу тотальной слежки со стороны правительства
Несколько экспертов по конфиденциальности данных уже высказались на тему того, что исследование подбросит дров в костер дебатов о сборе личных данных с помощью правительственных программ наблюдения. В этот пакет данных входят электронные базы данных (включая данные о кредитных картах), метаданные с мобильных телефонов и из соцсетей.
«Мы никогда не могли бы заподозрить метаданные в том, что это важнейший источник информации, а оказалось, они на диво много могут рассказать! — говорит Сьюзен Ландау, аналитик по вопросам кибернетической безопасности Вустерского политехнического института. — Небольшие крупицы данных, собранных в разных местах, действительно создают полный портрет человека».
К примеру, в 2013 году исследователи из Кембриджа выяснили, что по «лайкам» человека на фейсбуке легко вычисляются его политические взгляды, вероисповедание, отношение к наркотикам, семейное положение, сексуальные предпочтения. Буквально несколько недель назад психологи из Калифорнийского Университета добавили к этому исследованию, что «лайки» - более точная мера индивидуальности человека, нежели даже оценка его близких друзей.
В исследовании
MIT исследователи могли
определить пол человека уже по тому,
сколько времени они задерживались в
различных магазинах. Разумеется, очень
легко люди делились по уровню доходов.
К методу можно подключить абсолютно
любой набор данных, который реально
записать. «Каждый из нас имеет уникальные
особенности поведения», - говорит
программист MIT Алекс
Пентлэнд, который работал над исследованием.
— «И эти особенности обнаруживаются в
любой информации о вашей деятельности,
особенно собранной за определенный
период времени. Ваш образец будет
отличаться от остальных, и по нему вас
можно будет опознать, даже не зная вашего
имени».
Robert Lee Hotz, для Wall Street Journal. Адаптированный перевод - Lesnik007