Русские Вести

Из-за технологий мы полностью потеряли свободу и безопасность. Доказать это можно на нескольких примерах


Профессор Бостонского университета и заведующий кафедрой компьютерных наук колледжа Метрополитен при Бостонском университете Анатолий Темкин своим выступлением открыл Big Data Conference и заставил осенним утром 500 человек задуматься о том, куда исчезла наша свобода, как скрыть пин-код от своей карты и при чем тут большие данные.

Мы делимся с вами мыслями Анатолия как в печатном, так и аудио-формате. В конце материала добавлены вопросы аудитории, на которые ответил спикер.

Другие материалы с конференции и общий отчет ищите здесь.(https://rb.ru/list/itogi-big-data-conference/)

Про свободу, которой у нас больше нет

Люди медленно и плохо считают, зато замечательно распознают образы. А что делают компьютеры? Компьютеры считают быстро и без ошибок, но образы распознают не очень хорошо. Значит, что мы стремимся сделать? Мы стараемся создать нейронные сети, которые бы распознавали образы и определяли корреляции так же хорошо, как это делаем мы. При этом мы сами не очень понимаем, как наш мозг работает.

Если нейронные сети будут обладать такой же структурой, как наша голова, тогда компьютеры будут делать все то же, что делаем мы. При этом заметьте, что человеческая голова – это звучит красиво – работает на 3 или 4% от того, как могла бы работать.

Получается, что на меньшем количестве нейронных сетей нам удастся добиться того, что сейчас получается, когда доходит до нашего мышления. Преподаватели русского языка поставили бы мне двойку за такие выражения, но все так и есть.

Когда нейронные сети стали более развитыми, в Google придумали платформу, которая называется Tensor Flow. Она позволяет строить нейронные сети и обучать их с целью распознавания образов. И, что самое важное, здесь можно проследить корреляции. Есть еще Spark neural networks, сейчас все это активно развивается.

Непонятно, будем ли мы, как человечество, довольны этим, потому что мы абсолютно потеряли нашу прайваси. Прайваси – это не безопасность, это свобода. Именно ее мы и потеряли. Мы ее потеряли безвозвратно и навсегда. Я докажу вам это на нескольких примерах.

Пример 1. Дьявольское устройство

Каждый из нас носит дьявольское устройство в кармане. Когда вы покупаете это устройство, вы как бы заключаете договор с государством.

Договор такой: нам разрешают звонить, обмениваться сообщениями и так далее, но за это мы разрешаем государству знать, где мы находимся. Даже когда ваш телефон выключен, это не имеет абсолютно никакого значения. Государство знает, где вы находитесь 24 часа в сутки.

Есть еще такая штука, называется GPS, она есть и в машинах, и в телефонах. Государство знает, где мы находимся, с точностью до метра 24 часа в сутки. Но это еще не все.

Пример 2. С Google вы всегда откровенны

Сейчас я вам расскажу, как мы теряем прайваси. У нас по закону не имеют права прослушивать телефонные разговоры. Я думаю, что этот закон не нарушается, потому что это ведет к большим проблемам. Телефоны не прослушиваются. Если простой американец звонит за границу, то все разговоры записываются, машина анализирует их, но это другой разговор. Что важно – это meta data: кто звонил, куда звонил, откуда и длина разговора.

Если у вас имеется огромное количество meta data, то вам даже не нужно знать содержание разговора, чтобы понять, о чем разговор.

У вас есть огромное количество data basis, и это все meta data. В математическом смысле слова большое количество meta data и все корреляции, которые там прослеживаются, асимптотически приближены к тому, что вы бы услышали в разговоре.

Разбираем кейс... Итак, вы немножко заболели. Что вы делаете?

  1. При условии, что у вас есть компьютер. Вы идете в Google. Вбиваете туда все симптомы. При этом, если кому-нибудь вы могли бы и соврать, то с Google вы всегда откровенны.
  2. Вы написали все симптомы. Это одна data, которую Google запомнит навсегда. Что вы делаете дальше?
  3. Вы звоните врачу с целью прийти и полечиться. Позвонили врачу, очень хорошо, известно, когда вы звонили, известно, как долго вы разговаривали.
  4. После этого вы пришли к врачу. Врач вам выписал лекарства. Вы пошли в аптеку и заплатили вашей кредитной картой. Абсолютно вся эта информация сохраняется.
  5. Потом ваш врач отправил вас еще к какому-нибудь специалисту. И к нему вы тоже записались и тоже прогуглили все, что касается того, что вам сказал врач. Вся эта информация соединяется и коррелируется.

Где мы здесь потеряли прайваси? Не там, где появляются конкретные данные о каждом факте, а там, где это все коррелируется.

Еще кейс

Представьте себе ситуацию, что вы работаете в каких-нибудь специальных службах государства. И вы получили информацию, что человека, который вам нужен, видели в ресторане две недели назад, потом на каком-то вокзале и еще где-то в кинотеатре.

Вывод: вы мгновенно понимаете, кто этот человек.

Делается это так:

  1. Вам известно, что человек в такой-то день был в ресторане. Берутся записи абсолютно всех трансляционных вышек, а у вас там 120 000 телефонных номеров.
  2. Через две недели нужного человека видели на каком-то вокзале – вы берете вышку рядом с вокзалом, там есть еще 80 000 номеров.
  3. И, наконец, кино. Вероятность того, что еще один человек побывал во всех трех местах равна нулю. Поэтому вам выскакивает уже один номер телефона.

Теперь о нашем будущем...

Наше будущее очень светлое. Оно заключается в следующем: вы идете по улице, навстречу вам идет человек. Вы хотите познакомиться с этим человеком, расстояние 50 метров. Вы смотрите на ваш телефон. Там вся информация об этом человеке: имя, фамилия, отчество, где живет, женат – не женат. Болел: да – нет. Если да, то чем. Это все будет максимум через 10 лет.

Дальше вы хотите пойти в магазин, открываете дверь, входите, на вас внимательно смотрит продавец. У него в телефоне полная информация о вас. А главное – какой у вас доход. Потому что в зависимости от дохода вам будут предлагать разные товары.

Например, вчера я гулял по Малой Бронной и видел такое количество Майбахов, какое за 30 лет жизни в Америке не видел. Так вот, если вы заходите в магазин дилера, то продавец вместо Toyota сразу предложит вам Майбах. По-английски это называется pointed advertisement – когда вы совершенно точно знаете, кто ваш клиент и чего он хочет, еще до того, как он появился. Я считаю, что это полная потеря прайваси.

Про security, которая скоро исчезнет

На самом деле, с точки зрения философии, общество должно определять направление развития технологии. Но у нас развитие технологий диктует развитие общества. Это я говорю про Америку. Теперь поговорим о security. Вообще, моя область – это криптография. И я был математиком. Вся компьютерная security основана на hash functions.

Это сейчас называется cryptographically secure hash functions:

1. One way functions. Когда вы знаете, куда отобразилось, но никогда не можете вернуться обратно. Математически это возможно, а с точки зрения вычислений – нет.

2. Паблики infrastructure. Public key и private key, которые определяют и доказывают всем, что вы – это вы. Ваше лицо никто не видит, но в каждой компании имеется свой digital certificate, и вы его предъявляете.

– Как вас зовут?

– Мона.

– А я что-то неуверен, что вас зовут Мона. У вас доказательства есть?

– Паспорт.

– Паспорт, выданный государством? Если паспорт выдан государством, а я государству доверяю, то вы Мона. А если не доверяю, то я не знаю, кто вы.

То же самое происходит тут.

Когда же речь заходит о blockchain и криптовалютах, то там нет никого, кому бы вы доверяли. Поэтому, с моей точки зрения, это дань моде, которая продиктована биткоинами. Люди думают, что он стоил 5 центов, а скоро будет стоить 120 тысяч. Но вся эта структура совсем не дает вам сто процентов уверенности.

Так вот, digital certificates просто доказывают, что ваш компьютер – тот компьютер, с которым вы хотите иметь дело. Еще бывает такая вещь, как none rejudiation – это когда вы написали банку, что ему нужно вам заплатить, он заплатил, а вы говорите: «Нет-нет, я ничего не получил». Так вот чтобы такого не было, существует publicy cryptography.

И вдруг возникает проблема. Это квантовые компьютеры

Для меня это катастрофа, потому что мои два курса по криптографии улетают. Не будет больше той криптографии, которая есть. Люди, которые покупают вещи по интернету, не смогут этого делать. Вся зашифрованная информация будет расшифрована в доли секунды.

Был такой замечательный человек Питер Шор. Он в 1994 году просто доказал, что квантовые компьютеры очень скучные с точки зрения того, из чего они состоят. Они состоят из нулей и единиц, больше там ничего нет. У вас имеется эта единица информации. Это бит. Он либо ноль, либо один. Q-бит – это фотон, который одновременно находится и в состоянии 0, и в состоянии 1. И вы знаете только вероятность, с которой он 0 или 1. И выясняется, что если всего этих Q-битов несколько сотен, то вся security, которая у нас есть летит.

Теория решеток

По-английски есть такое выражение «лететь к черту в ручной корзинке». Так вот, в этой корзинке криптография улетает. И тут выясняется, что у нас еще есть некая схема. Или даже не схема, а теория решеток. Быстро объясню, что такое решетка. Те, кто никогда не имели дела с линейной алгеброй, могут меня не понять.

Представьте себе ваше двухмерное пространство, то есть плоскость. У вас имеется два вектора. Два вектора, оба выходят из нуля. Каждый из них вы будете умножать на целые числа, положительные и отрицательные. У вас получится такая прямая, две прямых и разбитые точечки. Потом все многообразие векторов, которое вы получили, вы начинаете складывать. Результат – решетка.

Выясняется, что если ваш базис, то есть вот эти два вектора, не ортонормированные, то есть не ортогональные, не длиной единица, то найти самый маленький вектор в такой решетке является невероятно сложной математической задачей. При условии, что размерность не два, а пятьсот.

Когда эти квантовые компьютеры, даже с не очень большим количество Q-битов, применили к моделированию сложных систем, то все выводы, которые можно вынести из этих моделей с помощью обычного компьютера, были также получены с помощью квантового компьютера.

Но там квантовый компьютер обнаружил то, что другие компьютеры не обнаруживали. Оказывается, в сложных системах есть такие практически бесконечные колебания. Они маленькие, но почти бесконечные. И это то, чего мы как раз всегда знали.

Простой пример – берем семью

Семья – сложная система, потому что поведение в семье значительно сложнее, чем ее структура. И как это бывает, в этой системе возникают возбуждения. Это ссоры. Они проходят, но некоторые колебания остаются. Это называется «злоба прошла, а осадочек остался». Так вот этот «осадочек» — это те колебания, которые позволили определить использование квантовых компьютеров.

Бояться особо нечего, но придется все перестраивать. Сейчас самые мощные квантовые компьютеры имеют в себе 51 Q-бит. С помощью этого компьютера удалось разложить на множители огромное число – 15. 15 разложили на 5 и 3. Кстати, RSA, на котором, считай, вся security держится, достаточно простой.

Для непосвященных: вы придумываете два громадных простых числа. Простое число – это число, которое простое. Каждое число больше, чем жизнь. Вы их перемножили, и то, что вы получили, называется security parameter, выясняется, что разложить это число назад не удается, при условии, что люди правильно подобрали эти простые числа. Они даже называются strong primes – «сильные простые числа».

Сильное простое число – это когда вы считаете его единицу, она, разумеется, четная. Она начинает уже делиться на что-то. И один из множителей этого числа тоже должен быть громадным. И это все идет, идет, идет... Так вот выясняется, что это все полетит, потому что квантовый компьютер будет раскладывать числа на множители в 1 секунду.

А где будущее Big Data?

Будущее в том, что все нейронные сети будут совершенствоваться, они будут более мощными. Мы будем делать намного более мощные вычисления. Для биологии и медицины это совершенно замечательно, потому что лекарства будут тестироваться вне человеческого организма и тестироваться намного быстрее. Это очень хорошо.

При этом мы абсолютно потеряем нашу прайваси. Ее просто не будет. Слово будет, а смысла, который оно несет, не будет. Я пытался придумать слово, которое есть, но смысла его для меня уже нет. Это слово «граммофон». Эта же судьба ждет и слово «прайваси».

Возвращаясь к Big Data, самое большое значение будет иметь интеграция разных платформ, если не брать в расчет нейронные сети. Big data будет вылавливать закономерности и корреляции. Вопрос в том, а что они будут означать. У вас имеется огромное количество данных, компьютер описал закономерность, а что это означает, с точки зрения здравого смысла? Это отдельная проблема.

Закономерностей в мире множество, но что-то мы просто не понимаем. Например, такая закономерность: поездка в метро от одной станции до другой занимает 11 минут, а мороженое стоит 50 рублей. Имеет ли это какой–то смысл?

Глупый пример, но такая закономерность тоже может быть выявлена. Это то, что нас ждет в будущем.

Благодаря сервису Penxy мы можем поделиться с вами презентацией Анатолия, которую можно не просто посмотреть, но и послушать:

После выступления аудитория задала Анатолию вопросы через специальный сервис WhenSpeak. Мы публикуем «публичное интервью» со спикером.

Вопрос 1. Сейчас много где пишут про алгоритм Шора и как он плохо повлияет на криптографию. А разработаны ли сейчас или разрабатываются какие-то алгоритмы на основе квантовых вычислений, новые технологии шифрования?

– Для человека, математически не предрасположенного, вы можете представить себе месседж, который вам нужно зашифровать, одной звездой. Что вы делаете? Вы добавляете к ней маленький вектор. И звезда плюс вектор – зашифрованное сообщение. Как происходит расшифровка? Вот у вас звезда плюс вектор – зашифрованное сообщение – вы должны из этого сообщения найти вектор, который был бы наиболее близким к нему. Вот это была бы расшифровка. И она сейчас возможна при условии, что ваша public key – базис нормальный, ортонормированный, а ваша private key – базис абсолютно жуткий. И математически доказывается, это тяжелая задача. Это одно направление, с которым я знаком. Про другие направления я практически ничего не знаю, и они мне неинтересны.

Вопрос 2. Что делать? Что надо скрывать уже сейчас, кроме пин-кода от карты?

– Я думаю, что имеет смысл внутренне расслабиться. Вы ничего не сможете скрыть, как бы вы ни старались. Спрятаться невозможно, даже не пытайтесь. Но дружеский совет: постарайтесь не нарушать закон. Если вам удастся, будете all set.

Вопрос 3. Что вы думаете о блокчейне и биткоине?
– Что касается блокчейна, я считаю, что это мода. Это работает так: когда подсоединяется новый блок, его содержание переходит в предыдущие блоки. Его содержание даже не переходит, но от его содержания берется криптографический hash function, поэтому если в предыдущих блоках что-то меняется, это всем будет известно. Кроме того, там все равно идет public key и private key. Я на это смотрю как на маленький кусочек криптографии, я не знаю, что с этим будет.

У меня на работе есть человек, который мировая величина в этом деле. Я ему задал перед отъездом этот же вопрос. И он мне ответил: «На эту глупость я даже времени не хочу тратить».

Тем не менее это distributed trust. В какой степени он надежен, это другой вопрос. Понятно, что hash function абсолютно не позволит изменить что-либо в предыдущих блоках без того, чтобы об этом узнали все люди. Вот люди делают на этом деньги.

Вопрос 4. Вы говорите, что общество должно определять направление развития технологий. С другой стороны, вы говорите, что прайваси исчезнет. Это общество выбрало

– Что значит «люди выбрали»... Это очень маленькое количество людей. Когда делается технический прогресс, люди делают то, что можно сделать сейчас, не зная, куда это приведет. Я думаю, это не изменится. Когда придумали пенициллин, никто его специально не придумывал, результат случайно оказался такой.

Если удастся придумать вакцину от ВИЧ, это тоже будет случайный побочный результат. То же с теоремой Ферма, которую случайно доказали, это был результат теории, которая не имела к этому отношения. Это слепой подход. Мы делаем то, что можем делать сегодня, чтобы завтра делать больше и лучше. Но, что будет послезавтра, мы не знаем. Мы понятия не имеем, куда мы идем, как общество.

Вопросы от аудитории

Что вы думаете о блокчейне и биткоине?

Подлинность и целостность данных требуют «якори доверия», а в технологии блокчейна их нет. Блокчейн скорее ближе к неформальной сети доверия, которая используется в PGP и GPG. У этой сети не такого же уровня гаранта доверия и возможностей для масштабирования, как у формальной иерархии доверия PKI. Именно поэтому PGP/GPG обрели популярность только у исследователей и любителей.

Как вы считаете, когда появится квантовый компьютер 500 qbit?

Сложно предсказать, когда точно, но, думаю, что в ближайшие десять лет. У меня есть друг, который занимается исследованиями в этой области. В 2004 году он сказал, что в ближайшие пять лет появится несколько сотен компьютеров qbit.

Останется ли в цифровом big data-обществе место для человеческой этики? Какие решения могут сохранить остатки конфиденциальности?

Это очень серьезный вопрос. К сожалению, я не могу на него ответить.

Сколько осталось до создания Скайнета и судного дня? Когда биологическая форма жизни перестанет доминировать в этой вселенной?

Сомневаюсь, что кто-то на Земле вообще может ответить на этот вопрос.

Какие альтернативы rsa для квантового шифрования?

Я вкратце говорил о них, когда рассказывал о схемах шифрования с открытым ключом. Можете почитать об этом тут.

Откуда информация про процент работы мозга/его использования? Звучит ненаучно.

Существует популярное мнение о том, что человеческий мозг использует не все свои возможности. Кто-то говорит, что в нем задействовано лишь 3-10%, но я не психолог и не специалист по работе мозга, так что не буду углубляться в эту тему.

Какие сферы бизнеса перестанут существовать из-за того, что их заменят анализ данных и машинное обучение?

Больше всего людей пугает вероятность потерять работу. Я считаю, что исчезнут такие профессии, как таксист, водитель доставки и дальнобойщик. Пропадет множество профессий в сфере обслуживания. В будущем значительно снизится рабочая нагрузка специалистов по оформлению налоговых деклараций, бухгалтеров и даже юристов. Автоматизация коснется даже профессоров колледжей/университетов.

Насколько важно сейчас введение цифрового паспорта для каждого пользователя в интернете?

У нас есть технологии, которые позволяют создать цифровой паспорт практически для всех веб-браузеров. Также существует технология цифровых сертификатов X.509v3, которые выпускают банки и государство. С кросс-CA сертификацией мы можем установить доверенные отношения между PKI без необходимости единого PKI. Да, людям придется научиться пользоваться кодовыми фразами и делать резервные копии своих ключей шифрования, но это все равно что хранить и пользоваться бумажными и электронными паспортами.

Зачем вообще скрывать данные? Пусть мне предлагают подходящие товары и услуги.

Так думает большинство и это нормально. Если человек не нарушает закон, ему нечего бояться.

Какую специальность выбрать будущим математикам, с учетом обрисованных вами перспектив?

Сложный вопрос... Я бы выбрал в первую очередь ту специальность, которая интересна мне и не смотрел бы на ее популярность. Пожалуй, сейчас наибольший интерес для математиков представляет data science и компьютерная безопасность.

Как вам живется в США, зная, что за вами постоянно следят?

Довольно неплохо. Google и другие аналогичные компании собирают данные только для того, чтобы показывать более подходящую рекламу. Государство делает это, чтобы защитить народ от тех, кто хочет ему навредить.

Будет ли как-то ограничиваться/регламентироваться использование квантовых компьютеров? Может ли квантовый компьютер стать оружием будущего?

Не думаю, что использование квантовых компьютеров будет как-то регулироваться. И я не считаю, что они смогут превратиться в оружие.

Сейчас уже есть успешные эксперименты по телепортации информации (квантовая запутанность). Правда ли, что канал по которому телепортируется информация в принципе невозможно взломать?

Да, это так. Любая попытка подслушивания приводит к полному уничтожению информации.

Почему не поможет отключение телефона?

Компания Cobham из Великобритании продает систему, которая позволяет звонить на телефон так, чтобы он не подавал никаких сигналов. Такой сигнал невозможно отследить. Звонок заставляет телефон передавать определенную частоту, по которой можно определить местоположение владельца. Я не знаю, как это возможно с технической точки зрения.

Аппаратно нейронные сети сейчас работают на основе GPU, есть ли способы оптимизировать обучение нейронных сетей и прямое распространение по сети с помощью квантовых компьютеров?

Основная проблема обучения нейросетей в надежности обучающего материала. Она же касается и квантовых концепций..

Помимо этических проблем может возникнуть проблема глобального технологического неравенства. Ведь не во всех странах одинаковый технологический прогресс. Не породит ли это новых глобальных конфликтов?

У нас сейчас итак слишком много глобальных конфликтов, чтобы задумываться о будущих.

У технологии есть как минусы, так и плюсы. Государство получает доступ ко всей информации о гражданах. А какие разрабатываются механизмы защиты от попадания информации в руки того же криминала?

Это реальная проблема. Базы данных государства и компаний постоянно подвергаются атакам хакеров. Чтобы их защитить понадобятся не только технические средства, но и должное обучение сотрудников.

В РФ есть закон о защите персональных данных, который запрещает передачу персональных данных без согласия субъекта. Какова ситуация в штатах?

В США есть много законов, защищающих персональные данные, например, информацию из медицинских карт. Но некоторые данные не защищены. Некоторые компании собирают их и продают третьим лицам, без ведома владельцев. И, разумеется, всегда есть хакеры.

А как же опыты Китая по внедрению систем социального доверия? Там уже не совсем действует правило «не нарушай закон», судьба человека может пострадать и от менее критичных социально нежелательных действий.

В США такой проблемы нет. Если человек не нарушает закон, его не будут наказывать просто так.

Для органов безопасности разных стран квантовое шифрование это плюс или минус? Ведь они не смогут тогда контролировать передачу данных тех же террористов.

Да, это проблема. Я не знаю, как и когда ее решат.

Как можно решить проблему увеличения хвостов истории (тяжести транзакций), появляющихся при обмене данными через блокчейн?

К сожалению, я не настолько разбираюсь в блокчейне, чтобы ответить на этот вопрос.

Уничтожат ли квантовые компьютеры криптовалюты? Или будут использоваться другие методы шифрования?

Появятся другие надежные методы обмена ключами.

Как Вы считаете, потеря приватности приведет к росту рынка оказания приватных услуг и защиты конфиденциальности?

Единственный способ защитить приватную информацию — это улучшить безопасность и проинструктировать на этот счет сотрудников, включая высшее руководство. За утечку информации должно отвечать именно оно.

Кто «сливает» большие данные? Разве закон не защищает конфиденциальность?

Закон действительно защищает конфиденциальность данных. Но часто утекают метаданные.

Модернизация производства тоже создавала безработицу и приводила к сокращению рабочих мест для неквалифицированного персонала. Сейчас это уже пройденный этап, и мы научились с этим жить. В чем отличие роботизации?

В этот раз все действительно будет иначе. Роботы вытеснят людей с огромного количества рабочих мест. Не из всякого можно будет вырастить разработчика или ученого.

Big data все больше применяются в науке. Не отнимут ли дата-сайентисты работу у биологов и медиков?

Стремительное развитие ИИ повлияет и на сферу медицины и биологии. Какие-то профессии исчезнут, но пока трудно предсказать их процентное соотношение.

Как научить модель предсказывать отказы, если раньше ничего не ломалось и учить не на чем.

Это будет непросто. Я считаю, что машина не может предугадывать ситуации без обучения.

Видео выступления на Big Data Conference 2017:

Источник: rb.ru