Большие данные все чаще фигурируют в выступлениях российских политиков. Президент страны Владимир Путин заявлял, что Россия должна стать мировым центром обработки больших данных. Премьер Дмитрий Медведев в своей программной статье писал о том, что технологии работы с большими данными и платформами эффективны с точки зрения развития. Не так давно в СМИ прошла информация, что большие данные могут быть использованы в работе Государственной думы, чтобы корректировать законы на основе обновляемой информацией. О чем говорят все эти сигналы, что будет с рынком больших данных в России, и как эта технология применяется в других странах?
Одним из последних документов в сфере регулирования больших данных можно считать « Концепцию комплексного регулирования отношений, возникающих в связи с развитием цифровой экономики». Эксперты «Сколково» предложили использовать большие данные (big data) для оперативной корректировки действующих законов. Идея является интересной, ведь депутаты часто запаздывают с решением наболевших проблем, а законы принимаются слишком поздно. Но при первом же рассмотрении этой инициативы становится очевидно, что мы наблюдаем очередной этап битвы за рынок больших данных в России, а не попытку перевести законодателей на дата-ориентированный подход.
Государственные органы власти, политики и представители крупного бизнеса стали говорить о больших данных относительно недавно. Если понятие «открытые данные» в нормативном поле появилось с принятием «майских указов» Путина в 2012 году, то понятие «большие данные» до сих пор не имеет четкого определения, и сейчас проходит процесс «перетягивания каната», когда различные интересанты борются за право определять правила игры.
Эту версию подтверждает комментарий главы департамента по развитию фонда «Сколково» Сергея Израйлита, который объяснил необходимость внедрения БД в законотворчестве: «основная идея регулирования заключается в том, чтобы своевременно вносить изменения в регулирование, чтобы оно не вредило экономическому состоянию тех или иных субъектов. Например, если у граждан есть спрос на проезд и остановку транспорта в каком-то определенном месте, то в результате запрета остановки может сократиться поток клиентов в магазины и рестораны, в итоге снизится инвестиционная привлекательность всего района. За счет накопленных на цифровых платформах данных, например, сервиса Яндекс.Карты, можно связать регуляторные решения с реальным спросом и создать более эффективную модель регулирования», — сказал Израйлит.
Во-первых, сразу же прослеживается непонимание специфики нормотворчества. Описанный пример относится к городской инфраструктуре и не требует изменения законов. Например, для разработки проекта бюджета страны, который принимает Госдума, большие данные были бы крайне полезны, но не в вопросах с определением остановок. Это об уровне понимания проблематики.
Во-вторых, Израйлит недвусмысленно намекает на то, что данные частных компаний могли бы помочь в процессе нормотворчества. Но здесь сразу возникает вопрос: а на каких условиях частные компании будут предоставлять большие данные государству? Готовы ли власти платить за них внушительные средства или же будет разработан некий другой механизм? Но помимо вопросов прикладного характера есть и сущностные вопросы, на которые до сих пор нет ответа как в нормативном поле, так и со стороны государственных игроков.
Битва за рынок больших данных: кто победит?
На сегодняшний день в дискурсе вокруг государственной политики в области больших данных фигурирует три основных подхода: государственнический, компромиссный и бизнес-ориентированный.
Государственнический
Суть подхода заключается в том, что большие данные зачастую являются огромными массивами информации о пользователях различных сервисов (информация о пользователях социальных сетей, банковских сервисов, мобильной связи и.т.д.), соответственно, единственным актором, способным регулировать распоряжение информации о гражданах может быть только государство. И именно государство обязано выполнять свою функцию сохранения неприкосновенности персональных данных граждан, а также обеспечивать их безопасность.
В рамках данного подхода предлагается создать государственного оператора больших данных, которые бы на базе собственных мощностей хранил, обрабатывал и контролировал большие данные по всей стране. Существует несколько идей, как это можно реализовать, например, предлагается создать государственную структуру на базе Роскомнадзора, которая бы и взяла на себя функцию государственного оператора. При такой модели возникает вопрос относительно того, кто будет оплачивать создание информационно инфраструктуры для хранения таких объемов данных. Госорганы и советники президента по развитию интернета предлагают оплатить затраты за счет самих владельцев больших данных. Возникает парадоксальная ситуация, при которой бизнес теряет монополию на собственные данные, еще и платит за собственные потери. Существует идея удерживать 2% от рекламной прибыли владельцев больших данных. Прибыль от использования больших данных огромна. Например, банк ВТБ 24 в прошлом году увеличил чистую процентную маржу от кредитных операций на 16%, и это принесло около 19 млрд руб. благодаря использованию анализа больших данных.
Такой подход имеет как ряд преимуществ, так и множество недостатков. Конечно, государство за счет таких действий повышает свой контроль за населением. При правильном построении систем потокового анализа данных возможно предотвращать теракты, раскрывать преступления и многое другое. Однако издержки высоки: помимо ресурсных затрат на хранение данных повышается и риск взлома баз. Принцип «все яйца в одной корзине» делает информационное хранилище уязвимым. Кроме этого, государственная монополия на свободное использование больших данных, безусловно ударит по бизнесу и темпам развития индустрии анализа больших данных, в которой Россия на данный момент является одним из лидеров наряду с Китаем и Индией.
Компромиссный
Компромиссный вариант предполагает, что государство будет выстраивать политику в области больших данных совместно с бизнесом и экспертным сообществом, учитывая интересы разных сторон. Примерно такой подход был выбран при разработке методических рекомендаций по работе с открытыми данными. Представители экспертного сообщества активно работали и продолжают работать в Совете по открытым данным, который и разработал большинство требований к оформлению открытых государственных данных.
Это позволило учесть интересы разных групп акторов: разработчиков, НКО, представителей бизнеса, представителей самих государственных органов.
Пока наладить полноценный диалог по определению правил игры не удается. Государство не торопится формировать дополнительные структуры для обсуждения. Интересно, что сам процесс выстраивания работы с большими данными находится в руках Минкомсвязи и Роскомнадзора, а не в ведении Открытого правительства как это было в случае с открытыми данными. Изначальная замкнутость Минкомсвязи и Роскомнадзора не позволяет реализовать компромиссный подход. Кроме того, следует отметить, что и сами представители бизнеса не нацелены на какие-либо компромиссы на данный момент.
Бизнес-ориентированный
Крупные владельцы больших данных: банки, мобильные операторы, социальные сети, не хотят, чтобы государство вмешивалось в сферу больших данных, так как любые ограничительные меры неминуемо ударят по бизнесу.
Выработкой бизнес-ориентированной стратегии развития рынка больших данных с октября 2018 года занимается ассоциация, созданная МегаФоном, Mail.ru Group, oneFactor, Тинькофф Банком, Яндексом и Сбербанком.
Очевидно, что частный сектор пытается сыграть на опережение. И если у бизнеса нет возможности решать вопросы нормативного регулирования, то формировать ключевые вопросы повестки за счет СМИ, экспертов и других акторов им под силу.
По мнению представителей бизнеса, государству просто нужно более четко прописать в нормативном поле понятие «большие данные», а также обеспечить минимальное регламентирование, которое бы не позволило контролирующим органом злоупотреблять при исполнении своих функций.
Однако, как мы видим, государство не оставляет надежды на то, чтобы заполучить полный или частичный контроль за большими данными. В развитых странах есть успешные кейсы применения больших данных в процессе принятия политических и государственных решений, и для этого не нужно полностью контролировать рынок БД.
Мировой опыт
По оценкам International Data Corporation, к 2020 году ежегодный объем сбора данных в мире удвоится, а общий размер к 2020 году достигнет 44 зетабайт (это триллионы гигабайт). В развитых странах большие массивы данных уже несколько лет применяются в самых разных сферах.
США и данные об экономике
Вопросом использования больших данных при принятии управленческих решений задались еще в 2012 году в администрации Барака Обамы. Тогда Белый дом выделил $200 миллионов на внедрение БД в органах власти. Более того, к процессу были привлечены и негосударственные акторы, а рынок больших данных с самого начала не планировалось монополизировать: «Мы также хотим предложить промышленности, исследовательским университетам и некоммерческим организациям объединиться с администрацией, чтобы максимально использовать возможности, создаваемые большими данными. Очевидно, что правительство не может сделать это самостоятельно», — говорилось в обращении.
Сейчас большие данные власти США в основном используют в экономике. Показательным стал кризис 2008 года. Экономисты, анализируя оперативную информацию, сигнализировали о надвигающихся глобальных проблемах, однако инертные госорганы не предпринимали никаких шагов, так как у них отсутствовала актуальная информация.
На данный момент Бюро экономического анализа Министерства торговли США производит квартальные показатели по валовому внутреннему продукту, но даже «быстрые» показания идут с месячной задержкой и часто пересматриваются. В будущем агентства смогут предоставлять гораздо более быстрые данные по экономике, прогнозирует Филипп Жордан, президент CFM, французского хедж-фонда, сообщает Financial Times.
«Публикация данных по ВВП ежеквартально будет выглядеть старомодно», — говорит он. «Структура данных очень сложна. Но, возможно, мы могли бы начать с получения ежемесячных данных по экономике, а не ежеквартально. Это был бы хороший первый шаг, заявил Жордан.
Сейчас большие данные используются властями США не только в экономической сфере, но и для обеспечения национальной безопасности, энергетике и других отраслях.
Австралия и повышение эффективности
В 2013 году правительство Австралии приняло стратегию «Большие данные для государственной службы Австралии». Стратегия включает проекты, направленные на реализацию реформ в секторе государственных услуг и обеспечение более эффективной государственной политики и информационной безопасности граждан за счет использования потенциала наборов данных. Разработка стратегии первоначально была указана в Стратегии развития информационно-коммуникационных технологий государственной службы Австралии на 2012–2015 годы. То есть о внедрении больших данных в управленческие процессы там задумались еще до 2012 года.
Сейчас большие данные используются не только государственными ведомствами для принятия решений, но и при анализе предоставления государственных услуг населению.
В Программе повышения производительности труда Австралии было объявлено, что правительство будет использовать большие данные для выявления неэффективности государственных расходов.
В бюджете на 2018 год выделено $65 млн на четыре года для реформирования австралийской системы данных, включая принятие нового Закона об обмене данными и их распространении.
Правительственные учреждения сообщили, что в среднем около трети их работы опирается на данные. Уровень использования данных сильно варьируется в зависимости от агентства, говорится в отчете о внедрении больших данных в 2018 году.
Главная цель — это достижение максимальной эффективности:
— лучшее развитие транспорта именно в тех регионах, где это нужнее всего;
— добыча необходимых ресурсов в нужном объеме и что важно — эффективное распределение этих ресурсов, чтобы в каждом регионе всего было в достатке;
— удовлетворение потребностей австралийцев: спрос на ту или иную услугу выявляется на начальном этапе и быстро удовлетворяется;
— австралийская избирательная комиссия использует данные для расследования фальсификаций на выборах;
— налоговики применяют данные для борьбы с неплательщиками и повышения собираемости налогов.
Это только малая часть сфер, в которых государственные органы Австралии применяют большие данные.
В стратегии развития больших данных на 2018-2020 годы Австралия переходит от стратегии «управления данными» к стратегии «данные как элемент культуры». Данные становятся неотъемлемой частью жизни.
Великобритания и первые проекты
Лондон является одним из лидеров в развитии и применении информационных коммуникационных технологий в процессе управлении. Правительство выделило 158 миллионов фунтов стерлингов на ресурсы высокопроизводительных вычислений в 2011 году и 375 миллионов фунтов стерлингов в 2012 году. С 2010 года data.gov.uk сгенерировал более 10 тыс. наборов данных. Здесь же был создан первый в мире Институт открытых данных.
В целях повышения качества услуг, предоставляемых в Великобритании, в октябре 2012 года при финансовой поддержке Совета экономических и социальных исследований (ESRC) была создана Служба данных. Служба данных — это национальная служба, предоставляющая социологам, исследователям и практикам доступ к данным переписи, социальным и экономическим наборам данных, финансируемым государством.
Правительство Великобритании выделило 64 миллиона фунтов стерлингов для сети передачи данных ESRC, чтобы оптимизировать работу с большими массивами информации.
В 2013 году в Великобритании была принята «Стратегия использования возможности передачи данных», в которой, как и в других развитых странах, закреплялся принцип коллективности работы с данными, к процессу приглашались НКО, исследователи, представители бизнеса.
Сегодня большие данные в Великобритании имеют столь же широкое распространение. Например, одной из проблем было уклонение от уплаты налогов, которое в совокупности обходится Великобритании в 6,9 млрд фунтов стерлингов в год. Благодаря большим данным удалось выявлять неплательщиков.
«Имея данные, мы можем тратить меньше времени на разработку политического курса и услуг, которые не работают, и вместо этого сосредоточиться на постоянном улучшении тех, которые работают», — написал в своей статье Исполнительный директор Государственной службы Джон Манцони.
В системах иностранных государств данные — это ресурс, который значительно повышает эффективность политических и государственных решений, в России сегодня большие данные воспринимаются тоже как ресурс, но, скорее, ресурс контроля за гражданским обществом и бизнесом.
Отсутствие государственных больших данных
Последней, но немаловажной проблемой применения больших данных российскими властями является отсутствие качественных государственных массивов информации.
Росстат в последние годы — едва ли не самое критикуемое ведомство. Причем данные Росстата критикуют как члены правительства, так и гражданские активисты, которые не могут эффективно работать с государственной информации.
Примеров по-настоящему больших государственных данных в России не так много. Реально большие датасеты предоставляет ФНС, Росреестр, Ростуризм и еще несколько ведомств. Разрабатывать на их основе механизмы ситуативного изменения законодательных норм — это довольно бесполезное и малоэффективное занятие.
Поэтому новую инициативу Сколково необходимо рассматривать как очередную попытку государства получить контроль за частным рынком больших данных. С реальным внедрением передовых технологий в процесс принятия политических и государственных решений она не имеет ничего общего.
Получив хоть какой-то контроль над частными большими данными, власти серьезно повысят управляемость обществом. Государство может знать о всех банковских транзакциях, получать данные сотовых операторов и многое другое. Все это увеличит присутствие государства в частной жизни каждого человека.
Все поступающие сигналы говорят о том, что власти склоняются к выборы государственнического подхода в вопросах регулирования больших данных.
Михаил Карягин