• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

119017 Москва, М.Ордынка, 17, стр. 1
телефон: +7(495)772-95-90*22237
e-mail: wec@hse.ru

Руководство
Департамент мировой экономики: руководитель Макаров Игорь Алексеевич
Департамент мировой экономики: научный руководитель Григорьев Леонид Маркович
Заместитель руководителя Клочко Ольга Александровна
Секции
Секция мировой экономики Мозиас Петр Михайлович
Секция энергетических и сырьевых рынков Крюков Валерий Анатольевич
Секция торговой политики Портанский Алексей Павлович
Секция глобального экономического регулирования Зуев Владимир Николаевич

Партнеры

Книга
Исследования будущего для долгосрочного развития ТЭК

Лихачев В. Л., Лихачева Е. В., Макаров И. А. и др.

М.: Издательский дом НИУ ВШЭ, 2024.

Статья
Кредитное поведение граждан России в период пандемии COVID-19

Ларионов А. В.

Мониторинг общественного мнения: Экономические и социальные перемены. 2024. № 4. С. 219-242.

Глава в книге
Keep Your Seatbelts Fastened: Political Turbulence Will Continue to Disrupt Economic Growth

Bondarenko K.

In bk.: Emerging Markets Decoded 2024. M.: SKOLKOVO Moscow School of Management, 2024. Ch. 2.2.. P. 31-42.

Лекция Ивана Бегтина «Открытые данные в цифровой экономике»

12 марта на факультете мировой экономики и мировой политики НИУ ВШЭ состоялась открытая лекция Ивана Бегтина об использовании данных в современной экономике.

Мероприятие состоялось в рамках магистерского курса «Цифровая экономика и технологические мегатренды». Иван рассказал о трендах в технологических компаниях, как и почему о пользователях собираются их личные данные и о навыках, которые необходимы для работы с большими объемами числовой информации. Слушателей, студентов магистерской программы «Мировая экономика», больше всего заинтересовали кейсы технологических компаний и проблемы защиты от отслеживания через мобильные устройства. По мнению лектора, мобильным приложениям доступно гораздо больше детальной информации, чем предпочли бы многие пользователи, однако, возможно научиться использовать особенности новой цифровой среды.

Давайте прежде, чем я начну, вы немножко расскажете, чего вы ждёте и хотите услышать. Вы же учитесь на программе «Цифровая экономика», правильно? Что вы хотите получить по итогам выпуска с этой программы?

Так, хорошо. Кто из вас умеет программировать? Есть, вижу, 1 человек есть. А кто из вас хочет научиться программировать? 2 человека есть, прогресс. А кто из вас вообще понимает, зачем нужно уметь программировать? Это не совсем так. Но вас же учат не на программистов. Вас учат на экономистов, если я правильно понимаю. Хорошо. А кто из вас какой-то бизнес хочет открыть, проект сделать, стартап? Так, есть.

Тогда давайте я начну с некоторого тезиса, который абсолютно про программистов, но он справедлив ко всем технологиям, которые есть. Главная причина, почему я говорю всем «Надо учиться программировать», вне зависимости от того, будете ли вы делать это сами или нет: всё, что касается разработки программных продуктов, мобильных приложений, вебсайтов, всего остального – оно устроено так, что люди, которые занимаются этим профессионально, говорят на своём профессиональном сленге, который, в общем, довольно специфичен. Они никогда не будут говорить на вашем языке, вот вообще никогда. То есть, программист, который начинает говорить юридическим языком или языком экономистов, как правило, довольно быстро открывает свою компанию и не нуждается в ком-нибудь ещё чаще всего. Но таких людей единицы. Вот.

Большая часть программистов живут, в общем, в своём мире. Для того, чтобы с ними взаимодействовать, если вы хотите организовать свой проект, участвовать в команде, сделать продукт, запустить стартап, – вам надо уметь с ними разговаривать. И это требует некоторых навыков понимания техники вводных, работы с большими данными, системы основных определений, что возможно, что невозможно, что есть.

Хорошо, например, кто из вас может дать определение «большим данным»? Big data ? Вы же слышали об этом? Ну, это правильный ответ, что действительно, как это правильно – никто точно сказать не может. Это маркетинговый термин, и у него нет прям чёткого определения, есть некоторая совокупность. Одна из них – это то, что большие данные – это те данные, которые вы не можете обработать на своём персональном компьютере, то есть, база достаточно большого размера. А второе определение (в каком-то смысле более точное), что большие данные – это совокупность технологий, позволяющих работать с данными, которые вы не можете обработать на своём компьютере. То есть, в первом случае это условная некоторая база данных, в которой вы работаете, а второе – это некоторые направления, которые породили огромный рынок.

Все крупнейшие компании, которые только существуют сейчас, – какие это компании, можете мне сказать? Крупнейшие компании в мире? Крупнейшие, необязательно IT – любые. Google уже нет. Amazon – тоже нет, но близко к этому, да. Alibaba – да, в каком-то смысле.

Вот смотрите, компания Google давно превратилась из компании Google в компанию Alphabet , которая объединяет огромный пул технологических компаний и является таким некоторым технологическим холдингом. Сейчас в мире IT не существует само по себе, существует понятие «технологические компании» – как правило, это компании, которые впитывают и распространяют внутри себя некоторый пул инноваций по направлениям.

Одно из них – это большие данные. Ну, то, что будет касаться больших данных, уже инновациями не считается, то есть большие данные – это как бы заказывающийся тренд: о них всё ещё говорят, ими всё ещё пользуются, они необходимы, но они стали для большинства из тех, кто с ними работает, некоторой частью повседневности. То есть, это уже не инновации. Есть технологии искусственного интеллекта, о которых вам важно задуматься уже сейчас, потому что через некоторое время это будет занимать ваши рабочие места. Вот, есть технологии Anti Tech Manufactoring – это данные и способы организации производства. Есть технологии интернет-вещей – это когда задействуются только ваши мобильные телефоны и всё, что вы с собой носите, не только в виде браслетов, но и просто одежда, кольца, браслеты, серьги, ботинки, – всё это будет следить за вами и за окружающим пространством так же, как и сейчас это не происходит.

В принципе существуют более 30 таких вот наиболее прорывных технологий. Есть пул компаний, из них Alphabet , Facebook , Microsoft , все остальные, ещё которые ранее были либо IT , либо технологические, Amazon , который приближается, Alibaba – трудно сравнить капитализацию, это китайская компания, Facebook – компания, основанная в Соединённых Штатах. Так вот, главные изменения последних 5 лет в том, что именно эти IT -компании – это основные компании в мире. Их капитализация очень… выборка по капитализации, первые топ-5 компаний – это компании технологические. А все остальные компании, вы слышали про digital transformation (цифровая трансформация). Так вот этот непустой термин – это попытка всех компаний с классической бизнес-моделью, существующих на классических рынках, реорганизовать своё производство, бизнес-модель, сервисы под, собственно, новые цифровые продукты.

Теперь давайте просто в качестве первого тезиса в рамках цифровой экономики. Ну, называется он «технологии пожирают всё». Это очень неприятный тезис для всех тех, кто существует на классических рынках. Кто из вас пользуется Яндекс Такси, Убером? То, что они появились, – это хорошо или плохо для вас? А что хорошего? Ещё. Дешевле. Ещё.

Как собрать всё, что вы описали, вместе? Это изменение модели рынка, бизнес-модели. Существовали таксопарки. Некоторые самые продвинутые из них с очень большим количеством машин, есть таксопарки на тысячи машин в Москве, у которых были свои мобильные приложения, через которые можно было их вызвать. Вот я до сих пор пользуюсь таксопарком, одним из приложений Ситимобил. Это был таксопарк, большой, который, собственно, обеспечен. Есть такси «Максим», есть множество других, которые существуют, но все они сдулись, как только появились Яндекс Такси, Uber , Gett , другие иже с ними аналоги, потому что они всё, что вы описали, собрали в одну единственную модель – перевернуть рынок.

До недавних пор рынок такси был рынком продавца, когда у вас фактически не было особого выбора: вы выходили с трапа самолёта, вы выходили через вокзал и вам приходилось садиться на тех таксистов, на тех условиях, которые они вам задавали. Если вы ловили такси на улице, опять же вы жили по принципам правил, называемых продавцом – таксистом. Эти сервисы сделали роль таксиста абсолютно бессмысленной в автомобиле, его можно заменить на робота. Главная причина, почему Uber имеет максимальную капитализацию среди всех подобных компаний, которые имеют стартапами инновации, – именно по той причине, что все инвесторы стратегически рассчитывают, что как только будут системы искусственного интеллекта по дорогам, водители исчезнут. То есть, все, кто сейчас являются водителями такси, - они потеряют свою работу. Цифровая экономика устроена именно так, что огромное количество классических рынков полностью исчезает: их заменяют некоторые новые сервисы и возникает некоторая сверхконцентрация возможностей, сбора данных, полномочий, капитала, всего остального. Фактически, у вас взаимодействие происходит с некоторым, там условно, одним, двумя, тремя брендами. Вот это одно из ключевых изменений.

То, что я описал, – это не является технологией, которая называется «disruptive» (разрушающая). Это технология организационная, глобальная реорганизация, которая затронула и Airbnb , и Booking . com , кто из вас ездил куда-либо и снимал гостиницу через Booking . com ? Все. Давайте исходить из того, что все, или Airbnb . Это стали стандарты де-факто для разных рынков, и они стандартны де-факто настолько, что отели боятся, боятся этих агрегатов. Владельцы квартир боятся Airbnb , водители такси боятся этих агрегатов, которые определяют там оценки, все практически отели боятся низких цен, жалоб Booking . com , потому что эти доминирующие компании по модели того же самого Uber ’ a сконцентрировали в себе внутри буквально всё, о чём мы говорим.

Это создало на рынке ниши, в которых стали агрегироваться огромные потребительские данные. Причём эти данные собираются как через добровольный сбор, когда вы сами даёте о себе информацию, т.е. когда вы выбираете телефон – Samsung , Xiaomi , Apple – важно выбирать, кому вы отдаёте информацию о себе. Вот. Шутка обычно в том, что отдаёте вы это корейским спецслужбам, или китайским, или японским. В России не производят телефоны, поэтому, к сожалению, российским вы ничего не отдаёте. К сожалению, конечно. Но, по сути, это так. И это данные, которые собираются от вас без вашего желания, без вашего решения.

Есть те данные, которые собираются добровольным образом. Тот же Booking . com , тот же Airbnb , тот же Facebook , куда вы постите информацию о себе, ВКонтакте, Яндекс Такси – они все собирают в концентрированном объёме огромные объёмы данных, которые используют для того, чтобы зарабатывать на вас больше денег.

Цифровая экономика основана на том, что компании, обладающие доступом к соответствующим технологиям, собирают максимум информации о вас в первую очередь для того, чтобы с одной стороны (хорошая часть), поставить вам новые продукты, новые сервисы, перевернуть рынок, как это сделали Яндекс Такси, как это сделал Uber , как это сделал Airbnb , – это всё поменять рынок, и вы соглашаетесь с этим, потому что этот рынок становится рынком покупателя. Но, с другой стороны, эти же компании сверхконцентрируют информацию о вас же самих, собирают о вас то, что вы о себе не знаете.

Я часто привожу в пример, и давайте вы как-то тут отгадаете, в определённый момент Walmart (это крупнейшая торговая сеть Соединённых Штатов, в 62 году была образована) на полках с молоком стали ставить рядом пачки презервативов. Как вы думаете, почему они это делали? Попробуйте в обратную сторону воспроизвести их аналитику.

Ну, за многие мои лекции сразу сходу угадали. Да, они проанализировали, что молодые пары, которые обзаводятся, как правило, первым ребёнком, они всегда выдерживают до следующего ребёнка некоторую паузу, как минимум год, пока он не вырастет. Есть некоторые рекомендованные врачами ожидания между рождением первого ребёнка, второго, третьего и так далее. Поэтому если кто-то покупает молоко, особенно молоко определённой жирности, они смотрят по чекам лояльности, что эти люди одновременно стараются предохраняться. И когда они стали ставить два этих продукта рядом, у них продажи возросли.

Из таких маленьких, мелких, но в огромном количестве трюков состоит почти весь ритейл. Он состоит из психологических трюков (дезориентировать потребителя), он состоит из психологических трюков, какой стоимости, какого цвета, как расположены должны быть мелкие продукты, когда вы проходите мимо кассы. Это всё, так сказать, мерчендайзинг высокого уровня. И всё это работает вплоть до того, что автоматически анализируется сканерами, автоматически анализируется ваша реакция на цвет, на свет, на тот или иной продукт, и потом это всё конвертируется.

Многие из вас наверняка видели Яндекс, который показывает рекламу после того, как вы что-то купили или зашли на какой-то сайт. Вы зашли на сайт, посмотрели моторные лодки, и потом вас целую неделю преследует реклама моторных лодок. Это всё происходит, потому что отслеживается некоторым образом трек ваших действий. Вот. Более умные системы – они не будут вам предлагать то, что вы как-то один раз захотели. Они постараются либо допродать вам этот ваш интерес, либо предсказать ваше поведение на основе какого-то количества других людей, которые условно шли по некоторому треку, как вы, которые какого-то одного особенного возраста, которые точно так же сначала посмотрели моторные лодки, потом купили одну, купили третью, купили четвёртую, и это автоматически пересчитывают. Поэтому значительная часть, если не большая часть всего, что касается цифровой экономики, – это мониторинг и манипулирование потребителями, которыми мы с вами являемся.

Как я уже говорил, это имеет очень хорошую сторону, потому что вы получаете новые продукты, действительно новые продукты, и действительно реклама, которая вас преследует, – она ближе к вашим интересам, чем то, что было до этого. А с другой стороны, конечно, цель – погрузить вас в определённый трек потребления, с которого вы можете куда-то разветвляться, но в принципе вы уже становитесь предсказуемы и на вас все бренды, все концентраторы внимания пользователей хотят заработать кучу денег.

То, что я описал сейчас, – это то, что в каком-то смысле является основой технологии больших данных. В отличие от космических технологий, в которые государства инвестировали там миллиарды рублей и долларов, в отличие от атомной промышленности, которая тоже является условно инвестициями государства, всё, что касается работы с большими данными, было не от государства. То есть, в начале в других областях часто государство делало инвестиции, там даже в электронику, в начале были огромные инвестиции в полупроводниковую технику, как раз в Калифорнии появлялись первые компании, которые этим занимались, и потом только приходил частный бизнес.

Здесь произошло всё ровно наоборот. В начале частный бизнес проинвестировал огромные средства и постоянно развивающимися инструментами для того, чтобы обрабатывать данные условно любого объёма. Дата-центры Гугла, дата-центры Амазона, дата-центры Алибабы – одни из крупнейших. Сейчас только вот государства пытаются делать что-то похожее. У китайцев есть большие инициативы по строительству прям в пустом поле огромных ЦОДов, в России этого совсем чуть-чуть (то, что есть на базе Ростелекома и налоговой службы), в Соединённых Штатах очень много разных ЦОДов, но все они не сравнятся с частными инвестициями в эту область.

И сейчас, когда вопрос про цифровую экономику возник, когда он возникает и в государственном контексте, и в частном контексте, – всё идёт от того, что эти технологии, которые разрабатывались для быстрой монетизации, стали применяться для огромного количества других областей. Причём технологии эти появились в разных формах. Условно, есть куча коммерческих проектов, продуктов, может быть, вы слышали, там базы данных типа Oracle , MYSQL , DBT , есть очень много крупных компаний, которые разрабатывали проприетарные технологии, там IBM , Microsoft – они все инвестировали большие средства.

Но, хотя я уже говорил, что IT -компании, все крупнейшие компании – они на самом деле не IT . Это компании технологические. Это означает, что их бизнес-модель уже давно не на продаже программного обеспечения. Программное обеспечение сейчас в мире – это основа бизнеса только одной из крупнейших технологических компаний – Microsoft . Все остальные продают услуги, сервисы.

Ваш телефон станет железкой, которую можно просто выкинуть, если Apple (ну или, соответственно, Google , если у вас Android ) отключат вас от всех сервисов. Просто они так устроены, что операционные системы, набор сервисов, в которые они встроены – это некоторый сервис, который вы покупаете. Вы покупаете, платя за это не деньги, за это платит деньги тот разработчик железа, и вы отдаёте свои данные. Ну, на самом деле, мир сейчас с мобильных устройств устроен так, что вы отдаёте их либо Гуглу, либо Apple , за очень маленьким исключением.

Так вот, вот эти компании, которые разрабатывают сервисы, – они являются крупнейшими инвесторами, которые вместо того, чтобы участвовать в рынке программного обеспечения, они его тоже поломали, как Яндекс поломал рынок такси (ну, соответственно, Яндекс, Uber ), сделав его клиентским. Так и сервисные компании поломали рынок программного обеспечения, очень много проинвестировав в открытое ПО. Они тем самым значительно снизили свои издержки, они почти никто не пользуются проприетарными продуктами, кроме очень конкретных задач, но инвестируют огромные средства в Linux (операционная система), в базы данных, открытые и свободные, такие как MYSQL , PostgreSQL и многие другие. Ну и, в общем, Google проинвестировал, создав сервис Google Documents с тем, чтобы практически заменить Microsoft Word и многие сервисы теперь – он уже перестал быть обязательным – и поменяли модель конкуренции, поменяли модель использования.

Технологии работы с большими данными (такие продукты, как Hadoop , или база Spark , или HBase – тоже порождение некоторое Hadoop ’ a ) – так вот все они открыты. В принципе, никто не ограничивает прямо сейчас взять любой из этих продуктов и начать анализировать там. Порог вхождения стал минимальным: вы можете арендовать сервер практически любой мощности на день/неделю/месяц, вы можете взять одни из уже опубликованных, открытых данных, и вы можете прямо сразу это всё делать, уже используя открытое ПО.

Кто из вас слышал про Kaggle? Это специальный сервис, который используется data – scientist ’ами, людьми, которые работают с данными непосредственно напрямую. Это сервис соревнований. Это сервис, на котором крупные компании выкладывают базы данных чего угодно: например, есть огромная база, по-моему, у Boeing ’ a выложенная, всех фотографий кораблей, находящихся в море в разных портах, рядом может находиться что-то ещё (остров, город и так далее), и они запустили огромный конкурс-соревнование для data – scientist ’ов, с помощью которых те разрабатывают алгоритм определения на изображении, что это именно корабль, что это не здание, которое стоит рядом, что это не полоска суши, не что-то плавающее, а именно корабль. Вот. Они провели конкурс вполне успешно, те, кто выиграли, получили призы и оффер на то, чтобы там работать.

Это огромные данные, то есть, там десятки и сотни гигабайт этих картинок, которые надо было скачать и обработать. Люди, которые в этом участвуют, – это просто ну ребята-разработчики. Они арендуют сервера (это не требует сейчас очень больших расходов), вот, поэтому у нас произошла такая демократизация работы с данными, с одной стороны, возник на это большой спрос. С другой стороны, конечно, и сами масштабы работы – они растут.

Смотрите. Сейчас я могу продолжить про то, чтобы поговорить немножко про то, как у нас в России всё устроено, я могу немножко рассказать, как устроено образование в области данных, могу рассказать вам про то, как устроена индустрия, связанная с большими данными. Что вам интереснее? Про индустрию? Хорошо. Спасибо.

Одна из самых модных профессий сейчас, причём не только в частных компаниях, но и в государстве, – это data – scientist ’ы. Это люди, которые могут иметь разный бэкграунд (чаще всего математический, но необязательно), но которые работают с данными напрямую и работают, как правило, с большими объёмами данных. Данные используются в самых разных продуктах. То есть, есть компании, которые под это заточены (ну, в России это Yandex , Mail . Ru ) и которые действительно следят, в основном, за пользователями, но не только. Они создают и другие data -продукты, так сказать, на пользователя ориентированные.

Всё это требует того, чтобы люди с этим работали. Теперь, в чём возникает сейчас первая проблема применительно к большим данным, но это касается всех технологий, которые входят в цифровую экономику. Образовательные программы не поспевают за технологическими изменениями. То есть, если в определённый момент у вас возникает ощущение, что вас учат не тому, что происходит вокруг, – ну, это не вина тех, кто вам составляет программы, а, в общем, это вопрос к вам, потому что огромное количество курсов, которые позволяют учиться, сейчас доступно онлайн. Поэтому технологии работы что с большими данными, что с интернетом вещей, что со всем остальным, – они основаны, в основном, на самообучении. На самообучении, на основе довольно качественных курсов, которые разрабатывает в том числе любимая вами Высшая Школа Экономики. Они есть на Курсере, они есть на других онлайн-ресурсах. Они довольно качественные, я могу сказать, что я при том, что много лет уже преподаю (правда, в основном для взрослой аудитории 30+), но я параллельно учу, минимум прохожу 2 курса параллельно там с Курсерой, с чего-то ещё. Нет другого способа поддержать свои знания кроме непрерывного обучения, life – long learning .

Для того, чтобы начать работать с данными, нужно всего 2 вещи. Первая: понимание задач, которые вы будете исполнять, хотя бы приблизительно в какой теме вы хотите работать. Например, вы хотите там быть исследователем рынка кинофильмов, работать дата-аналитиком. Или вы хотите делать там экономический анализ другого масштаба, уровня, измерения социально-экономического эффекта. Вот, первое – это понимание задач. А второе – это исключительно ваше время и внимание, потраченное, собственно, на вот эти самые курсы.

Есть такие курсы, как Delta Camp , в которых у вас может быть любой стартовый уровень, прям совсем онлайн, вы можете прямо сесть и начать изучать язык R . Я могу сказать, что вот в моей команде есть 2 человека, которые присоединились ко мне, не имея никакого технического образования. То есть, у одной девушки было образование журналистское, у другой – историк. Они просто сказали: «Я хочу учиться программированию, и я хочу работать с данными», всё, этого достаточно. После чего я их отправил пройти онлайн-курс, и вот сейчас у меня ведущий аналитик – это девушка, которая просто была много лет очень профессиональным журналистом. Она, наверное, лет 10 писала разные статьи, а сейчас она работает с данными. И такого довольно много. Это всё зависит исключительно от вашего времени и желания.

И это первое для чего? Для индустрии. В индустрии, как бы это странно ни звучало, вообще сейчас главный запрос не на людей с высшим образованием (если только оно не жёстко профильно по этой теме), а на людей, которые обладают навыками работы с конкретными инструментами (ну, я уже упоминал: Hadoob , HBase , их довольно много), владеющих определёнными языками программирования, понимающих технологическую структуру, способных вести проект, анализировать, работать, и всё это, как правило, упаковывается в курсы и всё остальное.

Практически всё онлайн-образование, которое бесплатное либо платное, – это такая double – sale : его продают вам, и вас продают потенциальным работодателям. То есть, это бизнес Курсеры, когда им платят работодатели за возможность направить оффер лучшим студентам, и за это платят, собственно, сами студенты. Практически весь рынок, всё, что касается больших данных, он устроен именно так.

Сами большие данные организованы по модели того, что я называю «Data corporations». Например, Яндекс – это дата-корпорация. Его бизнес-модель основана на том, что данные туда входят и не выходят. Если вы попросите у Яндекса (некоммерческой организацией запросите): «А можно там вот воспользуемся вашим сервисом бесплатно?», я скажу: «Да да да, конечно, можно». А если вы спросите: «А можно у вас там получить статистику чего-то там или такие-то данные?», они скажут: «Нет, мы вам не дадим». Даже каким бы невинным ни был ваш запрос.

Модель рынка компаний, работающих с данными, основана на осознании ценности этих данных. Данные имеют ценность всегда: данные персональные, статистические, ну практически любые. Дата-корпорации изменяют пространство таким образом, чтобы эти данные в себя вбирать.

Ну, модель поисковых систем изначально была на том, что был некоторый неопределённый правовой статус информации, лежащей свободно в БЭМе, их можно было проиндексировать и по модели Opt out , то есть, кому не нравится – пусть отключат себя от поисковой системы. Они основывались на бесплатном топливе. Они основывались на открытых данных, которые публиковало государство и публиковали другие игроки. Они основываются на покупке данных.

Ну, вот, я часто упоминаю в России Яндекс: Яндекс покупает данные у транспортных департаментов многих субъектов и так далее, и благодаря этому вы имеете возможность видеть движение автобусов на карте Яндекса. Точно так же делает Google , точно так же делает Microsoft c их сервисами. Кто-то покупает данные, кто-то получает их как открытые, кто-то как-то ещё. Но по сути это гигантский рынок, в котором есть публичная часть, которую вы видите, – это те данные, которые как бы, например, имеют финансовую ценность (финансовые рынки – это всегда были рынки данных), и большую серую часть, когда торгуются данные, которые не должны торговаться.

Там есть и совсем чёрная часть, это когда какие-нибудь нехорошие представители одних органов продают сведения о людях из других органов. Когда арестовывали сотрудника МВД, который слил информацию о российских разведчиках, – это вот пример чёрного рынка, то есть, который есть по проверке разных людей. Есть сервисы пробива людей, и информация в них – это чёрный рынок, это рынок данных.

Есть серый рынок. Серый рынок – это, например, персональные данные. Если вы распарсите ВКонтакт, получите базу данных, потом решите кому-то её продать, – вы, в общем, нарушите закон. Наверное. Компания Double Data , которая предоставляет сервис кредитного скоринга для банков, – она собирает данные из социальных сетей, основной из которых является ВКонтакт. Они распарсили практически весь его и делают это практически на регулярной основе. В определённый момент компания Mail . Ru , которая является владельцем ВКонтакта, подала на них в суд, и это убило их полностью от возможности использовать ВКонтакт для чего бы то ни было, сказав, что типа данные, которые есть в социальной сети, – это наши данные. На что Double Data сказала: «Нет, это общедоступные персональные данные, и они принадлежат только самим людям. Мы имеем право их использовать, а вы там только управляете технологической платформой». Ну, закончилось после нескольких судебных заседаний пока ещё не до конца, скорее Double Data , чем Mail . Ru , но скорее всего в итоге Mail . Ru победил.

Аналогичный процесс был с социальной сетью Linkedin , только там была другая история. Linkedin управляет Microsoft , Microsoft в определённый момент отрубили американский стартап, который извлекал из Linkedin данные. Те пошли в суд, сказали: «Эти персональные данные общедоступны, мы хотим их иметь». Суд встал в позицию этого стартапа и сказал, что Microsoft не имеет права ограничивать другие компании в использовании общедоступных данных. Вот. И те продолжают их использовать.

Но это рынок, в котором есть некоторые границы, которые меняются, и очень многие сервисы, основанные на данных, – они используют их незаконно. Те, кто знают условия использования Яндекс Карт, знают, что вы имеете возможность гео-кодировать данные, то есть, например, у вас есть адрес, - вы можете получить его гео-координаты, у Яндекс есть специальный сервис. Вы не имеете права их хранить, условия использования Яндекса запрещают. Это все нарушают, включая госорганы, которые используют Яндекс Карты для отображения каких-нибудь объектов, чего бы то ни было. Но такие условия есть.

Соответственно, рынок больших данных сейчас – он фактически основан на нескольких, я бы сказал, ключевых направлениях. Первое – это сервисные компании. Это компании, которые, в основном, предоставляют массовые потребительские сервисы (иногда B 2 B , но чаще B 2 C ). Они лидируют, и они работают ровно по той модели, которую я описал: data in , but not out . То есть, данные попадают, данные не выходят.

Второй большой блок компаний – это компании, которые, условно, сервисные для первых и для масс-маркета и B 2 B – это разработчики технологических решений. То, что я вам рассказывал, про открытый исходный код – это некоторая бизнес-модель, которая поменяла то, что меньше продажи софта, но больше продажи услуг, с ним связанных. И огромное количество компаний занимаются услугами поддержки обеспечения работы с технологиями, работы с большими данными. И есть какой-то пул малых рынков, связанных с обучением, связанных с подготовкой специалистов, с работой над разными большими данными.

При этом есть нечто, что всё сейчас меняет. Ну, давайте для начала я вам задам вопрос: как выдумаете, какие самые большие данные, которые, условно, в мире создаются? Давайте даже более конкретно: среди данных, которые есть (я описал), есть данные, которые закрытые (ну, то есть, которые никому не отдаются либо они общедоступны), а есть данные открытые, которые специально публикуются, чтобы все могли их использовать. Там, это данные, например, в России из порталов каких-то данных, такие порталы есть по всему миру. Так вот, как вы думаете, какие данные самые большие из публикуемых вот такими вот для общественного использования?

Социальные сети? Ну, они не открытые. Они как раз требуют разрешения. Ну, это не данные, это сервис.

Хорошо. Огромный коллайдер генерирует примерно 1 петабайт в день. Не все эти данные сохраняются, но общий поток, который идёт с сенсоров, примерно такого объёма. Эти данные доступны онлайн на сайте Церна, поэтому до сих пор научные данные при этом являются одними из крупнейших.

Одна из причин, да, и вот, собственно, почему я ожидал от вас другого ответа (у этого вопроса есть 2 правильных) – так вот, научные данные сейчас крупнейшие, которые создаются, – это данные, поступающие с сенсоров разных устройств, которые считывают информацию с измерителей землетрясений, с радио-телескопов, которые записывают всё, что они слышат и видят, с телескопа Hubble , который висел на орбите, с разного рода других датчиков.

Вот, мир меняется. То, о чём я кратко до этого упомянул, – это такая система интернет-вещей. По всем предсказаниям, которые есть сейчас у аналитиков рынка, о том, что интернет вещей будет создавать примерно минимум в 10 раз больше данных, чем всё, что создаётся сейчас. Это минимум. А скорее всего, значительно больше.

Интернет вещей – это, ну, у всех есть мобильные телефоны? Так вот, в мобильном телефоне каждое приложение, которое у вас установлено, – оно следит за вами. Каждое. Все, которые устанавливаются бесплатно (то есть, бесплатный сыр, как говорят, только в мышеловке), да, все бесплатные приложения следят за вами обязательно. Все платные следят за вами, в общем, тоже обязательно. Потому что если вы ещё и заплатили, то за вами надо обязательно следить, вы же ещё можете заплатить. Вот.

При этом все они существуют в эко-системе тех операторов, которые предоставляют сервисы: Google , платформа Android и их маркетплейс и Apple , соответственно, с их маркетплейсом. Эти 2 компании допускают всех остальных к сбору данных о других на тех условиях, которые они дают.

Есть компании, чей бизнес на 100% построен на продаже данных о вас. Ну, не так давно, вот, было очень интересное интервью одного из создателей мобильного приложения …, которое позволяло играть в компьютерные игры на телефоне, в самые разные. Бесплатно и  до того, как они вышли в массовый эфир. То есть, можно было протестировать какое-то бета-приложение. Тогда это было супер-популярно, бесплатно, но оно монетизировалось, потому что все game -дизайнеры, game – девелоперы платили, потому что они получали информацию об аудитории значительно до и очень подробную ещё до выпуска своего приложения. Это очень успешный коммерческий проект, основанный исключительно на данных.

Кто-то из вас наверняка читал и видел материалы о Сноудене, о том, что он публиковал, о деятельности ЦРУ и так далее. Там было очень много технических презентаций, прям действительно хорошо описанных, подробных, о том, как с помощью мобильных телефонов можно следить за деятельностью человека. Ну, вы знаете, что с помощью телефона, например, можно определять… то есть, вот, есть гироскопы, да, вот вы двигаете, и он меняет экран. Гироскоп позволяет ещё определить, сидите вы, идёте вы, поднимаетесь ли вы, спускаетесь ли вы и многое другое. То, что сейчас умеет делать фитнес-браслет. На телефонах это делают гораздо более грубо, гораздо менее точно, но информацию эту тем не менее собирают. И приложения, которые имеют доступ к гироскопам, – они, разумеется, эту информацию передают и знают о том, чем вы занимаетесь.

Например, это было в том числе в презентациях Сноудена. Это было – сколько? – ну, уже больше 5 лет назад. Сейчас всё стало гораздо более продвинутое, платформы постоянно меняются. Сейчас кроме телефонов у всех присутствующих есть фитнес-браслеты? У кого-то есть? Никто не пользуетесь? Шутка обычно в том, что фитнес-браслет – это лучший способ сообщить всем о времени, когда вы занимаетесь сексом. Потому что, ну, если только вы, конечно, его не снимаете его в ответственный момент. Они с вас снимают огромное количество личной информации. По вашей кардиограмме, по пульсу, по всему остальному можно сделать довольно много выводов, которые, там, начиная от того, внимательно ли аудитория слушает лектора, и продолжая тем, вообще, чем вы хронически больны, и что-то можно там ещё продать или что-то сделать.

Так вот, таких вещей, как фитнес-браслеты, сейчас становится больше. У кого-нибудь из вас есть home assistant – это то, что называется устройством, которое продаёт Яндекс? Дадада, оно всегда подслушивает, его нельзя выключить. Смотрите. В России они ещё не очень популярны. У нас есть только Яндекс, который продаёт. Эти самые ассистанты, которые делаются для других стран, – они всё-таки в основном ориентированы не на русскоязычную аудиторию, там надо распознавание голоса, языка. Ну, они есть, они просто ещё не набрали популярность у нас. Я в том числе и это отношу к набиранию популярности. Если бы это было востребовано аудиторией – сейчас бы их довольно быстро начали бы адаптировать.

Ну, в Соединённых Штатах, в Китае, в других развитых странах Европы это сейчас массовое явление. И это то, что относится к интернету вещей – то, что слушает вас постоянно. Все из вас, кто сидят за ноутбуками, – фактически они сделали так, что компании Microsoft и Apple следят и слышат всё, что здесь говорится. Нет, это не значит, что они будут это использовать, это значит, что им вообще это как-то интересно. Это значит, что Microsoft , начиная с Windows 10, включила везде сервис Katana , который записывает голосовые сообщения. Почему это происходит? Потому что для того, чтобы распознать голос, надо постоянно слушать, постоянно писать. Вот. Ваш ноутбук, начиная с определённой версии Windows и определённой версии, соответственно, Mac IOS X , следит за вами. То, что за вами следит телефон, я уже говорил. Фитнес-браслеты – всегда.

Кроме того, появляется огромное количество других способов, то, что называют, инструментов, датчиков, которые собирают эту информацию. В Сингапуре на лампах установлены датчики, которые следят за вашими движениями. Это камеры, которые следят, как вы двигаетесь и распознают ваши лица, что вы делаете. Это датчики WiFi , которые определяют модель, серию вашего телефона, номер, датчики Bluetooth и многое другое.

У этого есть применение вполне коммерческое или государственное – называется «городское планирование», urban planning . Если вы хотите правильно спроектировать город, вам надо знать, сколько людей примерно проходят по этой улице. У этого есть, разумеется, и не очень гуманное использование, потому что если будут какие-то волнения, власти Сингапура в любой момент знают о том, какие люди там собрались и что они там делают.

Я сознательно не буду вам приводить примеры из России, потому что у нас всё-таки самое демократичное и прекрасное государство в мире. Вот. Я вам приведу пример из каких-нибудь более страшных стран, таких как Соединённые Штаты. Сервис «Geofeedia». Geofeedia – это был стартап, который продавал услуги полицейским департаментам в Соединённых Штатах, условно, state departments , т.е. это на уровне отдельных штатов, который позволял следить за группами людей на определённых локациях. То есть, вы, например, указываете площадь какую-то, и все сообщения в социальных сетях с гео-тегами по этой площади вам шли потоком, с отображением на карте, таблицей, с распознаванием текста как потенциально offensive и так далее, и так далее, и так далее. Вот у вас весь социальный поток, который почему и назывался Geofeedia , он выдавался с некоторым отслеживанием того, что делает человек, который, соответственно, отправляет эти сообщения в социальной сети.

После того, как полиция Штатов (собственно, был скандал) застрелила американца, американского подростка, то Geofeedia подверглась мощнейшей общественной критике, потому что полицию как-то подозревали, обвиняли в том, что они использовали этот сервис для того, чтобы разгонять демонстрации. Вот. После чего сервисы, из которых они черпали данные, заблокировали им доступ. У Твиттера есть такой «fire hose», как-то «пожарный шланг», как они называют, – это возможность получать их твиты в огромном потоке не так, через их внешний публичный IP , а их бизнес на самом деле о том, что они дают вот этот вот большой шланг доступа ко всему потоку по определённым критериям для определённых компаний. Они перекрыли для этого сервисы Geofeedia . Это же перекрыл Instagram и все остальные. То есть, сейчас этого бизнеса официально и публично нет. Может быть, он остаётся неофициальным. Компании крупные интеграторы в Соединённых Штатах – они наверняка (там типа Motorola ), наверняка его предоставляют, так или иначе. Вот. Это пример использования данных вот, скажем так, в целях, которые общество необязательно будет приветствовать.

Такого довольно много, и во всём, что касается применения и интернета вещей, и социальных сетей, есть некоторый баланс. Но интернет вещей врывается в это особо жёстко, потому что он очень сильно персонифицирует, персонализирует информацию о вас, даже если вы этого не хотите. Многие из бизнесов, ещё не так давно которые развивались, стартапы, которые появлялись в России, – они занимались системами Bluetooth Beacon и WiFi Beacon . То есть это такие точки, которые отслеживали то, что вы проходили мимо определённого магазина, определённого кафе, например, чтобы понять, что вы являетесь потенциальным клиентом.

И я скажу больше, что это ещё довольно гуманная часть, потому что есть технологии, которые проэкспериментировали японцы (ну, и сейчас экспериментируют), когда, например, вы идёте в магазине, на вас смотрит камера, она на вас несколько раз с разных сторон посмотрит, сейчас умные камеры – это на самом деле не камеры, это intelligent system , которая может быть совокупностью камер, смотрящих на вас с нескольких сторон и формирующих ваш объёмный образ. Пока это ещё на уровне экспериментов, но это есть.

Вот, японцы экспериментируют с алгоритмами оценки стоимости вещей, которые на вас надеты, и брендов, которые вы носите. А знаете, насколько удобнее продать вам что-то из того же бренда, который вам нравится? Вы даже не осознаёте, что это бренд. Я, например, никогда не запоминаю бренды, которые я ношу, но ваши вкусы считываются, и вам предлагается конкретная реклама на те же самые общие темы. Вы проходите мимо рекламного щита, вас сфотографировали, вас записали в некотором объёме, распознали стоимость ваших вещей, осознали ваши потребительские возможности, возможности к покупке чего бы то ни было, и вам покажется именно та реклама, куда вы пойдёте и купите то, что вы даже не планировали.

Кроме того, интернет вещей – он, безусловно, распространяется на огромное, бесконечное количество датчиков чего бы то ни было. Это датчики электричества, учёт воды, датчики, которые замеряют погоду, датчики, которые летают автоматическими дронами, фотографирующими и отслеживающими, что делают люди. И многое, многое, многое другое.

Вот этого всего в самые ближайшие годы станет просто в каком-то неимоверном количестве. В самых радикальных формах это предметы, которые надеты на вас или вы используете. Вот. В самых лайт-формах это инструменты, опять же, которые условно используются властями городов, и все программы «smart cities» – они построены именно вокруг этого, «умные города».

Кто-нибудь из вас читал какие-нибудь программы умных городов? Это, в общем, небесполезное занятие, если вы их не смотрели, то посмотрите. В Москве каждое лето проходит московских урбанистический форум, вот, хотя бы 1 раз стоит его посетить. Там, в основном, показывают всякие такие вот красивые бесполезные, скажем честно, сервисы, но иногда бывают очень конкретные лекции, более подробные и как раз о том, как исследователи используют данные, собираемые датчиками, как этих датчиков становится всё больше и что с ними можно делать.

Так, у нас ещё есть время. Так, ещё минут 15-20? Может, тогда скажете, что вы хотите услышать, а я на этом сфокусируюсь? Давайте я вам попробую ответить, как защититься. Я вам расскажу анекдот, который, может быть, вы слышали. Молодой юрист приходит в юридическую компанию (ну, это, разумеется, в Соединённых Штатах, не в России). Приходит в юридическую компанию, ему говорят: «Вот представьте себе 3 картины: один человек убегает от акул, второй плывёт с ножом в руке и собирается дорого отдать свою жизнь, и третий идёт с базукой им навстречу, чтобы точно принять боль. С кем вы себя тут ассоциируете?» Он говорит: «Ну, конечно, с третьим». «Нет, вы должны ассоциировать себя с акулой.»

Поэтому вопрос, как здесь защищаться, – это вопрос, чем вы хотите заниматься. Вы воспринимаете себя как часть рынка данных или воспринимаете себя как тех, кто хочет продать максимально свои навыки, чтобы создать эти самые сервисы, которые помогут больше данных извлекать.

Те примеры, которые я вам приводил, – они очень связаны с темой дата-этики, которая сейчас одна из самых острых. Когда разрабатываются национальные стратегии, например, данных в США, – то тема дата-этики идёт первым пунктом, этическое использование. Потому что если неожиданно там вы начнёте использовать, например, данные в научных целях, и в результате вашего гендерного или расового исследования вдруг неожиданно появятся факторы, которые приведут к межнациональной розни или к социальным конфликтам, – ничего хорошего в этом не будет.

Когда Amazon сделали сервис автоматического роботизированного отсева резюме на вакансии, те стали дискриминировать женщин буквально моментально. Ну, то есть, после некоторого обучения (потому что большинство сотрудников Амазона – это мужчины) так оказалось, что он воспринимал с определённого момента пол как отрицательный фактор, пока его не переобучили и убрали этот фактор автоматически. Это всё происходило автоматически на основе нейронной сети.

Система «Compass», которую американские суды используют для автоматического анализа вероятности рецидива человека, которого, например, собираются освободить по залогу из здания суда, очень быстро стала дискриминировать афроамериканцев. Потому что 80% людей, находящихся в тюрьмах США, – это афроамериканцы. Даже если ты афроамериканец, не совершивший ни одного преступления, система назначала тебе всегда большую, соответственно, сумму для освобождения под залог.

Вопрос этики работы с данными – он один из ключевых, я бы сказал, острейших, особенно там, когда это касается данных медицинских, геномного анализа и многого другого. Но надо понимать, и это важно, что в другом мире мы уже жить не будем. У всего, что я вам описываю, есть 2 стороны, которые все люди, которые работают с данными, в принципе понимают. Что данные да, можно использовать как во зло инструментально или там для большей манипуляции потребителями. С другой стороны, только благодаря данным сейчас возникают совершенно новые возможности лечения рака, лечения сердечно-сосудистых заболеваний, лечения ВИЧ/ C ПИД. Все исследования, все новые лекарства – это просто колоссальные технические вычисления на огромных кластерах. И многие эксперименты по синтезу лекарств проводятся в такой форме, то есть, в начале идёт огромное количество пересчётов возможных комбинаций химических формул, и только после этого идут эксперименты, соответственно, на животных, на людях в рамках тех или иных выборок. Поэтому наш мир теперь устроен уже так. Вопрос, какую роль мы для себя в нём выберем.

Так. Второй вопрос был, где об это читать? Ну, смотрите. Все международные консалтинговые фирмы, такие как BCG , Delloyd , McKinsey – они с некоторой регулярностью публикуют отчёты. Ну, в основном, правда, качественные из них на английском языке и на китайском, но лучше ограничиться английским. Это довольно интересные материалы. В том, что касается больших данных, – это конференции, которые проводит O'Reilly, их презентации и материалы с конференции «Strata».

Ещё несколько крупных конференций в России. Я вот буду выступать на конференции больших данных «Big data» здесь в конце марта, и сейчас довольно много происходит в рамках трансформации и всего остального.

Тема этики данных пока ещё в России звучит слабо. То есть, в мире она звучит прям очень мощно, потому что когда там особенно начинаются какие-то генетические исследования, когда касается анализа разного рода очень персонифицированной информации, и это очень всех волнует. Или там вот история с Фейсбуком и Cambridge -аналитикой сейчас о том, что на основе информации о вас, то, что владельцы данных о вас, могут знать в принципе больше, чем вы сами о себе. Когда вы спите, вот вы можете сказать, сколько в среднем вы спите часов в день? Можете? Ну, а большинство сервисов, которыми вы пользуетесь, могут сделать это даже более точно, чем вы, до минут.

И этого касается очень многого касательно вашей жизни. Рынок стартапов, который сейчас есть в мире, – он основан в принципе на том, что вы придумываете новый сервис по извлечению данных либо обработке и их проявлению. «Machine learning» или вот то, что называют «искусственный интеллект», «artificial intelligence» – это всё стартапы, которые, как правило, потом выкупаются крупными компаниями: Microsoft , Google , Apple – все они придумывают что-то новое.

Вы знаете, что сейчас вот есть удобный поиск по картинкам в Google , вот. Это купленный ими в определённый момент стартап, потом развитый командой. Или когда вы в Google вбиваете название фильма, у вас справа появляется такая небольшая справка о нём. Так вот, эта справка – это в 2007 году компания Metadates на базе Википедии и кучи разных других источников сделали сервис семантической разметки разных понятий. Они сделали такой сервис по сотням тысяч людей, наиболее значимых по объектам, по книгам, по фильмам, и научились это обновлять. Google купил просто компанию целиком, полностью интегрировал в себя и теперь отображает вот эти подсказки. Это был стартап, который им продался, он работал с большими данными, очень большими, с довольно сложными механизмами. Яндекс поступает точно так же. Ну, только у нас российский рынок стартапов гораздо меньше, а так это происходит так же.

Соответственно, рынок больших данных – он основан именно на этом: на том, что большие компании инвестируют средства в то, чтобы проводить это как часть своей цифровой трансформации, больше знать о потребителе, больше знать о собственных процессах, больше собирать данных с разных датчиков и со всего остального. Это для тех, которые существуют в классическом бизнесе. Для тех, которые изначально существовали в цифровом бизнесе, для них это просто углубление и расширение того всего, что они делают. То есть, не просто поиск по картинкам, а поиск по картинкам с опознаванием лиц людей, которые там изображены. Не просто поиск по видео, а поиск там с пониманием того, что на этом видео изображено. У этого есть разные области применения, но смысл один.

И, наконец, куча маленьких стартапов, которые делают что-то, что было бы частью этой большой системы. То есть, они интегрируются как-то в ценностную цепочку, так называемую «value chain», либо продаваясь полностью, либо предлагая этот сервис.

Кем вы себя видите в этом всём – это, в общем, зависит только от вас. То есть, здесь можно найти себе применение и в роли людей, которые там работают с данными в академической среде (ну, просто умеют это делать) и в роли там организаторов, участников как раз компаний-стартапов, которые это делают, частью больших корпораций либо частью вообще правозащитников, которые защищают права граждан или свои в том, что касается их собственных данных.

Но мир сейчас устроен так. То есть, это в принципе некоторый такой «data world». И хотя уже помните с того, с чего я начинал, что big data – это уже устаревший термин. Это уже термин, который сейчас не на, скажем так, не является самым таким вот хайповым. Сейчас хайп – это то, что на основе больших данных происходит следующим шагом, – это искусственный интеллект. Не тот искусственный интеллект, который как в «Терминаторе» будет за вами бегать и либо вас спасать, либо убивать, а тот искусственный интеллект, который будет лишать вас работы, если только вы не будете знать своё место.

Помимо тех профессий, которых, ну, вот я уже говорил, это водители. Наиболее подвержены этому, как ни странно, программисты, вот, при том, что их дефицит, а с другой стороны, сами же программисты очень хорошо сами же себя автоматизируют. И очень много продуктов по автоматизации и разработке сейчас есть, требующих очень небольших усилий, и сейчас есть возможность разрабатывать приложения гораздо быстрее, чем раньше. Это юристы, как минимум корпоративные юристы: уже есть много алгоритмов, которые автоматически проверяют договора, автоматически находят в них нестыковку. Это бухгалтера. Бухгалтера – это в принципе стратегически это исчезающая профессия в России (ну, и в мире тоже).

Это огромное количество других профессий, которые уже могут реализовываться, то есть, если бы у нас был чуть меньший уровень преступности мелкой такой воровства, безопасности, то многих продавцов в магазинах можно было бы заменить на вендинговые автоматы, или как сейчас Amazon экспериментирует с магазинами, которые вообще не требуют не то чтобы продавцов, они не требуют касс. То есть, вы приходите, берёте предмет и уходите. Когда вы проходите через турникет назад, списываются все, считывается информация со всех товаров, которые вы выбрали, и автоматически списывается с вашей карты. Вам не надо вообще ни с кем никак взаимодействовать. Да, там камеры тоже, но всё равно эти камеры работают на базе этикеток, которые на товарах висят.

Ну, я бы сказал так, что сейчас до конца мы даже не можем предусмотреть все области, в которых не нужны будут люди. Преподаватели всё ещё нужны. То есть, вот передача знания от человека к человеку – она всё ещё действует. Очень немногие, буквально не больше 3% всех студентов способны учиться полностью самостоятельно. Ну, за очень редким исключением. Это статистика даже онлайн-курсов МООК: в среднем там успешно проходят около 3-5%. Ну, кроме тех, кто прям заплатил хорошие деньги.

Вот я, например, тоже учусь, меня мотивирует то, что я за свои курсы плачу деньги. Как раз я говорю: «Так, Ваня, ты должен 2 часа день потратить на это, потому что заплатил за это там тысячу долларов примерно». Но в принципе, это не очень просто.

Нянь в детстве просто так заменить очень трудно. Людей, занимающихся тяжёлым физическим трудом, как бы мы ни мечтали, что мы заменим самый тяжёлый труд, вот это – те области, в которых вакансий становится всё больше. Люди, способные укладывать плитку, являются дефицитом, роботы их заменят ещё не скоро. И такого довольно много.

Надо понимать, что белых воротничков, именно белых воротничков, в том числе тех, кем будете вы по итогу выпуска, их как раз автоматизация потихонечку заменяет. Это значит, что для них нет другой деятельности. Это значит, что готовьтесь сразу к тому, что у вас должно быть больше одной профессии и понимание того, как ваша профессия будет меняться в соответствии с этой автоматизацией. Чем больше данных, тем больше возможностей для тех или иных алгоритмов заменять те или иные рутинные действия в нашей жизни. Ну и, собственно, всё устроено именно так.

Так, наверное, уже всё? Если есть какие-то вопросы, давайте я на них отвечу.

Я бы сказал так: то, что сейчас в России – оно очень похоже на Европу. Наши законы о защите персональных данных списываются с европейских. И когда сейчас говорят про GDPR европейский, у нас постоянно говорят: «А будет ли он в России?» Мы очень тесно интегрированы, несмотря на все внешнеполитические, я бы сказал, дрязги, что как бы, хотелось нам или нет. Европа – наш крупнейший партнёр по товарообороту.

Но при этом надо понимать, что вот эти вот европейские ограничения – они же убивают европейский бизнес. Почему в Европе не появился европейский Google ? Почему в Европе не появятся огромные количества онлайн-сервисов или там европейский Apple ? Потому что европейское законодательство защищает потребителя. Оно не защищает бизнес, оно абсолютно потребителе-ориентировано. В Европе очень сильные потребительские общества, которые борются с Фейсбуком, судятся с ним (особенно немецкие).

Я ездил, общался с Ассоциацией потребительских обществ, они ждали GDPR , буквально как только его приняли, – в тот же день несколько исков оформили на Facebook . У них профессиональные юристы в штате, прям очень готовые судиться с любыми вот этими сервисами, они пролоббировали много законопроектов и внутригерманских, и общеевропейских по разным ограничениям в социальной сети, включая гигантские штрафы, если те не соблюдают требования по блокировке hate speech , то есть, разного рода токсичного общения в социальных сетях.

Поэтому Европейский Союз очень ориентирован на человека. Там хорошо жить, но там невозможно делать бизнес. Ну, если его делать большим. Соединённые Штаты, Сингапур и особенно Китай – они имеют очень специфическое законодательство, как правило, мало ограничивающее корпорации от использования тех же персональных данных. То есть, да, когда они совсем уж персональные, – то там есть ограничения, но, по сути, всё почти на 100% регулируется офертой либо договором между человеком и компанией. А если человек что-то выложил в онлайн, то вообще вопросов нет. То есть, они просто имеют свободу этого использования. Поэтому там и появились именно юрисдикции, юрисдикции особенно в штате Калифорния, и всё это стало возможным.

Видеозапись и текст подготовила Дарья Дмитриевна Гришаева