Digital October

Fuckup Nights Moscow Лекции Fuckup Nights Moscow

Приглашаем вас для обсуждения наиболее ярких провалов и историй неудач

Sketchfest EXPO 2016 Выставка Sketchfest EXPO 2016

первая выставка скетчеров, мастер-классы и новогодний арт-маркет!

Know More: Как открыть свой бар, кафе, ресторан и сделать его успешным? Интенсив Know More: Как открыть свой бар, кафе, ресторан и сделать его успешным?

интенсив от Даниила Гольдмана

Лекция Шона Горли. Стартап для предсказания будущего

24 июля 2012

24 июля в центре Digital October в рамках проекта Knowledge Stream состоялась лекция Шона Горли — одного из основателей и технического директора компании Quid из Сан-Франциско. Он рассказал о программном продукте своей компании, который позволяет обрабатывать большие объемы данных и помогает пользователю принимать верные решения в постоянно растущем потоке информации.

ШОН ГОРЛИ: Спасибо. Мне приятно, что действительно меня транслируют в России, и приветствую вас из своего полушария. Хотел бы вам рассказать о том, чем я занимался последние несколько лет. Ну, а заодно расскажу вам о визуализации, о мире больших данных и о том, как, собственно, большие объемы данных можно использовать так, чтобы лучше разобраться в тех проблемах, с которыми мы сталкиваемся в современной жизни.

Впрочем, перед этим, наверное, имеет смысл рассмотреть простую метафору. В качестве метафоры мы рассмотрим человеческий глаз, который безусловно является восхитительным изобретением природы, и человеческая эволюция не одно тысячелетие это изобретение совершенствовала. Кстати говоря, если вы ночью выгляните из окна вы можете видеть на огромные расстояния, ну, где-то километров 20-то точно. И, с другой стороны, глядя в звездное небо вы можете увидеть звезды, находящиеся в сотнях миллионов километров от нас. При всем при этом есть, безусловно, ограничение в плане того, что может увидеть человеческий глаз. Ну, вряд ли вы можете рассмотреть амебу без микроскопа. В общем, есть некие биологические границы. Впервые осознав, что такие границы существуют, человечество пыталось найти какие-то инструменты, которые позволят эти границы отодвинуть.

Так вот в 1063 году англичанин Роберт Гук разработал первый в мире микроскоп, который позволил ему увидеть микромир, позволил ему увидеть то, чего не видел до него ни один человек, позволил превзойти ограничения обычного человеческого зрения. В свое время Гук даже выпустил, в прямом смысле бестселлер того времени, книгу под названием «Микрография». Книга вызвала настоящий фурор. Поскольку тогда еще не было Instagram, и даже фотографии не было, ему приходилось зарисовывать от руки все то, что он видел под микроскопом, и «Микрография» стала своеобразной подборкой таких его зарисовок. Ну, в частности он зарисовал в увеличенном виде структуру глаза мухи, которую раньше, понятное дело, никто не видел. Точно так же он показал в сильно увеличенном виде блох и вшей, которые были разносчиками большинства эпидемий той эпохи. Ну, и в частности он в свое время рассмотрел под микроскопом разрез пробкового дерева. И обратил внимание, как вы видите на экране, он увидел, что в общем, в структуре ткани дерева есть такие будто бы клеточки, собственно, Гуку мы как раз обязаны изобретением слова клетка в этом смысле. Роберт открыл совершенно новый для нас микромир. Ну, а с другой стороны благодаря его исследованиям было положено начало сразу нескольким новым наукам.

Мы с вами живем где-то посередине между микромиром и макромиром. В одном случаем нам нужен микроскоп, в другом нужен телескоп для того, чтобы разобраться, что в этих мирах происходит. Нас не так сильно интересовали чисто биологические или физиологические ограничения человека, сколько уже когнитивные, то есть чисто мыслительные, умственные ограничения человека, поскольку в современном мире объем информации с которой мы сталкиваемся, настолько велик, что охватить его слабым человеческим мозгом уже становится просто технически трудно. Мир становится все сложнее и именно эти сложные явления в большей степени, чем явления простые определяют нашу жизнь. Пытаюсь просто немножко перевернуть камеру. Так вот, мне было интересно разобраться в том, как можно выстроить некий набор инструментов, которые позволят человеку разобраться в тех сложных явлениях, которые нас окружают и увидеть, если хотите, прочитать текст между строк в окружающей нас жизни. Впрочем, в отличие от Гука мы предлагаем вам не столько микроскоп, сколько макроскоп, который позволит вам изучать какие-то масштабные явления. Мы будем достаточно много говорить о больших объемах данных, будем говорить об алгоритмах, и о визуализации. Собственно говоря, это три компонента нашего инструмента. Мы его часто называем макроскоп. Алгоритм позволяет эффективно обрабатывать большие объемы данных, а механизм визуализации позволяет нам быстро считывать полученную информацию.

Начинал я свою работу в этой области в Оксфорде. Ну, можете представить себе Оксфорд хотя бы по фильмам о Гарри Поттере. В самом начале своего оксфордского образования я как-то столкнулся приблизительно в такой аудитории с бывшим главой ЦРУ. Мы как раз тогда обсуждали грядущий конфликт в Ираке. И начался спор о том, стоит ли или не стоит посылать американских солдат воевать за пределами родной страны. Мне тогда пришло в голову, что нам сильно не хватает нормальных качественных инструментов, которые позволили бы нам принимать взвешенные решения по столь сложным вопросам. Данных слишком много, они кажутся абсолютно разрозненными, непонятно каким скрытыми связями они друг с другом объединяются. И самое главное неясно какие выводы делать. С этого начались мои многолетние исследования, результатом которых стала компания Quid.

Мы тогда задались вопросом а как же разобраться в каких-то глобальных конфликтах, будь то Иран, Афганистан, Чечня, что-то еще. Глобальные конфликты характеризуются и тем, что в них участвует огромное количество разных заинтересованных групп и события там происходят и развиваются чрезвычайно быстро. То есть это уравнение с огромным количеством неизвестных. Я родом из Новой Зенландии, поэтому у меня такой забавный акцент, вы могли обратить внимание. Как любой физик я понимаю, что нам нужно начинать свой анализ со сбора данных. Мне было очень трудно, поскольку я был гражданином Новой Зенландии, получить доступ к огромным объемам данных. В Соединенных Штатах Америки мне сказали американские власти, что все данные, касающиеся, скажем, иракской компании, носят чисто конфиденциальный характер. В общем, меня расстроило объявление о том, что получить доступ к конфиденциальным данным легко не получится. Но было понятно, что что-то делать-то все равно нужно. В общем, я все это время все еще был в Оксфорде, смотрел телевизор, обратил внимание на то, что вот в тех же самых постоянных ток-шоу идут бегущие строки. И я читаю, например, столько-то человек погибло в Ираке, столько-то человек погибло в Багдаде. И задумался над тем, что действительно в окружающей нас жизни есть огромное количество таких может быть не потоков, ручейков информации, которые мы особо не отслеживаем. Если вы могли бы их каким-то образом все улавливать, если могли одновременно следить за всем,что происходит во всех, ну хотя бы основных источниках информации, следить за свежайшими новостями, скажем, большинство информационных агентств можно будет составить достаточно целостную картинку того, что в мире происходит. И не обращаясь к данным Пентагона или ЦРУ. Я понимаю, что в Пентагоне, наверное, был бы собран более полный, более целостный объем информации. У нас тогда в Оксфорде доступ был к небольшому количеству источников. В то время, когда мы начали заниматься этим проектом еще Wikileaks не существовало. Ну, а потом, когда нам предоставилась возможность сравнить свои данные с данными американских силовиков, выяснилось, что на самом деле качество нашей базы данных неплохое, где-то 81% всех новостей о том, что происходило с американскими солдатами за пределами страны, мы успешно вылавливали.

Ну, а с другой стороны, у нас была более разнородная база данных и в других своих частях, она была где-то на 30% обширнее того, что собирала ЦРУ. Мне показалось, что сами эти цифры демонстрируют кардинальное изменение баланса информации в мире. Действительно о чем бы не шла речь, о войне, о новых продуктах, новых ресурсах, всегда есть огромное количество источников информации. Другое дело, что одних данных нам никогда не будет достаточно. Мы обрабатываем эти данные, при помощи различных статистических механизмов постараемся выявить какие-то общие паттерны. Больше того, мы пытаемся эти паттерны переложить уже на язык математики. Ну и получаем вот такие вот формулы, которые фактически описывают динамику поведения партизанских групп. Другими словами, мы стараемся использовать статистические математические инструменты для того, чтобы анализировать огромные объемы данных. Одно дело — понимать, сколько существует каких-то повстанцев в той или иной стране, другое дело — понимать, как возникают, скажем, новые повстанческие объединения. Это информация совершенно разного уровня ценности. Ну, вот, например, мы пришли к выводу, что есть энное количество групп, собственно, вы видите цифры на экране, достаточно стабильно существующих в течение такого промежутка времени. Скажем, 4,5 месяцев. Выяснилось, что наши цифры достаточно сильно отличаются от цифр Пентагона. В своих обсуждениях с силовиками мы пришли к пониманию того, что одних этих цифр недостаточно. Хотя мы вроде как обрабатываем эти данные и получаем информацию. Этого все равно мало, неудобно все равно с этим объемом информации работать.

Тогда мы задались вопросом, а как же можно донести какую-то сложную концепцию до людей, не обладающих большими математическими знаниями. И в итоге обратились к теме визуализации. Ну, вот, например, можем посмотреть, в каких районах Афганистана происходили теракты. Вот видите, здесь вы видите с одной стороны географическую, а с другой стороны хронологическую разбивку всех терактов. Здесь не нужно быть математиком для того, чтобы составить определенное впечатление уже о том, какова структура террористической деятельности в том или ином регионе. Визуализация позволяет нам сильно упростить донесение информации до человека. Речь идет здесь не просто об инфографике. С этими визуализированными данными уже можно работать, можно забуриться с них поглубже, можно пытаться выявить какую-то скрытую динамику того или иного явления, попытаться проследить, может быть, не самые очевидные связи. Другими словами мы получаем механизмы анализа, ну, например, конфликтов при помощи математических инструментов. Ну, вот здесь вы видите репродукцию обложки журнала Nature, где мы опубликовали в свое время свои выкладки, свои работы. Ну, статья была посвящена непосредственно той теме, которой мы занимались на излете своей оксфордской программы, а именно анализу динамики поведения повстанческих группировок. Вообще, считаем, что есть огромное количество сложных явлений, будь то технологии, геополитика или научная литература, которые определяют во многом нашу современную жизнь.

Этим проектом в Оксфорде занималось 6 человек с бюджетом около $300 тыс. Ну, я дальше прикинул и понял, что для того, чтобы подход, который мы разработали, начал действительно применяться широко по всему миру, нужно разработать специальный софт. Я насчитал, что мне будет, приблизительно, конечно на коленке, насчитал, что нужно будет около $100 млн и 1 тыс. человек, силами которых и с этими деньгами, посчитал я, мы сможем такой продукт разработать. Очевидно было, что в академической среде столько народу и денег я не соберу. Было понятно, что для этого нужно отправляться за деньгами венчурных фирм. И первым делом я поехал в Сан-Франциско, поскольку знал, что именно там масса авторов не менее безумных проектов смогла найти деньги на свои детища. Именно там я встретился с Питером Тилем, который сразу понял, что же мы хотим сделать и дал нам первые деньги на этот проект. С этого собственно началась история нашей компания Quid. За это время мы успели уже поднять $17 млн. Сейчас 45 человек занимается этим проектом. Ну, и мы считаем, что наш проект позволит нам действительно расширить и дополнить человеческие способности лучше разбираться в окружающем нас сложном мире. Мне кажется, что если люди будут лучше понимать, в каком мире они существуют, как этот мир устроен, они смогут принимать более взвешенные решения.

Прежде чем я вам расскажу о том, чем же мы каждый день в Quid занимаемся, наверное, имеет смысл коротко поговорить о том, какие сейчас используются инструменты стратегического если хотите планирования. В основном в компаниях используются три инструмента: Google, Excel и PowerPoint. И на основе этих трех инструментов, компании пытаются принимать очень сложные стратегические решения. И это при том, что Google это все-таки сервис рассчитанный в первую очередь на рядовых потребителей. Нужно вам найти фотоаппарат определенного разрешения или купить авиабилет. Но, Google вряд ли вам поможет принять решение стоит отправлять войска в Ирак или не стоит. Или как лучше привлечь на свою сторону электорат в том или ином регионе.

Мы задались вопросом, каким же образом мы можем обобщить огромный объем документов, которые производятся, пересылаются каждый день по всему миру и превратить эту массу данных во что-то понятное и актуальное. Мы решили, что нам нужна какая-то 3D-среда, какой-то понятный пользовательский интерфейс, интерактив, позволяющий быстро получить ответы на стоящий перед вами вопрос. Мы пытались разработать макроскоп, то есть некий набор алгоритмов и инструментов для анализа больших объемов данных. Для этого первым делом нужно было наладить каналы, в которых, точнее подключиться к каналам, в которых мы будем собирать данные. В качестве примера, мы можем с вами рассмотреть, что происходит в конкретной области — области работы с большими объемами данных, то что по-английски называется Big Data.

Вот вы видите на этом графике отложено количество статей, в которых упоминается словосочетание Big Data. Вот, по этому графику вы видите, что каждые 58 дней количество этих статей в целом по миру удваивается. Ну, вот эта вот логарифмическая шкала демонстрирующая более-менее тоже самое. Если бы можно было продолжить дальше эту кривую, получалось бы к 2014 году, что 73% всех новостей в мире касались бы работы с большими объемами данных, что, конечно, было бы абсурдом. Все-таки есть в мире и другие новости. Ну, на самом деле мы, конечно, разрабатываем набор инструментов, которые позволят нам выяснить, скажем, не только глубинные взаимосвязи между различными топиками в рамках Big Data. Ну и, например, генерировать какие-то, скажем, информационные загрузки на основе того, что собирается в нашу систему. Ну, давайте посмотрим на ландшафт вот этого большого мира, больших данных. Собственно, эта инфографика показывает основные кластеры, на которые разбивается мир больших данных. Больше того, вы видите, здесь есть некая хронологическая шкала. Но, мы можем с вами забуриться с любой из этих кластеров и получить более детальную информацию. Ну, собственно, в данном случае мы зашли в раздел «Как сделать данные красивыми» и естественным образом читаем статьи про визуализацию данных. Собственно, здесь вы видите достаточно сложную сеть всех статей, всех информационных сообщений, которые так или иначе связаны с большими объемами данных, которые улавливаются нашими сетями. То есть этот ландшафт на самом деле разбивается на энное количество кластеров, а каждый кластер состоит из конкретных информационных сообщений. Здесь мы можем уже зайти подробно рассмотреть любой из кластеров, посмотреть с какими другими кластерами он связан. Нас, в принципе, при таком количестве статей не могут интересовать статьи сами по себе. Нам гораздо важнее понять, каковы основные тенденции в этой области, выделить какие-то основные явления.

Ну, например, здесь есть история про компанию Metamarkets, что компания привлекла венчурных инвестиций на $15 млн. Причем извлечь эти данные очень легко. Они на самом деле автоматически извлекаются системой из достаточно большого объема собранных статей. Мы с вами можем отфильтровать весь этот объем информации на тему больших данных по энному количеству масок. Например, можем разобраться в том, какие компании работают на этом рынке. Ну, собственно говоря, мы можем здесь как приближать, так и удалять всю эту инфографику по рынку Big Data. Для того, чтобы с одной стороны понять, что же за компании на этом рынке работают, и с другой стороны, какие отрасли они пытаются обслуживать. Ну, и больше того, мы можем с вами внимательней изучить все эти объекты, из которых эти кластеры складываются. Можно скажем данные геонавигационные, может быть компании работают в этой области для того, чтобы, скажем, совершенствовать аналитические системы крупных корпораций. Ну, здесь можно и приближать и удалять картинку, так же, как вы это, наверное, делаете в Google.maps. Больше того, можно, скажем, проанализировать, что происходит на этом рынке по отраслям или по размеру компании. Или по объему инвестиций, которые эти компании привлекли. Мы, вот, скажем, увидим, например, что в таком сегменте, как умные сети Smart grid явно доминирует одна конкретная компания Silver Star. Или же мы можем разобраться в другом сегменте. И больше того, вы видите по кривым, что система выявляет и определенные связи между этими компаниями. При всем при этом, несмотря на огромный объем данных, система предоставляет вам картинку, с которой легко и удобно работать. Ну, вы видите, в частности, тут есть и наша компания, тоже объединенная количеством кривых с другими игроками этого рынка.

Кстати говоря, эта информация, конечно же, не статична. Мир постоянно меняется, и поэтому мы здесь показываем энное количество временных разрезов. Вы можете переходить от одного к другому для того, чтобы понять, как эволюционировала та или иная отрасль, та или иная область. В данном случае мы говорим где-то о полутора тысячах достаточно крупных объектов с огромным количеством внутренних связей. Все это удержать в голове очень трудно, но мы легко можем научить машины, компьютеры, всю эту информацию держать, хранить, обрабатывать и понятным интуитивным образом представлять.

Я вам только что рассказал о том, как устроен, если хотите, этот мир больших данных. Но сразу возникает вопрос, а что дальше-то? Да, чем питаются в этом мире? Кто употребляет продукты или компании Big Data? Это резонные вопросы. Нужно, конечно, рассмотреть всю экосистему. Посмотреть на взаимоотношения если хотите хищников и жертв на этом рынке. Мы вот с коллегой в свое время изучали работу этой системы достаточно высоко в горах. Ну, вот конкретно наш проект был связан вот с этими двумя озерами. Изучали пищевые цепочки и так далее. Ну, когда вы изучите эту систему вам будет проще ответить на вопрос, как внедрение в эту экосистему нового биологического вида, скажем, форели, повлияет на остальные виды. Собственно говоря, это хороший инструмент для того, чтобы с одной стороны удержать людей от каких-то ошибочных решений, а с другой стороны помочь принимать решения, которые позволят нам наладить или восстановить какой-то такой системный баланс там, где он нарушен.

Тоже самое мы, в принципе можем сделать и на своем рынке, не в смысле внедрить туда форель, а в смысле проанализировать, кто кого ест, как устроены пищевые цепочки. Вот, видите, здесь показаны основные клиенты Big Data. Это в первую очередь платежные системы вроде Visa и MasterCard и American Express. Но точно так же вы видите здесь компании, вроде SAP и City Bank. Здесь мы видим, что есть определенные связи между таким крупным разработчиком систем, как SAP, с одной стороны и разработчиками, вроде Palantir с другой стороны. Больше того, мы можем сюда добавить энное количество других компаний. И понять, какие именно отношения связывают эти компании и какова стратегия поведения на этом рынке различных компаний. И мы увидим, что на самом деле, несмотря на разницу в отраслях, City Bank в области Big Data ведет себя приблизительно так же, как Visa и AMEX. Собственно, работа с большими объемами данных позволяет нам лучше разобраться в том, как ведут себя крупные компании в этих быстро меняющихся условиях молодых рынков. Очевидно, что American Express, конечно же, не монолитная корпорация. В ней можно выделить какие-то подсистемы, в которых мы тоже можем попробовать разобраться. Для этого мы можем присмотреться к, скажем, тысячам патентов, которые зарегистрированы на компанию American Express.

Собственно, если в качестве маски здесь выберем интеллектуальную собственность, мы сначала получим под микроскопом все эти тысячи патентов связанных с AMEX. А дальше по мере удаления от этой картинки мы увидим, что они будут по-немногу компоноваться в кластеры. Ну, и вот видим, что основные темы —  виртуальные платежи, бесконтактные платежи, страхование здоровья, оплата медицинских услуг. Ну, и вам может быть очень интересно провести подобный анализ, поскольку он покажет, что большинство известных нам компаний занимались не только тем, что вы думаете. Таким образом буквально за 10 минут вы можете получить уже первичное представление о том, чем занимается тайная компания, какие стратегические приоритеты она для себя ставит. Ну, хотя бы по тем патентам, которые она на себя оформляет. Такая информация может быть очень полезной для того, чтобы, скажем, прогнозировать дальнейшие рыночные ходы, которые по вашему мнению может предпринимать компания вроде AMEX. Вот здесь мы видим с вами ландшафт не компаний, а уже идей. Ну, вот, скажем, идея Occupy Wall Street. Ну, вот видите энное количество других тем, которые связаны с Occupy Wall Street, да, это Occupy New York, Occupy Oakland. И масса других тем. В нижней части экрана вы видите словосочетание «политические дискуссии». И здесь естественным образом выделяется 2 кластера, поскольку данные о Соединенных Штатах. Кластеры — демократы и республиканцы. Ну, а мы видим, что наиболее важный крупный кластер, с которым соединяется кластер демократов, это тема налогообложения. И неудивительно, что этот кластер, субкластер вылезает здесь при анализе движения Occupy Wall Street.

Использование цветовой легенды нам здесь позволяет быстрее увидеть в хронологическом уже разрезе, как та или иная идея начинает набирать обороты. Либо же можем сами по-другому посмотреть, что происходит, скажем, в области космоса. Мы, естественным образом загнав в качестве маски слово «космос» видим слова вроде NASA, точно так же там всплывет слово конгресс, постольку-поскольку конгресс принимает массу решений о субсидировании тех или иных миссий NASA. Такая кластеризация позволяет нам быстро разобраться в какой-то новой для себя области. Выявить основные, ну, если хотите, центры принятия решений или основные тренды и важные темы.

Больше того, мы обрабатываем статьи не только ведущих, но и практически заштатных журналов, поэтому можно проводить, скажем, анализ по статьям на тему конкретных химических соединений, если вы видите, что растет число статей на ту или иную тему, это может быть очень интересным сигналом. Поскольку очевидно, что все эти журналы самостоятельно вы прочитать не сможете никогда.

Давайте вернемся лет на 10 назад. В 1997 году я начал исследование. И очень хорошо помню эту историю, когда Каспаров играл свой последний матч против компьютера Big Blue. Вот здесь вы видите фотографии, которые показывают тот самый момент, когда Каспаров понял, что он проиграл. Это был, конечно, момент преисполненный символизма. Большинство людей тогда закономерно решили, что компьютеры наконец набрали больший интеллектуальный вес, сейчас даже лучшие человеческие умы. Многие люди в тот момент решили, что с этого момента люди уже больше не будут принимать важные решения. Однако, вскоре после своего проигрыша Каспаров заявил, а давайте мы просто пересмотрим шахматы. Он придумал шахматный фристайл, который предполагал возможность игры человека против человека, но при этом у каждого человека есть свой компьютер, в частности может быть и суперкомпьютер. В 2005 году прошел первый чемпионат по шахматному фристайлу, который показал, что человек играющий при помощи суперкомпьютера, сможет обыграть суперкомпьютер. Причем интересно, что для того, чтобы обыграть суперкомпьютер не нужно быть гроссмейстером. Достаточно просто быть хакером. Достаточно просто понимать как работает компьютерная логика. То есть нужно понимать, как устроены компьютерные алгоритмы. В этом случае, вы будете использовать компьютер не просто в предетективном качестве, не просто как оракула. С этого на самом деле началась тема дополненного интеллекта. То есть фактически тема симбиоза человеческого мозга и лучших вычислительных возможностей и способностей компьютерного интеллекта.

Очевидно, что между человеческим и машинным мозгом, если можно так сказать, должна быть какая-то система визуализации. Разработкой именно такого механизма визуализации мы и занимаемся. И мы считаем, что визуализационные механизмы, наверное, один из важнейших компонентов. С одной стороны мир наш очень сложный и очень хитро устроенный, слишком много различных разрезов. Мы собираем огромные объемы данных, мы их трансформируем, обрабатываем, получаем информацию. Но и этой информации тоже очень много. Для того, чтобы в ней не утонуть, нам нужны механизмы визуализации. Таким образом я кратко описываю то, чем занимается Qwid. Мы берем инструментарий математики, добавляем к нему механизмы визуализации и получаем некую понятную картинку. Ну, вот, собственно, вы здесь видите явную картинку из «Железного человека». Здесь вот мы видим, как герой задается какими-то важными вопросами, находясь фактически внутри компьютера. И я так понимаю, что таким, наверное, и будет будущее компьютеров. Понимаю, конечно, что пока такие картинки скорее воспринимаются, как нечто из мира голливудских фильмов и научной фантастики, но на мой взгляд, мне кажется, что до появления подобных систем в реальности осталось не так много времени.

Собственно, вы видите здесь, скажем, карту визуализации, прошу прощения, карту демонстрирующую, что происходит в области визуализации, обработке больших данных и здесь вы видите компании вроде, скажем, Boeing, который занимается одновременно и технологиями исследования космоса и авиатехнологиями. И мне кажется, что даже наш инструмент заметно должен упростить работу с огромными неструктурированными объемами данных. Ну, вот, в частности, мы можем с вами присмотреться к компании SpaceX, которая в последнее время много была в новостях, ну и посмотреть с кем связана эта компания. Соответственно, первый круг ее знакомых, с которыми она связана непосредственно, показан желтым, зеленым показаны компании, которые отстоят от нее на одно звено в этой цепочке. Ну, и больше того, здесь вы можете опять же ввести дополнительные маски, найти компании, которые актуальны для вас, с которыми так или иначе, скажем, связана ваша компания. В общем, таким софтом мы занимаемся. Нам кажется, что это очень интересная работа. Мы будем заниматься отладкой своего софта, я думаю, еще несколько лет. Спасибо вам за внимание. Я был рад такой возможности кратко вам рассказать о том, чем мы занимаемся, и надеюсь услышать от вас какую-то реакцию.

ВЕДУЩИЙ: Спасибо, Шон. Давайте, действительно, перейдем уже к вопросам и ответам. Следующая часть нашего мероприятия по традиции.

ВОПРОС ИЗ ЗАЛА: Спасибо, Шон за очень интересную презентацию. У меня вопрос такой. Какая коммерческая составляющая, какой коммерческий интерес всех этих данных, красивых картинок. Может быть парочку примеров. Спасибо.

ШОН ГОРЛИ: Я понимаю, что без коммерческой части, конечно, невозможно платить по счетам. Мы продаем свой софт различным крупным компаниям, в основном, софтом интересуются стратегические подразделения, которым нужно принимать решения о том, кого купить, как позиционироваться на том или ином рынке, что делать с собственной интеллектуальной собственностью. То есть в основном этот софт используется для решений от миллиарда долларов. То есть, если компании предстоит какое-то масштабное решение, нужно разобраться в достаточно сложной среде, обычно обращаются к нашему софту. При этом 20% наших клиентов — это госсектор, в котором тоже часто принимаются какие-то ответственные решения. Но, надо сказать, что большой интерес проявляют к нашему софту и службы маркетинга. Непосредственно среди наших клиентов большое количество директоров маркетинговых.

ВОПРОС ИЗ ЗАЛА: Я представляю российское трансгуманистическое движение, общественную организацию. У нас в России довольно-таки популярны различные изучения технологических трендов, в том числе и конвергенции. Я уверена, что вы конечно же постарались проанализировать, ну, ближайшие какие-то технологические тенденции. Если на сайте уже имеющиеся примеры, не могли бы вы об этом немножко рассказать? Я хотела сказать, было ли исследовано отношение биотехнологий, информационных технологий, нанотехнологи, конгинтивных наук и так далее?

ШОН ГОРЛИ: Вопрос интересный. Тут недавно мой хороший приятель, как раз был на круглом столе в Вашингтоне, как раз на тему конвергенции всех тех технологий, которые вы назвали. Мне кажется, что тема большая и интересная. Ей, по-хорошему, нужно было бы уделить несколько часов обсуждения. Мне кажется наиболее интересной в области конвергенции тема инфокогноконвергенции. То есть тема того, как совместно человеческий мозг и машинный и искусственный интеллект могут обрабатывать данные. Человеческий глаз это уже фактически мощнейшая камера гигопиксельная камера, которая снимает со скоростью порядка 60 кадров в секунду. Но при всем при этом наш мозг отсекает огромный объем информации. Здесь возникает вопрос, а можем ли мы чему-то обучить новому свои алгоритмы анализа данных по мотивам того, что уже, собственно, заложено в работу человеческого мозга. А с другой стороны есть вопрос о том, как мы можем научить компьютеры лучше переносить информацию в человеческий мозг. Поскольку в матрице мы с вами пока не живем. Просто подключить мозг к розетке не получится. Ну, глаза есть, есть энное количество других органов, при помощи которых можно налаживать контакты с машинами. Что касается нано, я думаю, что мы, наверное, лет 10 уже ждем того, как, собственно, нанотехнологии начнут влиять на нашу жизнь, тем более, что определенные подвижки в области, скажем, технологии протезирования, в области биотехнологии, в первую очередь, по-немножку появляются. Так что конвергенция в этой области безусловно будет, но мне очень трудно сказать, когда это произойдет. На самом деле предсказывать что-то, над чем работают одновременно тысячи людей, достаточно трудно. И вообще, непонятно, зачем что-то пытаться предсказывать, когда вы можете повлиять на эти тренды.

ВОПРОС ИЗ ЗАЛА: Здравствуй, Шон. Спасибо большое за такую интересную презентацию. Хочу вернуться к первому твоему вопросу. Вот ты говорил о предсказании военных конфликтов. Тебе не кажется, что когда вы пытаетесь искать, да, что-то конкретное использовать, я не знаю, конкретные механизмы измерения, вы рискуете просто потерять суть и выхолостить окружающую жизнь?

ШОН ГОРЛИ: Я сам на эту тему много думал. Я, собственно, и в Ираке был на передовой, и первое, что бросается в глаза, это, плач или звуки детского плача или разрыва снарядов или запах, не знаю, разлагающихся трупов, это то, что производит первое впечатление. Потом проникают какие-то другие чувства, я не знаю, ощущения полного хаоса, ощущения чувства страха. И в этой ситуации совершенно нет никакой возможности старательно все это хладнокровно анализировать. Это чрезвычайно эмоционально насыщенная среда, в которой по-хорошему нужно принимать взвешенные решения. Мы должны учитывать то, что происходит в эмоциональной области. Мы должны отдавать себе отчет в том, что отправляя, скажем, хорошо обученных прекрасно экипированных солдат на военный конфликт на войну мы скорее всего оставим огромное количество детей без отцов. Ну, а с другой стороны есть энное количество не эмоциональных решений, не эмоциональных факторов, которые тоже нужно учитывать. Именно поэтому я и говорю о важности не просто человеческого, не просто искусственного, а некоего синкретического принятия решения.

ВОПРОС ИЗ ЗАЛА: У вас интересное программное обеспечение. Я вот только хотел уточнить следующий вопрос, если можно. Любая такая программа в качестве работы зависит от качества тех данных, которые поданы на входе. Вот, представьте, если вам в систему загрузить или вам предоставить все отправленные имейлы в мире. Какие темы и какие тренды вы бы там обнаружили. Спасибо.

ШОН ГОРЛИ: Ну, на самом деле Gmail с этой работой уже прекрасно справляется. Вы же знаете, что Gmail читает всю вашу переписку. Ну, в смысле анализирует ее на предмет того, какую рекламу вам показывать. Больше того, там используется и определенные предективные механизмы, Google пытается как-то комбинировать информацию извлекаемую из ваших писем, потому что предполагает, что вы дальше захотите купить. Мне, собственно говоря, кажется, что это хорошо и больше того, это полезная функция. Многие на них хорошо зарабатывают. Мне кажется, что нам нужно научиться использовать информацию не только для продвижения товаров и услуг,но и для того, чтобы лучше разобраться в каких-то общечеловеческих явлениях, будь то эпидемии, войны или что-то еще. Может быть анализ, скажем, всех электронных сообщений поможет нам лучше разобраться, в политических явлениях, динамике политических событий. Ну, обычно те или иные проблемы решаются, поскольку за решение этих проблем вам светит достаточно большая сумма денег, видя, скажем доходы с продажи вашего продукта. Но когда эта технология разработана, вы вполне можете ее поставить на службу уже какой-то менее денежной задачи, которая при всем при этом будет иметь научный или социальный характер. Ну, вы сами хорошо понимаете, что анализ всей статистики электронных сообщений покажет, что реальная органиграмма очень сильно отличается от формальной организационной структуры вашей или любой другой компании. Ну, или во всяком случае так будет происходить в большинстве случаев.

ВОПРОС ИЗ ЗАЛА: Спасибо за очень интересную презентацию. Вы занимаетесь выявлением трендов и в зависимости между различными компаниями в разных областях, вот какая для вас была самой удивительной и непредсказуемой на вашем опыте? Спасибо.

ШОН ГОРЛИ: Я на самом деле занимаюсь все-таки разработкой софта, пользуясь которым другие люди уже будут делать какие-то неожиданные открытия. Поэтому наиболее важным своим открытием я все-таки считаю то, которое я сделал еще в оксфордские времена, когда я смог выявить общие алгоритмы. Алгоритмы, скажем, военных конфликтов. Больше того, я потом с интересом увидел, что многие алгоритмы, казалось бы в абсолютно разных областях, практически совпадают. Именно поэтому мне было так легко перенести наработки свои диссертационной эпохи уже в работу компании Quit.

ВОПРОС ИЗ ЗАЛА: Спасибо, Шон. Еще есть вопрос насчет качества данных. Я полагаю, что вы анализируете данные только на английском языке. Ну, и соответственно, ваши данные достаточно сильно искажены, они больше отражают, скорее западную ментальность. Собираетесь ли вы решать эту проблему? И если да, то каким способом?

ШОН ГОРЛИ: Ну, на самом деле мы уже обрабатываем на входе данные на китайском. Впрочем, в каком-то видимо упрощенном виде. Ну и наши первые тесты по ряду других языков показывают, что в принципе качество неплохое получается. Реально сейчас мы работаем с шестью языками, русского в их числе нету. На самом деле нашим компьютерам не ставится задача изучения детального текста, чтения текста. И гораздо важнее проводить такой дата-майнинг, если хотите, да, извлечение неких паттернов. И постольку-поскольку математическая структура языков достаточно сходна, здесь можно игнорировать небольшие отличия чисто вербального характера.

ВОПРОС ИЗ ЗАЛА: Как можно быть уверенным в том, что люди используют ваш софт не просто как красивую игрушку и просто крутят там вот эти все данные? А именно используют его для принятия решений. И если да, то, существует ли какая-то методика принятия решений на основании ваших тех данных, которые вы предоставляете и сколько нужно времени человеку для того, чтобы овладеть этой методикой и действительно научиться принимать такие взвешенные решения.

ШОН ГОРЛИ: Ну, в принципе, на то, чтобы наладить работу софта, да, установить, показать как он работает, нужно около часа. Продвинутым пользователем человек будет считаться где-то после 10 часов использования. То есть это не какой-то особо сложный профессиональный софт. Им может пользоваться практически любой человек, которого возьмут на работу в крупную компанию. Если вы занимаетесь стратегической работой, то мы настраивая вам систему, спросим какой областью вы занимаетесь, я не знаю, это могут быть фотогальванические элементы или машины электрогибриды. Что-то еще. Ну, дальше, собственно, настраиваются фильтры, выбираются каналы, из которых будет собираться информация. Дальше вы уже дополнительно вводите те или иные фильтры и маски, по которым вы будете уже организовывать всю эту информацию. Собственно, в каждом, скажем, технологическом кластере вы можете легко увидеть, скажем, ведущую компанию. Наиболее быстро развивающуюся компанию. Ну, это, впрочем, данные, которые вы много где можете найти. А ведь есть же еще, скажем, пограничные явления. Не знаю, какие-то пограничные и технологические темы, которые не в тот, ни в другой кластер напрямую отнести нельзя. И получив такую картинку со своего РНК или своей технологической области вы можете понять, какие позиции вы занимаете в этой области. Какие тренды вы учитываете, какие нет. Что вам угрожает. Вот, собственно, этому мы и учим своих клиентов. Мы учим из с одной стороны задавать свою интересующую их область, а с другой стороны учим задавать их правильные вопросы.

ВОПРОС ИЗ ЗАЛА: Спасибо за очень интересный рассказ. Мне хотелось бы спросить вас, как вы оцениваете перспективу применения вашей технологии при принятии политических решений, там где взвешенные обоснованные решения, не эмоциональные решения вроде бы крайне важны, но тем не менее они объективно там присутствуют. Это первая часть вопроса. А вторая часть вопроса: как вы оцениваете искажение информационного поля в результате манипуляций массовым сознанием, которое так или иначе происходит через средства массовой информации, и насколько она искажает, ну, так скажем, некую объективную реальность, если о ней вообще можно говорить? Спасибо.

ШОН ГОРЛИ: Я сначала отвечу на второй ваш вопрос. Средства массовой информации — да, это один из тех каналов, которые мы обрабатываем, но далеко не единственные. Мы анализируем базы данных, мы анализируем патентные библиотеки, какие-то государственные открытые каналы. И за счет этого, мы считаем, нам удается минимизировать воздействие подобных манипуляций. Скажем, мы понимаем, что для политиков очень важно анализировать то, что происходит именно в медийной сфере. Скажем, энному количеству штатов было важно для себя определить, какую позицию они займут по отношению движения к Occupy Wall Street. И как, собственно, ваша, скажем, политическая партия воспринимается в этой области. Ну, дальше вы проанализировав такой ландшафт можете решить, что вот,скажем на этом фронте все хорошо, а вот здесь у нас лакуна, здесь необходимо дополнительно проговорить, как мы относимся к вот такому аспекту движения Occupy. Это же не просто, что называется анализом настроений. Здесь мы проводим реально более глубокий анализ того, что происходит. Причем, это важно не только для политиков, это, наверное, будет важно и для некоммерческих организаций. Ну, собственно говоря, мы и не хотели бы, чтобы этот инструмент в итоге оказался только в руках политиков.

ВОПРОС ИЗ ЗАЛА: Вы сказали, что специализируетесь в области обработки данных военных конфликтов. Как вы считаете, когда и как закончится конфликт в Сирии и будет ли война в Иране?

ШОН ГОРЛИ: Что-то вопросы у вас непростые все. Я с вашего позволения пропущу первый вопрос про Сирию. Что касается конфликта в Иране я могу вам сказать, что мы на эту тему в общем-то публиковали свои статьи. Вы, наверное, хорошо знаете, что американская армия в общем-то была рассчитана на ведение 2-х конфликтов, ведение военных действий на 2-х разных театрах одновременно. Поскольку история с Ираком не закончена и с Афганистаном тоже, в общем вы арифметические операции сами выполните. Другое дело, что вы можете провести сантимент анализ того, что говорят американские политики. Добавить к этому информационные вводные о переброске или там передислокации войск личного состава, и уже будет складываться немножко другая картина. Собственно, анализ того, что говорят политики, показывает, что в общем, тема ведения только двух войн одновременно по-немногу отходит на второй план. И в общем-то проблема потерь среди личного состава сейчас, конечно, гораздо меньше волнует американских политиков, учитывая последние достижения в робототехнике. Я, как мне кажется, смог дать достаточно уклончивый ответ на ваш вопрос.

ВЕДУЩИЙ: Ты знаешь, Шон, мне кажется это был последний вопрос, к сожалению. Теперь уже хочу сообщить слушателям, Шон никуда не уходит. Будет дальше слушать дискуссию с экспертами. У вас будет возможность задать вопросы экспертам. Может быть модератор его захочет передать и Шону. Ну, я перехожу на русский. Тебе все переведут. Уважаемые коллеги, у нас сегодня потрясающая панель, очень интересные эксперты. Сейчас мы продолжим диалог о больших данных. И я надеюсь сместить несколько фокус с войны на бизнес, предпринимательство и более мирные дела. Итак, с большим удовольствием я представляю коллег, которые являются сегодня российскими экспертами. Доктор Мирча Михаэско, директор центра технологических исследований «Сбербанка», доктор в области электроники политехнического института Тими Шоара. До прихода в «Сбербанк» доктор Мирча Михаэску возглавлял интерпрайсы GVT в IBM, где был директором по информационным технологиям. Центр технологических исследований «Сбербанка» занимается анализом новых технологий и проектами развития, как внутри «Сбербанка», так и в сотрудничестве с его технологическими партнерами. Недавно «Сбербанк» стал клиентом компании Quid, собственно, по инициативе доктора Михаэско. Спасибо большое, что вы к нам присоединились. Пожалуйста, занимайте место.

Дмитрий Армяков, генеральный директор SAP Labs СНГ. Работает в компании SAP более 10 лет, пройдя путь от консультанта по логистике до директора подразделения клиентского сопровождения и поддержки. Создание лаборатории является серьезным шагом для компании SAP. Ее специализацией стали бизнес аналитика, мобильные решения и высокопроизводительные вычисления. Технологические задачи лаборатории заключаются в разработке системы управления городом, функционал который войдет в обеспечение безопасности современного мегаполиса. Прошу, Дмитрий, спасибо, что присоединились к нам сегодня.

А вы поддержите апплодисментами наших экспертов, коллеги? Эльдар Муртазин. Эльдар, спасибо большое, что оперативно отреагировали на приглашение. Пожалуйста, поднимайтесь. Ведущий аналитик компании Mobile Research Group, занимающейся исследованием рынка мобильных устройств в России. В 2001 году создал и стал главным редактором одного из крупнейших сайтов, посвященных мобильным телефонам, — Mobile-Review.Com. Участвовал в разработке большого числа телефонов для различных компаний. Автор многочисленных аналитических статей и научных публикаций, а также ряда книг об интернете и мобильных устройствах. Еще раз спасибо, Эльдар.

И как говорят у Шона на родине, the last but not least. Уважаемый Андрей Себран, модератор нашей сегодняшней дискуссии директор по маркетингу сервиса в компании Yandex аж с 2004 года. Как и Шон занимался физикой в унивеститетах. Бессменный редактор журнала «Интернет маркетинг» с момента его создания в 2001 году. Занимается вопросами маркетинговой стратегии и тактики компании, аналитикой и конкурентным анализом.

АНДРЕЙ СЕБРАНТ: Спасибо большое. А скажи, пожалуйста, а как нам лучше, на каком языке вести сейчас. Я даже в растерянности. Лучше, наверное, по-английски. Тогда я прошу прощения, мне придется говорить по-английски. Тогда первый вопрос к вам. Как вы используете Quid? И не забудьте взять микрофон. А то нам про софт много рассказывали. Интерфейс мы уже видели. Интерфейс такой навскидку непонятный. Может быть какой-нибудь простенький пример приведете того, как вы используете ее.

МИРЧА МИХАЗСКУ: Ну, вот честно скажу — софт мы еще не использовали. Мы позвали Quid для того, чтобы они помогли нам решить конкретную проблему. Я ее сейчас распишу вам, потому что Шон с вами обсуждал в основном какие-то большие такие масштабные жизненные проблемы. А у нас была такая маленькая конкретная задачка — выход на рынок мобильных платежей. В общем, казалось бы, да, мелочевка. Не так много компаний на этом рынке работает. Ну, мы присмотрелись. Известно, что их не 2, не 5, и не 10. Мы насчитали 120 компаний. И решили, пожалуй, надо положиться на какой-нибудь компьютер, который поможет нам в этом зоопарке разобраться. Вот, как раз в этот момент мы и познакомились с компанией Quid. Это было около года назад. Тогда как раз вышло несколько статей, видимо, за авторством Шона. И мы решили, может быть, вот эти голованы нам помогут с нашими проблемами разобраться. Ну, они включили свои системы, выяснилось, что этих компаний не 120, а больше 1000. Типичная, кстати говоря, ситуация и вызывает естественную проблему: а как же все это собственно анализировать? Это, кстати говоря, нас возвращает к вопросу, который задавался 10 или 15 минут назад. Компьютер же вам не скажет покупай вот эту компанию или вот эту компанию. Компьютер нам показал 1000 компаний, из которых мы, собственно, смогли выбрать 10 нам интересных. То есть система для вас стала полезным фильтром, но, конечно, же не стала принимать решение. Конечно. Но на самом деле использование умных фильтров можно считать инструментом принятия решения, во всяком случае поддержки принятия решения. Это действительно сложная проблема и согласитесь, что люди уже без помощи компьютера не могут сами решить.

АНДРЕЙ СЕБРАНТ: А вот думаю у Эльдара спрошу. Профессиональный аналитик в привычном смысле этого слова. Вот тебе поможет этот софт? Упростит твою работу, как маркетолога-аналитика?

ЭЛЬДАР МУРТАЗИН: Ну, и да и нет. Мы работаем с разными данными. Скажем, мы работаем с частными конфиденциальными данными операторов. Эти данные получить, ну просто очень трудно, да. Данные защищены в конце-концов законом о защите конфиденциальной и частной информации. Ну, скажем, еще 5 лет назад какие-нибудь западные операторы просто анализировали билинг, не анализировали поведение людей, не анализировалось, скажем, сколько времени люди проводят в смс-чатах или в браузере. Анализировался просто общий трафик, ну или просто ничего не анализировалось, просто собирались данные о том, кто сколько заплатил. Сейчас, конечно, такой анализ ведется. Мне лично эти данные бы сильно пригодились, но получить их практически невозможно. И это чистой воды пример Big Data. Я думаю, что в следующие десятилетия, может несколько следующих десятилетий наш мир станет гораздо более цифровым и окружающие нас вещи, вроде стаканов, бутылок, они все будут оснащены какими-то маркерами, которые мы сможем считывать. И этой точки зрения мне будет проще работать. Я смогу много разных аспектов и характеристик окружающих нас объектов учитывать. Помните там был вопрос насчет манипулирования средствами массовой информации. Мне кажется, что в будущем мы сможем манипулировать не только средствами массовой информации, но и нашим отношением к тем или иным явлениям. Если нету какого-то цифрового отображения этой бутылки, если эта бутылка существует только в реальном мире, значит она будет выпадать из огромной части нашей жизни.

АНДРЕЙ СЕБРАНТ: Хорошо. Последний вопрос. Потом уже начнется нормальная дискуссия. А вот на ваш взгляд такой анализ больше подходит для каких-то политических приложений, может быть, для какого-то поверхностного маркетинга, или же он скорее актуален для чисто бизнесовых предложений? Вы все в основном представляете B2B сегмент, правильно? Вы же практически не сталкиваетесь с рядовыми пользователями, прошу прощения, с рядовыми потребителями.

ДМИТРИЙ АРМЯКОВ: Мне кажется, что в нашем нынешнем мире уже нет ну никакой разницы между бизнесом, политикой, стерлась даже грань между ними и частной жизнью. Все эти инструменты. По-другому скажу. Мы на рынке выделяем три мощных тренда. Это облачные вычисления, мобильные приложения, мобильные устройства. Ну, собственно, нам все, нам и не нужны аналитики. Мы все знаем про эти тренды. Мне кажется, что подобные инструменты показывают, что это реально существующие и правда актуальные тренды. Они могут продемонстрировать что реально по каждому из этих трех направлений происходит с какой-нибудь крупной компанией, например. Наверное, было бы здорово запустить, скажем, систему, разрабатываемую Quid для рядовых пользователей, чтобы они могли, ну, не какие-то стратегические решения принимать, а просто сказать, что там интересного в жизни происходит.

АНДРЕЙ СЕБРАНТ: Хотелось бы, чтобы вы, может, поспорили друг с другом. Обсудили, например, какую роль в этой новой истории будет играть человеческий мозг, обогащенный большими данными. Вы-то как эксперты еще будете нужны? Или на самом деле можно будет и без вас обойтись. Другими словами, как изменится роль ведущего аналитика, директора по стратегии в мире больших данных?

ЭЛЬДАР МУРТАЗИН: На мой взгляд вообще ничего не изменится по одной простой причине. Данных будет все больше и больше. Сейчас многие люди считают, что компьютер нейтрален. Что компьютер может принять более качественное решение, чем человек, чем эксперт. То есть люди считают на этих компьютерах, не имеют личной материальной заинтересованности и хорошо считают. Но, мы при этом забываем, конечно, что компьютер-то работает на основе алгоритмов, которые написали люди, поэтому считать компьютер нейтральным нельзя. Компьютер может быть необъективен в ту или иную сторону, может быть позитивный или негативный настрой по отношению к тому или иному вопросу, условно говоря. Поэтому считать его нейтральным ни в коем случае нельзя. Именно поэтому организация вроде Пентагона, имеющая доступ к суперкомпьютерам, не отказываются от своих экспертов. Когда принимаются какие-то решения в том же Пентагоне, они принимаются людьми, а не машинами.

АНДРЕЙ СЕБРАНТ: Я честно говоря не верю в то, что я буду жить в мире, в котором компьютеры будут принимать решения. Все ли с этим согласны?

МИРЧА МИХАЭСКУ: Ну, более-менее, да. Я слышу последние 20 лет, что конечно искусственный интеллект отменяет потребность в людях. И в общем, понемногу автоматизация тоже как-то идет, и какие-то люди становятся не нужны. И действительно, мы можем за счет автоматизации разгрузить людей от какой-то, в общем, рутинной работы. Но есть масса сложных проблем, которые требуют, не знаю, 15 лет актуального профессионального изучения для того, чтобы принять правильное решение.

АНДРЕЙ СЕБРАНТ: А кстати, Шон, а ты пожалуйста, участвую в дискуссии. Ты вот головой качаешь, ты можешь вполне поучаствовать. Ты в конце-концов и софт написал. Может быть какие-то амбициозные планы есть? Ты-то что думаешь? Ты-то планируешь нас всех лишить работы или нет?

ШОН ГОРЛИ: Нет у меня такой цели. Нет у меня цели сделать ненужным человеческий мозг. Я считаю, что человеческий мозг способен на операции, которые недоступны компьютеру. Ну, вот мы знаем, что компьютер, например, нашел, да, скажем так уникальную гарантированную стратегию победы в шашки, но когда компьютер выигрывает например, в шахматы, нужно понимать, что это победа не стратегическая. Это победа путем перебора. То есть говорить о том, что компьютер научился играть в шахматы не совсем правильно. Да, безусловно, во многих областях, скажем, уже работают компьютеры с каждой области высокочастотной биржевой торговли. Уже 70% всех операций выполняется компьютером. Ну, вот в лучшем случае человеку нужны, там, десятки, сотни миллисекунд на то, чтобы принять решение, а это практически вечность для компьютера. Но все-таки сложные жизненные вопросы решались и будут решаться людьми. Но, я думаю, что по мере совершенствования компьютеров, мы будем находить более эффективные способы их использования.

МИРЧА МИХАЭСКУ: Я думаю, что в какой-то момент времени появится суперкомпьютер, который сможет заменить человеческий мозг. Ну, и вы слышали прогноз университета сингулярности, что мол к 2040 году такой компьютер появится.

АНДРЕЙ СЕБРАНТ: Ну, давайте доживем до этого года, проверим. Вот, в течение всей презентации Шон, я все ждал, что он упомянет интуитивную прозорливость, некое интуитивное чутье, которое очень важную роль играет в любых предективных процессах. Другое дело, что когда вы пишете какой-то предиктивный алгоритм для компьютера, вам приходится неким образом моделировать человеческую прозорливость. Вот, ты что думаешь, Шон? Наступит момент, когда компьютеры смогут что-то противопоставить нашей интуитивной прозорливости. Кто первый отвечает? Ну, давай ты.

ШОН ГОРЛИ: Ну, вот здесь в Кремниевой долине есть несколько может быть даже десяток компаний, которые пытаются написать алгоритм интуиции и прозорливости. Это может звучать, как аксиома, но они все равно этим занимаются. Можно по-разному оценивать их шансы на успех, но нет сомнений в том, что там собирается много умных людей и занимается пусть даже не решаемой проблемой, что-то интересное все равно получается. Может быть мы в конечном итоге изменим свое отношение или изменим свою формулировку вот этой вот интуиции или, я не знаю, некоего случайного элемента в нашей жизни. Собственно говоря, мы можем использовать компьютеры для того, чтобы анализировать то, что нам кажется случайными, непредсказуемыми явлениями в нашей жизни. И вполне может оказаться, что они далеко не случайны. Собственно говоря, анализ вот этой вот большой картинки позволит вам с большой вероятностью выявить какие-то скрытые паттерны. Но, другое дело, что как известно, вы какую гипотезу пытаетесь, да, доказать, такие факты и находите. То есть тут непонятно, что первично.

МИРЧА МИХАЭСКУ: Мы знаем, что в компьютерной технике нету действительного, да, подлинного, случайного генератора чисел. Мы хорошо понимаем, что есть уже достаточно хорошая достоверная наука того, как нужно, не знаю, проектировать веб-сайты, мобильные приложения, организовывать пространство в магазине. Людям потом кажется, что оно все просто креативно. Что это такая красивая творческая чья-то работа. А на самом деле это все построено на научных выкладках и благодаря этому вы больше покупаете того, что вам не нужно.

АНДРЕЙ СЕБРАНТ: Ну, при всем при этом создатель-то все равно человек. Правильно. Ну, вот ваш софт становится с каждым днем все умнее и умнее. Кто же в итоге будет принимать решение? Люди, или все-таки компьютер?

ДМИТРИЙ АРМЯКОВ: Определенные виды решений конечно будет принимать компьютер, особенно те решения, которые можно математически прогнозировать. Вот, скажем, на производстве абсолютно не важно, человек принимает решение или аппарат, скажем о запуске конвейера, ну или в трейдинге, как говорил Шон. Это именно так. В решениях, которые так или иначе повлияют на людей, на человека, все-таки нужно сохранить влияние человека, тем более, что и груз ответственности будет больше в дальнейшем по мере роста автоматизации.

АНДРЕЙ СЕБРАНТ: Ну, собственно говоря, вот в медицине, например, мы все больше и больше собираем данных, лучше, выше гранулярность собираемых данных. Но все равно доктор принимает решение.

ДМИТРИЙ АРМЯКОВ: Я вот тоже не доверил бы свое здоровье компьютеру. Больше того, компьютер сможет давать, может быть, более точные и более адекватные рекомендации врачу, но, в конечном итоге, компьютер не сможет снять ответственность за ваше здоровье и вашу жизнь с врача.

МИРЧА МИХАЭСКУ: И дело же не только в ответственности. Дело в том, что человек способен решать сложнейшие проблемы. На самом деле компьютеры пока еще не могут ничего противопоставить человеческим способностям выявления зависимости и паттернов. Другое дело, что просто никто не хочет читать сотни тысяч пресс-релизов.

АНДРЕЙ СЕБРАНТ: А, то есть вы хотите сказать, что вот эту вульгарную, неинтересную работу чтения, классификации пресс-релизов и статей нужно доверить компьютеру? Хорошо. Тогда еще один вопрос вам как профессиональному аналитику. Для вас что важнее – структурированные данные или ваша собственная чуйка?

ЭЛЬДАР МУРТАЗИН: Я считаю, что данные без чуйки не имеют никакого значения. Данные — это данные, и не более того. Данные не имеют никакого смысла, если вы не учитываете весь контекст. Скажем, можно очень долго считать количество танков, не знаю, у повстанцев и правительственных войск. Но если вы при этом не будете учитывать, скажем, обученность личного состава или, скажем, качество местности, качество техники, это все бессмысленный расчет. Для людей, конечно, актуальны другие вопросы: какой телефон купить, какую машину выбрать? Люди часто задают этот вопрос экспертам, да: какую машину мне купить, какие часы выбрать? Мне кажется, что умный софт, вроде такой системы, может оказаться очень полезным именно в таком повседневном приложении. Ну, а с другой стороны, есть масса серьезных тем, будь то война, здравоохранение, где такие системы тоже будут нужны. Я думаю, что можно доверить подобным системам принятие каких-то простых жизненных решений, какие часы купить.

АНДРЕЙ СЕБРАНТ: Вопрос к уважаемой аудитории. Первое. Есть ли у вас вопросы к нашим экспертам? Их здесь 4, как вы видите. Вижу руку. Прежде чем вам донесут микрофон, я прошу поднимать руки, если вы уже используете большие данные. Вот поднимите руки, если большими данными уже пользуетесь. Это такой своеобразный опрос будет. Ага, от 5 до 10% участников. По-моему, это неплохая цифра. Ну что ж, ваш вопрос, пожалуйста.

ВОПРОС ИЗ ЗАЛА: У меня такой был вопрос. Он как и предложение отчасти. Насколько я понимаю, там идет срез данных, то есть вы берете срез и строите по ним модель. Не планируете ли вы брать динамику, чтобы отслеживать динамику изменений актуальных тематик и, что более интересно, направление изменения этих потоков информации, то есть чтобы понимать, какие тематики стимулируют развитие каких тематик, таким образом, чтобы предсказывать, что будет актуально, какая новость будет актуальна завтра.

АНДРЕЙ СЕБРАНТ: Шон, вопрос явно к тебе. Шон, ну точно тебе отвечать. Про твою же систему спрашивают.

ШОН ГОРЛИ: Я согласен.

АНДРЕЙ СЕБРАНТ: Вопрос о том, вы хотели узнать, как система эволюционирует или как данные, с которыми она работает, эволюционируют?

ЗРИТЕЛЬ: Скорее, о том, как система эволюционирует. Не предполагается ли это исследовать? Потому что в данных-то это однозначно есть.

ШОН ГОРЛИ: Сформулируйте еще раз вопрос, пожалуйста.

ЗРИТЕЛЬ: Хорошо, может быть, повторить вопрос, да? Просто, ну, я не так давно занимался исследованием распространения информации, и так получилось, что отчасти накладывается тематика. Вот. И я как бы просто продолжаю свою тематику. Вот у меня вопрос такой, чтобы понимать динамику, потому что именно динамика изменения тематик каких-то, предсказание того, что будет популярно завтра, это, на мой взгляд, будет актуально для очень многих компаний, для очень многих людей. И, собственно, мне интересно, пытаетесь ли вы анализировать данные в прогрессии. Потому что из того, что вы показали, я этого не увидел. То есть, насколько я понимаю, вы просто берете один срез, да, и после этого его анализируете. Вот. И просто вопрос, будете ли вы это делать, возможно ли так делать, анализировать динамику, и получите ли вы релевантный результат? Как вы считаете, возможно ли это?

ШОН ГОРЛИ: Понял вопрос. Спасибо за уточнение. Мы на самом деле работаем с энным количеством различных временных срезов. Поэтому всегда есть возможность открутить часы назад, ну и потом, соответственно, открутить часы вперед для того, чтобы понять, как, собственно, интересующий вас феномен или интересующий вас ландшафт меняется. Мне кажется, что сейчас очень много внимания и так уделяется попыткам предсказания будущего. Мне кажется, что это ошибка. Мне кажется, важнее заниматься формированием будущего. Ну, когда компания, скажем, вроде «Сбербанка» привлекает нас к работе над, скажем, анализом того, что происходит в области мобильных платежей, она тоже влияет на эту отрасль. Мы, строго говоря, не очень сильно интересуемся прогнозированием. Нам интересней формирование будущего. При всем при этом нужно понимать, что картинки, которые вам дают подобные системы, являются некоей стохастической выжимкой из среза сегодняшнего дня. То есть можно использовать инструменты вроде нашего для того, чтобы с определенной вероятностью прогнозировать, что будет через, скажем, 12 месяцев. Только верить в такие прогнозы слишком сильно не надо.

АНДРЕЙ СЕБРАНТ: Спасибо, у нас еще один вопрос, вот там вот я вижу. Я так понимаю, что вопрос ко всем экспертам, не только к Шону.

ВОПРОС ИЗ ЗАЛА: Меня Руслан зовут. У меня вопрос такой. Ваша система анализирует компании. Может ли ваша система, потому что она используется в разных организациях, вы же из разных организаций, вы планируете использовать эту систему для анализа поведения человека, чтобы выявить его мотивы, предложить ему свои услуги и так далее? Вот какой вопрос. Анализировать не фирмы, а людей с помощью вашей системы?

ЭЛЬДАР МУРТАЗИН: Отвечу как независимое лицо, которое к этой системе отношения не имеет. Данные — они нейтральные, и можно анализировать все, что угодно. То есть поведенческие характеристики человека характеризуются очень просто. Они всегда условны, но на большом массиве данных их можно проанализировать. Я могу привести вот простой пример про Россию, он будет достаточно забавным. Мы пытались поделить социальные слои в России, проанализировав большой массив данных — это примерно 20 млн человек. Единственная категория, которая от Владивостока до Калининграда является одинаковой, ну вот, по набору характеристик, это чиновники. Соответственно, студенчества не существует как такового, потому что разброс очень большой. Есть какие-то подкатегории, но кроме чиновников в нашей стране отдельной категории людей не существует. Но мы анализировали те самые данные, которые можно достать из разных источников, и эта система зависит исключительно от того, как вы ее настроите. Она может анализировать данные для конкретного предприятия, завода, для конкретной сети магазинов или вообще глобально для всего мира. Это зависит от того, что вы на входе отдаете, какие данные вы скармливаете. Ну и сколько вы готовы заплатить за вычислительные мощности, скорее. Спасибо.

АНДРЕЙ СЕБРАНТ: Ну что ж, теперь слово вам как клиенту.

МИРЧА МИХАЭСКУ: Большие данные можно использовать совершенно по-разному. Шон со своими коллегами нацелены на решение конкретной задачи. Что касается «Сбербанка», могу сказать, что нас на самом деле интересует не столько поведение конкретных потребителей, сколько, скажем, большой группы клиентов, да, нас интересует, скажем, отношение наших клиентов к «Сбербанку». Люди в Twitter пишут хорошие вещи про «Сбербанк» или ругаются? А это тоже Big Data, согласитесь, постольку поскольку «твитов» каждый день пишется миллионы и миллионы. Плюс к этому можно добавить, скажем, данные о транзакциях. У нас все-таки 75 млн клиентов и 300 млн транзакций в день. Это огромный объем данных. И объединяя все эти виды данных, мы можем предположить, что у банка такое-то и такое-то финансовое будущее, потому что у нас есть возможность сравнить и эти данные со, скажем, восприятием наших основных конкурентов, добавить к этому данные по ликвидности банков и так далее. Когда данных много, все уже зависит от качества данных и качества фильтров.

ДМИТРИЙ АРМЯКОВ: Хотя Шон использовал SAP в качестве одного из примеров, вот та проблематика, которую вы затронули, на самом деле она очень большая. Вопрос — не просто обработать эти данные и получить персональный профиль. Вопрос — получить его вовремя. Представьте себе, когда вы приходите в магазин, вы являетесь одним — ну если для крупной торговой сети — вы являетесь одним из десятков или сотен, иногда миллионов пользователей. Информацию о вас нужно получить в ту секунду, когда вы вошли в магазин. То есть это вопрос уже не просто о больших данных, а их скорости обработки и их структурированности или неструктурированности, хотя, в принципе, технологии, о которых вы говорите, они уже существуют, и уже некоторые в России пока не знаю, насколько используют, но в мире уже есть примеры использования подобного рода вещей.

АНДРЕЙ СЕБРАНТ: Спасибо. Вижу вопрос. Наверное, это будет уже последний вопрос, поскольку время у нас заканчивается.

ВОПРОС ИЗ ЗАЛА Вопрос вот какой. Предположим ситуацию, что пользователями Quid становятся участники одного и того же рынка, и, так скажем, Quid становится традиционным, распространенным. Не означает ли это, что — ну, может быть, сейчас не то что спрогнозирую, а сфантазирую — что руководство компании останется фактически без инструмента к принятию решений. Что тогда? Они будут полагаться исключительно на свою интуицию, если у всех будет ну практически одна и та же аналитика для принятия решений? И если это так, то предполагается ли в дальнейшем какое-то, я не знаю, интегральное решение, может быть, для таких программ и им подобных? Спасибо.

ЭЛЬДАР МУРТАЗИН: Можно я коротко отвечу? Quid — это инструмент, молоток. В зависимости от кривости рук тех, кто держит этот молоток, у вас может получиться собачья будка, а может получиться очень красивый дом. Соответственно, клиенты предоставляют некие данные для обработки. Качество этих данных всегда будет отличаться, и на выходе — ну очень часто говорят: мусор на входе — мусор на выходе. Вот тут работает то же самое правило. Если вы на вход подаете непонятную жижу, на выходе конфетка не получится. Вот так.

МИРЧА МИХАЭСКУ: Я думаю, Шон будет счастлив, если мы будем все пользоваться его софтом, и нам тоже будет хорошо, потому что здесь сработает своеобразная сетевая динамика. Но если в мире всего у двух людей телефоны, полезность от них небольшая. Когда их миллиарды, это совершенно другой мир. И я думаю, что если мы все будем принимать хорошие, правильные решения, это пойдет на пользу обществу в целом.

контакты

119072, Москва, Берсеневская набережная, 6, стр.3

+7 (499) 963–31–10
+7 (985) 766–19–25
do@digitaloctober.com