Data Science Week 2015

С 24 по 30 августа в Digital October пройдет международный фестиваль анализа данных Data Science Week 2015. Вас ждет больше 30 открытых лекций и семинаров от ведущих российских и зарубежных экспертов по Data Science, которые сегодня развивают эту индустрию.
Среди хедлайнеров Data Science Week - руководитель службы разработки продуктов Big Data Beeline Сергей Марин, заместитель руководителя управления по информационной политике Московской области Сергей Водопетов, а также Мансур Раад - старший разработчик американского производителя геоинформационных систем Esri.
Генеральный партнер - Лаборатория новых профессий.
Программа:
24.08 Монетизация больших данных
- 18.00 - Регистрация участников
- 18.20 - Открытие
- 18.30-19.00 Михаил Черепенев, СТО DCA, доклад "Большие данные для большого дела"
- 19.00-19.30 Сергей Марин, Руководитель службы разработки продуктов Big Data Beeline, доклад "Использование технологий Big Data для персонализации до уровня клиента на примере кейсов оператора связи"
- 19.30 - 20.00 Зоя Никитина, генеральный директор и со-основатель E-Contenta, доклад "Монетизация читающей аудитории: как связь данных о поведении пользователя внутри мобильного приложения Bookmate и в социальной сети VK помогла снизить CAC"
- 20.15-20.45 Александр Крот, основатель MLClass.ru, доклад "Что мешает зарабатывать на больших данных?"
- 20.45-21.15 Лев Гершензон , СЕО Detectum, доклад "Поиск на сайте - как сделать из посетителей покупателей"
- 21.15-21.45 Игорь Селицкий, руководитель веб и онлайн аналитки Lamoda
25.08 Открытые данные
- 18.30-19.00 Майя Стравинская, медиа-продюсер, доклад "Как рассказать историю с помощью данных"
- 19.00 - 19.30 Иван Бегтин, директор центра "Информационная культура", доклад "Как работать с большими государственными данными"
- 19.30-20.00 Сергей Водопетов, заместитель руководителя главного управления по информационной политике Московской области, доклад «Медиа-дата. Есть ли заказчики»
- 20.15-20.45 Андрей Заводчиков, менеджер проектов Проектного офиса Открытого правительства, доклад " Теория и практика раскрытия государственной информации"
- 20.45 - 21.15 Евгений Смирнов, основатель и технический директор Newtonew, доклад «Как использовать большие данные при построении мобильных приложений и в онлайн-образовании?»
- 21.15-21.45 Ирина Радченко, доцент ИТМО, доклад «Как обучать работе с открытыми данными»
26.08 Data Scientist: рабочие инструменты
- 18.00-18.30 Денис Баталов, Amazon Web Services
- 18.30-19.00 Михаил Черепенев, СТО Data-Centric Alliance
- 19.00 - 19.45 Андрей Выходцев, Big Data Solution Architect IBM, доклад "Работа Data Scientist с инструментарием IBM"
- 19.45 - 20.15 Наталья Горбунова, ведущий консультант Oracle, доклад "Oracle Big Data Discovery – Hadoop c человеческим лицом"
- 20.15 - 20.45 Александр Иващенко, ведущий разработчик REES46, доклад "Архитектура рекомендательной системы REES46"
- 21.00 - 21.30 Вадим Челышков, эксперт по технологическим решениямм Microsoft, доклад "Использование облачных сервисов в сфере Big Data"
- 21.30 - 22.00 Андрей Зимовнов, ведущий data scientist Ozon.ru, доклад "Анализ данных при помощи Spark в IPython"
27.08 Data driven business
- 18.00-18.30 Павел Велихов, Chief Science Officer Toprater, доклад "Data Product: сборка, версионность, тестирование больших объемов данных"
- • 18.30-19.00 Михаил Кечинов, основатель REES46, доклад "Отраслевые товарные рекомендации на основе виртуального профиля покупателя"
- • 19.00-19.30 Иван Гуз, Директор аналитического департамента Avito, доклад "Точная оценка эффекта и оптимизация email рассылок среди лояльных клиентов"
- • 19.30-20.00 Евгений Легкий, основатель Segmento, доклад "Big Data = Big Money?"
- • 20.00-20.30 Василий Черный, Директор по маркетинговым коммуникациям Brand Analytics, доклад "Social Media Analytics: Маркетинговые исследования в социальных медиа"
- • 20.30-21.00 Александр Турилин, директор по продукту NPL, презентация программы "Специалист по большим данным"
- • 21.00-21.30 Ральф Хаберих, Chief commercial officer Webtrekk, доклад "Web Analytics is dead – long live Digital Intelligence" (с синхронным переводом на русский)
- • 21.30-22.00 Олег Новиков, Data Scientist Lyst.com, доклад "Мы собрали много данных о поведении пользователей сайта. Что делать дальше?"
28.08 Advanced Spark
- • 18.00-18.30 Мансур Раад, старший разработчик Esri, доклад "Визуализация геоданных в Esri при помощи Spark"
- • 18.30-19.00 Константин Коточигов, аналитик данных, CleverData, доклад "Сегментация пользователей в online-рекламе с использованием Spark"
- • 19.00-19.30 Олег Борисенко, Институт системного программирования, доклад "Реализация Spark jobs для Openstack Sahara и использование Spark в будущем релизе Openstack (Liberty)"
- • 19.30-20.00 Андрей Выходцев, Big Data Solution Architect IBM, доклад "Apache Spark - направление развития"
- • 20.15-20.45 Александр Федерягин, 3data, доклад "Кластер Spark за полчаса"
- • 21.00-22.00 Александр Сербул, руководитель направления 1C-Битрикс прочитает сразу два доклада "Apache Spark: подводные камни и надводные скалы - опыт выживания" и "Кластер для обработки BigData в Amazon Elastic MapReduce - взлеты и ... падения"
29.08 и 30.08 пройдет финальный Datathon, на котором можно будет закрепить полученные знания на практике. Он ориентирован на участников, которые уже умеют работать с данными и строить machine learning модели. Командам нужно будет решить три задачи:
- Первая задача - поработать с данными компании HeadHunter и построить модель прогнозирования зарплаты по описанию вакансии, проявив оригинальность в feature engeneering, также учитывая бизнес-требования к результату.
- Вторая задача - разработать алгоритм похожих поисковых запросов, с тем, чтобы каждый соискатель получал подборку вакансий, релевантных его требованиям. Для этого будут нужны знания по анализу текстов, коллаборативной фильтрации и content-based рекомендательных системах.
- Третью задачу подготовил Ozon - компания откроет часть своих данных, чтобы команды могли придумать, как рекомендовать пользователям редко покупаемые товары из так называемого хвоста распределения. Для этого нужно уметь работать с помощью content-based рекомендаций.
Все командам будет предоставлен доступ к Spark через IPython Notebook. Datathon начнется в 11 утра 29 августа и закончится в 15 часов 30 августа. Если хотите потратить эти 28 часов с пользой, регистрируйтесь в качестве участника состязания сегодня!