Data Lake против Data Warehouse или как посчитать то, о чем забыли написать в ТЗ


Никитин Иван
Иван Никитин и партнеры, Королев
Основатель
Тема доклада:
Data Lake против Data Warehouse или как посчитать то, о чем забыли написать в ТЗ…

Тезисы доклада:
• При работе с данными есть два подхода их сбора, хранения и обработки -- Data Lake и Data Warehouse, то есть, сырые данные и структурированные.
• Традиционно используют Data Warehouse и схему ETL (Extract – Transform – Load) однако жесткая структура таких данных и является тем ярмом, которая полностью лишает гибкости нашу систему аналитики.
• Использование Data Lake и сбор сырых, необработанных данных открывает совершенно новые горизонты, но цена этого – повышенные требования к мощности хранилищ.
• Наша компания на протяжении последнего времени сосредоточитесь на использовании Data Lake и мы научились решать очень нетривиальные задачи.
Несколько практических примеров на базе сырых необработанных данных Google Analytics 4 будут продемонстрированы в докладе.

О себе:
Иван Никитин – специалист в области интернет-маркетинга и веб-аналитики с более чем 15-летним стажем, реализовывал и участвовал в сотне проектов внедрения систем аналитики.

Автор многочисленных курсов по поисковой оптимизации и веб-аналитике, которые читались в многочисленных учебных заведениях: Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации в программе MBA Eecutive, ALMA University, Центр Специалист при МГТУ им. Баумана, Центр Мастеров. В настоящее время – создатель и директор компании "Иван Никитин и партнёры".
Республика Татарстан, Иннополис г., Университетская ул., д.1