Станьте инженером данных с нуля, обучаясь на реальных задачах бизнеса
Во время обучения сделаете большое количество заготовок, которые пригодятся и для портфолио, и уже во время работы:
Проведение RFM-анализа клиентской базы аптечной сети с помощью PostgreSQL и Metabase
Настройка удаленного Linux-сервера и развертывание аналитической инфраструктуры с нуля с помощью Docker: Metabase, PostgreSQL, Clickhouse, Airflow
Создание автоматизированного ETL/ELT-пайплайна по обработке данных об активности студентов крупного онлайн-университета с помощью Airflow
Формирование продуктовых рекомендаций для клиентов крупного телекома с помощью Clickhouse
Настройка ETL данных о пользователях в социальных сетях с помощью Python VK API и Hadoop
Программа курса
Введение в профессию
SQL и базы данных
Визуализация в Metabase
Git/Github
Python
Объектно-ориентированное программирование в Python (ООП в Python)
Python для анализа данных
Linux
Docker
Airflow
Продвинутый SQL для работы с большими данными
Clickhouse и хранилища данных (DWH)
Hadoop и озера данных (Data lake)
Spark / pySpark
Финальный проект
Преподаватели
Молоков Богдан
Backend Developer, Simulative
Андрон Алексанян
CEO & Founder. Simulative & IТ Resume
Астанков Дмитрий
Senior MLOps Engineer в Zvuk, ex-Яндекс, ex-Akvelon. Разрабатывает пайплайны для инференса моделей машинного обучения и получения контентных эмбеддингов, поддерживаю хранилище этих эмбеддингов. Стек: Python, SQL, PyTorch, Apache Airflow, Docker, Kubernetes, bash, Git.