Открыто

ETL-разработчик: пайплайны, хранилища данных и BI-решения [2020] [Нетология] [Алексей Кузьмин]

Тема в разделе "Курсы по программированию", создана пользователем Toxich, 1 ноя 2020.

Основной список: 17 участников

Резервный список: 12 участников

  1. 1 ноя 2020
    #1
    Toxich
    Toxich ЧКЧлен клуба
    ETL-разработчик: пайплайны, хранилища данных и BI-решения [2020]
    Нетология
    Алексей Кузьмин


    Ни аналитик, ни инженер данных не пишет ETL с нуля, но умеет его наладить и использовать готовые решения, где это возможно. Такой подход не требует глубокого знания программирования и помогает избегать костыльных решений, которые компании не могут масштабировать.

    1. Перейдите на следующую ступень профессионального развития для аналитиков.
    2. Научитесь извлекать данные и переносить их в хранилища в нужном виде без помощи разработчиков.
    3. Получите востребованную за границей специальность.

    Аналитик, разработчик или инженер — каждый найдёт в этом курсе практику и знания для усиления своих профессиональных позиций.

    1. Объяснять архитектуру и структуру базы данных.
    Применять нормализацию, проектировать схемы хранилища: Star Schema, Snowflake Schema, Hybrid Schemas.​
    2. Писать запросы к базам данных, Join`ы, агрегаты, группировки, вложенные запросы.
    Применять индексы, фильтрацию, агрегацию, импорт/экспорт данных.​
    3. Выбирать DWH под задачу и бюджет бизнеса.
    Понимать особенности популярных решений: Snowflake, BigQuery, Azure SQL DW, Redshift и прочих​
    4. Разовьёте навык data literacy.
    Научитесь понимать, пояснять и обогащать данные отчётов, дашбордов и других источников информации.​
    5. Выводить real-time отчётность.
    И строить RTDM-системы с использованием массовых enterprise BI-решений.​
    6. Управлять ETL/ELT-процессами.
    Настраивать и конфигурировать ETL / ELT-процессы в нескольких дата-инструментах.​
    1. Новичкам в data science.
    Сможете влиться в новую сферу и приобрести базу, с которой можно постоянно развиваться горизонтально — в любых компаниях и продуктах. Компании ждут, что новый сотрудник если и не умеет ровно то, что надо — его не надо учить работать с SQL и запросами к хранилищам.​
    2. Продуктовым, маркетинговым, бизнес-аналитикам.
    Расширите свою профессиональную траекторию, углубитесь в техническую сторону ровно настолько, чтобы достигать лучших результатов в текущей работе или перейти на новые более сложные задачи в работе с данными.​
    3. Разработчикам Python, JS, Java, C++.
    Узнаете, как правильно спроектировать аналитическую БД для нужд потребителей данных: аналитиков и руководителей, принимающих решения. Научитесь выводить real-time отчётность и строить RTDM-систему с понятными и читаемыми бизнес-показателями.​
    Модуль 1 - SQL и получение данных
    SQL — главный инструмент аналитика. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
    • Теория множеств. Введение в реляционную алгебру
    • Разбор сложностей и вопросов при работе с окружением
    • Основы SQL
    • Углубление в SQL
    • Работа с PostgreSQL
    • Работа с MongoDB
    Модуль 2 - Data Warehouse
    Научитесь организовывать работу с традиционными хранилищами данных и настраивать и конфигурировать ETL / ELT-процессы (Pentaho или аналоги). Выполните заливку данных в нескольких популярных форматах и создадите свой первый OLAP-куб. Поймёте плюсы и минусы Snowflake, BigQuery, Azure SQL DW, Redshift и разберётесь, когда переводить процессы с разрозненных Excel на БД.
    • Проектирование хранилища данных
    • Знакомство с Pentaho
    • ETL-pro
    • Data Governance
    • DWH в облаке
    Модуль 3 - Выбор и подключение Business Intelligence-решения
    Научитесь определять потребности и требования бизнес-пользователей, выбирать решения, архитектуру под него и стратегию масштабирования, удовлетворяющую росту бизнеса. Познакомитесь с Tableau / Power BI как самыми популярными энтерпрайз-решениями. Подключитесь к хранилищу данных и выполните передачу данных в шаблонный dashboard. Научитесь выводить Real Time-отчётность.
    • BI как сердце аналитики
    • Знакомство с Pentaho BI
    • Многомерные модели
    • Pentaho Analysis Services
    • Real Time-отчётность
    Модуль 4 - Дипломная работа
    В качестве дипломного проекта необходимо выполнить работу на учебном датасете, основанном на данных реального бизнеса. Вас ждут две личные онлайн-консультации с ментором и одна групповая консультация с ответами на вопросы и советами по подготовке работы.

    В рамках диплома потребуется:
    • Спроектировать модель данных
    • Загрузить в неё данные при помощи ETL
    • Построить OLAP-куб
    • Реализовать дашборд

    Продажник
     
  2. Последние события

    1. liya4
      liya4 не участвует.
      28 июн 2025
    2. liya4
      liya4 участвует.
      28 июн 2025
    3. Djeks
      Djeks не участвует.
      26 май 2025
    4. skladchik.com
      В складчине участвует 20 человек(а).
      6 дек 2024