4 episodes

Подкаст о Data Engineer-ах. Рассказы о сложностях практического Data Engineer-инга, основанные на опыте автора при создании системы аналитики для IOT/WebScraping данных на azure.
Упоминаются: azure data explorer, azure data fabric, azure data lake storage, azure data lake analytics и многое другое.

Data Engineer поневол‪е‬ Hodza Nassredin

    • Technology

Подкаст о Data Engineer-ах. Рассказы о сложностях практического Data Engineer-инга, основанные на опыте автора при создании системы аналитики для IOT/WebScraping данных на azure.
Упоминаются: azure data explorer, azure data fabric, azure data lake storage, azure data lake analytics и многое другое.

    3: ETL и EventHub

    3: ETL и EventHub

    Обсуждаем и сравниваем ETL системы на примере Apache NIFI и StreamsetsDataCollector. Далее разбираемся в работе EvenHub-ов.

    • 30 min
    2: Форматы и схемы

    2: Форматы и схемы

    Продолжаем обсуждение форматов файлов и схем данных.
    Рассматриваются: выведение схемы данных, проекция сложных типов данных в колонки, преимущества колоночных форматов, кратко о методах сжатия данных.


    Dremel made simple with Parquet
    https://blog.twitter.com/engineering/en_us/a/2013/dremel-made-simple-with-parquet.html

    Avro specs
    https://avro.apache.org/docs/1.8.1/spec.html

    • 16 min
    1. Форматы файлов

    1. Форматы файлов

    Обсуждаем разные форматы файлов для хранения данных

    • 16 min
    0. Пилотный выпуск

    0. Пилотный выпуск

    Подкаст о Data Engineer-ах. В пилотном выпуске краткая информация обо мне и о чем планируется говорить.
    Упоминаются: azure data explorer, azure data fabric, azure data lake storage, azure data lake analytics и многое другое.

    • 32 min

Top Podcasts In Technology

Lex Fridman Podcast
Lex Fridman
All-In with Chamath, Jason, Sacks & Friedberg
All-In Podcast, LLC
Apple Events (video)
Apple
Apple Events (audio)
Apple
The TED AI Show
TED
Deep Questions with Cal Newport
Cal Newport