Продолжаем обсуждение форматов файлов и схем данных. Рассматриваются: выведение схемы данных, проекция сложных типов данных в колонки, преимущества колоночных форматов, кратко о методах сжатия данных. Dremel made simple with Parquet https://blog.twitter.com/engineering/en_us/a/2013/dremel-made-simple-with-parquet.html Avro specs https://avro.apache.org/docs/1.8.1/spec.html
Информация
- Подкаст
- Опубликовано17 сентября 2019 г. в 22:18 UTC
- Длительность16 мин.
- ОграниченияБез ненормативной лексики