OTF Talk 第20回は、joker1007さんに「Apache Hudiを巨大トラフィックのシステムに導入しようと検証して得た知見(後編)」についてお話をうかがいました。
OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。
Hudiを選択した背景/検証環境/インデックス設定による変化/結果と考察
guest:@joker1007
Repro チーフアーキテクト
host: @simosako (下佐粉 昭)
AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。
※感想は #OTFTalk でポストいただけると励みになります。
※発言は各個人のものであり、所属組織を代表するものではありません。
参考)
joker1007さんXアカウント https://x.com/joker1007
Repro https://repro.io/
更新可能なデータレイクを構築するテーブルフォーマットApache Hudiについて (joker1007さんによるHudi解説)
https://tech.repro.io/entry/2024/07/26/141233
本番のトラフィック量でHudiを検証して見えてきた課題 (otfst_tokyo #4 でのjoker1007さん登壇資料)
https://speakerdeck.com/joker1007/ben-fan-notorahuitukuliang-dehudiwojian-zheng-sitejian-etekitake-ti
Apache HudiのMerge on Readテーブルのパフォーマンス特性とチューニングについて(上記資料の解説ブログ)
https://tech.repro.io/entry/2024/10/28/170721
Информация
- Подкаст
- ЧастотаЕженедельно
- Опубликовано10 декабря 2024 г., 22:00 UTC
- Длительность28 мин.
- Сезон1
- Выпуск20
- ОграниченияБез ненормативной лексики