OTF Talk

Akira Shimosako

OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。 (host: @simosako) https://www.otftalk.com/

  1. 3月24日

    #36 Apache HiveからみたOpen Table Format (OTF)

    OTF Talk 第36回は、Apache Hive PMCメンバーのおくみんさんに「Apache HiveからみたOTF」についてお話をうかがいました。 Apache Hiveとは何か/Apache Hiveへの貢献とPMC/HiveとOpen Table Format/Apache Iceberg対応/Apache Hiveコミュニティ OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。 https://www.otftalk.com/ guest: guest:@okumin おくみん Apache Hive PMC メンバー / Treasure Data ソフトウェアエンジニア host: @simosako 下佐粉 昭 AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス ※感想は #OTFTalk でポストいただけると励みになります。 ※発言は各個人のものであり、所属組織を代表するものではありません。 -------------------- 参考) おくみんさん Xアカウント - https://x.com/okumin Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウス (書籍) https://book.impress.co.jp/books/1124101072 Apache HiveとIceberg: 2025年春 (おくみんさんによる、HiveのIceberg関連プロジェクト解説) https://blog.okumin.com/entry/2025/05/30/110000 -------------------- ※AI生成の目次です。ご参考までに。 [00:00] ゲスト紹介とHive PMCとしての活動 ゲストのおくみんさん(トレジャーデータ)は、約10年のビッグデータ歴を持ち、Apache HiveのPMCメンバーとして開発を主導している。 共著(寄稿)した書籍『Apache Iceberg活用入門』の話題。 [05:22] Apache Hiveとは何か? モダンな構成への変化 Hiveは「メタストア」と「SQLクエリエンジン」の2つの主要コンポーネントで構成される。 実行エンジンはMapReduceからApache TezやLLAPへ移行し、高速化を実現している。 [11:13] Open Table Format(OTF)とHiveの親和性 HiveはApache Icebergを強力にサポートしており、Sparkに次ぐ機能網羅性を誇る。 カタログ機能だけでなく、データのコンパクション(最適化)やクリーンアップなどのメンテナンス機能もHive単体で完結できる「Best of Suite」としての利点。 [16:47] 最新の開発トピック:KubernetesとIceberg v3 HelmチャートによるKubernetesへのデプロイ対応が進んでおり、インフラ管理が容易になりつつある。 Iceberg v3スペックへの対応や、複数テーブルを跨ぐトランザクション機能の実装が進んでいる。 [25:31] Hiveコミュニティの熱量と今後の展望 100名以上のコミッターが在籍し、AI時代やデータレイクハウスの進展に合わせて今なお熱意を持って進化し続けている。

    24分
  2. 2025/09/23

    #29 関西でのOTFコミュニティ活動

    OTF Talk 第29回は、さくらインターネットの永富 安和さん(やっさん)に「関西でのOTFコミュニティ活動 」についてお話をうかがいました。 OTFSGとコミュニティ活動/OTF周辺での関心領域/関西でのコミュニティ活動/OTFSG今後の予定 OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。 https://www.otftalk.com/ guest: @yassan168 永富 安和さん(やっさん) さくらインターネット ソフトウェア開発エンジニア host: @simosako (下佐粉 昭) AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。 ※感想は #OTFTalk でポストいただけると励みになります。 ※発言は各個人のものであり、所属組織を代表するものではありません。 -------------------- 参考) やっさん X https://x.com/yassan168 OTFのコミュニティ OTF Study Group (OTFSG) https://otfsg-tokyo.connpass.com/ (OTFSG Slack への招待リンクも上記URLに記載されています) 資料 「マイクロアドのData LakehouseとIcebergテーブルの最適化について」 https://docs.google.com/presentation/d/1w4mY_coUKPfMBbpvi-fJygmUZIvmh0q6ipG-BM1PxiM/edit?slide=id.g22df57b2e5d_0_0 上記発表の録画 https://youtu.be/jEH17or26b0?si=uv6-rO2UTBQSNeIc&t=284 RUSTFS (MiniIO alternative) https://github.com/RustFS/RustFS Lake Keeper https://docs.lakekeeper.io/ -- ホストしているもう1つのPodcast : SKO Radio https://www.skoradio.com/

    20分

評価とレビュー

5
5段階評価中
3件の評価

番組について

OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。 (host: @simosako) https://www.otftalk.com/