詳解 データレイクハウスアーキテクチャ ―Delta Lakeを使ったデータAI活用とガバナンスの表紙

詳解 データレイクハウスアーキテクチャ ―Delta Lakeを使ったデータAI活用とガバナンス

Denny Lee, Tristen Wentling, Scott Haines, Prashanth Babu, R. Tyler Croy, 長谷川 亮(監訳), 倉光 怜(監訳), 小谷 尚太郎(監訳), 竹下 俊一郎(監訳)

出版日: 2025/11/19

出版社: オライリー・ジャパン

ページ数: 388ページ

最終更新: 2024年11月15日

人気スコア: 98

どんな本?

データレイクの限界を打破し、モダンなデータ基盤を構築するための決定版となる本書は、オープンソースのDelta Lakeを活用したデータレイクハウスアーキテクチャの全容を解説します。ACIDトランザクション、タイムトラベル、スキーマ進化、データ品質管理といったDelta Lakeの核となる機能と、その実践的な適用方法を詳細に学びます。Apache Sparkとの連携、BIツールやAI/MLへの応用、そして運用におけるベストプラクティスまで網羅しており、データエンジニア、アーキテクト、アナリストが直面するデータ管理の複雑さ、性能、ガバナンスといった課題を解決するための具体的な手法を提供します。本書を読むことで、信頼性が高く、スケーラブルで、かつ管理しやすいデータ基盤の設計・構築スキルを習得できます。データ活用の高度化を目指すすべての方にとって、必読の知識と実践的なノウハウが得られる一冊です。

この本に言及している記事

Z

データエンジニアリング関連のおすすめ書籍(随時更新)

by ぺんぎん on Zenn 2024年11月15日
"Databricks採用で有名なDelta Lakeを扱った書籍。概念、アーキテクチャから運用まで詳細に解説。特にパフォーマンスチューニングの章はレイクハウス運用に役立つ。Predictive OptimizationやAutomatic Liquid Clusteringなど、運用負荷軽減機能の必要性も理解でき、Delta Lakeを扱う上で必読。"