SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチームの表紙

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

澤田 武男, 関根 達夫, 細川 一茂, 矢吹 大輔, Betsy Beyer, Chris Jones, Jennifer Petoff, Niall Richard Murphy, Sky株式会社 玉川 竜司

出版日: 2017/8/12

出版社: オライリージャパン

ページ数: 590ページ

最終更新: 2023年9月18日

人気スコア: 263

どんな本?

Googleが長年培ってきたサイトリライアビリティエンジニアリング(SRE)の思想と実践を網羅した一冊です。本書では、GoogleのSREチームの主要メンバーが、世界最大規模のソフトウェアシステムをどのように構築・運用しているのか、その詳細な方法論を解説します。リスク管理、サービスレベル目標(SLO)、リリースエンジニアリングといったSREの原則から、インシデント管理、障害の根本原因分析(RCA)、SREチーム内でのソフトウェア開発といった実践的なノウハウまで、具体的かつ体系的に学ぶことができます。さらに、SREチームのトレーニングやコミュニケーションといったマネジメント側面にも触れており、大規模分散システムを高い信頼性で運用するための包括的な知識とスキルが身につきます。急速にスケールするサービスを安定運用したいエンジニア、運用チームの信頼性向上を目指すエンジニアにとって必携の書であり、実務における課題解決のヒントが満載です。

この本に言及している記事

Q

Webエンジニア1年目で取り組んだ教材53選を振り返る

by とも on Qiita 2023年9月18日
"SREの概念と実践方法を体系的に学べる書籍。サイトの信頼性向上に向けた具体的なアプローチや、障害発生時の対応策など、実務で直面する課題解決のヒントが豊富に詰まっている。特に、GoogleのSREチームが長年培ってきた知見が凝縮されており、信頼性の高いシステム運用を目指すエンジニアにとって必読の一冊と言える。"
Q

クラウドが好きな大学生が読んで良さげだった本を紹介する

by Ryota Yamada on Qiita 2021年11月27日
"GoogleのSREチームが実践する信頼性向上のノウハウが詰まった名著。サイトの信頼性を支えるための具体的なプラクティスや哲学を学べる。インフラ管理や運用に携わるエンジニアにとって必読であり、システムの安定稼働と可用性向上に不可欠な知識を提供。"