信頼性の高い機械学習 ―SRE原則を活用したMLOpsの表紙

信頼性の高い機械学習 ―SRE原則を活用したMLOps

Cathy Chen, Niall Richard Murphy, Kranti Parisa, D. Sculley, Todd Underwood, 井伊 篤彦, 張 凡, 樋口 千洋

出版日: 2024/10/23

出版社: オライリー・ジャパン

ページ数: 388ページ

最終更新: 2025年6月18日

人気スコア: 64

どんな本?

機械学習システムの信頼性と運用効率を劇的に向上させる一冊です。本書では、Googleが実践するSRE(サイトリライアビリティエンジニアリング)の原則を機械学習システムに適用する方法を、仮想のオンラインストア「yarnit.ai」の事例を通して具体的に解説します。モデルの本番環境でのモニタリング、責任あるデータ管理、スムーズで安全なモデル更新プロセス、コストやパフォーマンスの最適化など、MLOpsにおける実践的な課題解決スキルが身につきます。最後の15章では、6つのケーススタディを通じて、MLOps特有の複雑な問題に深掘りして対処する方法を学びます。単なるモデル開発に留まらず、製品開発組織におけるチーム運営や、機械学習ライフサイクル全体を俯瞰した運用・保守まで、SREの視点から信頼性の高いMLシステム構築・運用を目指すエンジニアやデータサイエンティストにとって、必読の内容となっています。

この本に言及している記事

Z

2025年6月版読んでいて良かった本紹介

by Akasan on Zenn 2025年6月18日
"MLOps構築に携わるエンジニアが、機械学習の実応用に向けた知識を再学習するのに適した書籍。機械学習モデルを安定して提供するためのプラットフォーム構築において、どのような点に注意すべきかを具体的に学べる。信頼性の高いAIシステムを開発・運用するための実践的なノウハウが詰まっており、プロジェクトの成功率を高めるための指針となる。"