システム監視の入門書籍を書きました
わたしが執筆したWebエンジニアのための監視システム実装ガイドが2020/3/24に発売されますました。
予約受付中です。
物理書籍・Kindle共に販売中です。
PDF版なら検索もできちゃいます。
※このエントリを書いている時点でまだ表紙がfixしていませんが、黒バックにウミガメ写真になる予定です
運用監視の会社でCTOとして勤続12年の知見を詰め込んだ、システム監視について幅広く取り扱った実践的な入門書です。 読者の方に体系的な知識と価値基準を獲得してもらえるよう努めました。
監視テクノロジの歴史や特徴、監視システムの基本動作と動作方式ごとの特徴、時系列データベース、DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集方式のPush/Pull、オンコールなど関連するトピックを幅広く取り上げています。
Amazonの内容紹介にあるとおり、本当に基本的な考え方から書きました。 システム監視についてテクノロジやツールそのものだけでなく、意義や目的のような抽象レイヤも、導入後の継続的な運用時のお悩みなど俯瞰して捉える足がかりになると思います。
システムは、何もしないと壊れます。 システムは、よくわからない状態になります。
どれだけ技術力の高いエンジニアが設計・構築しても、残念な事実として、システムを構築した後に何もしないと壊れます、よくわからない状態になります。
システムを「監視」あるいは「モニタリング」することで、
- 異常を検知し復旧させること
- システムの価値を維持・向上させること
ができます。
本書では、監視テクノロジの動向から組織での実装まで、わかりやすく学ぶことができます。 最新ツールの説明、実装パターンの紹介だけでなく、組織での実装にあたっての態勢づくり、システムづくりについても現場目線で寄り添って解説しています。
これから監視を始める方にはもちろん、現状の監視システムに疑問を抱いている方にもおすすめの1冊です。
もくじ
Amazonの商品ページの目次より少し詳しく紹介します。
第1章 監視テクノロジの動向
- 1.1 システムにまつわる残念な事実
- 1.2 監視テクノロジの2つの志向性
- 1.3 監視テクノロジの動向
- 1.4 Webシステム運用の文化
第2章 監視テクノロジの概要
- 2.1 監視テクノロジで実現したいこと
- 2.2 可用性の測り方
- 2.3 監視システムの種類
- 2.4 監視システムの構成概要
- 2.5 自己修復機構と監視テクノロジ
- 2.6 自己修復システムの継続的運用を支える Chaos Engineering
第3章 監視テクノロジの基礎
- 3.1 監視テクノロジの基礎
- 3.2 観測部分の基礎技術
- 3.3 データ収集部分の基礎技術
- 3.4 データ利用部分の基礎技術
- 3.5 時系列データベースの基礎技術
- 3.6 ログの基礎技術
第4章 監視テクノロジの導⼊
- 4.1 「監視」に対する期待
- 4.2 監視を始める
- 4.3 監視ツールどれにしよう問題
第5章 監視テクノロジの実装
- 5.1 アラーティングする / しないの基準
- 5.2 アラーティング目的の観測項目を決める
- 5.3 定番 の観測項目
第6章 インシデント対応実践編
- 6.1 インシデント対応の基礎知識
- 6.2 インシデント対応の心構え
- 6.3 インシデントが Open ステータスのときにやること
- 6.4 インシデントが Resolved ステータスのときにやること
- 6.5 恒久対応 / 改善対応
第7章 監視構成例
- 7.1 チェック、メトリクス、ログ、トレース、APM の構成例
- 7.2 通知、 コミュニケーション、ドキュメント、チケットの構成例
Webエンジニアの初期研修の1冊にピッタリだと思います。 ぜひお手にとってください!
(ゆくゆくKindleやPDFでも出る予定ですが、まず書籍を買ってくれていいんですよ)
Webエンジニアの初期研修の1冊にピッタリと言えば Webエンジニアが知っておきたいインフラの基本もぜひどうぞ。