『SREの探求』を読んでいます

@ymotongpooからご恵贈いただいた『SREの探求』を読んでいます。

全32章・632ページの大ボリュームで、まだ進捗は2/3くらい。

とっても面白いけれど、それでも時間がかかっています。

わたしは頭から順番に読んでいたけれど、エッセイ集の趣なので興味分野がはっきりしている方は拾い読みでもよいと思います。

そんな道半ばのわたしが面白いと思った章をピックアップしました。

4章 インシデントのメトリクスを用いたSREの大規模な改善

モニタリング好きにはたまらない、データドリブンな改善の考え方と事例の紹介。

なまじデータを計測できるのでSLI一本槍でいきがちだけど、SLIを実現する構造を分析・把握してうまいこと代理メトリクスを設定するとスムーズにゴールに近づけるのですよね。

(マーケの分野で「売上をあげるために、販売店の棚の専有面積をメトリクスにする」というような話があったりするやつ)

5章 サードパーティとの協力を円滑にすすめる重要性

いまはクラウドサービスはじめサードパーティをどっぷり活用する時代なので、この手の課題は実際に多く直面するのですよね。お互いに健全にやっていくために押さえておきたい知識がここに。

6章 専任SREチームなしでSREの原則を適用する方法、7章 SREのいないSRE:Spotifyのケーススタディ

SREやっていきあるある。SoundCloudとSpotifyの苦労話。

前提条件として時代背景・事業の状況・メンバーの気質なんかがあるので、そのまま適用したり自分たちの未来予測に使えるわけではないけれど、それでもとっても面白い。

こういう話を表に出してもらえるのはとてもありがたい。

17章 データ耐久性のエンジニアリング

この本で主題になっているわけではないけれど、(テクニカルな)エンジニアリングという側面で考え方が整理されていてとても面白い。

まだ読んでいる途中だけれどもこの紹介エントリを書いたのは17章が良かったからです。


というわけで 『SREの探求』 を年末年始のお供にぜひどうぞ!

わたしも引き続き読んでいます。


See also