- SRE : Site Reliability Engineering
- 信頼性こそがあらゆるプロダクトの基本的な機能として位置づけ、SREはシステムのスケーラビリティ、信頼性、効率性を向上させるために、その設計と運用の改善方法を見つけることに集中し、 システムが「十分な信頼性を持った」ら、機能の追加や新プロダクトの構築のために力を注ぐ
Toil †
Toilの定義 †
- 手作業(Manual)
- 繰り返し作業(Repetitive)
- 自動化可能(Automatable)
- 戦術的(Tactical)
- 割り込みで作業が発生する
- On-call対応とかも
- 永続的な価値なし(No enduring value)
- サービスの成長に比例して増加する (O(n) with service growth)