#author("2020-04-13T15:21:51+00:00","default:admin","admin") -[[Building Secure & Reliable Systems:https://landing.google.com/sre/books/]] ... Googleが出したSRE本(計3冊)が読める -[[SRE fundamentals: SLIs, SLAs and SLOs:https://cloud.google.com/blog/products/gcp/sre-fundamentals-slis-slas-and-slos]] -[[Introduction to Site Reliability Engineering (SRE):https://docs.microsoft.com/en-us/learn/modules/intro-to-site-reliability-engineering/]] -[[システムの信頼性を上げるための新しい考え方 SRE (Site Reliability Engineering) in Azure, on Azure:https://channel9.msdn.com/Events/de-code/2017/DO05]] -[[SREって何? これまでのシステム運用やDevOpsとは何が違うの?:https://codezine.jp/article/detail/11002]] -[[今更だけど、SREとは何かについてまとめる:https://qiita.com/masao-kunii/items/f96a89a0cdff66c108fd]] -[[SRE実践の手引 ─ 信頼性をどう制御するか? から始める、現実的な指標と目標の設計と計測:https://employment.en-japan.com/engineerhub/entry/2019/12/05/103000]] -[[SREって、具体的にどんな仕事する人たちなの?:https://www.itmedia.co.jp/enterprise/articles/1803/19/news016.html]] -[[特集:「DevSecOps」実現を支えるSRE:https://www.atmarkit.co.jp/ait/series/18223/]] -[[SREの現場に必要なのは“雑食性”--ITインフラの信頼性を高める技術者とは:https://japan.zdnet.com/article/35115398/]] -[[2019年SRE考:https://blog.yuuk.io/entry/2019/thinking-sre]] -[[サービスインフラを支えるSREチームの開発。ZOZO Technologies Meetup#11を開催しました!:https://techcorp.zozo.com/entry/20190725_Meetup]] -[[NoOpsを実現するSREの存在意義と役割 / class SRE implements NoOps:https://speakerdeck.com/katsuhisa91/class-sre-implements-noops]] -SRE : Site Reliability Engineering -信頼性こそがあらゆるプロダクトの基本的な機能として位置づけ、SREはシステムのスケーラビリティ、信頼性、効率性を向上させるために、その設計と運用の改善方法を見つけることに集中し、 システムが「十分な信頼性を持った」ら、機能の追加や新プロダクトの構築のために力を注ぐ *Toil [#wfa28c7c] -[[Eliminating Toil をやっていく話:https://qiita.com/tshohe/items/d791926621aa709141a2]] -[[Toilの地獄から抜け出す術を知りたい:https://chroju.github.io/blog/2017/06/12/very_exhausted_because_of_toil/]] **Toilの定義 [#f715a46e] -手作業(Manual) --スクリプトの手動実行も含む -繰り返し作業(Repetitive) -自動化可能(Automatable) -戦術的(Tactical) --割り込みで作業が発生する --On-call対応とかも -永続的な価値なし(No enduring value) -サービスの成長に比例して増加する (O(n) with service growth)