神策小秘書
|
2021年02月26日
Troubleshooting 即故障排查檢修,這絕對不是一項簡單的任務,不同技術體系之間天差地別,這個問題可有統(tǒng)一答案?因為具體的技術終將過時,所以本文不談任何具體的技術細節(jié),而是針對 troubleshooting 提出十條方法論。
本文原作者:Steve Mushero
原文鏈接: https://medium.com/faun/shit-breaks-dao-of-troubleshooting-6cc1b3869ce0
啊,你的服務又掛了,很不幸。
更不幸的是,因為負載高、業(yè)務復雜,它掛掉是常事。
它以一種不能被 “自動擴容”、“加容器”、“重啟” 等手段輕易 “解決” 的方式掛掉,花里胡哨的調(diào)度系統(tǒng)此時也起不到作用。當然我不是說這些方法沒用,畢竟它們各有各的場景。 有時候,你面對一個故障,5 分鐘就能定位原因,但作為 “老兵” 的你一定懂得這背后需要多少經(jīng)驗積累和努力,常言道 “功夫都在戲外”。 如果你恰好用了微服務(micro-service)、無服務器(server-less)、無限可分割(infinitely-divisible)、無處不在的松散連接組件(loosely-connected pieces and parts)之類的新玩意,修復起來就更難了。 何解?具體技術早晚會過時,而方法論則具備長久生命力。唯有 “道”(指方法論)才是應對復雜系統(tǒng)的指路明燈。 管你喜不喜歡,真正運行著的系統(tǒng)就是一切真相的源頭。
熱門文章
用戶分析模型——分布分析的使用方法
2018年05月14日
神策學堂發(fā)布——你有一份數(shù)據(jù)驅(qū)動指南待查收
2018年04月02日
埋點套路深,千萬別掉“坑”
2017年08月30日
數(shù)據(jù)驅(qū)動與用戶畫像
2017年06月20日
解析常見的數(shù)據(jù)分析模型——留存分析
2017年06月16日
如何運用點擊分析優(yōu)化產(chǎn)品體驗
2017年04月05日
如何應用 Sensors Analytics 進行 Session 分析
2016年10月12日
神策分析的技術選型與架構實現(xiàn)
2016年09月20日
iOS 渠道追蹤原理與實現(xiàn)
2016年05月24日
數(shù)據(jù)采集與埋點
2016年01月26日
視頻學習 - 總體介紹
2015年08月08日
視頻學習 - 事件分析
2015年08月07日