神策小秘書(shū)
|
2021年02月26日
Troubleshooting 即故障排查檢修,這絕對(duì)不是一項(xiàng)簡(jiǎn)單的任務(wù),不同技術(shù)體系之間天差地別,這個(gè)問(wèn)題可有統(tǒng)一答案?因?yàn)榫唧w的技術(shù)終將過(guò)時(shí),所以本文不談任何具體的技術(shù)細(xì)節(jié),而是針對(duì) troubleshooting 提出十條方法論。
本文原作者:Steve Mushero
原文鏈接: https://medium.com/faun/shit-breaks-dao-of-troubleshooting-6cc1b3869ce0
啊,你的服務(wù)又掛了,很不幸。
更不幸的是,因?yàn)樨?fù)載高、業(yè)務(wù)復(fù)雜,它掛掉是常事。
它以一種不能被 “自動(dòng)擴(kuò)容”、“加容器”、“重啟” 等手段輕易 “解決” 的方式掛掉,花里胡哨的調(diào)度系統(tǒng)此時(shí)也起不到作用。當(dāng)然我不是說(shuō)這些方法沒(méi)用,畢竟它們各有各的場(chǎng)景。 有時(shí)候,你面對(duì)一個(gè)故障,5 分鐘就能定位原因,但作為 “老兵” 的你一定懂得這背后需要多少經(jīng)驗(yàn)積累和努力,常言道 “功夫都在戲外”。 如果你恰好用了微服務(wù)(micro-service)、無(wú)服務(wù)器(server-less)、無(wú)限可分割(infinitely-divisible)、無(wú)處不在的松散連接組件(loosely-connected pieces and parts)之類的新玩意,修復(fù)起來(lái)就更難了。 何解?具體技術(shù)早晚會(huì)過(guò)時(shí),而方法論則具備長(zhǎng)久生命力。唯有 “道”(指方法論)才是應(yīng)對(duì)復(fù)雜系統(tǒng)的指路明燈。 管你喜不喜歡,真正運(yùn)行著的系統(tǒng)就是一切真相的源頭。
熱門文章
用戶分析模型——分布分析的使用方法
2018年05月14日
神策學(xué)堂發(fā)布——你有一份數(shù)據(jù)驅(qū)動(dòng)指南待查收
2018年04月02日
埋點(diǎn)套路深,千萬(wàn)別掉“坑”
2017年08月30日
數(shù)據(jù)驅(qū)動(dòng)與用戶畫(huà)像
2017年06月20日
解析常見(jiàn)的數(shù)據(jù)分析模型——留存分析
2017年06月16日
如何運(yùn)用點(diǎn)擊分析優(yōu)化產(chǎn)品體驗(yàn)
2017年04月05日
如何應(yīng)用 Sensors Analytics 進(jìn)行 Session 分析
2016年10月12日
神策分析的技術(shù)選型與架構(gòu)實(shí)現(xiàn)
2016年09月20日
iOS 渠道追蹤原理與實(shí)現(xiàn)
2016年05月24日
數(shù)據(jù)采集與埋點(diǎn)
2016年01月26日
視頻學(xué)習(xí) - 總體介紹
2015年08月08日
視頻學(xué)習(xí) - 事件分析
2015年08月07日