有關陸奇的兩篇公眾號文字,仔細讀來,有一些感觸。
關于價值觀
每個公司,每個群體、每個個人,都是有一套價值觀來驅動的,價值觀決定了做事情的動機,進而影響做事情的方式,最終會對事情的結果產生重大影響。價值觀是一個團隊走到一起,并長期走下去的決定性因素。
但價值觀又是非常飄渺的,他很難被量化,也缺乏有效的、具體的抓手,一般來說,能靠制度,靠技術解決的事情,是不會寫進價值觀的。群體的價值觀,是由每個個體的對價值觀的實踐來體現的,團隊的組建、后期的培養同等重要。在團隊建設上,我看重以下三層:
- 理念:志同道合
- 個人品質:正直,有責任心,有成就他人的胸襟,能堅持做正確的事情
- 工程師素質:堅信用技術解決問題,堅持學習,追求卓越
「志」和「道」
在我們運維部門建立的第一天,我們就確定了部門的使命「保障全球最大的出行平臺穩定、高效的運行」,所以這就是我們的「志」和「道」。其中有兩個關鍵字:穩定、高效。這兩個關鍵字,界定了我們的工作主航道,可為與不可為。
暫不談穩定性工作,我想重點探討一下針對「高效」的理解。高效包含兩方面的意思,一是人效高,二是資源使用效率高。人效高,并非是單純的提高SRE自身的效率,更大的部分是要提高整個研發、運維體系的效率。一個典型的互聯網公司,運維和研發的人員配比可能為一比二三十,所以通過技術手段,持續的提高RD效率,賦能RD,最大化整個公司的效率,是運維團隊的重要工作方向。
舉個例子,在我們公司,每周有數千次的線上變更,這些變更操作,都是由RD同學獨立完成實施的,從結果上來,相比交由 SRE 來執行線上變更,整體的迭代效率是大大提高的。當然這項工作能夠如此推行下去,有兩點是必要條件:
1. 變更帶來的風險不能增加;
1. RD 同學執行變更的體驗要足夠好,操作要足夠簡單,整體效率是提升的;
否則,這項行動注定會失敗。
關于條件1,從我們對一整年的實際分析數據來看,穩定性case,55%都是由于變更引發的。因此在很早之前,為了控制變更風險,所有線上的變更操作,都是交由專門的、經驗豐富的SRE來執行,降低變更引入的風險,更多的是依賴「人」的經驗,無法有效復制到更大人群范圍。為了解決這個問題,我們將變更的過程標準化,透明化,「讓每個人來操作,效果都一樣」成了我們的一個指導思想,強制性的流程規范和最佳實踐,在發布系統落地。發布過程中彈性的、可拿捏的部分,可以個性化配置,同時,通過建立量化機制來驅動最佳實踐的落地。
關于條件2,變更操作從SRE轉移到RD手中,轉移之后,雖然RD會花費一定的時間和精力來執行變更任務,但這些時間,相比轉移之前,雙方的溝通時間成本、SRE的需求執行排隊時間成本來說,是大大減少了的。因此這是對雙方的效率都是提升的,對整個公司是長期有益的。
「個人品質」
首先,正直應該是我們所堅持的做人做事的準繩,在個人認知能力范圍內,主觀上不做「錯」的事情,我理解這大概也就是 Google 的「don't be evil」所講的東西吧。其次,責任心是個人成功的基本要素,特別是在運維領域,能第一時間響應問題,把事情一跟到底,徹底解決,久而久之,這樣的人,我相信在任何崗位上都是值得信賴和依靠的人。
另外,在大公司,大團隊,大家詬病最多的可能就是內耗、協作不通暢、溝通成本高等。良好的溝通協作,是組織效率最大化的前提,這個東西為什么這么難解呢?在我看來,可能有下面一些客觀原因(這些客觀原因,待后續專門分解):
- 激勵機制畸形,過度強調晉升
- 跨團隊目標設定不統一,未形成互補
- 公司未能形成很好的仲裁機制和相關的文化
- 公司缺乏創新的文化,未能很好的提供創新和嘗試的環境
但是從發揮個人主觀能動性上來看,公司的各個管理層,各級 leader 在其中扮演中最為重要的角色。作為 leader,對于團隊的行事方式,團隊文化的影響是絕對性的。團隊 leader 能否從全局出發考慮問題,從公司的整體利益作為出發點做決策,決定了團隊的工作方向和工作方式,正所謂「上行下效」。因此在領導梯隊建設上,選好人,培養好人,讓「適合」的 leader 成為大多數,那就能形成良性循環,整個組織協同的阻力會大大減少。反之,那就可能形成劣幣驅逐良幣的局面。
知行合一,愿望是美好的,道理都是如此,但知易行難,共勉。
「工程師成長」
我很認同陸奇對于如何成長為一名優秀工程師的5條建議,仔細揣摩,未能有跳脫其外。
- Believe in 技術
- 站在巨人的肩膀上做創新
- 追求Engineering Excellence
- 每天學習
- Ownership
Believe in 技術,這是作為工程師的信念,不要小看信念的力量,特別是遇到難題的時候,如果沒有這個信念的支撐,可能就很難去堅持并取得突破。擴大到工程領域之外,人類的發展歷程,也很好的印證了信念的作用。人類的發展,從認知革命、到農業革命,工業革命,再到如今的科學革命,每個時代的發展速度和擁有的能力水平,是跨數量級別的差距。這其中的關鍵因素在于人類的信念發生了變化,在科學革命之前,人類發展遇到瓶頸,不自覺的求助于宗教或者神話,囿于現狀,把問題的解決寄托于神靈。而到了科學革命之后,人類好像一下子開了掛,首先我們承認自己對于世界有很多很多未解之處,端正了態度,其次認為這些未解之謎都是暫時的,都可以通過科學技術來逐個解釋并加以利用。因此,人類在短短的幾十年里,登上了月球,探測器飛向了火星,發現了新的能源利用方式,制造了新的材料等等,這一切都在于人類自身的思考方式發生了變化,堅信通過科學技術可以持續擴大人類的能力,資本也越來越多的投入到了科學研究之中。
知識的大爆炸,一方面沒有人有精力和能力從頭到尾研究一項技術的所有上下游環節,另一方面也沒有這個必要,精細化分工和協作提高了全社會的效率。對于計算機科學更是如此。開發一個 app ,原則上不需要先從頭開發一個 android。利用好現有的研究成果和技術積累,提高效率,加快創新的速度,在有限的時間里發揮最大的價值。譬如,要開展一項工作,首先去看看業界當前的最高水平是什么,別人已經趟過的路就不要再趟了,努力和前沿看齊,先爭取處于同一起跑線,再往前摸索。
關于追求卓越,一般情況下,把一件事情做到完成,基本一名合格的工程師都可以搞定,但是把事情做到超越預期,做到具備核心競爭力,這樣的人是少之又少,所以不要局限在把事情僅僅是完成,或者限定在自己所認為的完美,多抬頭看路,要做就做到完美。
關于每天學習,知識總有過時的時候,學習能力和學習本身,才是永恒的競爭力,作為一名追求成長的工程師,堅持每天學習。學習的方式方法、學習的途徑可以多種多樣,極端情況下,如果不知道該學什么,那么在糾結清楚之前,先隨機找個領域鉆進去吧,或許學著學著就清晰了。
Ownership,不局限于工程師成長領域,但凡各行各業出類拔萃者都是如此。把公司的事情,當做自己的事情去跟進;對工作中出現的不好的地方,也要勇于指出和糾正;對于三不管的地帶,要樂于去填磚縫。久而久之,不成長都難!