Netflix 的 Chaos Monkey 和供應鏈

我最近與 Zara 母公司 Inditex 的首席運營官 Carlos Crespo 進行了一次對話,他在談話中提到了 Netflix 十多年前創建的一種軟件工具,用於將系統彈性制度化。 這個名字很吸引人,對於試圖在動盪時期重塑供應網絡的供應鏈領導者來說,這是不可抗拒的。 然而,谷歌GOOG
搜索“supply chain chaos monkey”,結果正好 一次引用,從2012年開始。

為什麼我們不將這個想法應用於供應鏈彈性?

什麼是混沌猴子?

這是一個 軟件工具,更廣泛地說,是一種工程原理,它隨機關閉複雜系統的某些部分,迫使操作員恢復運行。 有點像突擊消防演習,但每天都在隨機的方式和地點進行。 這個想法是,擅長快速解決系統問題是一個學習過程,應該受益於陡峭的學習曲線。

背景故事是關於 Netflix 如何在從運送 DVD 過渡到客戶上門的同時擴展其在 Amazon Web Services 上的流媒體業務。 乍一看,這是一種系統冗餘規劃的合乎邏輯的方法,就像您對 NASA 的期望一樣,但實際上它利用了 Netflix 的文化規範,即允許個人貢獻者解決他們自己的問題。 正如記載在“混沌工程” 凱西·羅森塔爾 (Casey Rosenthal) 和諾拉·瓊斯 (Nora Jones) 在 2020 年出版的一本書中,他們在 Netflix 開創了這種做法,歸結為五個原則:

  • 圍繞穩態行為建立假設
  • 改變現實世界的事件
  • 在生產中運行實驗
  • 自動化實驗以連續運行
  • 最小化爆炸半徑

Netflix 的文化和流程融合很重要,因為它培養並利用了一種開源的問題解決方法,同時系統地轉動隨機停機的輪子加速了整個擴展團隊的學習。

供應鏈彈性與混沌工程

數字化轉型 in supply chain今年很火,因為它幫助供應鏈支持新的商業模式並推動可持續運營(參見 BCG X 研究),還因為它承諾“彈性”。 不幸的是,供應鏈彈性數字化轉型的實際應用仍然通常歸結為更好的“可見性”平台,並得到庫存緩沖和雙重採購等一系列傳統策略的支持。 支撐這種方法的是另一層分析工作 恢復時間 麻省理工學院的 David Simchi-Levi,以及使用數字孿生的一波模擬浪潮。 這一切聽起來不錯,但缺少任何系統的方法來試驗真實的供應鏈故障,以了解如何在實踐中最好地恢復。

將 Chaos Monkey 應用於供應鏈

醫生在切開我們之前宣讀希波克拉底誓言,包括著名的“首先不傷害”。 對於任何將 Chaos Monkey 原則應用於供應鏈的人來說,這都是一個不錯的主意,這需要隨機關閉某處的真實機器。 這是非常重要的,據我所知,還沒有發生在任何地方。

  • 上面引用的第一個原則是關注系統輸出而不是內部屬性。 驗證系統是否正常工作,而不是試圖理解其工作的原因。
  • 第二個原則說要以現實的方式打破各種事物。 無需模擬全球熱核戰爭,只需關閉開關或丟失命令,即可了解最有效的解決方案。
  • 第三條原則說,最好的學習場所是在生產中。 在實踐中學習比通過模擬學習更好——即,數字雙胞胎很棒,但它們可能不足以建立彈性文化。
  • 第四個原則將混沌猴子原則制度化,因為它允許擴展實驗過程,從而使您獲得更陡峭的學習曲線。 在救火中使用數據科學。
  • 最後,最小化爆炸半徑。 這意味著“不傷害”並轉化為某種緩衝(庫存、交貨時間、加急發貨)以保護客戶免受您的實驗的影響。 學習管理受控爆炸。

有人可能會說,過去三年 ., 戰爭, 勞工騷亂,經濟動盪對每個人來說都是一場大混亂的猴子演習。 Netflix 的教訓是,這種危機不僅僅是需要計劃的事情,而是需要作為生活中永恆的事實來掌握的事情。

完美風暴可能永遠不會結束,所以也許我們應該學會忍受它。

來源:https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/