博客專欄

        EEPW首頁 > 博客 > 瘋狂馬斯克的“極限”計劃居然成功了?!“下云”后成本降低 60%,部分功能代碼精簡 90%,30 天急速遷移服務器

        瘋狂馬斯克的“極限”計劃居然成功了?!“下云”后成本降低 60%,部分功能代碼精簡 90%,30 天急速遷移服務器

        發布人:傳感器技術 時間:2023-11-02 來源:工程師 發布文章


        整理 | 凌敏、核子可樂

        2022 年 10 月 27 日,經歷了長達半年的拉鋸戰之后,馬斯克終于將 Twitter(現已更名 X)收歸囊中,這筆 440 億美元的收購案也終于迎來了大結局。入主 Twitter 后,馬斯克進行了大刀闊斧的改革,如今一年過去了,Twitter 發生了哪些變化?

        2023 年 10 月 27 日,X 工程技術發布帖子稱,過去一年是 X(Twitter)平臺全面推進工程技術探索的一年。除了大家在 X 應用端看到的直觀調整之外,團隊還在幕后完成了以下一系列重要改進。其中包括:

        • 關閉薩克拉門托數據中心,并重新配置了 5200 臺機架和 14.8 萬臺服務器,每年節約超 1 億美元。共釋放出 48 兆瓦的功率配額、拆除重達 6 萬磅的網絡梯架,必要設備后續將被重新配置至其他數據中心。

        • 優化了 X 的云服務使用方式,著手將更多工作負載遷往本地基礎設施。這一轉變使 X 每月的云成本降低了 60%。所有媒體 /blob 工作均已下云,這讓 X 的整體云數據存儲量縮減了 60%,還成功將云數據處理成本降低了 75%。

        此外,X 還發生了以下變化:

        • 圍繞單一產品框架整合了 For you(為您推薦)、Following(關注)、Search(搜索)、Profiles(個人資料)、Lists(列表)、Communities(社區)和 Explore(探索)等技術棧。

        • 從頭開始全面重建了 For you 服務與排名系統,代碼行數從 700K 縮減至 70K,精簡比例高達 90%,計算占用量降低 50%,根據請求得分計算的帖子吞吐量增長了 80%。

        • 統一了 For you 和視頻個性化及排名模型,顯著提高了視頻推薦的質量。

        • 重構了技術棧內的 API 中間件層,通過刪除超 10 萬行代碼和數千個未實際使用的內部端點、清理未采用的客戶端服務等方式完成了架構簡化。

        • 精簡后的元數據獲取延遲降低了 50%,全局 API 超時錯誤減少了 90%。

        • 阻斷 bot 和內容抓取的速度較 2022 年提高了 37%。平均而言,X 每天阻斷超 100 萬次 bot 注冊攻擊,并將直接垃圾郵件減少了 95%。

        • 構建本地 GPU 超級計算集群,并設計、開發和交付了 43.2 Tbps 的新網絡體系架構以支持這些集群。

        • 擴展網絡主干容量與冗余,每年節約 1390 萬美元。

        • 開始進行自動峰值流量故障轉移測試,用以持續驗證整個平臺的可擴展性與可用性。

        自接手 X 以來,馬斯克為了縮減成本挖空心思,其中包括裁員、推行“極端硬核”企業文化、拖欠辦公室租金……在公司的運營開支方面,馬斯克去年剛接手 X 時便指示團隊通過削減云服務和額外的服務器空間,力爭每天在基礎設施上節省 300 萬美元。

        1省錢****一:云服務太貴了,馬斯克要“下云”

        2020 年 12 月,Twitter 宣布將使用亞馬遜云科技為其主時間線提供支持。當時的消息稱這將是一份“多年期”協議,但沒有透露任何具體數字。彼時 Twittr 公司 CTO Parwal Agrawal 在一份聲明中表示,Twitter 和亞馬遜云科技將合作擴展該社交媒體的基礎設施、加快功能發布速度,并擴大其功能組合。

        據 The Information 2023 年 3 月報道,這筆交易為期五年半,合同總值 5.1 億美元。根據報道,無論是否使用相應容量,Twitter 都同意向亞馬遜云科技付費。而且亞馬遜云科技不愿就具體條款進行重新談判。根據交易細則,Twitter 的月度亞馬遜云科技支出大約在 773 萬美元

        如今,Twitter 已經不再使用亞馬遜云科技的實時時間線功能,轉而選擇了 AWS for Spaces 等其他服務。Twitter 后續可能使用 Google Cloud Platform(GCP)運行其時間線業務。根據 Twitter 與亞馬遜云科技之間簽訂的合同細節,馬斯克執掌的社交媒體巨頭還計劃使用:

        • 亞馬遜云科技云基礎設施,用于補充 Twitter 的本地功能,幫助該公司在全球范圍內擴展其實時服務。

        • 采用 Amazon Elastic Compute Cloud (Amazon EC2) 服務中基于 Arm 架構的亞馬遜云科技 Graviton 2 實例,以運行其云工作負載。

        • 借助亞馬遜云科技容器服務,Twitter 將在其混合基礎設施當中統一構建并交付新的功能和服務。

        • Amazon CloudFront,即亞馬遜云科技的超高速內容交付網絡(CDN)服務,能夠以低延遲、高速率向全球客戶分發數據、應用程序、視頻和 API。

        • Amazon DynamoDB,即亞馬遜云科技的鍵值數據庫,可大規模提供個位數毫秒級性能。

        目前,Twitter 已經與谷歌簽訂了一份價值 10 億美元的合同,且相關承諾早在與亞馬遜云科技合作之前就已敲定。另據報道,Twitter 將在 2023 年向谷歌支付總計 3 億美元,這也是總價值約 10 億美元的多年期合作協議的一部分。

        隨著馬斯克入主 Twitter 并開啟削減成本計劃,Twitter 的基礎設施支出大幅減少。根據題為“深度削減成本”的 Slack 內部消息,Twitter 計劃從云服務和服務器容量方面入手,省下 150 萬到 300 萬美元。此外,Twitter 還試圖與亞馬遜云科技、Google Cloud 以及甲骨文就合同內容展開重新談判,但供應商們紛紛表示拒絕。

        根據最新公告,馬斯克通過將工作從云端轉移到 Twitter 自己的服務器上,每月的云成本降低了 60%,整體云數據存儲量縮減了 60%,還成功將云數據處理成本降低了 75%。

         下云就能解決問題?

        近年來,為了節省成本,不少公司開始下云。不過,并非所有公司都適合下云,需要結合自身實際業務情況來做判斷。比如,GitLab 在 2016 年底時候就表示計劃要“下云”,不過團隊“在收到數百條充滿建議和警告的評論和郵件后,最后還是決定將 GitLab.com 保留在云端。

        此外,37signals 旗下一款流行的基于云服務的項目管理軟件 Basecamp 也曾想“下云”。Basecamp 的上云歷程已經超過十年,而且其前兩年發布的產品 HEY 也一直在云端運行。但 Basecamp & HEY 聯合創始人 David Heinemeier Hansson 發文表示將要“下云”。

        “我們用過亞馬遜云科技、也用過谷歌云,試過裸虛擬機、也體驗了 Kubernetes 容器編排。我們知道云能提供哪些功能,其中大部分都有實際應用。現在我們終于得出結論:對于像我們這樣一家增長穩定的中型企業來說,租賃基礎設施資源總體上看是筆糟糕的買賣。云服務商做出的降低復雜性、控制運營成本等承諾從來就沒能實現,所以我們正在籌劃脫離云端、重歸本地。”

        不過,在 David Heinemeier Hansson 撰寫的關于離開云計算的思考中,他特別提到了兩個情況是不能離開云計算的。一種是流量極低,一種是復雜不均衡:

        • 第一個極端是當您的應用程序非常簡單且流量很低,通過使用完全托管的服務來降低復雜性確實能夠節省成本。這是 Heroku 鋪就的道路,也是 Render 等其他服務商所追隨的道路。當您沒有客戶時,這是一個絕佳的起點,即使在您開始擁有一些客戶后,它仍能推動您的業務發展。(然后,一旦使用量激增,賬單飆升到天際線上時,您可能會面臨一個好問題,但這是一個合理的權衡。)

        • 第二個極端是當您的負載非常不規則時。當您的使用量出現劇烈波動或巨大峰值時。當基線只是您最大需求的一小部分時。或者當您不知道您需要十臺服務器還是一百臺時。在這種情況下,沒有什么比云端更好了,就像我們在推出 HEY 時學到的那樣,突然有 30 萬用戶在三周內注冊嘗試我們的服務,而我們的預測是六個月內有 3 萬用戶。

        2省錢****二:數據中心大遷移

        為了節省成本,去年 12 月,馬斯克還關閉 Twitter 加州數據中心。

        據悉,在平安夜前夕,納斯克飛往加利福尼亞州的薩克拉門托——Twitter 三大主要計算存儲設施之一的所在地——切斷了維持該社交網絡平穩運行的服務器。有知情人士表示,雖然有員工擔心關閉這些服務器可能導致各種問題,但節省資金是首要任務。

        隨后,世界各地的用戶報告 Twitter 服務中斷。一些用戶反饋 Twitter 出現很多奇怪的錯誤消息,比如看到空白頁面、無法回復推文或關注熱門話題,還有人被迫退出登陸。有熟悉 Twitter 基礎設施的人士表示,如果薩克拉門托的設施仍在運行,它就可以在其他數據中心出現故障時提供備份計算能力,從而幫助緩解問題。

        此外有消息稱,當時馬斯克為了省錢,計劃將薩克拉門托的服務器搬到波特蘭,基礎設施團隊稱這項工作至少要九個月才能完成,馬斯克一怒之下直接搭乘私人飛機跑去機房,拔了網路線與電源就搬上大卡車開始轉移,最后整個工作一個月就完成了。

        在今年 9 月出版的《埃隆·馬斯克傳》中,詳細講述了馬斯克親自遷移服務器的故事(節選,經編輯):

        2022 年 12 月 22 日深夜,位于 X 公司 10 樓的會議室,馬斯克正在與兩名基礎設施經理進行緊張的交談。


        位于薩克拉門托的一家數據服務公司允許 X 公司延長其服務器租約,以便在 2023 年有序遷出。一名顯得有些緊張的基礎設施經理告訴馬斯克:“今天早上,他們回來告訴我們說這個計劃不再適用,因為他們認為我們在財務上不再穩健。”


        這個設施每年花費 X 公司超過 1 億美元。馬斯克想通過將服務器遷移到 X 公司在俄勒岡州波特蘭的其他設施來節省這筆費用。另一位經理表示這項工作不能立即進行。她平靜地說:“我們至少需要六到九個月的時間,因為薩克拉門托仍然需要服務流量。”


        馬斯克沉默了幾秒鐘,然后宣布:“你們有 90 天時間來完成這項任務。如果你們做不到,你們可以辭職。”這名經理開始詳細解釋遷移服務器到波特蘭的障礙。“機架密度不同,電力密度也不同,”她說。“所以機房需要進行升級。”她開始詳細介紹更多原因,但被馬斯克打斷。“這讓我的大腦感到壓抑,”馬斯克說道,“你知道頭爆炸的表情符號嗎我的腦袋現在就是這個感覺。真是一堆屁話。波特蘭明顯有大量的空間,從一個地方遷移到另一個地方簡直小菜一碟。”


        “你們需要做的就是將服務器遷移到波特蘭,”馬斯克說道,“如果超過 30 天,我會很震驚。”他停頓了一下,重新計算。“找一家搬家公司,運輸電腦需要一個星期,然后再花一個星期來連接它們。兩周。就應該這樣。”


        所有人都默不作聲。但馬斯克仍在發火。“如果你們租了一個 U-Haul (一家租車公司),你們可能自己就能完成。”兩位 X 公司的經理看著他,試圖判斷他是否是認真的。馬斯克的兩位親密助手 Steve Davis 和 Omead Afshar 也在場。他們多次看到過他這樣,知道他可能真的這么認為。


        12 月 23 日星期五晚上,James 和他的弟弟 Andrew(馬斯克的表弟)與馬斯克一起從舊金山飛往奧斯汀,當飛機飛過拉斯維加斯時,James 提出了一個建議,他們現在就可以移動服務器。一個名為 Alex 的來自烏茲別克斯坦的 X 員工幫助他們進入了 X 公司的數據中心,內部共有大約 5200 個冰箱大小的機架,每個機架有 30 臺電腦。每個機架重約 2500 磅,高 8 英尺。但馬斯克認為“這些東西看起來并不難移動”,他向保安借了一把小刀,抬起地板上的一個通風口,這讓他可以撬開地板面板。然后他爬到服務器下面,用小刀撬開了一個電箱,拔掉了服務器插頭,等著看會發生什么。沒什么異常發生。服務器已經準備好遷移。


        第二天——圣誕前夜,馬斯克召集了增援。Ross Nordeen,與他的朋友 James 在 Tesla 工作,從舊金山驅車而來。他在聯合廣場的 Apple Store 花了 2000 美元,買下了所有的 AirTags,這樣服務器在遷移過程中就可以被跟蹤。然后他去了家得寶,花了 2500 美元買了扳手、斷線鉗、頭燈和擰下地震螺栓所需的工具。


        Steve Davis,馬斯克的忠誠副手,找人租了一輛半掛車,并安排了搬家車。其他來自 SpaceX 的援助隊員也已到達。這些服務器機架都有輪子,所以團隊能夠斷開其中四個并將它們推到待命的卡車上。這表明,這五千兩百多個服務器可能在幾天內全部移動。“伙計們干得好!”馬斯克興高采烈地說。


        到這周結束時,他們已經使用了薩克拉門托所有可用的卡車。盡管該地區受到了雨的襲擊,他們在三天內移動了 700 多個機架。該設施之前的記錄是一個月移動 30 臺。這仍然留下了大量的服務器在設施中,但這群人已經證明了它們可以被快速移動。其余的部分在 1 月份由 X 公司的基礎設施團隊處理。

        馬斯克的瘋狂舉動引發了不少爭議。網友海狗油 90 認為,“幾乎沒有人明白數據中心搬遷要搬的是服務、數據,而不是服務器本身,也不明白 X 這樣的公司,服務連續性、數據一致性值多少錢。”

        網友酷憋哥評論稱:“除了證明馬斯克膽子大,這個案例沒有什么正面的意義,試想一下,哪個普通打工人可以做出這么魯莽的決定?他或她是否能承擔由這種行為導致的嚴重后果?所以最終只有老板能做這種事情,只要他愿意。”


        來源:AI前線


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: 馬斯克

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 海阳市| 含山县| 兴文县| 孙吴县| 紫阳县| 天峨县| 宕昌县| 衢州市| 蓬安县| 凉山| 盐城市| 禹城市| 白水县| 靖边县| 西宁市| 镇雄县| 霍城县| 丽江市| 凭祥市| 和平县| 周宁县| 吉林省| 南陵县| 阿鲁科尔沁旗| 金秀| 红河县| 全椒县| 玛多县| 怀集县| 旅游| 广东省| 石柱| 武夷山市| 大关县| 泽库县| 宁夏| 乐陵市| 石门县| 庆阳市| 诸暨市| 连江县|