博客專欄

        EEPW首頁 > 博客 > 亞馬遜第三代服務器芯片來了!機器學習負載性能飆3倍,能耗降60%

        亞馬遜第三代服務器芯片來了!機器學習負載性能飆3倍,能耗降60%

        發布人:芯東西 時間:2021-12-02 來源:工程師 發布文章
        云正為更多企業提供轉型的關鍵途徑。

        作者 |  心緣
        編輯 |  漠影
        芯東西12月1日報道,今日凌晨,云計算領域最受矚目的年度技術盛會AWS re:Invent在拉斯維加斯舉行。這是時隔兩年,re:Invent再度在線下舉辦。今年也是AWS re:Invent十周年和全球最大云服務商亞馬遜云科技(AWS)的十五周年。AWS首席執行官Adam Selipsky在主題演講中首先分享了AWS的最新成績,包括Amazon S3服務存儲了3萬億多份文件、AWS提供逾200種服務、在全球有數百萬客戶等。期間,AWS發布其第三代自研服務器處理器Graviton3、基于AWS自研云端AI訓練芯片的加速實例Trn1、讓開發小白也能輕松上手機器學習預測模型的Amazon SageMaker Canvas、用于輕松構建數字孿生的AWS IoT TwinMaker等一系列重磅新品。值得一提的是,這是Adam Selipsky接任AWS首席執行官一職以來,首次在線下發表公開演講。在原AWS負責人Andy Jassy接替Jeff Bezos擔任亞馬遜CEO后,曾為AWS效力11年的Selipsky成為AWS新的掌舵人。
        Graviton3:機器學習負載性能提高3倍


        AWS首先推出其第三代基于Arm的自研服務器處理器Graviton3。相比上一代處理器,Graviton3的計算性能可提高25%,浮點和加密工作負載性能提高2倍,機器學習工作負載性能提高3倍,其消耗能源將減少60%。

        Graviton3處理器還包括一項新的指針身份驗證功能以提高安全性。AWS正與操作系統及編譯器開發人員合作,以增加對該功能的額外支持。AWS在2018年底推出其首款自研Graviton處理器,2019年推出第二代Graviton2,如今AWS客戶可使用12種由Graviton2驅動的不同實例。新款Graviton3芯片將為AWS即將推出的EC2 C7g實例提供支持,適用于HPC、批處理、電子設計自動化(EDA)、媒體編碼、科學建模、廣告服務、分布式分析和基于CPU的機器學習推理等計算密集型工作負載。C7g實例也是云產業中第一個配備DDR5內存的實例。除了耗電量更少外,其內存將提供比上一代EC2實例中使用的DDR4內存高50%的帶寬。在網絡方面,C7g實例將提供高達30Gbps的網絡帶寬和彈性結構適配器(EFA)支持。目前AWS正在運行C7g實例的預覽。Selipsky說,現在幾乎每個工作負載都有超過475種不同的實例類型可用。


        推出Trn1新實例,加速機器學習模型訓練


        除了服務器芯片外,AWS早在2019年就發布其自研云端推理芯片,并于2020年推出其專為機器學習模型設計的自研云端訓練芯片Trainium。今日,AWS公布其由Trainium芯片提供支持的最新實例Trn1。“我們希望它能為在云端訓練深度學習模型提供最佳的性價比,并在EC2上提供最快的性能。”Selipsky說。Trn1是第一個每秒帶寬高達800千兆字節的EC2實例,適用于大規模、多節點分布式訓練用例,包括圖像識別、自然語言處理、欺詐檢測和預測等等。

        Selipsky談道:“我們可以將這些與Ultra集群聯系起來,這些集群由數萬個與兆字節規模網絡互聯的訓練加速器組成。這些訓練Ultra集群由強大的機器學習超級計算機提供支持,用于快速訓練有數萬億參數的最復雜、最深的學習模型。”早在2014年,亞馬遜就已成立芯片研發部門,并于次年收購以色列芯片設計公司Annapurna Labs。迄今AWS已公布其三個系列的自研芯片,除了前文所述的Arm服務器芯片、用于機器學習加速的云端訓練及推理芯片之外,還有替CPU分擔工作負載的AWS Nitro系統芯片。

        Mainframe Modernization:讓客戶盡快“擺脫”主機,遷移上云


        隨后,Selipsky宣布了一款主機遷移和現代化新平臺AWS Mainframe Modernization,旨在幫助AWS客戶盡快“擺脫”主機,以便更好地利用云。今天,客戶擺脫主機束縛的方法有幾種,要么幾乎原樣調整應用程序,要么可能會將應用程序重構和分解為云端的微服務。但這兩種方式都要耗費相當長的時間來完成,因為客戶必須評估應用程序源代碼的復雜性,了解對其他系統的依賴性,轉換或重新編譯代碼,然后必須測試所有內容,以確保一切正常。而AWS Mainframe Modernization能幫助企業以比以往低得多的成本,更快地在AWS上遷移、現代化和運行主機工作負載。使用其一套開發、測試和部署工具以及兼容主機的運行時環境,它可以將主機工作負載移動到云端所需的時間縮短多達2/3。

        該解決方案還將幫助客戶評估分析他們的主機應用程序是否就緒,然后幫助他們選擇要走的路徑并制定計劃。許多公司可能希望在云上運行一些應用程序,并希望其中的一些實際AWS使用相同的API、硬件和工具,由AWS全面管理和支持。
        AWS Private 5G:幾天構建專用移動網絡


        面向5G通信,AWS推出AWS Private 5G,一種可在幾天內即可輕松構建和擴展專用移動網絡的新服務。

        以往部署專用移動網絡,需投入大量時間、金錢和精力來設計其網絡,以實現預期的峰值容量,并從多個供應商采購和集成軟件和硬件組件。即便客戶能夠運行網絡,當前的專用移動網絡定價模型也會對每臺連接的設備收費,并使涉及數千臺連接設備的用例成本高昂。而使用AWS推出的這項新服務,用戶只需告知想在哪里構建網絡,并指定網絡容量,AWS就會提供所有必要的硬件、軟件和SIM卡。其自動配置功能使得用戶可按需連接盡可能多的設備。AWS Private 5G簡化了部署,允許客戶快速部署自己的4G/LTE或5G,可快速擴大和減少連接的設備數量,并受益于熟悉的按需云定價模型。該服務沒有前期費用或每臺設備成本,客戶僅支付他們要求的網絡容量和吞吐量。總體而言,用戶無需漫長的規劃周期、復雜的集成和高昂的前期成本,即可享用到移動技術的所有優點。
        Amazon SageMaker Canvas:零經驗小白也能玩轉機器學習


        Selipsky也談到機器學習,他說AWS提供了周圍最廣泛和最完整的機器學習功能集,希望通過AWS Sagemaker推動機器學習普及。今日,AWS又推出一項新的可視化、無代碼機器學習服務Amazon SageMaker Canvas。

        與其現有的機器學習服務不同,這里的目標受眾不是高度技術性的數據科學家和工程師,而是企業內部的任何工程師或業務用戶。Amazon SageMaker Canvas使得沒有任何經驗的用戶,無需編寫任何代碼,只需用鼠標點擊拖拽,即可創建機器學習預測模型。該服務得到了AWS完全托管的機器學習服務SageMaker的支持,可用于解決欺詐檢測、減少流失和庫存優化等業務關鍵型用例。
        4項基于云的分析服務


        AWS提供有大量分析工具來幫助客戶挖掘數據,并宣布推出Amazon Redshift、EMR、MSK和Kinesis等四項基于云的分析服務,它們現可作為無服務器和按需服務提供。

        Selipsky提到不同的工作負載需要正確的數據庫來支持它們,分析服務也是如此。客戶不想擔心運行這些服務帶來的基礎設施,除了省去管理集群的麻煩外,用戶只需為其使用的資源付費。AWS推出了數字程序AWS技能生成器,并在Amazon.com上提供學習云技能,以及AWS重新/啟動程序,以幫助剛開始上云的用戶。“Amazon Redshift Serverless會自動為您準備正確的計算資源。”AWS的Danilo Poccia解釋說:“隨著更多并發用戶和新工作負載的發展,您的數據倉庫會自動無縫擴展以適應變化。您可以選擇指定基本數據倉庫大小,以額外控制成本和應用程序特定的SLA。”同樣,AWS處理流數據的服務Kinesis現在提供完全托管的按需模式。使用此新容量模式,服務可以根據數據流量自動擴展。為了方便企業訪問所需數據,Selipsky展示了Amazon QuickSight Q功能如何提供儀表板以有用的方式顯示數據。

        AWS Lake Formation:構建安全的數據湖


        AWS Lake Formation是一個非常重要的安全提升,允許限制對特定行和列的訪問,并僅向授權用戶自動過濾和顯示數據。建立和管理數據湖涉及許多人工、復雜和耗時的任務。相比以往動輒花費數周或幾個月的時間,采用AWS Lake Formation,幾天就能輕松地建立一個安全的數據湖。

        Selipsky分享了一些新特性,可簡化進一步的數據加載、優化存儲和管理對數據湖的訪問:一個是Governed Tables。這是一種新型的Amazon S3表,使得在任何規模下攝取和管理數據變得簡單和可靠。它可以自動管理沖突和錯誤,確保用戶視圖一致,并無需自定義錯誤處理代碼或批處理更新。啟動為Governed Tables提供自動壓縮的存儲優化選項時,用戶無需自定義ETL作業,這些作業讀取、合并和壓縮數據到新文件中,然后替換原始文件。還有具有行和單元級安全性的粒度訪問控制,用戶可根據執行操作的身份控制對查詢結果和AWS Glue ETL作業中的特定行和列的訪問。AWS IoT TwinMaker:輕松構建數字孿生


        最后出場的是一項名為AWS IoT TwinMaker的新服務,可用于輕松創建和使用現實世界系統的數字孿生。數字孿生是建筑物、工廠、生產線和設備等事物的虛擬表示,它們定期更新現實世界數據,以模仿其所代表系統的行為。有了這項新服務,用戶無需將數據移動到單個存儲庫中,便可通過連接視頻提要和應用程序等來源的數據來創建數字孿生。

        另一個平臺AWS IoT FleetWise允許制造商從數百萬輛車中收集數據,并易于在云中進行分析。用戶可將內置數據連接器用于這些服務:AWS IoT FleetWise用于設備和時間序列傳感器數據;Amazon Kinesis視頻流用于視頻數據;Amazon Simple Storage Service(S3)用于存儲視覺資源(如CAD文件)和來自業務應用程序的數據。

        AWS IoT TwinMaker還提供了一個框架以創建自己的數據連接器,與其他數據源(如Snowflake和Siemens MindSphere)一起使用。一旦創建了數字孿生,用戶可能會希望在物理環境中可視化數據。為了解決這個問題,AWS IoT TwinMaker創建了一個數字孿生圖,它結合了用戶物理系統的虛擬表示和連接的數據源之間的關系。這允許用戶準確建模他們的現實世界環境。用戶可以導入現有的3D模型來排列物理空間的3D場景。從那里,用戶也可以添加交互式視頻和傳感器數據覆蓋,以及來自連接機器學習服務的見解。該服務附帶了Amazon Managed Grafana的插件,這是Grafana Labs開放儀表板和可視化平臺的托管服務。
        結語:云正為更多企業提供轉型的關鍵途徑


        在過去的15年里,云計算作為新興技術革命的核心驅動力,正為越來越多的企業提供了實現轉型的關鍵途徑。“我們才剛剛開始,”Selipsky提到只有5-15%的支出轉移到云端,因此有一個很大的機會到來,5G和物聯網也變得非常重要。在演講期間,Selipsky還宣布,AWS正在為培訓盡一份力,希望到2025年培訓29萬個云技能工人,以應對云相關工作的爆發式增長。


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: 服務器芯片

        技術專區

        關閉
        主站蜘蛛池模板: 开江县| 溧阳市| 桑植县| 岳普湖县| 娱乐| 平乐县| 呼玛县| 依兰县| 台前县| 隆回县| 南投县| 沙坪坝区| 开化县| 汝阳县| 阜宁县| 隆化县| 绥德县| 新兴县| 石狮市| 黄平县| 德兴市| 景泰县| 益阳市| 永平县| 桃园县| 河源市| 板桥市| 大城县| 锡林浩特市| 清镇市| 城固县| 高碑店市| 新巴尔虎右旗| 察雅县| 安龙县| 聂拉木县| 镇康县| 蒙自县| 徐闻县| 桂平市| 衡南县|