內存計算在DSP中的應用分析
2.1 處理器的性能
早期處理器性能的提升主要依賴于主頻的提高,即CPU在每個時鐘周期內可以執行更多的指令。但由于能耗與散熱條件的限制,這種方法在2005年左右碰到了障礙。于是業界開始轉向多核處理器的設計,即每個處理器內包含多個相互獨立的計算內核。在多核處理器之前,英特爾開發了超線程技術,允許一個處理內核可以在同一時間執行兩條指令線程,從而更好地利用CPU的片上資源。今天,多核、多線程、高可擴展的SMP架構,為x86服務器奠定了運行SAP應用的基礎。
與上一代至強7500相比,至強E7的內核數量由8核(16線程)增加到了10核(20線程);同時得益于QPI總線架構,基于至強E7的服務器可以從雙路擴展到四路、八路,直至256路。這些技術進步使得SAP HANA可以在單一系統內獲得更多的計算資源,其性能指標可以隨硬件升級而線性擴展,用戶甚至可以通過部署1000以上內核的系統實現更復雜的實時分析。
2.2 內存的性能
對于SAP內存計算應用來說,內存子系統的性能是否強壯顯得非常重要。一方面,64位操作系統的普及,使得今天的x86服務器內存可以超過32位的4個GB,理論上達到幾乎無限制的18 Exabyte(即180億GB);另一方面,隨著平臺技術的發展,以及每GB內存價格的下降,服務器系統內存容量越來越大。今天服務器的內存容量已經可以用TB來計算,每1TB即1000GB。
具體到至強E7來看,則主要通過大容量緩存、更高內存帶寬、以及更大容量的內存來滿足這一需求。比如,至強7500的三級緩存是24MB,至強E7達到了30MB,這使得SAP HANA應用中,CPU計算內核可以直接從緩存中讀取更多的數據,訪問速度因此更快。在內存方面,以四路服務器為例,至強7500系統可以支持16GB內存條,最大內存容量為1TB,而至強E7系統可以支持32GB的內存條,系統內存容量擴大到2TB。
當然,在SAP HANA應用中,快速的I/O也很關鍵,至強E7通過QPI互連總線,大大提高CPU與內存之間、CPU與CPU之間以及節點之間的數據傳輸速率,降低延遲。
2.3 高可用性
面向海量數據進行實時分析的系統,其對穩定可靠性的要求是不言而喻的。在這方面,新的至強E7服務器平臺在安全可靠性(RAS)方面也提供了更多的支持。比如Double Device Data Correction(DDDC)就對SAP HANA非常有用,允許當內存同時出現兩個錯誤時,也可以恢復。又比如Machine Check Architecture Recovery(MCA Recovery)技術使得SAP HANA可以與操作系統一起,從許多無法糾正的內存錯誤中恢復,在許多場合下可以不用停機就能恢復數據。在至強E7中,類似這樣的RAS技術還有20多條。
在一個針對32億條POS機銷售記錄的復雜模型中,英特爾與SAP進行了聯合測試,測試表明,跟上一代的至強7500相比,至強E7的性能提高了1.37倍。另外,同樣基于至強E7平臺,英特爾超線程技術性能提升1.21倍,NUMA技術提供1.07倍,睿頻加速(Turbo Boost)技術性能提升1.04倍,如下圖所示:

3 內存計算的前景展望
據了解,在SAP HANA的研發過程中,得到了IBM、惠普、思科、富士通、英特爾等硬件廠商的支持,同時也有可口可樂(希臘)、未來集團(Future Group)、喜利得(Hilti)在參與。比如喜利得(Hilti)是一家為全球建筑市場提供設備和技術的企業,擁有2萬名員工,其中三分之二直接從事與客戶打交道的銷售與工程工作,因此每天會發生超過20萬次客戶接觸。通過SAP HANA,該公司將交易與分析系統進行了融合,在早期測試中,搜索和分析5300萬條客戶數據記錄的時間從原來的2-3個小時,降低到了2-3秒。
許多服務器廠商也已經推出了基于英特爾至強E7處理器的服務器,并針對SAP HANA開發了相應的解決方案,如IBM的x3690 x5、x3850 x5服務器,戴爾的PowerEdge R910服務器等。IBM宣稱,其SAP HANA工作負載優化方案可以使基于SAP的ERP數據分析應用達到每秒處理1.3TB的數據量,以及每小時進行10000次復雜的組合查詢分析報告。
評論