安徽移動:云存儲下的容災建設
關于云計算的討論在持續升溫,越來越多的以運營商為代表的企業開始對云計算進行研究和部署。然而,在云存儲環境中存在著大量的異構環境,而傳統容災技術以同構存儲為主,無法在異構環境中實現容災保護。中國移動安徽公司(以下簡稱安徽移動)就對云存儲環境下的異構存儲容災進行了探索。
建設獨立、開放的容災系統
容災系統的獨立性和開放性,對于安徽移動現在以及將來保持系統平臺和存儲平臺的靈活性都至關重要。一個好的容災系統不僅能夠滿足企業目前的容災需要,而且還能夠為將來的數據平臺選擇提供更大的靈活性。
容災系統的獨立性、開放性表現在以下幾方面:可以支持用戶現有的服務器平臺以及將來可能選擇的主流服務器平臺,可以支持用戶現有的存儲平臺以及將來可能選擇的主流存儲平臺。對于安徽移動而言,各業務系統的核心數據涉及多種主要的存儲平臺,這就要求容災方案能夠全面支持用戶現有的以及將來可能采用的各種存儲平臺。
賽門鐵克公司提供的容災解決方案,能夠全面支持主流的服務器和存儲平臺,特別是存儲平臺,賽門鐵克的容災解決方案可以幫助用戶實現存儲平臺的無關性,這為用戶將來部署新系統提供了更大的選擇空間。
用戶系統環境現狀
安徽移動從BOSS 3.0上線開始,就利用云存儲技術對原有的存儲系統進行了改造,通過虛擬化技術、云計算技術實現異構環境下的統一管理,使應用逐步擺脫對硬件基礎架構的依賴。在原有的Sun主機、EMC存儲的基礎上,安徽移動逐步引入其他品牌的主機和存儲設備(包括惠普、IBM、富士通的主機,惠普、Sun、HDS等品牌的存儲產品),從而有效降低了硬件的采購成本。
安徽移動使用的存儲虛擬化技術是通過部署在主機上的Symantec Storage Foundation軟件,經過虛擬化的存儲空間,可以跨越多個異構的磁盤陣列。這種虛擬化功能通常由主機操作系統下的邏輯卷管理軟件來實現,其最大優點是穩定、開放,并可實現在線管理。Storage Foundation的核心包含一個卷管理器(VxVM)和其上的文件系統(VxFS)。
VxVM增強了對磁盤驅動器和LUN的管理。獨立的多路徑軟件(DMP)能夠屏蔽不同存儲設備間的差異,從而確保數據能在異構存儲間在線移動。VxVM統一了不同主機環境下卷的組織格式,確保數據能夠在不同主機系統間靈活遷移。
遠距離跨磁盤陣列鏡像
安徽移動原有的容災系統采用傳統硬件復制技術,對硬件平臺有很強的依賴性,生產站點和容災站點必須使用相同品牌的存儲設備。改用存儲虛擬化方案后,安徽移動的容災系統突破了硬件的限制。
利用Storage Foundation軟件和SAN網絡的遠距離連接能力,安徽移動可以實現生產中心與容災中心之間遠距離的跨磁盤陣列的鏡像,從而提高數據系統的可靠性。
當生產中心的磁盤系統發生故障或災難時,由于同城容災中心的磁盤是生產中心磁盤系統的鏡像,操作系統會自動隔離生產中心的磁盤,轉而對容災中心的數據進行訪問。業務系統可以通過城域SAN網絡直接訪問災備中心磁盤系統中的數據,而不會影響生產中心的業務系統。也就是說,生產中心磁盤系統的災難對業務系統是透明的,應用和數據庫不會因為生產中心磁盤系統的故障而停止。更重要的是,應用和數據庫不會因為災難而中止,從而避免了發生數據損壞的可能性。
生產中心磁盤系統出現故障后,用戶只要更換損壞的磁盤系統,然后利用Volume Manager重新生成鏡像即可。重新生成鏡像的過程,實際上就是將數據從災備中心的磁盤系統中復制到生產中心磁盤系統中的過程。值得注意的是,整個容災過程對應用是完全透明的,不需要也不會中斷業務系統的正常運行。這是采用基于磁盤系統的復制技術構建的容災系統所無法實現的。
利用傳統磁盤系統復制技術構建容災系統需要付出額外的代價,主要包括以下幾方面:生產磁盤系統出現故障時,會造成應用系統宕機;生產磁盤系統出現故障時,數據系統切換到災備系統需要較長時間;生產磁盤系統出現故障時,磁盤系統的切換過程很復雜,需要專家支持;需要支付額外的費用。
Storage Foundation軟件不僅可以利用鏡像實現遠程數據容災,而且具有鏡像斷裂后的快速同步功能。在需要遠程連接的物理環境中,遠程鏈路相對本地連接更容易受損,也更容易引起鏡像斷裂,因此鏡像斷裂后的快速同步功能就顯得非常重要。Storage Foundation軟件可以提供Fast Mirror Resync功能,方便實現增量數據的快速同步。
集群軟件異地切換
在上述容災方案中,生產數據通過SAN環境中的跨陣列鏡像功能得到了很好的保護。在生產端服務器上部署集群軟件,在本地進行切換,保障了應用的連續性。不過這樣的容災方案還不夠完善,當生產機房出現災害時,用戶又應如何保障整個業務的連續性?
用戶需要在容災端部署服務器,并在安裝和生產端同樣部署存儲管理軟件及集群軟件。在生產端發生災害時,上述方案不僅能夠保護生產端的數據,而且能將生產端的應用切換到容災端,使用戶能夠持續訪問應用,保障業務的連續性,這也是傳統硬件容災方案所無法實現的。
容災系統應用效果顯著
安徽移動在BOSS 3.0上線時就對容災系統進行了改進,不僅實施了同構環境下的鏡像容災,而且在結算數據庫和BI數據庫中進行了異構存儲容災的探索。生產中心采用的存儲設備為HP XP,容災中心采用EMC存儲。新的容災系統上線運行后,完全能夠滿足應用的需求。
在BOSS的核心系統中,安徽移動也使用了異構容災方案。在重要性僅次于CRM的中心資源庫中,原本計劃生產端和容災端都使用Sun主機加EMC存儲的方案。在系統上線前兩周,CRM系統要求緊急擴容,但是現有的存儲設備容量不足。因此,安徽移動迅速將系統遷移至Sun主機+惠普存儲(生產)+Sun存儲(容災)的平臺,并使用基于Storage Foundation的鏡像容災和快照技術,將存儲資源池化,既提高了資源的利用率,又避免了硬件的鎖定。
與此同時,安徽移動新上線的容災系統,除了能實現容災功能以外,還能提供如下三種功能。
跨存儲的快照
安徽移動原來使用的快照技術只適用于同構存儲環境。在使用Storage Foundation后,快照技術不受存儲硬件的限制,能以卷為單位進行數據快照和復制,比以LUN為單位的復制更加靈活,性能也絲毫不遜色。
異構存儲數據的在線遷移
跨異構陣列的鏡像,可以在線遷移生產數據,從而避免應用中止。
實現存儲集中統一管理
以往的存儲管理、集群管理都是以主機為出發點,無法兼顧整個數據的存儲、容災及集群的使用情況。在使用Storage Foundation后,安徽移動可以通過一個管理平臺VOM,了解異構環境中存儲設備的使用情況以及容災狀態。統一存儲管理平臺的使用改變了安徽移動的運維習慣,有效提高了運維的效率。
Storage Foundation降低容災投資
總而言之,Storage Foundation容災方案給企業用戶帶來了很多價值?;赟torage Foundation的容災方案減少了用戶對硬件環境的依賴,從而有效降低了容災的投資。如果采用傳統的硬件容災方案,生產中心與容災中心的存儲設備必須完全相同。如果采用賽門鐵克的存儲管理軟件,可以徹底改變這種狀況。賽門鐵克存儲管理軟件支持異構環境,不僅為用戶提供了選擇硬件設備的靈活性,而且降低了用戶的投資。
如果采用傳統硬件容災方案,用戶必須單獨購買復制軟件;如果采用基于Storage Foundation的容災方案,用戶不必再單獨購買復制軟件。大多數主機存儲管理軟件,在回收存儲空間或進行條帶化處理時,通常會造成應用中斷。
賽門鐵克存儲管理軟件具有強大的在線操作功能,保障了業務的連續性?;赟torage Foundation的容災方案具有強大的在線管理功能,可以減少計劃內停機時間。
如果采用基于Storage Foundation的容災方案,用戶不必再單獨購買硬件廠商提供的動態多路徑軟件。賽門鐵克存儲管理軟件內嵌免費的DMP動態多路徑管理功能,可以支持不同廠商的存儲設備,從而避免在同一主機上安裝多種動態多路徑軟件時可能引起的沖突。
基于Storage Foundation的容災方案不僅可以實現數據級容災,而且支持應用級容災。采用傳統的硬件容災方案,需要人工進行切換,因此會造成應用的中斷。
基于Storage Foundation的容災方案可以應對任意的存儲故障,避免應用中斷,同時還可以支持異構存儲環境,實現快速恢復,與VCS集群軟件配合,還能實現應用級的切換,保障業務連續性。
評論