1.容災備份的區(qū)别
容災 (Disaster Tolerance):就是在上述的災難發生時,在保證生産(chǎn)系統的數據盡量少丢失的情況下,保持生存系統的業務(wù)不間斷地運行。
容錯 (Fault Tolerance):指在計算機系統的軟件、硬件發生故障時,保證計算機系統中(zhōng)仍能(néng)工(gōng)作(zuò)的能(néng)力。
區(qū)别 :容錯可(kě)以通過硬件冗餘、錯誤檢查和熱交換 再加上特殊的軟件來實現,而容災必須通過系統冗餘、災難檢測和系統遷移等技(jì )術來實現。當設備故障不能(néng)通過容錯機制解決而導緻系統宕機時,這種故障的解決就屬于容災的範疇。
什麽是災難恢複 (Disaster Recovery):指的是在災難發生後,将系統恢複到正常運作(zuò)的能(néng)力。
區(qū)别 :容災強調的是在災難發生時,保證系統業務(wù)持續不 間斷地運行的能(néng)力,而災難恢複強調的災難之後,系統的恢複能(néng)力。現在的容災系統都包含着災難恢複的功能(néng),所以本文(wén)的讨論除了包括容災方面的内容,還包括了 災難恢複的部分(fēn)内容。
容災系統在企業中(zhōng)給與數據安(ān)全系數相當高的保障,但是容災系統倒是是什麽,他(tā)們是什麽意思?恐怕連正在使用(yòng)容災備份的網絡管理(lǐ)人員都不能(néng)解釋。本文(wén)用(yòng)最淺顯的語言給大家解釋容災備份到底是什麽。
2.容災和備份的目的不同
容災系統的目的在于保證系統數據和服務(wù)的“在線(xiàn)性”,即當系統發生故障時,仍然能(néng)夠正常地向網絡系統提供數據和服務(wù),以使系統不緻停頓。
而容災備份技(jì )術的目的與此并不相同,備份是“将在線(xiàn)數據轉移成離線(xiàn)數據的過程”,其目的在于應付系統數據中(zhōng)的邏輯錯誤和曆史數據保存。
所以,在各種容錯技(jì )術非常豐富的今天,備份系統仍然是不可(kě)替代的。
3.備份是基石
備份是指為(wèi)防止系統出現操作(zuò)失誤或系統故障導緻數據丢失,而将全系統或部分(fēn)數據集合從應用(yòng)主機的硬盤或陣列複制到其它的存儲介質(zhì)的過程。
備份是數據高可(kě)用(yòng)的最後一道防線(xiàn),其目的是為(wèi)了系統數據崩潰時能(néng)夠恢複數據。
4.容災不可(kě)少
那麽建設了備份系統,是否就不需要容災備份系統?這還要看業務(wù)部門對RTO(恢複所需的時間指标)/RPO(能(néng)夠恢複到的最新(xīn)狀态)指标的 期望值,如果允許1TB的數據庫RTO=8小(xiǎo)時,RPO=1天,那備份系統就能(néng)滿足要求。同時,備份的目的在于應付系統數據中(zhōng)的邏輯錯誤和曆史數據保存。隻能(néng)夠滿足數據丢失、數據破壞時的數據恢複目的,而不能(néng)提供實時的業務(wù)接管功能(néng)。
因此容災系統對于某些關鍵業務(wù)而言也是必不可(kě)少的。人們談及容災備份往往是針對當生産(chǎn)系統,不能(néng)正常工(gōng)作(zuò)時,其業務(wù)可(kě)由容災系統接替這些業務(wù),繼續進行正常的工(gōng)作(zuò)。
能(néng)夠提供很(hěn)好的RTO和RPO指标。同時遠(yuǎn)程容災系統具(jù)備應付各種災難,特别是區(qū)域性與毀滅性災難的能(néng)力,具(jù)備較為(wèi)完善的數據保護與災難恢複功能(néng),保證災難降臨時數據的完整性及業務(wù)的連續性,并在最短時間内恢複業務(wù)系統的正常運行,将損失降到最小(xiǎo)。
5.容災不能(néng)替換備份
容災系統會完整地把生産(chǎn)系統的任何變化複制到容災端去,包括不想讓它複制的工(gōng)作(zuò),比如不小(xiǎo)心把計費系統内的用(yòng)戶信息表删除了,同時容災端的 用(yòng)戶信息表也會被完整地删除。如果是同步容災,那容災端同時就删除了;如果是異步容災,那容災端在數據異步複制的間隔内就會被删除。這時就需要從備份系統 中(zhōng)取出最新(xīn)備份,來恢複被錯誤删除的信息。因此容災系統的建設不能(néng)替代備份系統的建設。
6.規劃企業安(ān)全保障體(tǐ)系考慮的因素
對于企業而言到底應該如何建設自己的災備系統,是隻建設備份系統、還是隻建設容災系統、還是需要二者同時建設、或者是分(fēn)步驟的建設,誰先誰後等問題,主要根據業務(wù)的需求而定:
(1)需要防範的災難類型:
企業信息系統可(kě)能(néng)遇到的災難類型及其發生的比例如下:
對于“人為(wèi)錯誤”、“軟件損壞和程序錯誤”加上“病毒”等這些都稱為(wèi)邏輯錯誤,占總故障的 56%,這些錯誤隻能(néng)通過備份系統才能(néng)防範;
對于“硬件和系統故障”以及“自然災難”等故障可(kě)以通過在容災系統(或者異地備份)來防範,占總故障率的44%。
(2)允許的RTO和RPO指标
從技(jì )術上看,衡量容災系統有(yǒu)兩個主要指标:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中(zhōng)RPO代表了當災難發生時允許丢失的數據量;而RTO則代表了系統恢複的時間。
一般而言:容災系統能(néng)夠提供較好的RTO和RPO指标。
(3)系統投資
總的說來,建設備份系統的投資遠(yuǎn)比建設标準意義的容災系統的投資小(xiǎo)得多(duō):
備份系統的投資規模一般在幾百萬;
而最節省的一套容災系統投資都将上千萬;
災難恢複與投資關系:
7.常用(yòng)的災備組合方式
基于以上原因,業界在災備系統的建設上一般按照以下幾種方式:
建設機房内的本地備份系統
建設異地的備份系統
該方式可(kě)以備份系統的價格滿足備份和異地容災功能(néng),能(néng)夠避免主生産(chǎn)中(zhōng)心由于地震、火災或其他(tā)災害造成的數據丢失。
備份系統+異地容災系統
這是一個較為(wèi)理(lǐ)想化的容災系統一體(tǐ)化解決方案,能(néng)夠在很(hěn)大程度上避免各種可(kě)能(néng)的錯誤。
8.容災恢複等級
9.災難恢複層次
,
10.災備技(jì )術層次
1.1 磁盤陣列災備技(jì )術
同步方式
半同步方式
異步方式
1.2 智能(néng)交換機技(jì )術
2.1 卷管理(lǐ)軟件災備技(jì )術
2.2 數據庫日志(zhì)複制技(jì )術
2.3 數據庫災備技(jì )術
3.1 應用(yòng)災備技(jì )術
11.容災體(tǐ)系結構規劃
系統正常運行
生産(chǎn)中(zhōng)心單台主機宕機
生産(chǎn)中(zhōng)心所有(yǒu)主機宕機
生産(chǎn)中(zhōng)心回切