什么是容災?
容災的主要目的是當自然或人為的原因導致生產系統發生故障時,能夠盡可能地保證業務的連續性。
容災就是在自然災害、設備故障、人為操作破壞等災難發生時,在保證生產系統的數據盡量少丟失的情況下,保持生產系統的業務不間斷地運行。
云容災有哪些功能?
云容災具有以下主要功能:
-
云主機跨可用區容災
當出現機房級故障(如電力故障、網絡故障、空調故障等)時,生產中心故障導致業務中斷,云容災服務可提供云主機跨可用區秒級RPO、分鐘級RTO的容災保護。通過簡單的配置,即可在容災中心拉起容災云主機,迅速接管業務。
-
容災演練
在不影響業務的情況下,通過模擬真實的容災恢復場景,確保在生產中心發生故障時能夠順暢地進行故障切換,且容災中心云主機能夠正常拉起、接管業務。
-
故障切換
定期的容災演練保障了業務可以隨時在云上拉起。當生產中心發生重大故障時,通過故障切換操作可以在云上迅速恢復業務。
什么是復影云主機和容災云主機?
- 復影云主機:云容災為充分減少容災閑置資源帶來的開銷,在容災端采用復影云主機,在減少資源消耗的同時又能夠提供良好的RTO。啟動容災復制后,生產中心受保護的云主機的數據會實時復制至復影云主機;容災演練/故障切換時,復影云主機中的數據會傳輸至容災云主機用于業務恢復。確認故障切換完成后,復影云主機會被自動刪除。容災復制期間,建議不要對復影云主機進行任何操作。
- 容災云主機:進行容災演練或故障切換時,系統在容災中心創建的用于恢復業務的云主機,稱為容災云主機。
云容災服務可以達到什么樣的RPO和RTO?
云容災采用持續數據保護(CDP)技術,支持字節級數據復制,RPO可達秒級、RTO可達分鐘級。
- RPO:Recovery Point Objective(恢復點目標),指故障發生時數據可以恢復到的時間點,決定生產中心發生故障時的數據丟失量。例如,RPO = 30秒,表示在生產中心發生故障時,最近30秒的數據無法恢復。
- RTO:Recovery Time Objective(恢復時間目標),指故障發生后云主機從中斷到恢復運行所需要的時間。例如,RTO = 1分鐘,表示在生產中心發生故障時,需要1分鐘才能恢復正常運行
云容災可以對物理機容災嗎?
云容災暫不支持物理機容災,后續將逐漸完善功能。
如果您有具體需求,可以通過客服電話等方式聯系產品售前經理或解決方案經理,我們會根據您的業務為您定制合適的解決方案。
云容災支持哪些彈性云主機?
目前僅支持64位操作系統,且云主機的規格不能小于2CPU+4GB內存。
支持的操作系統版本如下表所示:
| 操作系統類型 | 操作系統版本 | 位數 |
|---|---|---|
| CentOS | 7.0、7.1、7.2、7.3、7.4、7.5、7.6、7.7、7.8、7.9 | 64 |
| Ubuntu | 18.04 | 64 |
云備份產品和云容災產品的區別?
| 產品 | 應用場景 | 使用目的 | RPO | RTO |
|---|---|---|---|---|
| 云容災 | 主要針對火災、地震等重大自然災害,因此生產中心和容災中心之間必須保證一定的安全距離。 | 避免業務中斷,在災難發生后,可以在容災中心啟動容災主機,保證業務的連續性。 | 秒級 | 分鐘級 |
| 云備份 | 當發生軟件錯誤、病毒入侵、人為刪除等事件時,可將數據恢復到任意備份點。 | 避免數據丟失,出現故障后,可通過備份將數據恢復至最近的備份點。 | 小時級~天級 | 分鐘級~小時級 |
云容災服務是如何收費的?
云容災服務會收取容災客戶端的費用,容災中產生的云主機費用、云硬盤費用、云硬盤快照費用由對應的服務收取。
云容災服務的計費說明如下表所示:
| 計費項 | 說明 | 計費方式 | 收費方 |
|---|---|---|---|
| 容災客戶端 | 指授權部署在云主機上被保護的客戶端。 | 公測期間免費試用。 注意: 容災使用的其他服務,如云主機、云硬盤、云硬盤快照等正常計費。 |
云容災 |
| 云主機 | 當故障切換或容災演練時,對連續復制時使用的容災中心復影云主機或云上容災恢復拉起時部署的云主機進行收費。 | 僅支持按需計費。 收費標準按照云主機標準資費收取。 |
彈性云主機 |
| 云硬盤 | 掛載在容災中心云主機下,存放實時復制的數據。 | 僅支持按需計費。 收費標準按照云硬盤標準資費收取。 |
云硬盤 |
| 云硬盤快照 | 對容災中心云主機下的磁盤的歷史時間節點打快照,供容災恢復使用。 | 僅支持按需計費。 收費標準按照云硬盤快照標準資費收取。 |
云硬盤 |
容災資源是否需要手動創建?
云容災會自動創建容災中心所需的云資源,不需要用戶手動進行創建。
創建的容災中心云資源,需要按需收取所使用的云主機和云硬盤的費用。收費標準按照云主機標準資費和云硬盤標準資費收取。
云容災支持哪些類型云資源或工作負載的容災?
支持云主機的容災。
- 目前僅支持64位操作系統,建議運行容災客戶端的機器使用雙核,并配備4GB以上的可用內存。
- Linux系統的/boot分區和/分區必須在同一磁盤,若不滿足同一磁盤要求,建議手動調整磁盤后,再注冊受保護實例進行容災。
- 支持的云主機操作系統版本請參見支持的操作系統版本。
云容災復制是否支持斷點續傳?
支持。
云容災支持復制停止后,通過“重啟復制”操作再次重啟之前的復制過程,此過程是斷點續傳的過程。具體操作請參見重啟容災復制。
除此之外,復制過程中若發生斷網等異常情況,云容災也支持恢復后斷點續傳。
云容災有配額限制嗎?
為避免資源浪費,服務供應商限定了各服務資源的配額,對用戶可使用的資源數量和容量等做了限制。
云容災的具體配額如下:單租戶在一個地域內,默認最多可以創建20個容災客戶端。
如有更大需求可以提工單申請,最大支持200個。
云容災復制過程是否可以對云主機增擴盤?
不建議在復制過程中對云主機進行增擴盤操作,當磁盤發生變化的時候會導致復制錯誤。
如果您對云主機的磁盤容量、數量進行變更導致容災受保護服務器復制出錯,需要重新建立復制關系。
如果生產站點云主機使用密碼登錄,可以正常使用云容災服務嗎?
如果生產站點云主機(即受保護的服務器)設置為密碼方式登錄,可以正常使用云容災服務,如添加受保護服務器、進行容災演練、故障切換等操作。
但容災演練和故障切換所創建的容災云主機,不會保留生產站點云主機的密碼信息,您可以先進行重置密碼,然后登錄容災云主機。
什么是生產中心和容災中心?
- 生產中心指需要容災的服務器在云上的位置,即承載租戶業務的服務器所在的地域和可用區,需在創建保護組時指定。
- 容災中心指災備用的計算和存儲資源在云上的位置。當前僅支持容災中心與生產中心在同一個地域的不同可用區。
當受保護的服務器狀態顯示“容災功能所需源端磁盤空間不足”該如何操作?
當受保護服務器狀態顯示“容災功能所需源端磁盤空間不足”時,請執行如下操作:
步驟1:進入到被保護服務器的終端頁面;
步驟2:切換到root用戶下;
步驟3:執行入如下命令: /opt/cstor/cdr/scripts/cdr_checkcap.sh 如出現如下回顯: Check the follwing file system cap
請執行步驟4。否則請聯系運維人員;
步驟4:檢查步驟3中目錄(如上圖所示:/mnt/test)的可用空間,如空間不足,執行步驟5;
步驟5:清理步驟3中目錄(如上圖所示:/mnt/test),建議該路徑下的空閑空間比例大于原始磁盤20%的;
步驟6:刷新容災管理頁面;觀察當空間釋放后,重新刷新云容災受保護服務器頁面,錯誤狀態是否會自動更正。 如未更正,請重復檢測步驟3-5,如重復執行后仍未恢復,請聯系運維人員。
注意:
- 步驟5中清理文件釋放空間時請勿清理帶有前綴.cbrsnp_的隱藏文件,否則無法保證容災端數據的正確性。
- 容災運行中請勿刪除帶有前綴.cbrsnp_的隱藏文件,否則無法保證容災端數據的正確性。