什么是三副本數據冗余?
數據三副本技術是一種在分布式存儲系統中使用的數據冗余技術。它的原理是將數據分塊后的三個副本保存在集群中不同的節點上,以提高數據的可靠性和容錯性。
數據三副本技術的基本原理如下:
數據復制:當數據被寫入分布式存儲系統時,系統會自動將該數據分塊并復制為三個副本。
副本分布:這三個副本將分散存儲在不同的物理節點或存儲設備上,以減少副本之間的關聯性。這樣,即使某個存儲節點或設備發生故障,其他節點上的副本仍然可用。
容錯和數據恢復:如果一個副本不可用或損壞(例如由于存儲節點故障或硬件故障),系統可以使用其他副本中的數據來實現容錯和數據恢復。系統會自動檢測并修復副本中的數據錯誤或丟失。
三副本技術架構如圖:


三副本技術怎樣確保數據一致性?
數據一致性表示當應用寫一份數據到存儲系統時,存儲系統中的3個數據副本必須保持數據一致。且當應用再次讀取這些數據時,任意副本上的數據和之前寫入的數據都是一致的。
通常從兩個角度確保數據一致性:
應用程序寫數據時,會向存儲系統中寫入三份數據副本。只有當三個副本都寫入成功后,存儲系統才會向應用程序返回寫入成功響應。
如果有數據副本無法讀取,則存儲系統會自動從其他已保存的副本中讀取數據,然后在物理磁盤扇區錯誤的節點上重新寫入數據,自動修復損壞的副本,確保數據一致性。
故障影響及故障處理
存儲系統采用分布式存儲集群,集群中的每個物理磁盤上都保存了多個數據塊,每個數據塊的副本按照一定的策略分散存儲在集群中的不同節點上。當存儲系統中某臺存儲服務器或物理磁盤發生故障時,會自動啟動數據修復。由于整個存儲集群的多個存儲節點會同時參與數據修復,每個存儲節點上只需重建一小部分數據,多個存儲節點并行工作,因此有效避免了單個節點重建大量數據所產生的性能瓶頸,對上層業務幾乎無影響,用戶無感知。
三副本技術和云備份、快照有什么區別?
三副本技術:主要目的是提高數據的可靠性和容錯性,以保證數據的高可用性和持久性。它適用于分布式存儲系統,用于應對設備或節點故障的情況。
云備份:主要目的是在主存儲系統發生故障或數據丟失時,能夠恢復數據。云備份通常用于長期數據保護、災難恢復和數據遷移等場景。
快照:主要用于數據恢復、版本控制和測試等目的。它可以提供快速恢復點和數據回滾功能,并節省存儲空間,因為快照通常只記錄了數據的差異部分。