恢復元數據
更新時間 2023-06-09 09:00:15
最近更新時間: 2023-06-09 09:00:15
分享文章
本章節主要介紹 恢復元數據 。
操作場景
在用戶意外修改刪除、數據需要找回,對元數據組件進行重大操作(如升級、重大數據調整等)后系統數據出現異常或未達到預期結果,模塊全部故障完全無法使用,或者遷移數據到新集群的場景中,需要對元數據進行恢復操作。
該任務指導用戶通過MRS Manager創建恢復元數據任務。只支持創建任務手動恢復數據。
須知
- 只支持進行數據備份時的系統版本與當前系統版本一致時的數據恢復。
- 當業務正常時需要恢復數據,建議手動備份最新管理數據后,再執行恢復數據操作。否則會丟失從備份時刻到恢復時刻之間的元數據。
- 必須使用同一時間點的OMS和LdapServer備份數據進行恢復,否則可能造成業務和操作失敗。
- MRS集群默認使用DBService保存Hive的元數據。
對系統的影響
- 數據恢復后,會丟失從備份時刻到恢復時刻之間的數據。
- 數據恢復后,依賴DBService的組件可能配置過期,需要重啟配置過期的服務。
前提條件
- 檢查OMS和LdapServer備份文件是否是同一時間點備份的數據。
- 檢查OMS資源狀態是否正常,檢查LdapServer實例狀態是否正常。如果不正常,不能執行恢復操作。
- 檢查集群主機和服務的狀態是否正常。如果不正常,不能執行恢復操作。
- 檢查恢復數據時集群主機拓撲結構與備份數據時是否相同。如果不相同,不能執行恢復操作,必須重新備份。
- 檢查恢復數據時集群中已添加的服務與備份數據時是否相同。如果不相同,不能執行恢復操作,必須重新備份
- 檢查DBService主備實例狀態是否正常。如果不正常,不能執行恢復操作。
- 停止依賴MRS集群運行的上層業務應用。
- 在MRS Manager停止所有待恢復數據的NameNode角色實例,其他的HDFS角色實例必須保持正常運行,恢復數據后重啟NameNode。NameNode角色實例重啟前無法訪問。
- 檢查NameNode備份文件是否保存在主管理節點“數據存放路徑/LocalBackup/”。
操作步驟
查看備份數據位置
- 在MRS Manager,選擇“系統設置 > 備份管理”。
- 在任務列表指定任務的“操作”列,單擊“更多 > 查詢歷史”,打開備份任務執行歷史記錄。 在彈出的窗口中,在指定一次執行成功記錄的“備份路徑”列,單擊“查看”,打開此次任務執行的備份路徑信息,查找以下信息:
- “備份對象”表示備份的數據源。
- “備份路徑”表示備份文件保存的完整路徑。
- 選擇正確的項目,在“備份路徑”手工選中備份文件的完整路徑并復制。
創建恢復任務
- 在MRS Manager,選擇“系統設置 > 恢復管理”。
- 單擊“創建恢復任務”。
- 在“任務名稱”填寫恢復任務的名稱。
選擇恢復源
在“恢復配置”,勾選待恢復數據的元數據組件。
設置恢復參數
- 選擇不同的備份目錄時,對應設置如下:
- 在“路徑類型”,選擇一個備份目錄的類型。
- “LocalDir”:表示備份文件保存在主管理節點的本地磁盤上。選擇此參數值,還需要配置“源端路徑”,表示備份文件保存位置的完整路徑。例如,“數據存放路徑/LocalBackup/備份任務名_任務創建時間/數據源_任務執行時間/版本號_數據源_任務執行時間.tar.gz”。
- “LocalHDFS”:表示備份文件保存在當前集群的HDFS目錄。選擇此參數值,還需要配置以下參數:
-“源端路徑”:表示備份文件在HDFS中保存的完整路徑。例如“備份路徑/備份任務名_任務創建時間/版本號_數據源_任務執行時間.tar.gz”。
-“源實例名稱”:選擇恢復任務執行時備份目錄對應的NameService名稱。默認值為“hacluster”。
- 單擊“確定”保存。
執行恢復任務。
在恢復任務列表已創建任務的“操作”列,單擊“啟動”,開始執行恢復任務。
- 恢復成功后進度顯示為綠色。
- 恢復成功后此恢復任務不支持再次執行。
- 如果恢復任務在第一次執行時由于某些原因未執行成功,在排除錯誤原因后單擊“啟動”,重試恢復任務。
恢復了哪個元數據?
- 恢復了OMS和LdapServer元數據,執行步驟7。
- 恢復了DBService數據,任務結束。
- 恢復NameNode數據,在MRS Manager,選擇“服務管理 > HDFS > 更多 > 重啟服務”,任務結束。
重啟Manager使恢復數據生效。
- 在MRS Manager,選擇“LdapServer > 更多 > 重啟服務”,單擊“確定”,等待LdapServer服務重啟成功。
- 登錄主管理節點,詳情請參見如何確認Manager的主備管理節點。
- 執行以下命令,重新啟動OMS。
sh ${BIGDATA_HOME}/om-0.0.1/sbin/restart-oms.sh
提示以下信息表示命令執行成功:
startHA successfully.
- 在MRS Manager,選擇“KrbServer > 更多 > 同步配置”,不勾選“重啟配置過期的服務或實例”,單擊“確定”,等待KrbServer服務配置同步及重啟成功。
- 選擇“服務管理 > 更多 > 同步配置”,不勾選“重啟配置過期的服務或實例”,單擊“確定”,等待集群配置同步成功。
- 選擇“服務管理 > 更多 > 停止集群”。待停止集群的操作生效后,選擇“服務管理 > 更多 > 啟動集群”,等待集群啟動成功。