云容災網關drm進程啟動失敗,如何處理 ?
問題描述 :安裝部署完容災網關或者代理客戶端后,drm進程啟動失敗。
可能由以下原因導致:
- service賬號對“/dev/null”目錄沒有寫權限
- 本機無法解析hostname域名
處理方法 1 : 賦予service賬號對“/dev/null”目錄的讀寫權限。
步驟 1登錄容災網關或者代理客戶端所在服務器。
步驟 2以“root”用戶,執行以下命令,修改“/dev/null”目錄權限。
chmod 666 /dev/null
步驟 3執行以下命令,檢查“/dev/null”目錄權限。
ll /dev/null
回顯如下類似信息,表示權限設置成功:
crw-rw-rw- 1 root root 1, 3 Apr 9 09:21 /dev/null
處理方法 2 : 增加“hostname”域名解析。
步驟 1登錄容災網關或者代理客戶端所在服務器。
步驟 2以“root”用戶,執行以下命令,增加hostname域名解析。
echo "127.0.0.1 hostname" >> /etc/hosts
步驟 3執行以下命令,檢查hostname域名解析。
ping hostname
回顯如下類似信息,表示權限設置成功:
PING test-dr (127.0.0.1) 56(84) bytes of data.64 bytes from localhost (127.0.0.1): icmp_seq=1 ttl=64 time=0.022 ms
切換/故障切換后,生產站點服務器與容災站點服務器的hostname不一致
首次執行切換/故障切換操作前,用戶修改了生產站點服務器的hostname。然后執行切換/故障切換,并啟動容災站點服務器,發現容災站點服務器的hostname沒有更新。可能的原因是,對于linux云主機,在首次執行切換/故障切換操作前,您如果在生產站點服務器內部修改了hostname,該修改不會自動同步到容災站點服務器。
處理方法1:
對于暫未執行切換/故障切換操作的保護組,為保證開啟容災保護后,生產站點服務器與容災站點服務器的hostname一致,您可以在首次執行切換/故障切換操作前,先在生產站點服務器內部修改cloudinit配置文件/etc/cloud/cloud.cfg,將“preserve_hostname: false”修改為“preserve_hostname: true”。
具體操作如下:
- 登錄生產站點服務器。
- 執行以下命令,編輯配置文件“/etc/cloud/cloud.cfg”。
sudo vim /etc/cloud/cloud.cfg
- 修改“preserve_hostname”參數項。
- 如果文件“/etc/cloud/cloud.cfg”中已有參數項“preserve_hostname: false”,將其修改為“preserve_hostname: true”即可。
- 如果文件“/etc/cloud/cloud.cfg”中沒有該參數項,需在“cloud_init_modules”模塊前,添加語句 “preserve_hostname: true” 。
- 執行切換/故障切換操作。
切換/故障切換后,容災站點服務器的主機名與生產站點服務器hostname保持一致。
處理方法2:
對于已經執行切換/故障切換操作,但是未提前修改配置文件/etc/cloud/cloud.cfg的生產站點服務器,您需要登錄容災站點服務器,手動修改容災站點服務器的hostname,使其與生產站點服務器修改后的hostname保持一致。
故障切換后,為什么容災站點的服務器上看不到網卡了?
存儲容災服務以保護組為單位進行生產站點和容災站點的切換,按照場景可分為切換和故障切換。切換是指用戶在生產站點未發生故障時,主動計劃性的進行生產站點和容災站點的切換。故障切換是指生產站點產生故障后,進行生產站點和容災站點的切換。
- 切換時,保護實例中的生產站點服務器和容災站點服務器的網卡會進行相互交換,保證切換前后服務器能以相同的IP地址、MAC地址等提供業務訪問能力。
- 故障切換時,由于保護實例生產站點服務器處于故障狀態,生產站點服務器的網卡會遷移到容災站點服務器,容災站點服務器的主網卡會卸載后處于“待使用”狀態。所以故障切換完成時,原生產站點故障服務器會處于無網卡狀態;等待故障服務器恢復后,通過保護組重保護操作,會將原容災站點服務器卸載后處于“待使用”狀態的主網卡掛載到原生產站點服務器,最終實現生產站點服務器和容災站點服務器網卡相互交換。