滾動重啟單個集群服務
更新時間 2024-05-22 04:45:09
最近更新時間: 2024-05-22 04:45:09
分享文章
本章節主要介紹翼MR Manager的滾動重啟集群操作。
操作場景
一鍵滾動重啟單個集群服務。
操作步驟
-
登錄翼MR管理控制臺。
-
單擊“我的集群”,單擊指定的集群名稱,進入集群信息頁面。
-
單擊“翼MR Manager”tab,單擊“前往翼MR Manager”。
-
進入到翼MR Manager以后,單擊菜單“集群服務”,進入集群服務列表頁面。
-
選擇指定集群服務,單擊集群服務名稱進入集群服務詳情頁面。
-
單擊“運維操作>滾動重啟集群服務”,彈出確認操作彈框。
-
單擊“確定”
,進入到滾動重啟集群服務頁面,展示當前集群服務支持滾動重啟的實例列表。如圖所示:
-
選擇指定實例分組,單擊“滾動重啟設置”,對默認滾動重啟設置進行修改,修改完成后單擊“確定”,如圖所示:

-
單擊“下一步”,按照實例分組順序進行滾動重啟,等待所有實例完成重啟后即可。如圖所示:
滾動重啟參數說明
滾動重啟參數說明如下表所示:
| 參數名稱 | 描述 |
|---|---|
| 單批實例數 | 1. 按照角色實例維度,每1個批次的并發實例數,例如HDFS-DataNode。 2. 默認為1,輸入限制為int的最大值,僅支持輸入正整數。 3. 當角色實例數小于并發數時,以當前已有實例數為準例如:并發數設置為2,HDFS-DataNode的實例數為3;則第一批次執行的實例數是2,第2批次執行的實例數則為1。 |
| 批次間隔時間 | 1.上個批次成功后與下個批次開始的間隔時間。 2. 默認30秒,取值范圍1-1800,僅支持輸入正整數;單位默認為:秒,不可改。舉例:設置時間為600S批次間隔則表示,前1個批次運行完成后,等待600S后開始下一個批次。 |
| 批次等待時間 | 1. 上個批次開始后,開始下個批次的等待時間。 2. 默認30秒,取值范圍1-1800,僅支持輸入正整數;單位默認為:秒,不可改。舉例:設置時間為600S批次等待則表示,前1個排次開始運行,等待600S后不管前一個批次是否完成運行,都開始下一個批次的運行。 |
| 實例容錯閾值 | 1. 實例執行失敗的容錯次數。 2. 默認為0,輸入限制為int的最大值,僅支持輸入正整數例如:設置為0時,即表示任意一個角色實例的操作失敗后,滾動操作終止設置為2時,即表示任意3個角色實例的操作失敗后,滾動操作才會終止。 |