MRS的數據連接是用來管理集群中組件使用的外部源連接,如Hive的元數據使用外部的關系型數據庫,可以通過數據連接來關聯Hive組件實現。
- 本地元數據:元數據存儲于集群內的本地GaussDB中,當集群刪除時元數據同時被刪除,如需保存元數據,需提前前往數據庫手動保存元數據。
- 數據連接:可選擇關聯與當前集群同一虛擬私有云和子網的RDS服務中的PostgresDB或MySQL數據庫,元數據將存儲于關聯的數據庫中,不會隨當前集群的刪除而刪除,多個MRS集群可共享同一份元數據。
說明不同集群間Hive元數據切換時,MRS當前只對Hive組件自身的元數據數據庫中的權限進行同步。這是由于當前MRS上的權限模型是在Manager上維護的,所以不同集群間的Hive元數據切換,不能自動把用戶/用戶組的權限同步到另一個集群的Manager上。
數據連接前置操作
1.登錄RDS管理控制臺。
2.選擇“實例管理”,選擇MRS數據連接使用的RDS實例所在行的操作列的“更多 > 登錄”,以root用戶登錄該實例。

3.在實例“首頁”即可單擊“新建數據庫”創建新的數據庫。
4.在頁面頂部選擇“賬號管理 > 用戶管理”。

說明當用戶選擇的數據連接為“RDS服務MySQL數據庫”時,請確保使用的數據庫用戶為root用戶。如果為非root用戶,請參考步驟4-步驟6操作。
5.單擊“新建用戶”,創建一個非root用戶。
6.在頁面頂部選擇“SQL操作 > SQL查詢”,在“庫名”處切換對應數據庫,然后執行如下SQL命令為該數據庫用戶進行賦權,其中{db_name}與{db_user}為MRS待連接的數據庫名和新建的用戶名。
grant SELECT, INSERT on mysql.* to '${db_user}'@'%' with grant option;
grant all privileges on ${db_name}.* to '${db_user}'@'%' with grant option;
grant reload on *.* to '${db_user}'@'%' with grant option;
flush privileges;
7.參考下方 創建數據連接。
創建數據連接
1.登錄MRS控制臺,在導航欄選擇“數據連接”。
2.單擊“新建數據連接 ”。
3.參考下表配置相關參數。
數據連接
| 參數 | 說明 |
|---|---|
| 類型 | 選擇外部源連接的類型。 RDS服務MySQL數據庫,支持Hive或Ranger組件的集群支持連接該類型數據庫。 |
| 名稱 | 數據連接的名稱。 |
| 數據庫實例 | RDS服務數據庫實例,該實例需要先在RDS服務創建后在此處引用,且已創建數據庫,具體請參考管理數據連接章節-配置數據連接中的 數據連接前置操作。單擊“查看數據庫實例”查看已創建的實例。 說明 為了保證集群和PostgreSQL數據庫的網絡訪問,建議該實例與MRS集群的虛擬私有云和子網一致。 該實例的安全組入方向規則需要放通3306端口(可通過在RDS控制臺單擊實例名稱進入實例基本信息頁面,在“連接信息”區域單擊“安全組”右側的安全組名稱進入安全組控制臺,在入方向規則頁簽中添加一個“協議端口”為TCP 3306,“源地址”為Hive的MetaStore實例所在的所有節點IP的規則)。 當前MRS支持的RDS上Postgres數據庫版本號為PostgreSQL9.5/PostgreSQL9.6。 當前MRS僅支持RDS上MySQL數據庫版本為MySQL 5.7.x。 |
| 數據庫 | 待連接的數據庫的名稱。 |
| 用戶名 | 登錄待連接的數據庫的用戶名。 |
| 密碼 | 登錄待連接的數據庫的密碼。 |

當用戶選擇的數據連接為“RDS服務MySQL數據庫”時,請確保使用的數據庫用戶為root用戶。如果為非root用戶,請參考 管理數據連接章節-配置數據連接 中的 數據連接前置操作操作。
4.單擊“確定”完成創建。
編輯數據連接
1.登錄MRS控制臺,在導航欄選擇“數據連接”。
2.在數據連接列表的“操作列”,單擊待編輯數據連接所在行的“編輯 ”。
3.參考上表 數據連接 修改參數。
如果選擇的數據連接已經關聯了集群,編輯后會將修改后的配置同步到對應的集群中。
刪除數據連接
1.登錄MRS控制臺,在導航欄選擇“數據連接”。
2.在數據連接列表的操作列,單擊待刪除數據連接所在行的“刪除 ”。
如果選擇的數據連接已經關聯了集群,刪除動作不會影響對應的集群。
創建集群時配置數據連接
1.登錄MRS管理控制臺。
2.單擊“創建集群”,進入“創建集群”頁面。
3.在創建集群頁面,選擇“自定義創建”。
4.在軟件配置中,參考下表配置“元數據”,其他參數請參考創建自定義集群進行配置并創建集群。
數據連接參數說明
| 參數 | 參數說明 |
|---|---|
| 元數據 | 是否使用外部數據源存儲元數據。 本地元數據: 元數據存儲在集群本地。 數據連接:使用外部數據源元數據,若集群異常或刪除時將不影響元數據,適用于存儲計算分離的場景。 支持Hive或Ranger組件的集群支持該功能。 |
| 組件名 | 當“數據連接”功能開啟時,該參數有效。用于表示可以設置外部數據源的組件類型。 Hive Ranger |
| 數據連接類型 | 當“數據連接”功能開啟時,該參數有效。用于表示外部數據源的類型。 Hive組件支持的數據連接類型: ? RDS服務MySQL數據庫 ? 本地數據庫 Ranger組件支持的數據連接類型: ? RDS服務MySQL數據庫 ? 本地數據庫 |
| 數據連接實例 | 當“數據連接類型”選擇“RDS服務PostgreSQL數據庫”或“RDS服務MySQL數據庫”時,該參數有效。用于表示MRS集群與RDS服務數據庫連接的名稱,該實例必須先創建才能在此處引用。可單擊“創建數據連接”進行創建,具體請參考 管理數據連接章節-配置數據連接中的 數據連接前置操作 和 創建數據連接進行操作。 |
詳見下圖: 創建集群時配置數據連接

