操作場景
云搜(sou)索服(fu)務(CloudSearch Service)為用(yong)戶提供結構(gou)化、非結構(gou)化文本的多條件檢索、統計、報(bao)表,本章(zhang)節介紹如(ru)何(he)通過CDM將數(shu)據從(cong)Oracle遷移到云搜(sou)索服(fu)務中,流程如(ru)下:
1.創建CDM集群(qun)并綁定(ding)EIP
2.創(chuang)建云搜索服(fu)務連接
3.創建Oracle連接(jie)
4.創建遷移作業
前提條件
- 已經開通了云搜索服務,且獲取云搜索服務集群的IP地址和端口。
- 已獲取Oracle數據庫的IP、數據庫名、用戶名和密碼。
- 如果Oracle數據庫是在本地數據中心或第三方云上,需要確保Oracle可通過公網IP訪問,或者已經建立好了企業內部數據中心到的VPN通道或專線。
- 用戶已參考管理驅動,上傳了Oracle數據庫驅動。
創建CDM集群并綁定EIP
1.參考創建CDM集群,創建CDM集群。
關鍵配置如下:
- CDM集群的規格,按待遷移的數據量選擇,一般選擇cdm.medium即可,滿足大部分遷移場景。
- CDM集群的VPC必須和云搜索服務集群所在VPC一致,且推薦子網、安全組也與云搜索服務一致。
- 如果安全控制原因不能使用相同子網和安全組,那么需要確保安全組規則能允許CDM訪問云搜索服務集群。
2.CDM集群創建(jian)完(wan)成后,在集群管理界面(mian)選擇“綁(bang)定彈性IP”,CDM通過EIP訪問Oracle數據源(yuan)。
說明如果用戶對本地數據源(yuan)的訪問通道做了SSL加密(mi),則CDM無法通過(guo)彈性IP連接數據源(yuan)。
創建云搜索服務連接
1.單擊CDM集群后(hou)的(de)“作業管(guan)(guan)理(li)(li)”,進入作業管(guan)(guan)理(li)(li)界面(mian)(mian),再選(xuan)擇(ze)“連(lian)接(jie)管(guan)(guan)理(li)(li) > 新建連(lian)接(jie)”,進入選(xuan)擇(ze)連(lian)接(jie)器類型的(de)界面(mian)(mian)。
2.連接(jie)器(qi)類型選擇“云搜索服務”后單擊“下一步”,配(pei)置云搜索服務連接(jie)參(can)數。
- 名稱:用戶自定義連接名稱,例如“csslink”。
- Elasticsearch服務器列表:配置為云搜索服務集群(支持5.X以上版本)的連接地址、端口,格式為“ip:port”,多個地址之間使用分號(;)分隔,例如192.168.0.1:9200;192.168.0.2:9200。
- 用戶名、密碼:配置為訪問云搜索服務集群的用戶,需要擁有數據庫的讀寫權限。
3.單擊“保存”回到連接管理界面。
創建Oracle連接
1.單擊CDM集群(qun)后的(de)(de)“作業管(guan)(guan)理(li)”,進(jin)入作業管(guan)(guan)理(li)界(jie)面,再選擇“連接管(guan)(guan)理(li) > 新建連接”,進(jin)入選擇連接器(qi)類(lei)型的(de)(de)界(jie)面。
2.連接器類(lei)型選擇“Oracle”后單擊“下一步(bu)”,配置Oracle連接參(can)數:
- 名稱:用戶自定義連接名稱,例如“oracle_link”。
- 數據庫服務器地址、端口:配置為Oracle服務器的地址、端口。
- 數據庫名稱:選擇要導出數據的Oracle數據庫名稱。
- 用戶名、密碼:Oracle數據庫的登錄用戶名和密碼,該用戶需要擁有Oracle元數據的讀取權限。
3.單(dan)擊“保存(cun)”回到連(lian)接管理界面。
創建遷移作業
1.選擇“表/文(wen)件遷移(yi) > 新建作業”,開(kai)始創建從Oracle導出數據到云搜索(suo)服務的任務。
詳見下圖:創建Oracle到(dao)云搜索服務的(de)遷(qian)移任務

- 作業名稱:用戶自定義便于記憶、區分的任務名稱。
- 源端作業配置
?源連(lian)接名稱:選擇創(chuang)建Oracle連(lian)接中的“oracle_link”。
?模式或(huo)表(biao)空間:待遷移(yi)數據的數據庫名稱。
?表名(ming):待遷(qian)移數據的表名(ming)。
?高級屬性里的可選參數一般情況下保持默認既可,詳細說明請參見 配置常見關系數據庫源端參數。
- 目的端作業配置
?目的連接名(ming)稱:選擇創建(jian)云(yun)搜索服務(wu)連接中(zhong)的“csslink”。
?索(suo)(suo)引(yin):待寫入數(shu)據的Elasticsearch索(suo)(suo)引(yin),也(ye)可以輸入一個新的索(suo)(suo)引(yin),CDM會自動在云搜(sou)索(suo)(suo)服務(wu)中創(chuang)建(jian)。
?類(lei)(lei)型(xing):待寫入數據的Elasticsearch類(lei)(lei)型(xing),可輸入新的類(lei)(lei)型(xing),CDM支持在目的端自動創建類(lei)(lei)型(xing)。
?高級屬性里的可選參數一般情況下保持默認既可,詳細說明請參見配置云搜索服務目的端參數。
2.單擊(ji)“下一(yi)步”進入字段(duan)映射界(jie)面,CDM會(hui)自動匹配源和目的字段(duan),如下圖“云搜索(suo)服(fu)務的字段(duan)映射”所示。
- 如果字段映射順序不匹配,可通過拖拽字段調整。
- 如果選擇在目的端自動創建類型,這里還需要配置每個類型的字段類型、字段名稱。
- CDM支持遷移過程中轉換字段內容。

3.單(dan)擊(ji)“下一(yi)步”配置(zhi)任務參(can)數,一(yi)般情況下全部保持默認即(ji)可。
該步驟用戶可(ke)以(yi)配置如下可(ke)選功(gong)能:
- 作業失敗重試:如果作業執行失敗,可選擇是否自動重試,這里保持默認值“不重試”。
- 作業分組:選擇作業所屬的分組,默認分組為“DEFAULT”。在CDM“作業管理”界面,支持作業分組顯示、按組批量啟動作業、按分組導出作業等操作。
- 是否定時執行:如果需要配置作業定時自動執行,請參見 配置定時任務。這里保持默認值“否”。
- 抽取并發數:設置同時執行的抽取任務數。這里保持默認值“1”。
- 是否寫入臟數據:如果需要將作業執行過程中處理失敗的數據、或者被清洗過濾掉的數據寫入OBS中,以便后面查看,可通過該參數配置,寫入臟數據前需要先配置好OBS連接。這里保持默認值“否”即可,不記錄臟數據。
- 作業運行完是否刪除:這里保持默認值“不刪除”。
4.單(dan)擊“保存并運行(xing)”,回到作業(ye)(ye)管理界(jie)(jie)面(mian)(mian),在作業(ye)(ye)管理界(jie)(jie)面(mian)(mian)可查看(kan)作業(ye)(ye)執行(xing)進(jin)度和結果。
5.作業執行成功后,單擊作業操作列的“歷史(shi)記(ji)錄”,可查看該作業的歷史(shi)執行記(ji)錄、讀取(qu)和寫入的統計數(shu)據(ju)。
在歷(li)史記錄界(jie)面單(dan)擊“日志”,可查看作業的日志信息。