產品定義
更新時間 2025-04-08 16:09:24
最近更新時間: 2025-04-08 16:09:24
分享文章
本節介紹天翼云印刷文字識別(OCR)產品定義。
什么是印刷文字識別
印刷文字識別(OCR,Optical Character Recognition)是一種技術,能夠檢測圖片中的印刷文字。OCR服務以開放API的方式提供給用戶,用戶可以使用編程語言如Python和Java調用OCR服務API,將圖片轉換為文字,進而實現自動化關鍵數據的采集,提升業務效率。API詳情請參考《API參考》。
使用前必讀
在使用OCR服務前,用戶需具備編程和語言熟練程度,如Java、Python。
OCR服務通過API接口,將圖片中的文字識別成可編輯文本,并以JSON格式返回識別結果。用戶需編碼將識別結果與業務系統進行對接,或將結果保存為TXT、Excel等格式。
OCR服務面向企業用戶,提供以下能力
- 通用型的OCR
通用型OCR支持網絡圖片上印刷體文字的自動化識別,以實現圖片文字的提取,不支持手寫體文字的識別,不支持數學公式等符號識別。
- 證件類的OCR
證件類OCR支持身份證、營業執照等證件圖片上有效信息的自動識別和關鍵字段結構化提取。
- 行業類的OCR
行業類OCR支持多種行業特定圖片的結構化信息提取和識別,如車牌、行駛證、駕駛證等,進一步幫助企業實現自動化效率提升。