[發明專利]一種協同式人機混合智能識別方法在審
| 申請號: | 201610343201.0 | 申請日: | 2016-05-23 |
| 公開(公告)號: | CN107423656A | 公開(公告)日: | 2017-12-01 |
| 發明(設計)人: | 袁雪寧;何銘 | 申請(專利權)人: | 何銘 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 南京天華專利代理有限責任公司32218 | 代理人: | 夏平 |
| 地址: | 215612 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 協同 人機 混合 智能 識別 方法 | ||
技術領域
本發明涉及到智能技術和IT技術,具體涉及到一種可將機器識別能力與人工識別能力以系統自動化、標準化的方式協作結合,使智能識別可以同時利用機器識別的快速、低成本、可靠性與人工識別在認知、聯想、分析、辨識上的高效和廣譜適用性的IT技術與方法。
背景技術
所謂的智能識別是按照識別需求,根據一定的模式、模型、方法,將輸入數據中所要求的特征內容提取出來,并把特征內容轉換為目標格式輸出。一般常見的智能識別包括語音識別(Speech To Text,將語音人聲內容轉為文字文本)、圖文識別(Image To Text,將圖像中需要的文字內容轉為文字文檔)、人臉識別(Face Recognition,將影像或視頻中的人臉面部進行比對甄別)等。
業內人士都知道,傳統的智能識別依靠單一的機器智能識別,因為機器識別的原理性障礙是機器不能自主認知識別結果的有效性,機器智能缺失自主認知和自我感知能力,無法控制識別質量,當遇到較少訓練學習的邊緣數據或應用領域時會出現顯著的質量波動。例如語音識別中,當出現沒有充分訓練過的方言或口語表達時,機器不能識別出有意義的結果;在圖文識別中,如果一張表單的掃描或拍攝角度偏離正常較大,機器也不能識別出正確的文字內容。現階段機器智能識別的局限性,導致任何一個識別的應用都需要進行針對性的技術優化改進和大量數據的訓練學習,使得智能識別不能快速的進入新領域、無法廣譜適用的解決識別問題,極大限制約束了智能識別的應用領域、應用深度和應用范圍。
發明內容
本發明所要解決的技術問題是:提供一種以流程為驅動中心、以作業為信息媒介、把機器識別與人工識別這兩者用實時協作的方式鉚合在一起、兼具利用機器智能識別的速度、成本、可靠性優勢與人工識別的認知、聯想、分析、辨識優勢、并同時兼顧避免了機器智能識別的質量控制、廣譜適用性的缺陷與人工識別的易疲勞、易手誤、情緒化波動的弱點的協同式人機混合智能識別方法。
為解決上述問題,本發明采用了一種協同式人機混合智能識別方法,其步驟為:
1)采集:
采集由兩個子步驟構成:第一步從設備端、用戶端或系統服務接口上采集或接收需要處理的識別數據,并將該識別數據整理成輸入數據傳輸給后端識別處理系統;第二步是在后端識別處理系統上,把第一步傳輸過來的輸入數據格式化和/或重新采樣轉換為標準化的格式數據,并依據該格式數據以及數據源的特性或需求生成標準的作業信息模型;
2)機器分類:
機器分類是識別引擎系統對識別作業中包含的識別數據和識別要求選項進行分析,以確定后續識別處理中的機器切片參數、機器預識別參數、邊界檢測閾值、規則檢測項和規則檢測閾值、采樣監測的樣本數量及參數、合并輸出的參數和交付格式;
3)機器切片:
機器切片是識別引擎系統根據切片參數對識別作業中的識別數據進行切分,把大塊或長時間的識別數據切割為多個小的、短時間的分段數據(Sect),以便于后續流程可以分段并行處理,加快整體處理效率,降低識別處理復雜度;
機器切片在切割時根據切片參數和切割模型,會進行邊界處理。邊界就是指切分下來的分段數據的邊界,邊界用于在后續的邊界檢測環節中對切分正確性進行校驗,可以發現因為數據異常或切割模型不完全匹配導致的切割錯誤;
4)機器預識別:
機器預識別是根據預識別參數的設定,對識別作業中的分段識別數據進行首道識別處理,為后續的邊界檢測和規則檢測提供數據支持和分析依據;
5)邊界檢測:
邊界檢測根據邊界參數的設定,對機器預識別處理過的分段數據識別結果的邊界進行分析評估,計算出邊界指數(Border Instruction),根據邊界指數與設定閾值的對比,決定后續流程的分支走向;
6)規則檢測:
規則檢測是使用預設的業務和邏輯規則,根據預設的參數,對機器預識別的結果進行規則校驗,規則校驗用于檢測識別結果是否存在嚴重的分類和模板匹配問題;
7)機器識別;
機器識別是以并行計算處理的方式,對剩余未識別的分段數據進行識別處理。機器識別對每一個分段數據進行識別,并輸出對應該分段數據的識別輸出;
8)抽樣檢測:
抽樣檢測是對機器識別的所有識別輸出進行抽樣的規則檢測;
9)合并輸出:
合并輸出是對所有識別輸出數據,按照輸出參數的設定,將識別輸出結果合并整理為完整的輸出結果,并按照用戶需求設定轉換為目標文檔或數據格式;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于何銘,未經何銘許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610343201.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種QR碼圖像定位方法
- 下一篇:指紋辨識封裝單元及其制造方法





