[發(fā)明專利]配置聊天機器人的方法、裝置、計算機設備和存儲介質有效
| 申請?zhí)枺?/td> | 201910676824.3 | 申請日: | 2019-07-25 |
| 公開(公告)號: | CN110569341B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設計)人: | 黃海杰 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06V30/14;G06V30/148;G06V10/82;G06V30/19;G06N3/0464;G06N3/08 |
| 代理公司: | 華進聯(lián)合專利商標代理有限公司 44224 | 代理人: | 黃晶晶 |
| 地址: | 518052 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 配置 聊天 機器人 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種配置聊天機器人的方法,所述方法包括:
獲取業(yè)務表格掃描圖,提取所述業(yè)務表格掃描圖中的表格特征信息,確定所述表格特征信息中的文字塊的字段類型,并根據所述字段類型識別需要進行字段填充的目標文字塊,根據所述需要進行字段填充的目標文字塊,建立各文字塊之間的關聯(lián)關系;
根據所述需要進行字段填充的目標文字塊查詢預設的數據類型配置表,確定與各目標文字塊對應的需填充字段的數據類型;
根據與各所述目標文字塊對應的需填充字段的數據類型、各文字塊之間的關聯(lián)關系以及預設的語句模板,生成各目標文字塊的業(yè)務片段語句;
根據所述表格特征信息中各目標文字塊的位置信息,確定與各目標文字塊對應的需填充字段的填寫順序;
根據與各目標文字塊對應的需填充字段的填寫順序,確定各目標文字塊的業(yè)務片段語句的業(yè)務流程順序;
根據所述業(yè)務流程順序,生成業(yè)務申請的場景流程信息;
根據所述場景流程信息以及各目標文字塊的業(yè)務片段語句進行模型訓練,配置聊天機器人。
2.根據權利要求1所述的方法,其特征在于,所述獲取業(yè)務表格掃描圖,提取所述業(yè)務表格掃描圖中的表格特征信息包括:
獲取業(yè)務表格掃描圖,對所述業(yè)務表格掃描圖進行預處理;
根據已訓練的目標檢測模型,得到預處理后的業(yè)務表格掃描圖中各文字塊的位置信息以及各文字符號的位置信息,所述目標檢測模型是以包括文字塊和文字符號的樣本圖片訓練得到;
根據各所述文字塊的位置信息以及各所述文字符號的位置信息,分割所述業(yè)務表格掃描圖,得到多個文字塊圖像以及文字符號圖像;
根據已訓練的圖片分類模型,提取各文字塊圖像以及各文字符號圖像中的文字塊以及文字符號,得到所述業(yè)務表格掃描圖中的表格特征信息,所述圖片分類模型是以包括文字塊和文字符號的樣本圖片訓練得到。
3.根據權利要求1所述的方法,其特征在于,所述確定所述表格特征信息中的文字塊的字段類型包括:
將所述表格特征信息中各文字塊輸入已訓練的分類模型,得到各文字塊歸屬于各預設的字段類型的置信度;
根據所述表格特征信息中各文字塊的位置信息以及各文字符號的位置信息,確定各文字塊與各文字符號之間的坐標距離;
將與各文字塊的坐標距離在預設的距離閾值范圍內的各文字符號作為與各文字塊關聯(lián)的文字符號;
根據各文字塊與各文字符號的關聯(lián)情況,修正各文字塊歸屬于各預設的字段類型的置信度;
將各文字塊歸屬于各預設的字段類型的置信度進行排序,并將置信度最高的字段類型,作為各文字塊的字段類型。
4.根據權利要求1所述的方法,其特征在于,所述字段類型包括需填字段、選項字段以及注釋字段,所述根據所述字段類型識別需要進行字段填充的目標文字塊,根據所述需要進行字段填充的目標文字塊,建立各文字塊之間的關聯(lián)關系包括:
根據各所述文字塊的字段類型,確定字段類型為需填字段的文字塊為需要進行字段填充的目標文字塊;
根據所述表格特征信息中各文字塊的位置信息,確定各目標文字塊與各選項字段文字塊以及各注釋字段文字塊之間的距離;
根據各目標文字塊與各選項字段文字塊以及各注釋字段文字塊之間的距離,確定與各目標文字塊對應的選項字段文字塊以及注釋字段文字塊;
建立各目標文字塊與對應的選項字段文字塊以及注釋字段文字塊之間的關聯(lián)關系。
5.根據權利要求1所述的方法,其特征在于,所述根據所述場景流程信息以及各目標文字塊的業(yè)務片段語句進行模型訓練,配置聊天機器人包括:
將各目標文字塊的業(yè)務片段語句作為第一訓練集輸入初始自然語言理解模型進行模型訓練,得到自然語言理解模型,所述自然語言理解模型用于根據用戶語句判斷用戶意圖并抓取實體信息;
將所述場景流程信息作為第二訓練集輸入初始對話管理模型進行模型訓練,得到對話管理模型,所述對話管理模型用于根據所述用戶語句以及所述用戶意圖確定回復語句;
根據所述自然語言理解模型以及所述對話管理模型,配置聊天機器人。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910676824.3/1.html,轉載請聲明來源鉆瓜專利網。





