[發明專利]一種基于分詞檢索交互的方式在審
| 申請號: | 201810617412.8 | 申請日: | 2018-06-15 |
| 公開(公告)號: | CN108846094A | 公開(公告)日: | 2018-11-20 |
| 發明(設計)人: | 何中;湯海泉;嚴偉;戴建峰;顧永新;王斌;何登;巢振軍 | 申請(專利權)人: | 江蘇中威科技軟件系統有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 226000 江蘇省南通*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分詞 詞組 檢索 智能分詞 文本 粘貼 復制 塊狀方式 文本數據 業務系統 自由拖拽 組合詞組 文本框 拖拽 選中 展示 | ||
1.一種基于分詞檢索交互的方式,其特征在于;包括以下步驟;
A、選擇文本并復制,粘貼進系統,系統將自動進行智能分詞,分詞后將詞組以塊狀方式進行展示;
B、塊狀分詞支持選中,點擊后將分詞帶入上方的文本框,再次點擊選中的分詞,則取消選擇;
C、進行檢索交互,拖拽檢索后,將檢索后的結果直接展示。
2.根據權利要求1所述的一種基于分詞檢索交互的方式,其特征在于;所述步驟A中智能分詞方法如下;
a、獲取待分詞文本的特征信息,其中,所述特征信息包括段落劃分、標點符號或空格符中至少之一;
b、根據所述特征信息,確定所述待分詞文本中的所有自然區間;
c、將自然區間劃分為歧義區間和非歧義區間;
d、確定歧義區間中的候選詞,并將候選詞與非歧義區間中的文本進行匹配;
e、根據匹配結果確定候選詞的分詞規則,并按照分詞規則對歧義區間的文本進行分詞處理。
3.根據權利要求1所述的一種基于分詞檢索交互的方式,其特征在于;所述步驟C中檢索交互包括單個分詞拖拽檢索;文本框多個分詞,組合一起檢索;多選組合進行檢索。
4.根據權利要求2所述的一種基于分詞檢索交互的方式,其特征在于;所述步驟d中文本匹配方法如下;
1)、將被測文本中的字符進行獨立分割,得到分割后的字符串;
2)、將分割后的字符串中的字符分別與倒排字庫中的關鍵字符進行匹配;所述倒排字庫是對輸入的關鍵字進行逐字符分解并記錄每個關鍵字符在所述關鍵字中的位置信息后形成的;
3)、按照設定的模糊度確定規則,確定匹配成功的每個關鍵字中關鍵字符匹配時用到的模糊度值,得到每個關鍵字的匹配模糊度;
4)、根據每個關鍵字的匹配模糊度,確定輸入的關鍵字的平均模糊度,根據所述平均模糊度確定所述被測文本是否符合過濾條件。
5.根據權利要求2所述的一種基于分詞檢索交互的方式,其特征在于;所述步驟e中的分詞處理方法如下;
a)、獲取待分詞語句中各單字對應的第一特征向量及兩字對應的第二特征向量;
b)、根據所述第一特征向量及第二特征向量,確定各單字當前的第三特征向量;
c)、根據預設的漢字標簽轉移矩陣及所述各單字當前的第三特征向量,將所述待分詞語句進行分詞處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇中威科技軟件系統有限公司,未經江蘇中威科技軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810617412.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:支持多用戶操作的業務處理方法及系統
- 下一篇:一種數據處理方法及裝置





