[發明專利]一種基于分詞檢索交互的方式在審
| 申請號: | 201810617412.8 | 申請日: | 2018-06-15 |
| 公開(公告)號: | CN108846094A | 公開(公告)日: | 2018-11-20 |
| 發明(設計)人: | 何中;湯海泉;嚴偉;戴建峰;顧永新;王斌;何登;巢振軍 | 申請(專利權)人: | 江蘇中威科技軟件系統有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 226000 江蘇省南通*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分詞 詞組 檢索 智能分詞 文本 粘貼 復制 塊狀方式 文本數據 業務系統 自由拖拽 組合詞組 文本框 拖拽 選中 展示 | ||
本發明公開了一種基于分詞檢索交互的方式,包括以下步驟:A、選擇文本并復制,粘貼進系統,系統將自動進行智能分詞,分詞后將詞組以塊狀方式進行展示;B、塊狀分詞支持選中,點擊后將分詞帶入上方的文本框,再次點擊選中的分詞,則取消選擇;C、進行檢索交互,本發明可對一段文本進行智能分詞,復制粘貼文本數據后會自動對文本進行分詞,分詞后的詞組以塊狀顯示出來,用戶可自由拖拽組合詞組,單個詞組或組合的詞組可作為關鍵詞進行檢索,只需要將關鍵詞拖拽到業務系統上,便可自動進行檢索以及嘗試,方便快捷。
技術領域
本發明涉及檢索技術領域,具體為一種基于分詞檢索交互的方式。
背景技術
檢索是一種漢語詞匯,指從用戶特定的信息需求出發,對特定的信息集合采用一定的方法、技術手段,根據一定的線索與規則從中找出相關信息;在網絡時代,我們無時無刻地進行著檢索。在因特網上進行檢索主要有兩種方式:目錄瀏覽和使用搜索引擎;目錄瀏覽的方式即雅虎搜索引擎采用的方式,用戶可以根據自己的需要點擊目錄,深入下一層子目錄,從而找到自己需要的信息。這種方式便于查找某一類的信息集合,但是精確定位的能力不強;搜索引擎是目前最為常用的一種網絡檢索工具。用戶只需要提交自己的需求,搜索引擎就能返回大量結果。這些結果按照和檢索提問的相關性進行排序。
目前檢索交互的方式大多是通過手動輸入文字的方式進行檢索,比如谷歌、百度等搜索引擎,我們通過鍵盤輸入等方式,來進行檢索,多了手動輸入的環節。并且如果需要跨系統的進行檢索,需要在多個系統進行重復輸入,比較繁瑣。
發明內容
本發明的目的在于提供一種基于分詞檢索交互的方式,以解決上述背景技術中提出的問題。
為實現上述目的,本發明提供如下技術方案:一種基于分詞檢索交互的方式,包括以下步驟:
A、選擇文本并復制,粘貼進系統,系統將自動進行智能分詞,分詞后將詞組以塊狀方式進行展示;
B、塊狀分詞支持選中,點擊后將分詞帶入上方的文本框,再次點擊選中的分詞,則取消選擇;
C、進行檢索交互,拖拽檢索后,將檢索后的結果直接展示。
優選的,所述步驟A中智能分詞方法如下:
a、獲取待分詞文本的特征信息,其中,所述特征信息包括段落劃分、標點符號或空格符中至少之一;
b、根據所述特征信息,確定所述待分詞文本中的所有自然區間;
c、將自然區間劃分為歧義區間和非歧義區間;
d、確定歧義區間中的候選詞,并將候選詞與非歧義區間中的文本進行匹配;
e、根據匹配結果確定候選詞的分詞規則,并按照分詞規則對歧義區間的文本進行分詞處理。
優選的,所述步驟C中檢索交互包括單個分詞拖拽檢索;文本框多個分詞,組合一起檢索;多選組合進行檢索。
優選的,所述步驟d中文本匹配方法如下:
1)、將被測文本中的字符進行獨立分割,得到分割后的字符串;
2)、將分割后的字符串中的字符分別與倒排字庫中的關鍵字符進行匹配;所述倒排字庫是對輸入的關鍵字進行逐字符分解并記錄每個關鍵字符在所述關鍵字中的位置信息后形成的;
3)、按照設定的模糊度確定規則,確定匹配成功的每個關鍵字中關鍵字符匹配時用到的模糊度值,得到每個關鍵字的匹配模糊度;
4)、根據每個關鍵字的匹配模糊度,確定輸入的關鍵字的平均模糊度,根據所述平均模糊度確定所述被測文本是否符合過濾條件。
優選的,所述步驟e中的分詞處理方法如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇中威科技軟件系統有限公司,未經江蘇中威科技軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810617412.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:支持多用戶操作的業務處理方法及系統
- 下一篇:一種數據處理方法及裝置





