[發明專利]一種信息查詢的方法、裝置、計算機存儲介質及終端在審
| 申請號: | 201811487640.4 | 申請日: | 2018-12-06 |
| 公開(公告)號: | CN109753517A | 公開(公告)日: | 2019-05-14 |
| 發明(設計)人: | 牟小峰 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F16/2455 | 分類號: | G06F16/2455 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 王康;栗若木 |
| 地址: | 102218 北京市昌平區東小*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 查詢詞 結構化數據 實體類型 計算機存儲介質 信息查詢 終端 查詢效率 信息搜索 字符串 檢索 搜索 | ||
一種信息查詢的方法、裝置、計算機存儲介質及終端,包括:確定與查詢詞所屬實體類型相同的結構化數據;根據查詢詞,從與查詢詞所屬實體類型相同的結構化數據中進行信息搜索。本發明實施例根據實體類型,縮小了查詢詞在結構化數據中的搜索范圍;進一步的,根據字符串進行檢索,提升了查詢效率。
技術領域
本文涉及但不限于數據處理技術,尤指一種信息查詢的方法、裝置、計算機存儲介質及終端。
背景技術
在企業搜索中,待處理的數據包括結構化數據和非結構化數據。一般而言,用戶的結構化數據以表的形式存在,表的種類可以包括本領域技術人員公知的Excel、Mysql、Oracle、Access、Hbase等。在索引構造時,1個表對應1個索引,表的字段名對應索引中的相應的字段名。在結構化數據的搜索中,典型的搜索使用場景是:用戶在輸入框中輸入查詢詞,系統將所有數據類型相同的字段都作為匹配字段,并把匹配結果返回給用戶。由于數據類型相同的字段數量往往多達成百上千個,導致查詢匹配的效率很低,影響了搜索速度。
發明內容
以下是對本文詳細描述的主題的概述。本概述并非是為了限制權利要求的保護范圍。
本發明實施例提供一種信息查詢的方法、裝置、計算機存儲介質及終端,能夠提升信息查詢效率。
本發明實施例提供了一種信息查詢的方法,包括:
確定與查詢詞所屬實體類型相同的結構化數據;
根據查詢詞,從與查詢詞所屬實體類型相同的結構化數據中進行信息搜索。
可選的,所述確定與查詢詞所屬實體類型相同的結構化數據包括:
通過預設的分析模型,確定所述結構化數據中包含的每一個表的字段名和所述查詢詞的所屬實體類型;
其中,所述實體類型包括以下一種或一種以上類型:人名、地名、機構名、日期時間、身份證號、車牌號、即時通信客戶端賬號、銀行卡號、護照號、郵箱號、手機號。
可選的,所述分析模型包括以下一種或一種以上模型:
專家規則模型、統計模型。
可選的,所述從與查詢詞所屬實體類型相同的結構化數據中進行信息搜索之前,所述方法還包括:
提取結構化數據中,每張表的每條記錄的所有字段值,并在每個字段值的首尾分別添加預設的首尾標識;
將添加首尾標識后的字段值轉換為預設格式的字符串;
根據轉換獲得的字符串建立索引;
其中,所述索引的關鍵字為各字段值對應的字符串;所述索引的索引值包括以下部分或全部內容:字段名、表名。
可選的,所述從與查詢詞所屬實體類型相同的結構化數據中進行信息搜索包括:
將所述查詢詞轉換為所述預設格式的字符串;
根據查詢詞轉換獲得的字符串,對建立的索引進行搜索,以獲得與所述查詢詞匹配的數據信息。
可選的,所述字符串包括N元字符串;
其中,N為大于等于2的整數。
另一方面,本發明實施例還提供一種信息查詢的裝置,包括:確定單元和搜索單元;其中,
確定單元用于:確定與查詢詞所屬實體類型相同的結構化數據;
搜索單元用于:根據查詢詞,從與查詢詞所屬實體類型相同的結構化數據中進行信息搜索。
可選的,所述確定單元用于:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811487640.4/2.html,轉載請聲明來源鉆瓜專利網。





