[發明專利]一種互聯對象的檢索方法及系統在審
| 申請號: | 201910378932.2 | 申請日: | 2019-05-08 |
| 公開(公告)號: | CN110110333A | 公開(公告)日: | 2019-08-09 |
| 發明(設計)人: | 湯奇峰;龍文明 | 申請(專利權)人: | 上海數據交易中心有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06Q30/06 |
| 代理公司: | 上海翰信知識產權代理事務所(普通合伙) 31270 | 代理人: | 張維東 |
| 地址: | 200436 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 互聯 檢索 關鍵要素 相關度 分詞 排序 主體標識 集合 關鍵詞匹配 相似度匹配 倒排索引 檢索結果 接收輸入 權重 匹配 | ||
1.一種互聯對象的檢索方法,其特征在于,所述互聯對象具有至少一個關鍵要素,包括:
數據準備,建立領域詞庫數據庫、倒排索引庫數據庫以及互聯對象數據庫;
接收輸入的檢索描述,并將所述檢索描述拆分為多個分詞;
將多個所述分詞及所述倒排索引庫中的倒排關鍵詞進行相似度匹配,獲取與多個所述分詞相似的互聯對象的主體標識集合;
根據所述主體標識集合獲取所述與多個所述分詞相似的互聯對象的所有倒排關鍵詞,其中所述倒排關鍵詞對應于所述關鍵要素,由多個所述分詞與所有倒排關鍵詞匹配計算得到所有倒排關鍵詞對應的關鍵要素的相關值,根據所述關鍵要素的相關值和關鍵要素對應的權重值計算得到所述關鍵要素的相關度分值;
各互聯對象的相關度分值根據其對應的關鍵要素的相關度分值得到,各互聯對象的綜合排序分值根據各互聯對象的相關度分值得到;
根據所述綜合排序分值對與所述檢索描述匹配的互聯對象進行排序以得到檢索結果。
2.如權利要求1所述的互聯對象的檢索方法,其特征在于,所述互聯對象數據庫包括互聯對象;所述領域詞庫數據庫包括分詞詞庫以及分詞向量庫;所述倒排索引庫包括倒排關鍵詞庫以及倒排關鍵詞向量庫,所述倒排關鍵詞庫中包括倒排關鍵詞、倒排關鍵詞對應的互聯對象以及倒排關鍵詞對應的互聯對象的關鍵要素。
3.如權利要求2所述的互聯對象的檢索方法,其特征在于,相似度匹配包括以下步驟:通過分詞及倒排關鍵詞得到分詞向量及倒排關鍵詞向量,并輪詢計算所述分詞向量與所述倒排關鍵詞向量的余弦值,根據預設余弦閾值得到所述與多個所述分詞相似的互聯對象的主體標識集合。
4.如權利要求2所述的互聯對象的檢索方法,其特征在于,計算所述關鍵要素的相關值包括以下步驟:
通過分詞及倒排關鍵詞得到分詞向量及倒排關鍵詞向量,并輪詢計算各分詞向量與各倒排關鍵詞向量的余弦值,根據預設余弦閾值篩選余弦值;
將篩選后的余弦值對應于倒排關鍵詞對應的關鍵要素,取所述關鍵要素對應的所有余弦值的最大值或平均值為所述關鍵要素的相關值。
5.如權利要求1所述的互聯對象的檢索方法,其特征在于,計算各關鍵要素的相關度分值包括以下步驟:關鍵要素的相關值與關鍵要素對應的權重值的乘積為關鍵要素的相關度分值。
6.如權利要求1所述的互聯對象的檢索方法,其特征在于,計算各互聯對象的相關度分值包括以下步驟:取互聯對象對應的所有關鍵要素的相關度分值的總和或所有關鍵要素的相關度分值的平均值為互聯對象的相關度分值。
7.如權利要求1所述的互聯對象的檢索方法,其特征在于,所述互聯對象的檢索方法還包括以下步驟:計算各互聯對象的重要度分值,所述互聯對象包括至少一個重要因子,互聯對象的重要度分值的計算方式如下:對各重要因子的重要分值進行求和。
8.如權利要求7所述的互聯對象的檢索方法,其特征在于,通過各互聯對象的相關度分值和重要度分值得到各互聯對象的綜合排序分值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海數據交易中心有限公司,未經上海數據交易中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910378932.2/1.html,轉載請聲明來源鉆瓜專利網。





