[發明專利]一種基于擴展布爾檢索模型的大數據專利檢索方法在審
| 申請號: | 201710856763.X | 申請日: | 2017-09-21 |
| 公開(公告)號: | CN107609142A | 公開(公告)日: | 2018-01-19 |
| 發明(設計)人: | 盛時永 | 申請(專利權)人: | 合肥集知網知識產權運營有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 230088 安徽省合肥市高*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 擴展 布爾 檢索 模型 數據 專利 方法 | ||
1.一種基于擴展布爾檢索模型的大數據專利檢索方法,其特征在于,所述方法包括如下步驟:
步驟S1:將用戶的檢索提問轉化成廣義析取提問式和廣義合取提問式;
步驟S2:計算出檢索詞Ki在專利文檔dj中的權重;
步驟S3:對專利文檔dj分別計算出其與廣義析取提問式和廣義合取提問式的相似度;
步驟S4:遍歷專利數據庫中的文檔,計算出擴展布爾檢索模型最匹配的前N個專利文檔,并組成集合D;
步驟S5:對集合D中的專利文檔進行排序,輸出給用戶;
步驟S6:用戶根據呈現的結果,選擇所需專利,或者添加或重新輸入專利檢索詞并且調整各檢索詞的權重,進行二次檢索過濾。
2.根據權利要求1所述的一種基于擴展布爾檢索模型的大數據專利檢索方法,其特征在于,所述步驟S1中廣義析取提問式和廣義合取提問式計算公式如下:
qor=k1∨pk2∨p……∨pkt
qand=k1∧pk2∧p……∧pkt
其中,qor代表廣義析取提問式,qand代表廣義合取提問式,ki為用戶檢索詞,t為檢索詞個數,p∈[0,+∞]。
3.根據權利要求1所述的一種基于擴展布爾檢索模型的大數據專利檢索方法,其特征在于,所述步驟S2中權重記為wij,wij由兩種權值決定,分別是局部權值和全局權值。
4.根據權利要求1所述的一種基于擴展布爾檢索模型的大數據專利檢索方法,其特征在于,所述步驟S3中,qor和qand與dj的相似度計算公式如下:
其中,
5.根據權利要求1所述的一種基于擴展布爾檢索模型的大數據專利檢索方法,其特征在于,所述步驟S4中,定義SUM(q,dj)=SIM(qor,dj)+SIM(qand,dj),遍歷專利數據庫中的文檔,計算出SUM(q,dj)最大的前N個專利文檔,組成集合記為D。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥集知網知識產權運營有限公司,未經合肥集知網知識產權運營有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710856763.X/1.html,轉載請聲明來源鉆瓜專利網。





