[發明專利]基于關鍵詞提取的新技術查詢推薦方法在審
| 申請號: | 202011048900.5 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112307302A | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 鄭鑫;于德尚;張旭;侯永紅;高經緯;江秀財 | 申請(專利權)人: | 青島檬豆網絡科技有限公司 |
| 主分類號: | G06F16/9532 | 分類號: | G06F16/9532;G06F16/332;G06F40/216;G06F40/289 |
| 代理公司: | 武漢聚信匯智知識產權代理有限公司 42258 | 代理人: | 沙莎 |
| 地址: | 266000 山東省青*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 關鍵詞 提取 新技術 查詢 推薦 方法 | ||
1.基于關鍵詞提取的新技術查詢推薦方法,其特征在于,包括如下步驟:
(1)準備階段:新技術數據模型的準備;包括:
步驟1.1:對數據庫中新技術和用戶持續錄入的新技術的標題和成果簡介,分別提取關鍵詞匯句子;
步驟1.2:對新技術標題和成果簡介的關鍵詞匯句子,分別提取關鍵詞;
步驟1.3:統計新技術的關鍵詞和對應詞頻;
步驟1.4:根據詞頻由高到低排序,確定最終提取前KT個新技術關鍵詞和對應詞頻;
(2)運用階段:根據技術需求匹配推薦新技術;
步驟2.1:根據用戶當次輸入的技術需求,對技術需求的標題和需求簡介,提取關鍵詞匯句子;
步驟2.2:對技術需求的標題和需求簡介的關鍵詞匯句子,分別提取關鍵詞;
步驟2.3:統計技術需求的關鍵詞和對應詞頻;
步驟2.4:根據詞頻由高到低排序,確定最終提取前KD個技術需求關鍵詞和對應詞頻;
步驟2.5:計算技術需求與新技術之間基于關鍵詞的匹配度FW;
步驟2.6:計算技術需求與新技術之間的匹配度不為0的新技術,與技術需求之間基于關鍵詞的匹配率FR;
步驟2.7:根據用戶的技術需求,按照FW進行由高到低排序以及FR進行由高到低排序;根據排序結果,為用戶推薦新技術。
2.如權利要求1所述的基于關鍵詞提取的新技術查詢推薦方法,其特征在于,針對(1)準備階段:對新錄入的新技術,需要經過準備階段的步驟提取關鍵詞,并將其和新技術同時存儲在數據庫中,為后面的計算提供依據;對已經存在數據庫的新技術和關鍵詞信息,則無需每次經過以上步驟進行重復計算,只需要在詞庫發生變化時,定期進行更新即可。
3.如權利要求1所述的基于關鍵詞提取的新技術查詢推薦方法,其特征在于,所述步驟1.1:提取關鍵詞匯句子,具體方法包括:利用結巴分詞的分詞模塊函數,基于基本詞庫、停用詞庫,對新技術進行分詞,保留部分詞性的詞語,作為下一步新技術的描述;保留的詞性包括名詞、動名詞、英語、語素詞;對于去掉的詞性,具有可提取的意義時,采用兩種方式對詞庫進行修改補充:(1)修改詞性:對詞語在詞庫中的詞性,進行修改,定義詞性為vnmd,作為專屬提取詞語;(2)添加詞性:對于新技術各個領域的專有名詞,添加到新建詞性為mnmd的詞性庫中,對應詞頻設置為當前基本詞庫中的最大詞頻+1;步驟2.1的提取關鍵詞匯句子的方法與步驟1.1的方法相同。
4.如權利要求1所述的基于關鍵詞提取的新技術查詢推薦方法,其特征在于,所述步驟1.2:對新技術標題和成果簡介的關鍵詞匯句子,提取關鍵詞,具體方法包括:利用結巴分詞的分詞模型函數,增加專屬名詞庫、停用詞庫,對步驟1.1提取的關鍵詞匯句子進行分詞,積累新技術在各個領域當中的專屬名詞或術語,對基本詞庫或專屬名詞庫進行補充;對于停用詞庫的補充,只對步驟1.2的停用詞庫進行補充;對于步驟1.1中未篩選成功的詞語,添加到停用詞庫中,對這部分詞語不添加在成功分詞的詞語當中;步驟2.2的對技術需求標題和需求簡介的關鍵詞匯句子,提取關鍵詞的方法與步驟1.2的方法相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島檬豆網絡科技有限公司,未經青島檬豆網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011048900.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電機連接器旋轉結構
- 下一篇:取料頂升回流線





