[發明專利]一種基于關鍵詞的評審專家智能檢索與推薦方法有效
| 申請號: | 201310511342.5 | 申請日: | 2013-10-24 |
| 公開(公告)號: | CN103605665B | 公開(公告)日: | 2017-01-11 |
| 發明(設計)人: | 徐小良;吳仁克;鄭楊;潘翔 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙)33240 | 代理人: | 杜軍 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 關鍵詞 評審 專家 智能 檢索 推薦 方法 | ||
1.一種基于關鍵詞的評審專家智能檢索與推薦方法,其特征在于該方法的具體步驟是:?
步驟1.從科技項目申報管理系統后臺數據庫中收集評審專家信息;?
步驟2.把評審專家信息中的通用詞和慣用詞作為專業停用詞庫;把標點符號、非漢字作為切分標記庫;?
步驟3.對評審專家信息進行分詞:首先根據評審專家信息中切分標記抽取專家信息,獲獎情況、發明情況、發表論文情況、課題承擔過的項目及完成情況、研究方向;切分成子串序列,一個子串序列即一個字段信息;利用中科院ICTCLAS對子串序列進行分詞;?
步驟4.根據通用停用詞庫和專業停用詞庫進行停用詞過濾,提取每個專家的特征詞集合,所述的通用停用詞庫采用哈工大停用詞表;?
步驟5.構建專家知識表示模型:利用專家信息的“半結構化”特征,對空間向量模型和物元知識集模型的擴展,建立知識表示模型TM=(id,F,WF,T,V),其中,id表示在專家庫中的標識字段;F表示評審專家中字段類別集合;WF為字段的權重集合,定義wf為字段權重集合的元素;T為特征詞語集合;V表示字段所對應的特征詞語及其權重集合,Vi={vi1,f(vi1),vi2,f(vi2),...,vin,f(vin)},vij表示第i個字段中的第j個特征詞語,f(vij)表示vij特征詞語在所對應的字段內的出現頻率權重,計算公式如下:?
根據知識表示模型的定義,評審專家信息的知識表示為:?
步驟6.索引庫構建專家知識表示模型構建完成后,將專家信息索引入庫:從基礎項目庫中讀取評審專家的內容項信息;根據步驟4提取出的專家信息特征詞;依據步驟5的知識表示模型并利用Apache?Lucene對信息建立索引;將建立好的索引按所屬類別加至對應的索引庫中,直到所有的評審專家索引入庫;?
步驟7.當用戶輸入關鍵詞語素時,從關鍵詞庫中智能聯想地自動提示關鍵詞供用戶選擇,用戶也可不選擇自動提示關鍵詞,而是繼續輸入自己的關鍵詞語素,同時利用關鍵詞統計器實時更新關鍵詞詞庫;?
步驟8.計算關鍵詞和專家信息間的檢索相關度:檢索相關度的求解轉化為關鍵詞與專家信息特征詞語的語義相似度和語素相似度的加權和的計算,綜合相關度的計算公式如下:?
其中,表示專家信息;?
歸一化上述綜合相關度計算公式,檢索相關度的計算公式如下:?
Sim(K,D)i=SimComplex(K,D)i/SimComplex(K,D)max
其中,SimComplex(K,D)i表示關鍵詞K與第i個專家信息的檢索相關度,SimComplex(K,D)max表示關鍵詞K與所有專家信息的最大檢索相關度;?
步驟9.A.對檢索到的專家信息進行排序,同時將專家被檢索次數記錄更新,以便推薦基于用戶訪問行為的熱門專家資源;B.選擇不同字段或全字段方式查看專家信息:(1)當用戶選擇單一字段查看時,這一字段信息與關鍵詞具有較強語義性相關的專家被篩選出,語義相關性較弱的不加入檢索結果專家列表;檢索結果按檢索相關度從高到低排序輸出;(2)當用戶選擇全字段查看時,檢索結果直接按檢索相關度從高到低排序輸出。?
步驟10.將每個專家信息中的所有匹配成功的詞語分別高亮標注,便于用戶的對專家信息的詳細查看。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310511342.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種環境可控的薄液膜厚度自動測量裝置
- 下一篇:帶散熱裝置的冷藏柜





