[發(fā)明專利]一種面向科技項(xiàng)目的評審專家智能推薦方法有效
| 申請?zhí)枺?/td> | 201310509358.2 | 申請日: | 2013-10-24 |
| 公開(公告)號: | CN103631859B | 公開(公告)日: | 2017-01-11 |
| 發(fā)明(設(shè)計)人: | 徐小良;吳仁克;林建海;陳秋 | 申請(專利權(quán))人: | 杭州電子科技大學(xué) |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 杭州君度專利代理事務(wù)所(特殊普通合伙)33240 | 代理人: | 杜軍 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 科技 項(xiàng)目 評審 專家 智能 推薦 方法 | ||
1.一種面向科技項(xiàng)目的評審專家智能推薦方法,其特征在于該方法包括以下步驟:
步驟1.把科技項(xiàng)目和專家信息中的通用詞和慣用詞作為專業(yè)停用詞庫;把標(biāo)點(diǎn)符號、非漢字作為切分標(biāo)記庫;
步驟2.對科技項(xiàng)目信息、專家信息進(jìn)行分詞:根據(jù)科技項(xiàng)目信息中切分標(biāo)記,將項(xiàng)目名稱、主要研究內(nèi)容、技術(shù)指標(biāo)切分成子串序列;根據(jù)評審專家信息中切分標(biāo)記,抽取專家信息、獲獎情況、發(fā)明情況、發(fā)表論文情況、課題承擔(dān)過的項(xiàng)目及完成情況、研究方向切分成子串序列,一個子串序列即一個字段信息;利用中科院ICTCLAS對子串序列進(jìn)行分詞;
步驟3.科技項(xiàng)目特征詞語提?。豪猛ㄓ猛S迷~庫和專業(yè)停用詞庫對分詞進(jìn)行停用詞過濾,所述的通用停用詞庫采用哈工大停用詞表,把去除停用詞的分詞結(jié)果作為一個詞語集合;
專業(yè)停用詞庫的構(gòu)建是一個自學(xué)習(xí)不斷完善的過程,在信息分詞過程中不斷統(tǒng)計詞語的詞頻,詞語在文本出現(xiàn)的概率大于一定閥值,將它納入到停用詞庫;
科技項(xiàng)目信息量較大,對詞語集合進(jìn)行詞語間語義相似度計算,根據(jù)詞的語義關(guān)系和詞的共現(xiàn)關(guān)系構(gòu)建詞語網(wǎng)絡(luò),計算網(wǎng)絡(luò)中的詞語聚集特征值;然后結(jié)合詞語的統(tǒng)計特征值,計算詞語的關(guān)鍵度來提取出科技項(xiàng)目特征詞語;科技項(xiàng)目的特征詞語就是提取綜合文本的統(tǒng)計特征信息和語義特征信息,更加準(zhǔn)確地提取出特征詞語;
步驟4.評審專家特征詞語提?。焊鶕?jù)通用停用詞庫和專業(yè)停用詞庫進(jìn)行停用詞過濾,提取每個專家的特征詞集合;
步驟5.構(gòu)建科技項(xiàng)目、評審專家的分字段知識表示模型:通過對空間向量模型和物元知識集模型進(jìn)行擴(kuò)展,依據(jù)科技項(xiàng)目中的不同字段信息建立文本表示模型PRO=(id,F,WF,T,V),其中id表示在項(xiàng)目庫中的標(biāo)識字段;F表示科技項(xiàng)目中字段類別集合;WF為字段的權(quán)重;T為特征詞語;V表示字段所對應(yīng)的詞語及其權(quán)重集合即Vi={vi1,f(vi1),vi2,f(vi2),...,vin,f(vin)},vij表示第i個字段中的第j個特征詞語,f(vij)表示vij關(guān)鍵詞所對應(yīng)的頻數(shù);科技項(xiàng)目信息的知識表示如下:
同理,根據(jù)專家中的不同字段信息建立知識表示模型TM=(id,F,WF,T,V);其中,id表示在專家?guī)熘械臉?biāo)識字段;F表示評審專家中字段類別集合;WF為字段的權(quán)重集合;T為特征詞語;V表示字段所對應(yīng)的特征詞語及其權(quán)重集合即Vi={vi1,f(vi1),vi2,f(vi2),...,vin,f(vin)},vij表示第i個字段中的第j個特征詞語,f(vij)表示vij特征詞語在所對應(yīng)的字段內(nèi)的出現(xiàn)頻率;評審專家信息的知識表示為:
步驟5.評審專家信息索引庫構(gòu)建:待評審專家知識表示模型構(gòu)建完成后,將信息索引入庫:首先從專家?guī)熘凶x取一個評審專家的內(nèi)容項(xiàng)信息;基于分詞結(jié)果建立詞語語義網(wǎng)絡(luò)并提取評審專家所包含的特征詞;依據(jù)知識表示模型并利用Apache?Lucene對其建立索引;將建立好的索引按所屬類別加至對應(yīng)的索引庫中,直到所有的評審專家索引入庫;
步驟6:根據(jù)項(xiàng)目的個數(shù),推薦方式分為單一待審項(xiàng)目推薦專家和分組待審項(xiàng)目推薦專家;分組推薦專家對步驟5的待審項(xiàng)目知識表示模型做相應(yīng)的字段間和項(xiàng)目間的特征合并操作,單一待審專家推薦只做相應(yīng)的字段間特征合并操作;同時,對步驟5的評審專家的知識表示模型進(jìn)行字段間特征合并;依據(jù)知識表示模型并利用Apache?Lucene對合并后的特征信息建立索引;其中,科技項(xiàng)目索引構(gòu)建在進(jìn)行項(xiàng)目推薦時進(jìn)行;
科技項(xiàng)目申報管理系統(tǒng)中待審項(xiàng)目往往是需要分組推薦的,上述特征合并操作不但確保不會消除步驟5中知識表示模型設(shè)置不同字段權(quán)重對相似度計算產(chǎn)生推薦的貢獻(xiàn)差異;
步驟7.經(jīng)過步驟6的評審專家和科技項(xiàng)目的知識表示模型的字段間特征進(jìn)行合并,假設(shè)評審專家信息向量若表示為P={s1,f(s1),s2,f(s2),...,sn,f(sn)},科技項(xiàng)目信息向量表示為Q={t1,f(t1),t2,f(t2),...,tn,f(tn)},基于最大匹配算法計算待審科技項(xiàng)目向量與評審專家的語義相似度;
步驟8.設(shè)置相似度截斷,依據(jù)相似度的大小產(chǎn)生推薦指數(shù),產(chǎn)生最終的推薦評審專家列表。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué),未經(jīng)杭州電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310509358.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建?;蚍抡?,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 一種項(xiàng)目信息處理方法及系統(tǒng)
- 軟件項(xiàng)目管理方法、終端及計算機(jī)可讀存儲介質(zhì)
- 一種基于微信公眾號的線上項(xiàng)目申請審批的方法及系統(tǒng)
- 一種項(xiàng)目管理系統(tǒng)及方法
- 一種建筑項(xiàng)目綜合管理系統(tǒng)
- 一種項(xiàng)目管理方法、裝置及設(shè)備
- 項(xiàng)目管理方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 項(xiàng)目管理系統(tǒng)、方法、計算機(jī)設(shè)備和計算機(jī)可讀存儲介質(zhì)
- 一種電力項(xiàng)目業(yè)務(wù)中臺及其微服務(wù)系統(tǒng)
- 一種基于標(biāo)簽確定項(xiàng)目成員的方法、裝置以及存儲介質(zhì)





