[發明專利]一種用于為文檔匹配評議專家的系統以及方法在審
| 申請號: | 202110856600.8 | 申請日: | 2021-07-28 |
| 公開(公告)號: | CN113516094A | 公開(公告)日: | 2021-10-19 |
| 發明(設計)人: | 梁英;謝小杰;劉政君;王梓森 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 文檔 匹配 評議 專家 系統 以及 方法 | ||
本發明實施例提供了一種用于為文檔匹配評議專家的系統以及方法,該系統包括:專家特征提取模塊,其利用神經網絡用于根據專家描述文本和專家學術專長信息獲取專家特征表示;文檔特征提取模塊,其利用神經網絡根據待評議文檔的文檔描述、學科分類信息和關鍵詞信息獲取文檔特征表示;專家匹配模塊,其利用神經網絡根據專家特征表示和文檔特征表示計算專長匹配度,并基于專長匹配度生成候選專家列表;本發明在專家和待評議文檔方面均從不同的類別提取相關的信息,以更精準地提取到兩者的語義特征,降低語義鴻溝,提高專家推薦的精度。
技術領域
本發明涉及信息匹配技術領域,具體來說涉及學術數據挖掘領域,更具體地說,涉及一種用于為文檔匹配評議專家的系統以及方法。
背景技術
同行評議是若干領域的專家共同對學術成果、科技項目、科研學者等進行評價的活動。隨著同行評議和學術科研活動的蓬勃發展,新的同行評議需求不斷地被提出,專家庫信息不斷地被更新和規模增大,使得專家推薦的需求飛速增長。專家推薦通過學術專長匹配和專家遴選兩步為同行評議提供一批滿足評議要求的專家,成為了同行評議活動順利開展的基礎,在諸如項目評審、論文評審、技術招標、科技成果獎勵與孵化、需求對接等同行評議活動中獲得了廣泛應用。作為專家推薦的重要環節,學術專長匹配的目的是根據待評議文檔對專家庫中的專家進行匹配,為后續的專家遴選提供專業背景相符的候選專家列表。根據具體同行評議場景的不同,待評議文檔包括:1)項目評審場景的項目指南;2)論文評審場景的學術論文;3)技術招標場景的招標文檔;4)科研成果獎勵與孵化場景的科研成果;5)需求對接場景的需求文檔。學術專長匹配通過專家信息和待評議文檔確定專家的匹配程度,實現在同行評議活動中精確匹配出候選專家,從而保證專家推薦的匹配精準度和同行評議的質量。
現有的用于為文檔匹配評議專家的技術主要存在如下的缺點和不足:
1)沒有充分利用專家和待評議文檔的多類特征信息,導致學術專長匹配精準度不高。現有學術專長匹配技術主要根據專家描述文本和待評議文檔的描述文本進行特征建模,通過主題建模和文本表示提取特征,僅利用了單一的文本信息,忽略了其他語義特征,導致學術專長匹配結果不準確。
2)沒有考慮到學術專長匹配的語義鴻溝問題,難以準確建模信息間的語義相關性。現有學術專長匹配技術主要通過關鍵詞搜索的方式進行匹配,造成關鍵詞和信息之間的存在語義鴻溝問題,特征表示建模的方式也僅能提取信息中的淺層語義特征,無法對語義特征進行深度刻畫。
發明內容
因此,本發明的目的在于克服上述現有技術的缺陷,提供一種用于為文檔匹配評議專家的系統以及方法。
本發明的目的是通過以下技術方案實現的:
根據本發明的第一方面,提供一種用于為文檔匹配評議專家的系統,包括:專家特征提取模塊,其利用神經網絡根據專家描述文本和專家學術專長信息獲取專家特征表示;文檔特征提取模塊,其利用神經網絡用于根據待評議文檔的文檔描述、學科分類信息和關鍵詞信息獲取文檔特征表示;專家匹配模塊,其利用神經網絡用于根據專家特征表示和文檔特征表示計算專長匹配度,并基于專長匹配度生成候選專家列表。
在本發明的一些實施例中,所述專家特征提取模塊包括:專家文本特征提取單元,用于提取專家描述文本的特征以生成專家文本特征表示;學術專長特征提取單元,用于根據專家學術專長信息提取其中每種學術專長的向量表示,并通過向量加法進行池化融合,生成學術專長特征表示;專家特征融合單元,用于拼接專家文本特征表示和學術專長特征表示,對拼接得到的向量進行線性變換,生成專家特征表示。
在本發明的一些實施例中,所述專家文本特征提取單元包括全連接網絡和卷積神經網絡,并被配置為根據單詞嵌入表和全連接網絡將專家描述文本中的每個單詞轉換為單詞向量,根據卷積神經網絡對所有單詞向量進行卷積操作得到每個單詞的特征映射向量,根據池化函數對所有特征映射向量進行池化操作,得到專家文本特征表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110856600.8/2.html,轉載請聲明來源鉆瓜專利網。





