[發明專利]一種專利文本向量的語義表示方法在審
| 申請號: | 201410169250.8 | 申請日: | 2014-04-24 |
| 公開(公告)號: | CN104199809A | 公開(公告)日: | 2014-12-10 |
| 發明(設計)人: | 王秀紅;袁銀池;汪滿容;盧章平 | 申請(專利權)人: | 江蘇大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 江蘇縱聯律師事務所 32253 | 代理人: | 戴勇 |
| 地址: | 212013 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 專利 文本 向量 語義 表示 方法 | ||
技術領域
本發明屬于專利文獻檢索領域,具體涉及一種專利文本的向量空間表示方法。
背景技術
各國專利文獻基本上都有基本統一的內容結構和統一的國際專利分類IPC體系。與發明技術方案相關的專利文獻的內容結構部分包括:專利名稱、摘要、說明書、權利要求書、IPC號及對比文件。說明書又包括背景技術、發明內容和具體實施方式。專利文獻在用詞和造句上與一般科技文獻有很大的區別,這些特點給專利文獻的相似計算帶來很大的困難。專利文獻的詞句表達具有自身特點。在不同的專利文獻之間,專利申請為了達到專利審查的新穎性,常將同一產品冠以不同的名稱,相同概念的用語可能大相徑庭,導致大量未登錄專業術語的密集出現;為了拓寬保護范圍,術語使用往往概念上位化,如關于“水杯”的發明創造,往往會用“一種容器”來表達,通篇不出現“水杯”二字;專利文獻使用大量晦澀的技術性術語但很嚴謹很少出現歧義,技術術語帶有很強的專業性,有些術語在某一特定技術領域內反復出現,而在其它領域內很少出現;存在大量的專業術語定語嵌套現象,如“免疫球蛋白”、“免疫球蛋白分子”、“免疫球蛋白分子編碼序列”。專利文獻的這些特點,使得專利文獻的語義表示帶有特殊性。
現有研究中,將語義專利分析法用于計算專利相似度以測量專利的新穎性[1]及評價專利侵權風險[2],將潛在語義分析方法用于檢測專利文獻與科學出版物之間的相似度[3],將隱概念作為基本的文本元素用于專利的相似測量的研究[4],利用語義技術相似的主客相互關系結構來描述技術合作者之間的相互結構關系,用以判別專利的侵權[5]等,雖在一定程度上涉及語義,并未能很好地挖掘專利文獻的用詞特點,結合專利文獻用詞特點將專利文本的專利語義信息表達于專利文本向量表示中。此外,現有的WordNet、YAGO等通用詞典中,專業術語數量有限;借助外部詞典WordNet,分析具有較高TF-IDF值的重要詞項之間的語義相似度[6]等在一定程度上提供了檢索效果,但均不能很好地適應專利文獻的用詞特點,導致很多專利語義信息丟失。專利本體庫構建方法、利用OWL進行語義專利信息檢索和管理[7]等的相關研究,只是為專利本體的構建提供了一些方法思路,未能構建領域專利知識庫,并用于專利文本的語義表示。
現有的專利文本向量的語義表示方法有待進一步挖掘專利文獻的用詞造句特點;現有的專業領域本體缺少大量未登錄的在專利文獻中密集出現的領域專利技術術語。需要結合專利文獻的用詞特點,提供專利文本向量中專利文獻詞項語義表示的新方法。
對比文件
Gerken?JM,A?New?Instruments?for?Technology?Monitoring:Novelty?in?Patents?Measured?by?Semantic?Patent?Analysis[J],Scientometrics,Vol.91,No.3,PP.645-670,2012
Bergmann?I,Butzke?D,Walter?L,et?al,Evaluating?the?Risk?of?Patent?Infringement?by?Means?of?Semantic?Patent?Analysis:the?Case?of?DNA?Chips[J],R&DManagement,Vol.38,No.5,PP.550-562,2008
Magerman?Tom,Van?Looy?Bart,Song?Siaoyan,Exploring?the?Feasibility?and?Accuracy?of?Latent?Semantic?Analysis?based?on?Text?Mining?Techniques?to?Detect?Similarity?Between?Patent?Documents?and?Scientific?Publications[J],Scientometrics,Vol.82,No.2,pp.289-306,2010
Moehrle?Martin?G,Measures?for?Textual?Patent?Similarities:A?Guided?Way?to?Select?Appropriate?Approaches[J],Scientometrics,Vol.85,No.1,pp.95-109,2010
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇大學;,未經江蘇大學;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410169250.8/2.html,轉載請聲明來源鉆瓜專利網。





