[發明專利]一種基于說明書的專利分類方法有效
| 申請號: | 201710082677.8 | 申請日: | 2017-02-16 |
| 公開(公告)號: | CN107122382B | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 朱玉全;金健;佘遠程;石亮 | 申請(專利權)人: | 江蘇大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 212013 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 說明書 專利 分類 方法 | ||
本發明公開了一種基于說明書的專利分類方法,屬于文本處理與數據挖掘領域。首先對專利說明書進行文本預處理;其后構建倒排索引文件,利用信息增益和詞頻相結合的特征選擇方法來選取特征詞;進一步利用的改進過的TF?IDF公式計算特征詞權重,并構建專利特征向量;然后構建訓練專利領域集合;最后利用優化過的KNN分類器對專利進行分類。該項研究為專利文獻分類提供了新的思路,也為進一步研究專利文獻智能檢索等奠定了基礎。
技術領域
本發明屬于計算機分析技術在專利文獻的的應用,具體涉及一種利用專利說明書的專利分類方法。
背景技術
專利是技術創新和企業價值的具體表現,是知識發展和創新的重要載體、成果和源泉之一,許多發明創造成果僅出現于專利文獻中。據世界知識產權組織(WIPO)統計,世界上發明成果的70%~90%首先出現在專利文獻中,而不是雜志、論文等其他載體的文獻中。此外,為了保護自身的利益,企業會盡可能早的申請專利,專利中往往集中了最為活躍和先進的技術,包含了世界上90%~95%的技術信息。同時為了審查的方便,專利文獻往往撰寫的比較詳細,相對于其他類型的資料而言,專利文獻能夠提供更多的信息,是一種最常見的技術創新成果,記錄著專利活動的完整過程。它不僅反映各個技術領域中技術活動的現狀,而且能夠體現某個特定技術領域中技術活動的發展歷史。專利文獻中含有每一件申請專利的發明創造的具體技術解決方案,對于企業創新具有非常重要的作用,不僅使企業可以了解最新科研動態,避免重復研究,節約研究時間和科研經費,同時還可啟迪企業研究人員的創新思路,提高創新的起點,借鑒以往的發明,極大縮短科研工作進度。
隨著我國新研究成果和發明創造的不斷涌現,專利數量呈現出快速的增長。截止2016年10月5日,我國已公布的發明專利數已超過598萬件,其中授權發明專利總數為223.850萬件。如果每個專利的平均大小為2M,則專利數據的容量高達幾百TB。為了科學地管理這些專利文獻數據,同時也為了快速、方便地檢索相關專利文獻,專利文獻的分類顯得尤為重要。目前,世界上大多數國家均采用國際專利分類法IPC(International PatentClassification)來對專利文獻進行分類,IPC按照五個等級分類,即部(Section)、大類(Class)、小類(Subclass)、主組(Main Grop)、分組(Grop),其中部是分類表中最高等級的分類層,按照領域不同,分為八個大部,用一位的英文字母標記,分別是A-H,每個部分下屬設有多個大類,大類是由二位數字組成,每個部下面有不同數量的大類。例如:G06F21/00表示物理-電數字數據處理-防止未授權行為的保護計算機、其部件、程序或數據的安全裝置。
由此可見,對于已或即將公布的發明專利而言,必須賦予一個或多個與之對應的分類號,如發明專利“一種關聯規則挖掘中隱私數據的保護方法”的分類號為G06F21/00。對于即將提交的申請專利來講,其分類號是未知并需要確定的,對此,目前常用的做法是根據專利描述對象的所屬領域或專利內容來確定,需要依靠相關專家人工閱讀申請書,隨著專利申請量的急劇增加(每年的專利申請數已接近100萬),此方法需要耗費大量的人力和物力,而且專家自身知識的局限性也難以保證分類結果的一致性和準確性。為此,本發明提出了一種基于專利文獻說明書的專利分類方法,該方法利用已公布發明專利說明書中的信息來構造分類器或分類函數,并以此來確定申請專利的類別,由此實現專利的自動分類。
發明內容
本發明的目的在于針對現有專利分類方法不能充分有效地利用已公布發明專利中的說明書信息,提出一種基于專利文獻說明書的專利分類方法,該方法將充分利用已公布發明專利所包含的說明書信息以及對應的類別來構造分類器或分類函數,以此來確定已提交申請專利的類別,并就構造過程中說明書的特征提取和選擇、分類器的確定等方面提出了相應的優化解決方案。
本發明采用的技術方案是:基于專利文獻說明書的專利分類方法主要包括以下步驟:
(1)專利數據預處理
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇大學,未經江蘇大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710082677.8/2.html,轉載請聲明來源鉆瓜專利網。





