[發明專利]一種專利創造性的判斷方法在審
| 申請號: | 201910681777.1 | 申請日: | 2019-07-26 |
| 公開(公告)號: | CN110457690A | 公開(公告)日: | 2019-11-15 |
| 發明(設計)人: | 徐惟康;劉崢;夏彬;晁珍珍 | 申請(專利權)人: | 南京郵電大學;南京郵電大學鹽城大數據研究院有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/332;G06F16/33;G06Q50/18 |
| 代理公司: | 32102 南京蘇科專利代理有限責任公司 | 代理人: | 陳棟智<國際申請>=<國際公布>=<進入 |
| 地址: | 224000江蘇省鹽城*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 相似度 分詞 詞語 文本 關鍵字抽取 領域關鍵詞 文本相似度 專利數據庫 距離計算 人力成本 完整語義 文本特點 中文文本 專利集合 專利檢索 專利文本 專利文件 統計分析 詞向量 解釋性 向量化 詞法 詞庫 分句 句子 抽取 檢索 分解 | ||
1.一種專利創造性的判斷方法,其特征在于,包括以下步驟:
步驟1)關鍵字抽取,利用詞法分析抽取專利文本的初步關鍵詞,人工篩選后獲得精確關鍵詞,利用精確關鍵詞建立領域關鍵詞詞庫;
步驟2)相關專利檢索,利用上述精確關鍵詞去專利數據庫進行檢索,獲得對比專利文件,作為待對比專利的對比專利集合;
步驟3)分句,將專利文本里過長的句子根據文本特點分解成更短且具有完整語義的子句;
步驟4)分詞、計算詞向量,利用分詞工具對所述子句中中文文本進行詞語切分,并利用詞向量工具對所述詞語進行向量化處理;
步驟5)依據詞移距離計算文本相似度,判斷向量化處理后的詞語子句之間的相似度;
步驟6)計算整體文本的創造性,根據所述相似度來判斷整體文本的創造性。
2.根據權利要求1所述的一種專利創造性的判斷方法,其特征在于,步驟3)中分句的具體方法為:
區分標志類別,包括:結構詞、連接詞、序號、標點符號;
對應的分句標志和分句方法分別為:
結構詞分句標志包括:包括,comprising,including,includes, having,consisting;
分句方法為:長句:A+結構詞+B,可分解為1)子句1:A+結構詞+臨時詞匯;2)子句2:子句1中臨時詞匯的主語+結構詞+B;
連接詞分句標志包括:因此,其中,wherein,therefore;
分句方法為:長句:A+連接詞+B,可分解為1)子句1:A;2)子句2:B
序號分句標志包括:1),(1),(a),(i),a);
分句方法為:長句:A+序號+B,可分解為1)子句1:A;2)如果A或者B中包含“方法”、“步驟”等關鍵詞,則子句2:步驟+序號+B;
標點符號分句標志包括:“;”,“;”,“”,“.”“、”;
分句方法為:長句:A+標點符號+B,可分解為1)子句1:A;2)子句2:B。
3.根據權利要求1所述的一種專利創造性的判斷方法,其特征在于,步驟5)依據詞移距離計算文本相似度具體包括:
詞移距離把文檔在向量空間中的距離,建模成文檔所包含詞語在詞向量空間距離的線性加權組合,算法如下:
其中,為兩詞語的相似度,c(i,j)為詞i和j的語義距離:
T為加權權重,T可由下述最優化問題求解得到;
對待對比專利分句得到的子句集合與對比專利分句得到的子句集合,依據詞移距離計算模型和所得詞向量,分別兩兩計算子句相似度,通過詞移距離的計算方式,可以算出待對比專利里的每一個句子和對比專利里的所有句子的相似度。
4.根據權利要求3所述的一種專利創造性的判斷方法,其特征在于,步驟6)計算整體文本的創造性的具體方法為:
6-1)將待申請的專利中的句子S1與對比專利文檔D1的句子對比,若S1與D1中的相似度最高的句子的相似度大于給定的閾值α,則D1揭示了句子S1的創造性;用上述方法分別對比S1與專利文檔D2—Dn;
6-2)將其余句子S2-Sn依次用步驟1的方法分別對比專利文檔D2—Dn;
6-3)對于待申請的專利中的每個句子S1-Sn,都可以在對比專利文檔D1-Dn里得到一個與之最相似句子,只有兩個句子的相似度大于相似閾值時α,才認為兩個句子在統計學的定義下是相似的;
6-4)定義相似比γ,γ = 相似度低于α的句子數量/句子總數量;γ用于描述待對比專利與對比專利的相似程度,從而揭示待對比專利的創造性程度;
6-5)γ值小于1/3,則創造性強;處于1/3~2/3之間,創造性中;大于2/3,創造性弱。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學;南京郵電大學鹽城大數據研究院有限公司,未經南京郵電大學;南京郵電大學鹽城大數據研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910681777.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:語義處理方法及相關裝置
- 下一篇:基于劇本角色的情感曲線分析方法和裝置





