[發明專利]一種技術交底文本擴充方法、裝置和設備在審
| 申請號: | 202010420142.9 | 申請日: | 2020-05-18 |
| 公開(公告)號: | CN111753066A | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 劉愷;張灝;李強 | 申請(專利權)人: | 北京信聚知識產權有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/194;G06F40/211;G06F40/289;G06F40/30;G06F16/33;G06Q50/18 |
| 代理公司: | 北京思格頌知識產權代理有限公司 11635 | 代理人: | 潘珺;李中永 |
| 地址: | 100094 北京市海淀區西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 技術 交底 文本 擴充 方法 裝置 設備 | ||
本發明公開了一種技術交底文本擴充方法、裝置和設備,該方法包括:確定技術交底文本中的至少一個可能不具備創新性的段落文本,然后以至少一個可能不具備創新性的段落文本中包含的至少一個檢索語句為檢索對象,在預先建立的檢索數據庫中進行檢索,確定檢索到的相似語句和/或相似段落文本與檢索語句的相似度值,并將相似度值高于相似度閾值的相似段落文本和/或相似語句,作為與可能不具備創新性的段落文本相似的參考文本,添加到技術交底文本中。本發明與現有技術中通過人工撰寫的方式拓展實施例文本相比,不僅僅增加了檢索效率和質量,節省了大量人力物力,輔助相關人員的撰寫工作,進一步提高了撰寫質量和效率。
技術領域
本發明涉及數據處理領域,特別涉及一種技術交底文本擴充方法、裝置和設備。
背景技術
專利文件是世界上最大的技術信息資源,據統計專利文件包含了世界上90%~95%的科技技術信息,其作為一種無形財產越來越引起人們的重視。例如,2019年我國發明專利申請量為140.1萬件,共授權發明專利45.3萬件等。但是截至2019年12月底,全國專利代理機構僅2649家,執業專利代理師突破2萬人,雖然與2012年底相比,分別增長了1.9倍和1.5倍。但是相較于專利申請數量與專利代理師人數的懸殊,依然有許多申請人不能及時高效的將自己研發過程中產生的發明創造提交到相關部門進行專利申請。
對于普通申請人,尤其是發明人而言,雖然很清楚發明創造的技術方案,但是對于專利的撰寫規則和要求卻知之甚少,很難獨立撰寫出合格的申請文件。目前,還沒有一種可行的輔助方式,能夠幫助那些了解技術方案但專利申請經驗不足的申請人形成初步的申請文件,也沒有能夠幫助缺乏經驗的申請人、發明人迅速建立起專利撰寫文件的概念和掌握初步的方式。
因此在實際應用中的主要癥結在于:專利申請人不會撰寫技術交底文本,也沒有專門的專利撰寫系統為其提供便捷專利撰寫服務,而且在撰寫過程中可能不具備創新性的段落文本是生成具體實施方式的重要文本因素,使用可能不具備創新性的段落文本擴充成具體實施例內容時尤為重要,因此如何對技術交底文本進行擴充以方便智能生成專利申請文件是本領域技術人員亟需解決的問題。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的一種技術交底文本擴充方法、裝置和設備。
第一方面,本發明實施例提供一種技術交底文本擴充方法,可以包括:
確定所述技術交底文本中的至少一個可能不具備創新性的段落文本;
以至少一個所述可能不具備創新性的段落文本中包含的至少一個檢索語句為檢索對象,在預先建立的檢索數據庫中進行檢索,確定檢索到的相似語句和/或相似段落文本與所述檢索語句的相似度值;
將所述相似度值與預設的相似度閾值進行比較,將相似度值高于相似度閾值的相似段落文本和/或相似語句,作為與所述可能不具備創新性的段落文本相似的參考文本,添加到所述技術交底文本中。
可選的,以所述可能不具備創新性的段落文本中包含的至少一個檢索語句為檢索對象,在預先建立的檢索數據庫中進行檢索,之前還包括:
對至少一個所述檢索語句進行向量化處理,得到檢索語句向量;
以所述可能不具備創新性的段落文本中包含的至少一個檢索語句為檢索對象,在預先建立的檢索數據庫中進行檢索,確定檢索到的相似語句和/或相似段落文本與所述檢索語句的相似度值,包括:
以所述檢索語句向量為檢索對象,在預先建立的檢索數據庫中進行檢索,得到相似語句和/或相似段落文本,并根據計算出的相似語句和/或相似段落文本與所述檢索語句相似度距離,確定所述相似語句和/或相似段落文本與所述檢索語句的相似度值。
可選的,以所述檢索語句向量為檢索對象,在預先建立的檢索數據庫中進行檢索,確定所述相似語句和/或相似段落文本與所述檢索語句的相似度值,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京信聚知識產權有限公司,未經北京信聚知識產權有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010420142.9/2.html,轉載請聲明來源鉆瓜專利網。





