[發明專利]一種基于大數據的專利文件智能標引方法及裝置在審
| 申請號: | 202011180870.3 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112380838A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 程艷 | 申請(專利權)人: | 武漢蟬略科技有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/258;G06F40/289;G06F16/33;G06Q50/18 |
| 代理公司: | 武漢紅觀專利代理事務所(普通合伙) 42247 | 代理人: | 李季 |
| 地址: | 430000 湖北省武漢市東湖新技術*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 專利 文件 智能 標引 方法 裝置 | ||
本發明提出了一種基于大數據的專利文件智能標引方法及裝置。包括:獲取檢索分析指令,根據該檢索分析指令對專利數據庫進行檢索,并提取對應的專利文本;設定主題分類詞,根據該主題分類詞從同領域專利文本中標記出對應的詞語作為技術主題詞;建立TF?IDF算法,根據TF?IDF算法計算出每個技術主題詞在對應的專利文本中所占比重作為該技術主題詞的詞頻;根據技術主題詞的詞頻確定該專利文本對應的技術主題并進行標引。本發明通過利用檢索分析詞獲取二級詞語作為技術主題詞,然后加上TF?IDF算法能夠精確計算出每篇專利文件中的技術主題詞對應的詞頻,以此來自動確定每篇專利文本的技術主題,全程通過系統自動實現,極大程度節省了人力和時間。
技術領域
本發明涉及計算機軟件技術領域,尤其涉及一種基于大數據的專利文件智 能標引方法及裝置。
背景技術
隨著時間的發展,專利信息的增長尤為迅速,專利信息的快速增長帶來的 是信息超載,而對于用戶來說,要從海量的專利信息數據中對專利的技術主題 進行分析標引無疑是一件相當費時費力的事情。
現有的專利分析標引的步驟如下,首先根據檢索詞匯從專利數據庫中檢索 同領域的專利數據,然后人為通過閱讀大量專利文獻來確定每個專利的技術主 題,并進行標引,這種方法需要耗費大量時間和人力,所以亟需對現有的專利 分析標引方法進行改進。
上述內容僅用于輔助理解本發明的技術方案,并不代表承認上述內容是現 有技術。
發明內容
有鑒于此,本發明提出了一種基于大數據的專利文件智能標引方法及裝 置,旨在解決現有技術無法實現自動對檢索出的專利文件進行主題技術標引的 技術問題。
本發明的技術方案是這樣實現的:
一方面,本發明提供了一種基于大數據的專利文件智能標引方法,所述基 于大數據的專利文件智能標引方法包括以下步驟:
S1,獲取檢索分析指令,根據該檢索分析指令對專利數據庫進行檢索,并 提取對應的專利文本;
S2,設定主題分類詞,根據該主題分類詞從同領域專利文本中標記出對應 的詞語作為技術主題詞;
S3,建立TF-IDF算法,根據TF-IDF算法計算出每個技術主題詞在對應的 專利文本中所占比重作為該技術主題詞的詞頻;
S4,根據技術主題詞的詞頻確定該專利文本對應的技術主題并進行標引。
在以上技術方案的基礎上,優選的,步驟S1中,獲取檢索分析指令,根據 該檢索分析指令對專利數據庫進行檢索,并提取對應的專利文本,還包括以下 步驟,獲取檢索分析指令,從該獲取檢索分析指令中提取檢索分析詞,根據該 檢索分析詞對專利數據庫進行檢索,獲取對應的專利文本。
在以上技術方案的基礎上,優選的,步驟S2中,設定主題分類詞,根據該 主題分類詞從同領域專利文本中標記出對應的詞語作為技術主題詞,還包括以 下步驟,根據檢索分析詞獲取與該檢索分析詞同類別的二級詞語作為主題分類 詞,根據該主題分類詞對專利文本進行遍歷,并標記出專利文本中對應的主題 分類詞。
在以上技術方案的基礎上,優選的,根據檢索分析詞獲取與該檢索分析詞 同類別的二級詞語作為主題分類詞,根據該主題分類詞對專利文本進行遍歷, 并標記出專利文本中對應的主題分類詞之后,還包括以下步驟,設定檢索連詞, 所述檢索連詞包括:包括以及含有,根據該檢索連詞對標記有主題分類詞對應 的語句進行檢索,當該語句存在檢索連詞時,提取出該檢索連詞對應的語句中 的所有詞語,并對所有詞語進行篩選,將篩選出的詞語作為輔助分類詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢蟬略科技有限公司,未經武漢蟬略科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011180870.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多能源系統數字孿生數據流建模及壓縮方法
- 下一篇:純汽油發動機組件
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





