[發明專利]一種知識產權大數據情報檢索系統及存儲介質在審
| 申請號: | 202010790501.X | 申請日: | 2020-08-07 |
| 公開(公告)號: | CN111737421A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 耿德強;武偉;劉洋;李楊 | 申請(專利權)人: | 杭州六棱鏡知識產權科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/335;G06F16/338;G06F40/289 |
| 代理公司: | 杭州創智卓英知識產權代理事務所(普通合伙) 33324 | 代理人: | 唐超文 |
| 地址: | 310051 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識產權 數據 情報 檢索系統 存儲 介質 | ||
1.一種知識產權大數據情報檢索系統,其特征在于,包括數據獲取模塊、數據處理模塊、企業評價模塊、數據庫模塊、數據檢索模塊、數據收藏模塊和數據下載模塊;
其中,所述數據獲取模塊用于對多源異構數據進行采集;
所述多源異構數據是指自第三方購買的數據信息,或利用網絡蜘蛛技術從網頁抓取的數據信息,所述自第三方購買的數據信息來源包括國家知識產權局官方知識產權數據提供方、國家工商局企業注冊信用信息提供方、巨潮資訊網、中國行業經濟網、中國產業信息網、中國行業信息網、企查查、啟信寶和天眼查,所述從網頁抓取的數據信息來源包括中國政府網、各地方政府網、企業官方網站、各類征信網、社區論壇和輿情網站;
所述多元異構數據包括企業的知識產權信息、工商注冊企業數據信息、企業投資和融資信息以及風險信息,
所述知識產權信息包括企業的技術演進、知識產權獲取、知識產權維護、知識產權運用、研發體系、科技團隊、高管背景、公司資質、權威獎項、技術標準、研發中心、實驗室等信息;
所述工商注冊企業數據信息包括公司名稱、曾用名、法人名稱、成立日期、企業狀態、成立日期、社會統一信用社會代碼、經營范圍、企業logo、注冊地、公司簡介、官網地址等信息;
所述企業投資和融資信息包括投融資事件、并購事件、投資方等信息;
所述風險信息包括訴訟、知識產權的許可、知識產權的變更、知識產權的質押、知識產權的喪失等信息;
所述數據處理模塊包括數據清洗子模塊、數據預處理子模塊、特征工程子模塊、數據分類子模塊和標簽賦予子模塊,所述數據清洗子模塊用于去除文本中的噪音信息,所述數據預處理子模塊用于執行文本切分處理,所述特征工程子模塊用于將原始數據轉變成模型的訓練數據,所述數據分類子模塊用于將數據分類,所述標簽賦予子模塊用于給企業添加標簽;
所述去除文本中的噪音信息是指利用有效信息和噪音信息的區別特征,去除各種導航、鏈接,廣告、聲明信息等噪音信息;
所述文本切分處理是指降低文本粒度,去除文本中的停用詞、數字、英文及標點符號;
所述將原始數據轉變成模型的訓練數據是指基于TF-IDF算法,將文本內容轉化成數值形式的特征向量,從而得到每篇文檔中較為重要的特征向量;
所述企業評價模塊用于綜合企業各維度知識產權大數據情報對企業投資指數進行評價;
所述數據庫模塊用于儲存添加標簽的知識產權大數據情報;
所述數據檢索模塊用于檢索數據庫模塊知識產權大數據情報;
所述數據收藏模塊用于將指定的知識產權大數據情報進行收藏;
所述數據下載模塊用于下載目標知識產權大數據情報。
2.根據權利要求1所述的知識產權大數據情報檢索系統,其特征在于,所述知識產權大數據情報檢索的方法包括以下步驟:
步驟一、數據獲取步驟,獲取企業相關的多源異構數據信息;
步驟二、數據處理步驟,包括數據清洗、數據預處理、特征工程、數據分類、賦予標簽;
步驟三、企業評價步驟:綜合企業各維度知識產權大數據情報對企業投資指數進行評價;
步驟四、情報信息存儲步驟:儲存添加標簽的知識產權大數據情報;
步驟五、數據檢索步驟:利用檢索詞、檢索式和標簽綜合索引數據庫中的知識產權大數據情報;
步驟六、數據收藏步驟:對指定的知識產權大數據情報進行收藏;
步驟七、數據下載步驟:下載目標知識產權大數據情報。
3.根據權利要求1所述的知識產權大數據情報檢索系統,其特征在于,所述有效信息和噪音信息的區別特征包括文本路徑比特征、文本路徑長度特征、文本標點特征和文本路徑層次特征,所述文本路徑比特征是指有效信息和噪音信息各自擁有相同或相似的標簽路徑,且有效信息的標簽路徑與噪音信息的標簽路徑不同,所述文本路徑長度特征是指有效信息的文本長度比噪音信息的文本長度更長,所述文本標點特征是指有效信息的文本比噪音信息包含有更多的標點符號,所述文本路徑層次特征是指網頁有效信息比噪音信息擁有更少的修飾信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州六棱鏡知識產權科技有限公司,未經杭州六棱鏡知識產權科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010790501.X/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





