[發(fā)明專利]專利數(shù)據(jù)和產(chǎn)業(yè)數(shù)據(jù)的映射方法和裝置在審
| 申請?zhí)枺?/td> | 201610645773.4 | 申請日: | 2016-08-08 |
| 公開(公告)號: | CN107704469A | 公開(公告)日: | 2018-02-16 |
| 發(fā)明(設(shè)計)人: | 趙亞娟;田創(chuàng);王學(xué)昭;呂璐成;趙萍 | 申請(專利權(quán))人: | 中國科學(xué)院文獻(xiàn)情報中心 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司11240 | 代理人: | 韓建偉,張永明 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 專利 數(shù)據(jù) 產(chǎn)業(yè) 映射 方法 裝置 | ||
1.一種專利數(shù)據(jù)和產(chǎn)業(yè)數(shù)據(jù)的映射方法,其特征在于,包括:
獲取專利數(shù)據(jù)和產(chǎn)業(yè)數(shù)據(jù),其中,所述專利數(shù)據(jù)包括:至少一個專利類目,每個專利類目包含的文獻(xiàn)數(shù)據(jù),以及每個專利類目的類目注釋數(shù)據(jù),所述產(chǎn)業(yè)數(shù)據(jù)包括:至少一個產(chǎn)業(yè)類目,以及每個產(chǎn)業(yè)類目的類目注釋數(shù)據(jù);
計算所述至少一個產(chǎn)業(yè)類目的類目注釋數(shù)據(jù)和所述至少一個專利類目包含的文獻(xiàn)數(shù)據(jù)的第一相似度,以及所述至少一個產(chǎn)業(yè)類目的類目注釋數(shù)據(jù)和所述至少一個專利類目的類目注釋數(shù)據(jù)的第二相似度;
根據(jù)所述第一相似度和所述第二相似度,建立所述專利數(shù)據(jù)和所述產(chǎn)業(yè)數(shù)據(jù)的映射關(guān)系。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,計算所述至少一個產(chǎn)業(yè)類目的類目注釋數(shù)據(jù)和所述至少一個專利類目包含的文獻(xiàn)數(shù)據(jù)的第一相似度,以及所述至少一個產(chǎn)業(yè)類目的類目注釋數(shù)據(jù)和所述至少一個專利類目的類目注釋數(shù)據(jù)的第二相似度,包括:
分別從所述每個專利類目包含的文獻(xiàn)數(shù)據(jù)中,所述每個專利類目的類目注釋數(shù)據(jù)中和所述每個產(chǎn)業(yè)類目的類目注釋數(shù)據(jù)中抽取關(guān)鍵詞,得到所述每個專利類目的第一關(guān)鍵詞表,所述每個專利類目的第二關(guān)鍵詞表和所述每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表;
分別對所述每個專利類目的第一關(guān)鍵詞表,所述每個專利類目的第二關(guān)鍵詞表和所述每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表進(jìn)行加權(quán)處理,得到所述每個專利類目的第一權(quán)重值,所述每個專利類目的第二權(quán)重值和所述每個產(chǎn)業(yè)類目的第三權(quán)重值;
分別根據(jù)所述每個專利類目的第一權(quán)重值和所述每個產(chǎn)業(yè)類目的第三權(quán)重值,以及所述每個專利類目的第二權(quán)重值和所述每個產(chǎn)業(yè)類目的第三權(quán)重值,計算得到所述第一相似度和所述第二相似度。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,分別從所述每個專利類目包含的文獻(xiàn)數(shù)據(jù)中,所述每個專利類目的類目注釋數(shù)據(jù)中和所述每個產(chǎn)業(yè)類目的類目注釋數(shù)據(jù)中抽取關(guān)鍵詞,得到所述每個專利類目的第一關(guān)鍵詞表,所述每個專利類目的第二關(guān)鍵詞表和所述每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表,包括:
利用分詞算法,分別對所述每個專利類目包含的文獻(xiàn)數(shù)據(jù),所述每個專利類目的類目注釋數(shù)據(jù)和所述每個產(chǎn)業(yè)類目的類目注釋數(shù)據(jù)進(jìn)行分詞處理,得到所述每個專利類目的第一關(guān)鍵詞表,所述每個專利類目的第二關(guān)鍵詞表和所述每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在得到所述每個專利類目的第一關(guān)鍵詞表,所述每個專利類目的第二關(guān)鍵詞表和所述每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表之后,所述方法還包括:
分別對所述每個專利類目的第一關(guān)鍵詞表,所述每個專利類目的第二關(guān)鍵詞表和所述每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表進(jìn)行詞性標(biāo)記,得到標(biāo)記后的每個專利類目的第一關(guān)鍵詞表,標(biāo)記后的每個專利類目的第二關(guān)鍵詞表和標(biāo)記后的每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表;
分別從所述標(biāo)記后的每個專利類目的第一關(guān)鍵詞表,所述標(biāo)記后的每個專利類目的第二關(guān)鍵詞表和所述標(biāo)記后的每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表中,提取詞性滿足預(yù)設(shè)詞性的關(guān)鍵詞,得到提取后的每個專利類目的第一關(guān)鍵詞表,提取后的每個專利類目的第二關(guān)鍵詞表和提取后的每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,在得到所述每個專利類目的第一關(guān)鍵詞表,所述每個專利類目的第二關(guān)鍵詞表和所述每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表之后,所述方法還包括:
分別從所述每個專利類目的第一關(guān)鍵詞表,所述每個專利類目的第二關(guān)鍵詞表和所述每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表中,刪除噪聲詞,得到處理后的每個專利類目的第一關(guān)鍵詞表,處理后的每個專利類目的第二關(guān)鍵詞表和處理后的每個產(chǎn)業(yè)類目的第三關(guān)鍵詞表;
其中,所述噪聲詞為不具有明顯特征的高頻詞語。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院文獻(xiàn)情報中心,未經(jīng)中國科學(xué)院文獻(xiàn)情報中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610645773.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:按摩頭梳
- 下一篇:媒體文件的處理方法及服務(wù)器
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 填海治污產(chǎn)業(yè)
- 產(chǎn)業(yè)用車輛
- 產(chǎn)業(yè)工藝評價裝置以及產(chǎn)業(yè)工藝評價方法
- 產(chǎn)業(yè)用車輛
- 產(chǎn)業(yè)用車輛
- 產(chǎn)業(yè)用車輛的臺階以及產(chǎn)業(yè)用車輛
- 產(chǎn)業(yè)用通信系統(tǒng)、產(chǎn)業(yè)設(shè)備以及產(chǎn)業(yè)用通信方法
- 一種基于產(chǎn)業(yè)—空間互適性的開發(fā)區(qū)產(chǎn)業(yè)布局方法
- 產(chǎn)業(yè)關(guān)系鏈構(gòu)建方法、裝置、設(shè)備及存儲介質(zhì)
- 產(chǎn)業(yè)用機(jī)械





