[發(fā)明專利]一種企業(yè)標(biāo)簽的獲取方法、獲取裝置、存儲介質(zhì)和計(jì)算機(jī)設(shè)備在審
| 申請?zhí)枺?/td> | 202011264990.1 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112434158A | 公開(公告)日: | 2021-03-02 |
| 發(fā)明(設(shè)計(jì))人: | 柴源 | 申請(專利權(quán))人: | 北京創(chuàng)業(yè)光榮信息科技有限責(zé)任公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/335;G06F40/289;G06F40/284;G06K9/62 |
| 代理公司: | 廣州華享智信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44576 | 代理人: | 王晶 |
| 地址: | 100022 北京市朝陽區(qū)建國路108號、甲108、乙108、110、*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 企業(yè) 標(biāo)簽 獲取 方法 裝置 存儲 介質(zhì) 計(jì)算機(jī) 設(shè)備 | ||
本發(fā)明公開了一種企業(yè)標(biāo)簽的獲取方法、獲取裝置、存儲介質(zhì)和計(jì)算機(jī)設(shè)備,所述企業(yè)標(biāo)簽的獲取方法不僅基于用于描述企業(yè)的企業(yè)基本信息文本、企業(yè)投融資文本以及企業(yè)商業(yè)模式文本等待提取文本進(jìn)行關(guān)鍵詞提取,而且,還根據(jù)候選關(guān)鍵詞的位置、詞性、重復(fù)次數(shù)、獨(dú)立表意能力和熱度等對候選關(guān)鍵詞進(jìn)行了篩選,可以將投資人更為關(guān)注的候選關(guān)鍵詞作為企業(yè)標(biāo)簽,使得投資人通過所述企業(yè)標(biāo)簽可以快速查找到目標(biāo)企業(yè)。
技術(shù)領(lǐng)域
本發(fā)明涉及金融行業(yè)企業(yè)分類技術(shù)領(lǐng)域,尤其涉及一種企業(yè)標(biāo)簽的獲取方法、獲取裝置、存儲介質(zhì)和計(jì)算機(jī)設(shè)備。
背景技術(shù)
隨著科學(xué)技術(shù)的進(jìn)步和經(jīng)濟(jì)的飛速發(fā)展,一些企業(yè)為了擴(kuò)大發(fā)展范圍,需要引進(jìn)投資人對其進(jìn)行投資,對于投資人而言,選擇企業(yè)時(shí)往往需要從海量的數(shù)據(jù)中獲取感興趣的內(nèi)容,大大降低了投資人查找投資企業(yè)的效率。
發(fā)明內(nèi)容
本發(fā)明所解決的技術(shù)問題是提供一種企業(yè)標(biāo)簽的獲取方法、獲取裝置、存儲介質(zhì)和計(jì)算機(jī)設(shè)備,投資人利用對企業(yè)標(biāo)簽進(jìn)行企業(yè)查找,提高了企業(yè)查找的效率。
本發(fā)明所采用的技術(shù)方案內(nèi)容具體如下:
一種企業(yè)標(biāo)簽的獲取方法,包括如下步驟:
獲取待提取文本,所述待提取文本包括至少一個(gè)企業(yè)基本信息文本、至少一個(gè)企業(yè)投融資文本以及至少一個(gè)企業(yè)商業(yè)模式文本,并根據(jù)所述待提取文本的內(nèi)容確定所述待提取文本的文本類型;
對每個(gè)文本類型的所述待提取文本進(jìn)行分詞得到候選關(guān)鍵詞,并獲取每個(gè)所述候選關(guān)鍵詞的初始權(quán)重;
獲取每個(gè)所述候選關(guān)鍵詞和其他文本類型的候選關(guān)鍵詞的相似度值;
獲取每個(gè)所述候選關(guān)鍵詞的熱度值;
根據(jù)每個(gè)所述候選關(guān)鍵詞的相似度值、熱度值和初始權(quán)重,得到每個(gè)所述候選關(guān)鍵詞的權(quán)重優(yōu)化值;
將權(quán)重優(yōu)化值超過預(yù)設(shè)閾值的候選關(guān)鍵詞確定為企業(yè)標(biāo)簽。
作為上述方案的優(yōu)選,獲取每個(gè)所述候選關(guān)鍵詞的初始權(quán)重:
根據(jù)所述候選關(guān)鍵詞在所述待提取文本中的位置,得到所述候選關(guān)鍵詞的位置參數(shù)ri1,且當(dāng)所述候選關(guān)鍵詞同時(shí)出現(xiàn)在所述待提取文本的標(biāo)題和正文時(shí),ri1=2;當(dāng)所述候選關(guān)鍵詞同時(shí)出現(xiàn)在所述待提取文本的標(biāo)題或正文時(shí),ri1=1;
根據(jù)所述候選關(guān)鍵詞在所述待提取文本中的重復(fù)次數(shù),得到所述候選關(guān)鍵詞的重復(fù)參數(shù)ri2,且其中:ai為第i個(gè)候選關(guān)鍵詞的重復(fù)次數(shù),n為所述候選關(guān)鍵詞的個(gè)數(shù);
根據(jù)所述候選關(guān)鍵詞在所述待提取文本中的獨(dú)立表意能力,得到所述候選關(guān)鍵詞的表達(dá)參數(shù)ri3,且當(dāng)所述候選關(guān)鍵詞可以獨(dú)立表意時(shí),ri3=1;當(dāng)所述候選關(guān)鍵詞不能獨(dú)立表意時(shí),ri3=0;
根據(jù)所述候選關(guān)鍵詞在所述待提取文本中的詞性,得到所述候選關(guān)鍵詞的詞性參數(shù)ri4,且當(dāng)所述候選關(guān)鍵詞為動詞、形容詞、數(shù)量詞和代詞時(shí),ri4=0;當(dāng)所述候選關(guān)鍵詞為名詞時(shí),ri4=1;
根據(jù)所述位置參數(shù)、所述重復(fù)參數(shù)、所述表達(dá)參數(shù)和所述詞性參數(shù),得到所述候選關(guān)鍵詞的初始權(quán)重ωi0,則其中:n為所述候選關(guān)鍵詞的個(gè)數(shù)。
作為上述方案的優(yōu)選,獲取每個(gè)所述候選關(guān)鍵詞和其他文本類型的候選關(guān)鍵詞的相似度值包括如下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京創(chuàng)業(yè)光榮信息科技有限責(zé)任公司,未經(jīng)北京創(chuàng)業(yè)光榮信息科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011264990.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)企業(yè)規(guī)劃模型進(jìn)行水平企業(yè)規(guī)劃
- 企業(yè)評價(jià)裝置和企業(yè)評價(jià)程序
- 企業(yè)評價(jià)裝置和企業(yè)評價(jià)程序
- 企業(yè)評價(jià)裝置和企業(yè)評價(jià)程序
- 企業(yè)評價(jià)裝置和企業(yè)評價(jià)程序
- 企業(yè)評價(jià)裝置和企業(yè)評價(jià)程序
- 企業(yè)評價(jià)裝置和企業(yè)評價(jià)程序
- 企業(yè)與企業(yè)之間信息交流平臺
- 基于企業(yè)畫像的企業(yè)精準(zhǔn)分析方法
- 標(biāo)貼(企業(yè))
- 瀏覽器中關(guān)閉標(biāo)簽的裝置和方法
- 標(biāo)簽生成方法及標(biāo)簽生成裝置
- 一種帶有標(biāo)簽的電氣插座
- 標(biāo)簽檢測定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 基于樹形結(jié)構(gòu)的標(biāo)簽存儲方法及裝置
- 一種標(biāo)簽分離機(jī)構(gòu)
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 標(biāo)簽檢測定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽轉(zhuǎn)換處理方法、裝置、電子設(shè)備及可讀存儲介質(zhì)





