[發明專利]一種基于標簽分層延深建模的企業畫像方法有效
| 申請號: | 202011303829.0 | 申請日: | 2020-11-19 |
| 公開(公告)號: | CN112580332B | 公開(公告)日: | 2022-07-12 |
| 發明(設計)人: | 李翔;丁行碩;王媛媛;朱全銀;高尚兵;王留洋;馬甲林;張柯文;成潔怡 | 申請(專利權)人: | 淮陰工學院 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/242;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 梁耀文 |
| 地址: | 223005 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 標簽 分層 建模 企業 畫像 方法 | ||
發明公開了一種基于標簽分層延深建模的企業畫像方法,首先對企業模糊標簽進行統計和篩選,篩選出如批發業、零售業等不能完整概括企業特點的標簽,使用Bert模型依據企業經營范圍和企業標簽對篩選出的標簽進行分類延深;然后將企業名稱、企業簡介、經營范圍信息整合,基于預先建立好的企業詞庫進行特征拓展,分別使用TextRank、TF?IDF、LDA主題模型從綜合信息中抽取關鍵詞,將處理后的關鍵詞作為更深層的企業延深標簽;最后,將本建模方法應用到企業畫像系統中,優化標簽精確概括能力。本發明普遍適用于標簽延深建模和標簽提取問題,充分考慮了標簽延深的層次關系,可以有效的提高標簽和企業畫像系統的準確度。
技術領域
本發明屬于企業畫像和自然語言處理技術領域,特別涉及一種基于標簽分層延深建模的企業畫像方法。
背景技術
本發明中的標簽分層延深對畫像技術有重要的作用和意義。在面對畫像標簽問題的時候,研究者們通常會選擇分類匹配,但是這種模型存在明顯的不足,忽視了標簽的由淺入深的分層關系,標簽無法精確概括企業特點,且無法對標簽做進一步的延深建模。因此,通過結合神經網絡和自然語言處理能夠很好的解決標簽延深建模問題,從而提高標簽和畫像系統的準確度。
李翔、朱全銀等人已有的研究基礎包括:X.Li,Z.Wang,S.Gao,R.Hu,Q.Zhu andL.Wang,An Intelligent Context-Aware Management Framework for Cold ChainLogistics Distribution,in IEEE Transactions on Intelligent TransportationSystems.doi:10.1109/TITS.2018.2889069;X.Li,Z.Wang,L.Wang,R.Hu and Q.Zhu,AMulti-Dimensional Context-Aware Recommendation Approach Based on ImprovedRandom Forest Algorithm,in IEEE Access,vol.6,pp.45071-45085,2018,doi:10.1109/ACCESS.2018.2865436;Li,X.,Wang,Z.,Hu,R.et al.Recommendation algorithmbased on improved spectral clustering and transfer learning.Pattern AnalApplic 22,633–647(2019);李翔,朱全銀.聯合聚類和評分矩陣共享的協同過濾推薦[J].計算機科學與探索,2014,8(6):751-759;李翔、朱全銀等人申請、公開與授權的相關專利:朱全銀,潘舒新,李翔等.一種多維度網頁瀏覽行為評估方法.發明專利號ZL2017100546758.1,2020.02.07;朱全銀,李翔,胡榮林等.一種科技新聞的增量學習多層次二分類方法.發明專利號ZL 201510642902.X,2018.08.10;朱全銀,邵武杰,李翔等.一種科學新聞標題的多層次多分類方法.發明專利號ZL 201610114278.0,2019.04.19;朱全銀,尹永華,李翔等.一種基于神經網絡的多品種商品價格預測的數據預處理方法.發明專利號ZL201210325368.6,2016.06.08;朱全銀,辛誠,李翔等.一種基于K-means和LDA雙向驗證的網絡行為習慣聚類方法.發明專利號ZL 201610565749.X,2019.06.11。
企業畫像:
企業畫像是大數據時代下的產物,是基于用戶畫像而產生,它通過企業的基本信息,抽取出標簽化的企業模型,使用圖表的形式將企業信息全方位展示出來。企業畫像標簽的建立是通過最基礎的統計類標簽,以及企業用戶行為而產生的規則類標簽,最后在使用數據挖掘對企業某些屬性進行預測判斷,挖掘潛在的價值信息,這些標簽就組成了企業畫像的標簽體系。企業畫像能夠形象展示出一個企業的綜合實力,當企業在進行項目合作時,可以將畫像信息作為重要依據。同時還可以減少企業之間的競爭,使企業趨利避害。而對于政府,了解企業信息有利于對企業進行監管。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于淮陰工學院,未經淮陰工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011303829.0/2.html,轉載請聲明來源鉆瓜專利網。





