[發明專利]基金經理社團劃分方法、系統、計算機設備和存儲介質在審
| 申請號: | 201810977585.0 | 申請日: | 2018-08-27 |
| 公開(公告)號: | CN109359199A | 公開(公告)日: | 2019-02-19 |
| 發明(設計)人: | 陳澤暉;胡逸凡;謝云;黃鴻順 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06Q40/06 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 劉立天 |
| 地址: | 518028 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 社團 劃分結果 計算機設備 存儲介質 基金經理 權重 圖譜 節點設置 金融技術 網絡關系 聚類 調用 算法 基金 社區 團聚 合并 保存 | ||
1.一種基金經理社團劃分方法,其特征在于,包括:
從基金知識圖譜中提取多個實體,所述基金知識圖譜采用圖譜形式存儲在圖數據庫中,所述基金知識圖譜包括所述實體和關系;
獲取每兩個所述實體之間的關系,合并成權重W;
將每個實體均設置為一個節點,將每個所述節點設置為一個初始社團,兩個所述節點之間的權重W設置為度,調用快速聚類Fast Newman算法,對所述節點進行社團劃分,得到社團劃分結果;
將所述社團劃分結果保存入社團劃分表中,所述社團劃分表位于所述圖數據庫中。
2.根據權利要求1所述的基金經理社團劃分方法,其特征在于,所述基金知識圖譜的生成過程,包括:
從外部信息源中抽取多條基金知識數據,設置為知識元庫,所述基金知識數據據包括基金經理、所屬公司、畢業院校、導師、管理過的基金公司代碼或簡稱、管理過的基金名稱、正在管理的基金類型、正在管理的基金規模、投資風格、投資周期、單位凈值和累計凈值;
將所述知識元庫中的基金經理設置為統一標記,如果兩條所述基金知識數據具有同一項所述統一標記,則對兩條所述基金知識數據進行合并;
將所述基金經理設置為實體、所述所屬公司、畢業院校、導師、管理過的基金公司代碼或簡稱和管理過的基金名稱設置為關系,所述正在管理的基金類型、正在管理的基金規模、投資風格、投資周期、單位凈值和累計凈值設置為屬性,對所述知識元庫采用圖譜形式存儲在圖數據庫中,生成基金知識圖譜。
3.根據權利要求2所述的基金經理社團劃分方法,其特征在于,所述從外部信息源中抽取多條基金知識數據,包括:
當所述外部信息源是數據庫時,所述數據庫中的數據為結構化數據,通過設定規則腳本對所述數據庫中的數據進行抽取,得到多條所述基金知識數據;
當所述外部信息源是網站時,所述網站中的圖表數據為半結構化數據,通過爬蟲或正規表達式匹配來進行數據抽取,得到多條所述基金知識數據;
當所述外部信息源是基金研報、基金經理簡歷或社區評論時,所述外部信息源是非結構化的文本數據,通過自然語言處理來進行數據抽取,得到多條所述基金知識數據。
4.根據權利要求1所述的基金經理社團劃分方法,其特征在于,所述每兩個所述實體之間的關系,合并成權重W,包括:
所述實體與另一實體之間的關系是同一所述所屬公司,則所述實體與另一實體之間的所述所屬公司的關系對應的權重W=1;
所述實體與另一實體之間的關系是畢業于同一所所述畢業院校,則所述實體與另一實體之間的所述畢業院校的關系對應的權重W=1;
所述實體與另一實體之間的關系是具有共同的所述導師,則所述實體與另一實體之間的所述導師的關系對應的權重W=2;
所述實體與另一實體之間的關系是所述管理過的基金公司代碼或簡稱相同,則所述實體與另一實體之間的所述管理過的基金公司代碼或簡稱的關系對應的權重W=2;
所述實體與另一實體之間的關系是所述管理過的基金名稱相同,則所述實體與另一實體之間的所述管理過的基金名稱的關系對應的權重W=2;
對所述實體與另一實體之間的所有關系求和,形成權重W。
5.根據權利要求1所述的基金經理社團劃分方法,其特征在于,所述調用快速聚類FastNewman算法,對所述節點進行社團劃分,得到社團劃分結果,包括:
計算兩個所述初始社團結合時的模塊度Q值,將Q值增加最大的或者減少最少的兩個社團進行合并形成另一社團,重復進行計算和合并,直到所有社團合并成一個大社團時停止,找出合并過程中Q值最大時的社團劃分結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810977585.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種文本分類方法及裝置
- 下一篇:地名地址數據智能解析系統





