[發明專利]一種用CIO/CTO社交網絡預測科技公司業績的方法在審
| 申請號: | 201710128333.6 | 申請日: | 2017-03-06 |
| 公開(公告)號: | CN107103403A | 公開(公告)日: | 2017-08-29 |
| 發明(設計)人: | 饒東寧;溫遠麗 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/00 |
| 代理公司: | 廣東廣信君達律師事務所44329 | 代理人: | 楊曉松 |
| 地址: | 510062 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 cio cto 社交 網絡 預測 科技 公司業績 方法 | ||
技術領域
本發明涉及數據挖掘、機器學習、人工智能等領域,特別涉及到了CIO/CTO網絡中心度影響企業績效。
背景技術
社會網絡是人們通過各種關系建立起來的聯系,并通過成員之間的交互作用形成的一種網絡化結構。社交網絡為人們建立和維持各種社會關系提供了便利。人際關系為信息交流提供一個有效的渠道,讓知識、想法、或私人信息更好的傳播。社會網絡研究最先使用這一方法,用中心性指標對節點重要性進行量化。在這里,節點的重要性可以理解為該節點對其它節點或整個網絡的影響。中心度是指采用定量方法對每個節點處于網絡中心地位的程度進行刻畫,從而描述整個網絡是否存在核心,存在什么樣的核心。此類應用屬于數據挖掘范疇。
公司或企業的中心人物對公司的影響頗大。國內外已有眾多對社交網絡和中心度算法的研究。但是以往的中心度算法,只考慮單一的度量標準,沒有考慮多種中心度的共同影響。這種考慮在某些時候是不全面的。由于權值可以顯示出網絡中節點的重要性,因此加權網絡結構是非常實用的。其次,數據量大需要在大規模的網絡中進行模擬。所以難以滿足對求解效率的要求。基于這些問題,本發明從以下兩方面著手,首先考慮各種中心度的共同影響,提出加權中心度算法,用以刻畫社交網絡的中心性,力求更全面地、更完善地對比分析不同文化環境下的網絡中心性影響科技公司績效。同時利用Spark集群并行計算的能力,在多臺機器上同時處理數據,這樣處理數據的效率將大大提高。
發明內容
本發明主要研究社會網絡與公司業績的關系,提出社交網絡中心度的思想,通過高網絡中心度的CIO/CTO預測公司業績。這將對金融智能、中心性分析、數據分類、興趣推薦等方面的研究都有重要的現實意義。
本發明的目的通過下述技術方案實現:
(1)數據的收集,收集標準普爾股份公司數據,BoardEx數據等。
(2)原始數據預處理,對于收集到的公司股票數據進行處理,篩選標準普爾500指數公司。剔除數據庫中不完整的樣本。
(3)加權中心性算法,考慮各種中心度的共同影響,提出加權中心度算法,用加權中心度替代單一中心度的方法。本發明主要對度中心度(Degree Centrality)、三角計數(Trangle Counting)、PageRank、接近中心度(Closeness Centrality)和介數中心度(Betweenness Centrality)進行加權。
(4)評估CIO/CTO價值的方法,用中心度評估CIO/CTO價值,分析CIO/CTO的網絡中心性。
(5)算法并行化,利用Spark集群并行計算的能力,在多臺機器上同時處理數據,這樣處理數據的效率將大大提高,而且伴隨集群節點數量的增加,計算速度也會相應的加快。
(6)數據分析,用加權中心度價值評估分析公司效益的方法,采用Probit回歸分析以及OLS模型。
本發明相對于現有技術具有如下的優點及效果:
以往的中心度算法,只考慮單一的度量標準,沒有考慮多種中心度的共同影響。這種考慮在某些時候是不全面的,沒有考慮網絡規模。由于權值可以顯示出網絡中節點的重要性,因此加權網絡結構是非常實用的。本發明考慮各種中心度的共同影響,提出加權中心度算法,用以刻畫社交網絡的中心性。通過中心度評估CIO/CTO價值的方法,并且利用上述價值評估作用進而分析科技公司業績的方法。
附圖說明
圖1一種用CIO/CTO社交網絡預測科技公司業績的方法的框架圖。
圖2為計算PageRank的流程圖。
圖3為計算Trangle Counting的流程圖。
圖4為計算Degree Centrality的流程圖。
圖5為計算Closeness Centrality的流程圖。
圖6為計算Betweenness Centrality的流程圖。
具體實施方式
下面結合附圖1對本發明做進一步的說明。本發明針對數據收集、數據處理、加權中心性、評估CIO/CTO價值的方法、算法并行化、數據分析六個方面進行研究。圖1為我們的系統設計,下面分別敘述每個步驟的具體內容:
1.數據收集
該步驟主要收集在某個時間段內,標準普爾公司數據,BoardEx數據和金融數據。
2.原始數據處理
使用金融軟件篩選出標準普爾500指數覆蓋的所有公司,對于BoardEx數據將導入Mysql數據庫篩選需要的屬性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710128333.6/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





