[發明專利]一種企業經營業績預測先行指標篩選方法及系統在審
| 申請號: | 202110620532.5 | 申請日: | 2021-06-03 |
| 公開(公告)號: | CN113361262A | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 周純葆;王彥棡;王玨 | 申請(專利權)人: | 中國科學院計算機網絡信息中心 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/289;G06F40/30;G06Q10/04;G06Q10/06 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 陳霽 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 企業 經營 業績 預測 先行 指標 篩選 方法 系統 | ||
1.一種企業經營業績預測先行指標篩選方法,其特征在于,包括:
獲取目標企業的研報圖表和營業收入,并從所述研報圖表中提取研報關鍵詞,對所述研報關鍵詞進行計算得到所述研報關鍵詞向量;
從行業數據庫中獲取所述目標企業所屬行業的宏觀指標和產業指標;并從所述宏觀指標和產業指標中獲取指標關鍵詞,對所述指標關鍵詞進行計算得到指標詞向量;
確定所述研報關鍵詞向量與所述指標詞向量的邏輯相關性;
獲取所述宏觀指標和產業指標的指標值,并確定所述指標值與所述營業收入的數學相關性;
根據所述邏輯相關性和數學相關性確定各指標的綜合相關性,并根據所述綜合相關性確定相關指標列表;
對所述相關指標列表中的指標進行去共線性分析,得到所述目標企業的前瞻指標。
2.根據權利要求1所述的方法,其特征在于,所述從所述研報文件中提取研報關鍵詞包括:
通過字符識別技術得到所述研報圖表中的文字信息;
針對所述研報圖表中的文字信息,通過分詞、詞頻統計和詞性分析得到所述研報圖表中的關鍵詞。
3.根據權利要求2所述的方法,其特征在于,通過字符識別技術得到所述研報圖表中的文字信息包括:
針對目標企業的研報圖表,通過OCR技術,得到所述目標企業研報圖表中的文字信息,其中判定標準為識別準確率大于等99.9%。
4.根據權利要求1所述的方法,其特征在于,所述對所述研報關鍵詞進行計算得到研報關鍵詞向量包括:
獲取所述研報關鍵詞在所有研報圖表中的出現頻率和上下文的共現頻率;
根據所述出現頻率和上下文的共現頻率確定所述研報關鍵詞向量。
5.根據權利要求1所述的方法,其特征在于,所述對所述指標關鍵詞進行計算得到指標詞向量包括:
獲取所述關鍵詞在所述指標文件中的出現頻率和在所述指標文件中的上下文的共現頻率;
根據所述出現頻率和所述共現頻率確定所述指標詞向量。
6.根據權利要求1所述的方法,其特征在于,所述根據所述綜合相關性確定相關指標列表包括:
將所述宏觀指標和所述產業指標按照綜合相關性由大到小的順序進行排序,并選取排名前N個指標組成相關指標列表,其中N為大于等于1的自然數。
7.根據權利要求1所述的方法,其特征在于,所述對所述相關指標列表中的指標進行去共線性分析包括:差分法、逐步回歸分析、主成份分析、單因素方差分析中的至少一種。
8.一種企業經營業績預測先行指標篩選系統,其特征在于,包括:
采集單元,用于采集目標企業的研報圖表和營業收入以及采集所述目標企業所屬的行業數據庫中的宏觀指標和產業指標;
處理單元,用于從所述研報圖表中提取研報關鍵詞以及從所述宏觀指標和產業指標中提取指標關鍵詞,并對所述研報關鍵詞進行計算得到研報關鍵詞向量,對所述指標關鍵詞進行計算得到指標詞向量;確定所述研報關鍵詞向量與所述指標詞向量的邏輯相關性;
所述處理單元,還用于根據所述宏觀指標和產業指標確定所述宏觀指標和產業指標的指標值,并確定所述指標值與所述營業收入的數學相關性;根據所述邏輯相關性和數學相關性確定指標的綜合相關性,將所述宏觀指標和產業指標按照所述指標相關性排序,得到相關指標列表;對所述相關指標列表中的指標進行去共線性分析,得到所述目標企業的前瞻指標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算機網絡信息中心,未經中國科學院計算機網絡信息中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110620532.5/1.html,轉載請聲明來源鉆瓜專利網。





