[發明專利]一種涉及金融投研的數據處理方法及終端有效
| 申請號: | 202010950256.4 | 申請日: | 2020-09-11 |
| 公開(公告)號: | CN111815426B | 公開(公告)日: | 2020-12-15 |
| 發明(設計)人: | 李偉;楊雙 | 申請(專利權)人: | 深圳司南數據服務有限公司 |
| 主分類號: | G06Q40/00 | 分類號: | G06Q40/00;G06F16/35;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市博銳專利事務所 44275 | 代理人: | 歐陽燕明 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 涉及 金融 數據處理 方法 終端 | ||
本發明提供了一種涉及金融投研的數據處理方法及終端,獲取資訊來源、資訊標題、資訊文本及主觀性詞典,將資訊標題及資訊文本拆分為有順序的句子序列;根據資訊來源得到來源特征向量,根據句子序列得到其中每一個句子的句子特征向量,根據句子序列及主觀性詞典得到每一個句子的主觀權重得分及主觀性得分;根據來源特征向量、句子特征向量、主觀權重得分及主觀性得分,得到資訊特征向量;根據資訊特征向量,使用邏輯回歸判斷標簽類型,標簽類型為主觀或客觀;本發明不僅考慮到資訊正文的文本內容,也將資訊的來源考慮進主客觀的分析中,最終使用邏輯回歸判斷資訊的主客觀,計算簡單,基于詞語的模型訓練和分析確保了對資訊內容分析結果的準確性。
技術領域
本發明涉及數據分析領域,尤其涉及一種涉及金融投研的數據處理方法及終端。
背景技術
隨著人工智能、大數據、云計算和區塊鏈等新型互聯網技術的發展,金融行業也正在發生著巨大的變化,以人工智能為代表的新技術與金融服務、產品的深度融合產生了智能金融的概念,而智能投研就是智能金融的服務場景之一。
投研的前期分析需要對行業內的各種資訊進行總結和篩選,提取其中的關鍵信息生成摘要以供后續分析判斷使用,并且,因為資訊是人工撰寫的,為了避免其中的主觀結論影響后期對信息的提取與分析,往往需要對其進行主客觀分析,對其中的主觀描述進行修改,并且,對于最終生成的研究報告,也需要檢查其中的描述,摒棄主觀性的描述,但是傳統并未有相應技術能夠實現對文本的分析,故都需要依靠人工進行排查,效率低且容易出現遺漏的情況;
現有的方案(申請公布號CN110750648A一種基于深度學習和特征融合的文本情感分類方法),該方案主要是通過整合層次特征學習文本表示,其中里面包含了使用層級結構的深度學習模型來提取句子特征和文檔特征,最終用隨機森林進行情感分類,但其需要表情符號的輔助,適用于社交網絡上的文本分析,而對于資訊類文稿此種方式的判斷準確率較低。
發明內容
本發明所要解決的技術問題是:提供一種涉及金融投研的數據處理方法及終端,能夠準確區分出資訊文本中的主客觀內容。
為了解決上述技術問題,本發明采用的一種技術方案為:
一種涉及金融投研的數據處理方法,包括步驟:
S1、獲取資訊來源、資訊標題、資訊文本及主觀性詞典,并將所述資訊標題及所述資訊文本拆分為有順序的句子序列;
S2、根據所述資訊來源得到來源特征向量,根據所述句子序列得到所述句子序列中每一個句子的句子特征向量,根據所述句子序列及所述主觀性詞典得到每一個句子的主觀權重得分及主觀性得分;
S3、根據所述來源特征向量、所述句子特征向量、所述主觀權重得分及所述主觀性得分,得到資訊特征向量;
S4、根據所述資訊特征向量,使用邏輯回歸判斷標簽類型,所述標簽類型為主觀或客觀。
為了解決上述技術問題,本發明采用的另一種技術方案為:
一種涉及金融投研的數據處理終端,包括存儲器、處理器及存儲在存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現以下步驟:
S1、獲取資訊來源、資訊標題、資訊文本及主觀性詞典,并將所述資訊標題及所述資訊文本拆分為有順序的句子序列;
S2、根據所述資訊來源得到來源特征向量,根據所述句子序列得到所述句子序列中每一個句子的句子特征向量,根據所述句子序列及所述主觀性詞典得到每一個句子的主觀權重得分及主觀性得分;
S3、根據所述來源特征向量、所述句子特征向量、所述主觀權重得分及所述主觀性得分,得到資訊特征向量;
S4、根據所述資訊特征向量,使用邏輯回歸判斷標簽類型,所述標簽類型為主觀或客觀。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳司南數據服務有限公司,未經深圳司南數據服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010950256.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:半導體封裝結構和封裝方法
- 下一篇:一種基于自然語言生成結構化查詢語句的方法





