[發明專利]利用深度學習模型的證券研報核心觀點提取方法及裝置在審
| 申請號: | 201811228490.5 | 申請日: | 2018-10-22 |
| 公開(公告)號: | CN109388804A | 公開(公告)日: | 2019-02-26 |
| 發明(設計)人: | 葉曙峰;梁桂賢;吳冶成;黃鴻順 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06N3/04;G06N3/08 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 林彥之 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分句 核心觀點 證券 學習 分析 智能化 準確率 輸出 | ||
1.一種利用深度學習模型的證券研報核心觀點提取方法,其特征在于,包括如下步驟:
S01,接收輸入的待分析證券研報;
S02,對待分析證券研報進行分句處理,得到待分析證券研報中的各分句;
S03,將待分析證券研報中的各分句采用預先訓練好的第一深度學習模型進行評分,以得到針對待分析證券研報中的各分句的第一評分,并基于第一評分從待分析證券研報中的各分句中確定觀點類分句;
S04,將待分析證券研報中的各觀點類分句采用預先訓練好的第二深度學習模型進行評分,以得到針對待分析證券研報中的各觀點類分句的第二評分,并基于第二評分從待分析證券研報中的各觀點類分句中確定行業觀點類分句;
S05,提取第二評分最高的行業觀點類分句作為待分析證券研報的核心觀點進行輸出。
2.根據權利要求1所述的利用深度學習模型的證券研報核心觀點提取方法,其特征在于,S01接收輸入的待分析證券研報,包括:
判斷接收到的待分析證券研報的格式是否為文本類型;
若否,則將所述待分析證券研報的格式轉換為文本類型。
3.根據權利要求1所述的利用深度學習模型的證券研報核心觀點提取方法,其特征在于,S02對待分析證券研報進行分句處理,得到待分析證券研報中的各分句,包括:
根據預置類型的符號對待分析證券研報進行分句處理,得到待分析證券研報中的各分句;
對待分析證券研報中的各分句進行分詞處理,得到待分析證券研報中的各分詞;
基于預置的包括分詞與數值的對應轉換關系的字典,確定待分析證券研報中的各分詞對應的數值;
根據確定結果,將待分析證券研報中的各分句轉換成數值向量格式的分句。
4.根據權利要求1所述的利用深度學習模型的證券研報核心觀點提取方法,其特征在于,第一深度學習模型的訓練過程,包括如下步驟:
步驟110,確定第一數據集,所述第一數據集包括預先對預置篇數的證券研報的摘要部分進行分句處理后得到的多個分句,其中每個分句具有預先標注的第一類型標簽,第一類型標簽包括觀點類和非觀點類;
步驟120,將標注有第一類型標簽的各分句進行分詞處理,得到標注有第一類型標簽的各分詞;
步驟130,根據預置規則將標注有第一類型標簽的各分詞轉換為對應的第一數值,并將標注有第一類型標簽的各分詞與其對應的第一數值存儲于預置的包括分詞與數值的對應轉換關系的字典中;
步驟140,根據所述詞典,將標注有第一類型標簽的各分句轉換成數值向量格式的分句,形成第一數值向量分句集合;
步驟150,從第一數值向量分句集合中選取第一預置數量的分句作為第一訓練數據;
步驟160,將第一訓練數據經深度學習模型進行訓練,以獲得第一深度學習模型。
5.根據權利要求1所述的利用深度學習模型的證券研報核心觀點提取方法,其特征在于,第二深度學習模型的訓練過程,包括如下步驟:
步驟210,確定第二數據集,所述第二數據集包括預先對預置篇數的證券研報的摘要部分進行分句處理后得到的多個分句,其中每個分句具有預先標注的第一類型標簽,第一類型標簽包括觀點類和非觀點類,且標注有觀點類標簽的分句同時具有預先標注的第二類型標簽,第二類型標簽包括行業觀點類和非行業觀點類;
步驟220,將標注有第二類型標簽的各分句進行分詞處理,得到標注有第二類型標簽的各分詞;
步驟230,根據預置規則將標注有第二類型標簽的各分詞轉換為對應的第二數值,并將標注有第二類型標簽的各分詞與其對應的第二數值存儲于預置的包括分詞與數值的對應轉換關系的字典中;
步驟240,根據所述字典,將標注有第二類型標簽的各分句轉換成數值向量格式的分句,形成第二數值向量分句集合;
步驟250,從第二數值向量分句集合中選取第二預置數量的分句作為第二訓練數據;
步驟260,將第二訓練數據經深度學習模型進行訓練,以獲得第二深度學習模型。
6.根據權利要求4或5所述的利用深度學習模型的證券研報核心觀點提取方法,其特征在于,所述深度學習模型為長短期記憶網絡機器學習模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811228490.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:中文分詞方法及系統
- 下一篇:一種基于實體抽取的工商變更分析方法





