[發(fā)明專利]一種涉及金融投研的數(shù)據(jù)處理方法及終端有效
| 申請?zhí)枺?/td> | 202010950256.4 | 申請日: | 2020-09-11 |
| 公開(公告)號: | CN111815426B | 公開(公告)日: | 2020-12-15 |
| 發(fā)明(設(shè)計)人: | 李偉;楊雙 | 申請(專利權(quán))人: | 深圳司南數(shù)據(jù)服務(wù)有限公司 |
| 主分類號: | G06Q40/00 | 分類號: | G06Q40/00;G06F16/35;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市博銳專利事務(wù)所 44275 | 代理人: | 歐陽燕明 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 涉及 金融 數(shù)據(jù)處理 方法 終端 | ||
1.一種涉及金融投研的數(shù)據(jù)處理方法,其特征在于,包括步驟:
S1、獲取資訊來源、資訊標(biāo)題、資訊文本及主觀性詞典,并將所述資訊標(biāo)題及所述資訊文本拆分為有順序的句子序列;
S2、根據(jù)所述資訊來源得到來源特征向量,根據(jù)所述句子序列得到所述句子序列中每一個句子的句子特征向量,根據(jù)所述句子序列及所述主觀性詞典得到每一個句子的主觀權(quán)重得分及主觀性得分;
S3、根據(jù)所述來源特征向量、所述句子特征向量、所述主觀權(quán)重得分及所述主觀性得分,得到資訊特征向量;
S4、根據(jù)所述資訊特征向量,使用邏輯回歸判斷標(biāo)簽類型,所述標(biāo)簽類型為主觀或客觀;
所述S1具體為:
獲取資訊來源,并根據(jù)預(yù)設(shè)規(guī)則將所述資訊來源轉(zhuǎn)換為數(shù)字標(biāo)識;
獲取資訊標(biāo)題及資訊文本,以問號、句號、感嘆號或省略號作為分隔標(biāo)識將所述資訊標(biāo)題及所述資訊文本劃分為句子,得到有順序的句子序列;
獲取預(yù)訓(xùn)練的主觀性詞典,所述主觀性詞典包括多個詞性詞典,為每個所述詞性詞典分配權(quán)重系數(shù);
所述S2中根據(jù)所述句子序列及所述主觀性詞典得到每一個句子的主觀性得分具體為:
按照所述句子序列的順序,逐一獲取所述句子序列中句子的主觀性得分;
其中,獲取句子的主觀性得分具體為:
對所述句子進(jìn)行分詞,得到分詞列表,所述分詞列表中詞語按所述詞語在所述句子中的出現(xiàn)順序排列;
確認(rèn)所述分詞列表中的詞語的詞性;
將所述分詞列表中相鄰的兩個詞語作為第一組合,根據(jù)所述詞語的所述詞性,得到所述第一組合對應(yīng)的第一詞性組合;
比較所述詞性組合與預(yù)設(shè)的主觀詞性組合,獲取與所述主觀詞性組合相同的所述第一詞性組合,并獲取所述第一詞性組合所對應(yīng)的所述主觀詞性組合的詞性權(quán)重;
將所述第一詞性組合所對應(yīng)的所述詞性權(quán)重相加,除以句子中所述第一詞性組合的總數(shù),得到句子的主觀性得分。
2.根據(jù)權(quán)利要求1所述的一種涉及金融投研的數(shù)據(jù)處理方法,其特征在于,所述S2中根據(jù)所述資訊來源得到來源特征向量具體為:
預(yù)設(shè)資訊來源類別,確定所述資訊來源對應(yīng)的所述資訊來源類別,得到所述資訊來源類別對應(yīng)的來源特征向量,作為所述資訊來源對應(yīng)的來源特征向量。
3.根據(jù)權(quán)利要求1所述的一種涉及金融投研的數(shù)據(jù)處理方法,其特征在于,所述S2中根據(jù)所述句子序列得到所述句子序列中每一個句子的句子特征向量具體為:
預(yù)訓(xùn)練預(yù)設(shè)詞庫中詞語對應(yīng)的詞向量;
對所述句子進(jìn)行詞語劃分,得到分詞列表;
使用正態(tài)分布對所述分詞列表進(jìn)行采樣,按照詞性出現(xiàn)頻率由高到低獲取預(yù)設(shè)數(shù)量的詞性的向量表示,作為詞性向量;
獲取所述分詞列表中每個詞語對應(yīng)的詞向量及所述詞語的詞性對應(yīng)的所述詞性向量;
拼接所述分詞列表中每個所述詞語的所述詞向量及所述詞性向量,得到所述句子特征向量。
4.根據(jù)權(quán)利要求1所述的一種涉及金融投研的數(shù)據(jù)處理方法,其特征在于,所述S2中所述根據(jù)所述句子序列及所述主觀性詞典,得到每一個句子的主觀權(quán)重得分具體為:
按照所述句子序列的順序,逐一獲取所述句子序列中句子的主觀權(quán)重得分;
其中,獲取句子的主觀權(quán)重得分具體為:
獲取所述主觀性詞典及所述主觀性詞典中每個所述詞性詞典對應(yīng)的所述權(quán)重系數(shù);
對所述句子進(jìn)行分詞,得到分詞列表;
匹配所述分詞列表中的詞語及所述主觀性詞典,若所述主觀性詞典中第一詞性詞典中的詞語與所述分詞列表中的詞語相同,則所述第一詞性詞典所對應(yīng)的所述權(quán)重系數(shù)為所述分詞列表中的詞語的權(quán)重;
將所述分詞列表中各個詞語的權(quán)重相加,除以所述分詞列表中詞語的總數(shù),得到所述句子的主觀權(quán)重得分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳司南數(shù)據(jù)服務(wù)有限公司,未經(jīng)深圳司南數(shù)據(jù)服務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010950256.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風(fēng)險分析或養(yǎng)老金
- 一種金融服務(wù)系統(tǒng)、金融服務(wù)平臺及其方法
- 一種移動終端搭載金融支付終端的方法及金融支付系統(tǒng)
- 一種基于微信小程序及金融開放平臺的金融能力輸出模式
- 金融產(chǎn)品推薦方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 基于三維坐標(biāo)定位的金融憑證智能存放系統(tǒng)及其裝置
- 基于云計算和區(qū)塊鏈的金融信息管理系統(tǒng)
- 基于數(shù)據(jù)倉庫的金融數(shù)據(jù)自動化測試與監(jiān)控系統(tǒng)
- 基于金融應(yīng)用的風(fēng)險監(jiān)測方法及系統(tǒng)
- 金融數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì)
- 金融憑證智能存放裝置
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





