日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于卷積神經網絡的中文財經新聞文本分類方法在審

專利信息
申請號: 201810147792.3 申請日: 2018-02-13
公開(公告)號: CN108399230A 公開(公告)日: 2018-08-14
發明(設計)人: 吳佳萍;謝志峰;黃東晉;丁友東 申請(專利權)人: 上海大學
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 上海上大專利事務所(普通合伙) 31205 代理人: 陸聰明
地址: 200444*** 國省代碼: 上海;31
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 卷積神經網絡 財經新聞 詞向量 文本分類 中文 神經網絡模型 文本預處理 無監督學習 統計信息 動態調整 分類問題 網絡模型 新聞分類 有效解決 加模型 通用的 小樣本 有效地 卷積 語料 引入 表現
【權利要求書】:

1.一種基于卷積神經網絡的中文財經新聞文本分類方法,實現對財經新聞正負性的分類;其特征在于,具體操作步驟如下:

1)詞向量訓練:將分好詞的語料文本使用神經網絡來訓練,在訓練過程中生成一組向量,將每個詞映射到一個n維詞向量;

2)文本預處理:利用訓練好的詞向量模型將待訓練樣本轉化為以詞向量為元素的序列表示,得到一個2維矩陣,用于后續神經網絡的訓練;

3)CNN模型訓練:將訓練集通過多塊卷積神經網絡進行有監督的學習訓練;

4)新聞分類:通過使用softmax方式完成對句子的分類。

2.根據權利要求1所述的基于卷積神經網絡的中文財經新聞文本分類方法,其特征在于,所述步驟1)中,使用Google公司開源的word2vec工具訓練一個財經類詞向量模型,對數據的處理包括:去除非法字符、停用詞處理、分詞處理、編碼處理四部分;中文文本與英文文本主要不同之處是不存在天然分隔符,因此需要進行分詞處理,同時,中文文本都存在半角、全角兩種字符,需要對文本進行編碼規范;訓練所得的財經類詞向量用于完成財經類NLP中詞性標注、命名實體識別、短語識別、語義角色標注的任務。

3.根據權利要求1所述的基于卷積神經網絡的中文財經新聞文本分類方法,其特征在于,所述步驟2)中,文本預處理時將財經新聞的數據集,標注為正負兩類,對經濟市場產生積極正面影響的標注為正,對經濟市場產生滯后影響或報道負面的標注為負,并利用JIEBA分詞工具對實驗數據集進行分詞、去除非法字符、停用詞處理。

4.根據權利要求1所述的基于卷積神經網絡的中文財經新聞文本分類方法,其特征在于,所述步驟3)中,使用的卷積神經網絡是前饋神經網絡的一種,由卷積層和池化層疊加組合而成;卷積層作為特征提取層,通過濾波器提取局部特征,經過卷積核函數運算產生特征圖,輸出到池化層,池化層屬于特征映射層,對卷積層產生的特征圖進行降采樣,輸出局部最優特征;具體包括:

(1)詞向量層:將詞序列中的元素轉化為詞向量,令xi∈Rk為第i個詞對應的k維詞向量,長度為n的句子表示為:

其中為級聯運算符,則xi:i+h-1表示由第i到第i+h-1個詞組成的局部特征矩陣;

(2)卷積層:對不同大小的濾波器建立不同的卷積層,若濾波器大小為h*k,其中h為卷積核窗口中的詞數量,則對輸入的特征矩陣進行卷積操作后,生成特征ci為:

ci=f(w·xi:i+h-1+b) (2)

其中b∈R為偏差項,w∈Rh*k為卷積核的權重矩陣,f是卷積核函數;該濾波器應用于句子{x1:h,x2:h+1,...,xn-h+1:n}得到特征圖C為:

C=[c1,c2,c3,c4,...,cn-h+1] (3)

其中c∈Rn-h+1

(3)池化層:池化層采用max-over-time pooling方法進行特征采樣,對卷積層的輸出特征進一步抽象,保留最重要的特征

(4)全連接層:全連接層由池化層輸出的多個特征向量構成,若有大小不同的濾波器p種,每種濾波的數量為q,則全連接層的特征向量為V為:

在模型訓練階段,采用Adadelta Update Rule進行隨機梯度下降更新模型。

5.根據權利要求1所述的基于卷積神經網絡的中文財經新聞文本分類方法,其特征在于,所述步驟4)中,輸出層使用全連接的softmax層完成分類任務,通過動態調整詞向量増加神經網絡句子模型的統計語義信息,有效提升模型的分類能力。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810147792.3/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91精品一区| 好吊色欧美一区二区三区视频| 片毛片免费看| 国产在线精品一区| 欧美777精品久久久久网| 亚洲国产另类久久久精品性| 99国产精品欧美久久久久的广告| 欧美激情在线观看一区| 国产69精品久久久久777| 91久久国产视频| 久久人人97超碰婷婷开心情五月| 狠狠色很很在鲁视频| 日韩精品一区三区| 精品国产一级| 国产日本欧美一区二区三区| 亚洲乱视频| 夜夜躁狠狠躁日日躁2024| 国产欧美一区二区三区免费视频| 久久一区二区精品| 91精品啪在线观看国产手机 | 99国产精品| 97人人添人人爽一区二区三区| 国产日韩欧美精品一区| 午夜毛片在线看| av午夜剧场| 美女被羞羞网站视频软件| 好吊妞国产欧美日韩软件大全| 日韩精品中文字幕在线播放| 91精品福利观看| 少妇在线看www| 欧美精品一区二区三区在线四季| 色综合欧美亚洲国产| 久久福利视频网| 首页亚洲欧美制服丝腿| 亚洲午夜精品一区二区三区电影院| 国产视频精品一区二区三区| 91久久精品在线| 国产99久久九九精品免费| 亚洲综合日韩精品欧美综合区| 亚洲欧美日韩一级| 国产的欧美一区二区三区| 欧美xxxxhdvideos| 亚洲乱码av一区二区三区中文在线: | 色噜噜狠狠色综合影视| 亚洲精品一区二区三区香蕉| 国产午夜精品一区二区三区欧美 | 日韩精品一区二区久久| 国产一区二区二| 亚洲精品久久久久久久久久久久久久| 国产综合久久精品| 久久免费精品国产| 国产在线一卡| 日韩精品免费一区二区夜夜嗨| 日本一区二区高清| 欧美一区二区三区艳史| 欧美中文字幕一区二区| 日本一区二区三区中文字幕 | 午夜裸体性播放免费观看| 欧美激情视频一区二区三区免费| 日韩av电影手机在线观看| 国产一区免费在线| 久久夜靖品2区| 午夜激情免费电影| 99国产精品| 99re热精品视频国产免费| 7777久久久国产精品| 国产精品一级在线| 亚洲精品无吗| 精品国产乱码久久久久久久| 97精品国产97久久久久久| 91麻豆精品一区二区三区| 国产亚洲精品久久午夜玫瑰园| 欧美三级午夜理伦三级老人| 日本一二三四区视频| 国产亚洲综合一区二区| 国产一区二区麻豆| 国产69精品久久久久久久久久| 午夜剧场一级片| 日本高清二区| 91麻豆精品国产91久久久久推荐资源 | 久久久久国产精品嫩草影院| 精品久久国产视频|