[發明專利]基于最小信息熵的神經網絡分詞系統及訓練方法有效
| 申請號: | 201810724646.2 | 申請日: | 2018-07-04 |
| 公開(公告)號: | CN110750986B | 公開(公告)日: | 2023-10-10 |
| 發明(設計)人: | 張鵬 | 申請(專利權)人: | 普天信息技術有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06N3/0464;G06N3/0442;G06N3/084 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩;李相雨 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 最小 信息 神經網絡 分詞 系統 訓練 方法 | ||
1.一種基于最小信息熵的神經網絡分詞系統,其特征在于,所述系統包括:
卷積神經網絡、雙向長短期記憶神經網絡、第一詞庫預測層和最小信息熵詞庫預測層,其中:
所述卷積神經網絡用于提取輸入文本的特征向量,并將所述特征向量輸出至所述雙向長短期記憶神經網絡;
所述雙向長短期記憶神經網絡用于接收所述特征向量,進行前后文信息的讀取和去冗余之后輸出至所述第一詞庫預測層和所述最小信息熵詞庫預測層;
所述第一詞庫預測層用于接收所述雙向長短期記憶神經網絡輸出的特征向量并根據第一詞庫計算并輸出所述輸入文本的每個字的標簽;
所述最小信息熵詞庫預測層用于接收所述雙向長短期記憶神經網絡輸出的特征向量并根據最小信息熵詞庫計算并輸出所述輸入文本的每個字的標簽。
2.根據權利要求1所述的系統,其特征在于,所述最小信息熵預測層包括全連接層和條件隨機場層,所述全連接層用于接收所述雙向長短期記憶神經網絡輸出的特征向量,分類后輸出至所述條件隨機場層;所述條件隨機場層用于根據最小信息熵詞庫計算所述條件隨機場輸出的特征向量,并輸出所述輸入文本的每個字的標簽。
3.根據權利要求1所述的系統,其特征在于,所述最小信息熵詞庫預測層用于輸出單字詞的標簽為S,多字詞的第一個字的標簽為B,多字詞的中間的字的標簽為I,多字詞的最后一個字的標簽為E。
4.一種用于如權利要求1至3任一項所述的基于最小信息熵的神經網絡分詞系統的訓練方法,其特征在于,所述方法包括:
計算所述基于最小信息熵的神經網絡分詞系統的損失函數Ltotal,計算公式如下:
Ltotal=LC+LC1+LFab
其中,LC為第一詞庫對應的損失函數,LC1為最小信息熵詞庫對應的損失函數,LFab為經過所述第一詞庫輸出的分詞結果的點信息的相反數;
最小化所述基于最小信息熵的神經網絡分詞系統的損失函數Ltotal,得到收斂的基于最小信息熵的神經網絡分詞系統。
5.根據權利要求4所述的方法,其特征在于,
所述第一詞庫對應的損失函數Lc=-∑i,x∈Clogp(y|x;W,b);
所述最小信息熵詞庫對應的損失函數Lc1=-∑i,x∈C1logp(y|z;W,b);
所述點信息的相反數
其中,p(y|x;W,b)表示在給定輸入字向量x、權重W和偏置b的前提下輸出標簽y的概率;
p(y|z;W,b)表示在給定輸入字向量z、權重W和偏置b的前提下輸出標簽y的概率;
Fab的值越大,表示詞a和詞b合并一起后的信息熵越小,pab表示詞a和詞b合并后出現的概率。
6.根據權利要求4所述的方法,其特征在于,所述方法還包括:
構建最小信息熵詞庫的步驟:
統計k個字合并后出現的概率pa,其中k≥2,且k為整數;
根據所述k個字合并后出現的概率在語料中進行分詞,得到k個字合并后熵最小的分詞結果;
對所述分詞結果進行標記,得到最小信息熵詞庫。
7.根據權利要求6所述的方法,其特征在于,所述得到k個字合并后熵最小的分詞結果包括:
計算使Fa最大值的分詞結果為k個字合并后熵最小的分詞結果;
其中,pa為k個字合并后出現的概率,pi為k個字中的單個字出現的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于普天信息技術有限公司,未經普天信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810724646.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:品牌詞識別方法、裝置、設備及存儲介質
- 下一篇:文本處理方法、裝置及存儲介質
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





