[發明專利]神經網絡訓練方法、成語誤用檢測方法、裝置和電子設備有效
| 申請號: | 201910821030.1 | 申請日: | 2019-08-30 |
| 公開(公告)號: | CN110532562B | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 楊雙濤 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289;G06F16/35;G06N3/08 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 楊靜 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 訓練 方法 成語 誤用 檢測 裝置 電子設備 | ||
本公開提供了一種用于訓練神經網絡的方法,包括:獲取多個語句文本;對于所述多個語句文本中的任一語句文本,從所述任一語句文本中提取成語文本,并獲取所述成語文本的語義信息,其中由所述任一語句文本和所述語義信息構成一個樣本對;為所述一個樣本對添加標簽,所述標簽表征所述語義信息與所述任一語句文本的語境信息之間是否相適配;以及利用與所述多個語句文本對應的多個帶有標簽的樣本對對所述神經網絡進行訓練,得到用于檢測成語誤用的目標神經網絡。本公開還提供了一種用于訓練神經網絡的裝置、成語誤用檢測方法及其裝置、以及電子設備。
技術領域
本公開涉及一種用于訓練神經網絡的方法及其裝置、成語誤用檢測方法及其裝置、以及電子設備。
背景技術
成語是漢語經過漫長歷史積累的語言精華,雖然多數僅由四個字構成,但其含義卻十分豐富,且部分成語有著特定的情感色彩和使用方式。合理的運用成語可以有效提高文章內涵,為文章增色。但在實際應用中,在日常生活使用、各類刊物、網絡平臺內,存在較多的成語誤用,為企業或個人造成不良影響。
發明內容
本公開的一個方面提供了一種用于訓練神經網絡的方法,包括:獲取多個語句文本。對于所述多個語句文本中的任一語句文本,從該任一語句文本中提取成語文本,并獲取該成語文本的語義信息,其中由該任一語句文本和所獲取的相應的語義信息構成一個樣本對。為每個樣本對添加標簽,標簽用于表征一個樣本對中的語義信息與語句文本的語境信息之間是否相適配。然后,利用與多個語句文本對應的多個帶有標簽的樣本對對神經網絡進行訓練,得到用于檢測成語誤用的目標神經網絡。
可選地,神經網絡包括第一編碼器、第二編碼器和分類器。上述利用與多個語句文本對應的多個帶有標簽的樣本對對神經網絡進行訓練包括:將一個樣本對輸入至神經網絡,由第一編碼器和第二編碼器分別對該樣本對中的語句文本和語義信息進行編碼,得到語句表示向量和語義表示向量,再由分類器基于該語句表示向量和語義表示向量輸出分類結果。然后,基于分類結果和該樣本對的標簽確定損失函數是否實現收斂。如果是,則確定訓練完成,得到目標神經網絡。如果否,則調整神經網絡的參數后重復上述對神經網絡進行訓練的操作,直至損失函數實現收斂。
可選地,上述由分類器基于語句表示向量和語義表示向量輸出分類結果包括:對語句表示向量和語義表示向量進行組合,得到第一特征向量。接著對第一特征向量進行全連接映射,得到關于該樣本對中的語義信息與語句文本的語境信息之間是否相適配的分類結果。
本公開的另一方面提供了一種成語誤用檢測方法,包括:獲取輸入語句文本。獲取基于如上所述的用于訓練神經網絡的方法訓練得到的目標神經網絡。從輸入語句文本中提取輸入成語文本,并獲取該輸入成語文本的語義信息。然后,利用目標神經網絡處理該輸入語句文本和該輸入成語文本的語義信息,得到表征輸入成語文本的語義信息與輸入語句文本的語境信息之間是否相適配的檢測結果。
可選地,目標神經網絡包括第一優化編碼器、第二優化編碼器和分類器。上述利用目標神經網絡處理輸入語句文本和輸入成語文本的語義信息包括:利用第一優化編碼器對輸入語句文本進行編碼,得到輸入語句表示向量。利用第二優化編碼器對輸入成語文本的語義信息進行編碼,得到成語語義表示向量。然后,利用優化分類器基于輸入語句表示向量和成語語義表示向量進行分類處理,得到檢測結果。
可選地,上述利用優化分類器基于輸入語句表示向量和成語語義表示向量進行分類處理包括:對輸入語句表示向量和成語語義表示向量進行組合,得到第二特征向量。然后,對第二特征向量進行全連接映射,得到檢測結果。
可選地,上述對輸入語句表示向量和成語語義表示向量進行組合包括:對輸入語句表示向量和成語語義表示向量進行拼接。并且/或者,對輸入語句表示向量和成語語義表示向量進行指定運算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910821030.1/2.html,轉載請聲明來源鉆瓜專利網。





