[發(fā)明專利]一種語句的糾錯方法及設(shè)備在審
| 申請?zhí)枺?/td> | 201911157807.5 | 申請日: | 2019-11-22 |
| 公開(公告)號: | CN112836495A | 公開(公告)日: | 2021-05-25 |
| 發(fā)明(設(shè)計(jì))人: | 曹源 | 申請(專利權(quán))人: | TCL集團(tuán)股份有限公司 |
| 主分類號: | G06F40/232 | 分類號: | G06F40/232;G06F40/289 |
| 代理公司: | 深圳中一聯(lián)合知識產(chǎn)權(quán)代理有限公司 44414 | 代理人: | 左婷蘭 |
| 地址: | 516006 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語句 糾錯 方法 設(shè)備 | ||
1.一種語句的糾錯方法,其特征在于,包括:
通過預(yù)設(shè)的關(guān)聯(lián)概率識別模型識別目標(biāo)語句包含的異常分詞;
將所述目標(biāo)語句內(nèi)的所述異常分詞替換為合法分詞,得到已糾錯語句。
2.根據(jù)權(quán)利要求1所述的糾錯方法,其特征在于,所述通過預(yù)設(shè)的關(guān)聯(lián)概率識別模型識別目標(biāo)語句包含的異常分詞,包括:
在所述目標(biāo)語句中選取多個連續(xù)的字符得到字符串;
分別計(jì)算各個所述字符與所述字符串內(nèi)其余字符之間的關(guān)聯(lián)度;
根據(jù)各個所述字符對應(yīng)的所述關(guān)聯(lián)度,確定所述字符串的分詞關(guān)聯(lián)系數(shù);
若所述分詞關(guān)聯(lián)系數(shù)小于預(yù)設(shè)的關(guān)聯(lián)閾值,則識別所述字符串包含異常分詞。
3.根據(jù)權(quán)利要求2所述的糾錯方法,其特征在于,所述在所述目標(biāo)語句中選取多個連續(xù)的字符得到字符串,包括:
在所述目標(biāo)語句中框取預(yù)設(shè)個數(shù)的多個連續(xù)的所述字符,得到所述字符串。
4.根據(jù)權(quán)利要求1所述的糾錯方法,其特征在于,在所述通過預(yù)設(shè)的關(guān)聯(lián)概率識別模型識別目標(biāo)語句包含的異常分詞之前,還包括:
獲取模型學(xué)習(xí)參數(shù);所述模型學(xué)習(xí)參數(shù)包括:初始效率、最低效率、效率調(diào)整步長以及學(xué)習(xí)周期個數(shù);
根據(jù)所述初始效率設(shè)置第N個學(xué)習(xí)周期的學(xué)習(xí)效率;所述N的初始值為1;
通過多個訓(xùn)練樣本以所述第N個學(xué)習(xí)周期學(xué)習(xí)效率對所述關(guān)聯(lián)概率識別模型進(jìn)行訓(xùn)練學(xué)習(xí),直到所述關(guān)聯(lián)概率識別模型的損失函數(shù)的輸出值小于預(yù)設(shè)的收斂閾值;
對N的值進(jìn)行加1操作,并基于所述效率調(diào)整步長減少第N-1個學(xué)習(xí)周期的學(xué)習(xí)效率,將調(diào)整后的第N-1個學(xué)習(xí)周期的學(xué)習(xí)效率識別為第N個學(xué)習(xí)周期的學(xué)習(xí)效率;
若所述學(xué)習(xí)效率小于所述最低效率,則將所述學(xué)習(xí)效率設(shè)置為初始效率,并返回執(zhí)行所述通過多個訓(xùn)練樣本以所述第N個學(xué)習(xí)周期學(xué)習(xí)效率對所述關(guān)聯(lián)概率識別模型進(jìn)行訓(xùn)練學(xué)習(xí)的操作;
若所述學(xué)習(xí)效率大于或等于最低效率,則返回執(zhí)行通過多個訓(xùn)練樣本以所述第N個學(xué)習(xí)周期學(xué)習(xí)效率對所述關(guān)聯(lián)概率識別模型進(jìn)行訓(xùn)練學(xué)習(xí)的操作;
若所述N的值大于所述學(xué)習(xí)周期個數(shù),則識別所述關(guān)聯(lián)概率識別模型已訓(xùn)練完畢。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的糾錯方法,其特征在于,在所述通過預(yù)設(shè)的關(guān)聯(lián)概率識別模型識別目標(biāo)語句包含的異常分詞之前,還包括:
將待糾錯的原始語句導(dǎo)入到初始糾錯模型,生成所述原始語句對應(yīng)的所述目標(biāo)語句。
6.根據(jù)權(quán)利要求5所述的糾錯方法,其特征在于,所述將待糾錯的原始語句導(dǎo)入到初始糾錯模型,生成所述原始語句對應(yīng)的所述目標(biāo)語句,包括:
通過預(yù)設(shè)的語句編碼網(wǎng)絡(luò)對所述原始語句進(jìn)行編碼,輸出關(guān)于所述原始語句的編碼序列;
將所述編碼序列導(dǎo)入關(guān)注度計(jì)算模型,計(jì)算所述編碼序列內(nèi)各個元素在所述原始語句中的語句權(quán)重;
將所述語句權(quán)重以及所述編碼序列導(dǎo)入到預(yù)設(shè)的語句譯碼網(wǎng)絡(luò),生成所述原始語句對應(yīng)的目標(biāo)語句。
7.根據(jù)權(quán)利要求6所述的糾錯方法,其特征在于,所述通過預(yù)設(shè)的語句編碼網(wǎng)絡(luò)對所述原始語句進(jìn)行編碼,輸出關(guān)于所述原始語句的編碼序列,包括:
將所述原始語句劃分為至少一個短句;
若任一所述短句的實(shí)際字符數(shù)小于預(yù)設(shè)的預(yù)設(shè)標(biāo)準(zhǔn)個數(shù),則將無效字符填入所述短句,生成標(biāo)準(zhǔn)句;
通過預(yù)設(shè)的語句編碼網(wǎng)絡(luò)對所有所述標(biāo)準(zhǔn)句進(jìn)行編碼,輸出關(guān)于所述原始語句的編碼序列。
8.根據(jù)權(quán)利要求7所述的糾錯方法,其特征在于,所述將所述語句權(quán)重以及所述編碼序列導(dǎo)入到預(yù)設(shè)的語句譯碼網(wǎng)絡(luò),生成所述原始語句對應(yīng)的目標(biāo)語句,包括:
基于各個所述標(biāo)準(zhǔn)句內(nèi)包含的所述無效字符,生成所述原始語句的無效字符過濾矩陣;
將所述無效字符過濾矩陣、所述語句權(quán)重以及所述編碼序列導(dǎo)入到預(yù)設(shè)的語句譯碼網(wǎng)絡(luò),生成所述原始語句對應(yīng)的目標(biāo)語句。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于TCL集團(tuán)股份有限公司,未經(jīng)TCL集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911157807.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于聊天大數(shù)據(jù)知識庫的機(jī)器人對話控制方法和系統(tǒng)
- 基于大數(shù)據(jù)搜索的幽默型機(jī)器人對話控制方法和系統(tǒng)
- 基于對話知識庫的機(jī)器人對話控制方法和系統(tǒng)
- 一種自然語言語句評價方法及裝置
- 句子級雙語對齊方法及系統(tǒng)
- 一種獲取相似語句的方法、裝置、存儲介質(zhì)及電子設(shè)備
- 一種翻譯模型結(jié)果重排序的方法及裝置
- 用于輸出信息的方法、裝置、設(shè)備以及存儲介質(zhì)
- 搜索推薦方法和裝置、服務(wù)器、計(jì)算機(jī)可讀存儲介質(zhì)
- 文本識別方法、裝置、電子設(shè)備和可讀存儲介質(zhì)
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗(yàn)設(shè)備、驗(yàn)證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點(diǎn)設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





