[發(fā)明專利]一種用于確定候選項的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法和裝置在審
| 申請?zhí)枺?/td> | 201811190172.4 | 申請日: | 2018-10-12 |
| 公開(公告)號: | CN111124141A | 公開(公告)日: | 2020-05-08 |
| 發(fā)明(設(shè)計)人: | 王丹;崔欣;張揚 | 申請(專利權(quán))人: | 北京搜狗科技發(fā)展有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06F40/284;G06N3/04 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 郭化雨;朱靜 |
| 地址: | 100084 北京市海淀區(qū)中關(guān)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 確定 候選 神經(jīng)網(wǎng)絡(luò) 模型 訓(xùn)練 方法 裝置 | ||
本申請實施例公開了一種用于確定候選項的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法和裝置,從用戶的歷史上屏數(shù)據(jù)確定滿足該用戶自身輸入習(xí)慣的個性化輸入方式。如果第一詞在該個性化輸入方式中具有第一組詞關(guān)系,且該第一組詞關(guān)系與第二詞對應(yīng)的第二組詞關(guān)系相似度較高,那么可以確定第一詞的詞義與第二詞在第二組詞關(guān)系的詞義近似,根據(jù)第二詞在第二組詞關(guān)系下的詞義調(diào)整用于標(biāo)識第一詞詞義的詞嵌入向量,使得第一詞的詞嵌入向量體現(xiàn)出第二詞詞義。若根據(jù)調(diào)整后的詞嵌入向量以及第一組詞關(guān)系訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練得到的模型根據(jù)字符串確定出的候選項能夠符合該用戶的輸入個性,被該用戶選擇上屏的幾率更高,從而提高了該用戶的輸入效率,提升了該用戶的輸入體驗。
技術(shù)領(lǐng)域
本申請涉及輸入法領(lǐng)域,特別是涉及用于確定候選項的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法和裝置。
背景技術(shù)
輸入法屬于一種常用的文字輸入工具,例如可以根據(jù)用戶輸入的字符串展示對應(yīng)的候選項,并將用戶選擇的候選項進行上屏。
針對不同的用戶,輸入法在確定用戶輸入字符串所對應(yīng)候選項時,一般通過同一個語言模型對字符串進行組詞來確定對應(yīng)的候選項。然而,不同用戶的輸入習(xí)慣并不盡相同,具有個性化因素,例如同一個詞在使用過程中表達(dá)的含義和使用語境對于不同用戶來說可能有所區(qū)別,導(dǎo)致不同用戶在輸入相同的字符串時,所要選擇上屏的內(nèi)容并不相同。
故如果不考慮用戶的個性化輸入方式而簡單采用統(tǒng)一的語言模型來確定候選項,會導(dǎo)致一些輸入場景下,用戶在輸入字符串后,輸入法所展示的候選項中并沒有用戶實際希望上屏的候選項,或者用戶實際希望上屏的候選項展示在較后位置導(dǎo)致用戶需要多次翻頁才能選擇,從而降低用戶的輸入體驗。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,本申請?zhí)峁┝艘环N用于確定候選項的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法和裝置,提高了該用戶的輸入效率,提升了該用戶的輸入體驗。
本申請實施例公開了如下技術(shù)方案:
第一方面,本申請實施例提供了一種用于確定候選項的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法,所述方法包括:
根據(jù)用戶的歷史上屏數(shù)據(jù),確定所述用戶的個性化輸入方式;
若在所述個性化輸入方式中第一詞對應(yīng)的第一組詞關(guān)系與第二詞對應(yīng)的第二組詞關(guān)系滿足相似條件,根據(jù)所述第二詞在所述第二組詞關(guān)系下的詞義調(diào)整用于標(biāo)識所述第一詞詞義的詞嵌入向量;
根據(jù)調(diào)整后的所述詞嵌入向量以及所述第一組詞關(guān)系訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,所述神經(jīng)網(wǎng)絡(luò)模型用于為所述用戶輸入的字符串確定對應(yīng)的候選項。
可選的,所述根據(jù)用戶的歷史上屏數(shù)據(jù),確定所述用戶的個性化輸入方式,包括:
根據(jù)所述用戶的歷史上屏數(shù)據(jù),通過所述神經(jīng)網(wǎng)絡(luò)模型確定所述用戶的個性化輸入方式。
可選的,在訓(xùn)練完所述神經(jīng)網(wǎng)絡(luò)模型后,所述方法還包括:
獲取所述用戶輸入的字符串;
根據(jù)所述神經(jīng)網(wǎng)絡(luò)模型確定所述字符串對應(yīng)的候選項。
可選的,所述字符串具有至少三個分詞結(jié)構(gòu)。
可選的,在展示所述字符串對應(yīng)的候選項之后,所述方法還包括:
若檢測到所述用戶沒有選擇所展示的候選項,將所展示的候選項作為訓(xùn)練所述神經(jīng)網(wǎng)絡(luò)模型的錯誤樣本。
第二方面,本申請實施例提供了一種用于確定候選項的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練裝置,所述裝置包括確定單元、調(diào)整單元和訓(xùn)練單元:
所述確定單元,用于根據(jù)用戶的歷史上屏數(shù)據(jù),確定所述用戶的個性化輸入方式;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811190172.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





