[發(fā)明專利]基于capsule網(wǎng)絡(luò)的輸入法輸出字符預(yù)測方法在審
| 申請?zhí)枺?/td> | 201810565819.0 | 申請日: | 2018-06-04 |
| 公開(公告)號: | CN108762523A | 公開(公告)日: | 2018-11-06 |
| 發(fā)明(設(shè)計)人: | 薛方正;古俊波;劉陽陽;羅勝元 | 申請(專利權(quán))人: | 重慶大學 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06N3/04;G06N3/08 |
| 代理公司: | 重慶晟軒知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 50238 | 代理人: | 王海鳳 |
| 地址: | 400044 *** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 預(yù)測 輸出字符 文本數(shù)據(jù) 輸入法 訓(xùn)練集 神經(jīng)網(wǎng)絡(luò)單元 預(yù)測模型訓(xùn)練 變換矩陣 內(nèi)在聯(lián)系 神經(jīng)網(wǎng)絡(luò) 輸入預(yù)測 隨機設(shè)置 傳統(tǒng)的 詞向量 迭代 字典 網(wǎng)絡(luò) 捕捉 輸出 語言 | ||
1.基于capsule網(wǎng)絡(luò)的輸入法輸出字符預(yù)測方法,其特征在于:包括如下步驟:
S1:獲取已知的文本數(shù)據(jù)集;
使用jieba分詞工具對獲取到的文本數(shù)據(jù)集進行分詞;
將已經(jīng)分詞過的文本數(shù)據(jù)集通過word2vec訓(xùn)練生成詞向量字典;
S2:設(shè)定迭代次數(shù)為N,預(yù)設(shè)每層神經(jīng)網(wǎng)絡(luò)中變換矩陣和加權(quán)系數(shù)的初始值;
將已經(jīng)分詞的文本數(shù)據(jù)集中的詞通過詞向量字典轉(zhuǎn)化為對應(yīng)詞向量,并對所有詞向量進行分組,每個詞向量組中包括x+1個詞向量,每輸入一個詞向量組完成一次迭代,同時每層神經(jīng)網(wǎng)絡(luò)中的變換矩陣更新一次,迭代次數(shù)完成,每層神經(jīng)網(wǎng)絡(luò)中的變換矩陣更新結(jié)束,即預(yù)測模型訓(xùn)練完成;
S3:當用戶輸入x個詞時,先將該x個詞分別轉(zhuǎn)化為詞向量,轉(zhuǎn)化后的詞向量構(gòu)成待預(yù)測詞向量組,將所述待預(yù)測詞向量組輸入步驟S2得到的預(yù)測模型,輸出預(yù)測值,最后將預(yù)測值分別轉(zhuǎn)化為詞輸出。
2.如權(quán)利要求1所述的基于capsule網(wǎng)絡(luò)的輸入法輸出字符預(yù)測方法,其特征在于:所述步驟S2中預(yù)測模型的訓(xùn)練方法如下:
S2a:設(shè)將已經(jīng)分詞的文本數(shù)據(jù)集中的詞轉(zhuǎn)化為詞向量,并對所有詞向量進行分組,得到M個詞向量組,其中每個詞向量組中第x+1個詞向量為期望值;
1)令k=1;
2)
其中,表示輸入神經(jīng)元經(jīng)過變化矩陣之后的狀態(tài),uk|i表示輸入的第k個詞向量組的第i個詞的詞向量,Wji表示神經(jīng)網(wǎng)絡(luò)輸入層到變換層的變換矩陣,i表示輸入詞向量的維度,j表示輸入詞向量經(jīng)過變化矩陣后的維度大小;
3)
其中,s表示對加權(quán)求和之后的值,ci表示加權(quán)系數(shù),x表示輸入的詞向量的個數(shù);
4)
其中,v表示對s進行壓縮后的狀態(tài);
5)將神經(jīng)網(wǎng)絡(luò)的實際輸出與詞向量字典中的每個詞向量采用如下公式做內(nèi)積;
Y=softmax(av),其中a表示詞向量字典,
Y表示詞向量字典中詞的輸出概率,將詞向量字典中輸出概率最大的那個詞向量作為預(yù)測值;
6)將預(yù)測值與所述期望值做差,然后根據(jù)差值采用梯度下降法對Wji進行更新,使用動態(tài)路由對ci進行更新;
7)如果k≤M,則令k=k+1,并返回步驟2),否則執(zhí)行下一步;
8)保存模型參數(shù)Wji|last,ci|last;
S2b:所述預(yù)測模型為:
a)
其中,表示輸入神經(jīng)元經(jīng)過變化矩陣之后的狀態(tài),ui表示輸入的第i個詞的詞向量;
b)
其中,s表示對加權(quán)求和之后的一個狀態(tài);
c)
其中,v表示對s進行壓縮后的狀態(tài);
d)將神經(jīng)網(wǎng)絡(luò)的實際輸出與詞向量字典中的每個詞向量采用如下公式做內(nèi)積用于評價他們的相似度;
Y=softmax(av),其中a表示詞向量字典,
Y表示詞向量字典中詞的輸出概率,將所有輸出概率從大到小排序,輸出概率值位于前Q位所對應(yīng)的詞向量作為預(yù)測值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶大學,未經(jīng)重慶大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810565819.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)
- 一種韻律預(yù)測方法及系統(tǒng)
- 一種基于KNN技術(shù)的語料庫文本分類方法
- 文本數(shù)據(jù)標注方法及裝置、存儲介質(zhì)、電子設(shè)備
- 數(shù)據(jù)采集方法、裝置、設(shè)備及計算機可讀存儲介質(zhì)
- 文本的處理、文本分類模型的訓(xùn)練方法及裝置
- 文本加密方法及裝置、終端設(shè)備、存儲介質(zhì)
- 文本數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- 富文本數(shù)據(jù)處理方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 文本分類模型構(gòu)建、文本分類方法及裝置
- 文本匹配方法、裝置、設(shè)備及存儲介質(zhì)





