[發(fā)明專利]一種基于深度學(xué)習(xí)及遺忘算法的中文分詞方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811258651.5 | 申請(qǐng)日: | 2018-10-26 |
| 公開(kāi)(公告)號(hào): | CN109388806B | 公開(kāi)(公告)日: | 2023-06-27 |
| 發(fā)明(設(shè)計(jì))人: | 盧學(xué)裕;王安;楊大海;楊利軍 | 申請(qǐng)(專利權(quán))人: | 北京布本智能科技有限公司 |
| 主分類號(hào): | G06F40/289 | 分類號(hào): | G06F40/289;G06F40/237;G06N20/00 |
| 代理公司: | 北京東方芊悅知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11591 | 代理人: | 陳靳秋 |
| 地址: | 100102 北京市朝陽(yáng)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 遺忘 算法 中文 分詞 方法 | ||
1.一種基于深度學(xué)習(xí)及遺忘算法的中文分詞方法,其特征在于,包括以下步驟:
步驟一:逐字掃描句子獲取自然語(yǔ)言,采用深度學(xué)習(xí)分詞方法對(duì)掃描的自然語(yǔ)言劃分成詞語(yǔ)序列收入至第一詞庫(kù);
步驟二:逐字掃描句子獲取自然語(yǔ)言,采用遺忘算法分詞方法對(duì)獲取的自然語(yǔ)言進(jìn)行斷字劃分成候選詞收入至第二詞庫(kù),
步驟三:將第一詞庫(kù)中的詞語(yǔ)序列與第二詞庫(kù)中的候選詞融合獲取最終分詞結(jié)果,其中,融合方法為:
第一詞庫(kù)與第二詞庫(kù)均為詞,則合并為詞;第一詞庫(kù)與第二詞庫(kù)均為單字,則合并為字;第二詞庫(kù)中的連續(xù)單字,若對(duì)應(yīng)深度學(xué)習(xí)中為詞,則合并為詞;第二詞庫(kù)中的單個(gè)單字,若對(duì)應(yīng)深度學(xué)習(xí)中為詞,則向前或向后合并為詞;
所述步驟二遺忘算法分詞方法采用判斷公式為:
P(Wn?Wn+1)<P(Wn)*P(Wn+1)
其中,Wn為在掃描句子中第n個(gè)字
P(Wn):
P(Wn?Wn+1):
所述步驟二中遺忘算法采用的遺忘曲線為牛頓冷卻曲線。
2.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)及遺忘算法的中文分詞方法,其特征在于,所述步驟一深度學(xué)習(xí)分詞方法采用RNN方法。
3.根據(jù)權(quán)利要求1或2所述的一種基于深度學(xué)習(xí)及遺忘算法的中文分詞方法,其特征在于,所述步驟一深度學(xué)習(xí)分詞方法采用RNN方法中的LSTM模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京布本智能科技有限公司,未經(jīng)北京布本智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811258651.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





