日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于語(yǔ)言模型的糾錯(cuò)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在審

專利信息
申請(qǐng)?zhí)枺?/td> 202010164817.8 申請(qǐng)日: 2020-03-11
公開(公告)號(hào): CN111428474A 公開(公告)日: 2020-07-17
發(fā)明(設(shè)計(jì))人: 劉東煜;曾增烽 申請(qǐng)(專利權(quán))人: 中國(guó)平安人壽保險(xiǎn)股份有限公司
主分類號(hào): G06F40/242 分類號(hào): G06F40/242;G06F40/216;G06F40/289;G06F40/284;G06F40/232;G06F40/263;G06F40/169;G06F16/31
代理公司: 北京市京大律師事務(wù)所 11321 代理人: 劉挽瀾
地址: 518033 廣東省深圳市福田區(qū)益田路5033號(hào)*** 國(guó)省代碼: 廣東;44
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 基于 語(yǔ)言 模型 糾錯(cuò) 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì)
【說(shuō)明書】:

發(fā)明涉及人工智能技術(shù)領(lǐng)域,公開了一種基于語(yǔ)言模型的糾錯(cuò)方法,通過(guò)語(yǔ)言模型對(duì)文本數(shù)據(jù)進(jìn)行兩次相同的分詞處理,得到第一詞序列和第二詞序列,在兩個(gè)詞序列的基礎(chǔ)上計(jì)算關(guān)鍵詞的分割概率,基于該概率對(duì)文本數(shù)據(jù)進(jìn)行從新分割,得到第三詞序列,在第三詞序列的基礎(chǔ)上進(jìn)行關(guān)鍵詞的拼音特征轉(zhuǎn)換,并進(jìn)行召回處理,得到候選詞,從候選詞中選擇一個(gè)滿足條件的關(guān)鍵詞對(duì)文本數(shù)據(jù)中對(duì)應(yīng)的關(guān)鍵詞進(jìn)行糾錯(cuò)操作;本發(fā)明還提供了一種基于語(yǔ)言模型的糾錯(cuò)裝置、設(shè)備及存儲(chǔ)介質(zhì),從而有效的提高對(duì)關(guān)鍵詞的分割和識(shí)別,同時(shí)基于召回和概率相結(jié)合來(lái)選擇正確的關(guān)鍵詞進(jìn)行替換,以此降低檢測(cè)的困難,提高的檢測(cè)的精準(zhǔn)度和效率。

技術(shù)領(lǐng)域

本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種基于語(yǔ)言模型的糾錯(cuò)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。

背景技術(shù)

現(xiàn)有技術(shù)的開源NLP(Natural Language Processing,自然語(yǔ)言處理)糾錯(cuò),僅僅靠文本語(yǔ)序進(jìn)行糾錯(cuò),具體是通過(guò)語(yǔ)言模型來(lái)實(shí)現(xiàn)。在糾錯(cuò)中,往往需要先檢測(cè)出錯(cuò)誤的位置,然后再根據(jù)錯(cuò)誤的位置來(lái)召回該位置相應(yīng)的候選詞,最后進(jìn)行糾錯(cuò)的處理。

目前,在錯(cuò)誤的檢測(cè)方法上,有很多方法,而常用的方法包括序列標(biāo)注的方法、字典匹配方法和傳統(tǒng)語(yǔ)音模型卡閾值的方式;對(duì)于利用序列標(biāo)注的方法,需要大批的人工標(biāo)注的語(yǔ)料來(lái)進(jìn)行有監(jiān)督的訓(xùn)練;對(duì)于利用字典匹配方法,又非常依賴于字典的質(zhì)量,同時(shí)也很難保證不在字典中的字就是有錯(cuò)誤的;而利用傳統(tǒng)語(yǔ)音模型很難確定閾值,可見在現(xiàn)有技術(shù)中的,對(duì)于錯(cuò)誤的關(guān)鍵詞的檢測(cè)以及糾正的實(shí)現(xiàn)方式還是比較復(fù)雜且精準(zhǔn)度也不高。

發(fā)明內(nèi)容

本發(fā)明的主要目的在于提供一種基于語(yǔ)言模型的糾錯(cuò)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),旨在解決現(xiàn)有技術(shù)中對(duì)于文本糾錯(cuò)的檢測(cè)過(guò)程復(fù)雜,且糾錯(cuò)準(zhǔn)確率不高的技術(shù)問(wèn)題。

為解決上述的問(wèn)題,在本發(fā)明的第一方面中提供了一種基于語(yǔ)言模型的糾錯(cuò)方法,所述基于語(yǔ)言模型的糾錯(cuò)方法包括:獲取待糾錯(cuò)的文本數(shù)據(jù),并根據(jù)所述語(yǔ)言模型中的分割模型,對(duì)所述文本數(shù)據(jù)進(jìn)行分詞處理,得到第一詞序列和第二詞序列;計(jì)算所述第一詞序列和第二詞序列中各個(gè)關(guān)鍵詞被所述語(yǔ)言模型分割出來(lái)的概率,并根據(jù)所述概率對(duì)所述文本數(shù)據(jù)進(jìn)行二次分詞處理,得到第三詞序列;計(jì)算所述第三詞序列中的每個(gè)關(guān)鍵詞的詞頻,其中,所述詞頻為通過(guò)所述關(guān)鍵詞查詢預(yù)設(shè)的字典統(tǒng)計(jì)得到;判斷所述詞頻是否達(dá)到預(yù)設(shè)的詞頻閾值;若否,則將對(duì)應(yīng)的第一關(guān)鍵詞,通過(guò)所述語(yǔ)言模型轉(zhuǎn)換為拼音特征;根據(jù)所述拼音特征,利用預(yù)設(shè)的召回模型召回所述第一關(guān)鍵詞對(duì)應(yīng)的候選詞,并從所述候選詞中選擇正確的詞對(duì)所述第一關(guān)鍵詞進(jìn)行糾錯(cuò)。

可選的,本發(fā)明第一方面的一個(gè)可行實(shí)施方式中,所述根據(jù)所述語(yǔ)言模型中的分割模型,對(duì)所述文本數(shù)據(jù)進(jìn)行分詞處理,得到第一詞序列和第二詞序列包括:根據(jù)正向最大匹配算法,基于從左到右的方向,將所述文本數(shù)據(jù)中的連續(xù)字符最多的字段與預(yù)設(shè)的分詞表進(jìn)行匹配,若匹配到所述分詞表中存在所述字段,則切分出一個(gè)關(guān)鍵詞,直到所述文本數(shù)據(jù)分切完成,得到所述第一詞序列;根據(jù)逆向最大匹配算法,基于從右到左的方向,將所述文本數(shù)據(jù)中的連續(xù)字符最多的字段與預(yù)設(shè)的分詞表進(jìn)行匹配,若匹配到所述分詞表中存在所述字段,則切分出一個(gè)關(guān)鍵詞,直到所述文本數(shù)據(jù)分切完成,得到所述第二詞序列。

可選的,本發(fā)明第一方面的一個(gè)可行實(shí)施方式中,所述計(jì)算所述第一詞序列和第二詞序列中各個(gè)關(guān)鍵詞在所述語(yǔ)言模型中分詞時(shí)所出現(xiàn)的概率,并根據(jù)所述概率對(duì)所述文本數(shù)據(jù)進(jìn)行二次分詞處理,得到第三詞序列包括:確定所述第一詞序列和第二詞序列中相同的第二關(guān)鍵詞和不同的第三關(guān)鍵詞;分別計(jì)算所述第一詞序列和第二詞序列中位于所述第二關(guān)鍵詞的左右兩邊的第三關(guān)鍵詞,在所述語(yǔ)言模型對(duì)歷史文本數(shù)據(jù)的分割過(guò)程中被分割出來(lái)的概率,并計(jì)算左右兩邊的所有關(guān)鍵詞的總概率;從所述第一詞序列和第二詞序列中的第二關(guān)鍵詞的左邊選擇所述總概率大的詞序段,以及從所述第一詞序列和第二詞序列中的第二關(guān)鍵詞的右邊選擇所述總概率大的詞序段;基于從所述第二關(guān)鍵詞的左邊和右邊選擇的詞序段,以及所述第二關(guān)鍵詞組成新的詞序列,得到所述第三詞序列。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)平安人壽保險(xiǎn)股份有限公司,未經(jīng)中國(guó)平安人壽保險(xiǎn)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010164817.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 精品亚洲午夜久久久久91| 精品少妇一区二区三区免费观看焕| 69久久夜色精品国产69乱青草| 日本xxxxxxxxx68护士| 小萝莉av| 国产美女三级无套内谢| 亚洲欧美一区二区精品久久久| 国产精品高潮呻吟视频| 国产97免费视频| 日本免费电影一区二区| 日本高清不卡二区| 国产精品你懂的在线| 久久中文一区| 蜜臀久久99精品久久久久久网站| www色视频岛国| 午夜一区二区视频| 精品一区二区三区视频?| 玖玖玖国产精品| 久久久中精品2020中文| 免费看农村bbwbbw高潮| 蜜臀久久99精品久久久| xxxxx色| 亚洲1区2区3区4区| 国产资源一区二区三区| 久久99国产综合精品| 日韩精品一区在线观看| 久久99久久99精品免观看软件 | 国产伦精品一区二区三区照片91 | 亚洲精品一区在线| 免费精品一区二区三区视频日产| 精品国产一级| 一区二区久久精品| 狠狠色噜噜狠狠狠狠黑人| 欧美日韩精品中文字幕| 久久中文一区| 999久久久国产| 国产一区2区3区| 日韩av在线播放观看| 色婷婷久久一区二区三区麻豆| 国产精品5区| 狠狠色噜噜狠狠狠888奇米| 国产精品高潮呻吟88av| 91久久久爱一区二区三区| 欧美精品一区二区性色| 午夜无人区免费网站| 国产91电影在线观看| 欧美日韩国产精品综合| 亚洲乱亚洲乱妇50p| 亚洲国产日韩综合久久精品| 国产极品一区二区三区| 国产伦精品一区二区三区免费迷| 久久久久久中文字幕 | 欧美国产在线看 | 色婷婷久久一区二区三区麻豆 | 亚洲伊人久久影院| 国产精品高潮呻吟三区四区 | 夜夜嗨av色一区二区不卡| 国产乱人伦偷精品视频免下载| 999久久久国产| 国产资源一区二区三区| 亚欧精品在线观看| 狠狠色丁香久久婷婷综| 亚洲欧美色图在线| 亚洲午夜天堂吃瓜在线| 国产伦精品一区二区三区免费优势| 国产伦精品一区二区三区免费迷| 亚洲乱码av一区二区三区中文在线:| 国产精品精品视频一区二区三区| 国产午夜亚洲精品午夜鲁丝片| 国产乱码一区二区| 日本激情视频一区二区三区| 欧美一级久久精品| 亚洲欧美国产中文字幕| 日韩女女同一区二区三区| 97精品国产97久久久久久粉红| 少妇在线看www| www.久久精品视频| 国内久久久| 欧美日韩一区在线视频| 国产精品久久久久久久久久久杏吧| 久久综合久久自在自线精品自| 一区二区在线国产| 在线国产精品一区二区| 国产极品美女高潮无套久久久| 欧美乱偷一区二区三区在线 | 国产欧美一区二区三区免费| 99精品小视频| 久久久精品久久日韩一区综合| 艳妇荡乳欲伦2| 欧美乱码精品一区二区三| 国产精品一二三区视频出来一| 8x8x国产一区二区三区精品推荐| 亚洲乱小说| 日韩精品中文字幕一区| 99国产精品久久久久老师| 久久国产精品久久| 欧美久久一区二区三区| 丰满少妇高潮惨叫久久久| 91片在线观看| 婷婷嫩草国产精品一区二区三区| 久久精品一二三| 国产精品免费一视频区二区三区| 日韩在线一区视频| 国产中文字幕一区二区三区| 精品综合久久久久| 国产在线一二区| 日韩国产精品久久久久久亚洲| 国产亚洲综合一区二区| 久久久久亚洲精品视频| 香港三日三级少妇三级99| 偷拍久久精品视频| 99国产精品永久免费视频| 国产全肉乱妇杂乱视频在线观看| 国产日韩一二三区| 亚洲国产精品第一区二区| 欧美三级午夜理伦三级中视频| 欧美精品一区二区三区视频| 99精品国产99久久久久久97| 丰满少妇高潮惨叫久久久一| 亚洲第一区国产精品| 欧美乱妇在线观看| 国产精品一区在线播放| 国产精品久久久久久久久久久杏吧| 91精品一区二区中文字幕| 一区精品二区国产| 欧洲另类类一二三四区| 久久99久国产精品黄毛片入口| 国产欧美综合一区| 国产精品尤物麻豆一区二区三区| 久久综合激情网| 一区二区三区国产精品视频 | 国产午夜精品一区二区三区四区| 欧美xxxxxhd| 91麻豆精品一区二区三区| 四虎精品寂寞少妇在线观看| 99久久精品免费视频| 欧美精品一区二区三区在线四季| 满春阁精品av在线导航| 欧美乱码精品一区二区 | 国产电影精品一区| 国产精品一二三区视频网站| 欧美高清性xxxx| 亚洲免费永久精品国产| 伊人av中文av狼人av| 欧美午夜理伦三级在线观看偷窥| 亚洲欧美一区二| 免费观看又色又爽又刺激的视频| 欧美精品一区久久| 欧美一区久久| 国产欧美精品久久| 99国精视频一区一区一三| 国产精品一区二区久久乐夜夜嗨| 久久精品99国产国产| 午夜av网址| 狠狠色噜噜狠狠狠四色米奇| 一区二区在线视频免费观看| 午夜精品在线观看| 欧美乱战大交xxxxx| 国产三级在线视频一区二区三区 | 国产精华一区二区精华| 夜夜躁日日躁狠狠久久av| 欧美黑人巨大久久久精品一区| 国产日韩欧美精品一区 | 香港三日本三级三级三级| 国产伦精品一区二区三区免费优势| 91精品啪在线观看国产手机 | 午夜激情在线免费观看| 欧美一级特黄乱妇高清视频| 玖玖精品国产| 91精品美女| 久久夜色精品久久噜噜亚| 一本色道久久综合亚洲精品图片| 日本一区二区三区在线视频| 午夜天堂在线| 日韩久久精品一区二区| 国产精品v欧美精品v日韩| 国产一区二区视频免费观看| 狠狠躁夜夜躁| 四虎国产永久在线精品| 欧美国产在线看| 素人av在线| 国产99久久九九精品| 午夜影院一区二区| 亚洲精品久久久久玩吗| 欧美一区二区三区四区夜夜大片 | 97午夜视频| 欧美日韩精品在线一区| 精品免费久久久久久久苍| 国产一区二区视频免费观看| 久久国产欧美一区二区三区精品| 色婷婷综合久久久久中文| 国产精品一级片在线观看| 国产真实一区二区三区| 国产欧美久久一区二区三区| 草逼视频网站| 欧美精品亚洲一区| 淫片免费看| 91福利试看| 国产精品亚洲一区| 国产一区不卡视频| 久久久一二区| 真实的国产乱xxxx在线91| 亚洲国产视频一区二区三区| 丰满少妇高潮惨叫久久久| 香蕉久久国产| 欧美精品乱码视频一二专区| 97人人模人人爽人人喊38tv | 欧美精品一区二区性色| 97人人模人人爽人人喊小说| 国产69精品福利视频| 91久久精品久久国产性色也91| 久久久久亚洲| 日韩久久影院| 91精品一区二区中文字幕| **毛片在线| 亚洲午夜精品一区二区三区电影院 | 亚洲第一区国产精品| 国产91丝袜在线熟| 国产香蕉97碰碰久久人人| 免费视频拗女稀缺一区二区| 一级久久久| 首页亚洲欧美制服丝腿| 国产91精品一区| 久久中文一区| 国产亚洲久久| 国产欧美一区二区三区四区| 欧美国产在线看| 狠狠搞av| 国产二区三区视频| 国产1区2区3区中文字幕| 偷拍精品一区二区三区| 99爱国产精品| 久久国产欧美一区二区免费| 午夜国产一区二区三区| 亚洲无人区码一码二码三码| 欧美一区免费| 国产精品二十区| 丝袜脚交一区二区| 精品福利一区二区| 波多野结衣女教师电影| 国产视频精品一区二区三区| 99三级视频| 强行挺进女警紧窄湿润| 亚洲五码在线| 日韩亚洲精品视频| 国产精品久久久麻豆|