日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專(zhuān)利]一種基于多模態(tài)模型的漢字易混淆集構(gòu)建方法有效

專(zhuān)利信息
申請(qǐng)?zhí)枺?/td> 202110402126.1 申請(qǐng)日: 2021-04-14
公開(kāi)(公告)號(hào): CN112990353B 公開(kāi)(公告)日: 2021-07-30
發(fā)明(設(shè)計(jì))人: 李芳芳;汪業(yè)成;林中堯;單悠然;毛星亮 申請(qǐng)(專(zhuān)利權(quán))人: 中南大學(xué)
主分類(lèi)號(hào): G06K9/62 分類(lèi)號(hào): G06K9/62;G06K9/68;G06N3/08;G10L15/06;G10L15/08;G10L15/16;G10L15/183;G10L25/51
代理公司: 長(zhǎng)沙惟盛赟鼎知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 43228 代理人: 滕澧陽(yáng)
地址: 410000 湖南*** 國(guó)省代碼: 湖南;43
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 多模態(tài) 模型 漢字 混淆 構(gòu)建 方法
【說(shuō)明書(shū)】:

發(fā)明涉及漢字易混淆集構(gòu)建領(lǐng)域,公開(kāi)了一種基于多模態(tài)模型的漢字易混淆集構(gòu)建方法。S1:得到字形編碼的相似度,S2:得到字音編碼的相似度,S3:構(gòu)建并訓(xùn)練出一個(gè)圖像分類(lèi)的神經(jīng)網(wǎng)絡(luò)模型,由圖像分類(lèi)的神經(jīng)網(wǎng)絡(luò)模型輸出一個(gè)M維的向量,S4:構(gòu)建并訓(xùn)練出一個(gè)音頻分類(lèi)的神經(jīng)網(wǎng)絡(luò)模型,由音頻分類(lèi)的神經(jīng)網(wǎng)絡(luò)模型輸出一個(gè)M維的向量,S5:將漢字字符Ci的字形編碼相似度向量、字音編碼相似度向量、字形視覺(jué)易混淆向量、字音聽(tīng)覺(jué)易混淆向量,加權(quán)組合為一個(gè)向量,作為音形易混淆向量,從而依據(jù)音形易混淆向量中每個(gè)維度上的相似度,選擇對(duì)應(yīng)的字典Dic中的漢字,構(gòu)成音形易混淆集。本發(fā)明能夠模擬人的視覺(jué)和聽(tīng)覺(jué)構(gòu)建易混淆集。

技術(shù)領(lǐng)域

本發(fā)明屬于漢字易混淆集構(gòu)建領(lǐng)域,尤其涉及一種基于多模態(tài)模型的漢字易混淆集構(gòu)建方法。

背景技術(shù)

中文文本糾錯(cuò)是中文自然語(yǔ)言處理中一項(xiàng)傳統(tǒng)而重要的預(yù)處理任務(wù)。對(duì)于一段含有拼寫(xiě)錯(cuò)誤的自然文本,如果沒(méi)有糾正就去做文本分類(lèi)和命名實(shí)體識(shí)別等自然語(yǔ)言任務(wù),勢(shì)必會(huì)影響做這些任務(wù)的模型的學(xué)習(xí)效果和判斷能力。

人輸入的字句尤其是長(zhǎng)文本時(shí),即使經(jīng)歷多次檢查,也會(huì)或多或少都出現(xiàn)語(yǔ)病、錯(cuò)別字、漏字多字等錯(cuò)誤,這是因?yàn)槿撕茈y長(zhǎng)時(shí)間保持專(zhuān)注。此外如果是自己檢查自己寫(xiě)的文字,那么思維的定勢(shì)也將會(huì)影響錯(cuò)誤的檢查。

而使用計(jì)算機(jī)算法實(shí)現(xiàn)的拼寫(xiě)檢查,可以幫助人們做拼寫(xiě)檢查,甚至糾錯(cuò)的工作。因此,拼寫(xiě)檢查對(duì)文字出版商,對(duì)學(xué)生論文的修改等應(yīng)用場(chǎng)景具有重要的意義。

易混淆集是現(xiàn)在大多數(shù)拼寫(xiě)檢查和拼寫(xiě)糾錯(cuò)任務(wù)都使用到的一個(gè)重要數(shù)據(jù)。如,我們?cè)谖谋局行枰褂玫健氨钡牡胤剑苋菀族e(cuò)誤會(huì)被替換成“暴”,“曝”等詞,造成一些拼寫(xiě)甚至語(yǔ)法上的錯(cuò)誤。這里“暴”,“曝”等字構(gòu)成的集合就是“爆”的易混淆集。

易混淆集一直在中文文本糾錯(cuò)中扮演著重要角色。

Linetal.2015用易混淆集和N-gram算法做中文文本糾錯(cuò);

Wangetal.2019用易混淆集和指針網(wǎng)絡(luò)做中文文本糾錯(cuò);

Chengetal.2020分別用字音的易混淆集和字形的易混淆集構(gòu)建一個(gè)圖,然后用圖神經(jīng)網(wǎng)絡(luò)的方法把圖嵌入成向量。接著用該向量與Bert模型的輸出進(jìn)行對(duì)應(yīng)元素相乘,得出結(jié)果作為最后輸出的預(yù)測(cè)向量。

關(guān)于易混淆集的生成,有學(xué)者對(duì)4100個(gè)錯(cuò)誤的漢字的研究統(tǒng)計(jì),發(fā)現(xiàn)76%的錯(cuò)誤與正確字符和錯(cuò)誤字符之間的語(yǔ)音相似性有關(guān),46%是由于視覺(jué)相似性,29%涉及兩個(gè)因素。這表明漢字與該漢字對(duì)應(yīng)的易混淆集的易混淆性,往往與字音和字形的相似度有關(guān)。

近年來(lái),已經(jīng)有很多學(xué)者基于這點(diǎn),提出了生成易混淆集的一些方式,包括:

Liuetal.2011用倉(cāng)頡碼進(jìn)判斷漢字之間的視覺(jué)相似性,用經(jīng)驗(yàn)規(guī)則來(lái)確定漢語(yǔ)音素之間的相似度。接著混合字形和字音相似度,并取相似度達(dá)到閾值的項(xiàng)選為易混淆集。

Shietal.2014利用筆順相似度和字音的點(diǎn)陣相似度構(gòu)建初始易混淆集。然后在原有易混淆集的基礎(chǔ)上,根據(jù)易混淆關(guān)系構(gòu)建一張圖,在圖上設(shè)計(jì)了一些基于規(guī)則的自擴(kuò)展算法和開(kāi)源外部補(bǔ)充算法,來(lái)擴(kuò)展易混淆集。

Leeetal.2019使用Jaccard系數(shù)計(jì)算字形相似度;為韻母、音調(diào)分別制定規(guī)則,計(jì)算字音相似度,然后綜合音形相似度生成易混淆集。

目前為止,中文易混淆集的生成,基本都使用了字音形相似的思路。不過(guò)目前這些文章的思路都有一個(gè)明顯的共性,就是對(duì)官方給出的漢字的字音和字形的編碼來(lái)設(shè)定特定的規(guī)則求字音和字形的相似度;而不是從模擬人本身的視覺(jué)和聽(tīng)覺(jué)感官來(lái)評(píng)估字音和字形對(duì)于人的易混淆程度。這種直接的方式會(huì)帶來(lái)以下兩個(gè)問(wèn)題:

下載完整專(zhuān)利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中南大學(xué),未經(jīng)中南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110402126.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。

×

專(zhuān)利文獻(xiàn)下載

說(shuō)明:

1、專(zhuān)利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利說(shuō)明書(shū);

2、支持發(fā)明專(zhuān)利 、實(shí)用新型專(zhuān)利、外觀設(shè)計(jì)專(zhuān)利(升級(jí)中);

3、專(zhuān)利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專(zhuān)利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專(zhuān)利網(wǎng)在線咨詢(xún)

周一至周五 9:00-18:00

咨詢(xún)?cè)诰€客服咨詢(xún)?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 欧美日韩卡一卡二| 久久久久亚洲精品| 福利片一区二区三区| 国产区二区| 精品国产区| 波多野结衣女教师30分钟| 欧美国产三区| 午夜社区在线观看| 96国产精品视频| 国产精品视频免费看人鲁| 日韩一区国产| 中文在线√天堂| 一区二区在线不卡| 日本午夜久久| 99久久免费毛片基地| 精品国产伦一区二区三区免费| 91久久一区二区| 久久国产欧美一区二区三区免费| 狠狠插影院| 窝窝午夜精品一区二区| 在线国产二区| 久久99国产精品视频| 黄色香港三级三级三级| 69xx国产| 亚洲国产精品一区二区久久hs| 欧美日韩国产精品一区二区亚洲| 一区二区三区欧美视频| 日韩国产精品久久久久久亚洲| 欧美日韩亚洲三区| 少妇又紧又色又爽又刺激的视频 | 991本久久精品久久久久| 亚洲女人av久久天堂| 亚洲精品无吗| 久久久久国产精品www| 欧美一级久久精品| 午夜少妇性影院免费观看| 国产片91| 福利片一区二区三区| 97久久国产亚洲精品超碰热| 久久精品国产一区二区三区不卡| 性夜影院在线观看| 国产亚洲综合一区二区| 91波多野结衣| 久久精品亚洲精品国产欧美| 久久精品手机视频| 国产精品香蕉在线的人| 国产午夜精品一区二区三区欧美| 国产乱色国产精品播放视频| 中文字幕区一区二| 午夜剧场一区| 欧美系列一区二区| 久久精品国产精品亚洲红杏| 欧美日韩九区| 亚洲一区中文字幕| 91人人爽人人爽人人精88v| 国产一级二级在线| 午夜天堂电影| 日韩欧美激情| 亚洲三区二区一区| 免费久久99精品国产婷婷六月| 99久久国产免费,99久久国产免费大片 | 狠狠色丁香久久婷婷综合丁香| 亚洲二区在线播放视频| 欧美一区二区三区久久综合| 猛男大粗猛爽h男人味| 日韩av在线中文| 国内少妇偷人精品视频免费| 欧美一区二区三区久久久| 欧美一区二区三区三州| 羞羞免费视频网站| 国产精品1区二区| 欧美一区二区色| 国产精品免费自拍| xoxoxo亚洲国产精品| 国产偷久久一区精品69| 91精品综合在线观看| 久久五月精品| 日韩亚洲国产精品| 国产午夜精品一区理论片飘花| 久久99精品国产麻豆婷婷洗澡| 午夜爱爱电影| 久久久久国产精品免费免费搜索 | 免费看大黄毛片全集免费| 午夜精品在线播放| 日韩av电影手机在线观看| 99色精品视频| 色一情一乱一乱一区免费网站| 亚洲国产精品国自产拍av| 美女销魂免费一区二区| 中文字幕国内精品| 欧美日韩中文字幕一区| 久久乐国产精品| 欧美3p激情一区二区三区猛视频| 夜夜爱av| 91精品丝袜国产高跟在线| 亚州精品中文| 99久久久国产精品免费无卡顿| 热99re久久免费视精品频软件| 精品一区二区三区自拍图片区| 国产精品丝袜综合区另类| 亚洲v欧美v另类v综合v日韩v| 99re热精品视频国产免费| 国产目拍亚洲精品区一区| 欧美乱偷一区二区三区在线| 国产91色综合| 国产精品19乱码一区二区三区| 精品国产伦一区二区三区免费 | 少妇**毛片| 精品国产一区二| 久久精品手机视频| 黄色av免费| 午夜av网址| 国产真实乱偷精品视频免| 精品一区二区三区影院| 精品一区二区三区自拍图片区| 在线播放国产一区| 国产精品久久久视频| 亚洲二区在线播放视频| 欧美久久一区二区三区| 国产大学生呻吟对白精彩在线| 国产一级大片| 狠狠色综合欧美激情| 国产精品久久91| 日本xxxxxxxxx68护士| 亚洲精品国产一区二| 日韩一区免费| 国产视频在线一区二区| 91狠狠操| 亚洲国产偷| 国产极品一区二区三区| 国产三级欧美三级日产三级99| 午夜电影三级| 久久国产精彩视频| 国产精品96久久久| 国产一区二区在线观| 国产91高清| 午夜激情综合网| 91麻豆精品国产91久久久资源速度| 欧美一区亚洲一区| 欧美日韩激情一区二区| 日韩欧美国产中文字幕| 国产在线视频99| 亚洲欧美日韩三区| 国产精品欧美久久久久一区二区| 国产高清精品一区| 四虎国产精品永久在线国在线 | 色午夜影院| 中文字幕日本精品一区二区三区| 综合久久色| 国产伦高清一区二区三区| 精品国产18久久久久久依依影院| 99爱精品视频| 日韩中文字幕一区二区在线视频| 国内少妇偷人精品视频免费| 99国产精品一区| 精品国产免费一区二区三区| 国产精品不卡在线| 国产一级在线免费观看| 久久99精品久久久久国产越南 | 国产一区二区精品在线| 久久影院一区二区| 国产日韩一区二区三免费| 岛国黄色av| www.日本一区| 99精品视频免费看| 欧美日韩乱码| 蜜臀久久99静品久久久久久| 国产一区二区国产| 在线观看欧美一区二区三区| 亚洲欧美一区二区三区1000| 日韩精品免费一区二区中文字幕| 久久国产免费视频| 久久午夜无玛鲁丝片午夜精品| 少妇**毛片| 国产视频一区二区不卡| 91一区在线观看| 欧美久久久一区二区三区| 国产二区精品视频| 欧美激情片一区二区| 亚洲理论影院| 国产jizz18女人高潮| 综合久久国产九一剧情麻豆| 国产欧美日韩在线观看| 欧美综合在线一区| 久久久久亚洲精品视频| 国产精品久久久久久久久久软件| 国产精品国产三级国产aⅴ下载| 李采潭无删减版大尺度| 久久综合伊人77777麻豆最新章节| 麻豆精品久久久| 亚洲精品日韩精品| 国产一区二区三区黄| 国产亚洲精品久久777777| 91精品资源| 中文字幕一级二级三级| 538国产精品一区二区免费视频| 欧美日韩久久精品| 中文字幕在线一二三区| 国产午夜精品一区二区三区在线观看 | 亚洲福利视频二区| 国产精品欧美一区二区视频| 国产精品19乱码一区二区三区| 精品国产乱码久久久久久虫虫| 欧美日韩精品影院| 91精品丝袜国产高跟在线| 97精品超碰一区二区三区| 窝窝午夜理伦免费影院| 李采潭无删减版大尺度| 性色av色香蕉一区二区| 久久69视频| 又色又爽又大免费区欧美| 亚洲欧美国产日韩色伦| 欧美精品免费看| 日韩精品中文字幕在线| 国产69精品久久久久男男系列 | 久久久精品欧美一区二区免费| 日韩精品免费播放| 日韩午夜毛片| 久久国产视屏| 久久91久久久久麻豆精品| 亚洲欧美另类久久久精品2019| 午夜免费网址| 中文字幕欧美另类精品亚洲| 久久久久偷看国产亚洲87| 国产精品天堂网| 国产精品一区二区6| 久久99国产综合精品| 黄色av免费| 中文在线√天堂| 亲子乱子伦xxxx| 好吊色欧美一区二区三区视频| 欧美日韩三区| 丝袜诱惑一区二区三区| 日韩午夜毛片| 日本xxxxxxxxx68护士| 国产一区二区激情| 国产69精品久久777的优势| 久久一区二区精品视频| 91婷婷精品国产综合久久| 91久久香蕉国产日韩欧美9色| 欧美一区二三区人人喊爽| 精品中文久久| 国产无遮挡又黄又爽又色视频 | 性国产日韩欧美一区二区在线| 国产精品精品国内自产拍下载| 日韩午夜电影院|