[發(fā)明專利]一種用于互聯(lián)網(wǎng)信息的錯(cuò)詞檢測(cè)控制方法在審
申請(qǐng)?zhí)枺?/td> | 201910361026.1 | 申請(qǐng)日: | 2019-04-30 |
公開(公告)號(hào): | CN111859089A | 公開(公告)日: | 2020-10-30 |
發(fā)明(設(shè)計(jì))人: | 李青龍;駱飛;彭璿韜;王雪峰;韓輝 | 申請(qǐng)(專利權(quán))人: | 北京智慧星光信息技術(shù)有限公司 |
主分類號(hào): | G06F16/9532 | 分類號(hào): | G06F16/9532;G06F16/33 |
代理公司: | 北京國(guó)昊天誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 劉昕 |
地址: | 100080 北京市海*** | 國(guó)省代碼: | 北京;11 |
權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 一種 用于 互聯(lián)網(wǎng) 信息 檢測(cè) 控制 方法 | ||
一種用于互聯(lián)網(wǎng)信息的錯(cuò)詞檢測(cè)控制方法,包括系統(tǒng)在字詞標(biāo)準(zhǔn)庫(kù)中通過字典查找樹的方式,檢索需要進(jìn)行錯(cuò)詞檢測(cè)的信息中是否包含組成詞組的字符串,判斷若存在,則返回該字符串及字符串在信息中位置的檢索結(jié)果信息后,系統(tǒng)通過字符位置查找映射的方式,獲取檢索結(jié)果信息中匹配到的每個(gè)字符串在詞組中的位置及該字符串的長(zhǎng)度的信息;通過獲取的信息,截取需要進(jìn)行錯(cuò)詞檢測(cè)的信息的文本內(nèi)容信息;系統(tǒng)將截取到的文本內(nèi)容信息,傳入文本糾錯(cuò)樹中,獲取截取到的所述文本內(nèi)容信息中各個(gè)詞組與組成文本糾錯(cuò)樹的標(biāo)準(zhǔn)詞組之間的編輯距離為設(shè)定閥值的截取詞組。本發(fā)明解決了需要檢測(cè)出互聯(lián)網(wǎng)信息中同音錯(cuò)別字、字形錯(cuò)別字以及人名錯(cuò)誤的技術(shù)問題。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)信息技術(shù)領(lǐng)域,特別涉及一種用于互聯(lián)網(wǎng)信息的錯(cuò)詞檢 測(cè)控制方法。
背景技術(shù)
近年來(lái)隨著信息技術(shù)的大力發(fā)展,新媒體的發(fā)展日新月異,技術(shù)手段的革 新使得任何人可以在任何空間、任何時(shí)間里發(fā)布和接觸信息,海量的信息也改 變了人們的認(rèn)知過程與行為方式,但是在互聯(lián)網(wǎng)信息的廣泛傳播中存在大量的 錯(cuò)詞問題,錯(cuò)詞問題長(zhǎng)期廣泛存在,對(duì)人們的工作和生活帶來(lái)極大影響,例如, 經(jīng)濟(jì)合同里的錯(cuò)別字可能會(huì)導(dǎo)致巨大的商業(yè)損失,知名公眾人物的錯(cuò)別字問題 可能會(huì)影響其發(fā)展前途,高考作文里的錯(cuò)別字也一定會(huì)影響到學(xué)生的升學(xué)成 績(jī)。
當(dāng)前互聯(lián)網(wǎng)上存在的一些錯(cuò)詞檢測(cè)技術(shù),通常只能檢測(cè)成語(yǔ)中的錯(cuò)別字, 并且檢測(cè)到的錯(cuò)別字大都只能是正確字的同音字。當(dāng)前需要一種技術(shù)方案,不 僅可以檢測(cè)互聯(lián)網(wǎng)信息中的同音錯(cuò)別字和字形錯(cuò)別字,而且可以檢測(cè)人名錯(cuò) 誤。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供一種用于互聯(lián)網(wǎng)信息的錯(cuò)詞檢測(cè)控制方法,以解決需要 檢測(cè)出互聯(lián)網(wǎng)信息中同音錯(cuò)別字、字形錯(cuò)別字以及人名錯(cuò)誤的技術(shù)問題。
本發(fā)明提供了一種用于互聯(lián)網(wǎng)信息的錯(cuò)詞檢測(cè)控制方法,包括:
步驟A、系統(tǒng)在字詞標(biāo)準(zhǔn)庫(kù)中通過字典查找樹的方式,檢索需要進(jìn)行錯(cuò)詞 檢測(cè)的互聯(lián)網(wǎng)信息中是否包含組成詞組的字符串,判斷若存在,則返回該字符 串及字符串在所述互聯(lián)網(wǎng)信息中位置的檢索結(jié)果信息,執(zhí)行步驟B;
步驟B、系統(tǒng)通過字符位置查找映射的方式,獲取所述檢索結(jié)果信息中匹 配到的每個(gè)字符串在詞組中的位置及該字符串的長(zhǎng)度的信息;通過獲取的信 息,截取需要進(jìn)行錯(cuò)詞檢測(cè)的互聯(lián)網(wǎng)信息的文本內(nèi)容信息;
步驟C、系統(tǒng)將截取到的所述文本內(nèi)容信息,傳入文本糾錯(cuò)樹中,獲取截 取到的所述文本內(nèi)容信息中各個(gè)詞組與組成文本糾錯(cuò)樹的標(biāo)準(zhǔn)詞組之間的編 輯距離為設(shè)定閥值的截取詞組。
上述方法還可包括:所述系統(tǒng)在字詞標(biāo)準(zhǔn)庫(kù)中通過字典查找樹的方式,檢 索需要進(jìn)行錯(cuò)詞檢測(cè)的互聯(lián)網(wǎng)信息中是否包含組成詞組的字符串,是指:所述 系統(tǒng)在字詞標(biāo)準(zhǔn)庫(kù)中通過由一種字符串構(gòu)成的存儲(chǔ)結(jié)構(gòu),快速查詢需要進(jìn)行錯(cuò) 詞檢測(cè)的互聯(lián)網(wǎng)信息中是否包含構(gòu)成該存儲(chǔ)結(jié)構(gòu)的字符串。
上述方法還可包括:所述系統(tǒng)通過字符位置查找映射的方式,獲取所述檢 索結(jié)果信息中匹配到的每個(gè)字符串在詞組中的位置及該字符串的長(zhǎng)度的信息, 是指:系統(tǒng)通過一種快速定位字符串的映射結(jié)構(gòu),該映射結(jié)構(gòu)用于存儲(chǔ)所述字 詞標(biāo)準(zhǔn)庫(kù)中每個(gè)詞的字符串及字符串在這個(gè)詞中的位置和字符串的長(zhǎng)度。
上述方法還可包括:所述文本糾錯(cuò)樹是一種由字符串組成的快速判斷樹, 用于檢測(cè)傳入字符串與組成字符串之間的編輯距離是否為設(shè)定閥值。
上述方法還可包括:所述步驟A中還包括:所述系統(tǒng)對(duì)需要進(jìn)行錯(cuò)詞檢測(cè) 的互聯(lián)網(wǎng)信息進(jìn)行分詞操作,得到分詞組合A=[a1,a2,a3,......,an],其中n 為正整數(shù)。
上述方法還可包括:所述系統(tǒng)要根據(jù)預(yù)設(shè)周期對(duì)所述字詞標(biāo)準(zhǔn)庫(kù)進(jìn)行更 新,增加新的字詞內(nèi)容。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京智慧星光信息技術(shù)有限公司,未經(jīng)北京智慧星光信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910361026.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:二維壓力伺服變量泵
- 下一篇:一種高維數(shù)據(jù)快速搜索方法
- 基于網(wǎng)絡(luò)電視的互聯(lián)網(wǎng)業(yè)務(wù)處理方法和系統(tǒng)
- 互聯(lián)網(wǎng)業(yè)務(wù)接入網(wǎng)關(guān)的實(shí)現(xiàn)方法和系統(tǒng)
- 一種互聯(lián)網(wǎng)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動(dòng)攝像終端進(jìn)行異地圖像拍攝的系統(tǒng)
- 一種網(wǎng)絡(luò)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 利用區(qū)塊鏈保護(hù)用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 互聯(lián)網(wǎng)廣告裝置及方法
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點(diǎn)中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)