[發(fā)明專利]一種文本檢測方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請?zhí)枺?/td> | 202010721748.6 | 申請日: | 2020-07-24 |
| 公開(公告)號: | CN113971400B | 公開(公告)日: | 2023-07-25 |
| 發(fā)明(設(shè)計(jì))人: | 楊潤楷;林苑;李航 | 申請(專利權(quán))人: | 抖音視界有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/205;G06F16/35;G06Q50/00;G06N3/042;G06N3/08 |
| 代理公司: | 北京遠(yuǎn)智匯知識(shí)產(chǎn)權(quán)代理有限公司 11659 | 代理人: | 范坤坤 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文本 檢測 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本公開實(shí)施例公開了一種文本檢測方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),該方法包括:確定待檢測文本的第一屬性特征以及與所述待檢測文本具有關(guān)聯(lián)關(guān)系的元素的第二屬性特征;將所述第一屬性特征、所述第二屬性特征、所述待檢測文本與所述元素之間的關(guān)聯(lián)關(guān)系以及所述元素之間的關(guān)聯(lián)關(guān)系輸入至訓(xùn)練好的網(wǎng)絡(luò)模型,獲得針對所述待檢測文本的檢測結(jié)果。本公開實(shí)施例的技術(shù)方案,提高了低質(zhì)文本的檢測準(zhǔn)確度。
技術(shù)領(lǐng)域
本公開實(shí)施例涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種文本檢測方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
資訊類應(yīng)用是現(xiàn)今大量用戶閱讀、交流以及創(chuàng)作的重要平臺(tái),因此對在該類平臺(tái)傳播的文本質(zhì)量進(jìn)行維護(hù)是該類平臺(tái)的重要責(zé)任,也是為大量用戶提供良好的閱讀、交流以及創(chuàng)作環(huán)境的重要舉措。
目前常用的文本質(zhì)量檢測方法為:將待檢測文本輸入文本分類模型,模型輸出檢測結(jié)果,所述模型基于語料庫訓(xùn)練得到?,F(xiàn)有文本質(zhì)量檢測方法存在的問題是,一方面僅考慮了文本本身,而相同的文本在不同場景下所表達(dá)的含義可能不同,針對該種情況現(xiàn)有的文本質(zhì)量檢測方法無法區(qū)分識(shí)別;另一方面對于文本中新出現(xiàn)的低質(zhì)表達(dá)方式模型無法識(shí)別。因此,現(xiàn)有的文本質(zhì)量檢測方法還需進(jìn)一步改進(jìn)。
發(fā)明內(nèi)容
本公開實(shí)施例提供一種文本檢測方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),提高了低質(zhì)文本的檢測準(zhǔn)確度。
第一方面,本公開實(shí)施例提供了一種文本檢測方法,該方法包括:
確定待檢測文本的第一屬性特征以及與所述待檢測文本具有關(guān)聯(lián)關(guān)系的元素的第二屬性特征;
將所述第一屬性特征、所述第二屬性特征、所述待檢測文本與所述元素之間的關(guān)聯(lián)關(guān)系以及所述元素之間的關(guān)聯(lián)關(guān)系輸入至訓(xùn)練好的網(wǎng)絡(luò)模型,獲得針對所述待檢測文本的檢測結(jié)果。
第二方面,本公開實(shí)施例還提供了一種文本檢測裝置,該裝置包括:
確定模塊,用于確定待檢測文本的第一屬性特征以及與所述待檢測文本具有關(guān)聯(lián)關(guān)系的元素的第二屬性特征;
檢測模塊,用于將所述第一屬性特征、所述第二屬性特征、所述待檢測文本與所述元素之間的關(guān)聯(lián)關(guān)系以及所述元素之間的關(guān)聯(lián)關(guān)系輸入至訓(xùn)練好的網(wǎng)絡(luò)模型,獲得針對所述待檢測文本的檢測結(jié)果。
第三方面,本公開實(shí)施例還提供了一種設(shè)備,所述設(shè)備包括:
一個(gè)或多個(gè)處理器;
存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如本公開實(shí)施例任一所述的文本檢測方法。
第四方面,本公開實(shí)施例還提供了一種包含計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令在由計(jì)算機(jī)處理器執(zhí)行時(shí)用于執(zhí)行如本公開實(shí)施例任一所述的文本檢測方法。
本公開實(shí)施例的技術(shù)方案,通過確定待檢測文本的第一屬性特征以及與所述待檢測文本具有關(guān)聯(lián)關(guān)系的元素的第二屬性特征;將所述第一屬性特征、所述第二屬性特征、所述待檢測文本與所述元素之間的關(guān)聯(lián)關(guān)系以及所述元素之間的關(guān)聯(lián)關(guān)系輸入至訓(xùn)練好的網(wǎng)絡(luò)模型,獲得針對所述待檢測文本的檢測結(jié)果的技術(shù)手段,實(shí)現(xiàn)了提高低質(zhì)文本檢測精度的目的。
附圖說明
結(jié)合附圖并參考以下具體實(shí)施方式,本公開各實(shí)施例的上述和其他特征、優(yōu)點(diǎn)及方面將變得更加明顯。貫穿附圖中,相同或相似的附圖標(biāo)記表示相同或相似的元素。應(yīng)當(dāng)理解附圖是示意性的,原件和元素不一定按照比例繪制。
圖1為本公開實(shí)施例一所提供的一種文本檢測方法流程示意圖;
圖2為本公開實(shí)施例二所提供的一種文本檢測方法流程示意圖;
圖3為本公開實(shí)施例二所提供的一種節(jié)點(diǎn)之間關(guān)聯(lián)關(guān)系圖的結(jié)構(gòu)示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于抖音視界有限公司,未經(jīng)抖音視界有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010721748.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





