[發明專利]文本審核方法、裝置、電子設備、存儲介質及程序產品有效
| 申請號: | 202011443455.2 | 申請日: | 2020-12-08 |
| 公開(公告)號: | CN112597768B | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 丁鑫哲;王倩倩;劉瑛;劉凱;李婷婷 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F40/216 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 田宏賓 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 審核 方法 裝置 電子設備 存儲 介質 程序 產品 | ||
本申請公開了一種文本審核方法、裝置、電子設備、存儲介質及程序產品,涉及機器學習與自然語言處理等人工智能技術領域。具體實現方案為:獲取待審核文本的待審核分句;基于待審核分句,從數據庫中召回待審核分句對應的多個候選信息;基于多個候選信息,獲取與待審核分句最相關的候選信息;基于最相關的候選信息,對待審核分句進行審核。本申請通過采用上述技術方案,可以自動地對待審核文本的各待審核分句進行審核,進而實現對待審核文本進行審核,避免人工對待審核文本的審核,能夠有效地提高文本審核的準確性、以及文本審核效率。
技術領域
本申請涉及計算機技術領域,具體涉及機器學習與自然語言處理等人工智能技術領域,尤其涉及一種文本審核方法、裝置、電子設備、存儲介質及程序產品。
背景技術
每一門語言都是復雜的,經歷了幾百甚至上千年的長期發展和演變,積累形成了一套復雜的文法和句法規則。語言的運用對于使用者來說,提出了比較高的要求,一旦掌握不全或者粗心大意,很容易造成張冠李戴,差之毫厘謬以千里,特別是在比較重要的場合,即便是極小的語言錯誤,也會帶來非常惡劣的影響?;诖耍谋緦徍俗鳛樽匀徽Z言處理的一個傳統的問題,變得尤為重要。
近年來,隨著媒體行業的高速發展,以及每天的信息爆炸,對于稿件的校稿需求急劇上升。特別是在傳統的媒體行業,涉及比較重要的稿件,都需要進行嚴格的三審三校,要杜絕嚴重的錯誤。除了傳統的媒體,新興的自媒體從業人數也在逐年增加,他們更加缺乏人工校稿環節。而在為自媒體從業者提供服務的新媒體平臺上,結合當前的整體環境,也是需要對重要的信息,進行嚴格的審校的。
發明內容
本申請提供了一種文本審核方法、裝置、電子設備、存儲介質及程序產品。
根據本申請的一方面,提供了一種文本審核方法,其中,所述方法包括:
獲取待審核文本的待審核分句;
基于所述待審核分句,從數據庫中召回所述待審核分句對應的多個候選信息;
基于所述多個候選信息,獲取與所述待審核分句最相關的候選信息;
基于所述最相關的候選信息,對所述待審核分句進行審核。
根據本申請的另一方面,提供了一種文本審核裝置,其中,所述裝置包括:
分句獲取模塊,用于獲取待審核文本的待審核分句;
召回模塊,用于基于所述待審核分句,從數據庫中召回所述待審核分句對應的多個候選信息;
候選獲取模塊,用于基于所述多個候選信息,獲取與所述待審核分句最相關的候選信息;
審核模塊,用于基于所述最相關的候選信息,對所述待審核分句進行審核。
根據本申請的再一方面,提供了一種電子設備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行如上所述的方法。
根據本申請的又一方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,所述計算機指令用于使所述計算機執行如上所述的方法。
根據本申請的再另一方面,提供了一種計算機程序產品,當所述計算機程序產品中的指令處理器執行時,執行如上所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011443455.2/2.html,轉載請聲明來源鉆瓜專利網。





