[發(fā)明專利]一種信息識別方法、裝置及設(shè)備在審
| 申請?zhí)枺?/td> | 202111314488.1 | 申請日: | 2021-11-08 |
| 公開(公告)號: | CN113902038A | 公開(公告)日: | 2022-01-07 |
| 發(fā)明(設(shè)計)人: | 李宗祥 | 申請(專利權(quán))人: | 咪咕文化科技有限公司;中國移動通信集團有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06F40/30 |
| 代理公司: | 北京市浩天知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11276 | 代理人: | 趙婭 |
| 地址: | 100032 北京市西城區(qū)德*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 信息 識別 方法 裝置 設(shè)備 | ||
本發(fā)明公開了一種信息識別方法、裝置及設(shè)備,該方法包括:獲取用戶發(fā)表的言論信息;對所述言論信息進行識別,得到所述言論信息是否為預(yù)設(shè)類型的信息的第一識別結(jié)果;若所述第一識別結(jié)果表示所述言論信息不是所述預(yù)設(shè)類型的信息,根據(jù)所述言論信息確認(rèn)用戶可信度,根據(jù)用戶可信度確認(rèn)所述言論信息是否為預(yù)設(shè)類型的信息的第二識別結(jié)果。通過上述方式,本發(fā)明實現(xiàn)了自動、準(zhǔn)確、高效地識別預(yù)設(shè)類型的言論信息。
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理技術(shù)領(lǐng)域,具體涉及一種信息識別方法、裝置及設(shè) 備。
背景技術(shù)
隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)上論壇、貼吧也愈加火爆,不管在什么論壇或者 貼吧中都存在一些故意擾亂討論秩序的“黑子”,嚴(yán)重影響了其他正常用戶 的使用,降低貼吧、論壇的質(zhì)量;而且到目前為止“黑子”已經(jīng)由“有理有 據(jù)”的“高級黑”進化為善于偽裝的“反串黑”;所謂“反串黑”即指對想 要黑(污蔑、侮辱)的現(xiàn)象極力吹捧,甚至出現(xiàn)很多極端言論達(dá)到反向引導(dǎo) 輿論的效果。
目前針對論壇、貼吧發(fā)言內(nèi)容的審核主要有兩種方式:(1)第一種是管 理員人工審核,管理員通過定期瀏覽或者其他用戶的舉報發(fā)現(xiàn)“反串黑”的 言論,將用戶定為“反串黑”用戶并進行言論刪除與賬號禁言;(2)第二種 則是通過AI(人工智能)模型進行智能審核,通過訓(xùn)練的AI模型對用戶發(fā)布 的言論進行判定,判斷用戶的言論是否違反相關(guān)的規(guī)定,如果違反則進行言 論刪除。
已有的方法都不能很好的應(yīng)對“反串黑”這種新的擾亂論壇、貼吧的形 式,主要有以下幾個問題:
首先,人工審查的方式成本太高,而且效率太差,當(dāng)“反串黑”的人數(shù) 很多、發(fā)言也多的時候,管理員根本來不及刪除相關(guān)言論并且禁言,這會導(dǎo) 致論壇、貼吧的言論環(huán)境極速惡化,嚴(yán)重影響正常用戶的使用體驗;
其次,使用AI模型進行用戶言論的審核,雖然可以審核出很多不合規(guī)的 言論,但是很難判斷出“反串黑”的言論,因為“反串黑”的言論往往都偽 裝成“正能量”的東西,AI模型很難識破這層偽裝,從而使“反串黑”言論 通過審查發(fā)表出來。
最后,由于“反串黑”言論的偽裝性,不論是人工還是AI模型都不能很 準(zhǔn)確地判斷一個人的發(fā)言是否是“反串黑”的言論,誤判率極高;如果誤判 率太高封禁了正常的用戶,也會嚴(yán)重影響正常用戶的使用。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明實施例以便提供一種克服上述問題或者至 少部分地解決上述問題的信息識別方法、裝置及設(shè)備。
根據(jù)本發(fā)明實施例的一個方面,提供了一種信息識別方法,包括:
獲取用戶發(fā)表的言論信息;
對所述言論信息進行識別,得到所述言論信息是否為預(yù)設(shè)類型的信息的 第一識別結(jié)果;
若所述第一識別結(jié)果表示所述言論信息不是所述預(yù)設(shè)類型的信息,根據(jù) 所述言論信息確認(rèn)用戶可信度,根據(jù)用戶可信度確認(rèn)所述言論信息是否為預(yù) 設(shè)類型的信息的第二識別結(jié)果。
根據(jù)本發(fā)明實施例的另一方面,提供了一種信息識別裝置,包括:
獲取模塊,用于獲取用戶發(fā)表的言論信息;處理模塊,用于對所述言論 信息進行識別,得到所述言論信息是否為預(yù)設(shè)類型的信息的第一識別結(jié)果; 若所述第一識別結(jié)果表示所述言論信息不是所述預(yù)設(shè)類型的信息,根據(jù)所述 言論信息確認(rèn)用戶可信度,根據(jù)用戶可信度確認(rèn)所述言論信息是否為預(yù)設(shè)類 型的信息的第二識別結(jié)果。
根據(jù)本發(fā)明實施例的又一方面,提供了一種計算設(shè)備,包括:處理器、 存儲器、通信接口和通信總線,所述處理器、所述存儲器和所述通信接口通 過所述通信總線完成相互間的通信;
所述存儲器用于存放至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器 執(zhí)行上述信息識別方法對應(yīng)的操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于咪咕文化科技有限公司;中國移動通信集團有限公司,未經(jīng)咪咕文化科技有限公司;中國移動通信集團有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111314488.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





