[發(fā)明專(zhuān)利]內(nèi)容風(fēng)險(xiǎn)識(shí)別方法和系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202210767655.6 | 申請(qǐng)日: | 2022-07-01 |
| 公開(kāi)(公告)號(hào): | CN115019328A | 公開(kāi)(公告)日: | 2022-09-06 |
| 發(fā)明(設(shè)計(jì))人: | 朱強(qiáng)強(qiáng) | 申請(qǐng)(專(zhuān)利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06V30/413 | 分類(lèi)號(hào): | G06V30/413;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 上海專(zhuān)利商標(biāo)事務(wù)所有限公司 31100 | 代理人: | 錢(qián)孟清 |
| 地址: | 310023 浙江省杭州市*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 內(nèi)容 風(fēng)險(xiǎn) 識(shí)別 方法 系統(tǒng) | ||
本公開(kāi)提出了一種內(nèi)容風(fēng)險(xiǎn)識(shí)別方法和系統(tǒng)。該方法包括:從頁(yè)面上的目標(biāo)內(nèi)容提取實(shí)體集合;確定該目標(biāo)內(nèi)容的頁(yè)面結(jié)構(gòu);對(duì)該實(shí)體集合進(jìn)行分類(lèi)以獲得經(jīng)分類(lèi)實(shí)體集合;根據(jù)該經(jīng)分類(lèi)實(shí)體集合來(lái)識(shí)別該目標(biāo)內(nèi)容的業(yè)務(wù)屬性;基于該業(yè)務(wù)屬性和該頁(yè)面結(jié)構(gòu)來(lái)識(shí)別內(nèi)容風(fēng)險(xiǎn)。
技術(shù)領(lǐng)域
本公開(kāi)主要涉及風(fēng)險(xiǎn)識(shí)別,尤其涉及基于實(shí)體挖掘的內(nèi)容風(fēng)險(xiǎn)識(shí)別。
背景技術(shù)
由于內(nèi)容業(yè)務(wù)開(kāi)發(fā)者的開(kāi)發(fā)和運(yùn)營(yíng)質(zhì)量參差不齊,內(nèi)容風(fēng)險(xiǎn)滲透從開(kāi)發(fā)到上線(xiàn)之后的多個(gè)場(chǎng)景,嚴(yán)重?fù)p害了用戶(hù)的服務(wù)體驗(yàn)。業(yè)務(wù)內(nèi)容往往容易出現(xiàn)一系列內(nèi)容風(fēng)險(xiǎn)問(wèn)題,比如業(yè)務(wù)名稱(chēng)與經(jīng)營(yíng)內(nèi)容不符、缺商品服務(wù)、純黃頁(yè)等等。
當(dāng)前的內(nèi)容風(fēng)險(xiǎn)識(shí)別方案面向純圖像或純文本,并且針對(duì)單個(gè)場(chǎng)景中的單個(gè)問(wèn)題構(gòu)建識(shí)別模型,從而堆砌成M個(gè)風(fēng)險(xiǎn)種類(lèi)M+個(gè)模型的散點(diǎn)式方案。散點(diǎn)式方案的構(gòu)建成本高,場(chǎng)景應(yīng)用的拓展性差,不利于進(jìn)行體系化的風(fēng)險(xiǎn)管控。
由此,期望提供一種改進(jìn)的內(nèi)容風(fēng)險(xiǎn)識(shí)別方案來(lái)替代現(xiàn)有的常規(guī)方案,以緩解常規(guī)方案的上述缺陷。
有鑒于此,本公開(kāi)提供了一種改進(jìn)的基于實(shí)體挖掘的內(nèi)容風(fēng)險(xiǎn)識(shí)別方法和系統(tǒng)。
發(fā)明內(nèi)容
以下給出一個(gè)或多個(gè)方面的簡(jiǎn)要概述以提供對(duì)這些方面的基本理解。此概述不是所有構(gòu)想到的方面的詳盡綜覽,并且既非旨在標(biāo)識(shí)出所有方面的關(guān)鍵性或決定性要素亦非試圖界定任何或所有方面的范圍。其唯一的目的是以簡(jiǎn)化形式給出一個(gè)或多個(gè)方面的一些概念以作為稍后給出的更詳細(xì)描述之序言。
本公開(kāi)提出了一種內(nèi)容風(fēng)險(xiǎn)識(shí)別方法,包括:從頁(yè)面上的目標(biāo)內(nèi)容提取實(shí)體集合;確定該目標(biāo)內(nèi)容的頁(yè)面結(jié)構(gòu);對(duì)該實(shí)體集合進(jìn)行分類(lèi)以獲得經(jīng)分類(lèi)實(shí)體集合;根據(jù)該經(jīng)分類(lèi)實(shí)體集合來(lái)識(shí)別該目標(biāo)內(nèi)容的業(yè)務(wù)屬性;基于該業(yè)務(wù)屬性和該頁(yè)面結(jié)構(gòu)來(lái)識(shí)別內(nèi)容風(fēng)險(xiǎn)。
在本公開(kāi)的一實(shí)施例中,基于該業(yè)務(wù)屬性和該頁(yè)面結(jié)構(gòu)來(lái)識(shí)別內(nèi)容風(fēng)險(xiǎn)進(jìn)一步包括:基于該業(yè)務(wù)屬性和該頁(yè)面結(jié)構(gòu)來(lái)從該經(jīng)分類(lèi)實(shí)體集合提取風(fēng)險(xiǎn)特征;計(jì)算該風(fēng)險(xiǎn)特征的特征值;基于所計(jì)算的特征值來(lái)確定該目標(biāo)內(nèi)容中是否存在內(nèi)容風(fēng)險(xiǎn)。
在本公開(kāi)的一實(shí)施例中,基于所計(jì)算的特征值來(lái)確定該目標(biāo)內(nèi)容中是否存在內(nèi)容風(fēng)險(xiǎn)進(jìn)一步包括:如果所計(jì)算的特征值滿(mǎn)足預(yù)設(shè)閾值,則確定該目標(biāo)內(nèi)容中存在內(nèi)容風(fēng)險(xiǎn);如果所計(jì)算的特征值不滿(mǎn)足該預(yù)設(shè)閾值,則確定該目標(biāo)內(nèi)容中不存在內(nèi)容風(fēng)險(xiǎn)。
在本公開(kāi)的一實(shí)施例中,確定該目標(biāo)內(nèi)容的頁(yè)面結(jié)構(gòu)是通過(guò)Fast RCNN算法來(lái)實(shí)現(xiàn)的。
在本公開(kāi)的一實(shí)施例中,對(duì)該實(shí)體集合進(jìn)行分類(lèi)是通過(guò)多模態(tài)分類(lèi)算法來(lái)實(shí)現(xiàn)的。
在本公開(kāi)的一實(shí)施例中,該實(shí)體集合中的實(shí)體包括原子層實(shí)體和應(yīng)用層實(shí)體,其中原子層實(shí)體表示該目標(biāo)內(nèi)容中的最小內(nèi)容塊,應(yīng)用層實(shí)體表示經(jīng)合并的一個(gè)或多個(gè)語(yǔ)義相關(guān)的原子層實(shí)體。
在本公開(kāi)的一實(shí)施例中,內(nèi)容風(fēng)險(xiǎn)包括以下一者或多者:純空白風(fēng)險(xiǎn)、內(nèi)容不符風(fēng)險(xiǎn)、商品服務(wù)缺失風(fēng)險(xiǎn)、功能不完整風(fēng)險(xiǎn)。
在本公開(kāi)的一實(shí)施例中,該目標(biāo)內(nèi)容包括長(zhǎng)圖頁(yè)面、純圖像、或純文本。
本公開(kāi)還提出了一種內(nèi)容風(fēng)險(xiǎn)識(shí)別系統(tǒng),包括:提取模塊,從頁(yè)面上的目標(biāo)內(nèi)容提取實(shí)體集合;結(jié)構(gòu)確定模塊,確定該目標(biāo)內(nèi)容的頁(yè)面結(jié)構(gòu);分類(lèi)模塊,對(duì)該實(shí)體集合進(jìn)行分類(lèi)以獲得經(jīng)分類(lèi)實(shí)體集合;業(yè)務(wù)屬性模塊,根據(jù)該經(jīng)分類(lèi)實(shí)體集合來(lái)識(shí)別該目標(biāo)內(nèi)容的業(yè)務(wù)屬性;風(fēng)險(xiǎn)識(shí)別模塊,基于該業(yè)務(wù)屬性和該頁(yè)面結(jié)構(gòu)來(lái)識(shí)別內(nèi)容風(fēng)險(xiǎn)。
在本公開(kāi)的一實(shí)施例中,該風(fēng)險(xiǎn)識(shí)別模塊被進(jìn)一步配置成:基于該業(yè)務(wù)屬性和該頁(yè)面結(jié)構(gòu)來(lái)從該經(jīng)分類(lèi)實(shí)體集合提取風(fēng)險(xiǎn)特征;計(jì)算該風(fēng)險(xiǎn)特征的特征值;基于所計(jì)算的特征值來(lái)確定該目標(biāo)內(nèi)容中是否存在內(nèi)容風(fēng)險(xiǎn)。
在本公開(kāi)的一實(shí)施例中,該風(fēng)險(xiǎn)識(shí)別模塊被進(jìn)一步配置成:如果所計(jì)算的特征值滿(mǎn)足預(yù)設(shè)閾值,則確定該目標(biāo)內(nèi)容中存在內(nèi)容風(fēng)險(xiǎn);如果所計(jì)算的特征值不滿(mǎn)足該預(yù)設(shè)閾值,則確定該目標(biāo)內(nèi)容中不存在內(nèi)容風(fēng)險(xiǎn)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210767655.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法
- 風(fēng)險(xiǎn)監(jiān)視裝置、風(fēng)險(xiǎn)監(jiān)視系統(tǒng)、風(fēng)險(xiǎn)監(jiān)視方法
- 風(fēng)險(xiǎn)控制方法及風(fēng)險(xiǎn)控制裝置
- 風(fēng)險(xiǎn)分層
- 風(fēng)險(xiǎn)分層
- 風(fēng)險(xiǎn)判定裝置、風(fēng)險(xiǎn)判定方法以及風(fēng)險(xiǎn)判定程序
- 風(fēng)險(xiǎn)評(píng)價(jià)系統(tǒng)以及風(fēng)險(xiǎn)評(píng)價(jià)方法
- 風(fēng)險(xiǎn)管理裝置、風(fēng)險(xiǎn)管理方法以及風(fēng)險(xiǎn)管理程序
- 風(fēng)險(xiǎn)測(cè)算方法和風(fēng)險(xiǎn)測(cè)算系統(tǒng)
- 風(fēng)險(xiǎn)評(píng)估方法及風(fēng)險(xiǎn)評(píng)估裝置
- 風(fēng)險(xiǎn)評(píng)估方法及風(fēng)險(xiǎn)評(píng)估裝置
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





