[發明專利]查找內容項中是否存在標志的方法及裝置有效
| 申請號: | 201310714534.6 | 申請日: | 2013-12-20 |
| 公開(公告)號: | CN103646101B | 公開(公告)日: | 2017-06-27 |
| 發明(設計)人: | 任亞軍 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司11315 | 代理人: | 許志勇 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 查找 內容 是否 存在 標志 方法 裝置 | ||
技術領域
本發明涉及互聯網技術領域,具體涉及一種查找內容項中是否存在標志的方法及裝置。
背景技術
在互聯網上的內容項展示系統中,一般一個內容項發布者所展示的內容項都是具有其獨有的標志的,并且在一般情況下只有該內容項的發布者具有該獨有的標志的使用權,因此該發布者還會禁止其他的發布者使用該獨有的標志,例如,禁止其他的發布者發布包含該獨有的標志的內容項。內容項展示系統一般都具有針對標志侵權進行過濾的模塊,會對所有內容項文本進行標志的查找,若查找到內容項中包含不屬于該發布者的標志,則從展示平臺撤銷該內容項的展示。
可以通過從標志庫中取出所有標志,然后逐個地和一個內容項文本進行字符串匹配的方式查找該內容項中是否存在不允許使用的標志,若該內容項文本中出現了標志庫中的任意一個標志,則可以確定該內容項中包含不允許使用的標志,將會從展示平臺中撤銷該內容項的展示,若該內容項文本中未出現該標志庫中的任何一個標志,則可以確定該內容項中不包含不允許使用的標志,可以在展示平臺上展示該內容項。然而,標志庫中標志的數量一般都很大,因此,將內容項文本與標志庫中的每一個標志逐個進行字符對比的查找方法效率非常低。
為提高內容項中標志的查找效率,本發明提出了一種查找內容項中是否存在標志的方案。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的一種查找內容項中是否存在標志的方法和相應的裝置。
依據本發明的一個方面,提供了一種查找內容項中是否存在標志的方法,包括:將內容項文本拆分為一個或多個字符串;其中,每一個字符串包含至少一個字符;針對所述一個或多個字符串中的每一個字符串,查找在預先建立的標志樹上是否存在與該字符串相匹配的字符路徑;如果所述標志樹中存在至少一個與所述一個或多個字符串中任意一個字符串相匹配的字符路徑,則確定所述內容項文本中存在標志。
其中,如果所述標志樹中不存在與所述一個或多個字符串中任何一個字符串相匹配的字符路徑,則確定所述內容項文本中不存在標志。
其中,所述標志樹是基于標志庫中的所有標志而被預先建立的;其中,所述標志庫中包含一個或多個標志,所述標志樹包含一個或多個節點,其中的一個或多個為首級節點,每個節點包含一個字符,每個首級節點包含的字符與所述標志庫中一個或多個標志所共有的相同的一個或多個首字符相同,所述每個首級節點與其下級的一級或多級節點構成一個或多個字符路徑,每個字符路徑構成一個路徑字符串,并且每個所述路徑字符串對應所述標志庫中一個標志,每個所述標志的結束字符對應的節點上帶有結束標記。
其中,將內容項文本拆分為一個或多個字符串,包括:按順序取出所述內容項文本中的所有字符,以得到所述內容項文本的一個字符串;依次去除前一次得到的字符串的首字符,以得到所述內容項文本的一個或多個字符串。
其中,針對所述一個或多個字符串中的每一個字符串,查找在預先建立的標志樹上是否存在與該字符串相匹配的字符路徑,包括:針對所述一個或多個字符串中的任意一個字符串,在所述標志樹上查找包含的字符與所述字符串的首字符對應相同的首級節點;從所述首級節點起,順次向下級查找包含的字符與所述字符串的其余字符對應相同的節點;如果順次查找到的包含的字符與所述字符串中字符對應相同的任意一級節點帶有結束標記,則確定在所述標志樹上存在與所述字符串匹配的字符路徑。
其中,如果針對所述一個或多個字符串中的任意一個字符串,在所述標志樹上未查找到包含的字符與所述字符串的首字符對應相同的首級節點,則確定在所述標志樹上不存在與所述字符串匹配的字符路徑。
其中,如果順次一直查找到包含的字符與所述字符串的結束字符對應相同的節點,但在包含的字符與所述字符串對應相同的每一級節點中都不帶有結束標記,則確定在所述標志樹上不存在與所述字符串匹配的字符路徑。
根據本發明的另一方面,提供了一種查找內容項中是否存在標志的裝置,包括:拆分模塊,用于將內容項文本拆分為一個或多個字符串;其中,每一個字符串包含至少一個字符;查找模塊,用于針對所述一個或多個字符串中的每一個字符串,查找在預先建立的標志樹中是否存在與該字符串相匹配的字符路徑;確定模塊,用于如果所述標志樹中存在至少一個與所述一個或多個字符串中任意一個字符串相匹配的字符路徑,則確定所述內容項文本中存在標志。
其中,所述確定模塊進一步用于如果所述標志樹中不存在與所述一個或多個字符串中任何一個字符串相匹配的字符路徑,則確定所述內容項文本中不存在標志。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310714534.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:密碼箱和行李箱專用把手套
- 下一篇:帶手柄的刷子
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





