[發(fā)明專利]通過使用自動(dòng)變體檢測來防止禁止網(wǎng)絡(luò)內(nèi)容的分發(fā)在審
| 申請?zhí)枺?/td> | 201680003648.1 | 申請日: | 2016-12-09 |
| 公開(公告)號: | CN108463816A | 公開(公告)日: | 2018-08-28 |
| 發(fā)明(設(shè)計(jì))人: | 劉銀濤;瓦伊巴夫·瓦伊什;徐瑞秋;陳兆夫 | 申請(專利權(quán))人: | 谷歌有限責(zé)任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 周亞榮;安翔 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 接收查詢 分發(fā) 集合 后端服務(wù)器 前端服務(wù)器 搜索結(jié)果 網(wǎng)絡(luò)內(nèi)容 變體 查詢 數(shù)據(jù)通信網(wǎng)絡(luò) 查詢?nèi)罩?/a> 搜索引擎 自動(dòng)變體 響應(yīng) 歸類 檢測 | ||
本說明書的主題大體上涉及防止禁止網(wǎng)絡(luò)內(nèi)容的分發(fā)。在一個(gè)方面中,系統(tǒng)包括前端服務(wù)器,該前端服務(wù)器接收要在數(shù)據(jù)通信網(wǎng)絡(luò)上分發(fā)的內(nèi)容。所述后端服務(wù)器在所述查詢?nèi)罩局凶R(shí)別已接收查詢的集合,對于已接收查詢的所述集合,即使給定禁止詞項(xiàng)未包括在已接收查詢的所述集合中所包括的查詢中,所述給定禁止詞項(xiàng)也被用于響應(yīng)于已接收查詢來識(shí)別搜索結(jié)果。所述后端服務(wù)器將在已接收查詢的所述集合中的一個(gè)或者多個(gè)查詢中的詞項(xiàng)歸類為所述給定禁止詞項(xiàng)的變體,所述詞項(xiàng)使搜索引擎響應(yīng)于所述一個(gè)或者多個(gè)查詢而使用所述給定禁止詞項(xiàng)來識(shí)別一個(gè)或者多個(gè)搜索結(jié)果并且防止包括所述變體的內(nèi)容的分發(fā)。
背景技術(shù)
互聯(lián)網(wǎng)促進(jìn)了全球用戶之間的信息交換和交易。這種信息交換使數(shù)據(jù)提供者能夠向各種用戶提供數(shù)據(jù)。可以按照各種方式來提供數(shù)據(jù),包括:將信息發(fā)布在電子文檔(例如,網(wǎng)頁)上和應(yīng)用(例如,移動(dòng)應(yīng)用)內(nèi)。一些互聯(lián)網(wǎng)內(nèi)容提供者和政府實(shí)體禁止發(fā)布某一內(nèi)容和/或某些類型的內(nèi)容。例如,一些政府實(shí)體可能禁止在互聯(lián)網(wǎng)網(wǎng)站上發(fā)布與非法藥物分發(fā)有關(guān)的內(nèi)容。
發(fā)明內(nèi)容
本說明書描述了用于識(shí)別禁止詞項(xiàng)(forbidden term)的變體并且防止包括該變體的內(nèi)容的分發(fā)的系統(tǒng)、方法、裝置、和其它技術(shù)。
一般而言,在本說明書中描述的主題的一個(gè)創(chuàng)新方面可以在包括一個(gè)或者多個(gè)數(shù)據(jù)存儲(chǔ)裝置的系統(tǒng)中實(shí)施,該一個(gè)或者多個(gè)數(shù)據(jù)存儲(chǔ)裝置存儲(chǔ)(i)識(shí)別禁止詞項(xiàng)的集合的數(shù)據(jù)和(ii)包括已接收查詢的查詢?nèi)罩?。該系統(tǒng)可以包括:一個(gè)或者多個(gè)前端服務(wù)器,該一個(gè)或者多個(gè)前端服務(wù)器接收要在數(shù)據(jù)通信網(wǎng)絡(luò)上分發(fā)的內(nèi)容;以及一個(gè)或者多個(gè)后端服務(wù)器,該一個(gè)或者多個(gè)后端服務(wù)器與該數(shù)據(jù)存儲(chǔ)裝置和該一個(gè)或者多個(gè)前端服務(wù)器進(jìn)行通信。該一個(gè)或者多個(gè)后端服務(wù)器可以在該查詢?nèi)罩局凶R(shí)別已接收查詢的集合,對于已接收查詢的所述集合,即使給定禁止詞項(xiàng)未包括在已接收查詢的所述集合所包括的查詢中,所述給定禁止詞項(xiàng)也被用于響應(yīng)于已接收查詢來識(shí)別搜索結(jié)果。該一個(gè)或者多個(gè)后端服務(wù)器可以對在已接收查詢的所述集合中的一個(gè)或者多個(gè)查詢中的詞項(xiàng)歸類為所述給定禁止詞項(xiàng)的變體,該詞項(xiàng)使搜索引擎使用給定禁止詞項(xiàng)來響應(yīng)于一個(gè)或者多個(gè)查詢識(shí)別一個(gè)或者多個(gè)搜索結(jié)果。該一個(gè)或者多個(gè)后端服務(wù)器可以防止由該一個(gè)或者多個(gè)前端服務(wù)器分發(fā)包括給定禁止詞項(xiàng)的變體的內(nèi)容。該方面的其它實(shí)施方式包括對應(yīng)的設(shè)備、方法、和編碼在計(jì)算機(jī)存儲(chǔ)裝置上、配置為執(zhí)行方法的動(dòng)作的計(jì)算機(jī)程序。
可選地,這些和其它實(shí)施方式可以包括以下特征中的一個(gè)或者多個(gè)。在一些方面中,識(shí)別已接收查詢的集合,對于已接收查詢的所述集合,即使給定禁止詞項(xiàng)未包括在已接收查詢的所述集合所包括的查詢中,所述給定禁止詞項(xiàng)也被用于響應(yīng)于已接收查詢來識(shí)別搜索結(jié)果,包括:識(shí)別由搜索引擎擴(kuò)展為包括禁止詞項(xiàng)的給定已接收查詢。在一些方面中,該一個(gè)或者多個(gè)后端服務(wù)器使用詞項(xiàng)的語義網(wǎng)絡(luò)來識(shí)別語義地鏈接至禁止詞項(xiàng)的詞項(xiàng),作為禁止詞項(xiàng)的變體。
在一些方面中,將來自已接收查詢的所述集合中的一個(gè)或者多個(gè)查詢中的詞項(xiàng)歸類為禁止詞項(xiàng)的變體包括:識(shí)別該禁止詞項(xiàng)的候選變體的集合;確定每個(gè)候選變體的分?jǐn)?shù);以及基于每個(gè)候選變體的分?jǐn)?shù)來選擇一個(gè)或者多個(gè)候選變體作為該禁止詞項(xiàng)的變體。候選變體的所述集合可以包括第一候選變體和第二候選變體,該第一候選變體的拼寫被校正為該禁止詞項(xiàng),該第二候選變體被添加至包括該禁止詞項(xiàng)的已接收查詢中。第一候選變體的分?jǐn)?shù)可以基于在第一候選變體與該禁止詞項(xiàng)之間的編輯距離。第二候選變體的分?jǐn)?shù)可以基于第二候選變體的逆向文檔頻率分?jǐn)?shù)。
在一些方面中,在該查詢?nèi)罩局凶R(shí)別已接收查詢的集合,對于已接收查詢的所述集合,即使給定禁止詞項(xiàng)未包括在已接收查詢的所述集合所包括的查詢中,所述給定禁止詞項(xiàng)也被用于響應(yīng)于已接收查詢來識(shí)別搜索結(jié)果,包括:使用映射過程來從該查詢?nèi)罩局凶R(shí)別每個(gè)禁止詞項(xiàng)的候選變體。在一些方面中,將來自已接收查詢的所述集合中的一個(gè)或者多個(gè)查詢中的詞項(xiàng)歸類為該禁止詞項(xiàng)的變體,該詞項(xiàng)使搜索引擎響應(yīng)于一個(gè)或者多個(gè)查詢使用該禁止詞項(xiàng)來識(shí)別一個(gè)或多個(gè)搜索結(jié)果,包括:針對每個(gè)禁止詞項(xiàng)使用縮減過程以從該禁止詞項(xiàng)的候選變體中選擇該禁止詞項(xiàng)的一個(gè)或者多個(gè)變體。每個(gè)縮減過程可以在分立的后端服務(wù)器上執(zhí)行。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌有限責(zé)任公司,未經(jīng)谷歌有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680003648.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 電子數(shù)據(jù)分發(fā)系統(tǒng)
- 分發(fā)系統(tǒng)、分發(fā)控制設(shè)備和分發(fā)控制方法
- 分發(fā)方法和分發(fā)系統(tǒng)
- 廣播TS分發(fā)系統(tǒng)、分發(fā)裝置及分發(fā)方法
- 分發(fā)裝置、分發(fā)系統(tǒng)以及分發(fā)方法
- 分發(fā)系統(tǒng)以及分發(fā)方法
- 影像分發(fā)裝置、影像分發(fā)系統(tǒng)、影像分發(fā)方法及存儲(chǔ)介質(zhì)
- 分發(fā)梳齒以及分發(fā)梳
- 向用戶分發(fā)問題的方法及裝置
- 數(shù)據(jù)分發(fā)系統(tǒng)及數(shù)據(jù)分發(fā)方法
- 一種服務(wù)器連接切換方法、裝置及系統(tǒng)
- 使用VTAG調(diào)停的負(fù)載均衡SCTP關(guān)聯(lián)
- 一種服務(wù)器連接方法及服務(wù)器系統(tǒng)
- 服務(wù)器的配置方法和裝置
- 服務(wù)器負(fù)載均衡的方法、裝置及服務(wù)器設(shè)備
- 一種基于Nginx服務(wù)器的動(dòng)態(tài)負(fù)載處理方法及系統(tǒng)
- 一種數(shù)據(jù)處理系統(tǒng)、方法、客戶端及服務(wù)器
- 一種請求消息處理方法及裝置
- 服務(wù)器確定方法、調(diào)控方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種聲紋檢索方法及前端后端服務(wù)器、后端服務(wù)器





