[發明專利]用于并入到審查媒體語料庫中的媒體源度量在審
| 申請號: | 201880092001.X | 申請日: | 2018-06-29 |
| 公開(公告)號: | CN111919210A | 公開(公告)日: | 2020-11-10 |
| 發明(設計)人: | 斯科特·彼得森 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G06F16/954 | 分類號: | G06F16/954 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 李寶泉;任慶威 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 并入 審查 媒體 語料庫 中的 度量 | ||
1.一種方法,包括:
確定第一媒體語料庫的多個搜索事件的搜索特性;
識別第二媒體語料庫的搜索事件的集合,其中,所述搜索事件的集合與所述搜索特性相對應并且包括引用多個媒體源的搜索事件;
從所述搜索事件的集合中提取與所述第二媒體語料庫相關聯的媒體源的集合;
由處理設備基于所述媒體源的度量從所述媒體源的集合中選擇媒體源,其中,所述度量基于引用所述媒體源的搜索事件;以及
將內容從所選擇的與所述第二媒體語料庫相關聯的媒體源并入到所述第一媒體語料庫中。
2.根據權利要求1所述的方法,進一步包括:分析包括所述第一媒體語料庫的多個搜索事件的日志,其中,所述多個搜索事件中的至少一個包括搜索詞語并且被鏈接到所述搜索特性。
3.根據權利要求1或2所述的方法,其中,所述搜索特性包括知識圖標識符。
4.根據權利要求1、2或3所述的方法,其中,所述第一媒體語料庫包括包含針對在特定年齡范圍內的一類個體的內容特性的媒體項的合集。
5.根據任一前述權利要求所述的方法,其中,所述媒體源包括媒體通道并且所述內容包括視頻內容。
6.根據任一前述權利要求所述的方法,其中,提取所述媒體源的集合包括識別由所述第二媒體語料庫的所述搜索事件的集合所引用的媒體通道的集合。
7.根據任一前述權利要求所述的方法,其中,從與所述第二媒體語料庫相關聯的所述媒體源的集合中選擇所述媒體源包括:
識別在所述集合中引用所述媒體源的搜索事件,其中,所識別的搜索事件中的每一個均包括媒體源的次序;
確定所述媒體源在所述次序內的位置;并且
基于所述媒體源的位置和與所述搜索特性相對應的所述搜索事件的集合中的搜索事件的量來計算所述媒體源的度量;以及
選擇具有預定度量的所述媒體源。
8.根據權利要求7所述的方法,其中,所述預定度量是最大度量。
9.根據任一前述權利要求所述的方法,進一步包括鑒于以下等式基于所述媒體源在所述搜索事件的集合中的平均排名r并且基于所述媒體源的違反值pv來計算所述媒體源的度量:
度量=1/(r*(pv+1))。
10.根據任一前述權利要求所述的方法,其中,確定所述第一媒體語料庫的多個搜索事件的搜索特性包括:
將所述第一媒體語料庫的搜索事件分為多個組;
基于預定閾值選擇所述多個組中的一個或多個組;
識別與所述搜索事件的一個或多個組相關聯的多個搜索特性;并且
將所述多個搜索特性合并為唯一搜索特性的集合;以及
基于與所述搜索特性相關聯的搜索事件的量從所述唯一搜索特性的集合中選擇所述搜索特性。
11.一種系統,包括:
存儲器;和
處理設備,所述處理設備通信地耦合到所述存儲器,所述處理設備被配置成執行根據權利要求1至10中的任一項所述的方法。
12.一種非暫時性計算機可讀存儲介質,所述非暫時性計算機可讀存儲介質包括用于使處理設備執行根據權利要求1至10中的任一項所述的方法的指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880092001.X/1.html,轉載請聲明來源鉆瓜專利網。





