[發明專利]利用概率謂詞來加速機器學習推理在審
| 申請號: | 201980038901.0 | 申請日: | 2019-05-30 |
| 公開(公告)號: | CN112639769A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | S·喬杜里;S·坎杜拉;路遙 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 姚杰 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 利用 概率 謂詞 加速 機器 學習 推理 | ||
1.一種系統,包括:
存儲器,包括指令;以及
一個或多個計算機處理器,其中所述指令當由所述一個或多個計算機處理器執行時,使所述一個或多個計算機處理器執行操作,所述操作包括:
接收用于搜索數據庫的查詢,所述查詢包括用于利用用戶定義函數(UDF)來過濾所述數據庫中的二進制大對象的謂詞,所述過濾需要由所述UDF對所述二進制大對象的分析以確定所述二進制大對象是否通過由所述謂詞所指定的所述過濾;
基于所述謂詞確定一個或多個概率謂詞(PP)的PP序列,每個PP是與相應子句相關聯的二進制分類器,所述PP計算每個二進制大對象滿足所述子句的PP-二進制大對象概率,所述PP序列定義用于基于所述謂詞來組合所述PP序列的所述PP的表達式;
執行所述PP序列,以確定所述二進制大對象滿足所述表達式的二進制大對象概率,所述二進制大對象概率基于所述PP-二進制大對象概率和所述表達式;
確定哪些二進制大對象具有大于或等于準確性閾值的二進制大對象概率;
從所述搜索中丟棄具有小于所述準確性閾值的所述二進制大對象概率的所述二進制大對象;
對未被丟棄的所述二進制大對象執行所述數據庫查詢,數據庫搜索利用所述UDF;以及
提供所述數據庫搜索的結果。
2.根據權利要求1所述的系統,其中所述二進制大對象是圖像、視頻或文本文檔之一,其中每個PP執行二進制分類以確定所述二進制大對象是否滿足所述PP的所述子句。
3.根據權利要求1所述的系統,其中所述查詢包括所述準確性閾值,其中每個PP與PP準確性、執行所述PP的開銷以及減少率相關聯。
4.根據權利要求3所述的系統,其中確定所述PP序列還包括:
基于以下項從可用PP池中選擇PP:所述查詢中的所述準確性閾值和所述開銷、PP準確性以及所述可用PP池中的PP的減少率。
5.根據權利要求1所述的系統,其中所述表達式包括第一PP的第一子句和第二PP的第二子句的邏輯或運算,其中執行所述PP序列還包括:
執行所述第一PP以生成滿足所述第一子句的第一通過二進制大對象集合和不滿足所述第一子句的第一失敗二進制大對象集合;
在所述第一失敗二進制大對象集合上執行所述第二PP,以生成滿足所述第二子句的第二通過二進制大對象集合和不滿足所述第二子句的第二失敗二進制大對象集合;以及
利用所述第一通過二進制大對象集合和所述第二通過二進制大對象集合的并集來繼續所述PP序列。
6.一種方法,包括:
接收用于搜索數據庫的查詢,所述查詢包括用于利用用戶定義函數(UDF)來過濾所述數據庫中的二進制大對象的謂詞,所述過濾需要由所述UDF對所述二進制大對象的分析以確定所述二進制大對象是否通過由所述謂詞所指定的所述過濾;
基于所述謂詞確定一個或多個概率謂詞(PP)的PP序列,每個PP是與相應子句相關聯的二進制分類器,所述PP計算每個二進制大對象滿足所述子句的PP-二進制大對象概率,所述PP序列定義用于基于所述謂詞來組合所述PP序列的所述PP的表達式;
執行所述PP序列,以確定所述二進制大對象滿足所述表達式的二進制大對象概率,所述二進制大對象概率基于所述PP-二進制大對象概率和所述表達式;
確定哪些二進制大對象具有大于或等于準確性閾值的二進制大對象概率;
從所述搜索中丟棄具有小于所述準確性閾值的所述二進制大對象概率的所述二進制大對象;
對未被丟棄的所述二進制大對象執行所述數據庫查詢,數據庫搜索利用所述UDF;以及
提供所述數據庫搜索的結果。
7.根據權利要求6所述的方法,其中所述二進制大對象是圖像、視頻或文本文檔之一,其中每個PP執行二進制分類以確定所述二進制大對象是否滿足所述PP的所述子句。
8.根據權利要求6所述的方法,其中所述查詢包括所述準確性閾值,其中每個PP與PP準確性、執行所述PP的開銷以及減少率相關聯。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980038901.0/1.html,轉載請聲明來源鉆瓜專利網。





