[發明專利]保護隱私的文本分類方法及裝置有效
| 申請號: | 202010691952.8 | 申請日: | 2020-07-17 |
| 公開(公告)號: | CN111737719B | 公開(公告)日: | 2020-11-24 |
| 發明(設計)人: | 李龍飛;周俊 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G06F21/62;G06F21/53;G06F16/35 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 張明;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 保護 隱私 文本 分類 方法 裝置 | ||
本說明書實施例提供一種保護隱私的文本分類方法及裝置,在文本分類方法中,第一服務器接收數據請求方發送的文本分類請求,文本分類請求至少包括采用數據請求方的第一公鑰進行加密的待分類文本。基于數據提供方提供的加密樣本文本,構建詞組集合。該加密樣本文本采用第一公鑰對樣本文本加密得到。確定加密詞頻,該加密詞頻為詞組集合中各詞組在加密的待分類文本中的詞頻統計的加密值。至少向第二服務器發送加密詞頻,以使得第二服務器將加密詞頻加載到其可信執行環境TEE中,在TEE中,對加密詞頻進行解密,并將解密結果輸入預先部署在TEE中的文本分類模型,得到待分類文本的分類結果,其中的文本分類模型基于上述樣本文本訓練得到。
技術領域
本說明書一個或多個實施例涉及計算機技術領域,尤其涉及一種保護隱私的文本分類方法及裝置。
背景技術
在大數據時代,市場存在大量的數據合作需求。比如,某個企業或者組織(以下簡稱數據請求方)想要針對某個文本進行分類,而其在本地又沒有維護相應的文本分類模型。那么就需要其它維護有文本分類模型的企業或者組織(以下簡稱數據提供方)協助其完成文本的分類。
然而,對于數據提供方來說,文本分類模型屬于其私有數據,不能泄露給數據請求方。而對于數據請求方來說,它也不能讓數據提供方獲取到所請求分類的文本。
因此,需要提供一種方案,以便能夠在保護雙方隱私的情況下,實現文本的分類。
發明內容
本說明書一個或多個實施例描述了一種保護隱私的文本分類方法及裝置,可以在確保各方數據安全的情況下實現文本的分類。
第一方面,提供了一種保護隱私的文本分類方法,包括:
接收數據請求方發送的文本分類請求,所述文本分類請求至少包括采用所述數據請求方的第一公鑰進行加密的待分類文本;
基于數據提供方提供的加密樣本文本,構建詞組集合;所述加密樣本文本采用所述第一公鑰對樣本文本加密得到,所述詞組集合中的每個詞組由所述加密樣本文本中的一個或多個加密樣本詞組成;
確定加密詞頻,所述加密詞頻為所述詞組集合中各詞組在所述加密的待分類文本中的詞頻統計的加密值;
至少向第二服務器發送所述加密詞頻,以使得所述第二服務器將所述加密詞頻加載到其可信執行環境TEE中,在所述TEE中,對所述加密詞頻進行解密,并將解密結果輸入預先部署在所述TEE中的文本分類模型,得到所述待分類文本的分類結果,其中所述文本分類模型基于所述樣本文本訓練得到。
第二方面,提供了一種保護隱私的文本分類方法,包括:
接收第一服務器發送的加密詞頻;所述加密詞頻為詞組集合中各詞組在加密的待分類文本中的詞頻統計的加密值;
所述詞組集合由所述第一服務器基于數據提供方提供的加密樣本文本構建得到;所述加密樣本文本采用數據請求方的第一公鑰對樣本文本加密得到;所述加密的待分類文本采用所述第一公鑰對待分類文本加密得到;
將所述加密詞頻加載到所述TEE中,在所述TEE中,對所述加密詞頻進行解密;
將解密結果輸入所述文本分類模型,得到所述待分類文本的分類結果,其中所述文本分類模型基于所述樣本文本訓練得到。
第三方面,提供了一種保護隱私的文本分類方法,包括:
接收數據請求方發送的文本分類請求,所述文本分類請求至少包括采用所述數據請求方的第一公鑰進行加密的待分類文本;
基于數據提供方提供的加密樣本文本,構建詞組集合;所述加密樣本文本采用所述第一公鑰對樣本文本加密得到,所述詞組集合中的每個詞組由所述加密樣本文本中的一個或多個加密樣本詞組成;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010691952.8/2.html,轉載請聲明來源鉆瓜專利網。





