[發(fā)明專利]網(wǎng)絡(luò)社交平臺(tái)隱私甄別方法、系統(tǒng)、存儲(chǔ)介質(zhì)和計(jì)算機(jī)在審
| 申請?zhí)枺?/td> | 201811451898.9 | 申請日: | 2018-11-30 |
| 公開(公告)號(hào): | CN109739976A | 公開(公告)日: | 2019-05-10 |
| 發(fā)明(設(shè)計(jì))人: | 曹娟;郭俊波;謝添 | 申請(專利權(quán))人: | 中國科學(xué)院計(jì)算技術(shù)研究所 |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35;G06K9/62;G06F21/62;G06F17/27 |
| 代理公司: | 北京律誠同業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 11006 | 代理人: | 祁建國;梁揮 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 甄別信息 網(wǎng)絡(luò)社交平臺(tái) 列表信息 問題信息 隱私性 答案 隱私 存儲(chǔ)介質(zhì) 分析數(shù)據(jù) 隱私信息 標(biāo)簽 訓(xùn)練樣本集 社交網(wǎng)絡(luò) 訓(xùn)練樣本 計(jì)算機(jī) 構(gòu)建 發(fā)布 輸出 學(xué)習(xí) | ||
1.一種網(wǎng)絡(luò)社交平臺(tái)隱私甄別方法,其特征在于,包括:
步驟1、根據(jù)網(wǎng)絡(luò)社交平臺(tái)已發(fā)布的問題及相關(guān)答案之間的結(jié)構(gòu)特征,構(gòu)建由多組分析數(shù)據(jù)構(gòu)成的訓(xùn)練樣本集,該分析數(shù)據(jù)包括:問題信息、相關(guān)的答案列表信息以及對應(yīng)的隱私性標(biāo)簽;
步驟2、以該訓(xùn)練樣本集中的問題信息、相關(guān)的答案列表信息為輸入,以對應(yīng)的隱私性標(biāo)簽為輸出,訓(xùn)練深度學(xué)習(xí)模型得到基于該深度學(xué)習(xí)模型的隱私信息甄別模型;
步驟3、獲取該社交網(wǎng)絡(luò)平臺(tái)上發(fā)布的問題信息,作為待甄別信息,將該待甄別信息和與該待甄別信息相關(guān)的答案列表信息輸入到該隱私信息甄別模型,得到該待甄別信息的隱私性標(biāo)簽作為隱私甄別結(jié)果。
2.如權(quán)利要求1所述的網(wǎng)絡(luò)社交平臺(tái)隱私甄別方法,其特征在于,該步驟1包括:
步驟11、獲取該網(wǎng)絡(luò)社交平臺(tái)多個(gè)話題下的問題信息以及相關(guān)的答案列表信息;
步驟12、對于所獲得的每一問題信息及相關(guān)的答案列表信息,根據(jù)相關(guān)用戶的匿名行為確定該問題對應(yīng)的隱私性標(biāo)簽,以構(gòu)建該訓(xùn)練樣本集。
3.如權(quán)利要求2所述的網(wǎng)絡(luò)社交平臺(tái)隱私甄別方法,其特征在于,該匿名行為包括:問題是否匿名提出、問題答案匿名率、問題關(guān)注匿名率中的至少一項(xiàng),該問題答案匿名率表示一個(gè)問題的匿名答案數(shù)與全部答案數(shù)之比,該問題關(guān)注匿名率表示一個(gè)問題的匿名關(guān)注者數(shù)與全部關(guān)注者數(shù)之比。
4.如權(quán)利要求1所述的網(wǎng)絡(luò)社交平臺(tái)隱私甄別方法,其特征在于,該深度學(xué)習(xí)模型包括:答案子網(wǎng)絡(luò)、問題子網(wǎng)絡(luò)和分類器,該問題子網(wǎng)絡(luò)用于對該訓(xùn)練樣本集中的問題信息進(jìn)行特征學(xué)習(xí),獲得問題信息的向量表示q,該答案子網(wǎng)絡(luò)用于對該訓(xùn)練樣本集中的答案列表信息進(jìn)行特征學(xué)習(xí),獲得答案列表的向量表示a,該分類器用于對獲得的q和a進(jìn)行隱私信息分類。
5.如權(quán)利要求4所述的網(wǎng)絡(luò)社交平臺(tái)隱私甄別方法,其特征在于,該步驟2中,對于該訓(xùn)練集中的每一條分析數(shù)據(jù)執(zhí)行以下子步驟:
步驟51:將該訓(xùn)練樣本集中的問題信息轉(zhuǎn)換為詞向量輸入到雙向長短時(shí)記憶網(wǎng)絡(luò)進(jìn)行特征學(xué)習(xí),獲得問題信息中單詞wt的向量表示其中,為前向的信息,為反向的信息,t為單詞編號(hào);
步驟52:將向量ht進(jìn)行平均,獲得該問題信息的向量表示q;
步驟53:將該問題信息相關(guān)的答案列表信息轉(zhuǎn)換為詞向量輸入到雙向長短時(shí)記憶網(wǎng)絡(luò)進(jìn)行特征學(xué)習(xí),獲得該答案列表中每條答案的向量表示at;
步驟54:將每條答案的向量表示at輸入到雙向長短時(shí)記憶網(wǎng)絡(luò)進(jìn)行特征學(xué)習(xí),獲得該答案列表的向量表示a。
6.如權(quán)利要求4所述的網(wǎng)絡(luò)社交平臺(tái)隱私甄別方法,其特征在于,該分類器為softmax模型、SVM或樸素貝葉斯。
7.如權(quán)利要求1至6中任一項(xiàng)所述的網(wǎng)絡(luò)社交平臺(tái)隱私甄別方法,其特征在于,該隱私性標(biāo)簽為屬于隱私信息或不屬于隱私信息。
8.一種基于深度學(xué)習(xí)的網(wǎng)絡(luò)社交平臺(tái)隱私甄別系統(tǒng),其特征在于,包括:
訓(xùn)練樣本構(gòu)建模塊,用于根據(jù)網(wǎng)絡(luò)社交平臺(tái)已發(fā)布的問題及相關(guān)答案之間的結(jié)構(gòu)特征,構(gòu)建由多組分析數(shù)據(jù)構(gòu)成的訓(xùn)練樣本集,該分析數(shù)據(jù)包括:問題信息、相關(guān)的答案列表信息以及對應(yīng)的隱私性標(biāo)簽;
深度學(xué)習(xí)模塊,用于以該訓(xùn)練樣本集中的問題信息、相關(guān)的答案列表信息為輸入,以對應(yīng)的隱私性標(biāo)簽為輸出,訓(xùn)練深度學(xué)習(xí)模型得到基于該深度學(xué)習(xí)模型的隱私信息甄別模型;
隱私甄別模塊,用于獲取該社交網(wǎng)絡(luò)平臺(tái)上發(fā)布的問題信息,作為待甄別信息,將該待甄別信息和與該待甄別信息相關(guān)的答案列表信息輸入到該隱私信息甄別模型,得到該待甄別信息的隱私性標(biāo)簽作為隱私甄別結(jié)果。
9.一種存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述網(wǎng)絡(luò)社交平臺(tái)隱私甄別方法的步驟。
10.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,在該存儲(chǔ)器上存儲(chǔ)有能夠在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,該處理器執(zhí)行該程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述網(wǎng)絡(luò)社交平臺(tái)隱私甄別方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院計(jì)算技術(shù)研究所,未經(jīng)中國科學(xué)院計(jì)算技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811451898.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 動(dòng)態(tài)頁面信息展示方法和動(dòng)態(tài)頁面信息展示系統(tǒng)
- 一種確定社交網(wǎng)絡(luò)平臺(tái)中用戶屬性的方法和系統(tǒng)
- 一種社交網(wǎng)絡(luò)服務(wù)平臺(tái)的實(shí)現(xiàn)方法及社交網(wǎng)絡(luò)服務(wù)平臺(tái)
- 用于通過社交網(wǎng)絡(luò)平臺(tái)來控制外圍設(shè)備的方法和設(shè)備
- 一種社交網(wǎng)絡(luò)平臺(tái)介入系統(tǒng)
- 一種基于專利信息的社交網(wǎng)絡(luò)平臺(tái)系統(tǒng)及智能社交方法
- 一種廣告投放方法及系統(tǒng)
- 異質(zhì)社交網(wǎng)絡(luò)跨平臺(tái)關(guān)聯(lián)用戶賬戶挖掘方法
- 利用可信初始化器共享秘密
- 不利用可信初始化器的秘密共享





