[發明專利]郵箱作者對應方法和裝置及計算機可讀存儲介質有效
| 申請號: | 201710574481.0 | 申請日: | 2017-07-14 |
| 公開(公告)號: | CN107506374B | 公開(公告)日: | 2020-02-21 |
| 發明(設計)人: | 霍東云 | 申請(專利權)人: | 北京賽時科技有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 北京易光知識產權代理有限公司 11596 | 代理人: | 孫海龍 |
| 地址: | 100085 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 郵箱 作者 對應 方法 裝置 計算機 可讀 存儲 介質 | ||
1.一種郵箱作者對應方法,包括:
郵箱查找步驟,在包含已知作者的作品的文件中查找郵箱;
作者和郵箱共同出現量統計步驟,統計在包含所述已知作者的作品的文件中,所述已知作者與所述郵箱共同出現的文件的數量,即作者和郵箱共同出現量;
合作者獲取步驟,針對所述已知作者與所述郵箱共同出現的文件中包含的作品,獲得所述已知作者的各合作者;
合作者和郵箱共同出現量統計步驟,統計在包含所述已知作者的作品的文件中,各合作者與所述郵箱共同出現的數量,即合作者和郵箱共同出現量;
郵箱關聯步驟,在所述作者和郵箱共同出現量與各合作者和郵箱共同出現量之差均大于預定閾值時,將所述郵箱與所述已知作者相關聯。
2.根據權利要求1所述的郵箱作者對應方法,其特征在于,所述方法還包括:
作者和郵箱共同出現率統計步驟,統計所述已知作者與所述郵箱共同出現的文件在包含已知作者的作品的文件中所占的比率,即作者和郵箱共同出現率;
合作者和郵箱共同出現率統計步驟,統計各所述合作者與所述郵箱共同出現的文件在包含各合作者的作品的文件中所占的比率,即合作者和郵箱共同出現率;
在所述作者和郵箱共同出現量與所述合作者和郵箱共同出現量之差小于預定閾值時,如果所述作者和郵箱共同出現率與各所述合作者和郵箱共同出現率之差均大于預定閾值,則所述郵箱關聯步驟將所述郵箱與所述已知作者相關聯。
3.根據權利要求2所述的郵箱作者對應方法,其特征在于,當所述作者和郵箱共同出現率低于預定閾值時,所述郵箱關聯步驟不將所述郵箱與所述已知作者相關聯。
4.根據權利要求2所述的郵箱作者對應方法,其特征在于,在所述合作者和郵箱共同出現率統計步驟中,在包含各合作者的作品的文件中去除包含已知作者和所述合作者兩者的合作作品的文件。
5.根據權利要求2所述的郵箱作者對應方法,其特征在于,所述方法還包括:
距離計算步驟,采用文件布局法計算在包括所述已知作者和所述合作者的合作作品的文件中,所述郵箱地址和所述已知作者之間的距離以及所述郵箱地址和所述合作者之間的距離;
距離遠近概率計算步驟,確定所述郵箱地址和所述已知作者之間的距離小于所述郵箱地址和所述合作者之間的距離的概率;
當所述郵箱地址和所述已知作者之間的距離小于所述郵箱地址和所述合作者之間的距離的概率大于預定閾值時,所述郵箱關聯步驟將所述郵箱和所述已知作者相關聯。
6.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現權利要求1-5任一項所述方法的步驟。
7.一種郵箱作者對應裝置,包括:
郵箱查找單元,在包含已知作者的作品的文件中查找郵箱;
作者和郵箱共同出現量統計單元,統計在包含已知作者的作品的文件中所述已知作者與所述郵箱共同出現的文件的數量,即作者和郵箱共同出現量;
合作者獲取單元,針對所述已知作者與所述郵箱共同出現的文件中包含的作品,獲得所述已知作者的各合作者;
合作者和郵箱共同出現量統計單元,統計在包含已知作者的作品的文件中,各合作者與所述郵箱共同出現的數量,即合作者和郵箱共同出現量;
數量差計算單元,計算所述作者和郵箱共同出現量與各合作者和郵箱共同出現量之差;
郵箱關聯單元,在所述作者和郵箱共同出現量與各合作者和郵箱共同出現量之差均大于預定閾值時,將所述郵箱與所述已知作者相關聯。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京賽時科技有限公司,未經北京賽時科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710574481.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種教材的制作方法及終端設備
- 下一篇:數據存儲方法及裝置





