[發明專利]基于電子商務評論數據的非聚類中心節點分配方法及裝置在審
| 申請號: | 201810426131.4 | 申請日: | 2018-05-07 |
| 公開(公告)號: | CN108596737A | 公開(公告)日: | 2018-09-28 |
| 發明(設計)人: | 王紅;狄瑞彤;房有麗;周瑩;王露潼;劉海燕;王倩;宋永強 | 申請(專利權)人: | 山東師范大學 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06F17/30 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 楊哲 |
| 地址: | 250014 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子商務 節點分配 聚類中心 評論數據 分配策略 距離矩陣 評論 中心點 樣本 樣本點 度量 類簇 分配 | ||
1.一種基于電子商務評論數據的非聚類中心節點分配方法,其特征在于,該方法包括:
接收電子商務評論數據集,獲取電子商務評論中心點集、近鄰數和距離矩陣;
建立與電子商務評論中心點集、近鄰數和距離矩陣相對應的第一樣本,判斷所述第一樣本中的電子商務評論為必然隸屬點或可能隸屬點;
根據兩步分配策略進行非聚類中心節點分配,所述兩步分配策略為以必然隸屬點和可能隸屬點為度量,按照必然隸屬點或可能隸屬點準則進行樣本點分配,得到真實和虛假兩個不同類型的電子商務評論類簇。
2.如權利要求1所述的方法,其特征在于,在本方法中,判斷所述第一樣本中的電子商務評論為必然隸屬點的方法為:
對所述基于中心點集,近鄰數和距離矩陣的第一樣本進行SNN的計算;
判斷計算結構是否滿足必然隸屬點定義。
3.如權利要求2所述的方法,其特征在于,所述必然隸屬點定義為:
已被分配所述類簇的電子商務評論與未分配所述類簇的電子商務評論的共同鄰居數量至少為設定近鄰數量的一半,則未分配所述類簇的電子商務評論為已被分配所述類簇的電子商務評論所在簇的必然隸屬點。
4.如權利要求1所述的方法,其特征在于,判斷所述第一樣本中的電子商務評論為可能隸屬點的方法為:
對所述基于中心點集,近鄰數和距離矩陣的第一樣本進行SNN的計算;
判斷計算結構是否滿足可能隸屬點定義。
5.如權利要求4所述的方法,其特征在于,所述可能隸屬點定義為:
已被分配所述類簇的電子商務評論與未分配所述類簇的電子商務評論的共同鄰居數量大于零小于設定近鄰數量的一半,則未分配所述類簇的電子商務評論為已被分配所述類簇的電子商務評論所在簇的可能隸屬點。
6.如權利要求1所述的方法,其特征在于,所述必然隸屬點準則進行樣本點分配的具體方法為:
利用廣度優先搜索,從聚類中心開始,依次考察其K近鄰點;
若該點與考察的點之間存在較多共享近鄰,則考察的點必然隸屬于自身所在的簇,將其劃分到所在簇,并加入隊列,繼續考察該點的近鄰點。
7.如權利要求1所述的方法,其特征在于,所述可能隸屬點準則進行樣本點分配的具體方法為:
遍歷所有未分配點,統計其近鄰中隸屬于每個簇的點的數量,構成分配矩陣;
尋找分配矩陣中的最大值,再次遍歷所有未分配點;
若其近鄰中隸屬于某一簇的點數量與前述最大值相同,則將該點分配至該簇,遍歷過所有未分配點后更新識別矩陣,再次重復該過程,完成剩余點的分配。
8.一種計算機可讀存儲介質,其中存儲有多條指令,其特征在于,所述指令適于由終端設備的處理器加載并執行根據權利要求1-7中任一項所述的方法。
9.一種終端設備,包括處理器和計算機可讀存儲介質,處理器用于實現各指令;計算機可讀存儲介質用于存儲多條指令,其特征在于,所述指令用于執行根據權利要求1-7中任一項所述的方法。
10.一種基于電子商務評論數據的聚類方法,其特征在于,一種基于電子商務評論數據的聚類方法,采用如權利要求1-7任一項所述的方法進行非聚類中心節點分配,得到真實和虛假兩個不同類型的電子商務評論類簇進行聚類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東師范大學,未經山東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810426131.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電子商務購物系統
- 下一篇:一種用戶行為檢測方法及裝置





