[發明專利]一種通過文化云平臺進行互動的方法及裝置有效
| 申請號: | 201810017376.1 | 申請日: | 2018-01-09 |
| 公開(公告)號: | CN108090228B | 公開(公告)日: | 2022-01-28 |
| 發明(設計)人: | 呂長紅;包嘉會;李欣 | 申請(專利權)人: | 江蘇凌霄智慧信息技術有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536 |
| 代理公司: | 鹽城易動專利代理事務所(特殊普通合伙) 32613 | 代理人: | 王宗藝 |
| 地址: | 224000 江蘇省鹽城市鹽南高*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通過 文化 平臺 進行 互動 方法 裝置 | ||
1.一種通過文化云平臺進行互動的方法,其特征在于:該流程方法包括:
S01通過網絡平臺進行評論信息的數據采集,其中數據采集包括以下內容:評論文本信息以及評論用戶的個人信息,并且將評論文本信息和評論用戶個人信息形成關聯,在數據采集時不僅采集評論信息本身的文本信息,還要提取評論者的相關個人資料的信息;以便在計算評論排序的過程中計算評論者的身份信息參數;
S02通過文本檢測模塊,檢測評論文的復雜程度,
即在提取的文本信息之后,文本檢測模塊對該文本信息的長度、字符標點比例、字段重復比例以及是否出現特定垃圾字段方面,對文本進行數據分析;
具體的分析流程是:
(1)通過len(R)函數,確定文本信息的長度,并記錄長度函數len(R);
(2)提取評論文本中的中文文字的個數Char(R)以及評論文本中的標點的個數M(R),并計算字符標點的比例Rat(R)=M(R)/Char(R);
(3)通過文本識別方法識別評論文本中重復三次以上的中文字符的長度占總文本長度的百分比lev(R);
(4)通過文本搜索的方法,在評論文本中自動搜索該評論文本中是否包含垃圾字段庫中的字段,并將搜索結果的字段數的值賦于函數not(R);
(5)通過復雜度函數C(R)=n1×len(R)/(n2×Rat(R)+n3×lev(R)+n4×not(R)),其中n1,n2,n3,n4取值為大于0且小于1,且n1+n2+n3+n4=1;n1,n2,n3,n4可以視所需要的權重來調整;
S03通過評論文本與評論者的對應關系,獲得評論用戶個人信息數據,個人信息數據包括:性別、年齡、學歷、地域;并且建立與各評論文本對應的用戶個人信息數據表;
S04評論查看注冊用戶登錄后,進行評論查看時,會通過注冊的個人信息生成目標匹配信息數據表,該目標匹配信息數據表的格式與個人信息數據對應,也包括:性別、年齡、學歷;S05在生成評論信息排序時,通過查表來比較目標匹配信息數據表和評論用戶個人信息數據表生成個人信息差異化參數,
其中,對于性別參數G,區別賦值為1,相同賦值為0;
對于年齡參數A,每相差5年,原始值為0,年齡差異值賦值增加0.5;
對于學歷參數E,原始值為0,學歷每相差一個等級,學歷參數賦值增加0.2;
個人信息化差異參數info(R)=a1×G+a2×A+a3×E;
S06通過綜合復雜度參數和個人信息化差異參數進行評論內容排名;采用優先升序排列個人信息化差異參數的基礎上進一步降序復雜度函數進行排列;或者通過個人信息化差異參數和復雜度函數進行擬合進行排列。
2.根據權利要求1所述的通過文化云平臺進行互動的方法,其特征在于:該方法進一步包括通過自動化語義分析的方式進行語義標簽的添加。
3.根據權利要求1所述的通過文化云平臺進行互動的方法,其特征在于:該方法進一步包括綜合排序中進一步結合其他用戶瀏覽評論時給出的累積推薦數量進行排序。
4.根據權利要求1所述的通過文化云平臺進行互動的方法,其特征在于:采用優先升序排列個人信息化差異參數的基礎上進一步降序復雜度函數進行排列,并且進一步以其他用戶瀏覽評論時給出的累積推薦數量進行降序排序;或者通過個人信息化差異參數、復雜度函數進行、其他用戶瀏覽評論時給出的累積推薦數量同時擬合后來進行排列。
5.一種實現通過文化云平臺進行互動的方法的裝置,其特征在于:該裝置包括評論信息獲取模塊、復雜度計算模塊、個人信息差異計算模塊以及排序顯示模塊;
其中,評論信息獲取模塊用于數據采集評論文本信息以及評論用戶的個人信息,并且將評論文本信息和評論用戶個人信息形成關聯;
復雜度計算模塊,在提取的文本信息之后,文本檢測模塊對該文本信息的長度、字符標點比例、字段重復比例以及是否出現特定垃圾字段幾個方面,對文本進行數據分析;
所述復雜度計算模塊具體用于:
(1)通過len(R)函數,確定文本信息的長度,并記錄長度函數len(R);
(2)提取評論文本中的中文文字的個數Char(R)以及評論文本中的標點的個數M(R),并計算字符標點的比例Rat(R)=M(R)/Char(R);
(3)通過文本識別方法識別評論文本中重復三次以上的中文字符的長度占總文本長度的百分比lev(R);
(4)通過文本搜索的方法,在評論文本中自動搜索該評論文本中是否包含垃圾字段庫中的字段,并將搜索結果的字段數的值賦于函數not(R);
(5)通過復雜度函數C(R)=n1×len(R)/(n2×Rat(R)+n3×lev(R)+n4×not(R)),其中n1,n2,n3,n4取值為大于0且小于1,且n1+n2+n3+n4=1;n1,n2,n3,n4可以視所需要的權重來調整;
個人信息差異計算模塊,用于通過評論文本與評論者的對應關系,獲得評論用戶個人信息數據,個人信息數據包括:性別、年齡、學歷、地域,并且建立與各評論文本對應的用戶個人信息數據表;
在生成評論信息排序時,通過查表來比較目標匹配信息數據表和評論用戶個人信息數據表生成個人信息差異化參數,
其中,對于性別參數G,區別賦值為1,相同賦值為0;
對于年齡參數A,每相差5年,原始值為0,年齡差異值賦值增加0.5;
對于學歷參數E,原始值為0,學歷每相差一個等級,學歷參數賦值增加0.2;
個人信息化差異參數info(R)=a1×G+a2×A+a3×E;
排序顯示模塊,用于通過綜合復雜度參數和個人信息化差異參數進行評論內容排名,采用優先升序排列個人信息化差異參數的基礎上進一步降序復雜度函數進行排列;或者通過個人信息化差異參數和復雜度函數進行同時擬合后來進行排列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇凌霄智慧信息技術有限公司,未經江蘇凌霄智慧信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810017376.1/1.html,轉載請聲明來源鉆瓜專利網。





