[發明專利]一種基于主觀情感測度的電商產品可靠性指標及其實現方法有效
| 申請號: | 201810256205.4 | 申請日: | 2018-03-27 |
| 公開(公告)號: | CN108665339B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 謝冠旭;張欣予;李大慶 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06 |
| 代理公司: | 北京慧泉知識產權代理有限公司 11232 | 代理人: | 王順榮;唐愛華 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主觀 情感 測度 產品 可靠性 指標 及其 實現 方法 | ||
1.一種基于主觀情感測度的電商產品可靠性指標的計算方法,其特征在于:步驟如下:
步驟一、使用網絡爬蟲框架Scrapy和瀏覽器引擎PhantomJS對網絡平臺商品評論的內容、評論日期、用戶等級和評論數量信息進行數據爬取;
步驟二、對爬取的評論內容數據使用神經網絡進行情感值計算,即針對評論的用詞判斷其正負面概率,取正面概率為情感值;
整個流程為:①輸入句子②分詞③詞ID④詞向量⑤LSTM層⑥全連接層⑦輸出正面、負面概率,取正面概率為情感值;
其中,分詞步驟是將評論的語句拆分成一個個詞語;詞ID是為每一個分出來的詞語建立專屬的識別方式;詞向量則是將每一個擁有詞ID的詞語也就是自然語言中的字詞,轉為計算機能理解的稠密向量;進而通過RNN模型,包括LSTM層和全連接層,檢測正負面評論,最終輸出情感值;
其中輸入的詞ID序列長度被截取及填充到64個詞,嵌入層有128個單元,LSTM層有128個單元,后跟保持概率為0.8的dropout層,最后是2個單元的全連接層,激活函數為softmax,輸出評論情感值S,越大說明評價越正面;
步驟三、通過另一神經網絡,結合其他爬取的數據對評論進行權值計算,該權值表示該條評論的有效概率;
構建一個三層神經網絡,輸入為歸一化后的用戶信用等級、評論長度、是否有圖片、是否有追評和評論數量差分;隱藏層為32個神經元,帶偏置,激活函數為tanh;輸出層2個單元,激活函數為softmax,輸出評論的有效概率U,越大說明評價越正面;
步驟四、將有效概率與情感值結合,計算評論情感值的加權平均,得到商品的最終可靠度評價指標;
設一商品第i條評論經由步驟二得出的情感值為Si,經由步驟三得出的有效概率為Ui,則該商品的可靠度R為各條評論的加權平均值:
2.根據權利要求1所述的一種基于主觀情感測度的電商產品可靠性指標的計算方法,其特征在于:在步驟一中所述的“使用網絡爬蟲框架Scrapy和瀏覽器引擎PhantomJS對網絡平臺商品評論的內容、評論日期、用戶等級和評論數量信息進行數據爬取”,其具體實施方法如下:
進行數據爬取的內容有:
①向服務器發送請求②獲得目標網頁內容③解析頁面,提取目標商品ID④使用PhantomJS跳轉對應商品頁面,抓取評論⑤儲存內容;
評論內容不僅包括買家真實填寫的內容,還包括系統默認評價;對于有買家信用的平臺,正常爬取信用分,若平臺未設立買家信用評估機制,應爬取買家的平臺等級及相似的信息;
現實采集到的數據往往是有缺失及有錯誤數據的,這時候需要運用數據補償、數據篩選方法對數據進行預處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810256205.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:銷售促進系統
- 下一篇:一種基于用戶的保險產品推薦方法和系統





