[發明專利]基于用戶評價的推薦理由生成方法在審
| 申請號: | 201611215951.6 | 申請日: | 2016-12-26 |
| 公開(公告)號: | CN106776568A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 唐雪飛;楊煒林;賈俊德 | 申請(專利權)人: | 成都康賽信息技術有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 成都宏順專利代理事務所(普通合伙)51227 | 代理人: | 周永宏 |
| 地址: | 610041 四川省成都市一*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 用戶 評價 推薦 理由 生成 方法 | ||
技術領域
本發明屬于信息處理技術領域,尤其涉及一種基于用戶評價的推薦理由生成方法。
背景技術
隨著信息化服務在社會各個領域迅速發展,各種服務平臺也逐漸被人們廣泛的接受,用戶在使用服務過程中,也會對這個服務進行評價,評價里包含各種具有情感含義的表情、縮略語、以及簡短、口語化、出現拼寫錯誤等各種情況,計算機如何有效的從這種不確定的評價中得到基于正面的評價、并從中分析得出一個推薦的理由給用戶,而且應該是來源于評價、且具有簡短的口語化等特點,供用戶快速的了解這個服務,這成了一個技術難題。
傳統的文本情感分析,常用的進行詞意進行按照褒義、貶義、中立等進行特征分析,并以頻率作為權重指標。這種從情感詞匯向量的角度作為切入點,以詞頻的情感分析適合普通的文本分類模型,而情感分析需要從這些不規則的文本中,進行語句分析、考慮主謂賓等句型、句式等特點。
發明內容
本發明的發明目的是:為了解決現有技術中存在的以上問題,本發明提出了一種針對評價數據的特點提高情感分析后推薦理由的準確性的基于用戶評價的推薦理由生成方法。
本發明的技術方案是:一種基于用戶評價的推薦理由生成方法,包括:
A、提取用戶對服務的評價數據,將評價數據分割為若干個短句數據保存至數據庫中;
B、從步驟A中的數據庫中隨機抽取若干條短句數據建立訓練集,對訓練集中的短句數據進行詞性分析生成訓練結果;
C、從步驟A中的數據庫中隨機抽取若干條短句數據建立測試集,利用步驟B中的訓練結果對測試集中的短句數據進行分析生成測試結果;
D、根據步驟C中的測試結果對測試集中的短句數據進行拼接,生成推薦理由。
進一步地,所述步驟A中將評價數據分割為若干個短句數據具體為將評價數據按照符號進行分割,形成若干個短句數據。
進一步地,所述步驟B中訓練結果具體為:對訓練集中的短句數據進行情感分類并生成標注值;其中標注值為負數時表示負面情感、標注值為正數時表示正面情感、標注值為0時表示中立詞。
進一步地,所述步驟B中對訓練集中的短句數據進行情感分類具體為采用歸類算法對短句數據進行情感分類。
進一步地,所述步驟B還包括對生成的標注值進行修正生成修正標注值,再采用歸類算法對訓練集中的短句數據進行情感分類生成二次標注值。
進一步地,所述步驟D中對測試集中的短句數據進行拼接具體為采用主謂賓語法結構再生成方式對測試集中的短句數據進行拼接。
本發明的有益效果是:本發明針對評價數據的特點,分別建立訓練集和測試集,利用訓練集對評價數據進行情感分析后對測試集進行處理,從而生成推薦理由,大大提高了基于情感分析后的推薦理由的準確性。
附圖說明
圖1是本發明的基于用戶評價的推薦理由生成方法流程示意圖。
具體實施方式
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本發明,并不用于限定本發明。
圖1是本發明的基于用戶評價的推薦理由生成方法流程示意圖。一種基于用戶評價的推薦理由生成方法,包括:
A、提取用戶對服務的評價數據,將評價數據分割為若干個短句數據保存至數據庫中;
B、從步驟A中的數據庫中隨機抽取若干條短句數據建立訓練集,對訓練集中的短句數據進行詞性分析生成訓練結果;
C、從步驟A中的數據庫中隨機抽取若干條短句數據建立測試集,利用步驟B中的訓練結果對測試集中的短句數據進行分析生成測試結果;
D、根據步驟C中的測試結果對測試集中的短句數據進行拼接,生成推薦理由。
在步驟A中,本發明根據服務的序列號,通過jdbc并使用java編程的方式提取出互聯網上針對這個服務發布的所有用戶的評價數據;再利用斷句分析器對這個服務的所有用戶的評價數據按符號進行斷成若干短句保存到數據庫中。這里的符號包括“。||//.|//.|!|//||?|~|;|,|'|~|;|……|,”。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都康賽信息技術有限公司,未經成都康賽信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611215951.6/2.html,轉載請聲明來源鉆瓜專利網。





