[發明專利]基于多極情感分析的用戶行為預測系統及其方法有效
| 申請號: | 201810525929.4 | 申請日: | 2018-05-29 |
| 公開(公告)號: | CN108733838B | 公開(公告)日: | 2021-04-23 |
| 發明(設計)人: | 王玲;周鐵華;呼功亮;孫聰慧 | 申請(專利權)人: | 東北電力大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/953;G06F40/289;G06F40/30 |
| 代理公司: | 吉林市達利專利事務所 22102 | 代理人: | 陳傳林 |
| 地址: | 132012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 多極 情感 分析 用戶 行為 預測 系統 及其 方法 | ||
1.一種基于多極情感分析的用戶行為預測系統,其特征是,它包括:用于采集網絡數據并進行分類管理,進而構建系統數據庫的數據采集及數據庫管理模塊;基于分詞詞典將每個課時的文本語段進行分詞處理,并將參與觀看情況、參與評論情況、參與問答情況、私信教師情況和私信其他用戶情況五項用戶行為表示為時間序列,從而合并運算構建用戶參與度時間序列的數據預處理模塊;基于多種詞性詞典對分詞處理后的語段進行詞語匹配與位置標注,而后對語句情感進行量化處理,實現語句的情感量化,最終通過加權計算處理分析用戶的階段性情感傾向與情感傾向性的多極情感分析模塊;通過分析網絡學習用戶的情感傾向性與用戶行為將用戶分為活躍的積極用戶、活躍的消極用戶、游覽學習的用戶和抽樣學習的用戶四類的用戶分類模塊;用于實時預測用戶行為的用戶行為實時預測模塊;用于展示用戶ID、課程信息、課程教師、實時畢業概率、用戶類別、情感傾向性、課程完成情況、考試成績和畢業情況的狀態評估可視化模塊;所述的數據采集及數據庫管理模塊與數據預處理模塊信號連接,所述的數據預處理模塊分別與數據采集及數據庫管理模塊、用戶分類模塊、多極情感分析模塊信號連接,所述的用戶分類模塊分別與數據預處理模塊、狀態評估可視化模塊、多極情感分析模塊信號連接,所述的多極情感分析模塊分別與數據預處理模塊、用戶分類模塊、用戶行為實時預測模塊信號連接,所述的用戶行為實時預測模塊分別與多極情感分析模塊、狀態評估可視化模塊信號連接。
2.根據權利要求1所述的基于多極情感分析的用戶行為預測系統,其特征是,所述的數據采集及數據庫管理模塊所采集的數據包括:文本數據與學習行為數據,其中文本數據包括:用戶評論文本、用戶發起話題文本、用戶提問文本、用戶回復話題文本、用戶回復提問文本、私信教師文本、私信其他用戶文本和用戶基本信息;學習行為數據包括:參與觀看情況、參與評論情況、參與問答情況、私信教師情況、考試成績、畢業情況、作業完成情況和私信其他用戶情況。
3.根據權利要求1所述的基于多極情感分析的用戶行為預測系統,其特征是,所述的數據預處理模塊的功能是,分別對文本數據與用戶行為數據進行預處理,其中,需要經過數據的預處理學習行為數據包括:參與觀看情況、參與評論情況、參與問答情況、私信教師情況和私信其他用戶情況五項學習行為數據;首先,將所述的五項學習行為數據處理成包括時間屬性與參與度屬性的二維時間序列;其次,將所述的五項學習行為數據二維時間序列進行合并運算,得到參與度時間序列,文本數據預處理的功能在于,基于分詞詞典以課時為時間節點,將每個時間節點的文本語段進行分詞處理。
4.根據權利要求1所述的基于多極情感分析的用戶行為預測系統,其特征是,所述的多極情感分析模塊用于文本數據的情感量化處理,最終將文本數據表示為情感向量,首先,基于多種詞性詞典對分詞處理后的語段進行詞語匹配與位置標注;而后,對語句情感進行量化處理,實現語句的情感量化;最終,通過加權計算處理分析用戶的階段性情感傾向與情感傾向性,其中,用于詞性分析的詞典包括多極情感詞典,程度副詞詞典,否定詞詞典,轉折連詞詞典,情感標點符號和情感表情符號。
5.根據權利要求1所述的基于多極情感分析的用戶行為預測系統,其特征是,所述的用戶分類模塊四種用戶類型中,所述的活躍的積極用戶為:課程學習參與度較高,而且情感傾向性表現為積極的用戶;所述的活躍的消極用戶為:課程學習參與度較高,而且情感傾向性表現為消極的用戶;所述的游覽學習的用戶為:僅參與前期課程的學習,三節課時以后不再參與課程學習的用戶;所述的抽樣學習的用戶為:不定時參與課程學習,曠課次數較多的用戶。
6.根據權利要求1所述的基于多極情感分析的用戶行為預測系統,其特征是,所述的用戶行為預測模塊的功能是實時預測用戶的行為,主要通過分析用戶的多極情感預測其畢業概率。
7.根據權利要求1所述的基于多極情感分析的用戶行為預測系統,其特征是,所述的狀態評估可視化模塊的功能是,根據狀態評估可視化處理,展示相應的用戶行為,包括:實時畢業概率、用戶類別、情感傾向性、課程完成情況、考試成績和畢業情況。
8.一種基于多極情感分析的用戶行為預測方法,其特征是,它包括以下步驟:
步驟1:針對網絡教學網站,進入數據采集及數據庫管理模塊,利用網絡爬蟲采集網絡教學網站數據,依據字段屬性與數據結構,將網頁數據保存到數據庫中;
步驟2:對所述網頁數據進行數據預處理:
(1)定義參與觀看時間序列CVPTS,CVPTS是每個課時用戶是否參與課程觀看的時間序列,參與觀看記為1,未參與觀看記為0;
(2)定義參與評論時間序列CCPTS,CCPTS是每個課時用戶是否參與課程評論的時間序列,參與評論記為1,未參與評論記為0;
(3)定義參與問答時間序列CQPTS,CQPTS是每個課時用戶是否參與課程問答的時間序列,參與問答記為1,未參與問答記為0;
(4)定義私信教師時間序列CTPTS,CTPTS是每個課時用戶是否私信教師的時間序列,私信記為1,未私信記為0;
(5)定義私信其他用戶時間序列COPTS,COPTS是每個課時用戶是否私信其他用戶的時間序列,私信記為1,未私信記為0;
(6)定義參與度時間序列ACPTS,判斷在每個課時,用戶是否參與課程觀看,參與評論,參與問答,私信教師,私信其他用戶五項用戶行為中的任何一項行為活動,參與記為1,未參與記為0;
(7)以課時為時間節點,合并每個時間節點的文本語段,文本語段包括:用戶評論文本Comment,用戶發起話題文本Topic-Create,用戶提問文本Question-Create,用戶回復話題文本Topic-Reply,用戶回復提問文本Question-Reply,私信教師文本To-Teacher,私信其他用戶文本To-Other;
(8)語段分詞,利用分詞詞典對所述的各時間節點的合并文本語段,進行分詞處理;
步驟3:情感表達規則建立:
(1)擴展現有多極情感詞典:計算詞語相似度Similarity,在同義詞詞典中選擇每個情感詞詞意相似度最高的五個詞語,并添加到現有情感詞典中;
(2)定義多極情感詞典影響強度w;
(3)定義程度副詞影響強度ε;
(4)定義情感標點符號影響強度ω;
(5)定義情感表情符號影響強度δ;
(6)定義否定詞影響強度μ;
(7)定義轉折連詞對前向與后向子句的影響強度σ;
步驟4:語句情感量化:
(1)定義語段s,并對語段s進行分句處理;
(2)定義語句si,si是語段s中的第i個語句;
(3)定義語句的多極情感量化值p(si),采用公式得到語句的情感量化值,其中,n*是語句si中情感詞的總數,wj是語句si中第j個情感詞的影響強度,m是修飾情感詞wj的程度副詞總數,εk是語句si中第k個程度副詞的影響強度,ω是情感標點符號的影響強度,δ是情感表情符號的影響強度,μ是否定詞的影響強度,σ是轉折連詞對前向與后向子句的影響強度;
步驟5:語段情感向量化:
(1)定義課時節點t;
(2)定義語段情感向量vt,采用公式得到語段情感向量,其中,n是語段s中語句的總數;
步驟6:階段性情感傾向分析:
(1)定義階段性單極情感量化值pst,其中,t是課時節點;
(2)定義階段性情感傾向max pst,采用統計分析法計算每一課時t的情感量化值最高的單極情感量化值,得到階段性情感傾向max pst;
步驟7:情感傾向性分析:
(1)定義情感傾向性Et,采用公式得到用戶情感傾向性,其中,n’是課時的總數;
(2)定義積極情感傾向性,積極情感傾向性包含:快樂,驚訝,傲慢,愛慕;
(3)定義消極情感傾向性,消極情感傾向性包含:悲傷,憤怒,失望,傲慢,恐懼;
步驟8:用戶分類:
(1)定義活躍的積極用戶,判斷參與度時間序列是否具有較高的完整度,并具有積極情感傾向性;
(2)定義活躍的消極用戶,判斷參與度時間序列是否具有較高的完整度,并具有消極情感傾向性;
(3)定義瀏覽學習的用戶,通過公式iffand Pc(t)≠1 when t≥3判斷用戶是否屬于瀏覽學習的用戶;
(4)定義抽樣學習的用戶,定義參與度時間序列ACPTS的曠課次數rv,通過公式iff rv≥3 and判斷用戶是否屬于抽樣學習的用戶;
步驟9:學習行為實時預測:
(1)實時統計用戶每個課時的階段性情感傾向max pst;
(2)實時計算每個課時的階段性積極情感與消極情感比率r;
(3)將每位用戶的階段性積極情感與消極情感比率r及相應的畢業情況輸入畢業概率回歸函數f(x)=p1×r3+p2×r2+p3×r+p4,其中,p1,p2,p3,p4是回歸函數的回歸系數,f(x)是預測的畢業概率;
(4)將未處理用戶的階段性積極情感與消極情感比率r輸入畢業概率回歸函數f(x)實時預測畢業概率;
步驟10:在狀態評估可視化模塊顯示用戶的行為與狀態,包括:預測畢業概率,用戶類別,情感傾向性,課程完成情況,考試成績,畢業情況。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北電力大學,未經東北電力大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810525929.4/1.html,轉載請聲明來源鉆瓜專利網。





