[發(fā)明專利]一種考慮種子信息及因果關(guān)系的評(píng)論有用性預(yù)測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202310032346.9 | 申請(qǐng)日: | 2023-01-10 |
| 公開(公告)號(hào): | CN116010702A | 公開(公告)日: | 2023-04-25 |
| 發(fā)明(設(shè)計(jì))人: | 姜元春;張萌;錢洋;劉業(yè)政 | 申請(qǐng)(專利權(quán))人: | 合肥工業(yè)大學(xué) |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535;G06F16/9532;G06F40/242;G06F40/30;G06Q30/0201 |
| 代理公司: | 安徽省合肥新安專利代理有限責(zé)任公司 34101 | 代理人: | 陸麗莉;何梅生 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 考慮 種子 信息 因果關(guān)系 評(píng)論 有用 預(yù)測(cè) 方法 | ||
本發(fā)明公開了一種考慮種子信息及因果關(guān)系的評(píng)論有用性預(yù)測(cè)方法,包括獲取評(píng)論文本及其對(duì)應(yīng)的非文本數(shù)據(jù),從而構(gòu)建評(píng)論數(shù)據(jù)集D;獲取用戶評(píng)論偏好,從而構(gòu)建種子主題詞分布φsupgt;s/supgt;;基于評(píng)論數(shù)據(jù)集D和種子主題詞分布φsupgt;s/supgt;構(gòu)建貝葉斯種子主題回歸模型;基于所述評(píng)論數(shù)據(jù)集D,初始化步驟S2與步驟S3中的所有參數(shù),并利用EM算法與吉布斯采樣方法對(duì)文檔主題分布、主題詞分布、評(píng)論有用性預(yù)測(cè)分布進(jìn)行參數(shù)推斷。本發(fā)明通過加入種子信息來允許用戶指導(dǎo)主題的發(fā)現(xiàn)過程,從而能快速、準(zhǔn)確地挖掘?qū)τ脩絷P(guān)注的有益主題,同時(shí)通過聯(lián)合建模評(píng)論文本和評(píng)論相關(guān)數(shù)據(jù)來提高預(yù)測(cè)精度,可廣泛應(yīng)用于因果推斷和語言學(xué)領(lǐng)域。
技術(shù)領(lǐng)域
本發(fā)明涉及評(píng)論有用性預(yù)測(cè)技術(shù)領(lǐng)域,具體涉及一種考慮種子信息及因果關(guān)系的評(píng)論有用性預(yù)測(cè)方法。
背景技術(shù)
互聯(lián)網(wǎng)的迅猛發(fā)展使得在線交互成為一種全球性的日常現(xiàn)象,這為人們的生活帶來了極大的便利。與此同時(shí),隨之產(chǎn)生的巨量評(píng)論文本數(shù)據(jù)也變得唾手可得。這些數(shù)據(jù)中蘊(yùn)含著社會(huì)、市場(chǎng)、企業(yè)和消費(fèi)者的行為特征。因此為了使數(shù)據(jù)價(jià)值得以體現(xiàn),研究人員必須能夠提取潛在的數(shù)據(jù)特征,以衡量、理解并解釋其背后所代表的市場(chǎng)行為的原因結(jié)果。
為了從非結(jié)構(gòu)化的評(píng)論文本數(shù)據(jù)中提取潛在的數(shù)據(jù)特征,研究者提出了主題建模技術(shù)。主題建模可以幫助我們從文本中提取隱含的語義信息。但對(duì)于營(yíng)銷者而言,單單得到文本的潛在語義特征是不夠的,他們更希望從這些特征中獲得有價(jià)值的用戶反饋,并用于改進(jìn)商品或服務(wù)以提升自身核心競(jìng)爭(zhēng)力。
但是,現(xiàn)有融合主題模型的評(píng)論有用性預(yù)測(cè)方法存在三個(gè)問題。其一,利用傳統(tǒng)主題模型從文本數(shù)據(jù)中提取潛在的數(shù)據(jù)特征是一個(gè)無監(jiān)督的過程,其最大的局限性在于提取到的數(shù)據(jù)特征并不總是有意義的或是用戶感興趣的;其二,目前的研究大多關(guān)注數(shù)據(jù)間的相關(guān)關(guān)系來達(dá)到更好的預(yù)測(cè)結(jié)果,忽視了因果關(guān)系在干預(yù)、預(yù)測(cè)評(píng)論有用性中所起到的關(guān)鍵作用。其三,部分考慮因果關(guān)系的評(píng)論有用性預(yù)測(cè)研究多采用雙階段的方法來進(jìn)行因果推斷,但是由于文本本身作為一種估計(jì)數(shù)據(jù),如果將文本與預(yù)測(cè)數(shù)據(jù)分開估計(jì),那么由此產(chǎn)生的因果效果是有偏差的。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種考慮種子信息及因果關(guān)系的評(píng)論有用性預(yù)測(cè)方法,以期能解決現(xiàn)有基于文本的因果推斷方法無法聯(lián)合估計(jì)評(píng)論文本和評(píng)論長(zhǎng)度、評(píng)論評(píng)級(jí)、整體評(píng)級(jí)相關(guān)數(shù)據(jù)信息以及無法從文本數(shù)據(jù)中獲得連貫、有意義的主題特征的問題;從而能提高預(yù)測(cè)準(zhǔn)確性,同時(shí)基于因果推斷的評(píng)論有用性預(yù)測(cè)結(jié)果可以有效直接指導(dǎo)營(yíng)銷者進(jìn)行決策,并能提高決策準(zhǔn)確性。
為實(shí)現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案予以實(shí)現(xiàn):
本發(fā)明一種考慮種子信息及因果關(guān)系的評(píng)論有用性預(yù)測(cè)方法的特點(diǎn)在于,包括:
S1、獲取評(píng)論文本及其對(duì)應(yīng)的非文本數(shù)據(jù),從而構(gòu)建評(píng)論數(shù)據(jù)集D;
S11、獲取評(píng)論數(shù)據(jù)集D中包含K個(gè)常規(guī)主題的評(píng)論文本集合W={W1,W2,…,Wd,…,WD},其中,|D|表示評(píng)論文本集合W中評(píng)論文本的數(shù)量;Wd表示第d篇評(píng)論文本,且wd,n表示第d篇評(píng)論文本W(wǎng)d中的第n個(gè)單詞,Nd表示第d篇評(píng)論文本W(wǎng)d中的單詞總數(shù);
構(gòu)建評(píng)論文本集合W的詞典V={w1,...,wv,...,w|V|},其中,wv表示詞典V中的第v個(gè)單詞,|V|表示評(píng)論文本集合W中不重復(fù)的詞匯總數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥工業(yè)大學(xué),未經(jīng)合肥工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310032346.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 標(biāo)志控制請(qǐng)求代理仲裁的方法和系統(tǒng)
- 信號(hào)處理方法與設(shè)備以及記錄介質(zhì)
- 一種考慮能量傳輸?shù)闹欣^選擇方法
- 一種考慮電網(wǎng)分區(qū)優(yōu)化運(yùn)行的城市電網(wǎng)規(guī)劃方法
- 一種定位考慮攻擊精度的骨干鏈路DDoS攻擊目標(biāo)鏈路的方法
- 基于全局策略管理節(jié)點(diǎn)網(wǎng)絡(luò)故障的程序
- 基于本地策略管理節(jié)點(diǎn)網(wǎng)絡(luò)故障的程序
- 考慮互補(bǔ)約束的潮流計(jì)算方法及裝置
- 考慮穩(wěn)態(tài)約束和暫態(tài)約束的聯(lián)絡(luò)線功率可行域刻畫方法
- 土結(jié)作用的變壓器本體地震放大系數(shù)確定及抗震評(píng)估方法
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 基于行為時(shí)間序列的社交網(wǎng)絡(luò)因果關(guān)系發(fā)現(xiàn)算法
- 一種自底向上的高維數(shù)據(jù)因果網(wǎng)絡(luò)學(xué)習(xí)方法
- 情態(tài)生成裝置以及計(jì)算機(jī)可讀取記錄介質(zhì)
- 一種基于動(dòng)量動(dòng)力學(xué)模型的行人間因果關(guān)系識(shí)別方法
- 用于估計(jì)觀測(cè)變量之間的因果關(guān)系的方法、裝置和系統(tǒng)
- 一種航空安全事故因果關(guān)系抽取方法
- 一種面向金融事件的混合型因果關(guān)系發(fā)現(xiàn)方法
- 一種故障過程因果關(guān)系文本轉(zhuǎn)化為符號(hào)序列的方法
- 訂單歸因方法及裝置
- 分析裝置、分析方法以及分析程序





