[發(fā)明專利]一種電商服務(wù)問題自動(dòng)發(fā)現(xiàn)系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201810371912.8 | 申請(qǐng)日: | 2018-04-24 |
| 公開(公告)號(hào): | CN108596637B | 公開(公告)日: | 2022-05-06 |
| 發(fā)明(設(shè)計(jì))人: | 趙吉昌;王珊珊;孫孟晗 | 申請(qǐng)(專利權(quán))人: | 北京航空航天大學(xué) |
| 主分類號(hào): | G06Q30/00 | 分類號(hào): | G06Q30/00;G06Q30/06;G06Q30/02;G06F40/279 |
| 代理公司: | 北京中創(chuàng)陽光知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11003 | 代理人: | 尹振啟 |
| 地址: | 100191*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 服務(wù) 問題 自動(dòng) 發(fā)現(xiàn) 系統(tǒng) | ||
1.一種電商服務(wù)問題自動(dòng)發(fā)現(xiàn)系統(tǒng),其特征在于包括:特征詞提取模塊、文本分類模塊、一級(jí)屬性發(fā)現(xiàn)模塊和二級(jí)屬性提取模塊;
所述特征詞提取模塊,完成對(duì)文本中出現(xiàn)的有意義詞的提取:對(duì)已經(jīng)標(biāo)記的典型文本進(jìn)行分詞并去除停用詞之后,根據(jù)詞語出現(xiàn)頻次排序,得到特征詞;
所述文本分類模塊,完成對(duì)單條文本的初步分類:利用邏輯回歸分類器對(duì)有關(guān)電商服務(wù)問題的文本進(jìn)行分類,分類結(jié)果分為物流、產(chǎn)品、售后、營(yíng)銷四類;
所述一級(jí)屬性發(fā)現(xiàn)模塊,完成基于詞性的電商服務(wù)問題一級(jí)屬性關(guān)鍵詞的確定,為二級(jí)屬性的自動(dòng)發(fā)現(xiàn)提供數(shù)據(jù)基礎(chǔ);
所述二級(jí)屬性提取模塊,實(shí)現(xiàn)電商服務(wù)問題二級(jí)屬性的自動(dòng)發(fā)現(xiàn);利用文本建立word2vec模型和嶺回歸分類模型對(duì)情感字典進(jìn)行擴(kuò)充;利用滑動(dòng)窗口法建立二級(jí)屬性備選集合;基于情緒詞典對(duì)二級(jí)屬性統(tǒng)計(jì)與排序,并進(jìn)行統(tǒng)計(jì);
所述文本分類模塊中使用所述邏輯回歸分類器對(duì)有關(guān)電商服務(wù)問題的文本進(jìn)行分類的具體實(shí)現(xiàn)過程為:
步驟1a,手工標(biāo)記部分典型的文本,分為物流、產(chǎn)品、售后、營(yíng)銷四類,作為該文本的類別標(biāo)注;
步驟1b,將特征詞提取模塊得到的特征詞,作為特征集;
步驟1c,從電商網(wǎng)站的商品評(píng)論獲取的有關(guān)電商服務(wù)問題的文本數(shù)據(jù)中去掉重復(fù)和無效的數(shù)據(jù),作為訓(xùn)練數(shù)據(jù);
步驟1d,利用特征集將已標(biāo)注的數(shù)據(jù)、訓(xùn)練數(shù)據(jù)轉(zhuǎn)為向量,并以此訓(xùn)練邏輯回歸分類器;
步驟1e,使用所訓(xùn)練的邏輯回歸分類器對(duì)文本進(jìn)行分類。
2.根據(jù)權(quán)利要求1所述的一種電商服務(wù)問題自動(dòng)發(fā)現(xiàn)系統(tǒng),其特征在于:所述特征詞提取模塊的具體實(shí)現(xiàn)過程為:
步驟2a,對(duì)已標(biāo)注的文本進(jìn)行分詞;
步驟2b,去除其中的停用詞;
步驟2c,按詞語出現(xiàn)頻次統(tǒng)計(jì)得到所有的特征詞。
3.根據(jù)權(quán)利要求1所述的一種電商服務(wù)問題自動(dòng)發(fā)現(xiàn)系統(tǒng),其特征在于:所述基于詞性的一級(jí)屬性發(fā)現(xiàn)模塊中基于詞性的問題一級(jí)屬性關(guān)鍵詞確定,具體實(shí)現(xiàn)為:
對(duì)不同類別相關(guān)文本進(jìn)行分詞處理,所述類別包括物流、產(chǎn)品、售后、營(yíng)銷,過濾停用詞,篩選其中詞性為名詞的詞語,統(tǒng)計(jì)頻次并按照降序排序,作為關(guān)鍵詞集合,由此得到不同類別商品問題的一級(jí)屬性及其對(duì)應(yīng)關(guān)鍵詞。
4.根據(jù)權(quán)利要求1所述的一種電商服務(wù)問題自動(dòng)發(fā)現(xiàn)系統(tǒng),其特征在于:所述二級(jí)屬性提取模塊中利用文本建立word2vec模型和嶺回歸分類模型對(duì)情感字典進(jìn)行擴(kuò)充,具體實(shí)現(xiàn)為:
步驟4a,利用典型文本訓(xùn)練word2vec模型;
步驟4b,從外部獲取情感字典,包括HowNet、NTUSD,并將已有情感字典作為種子詞;
步驟4c,建立嶺回歸分類模型對(duì)情感字典進(jìn)行擴(kuò)充。
5.根據(jù)權(quán)利要求1所述的一種電商服務(wù)問題自動(dòng)發(fā)現(xiàn)系統(tǒng),其特征在于:所述二級(jí)屬性提取模塊中二級(jí)屬性備選集合的建立,具體實(shí)現(xiàn)為:
步驟5a,將文本分類模塊獲得的不同類別相關(guān)文本下屬的一級(jí)屬性關(guān)鍵詞作為二級(jí)屬性備選集合建立模塊的輸入;
步驟5b,將所輸入的一級(jí)屬性關(guān)鍵詞所對(duì)應(yīng)的文本類別進(jìn)行分詞處理,并過濾停用詞,每條文本生成一個(gè)分詞列表;
步驟5c,使用滑動(dòng)窗口方法,取窗口長(zhǎng)度為2,遍歷步驟5b中生成的本文本分詞列表,若窗口中包含所輸入關(guān)鍵詞,進(jìn)一步判斷窗口內(nèi)除關(guān)鍵詞外的詞語的情感傾向,過濾積極情感詞,建立詞組組成的二級(jí)屬性備選集合。
6.根據(jù)權(quán)利要求1所述的一種電商服務(wù)問題自動(dòng)發(fā)現(xiàn)系統(tǒng),其特征在于:所述二級(jí)屬性提取模塊中基于情緒詞典對(duì)二級(jí)屬性統(tǒng)計(jì)與排序時(shí),設(shè)定文本長(zhǎng)度和語義密度閾值,進(jìn)行判斷后進(jìn)行相應(yīng)處理,當(dāng)文本長(zhǎng)度長(zhǎng),且語義密度大時(shí),則使用文本情感傾向度統(tǒng)計(jì)方法,當(dāng)反之文本長(zhǎng)度短,且語義密度低時(shí),則使用情緒詞典區(qū)分情感詞統(tǒng)計(jì)方法。
7.根據(jù)權(quán)利要求6所述的一種電商服務(wù)問題自動(dòng)發(fā)現(xiàn)系統(tǒng),其特征在于:所述二級(jí)屬性提取模塊中文本情感傾向度統(tǒng)計(jì)方法,首先進(jìn)行基于擴(kuò)充后的情緒詞典的文本情緒傾向標(biāo)記;隨后基于文本負(fù)面情感傾向度對(duì)二級(jí)屬性的排序與提取。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學(xué),未經(jīng)北京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810371912.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購(gòu)物或電子商務(wù)
G06Q30-02 .行銷,例如,市場(chǎng)研究與分析、調(diào)查、促銷、廣告、買方剖析研究、客戶管理或獎(jiǎng)勵(lì);價(jià)格評(píng)估或確定
G06Q30-04 .簽單或開發(fā)票
G06Q30-06 .購(gòu)買、出售或租賃交易
G06Q30-08 ..拍賣
- 服務(wù)票據(jù)發(fā)行系統(tǒng)及服務(wù)票據(jù)發(fā)行服務(wù)
- 出租服務(wù)服務(wù)器和出租服務(wù)系統(tǒng)
- 服務(wù)開放方法及系統(tǒng)、服務(wù)開放服務(wù)器
- 基于服務(wù)券服務(wù)的在線企業(yè)服務(wù)平臺(tái)
- 退稅服務(wù)系統(tǒng)、退稅服務(wù)平臺(tái)及其服務(wù)方法
- 服務(wù)亭(服務(wù)驛站)
- 公共服務(wù)自助服務(wù)機(jī)
- 服務(wù)提供服務(wù)器、服務(wù)提供系統(tǒng)以及服務(wù)提供方法
- 服務(wù)提供服務(wù)器、服務(wù)提供系統(tǒng)以及服務(wù)提供方法
- 服務(wù)提供服務(wù)器、服務(wù)提供系統(tǒng)以及服務(wù)提供方法
- 知識(shí)發(fā)現(xiàn)裝置、知識(shí)發(fā)現(xiàn)程序和知識(shí)發(fā)現(xiàn)方法
- 規(guī)則發(fā)現(xiàn)程序、規(guī)則發(fā)現(xiàn)處理和規(guī)則發(fā)現(xiàn)裝置
- 發(fā)現(xiàn)協(xié)議
- 對(duì)等發(fā)現(xiàn)
- 小區(qū)發(fā)現(xiàn)
- 漏洞發(fā)現(xiàn)裝置、漏洞發(fā)現(xiàn)方法以及漏洞發(fā)現(xiàn)程序
- 使用發(fā)現(xiàn)節(jié)點(diǎn)的設(shè)備發(fā)現(xiàn)
- 漏洞發(fā)現(xiàn)裝置、漏洞發(fā)現(xiàn)方法以及存儲(chǔ)介質(zhì)
- 用于提供虛擬場(chǎng)景的裝置及方法
- 接入語音服務(wù)的方法、裝置和數(shù)據(jù)載體





