[發(fā)明專利]基于本體模型和多核支持向量機(jī)的情感原因抽取方法在審
| 申請(qǐng)?zhí)枺?/td> | 201811303734.1 | 申請(qǐng)日: | 2018-11-02 |
| 公開(公告)號(hào): | CN109670045A | 公開(公告)日: | 2019-04-23 |
| 發(fā)明(設(shè)計(jì))人: | 謝英杰;孫越恒;王文俊 | 申請(qǐng)(專利權(quán))人: | 天津大學(xué) |
| 主分類號(hào): | G06F16/36 | 分類號(hào): | G06F16/36;G06F16/951;G06F17/27;G06K9/62 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 程小艷 |
| 地址: | 300072*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多核支持向量機(jī) 支持向量機(jī)算法 抽取 語(yǔ)料庫(kù) 構(gòu)建 基礎(chǔ)本體 模型構(gòu)建 事件聚類 事件識(shí)別 文本信息 行為概念 因果關(guān)系 預(yù)測(cè) 算法 標(biāo)注 融合 地域 拓展 應(yīng)用 發(fā)現(xiàn) | ||
1.基于本體模型和多核支持向量機(jī)的情感原因抽取方法,其特征在于,該方法主要步驟為:首先構(gòu)建情感原因語(yǔ)料庫(kù);然后根據(jù)ABC本體模型構(gòu)建情感原因本體模型;在此模型上基于支持向量機(jī)算法對(duì)情感原因事件進(jìn)行識(shí)別。
2.根據(jù)權(quán)利要求1所述的基于本體模型和多核支持向量機(jī)的情感原因抽取方法,其特征在于,具體步驟如下:
1)編寫爬蟲代碼,爬取新聞數(shù)據(jù),每一條新聞數(shù)據(jù)內(nèi)容包括:帖子標(biāo)題、帖子內(nèi)容、帖子發(fā)表時(shí)間、新聞url;
2)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,去掉停用詞,進(jìn)行分詞;
3)構(gòu)建情感原因語(yǔ)料庫(kù);
4)根據(jù)ABC本體模型構(gòu)建情感原因本體模型;
5)通過融合情感原因領(lǐng)域中情感事件、情感原因、人、地域、行為等概念與概念之間的關(guān)系拓展情感原因本體模型;
6)根據(jù)三元關(guān)系構(gòu)建情感原因樹;
7)判斷輸入語(yǔ)句是否含有情感詞;
8)利用支持向量機(jī)算法對(duì)情感原因事件進(jìn)行抽取;
9)采用精確率P值,召回率R值和F值對(duì)情感事件抽取算法進(jìn)行評(píng)估;
10)在情感原因本體模型上對(duì)情感原因進(jìn)行分析。
3.根據(jù)權(quán)利要求2所述的基于本體模型和多核支持向量機(jī)的情感原因抽取方法,其特征在于,所述步驟1)主要是利用JAVA語(yǔ)言在myeclipse的環(huán)境平臺(tái)下,利用包括Struts,Spring,Hibernate框架技術(shù)進(jìn)行實(shí)現(xiàn)。
4.根據(jù)權(quán)利要求2所述的基于本體模型和多核支持向量機(jī)的情感原因抽取方法,其特征在于,所述步驟2)中用現(xiàn)有的中文分詞工具進(jìn)行數(shù)據(jù)預(yù)處理操作,預(yù)處理步驟包括去掉停用詞、斷句、分詞、詞性標(biāo)注或語(yǔ)義分析。
5.根據(jù)權(quán)利要求4所述的基于本體模型和多核支持向量機(jī)的情感原因抽取方法,其特征在于,所述斷句處理主要是利用現(xiàn)有的分詞器實(shí)現(xiàn)。
6.根據(jù)權(quán)利要求5所述的基于本體模型和多核支持向量機(jī)的情感原因抽取方法,其特征在于,所述分詞器主要包括word分詞器、Ansj分詞器、斯坦福分詞、Lucene&Nutch分詞器、斯坦福分詞器或Lucene&Nutch分詞器、Hanlp、Jieba。
7.根據(jù)權(quán)利要求2所述的基于本體模型和多核支持向量機(jī)的情感原因抽取方法,其特征在于,所述步驟4)情感原因本體模型主要是根據(jù)前因-行為-后果的ABC本體模型進(jìn)行構(gòu)建,ABC本體模型主要是根據(jù)事件進(jìn)行建模,事件的內(nèi)容主要是通過agent、action、situation、event、place描述。
8.根據(jù)權(quán)利要求2所述的基于本體模型和多核支持向量機(jī)的情感原因抽取方法,其特征在于,所述步驟5)具體是:對(duì)導(dǎo)致事件因子進(jìn)行擴(kuò)展、對(duì)地域進(jìn)行擴(kuò)展、對(duì)情感進(jìn)行擴(kuò)展。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811303734.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 槽式反應(yīng)器基于多核支持向量機(jī)的非線性預(yù)測(cè)控制方法
- 一種多核支持向量機(jī)分類方法
- 基于多核支持向量機(jī)的肌電信號(hào)分類方法
- 一種基于多核學(xué)習(xí)異構(gòu)特征融合的手勢(shì)識(shí)別方法
- 動(dòng)態(tài)粒子群算法優(yōu)化的多核支持向量機(jī)吊艙故障診斷方法及裝置
- 基于貝葉斯多核學(xué)習(xí)支持向量機(jī)的SAR目標(biāo)識(shí)別方法
- 一種優(yōu)化多核多特征融合支持向量機(jī)用于軸承故障識(shí)別的方法
- 一種基于多核支持向量機(jī)的電池單體品質(zhì)分類方法
- 霧霾天氣預(yù)測(cè)方法
- 一種基于蜻蜓算法優(yōu)化多核支持向量機(jī)的逾期風(fēng)險(xiǎn)預(yù)測(cè)方法
- 一種基于支持向量機(jī)和遺傳算法的鏡頭邊界檢測(cè)方法
- 一種基于二類支持向量機(jī)和遺傳算法的轎車車型識(shí)別方法
- 一種基于貓群算法優(yōu)化支持向量機(jī)參數(shù)的冷負(fù)荷預(yù)測(cè)方法
- 一種遺傳算法最小二乘風(fēng)電功率預(yù)測(cè)方法
- 一種基于數(shù)據(jù)挖掘技術(shù)和改進(jìn)支持向量機(jī)的風(fēng)電預(yù)測(cè)算法
- 一種基于樽海鞘群算法支持向量機(jī)的網(wǎng)絡(luò)釣魚檢測(cè)方法
- 一種基于免疫算法優(yōu)化的支持向量機(jī)蓄電池壽命預(yù)測(cè)方法
- 一種基于支持向量機(jī)和雜草算法結(jié)合的目標(biāo)分類方法
- 一種跨技術(shù)通信的欺騙攻擊檢測(cè)方法
- 基于最小二乘支持向量機(jī)模型的電力價(jià)格預(yù)測(cè)方法和裝置
- 一種創(chuàng)建共享語(yǔ)料庫(kù)的方法
- 口語(yǔ)化語(yǔ)句提取的方法及裝置
- 面向任務(wù)式對(duì)話系統(tǒng)意圖識(shí)別的語(yǔ)料庫(kù)生成方法和裝置
- 一種數(shù)據(jù)驅(qū)動(dòng)的語(yǔ)料庫(kù)自動(dòng)化構(gòu)建方法
- 一種拼寫數(shù)據(jù)的生成方法
- 訓(xùn)練語(yǔ)料庫(kù)細(xì)化和增量更新
- 用于電子文檔的內(nèi)容語(yǔ)料庫(kù)
- 作者創(chuàng)建的數(shù)字代理
- 情感語(yǔ)料庫(kù)的擴(kuò)展方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 意圖識(shí)別模型的訓(xùn)練語(yǔ)料生成方法及其相關(guān)設(shè)備





